Новости Software

«Яндекс» представил новый метод машинного обучения CatBoost

Компания «Яндекс» разработала новый метод машинного обучения CatBoost. Соответствующая библиотека выложена в открытый доступ — применять её могут все желающие.

CatBoost — это наследник метода машинного обучения «Матрикcнет», который применяется почти во всех сервисах «Яндекса. В основе «Матрикснета» лежит механизм градиентного бустинга. Его особенность в том, что он хорошо подходит для работы с разнородными данными. Кроме того, градиентный бустинг даёт точные результаты даже там, где данных относительно мало. Этим он отличается от нейросетей, которые обучаются на огромном массиве однородных данных.

Но если «Матрикснет» обучает модели на числовых данных, то CatBoost учитывает и нечисловые, например, виды облаков или типы зданий. Раньше такие данные приходилось переводить на язык цифр, что могло изменить их суть и повлиять на точность работы модели. Теперь их можно использовать в первоначальном виде.

 Яндекс

Яндекс

Утверждается, что CatBoost показывает более высокое качество обучения, чем аналогичные методы для работы с разнородными данными. Метод уже опробован в различных сервисах «Яндекса». Так, он применялся для улучшения результатов поиска, ранжирования ленты рекомендаций и для расчёта прогноза погоды.

CatBoost можно применять в самых разных областях — от банковской сферы до промышленности. Библиотека поддерживает операционные системы Linux, Windows и macOS; она доступна на языках программирования Python и R.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
«Это будет или великолепно, или ужасно»: новый трейлер сериала The Last of Us воодушевил игроков перед скорой премьерой 11 мин.
Еженедельный чарт Steam: The Callisto Protocol и Need for Speed Unbound не попали в тройку лидеров, но это удалось другой проблемной новинке 41 мин.
Геральт из Ривии добрался до Fortnite благодаря боевому пропуску четвёртой главы 55 мин.
Алексей Кудрин станет советником по корпоративному развитию в «Яндексе» 4 ч.
«Far Cry Primal, но с 3 % бюджета»: симулятор выживания Primitive перенесёт игроков в доисторический мир с мамонтами и саблезубыми тиграми 4 ч.
В приложениях для Hyundai и других авто нашли уязвимости, позволяющие дистанционно захватить контроль над машиной 5 ч.
Слухи: ремейк Metal Gear Solid станет эксклюзивом PS5, а анонс не за горами 6 ч.
BioWare показала внутриигровой ролик из Dragon Age: Dreadwolf — он знакомит с главным злодеем и готовит к новой битве 6 ч.
Создатель The Callisto Protocol объяснил проблемный запуск игры на ПК: из-за спешки в релиз ушли не те файлы 20 ч.
Криптобиржу FTX приходилось спасать от обвала ещё задолго до банкротства 04-12 12:08
Foxconn рассчитывает полностью восстановить работу крупнейшего производства iPhone 14 Pro к началу января 41 мин.
ASUS назвала характеристики Radeon RX 7900 XTX и RX 7900 XT TUF Gaming — обе получили небольшой заводской разгон 51 мин.
DJI вскоре выпустит бюджетный беспилотник Mini 3 — расширенный комплект обойдётся в $860 2 ч.
Tesla сократит объёмы выпуска электромобилей в Шанхае на 20 % из-за упавшего спроса 3 ч.
Поставки AR/VR-гарнитур Apple могут отложить до второй половины 2023 года 4 ч.
Субсидий на $52 млрд для производства чипов в США будет недостаточно — нужно ещё $30 млрд для разработки 4 ч.
Nokia получила разрешение на поставки оборудования в Россию, но о возобновлении бизнеса речь не идёт 5 ч.
«МегаФон» продал долю в «Связном» неизвестному покупателю 7 ч.
NVIDIA и Apple окажутся в числе первых клиентов предприятия TSMC в Аризоне 7 ч.
Власти Вьетнама стараются склонить Samsung к строительству предприятия по выпуску чипов 8 ч.