Новости Software

«Яндекс» представил новый метод машинного обучения CatBoost

Компания «Яндекс» разработала новый метод машинного обучения CatBoost. Соответствующая библиотека выложена в открытый доступ — применять её могут все желающие.

CatBoost — это наследник метода машинного обучения «Матрикcнет», который применяется почти во всех сервисах «Яндекса. В основе «Матрикснета» лежит механизм градиентного бустинга. Его особенность в том, что он хорошо подходит для работы с разнородными данными. Кроме того, градиентный бустинг даёт точные результаты даже там, где данных относительно мало. Этим он отличается от нейросетей, которые обучаются на огромном массиве однородных данных.

Но если «Матрикснет» обучает модели на числовых данных, то CatBoost учитывает и нечисловые, например, виды облаков или типы зданий. Раньше такие данные приходилось переводить на язык цифр, что могло изменить их суть и повлиять на точность работы модели. Теперь их можно использовать в первоначальном виде.

Яндекс

Яндекс

Утверждается, что CatBoost показывает более высокое качество обучения, чем аналогичные методы для работы с разнородными данными. Метод уже опробован в различных сервисах «Яндекса». Так, он применялся для улучшения результатов поиска, ранжирования ленты рекомендаций и для расчёта прогноза погоды.

CatBoost можно применять в самых разных областях — от банковской сферы до промышленности. Библиотека поддерживает операционные системы Linux, Windows и macOS; она доступна на языках программирования Python и R. 

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...
window-new
Soft
Hard
Тренды 🔥
Instagram наконец позволил пользователям из России добавлять музыку в «Истории» и запустил в стране Reels 3 ч.
NVIDIA выпустила драйвер GeForce 477.11 WHQL с поддержкой трассировки лучей в DOOM Eternal и другими улучшениями 3 ч.
Project Aurora обеспечит HPE GreenLake сквозную безопасность по модели нулевого доверия 5 ч.
Разработчики Overwatch объявили о старте бета-тестирования кроссплатформенного мультиплеера 5 ч.
Android-версия тактической стратегии XCOM 2 Collection выйдет 13 июля 6 ч.
Видео: смертельные ловушки, призраки других игроков и драгоценные реликвии в трейлере к запуску раннего доступа Phantom Abyss 8 ч.
Tencent купила контрольный пакет акций студии-разработчика Spec Ops: The Line и The Cycle 8 ч.
S.T.A.L.K.E.R. 2: Heart of Chernobyl получит «масштабные дополнения», которые продолжат основную историю 9 ч.
Bloodborne оказалась самой популярной игрой PlayStation Now на ПК за последние три месяца 9 ч.
Европейский суд постановил, что YouTube не несёт ответственности за нарушающий авторские права контент 10 ч.
Microsoft впервые достигла рыночной капитализации в $2 триллиона 2 ч.
Toyota научила роботов отличать предметы от их отражений — это большой прорыв в робототехнике 3 ч.
Представлены мониторы Designed for Xbox, которые раскроют все особенности Xbox Series X и S 3 ч.
Новая статья: Обзор игрового ноутбука ASUS ROG Zephyrus S17 GX703: флагман, который мы заслужили 3 ч.
Норвежский дата-центр Green Mountain направит «мусорное» тепло на обогрев омаров 3 ч.
Samsung опровергла слухи о закупке OLED-панелей у LG и снова заявила, что её матрицы QLED лучше 4 ч.
Марсианский вертолёт Ingenuity в восьмой раз поднялся над Красной планетой и совершил самый длительный полёт 5 ч.
Физики Инсбруксого университета создали прототип сверхкомпактного квантового компьютера 6 ч.
Теперь добывать криптовалюту можно на электромобиле — Daymak Spiritus наделён встроенным майнером 6 ч.
Xiaomi представила в России смартфоны Redmi Note 10T и Redmi Note 10S 7 ч.