Новости Software

«Яндекс» представил новый метод машинного обучения CatBoost

Компания «Яндекс» разработала новый метод машинного обучения CatBoost. Соответствующая библиотека выложена в открытый доступ — применять её могут все желающие.

CatBoost — это наследник метода машинного обучения «Матрикcнет», который применяется почти во всех сервисах «Яндекса. В основе «Матрикснета» лежит механизм градиентного бустинга. Его особенность в том, что он хорошо подходит для работы с разнородными данными. Кроме того, градиентный бустинг даёт точные результаты даже там, где данных относительно мало. Этим он отличается от нейросетей, которые обучаются на огромном массиве однородных данных.

Но если «Матрикснет» обучает модели на числовых данных, то CatBoost учитывает и нечисловые, например, виды облаков или типы зданий. Раньше такие данные приходилось переводить на язык цифр, что могло изменить их суть и повлиять на точность работы модели. Теперь их можно использовать в первоначальном виде.

Яндекс

Яндекс

Утверждается, что CatBoost показывает более высокое качество обучения, чем аналогичные методы для работы с разнородными данными. Метод уже опробован в различных сервисах «Яндекса». Так, он применялся для улучшения результатов поиска, ранжирования ленты рекомендаций и для расчёта прогноза погоды.

CatBoost можно применять в самых разных областях — от банковской сферы до промышленности. Библиотека поддерживает операционные системы Linux, Windows и macOS; она доступна на языках программирования Python и R. 

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...
window-new
Soft
Hard
Тренды 🔥
Microsoft предложила внушительные скидки на свои продукты участникам Build 2020 38 мин.
Обновление Windows 10 May 2020 Update вызывает проблемы с Intel Optane 53 мин.
Epic Games снова отложила запуск 3 сезона 2 главы Fortnite 3 ч.
В видеочатах Microsoft Teams смогут участвовать до 300 пользователей одновременно 4 ч.
Видео: многопользовательские баталии и босс Робосквидвард в трейлере SpongeBob SquarePants: Battle for Bikini Bottom — Rehydrated 4 ч.
Google выделит части контента на страницах, основываясь на тексте из поисковой выдачи 6 ч.
Аудитория российских пользователей Telegram достигла 30 млн человек 6 ч.
Анализ QIWI: из-за COVID-19 россияне стали тратить вдвое больше на игры в последние два месяца 7 ч.
Повреждённые сохранения и огонь в унитазе: после релиза большого обновления в The Sims 4 появились ошибки 7 ч.
В Escape from Tarkov заблокировали 10 тысяч читеров, на очереди — продавцы и покупатели предметов за реальные деньги 8 ч.