Новости Software

«Яндекс» представил новый метод машинного обучения CatBoost

Компания «Яндекс» разработала новый метод машинного обучения CatBoost. Соответствующая библиотека выложена в открытый доступ — применять её могут все желающие.

CatBoost — это наследник метода машинного обучения «Матрикcнет», который применяется почти во всех сервисах «Яндекса. В основе «Матрикснета» лежит механизм градиентного бустинга. Его особенность в том, что он хорошо подходит для работы с разнородными данными. Кроме того, градиентный бустинг даёт точные результаты даже там, где данных относительно мало. Этим он отличается от нейросетей, которые обучаются на огромном массиве однородных данных.

Но если «Матрикснет» обучает модели на числовых данных, то CatBoost учитывает и нечисловые, например, виды облаков или типы зданий. Раньше такие данные приходилось переводить на язык цифр, что могло изменить их суть и повлиять на точность работы модели. Теперь их можно использовать в первоначальном виде.

Яндекс

Яндекс

Утверждается, что CatBoost показывает более высокое качество обучения, чем аналогичные методы для работы с разнородными данными. Метод уже опробован в различных сервисах «Яндекса». Так, он применялся для улучшения результатов поиска, ранжирования ленты рекомендаций и для расчёта прогноза погоды.

CatBoost можно применять в самых разных областях — от банковской сферы до промышленности. Библиотека поддерживает операционные системы Linux, Windows и macOS; она доступна на языках программирования Python и R. 

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...
window-new
Soft
Hard
Тренды 🔥
Twitter добавила функцию Tip Jar, с которой пользователи смогут финансово поддержать любимые аккаунты 4 ч.
AMD представила обновление драйвера Radeon Adrenalin 2020 с поддержкой Resident Evil Village и Metro Exodus Enhanced Edition 5 ч.
Утечка: продолжение Judgment действительно получит название Lost Judgment и выйдет 24 сентября 5 ч.
PlayStation 5 получила приложение YouTube TV 5 ч.
Google начнёт автоматически включать двухфакторную аутентификацию, чтобы повысить безопасность пользователей 7 ч.
Ubisoft запланировала расширение The Division за счёт двух новых игр, фильма и романа по мотивам 7 ч.
Своё участие в E3 2021 подтвердили ещё несколько компаний, включая издателя Elden Ring 8 ч.
Студия 11 bit выпустит расширенную версию Frostpunk на iOS и Android при участии китайской NetEase 8 ч.
Google Play обяжет разработчиков рассказывать, какую информацию собирают их приложения и как её обрабатывают 8 ч.
LinuxBoot внедрил netboot.xyz для простой PXE-загрузки по сети 8 ч.
Исследователи выяснили, что функция Night Shift в iPhone не улучшает качество сна 4 ч.
Новая статья: Обзор смартфона realme 8 Pro: зачастили 5 ч.
Tomorrow Water предлагает размещать ЦОД на водоочистных станциях 5 ч.
Второй испытательный полёт корабля Boeing Starliner к МКС назначили на 30 июля 5 ч.
В модемах Qualcomm обнаружена критическая уязвимость, затрагивающая миллионы устройств. Исправление уже создано 5 ч.
Производители стали убирать дополнительные функции из авто и отдавать предпочтение ходовым моделям из-за дефицита чипов 5 ч.
Cowboy представила два электрических велосипеда с беспроводной зарядкой для смартфонов 9 ч.
Samsung ускорила запуск нового производства чипов памяти DRAM и 3D V-NAND в Южной Корее 10 ч.
Все электромобили, которые выпустит Tesla за второй квартал, уже распроданы 10 ч.
Суперкомпьютер SuperMUC-NG получит процессоры Intel Xeon Sapphire Rapids и ускорители Intel Xe Ponte Vecchio 11 ч.