«Яндекс» активно интегрирует алгоритмы на базе генеративных нейросетей в свои сервисы. На этот разработчики создали рекомендательные алгоритмы на основе генеративного ИИ, которые будут внедряться в продукты компании. За счёт этого пользователи сервисов «Яндекса» будут экономить время на поиске контента и товаров, а также смогут выйти за рамки своих привычек.

Источник изображения: «Яндекс» / yandex.ru/jobs/locations/vladivostok
«Новшество в том, что мы смогли внедрить большие генеративные модели в рексистемы. В рекомендации «Яндекс Музыки» внедрена трансформерная модель с 126 млн параметров и длиной истории 8192 (в терминах событий в жизни пользователя). Для сравнения — раньше у нас максимальная конфигурация имела 19 млн параметров в энкодере и обрабатывала 2000 событий», — рассказали в «Яндексе».
В компании отметили, что алгоритм обрабатывает обезличенные данные о действиях пользователей внутри сервиса. Разработчики также добавили, что такой подход не использовал ни один другой музыкальный сервис. «Мы первые в мире показали, что можно сделать такую большую модель с такой большой длиной истории для музыкальных рекомендаций», — рассказал представитель компании.
Новые алгоритмы были интегрированы в «Яндекс Музыку». Они функционируют в режиме онлайн и мгновенно реагируют на действия пользователей с учётом большего количества параметров. После этого они появились в «Яндекс Маркете», а позднее будут добавлены в другие сервисы компании, такие как «Кинопоиск» и «Лавка».
Руководитель рекомендательных технологий «Яндекса» Николай Савушкин отметил, что в последние годы качество рекомендательных алгоритмов вышло на плато, и для поднятия их на новый уровень требовалось внедрение генеративных моделей, что сопряжено с увеличением вычислительных мощностей. «Нам удалось разработать нейронную архитектуру, которая более эффективна в обучении и требует меньше ресурсов, и доказать, что скачок качества, который мы видим в сфере языковых моделей, возможен в рекомендациях. Эту задачу удалось решить только нескольким компаниям в мире — таким, как Google, Netflix, LinkedIn», — рассказал господин Савушкин.
Нейросети в рекомендациях «Яндекс Музыки» появились ещё в 2023 году. Теперь же стриминговая платформа стала первым сервисом компании, внедрившим обновлённые ИИ-модели, работающие в режиме онлайн. Алгоритмы анализируют потребности человека и генерируют рекомендации в моменте, но с учётом долгосрочных потребностей пользователя. На этом фоне люди стали чаще и дольше слушать «Мою волну», где проигрываются только рекомендательные композиции. Пользователи также стали на 20 % чаще добавлять в коллекцию песни и артистов, которых услышали впервые. При этом разнообразие самих рекомендаций выросло на 14 %, в них стало больше новых для пользователей треков.
«Яндекс Маркет» стал ещё одним сервисом компании, куда уже были интегрированы новые ИИ-модели. «Теперь учитываются в десятки раз больше обезличенных действий пользователей — это эквивалентно данным за два года пользования сервисом. Так у алгоритмов появляется более полный контекст, и пользователь получает действительно нужные рекомендации. Во время тестирования покупатели стали добавлять в корзину на 3 % больше релевантных товаров, чем раньше. А покупок в новых для людей категориях стало больше на 5 %», — рассказали в «Яндексе».
В компании также отметили, что для обеспечения стабильной работы рекомендательных систем на базе генеративных моделей требуется соответствующая инфраструктура, т.е. большое количество вычислительных мощностей и данных. До недавнего времени рекомендательные алгоритмы работали на основе маленьких моделей, которые не сопоставимы по вычислительной сложности с большими языковыми моделями. Благодаря новой архитектуре «Яндекс» смог внедрить более тяжёлые модели с большим количеством параметров. Кроме того, часть генеративной модели перенесена в расчёт в режиме онлайн. Всё это позволило значительно повысить качество работы рекомендательных алгоритмов.
По мнению аналитиков, запуск новых рекомендательных систем в продуктах «Яндекса» является «очень важным шагом» для развития российского ИИ. Сооснователь университета Zerocoder Кирилл Пшинник отметил, что создание и запуск таких систем могут себе позволить лишь крупные бигтех-игроки, в арсенале которых есть внушительные массивы пользовательских данных и достаточный объём вычислительных ресурсов для обучения больших языковых моделей. Руководитель научной группы «Адаптивные агенты» Института AIRI Владислав Куренков добавил, что масштабирование генеративных моделей в рекомендательных системах является сложной задачей. «У неё высокий порог входа, поскольку, чтобы масштабировать модель и при этом сохранить или улучшить её эффективность, нужны огромные объёмы данных, значительные вычислительные ресурсы и экспертиза», — отметил господин Куренков.
Источник: