Сегодня 31 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Яндекс» рассказал, как сэкономил 4,8 млрд рублей на обучении ИИ без потери качества

Информационно-технологический холдинг «Яндекс» сообщил о сокращении годовых операционных расходов на 4,8 млрд руб. Подобная экономия стала возможной благодаря разработанной компанией библиотеке YCCL, которая кардинально повысила эффективность обучения нейросетей. Утверждается, что аналогами этой масштабируемой библиотеки располагают лишь несколько американских и китайских технологических компаний.

 Источник изображения: «Яндекс»

Источник изображения: «Яндекс»

По сообщению пресс-службы компании, глубокая оптимизация инфраструктуры была достигнута благодаря прогрессу в обучении больших языковых моделей (LLM) без снижения качества и масштабов разработок. Ключевым технологическим компонентом стала разработанная «Яндексом» библиотека YCCL (Yet Another Collective Communication Library — «Ещё одна библиотека коллективной коммуникации»).

Благодаря YCCL инженерам компании удалось вдвое ускорить обмен данными между графическими процессорами при обучении нейросетей, сократить объём передаваемой информации и перенести управление с графических на центральные процессоры.

Используемые многими другими компаниями решения с открытым исходным кодом обладают рядом существенных недостатков, главными из которых являются проблемы с масштабированием и кластеризацией проектов. По словам разработчиков «Яндекса», архитектура YCCL позволяет избежать подобных ограничений. Сообщается, что немногочисленными аналогами подобной библиотеки располагают лишь Meta, AMD и несколько китайских IT‑гигантов.

Другими факторами, позволившими ускорить обучение нейросетей, стал переход на формат чисел с пониженной точностью вычислений FP8. Это ускорило обучение моделей на 30 % и сократило обмен данными вдвое. Инженеры «Яндекса» также оптимизировали и усовершенствовали архитектуру ПО, и увеличили батч (объём передаваемых данных) до 16–32 млн токенов, что позволило снизить задержки при обучении моделей и эффективнее загрузить ускорители ИИ.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Авторы эвакуационного шутера Active Matter показали новый геймплей под аккомпанемент советского рок-хита «На заре» 21 мин.
GamesVoice анонсировала сбор средств на русскую озвучку Cyberpunk 2077: Phantom Liberty, но CDPR это не понравилось 2 ч.
Microsoft перевела GitHub Copilot с подписки на оплату за токены — пользователи недовольны 6 ч.
Трафик поисковика DuckDuckGo утроился после последнего обновления ИИ-поиска Google 6 ч.
ИИ стал реже галлюцинировать, но всё ещё уверенно выдаёт ложь за правду 6 ч.
Новая статья: Lego Batman: Legacy of the Dark Knight — это что, новая Batman: Arkham? Рецензия 19 ч.
Тактическая ролевая игра RuneSmith позволит возглавить отряд дворфов, чтобы выбить из главного злодея денежный долг 22 ч.
ООН объяснила: запрещать соцсети для детей контрпродуктивно, нужно менять сами платформы 30-05 18:10
ИИ-агент Google Gemini Spark, который работает в облаке 24/7, вышел в ограниченный доступ 30-05 17:59
AOMedia выпустила первый вариант кодека AV2 30-05 16:51