Сегодня 15 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Яндекс» рассказал, как сэкономил 4,8 млрд рублей на обучении ИИ без потери качества

Информационно-технологический холдинг «Яндекс» сообщил о сокращении годовых операционных расходов на 4,8 млрд руб. Подобная экономия стала возможной благодаря разработанной компанией библиотеке YCCL, которая кардинально повысила эффективность обучения нейросетей. Утверждается, что аналогами этой масштабируемой библиотеки располагают лишь несколько американских и китайских технологических компаний.

 Источник изображения: «Яндекс»

Источник изображения: «Яндекс»

По сообщению пресс-службы компании, глубокая оптимизация инфраструктуры была достигнута благодаря прогрессу в обучении больших языковых моделей (LLM) без снижения качества и масштабов разработок. Ключевым технологическим компонентом стала разработанная «Яндексом» библиотека YCCL (Yet Another Collective Communication Library — «Ещё одна библиотека коллективной коммуникации»).

Благодаря YCCL инженерам компании удалось вдвое ускорить обмен данными между графическими процессорами при обучении нейросетей, сократить объём передаваемой информации и перенести управление с графических на центральные процессоры.

Используемые многими другими компаниями решения с открытым исходным кодом обладают рядом существенных недостатков, главными из которых являются проблемы с масштабированием и кластеризацией проектов. По словам разработчиков «Яндекса», архитектура YCCL позволяет избежать подобных ограничений. Сообщается, что немногочисленными аналогами подобной библиотеки располагают лишь Meta, AMD и несколько китайских IT‑гигантов.

Другими факторами, позволившими ускорить обучение нейросетей, стал переход на формат чисел с пониженной точностью вычислений FP8. Это ускорило обучение моделей на 30 % и сократило обмен данными вдвое. Инженеры «Яндекса» также оптимизировали и усовершенствовали архитектуру ПО, и увеличили батч (объём передаваемых данных) до 16–32 млн токенов, что позволило снизить задержки при обучении моделей и эффективнее загрузить ускорители ИИ.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Без вас у нас бы ничего не вышло»: Konami отключила для россиян и белорусов серверы Metal Gear Solid V: The Phantom Pain и eFootball 17 мин.
В Великобритании полицейского уличили в фальсификации доказательств преступлений с помощью ИИ 5 ч.
«Кто купит Xbox и Game Pass ради Gears?»: инсайдер рассекретил «безумный» бюджет Gears of War: E-Day 6 ч.
Anthropic проведёт переговоры с властями США для разблокировки ИИ-моделей Mythos 5 и Fable 5 6 ч.
Авторитетный инсайдер подтвердил, когда выйдет God of War Laufey 7 ч.
Журналисты раскрыли подробности неанонсированного кооперативного ролевого боевика по «Ведьмаку» 7 ч.
Власти США заподозрили Китай в несанкционированном доступе к модели Mythos компании Anthropic 11 ч.
К сентябрю Apple подготовит ряд новых функций для iOS 27 11 ч.
Блокировщики рекламы не перестанут работать в Google Chrome после прекращения поддержки Manifest V2 14-06 16:54
Отключить доступ иностранцев к передовым моделям Anthropic пришлось по наводке главы Amazon 14-06 07:23
Google Chromebook исполнилось 15 лет — массовыми хромбуки не стали, но завоевали популярность в образовании 2 мин.
Samsung в следующем году запустит производство 4-нм чипов для мозговых имплантов Neuralink 25 мин.
Китайский автопроизводитель Seres представил человекоподобного робота Xiaosai — он умеет поддерживать беседу 28 мин.
ByteDance ведёт переговоры о покупке китайских ИИ-ускорителей Iluvatar CoreX и Baidu 38 мин.
Dreame H16 Pro Steam и Dreame Z40 TangleCut Flex+: какой пылесос выбрать — моющий или для сухой уборки? 2 ч.
Дата-центры Amazon «выпили» почти 9,5 млн кубометров воды в 2025 году 3 ч.
К концу года SK hynix намерена начать массовое производство 375-слойной памяти 3D NAND 3 ч.
SteamOS научили работать с процессорами Intel и настольной видеокартой Arc B580 4 ч.
Pinterest заключила с AWS самую крупную инфраструктурную сделку, планируя потратить $4 млрд на облачные сервисы, Graviton и Trainium 4 ч.
В Сингапуре запущен суперкомпьютер ASPIRE 2B на базе NVIDIA H200 и AMD EPYC Turin с быстродействие 115 Пфлопс 5 ч.