Сегодня 29 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → mws

МТС потратила 1 миллиард рублей на дообучение ИИ — OpenAI тратит на ИИ на несколько порядков больше

По итогам 2024 года расходы подразделения МТС MWS AI на обучение больших языковых моделей семейства Cotype составили 1 млрд рублей, пишут «Ведомости» со ссылкой на заявление гендиректора компании Дениса Филиппова.

 Источник изображения: Igor Omilaev / unsplash.com

Источник изображения: Igor Omilaev / unsplash.com

Вместо создания собственных моделей с нуля МТС занимается дообучением существующих. Семейство вышедших в 2024 году моделей Cotype первого поколения было основано на французской открытой модели Mistral; в 2025 году вышли Cotype второго поколения, основанные уже на Alibaba Cloud Qwen 2.5. В ассортименте МТС значится также базирующийся на нескольких моделях помощник Kodify для написания программного кода.

Создание собственной большой языковой модели с нуля обошлось бы МТС в сумму от 10 млрд руб., рассуждают опрошенные «Ведомостями» эксперты, — такие проекты есть у «Яндекса» и «Сбера», но они объёмов своих вложений не раскрывают. У «Яндекса», гласит официальная информация, на конец 2021 года были три суперкомпьютера, на которых установлены в общей сложности 3500 ИИ-ускорителей Nvidia А100. У «Яндекса» и «Сбера» могут быть около 10 000 единиц такого оборудования, полагают эксперты.

Дообучение готовых больших языковых моделей — задача также дорогостоящая: 100 млн руб. требуются на аренду оборудования, и ещё в 400–500 млн руб. обходятся прочие расходы, включая команду от 30 до 50 специалистов. Поэтому расходы в 1 млрд руб. (примерно $12 млн) представляются адекватной суммой, учитывая масштабы задачи. Но зарубежные лидеры отрасли тратят на обучение ИИ значительно больше денег: OpenAI потратила на создание и оптимизацию GPT-4 около $10–15 млрд. С другой стороны, DeepSeek утверждает, что её расходы на обучение не уступающей американским модели составили всего $6 млн, но этот тезис экспертам до сих пор представляется спорным.

Мировой рынок продуктов на основе больших языковых моделей в 2024 году вырос до $6,4 млрд (примерно 503 млрд руб.), российский — до 35 млрд руб. При этом объёмы инвестиций в отрасль ИИ составили $110 млрд (8 трлн руб.), значительная часть из которых пошла на разработку и обучение больших языковых моделей и прочих видов генеративного ИИ. В мировом масштабе затраты МТС на обучение ИИ представляются не очень большой суммой, но свидетельствуют о серьёзном настрое компании — от её проекта ожидают не лидерства в отрасли, а практической пользы, кроме того, отечественный игрок помогает клиентам снижать зависимость от зарубежных разработок. К 2030 году мощность российских центров обработки данных должна достичь 70 000 единиц в эквиваленте Nvidia А100.


window-new
Soft
Hard
Тренды 🔥
Раскрыта древнейшая «пасхалка» от разработчиков Apple — 27 лет назад её спрятали в Power Mac G3 13 мин.
Обновился формат изображений PNG — теперь в нём поддерживается HDR, анимация и Exif 18 мин.
ИИ может лишить работы миллионы — Anthropic выяснит, так ли это на самом деле 20 мин.
Новая статья: Rematch — лучшая версия дворового футбола. Рецензия 2 ч.
Годовая выручка Canonical приблизилась к $300 млн 9 ч.
Долг Google по штрафам в России превысил 27 млрд рублей — и ещё 2,8 дуодециллиона рублей 12 ч.
Российские банки тестируют заменитель Apple Pay, но до массового внедрения ещё далеко 12 ч.
Роскомнадзор зарегистрировал почти 150 тысяч блогеров-десятитысячников 12 ч.
Facebook захотел покопаться в фотографиях на смартфонах пользователей — скорее всего, для обучения ИИ 14 ч.
В миллионах принтеров Brother обнаружены уязвимости безопасности — некоторые невозможно исправить 20 ч.
Speedata представила ускоритель анализа данных и привлекла на развитие $44 млн 2 ч.
Первые огневые испытания ускорителя для лунных и марсианских ракет SLS закончились яркой и шумной аномалией 4 ч.
Смартфоны в России подорожали на 10 %, а их продажи упали на 15–20 % 4 ч.
ИИ-процессор Microsoft выйдет с опозданием и будет медленнее Nvidia Blackwell 8 ч.
Старый марсианский спутник NASA научился «стоять на голове» — это на порядок повысило чувствительность подповерхностного радара 10 ч.
Мёртвый спутник NASA потёрся об атмосферу и перепугал учёных, испустив загадочный радиосигнал 14 ч.
Tesla впервые доехала до покупателя своим ходом без людей в салоне 19 ч.
Maxell выпустила кассетный ретро-плеер MXCP-P100 с поддержкой Bluetooth-наушников и USB-C 19 ч.
Intel отправила в отставку директора по стратегии 20 ч.
Мозговой имплант N1 компании Neuralink получили уже семь пациентов с опорно-двигательными проблемами 20 ч.