Сегодня 20 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI остаётся только завидовать — обучение китайской модели ИИ DeepSeek R1 обошлось всего в $294 тыс.

Китайская компания DeepSeek сообщила, что на обучение её модели искусственного интеллекта R1 было затрачено $294 тыс., что радикально меньше, чем аналогичные расходы американских конкурентов. Эта информация была опубликована в академическом журнале Nature. Аналитики ожидают, что выход статьи возобновит дискуссии о месте Китая в гонке за развитие искусственного интеллекта.

 Источник изображения: DeepSeek

Источник изображения: DeepSeek

Выпуск компанией DeepSeek в январе сравнительно дешёвых систем ИИ побудил мировых инвесторов избавляться от акций технологических компаний из опасения обвала их стоимости. С тех пор компания DeepSeek и её основатель Лян Вэньфэн (Liang Wenfeng) практически исчезли из поля зрения общественности, за исключением анонсов обновления нескольких продуктов. Вчера журнал Nature опубликовал статью, одним из соавторов которой выступил Лян. Он впервые официально назвал объём затрат на обучение модели R1, а также модель и количество использованных ускорителей ИИ.

Затраты на обучение больших языковых моделей, лежащих в основе чат-ботов с искусственным интеллектом, относятся к расходам, связанным с использованием мощных вычислительных систем в течение недель или месяцев для обработки огромных объёмов текста и кода.

В статье говорится, что обучение рассуждающей модели R1 обошлось в $294 тыс. долларов и потребовало 512 ускорителей Nvidia H800. Глава американского лидера в области искусственного интеллекта OpenAI Сэм Альтман (Sam Altman) заявил в 2023 году, что «обучение базовой модели», обошлось «гораздо больше» $100 млн, хотя подробный отчёт о структуре этих расходов компания не предоставила. Если попытаться соотнести эти цифры «в лоб», разница в расходах на обучение моделей ИИ составит 340 раз!

Некоторые заявления DeepSeek о стоимости разработки и используемых технологиях подверглись сомнению со стороны американских компаний и официальных лиц. Ускорители H800 были разработаны Nvidia для китайского рынка после того, как в октябре 2022 года США запретили компании экспортировать в Китай более мощные решения H100 и A100. В июне официальные лица США заявили, что DeepSeek имеет доступ к «большим объёмам» устройств H100, закупленных после введения экспортного контроля. Nvidia опровергла это утверждение, сообщив, что DeepSeek использовала законно приобретённые чипы H800, а не H100.

Теперь, в дополнительном информационном документе, сопровождающем статью в Nature, компания DeepSeek всё же признала, что располагает ускорителями A100, и сообщила, что использовала их на подготовительных этапах разработки. «Что касается нашего исследования DeepSeek-R1, мы использовали графические процессоры A100 для подготовки к экспериментам с меньшей моделью», — написали исследователи. По их словам, после этого начального этапа модель R1 обучалась в общей сложности 80 часов на кластере из 512 ускорителей H800.

Ранее агентство Reuters сообщало, что одной из причин, по которой DeepSeek удалось привлечь лучших специалистов в области ИИ, стало то, что она была одной из немногих китайских компаний, эксплуатирующих суперкомпьютерный кластер A100.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Embracer подтвердила сроки релиза следующей игры Warhorse Studios — новая Kingdom Come может выйти уже в 2027 году 37 мин.
Хакеры слили данные клиентов Trump Mobile и раскрыли реальные продажи смартфона T1 2 ч.
Сетевой боевик Spellcasters Chronicles от авторов Detroit: Become Human закроется спустя четыре месяца раннего доступа, зато у Star Wars Eclipse всё хорошо 3 ч.
Apple похвалилась, что пресекла мошеннические транзакции на $11,2 млрд за шесть лет и на этом не остановится 3 ч.
Owlcat раскрыла статистику участников «беты» The Expanse: Osiris Reborn и рассказала, как будет улучшать игру после критики фанатов 4 ч.
«Ваше мнение имеет значение»: разработчики Subnautica 2 помогут игрокам защититься от рыб, но оружие добавлять не будут 4 ч.
Настольные приложения «Яндекс Диска» перестанут нормально работать у бесплатных пользователей 5 ч.
Режиссёр Returnal открыл студию Cosmic Division для создания новой однопользовательской франшизы с «беззастенчивым упором на геймплей» 5 ч.
Новая State of Play пройдёт в ночь на 3 июня — будет расширенная демонстрация Marvel’s Wolverine и не только 5 ч.
GitHub признала взлом 3800 репозиториев по вине своего сотрудника — он установил вредоносное расширение VS Code 7 ч.
Alibaba представила ИИ-ускоритель Zhenwu M890, который втрое быстрее предшественника 2 ч.
Суперкомпьютер по подписке: Bull предоставила Airbus инфраструктуру HPC-as-a-service 3 ч.
«Билайн бизнес» сообщил о массовом внедрении аудиобейджей с ИИ — они проанализировали 600 тысяч часов разговоров 3 ч.
Представлен iQOO 15T — игровой смартфон с разогнанным Dimensity 9500, 200-Мп камерой и батареей на 8000 мА⋅ч 4 ч.
AMD готовит мини-ПК Ryzen AI Halo для вайб-кодинга без облака за $3999 4 ч.
Производитель премиальной мебели Herman Miller выпустил дебютный геймерский стол Coyl — от $1095 5 ч.
TSMC выпустила брендированные кроссовки и рисоварку, но только для своих 5 ч.
Обсерватория «Чандра» обнаружила следы древнего галактического ДТП в считавшемся спокойным скоплении Abell 2029 5 ч.
SpaceX отложила запуск огромной ракеты Starship V3 на 21 мая 6 ч.
Google пообещала выпустить умные очки на Android XR уже осенью — с Gemini и разнообразным дизайном 6 ч.