Сегодня 16 февраля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Китайцы обучили аналог GPT-4 всего на 2000 чипов и в 33 раза дешевле, чем OpenAI

Китайская компания 01.ai разработала конкурентоспособную ИИ-модель Yi-Lightning, которая, как утверждается, по своим возможностям аналогична GPT-4. Но что удивительно, для этого потребовалось всего 2000 графических процессоров (GPU), а затраты составили всего $3 млн, в то время как OpenAI потратила около $100 млн на обучение своей модели, сообщает Tom's Hardware.

 Источник изображения: Copilot

Источник изображения: Copilot

Достижение 01.ai особенно примечательно на фоне ограниченного доступа китайских компаний к передовым графическим процессорам Nvidia. Основатель и глава компании Кай-Фу Ли (Kai-Fu Lee) подчёркивает, что несмотря на то, что китайские компании практически не имеют доступ к GPU Nvidia из-за нормативных актов США, ИИ-модель Yi-Lightning заняла шестое место в рейтинге производительности моделей по версии LMSIS Калифорнийского университета в Беркли.

 Источник изображения: Nvidia

Источник изображения: Nvidia

«Моих друзей в Кремниевой долине шокирует не только наша производительность, но и то, что мы обучили модель всего за $3 млн, — сказал Кай-Фу Ли. — По слухам, в обучение GPT-5 уже вложен примерно 1 миллиард долларов». Он также добавил, что из-за санкций США, компании в Китае вынуждены искать более эффективные и экономичные решения, чего и удалось достичь 01.ai благодаря оптимизации ресурсов и инженерных идей, получив при этом аналогичные GPT-4 результаты при значительно меньших затратах.

Вместо того, чтобы наращивать вычислительные мощности, как это делают конкуренты, компания сосредоточилась на оптимизации алгоритмов и сокращении узких мест в процессе обработки информации. «Когда у нас есть только 2000 графических процессоров, мы должны придумать, как их использовать [эффективно] », — сказал Ли.

В результате затраты на вывод модели составили всего 10 центов за миллион токенов, что примерно в 30 раз меньше, чем у аналогичных моделей. «Мы превратили вычислительную проблему в проблему памяти, построив многоуровневый кеш, создав специальный механизм вывода и так далее», — поделился подробностями Ли.

Несмотря на заявления о низкой стоимости обучения модели Yi-Lightning, остаются вопросы относительно типа и количества используемых GPU. Глава 01.ai утверждает, что у компании достаточно ресурсов для реализации своих планов на полтора года, но простой подсчёт показывает, что 2000 современных GPU Nvidia H100 по текущей цене в $30 000 за единицу обошлись бы в $6 млн, что вдвое превышает заявленные затраты. Это несоответствие вызывает вопросы и требует дальнейших разъяснений. Тем не менее, достижение компании уже привлекло внимание мировой общественности и показало, что инновации в сфере ИИ могут рождаться даже в условиях ограниченных вычислительных ресурсов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Orcs Must Die! Deathtrap — в ловушке дисбаланса. Рецензия 9 ч.
Новая статья: Gamesblender № 713: анонсы State of Play, «революция» Overwatch 2 и заморозка Crysis 4 9 ч.
VK купил 25-% долю в Р7 для усиления позиций VK Tech перед IPO 10 ч.
Google отключила на Android оповещения о землетрясениях в Бразилии после ложной тревоги 15-02 07:19
Совет директоров OpenAI единогласно отверг предложение Маска о покупке стартапа за $97,4 млрд 15-02 05:43
Instagram начал тестировать скрытую реакцию «не нравится» для комментариев 15-02 05:10
Новая статья: Эмулируй меня полностью: состояние эмуляции игровых консолей в 2025 году 15-02 00:09
295 млн пользователей, проверенные хиты продаж и 7,7 млрд часов в играх: Epic Games Store подвёл итоги 2024 года и раскрыл планы по улучшению магазина 14-02 22:34
«Доверьтесь нам»: разработчики Okami 2 поделились первыми подробностями сиквела легендарной приключенческой игры 14-02 21:16
Telegram снова стал перегревать и быстро разряжать iPhone 14-02 19:57
Broadcom интересуется покупкой той части Intel, которая останется после отделения предприятий 31 мин.
Техпроцесс Intel 18A позволяет создавать более быстрые чипы, но 2-нм технология TSMC имеет более высокую плотность транзисторов 53 мин.
HBF вместо HBM: SanDisk предлагает увеличить объём памяти ИИ-ускорителей в 16 раз, заменив DRAM на сверхбыструю флеш-память 9 ч.
Selectel: количество DDoS-атак во II полугодии 2024 года выросло в 2,6 раза 9 ч.
50 тыс. км под водой: Meta представила проект Waterworth по созданию самого протяжённого в мире интернет-кабеля 9 ч.
xAI может построить второй ЦОД и купить у Dell ИИ-серверы на $5 млрд 10 ч.
Представлен смартфон ZTE Blade V70 Max с 6,9-дюймовым дисплеем и батареей на 6000 мА·ч 11 ч.
Аэропорт Далласа начал вырабатывать энергию от реактивных струй взлетающих самолётов 12 ч.
Intel участвует в переговорах с TSMC по поводу передачи в управление своих предприятий 12 ч.
Американский лунный модуль компании Firefly Aerospace вышел на орбиту Луны — посадка будет в марте 13 ч.