Сегодня 09 марта 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Китайский ИИ-стартап DeepSeek устроил переполох в Кремниевой долине

Китайский миллиардер и владелец хедж-фонда Лян Вэньфэн (Liang Wenfeng) запустил стартап DeepSeek в области искусственного интеллекта, который разрабатывает передовые модели при ограниченных бюджете и технических ресурсах, а также рассказывает, как это можно сделать. В этом компания опередила американских лидеров рынка и устроила настоящий переполох, пишет Financial Times.

 Источник изображения: Nguyen Dang Hoang Nhu / unsplash.com

Источник изображения: Nguyen Dang Hoang Nhu / unsplash.com

На этой неделе DeepSeek выпустила «рассуждающую» модель ИИ R1 и опубликовала инструкции, как с минимальными затратами построить большую языковую модель, способную самостоятельно обучаться и совершенствоваться без контроля со стороны человека. Пионерами в разработке «рассуждающих» моделей, которые подражают когнитивным способностям человека, являются OpenAI и Google DeepMind. В декабре OpenAI выпустила полную версию своей нейросети o1, но не раскрыла, как вела её разработку. Выход DeepSeek R1 поднял вопрос, смогут ли обеспеченные ресурсами американские компании с проектами в области ИИ, в том числе Meta и Anthropic, сохранить за собой технологическое преимущество.

Ещё в 2021 году Лян Вэньфэн начала закупать тысячи графических процессоров Nvidia для своего побочного ИИ-проекта — основным его местом работы значился фонд High-Flyer. Тогда его действия рассматривались как эксцентричное поведение миллиардера, который ищет для себя новое увлечение. Его не воспринимали всерьёз, когда он говорил о запуске кластера из 10 000 ускорителей Nvidia, да и сам он не мог внятно сформулировать своих целей — просто утверждал: «Я хочу это построить, и это изменит правила игры». Считалось, что это под силу только гигантам масштаба ByteDance и Alibaba. Свои миллиарды в High-Flyer он заработал, используя ИИ и алгоритмы для выявления закономерностей, способных повлиять на котировки акций. Его команда достигла высот, используя чипы Nvidia в торговле акциями. В 2023 году Лян Вэньфэн запустил стартап DeepSeek и объявил о намерении создать ИИ человеческого уровня.

 Источник изображения: Stefan Cosma / unsplash.com

Источник изображения: Stefan Cosma / unsplash.com

Американские санкции, ограничившие доступ китайских компаний к ИИ-ускорителям, не помешали работе компании — её инженеры уже знали, «как раскрыть потенциал этих графических процессоров, даже если они не новейшие». Особенно опасной DeepSeek становится в связи с тем, что она готова делиться своими достижениями, а не скрывать их ради коммерческой выгоды. Компания не привлекала средств из внешних источников и не предпринимала значительных шагов для монетизации своих моделей; её область — это исследования и инженерная работа, что роднит её с ранней DeepMind. Лян характеризует DeepSeek как «местную» компанию, в которой работают доктора наук из лучших китайских вузов, а не американских институтов; а в прошлом году он сообщил в интервью, что в основной команде нет людей, которые вернулись из-за границы.

При обучении одной из своих моделей с 671 млрд параметров DeepSeek использовала всего 2048 ИИ-ускорителей Nvidia H800 и потратила $5,6 млн, и это лишь малая часть расходов OpenAI и Google на обучение систем сопоставимого размера. В Китае действительно много экспертов, которые знают, как обучать и запускать ИИ-модели, имея ограниченные вычислительные ресурсы, признают эксперты; но нет гарантии, продолжают они, что DeepSeek сможет сохранить конкурентоспособность по мере развития отрасли. При этом доходность компании High-Flyer, за чей счёт преимущественно существует DeepSeek, по итогам 2024 года снизилась, потому что её глава сейчас больше интересуется технологиями ИИ.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google обяжут продать Chrome, но позволят инвестировать в искусственный интеллект 13 мин.
Новая статья: Like a Dragon: Pirate Yakuza in Hawaii — якудза в треуголке. Рецензия 3 ч.
В двух регионах РФ заблокировали Telegram — в Госдуме заверили, что на всю страну меры пока что не распространятся 3 ч.
ИИ-боты выяснили, кто из них лучше всех играет в «Мафию» — не обошлось без странностей 14 ч.
Microsoft создаст суверенный «рассуждающий» ИИ, который сможет потягаться с OpenAI и DeepSeek 14 ч.
«Нам потребуется больше времени»: поумневшая Siri задержится до 2026 года, подтвердила Apple 15 ч.
Сотрудник производителя DVD с фильмами продавал диски пиратам до релиза — теперь ему грозит 20 лет тюрьмы 18 ч.
Илону Маску предстоит дать показания по иску акционеров Twitter третьего апреля 19 ч.
Новая статья: Rift of the NecroDancer — дофаминовый разлом. Рецензия 08-03 00:04
В раннем доступе Steam вышла комедийная песочница про секретного агента в школе магии, которая выглядит как те самые игры по «Гарри Поттеру» 07-03 23:31
Первый ЦОД Stargate получит 64 тыс. ИИ-ускорителей NVIDIA GB200 к концу 2026 года 4 ч.
Lenovo представила серверы ThinkSystem SR630 V4 и SR650(a) V4 на базе Intel Xeon Granite Rapids-SP 6500P/6700P 5 ч.
QCT представила компактный edge-сервер QuantaEdge EGX88D-1U с 24 25GbE-портами на базе Intel Xeon Granite Rapids-D 5 ч.
AMD разыграет пять видеокарт Radeon RX 9070 XT — две из них подпишет Лиза Су 9 ч.
Названа дата «спасения» застрявших на МКС астронавтов NASA 12 ч.
SpaceX разрешили повысить мощность сигнала Starlink для видеозвонков из глухомани 16 ч.
Британским провайдерам предложили тянуть «оптику» по заброшенным газовым трубам и водопроводам 18 ч.
Apple увернулась от запрета на поставки умных часов Watch в США по патентному иску AliveCor 21 ч.
Google отключилась от российских IX и ЦОД, но о полном уходе из страны речи нет 08-03 02:05
В Ростове-на-Дону запустили завод электроники, который сможет выпускать до 500 тысяч изделий в год 08-03 00:34
Включить темный режим