Представлена DeepSeek V4 — открытая ИИ-модель, которая потягается с лучшими решениями OpenAI и Google
Читать в полной версииКитайская компания DeepSeek выпустила предварительную версию большой языковой модели V4. Релиз состоялся спустя более чем год после того, как DeepSeek представила свою модель с поддержкой рассуждения R1, которая потрясла глобальные технологические рынки благодаря высокому уровню производительности и экономической эффективности. Также интересно, что DeepSeek V4 вышла через несколько часов после анонса OpenAI GPT-5.5.
Источник изображения: AI
Как и предыдущая модель DeepSeek V3, новая версия алгоритма имеет открытый исходный код, что позволяет разработчикам разворачивать нейросеть локально и модифицировать её по собственному усмотрению. DeepSeek заявила, что V4 демонстрирует высокую производительность по сравнению с китайскими конкурентами, особенно в агентных задачах, обработке данных и логических выводах. В дополнение к этому DeepSeek V4 оптимизирована для использования с популярными ИИ-агентами, такими как OpenClaw и Anthropic Claude Code. Доступны версии «pro» и «flash», отличающиеся размером и производительностью. DeepSeek-V4-Pro предлагает 1,6 триллионов параметров (49 миллиардов активных) и производительность, «сопоставимую с лучшими в мире закрытыми моделями». DeepSeek-V4-Flash обеспечивает только 284 млрд параметров, из которых 13 млрд активных.
Версия Pro превосходит все существующие открытые модели в математике и программировании, и способна потягаться здесь даже с лучшими закрытыми моделями. А знания о мире этой модели «уступают только Gemini 3.1 Pro». В свою очередь версия Flash даёт возможности рассуждения близкие к уровню V4-Pro, и выполняет простые задачи в режиме агента на уровне V4-Pro.
DeepSeek основана в 2023 году, а внимание компания привлекла в 2024 году, когда выпустила бесплатную ИИ-модель V3 с открытым исходным кодом. Этот алгоритм оказался экономически эффективным, поскольку на его создание ушло значительно меньше средств по сравнению с западными конкурентами, например, от OpenAI и Google.
В январе 2025 года DeepSeek выпустила модель R1, которая показала аналогичную производительность или превзошла многих конкурентов. Модель R1 встревожила инвесторов, когда DeepSeek объявила, что на её создание с использованием не самых мощных ускорителей Nvidia потребовалось всего два месяца и менее $6 млн. Это поставило под сомнение лидерство США в сфере ИИ, а также огромные расходы технологических компаний на инфраструктуру для ИИ.
Аналитик MorningStar Айвен Су (Ivan Su) считает, что алгоритм V4 вряд ли окажет на индустрию такое же влияние, как R1, поскольку рынки учли то, что китайский ИИ конкурентоспособен и дешевле в использовании. Он добавил, что новая позиция DeepSeek делает другие китайские ИИ-модели с открытым исходным кодом прямыми конкурентами. «Такой формулировки не существовало во времена R1, и уже это говорит о том, насколько усилилась внутренняя конкуренция», — добавил Су.
Главный вопрос после запуска DeepSeek V4 в том, какие ускорители использовались для обучения модели. Китайский технологический гигант Huawei на этой неделе подтвердил, что его новейший вычислительный ИИ-кластер, работающий на ускорителях Ascend, может поддерживать модель DeepSeek V4. Однако не ясно, в какой степени ускорители Huawei использовались для обучения новой ИИ-модели.
Новые модели DeepSeek уже доступны в веб-версии и приложении чат-бота DeepSeek, где режим Instant основан на V4-Flash, а Expert — на V4-Pro. Разработчики также получили доступ к новинкам через API.