Сегодня 30 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

DeepSeek обновила открытую модель V3, улучшив её навыки программирования

DeepSeek выпустила обновление ИИ-модели V3, получившее название V3-0324, которое, как сообщается, предоставляет лучшие возможности для программирования, одновременно устанавливая новые стандарты точности и эффективности, пишет Bloomberg. Обновление было опубликовано на платформе Hugging Face без официального анонса.

 Источник изображения: Solen Feyissa/unsplash.com

Источник изображения: Solen Feyissa/unsplash.com

Открытая ИИ-модель DeepSeek V3 была представлена в конце прошлого года. Модель построена на архитектуре Mixture of Experts (MoE, набор экспертов) с общим количеством параметров 671 млрд и 37 млрд параметров, активируемых на каждый токен.

Как сообщила тогда компания, на обучение DeepSeek V3 ушло $5,5 млн, что значительно ниже расходов других технологических компаний, таких как OpenAI, на обучение аналогичных моделей. Спустя несколько недель DeepSeek выпустила открытую рассуждающую модель R1, которая, несмотря на скромный бюджет на разработку, превзошла ИИ-модель o1 от компании OpenAI в некоторых бенчмарках по ряду ключевых показателей.

В январе 2025 года приложение DeepSeek опередило ИИ-чат-бот ChatGPT и вышло на первое место в рейтинге самых популярных бесплатных приложений в интернет-магазине Apple App Store в США. Достижения китайского стартапа вызвали вопросы у инвесторов по поводу обоснованности громадных затрат американских компаний на разработку ИИ-технологий, что привело к обрушению ИИ-рынка, в результате которого его участники столкнулись со значительным падением акций. В частности, лидер рынка Nvidia потеряла за день $593 млрд рыночной стоимости, что было крупнейшим однодневным падением в истории фондового рынка.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
OpenAI запустила «режим обучения» в ChatGPT — теперь ИИ не даёт готовых ответов, а помогает думать 3 ч.
Квадриллион токенов за месяц: Google рассказала о нагрузке на свои ИИ-сервисы в июне 3 ч.
«Аэрофлот» возобновил полёты после взлома, но масштабы и ущерб от инцидента по-прежнему неизвестны 3 ч.
Runway представила «Photoshop для видео» — ИИ-модель Aleph для быстрого редактирования видео 3 ч.
Кровавый пародийный боевик Hotel Barcelona от авторов Deadly Premonition и No More Heroes отправит игроков в отель маньяков-убийц — раскрыта дата выхода 4 ч.
Selectel запустил хранилище S3 Vault — облачное решение для резервного копирования S3-бакетов 4 ч.
ИИ-блокнот NotebookLM от Google научился создавать слайд-шоу с озвучкой 5 ч.
Выручка Yandex B2B Tech выросла во втором квартале 2025 года на 59 % 5 ч.
Bloober Team показала 35 минут геймплея Cronos: The New Dawn — фанаты Dead Space и Silent Hill в восторге 5 ч.
Windows 10 сегодня исполнилось 10 лет — вспоминаем 10 спорных и определяющих моментов в истории ОС 7 ч.
Новая статья: Обзор материнской платы MSI MPG X870E CARBON WIFI: каждому — своё 3 ч.
Энергетическую безопасность Техаса обеспечат хранилища энергии на б/у-аккумуляторах от электромобилей 5 ч.
Razer представила киберспортивную беспроводную гарнитуру BlackShark V3 Pro в версиях для ПК, PS5 и Xbox 7 ч.
Стартап Reflect Orbital направит солнечный свет на ночную сторону Земли с помощью гигантских зеркал на орбите 7 ч.
Corsair представила мощный мини-ПК AI Workstation 300 — процессоры Ryzen AI Max и до 128 Гбайт памяти LPDDR5X 8 ч.
Ayaneo анонсировала складную портативную игровую консоль Pocket DS с Android и двумя экранами 8 ч.
Domino's научила робопса Boston Dynamics Spot доставлять пиццу и отгонять чаек 9 ч.
Elgato выпустила Facecam 4K — веб-камеру с поддержкой 4K при 60 FPS и сменными фильтрами за $200 9 ч.
Apple открывает академию в Детройте, чтобы научить малый бизнес умному производству в США 9 ч.
Калибровочные снимки «Джеймса Уэбба» отсеяли кандидатов на роль лёгкой тёмной материи 9 ч.