Сегодня 01 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

DeepSeek обновила открытую модель V3, улучшив её навыки программирования

DeepSeek выпустила обновление ИИ-модели V3, получившее название V3-0324, которое, как сообщается, предоставляет лучшие возможности для программирования, одновременно устанавливая новые стандарты точности и эффективности, пишет Bloomberg. Обновление было опубликовано на платформе Hugging Face без официального анонса.

 Источник изображения: Solen Feyissa/unsplash.com

Источник изображения: Solen Feyissa/unsplash.com

Открытая ИИ-модель DeepSeek V3 была представлена в конце прошлого года. Модель построена на архитектуре Mixture of Experts (MoE, набор экспертов) с общим количеством параметров 671 млрд и 37 млрд параметров, активируемых на каждый токен.

Как сообщила тогда компания, на обучение DeepSeek V3 ушло $5,5 млн, что значительно ниже расходов других технологических компаний, таких как OpenAI, на обучение аналогичных моделей. Спустя несколько недель DeepSeek выпустила открытую рассуждающую модель R1, которая, несмотря на скромный бюджет на разработку, превзошла ИИ-модель o1 от компании OpenAI в некоторых бенчмарках по ряду ключевых показателей.

В январе 2025 года приложение DeepSeek опередило ИИ-чат-бот ChatGPT и вышло на первое место в рейтинге самых популярных бесплатных приложений в интернет-магазине Apple App Store в США. Достижения китайского стартапа вызвали вопросы у инвесторов по поводу обоснованности громадных затрат американских компаний на разработку ИИ-технологий, что привело к обрушению ИИ-рынка, в результате которого его участники столкнулись со значительным падением акций. В частности, лидер рынка Nvidia потеряла за день $593 млрд рыночной стоимости, что было крупнейшим однодневным падением в истории фондового рынка.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Самурайский экшен Onimusha: Way of the Sword выйдет до GTA VI — инсайдер раскрыл дату релиза первой за 20 лет новой игры серии 24 мин.
К взлёту готов: амбициозный авиасимулятор «Корея. Серия Ил-2» получил дату выхода в раннем доступе Steam 2 ч.
Княжна, волки и настоящие эмоции: российский боевик «Война Миров: Сибирь» получил атмосферный сюжетный трейлер 3 ч.
«У людей должна быть свобода выбора»: GamesVoice не откажется от русской озвучки Cyberpunk 2077: Phantom Liberty, несмотря на претензии CD Projekt Red 3 ч.
Наш SQL: фанаты MySQL основали фонд OurSQL Foundation, чтобы давить на Oracle 3 ч.
Анонсирована «Смерш: Охотник на волков» — идейная наследница стелс-игр «Смерть шпионам» 13 ч.
Иранские хакеры превратили ChatGPT и Gemini в оружие для кибервойны 17 ч.
GamesVoice анонсировала сбор средств на русскую озвучку Cyberpunk 2077: Phantom Liberty, но CDPR это не понравилось 20 ч.
Microsoft перевела GitHub Copilot с подписки на оплату за токены — пользователи недовольны 23 ч.
Трафик поисковика DuckDuckGo утроился после последнего обновления ИИ-поиска Google 24 ч.
Nvidia расписала будущее процессоров RTX Spark для мобильных и настольных ПК до 2030 года 18 мин.
Представлен Surface Laptop Ultra — это самый мощный ноутбук Microsoft, и он получил процессор Nvidia RTX Spark 25 мин.
Apple собралась захватить рынок умных очков по проверенному сценарию Apple Watch 30 мин.
Intel раскрыла детали серверного ИИ-ускорителя Crescent Island — до 350 Вт и 480 Гбайт LPDDR5X 38 мин.
Ampere Computing: экстремальная жара в мире потребует больше энергии, повышения эффективности вычислений и сокращения количества ЦОД 2 ч.
РТК-ЦОД разворачивает в своих дата-центрах высокоскоростной защищенный Wi-Fi от «Ростелеком» 2 ч.
AMD получит фору: ангстремные Xeon Diamond Rapids задержатся до 2027 года 3 ч.
Венчурные капиталисты всё активнее вкладываются в стартапы, связанные с физическим воплощением ИИ 4 ч.
Власти США запретят китайским компаниям закупать передовые ускорители для своих зарубежных ЦОД 6 ч.
AMD выпустит Radeon RX 9070 GRE по всему миру — 12-Гбайт видеокарту для комфортной игры в 1440p оценили в $549 9 ч.