Сегодня 29 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

DeepSeek обновила открытую модель V3, улучшив её навыки программирования

DeepSeek выпустила обновление ИИ-модели V3, получившее название V3-0324, которое, как сообщается, предоставляет лучшие возможности для программирования, одновременно устанавливая новые стандарты точности и эффективности, пишет Bloomberg. Обновление было опубликовано на платформе Hugging Face без официального анонса.

 Источник изображения: Solen Feyissa/unsplash.com

Источник изображения: Solen Feyissa/unsplash.com

Открытая ИИ-модель DeepSeek V3 была представлена в конце прошлого года. Модель построена на архитектуре Mixture of Experts (MoE, набор экспертов) с общим количеством параметров 671 млрд и 37 млрд параметров, активируемых на каждый токен.

Как сообщила тогда компания, на обучение DeepSeek V3 ушло $5,5 млн, что значительно ниже расходов других технологических компаний, таких как OpenAI, на обучение аналогичных моделей. Спустя несколько недель DeepSeek выпустила открытую рассуждающую модель R1, которая, несмотря на скромный бюджет на разработку, превзошла ИИ-модель o1 от компании OpenAI в некоторых бенчмарках по ряду ключевых показателей.

В январе 2025 года приложение DeepSeek опередило ИИ-чат-бот ChatGPT и вышло на первое место в рейтинге самых популярных бесплатных приложений в интернет-магазине Apple App Store в США. Достижения китайского стартапа вызвали вопросы у инвесторов по поводу обоснованности громадных затрат американских компаний на разработку ИИ-технологий, что привело к обрушению ИИ-рынка, в результате которого его участники столкнулись со значительным падением акций. В частности, лидер рынка Nvidia потеряла за день $593 млрд рыночной стоимости, что было крупнейшим однодневным падением в истории фондового рынка.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Соруководитель студии экс-президента Rockstar уверен, что негатив вокруг MindsEye генерируют боты и проплаченные блогеры 5 мин.
«Базис» представляет программно-определяемую систему хранения данных Basis SDS 2.0 49 мин.
«Призовите силу альтернативного метала начала 2000-х»: новый трейлер Elden Ring Nightreign зарядил фанатов ностальгией 2 ч.
Илон Маск ушёл из DOGE и плотнее займётся проблемами Tesla, X и xAI 2 ч.
Ежемесячная аудитория ИИ-бота Meta AI превысила 1 млрд человек, похвастался Цукерберг 2 ч.
Salesforce приобрела за $8 млрд Informatica ради улучшения платформы ИИ-агентов Agentforce 3 ч.
«Базис» представляет Basis Workplace 3.0: новое поколение платформы виртуализации рабочих мест 3 ч.
Создатели новой Painkiller пригласили игроков на техническое тестирование в Steam — доступный контент и системные требования 3 ч.
Маск опроверг заявление Дурова о сделке по интеграции Grok в Telegram, но история ещё не окончена 3 ч.
«Базис» представляет Basis SDN — первое полностью российское решение для управления программно-определяемыми сетями 4 ч.
Перегрев, протечки и нестабильность затормозили массовый выпуск NVIDIA GB200 NVL72, но теперь все проблемы решены 31 мин.
NASA спасло межпланетную станцию «Психея», переключив на запасную топливную магистраль в двигателях 2 ч.
После ухода из политики Маск пообещал запустить беспилотное такси Tesla в Техасе раньше сроков 2 ч.
Новая статья: Обзор смартфона realme 14 5G: мощность на каждый день 2 ч.
Федеральный суд США признал незаконными и заблокировал большинство трамповских пошлин 3 ч.
Дебютировали российские серверы «Аквариус» AQserv RS на базе Intel Xeon Emerald Rapids 3 ч.
Илон Маск пытался сорвать создание мощнейших ИИ-суперкомпьютеров OpenAI на Ближнем Востоке 3 ч.
Количество роботов на российских предприятиях планируется увеличить впятеро к 2030 году 3 ч.
AAEON выпустила одноплатные компьютеры UP Squared TWL / Pro TWL на базе Intel Twin Lake 4 ч.
Mastero представила недорогую оперативную память DDR5 на чипах Samsung и Micron 4 ч.