Сегодня 15 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

DeepSeek обновила открытую модель V3, улучшив её навыки программирования

DeepSeek выпустила обновление ИИ-модели V3, получившее название V3-0324, которое, как сообщается, предоставляет лучшие возможности для программирования, одновременно устанавливая новые стандарты точности и эффективности, пишет Bloomberg. Обновление было опубликовано на платформе Hugging Face без официального анонса.

 Источник изображения: Solen Feyissa/unsplash.com

Источник изображения: Solen Feyissa/unsplash.com

Открытая ИИ-модель DeepSeek V3 была представлена в конце прошлого года. Модель построена на архитектуре Mixture of Experts (MoE, набор экспертов) с общим количеством параметров 671 млрд и 37 млрд параметров, активируемых на каждый токен.

Как сообщила тогда компания, на обучение DeepSeek V3 ушло $5,5 млн, что значительно ниже расходов других технологических компаний, таких как OpenAI, на обучение аналогичных моделей. Спустя несколько недель DeepSeek выпустила открытую рассуждающую модель R1, которая, несмотря на скромный бюджет на разработку, превзошла ИИ-модель o1 от компании OpenAI в некоторых бенчмарках по ряду ключевых показателей.

В январе 2025 года приложение DeepSeek опередило ИИ-чат-бот ChatGPT и вышло на первое место в рейтинге самых популярных бесплатных приложений в интернет-магазине Apple App Store в США. Достижения китайского стартапа вызвали вопросы у инвесторов по поводу обоснованности громадных затрат американских компаний на разработку ИИ-технологий, что привело к обрушению ИИ-рынка, в результате которого его участники столкнулись со значительным падением акций. В частности, лидер рынка Nvidia потеряла за день $593 млрд рыночной стоимости, что было крупнейшим однодневным падением в истории фондового рынка.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Япония предписала Google прекратить навязывание своих приложений производителям смартфонов 2 ч.
Obsidian рассказала о широте ролевых возможностей в The Outer Worlds 2 — игроки смогут отыгрывать серийного убийцу и не только 2 ч.
Датамайнер рассказала о самом большом неиспользованном боссе в играх FromSoftware — он мог появиться в Sekiro: Shadows Die Twice 2 ч.
В деле об отделении Instagram и WhatsApp от Meta появилась веская улика — компрометирующее письмо Цукерберга от 2012 года 3 ч.
ИИ-модели Gemini позволили анализировать снимки в «Google Фото», но пока не у всех пользователей 3 ч.
«Абсолютно завораживающий опыт»: эксперт Digital Foundry протестировал Cyberpunk 2077 на Nintendo Switch 2 4 ч.
К Apple подали ещё два иска за невыполненные обещания по ИИ-функциям Apple Intelligence 4 ч.
Apple будет анализировать переписки пользователей на iPhone, iPad и Mac для улучшения своего ИИ 5 ч.
Правительство РФ определилось, как будет изымать криптовалюту при уголовных делах 6 ч.
Контур.Толк представил новый ИИ-инструмент — резюме встречи 7 ч.
ИБП Google Cloud стали причиной… шестичасового перебоя в электроснабжении одного из облачных регионов 12 мин.
TSMC решила выпускать прямоугольные чипы на квадратных кремниевых пластинах вместо круглых 47 мин.
Caviar представила OVI 8 — спецверсию iPhone в часть Александра Овечкина за 650 тыс. рублей 57 мин.
МТС придумала, как сэкономить на развёртывании сетей 5G 2 ч.
Тайвань впервые обвинил капитана китайского судна в умышленном повреждении подводных кабелей 3 ч.
Крупнейший завод по сборке iPhone возобновил набор сотрудников, несмотря на неопределённость с пошлинами 3 ч.
Apple впервые стала крупнейшим в мире производителем смартфонов в первом квартале 3 ч.
Российским производителям электроники прекратят выдавать субсидии 4 ч.
Власти США начали расследование цепочек импорта чипов — это грозит новыми пошлинами 5 ч.
Ученые создали растягивающуюся литиевую батарею — её безопасно сгибать, резать и прокалывать 5 ч.