Сегодня 25 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

DeepSeek обновила открытую модель V3, улучшив её навыки программирования

DeepSeek выпустила обновление ИИ-модели V3, получившее название V3-0324, которое, как сообщается, предоставляет лучшие возможности для программирования, одновременно устанавливая новые стандарты точности и эффективности, пишет Bloomberg. Обновление было опубликовано на платформе Hugging Face без официального анонса.

 Источник изображения: Solen Feyissa/unsplash.com

Источник изображения: Solen Feyissa/unsplash.com

Открытая ИИ-модель DeepSeek V3 была представлена в конце прошлого года. Модель построена на архитектуре Mixture of Experts (MoE, набор экспертов) с общим количеством параметров 671 млрд и 37 млрд параметров, активируемых на каждый токен.

Как сообщила тогда компания, на обучение DeepSeek V3 ушло $5,5 млн, что значительно ниже расходов других технологических компаний, таких как OpenAI, на обучение аналогичных моделей. Спустя несколько недель DeepSeek выпустила открытую рассуждающую модель R1, которая, несмотря на скромный бюджет на разработку, превзошла ИИ-модель o1 от компании OpenAI в некоторых бенчмарках по ряду ключевых показателей.

В январе 2025 года приложение DeepSeek опередило ИИ-чат-бот ChatGPT и вышло на первое место в рейтинге самых популярных бесплатных приложений в интернет-магазине Apple App Store в США. Достижения китайского стартапа вызвали вопросы у инвесторов по поводу обоснованности громадных затрат американских компаний на разработку ИИ-технологий, что привело к обрушению ИИ-рынка, в результате которого его участники столкнулись со значительным падением акций. В частности, лидер рынка Nvidia потеряла за день $593 млрд рыночной стоимости, что было крупнейшим однодневным падением в истории фондового рынка.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Microsoft пообещала исправить ошибку с чрезмерной нагрузкой на процессор в классическом Outlook 19 мин.
Спустя 25 лет GOG подарил новую жизнь ролевой классике от Capcom — Breath of Fire IV вновь доступна на ПК 31 мин.
Warhorse подтвердила планы на новую игру и показала геймплей дополнения Brushes with Death к Kingdom Come: Deliverance 2 33 мин.
Бесплатные пользователи ChatGPT получили доступ к исследованиям Deep Research, но с ограничениями 2 ч.
Платформа «CTI Мониторинг» получила расширенные средства аналитики проблем в работе ВКС-сервисов 2 ч.
«Яндекс» нарастил квартальную выручку на 34 % — компания похвалилась ростом по всем направлениям 3 ч.
Yahoo тоже попытается заполучить Chrome, если представится возможность 5 ч.
Продажи ремейка Resident Evil 4 достигли 10 миллионов копий — рекорд Resident Evil Village не устоял 7 ч.
YouTube выручила $8,9 млрд и отпраздновала 20-летие, объявив о новом рекорде загрузок видео 8 ч.
Meta ограничит спамерам охват аудитории и монетизацию в Facebook 11 ч.
Через пять лет ИИ-суперкомпьютер потребует для работы 9 атомных ректоров и будет стоить как три годовых бюджета Москвы 13 мин.
Phanteks выпустила СЖО Glacier One D30 X2 с радиаторами на 360 и 420 мм 59 мин.
Galax представила три оверклокерские GeForce RTX 5090D HOF стоимостью от $3605 2 ч.
Intel привлекла ИИ к обнаружению ошибок у чипов в ЦОД 2 ч.
Китай поделился с учёными из США свежими образцами лунного грунта, но ответного жеста не дождался 3 ч.
Nintendo собрала предзаказы на миллионы Switch 2 — в США и Японии консолей на всех не хватит 3 ч.
Пошлины Трампа должны были привести к выпуску iPhone в США, но Apple пойдёт другим путём 3 ч.
Xiaomi представила игровую мышь, механическую клавиатуру, пауэрбанк и колонку в стиле Гарри Поттера 3 ч.
Популярность беспилотных такси Waymo достигла 250 000 платных поездок в неделю 3 ч.
Квартальная выручка Intel в сегменте ЦОД превысила $4 млрд 4 ч.