Сегодня 15 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

DeepSeek обновила открытую модель V3, улучшив её навыки программирования

DeepSeek выпустила обновление ИИ-модели V3, получившее название V3-0324, которое, как сообщается, предоставляет лучшие возможности для программирования, одновременно устанавливая новые стандарты точности и эффективности, пишет Bloomberg. Обновление было опубликовано на платформе Hugging Face без официального анонса.

 Источник изображения: Solen Feyissa/unsplash.com

Источник изображения: Solen Feyissa/unsplash.com

Открытая ИИ-модель DeepSeek V3 была представлена в конце прошлого года. Модель построена на архитектуре Mixture of Experts (MoE, набор экспертов) с общим количеством параметров 671 млрд и 37 млрд параметров, активируемых на каждый токен.

Как сообщила тогда компания, на обучение DeepSeek V3 ушло $5,5 млн, что значительно ниже расходов других технологических компаний, таких как OpenAI, на обучение аналогичных моделей. Спустя несколько недель DeepSeek выпустила открытую рассуждающую модель R1, которая, несмотря на скромный бюджет на разработку, превзошла ИИ-модель o1 от компании OpenAI в некоторых бенчмарках по ряду ключевых показателей.

В январе 2025 года приложение DeepSeek опередило ИИ-чат-бот ChatGPT и вышло на первое место в рейтинге самых популярных бесплатных приложений в интернет-магазине Apple App Store в США. Достижения китайского стартапа вызвали вопросы у инвесторов по поводу обоснованности громадных затрат американских компаний на разработку ИИ-технологий, что привело к обрушению ИИ-рынка, в результате которого его участники столкнулись со значительным падением акций. В частности, лидер рынка Nvidia потеряла за день $593 млрд рыночной стоимости, что было крупнейшим однодневным падением в истории фондового рынка.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Яндекс» научил «Алису» рассуждать, работать с файлами, говорить по-английски, изучать мир и заниматься с детьми 20 мин.
В открытый доступ попали первые скриншоты The Elder Scrolls IV: Oblivion Remastered — официального ремейка культовой RPG от Bethesda 32 мин.
Япония предписала Google прекратить навязывание своих приложений производителям смартфонов 3 ч.
Obsidian рассказала о широте ролевых возможностей в The Outer Worlds 2 — игроки смогут отыгрывать серийного убийцу и не только 3 ч.
Датамайнер рассказала о самом большом неиспользованном боссе в играх FromSoftware — он мог появиться в Sekiro: Shadows Die Twice 4 ч.
В деле об отделении Instagram и WhatsApp от Meta появилась веская улика — компрометирующее письмо Цукерберга от 2012 года 4 ч.
ИИ-модели Gemini позволили анализировать снимки в «Google Фото», но пока не у всех пользователей 4 ч.
«Абсолютно завораживающий опыт»: эксперт Digital Foundry протестировал Cyberpunk 2077 на Nintendo Switch 2 5 ч.
К Apple подали ещё два иска за невыполненные обещания по ИИ-функциям Apple Intelligence 6 ч.
Apple будет анализировать переписки пользователей на iPhone, iPad и Mac для улучшения своего ИИ 6 ч.
«Яндекс» представила «Станцию Мини 3 Про» с поддержкой Zigbee и подключаемыми модулями 7 мин.
«Рикор» представила Rikor Pro 7 — лёгкий и мощный ноутбук для бизнеса 12 мин.
Учёные МФТИ построили литограф для создания 3D-микроструктур с элементами размером 150 нм 16 мин.
«Яндекс» представила первую в России портативную умную колонку — «Станцию Стрит» с «Алисой» 21 мин.
«Яндекс» представила свою первую умную IP-камеру для дома 24 мин.
США призвали Европу сделать выбор между американскими и китайскими технологиями связи 27 мин.
ИБП Google Cloud стали причиной… шестичасового перебоя в электроснабжении одного из облачных регионов 2 ч.
Caviar представила OVI 8 — спецверсию iPhone в часть Александра Овечкина за 650 тыс. рублей 3 ч.
МТС придумала, как сэкономить на развёртывании сетей 5G 3 ч.
Тайвань впервые обвинил капитана китайского судна в умышленном повреждении подводных кабелей 4 ч.