Сегодня 25 марта 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

DeepSeek обновила открытую модель V3, улучшив её навыки программирования

DeepSeek выпустила обновление ИИ-модели V3, получившее название V3-0324, которое, как сообщается, предоставляет лучшие возможности для программирования, одновременно устанавливая новые стандарты точности и эффективности, пишет Bloomberg. Обновление было опубликовано на платформе Hugging Face без официального анонса.

 Источник изображения: Solen Feyissa/unsplash.com

Источник изображения: Solen Feyissa/unsplash.com

Открытая ИИ-модель DeepSeek V3 была представлена в конце прошлого года. Модель построена на архитектуре Mixture of Experts (MoE, набор экспертов) с общим количеством параметров 671 млрд и 37 млрд параметров, активируемых на каждый токен.

Как сообщила тогда компания, на обучение DeepSeek V3 ушло $5,5 млн, что значительно ниже расходов других технологических компаний, таких как OpenAI, на обучение аналогичных моделей. Спустя несколько недель DeepSeek выпустила открытую рассуждающую модель R1, которая, несмотря на скромный бюджет на разработку, превзошла ИИ-модель o1 от компании OpenAI в некоторых бенчмарках по ряду ключевых показателей.

В январе 2025 года приложение DeepSeek опередило ИИ-чат-бот ChatGPT и вышло на первое место в рейтинге самых популярных бесплатных приложений в интернет-магазине Apple App Store в США. Достижения китайского стартапа вызвали вопросы у инвесторов по поводу обоснованности громадных затрат американских компаний на разработку ИИ-технологий, что привело к обрушению ИИ-рынка, в результате которого его участники столкнулись со значительным падением акций. В частности, лидер рынка Nvidia потеряла за день $593 млрд рыночной стоимости, что было крупнейшим однодневным падением в истории фондового рынка.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Правительство возьмёт объекты КИИ на карандаш и наведёт порядок в деле миграции на отечественное ПО 12 мин.
Новая компания сооснователя Blizzard анонсировала мультиплеерный шутер Wildgate, который выглядит как Sea of Thieves в космосе 15 мин.
Google представила Gemini 2.5 Pro — свою самую умную ИИ-модель, которая превзошла OpenAI o3 16 мин.
Инсайдер раскрыл план выпуска игр для Nintendo Switch 2 — консоль выйдет в июне 2 ч.
ЕС намерен «обуздать хищническую монетизацию» игр и запретить продажу внутриигровой валюты детям 4 ч.
Vampire: The Masquerade — Bloodlines 2 не выйдет в первой половине 2025 года, но есть и хорошая новость 4 ч.
«Проводник» в Windows 11 получит умный поиск — Microsoft готовит ворох новых ИИ-инструментов 4 ч.
«Мы пытаемся не попасть в зону удара»: крупные издатели приготовились переносить свои игры, чтобы избежать конкуренции с GTA VI 4 ч.
Приложение «Фотографии» в Windows 11 получит большое обновление, основанное на ИИ 6 ч.
Минцифры РФ: уровень использования госкомпаниями отечественного ПО превышает 80 % 6 ч.
Из-за проблем с ИИ Apple резко поменяла курс и решила потратить $1 млрд на суперускорители NVIDIA GB300 NVL72 3 ч.
Vivo показала AR-гарнитуру Vivo Vision с аккумулятором на верёвочке 3 ч.
Apple объявила даты конференции WWDC 2025, где представит совершенно новую iOS и не только 3 ч.
Учёные впервые запустили модель Вселенной на уровне теории квантового поля — вышло примитивно, но похоже 4 ч.
Ещё один партнёр Nvidia поднял цены на GeForce RTX 5090 — самая дешёвая теперь стоит $2700, но купить её невозможно 6 ч.
PQ.Hosting запускает новую локацию в Лихтенштейне со скидкой 45 % на предзаказ серверов 6 ч.
Керамические накопители Cerabyte заинтересовали In-Q-Tel, инвестирующую в перспективные технологии в интересах ЦРУ и др. 7 ч.
Из пушки на Луну — в Китае построят электромагнитную катапульту для космических запусков 7 ч.
В России началась разработка проекта плавучих дата-центров 7 ч.
У нового Motorola Razr уменьшится дисплей, увеличится батарея и появится зелёная расцветка 8 ч.