Сегодня 21 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

DeepSeek обновила открытую модель V3, улучшив её навыки программирования

DeepSeek выпустила обновление ИИ-модели V3, получившее название V3-0324, которое, как сообщается, предоставляет лучшие возможности для программирования, одновременно устанавливая новые стандарты точности и эффективности, пишет Bloomberg. Обновление было опубликовано на платформе Hugging Face без официального анонса.

 Источник изображения: Solen Feyissa/unsplash.com

Источник изображения: Solen Feyissa/unsplash.com

Открытая ИИ-модель DeepSeek V3 была представлена в конце прошлого года. Модель построена на архитектуре Mixture of Experts (MoE, набор экспертов) с общим количеством параметров 671 млрд и 37 млрд параметров, активируемых на каждый токен.

Как сообщила тогда компания, на обучение DeepSeek V3 ушло $5,5 млн, что значительно ниже расходов других технологических компаний, таких как OpenAI, на обучение аналогичных моделей. Спустя несколько недель DeepSeek выпустила открытую рассуждающую модель R1, которая, несмотря на скромный бюджет на разработку, превзошла ИИ-модель o1 от компании OpenAI в некоторых бенчмарках по ряду ключевых показателей.

В январе 2025 года приложение DeepSeek опередило ИИ-чат-бот ChatGPT и вышло на первое место в рейтинге самых популярных бесплатных приложений в интернет-магазине Apple App Store в США. Достижения китайского стартапа вызвали вопросы у инвесторов по поводу обоснованности громадных затрат американских компаний на разработку ИИ-технологий, что привело к обрушению ИИ-рынка, в результате которого его участники столкнулись со значительным падением акций. В частности, лидер рынка Nvidia потеряла за день $593 млрд рыночной стоимости, что было крупнейшим однодневным падением в истории фондового рынка.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google Cloud Cybershield встал на киберзащиту национальной цифровой инфраструктуры Болгарии 44 мин.
Импортозамещение не помогло: российский рынок ПО вдвое отстал от мирового по темпам роста 3 ч.
На ПК вышла психоделическая шпионская ролевая игра Zero Parades: For Dead Spies от студии-разработчика Disco Elysium 4 ч.
Платное дополнение 2026 Season Pack отправит игроков F1 25 в «новую смелую эру для Формулы-1» — первый трейлер и дата выхода 4 ч.
Импортозамещение в IT принесло российским компаниям 1,6 млрд рублей, но потратили они в 116 раз больше 5 ч.
Масштабная перезагрузка обернулась для Ubisoft рекордными убытками, зато к 2029 году выйдут новые Assassin's Creed, Far Cry и Ghost Recon 6 ч.
Anthropic намерена завершить текущий квартал с прибылью — впервые в своей истории 6 ч.
Вместо Titanfall 3: разработчики Splitgate анонсировали мультиплеерный шутер с титанами Empulse 8 ч.
«Настоящий шаг вперёд»: Cloudflare сравнила Anthropic Mythos с опытным исследователем 8 ч.
Valve назвала абсурдом приравнивание лутбоксов в Counter-Strike к азартным играм 10 ч.
MSI готовит портативную приставку Claw 8 EX AI+ с графикой Intel Arc G3 Extreme — она показалось в Австралии почти за $1800 7 мин.
Работники чипового бизнеса Samsung выбили премии  почти по $340 000 на человека 13 мин.
AMD запустила массовое производство 2-нм серверных процессоров EPYC Venice на Zen 6 19 мин.
Представлен мощный хакерский мультитул Flipper One — это уже полноценный компьютер на Linux 24 мин.
Blackview ROCK 5 — сверхпрочный смартфон с кемпинговым фонарём, мощным динамиком и батареей на 20 000 мА·ч 27 мин.
Armada привлекла $230 млн на расширение производства модульных ИИ ЦОД 2 ч.
Глава ASML подтвердил, что Илон Маск очень серьёзно настроен по поводу гигантской фабрики чипов TeraFab 2 ч.
В Японии создали многоразовый фотополимер для 3D-печати — брак можно будет использовать повторно 2 ч.
Cowboy Space подала в FCC заявку на создание орбитальной группировки из 20 тыс. ЦОД 2 ч.
Суд приказал заблокировать все домены Anna’s Archive — крупнейшей пиратской библиотеки в интернете 2 ч.