Сегодня 17 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Новая ИИ-модель DeepSeek cделает работу с длинным контекстом вдвое дешевле и быстрее

Инженеры DeepSeek представили новую экспериментальную модель V3.2-exp, которая обеспечивает вдвое меньшую стоимость инференса и значительное ускорение для сценариев с длинным контекстом.

 Источник изображения: DeepSeek/TechCrunch

Источник изображения: DeepSeek/TechCrunch

«В качестве промежуточного шага к архитектуре следующего поколения, V3.2-Exp дополняет V3.1-Terminus, внедряя DeepSeek Sparse Attention — механизм разреженного внимания, предназначенный для исследования и валидации оптимизаций эффективности обучения и вывода в сценариях с длинным контекстом», — сообщила компания в публикации на платформе Hugging Face, отметив в сообщении в соцсети X, что цены на API снижены более чем на 50 %.

С помощью механизма DeepSeek Sparse Attention (DSA), который работает как интеллектуальный фильтр, модель выбирает наиболее важные фрагменты контекста, из которых с использованием системы точного выбора токенов выбирает определённые токены для загрузки в ограниченное окно внимания модуля.

Метод сочетает крупнозернистое сжатие токенов с мелкозернистым отбором, гарантируя, что модель не теряет более широкий контекст. DeepSeek утверждает, что новый механизм отличается от представленной раннее в этом году технологии Native Sparse Attention и может быть модифицирован для предобученных моделей.

В бенчмарках V3.2-Exp не уступает предыдущей версии ИИ-модели. В тестах на рассуждение, кодирование и использование инструментов различия были незначительными — часто в пределах одного-двух пунктов, — в то время как рост эффективности был значительным, пишет techstartups.com. Модель работала в 2–3 раза быстрее при инференсе с длинным контекстом, сократила потребление памяти на 30–40 % и вдвое повысила эффективность обучения. Для разработчиков это означает более быструю реакцию, снижение затрат на инфраструктуру и более плавный путь к развёртыванию.

Для операций с длинным контекстом преимущества системы весьма существенны, отметил ресурс TechCrunch. Для более надёжной оценки модели потребуется дальнейшее тестирование, но, поскольку она имеет открытый вес и свободно доступна на площадке Hugging Face, пользователи сами могут оценить с помощью тестов, насколько эффективна новая разработка DeepSeek.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Решение TrueNAS Connect обеспечит пользователям Community Edition и сторонних СХД бесплатный доступ к продвинутым функциям TrueNAS Enterprise 2 ч.
Крупнейший архив видеоигр Myrient спасён фанатами от забвения 4 ч.
Календарь релизов 16–22 марта: Crimson Desert, Starship Troopers: Ultimate Bug War! и DS2 на ПК 4 ч.
70 % российских компаний продолжают использовать софт Atlassian 4 ч.
Для PS5 Pro вышел ИИ-апскейлер PSSR 2 — улучшенную графику получат Silent Hill 2, Alan Wake 2 и другие игры 5 ч.
«Британская энциклопедия» подала в суд на OpenAI — ChatGPT почти дословно воспроизводит её статьи 5 ч.
Бэтмен спешит на помощь: амбициозный боевик Lego Batman: Legacy of the Dark Knight выйдет на неделю раньше запланированного 6 ч.
«КРИ официально возвращается»: летом в Москве впервые с 2013 года пройдёт конференция разработчиков игр 6 ч.
В Европе потребовали срочно оштрафовать Google за подыгрывание своим сервисам в поиске 8 ч.
Обновление Windows 11 заблокировало доступ к диску C на компьютерах Samsung 8 ч.
ИИ-ускорители Groq прописались в платформе NVIDIA Vera Rubin 37 мин.
Apple наконец признала устаревшими смартфоны iPhone 5 и iPhone 4 8GB 2 ч.
«Космические вычисления уже здесь»: Nvidia представила модуль Space-1 Vera Rubin для орбитальных ИИ-серверов 3 ч.
Nvidia ударила по Intel и AMD: представлены серверные 88-ядерные CPU Vera, которые сгодятся не только для ИИ 3 ч.
ИИ-бум наплодил миллиардеров: рейтинг Forbes пополнили сразу 45 новоиспечённых богачей 4 ч.
От тысяч к десяткам миллионов: гонка ИИ разогнала спрос на углеродные кредиты среди техногигантов 6 ч.
Creative выпустила звуковую карту Sound Blaster Audigy FX Pro — звук 32 бит / 384 кГц и 7.1 для ПК 8 ч.
Vivo и iQOO анонсировали повышение цен на смартфоны, но не все 9 ч.
Apple представила наушники AirPods Max 2 с улучшенным шумоподавлением и переводом в реальном времени за $549 10 ч.
MSI рассказала, кто виноват в дефиците видеокарт, и предупредила о росте цен на игровое железо на 15–30 % 11 ч.