Сегодня 28 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Ускорители Nvidia Blackwell более чем в два раза обходят предшественников в обучении больших языковых моделей

По опубликованным некоммерческой организацией MLCommons результатам тестирования различных аппаратных систем при обучении больших языковых моделей становится понятно, что ускорители вычислений Nvidia с архитектурой Blackwell более чем в два раза превосходят по производительности своих предшественников поколения Hopper.

 Источник изображения: Nvidia

Источник изображения: Nvidia

В принципе, об этом в момент анонса архитектуры Blackwell говорила и сама Nvidia, но теперь эти заявления хотя бы подкреплены данными тестов в изложении независимых источников. Применялись языковые модели типа Llama 3.1 405B, которые содержат буквально триллионы параметров и отображают сложность вычислений в сфере искусственного интеллекта на актуальном этапе развития отрасли. Справедливости ради, следует учитывать, что данные для исследования с результатами тестирования своих систем на основе Blackwell компания Nvidia предоставила сама, но представители MLCommons хотя бы не сомневаются в их достоверности.

Из полученных результатов тестирования становится известно, что в удельном выражении каждый чип поколения Blackwell в подобных вычислительных задачах оказывается в два с лишним раза быстрее предшественника поколения Hopper. В конкретной конфигурации система на основе 2496 чипов Blackwell справилась с заданием за 27 минут. Чтобы получить более впечатляющий результат, системе на базе такого же количества чипов Hopper потребовалось более чем в три раза больше времени.

Представители CoreWeave пояснили, что в последнее время в отрасли наблюдается тенденция к разделению крупных вычислительных кластеров на более мелкие подсистемы с небольшим количеством ускорителей, специализирующихся на отдельных подзадачах. Это позволяет ускорять обучение языковых моделей в условиях ограниченности аппаратных ресурсов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Alibaba представила ИИ-модель Qwen VLo, которая умеет редактировать картинки 46 мин.
В миллионах принтеров Brother обнаружены уязвимости безопасности — некоторые невозможно исправить 58 мин.
Runway готовит платформу для создания игр с помощью ИИ 2 ч.
ЕС пригрозил Meta ежедневными штрафами — бизнес-модель «плати или соглашайся» не прошла проверку 7 ч.
Новая статья: FBC: Firebreak — контроль потерян. Рецензия 8 ч.
Кодзима спрятал в Death Stranding 2: On the Beach отсылки к самому себе — они могут вызвать «сильный кринж» 8 ч.
Сердце пустыни склонно к измене: создатели Dune: Awakening устроили передел PvP и PvE в эндгейме после жалоб игроков 10 ч.
Microsoft добавила в браузер Edge поиск по истории с ИИ и новые функции Copilot 12 ч.
«Погоня за безопасными идеями — смертный приговор»: разработчик Rematch разбил надежды фанатов на Sifu 2 13 ч.
Мир охватила эпидемия ИИ-зависимости — от нездорового общения с ботами лечатся, как от наркомании 13 ч.
Maxell выпустила кассетный ретро-плеер MXCP-P100 с поддержкой Bluetooth-наушников и USB-C 11 мин.
Intel отправила в отставку директора по стратегии 28 мин.
Мозговой имплант N1 компании Neuralink получили уже семь пациентов с опорно-двигательными проблемами 49 мин.
Xiaomi выпустила контроллер Redmi GamePad за $70 со стиками с эффектом Холла для мобильных устройств 56 мин.
Экс-руководитель печально известной Cruise перешел в Tesla для работы над роботакси 2 ч.
Intel скоро «догонит» AMD по доле рынка серверных процессоров 8 ч.
Intel смогла снизить долю на рынке серверных процессоров до 62 %, но доля AMD всё равно меньше 8 ч.
Да будет свет: российские IT-компании заинтересовались арендой тёмного волокна 9 ч.
Учёные заставили цифровой контроллер работать почти при абсолютном нуле — это прорыв для квантовых компьютеров 10 ч.
Над США взорвался пылающий метеорит массой более тонны — осколки пробили жилой дом 13 ч.