Сегодня 02 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Nvidia выпустила мультимодальную модель ИИ с открытым исходным кодом, и она не уступает GPT-4

Nvidia представила новое семейство больших мультимодальных языковых моделей NVLM 1.0, включая обученную на 72 миллиардах параметров NVLM-D-72B. Модели демонстрируют высокую производительность в широком спектре задач, таких как машинное зрение, создание программного кода, анализ изображений, решение математических задач и генерация текстов. Похоже, что лидерам отрасли во главе с OpenAI и Google придётся потесниться.

 Источник изображения: freepik.com

Источник изображения: freepik.com

«Мы представляем NVLM 1.0, семейство передовых мультимодальных больших языковых моделей, которые достигают самых современных результатов в задачах зрения и языка, конкурируя с ведущими фирменными моделями (например, GPT-4o) и моделями с открытым доступом», — утверждают разработчики Nvidia. По их мнению, открытый исходный код предоставляет исследователям и разработчикам беспрецедентный доступ к передовым технологиям.

Флагманская модель NVLM-D-72B демонстрирует адаптивность при обработке сложных визуальных и текстовых входных данных. Исследователи подчёркивают способность модели интерпретировать мемы, анализировать изображения и пошагово решать математические задачи. Разработчики также отметили, что NVLM-D-72B улучшает свою производительность в текстовых задачах после мультимодального обучения, в отличие от большинства аналогичных моделей.

Проект NVLM также представляет инновационные архитектурные решения, включая гибридный подход, который объединяет различные методы мультимодальной обработки. По оценкам сторонних исследователей, модель NVLM-D-72B «находится на одном уровне с Llama 3.1 405B по математике и кодированию, а также имеет видение».

Выпуск Nvidia NVLM 1.0 знаменует собой поворотный момент в разработке ИИ. Открывая исходный код модели, которая конкурирует с проприетарными гигантами, Nvidia не просто делится кодом — она бросает вызов самой структуре индустрии ИИ. Благодаря Nvidia множество небольших организаций и независимых исследователей смогут вносить более значительный вклад в развитие ИИ, что может открыть эру беспрецедентного сотрудничества и инноваций в области ИИ.

Этот шаг может вызвать цепную реакцию — другим лидерам в области ИИ также придётся открыть свои исследования, что потенциально ускорит прогресс ИИ по всем направлениям.

Нужно отметить, что выпуск NVLM 1.0 не лишён рисков. По мере того, как мощный ИИ становится все более доступным, возрастают и опасения по поводу его неправильного использования и возможных этических последствий. Сообщество ИИ уже столкнулось с необходимостью ответственного использования новых технологий.

Одно можно сказать наверняка: политика Nvidia в отношении ИИ затронет всю индустрию. Вопрос только в том, насколько радикальным окажется её влияние, и смогут ли конкуренты адаптироваться достаточно быстро, чтобы преуспеть в этом новом мире открытого ИИ.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Сэма Альтмана поймали за руку при попытке украсть видеокарту — это самое популярное ИИ-видео в Sora 31 мин.
YouTube тестирует новый интерфейс мобильного приложения — реакция пользователей ожидаемо негативная 47 мин.
Суд США разрешил прокуратуре взломать Telegram, но у неё не получилось 3 ч.
Павел Дуров открыл в Казахстане лабораторию ИИ и пообещал новые проекты 3 ч.
ГК Softline приобрела контрольную долю в BeringPro, чтобы усилить консалтинговое направление 3 ч.
Konami отобрала у покупателей Silent Hill f в Steam бонусы, которые случайно им подарила — фанаты требуют починить оптимизацию 4 ч.
Bethesda анонсировала самое крупное обновление для Fallout 76 с 2020 года — в Burning Springs появится звезда сериала «Фоллаут» 4 ч.
Instagram не подслушивает пользователей через смартфоны, заверил глава соцсети 5 ч.
«К сожалению, олдскульного Painkiller здесь нет»: игроки раскритиковали очередной трейлер кооперативного перезапуска культовой серии шутеров 6 ч.
«Выживательное» приключение The Last Caretaker о спасающем человечество роботе получило дату релиза в раннем доступе 8 ч.
Дата-центр радиотелескопа Square Kilometre Array (SKA) «засадили» сразу в две клетки Фарадея для защиты сверхчувствительных антенн от радиопомех 2 ч.
В Гарварде создали систему для «вечной» работы квантового компьютера 2 ч.
$1,5 млрд за неделю: Nscale получила ещё $443 млн инвестиций, едва закрыв прошлый раунд финансирования на $1,1 млрд 2 ч.
Meta приобрела Rivos, разработчика RISC-V-ускорителей Rivos, совместимых с CUDA 4 ч.
Dell представила сервер PowerEdge XR8720t для инфраструктур Cloud RAN 5 ч.
Китай ограничил использование оборудования Nokia и Ericsson в сетях связи 5 ч.
Anker скупает у пользователей камер Eufy видео краж и угонов — инсценировки тоже подходят 5 ч.
Илон Маск стал первым человеком с состоянием в $500 млрд — столько же стоит OpenAI 5 ч.
Google показала умную колонку Home со свежим дизайном и поддержкой Gemini AI по цене $99 5 ч.
Google столкнулась с рекордным ростом акций за 20 лет благодаря ИИ — плюс 38 % за квартал 6 ч.