Сегодня 01 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Nvidia выпустила мультимодальную модель ИИ с открытым исходным кодом, и она не уступает GPT-4

Nvidia представила новое семейство больших мультимодальных языковых моделей NVLM 1.0, включая обученную на 72 миллиардах параметров NVLM-D-72B. Модели демонстрируют высокую производительность в широком спектре задач, таких как машинное зрение, создание программного кода, анализ изображений, решение математических задач и генерация текстов. Похоже, что лидерам отрасли во главе с OpenAI и Google придётся потесниться.

 Источник изображения: freepik.com

Источник изображения: freepik.com

«Мы представляем NVLM 1.0, семейство передовых мультимодальных больших языковых моделей, которые достигают самых современных результатов в задачах зрения и языка, конкурируя с ведущими фирменными моделями (например, GPT-4o) и моделями с открытым доступом», — утверждают разработчики Nvidia. По их мнению, открытый исходный код предоставляет исследователям и разработчикам беспрецедентный доступ к передовым технологиям.

Флагманская модель NVLM-D-72B демонстрирует адаптивность при обработке сложных визуальных и текстовых входных данных. Исследователи подчёркивают способность модели интерпретировать мемы, анализировать изображения и пошагово решать математические задачи. Разработчики также отметили, что NVLM-D-72B улучшает свою производительность в текстовых задачах после мультимодального обучения, в отличие от большинства аналогичных моделей.

Проект NVLM также представляет инновационные архитектурные решения, включая гибридный подход, который объединяет различные методы мультимодальной обработки. По оценкам сторонних исследователей, модель NVLM-D-72B «находится на одном уровне с Llama 3.1 405B по математике и кодированию, а также имеет видение».

Выпуск Nvidia NVLM 1.0 знаменует собой поворотный момент в разработке ИИ. Открывая исходный код модели, которая конкурирует с проприетарными гигантами, Nvidia не просто делится кодом — она бросает вызов самой структуре индустрии ИИ. Благодаря Nvidia множество небольших организаций и независимых исследователей смогут вносить более значительный вклад в развитие ИИ, что может открыть эру беспрецедентного сотрудничества и инноваций в области ИИ.

Этот шаг может вызвать цепную реакцию — другим лидерам в области ИИ также придётся открыть свои исследования, что потенциально ускорит прогресс ИИ по всем направлениям.

Нужно отметить, что выпуск NVLM 1.0 не лишён рисков. По мере того, как мощный ИИ становится все более доступным, возрастают и опасения по поводу его неправильного использования и возможных этических последствий. Сообщество ИИ уже столкнулось с необходимостью ответственного использования новых технологий.

Одно можно сказать наверняка: политика Nvidia в отношении ИИ затронет всю индустрию. Вопрос только в том, насколько радикальным окажется её влияние, и смогут ли конкуренты адаптироваться достаточно быстро, чтобы преуспеть в этом новом мире открытого ИИ.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Окей, Google, давай пообщаемся»: представлен ИИ-помощник Gemini for Home для умного дома 5 мин.
У Assassin's Creed, Far Cry и Rainbow Six теперь новый дом, которым частично владеет Tencent — Ubisoft представила Vantage Studios 36 мин.
Microsoft вывела Xbox Cloud Gaming из беты, подтянула графику до 1440p и повысила битрейт 45 мин.
Meta начнёт использовать чаты пользователей с ИИ, чтобы продавать ещё более персонализированную рекламу 2 ч.
Ultimate за $30, ПК-игры и Xbox Cloud Gaming для всех: Microsoft анонсировала масштабные изменения в Game Pass 2 ч.
Базу данных Wikimedia Foundation переведут в вектор — это упростит поиск для людей и ИИ 4 ч.
Epic Games: iOS 18.6 показала, что барьеры для сторонних магазинов приложений были искусственными 4 ч.
Apple, Google и Meta ответят в суде за рекламу вызывающих зависимость игр-казино 5 ч.
Apple назвала антимонопольный иск Маска к ней и OpenAI пустышкой и попросила его отклонить 7 ч.
«Ничего подобного мы раньше не делали»: нелинейный шутер Judas от авторов BioShock на самом деле «радикально отличается» от BioShock 7 ч.
Asus оценила GeForce RTX 5080 Hatsune Miku Edition в $1900 — на 90 % дороже рекомендованной цены 23 мин.
OpenAI построит ИИ ЦОД Stargate в Южной Корее, а Samsung поможет ей создать плавучие дата-центры 58 мин.
OpenAI объединится с Samsung и SK hynix, чтобы удовлетворить потребность в памяти для ИИ-мегапроекта Stargate 2 ч.
Oura представила керамические умные кольца Ring 4 за $499, зарядный футляр за $99 и медицинский сервис за $99 2 ч.
Сегодня в России отмечается День работников отрасли ЦОД 2 ч.
Selectel проведёт ежегодную флагманскую конференцию Selectel Tech Day 2025 в Москве 3 ч.
Паукообразный робот Charlotte будет возводить по дому в день — и на Луне тоже 3 ч.
Crucial выпустила самую быструю память LPCAMM2 LPDDR5X для ноутбуков — 8533 МТ/с 3 ч.
В гейзерах спутника Сатурна Энцелада засекли органику, намекающую на зарождение жизни — данные зонда «Кассини» 3 ч.
Представлен доступный смартфон Realme 15x — экран 144 Гц, защита IP69 и батарея на 7000 мА·ч за $200 3 ч.