Сегодня 23 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Alibaba выпустила ИИ-модели, которые могут распознавать изображения и вести диалог

Китайский технологический гигант Alibaba представил две языковые модели — Qwen Large Vision Language Model (Qwen-VL) и Qwen-VL-Chat — демонстрирующие расширенные возможности интерпретации изображений и ведения диалогов на естественном языке. Учитывая растущий спрос на доступ к продвинутым ИИ-алгоритмам, появление языковых моделей Alibaba может оказаться весьма своевременным.

 Источник изображения: maginative.com

Источник изображения: maginative.com

Представленные языковые модели не ограничиваются понимаем текстовых сообщений. Qwen-VL способен воспринимать и понимать изображения, текст и соблюдать ограничения. Алгоритм может обрабатывать запросы, связанные с разными изображениями, и генерировать ответы на них. Qwen-VL-Chat предназначен для более сложного взаимодействия. Например, он может сравнивать несколько изображений, отвечать на серии вопросов, писать истории на основе предоставленных пользователем картинок. К примеру, пользователь может спросить ИИ о местоположении больницы по фото её вывески и получить точный ответ на этот вопрос.

Одно из преимуществ представленных языковых моделей состоит в том, что они работают с высокой точностью. По данным Alibaba, Qwen-VL значительно превосходит существующие схожие языковые модели с открытым исходным кодом по нескольким критериям оценки английского языка. Алгоритм также поддерживает новую функцию «общение с чередованием нескольких изображений», которая предполагает, что пользователь предоставит ИИ несколько изображений, после чего будет задавать связанные с ними вопросы.

Используя стандартные эталоны, специалисты Alibaba оценили возможности новых алгоритмов при выполнении разных задач, начиная от генерации комментариев к изображениям и заканчивая ответами на вопросы по загруженным снимкам. Обе модели также тестировались по разработанному в Alibaba эталону, который основан на оценке GPT-4 для определения диалоговых возможностей и соответствия человеческому восприятию. Отмечается, что Qwen-VL и Qwen-VL-Chat достигли наилучших результатов в разных категориях.

Alibaba стала одной из первых китайских компаний, представивших конкурентоспособную систему генеративного ИИ, что свидетельствует о быстром прогресс исследований в сфере нейросетей в Поднебесной. Выпуская модели с открытым исходным кодом, Alibaba гарантирует, что исследователи, учёные и компании по всему миру смогут использовать их для создания собственных приложений, не прибегая к трудоёмкому и дорогостоящему процессу обучения нейросетей с нуля.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Meta может потерять $7 млрд из-за новых пошлин Трампа против Китая 4 ч.
OpenAI готова купить браузер Chrome, если Google обяжут его продать 6 ч.
Новые правила «Оскара» разрешили применение ИИ в кино, но с оговоркой 10 ч.
Google бросила попытки искоренить сторонние cookies — они останутся в браузере Chrome 10 ч.
«Однозначно стоит своих денег»: хоррор Post Trauma в духе первых Silent Hill и Resident Evil вышел в российском Steam 11 ч.
Apple полностью поменяет команду разработки Siri, чтобы вывести её из застоя 11 ч.
Nvidia похвалилась, что поддержка технологии DLSS уже есть в 769 играх и приложениях 13 ч.
Анонсирован психологический хоррор «нового уровня» Displacement с элементами BioShock и Condemned — игра на грани закрытия 13 ч.
AMD выпустила необязательный драйвер с поддержкой The Elder Scrolls IV: Oblivion Remastered и FSR 4 для новых игр 14 ч.
Apple перестала обманывать пользователей и убрала утверждение, что Apple Intelligence «доступен сейчас» 14 ч.
Гендир Тан вот-вот объявит об увольнении более 20 тыс. сотрудников Intel 19 мин.
Глава NVIDIA призвал премьера Японии к увеличению производства электроэнергии для развития ИИ-индустрии 35 мин.
Китайские техногиганты успели заказать у Nvidia ускорителей H20 на миллиарды долларов до введения запрета на их поставку 2 ч.
Microsoft развернёт системы охлаждения LG в своих ИИ ЦОД 2 ч.
Трагическое ДТП с электромобилем SU7 вынудило Xiaomi задержать премьеру кроссовера YU7 3 ч.
Политический активизм Маска обернулся для Tesla рухнувшей на 20 % выручкой от продаж электромобилей 4 ч.
Минпромторг исключит ноутбуки и серверы HP и Fujitsu из списка на параллельный импорт 10 ч.
Новая статья: Старость — не радость (и для кремния тоже) 11 ч.
GS Group освоила самое передовое в России корпусирование микросхем, но до мировых лидеров ещё далеко 11 ч.
Зонд «Гера» показал Марс с необычного ракурса и сфотографировал один из самых маленьких спутников в Солнечной системе 12 ч.