Сегодня 22 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → qwen-vl

Alibaba выпустила ИИ-модели, которые могут распознавать изображения и вести диалог

Китайский технологический гигант Alibaba представил две языковые модели — Qwen Large Vision Language Model (Qwen-VL) и Qwen-VL-Chat — демонстрирующие расширенные возможности интерпретации изображений и ведения диалогов на естественном языке. Учитывая растущий спрос на доступ к продвинутым ИИ-алгоритмам, появление языковых моделей Alibaba может оказаться весьма своевременным.

 Источник изображения: maginative.com

Источник изображения: maginative.com

Представленные языковые модели не ограничиваются понимаем текстовых сообщений. Qwen-VL способен воспринимать и понимать изображения, текст и соблюдать ограничения. Алгоритм может обрабатывать запросы, связанные с разными изображениями, и генерировать ответы на них. Qwen-VL-Chat предназначен для более сложного взаимодействия. Например, он может сравнивать несколько изображений, отвечать на серии вопросов, писать истории на основе предоставленных пользователем картинок. К примеру, пользователь может спросить ИИ о местоположении больницы по фото её вывески и получить точный ответ на этот вопрос.

Одно из преимуществ представленных языковых моделей состоит в том, что они работают с высокой точностью. По данным Alibaba, Qwen-VL значительно превосходит существующие схожие языковые модели с открытым исходным кодом по нескольким критериям оценки английского языка. Алгоритм также поддерживает новую функцию «общение с чередованием нескольких изображений», которая предполагает, что пользователь предоставит ИИ несколько изображений, после чего будет задавать связанные с ними вопросы.

Используя стандартные эталоны, специалисты Alibaba оценили возможности новых алгоритмов при выполнении разных задач, начиная от генерации комментариев к изображениям и заканчивая ответами на вопросы по загруженным снимкам. Обе модели также тестировались по разработанному в Alibaba эталону, который основан на оценке GPT-4 для определения диалоговых возможностей и соответствия человеческому восприятию. Отмечается, что Qwen-VL и Qwen-VL-Chat достигли наилучших результатов в разных категориях.

Alibaba стала одной из первых китайских компаний, представивших конкурентоспособную систему генеративного ИИ, что свидетельствует о быстром прогресс исследований в сфере нейросетей в Поднебесной. Выпуская модели с открытым исходным кодом, Alibaba гарантирует, что исследователи, учёные и компании по всему миру смогут использовать их для создания собственных приложений, не прибегая к трудоёмкому и дорогостоящему процессу обучения нейросетей с нуля.


window-new
Soft
Hard
Тренды 🔥
«Превращает мечту в реальность»: эксперта Digital Foundry впечатлила работа Bloodborne на ПК через эмулятор shadPS4 42 мин.
Google вложит ещё $1 млрд в конкурента OpenAI — ИИ-стартап Anthropic 55 мин.
Трамп помиловал основателя даркнет-платформы Silk Road, осуждённого на пожизненный срок 56 мин.
Регулирование криптовалют станет простым и понятным — сторонники Трампа запустили глубинные изменения в SEC 57 мин.
Аналитики подсчитали траты российских геймеров на игры в 2024 году и назвали главные хиты продаж 2 ч.
Журналисты случайно «засветили» дату выхода Doom: The Dark Ages, которую анонсируют на Developer_Direct 3 ч.
Аудитория Netflix взлетела до 302 млн благодаря «Игре в кальмара» — сервис поднял цены на подписку 3 ч.
Microsoft разрешила OpenAI пользоваться облачными сервисами конкурентов 7 ч.
Microsoft встроила свой браузер Edge во все игры сразу 8 ч.
Хардкорный режим, скачки и три сюжетных дополнения: Warhorse рассказала, как будет поддерживать Kingdom Come: Deliverance 2 после релиза 16 ч.
Германия поставила на боевое дежурство израильский подводный беспилотник Blue Whale для патрулирования Балтики 14 мин.
Марсоход Curiosity обнаружил, где на Красной планете плескались волны 39 мин.
Silicon Motion разрабатывает SSD-контроллер SM8466 с поддержкой PCIe 6.0 2 ч.
OpenAI, Softbank и Oracle запустили Stargate — предприятие на $500 млрд по превращению США в ИИ-сверхдержаву 3 ч.
Transcend выпустила SSD серии ETD410T формата U.2 для дата-центров 4 ч.
Владелец TikTok потратит в этом году $12 млрд на ИИ-ускорители от Nvidia и китайских производителей 4 ч.
Samsung вложит в контрактное производство чипов на порядок меньше, чем TSMC 6 ч.
Ускорители Ascend не готовы состязаться с чипами NVIDIA в деле обучения ИИ, но за эффективность инференса Huawei будет бороться всеми силами 6 ч.
Meta планирует выпустить умные очки Oakley, часы и наушники с ИИ 8 ч.
Nvidia в третий раз обошла Apple, став самой дорогой компанией в мире 8 ч.