|
Опрос
|
реклама
Быстрый переход
Alibaba представила семейство ИИ-моделей Qwen3, которые быстрее и эффективнее DeepSeek
29.04.2025 [05:44],
Алексей Разин
В начале этой недели китайская компания Alibaba Group Holdings представила новое семейство флагманских языковых моделей Qwen3, которое использует актуальный метод «смешения экспертов» для достижения результатов, сопоставимых с итогами работы гибридных рассуждающих систем.
Источник изображения: Alibaba По данным Alibaba, её модели семейства Qwen3 в ряде сфер применения оказываются на уровне или даже быстрее и эффективнее разработок DeepSeek, включая решение математических задач и написание программного кода. Масштабирование этих моделей также обходится значительно дешевле большинства популярных аналогов. Модели такого типа пытаются подражать людям в логике решения задач, подобные системы уже предложены компаниями Anthropic и Alphabet (Google). Более эффективное решение задачи осуществляется за счёт дробления её на несколько сегментов, за каждый из которых отвечает свой фрагмент кода. Это напоминает процесс решения проблемы группой экспертов, каждому из которых поручена своя задача. Alibaba ещё в марте представила модели семейства Qwen 2.5, которые могут работать с текстом, изображениями, аудио и видео, ограничиваясь при этом аппаратными ресурсами ноутбука или смартфона. Семейство моделей Qwen3 придерживается принципа открытости исходного кода. Под давлением DeepSeek американский стартап OpenAI также пообещал представить более открытую модель, подражающую логике рассуждения человека. Стремление Alibaba усилить свои позиции на рынке систем искусственного интеллекта помогло китайскому гиганту выйти из кризиса, порождённого конфликтом основателя Джека Ма (Jack Ma) с китайскими властями, которые несколько лет назад всерьёз взялись за регулирование бизнеса в тех сферах, на которых строилось благополучие Alibaba Group. Alibaba представила мощную ИИ-модель Qwen2.5-Max, которая лучше GPT-4o и DeepSeek V3
29.01.2025 [06:04],
Анжелла Марина
Alibaba Cloud, облачное подразделение китайской компании Alibaba, анонсировала выпуск обновлённой, крупномасштабной языковой модели Qwen2.5-Max. ИИ-модель основана на архитектуре Mixture-of-Experts (MoE) и обучена на более чем 20 триллионах токенов. Разработчики подчёркивают, что инструмент показал «значительный прогресс в интеллектуальных возможностях» и уже доступен для использования.
Источник изображения: Alibaba Cloud Новая версия модели отличается улучшенной производительностью и точностью, способна лучше справляться с задачами, требующими глубокого понимания контекста, таких как анализ текста, перевод и генерация контента. «Qwen2.5-Max демонстрирует значительный прогресс в обработке сложных запросов и предоставлении релевантных ответов», — пишет компания на страницах своего блога. Qwen2.5-Max была протестирована в ряде ключевых бенчмарков, включая MMLU-Pro, LiveCodeBench, LiveBench и Arena-Hard. Модель показала превосходство над DeepSeek V3 в таких тестах, как Arena-Hard, LiveBench и LiveCodeBench, а также продемонстрировала конкурентоспособные результаты в MMLU-Pro. В сравнении с другими ведущими моделями, такими как GPT-4o и Claude-3.5-Sonnet, Qwen2.5-Max также подтвердила свои лидирующие позиции.
Источник изображения: Alibaba Cloud
Источник изображения: Alibaba Cloud Alibaba Cloud планирует интегрировать Qwen2.5-Max в свои облачные сервисы, что позволит клиентам использовать инструмент для решения широкого спектра задач, включая автоматизацию обработки данных, улучшение взаимодействия с клиентами через чат-ботов и оптимизацию бизнес-процессов. ИИ-модель уже доступна через сервис Qwen Chat, в котором пользователи могут взаимодействовать с Qwen2.5-Max, тестировать её возможности и экспериментировать с различными функциями. Для разработчиков также открыт программный интерфейс API. Для доступа необходимо зарегистрироваться в Alibaba Cloud, активировать сервис Model Studio и создать API-ключ. Ещё один китайский удар по OpenAI: Alibaba выпустила ИИ, который может управлять ПК и смартфоном
28.01.2025 [16:18],
Павел Котов
Самой яркой звездой китайской отрасли искусственного интеллекта в последние дни стала лаборатория DeepSeek, но не сидят сложа руки и технологические гиганты: подразделение Alibaba Qwen представило семейство моделей Qwen2.5-VL, способных управлять ПК и смартфоном, как это делает виртуальный помощник OpenAI Operator.
Источник изображения: alibabacloud.com Самая мощная модель в семействе Qwen2.5-VL превзошла крупнейшие американские проекты, в том числе OpenAI GPT-4o, Anthropic Claude 3.5 Sonnet и Google Gemini 2.0 Flash в ряде испытаний, включая «понимание» видео, решение математических задач, анализ документов и ответы на вопросы, утверждают разработчики. Испытать эту модель можно в приложении Alibaba Qwen Chat, доступна её загрузка с платформы Hugging Face. Она анализирует диаграммы и графики, извлекает данные из бухгалтерских документов, изучает многочасовые видео, а также распознаёт фрагменты фильмов и сериалов — возможно, её обучение велось с использованием защищённых авторским правом работ. Как и другие китайские модели, она отказывается комментировать политику Пекина.
Источник изображения: x.com/_philschmid Одной из наиболее интересных особенностей Qwen2.5-VL является её способность управлять программами на ПК и мобильных устройствах. В одном из примеров модель запустила приложение на Android и забронировала авиабилеты. В другом примере ей поручили управление ПК под Linux, но она смогла совершить лишь базовые действия, в частности, переключала вкладки в браузере. Младшие версии Qwen2.5-VL-3B и Qwen2.5-VL-7B доступны по открытой лицензии без ограничений; флагманская Qwen2.5-VL-72B требует, чтобы владельцы платформ с более чем 100 млн пользователей получали разрешение у Alibaba Qwen перед коммерческим развёртыванием модели. |