Сегодня 16 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Alibaba представила открытую ИИ-модель, которая лучше OpenAI

Китайская компания Alibaba представила модель искусственного интеллекта с открытым исходным кодом под названием QwQ-32B-Preview. Модель способна решать сложные логические и математические задачи, содержит 32,5 миллиарда параметров и может обрабатывать запросы длиной до 32 000 слов. По тестам, проведённым Alibaba, QwQ-32B-Preview превосходит модели o1-preview и o1-mini от OpenAI в ряде показателей.

 Источник изображения: Copilot

Источник изображения: Copilot

Одним из ключевых преимуществ QwQ-32B-Preview, как сообщает TechCrunch, является её производительность в тестах AIME и MATH. Тест AIME оценивает работу модели с помощью других искусственных интеллектов, а MATH представляет собой набор текстовых математических задач. Благодаря своим особенностям, этот ИИ-бот способен решать сложные задачи и логические головоломки. Однако отмечается, что QwQ-32B-Preview не лишена недостатков: она может неожиданно менять язык общения, зацикливаться на некоторых моментах и хуже справляется с заданиями, когда требуется задействовать здравый смысл.

Интересной особенностью QwQ-32B-Preview является способность «проверять саму себя». Это помогает избегать ошибок-ловушек, свойственных другим системам искусственного интеллекта, однако замедляет процесс нахождения решений. Как и модели o1 от OpenAI, новая разработка Alibaba решает задачи поэтапно, постепенно анализируя и планируя дальнейшие шаги.

Несмотря на то, что QwQ-32B-Preview доступна для скачивания на платформе Hugging Face под лицензией Apache 2.0 (свободное программное обеспечение), что позволяет использовать её в коммерческих целях, Alibaba раскрыла лишь часть компонентов модели, тем самым не позволяя изучить внутренние механизмы работы алгоритма. Таким образом, несмотря на заявления об «открытости», модель остаётся промежуточным вариантом между закрытыми и открытыми системами (open source license).

Китайское происхождение модели также накладывает определённые ограничения. Как и другие разработки из Китая, QwQ-32B-Preview следует требованиям местного регулятора, который проверяет ИИ на соответствие «основным социалистическим ценностям». На вопросы политического характера, связанных с Китаем, модель отвечать откажется.

Стоит сказать, что интерес к «рассуждающим» моделям растёт на фоне снижения эффективности традиционного подхода к увеличению возможностей ИИ, основанного на простом масштабировании данных и вычислительных мощностей. Компании, такие как OpenAI, Google и Anthropic, всё чаще сталкиваются с замедлением прогресса своих технологий, что в свою очередь, стимулирует разработчиков искать новые подходы, например, такие как «вычисления на этапе выполнения» (test-time compute), которые дают моделям дополнительное время для обработки задач. При этом крупные лаборатории, включая Google, активно инвестируют в развитие подобных технологий, что подтверждает их ключевую роль в будущем искусственного интеллекта.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Бывший инженер OpenAI раскрыл, каково это — работать в компании мечты 2 ч.
OpenAI упростила создание изображений: в ChatGPT появились готовые «крутые» стили 4 ч.
Google Chrome для Android теперь позволяет выбрать, где расположить адресную строку 7 ч.
В персональной ленте Google Discover появились ИИ-сводки — это грозит новостным сайтам падением посещаемости 9 ч.
Анонсирован нелинейный ролевой триллер Agent of Strange от создателей «Жизнь и страдания господина Бранте» — первый трейлер и подробности 10 ч.
xAI отучила ИИ-чат-бот Grok оглядываться на мнение Илона Маска и приписывать себе странные фамилии 11 ч.
Банк России объявил, когда начнётся массовое внедрение цифрового рубля 12 ч.
RoboCop: Rogue City, Wuchang: Fallen Feathers, Grounded 2 и не только: Microsoft раскрыла последние новинки Game Pass в июле 13 ч.
В SelectOS появились функции автоматической установки на выделенных серверах и запуска через облако 14 ч.
Европа начала тестировать сервис проверки возраста для доступа к контенту 18+ 14 ч.
После шести кварталов роста китайский рынок смартфонов сократился на 4 %, лидером опять стала Huawei 35 мин.
Трамп заявил о создании ИИ-хаба в Пенсильвании с инвестициями $90 млрд от крупнейших компаний 2 ч.
Amazon для запуска спутников Kuiper начнёт пользоваться услугами конкурирующей SpaceX 3 ч.
Клиенты Uber получат возможность вызвать беспилотное такси Baidu 7 ч.
Госдума РФ одобрила законопроект, регулирующий деятельность ЦОД 7 ч.
Новая статья: Обзор робота-пылесоса Dreame L40S Pro Ultra: уборка по-взрослому 8 ч.
Ugreen анонсировала «первый в мире» беспроводной пауэрбанк стандарта Qi2.2 — он обеспечит до 25 Вт 9 ч.
Honor представила геймерский планшет Pad GT2 Pro со Snapdragon 8 Gen 3 и OLED-экраном на 165 Гц 10 ч.
Thermalright выпустила флагманский кулер Royal Pretor 130 Ultra с парой башен и вентиляторами разного размера 10 ч.
Dreame запустила производство телевизоров в Калужской области 10 ч.