Сегодня 25 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Alibaba выпустила математические языковые модели Qwen2-Math, которые лучше аналогов от OpenAI и Google

Alibaba Group Holding продолжает активно работать в сфере искусственного интеллекта. На этой неделе гигант электронной коммерции выпустил несколько больших языковых моделей (LLM) под общим названием Qwen2-Math, которые ориентированы на решение сложных математических задач и, по заявлению разработчиков, справляются с этим лучше ИИ-алгоритмов других компаний.

 Источник изображения: Shutterstock

Источник изображения: Shutterstock

Всего было представлено три большие языковые модели, которые отличаются друг от друга количеством параметров, влияющих на точность ответов алгоритма. Модель с наибольшим количеством параметров Qwen2-Math-72B-Instruct, по данным разработчиков, превосходит в плане решения математических задач многие ИИ-алгоритмы, включая GPT-4o от OpenAI, Claude 3.5 Sonnet от Anthropic, Gemini 1.5 Pro от Google и Llama-3.1-405B от Meta Platforms.

«За последний год мы проделали большую работу по изучению и расширению логических возможностей больших языковых моделей, уделяя особое внимание их способности решать арифметические и математические задачи <…> Мы надеемся, что Qwen2-Math внесёт свой вклад в усилия сообщества по решению сложных математических задач», — говорится в сообщении разработчиков.

Языковые модели Qwen2-Math протестировали с помощью разных бенчмарков, включая GSM8K (8500 сложных и разнообразных математических задач школьного уровня), OlympiadBench (двуязычный мультимодальный научный бенчмарк высокого уровня) и Gaokao (один из сложнейших вступительных математических экзаменов для университетов). Отмечается, что новые модели имеют некоторые ограничения из-за «поддержки только английского языка». В дальнейшем разработчики планируют создать двуязычные и многоязычные LLM.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Если научить ИИ маленькому обману, он начнёт жульничать систематически — Anthropic открыла вредную склонность ИИ 19 мин.
Утечка: российские фанаты «Принца Персии» опубликовали запись внутреннего показа ремейка Prince of Persia: The Sands of Time 35 мин.
В «Яндекс Картах» появился ИИ-помощник — он даёт подробные и актуальные подсказки 3 ч.
Google отчаянно защищает AdX от принудительной продажи: отделить рекламный бизнес технически невозможно 5 ч.
Ошибка Windows 11 24H2 приводит к сбоям в «Проводнике» и меню «Пуск» 6 ч.
ИИ оказался слишком рискованным даже для страхования от рисков 9 ч.
Anthropic бросает вызов Gemini 3: представлена мощная ИИ-модель Opus 4.5 и инструмент для покорения Excel 13 ч.
Маск ударил по фабрикам троллей: X начала показывать местоположение аккаунтов 14 ч.
Календарь релизов 24 – 30 ноября: Of Ash and Steel, Project Motor Racing и Hail to the Rainbow 15 ч.
В Steam стартовала распродажа «Чёрная пятница» и голосование за лучшие игры 2025 года 15 ч.
Китай запустил первую в своей истории спасательную космическую миссию 6 мин.
Российскому интернету грозит «помутнение»: до 70 % оптоволоконных магистралей устареют в 2025 году 8 мин.
Xiaomi научила электромобили автоматически объезжать препятствия в случае опасности 23 мин.
TSMC построит на Тайване ещё три фабрики 2-нм чипов и ускорит освоение этого техпроцесса в США 38 мин.
Microsoft представила настоящие кроксы в стиле Xbox — и их даже можно купить 2 ч.
Российские магистральные ВОЛС близки к предельному возрасту эксплуатации 2 ч.
Приемлемо: Samsung наконец довела 2-нм техпроцесс до уровня брака ниже 50 % 2 ч.
Стартап Kneron представил чип KL1140 для работы с ИИ-моделями на периферии 3 ч.
В Швейцарии создали крошечного робота-курьера для адресной доставки лекарств по венам 3 ч.
«Они его не хотят!»: Маск признал, что автопилот Tesla оказался не нужен другим автопроизводителям 3 ч.