Сегодня 14 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → qwen2-math

Alibaba выпустила математические языковые модели Qwen2-Math, которые лучше аналогов от OpenAI и Google

Alibaba Group Holding продолжает активно работать в сфере искусственного интеллекта. На этой неделе гигант электронной коммерции выпустил несколько больших языковых моделей (LLM) под общим названием Qwen2-Math, которые ориентированы на решение сложных математических задач и, по заявлению разработчиков, справляются с этим лучше ИИ-алгоритмов других компаний.

 Источник изображения: Shutterstock

Источник изображения: Shutterstock

Всего было представлено три большие языковые модели, которые отличаются друг от друга количеством параметров, влияющих на точность ответов алгоритма. Модель с наибольшим количеством параметров Qwen2-Math-72B-Instruct, по данным разработчиков, превосходит в плане решения математических задач многие ИИ-алгоритмы, включая GPT-4o от OpenAI, Claude 3.5 Sonnet от Anthropic, Gemini 1.5 Pro от Google и Llama-3.1-405B от Meta Platforms.

«За последний год мы проделали большую работу по изучению и расширению логических возможностей больших языковых моделей, уделяя особое внимание их способности решать арифметические и математические задачи <…> Мы надеемся, что Qwen2-Math внесёт свой вклад в усилия сообщества по решению сложных математических задач», — говорится в сообщении разработчиков.

Языковые модели Qwen2-Math протестировали с помощью разных бенчмарков, включая GSM8K (8500 сложных и разнообразных математических задач школьного уровня), OlympiadBench (двуязычный мультимодальный научный бенчмарк высокого уровня) и Gaokao (один из сложнейших вступительных математических экзаменов для университетов). Отмечается, что новые модели имеют некоторые ограничения из-за «поддержки только английского языка». В дальнейшем разработчики планируют создать двуязычные и многоязычные LLM.


window-new
Soft
Hard
Тренды 🔥
Microsoft ответит в суде за слишком дорогую подписку ChatGPT 8 мин.
Instagram защитит подростков от ИИ и «взрослого» контента — фильтр PG-13 теперь включён по умолчанию 18 мин.
Splinter Cell: Pandora Tomorrow спустя 20 лет вернулась на ПК — культовый стелс-экшен внезапно появился в Steam, EGS и Ubisoft Connect 44 мин.
Google Gemini научился пересказывать содержимое страниц в мобильном Chrome 57 мин.
Microsoft начала сканировать лица на снимках в OneDrive — отказаться от этого можно лишь трижды в год 2 ч.
Надёжный инсайдер рассекретил дату выхода и цену Assassin’s Creed Shadows на Nintendo Switch 2 2 ч.
Смартфоны Samsung начнут притормаживать мобильный интернет для экономии батареи 2 ч.
Создатели ремейка Demon’s Souls взялись за загадочный экшен от третьего лица — фанаты Bloodborne напряглись 3 ч.
«Группа Астра» представила программно-определяемую систему хранения данных TROK 4 ч.
Хакеры научились похищать коды 2FA и личные сообщения со смартфонов на Android 6 ч.
OCP поможет в унификации чиплетов с применением открытых стандартов 25 мин.
AOC анонсировала геймерский дисплей, на котором можно играть без ПК — 41,5" OLED, 144 Гц и Android 14 43 мин.
Be quiet! представила компактный башенный кулер Pure Rock Slim 3 для процессоров до 130 Вт 49 мин.
Huawei выпустила 8-долларовую беспроводную мышь Enjoy Edition с автономностью до 12 месяцев 54 мин.
Motorola представила смартфон Moto G100 — Snapdragon 7s Gen 2 и батарея на 7000 мА·ч за $190 58 мин.
В спутниковой связи не оказалось шифрования — любой может перехватывать сообщения, звонки и трафик 2 ч.
Иностранные SIM-карты переохладили: блокировка в России не снимается через обещанные 24 часа 2 ч.
Ключевая для NASA лаборатория потеряла 10 % сотрудников — их просто уволили 2 ч.
ASML показала 20-летний рекорд выручки за сентябрь и привлекла внимание инвесторов 2 ч.
Смартфон Realme GT 8 Pro получит фотографические функции, как у камер Ricoh GR 2 ч.