Сегодня 02 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → qwen2-math

Alibaba выпустила математические языковые модели Qwen2-Math, которые лучше аналогов от OpenAI и Google

Alibaba Group Holding продолжает активно работать в сфере искусственного интеллекта. На этой неделе гигант электронной коммерции выпустил несколько больших языковых моделей (LLM) под общим названием Qwen2-Math, которые ориентированы на решение сложных математических задач и, по заявлению разработчиков, справляются с этим лучше ИИ-алгоритмов других компаний.

 Источник изображения: Shutterstock

Источник изображения: Shutterstock

Всего было представлено три большие языковые модели, которые отличаются друг от друга количеством параметров, влияющих на точность ответов алгоритма. Модель с наибольшим количеством параметров Qwen2-Math-72B-Instruct, по данным разработчиков, превосходит в плане решения математических задач многие ИИ-алгоритмы, включая GPT-4o от OpenAI, Claude 3.5 Sonnet от Anthropic, Gemini 1.5 Pro от Google и Llama-3.1-405B от Meta✴ Platforms.

«За последний год мы проделали большую работу по изучению и расширению логических возможностей больших языковых моделей, уделяя особое внимание их способности решать арифметические и математические задачи <…> Мы надеемся, что Qwen2-Math внесёт свой вклад в усилия сообщества по решению сложных математических задач», — говорится в сообщении разработчиков.

Языковые модели Qwen2-Math протестировали с помощью разных бенчмарков, включая GSM8K (8500 сложных и разнообразных математических задач школьного уровня), OlympiadBench (двуязычный мультимодальный научный бенчмарк высокого уровня) и Gaokao (один из сложнейших вступительных математических экзаменов для университетов). Отмечается, что новые модели имеют некоторые ограничения из-за «поддержки только английского языка». В дальнейшем разработчики планируют создать двуязычные и многоязычные LLM.


window-new
Soft
Hard
Тренды 🔥
Роскомнадзор заявил, что не блокировал Python в России 7 ч.
«Русы против ящеров 2» выйдет на «ящерских консолях» и получит бесплатное дополнение «Русы в Америке» 8 ч.
Rutube продолжает расти, тогда как аудитория «VK Видео» и YouTube в России сокращается 8 ч.
Тактический шутер Dioxide с элементами Dark Souls отправит в корпоративную антиутопию — трейлер новой игры от авторов Forgive Me Father 8 ч.
«Готовьтесь к следующей битве!»: режиссёр Tekken 7 и Tekken 8 покинул Bandai Namco после 20 лет работы 11 ч.
Календарь релизов 1–7 июня: Gothic 1 Remake, Fatekeeper, Underchoice и The 7th Guest Remake 13 ч.
После 10 лет разработки следующее крупное обновление станет для Factorio последним 13 ч.
Слухи: Wizards of the Coast запустила в разработку ремейк легендарной Baldur's Gate 2 14 ч.
Mewgenics совсем скоро получит официальный перевод на русский язык — разработчики уже собрали «все возможные имена» для котиков 19 ч.
Самурайский экшен Onimusha: Way of the Sword выйдет до GTA VI — инсайдер раскрыл дату релиза первой за 20 лет новой игры серии 20 ч.
MSI представила портативный игровой компьютер Claw 8 EX AI+ с процессором Intel Arc G3 16 мин.
Anthropic передала американским регуляторам проспект эмиссии, позволяющий начать подготовку к IPO 2 ч.
ИИ-ускоритель Intel Crescent Island получит до 480 Гбайт LPDDR5X 6 ч.
MSI анонсировала тонкий 16-дюймовый ноутбук «2-в-1» Prestige N16 Flip AI+ на чипе Nvidia RTX Spark 7 ч.
Некоторые смартфоны Xiaomi научились обмениваться файлами с iPhone через AirDrop 7 ч.
Новая статья: Обзор и тестирование корпуса MSI MAG PANO 130R PZ: обжигающая красота 7 ч.
Intel выпустит 192-ядерные процессоры Xeon Diamond Rapids на техпроцессе 18A-P в 2027 году 9 ч.
Microsoft представит улучшения Windows, суперприложение Copilot и новый рассуждающий ИИ на конференции Build 3 июня 9 ч.
256 Гбайт оперативки для ПК в двух модулях: Origin Code представила комплект 4R CUDIMM DDR5-8000 10 ч.
Российский рынок электронных компонентов просел на 18,3 % — китайская продукция вытесняет отечественную 12 ч.