Сегодня 10 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → qwen2-math

Alibaba выпустила математические языковые модели Qwen2-Math, которые лучше аналогов от OpenAI и Google

Alibaba Group Holding продолжает активно работать в сфере искусственного интеллекта. На этой неделе гигант электронной коммерции выпустил несколько больших языковых моделей (LLM) под общим названием Qwen2-Math, которые ориентированы на решение сложных математических задач и, по заявлению разработчиков, справляются с этим лучше ИИ-алгоритмов других компаний.

 Источник изображения: Shutterstock

Источник изображения: Shutterstock

Всего было представлено три большие языковые модели, которые отличаются друг от друга количеством параметров, влияющих на точность ответов алгоритма. Модель с наибольшим количеством параметров Qwen2-Math-72B-Instruct, по данным разработчиков, превосходит в плане решения математических задач многие ИИ-алгоритмы, включая GPT-4o от OpenAI, Claude 3.5 Sonnet от Anthropic, Gemini 1.5 Pro от Google и Llama-3.1-405B от Meta Platforms.

«За последний год мы проделали большую работу по изучению и расширению логических возможностей больших языковых моделей, уделяя особое внимание их способности решать арифметические и математические задачи <…> Мы надеемся, что Qwen2-Math внесёт свой вклад в усилия сообщества по решению сложных математических задач», — говорится в сообщении разработчиков.

Языковые модели Qwen2-Math протестировали с помощью разных бенчмарков, включая GSM8K (8500 сложных и разнообразных математических задач школьного уровня), OlympiadBench (двуязычный мультимодальный научный бенчмарк высокого уровня) и Gaokao (один из сложнейших вступительных математических экзаменов для университетов). Отмечается, что новые модели имеют некоторые ограничения из-за «поддержки только английского языка». В дальнейшем разработчики планируют создать двуязычные и многоязычные LLM.


window-new
Soft
Hard
Тренды 🔥
Для Kingdom Come: Deliverance 2 вышло большое сюжетное дополнение Legacy of the Forge и крупное обновление 1.4 3 ч.
Atari решила выпустить метроидванию Adventure of Samsara в один день с Hollow Knight: Silksong — пиковый онлайн в Steam достиг 12 человек 4 ч.
«До сих пор отходим от похмелья»: разработчики Ghost of Yotei с размахом отпраздновали перенос GTA VI 6 ч.
Нейросеть Google Veo 3 научилась создавать вертикальные видео для соцсетей 7 ч.
Разработчики Hollow Knight: Silksong сжалились над игроками — первый патч сделает метроидванию чуть проще 7 ч.
По мотивам «Повести временных лет» выпустят MMORPG на стыке научной фантастики и фэнтези с «эпической историей» и геймплеем «нового уровня» 8 ч.
Антиспам-сервис Microsoft начал блокировать безопасные ссылки в Teams и Exchange Online, и отправлять письма в карантин 8 ч.
Пароли «admin» и другие дыры в кибербезопасности сети ресторанов Burger King выявили белые хакеры 9 ч.
Из Meta продолжается массовый исход специалистов в сфере ИИ — Цукерберг пытается его остановить, но безуспешно 9 ч.
Microsoft тестирует новые ИИ-функции в «Проводнике» Windows 11 9 ч.
До 300 000 рублей: объявлены российские цены на iPhone Air, iPhone 17, 17 Pro и 17 Pro Max 2 ч.
Apple представила смарт-часы Watch Ultra 3 со спутниковой связью и автономностью на 42 часа за $799 2 ч.
Новая статья: IFA 2025: выставки электроники уже не те, но без интересных новинок не обошлось 2 ч.
Apple объявила дату выхода iOS 26 со «стеклянным» дизайном для всех совместимых устройств 3 ч.
Представлен беспроводной контроллер Apple N1 для Wi-Fi 7 и Bluetooth 6 в новых iPhone 3 ч.
Apple представила плечевой ремешок для iPhone 17 Air за $59 и другие модные аксессуары 3 ч.
Fermi America, стоящая за мегапроектом 11-ГВт ИИ ЦОД HyperGrid с питанием от АЭС, собралась на биржу 3 ч.
Apple представила смарт-часы Watch Series 11 — самые тонкие, с 5G и детектором гипертонии за $399 3 ч.
Представлены беспроводные наушники Apple AirPods Pro 3 с живым переводом и датчиком пульса за $249 3 ч.
Дебютировали Apple Watch SE 3 с усиленным стеклом, AoD, повышенной автономностью и 5G — от $249 5 ч.