Сегодня 10 октября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Alibaba выпустила математические языковые модели Qwen2-Math, которые лучше аналогов от OpenAI и Google

Alibaba Group Holding продолжает активно работать в сфере искусственного интеллекта. На этой неделе гигант электронной коммерции выпустил несколько больших языковых моделей (LLM) под общим названием Qwen2-Math, которые ориентированы на решение сложных математических задач и, по заявлению разработчиков, справляются с этим лучше ИИ-алгоритмов других компаний.

 Источник изображения: Shutterstock

Источник изображения: Shutterstock

Всего было представлено три большие языковые модели, которые отличаются друг от друга количеством параметров, влияющих на точность ответов алгоритма. Модель с наибольшим количеством параметров Qwen2-Math-72B-Instruct, по данным разработчиков, превосходит в плане решения математических задач многие ИИ-алгоритмы, включая GPT-4o от OpenAI, Claude 3.5 Sonnet от Anthropic, Gemini 1.5 Pro от Google и Llama-3.1-405B от Meta Platforms.

«За последний год мы проделали большую работу по изучению и расширению логических возможностей больших языковых моделей, уделяя особое внимание их способности решать арифметические и математические задачи <…> Мы надеемся, что Qwen2-Math внесёт свой вклад в усилия сообщества по решению сложных математических задач», — говорится в сообщении разработчиков.

Языковые модели Qwen2-Math протестировали с помощью разных бенчмарков, включая GSM8K (8500 сложных и разнообразных математических задач школьного уровня), OlympiadBench (двуязычный мультимодальный научный бенчмарк высокого уровня) и Gaokao (один из сложнейших вступительных математических экзаменов для университетов). Отмечается, что новые модели имеют некоторые ограничения из-за «поддержки только английского языка». В дальнейшем разработчики планируют создать двуязычные и многоязычные LLM.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая компания сооснователя Blizzard анонсировала Sunderfolk — кооперативное тактическое приключение, которое воссоздаёт опыт настольных RPG 2 мин.
Selectel и Arenadata запустят аналитическую СУБД на выделенных серверах 26 мин.
Rockstar возмутила игроков стоимостью Red Dead Redemption на ПК 2 ч.
Почти 30 % детей в России играют в игры, которые не подходят им по возрасту 3 ч.
Роскомнадзор не собирается блокировать Steam и не видит оснований для снятия ограничений с Discord 3 ч.
Изометрический ролевой экшен «Былина» отправит игроков в эпическое приключение по миру славянских мифов — трейлер и детали 4 ч.
Гендиректора Gotbit Алексея Андрюнина задержали в Португалии по запросу США 5 ч.
В Windows 11 станет удобнее работать с ключами доступа — ОС получит облачную синхронизацию и интеграцию с 1Password 6 ч.
Представлена ИИ-модель YandexART 2.0 с поддержкой генерации текста на изображениях 6 ч.
Оригинальную версию стратегии Age of Empires III сняли с продажи в Steam, доступ к мультиплееру закроется 30 октября 7 ч.
AMD представила процессоры Ryzen AI Pro 300 для корпоративных ноутбуков 2 ч.
«Элитный» Wi-Fi 7 с ИИ-поддержкой: Qualcomm представила сетевую платформу Pro A7 Elite 2 ч.
AMD представила серверные процессоры EPYC 9005: до 128 ядер Zen 5 у Turin Classic и до 192 ядер Zen 5c у Turin Dense 2 ч.
«Гравитон» представила огромный моноблок 31,5-дюймовым экраном и чипами Intel Core 3 ч.
Все кулеры Noctua, выпущенные с 2005 года, получат поддержку Intel LGA 1851 3 ч.
Selectel представила первые российские серверы на базе Intel Xeon Sierra Forrest и Granite Rapids 3 ч.
Владелец TikTok представил свои первые беспроводные наушники Ola Friend — у них есть ИИ-помощник 3 ч.
Corsair и Activision представили геймерские ПК и периферию по мотивам Call of Duty 4 ч.
TensorWave привлёк $43 млн на закупу ускорителей AMD Instinct MI300X для своего ИИ-облака, в том числе от самой AMD 4 ч.
Intel мельком показала чипы Core Ultra 200H и 200HX для мощных игровых ноутбуков нового поколения — они выйдут только в 2025 году 4 ч.