Сегодня 13 августа 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Alibaba выпустила математические языковые модели Qwen2-Math, которые лучше аналогов от OpenAI и Google

Alibaba Group Holding продолжает активно работать в сфере искусственного интеллекта. На этой неделе гигант электронной коммерции выпустил несколько больших языковых моделей (LLM) под общим названием Qwen2-Math, которые ориентированы на решение сложных математических задач и, по заявлению разработчиков, справляются с этим лучше ИИ-алгоритмов других компаний.

 Источник изображения: Shutterstock

Источник изображения: Shutterstock

Всего было представлено три большие языковые модели, которые отличаются друг от друга количеством параметров, влияющих на точность ответов алгоритма. Модель с наибольшим количеством параметров Qwen2-Math-72B-Instruct, по данным разработчиков, превосходит в плане решения математических задач многие ИИ-алгоритмы, включая GPT-4o от OpenAI, Claude 3.5 Sonnet от Anthropic, Gemini 1.5 Pro от Google и Llama-3.1-405B от Meta Platforms.

«За последний год мы проделали большую работу по изучению и расширению логических возможностей больших языковых моделей, уделяя особое внимание их способности решать арифметические и математические задачи <…> Мы надеемся, что Qwen2-Math внесёт свой вклад в усилия сообщества по решению сложных математических задач», — говорится в сообщении разработчиков.

Языковые модели Qwen2-Math протестировали с помощью разных бенчмарков, включая GSM8K (8500 сложных и разнообразных математических задач школьного уровня), OlympiadBench (двуязычный мультимодальный научный бенчмарк высокого уровня) и Gaokao (один из сложнейших вступительных математических экзаменов для университетов). Отмечается, что новые модели имеют некоторые ограничения из-за «поддержки только английского языка». В дальнейшем разработчики планируют создать двуязычные и многоязычные LLM.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
США стандартизировали первые криптографические алгоритмы, стойкие к взлому на квантовых компьютерах 53 мин.
Owlcat Games начнёт издавать игры сторонних студий — разработчики Warhammer 40,000: Rogue Trader помогут создателям двух RPG 2 ч.
Ретрофутуристический экшен-платформер Replaced не выйдет в 2024 году, но есть и хорошая новость 2 ч.
NVIDIA открыла исходный код RTX Remix Toolkit — инструментария для создания ремастеров старых игр 3 ч.
Alibaba выпустила математические языковые модели Qwen2-Math, которые лучше аналогов от OpenAI и Google 3 ч.
Соцсеть X не справилась с бесперебойной трансляцией интервью Трампа Маску 3 ч.
Анонсирован олдскульный шутер Gravelord в духе Quake и Duke Nukem про вставшего на путь мести гробовщика 3 ч.
«Лучше любой современной игры»: моддер добавил в Doom 2 трассировку пути, преобразив легендарный шутер до неузнаваемости 5 ч.
Доля резюме от соискателей, написанных ИИ, дошла до 50 %, но в поиске работы это только вредит 5 ч.
Apple не будет взимать плату за ИИ-функции как минимум до 2027 года 8 ч.
Google представила смарт-часы Pixel Watch 3 в двух размерах 41 и 45 мм, но со старым дизайном 18 мин.
«Аквариус» представила шесть новых моделей ноутбуков: для офиса, госслужащих, бизнесменов и работы в поле 27 мин.
Во втором квартале на ПК с поддержкой ИИ пришлось 14 % поставок 2 ч.
Huawei готовит к выпуску ИИ-ускоритель Ascend 910C, конкурента NVIDIA H100 2 ч.
Klevv представила модули памяти CRAS V RGB ROG Certified DDR5 со скоростью до 7400 МГц 3 ч.
Apple передумала использовать дисплеи LG MicroLED в умных часах — корейцы требуют компенсации 3 ч.
Huawei Cloud построила сетевой монитор, способный быстро найти отдельный неисправный чип в целом ЦОД 4 ч.
Мировые объёмы продаж электромобилей и гибридов по итогам июля выросли на 21 % 5 ч.
Анализ данных с зонда InSight позволил найти на Марсе невидимые океаны воды 7 ч.
Малые ЦОД Китая оказались под угрозой исчезновения из-за новой энергетической политики властей 7 ч.