Сегодня 28 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

В Meta✴ отрицают, что искусственно завысили результаты тестов ИИ-модели Llama 4

Представитель Meta опроверг слухи о том, что компания намеренно улучшала показатели своих новых ИИ-моделей Llama 4 в бенчмарках. Вице-президент по генеративному искусственному интеллекту Ахмад Аль-Дахле (Ahmad Al-Dahle) заявил в посте на страницах X, что утверждения о подгонке результатов с целью сокрытия слабых сторон моделей Maverick и Scout — «просто неправда».

 Источник изображения: Mariia Shalabaieva / Unsplash

Источник изображения: Mariia Shalabaieva / Unsplash

Слухи о манипуляциях появились в соцсетях после публикации бывшего сотрудника Meta. Пользователь китайской платформы утверждал, что уволился из компании в знак протеста против «нечестных методов тестирования». Позже эти обвинения распространились в X (бывший Twitter) и Reddit, пишет издание TechCrunch.

Однако Аль-Дахле подчеркнул, что Meta не обучала модели Llama 4 Maverick и Llama 4 Scout на «тестовых наборах данных», то есть специальных выборках, используемых для оценки ИИ. Такая практика могла бы искусственно завысить результаты, создав ложное впечатление о возможностях моделей.

Подозрения изначально появились из-за различий в работе Llama 4 Maverick на разных платформах. Исследователи заметили, что версия модели в бенчмарке LM Arena ведёт себя иначе, чем публично доступная и не справляется с определёнными задачами. Кроме того, Meta использовала экспериментальную сборку Maverick для улучшения результатов тестов, что также вызвало вопросы.

Одновременно Аль-Дахле отмечает, что причина, по которой пользователи пока сталкиваются с нестабильным качеством моделей, может быть связана с настройками облачных провайдеров, на серверах которых размещаются скрипты. «Мы выпустили модели сразу после их готовности, и потребуется несколько дней, чтобы все публичные реализации были настроены в соответствии с нашими требованиями», — пояснил он. В Meta пообещали в любом случае продолжить работу над исправлениями багов Llama 4 для быстрой интеграции разработчиками в свои проекты.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Платформа HPE Supercomputing Programming Software упростит работу с мультивендорными системами ИИ и HPC 5 мин.
Дональд Трамп пригрозил 100-процентными пошлинами тем странам, которые будут облагать цифровые услуги американских компаний налогами 15 ч.
Ограничения на доступ к ИИ-модели Anthropic Fable 5 будут сняты на следующей неделе 16 ч.
Новая статья: The Adventures of Elliot: The Millenium Tales — возвращение старой школы. Рецензия 23 ч.
Gemini научился находить приложения в «Play Маркете» по команде в чате 27-06 16:52
Армия из 45 000 пользователей Reddit успешно убедила ИИ-поисковики, что Трамп и Вэнс скончались от бешенства 27-06 13:47
Еврокомиссия взяла на карандаш AWS и Microsoft Azure 27-06 13:17
Путин подписал закон о штрафах за авторизацию через зарубежные сервисы 27-06 10:05
Путин подписал закон о создании базы IMEI всех смартфонов россиян 27-06 09:07
Google согласилась на регулирование ИИ, но на своих условиях 27-06 09:05
Китайские x86-процессоры Hygon C86-5G получили 128 ядер с поддержкой 512 потоков 7 ч.
Intel Panther Lake и три порта 2.5GbE: AAEON выпустила индустриальный одноплатный компьютер EPIC-PTH9 8 ч.
Apple и SpaceX получат возможность протестировать технологию Intel 14A этой осенью 15 ч.
Акции компаний технологического сектора в минувшую пятницу снижались в цене по всему миру, но Apple шла против течения 17 ч.
Старая память на новый лад: ASIC Meta Vistara поможет установить DDR4 из б/у серверов в современные системы 24 ч.
Amazon инвестирует в ИИ-инфраструктуру Индии ещё $13 млрд 27-06 22:35
Далёкая галактика ворвалась в галактическое скопление и устроила там световое шоу на полнеба 27-06 21:10
Вышла компактная портативная консоль Ayaneo Pocket Micro 2 с нестандартным Snapdragon 865 за $239 27-06 19:43
Американский регулятор предложил убрать педаль тормоза из роботакси — так безопаснее 27-06 17:49
Commodore удешевит кнопочный смартфон Callback 8020 на $100 с помощью б/у памяти 27-06 16:51