Сегодня 25 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

В Meta✴ отрицают, что искусственно завысили результаты тестов ИИ-модели Llama 4

Представитель Meta опроверг слухи о том, что компания намеренно улучшала показатели своих новых ИИ-моделей Llama 4 в бенчмарках. Вице-президент по генеративному искусственному интеллекту Ахмад Аль-Дахле (Ahmad Al-Dahle) заявил в посте на страницах X, что утверждения о подгонке результатов с целью сокрытия слабых сторон моделей Maverick и Scout — «просто неправда».

 Источник изображения: Mariia Shalabaieva / Unsplash

Источник изображения: Mariia Shalabaieva / Unsplash

Слухи о манипуляциях появились в соцсетях после публикации бывшего сотрудника Meta. Пользователь китайской платформы утверждал, что уволился из компании в знак протеста против «нечестных методов тестирования». Позже эти обвинения распространились в X (бывший Twitter) и Reddit, пишет издание TechCrunch.

Однако Аль-Дахле подчеркнул, что Meta не обучала модели Llama 4 Maverick и Llama 4 Scout на «тестовых наборах данных», то есть специальных выборках, используемых для оценки ИИ. Такая практика могла бы искусственно завысить результаты, создав ложное впечатление о возможностях моделей.

Подозрения изначально появились из-за различий в работе Llama 4 Maverick на разных платформах. Исследователи заметили, что версия модели в бенчмарке LM Arena ведёт себя иначе, чем публично доступная и не справляется с определёнными задачами. Кроме того, Meta использовала экспериментальную сборку Maverick для улучшения результатов тестов, что также вызвало вопросы.

Одновременно Аль-Дахле отмечает, что причина, по которой пользователи пока сталкиваются с нестабильным качеством моделей, может быть связана с настройками облачных провайдеров, на серверах которых размещаются скрипты. «Мы выпустили модели сразу после их готовности, и потребуется несколько дней, чтобы все публичные реализации были настроены в соответствии с нашими требованиями», — пояснил он. В Meta пообещали в любом случае продолжить работу над исправлениями багов Llama 4 для быстрой интеграции разработчиками в свои проекты.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Apple выпустила первые публичные беты iOS 26 и других ОС с прозрачным дизайном Liquid Glass 6 ч.
«Парадокс успеха»: глава Microsoft попытался успокоить сотрудников после новой волны увольнений 7 ч.
Ubisoft раскрыла дату выхода дополнения Claws of Awaji к Assassin’s Creed Shadows и план улучшений игры 7 ч.
Google объявила дату отключения сервиса сокращения ссылок goo.gl 9 ч.
Официальный сайт Electronic Arts случайно подтвердил, когда выйдет Battlefield 6 10 ч.
Apple запустила онлайн-генератор обоев с логотипом компании 10 ч.
Маск анонсировал возрождение «вайнов», но «в форме с искусственным интеллектом» 10 ч.
Techland уверена, что Dying Light: The Beast отобьёт каждый потраченный на неё доллар, в отличие от Assassin’s Creed Shadows 11 ч.
Figma открыла доступ к ИИ-генератору приложений по текстовому описанию всем желающим 11 ч.
Их заменил ИИ: ведущие технологические компании уволили более 100 000 специалистов с начала года 11 ч.
Акции Tesla подешевели на 8 %, но Трамп дал понять, что не желает разрушить компании Маска 2 ч.
Новая статья: Обзор игрового QD-OLED DQHD-монитора Acer Predator X49X 5 ч.
Endgame Gear извинилась за инцидент с трояном в драйвере для мыши и пообещала больше такого не допускать 7 ч.
Новая статья: Ноутбук Digma Pro Fortis M с процессором Intel Raptor Lake: для учёбы и не только 7 ч.
Для изучения полярных щелей Земли NASA запустило два космических зонда 9 ч.
Vivo представила смартфон iQOO Z10R — чип Dimensity 7400, защищённый корпус и цена от $225 11 ч.
Intel отбилась от иска акционеров из-за падения капитализации на $32 млрд 11 ч.
Gartner: объём мирового IT-рынка в 2025 году превысит $5,4 трлн, а его основным драйвером станут ИИ ЦОД 13 ч.
Ryzen Threadripper Pro 9995WX разогнали с помощью системы охлаждения спорткара BWM — до жидкого азота далеко 14 ч.
Amazon выпустила более доступный ридер Kindle Colorsoft с цветным экраном, а также версию для детей 14 ч.