В интернет утекли исходники большой языковой ИИ-модели LLaMA от Meta✴

Разрабатываемая компанией Meta✴ языковая модель с генеративным искусственным интеллектом LLaMa появилась в открытом доступе. Исходные коды платформы обнаружились на площадке 4chan.

Источник изображения: geralt/unsplash.com

3 марта на 4chan появился торрент-файл для загрузки системы, и вскоре код распространился в различных тематических сообществах. Некоторые считают, что свободное распространение подобных технологий не сулит ничего хорошего, поскольку такие системы могут использоваться для создания персонализированного спама или фишинговых атак и другой незаконной активности. Другие уверены, что открытый доступ необходим для разработки эффективной защиты ИИ-систем. Релизы схожего ПО ранее не привели к катастрофическим результатам, и никаких задокументированных случаев масштабного злонамеренного использования языковых моделей просто нет.

Как сообщает The Verge со ссылкой на исследователей, знакомых с «официальной» и появившейся в Сети версиями модели, они совпадают. В самой Meta✴ отказались подтверждать или опровергать информацию.

Имеется четыре версии ИИ-системы: LLaMA-7B, 13B, 30B и 65B (по числу миллиардов параметров). Для примера: версия на 13 млрд может запускаться на машине с одним ускорителем A100 и обходится в несколько долларов за час эксплуатации на облачных платформах. При этом в многочисленных бенчмарках для языковых ИИ-моделей вариант превосходит GPT-3 со 175 млрд параметров. Впрочем, такие бенчмарки плохо отражают удобство использования в реальном мире обычными людьми. Тем не менее считается, что хорошо настроенная LLaMA сопоставима по характеристикам с ChatGPT, а её относительная компактность будет способствовать широкому распространению платформы.

У концепции свободного распространения такого ПО есть немало сторонников и противников. Если первые уверены, что общедоступность ИИ-кода позволит выловить все баги, уязвимости и избежать концентрации важных данных в руках корпораций, то противники Open Source считают, что публичное тестирование очень опасно.

В любом случае, утечка кода способна подорвать доверие между Meta✴ и исследователями, получившими по запросу доступ к исходным данным, а результаты её повсеместного распространения, как плохие, так и хорошие, должны проявиться несколько позже.

Источник: