Сегодня 08 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → скрипты

Андрей Карпатый научил ИИ-агентов проводить сотни экспериментов, пока люди спят

Андрей Карпатый (Andrej Karpathy), бывший руководитель ИИ-проекта Tesla и соучредитель OpenAI, придумавший термин «вайбкодинг», разместил на GitHub свой новый проект с открытым исходным кодом. Это не готовая модель и не масштабный корпоративный продукт — это простой скрипт из 630 строк, но с грандиозными амбициями: автоматизация научного метода с помощью ИИ-агентов без участия человека — например, в ночные часы.

 Источник изображений: unsplash.com

Источник изображений: unsplash.com

«Цель состоит в том, чтобы сконструировать ваших агентов таким образом, чтобы они бесконечно быстро продвигались в исследованиях без вашего участия», — написал Карпатый в социальной сети X. Это сообщение мгновенно стало вирусным и набрало более 8,6 миллионов просмотров за два дня.

Система функционирует как автономный цикл оптимизации. Агенту ИИ предоставляется обучающий скрипт и фиксированный вычислительный бюджет (обычно 5 минут на графическом процессоре). Агент считывает собственный исходный код, формулирует гипотезу для улучшения (например, изменение скорости обучения или глубины архитектуры), модифицирует код, запускает эксперимент и оценивает результаты.

Если потери при валидации — измеряемые в битах на байт (val_bpb) — улучшаются, он сохраняет изменение, в противном случае агент отменяет его и пробует снова. За одну ночь ИИ -агент выполнил 126 экспериментов, снизив потери с 0,9979 до 0,9697. После двухдневной настройки модели агент успешно обработал около 700 автономных изменений. Он обнаружил примерно 20 аддитивных улучшений, которые идеально перенеслись на более крупные модели.

«Видеть, как агент выполняет весь этот рабочий процесс от начала до конца и совершенно самостоятельно… это невероятно», — заметил Карпатый, отметив, что агент обнаружил ошибки в масштабировании внимания и регуляризации, которые он сам упускал на протяжении двух десятилетий работы.

По мнению экспертов, автоисследования — это фундаментальный сдвиг в совершенствовании искусственного интеллекта. Автоматизировав «научный метод» для кода, Карпатый превратил машинное обучение в эволюционный процесс, работающий со скоростью кремния, а не со скоростью человеческого мышления. Этот тип процесса может быть применён далеко за пределами ИТ, в таких областях, как маркетинг, здравоохранение — практически во всём, что требует исследований.

Руководитель платформы агрегации инструментов ИИ Hyperspace AI Варун Матур (Varun Mathur) провёл эксперимент с одним агентом в одноранговой сети. Каждый узел, на котором работал агент Hyperspace, стал автономным исследователем. За одну ночь 35 автономных агентов провели 333 эксперимента полностью без участия оператора.

По словам Матура, в то время как графические процессоры H100 использовали бы «грубую силу», агенты, работающие только на ноутбучных ЦП, были вынуждены «проявлять смекалку». Они сосредоточились на стратегиях инициализации (таких как Kaiming и Xavier init) и выборе нормализации, поскольку не могли полагаться на высокую пропускную способность.

Используя протокол GossipSub, агенты делились своими успехами в режиме реального времени. Когда один из агентов обнаружил, что стратегия Kaiming снижает потери на 21 %, эта информация распространилась по сети, как вирус. В течение нескольких часов 23 других агента включили это открытие в свои собственные гипотезы. Всего за 17 часов агенты независимо друг от друга заново открыли важные этапы машинного обучения — такие как RMSNorm и связанные эмбеддинги, — на формализацию которых у исследователей в таких лабораториях, как Google Brain и OpenAI, ушло почти восемь лет.

Основатель рекламного агентства Single Grain Эрик Сиу (Eric Siu) применил автоисследования по методу Карпатого к «экспериментальному циклу» маркетинга. Фреймворк Сиу заменяет обучающий сценарий маркетинговым инструментом — целевой страницей, рекламным креативом или холодным письмом. ИИ-агент изменяет переменную (заголовок письма или призыв к действию), запускает его, измеряет «процент положительных ответов» и сохраняет или удаляет.

Сиу утверждает, что такой подход создаёт «собственную карту» отклика конкретной аудитории — своего рода отчёт, полученный не из кода, а из истории экспериментов. «Большинство маркетинговых команд проводят около 30 экспериментов в год. Следующее поколение будет проводить более 36 500 экспериментов. Легко», — заявил Сиу. «У компаний, которые выиграют, будут не лучшие маркетологи, — уверен он, — а более быстрые циклы экспериментов».

Несмотря на возникший ажиотаж, обсуждения на GitHub показали, что сообщество пытается осмыслить последствия такого быстрого автоматизированного прогресса. Высказываются опасения о возможной «ловушке чрезмерной оптимизации» — при достаточном количестве агентов параметры могут оказаться оптимизированы под конкретные особенности тестовых данных, а не под общий интеллект.

На вопрос, действительно ли заметно падение потерь при валидации с 0,9979 до 0,9697, Карпатый ответил: «Мы всего лишь оптимизируем производительность на каждый вычислительный ресурс... это реальные и существенные улучшения». Один из экспериментаторов сообщил, что, 26 из 35 его экспериментов провалились или завершились с ошибкой, но успешные показали, что «модель стала лучше, став проще». По его словам, это понимание было достигнуто без вмешательства человека.

Появление автоматических исследований может изменить будущее исследовательской работы в различных областях, где благодаря простым механизмам управления ИИ роль человека смещается от «экспериментатора» к «разработчику экспериментов». По мере появления таких инструментов, узким местом прогресса в области ИИ становится уже не способность человека программировать, а его умение определять ограничения поиска.

По мнению аналитиков, «Андрей Карпатый в очередной раз изменил ситуацию — мы больше не просто кодируем модели; мы создаём экосистемы, которые учатся, пока мы спим».

«Википедию» временно закрыли для редактирования из-за атаки вредоносного скрипта

Управляющая «Википедией» некоммерческая организация накануне временно перевела платформу в режим «только для чтения» из-за того, что пользователи обнаружили код, который мог удалять статьи и размещать в описании правки русскоязычный текст.

 Источник изображения: Luke Chesser / unsplash.com

Источник изображения: Luke Chesser / unsplash.com

Атака посредством вредоносного JavaScript затронула связанную с Wikimedia Foundation учётную запись WMFOffice. При удалении статей в описании правки скрипт оставлял русскоязычное сообщение «Закрываем проект»; правки, однако, он успел внести только на сайте Meta✴-Wiki, посвящённом программным проектам организации. Код удалось связать с одним из пользователей платформы, который загрузил его в русскоязычный раздел сайта в марте 2024 года, то есть файл находился в спящем режиме около двух лет. В коде упоминается запуск расширения Special:Nuke для администраторов — оно используется для массового удаления недавно созданных страниц; скрипт запускает функцию Nuke, обращая её на случайные материалы и пытается также разместить несуществующее изображение «Woodpecker10.jpg».

Неудавшуюся атаку сравнили с компьютерным червём: если бы вредоносный файл оказался на главной странице одной из платформ, он в теории помог бы неизвестным злоумышленникам в перехвате функций редактирования от любой учётной записи с привилегиями администратора, когда владелец этого аккаунта посетил бы заражённую страницу. Атака была инициирована, когда сотрудники службы безопасности тестировали все приложения JavaScript и загрузили неактивный вредоносный файл.

«Сегодня ранее сотрудники Wikimedia Foundation проводили проверку безопасности пользовательского кода в „Википедии“. В ходе проверки мы активировали спящий код, который быстро идентифицировали как вредоносный. В качестве превентивной меры мы временно отключили редактирование в „Википедии“ и прочих проектах Wikimedia на время удаления вредоносного кода и подтверждения безопасности сайта для пользователей. Вызвавшая этот сбой проблема безопасности разрешена. Код оставался активным в течение 23 минут. За это время он изменил и удалил материалы в Meta✴-Wiki, которые сейчас восстанавливаются, но необратимого ущерба не причинил. Мы разрабатываем дополнительные меры безопасности, чтобы сократить риск повторения подобных инцидентов», — прокомментировали инцидент ресурсу PCMag в Wikimedia Foundation. Пользователя, который, предположительно, загрузил вредоносный файл с именем «test.js», заблокировали.


window-new
Soft
Hard
Тренды 🔥
«Леон должен умереть навсегда»: Capcom выпустила для Resident Evil Requiem обновление с новым режимом, и фанаты «Наёмников» не рады 20 мин.
В ChatGPT появился «доверенный контакт» — его уведомят, если пользователь захочет навредить себе 31 мин.
OpenAI распустила две команды по безопасности ИИ ради прибыли, заявила бывшая сотрудница стартапа 36 мин.
Приложение Fitbit превратилось в Google Health — и сможет собирать данные о здоровье даже из Apple Health 13 ч.
Новый стандарт жанра для вселенной «Чужих»: анонсирован амбициозный кооперативный шутер Aliens: Fireteam Elite 2 14 ч.
В Steam вышло атмосферное сюжетное приключение Will: Follow The Light о поиске смысла «даже в темноте» 15 ч.
Заряженное ностальгией музыкальное приключение Mixtape от создателей The Artful Escape очаровало критиков — игра доступна в российском Steam 16 ч.
IBM когда-то хотела отказаться от навигации с клавишей Tab — Microsoft не согласилась, сославшись на маму Билла Гейтса 17 ч.
ИИ с «глазами» оказался в разы дороже обычного API — агенты сжигают бюджеты, ходя по сайтам 17 ч.
Глава Take-Two взял вину за неудачи Sid Meier’s Civilization VII на себя, а обновление Test of Time исправит главную проблему игры 17 ч.
NVIDIA и Iren объединили усилия для создания ИИ-инфраструктуры мощностью до 5 ГВт 47 мин.
Arm уже получает 15 % выручки от серверного направления и рассчитывает утроить её к 2031 году 3 ч.
AMD представила ускоритель Instinct MI350P — CDNA 4 в формате PCIe 9 ч.
Valve внедрила защиту от перекупщиков и пообещала новые партии Steam Controller 10 ч.
Новая статья: Ноутбук DIGMA PRO Pactos на процессоре AMD Ryzen 5 7430U: скромность украшает 10 ч.
GeIL анонсировала модули DDR5, которые работают со скоростью 8000 МТ/с без разгона 13 ч.
AMD выпустила ИИ-ускоритель Instinct MI350P с 144 Гбайт HBM3E, PCIe 5.0 x16 и потреблением 600 Вт 13 ч.
Google анонсировала Fitbit Air — лёгкий фитнес-трекер без экрана за $99 с круглосуточным отслеживанием активности владельца 14 ч.
Apple закажет новую партию чипов A18 Pro из-за высокого спроса на MacBook Neo 17 ч.
Iridium анонсировала PNT-решение для безошибочного позиционирования и синхронизации времени Project Authentic 17 ч.