ИИ-агенты разгоняют спрос на токены — компании тратят миллионы и не знают, окупится ли это
Читать в полной версииКрупные технологические компании активно пытаются оправдать стремительный рост цен на системы искусственного интеллекта — его уже ощутили на себе даже такие компании, как Microsoft и Uber.
Источник изображений: Igor Omilaev / unsplash.com
Uber за считанные месяцы исчерпала весь свой бюджет на ИИ, сообщил недавно технический директор компании Правеен Неппалли Нага (Praveen Neppalli Naga); при этом расход токенов не имеет прямой связи с появлением полезных функций для потребителей, добавил руководитель операционного отдела Эндрю Макдональд (Andrew Macdonald). Microsoft начала отключать разработчиков от корпоративной подписки на помощника программиста Anthropic Claude Code и уже к 30 июня намеревается полностью перевести сотрудников на Copilot. Эта мера может показаться стремлением к консолидации средств разработки, но есть причины полагать, что решение имеет финансовые основания. Активное использование ИИ-агентов может в ближайшие годы повысить мировой расход токенов в 24 раза, подсчитали в Goldman Sachs.
Компании из большинства отраслей и их руководители стремятся найти ощутимую выгоду от активного внедрения ИИ, но примеры Uber и Microsoft продемонстрировали, что это не самая простая задача. Microsoft, в частности, стала переводить GitHub Copilot с фиксированного тарифа на прямую оплату токенов, потому что себестоимость сервиса выросла. Основной причиной перемен стала популярность агентного ИИ, который потребляет ресурсы в объёме до тысячи раз большем, чем чат-боты. В марте глава Nvidia Jensen Huang заявил, что если инженер с зарплатой $500 тыс. в год не использует за тот же период токены на $250 тыс., то это повод для беспокойства. И это не редкость: руководители компаний теперь наперебой хвалятся масштабами использования ИИ. В Airbnb сообщили, что 60 % нового кода генерируется ИИ; в Google этот показатель составляет 50 %; в Uber ИИ пользуются 80 % инженеров-программистов, а 60 % кода генерирует ИИ — и нет гарантии, что такие расходы себя оправдывают.
Создатель OpenClaw и ныне сотрудник OpenAI, Петер Штайнбергер (Peter Steinberger) недавно признался, что его отдел, состоящий всего из трёх человек за месяц потребил токенов на сумму $1,3 млн. Это наглядно подтверждает тезис, что стоимость ИИ растёт быстрее, чем оплата труда работников, которых он должен заменить — всё менее обоснованными представляются массовые сокращения, которые руководство компаний пытается оправдать ИИ. Есть, впрочем, надежда, что оборудование нового поколения позволит значительно удешевить использование ИИ: Nvidia, например, готовит платформу Vera Rubin, которая обещает обеспечить десятикратный прирост производительности на ватт по сравнению с существующими решениями.
Это даст колоссальные преимущества компаниям, использующим ускорители нового поколения, перед конкурентами, которые пользуются актуальными Blackwell и тем более устаревшими Hopper. При этом более 50 % проектов центров обработки данных, которые анонсировали с учётом оборудования Blackwell, были закрыты или заморожены, и всё меньше ясности относительно того, как они будут работать, если их запустят в текущем году. В конце 2025 года Google, Oracle и Microsoft установили, что в любом случае будут использовать это оборудование в течение шести лет, прежде чем модернизировать — и это, кажется, невозможно согласовать с тем прогрессом, который обещают производители ускорителей.
Пока же реальность такова, что даже при снижении стоимости токенов взрывной рост числа ИИ-агентов не может компенсироваться повышением эффективности оборудования. И нет гарантии, что этого оборудования когда-либо будет достаточно, чтобы удовлетворить спрос на ИИ. И если даже такие игроки, как Microsoft и Uber, корректируют свои планы по внедрению ИИ, то всё труднее становится представить, как должен вести себя весь остальной бизнес. Если же ИИ станут использовать меньше, чтобы сократить затраты, то и у разработчиков ИИ никогда не будет средств, чтобы компенсировать огромные расходы на инфраструктуру.