Сегодня 22 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Инференс ИИ скоро подешевеет, но пользователи этого почти не заметят

Приложения и сервисы генеративного искусственного интеллекта дорожают с каждым днём, потому что у разработчиков растут затраты на инфраструктуру. Новое поколение графических процессоров и ИИ-ускорителей обещает облегчить растущий спрос на инференс (развёртывание ИИ), но конечный потребитель едва ли заметит экономию, пишет The Register.

 Источник изображения: BoliviaInteligente / unsplash.com

Источник изображения: BoliviaInteligente / unsplash.com

С момента начала бума ИИ прошло уже несколько лет, разработчики потратили миллиарды долларов на создание новых моделей, и уже стали появляться варианты практического применения ИИ — наиболее яркими примерами являются Claude Code, Codex, GitHub Copilot и другие сервисы для написания кода. Вскоре появятся и новые. Проблема в том, что предназначенные для обучения моделей центры обработки данных не рассчитаны на инференс — это совершенно разные задачи. Разработчики ускорителей сейчас активно создают новое оборудование; Nvidia поглотила за $20 млрд стартап Groq, собственные версии ускорителей готовят AMD, AWS, Intel и Google — все они пытаются снизить стоимость токена.

Более дешёвые токены оптимизируют экономику, и инвесторы надеются, что OpenAI и Anthropic когда-нибудь выберутся из убытков. Оборудование нового поколения ещё не готово выйти на рынок: производители говорят о второй половине текущего года, но на практике, вероятно, придётся ждать до начала или середины следующего. Поэтому разработчики ИИ уже начали поднимать цены: OpenAI GPT-5.5 подорожала вдвое по сравнению с предшественницей, и даже новая Google Gemini 3.5 Flash стоит в 3–6 раз дороже, чем Gemini 3.1 Flash-Lite и Gemini 3 Flash Preview. Рост цен усугубляется тем, что основанные на этих моделях ИИ-агенты потребляют больше токенов, чем чат-боты.

В результате разработчики ИИ отказываются от фиксированных тарифов: нет смысла брать $200 в месяц, если клиент потребляет ресурсов на $5000. Microsoft уже начала переводить тарификацию GitHub Copilot с количества рабочих мест на ценообразование по факту потребления, в этом же направлении движется Anthropic. В итоге работодателей, которые надеялись, что ИИ за бесценок заменит им сотрудников, ждёт неприятный сюрприз: вместо $40 в час и соцпакета придётся платить $30 в час за токены.

Пока же волна сокращений продолжает накрывать технологическую отрасль. Meta уволит 10 % сотрудников, закроет 6000 вакансий и переведёт 7000 человек на новые должности, около 1100 работников уволит Cloudflare, и даже власти Новой Зеландии объявили о планах сократить около 9000 госслужащих из-за ИИ. Преимущество пока на стороне крупных компаний, которые могут позволить себе убытки по одним направлениям за счёт других. OpenAI и Anthropic пока ничего не угрожает: кто-то должен разрабатывать модели ИИ, а игроки вроде Microsoft, Meta и AWS пока в этом не преуспели. Добиться успеха удалось разве что Google.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Microsoft придумала временную заплатку для уязвимости YellowKey в BitLocker 25 мин.
Alibaba открыла для всех Qwen 3.7-Max — бесплатную флагманскую ИИ-модель, которая вышла на уровень Claude Opus 4.6 Max 48 мин.
Bungie после завершения поддержки Destiny 2 готовит не Destiny 3, а массовые увольнения 49 мин.
Apple попросила Верховный суд США пересмотреть решение, заставившее её поменять правила App Store 2 ч.
Дождались Японию: за неделю в Forza Horizon 6 сыграло 6 миллионов человек 4 ч.
GTA VI точно выйдет 19 ноября — Take-Two уже планирует, сколько денег принесёт игра 4 ч.
AMD внезапно обновила драйверы для древних видеокарт Polaris и Vega 12 ч.
Microsoft теряет GitHub: сервис захлестнули сбои, хаос и массовый уход разработчиков 13 ч.
Без техподдержки, апдейтов и прав: почти треть крупного российского бизнеса использует зарубежное ПО 13 ч.
Новый геймплейный трейлер амбициозной стратегии Warhammer 40,000: Dawn of War 4 раскрыл дату выхода и планы на DLC 17 ч.
Учёные превратили дрожащий в руке смартфон в камеру, способную заглянуть за угол 2 мин.
Память в серверах Nvidia подорожала на 435 % при переходе от Blackwell к Vera Rubin — стойку оценили в $7,8 млн 7 мин.
Паника из-за дефицита памяти разогнала продажи ПК — выручка Lenovo взлетела на 27 % 11 мин.
Microsoft начала убирать с геймпадов для Xbox порт для аксессуаров 19 мин.
MacBook Pro OLED на подходе — Samsung почти готова к массовому выпуску дисплеев 20 мин.
Представлен сервер Delta Orca на базе Intel Xeon 6 для работы с неструктурированными данными 25 мин.
Инференс ИИ скоро подешевеет, но пользователи этого почти не заметят 26 мин.
Anker представила наушники Soundcore Liberty 5 Pro и Pro Max с фирменным ИИ-чипом Thus 43 мин.
IBM создаст контрактное производство чипов завтрашнего дня — квантовое 46 мин.
Потеря слуха и мёртвые цыплята: против майнинговой компании Mara подали очередной судебный иск в Техасе 3 ч.