Сегодня 18 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Мощнейшая ИИ-модель OpenAI o3 тратит до $30 000 на решение одной задачи

В декабре OpenAI представила рассуждающую модель искусственного интеллекта o3 и продемонстрировала результаты бенчмарка ARC-AGI — самого сложного теста для оценки возможностей ИИ. Теперь результаты теста пришлось пересмотреть, и выглядят они менее впечатляющими: модель оказалась слишком дорогой в обслуживании.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

На минувшей неделе организация Arc Prize Foundation, ответственная за ARC-AGI, обновила свою оценку затрат на вычисления для OpenAI o3. Первоначально считалось, что её наиболее мощная конфигурация o3 high требует расходов в размере около $3000 на решение одной задачи ARC-AGI. Теперь же было установлено, что стоимость обслуживания намного выше — она, возможно, достигает $30 000 за задачу. Это иллюстрирует, насколько дорогими могут оказаться самые сложные современные модели ИИ в определённых задачах, по крайней мере, на начальном этапе. Цену на o3 компания OpenAI ещё не установила, и в общий доступ модель не поступила, но в Arc Prize Foundation предположили, что можно ориентироваться на показатели OpenAI o1-pro.

«Считаем, что o1-pro является более близким сравнением [для определения] истинной стоимости o3 <..> из-за объёма используемых во время тестирования вычислений. Но это не точная оценка, и мы оставили для o3 пометку о предварительной версии в нашей таблице лидеров, чтобы отразить неопределённость, пока не объявлена официальная цена», — рассказали в Arc Prize Foundation ресурсу TechCrunch. Известно, что при решении одной задачи o3 high использовала в 172 раза больше вычислительных ресурсов в ARC-AGI, чем o3 low — наиболее слабая модель в линейке.

Ранее стало известно, что тарифные планы на передовые системы OpenAI могут оказаться чрезвычайно дорогостоящими — до $20 000 в месяц за работу специализированных агентов ИИ. При этом моделям свойственно ошибаться: той же o3 high потребовалось 1024 попытки для решения каждой задачи теста ARC-AGI, чтобы показать лучший результат.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Создатели кинематографичного боевика Spine в духе «Джона Уика» заинтриговали игроков тизером хардкорного режима — новый геймплейный трейлер 21 мин.
Цифровой белорусский рубль «полноценно» заработает во второй половине 2026 года 27 мин.
Google вживую продемонстрировала возможности Android XR 54 мин.
Премьера аддона A Pirate’s Fortune, дата выхода на Switch 2 и бесплатное демо: Ubisoft разразилась новостями о Star Wars Outlaws 2 ч.
Взрывной геймплейный трейлер Painkiller порадовал фанатов демонстрацией нового и классического адского оружия 3 ч.
WhatsApp перенял ещё одну «фишку» Telegram — пользовательские наборы стикеров 3 ч.
Повышение цен сработало: квартальная выручка Netflix подскочила до $10,5 млрд 3 ч.
AWS: облако Azure лишится половины нагрузок, как только Microsoft ослабит политику лицензирования своего ПО 4 ч.
Лицо к осмотру: Discord начал тестировать распознавание лиц для проверки возраста пользователей перед просмотром контента 18+ 6 ч.
Отчёт Google о Gemini 2.5 Pro раскритиковали за отсутствие прозрачности о безопасности ИИ 9 ч.
ИИ-мегапроект Stargate может прийти в Великобританию и Евросоюз, но только в случае успеха в США 12 мин.
AMD выпустила DPU Pensando Pollara 400 для ИИ-инфраструктур с поддержкой Ultra Ethernet 31 мин.
Массовый выпуск серверных процессоров на предприятиях в России начнётся не раньше 2030 года 35 мин.
Apple продолжает терять китайский рынок — компания скатилась на пятое место с долей в 13,7 % 41 мин.
МТС начала торговать китайскими автомобилями 2 ч.
Intel назначила нового технического директора, который также будет отвечать за ИИ 2 ч.
Китайцы разработали флеш-память со «сверхсветовой скоростью» — она в 100 000 раз быстрее обычного кеша 3 ч.
Некоторые NAS Synology станут совместимы только с проприетарными и сертифицированными HDD, но обойти ограничения пока можно 4 ч.
Конкурент Neuralink получил разрешение на длительные клинические испытания своего мозгового импланта 6 ч.
В Китае вводятся повышенные требования к пожарной безопасности тяговых аккумуляторов электромобилей 8 ч.
Включить темный режим