Сегодня 05 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Мощнейшая ИИ-модель OpenAI o3 тратит до $30 000 на решение одной задачи

В декабре OpenAI представила рассуждающую модель искусственного интеллекта o3 и продемонстрировала результаты бенчмарка ARC-AGI — самого сложного теста для оценки возможностей ИИ. Теперь результаты теста пришлось пересмотреть, и выглядят они менее впечатляющими: модель оказалась слишком дорогой в обслуживании.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

На минувшей неделе организация Arc Prize Foundation, ответственная за ARC-AGI, обновила свою оценку затрат на вычисления для OpenAI o3. Первоначально считалось, что её наиболее мощная конфигурация o3 high требует расходов в размере около $3000 на решение одной задачи ARC-AGI. Теперь же было установлено, что стоимость обслуживания намного выше — она, возможно, достигает $30 000 за задачу. Это иллюстрирует, насколько дорогими могут оказаться самые сложные современные модели ИИ в определённых задачах, по крайней мере, на начальном этапе. Цену на o3 компания OpenAI ещё не установила, и в общий доступ модель не поступила, но в Arc Prize Foundation предположили, что можно ориентироваться на показатели OpenAI o1-pro.

«Считаем, что o1-pro является более близким сравнением [для определения] истинной стоимости o3 <..> из-за объёма используемых во время тестирования вычислений. Но это не точная оценка, и мы оставили для o3 пометку о предварительной версии в нашей таблице лидеров, чтобы отразить неопределённость, пока не объявлена официальная цена», — рассказали в Arc Prize Foundation ресурсу TechCrunch. Известно, что при решении одной задачи o3 high использовала в 172 раза больше вычислительных ресурсов в ARC-AGI, чем o3 low — наиболее слабая модель в линейке.

Ранее стало известно, что тарифные планы на передовые системы OpenAI могут оказаться чрезвычайно дорогостоящими — до $20 000 в месяц за работу специализированных агентов ИИ. При этом моделям свойственно ошибаться: той же o3 high потребовалось 1024 попытки для решения каждой задачи теста ARC-AGI, чтобы показать лучший результат.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google научила Gemini 2.5 понимать и передавать эмоции в диалогах 16 мин.
«Мечты сбываются!»: Team Ninja анонсировала Nioh 3 и выпустила на PS5 эксклюзивную демоверсию 17 мин.
Первый геймплейный трейлер раскрыл дату выхода психологического хоррора Silent Hill f 55 мин.
«Яблочный интеллект» упёрся в китайскую стену: запуск ИИ-сервисов Apple в КНР заморожен 2 ч.
ChatGPT научился копаться в корпоративных файлах в «Google Диске», Dropbox и других облаках 4 ч.
Разработчики Kingdom Come: Deliverance 2 готовят расширение, но не только для игры — Warhorse Studios откроет офис в Брно 4 ч.
Mozilla перестанет пропускать в магазин Firefox мошеннические криптовалютные расширения 6 ч.
На Мосбирже стартовали первые в России торги фьючерсами на биткоин 7 ч.
Gemini покажет изменения, внесённые коллегами в файлы на «Google Диске» 7 ч.
«Отражает наши амбиции»: в CDPR уклонились от ответа, будет ли графика The Witcher 4 соответствовать уровню технодемо 8 ч.
Новая статья: Система жидкостного охлаждения PCCooler DT360 ARGB Display: красиво, но есть нюансы 28 мин.
Посадочные модули и лунный танкер: Blue Origin представила план освоения Луны 2 ч.
Новая статья: ИИтоги мая 2025 г.: кто кого ещё выключит 3 ч.
Разборка Galaxy S25 Edge показала, за счёт чего Samsung удалось сделать смартфон таким тонким 3 ч.
AMD оправдалась за отсутствие обзоров Radeon RX 9060 XT 8GB — получилось неубедительно 4 ч.
В аэропорту Нью-Йорка впервые осуществил посадку полностью электрический самолёт 4 ч.
Лучше, чем InfiniBand и Ethernet: Cornelis Networks представила 400G-интерконнект Omni-Path CN5000 5 ч.
Провода — прошлый век: представлен стол с беспроводным питанием всей компьютерной периферии, включая монитор 7 ч.
GlobalFoundries потратит $16 млрд на расширение производства чипов в США 7 ч.
Побит мировой рекорд по разгону GPU — встроенную графику Intel Core Ultra 9 285K довели до 4,25 ГГц под жидким азотом 8 ч.