Сегодня 14 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Мощнейшая ИИ-модель OpenAI o3 тратит до $30 000 на решение одной задачи

В декабре OpenAI представила рассуждающую модель искусственного интеллекта o3 и продемонстрировала результаты бенчмарка ARC-AGI — самого сложного теста для оценки возможностей ИИ. Теперь результаты теста пришлось пересмотреть, и выглядят они менее впечатляющими: модель оказалась слишком дорогой в обслуживании.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

На минувшей неделе организация Arc Prize Foundation, ответственная за ARC-AGI, обновила свою оценку затрат на вычисления для OpenAI o3. Первоначально считалось, что её наиболее мощная конфигурация o3 high требует расходов в размере около $3000 на решение одной задачи ARC-AGI. Теперь же было установлено, что стоимость обслуживания намного выше — она, возможно, достигает $30 000 за задачу. Это иллюстрирует, насколько дорогими могут оказаться самые сложные современные модели ИИ в определённых задачах, по крайней мере, на начальном этапе. Цену на o3 компания OpenAI ещё не установила, и в общий доступ модель не поступила, но в Arc Prize Foundation предположили, что можно ориентироваться на показатели OpenAI o1-pro.

«Считаем, что o1-pro является более близким сравнением [для определения] истинной стоимости o3 <..> из-за объёма используемых во время тестирования вычислений. Но это не точная оценка, и мы оставили для o3 пометку о предварительной версии в нашей таблице лидеров, чтобы отразить неопределённость, пока не объявлена официальная цена», — рассказали в Arc Prize Foundation ресурсу TechCrunch. Известно, что при решении одной задачи o3 high использовала в 172 раза больше вычислительных ресурсов в ARC-AGI, чем o3 low — наиболее слабая модель в линейке.

Ранее стало известно, что тарифные планы на передовые системы OpenAI могут оказаться чрезвычайно дорогостоящими — до $20 000 в месяц за работу специализированных агентов ИИ. При этом моделям свойственно ошибаться: той же o3 high потребовалось 1024 попытки для решения каждой задачи теста ARC-AGI, чтобы показать лучший результат.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google создала ИИ-модель DolphinGemma для общения с дельфинами 4 мин.
«Вы не можете спланировать фильм такого масштаба по Zoom»: режиссёр «Бордерлендс» объяснил провал экранизации 16 мин.
GSC пообещала сделать S.T.A.L.K.E.R. 2: Heart of Chornobyl «той игрой, которую вы заслуживаете» — план ближайших обновлений 49 мин.
Начался процесс, который грозит Meta потерей Instagram и WhatsApp, а также многомиллиардными убытками 2 ч.
Google устранила уязвимость в Chrome, существовавшую 23 года 4 ч.
Аудитория ChatGPT приблизилась к миллиарду пользователей благодаря аниме-картинкам 6 ч.
Почти половина любителей мобильных игр играет в них в рабочее время 6 ч.
Сооснователь Troika раскрыл детали вырезанного мультиплеера Vampire: The Masquerade — Bloodlines, который был вдохновлён Counter-Strike 6 ч.
Чистая прибыль «Солар» за 2024 год достигла 1,3 млрд руб. 7 ч.
Начинающие разработчики ИИ-приложений привлекли рекордные $8,2 млрд инвестиций за прошлый год 7 ч.
Intel продала контролирующую долю в Altera частной инвестиционной компании Silver Lake 14 мин.
Nvidia запустила выпуск ИИ-чипов «Made in USA» и пообещала развивать американское производство 35 мин.
Неопределённость хуже полного запрета: тарифная политика США вряд ли поможет рынку ЦОД 43 мин.
Samsung представила Galaxy XCover7 Pro — неубиваемый смартфон со съёмной батареей 52 мин.
Intel продала подразделение FPGA — Altera перешла под контроль Silver Lake за $8,75 млрд 2 ч.
Телекоммуникационные услуги в России подорожали на 12,87 % 2 ч.
А ватты где? Захотевшая стать ИИ-сверхдержавой Великобритания задумалась, где взять энергию для ЦОД 2 ч.
Установлен новый рекорд разгона памяти — DDR5-12772, его поставила память G.Skill 4 ч.
GAC и Didi к концу года запустят производство беспилотных такси четвёртого уровня 6 ч.
Видеокарты Asus GeForce RTX 5060 Ti в исполнениях TUF Gaming, Prime и Dual показались на изображениях 6 ч.
Включить темный режим