Сегодня 30 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Думающая ИИ-модель OpenAI о1 получила 83 балла на математической олимпиаде США

Искусственный интеллект вступил в новую эру благодаря ИИ-модели о1 компании OpenAI, которая значительно приблизилась к человеческому мышлению. Её впечатляющий результат на тесте AIME — 83 балла из ста — позволил включить её в число 500 лучших участников математической олимпиады США. Однако такие достижения сопровождаются серьёзными вызовами, включая риски манипуляции ИИ человеком и возможность его использования для создания биологического оружия.

 Источник изображения: Saad Ahmad / Unsplash

Источник изображения: Saad Ahmad / Unsplash

Долгое время отсутствие у ИИ способности обдумывать свои ответы являлось одним из его главных ограничений. Однако ИИ-модель о1 совершила прорыв в этом направлении и продемонстрировала способность к осмысленному анализу информации. Несмотря на то, что результаты её работы пока не опубликованы в полном объёме, научное сообщество уже активно обсуждает значимость такого достижения.

Современные нейронные сети в основном функционируют по принципу так называемой «системы 1», которая обеспечивает быструю и интуитивную обработку информации. Например, такие ИИ-модели успешно применяются для распознавания лиц и объектов. Однако человеческое мышление включает также «систему 2», связанную с глубоким анализом и последовательным размышлением над задачей. ИИ-модель о1 объединяет эти два подхода, добавляя к интуитивной обработке данных сложные рассуждения, характерные для человеческого интеллекта.

Одной из ключевых особенностей о1 стала её способность строить «цепочку размышлений» — процесс, при котором система анализирует задачу постепенно, уделяя больше времени поиску оптимального решения. Эта инновация позволила ИИ-модели достичь 83 балла на тесте Американской математической олимпиады (AIME), что значительно превосходит результат GPT-4o, набравшей лишь 13 баллов. Тем не менее такие успехи связаны с возросшими вычислительными затратами и высоким уровнем энергопотребления, что ставит под сомнение экологичность разработки.

 Источник изображения: Igor Omilaev / Unsplash

Источник изображения: Igor Omilaev / Unsplash

Вместе с достижениями ИИ-модели о1 растут и потенциальные риски. Улучшенные когнитивные способности сделали её способной вводить человека в заблуждение, что, возможно, несёт серьёзную угрозу в будущем. Кроме того, уровень риска её использования для разработки биологического оружия оценён как средний — высший допустимый показатель по шкале самой OpenAI. Эти факты подчёркивают необходимость внедрения строгих стандартов безопасности и регулирования подобных ИИ-моделей.

Несмотря на значительные успехи, ИИ-модель о1 всё же сталкивается с ограничениями в решении задач, требующих долгосрочного планирования. Её способности ограничиваются краткосрочным анализом и прогнозированием, что делает невозможным решение комплексных задач. Это свидетельствует о том, что создание полностью автономных ИИ-систем остаётся задачей будущего.

Развитие ИИ-моделей, подобных о1, подчёркивает острую необходимость регулирования данной области. Эти технологии открывают перед наукой, образованием и медициной новые горизонты, однако их неконтролируемое применение может привести к серьёзным последствиям, включая угрозы безопасности и неэтичное использование. Для минимизации этих рисков требуется обеспечить прозрачность разработок ИИ, соблюдение этических стандартов и внедрение строгого надзора со стороны регулирующих органов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В России число заражённых вирусами смартфонов подскочило на 70 % с начала года 3 ч.
Хакеры нашли способ проникать в Gmail через штатный механизм Chrome 3 ч.
Apple ускорила выпуск обновлений безопасности в свете растущей угрозы со стороны ИИ 5 ч.
«Не терпится ждать это семь лет»: амбициозный мод Silksoul для Hollow Knight: Silksong впечатлил фанатов первым трейлером 5 ч.
State of Decay 3 может не выйти — Undead Labs оказалась под угрозой закрытия 7 ч.
Netflix выпустит сериал по мотивам Persona — первые подробности 8 ч.
Oracle пообещала сделать управление развитием MySQL более открытым, но сообщество требует гарантий 15 ч.
В WhatsApp появились никнеймы для скрытия телефонного номера — резервирование уже доступно 15 ч.
Календарь релизов — 29 июня – 5 июля: Undergrounded, Monopoly: Star Wars Heroes vs. Villains 17 ч.
Власти США предложили $10 млн за информацию о хакерах, атакующих пользователей WhatsApp и Signal 17 ч.
Firmus при поддержке NVIDIA развернёт в Индонезии ИИ-кластер из 170 тыс. ускорителей 41 мин.
Dreame выпустила в России робот-пылесос L60 Pro Ultra за 110 тыс. рублей 59 мин.
AOC выпустила доступный 24,5-дюймовый игровой монитор AOC Gaming 25G4ZR с Full HD и 260 Гц 60 мин.
Samsung перестала сомневаться в целесообразности освоения 1,4-нм техпроцесса к 2029 году 2 ч.
Китайцы создали сверхпроводящую катушку для крупнейшего в мире термоядерного реактора — своего собственного 2 ч.
Crusoe инвестирует в израильские ЦОД $10 млрд 3 ч.
Представлен 240-долларовый смартфон OnePlus N6 с батареей на 8000 мА·ч, Dimensity 6360 Max и 50-Мп камерой 3 ч.
Meta научилась точнее распознавать мысленный ввод текста с клавиатуры без операций на мозге и имплантов 3 ч.
51,3 Тбит/с на 206,5 км без усилителей — китайская YOFC успешно протестировала полое оптоволокно 3 ч.
Первый ЦОД, построенный в действующей шахте, открылся в Доломитовых Альпах 3 ч.