Сегодня 24 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Думающая ИИ-модель OpenAI о1 получила 83 балла на математической олимпиаде США

Искусственный интеллект вступил в новую эру благодаря ИИ-модели о1 компании OpenAI, которая значительно приблизилась к человеческому мышлению. Её впечатляющий результат на тесте AIME — 83 балла из ста — позволил включить её в число 500 лучших участников математической олимпиады США. Однако такие достижения сопровождаются серьёзными вызовами, включая риски манипуляции ИИ человеком и возможность его использования для создания биологического оружия.

 Источник изображения: Saad Ahmad / Unsplash

Источник изображения: Saad Ahmad / Unsplash

Долгое время отсутствие у ИИ способности обдумывать свои ответы являлось одним из его главных ограничений. Однако ИИ-модель о1 совершила прорыв в этом направлении и продемонстрировала способность к осмысленному анализу информации. Несмотря на то, что результаты её работы пока не опубликованы в полном объёме, научное сообщество уже активно обсуждает значимость такого достижения.

Современные нейронные сети в основном функционируют по принципу так называемой «системы 1», которая обеспечивает быструю и интуитивную обработку информации. Например, такие ИИ-модели успешно применяются для распознавания лиц и объектов. Однако человеческое мышление включает также «систему 2», связанную с глубоким анализом и последовательным размышлением над задачей. ИИ-модель о1 объединяет эти два подхода, добавляя к интуитивной обработке данных сложные рассуждения, характерные для человеческого интеллекта.

Одной из ключевых особенностей о1 стала её способность строить «цепочку размышлений» — процесс, при котором система анализирует задачу постепенно, уделяя больше времени поиску оптимального решения. Эта инновация позволила ИИ-модели достичь 83 балла на тесте Американской математической олимпиады (AIME), что значительно превосходит результат GPT-4o, набравшей лишь 13 баллов. Тем не менее такие успехи связаны с возросшими вычислительными затратами и высоким уровнем энергопотребления, что ставит под сомнение экологичность разработки.

 Источник изображения: Igor Omilaev / Unsplash

Источник изображения: Igor Omilaev / Unsplash

Вместе с достижениями ИИ-модели о1 растут и потенциальные риски. Улучшенные когнитивные способности сделали её способной вводить человека в заблуждение, что, возможно, несёт серьёзную угрозу в будущем. Кроме того, уровень риска её использования для разработки биологического оружия оценён как средний — высший допустимый показатель по шкале самой OpenAI. Эти факты подчёркивают необходимость внедрения строгих стандартов безопасности и регулирования подобных ИИ-моделей.

Несмотря на значительные успехи, ИИ-модель о1 всё же сталкивается с ограничениями в решении задач, требующих долгосрочного планирования. Её способности ограничиваются краткосрочным анализом и прогнозированием, что делает невозможным решение комплексных задач. Это свидетельствует о том, что создание полностью автономных ИИ-систем остаётся задачей будущего.

Развитие ИИ-моделей, подобных о1, подчёркивает острую необходимость регулирования данной области. Эти технологии открывают перед наукой, образованием и медициной новые горизонты, однако их неконтролируемое применение может привести к серьёзным последствиям, включая угрозы безопасности и неэтичное использование. Для минимизации этих рисков требуется обеспечить прозрачность разработок ИИ, соблюдение этических стандартов и внедрение строгого надзора со стороны регулирующих органов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Создатель Discord покинул пост гендиректора ради нового будущего компании 5 ч.
Google Gemini проиграл ИИ-гонку — пользователи предпочитают ChatGPT и Meta AI 5 ч.
Российский суд запретил Google продолжить процесс по банкротству «Гугл» в США 6 ч.
Создатели The Quarry и Until Dawn должны были выпустить экшен во вселенной «Бегущего по лезвию» — детали отменённой Blade Runner: Time To Live 6 ч.
«Ошеломляющий объём работы»: ремастер The Elder Scrolls IV: Oblivion поразил дизайнера оригинальной игры 7 ч.
Минфин и ЦБ РФ запустят криптобиржу для «суперквалифицированных» инвесторов 9 ч.
«Возвращает легенду в строй»: антиутопическое приключение на колёсах Beholder: Conductor вышло в Steam и порадовало игроков 9 ч.
Герои не нашего времени: Ubisoft анонсировала мобильную блокчейн-игру Might and Magic Fates 10 ч.
Google и X могут стать следующими целями для Еврокомиссии 10 ч.
Google проиграла биткоину по рыночной капитализации 12 ч.
Глава Intel произвёл ключевые кадровые перестановки, чтобы распрощаться с бюрократией 17 мин.
Новая статья: Обзор процессорного кулера ID-Cooling Frozn A620 GDL: охлаждение на стиле 4 ч.
Мировые поставки ПК в первом квартале подскочили на 6,7 % благодаря разговорам о трамповских пошлинах 5 ч.
Китайские IT-гиганты всё-таки успели закупить NVIDIA H20 на миллиарды долларов до объявления новых санкций 5 ч.
Новая статья: Обзор планшета DIGMA PRO Empire: успешная попытка усидеть на двух стульях 5 ч.
Не было бы счастья: Индия и Китай стали лидерами по внедрению IPv6 потому, что когда-то им досталось совсем мало IPv4-адресов 6 ч.
Учёные предложили буквально пускать золотую пыль в глаза для лечения возрастной слепоты 7 ч.
Meta запустила онлайн-переводы и другие функции на базе ИИ для умных очков Ray-Ban 8 ч.
AMD подтвердила участие в Computex 2025 — ожидается анонс Radeon RX 9060 XT 9 ч.
Honor представила фитнес-браслет Band 10 за $34 — он умеет выявлять проблемы с сердцем на ранних этапах 10 ч.