Сегодня 04 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-модель OpenAI o1 иногда думает на китайском языке, и никто не знает почему

Рассуждающая ИИ-модель OpenAI o1 удивляет лингвистическими способностями, переключаясь в процессе решения задач на разные языки, в том числе на китайский, даже если запрос был сделан на английском. Эксперты теряются в догадках, а OpenAI не спешит с объяснениями.

 Источник изображения: hdhAI

Источник изображения: hdhAI

OpenAI в прошлом году представила свою первую модель искусственного интеллекта (ИИ) с функциями рассуждения — o1. Однако пользователи заметили любопытную особенность: модель иногда начинает размышлять на китайском, персидском или других языках, даже если вопрос был задан на английском. Например, при решении задачи «Сколько букв R в слове strawberry?» o1 может выполнить часть рассуждений на китайском, прежде чем выдать окончательный ответ на английском.

Эксперты выдвигают несколько теорий, объясняющих это явление. Одной из них является гипотеза о влиянии китайских данных, на которых обучалась модель. Клемент Деланж (Clement Delangue), генеральный директор компании Hugging Face, разрабатывающей инструменты для создания приложений с использованием машинного обучения, и Тед Сяо (Ted Xiao), исследователь из Google DeepMind, отмечают, что многие компании, включая OpenAI, используют услуги сторонних китайских компаний для разметки данных, необходимых для обучения моделей. Это, по их мнению, и может приводить к тому, что модель o1 в некоторых случаях предпочитает в своих рассуждениях китайский язык, как более эффективный для обработки информации.

Однако не все согласны с этой теорией. Некоторые специалисты указывают на то, что влияние китайских данных не подтверждено и модель на самом деле может переключаться на разные языки, включая хинди и тайский. Это может быть связано с тем, что o1 просто выбирает наиболее удобный для себя способ решения задачи. По словам Мэтью Гуздиала (Matthew Guzdial), исследователя ИИ из университета Альберты, модель o1 не воспринимает языки как отдельные сущности, для неё это обычный текст, состоящий из набора токенов, который она обрабатывает.

В конечном итоге, точные причины поведения модели, рассуждающей на разных языках остаются загадкой. Лука Солдаини (Luca Soldaini), научный сотрудник Allen Institute for AI, подчёркивает, что из-за «непрозрачности ИИ-моделей невозможно точно установить, что происходит внутри» и как это всё функционирует. Сама OpenAI пока отмалчивается.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В открытый доступ попало 10 минут геймплея Awakening — потерянного сюжетного дополнения к Quake 4 10 мин.
Biohub Марка Цукерберга взялся ускорить лечение всех болезней с помощью ИИ-моделей клеток 4 ч.
Развитие ИИ замедляется из-за переизбытка бесполезных данных — их слишком много 4 ч.
Кооперативный шутер о приключениях роботов-ковбоев на Диком Западе стал новым хитом Steam — полмиллиона проданных копий Far Far West 5 ч.
Долгожданное воссоединение: моддер добавил в Resident Evil Requiem торговца из ремейка Resident Evil 4 5 ч.
Квартальные расходы на облачные инфраструктуры выросли на 35 % — до $129 млрд 6 ч.
Продажи Heroes of Might & Magic: Olden Era превысили 500 тыс. копий менее чем за три дня после релиза 9 ч.
Аддон Lord of Hatred вернул игроков в Diablo IV — первый за полтора года новый рекорд пикового онлайна в Steam 9 ч.
OpenAI добавила в Codex анимированных ИИ-«питомцев» для напоминаний о ходе работы — пока на Windows и macOS 22 ч.
Microsoft адаптировала Azure Local для крупномасштабных суверенных облаков 03-05 12:53
Вместо «Роскосмоса» южнокорейский спутник дистанционного зондирования Земли запустила SpaceX 4 мин.
Samsung загружена заказами на выпуск 4-нм чипов до конца следующего года 9 мин.
В кабеле питания Asus ROG Equalizer за $50 «нет никакого смысла», а удаление встроенного мостика улучшает баланс тока, говорит Der8auer 11 мин.
На фоне торговой войны США и Китая Huawei прогнозирует рост выручки от продажи ИИ-чипов на 60 % 4 ч.
MSI IPC выпустила 3,5″ одноплатный компьютер MS-CF27 с четырьмя портами 2.5GbE 4 ч.
Электромобили Tesla намотали 16 млрд км в автономном режиме: ранее Илон Маск обещал, что это позволит им отказаться от надзора водителя 4 ч.
GameStop предложила купить eBay за $56 млрд 5 ч.
Видеокарты GeForce RTX 5050 и Radeon RX 9070 появились в рейтинге оборудования Steam 5 ч.
Western Digital увеличила квартальную выручку в полтора раза благодаря ИИ 5 ч.
Samsung сменила главу телевизионного подразделения — китайские конкуренты давят всё сильнее 7 ч.