Сегодня 24 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-модель OpenAI o1 иногда думает на китайском языке, и никто не знает почему

Рассуждающая ИИ-модель OpenAI o1 удивляет лингвистическими способностями, переключаясь в процессе решения задач на разные языки, в том числе на китайский, даже если запрос был сделан на английском. Эксперты теряются в догадках, а OpenAI не спешит с объяснениями.

 Источник изображения: hdhAI

Источник изображения: hdhAI

OpenAI в прошлом году представила свою первую модель искусственного интеллекта (ИИ) с функциями рассуждения — o1. Однако пользователи заметили любопытную особенность: модель иногда начинает размышлять на китайском, персидском или других языках, даже если вопрос был задан на английском. Например, при решении задачи «Сколько букв R в слове strawberry?» o1 может выполнить часть рассуждений на китайском, прежде чем выдать окончательный ответ на английском.

Эксперты выдвигают несколько теорий, объясняющих это явление. Одной из них является гипотеза о влиянии китайских данных, на которых обучалась модель. Клемент Деланж (Clement Delangue), генеральный директор компании Hugging Face, разрабатывающей инструменты для создания приложений с использованием машинного обучения, и Тед Сяо (Ted Xiao), исследователь из Google DeepMind, отмечают, что многие компании, включая OpenAI, используют услуги сторонних китайских компаний для разметки данных, необходимых для обучения моделей. Это, по их мнению, и может приводить к тому, что модель o1 в некоторых случаях предпочитает в своих рассуждениях китайский язык, как более эффективный для обработки информации.

Однако не все согласны с этой теорией. Некоторые специалисты указывают на то, что влияние китайских данных не подтверждено и модель на самом деле может переключаться на разные языки, включая хинди и тайский. Это может быть связано с тем, что o1 просто выбирает наиболее удобный для себя способ решения задачи. По словам Мэтью Гуздиала (Matthew Guzdial), исследователя ИИ из университета Альберты, модель o1 не воспринимает языки как отдельные сущности, для неё это обычный текст, состоящий из набора токенов, который она обрабатывает.

В конечном итоге, точные причины поведения модели, рассуждающей на разных языках остаются загадкой. Лука Солдаини (Luca Soldaini), научный сотрудник Allen Institute for AI, подчёркивает, что из-за «непрозрачности ИИ-моделей невозможно точно установить, что происходит внутри» и как это всё функционирует. Сама OpenAI пока отмалчивается.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Zero Parades: For Dead Spies — шпион, выйди вон. Рецензия 6 ч.
ИИ-супермодель Claude Mythos всего за месяц обнаружила свыше 10 тыс. уязвимостей в ПО 10 ч.
В Linux обнаружена очередная серьёзная уязвимость — и ей уже десять лет 13 ч.
Firefox перестал вылетать на ПК с процессорами Intel Raptor Lake — на исправление ошибки ушёл год 14 ч.
Outlook Classic перестал показывать картинки, но Microsoft обещала всё починить 14 ч.
На GitHub напал Megalodon — вредоносный код заразил более чем 5500 репозиториев 17 ч.
Марк Цукерберг высказался в защиту тотальной слежки за действиями сотрудников Meta — для обучения ИИ, но это не точно 18 ч.
Техногиганты в последний момент отговорили Трампа подписывать указ об обязательных проверках ИИ 18 ч.
Новый поиск Google оказался капризным: из-за ИИ запросы «стой» и «игнорируй» ломают выдачу 20 ч.
Глава DeepMind спрогнозировал появление сильного искусственного интеллекта (AGI) к 2030 году 23-05 04:46
Первый полёт Starship V3 доказал живучесть обновлённой мегаракеты, хоть и закончился взрывом 9 ч.
Трамп случайно вложил $1 млн в сеть суши-ресторанов вместо производителя ИИ-оборудования 12 ч.
Первая женщина-тайконавт из Гонконга отправится на китайскую космическую станцию 13 ч.
Производитель умных колец Oura подал заявку на IPO 13 ч.
Производителей компонентов для жёстких дисков заподозрили в завышении цен на протяжении 13 лет 14 ч.
Dell представила «элитные» All-Flash СХД PowerStore Elite вместимостью до 5,8 Пбайт 14 ч.
YADRO представила коммутаторы KORNFELD SE для кампусных сетей 16 ч.
Lenovo представила ноутбук IdeaPad Slim 5i на чипе Intel Wildcat Lake — это прямой конкурент MacBook Neo 17 ч.
С началом строительства ЦОД Meta в США вода в близлежащем округе помутнела 17 ч.
Cолнечная и ветровая энергетика впервые обогнали газовые электростанции по выработке электричества 20 ч.