Создатель ChatGPT разработал инструмент для выявления текстов, написанных ИИ

Компания OpenAI, разработавшая ИИ-бот ChatGPT, способный писать довольно сложные осмысленные тексты, заявила о создании нового инструмента, позволяющего идентифицировать происхождение написанного. По данным представителей стартапа, новая версия инструмента более точно распознаёт контент, созданный ИИ, чем вариант 2019 года.

Источник изображения: Mel Poole/unsplash.com

Инструмент представили всего через пару месяцев после того, как OpenAI привлекла всеобщее внимание, представив ChatGPT — бота, способного писать тексты, автором которых, на первый взгляд, мог бы быть и человек. На прошлой неделе Microsoft, уже вложившая в OpenAI довольно большие средства, анонсировала многомиллиардные инвестиции с прицелом на интеграцию разработок стартапа в свои сервисы.

Многие учебные заведения довольно быстро ограничили использование ChatGPT учащимися, опасаясь, что использование бота негативно скажется на качестве учебного процесса. Как пошутил глава OpenAI Сэм Альтман (Sam Altman), в своё время процесс обучения изменился и с появлением калькуляторов. Впрочем, он также сообщил, что компания, вероятно, поможет учителям распознавать «работы-подделки», выполненные ИИ.

Пока разработка нового инструмента продолжается и он всё ещё совершает много ошибок. В компании ожидают обратной связи от учителей и родителей. По оценкам самой OpenAI, при оценке тестового набора текстов на английском, программа-классификатор успешно идентифицирует 26 % подготовленных ИИ текстов, называя их «вероятно написанными ИИ», в то же время некорректно определяя 9 % текстов, созданных людьми, как написанные искусственным интеллектом.

Это не первая попытка создать средство, позволяющее распознавать текст, создаваемый машинами. В этом месяце студент Принстонского университета Эдвард Тянь (Edward Tian) анонсировал инструмент GPTZero, предназначенный для преподавателей. OpenAI сама выпустила средство для распознавания текстов ИИ ещё в 2019 году, одновременно с языковой моделью LLM, которая несколько проще ядра ChatGPT. По словам сотрудников стартапа, новая версия инструмента намного лучше справляется с распознаванием текстов «искусственного» авторства.

Известно, что инструмент не силён в анализе фрагментов менее 1000 знаков, и OpenAI не рекомендует использовать его с другими языками помимо английского. Кроме того, созданный ИИ текст можно слегка скорректировать вручную, благодаря чему его будет сложнее идентифицировать. Ещё в 2019 году OpenAI подчёркивала, что идентификация синтетических текстов является непростой задачей, но компания намерена работать над системой распознавания и в дальнейшем.