Компания OpenAI, разработавшая ИИ-бот ChatGPT, способный писать довольно сложные осмысленные тексты, заявила о создании нового инструмента, позволяющего идентифицировать происхождение написанного. По данным представителей стартапа, новая версия инструмента более точно распознаёт контент, созданный ИИ, чем вариант 2019 года.
Инструмент представили всего через пару месяцев после того, как OpenAI привлекла всеобщее внимание, представив ChatGPT — бота, способного писать тексты, автором которых, на первый взгляд, мог бы быть и человек. На прошлой неделе Microsoft, уже вложившая в OpenAI довольно большие средства, анонсировала многомиллиардные инвестиции с прицелом на интеграцию разработок стартапа в свои сервисы.
Многие учебные заведения довольно быстро ограничили использование ChatGPT учащимися, опасаясь, что использование бота негативно скажется на качестве учебного процесса. Как пошутил глава OpenAI Сэм Альтман (Sam Altman), в своё время процесс обучения изменился и с появлением калькуляторов. Впрочем, он также сообщил, что компания, вероятно, поможет учителям распознавать «работы-подделки», выполненные ИИ.
Пока разработка нового инструмента продолжается и он всё ещё совершает много ошибок. В компании ожидают обратной связи от учителей и родителей. По оценкам самой OpenAI, при оценке тестового набора текстов на английском, программа-классификатор успешно идентифицирует 26 % подготовленных ИИ текстов, называя их «вероятно написанными ИИ», в то же время некорректно определяя 9 % текстов, созданных людьми, как написанные искусственным интеллектом.
Это не первая попытка создать средство, позволяющее распознавать текст, создаваемый машинами. В этом месяце студент Принстонского университета Эдвард Тянь (Edward Tian) анонсировал инструмент GPTZero, предназначенный для преподавателей. OpenAI сама выпустила средство для распознавания текстов ИИ ещё в 2019 году, одновременно с языковой моделью LLM, которая несколько проще ядра ChatGPT. По словам сотрудников стартапа, новая версия инструмента намного лучше справляется с распознаванием текстов «искусственного» авторства.
Известно, что инструмент не силён в анализе фрагментов менее 1000 знаков, и OpenAI не рекомендует использовать его с другими языками помимо английского. Кроме того, созданный ИИ текст можно слегка скорректировать вручную, благодаря чему его будет сложнее идентифицировать. Ещё в 2019 году OpenAI подчёркивала, что идентификация синтетических текстов является непростой задачей, но компания намерена работать над системой распознавания и в дальнейшем.