Сегодня 20 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Алгоритм распознавания речи OpenAI Whisper страдает от галлюцинаций

По данным исследователей, система распознавания речи Whisper от компании OpenAI иногда страдает галлюцинациями, т.е. занимается выдумкой фактов. Инженеры-программисты, разработчики и учёные выразили серьёзные опасения по поводу того, что эта особенность ИИ-алгоритма может нанести реальный вред, поскольку Whisper уже используется, в том числе, в медицинских учреждениях.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Склонность генеративных нейросетей к выдумыванию фактов при ответах на вопросы пользователей обсуждается давно. Однако странно видеть эту особенность у алгоритма Whisper, который предназначен для распознавания речи. Исследователи установили, что алгоритм при распознавании речи может включать в генерируемый текст что угодно, начиная от расистских комментариев и заканчивая выдуманными медицинскими процедурами. Это может нанести реальный вред, поскольку Whisper начали использовать в больницах и других медицинских учреждениях.

Исследователь из Университета Мичигана, изучавший расшифровку публичных собраний, сгенерированных Wisper, обнаружил неточности при транскрибировании 8 из 10 аудиозаписей. Другой исследователь изучил более 100 часов, расшифрованных Whisper аудио, и выявил неточности более чем в половине из них. Ещё один инженер заявил, что выявил недостоверности почти во всех 26 тыс. расшифровок, которые он создал с помощью Wisper.

Представитель OpenAI сообщил, что компания постоянно работает над повышением качества работы своих нейросетей, в том числе над уменьшением количества галлюцинаций. Он также добавил, что политика компании запрещает использовать Whisper «в определённых контекстах принятия решений высокой важности». «Мы благодарим исследователей за то, что они поделились своими результатами», — добавил представитель OpenAI.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Датамайнер показал взрывной финал сюжетной миссии из новой Battlefield — фанаты в восторге 2 ч.
Длительная работа с ИИ-инструментами ослабляет у людей когнитивные способности, выяснили учёные 3 ч.
Google давно использует контент YouTube для обучения ИИ и никогда это не скрывала 3 ч.
Релиз СУБД Tantor Postgres 17.5.0: доработки безопасности и аналитики, оптимизации для «1С» и прочие улучшения 3 ч.
WhatsApp не сможет запустить рекламу в Евросоюзе до следующего года 5 ч.
Дурову разрешили ездить из Франции в Дубай, но только на две недели 5 ч.
«Наконец-то Uncharted 5»: первый трейлер китайского AAA-боевика Blood Message впечатлил игроков 5 ч.
«Яндекс» встроит ИИ-рекомендации почти во все свои сервисы 5 ч.
С начала июня трафик Cloudflare в России сократился на 30 % — Роскомнадзор говорит о «проблемах на их стороне» 5 ч.
ИИ стал экзистенциальной угрозой для интернет-СМИ: посетителей на сайтах вытесняют роботы 5 ч.
Ирландия готова разрешить дата-центрам строить не только электростанции, но и частные ЛЭП 3 мин.
AMD «поместит геймеров в центр событий», — в компании прокомментировали сотрудничество с Microsoft 59 мин.
В Германии протестировали рядовую оптическую магистраль на рекордную дальность квантовой связи 2 ч.
Смартфон-раскладушка Samsung Galaxy Z Flip 7 в чёрном и синем цветах предстал на рендерах 2 ч.
AMD готовит шестиядерный Ryzen 5 9600X3D с дополнительной кеш-памятью 3D V-Cache 3 ч.
Японцы изменили атомарную структуру оксида марганца и сделали суперкатализатор для производства водорода 3 ч.
Изображения несуразных накладных наушников Nothing Headphone (1) утекли в интернет 3 ч.
Дизайн и некоторые характеристики смартфона Samsung Galaxy Z Fold 7 раскрыты до анонса 3 ч.
«Мегафон» заканчивает строительство 5-МВт ЦОД в Новосибирске 3 ч.
Kioxia анонсировала 61,44-Тбайт SSD CD9P для ИИ-серверов с PCIe 5.0 5 ч.