В смартфонах Samsung есть функция Bixby Text Call, которая позволяет отвечать на голосовые вызовы, не произнося ни звука. Идея в том, что при невозможности или нежелании ответить вслух, пользователь сможет напечатать ответ, и он будет озвучен звонящему. Ранее ею могли пользоваться корейские пользователи, а теперь она стала доступна и на английском языке. Кроме того, планируется научить смартфоны озучивать сообщения голосом пользователя.
В настоящее время озвучка текста голосом пользователя доступна только на корейском языке в приложении Bixby Custom Voice Creator для небольшого количества смартфонов Samsung — только новых флагманов Galaxy S23, S23+ и S23 Ultra. Качество голоса может быть ужасным, а время отклика слишком велико, чтобы эта функция оказалась реально полезной. Но само по себе клонирование голосов для ответа на вызовы вполне по плечу современным технологиям, поскольку инструменты искусственного интеллекта способны создавать реалистичные копии голосов всего за несколько минут аудиозаписи.
Сам по себе ответ на аудиозвонки через текстовый интерфейс встроенным синтезированным голосом уже не новинка. На устройствах Samsung эта функция известна как Bixby Text Call, она была представлена в оболочке One UI 5 для Android. Google предлагает аналогичную услугу под названием Call Screen, которая позволяет вам отвечать на потенциальные спам-вызовы с помощью автоматизированного голоса. Но служба Google позволяет вам выбирать только из списка общих ответов, а не вводить собственные ответы.
Нетрудно представить, что в ближайшем будущем эти функции станут более сложными и автоматизированными. В конце концов, достаточно будет подключить свой голосовой клон, преобразующий текст в речь, к чат-боту на базе ИИ. Сама Samsung обещает, что в будущем сгенерированные пользователями голоса будут «совместимы с другими приложениями Samsung, помимо телефонных звонков», хотя неясно, что это значит.
Технологические компании давно обещают, что помощники на базе ИИ смогут выполнять разного рода администрирование от имени пользователя, и создание голосового клона самого себя и постановка ему задач через чат-бота может фактически воплотить эту идею в жизнь.
Это также может создать всевозможные проблемы. Google уже пыталась внедрять аналогичную функциональность в 2018 году c помощью своей технологии Duplex AI, как способ автоматического бронирования столиков в ресторанах с помощью голоса ИИ. Но реакция на эту технологию была неоднозначной: многие критиковали её как неэтичную и отмечали, что она создаёт больше работы для людей, принимающих звонки. В конце концов, компания закрыла Duplex AI в конце 2022 года.
Существуют также злонамеренные варианты использования голосовых клонов ИИ, от разжигания ненависти и преследований ИИ до простого мошенничества. Весьма вероятно, что в ближайшем будущем окажется практически невозможно определить, действительно ли это человек на другом конце провода.