Сегодня 22 ноября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → аудиокниги

Audible протестирует поиск аудиокниг при помощи ИИ

Компания по производству аудиокниг Audible, принадлежащая Amazon, объявила о старте тестирования функции поиска на основе искусственного интеллекта, которая должна помочь пользователям существенно упростить поиск аудиокниг. Некоторым клиентам в США уже сейчас стало доступно взаимодействие с Maven, новым ИИ-экспертом по персональным рекомендациям Audible, который предлагает аудиокниги на основе запросов пользователей.

 Источник изображений: Audible

Источник изображений: Audible

При поиске пользователь может использовать естественный язык для ввода запросов, а Maven предоставит индивидуальные рекомендации, основываясь на каталоге Audible, насчитывающем почти миллион наименований книжной продукции.

ИИ-поиск Maven станет доступен на устройствах iOS и Android. Почти половина клиентов Audible в США получат доступ к этой функции, независимо от тарифного плана. В настоящее время, по словам компании, область поиска ограничена «подмножеством» её библиотеки аудиокниг. В дальнейшем Audible планирует развивать и совершенствовать новый инструмент поиска.

Audible не конкретизировала, какие модели ИИ были использованы при разработке системы поиска Maven. Представитель компании отметил, что Maven использует «сильные стороны нескольких моделей» и будет «постоянно оценивать» их по мере совершенствования.

Наряду с объявлением о запуске Maven, Audible сообщила, что также экспериментирует с «Коллекциями», курируемыми ИИ, и обзорами, созданными ИИ. «Коллекции» Audible примечательны тем, что могут стать ответом Audible на плейлисты Spotify, созданные при помощи ИИ.

Ранее негативную реакцию со стороны актёров и других творческих личностей вызвало сообщение, что по состоянию на май 2024 года более 40 000 книг в библиотеке Audible были озвучены ИИ. На сегодняшний день их количество, вероятно, заметно увеличилось.

В России набирает популярность озвучивание аудиокниг с помощью ИИ

По сообщениям сетевых источников, российские книжные сервисы и издательства активно используют алгоритмы на базе искусственного интеллекта для озвучивания аудиокниг. Предполагается, что такие алгоритмы позволят существенно ускорить и удешевить производство контента в этом сегменте. Однако на данном этапе эта технология не может полностью заменить человека и подходит не для всех типов литературы.

 Источник изображения: 4system / Pixabay

Источник изображения: 4system / Pixabay

По данным источника, принадлежащий МТС книжный сервис «Строки» в этом году планирует озвучить свыше 10 тыс. произведений с помощью алгоритма, созданного специалистами подразделения MTS AI. В настоящее время в работе находятся 600 произведений. Запись книг будет осуществляться с помощью платформы Audiogram, которая построена на основе нейросетей, машинного обучения и технологии обработки естественного языка. С её помощью можно синтезировать речь, расставляя ударения и паузы, а также воспроизводить вопросительные побудительные и другие интонации.

Лидер отечественного рынка аудиокниг в лице ГК «ЛитРес» (сервисы «ЛитРес», MyBook, LiveLib и др.) также развивает направление, связанное с озвучиванием книг с помощью нейросетей. «Такую озвучку мы запустили ещё осенью 2020 года, но активно использовать начали осенью 2022 года. Она основана на технологии распознавания и синтеза речи SpeechKit, на которой работает голосовой помощник «Алиса», — рассказал директор департамента по развитию контента ГК «ЛитРес» Евгений Селиванов.

По данным «Яндекса», в 2022 году с помощью технологии SpeechKit было озвучено свыше 100 тыс. часов аудиокниг. «ЛитРес» в прошлом году записал и выпустил около 6 тыс. книг, озвученных «живыми» голосами, тогда как использование ИИ-алгоритма позволило озвучить 3 тыс. произведений всего за два месяца. Отмечается, что себестоимость озвучивания одной книги с помощью ИИ составляет всего 400-700 рублей.

В МТС отметили, что в настоящее время более 90 % книг на российском рынке не имеют аудиоверсий, а их трансформация в аудиоформат традиционным способом заняла бы годы. В то же время для создания первоначальной версии аудиокниги с помощью ИИ-алгоритма требуется 30-60 минут. Для сравнения, запись живым голосом занимает до нескольких дней с учётом технической обработки и монтажа. При этом расходы на озвучивание одной единицы контента снижаются примерно в десять раз.

Apple начала продавать аудиокниги, озвученные нейросетью

Стало известно, что в сервисе Apple Books появились аудиокниги, которые были озвучены с помощью специального алгоритма на базе искусственного интеллекта. Очевидно, за счёт этого компания планирует не только сократить расходы на оплату работы дикторов и рассказчиков, но и существенно ускорить процесс создания аудиокниг.

 Источник изображений: Samuel Axon / ArsTechnica

Источник изображений: Samuel Axon / ArsTechnica

На данный момент в библиотеке Apple присутствует всего несколько книг, озвученных нейросетью, но в будущем их может стать больше. Каждая такая книга в описании имеет соответствующую пометку, в которой сказано, что произведение озвучено «цифровым голосом». Отмечается, что озвученные нейросетью аудиокниги мало чем уступают более привычным, в которых озвучкой занимались люди. Однако в некоторых местах повествования можно заметить отрывки со странным произношением или отсутствием эмоций в голосе.

По данным источника, за последние несколько месяцев Apple контактировала с разными независимыми книжными издателями, предлагая взять на себя расходы по созданию аудиокниг и обещая платить авторам отчисления с продаж. Не все издатели согласились сотрудничать с Apple, но, вероятно, в дальнейшем IT-гигант продолжит расширять библиотеку аудиокниг на своей платформе, поскольку они пользуются большой популярностью. Отметим также, что Apple, скорее всего, будет не единственной компанией, использующей нейросеть для создания аудиокниг. В прошлом Google и Amazon, являющиеся крупными поставщиками электронных и аудиокниг, также не исключали такую возможность.


window-new
Soft
Hard
Тренды 🔥
Итоги Golden Joystick Awards 2024 — Final Fantasy VII Rebirth и Helldivers 2 забрали больше всех наград, а Black Myth: Wukong стала игрой года 60 мин.
В программу сохранения классических игр от GOG вошли S.T.A.L.K.E.R. Shadow of Chernobyl и Call of Pripyat, а Clear Sky — на подходе 2 ч.
Star Wars Outlaws вышла в Steam с крупным обновлением и дополнением про Лэндо Калриссиана 4 ч.
Миллионер с зарплатой сантехника: выяснилось, сколько зарабатывает глава OpenAI 5 ч.
Рекордная скидка и PvP-режим Versus обернулись для Warhammer: Vermintide 2 полумиллионом новых игроков за неделю 5 ч.
Новый трейлер раскрыл дату выхода Mandragora — метроидвании с элементами Dark Souls и нелинейной историей от соавтора Vampire: The Masquerade — Bloodlines 6 ч.
В Японии порекомендовали добавить в завещания свои логины и пароли 8 ч.
Обновления Windows 11 больше не будут перезагружать ПК, но обычных пользователей это не касается 8 ч.
VK похвасталась успехами «VK Видео» на фоне замедления YouTube 10 ч.
GTA наоборот: полицейская песочница The Precinct с «дозой нуара 80-х» не выйдет в 2024 году 11 ч.
Представлен внешний SSD SanDisk Extreme на 8 Тбайт за $800 и скоростной SanDisk Extreme PRO с USB4 39 мин.
Представлен безбуферный SSD WD_Black SN7100 со скорость до 7250 Мбайт/с и внешний SSD WD_Black C50 для Xbox 44 мин.
Новая статья: Обзор ноутбука ASUS Zenbook S 16 (UM5606W): Ryzen AI в естественной среде 59 мин.
Redmi показала флагманский смартфон K80 Pro и объявила дату его премьеры 3 ч.
SpaceX рассказала, почему затопила ракету Super Heavy во время последнего запуска Starship 4 ч.
Астрономы впервые сфотографировали умирающую звезду за пределами нашей галактики — она выглядит не так, как ожидалось 6 ч.
Японская Hokkaido Electric Power намерена перезапустить ядерный реактор для удовлетворения потребности ЦОД в энергии 7 ч.
Meta планирует построить за $5 млрд кампус ЦОД в Луизиане 8 ч.
Arm задаёт новый стандарт для ПК, чтобы навязать конкуренцию x86 8 ч.
HPE готова ответить на любые вопросы Минюста США по расследованию покупки Juniper за $14 млрд 8 ч.