Сегодня 22 февраля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → аудиокниги

В России набирает популярность озвучивание аудиокниг с помощью ИИ

По сообщениям сетевых источников, российские книжные сервисы и издательства активно используют алгоритмы на базе искусственного интеллекта для озвучивания аудиокниг. Предполагается, что такие алгоритмы позволят существенно ускорить и удешевить производство контента в этом сегменте. Однако на данном этапе эта технология не может полностью заменить человека и подходит не для всех типов литературы.

 Источник изображения: 4system / Pixabay

Источник изображения: 4system / Pixabay

По данным источника, принадлежащий МТС книжный сервис «Строки» в этом году планирует озвучить свыше 10 тыс. произведений с помощью алгоритма, созданного специалистами подразделения MTS AI. В настоящее время в работе находятся 600 произведений. Запись книг будет осуществляться с помощью платформы Audiogram, которая построена на основе нейросетей, машинного обучения и технологии обработки естественного языка. С её помощью можно синтезировать речь, расставляя ударения и паузы, а также воспроизводить вопросительные побудительные и другие интонации.

Лидер отечественного рынка аудиокниг в лице ГК «ЛитРес» (сервисы «ЛитРес», MyBook, LiveLib и др.) также развивает направление, связанное с озвучиванием книг с помощью нейросетей. «Такую озвучку мы запустили ещё осенью 2020 года, но активно использовать начали осенью 2022 года. Она основана на технологии распознавания и синтеза речи SpeechKit, на которой работает голосовой помощник «Алиса», — рассказал директор департамента по развитию контента ГК «ЛитРес» Евгений Селиванов.

По данным «Яндекса», в 2022 году с помощью технологии SpeechKit было озвучено свыше 100 тыс. часов аудиокниг. «ЛитРес» в прошлом году записал и выпустил около 6 тыс. книг, озвученных «живыми» голосами, тогда как использование ИИ-алгоритма позволило озвучить 3 тыс. произведений всего за два месяца. Отмечается, что себестоимость озвучивания одной книги с помощью ИИ составляет всего 400-700 рублей.

В МТС отметили, что в настоящее время более 90 % книг на российском рынке не имеют аудиоверсий, а их трансформация в аудиоформат традиционным способом заняла бы годы. В то же время для создания первоначальной версии аудиокниги с помощью ИИ-алгоритма требуется 30-60 минут. Для сравнения, запись живым голосом занимает до нескольких дней с учётом технической обработки и монтажа. При этом расходы на озвучивание одной единицы контента снижаются примерно в десять раз.

Apple начала продавать аудиокниги, озвученные нейросетью

Стало известно, что в сервисе Apple Books появились аудиокниги, которые были озвучены с помощью специального алгоритма на базе искусственного интеллекта. Очевидно, за счёт этого компания планирует не только сократить расходы на оплату работы дикторов и рассказчиков, но и существенно ускорить процесс создания аудиокниг.

 Источник изображений: Samuel Axon / ArsTechnica

Источник изображений: Samuel Axon / ArsTechnica

На данный момент в библиотеке Apple присутствует всего несколько книг, озвученных нейросетью, но в будущем их может стать больше. Каждая такая книга в описании имеет соответствующую пометку, в которой сказано, что произведение озвучено «цифровым голосом». Отмечается, что озвученные нейросетью аудиокниги мало чем уступают более привычным, в которых озвучкой занимались люди. Однако в некоторых местах повествования можно заметить отрывки со странным произношением или отсутствием эмоций в голосе.

По данным источника, за последние несколько месяцев Apple контактировала с разными независимыми книжными издателями, предлагая взять на себя расходы по созданию аудиокниг и обещая платить авторам отчисления с продаж. Не все издатели согласились сотрудничать с Apple, но, вероятно, в дальнейшем IT-гигант продолжит расширять библиотеку аудиокниг на своей платформе, поскольку они пользуются большой популярностью. Отметим также, что Apple, скорее всего, будет не единственной компанией, использующей нейросеть для создания аудиокниг. В прошлом Google и Amazon, являющиеся крупными поставщиками электронных и аудиокниг, также не исключали такую возможность.

Spotify сделает аудиокниги третьим столпом своего бизнеса

Стриминговый музыкальный сервис Spotify намерен сделать аудиокниги одной из составляющих своего бизнеса. Об этом заявило руководство компании на встрече с инвесторами, которая состоялась на этой неделе.

 Источник изображения: Spotify

Источник изображения: Spotify

«Мы верим, что аудиокниги в самых разных форматах откроют огромные возможности. И так же, как мы сделали в подкастинге, ожидайте, что мы будем играть, чтобы выиграть», — заявил генеральный директор Spotify Даниэль Эк (Daniel Ek).

Первым большим шагом Spotify на пути развития этого направления бизнеса стало приобретение сервиса Findway, о котором было объявлено в прошлом году. Платформа для аудиокниг позволяет авторам публиковать свои работы и зарабатывать на этом. Несмотря на то, что о сделке было объявлено в ноябре 2021 года, она всё ещё не закрыта, поскольку её продолжает изучать антимонопольный отдел Министерства юстиции США. Если у регулятора не возникнет никаких претензий, то сделка по покупке Findway может быть закрыта к концу этого года.

По какой модели пользователи Spotify смогут получить доступ к аудиокнигам, пока неизвестно. Предполагается, что часть аудиокниг будет доступна бесплатно всем пользователям платформы. Кроме того, компания рассматривает возможность монетизации этого сегмента с помощью рекламного контента. Сроки запуска новых функций, связанных с воспроизведением аудиокниг, озвучены не были.

window-new
Soft
Hard
Тренды 🔥
Российская платформа серверной виртуализации zVirt дополнилась функциями репликации данных и массовой конвертации ВМ VMware 8 мин.
NVIDIA выпустила драйвер с поддержкой Nightingale 40 мин.
Вышла бета NVIDIA App — единого приложения для удобного управления графикой GeForce 50 мин.
«Кто позволил Илону Маску выбирать имя?»: Riot раскрыла окончательное название файтинга Project L, и фанаты ему не рады 2 ч.
Дорого, масштабно, но не без проблем: Final Fantasy VII Rebirth получила первые оценки критиков 2 ч.
Инсайдер: в Skull and Bones сыграло 850 тысяч человек, но это с учётом бесплатной пробной версии 4 ч.
Хидетака Миядзаки допустил выход ремейка Bloodborne 5 ч.
Опубликована инструкция по возврату средств для владельцев кошельков QIWI 7 ч.
«Яндекс» остался самой дорогой интернет-компанией России по версии Forbes 7 ч.
Создатели игр для Roblox в 2023 году заработали рекордные $741 млн, но есть нюанс 9 ч.
Учёные из Австралии создали аккумулятор из цинка и воды 27 мин.
Xiaomi представила флагманский планшет Pad 6S Pro 12.4 с процессором Snapdragon 8 Gen 2 и до 16 Гбайт оперативной памяти 3 ч.
Sony анонсировала официальную поддержку PlayStation VR2 на ПК с Windows 3 ч.
Британцы ускорили изготовление рабочих камер для малых ядерных реакторов с года до суток 3 ч.
Вышел смартфон Xiaomi 14 Pro Titanium Special Edition с двухсторонней спутниковой связью и титановым корпусом за $973 4 ч.
NVIDIA установила абсолютный мировой рекорд, всего за день подорожав на $230 млрд 4 ч.
Австралийское Минобороны представило мощный суперкомпьютер Taingiwilta, не сказав о нём практически ни слова 5 ч.
Клиенты NVIDIA уже начали тестировать антисанкционные ИИ-ускорители для Китая 5 ч.
Представлен флагман Xiaomi 14 Ultra — двухсторонняя спутниковая связь, передовая камера Leica и не только 6 ч.
Samsung представила фитнес-браслет Galaxy Fit3 с большим экраном и автономностью на 13 дней 6 ч.