Сегодня 24 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → аудиокниги

В России набирает популярность озвучивание аудиокниг с помощью ИИ

По сообщениям сетевых источников, российские книжные сервисы и издательства активно используют алгоритмы на базе искусственного интеллекта для озвучивания аудиокниг. Предполагается, что такие алгоритмы позволят существенно ускорить и удешевить производство контента в этом сегменте. Однако на данном этапе эта технология не может полностью заменить человека и подходит не для всех типов литературы.

 Источник изображения: 4system / Pixabay

Источник изображения: 4system / Pixabay

По данным источника, принадлежащий МТС книжный сервис «Строки» в этом году планирует озвучить свыше 10 тыс. произведений с помощью алгоритма, созданного специалистами подразделения MTS AI. В настоящее время в работе находятся 600 произведений. Запись книг будет осуществляться с помощью платформы Audiogram, которая построена на основе нейросетей, машинного обучения и технологии обработки естественного языка. С её помощью можно синтезировать речь, расставляя ударения и паузы, а также воспроизводить вопросительные побудительные и другие интонации.

Лидер отечественного рынка аудиокниг в лице ГК «ЛитРес» (сервисы «ЛитРес», MyBook, LiveLib и др.) также развивает направление, связанное с озвучиванием книг с помощью нейросетей. «Такую озвучку мы запустили ещё осенью 2020 года, но активно использовать начали осенью 2022 года. Она основана на технологии распознавания и синтеза речи SpeechKit, на которой работает голосовой помощник «Алиса», — рассказал директор департамента по развитию контента ГК «ЛитРес» Евгений Селиванов.

По данным «Яндекса», в 2022 году с помощью технологии SpeechKit было озвучено свыше 100 тыс. часов аудиокниг. «ЛитРес» в прошлом году записал и выпустил около 6 тыс. книг, озвученных «живыми» голосами, тогда как использование ИИ-алгоритма позволило озвучить 3 тыс. произведений всего за два месяца. Отмечается, что себестоимость озвучивания одной книги с помощью ИИ составляет всего 400-700 рублей.

В МТС отметили, что в настоящее время более 90 % книг на российском рынке не имеют аудиоверсий, а их трансформация в аудиоформат традиционным способом заняла бы годы. В то же время для создания первоначальной версии аудиокниги с помощью ИИ-алгоритма требуется 30-60 минут. Для сравнения, запись живым голосом занимает до нескольких дней с учётом технической обработки и монтажа. При этом расходы на озвучивание одной единицы контента снижаются примерно в десять раз.

Apple начала продавать аудиокниги, озвученные нейросетью

Стало известно, что в сервисе Apple Books появились аудиокниги, которые были озвучены с помощью специального алгоритма на базе искусственного интеллекта. Очевидно, за счёт этого компания планирует не только сократить расходы на оплату работы дикторов и рассказчиков, но и существенно ускорить процесс создания аудиокниг.

 Источник изображений: Samuel Axon / ArsTechnica

Источник изображений: Samuel Axon / ArsTechnica

На данный момент в библиотеке Apple присутствует всего несколько книг, озвученных нейросетью, но в будущем их может стать больше. Каждая такая книга в описании имеет соответствующую пометку, в которой сказано, что произведение озвучено «цифровым голосом». Отмечается, что озвученные нейросетью аудиокниги мало чем уступают более привычным, в которых озвучкой занимались люди. Однако в некоторых местах повествования можно заметить отрывки со странным произношением или отсутствием эмоций в голосе.

По данным источника, за последние несколько месяцев Apple контактировала с разными независимыми книжными издателями, предлагая взять на себя расходы по созданию аудиокниг и обещая платить авторам отчисления с продаж. Не все издатели согласились сотрудничать с Apple, но, вероятно, в дальнейшем IT-гигант продолжит расширять библиотеку аудиокниг на своей платформе, поскольку они пользуются большой популярностью. Отметим также, что Apple, скорее всего, будет не единственной компанией, использующей нейросеть для создания аудиокниг. В прошлом Google и Amazon, являющиеся крупными поставщиками электронных и аудиокниг, также не исключали такую возможность.

Spotify сделает аудиокниги третьим столпом своего бизнеса

Стриминговый музыкальный сервис Spotify намерен сделать аудиокниги одной из составляющих своего бизнеса. Об этом заявило руководство компании на встрече с инвесторами, которая состоялась на этой неделе.

 Источник изображения: Spotify

Источник изображения: Spotify

«Мы верим, что аудиокниги в самых разных форматах откроют огромные возможности. И так же, как мы сделали в подкастинге, ожидайте, что мы будем играть, чтобы выиграть», — заявил генеральный директор Spotify Даниэль Эк (Daniel Ek).

Первым большим шагом Spotify на пути развития этого направления бизнеса стало приобретение сервиса Findway, о котором было объявлено в прошлом году. Платформа для аудиокниг позволяет авторам публиковать свои работы и зарабатывать на этом. Несмотря на то, что о сделке было объявлено в ноябре 2021 года, она всё ещё не закрыта, поскольку её продолжает изучать антимонопольный отдел Министерства юстиции США. Если у регулятора не возникнет никаких претензий, то сделка по покупке Findway может быть закрыта к концу этого года.

По какой модели пользователи Spotify смогут получить доступ к аудиокнигам, пока неизвестно. Предполагается, что часть аудиокниг будет доступна бесплатно всем пользователям платформы. Кроме того, компания рассматривает возможность монетизации этого сегмента с помощью рекламного контента. Сроки запуска новых функций, связанных с воспроизведением аудиокниг, озвучены не были.


window-new
Soft
Hard
Тренды 🔥
Критики вынесли вердикт Stellar Blade — формы есть, а содержание? 24 мин.
Вышла новая версия системы резервного копирования «Кибер Бэкап Облачный» с расширенной поддержкой Linux-платформ 28 мин.
Минюст США порекомендовал посадить основателя Binance Чанпэна Чжао в тюрьму на три года 2 ч.
Художественная нейросеть YandexART с латентной диффузией обновилась до версии 1.3 2 ч.
Senua's Saga: Hellblade II получит поддержку русского и ещё 26 языков — игру переведут даже на исландский 2 ч.
Создатели Gloomhaven анонсировали Ironmarked — пошаговую кооперативную RPG, которая может никогда не выйти 3 ч.
Apple выпустит «Калькулятор» для iPad — пользователи планшета 14 лет считали в столбик 3 ч.
SSE4.2-инструкции стали обязательны для Windows 11 24H2 — в LGA775- и AM2/AM3-системах ОС не загружается 3 ч.
В 2023 году ГК «Солар» росла вдвое быстрее рынка 4 ч.
Реклама в меню «Пуск» Windows 11 появилась у всех (после обновления ОС) 6 ч.