Сегодня 19 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

В России набирает популярность озвучивание аудиокниг с помощью ИИ

По сообщениям сетевых источников, российские книжные сервисы и издательства активно используют алгоритмы на базе искусственного интеллекта для озвучивания аудиокниг. Предполагается, что такие алгоритмы позволят существенно ускорить и удешевить производство контента в этом сегменте. Однако на данном этапе эта технология не может полностью заменить человека и подходит не для всех типов литературы.

 Источник изображения: 4system / Pixabay

Источник изображения: 4system / Pixabay

По данным источника, принадлежащий МТС книжный сервис «Строки» в этом году планирует озвучить свыше 10 тыс. произведений с помощью алгоритма, созданного специалистами подразделения MTS AI. В настоящее время в работе находятся 600 произведений. Запись книг будет осуществляться с помощью платформы Audiogram, которая построена на основе нейросетей, машинного обучения и технологии обработки естественного языка. С её помощью можно синтезировать речь, расставляя ударения и паузы, а также воспроизводить вопросительные побудительные и другие интонации.

Лидер отечественного рынка аудиокниг в лице ГК «ЛитРес» (сервисы «ЛитРес», MyBook, LiveLib и др.) также развивает направление, связанное с озвучиванием книг с помощью нейросетей. «Такую озвучку мы запустили ещё осенью 2020 года, но активно использовать начали осенью 2022 года. Она основана на технологии распознавания и синтеза речи SpeechKit, на которой работает голосовой помощник «Алиса», — рассказал директор департамента по развитию контента ГК «ЛитРес» Евгений Селиванов.

По данным «Яндекса», в 2022 году с помощью технологии SpeechKit было озвучено свыше 100 тыс. часов аудиокниг. «ЛитРес» в прошлом году записал и выпустил около 6 тыс. книг, озвученных «живыми» голосами, тогда как использование ИИ-алгоритма позволило озвучить 3 тыс. произведений всего за два месяца. Отмечается, что себестоимость озвучивания одной книги с помощью ИИ составляет всего 400-700 рублей.

В МТС отметили, что в настоящее время более 90 % книг на российском рынке не имеют аудиоверсий, а их трансформация в аудиоформат традиционным способом заняла бы годы. В то же время для создания первоначальной версии аудиокниги с помощью ИИ-алгоритма требуется 30-60 минут. Для сравнения, запись живым голосом занимает до нескольких дней с учётом технической обработки и монтажа. При этом расходы на озвучивание одной единицы контента снижаются примерно в десять раз.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Seagate заявила, что жёсткие диски с HAMR уже не уступают по надёжности традиционным HDD 6 мин.
Corsair представила обновлённые доступные проводные гарнитуры HS35 v2 для геймеров 28 мин.
Tesla отзовёт все проданные электромобили Cybertruck для замены залипающей педали газа 2 ч.
Galax выпустила полностью белую низкопрофильную GeForce RTX 4060 с крошечным заводским разгоном 4 ч.
Razer представила игровые контроллеры Kishi Ultra и Kishi V2 для смартфонов, планшетов и ПК 4 ч.
5 ГВт уже есть, ещё 2,5 ГВт на подходе: Microsoft стремительно наращивает ёмкость ЦОД и скупает ИИ-ускорители 4 ч.
На пути к квантовому интернету учёные впервые смогли записать и считать квантовую информацию в состояниях фотонов 4 ч.
Ulefone покажет на выставке «Связь-2024» новейшие смартфоны, планшеты и аксессуары 6 ч.
HPE обвинила китайскую Inspur в нарушении серверных патентов и обходе санкций США 6 ч.
Китайский автопроизводитель FAW начнёт выпускать премиальные смартфоны 7 ч.