Новости Software

VocaliD: стань голосовым донором для нуждающихся в этом людей

Несмотря на слегка пугающую формулировку, на самом деле разработчики проекта VocaliD предлагают любому человеку выступить в качестве донора и оказать помощь для создания звукового суррогата тем людям, которые из-за болезни потеряли возможность разговаривать. Данная идея пришла в голову группе специалистов из штатов Делавэр и Бостон. В основу проекта легли достаточно несложные принципы: здоровой человек должен записать всю гамму разнообразных звуков, чтобы после компьютерной обработки с сохранением максимальной точности передачи тембра и интонации пациент мог воспользоваться уникальным синтетическим голосом.

Сортирование записываемых голосов добровольцев происходит исходя из их пола, возраста, критерия физической формы. Поэтому люди, лишённые речевой функциональности, смогут найти себе искусственный голос по своему образу и подобию с наиболее точной и подходящей вокальной идентичностью.

По предварительным данным, десятки миллионов людей во всём мире сосуществуют в социуме благодаря синтетической генерации речи. Лишь в одних Штатах это количество примерно равняется 2,5 млн. Очень часто люди, лишившиеся возможности разговаривать (а причиной потери способности к коммуникации во многих случаях является паралич), по-прежнему хотят оставаться полноценными членами общества и не терять свою индивидуальность. К тому же некоторые из них вовсе не рождались с данным дефектом, потому всё ещё помнят свой уникальный голос и хотели бы получить второй шанс на его возвращение. Преимущественно основными пациентами, нуждающимися в «чужом голосе», являются страдающие болезнью Паркинсона или церебральным параличом. Самым известным и ярким примером для подражания всем людям с подобным недугом может стать известный учёный Стивен Хокинг (Stephen Hawking).

Разработчики предлагают «голосовым донорам» построить весь процесс записи исходников следующим образом: любой желающий зачитывает несколько тысяч слов и короткие предложения, в которых используется максимальный спектр произносимого звукового ряда. Весь процесс должен занять у донора и специалистов не более 2–3 часов. Примерно по аналогичному принципу был разработан популярный голосовой помощник Siri.

Ну а далее дело остаётся за программистами, которые обрабатывают весь записанный материал и выделяют звуковые единицы из речи  гласные и согласные. Хотя и существует вероятность использования донором и пациентом идентичного синтетического голоса, однако создатели VocaliD уверяют, что финальный набор букв-звуков будет представлять собой совокупность нескольких соединённых в единое целое голосовых записей.

 

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Создатели олдскульного квеста Unusual Findings рассказали о важности выбора на примере нового трейлера 12 мин.
Австралийское издательство обвинило Facebook в несоблюдении закона, обязывающего платить СМИ за новости 30 мин.
Microsoft связала более 22 тыс. кибератак с якобы российской группировкой Nobelium 46 мин.
В геймплейном трейлере сезона «Побег» представили новую карту Apex Legends 2 ч.
Discord расскажет больше о том, как ваши друзья проводят время в играх от Electronic Arts 2 ч.
Олдскульный хоррор Tormented Souls выйдет на PS4, Xbox One и Switch только в будущем году 3 ч.
Яркое приключение не без недостатков: первые оценки Marvel's Guardians of the Galaxy 4 ч.
Сервисы интеллектуального управления данными Commvault теперь доступны на AWS Marketplace 4 ч.
Видео: трейлер сюжетной кампании Halo Infinite зовёт игроков в новую эпоху для серии 4 ч.
Google выплатила более 32 млн рублей штрафов, назначенных в России 4 ч.