Сегодня 08 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

«Голосовое протезирование с ИИ» превратит мозговые волны немых людей в беглую речь

Немало людей страдают от потери речи в результате заболеваний, хотя их когнитивные функции остаются незатронутыми. Поэтому на волне прогресса в области ИИ многие исследователи сосредоточились на синтезе естественной речи (вокализации) с помощью комбинации мозговых имплантатов и нейросети. В случае успеха эта технология может быть расширена для помощи людям, испытывающим трудности с вокализацией из-за таких состояний, как церебральный паралич или аутизм.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

Долгое время основные инвестиции и внимание учёных были сосредоточены на имплантах, которые позволяют людям с тяжёлыми формами инвалидности использовать клавиатуру, управлять роботизированными руками или частично восстанавливать использование парализованных конечностей. Одновременно многие исследователи сконцентрировались на разработке технологий вокализации, которые преобразует мыслительные модели в речь.

«Мы добиваемся большого прогресса. Сделать передачу голоса от мозга к синтетическому голосу такой же плавной, как диалог между двумя говорящими людьми — наша главная цель, — рассказал нейрохирург из Калифорнийского университета Эдвард Чанг (Edward Chang). — Используемые нами алгоритмы ИИ становятся быстрее, и мы учимся с каждым новым участником наших исследований».

В марте 2025 года Чанг с коллегами опубликовали статью в журнале Nature Neuroscience, в которой описали работу с парализованной женщиной, которая не могла говорить в течение 18 лет после перенесённого инсульта. При помощи учёных она обучала нейронную сеть, безмолвно пытаясь произнести предложения, составленные из 1024 разных слов. Затем звук её голоса был синтезирован путём потоковой передачи её нейронных данных в совместную модель синтеза речи и декодирования текста.

 Источник изображения: New England Journal of Medicine

Источник изображения: New England Journal of Medicine

Технология позволила сократить задержку между мозговыми сигналами пациента и полученным звуком с первоначальных восьми до одной секунды. Этот результат уже сопоставим с естественным для обычной речи временным интервалом в 100–200 миллисекунд. Медианная скорость декодирования системы достигла 47,5 слов в минуту, что составляет примерно треть от скорости обычного разговора.

Аналогичные исследования были произведены компанией Precision Neuroscience, причём её генеральный директор Майкл Магер (Michael Mager) утверждает, что их подход позволяет захватывать мозговые сигналы с более высоким разрешением за счёт «более плотной упаковки электродов».

На данный момент Precision Neuroscience провела успешные эксперименты с 31 пациентом и даже получила разрешение регулирующих органов оставлять свои датчики имплантированными на срок до 30 дней. Магер утверждает, что это позволит в течение года обучить нейросеть на «крупнейшим хранилище нейронных данных высокого разрешения, которое существует на планете Земля». Следующим шагом, по словам Магера, будет «миниатюризация компонентов и их помещение в герметичные биосовместимые пакеты, чтобы их можно было навсегда внедрить в тело».

 Источник изображения: UC Davis Health

Источник изображения: UC Davis Health

Самым серьёзным препятствием для разработки и использования технологии «мозг-голос» является время, которое требуется пациентам, чтобы научиться пользоваться системой. Ключевой нерешённый вопрос заключается в степени различия шаблонов реагирования в двигательной коре — части мозга, которая контролирует произвольные действия, включая речь, — у разных людей. Если они окажутся схожими, предварительно обученные модели можно будет использовать для новых пациентов. Это ускорит процесс индивидуального обучения, который занимает десятки или даже сотни часов.

Все исследователи вокализации солидарны в вопросе о недопустимости «расшифровки внутренних мыслей», то есть того, что человек не хочет высказывать. По словам одного из учёных, «есть много вещей, которые я не говорю вслух, потому что они не пойдут мне на пользу или могут навредить другим».

На сегодняшний учёные ещё далеки от вокализации, сопоставимой с обычным разговором среднестатистических людей. Хотя точность декодирования удалось довести до 98 %, голосовой вывод происходит не мгновенно и не в состоянии передать такие важные особенности речи, как тон и настроение. Учёные надеются, что в конечном итоге им удастся создать голосовой нейропротез, который обеспечит полный экспрессивный диапазон человеческого голоса, чтобы пациенты могли контролировать тон и ритм своей речи и даже петь.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В iOS 27 появятся новые ИИ-инструменты для редактирования фотографий в «Фото» 19 мин.
Европейцы не получат Siri AI вместе с iOS 27 — Apple винит в этом закон DMA 27 мин.
Apple радикально обновила Apple Intelligence, опираясь на Google Gemini 2 ч.
Apple представила новую Siri, снова — Siri AI поселилась на островке iPhone, работает с Google Gemini и умеет анализировать экран 3 ч.
После семи лет разработки олдскульная ролевая игра Sea of Stars от создателей The Messenger получила прощальное обновление и вышла на Switch 2 4 ч.
Meta обвинила создателя шпионского софта Pegasus в нарушении судебного запрета и новых атаках на WhatsApp 4 ч.
Основатель разорившейся криптобиржи FTX Сэм Бэнкман-Фрид подал Трампу прошение о помиловании 4 ч.
Сюжетное дополнение к Fable позволит стать новым боссом древнего культа — первые подробности Order of the Hero 5 ч.
Анонсирована первая за девять месяцев большая игровая презентация Nintendo Direct: когда пройдёт, где смотреть, что покажут 6 ч.
Бесстрашная пиратка, Минотавр и бои на мечах вместо стелса: Resonance: A Plague Tale Legacy получила геймплейный трейлер с датой релиза 6 ч.
Google заказала у Intel производство 3 млн ИИ-процессоров TPU 4 ч.
Акции TSMC и других азиатских техногигантов массово дешевеют вслед за американскими 6 ч.
Россиян не будут заставлять регистрировать аккаунты через отечественные e-mail — «Антифрод 2.0» доработали 7 ч.
Эстонская Skeleton Technologies представила суперконденсаторные ИБП GrapheneUPS для ИИ ЦОД 8 ч.
Российский рынок радиоэлектроники достиг 4 трлн рублей, но зависимость от импорта остаётся высокой 8 ч.
Стартап Windrose Electric, разрабатывающий электрические грузовики, представил концепцию ИИ ЦОД на колёсах 8 ч.
Репортаж со стенда Patriot на Computex 2026: память DDR5-9600, быстрые SSD и решения для эпохи ИИ 8 ч.
Репортаж со стенда PCCooler на Computex 2026: кулеры для самых мощных процессоров, модульный ПК и шаг к серверному охлаждению 10 ч.
Alphacool показала жидкостный кулер для Xbox и другие новинки на выставке Computex 2026 10 ч.
Репортаж со стенда Ocypus на Computex 2026: корпусные дисплеи, СЖО с обдувом VRM, кулеры с дисплеями и новые корпуса 10 ч.