Сегодня 20 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Учёные с помощью ИИ в четыре раза ускорили преобразование мыслей в речь через нейроинтерфейс

В журнале Nature вышли две статьи, в которых учёные рассказали о новых методиках трансляции мыслей пациентов с поражениями мозга в речь и эмоции. Преобразование мозговой активности в текст и голосовое общение происходит с помощью алгоритма машинного обучения. Учёным удалось увеличить скорость преобразования почти в четыре раза с 18 слов в минуту до 78. Это ниже среднего для обычного разговора темпа в 160 слов в минуту, но кратно быстрее, чем было до этого.

 Источник изображений: Noah Berger/UCSF

Источник изображений: Noah Berger/UCSF

Нейродегенеративные заболевания, инсульты или травмы способны лишить человека речи разными способами, но один из них достаточно легко поддаётся исправлению. Современные технологии позволяют создать мостик между здоровыми участками мозга, отвечающими за речь или мысленное произношение, и мышцами, управляющими мимикой и позволяющими говорить. Естественный канал коммуникации между мышцами и мозгом может быть разорван в случае болезни или травмы, и тогда на помощь приходит интерфейс человек-компьютер и обучаемый алгоритм.

В мозг пациента встраивается датчик или несколько датчиков с электродами, входящими в зоны активности мозга человека, ответственные за произношение и речь (хотя учёные пока не до конца понимают, какие это зоны). В одном случае, например, учёные установили на речевую область сенсомоторной коры и на область верхней височной извилины женщины после инсульта 253 электрода. После болезни она не могла говорить и даже печатать.

В течение нескольких недель ИИ обучался на примере произношения пациенткой 1024 слов из специально подобранного словаря. Для упрощения работы алгоритма он разбивал все слова на фонемы, которых было всего 39. Затем словарный запас женщины был расширен до 125 тыс. слов. Машинный алгоритм смог распознавать мысленное произношение женщины с ошибками на уровне 25 %, но со скоростью до 78 слов в минуту.

Алгоритм также научили распознавать эмоции пациентки — горе, радость, удивление. Наконец, используя старую видеозапись женщины, учёные создали её компьютерный образ — аватар — и заставили его транслировать текстовые сообщения в голосовые. По сути, они вернули пациентке возможность разговаривать.

Сегодня подобные процедуры восстановления сопряжены с длительным обучением ИИ и необходимостью быть постоянно подключённым к компьютеру. Учёные из Калифорнийского университета в Сан-Франциско (UCSF) и Калифорнийского университета в Беркли, которые реализовали представленную методику, теперь работают над беспроводными вариантами транслятора. Когда-нибудь это повысит социальную вовлечённость людей с подобными медицинскими проблемами.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Трамп в третий раз отсрочил блокировку TikTok в США 4 мин.
Microsoft готова порвать с OpenAI, потому что компании не могут договориться о совместном будущем 7 мин.
Управлять данными, а не хранилищами: Pure Storage представила унифицированную облачную платформу Enterprise Data Cloud 25 мин.
На Apple подали в суд за публикацию мошеннического криптовалютного приложения в App Store 2 ч.
Death Stranding 2: On the Beach выйдет полностью на русском языке — «М.Видео-Эльдорадо» подтвердила цену игры в России 3 ч.
Крах VR-игр на консолях становится очевидным: Beat Saber перестанет получать новый контент 3 ч.
Психологический хоррор s.p.l.i.t от автора Buckshot Roulette отправит раскрывать секреты аморальной суперструктуры — дата выхода и геймплейный трейлер 4 ч.
Маск на пути к суперприложению: X запустит кошелёк и инвестиции уже в этом году 4 ч.
Playdead готовится подать в суд на сооснователя студии Дино Патти — он утверждает, что его хотят стереть из истории Limbo и Inside 5 ч.
Производитель гигантских ИИ-чипов Cerebras оказался втянут в скандал с криптомошенничеством 6 ч.
Новая статья: Обзор ASUS ProArt Display OLED PA32UCDM: профессиональный клон 19 мин.
Asus представила игровой монитор ROG Swift OLED PG32UCDMR с поддержкой 80-гигабитного DisplayPort 2.1a UHBR20 3 ч.
Nothing показала, чем заменит фирменную подсветку Glyph на смартфоне Phone (3) 4 ч.
ASRock представила «турбированную» видеокарту Radeon AI Pro R9700 Creator для профессионалов 4 ч.
Вторичный рынок завалило заблокированными за пиратство Nintendo Switch 2 5 ч.
ИИ потребляет чудовищные объёмы энергии — экологи бьют тревогу, хотя точные цифры не знает никто 8 ч.
Экзафлопсный суперкомпьютер Fugaku Next получит Arm-процессоры Fujitsu MONAKA-X 8 ч.
Беспилотные такси в городах России появятся не раньше 2030 года 9 ч.
Здесь ЦОД с ИИ, здесь Grok'ом пахнет: экоактивисты подали в суд на xAI за использование газовых турбин для суперкомпьютера Colossus 9 ч.
Космический шедевр — создано самое детальное и самое многоцветное изображение галактики 10 ч.