Сегодня 11 марта 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Учёные с помощью ИИ в четыре раза ускорили преобразование мыслей в речь через нейроинтерфейс

В журнале Nature вышли две статьи, в которых учёные рассказали о новых методиках трансляции мыслей пациентов с поражениями мозга в речь и эмоции. Преобразование мозговой активности в текст и голосовое общение происходит с помощью алгоритма машинного обучения. Учёным удалось увеличить скорость преобразования почти в четыре раза с 18 слов в минуту до 78. Это ниже среднего для обычного разговора темпа в 160 слов в минуту, но кратно быстрее, чем было до этого.

 Источник изображений: Noah Berger/UCSF

Источник изображений: Noah Berger/UCSF

Нейродегенеративные заболевания, инсульты или травмы способны лишить человека речи разными способами, но один из них достаточно легко поддаётся исправлению. Современные технологии позволяют создать мостик между здоровыми участками мозга, отвечающими за речь или мысленное произношение, и мышцами, управляющими мимикой и позволяющими говорить. Естественный канал коммуникации между мышцами и мозгом может быть разорван в случае болезни или травмы, и тогда на помощь приходит интерфейс человек-компьютер и обучаемый алгоритм.

В мозг пациента встраивается датчик или несколько датчиков с электродами, входящими в зоны активности мозга человека, ответственные за произношение и речь (хотя учёные пока не до конца понимают, какие это зоны). В одном случае, например, учёные установили на речевую область сенсомоторной коры и на область верхней височной извилины женщины после инсульта 253 электрода. После болезни она не могла говорить и даже печатать.

В течение нескольких недель ИИ обучался на примере произношения пациенткой 1024 слов из специально подобранного словаря. Для упрощения работы алгоритма он разбивал все слова на фонемы, которых было всего 39. Затем словарный запас женщины был расширен до 125 тыс. слов. Машинный алгоритм смог распознавать мысленное произношение женщины с ошибками на уровне 25 %, но со скоростью до 78 слов в минуту.

Алгоритм также научили распознавать эмоции пациентки — горе, радость, удивление. Наконец, используя старую видеозапись женщины, учёные создали её компьютерный образ — аватар — и заставили его транслировать текстовые сообщения в голосовые. По сути, они вернули пациентке возможность разговаривать.

Сегодня подобные процедуры восстановления сопряжены с длительным обучением ИИ и необходимостью быть постоянно подключённым к компьютеру. Учёные из Калифорнийского университета в Сан-Франциско (UCSF) и Калифорнийского университета в Беркли, которые реализовали представленную методику, теперь работают над беспроводными вариантами транслятора. Когда-нибудь это повысит социальную вовлечённость людей с подобными медицинскими проблемами.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Эксклюзивные анонсы, жаркие кибертурниры, невероятный косплей»: первые подробности российской выставки игр и технологий РЭД ЭКСПО 2025 2 мин.
Загадочная Silent Hill f скоро выйдет из тени — Konami подтвердила новую презентацию Silent Hill Transmission 2 ч.
«Впечатляет и удручает одновременно»: в открытый доступ попала демонстрация прототипа ИИ-версии Элой из Horizon Forbidden West 3 ч.
ЕС вот-вот оштрафует Apple и Meta за нарушение закона «О цифровых рынках» 4 ч.
GSC Game World рассказала, чего ждать от сюжетных дополнений к S.T.A.L.K.E.R. 2: Heart of Chornobyl 4 ч.
Microsoft отметит 50-летие презентацией новинок с потребительским ИИ 4 ч.
«Базис» первым в России реализовал управление репликацией и снапшотами для СХД TATLIN.UNIFIED Gen2 4 ч.
Надёжный инсайдер раскрыл дату выхода Indiana Jones and the Great Circle на PS5 5 ч.
Илон Маск сообщил о масштабной атаке на X, которая привела к сбоям в работе соцсети 15 ч.
Для Stardew Valley вышел мод Baldur’s Village с персонажами из Baldur’s Gate 3 — Свен Винке одобряет 17 ч.