Сегодня 17 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

В Санкт-Петербурге разработали нейросеть, которая распознаёт речь по губам

В Санкт-Петербургском Федеральном исследовательском центре РАН (СПб ФИЦ РАН) создали приложение для смартфона, с помощью которого можно считывать речь пользователя в шумных местах по губам, что позволит повысить точность распознавания слов голосовыми помощниками в сложных условиях, пишет ТАСС.

 Источник изображения: Pixabay

Источник изображения: Pixabay

В пресс-службе СПб ФИЦ РАН отметили, что приложение можно будет использовать в широком перечне отраслей с применением голосовых команд — от сферы услуг до тяжёлой промышленности.

Как сообщается, в основе приложения лежит нейросетевая модель, способная распознавать по аудиовизуальным сигналам (видеозаписям, сопровождающимися звуком) несколько сотен наиболее распространённых команд и автоматически определять, какой вид данных обеспечивает максимальную точность — видео или звук, или оба сразу.

«Исследователи Санкт-Петербургского Федерального исследовательского центра РАН научились при помощи алгоритмов искусственного интеллекта и компьютерного зрения распознавать речь человека по губам. Разработка поможет повысить точность работы голосовых помощников в шумных условиях, например, в людных местах или при управлении тяжёлой техникой», — рассказали в пресс-службе корреспонденту ТАСС.

Программа прошла тестирование в одной из логистических компаний в России. Для этого приложение было установлено на смартфоны водителей шумных большегрузных автомобилей. Тестирование подтвердило тот факт, что совмещение двух видов считывания информации повышает эффективность работы алгоритмов — если при чтении по губам точность распознавания команд составила 60–80 %, то в сочетании со звуковым сигналом точность распознавания превышает 90 %.

«Мы предполагаем, что в будущем наше приложение может найти применение у пилотов самолётов и тяжёлой промышленной техники или для использования в интерактивных информационных киосках в торговых центрах и других местах массового скопления людей», — сообщил старший научный сотрудник лаборатории речевых и многомодальных интерфейсов СПб ФИЦ РАН Денис Иванько.

Также следует отметить, что на проведение разработки был выделен грант Российского научного фонда.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
3Logic локализует в России китайскую платформу Gitee и перенесёт 100 тыс. open source проектов 13 мин.
Ghost of Tsushima наконец вышла на ПК, а оверлей PlayStation звёзд с неба не хватает 2 ч.
Microsoft PC Manager начал настоятельно рекомендовать поисковик Bing 3 ч.
В TikTok появились 60-минутные видео, но загружать их могут не все 3 ч.
Масштабная мегараспродажа Epic Games Store началась с раздачи полного издания Dragon Age: Inquisition 3 ч.
Manor Lords превзошла «самые смелые» ожидания издателя — игра достигла новой вершины продаж 4 ч.
Датамайнер поделился подробностями следующей игры Valve — это героический PvP-шутер в мире фэнтезийного стимпанка 4 ч.
Ubisoft раскрыла стратегию на ближайшее будущее, но Watch Dogs в нём места не нашлось 5 ч.
Fallout 4 оказалась самой продаваемой игрой в Европе за апрель — спустя почти девять лет после релиза 7 ч.
Meta грозят огромные штрафы: ЕС расследует, как обеспечивается безопасность детей в Facebook и Instagram 8 ч.
Новая статья: Обзор 57-дюймового игрового Mini-LED VA-монитора Samsung Odyssey Neo G95NC: с запасом на будущее 7 мин.
Шестое поколение ускорителей Google TPU v6 готово к обучению ИИ-моделей следующего поколения 43 мин.
TSMC запустит массовое производство по оптимизированному 3-нм техпроцессу N3P уже в этом году 3 ч.
В Индии испытали напечатанный на 3D-принтере ракетный двигатель 5 ч.
Сверхпрочный смартфон IIIF150 Air2 Ultra получил тонкий корпус, чип Dimensity 7050 и 64-Мп камеру с ночным видением 5 ч.
Чип Apple M4 в iPad Pro протестировали под жидким азотом — на 28 % быстрее M3 Max, но только в одноядерном тесте 5 ч.
«Хаббл» сфотографировал космический невод — линзовидную галактику NGC 4753 7 ч.
Представлен смартфон Meizu 21 Note с чипом Snapdragon 8 Gen 2, Wi-Fi 7 и ценой $360 7 ч.
Fujifilm представила GFX 100S II — среднеформатную беззеркалку с ИИ за $4999 7 ч.
G.Skill представила комплекты памяти Ripjaws M5 RGB со скоростью до 6400 МТ/с и объёмом до 96 Гбайт 7 ч.