Новости Software

ּּּИИ поможет Meta* добиться реалистичного звука в виртуальных мирах

Компания Meta* рассказала о работе над технологиями реалистичного звука для виртуальных миров — проект реализуется при содействии учёных Техасского университета в Остине. В рамках проекта были разработаны три модели искусственного интеллекта, доступные для сторонних разработчиков.

 Источник изображения: Rodger Shija / pixabay.com

Источник изображения: Rodger Shija / pixabay.com

Как пояснила Кристен Гаруман (Kristen Garuman), профессор информатики Техасского университета и директор по исследованиям Meta* AI, дополненную и виртуальную реальность нельзя сводить только к визуальной составляющей — важную роль в оживлении мира играет звук. На его качество влияют различные факторы: геометрия помещения, размещённые в нём объекты, а также расстояние до источника. Поэтому родилась идея использовать для обработки звука алгоритмы искусственного интеллекта.

Первый алгоритм получил название AviTAR — это «модель визуально-акустического согласования», которая обеспечивает преобразование звука в соответствии со средой. Чтобы объяснить работу алгоритма, авторы проекта привели пример. Мать посетила выступление своего ребёнка и при помощи очков дополненной реальности записала его прямо из зрительного зала. Алгоритм приводится в действие, когда женщина хочет воспроизвести запись дома. Система сканирует помещение, учитывая расположенные в нём предметы интерьера, и воспроизводит запись таким образом, как будто юный артист выступает в том же зале.

Второй алгоритм получил название Visually-Informed Dereverberation. Он предназначается для удаления из записи эффекта реверберации — множественных эхо, возникающих при отражении звука от стен и других объектов. Возвращаясь к примеру с детским концертом, мать при воспроизведении записи дома не услышит ничего, кроме музыки.

Наконец, третья модель ИИ получила название VisualVoice — она отделяет голос человека от остальных источников звука. Например, если записать видео, на котором спорят два человека, алгоритм выделит один из голосов, заглушив все остальные. Как пояснили в Meta*, для этого искусственному интеллекту необходимы визуальные подсказки — он должен «видеть», кто говорит, и на основе этой информации различать в общем потоке необходимые нюансы.


* Внесена в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Volkswagen начала приём заказов на новое поколение электромобиля ID.3 со сроком ожидания один год 3 ч.
«Росатом», Delta Computers и Positive Technologies создали отечественный комплекс киберзащиты 11 ч.
EK Water Blocks представила 120-мм и 140-мм вентиляторы EK-Loop Fan FPT для радиаторов СЖО 12 ч.
Учёные получили суперкомпьютер для поиска техногенных сигналов инопланетной жизни 15 ч.
KDDI ввела в эксплуатацию первую мобильную вышку на базе сети Starlink 15 ч.
PowerColor представила массивные видеокарты Radeon RX 7900 XTX Hellhound и RX 7900 XT Hellhound 15 ч.
Тайваньские ODM-производители серверов переносят мощности за пределы Китая 15 ч.
Graphcore представила ИИ-ускоритель C600 PCIe на чипе Colossus Mk2 GC200, предназначенный для Китая и Сингапура 15 ч.
GeForce RTX 3060 с 8 Гбайт памяти оказалась на 17-18 % медленнее в играх, чем оригинальная версия с 12 Гбайт 16 ч.
Hyundai заняла 9 % рынка электромобилей США — это второе место после Tesla, у которой 65 % 18 ч.