Сегодня 24 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ּּּИИ поможет Meta✴ добиться реалистичного звука в виртуальных мирах

Компания Meta рассказала о работе над технологиями реалистичного звука для виртуальных миров — проект реализуется при содействии учёных Техасского университета в Остине. В рамках проекта были разработаны три модели искусственного интеллекта, доступные для сторонних разработчиков.

 Источник изображения: Rodger Shija / pixabay.com

Источник изображения: Rodger Shija / pixabay.com

Как пояснила Кристен Гаруман (Kristen Garuman), профессор информатики Техасского университета и директор по исследованиям Meta AI, дополненную и виртуальную реальность нельзя сводить только к визуальной составляющей — важную роль в оживлении мира играет звук. На его качество влияют различные факторы: геометрия помещения, размещённые в нём объекты, а также расстояние до источника. Поэтому родилась идея использовать для обработки звука алгоритмы искусственного интеллекта.

Первый алгоритм получил название AviTAR — это «модель визуально-акустического согласования», которая обеспечивает преобразование звука в соответствии со средой. Чтобы объяснить работу алгоритма, авторы проекта привели пример. Мать посетила выступление своего ребёнка и при помощи очков дополненной реальности записала его прямо из зрительного зала. Алгоритм приводится в действие, когда женщина хочет воспроизвести запись дома. Система сканирует помещение, учитывая расположенные в нём предметы интерьера, и воспроизводит запись таким образом, как будто юный артист выступает в том же зале.

Второй алгоритм получил название Visually-Informed Dereverberation. Он предназначается для удаления из записи эффекта реверберации — множественных эхо, возникающих при отражении звука от стен и других объектов. Возвращаясь к примеру с детским концертом, мать при воспроизведении записи дома не услышит ничего, кроме музыки.

Наконец, третья модель ИИ получила название VisualVoice — она отделяет голос человека от остальных источников звука. Например, если записать видео, на котором спорят два человека, алгоритм выделит один из голосов, заглушив все остальные. Как пояснили в Meta, для этого искусственному интеллекту необходимы визуальные подсказки — он должен «видеть», кто говорит, и на основе этой информации различать в общем потоке необходимые нюансы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google вновь отложила блокировку сторонних cookie в браузере Chrome 46 мин.
Microsoft продолжает продлевать лицензии на ПО клиентам из России 2 ч.
Еженедельный чарт Steam: No Rest for the Wicked стартовала в тройке лидеров, а Dota 2 вплотную приблизилась к Counter-Strike 2 10 ч.
Олдскульный шутер Phantom Fury наконец вышел в Steam, но первые отзывы настораживают 11 ч.
Руководитель поиска Google призвал сотрудников «действовать быстрее», потому что «всё изменилось» 13 ч.
Приближали как могли: военная стратегия Men of War II выйдет в памятный для серии «В тылу врага» день 13 ч.
Стратегия Songs of Conquest в духе «Героев Меча и Магии» вырвется из раннего доступа уже совсем скоро — разработчики объявили дату выхода 15 ч.
Звезда GTA V пролил свет на отменённое дополнение про агента Тревора 15 ч.
«Лаборатория Касперского» выпустила обновлённое решение Kaspersky Symphony XDR 2.0 16 ч.
Нейросеть Adobe Firefly упростила работу с ИИ-инструментами в Photoshop 17 ч.
Tesla начнёт применять роботов Optimus в конце года, а в продажу они поступят в следующем 50 мин.
Выручка Tesla упала на 9 %, максимально с 2012 года, но акции пошли в рост 2 ч.
В фирменном приложении Tesla появится функция вызова роботизированного такси 2 ч.
Tesla пообещала быстрее вывести на рынок новые модели электромобилей, но они будут не такими дешёвыми 5 ч.
Asus увеличила гарантию на консоли ROG Ally в ответ на массовые поломки кардридеров 9 ч.
Apple просчиталась с оценкой спроса на гарнитуру Vision Pro и вынуждена корректировать планы 9 ч.
Новая статья: Обзор смартфона Infinix NOTE 40: плоскость пассажира 9 ч.
LG начала выпуск двухрежимных OLED-панелей — они поддерживают 1080р/480 Гц и 4К/240 Гц 10 ч.
Смарт-очки Ray-Ban Meta получили поддержку видеосвязи, Apple Music и мультимодального ИИ 10 ч.
Учёные согнули беспроводной канал в терагерцовом диапазоне — слепых зон в 6G-сетях станет меньше 11 ч.