Сегодня 15 июня 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → панорамы

Intel Labs представила нейросеть для генерации панорамных изображений с 360-градусным обзором

Intel Labs в сотрудничестве с Blockade Labs представили латентную диффузионную ИИ-модель для создания панорамных трёхмерных изображений (LDM3D) с 360-градусным обзором, которая первой в отрасли обеспечивает отображение глубины сцены. LDM3D может произвести революцию в создании реалистичного визуального 3D-контента, приложениях метавселенной и цифровом опыте, найти применение в широком спектре отраслей — от развлечений и игр до архитектуры и дизайна.

 Источник изображения: Intel Labs

Источник изображения: Intel Labs

LDM3D была обучена на наборе данных, созданном из подмножества 10 000 образцов базы данных LAION-400M, которая содержит более 400 миллионов пар изображений и подписей к ним. Для отображения точной относительной глубины каждого пикселя была использована разработанная Intel Labs модель Dense Prediction Transformer (DPT). Набор данных LAION-400M создан, чтобы обеспечить возможность широкомасштабного тестирования модели для широкого круга исследователей и других заинтересованных сообществ.

Модель LDM3D обучалась на суперкомпьютере Intel AI на базе процессоров Intel Xeon и ускорителей Intel Habana Gaudi AI. Полученная модель и конвейер объединяют сгенерированное изображение и карту глубины для создания 360-градусных панорамных представлений.

Чтобы продемонстрировать потенциал LDM3D, исследователи разработали приложение DepthFusion, которое использует стандартные 2D-фотографии RGB и карты глубины для создания интерактивной 360-градусной панорамы. Для превращения текстовых подсказок в 3D-панорамы применяется язык визуального программирования TouchDesigner на основе узлов для интерактивного мультимедийного контента в реальном времени. Модель LDM3D объединяет изображение RGB и его карту глубины, что приводит к экономии памяти и ускорению работы.

Примеры панорамных изображений с 360-градусным обзором

«Технология генеративного ИИ направлена на расширение человеческого творчества и экономию времени. Однако большинство сегодняшних моделей ИИ ограничены созданием 2D-изображений. В отличие от них LDM3D позволяет пользователям генерировать изображение и карту глубины из заданной текстовой подсказки. Это обеспечивает более точную относительную глубину для каждого пикселя по сравнению со стандартными методами постобработки и экономит разработчикам значительное время при разработке сцен», — пояснил Васудев Лал (Vasudev Lal), научный сотрудник Intel Labs.

Это исследование может революционизировать взаимодействие с цифровым контентом, позволяя пользователям отображать текстовые подсказки ранее немыслимыми способами. Изображения и карты глубины, сгенерированные LDM3D, позволяют пользователям превратить текстовое описание безмятежного тропического пляжа, современного небоскрёба или научно-фантастической вселенной в детализированную панораму. Способность создавать карту глубины изображения может мгновенно повысить общий реализм и погружение, позволяя создавать инновационные приложения для различных отраслей, от развлечений и игр до дизайна интерьеров и каталогов недвижимости, а также виртуальных музеев и иммерсивной виртуальной реальности.

Внедрение LDM3D и DepthFusion прокладывает путь к дальнейшему развитию генеративного ИИ и компьютерного зрения. Intel продолжит исследования генеративного ИИ для расширения человеческих возможностей и создания экосистемы разработок в области ИИ с открытым исходным кодом, которая демократизирует доступ к этой технологии. LDM3D предоставляется с открытым исходным кодом через сообщество HuggingFace.

Perseverance сделал 2,5-гигапиксельный снимок — фото Марса с такой детализацией ещё не было

Американское космическое агентство NASA опубликовало самый детализированный снимок Марса за всю историю. Разрешение панорамного фото составило 2,5 гигапикселя — на нём запечатлены марсианский грунт, камни, скалы, небо и следы ровера Perseverance, с помощью которого и было получено изображение.

 Источник изображения: nasa.gov

Источник изображения: nasa.gov

Снимок был сделан в кратере Езеро, и специалисты NASA опубликовали краткий видеообзор подробнейшей марсианской панорамы, а член исследовательской группы Рэйчел Кроняк (Rachel Kronyak) в комментариях познакомила зрителей с достопримечательностями дельты реки, которая предположительно протекала здесь в древние времена. Госпожа Кроняк рассказала об осадочных породах, скалах, утёсах, показала следы марсохода и места забора проб.

Предыдущий рекорд по разрешению панорамного снимка поставил марсоход Curiosity в 2020 году — он получил 1,8-гигапиксельное изображение кратера Гейла. Новое 2,5-гигапиксельное фото было составлено из 1118 отдельных изображений, полученных системой камер Mastcam-Z, которые установлены на «голове» Perseverance. Снимки делались в период с 12 по 20 июня. Полная версия снимка имеет размер 3,85 Гбайт — скачать его с сайта NASA может любой желающий.

Дельта древней реки имеет большое значение для науки: специалисты NASA надеются, что Perseverance поможет ответить на вопрос, была ли когда-нибудь на Марсе жизнь, хотя бы микроорганизмы. Здесь аппарат собирает образцы, которые впоследствии будут доставлены на Землю для изучения.


window-new
Soft
Hard
Тренды 🔥
Intel выпустила драйвер с поддержкой Destiny 2: The Final Shape и Elden Ring Shadow of the Erdtree 12 мин.
Disney внедрил «рекламные игры» в стриминговые сервисы Hulu и ESPN 11 ч.
Meta перестала обучать ИИ на данных пользователей, но только из ЕС 11 ч.
Новая статья: XDefiant — зов долга, но не тот. Рецензия 12 ч.
В Сети нашли намёк на сроки выхода крупного эксклюзива Xbox — ролевой игры Clockwork Revolution, похожей на BioShock Infinite 12 ч.
The Talos Principle 2 получила «грандиозное» дополнение Road to Elysium со счастливой концовкой и сложнейшими загадками 13 ч.
Ubisoft превращается в «Абстерго»: платформу Assassin’s Creed Infinity переименовали в «Анимус» 14 ч.
Статистика назвала самые желанные игры с летних презентаций — Doom: The Dark Ages на втором месте 15 ч.
Bandai Namco анонсировала первый за несколько месяцев патч для Elden Ring и раскрыла системные требования Shadow of the Erdtree 16 ч.
«Базальт СПО» представила открытую библиотеку libdomain для управления службами каталогов 17 ч.
NASA без объяснений отложило посадку корабля Boeing Starliner ещё на четыре дня 14 мин.
Intel опровергла сообщение о найденной причине сбоев в Core i9 — расследование продолжается 24 мин.
Китайские учёные создали основу для идеальной энергонезависимой памяти без износа 42 мин.
На всех парах: Google запитает от геотермальной энергии ЦОД в Неваде 2 ч.
Intel поймала AMD на подтасовке результатов в ИИ-тестах EPYC против Xeon 11 ч.
Южнокорейские ИИ-стартапы Sapeon и Rebellions объединятся, чтобы вместе противостоять NVIDIA 13 ч.
Lian Li представила корпус O11 EVO RGB Automobili Lamborghini в стиле итальянских суперкаров 14 ч.
«Джеймс Уэбб» разглядел пару звёзд с газовыми шлейфами там, где учёные 50 лет видели лишь одну звезду 16 ч.
Марсоход Perseverance наткнулся на опасное поле валунов, но смог обогнуть его по руслу древней реки 17 ч.
Samsung Galaxy Z Fold6 показался на видео в форме макета — его сравнили с предшественником 17 ч.