Сегодня 12 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Apple научила ИИ строить 3D-сцены по одному фото — быстро и без домыслов

Apple опубликовала исследование под названием «Чёткий монокулярный синтез изображения менее чем за секунду», в котором подробно описала, как обучила модель искусственного интеллекта выстраивать трёхмерные сцены по одному плоскому изображению, обеспечивая соответствующие реальным условиям расстояния и масштаб.

 Источник изображения: x.com/timd_ca

Источник изображения: x.com/timd_ca

Задача модели ИИ — предсказывать трёхмерное представление сцены, которое отрисовывается с близлежащих точек обзора. Вместо привычных жёстких 3D-моделей сцена выстраивается из трёхмерных представлений функции Гаусса — небольших размытых пятен цвета и света, расположенных в пространстве. Объединив несколько миллионов таких пятен, можно воссоздать конкретное изображение, которое выглядит аналогично с той же точки обзора. Обычно для достижения этого результата требуются несколько десятков, если не сотен изображений, снятых с разных ракурсов — созданная Apple модель SHARP предсказывает полное трёхмерное представление с помощью гауссовской развёртки всего по одной фотографии и всего за один проход нейросети.

Чтобы добиться такого результата, инженеры Apple обучили SHARP на большом объёме синтетических и реальных данных, благодаря чему модель изучила общие закономерности глубины и геометрии в различных сценах. Получив новую фотографию, она оценивает глубину, уточняет её, используя имеющиеся знания, а затем составляет прогноз положения и внешнего вида трёхмерных «колоколов Гаусса» за один проход. Но есть у этого метода и слабое место: SHARP действительно в точности отображает близлежащие ракурсы, но не дорисовывает невидимые части сцены. То есть пользователь не сможет далеко отойти от точки обзора, с которой был сделан снимок.

За счёт этого исследователи Apple добились достаточно высокой скорости работы модели, которая получает результат менее чем за секунду с высокой стабильностью. Исходный код SHARP компания опубликовала на GitHub. Интересно, что в одном из примеров источниками трёхмерных моделей стали не статические изображения, а видеофайлы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
WhatsApp расширил поддержку нескольких аккаунтов в приложении для iOS 36 мин.
«Вышитое» средневековое приключение Scarlet Deer Inn не заставит себя долго ждать — новый трейлер и дата выхода в Steam 57 мин.
Telegram получил клиенты для смарт-часов, поддержку форматирования у ботов, ИИ-модерацию в группах и многое другое 2 ч.
SemiAnalysis: подписная модель на ИИ-сервисы оказалась до семи раз дешевле доступа по API 3 ч.
В Steam пробралась демоверсия ретрофутуристического хоррора RetroSpace, вдохновлённого System Shock 13 ч.
Ролевой боевик Valor Mortis от создателей Ghostrunner не выйдет в один день с Control Resonant — объявлена новая дата релиза 15 ч.
«Абеляр, запускай игру»: для Warhammer 40,000: Rogue Trader вышло сюжетное дополнение «Неисчислимый музеон» и крупное обновление 1.6 15 ч.
«Некоторое количество перемещений рабочих мест»: Anthropic разработала план на случай, если ИИ оставит людей без работы 15 ч.
Gears of War: E-Day станет самой продолжительной игрой серии от The Coalition — новые подробности консольного эксклюзива Xbox 17 ч.
Deezer выпустил детектор ИИ-музыки для других стримингов 17 ч.