Сегодня 23 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Apple научила ИИ строить 3D-сцены по одному фото — быстро и без домыслов

Apple опубликовала исследование под названием «Чёткий монокулярный синтез изображения менее чем за секунду», в котором подробно описала, как обучила модель искусственного интеллекта выстраивать трёхмерные сцены по одному плоскому изображению, обеспечивая соответствующие реальным условиям расстояния и масштаб.

 Источник изображения: x.com/timd_ca

Источник изображения: x.com/timd_ca

Задача модели ИИ — предсказывать трёхмерное представление сцены, которое отрисовывается с близлежащих точек обзора. Вместо привычных жёстких 3D-моделей сцена выстраивается из трёхмерных представлений функции Гаусса — небольших размытых пятен цвета и света, расположенных в пространстве. Объединив несколько миллионов таких пятен, можно воссоздать конкретное изображение, которое выглядит аналогично с той же точки обзора. Обычно для достижения этого результата требуются несколько десятков, если не сотен изображений, снятых с разных ракурсов — созданная Apple модель SHARP предсказывает полное трёхмерное представление с помощью гауссовской развёртки всего по одной фотографии и всего за один проход нейросети.

Чтобы добиться такого результата, инженеры Apple обучили SHARP на большом объёме синтетических и реальных данных, благодаря чему модель изучила общие закономерности глубины и геометрии в различных сценах. Получив новую фотографию, она оценивает глубину, уточняет её, используя имеющиеся знания, а затем составляет прогноз положения и внешнего вида трёхмерных «колоколов Гаусса» за один проход. Но есть у этого метода и слабое место: SHARP действительно в точности отображает близлежащие ракурсы, но не дорисовывает невидимые части сцены. То есть пользователь не сможет далеко отойти от точки обзора, с которой был сделан снимок.

За счёт этого исследователи Apple добились достаточно высокой скорости работы модели, которая получает результат менее чем за секунду с высокой стабильностью. Исходный код SHARP компания опубликовала на GitHub. Интересно, что в одном из примеров источниками трёхмерных моделей стали не статические изображения, а видеофайлы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Apple выпустила внеплановые обновления iOS 26.4.2 и iPadOS 26.4.2, устранив уязвимость хранения удалённых уведомлений 2 ч.
Microsoft объявила о партнёрстве между Xbox и Discord, но скрыла детали 9 ч.
Google начала рекламировать поумневшую Apple Siri — в её основу ляжет ИИ Gemini 9 ч.
Tides of Tomorrow уже в продаже: асинхронное приключение от авторов Road 96, где игрок расплачивается за ошибки своих предшественников 9 ч.
Tencent и Alibaba готовы инвестировать в DeepSeek — стартап уже оценивается в более чем $20 млрд 11 ч.
В Steam и на консолях стартовала закрытая «бета» амбициозного ролевого боевика The Expanse: Osiris Reborn в духе Mass Effect — 35 минут геймплея 13 ч.
Первая за 25 лет новая игра о приключениях разумного дельфина Экко войдёт в сборник Ecco the Dolphin: Complete — подробности «правильного ремастера» 13 ч.
«Google Карты» скоро получат мощную порцию искусственного интеллекта 15 ч.
Паранормальный экшен Control теперь доступен на iPhone и iPad — с переработанным управлением и не только 15 ч.
В популярном ИИ-протоколе нашли критическую уязвимость — отвечающая за него Anthropic ничего исправлять не будет 15 ч.
JEDEC анонсировала LPDDR6 с плотностью до 512 Гбайт и два новых стандарта SOCAMM2 и PIM для ЦОД 31 мин.
SK hynix смогла по итогам первого квартала утроить выручку и увеличить операционную прибыль в пять раз 2 ч.
Для обучения и инференса — Google анонсировала ИИ-ускорители TPU 8t и TPU 8i 6 ч.
Новая статья: Да воссияет кремний 7 ч.
Новый великий космический телескоп NASA «Роман» прошёл основные испытания — до запуска меньше пяти месяцев 10 ч.
BMW представила флагманскую «семёрку» на платформе Neue Klasse — спорный стиль, много экранов и «скрытые технологии» 11 ч.
Google представила пару ИИ-чипов TPU 8 с упором на эффективность и комплексный ИИ-сервис Workspace Intelligence 11 ч.
Начались продажи флагманского процессора Ryzen 9 9950X3D2 Dual Edition с двойным 3D V-Cache за $899 11 ч.
Meta подала заявку на расширение кампуса в Эль-Пасо и анонсировала 28-й по счёту дата-центр в США — в Талсе 12 ч.
Стартап Миры Мурати закупил у Google мощности для обучения ИИ на несколько миллиардов 15 ч.