Сегодня 08 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-модель DragGAN способна поворачивать головы и менять позы людей и животных на фото, словно в 3D

Исследователи из Института Макса Планка представили ИИ-модель DragGAN, которая позволяет манипулировать изображениями практически в режиме реального времени. Инструмент похож на функцию «Искривление» в Photoshop, но гораздо мощнее, так как пользователь не просто перемещает пиксели, а использует искусственный интеллект для повторного создания базового объекта. Более того он позволяет вращать изображения, как если бы они были в 3D-формате.

 Источник изображения: arxiv.org / Drag Your GAN

Источник изображения: arxiv.org / Drag Your GAN

DragGAN может не только изменять размеры объекта на изображении или превращать улыбку в хмурое выражение лица простым щелчком мыши, но и поворачивать его таким образом, как если бы это была 3D-модель. Например, можно изменить направление лица человека. Приведённые ниже видео взяты с сайта исследовательской группы. Полный текст исследовательской работы можно прочитать на сайте arXiv.

Как отмечает команда разработчиков, то, что действительно интересно в этой работе, это не манипуляция изображениями как таковая, а пользовательский интерфейс. Мы уже давно можем использовать инструменты ИИ, такие как GANs, для создания реалистичных изображений, но большинству методов не хватает гибкости и точности. Вы можете сказать генератору изображений ИИ: «Сделай изображение льва, наблюдающего за саванной», и получите его, но может оказаться, что лев сидит не совсем в той позе, которая вам нужна.

DragGAN предлагает решение этой проблемы. Интерфейс точно такой же, как и в традиционных редакторах изображений, но вместо того, чтобы просто размазывать существующие пиксели, модель создаёт объект заново. Исследователи пишут: «Наш подход не только может создавать окклюзию объектов, но и может деформировать их в соответствии с жёсткостью, например, при сгибании ноги лошади».

Пока это только демонстрация, которая не даёт оценить технологию полностью, но это ещё один пример того, как сделать манипуляции с изображениями с помощью ИИ более доступными.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Россияне смогут купить новые iPad Pro и Air в день старта мировых продаж, но цена достигнет 500 тыс. рублей 4 мин.
Американский ИИ-стартап Iozera намерен построить в Марокко 386-МВт дата-центр 54 мин.
Одноплатный компьютер GigaIPC PICO-N97A на базе Intel Alder Lake-N выполнен в формате Pico-ITX 2 ч.
Рурский университет предложил сохранять тепло ЦОД в заброшенной шахте, чтобы зимой использовать его для отопления домов 2 ч.
«Ситилинк» уволил сотни сотрудников на фоне падения выручки и прибыли 3 ч.
Чёрные дыры в ранней Вселенной развивались быстрее галактик, показали наблюдения «Джеймса Уэбба» 4 ч.
Анонсированы смартфоны ZTE Axon 60 и Axon 60 Lite на чипах Unisoc 4 ч.
Crucial первой начала продажи оперативной памяти LPCAMM2 LPDDR5X для ноутбуков — $210 за 32 Гбайт 5 ч.
Dell введёт цветовую дифференциацию сотрудников в зависимости от посещаемости офисов 5 ч.
Китай впервые запустил в космос новую модификацию ракеты «Чанчжэн-6» — она станет базой для коммерческих запусков 5 ч.