Сегодня 20 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Apple представила ИИ для редактирования фото по текстовым командам

Научное подразделение Apple совместно с исследователями Калифорнийского университета в Санта-Барбаре выпустило мультимодальную модель искусственного интеллекта MGIE, предназначенную для редактирования изображений. Чтобы внести изменения в снимок, пользователю достаточно естественным языком описать, что он хочет получить на выходе.

 Источник изображений: Apple

Источник изображений: Apple

MGIE (Multimodal Large Language Model-Guided Image Editing) может применяться для задач различной сложности, связанных с редактированием изображений: можно добавлять различные объекты, убирать или изменять их. При получении команды модель интерпретирует слова пользователя, а затем «представляет себе», как будет выглядеть изменённая в соответствии с ними картинка.

В описывающей MGIE статье приводятся несколько примеров её работы. Когда модели дали на редактирование фото пиццы и предложили «сделать её более здоровой», та добавила овощную начинку. Далее ей предложили излишне тёмный снимок гепарда в пустыне и предложили «добавить контраста, имитируя больше света» — изображение стало ярче. MGIE доступна для бесплатного скачивания на GitHub, а опробовать её в работе можно на платформе Hugging Face Spaces. В Apple не уточнили, каковы планы компании в отношении модели вне исследовательского проекта.

Редактирование изображений поддерживается некоторыми ИИ-генераторами, включая OpenAI DALL-E 3; функции генеративного ИИ присутствуют и в Photoshop благодаря модели Adobe Firefly. Apple не позиционирует себя как крупного игрока в области ИИ в отличие от Microsoft, Meta или Google, но недавно гендиректор компании Тим Кук заявил, что в этом году производитель добавит на свои устройства новые функции ИИ. В минувшем декабре компания выпустила открытую платформу MLX для обучения ИИ-моделей на чипах Apple Silicon.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Датамайнер показал взрывной финал сюжетной миссии из новой Battlefield — фанаты в восторге 2 ч.
Длительная работа с ИИ-инструментами ослабляет у людей когнитивные способности, выяснили учёные 3 ч.
Google давно использует контент YouTube для обучения ИИ и никогда это не скрывала 3 ч.
Релиз СУБД Tantor Postgres 17.5.0: доработки безопасности и аналитики, оптимизации для «1С» и прочие улучшения 3 ч.
WhatsApp не сможет запустить рекламу в Евросоюзе до следующего года 4 ч.
Дурову разрешили ездить из Франции в Дубай, но только на две недели 4 ч.
«Наконец-то Uncharted 5»: первый трейлер китайского AAA-боевика Blood Message впечатлил игроков 5 ч.
«Яндекс» встроит ИИ-рекомендации почти во все свои сервисы 5 ч.
С начала июня трафик Cloudflare в России сократился на 30 % — Роскомнадзор говорит о «проблемах на их стороне» 5 ч.
ИИ стал экзистенциальной угрозой для интернет-СМИ: посетителей на сайтах вытесняют роботы 5 ч.
AMD «поместит геймеров в центр событий», — в компании прокомментировали сотрудничество с Microsoft 47 мин.
В Германии протестировали рядовую оптическую магистраль на рекордную дальность квантовой связи 2 ч.
Смартфон-раскладушка Samsung Galaxy Z Flip 7 в чёрном и синем цветах предстал на рендерах 2 ч.
AMD готовит шестиядерный Ryzen 5 9600X3D с дополнительной кеш-памятью 3D V-Cache 2 ч.
Японцы изменили атомарную структуру оксида марганца и сделали суперкатализатор для производства водорода 2 ч.
Изображения несуразных накладных наушников Nothing Headphone (1) утекли в интернет 3 ч.
Дизайн и некоторые характеристики смартфона Samsung Galaxy Z Fold 7 раскрыты до анонса 3 ч.
«Мегафон» заканчивает строительство 5-МВт ЦОД в Новосибирске 3 ч.
Kioxia анонсировала 61,44-Тбайт SSD CD9P для ИИ-серверов с PCIe 5.0 4 ч.
Softbank вместе с Nvidia и TSMC предлагает построить мини-Шэньчжэнь в Аризоне за $1 трлн 4 ч.