Сегодня 19 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Apple представила ИИ для редактирования фото по текстовым командам

Научное подразделение Apple совместно с исследователями Калифорнийского университета в Санта-Барбаре выпустило мультимодальную модель искусственного интеллекта MGIE, предназначенную для редактирования изображений. Чтобы внести изменения в снимок, пользователю достаточно естественным языком описать, что он хочет получить на выходе.

 Источник изображений: Apple

Источник изображений: Apple

MGIE (Multimodal Large Language Model-Guided Image Editing) может применяться для задач различной сложности, связанных с редактированием изображений: можно добавлять различные объекты, убирать или изменять их. При получении команды модель интерпретирует слова пользователя, а затем «представляет себе», как будет выглядеть изменённая в соответствии с ними картинка.

В описывающей MGIE статье приводятся несколько примеров её работы. Когда модели дали на редактирование фото пиццы и предложили «сделать её более здоровой», та добавила овощную начинку. Далее ей предложили излишне тёмный снимок гепарда в пустыне и предложили «добавить контраста, имитируя больше света» — изображение стало ярче. MGIE доступна для бесплатного скачивания на GitHub, а опробовать её в работе можно на платформе Hugging Face Spaces. В Apple не уточнили, каковы планы компании в отношении модели вне исследовательского проекта.

Редактирование изображений поддерживается некоторыми ИИ-генераторами, включая OpenAI DALL-E 3; функции генеративного ИИ присутствуют и в Photoshop благодаря модели Adobe Firefly. Apple не позиционирует себя как крупного игрока в области ИИ в отличие от Microsoft, Meta или Google, но недавно гендиректор компании Тим Кук заявил, что в этом году производитель добавит на свои устройства новые функции ИИ. В минувшем декабре компания выпустила открытую платформу MLX для обучения ИИ-моделей на чипах Apple Silicon.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: South of Midnight — соткана по лекалам. Рецензия 5 ч.
Вежливость — это дорого: OpenAI тратит миллионы долларов на «спасибо» и «пожалуйста» в ChatGPT 6 ч.
Спустя восемь лет «беты» Escape from Tarkov взяла курс на версию 1.0 — план обновлений игры на 2025 год 7 ч.
ChatGPT научился использовать воспоминания о пользователе для персонализации веб-поиска 7 ч.
Создатели следующей Battlefield рассказали о новом «языке разрушения» и показали его в деле 8 ч.
Глава Microsoft Gaming Фил Спенсер намекнул на продолжение Indiana Jones and the Great Circle 9 ч.
Разработчики Everspace 2 решили снизить цену на дополнение Wrath of the Ancients, потому что «вокруг дорожает буквально всё» 10 ч.
Google обжалует «неблагоприятное» решение суда о признании её монополистом в интернет-рекламе 11 ч.
84 % россиян выходят в интернет каждый день, подсчитал Mediascope 11 ч.
Cloud.ru представил первый в России управляемый облачный сервис для инференса ИИ-моделей — Evolution ML Inference 13 ч.
Western Digital начала добывать редкоземельные и драгоценные металлы из жёстких дисков 8 ч.
HP отделалась выплатой $4 млн по иску о завышенных ценах и фиктивных скидках 11 ч.
Xiaomi представила компактный домашний проектор Redmi 3 Lite за $100 11 ч.
Nintendo Switch 2 избежала подорожания, несмотря на новые пошлины США — аксессуары тем же похвастаться не могут 11 ч.
Western Digital запустила в США масштабную программу извлечения редкоземельных элементов из HDD — уже переработано почти 23 т дисков Microsoft 12 ч.
Физики обнаружили аномальный эффект Холла в неожиданном месте 13 ч.
Из-за политики США европейские пользователи задумались об уходе из американских облаков 14 ч.
Продажи российского электромобиля Lada e-Largus выросли до одного экземпляра в первом квартале 14 ч.
Intel расследует падение производительности видеокарт Arc при работе со старыми CPU 14 ч.
Китайская EHang пообещала запустить сервис летающих такси по разумной цене до конца года 15 ч.