Google выпустила «ИИ-фотошоп» — в Gemini встроили модель nano-banana, которая может точно редактировать картинки
Читать в полной версииGoogle обновила чат-бот Gemini, добавив в него основанную на алгоритмах искусственного интеллекта функцию для обработки изображений — она позволяет с высокой точностью контролировать процесс редактирования фотографий. Поисковый гигант стремится выйти на уровень средств обработки изображений от OpenAI и привлечь аудиторию ChatGPT.
Источник изображения: blog.google
Обновление Gemini 2.5 Flash Image доступно всем пользователям приложения Gemini, а также разработчикам на платформах Gemini API, Google AI Studio и Vertex AI. Новый редактор обрабатывает изображения с высокой точностью на основе запросов простым естественным языком. Он сохраняет единообразие лиц, животных и другие детали, что не всегда под силу конкурирующим инструментам: например, если попросить ChatGPT или xAI Grok изменить на фотографии цвет чьей-то рубашки, на выходе можно получить искажённое лицо или изменения на фоне. Google Gemini 2.5 Flash Image уже завоевала признание пользователей — компания открыла доступ к ней на платформе LMArena под названием «nano-banana».
Это не отдельная модель ИИ, а встроенная функциональность существующей Gemini 2.5 Flash AI. «Мы по-настоящему повысили качество работы с изображением, а также способность модели следовать инструкциям. Это обновление значительно улучшает процесс редактирования, делая его более органичным, а результаты работы модели — пригодными для любых целей», — рассказала ресурсу TechCrunch руководитель направления по генеративным визуальным моделям в Google DeepMind Николь Брихтова (Nicole Brichtova).
Модель обладает глубокими знаниями о мире и позволяет задавать в запросе несколько образцов — например, изображение дивана, гостиной и цветовой палитры можно совместить в едином ответе. «Мы хотим дать пользователям свободу творчества, чтобы они могли получить от моделей то, что хотят. Но это не похоже на что-то другое», — добавила госпожа Брихтова. Google приняла некоторые меры для борьбы с ростом числа дипфейков: на сгенерированные ИИ изображения добавляются визуальные водяные знаки и идентификаторы в метаданных.