Сегодня 26 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → imagen

ИИ-генератор Google Imagen 2 научился создавать 4-секундные анимированные изображения

Google сообщила, что генератор изображений Imagen 2 получил с очередным обновлением возможность создавать анимированные 4-секундные ролики. Модель также научилась по текстовым запросам редактировать готовые изображения, добавляя на них новые объекты или убирая их; а все новые картинки помечаются невидимыми цифровыми водяными знаками.

 Источник изображения: deepmind.google

Источник изображения: deepmind.google

На мероприятии Google Cloud Next разработчик сообщил, что Imagen 2 теперь генерирует 4-секундные анимированные ролики с разрешением 360 × 640 пикселей и частотой 24 кадра в секунду. Google также пообещала в этом направлении «постоянные усовершенствования». «Если взглянуть, вместо картинки объекта, например, статического изображения автомобиля, можно увидеть короткий ролик, например, движущейся машины. Многим организациям, особенно в таких областях как СМИ и реклама, это интересно, потому что это улучшает взаимодействие с пользователем», — пояснил гендиректор Google Cloud Томас Куриан (Thomas Kurian).

Генератор Imagen 2 создаёт изображения, используя различные ракурсы и движения камеры, «при этом сохраняя согласованность всей последовательности». Модель предлагает фильтры безопасности, которые предотвращают создание недопустимых материалов, и цифровые водяные знаки SynthID, позволяющие отслеживать созданные ИИ произведения. Imagen 2 также научился редактировать изображения, добавляя или удаляя элементы по текстовому запросу, и расширять границы изображения для увеличения обзора. Все эти возможности доступны на облачной платформе Vertex AI.

В популярных материалах для обучения нейросетей нашли изображения сексуального насилия над детьми

Исследователи из Стэнфорда обнаружили, что популярный набор данных LAION-5B, используемый для обучения моделей генеративного искусственного интеллекта, и применявшийся для Stable Diffusion и Google Imagen, включает в себя сотни ссылок на материалы сексуального насилия над детьми (Child Sexual Abuse Material — CSAM). Установлено, что LAION-5B включал по меньшей мере 1679 нелегальных изображений, взятых из постов в социальных сетях и популярных сайтов для взрослых.

 Источник изображения: LAION

Источник изображения: LAION

Исследователи начали изучение набора данных LAION в сентябре 2023 года, стремясь выяснить, используются ли там материалы с сексуальным насилием над детьми. С этой целью хеши или идентификаторы изображений отправлялись на платформы обнаружения CSAM, такие как PhotoDNA, и в Канадский центр защиты детей.

Исследователи из Стэнфорда отметили, что наличие CSAM в наборе данных для обучения ИИ не обязательно негативно повлияет на результаты обученных моделей. Тем не менее, всегда есть вероятность, что модель использует что-то из незаконных материалов при генерации изображений. «Наличие повторяющихся идентичных случаев CSAM также является проблематичным, особенно из-за увеличения вероятности получения изображений конкретных жертв», — говорится в отчёте.

LAION, некоммерческая организация, которая управляет набором данных, сообщила, что придерживается политики «нулевой терпимости» к вредоносному контенту и временно удалит наборы данных из Сети. Согласно сайту LAION, набор данных не является непосредственно репозиторием изображений. Он представляет собой результат индексирования ресурсов интернета и содержит ссылки на изображения и замещающий текст.

Stability AI сообщила, что внутренние правила компании запрещают неправомерное использование её платформ. Компания утверждает, что при обучении своих моделей на наборе данных LAION-5B, она использовала лишь часть материалов, которые отбирались в том числе и с учётом безопасности.

Эксперты полагают, что будет сложно полностью удалить проблемный контент из моделей ИИ, обученных на нём. Они рекомендуют подождать, чтобы модели, обученные на LAION-5B, такие как Stable Diffusion 1.5, «устарели, а распространение прекратилось там, где это возможно». Google выпустила новую версию Imagen, но не раскрыла, на каком наборе данных она обучалась.

Генеральные прокуроры США призвали Конгресс создать комитет для расследования влияния ИИ на эксплуатацию детей и запретить создание CSAM, генерируемого ИИ.

Google откроет доступ к своей нейросети Imagen для генерации картинок по описанию, но с ограничениями

Компания Google не спешит делать общедоступной свою новую нейросеть Imagen, которая позволяет создавать изображения по текстовому описанию, несмотря на то, что она работает не хуже аналогов, таких как DALL-E 2 от OpenAI или Stability от Stable Diffusion. Однако теперь Imagen станет доступна ограниченному числу пользователей приложения AI Test Kitchen, за счёт чего компания рассчитывает получить отзывы о работе нейросети.

 Источник изображений: Google

Источник изображений: Google

Напомним, Google запустила приложение AI Test Kitchen в начале этого года, чтобы с его помощью тестировать разные алгоритмы на базе нейросетей. В настоящее время пользователи приложения могут взаимодействовать с продвинутым чатботом, который построен на базе языковой модели LaMDA 2. В скором времени разработчики откроют доступ к Imagen, благодаря чему пользователи AI Test Kitchen смогут генерировать изображения по текстовому описанию.

Согласно имеющимся данным, Google предоставит два режима взаимодействия с нейросетью Imagen. Первый носит название City Dreamer и позволяет сгенерировать элементы города, созданного на выбранную пользователем тему. Исходя из заданной темы, Imagen воссоздаст здания, городские кварталы, аэропорты и другие объекты в виде изометрических моделей, подобных тем, что можно увидеть в игре SimCity.

В режиме Wobble пользователю предложат создать забавного монстра. Нужно выбрать из чего он состоит, например, из резины или глины, в затем придумать для него одежду. Imagen сформирует виртуального монстра по описанию пользователя и даст ему имя, после чего с ним можно будет взаимодействовать, заставляя танцевать.

Источник отмечает, что в нынешнем виде варианты взаимодействия с алгоритмом Imagen сильно ограничены, что особенно заметно на фоне некоторых других аналогов. Пользователи не смогут создавать какие угодно изображения. Однако сейчас цель Google в том, чтобы собрать первые отзывы о работе системы и том, каким образом пользователи её задействуют. Google также не раскрывает количество пользователей приложения AI Test Kitchen и не говорит ничего касательно будущего алгоритма Imagen и его возможной интеграции в какие-то общедоступные продукты компании.


window-new
Soft
Hard
Тренды 🔥
Инсайдер: Capcom отложила релиз Resident Evil 9, но в 2025 году может выйти другая игра серии 24 мин.
Звёздный отчёт Alphabet вдохновил инвесторов: у компании быстро растёт выручка и рентабельность 45 мин.
Microsoft получает всё больше выгоды от ИИ — компания показала сильный квартальный отчёт 3 ч.
Газировка с Copilot: Microsoft получила миллиардный контракт на обеспечение Coca-Cola облачными и ИИ-сервисами 3 ч.
Продюсер «Смуты» раскрыл, что добавят в игру с обновлениями, и подтвердил работу над продолжением 3 ч.
ИИ-приложение Google Gemini стало совместимо с Android 10 и Android 11 4 ч.
В США вернули сетевой нейтралитет 5 ч.
Alphabet объявила о первых в своей истории дивидендах, акции выросли в цене на 11,4 % 5 ч.
Младенец-экстрасенс против секретной корпорации: соавторы Before Your Eyes анонсировали сюжетное приключение Goodnight Universe 5 ч.
AMD выпустила драйвер с поддержкой игры Manor Lords и исправлением множества ошибок 11 ч.
IBM представила СХД FlashSystem 5300 и подписку Storage Assurance 15 мин.
Выручка Western Digital выросла на 23 %, но число проданных жёстких дисков продолжает падать 33 мин.
«Закон о чипах» сработал: строительство полупроводниковых заводов в США активизировалось в 15 раз 37 мин.
Blackview представила BL9000 Pro — неубиваемый смартфон со встроенным тепловизором 3 ч.
Meta увеличит инвестиции в развитие инфраструктуры ИИ и готовит крупнейшие капиталовложения в истории компании 3 ч.
HPE построила самый мощный в Польше суперкомпьютер Helios производительностью 35 Пфлопс 3 ч.
AWS построит в Индиане кампус ЦОД стоимостью $11 млрд 3 ч.
США усиливают давление на Японию, Южную Корею и Нидерланды, требуя ужесточить антикитайские санкции 3 ч.
Honor вышел в лидеры китайского рынка смартфонов, на втором месте — Huawei 4 ч.
Samsung заключила контракт с AMD на поставку HBM3E на сумму $3 млрд 4 ч.