Сегодня 25 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → изображение
Быстрый переход

ИИ-художник «Шедеврум» научился перерисовывать фото пользователей в разных стилях

Мобильной приложение «Шедеврум» компании «Яндекс» теперь может перерисовывать изображения и фотографии пользователей в разных стилях, для чего задействована нейросеть YandexART. В приложении появились «Фильтрумы» — восемь креативных режимов, которые откроют дополнительные возможности для пользователей «Шедеврума».

 Источник изображений: yandex.ru

Источник изображений: yandex.ru

С помощью «Фильтрумов» можно стилизовать свои изображения и снимки под плюшевые или вязаные игрушки, кадры из мультфильмов, пиксельную графику, нарисованные кистью изображения, а также добавить на них атмосферу зимы, неоновое свечение и красочные цветы. Новая функция работает на основе нейросети YandexART, которая полностью перерисовывает исходное изображение в выбранном стиле, сохраняя при этом сходство с оригиналом.

Для взаимодействия с новым инструментом необходимо выбрать один из предлагаемых стилей, после чего остается лишь загрузить из памяти устройства исходное изображение. Обработанные нейросетью изображения можно публиковать в ленте «Шедеврума», а также скачивать, отправлять друзьям, делиться в чатах и др.

Также анонсировано скорое появление в «Шедевруме» новых креативных режимов и функции создания собственных режимов обработки изображений посредством текстовых запросов. Сгенерированными таким образом изображениями можно будет делиться как в самом приложении, так и в соцсетях и мессенджерах. Первый специальный режим называется «Ёлочная игрушка», он появился в приложении в конце прошлого года. С помощью этого режима пользователи сервиса сгенерировали более 4,5 млн новогодних украшений.

Представлен гигантский датчик изображения на 316 Мп — почти размером с блюдце

Компания STMicroelectronics выпустила самые большие в мире датчики изображений с разрешением примерно 18К × 18К пикселей. На одной 300-мм кремниевой пластине можно изготовить всего четыре таких сенсора. Это не процессор Cerebras размером с целую пластину, но всё равно — это кремниевый чип, который не может не впечатлить.

 Источник изображений: STMicroelectronics

Источник изображений: STMicroelectronics

Датчик разработан и производится для уникальной цифровой камеры Big Sky. Камера, в свою очередь, разрабатывалась для съёмок видеоматериалов для самого большого в мире сферического кинотеатра MSG Sphere в Лас-Вегасе. Благодаря огромному и производительному датчику камера снимает видео на 316-Мп сенсор со скоростью 120 кадров в секунду с производительностью 60 Гбайт/с.

Чтобы успевать записывать материал камера подключается к специальному накопителю по нескольким оптическим интерфейсам. С питанием инженерам тоже пришлось повозиться, ведь только один датчик потребляет 23 Вт.

 Спецификации датчика изображений

Спецификации датчика изображений

Внешние размеры датчика для камеры Big Sky составляют 8,31 × 9,92 см. Выше на снимке можно увидеть его сравнение с современным датчиком для цифровой камеры. Подобное решение нельзя назвать массовым, но мелкосерийное производство датчиков и камер наверняка будет продолжено.

В разработку и подготовку к производству датчиков было вложено немало средств, и они должны окупиться. Вместе с тем возникают опасения, что отснятый в высочайшем разрешении материал потребует ещё больше цифровых хранилищ, а ведь их можно использовать для чего-то более ценного, чем рядовые, в общем-то, шоу.

 Сферический кинотеатр MSG Sphere в Лас-Вегасе. Источник изображения:

Сферический кинотеатр MSG Sphere в Лас-Вегасе. Источник изображения: Sphere Entertainment

Инфракрасные датчики сделали безопасными для здоровья — токсичные вещества в них заменили квантовыми точками

Европейские учёные изобрели и испытали технологию производства не содержащих ядовитых веществ инфракрасных датчиков. До сих пор подобные датчики содержали ртуть, фосфор, свинец и другие вещества не совместимые со здоровьем человека. Открытие безопасных материалов позволит повсеместно внедрить инфракрасное зрение, что подтолкнёт производство, робототехнику и улучшит качество жизни людей.

 Источник изображения: ICFO

Источник изображения: ICFO

Исследователи из испанского Института фотонных наук (ICFO) совместно со специалистами из дочерней компании Qurv разработали новый тип квантовых точек, чувствительных к диапазону 1–2 мкм (SWIR, short wave infrared или коротковолновый инфракрасный диапазон). Квантовые точки называют квантовыми не только за то, что они работают на принципах квантовой физики.

Квант в оригинале — это порция чего-то. Квантовые точки — это «порции» полупроводников нанометрового размера, которые действуют как отдельный элемент. В случае квантовых точек в составе датчиков изображения они поглощают свет одной длины волны и/или генерируют свет другой длины волны. Чувствительные к инфракрасному диапазону квантовые точки улавливают свет в этом диапазоне, а излучают его в видимом.

Как вариант для изготовления массива квантовых точек используется технология осаждения или синтеза из коллоидных растворов. Традиционно прекурсоры для таких растворов создавались с использованием фосфина. Исследователи заменили это токсичное вещество безопасным соединением теллурида серебра (Ag2Te). Изготовленные таким образом квантовые точки использовали для создания SWIR-фотоприёмника. Опытный фотоприёмник продемонстрировал отличные характеристики в спектральном диапазоне от 350 до 1600 нм с линейным динамическим диапазоном, превышающим 118 дБ.

Затем учёные собрали полноценную матрицу на базе традиционных CMOS-элементов. Испытания матрицы показали, что всё работает без нареканий. Так, новые инфракрасные датчики помогли увидеть кремниевую пластину на просвет (кремний прозрачен для инфракрасных лучей), а также визуализировали изображение предметов в пластиковой бутылке с мутным раствором жидкости, которые не были видны для обычного взгляда.

Безопасные для здоровья и чувствительные к инфракрасному свету квантовые точки можно использовать повсеместно, уверены учёные. От нанесения на обычные оконные стёкла до систем машинного зрения и установки в смартфоны и гарнитуры. Они помогут видеть сквозь туман, снег и ночь, анализировать состав продуктов, помогать спасателям и медикам.

Sony займётся экспансией выпуска датчиков изображений с расчётом на Китай и новые сегменты рынка

Компания Huawei Technologies до введения жёстких американских санкций была одним из крупнейших покупателей датчиков изображений Sony, которые использовались в китайских смартфонах марок Huawei и Honor. Теперь Sony сосредоточена на обслуживании заказов Apple, но параллельно она хочет охватить и китайский рынок, а заодно освоить новые рыночные ниши, ради чего расширяет своё производство датчиков изображений.

 Источник изображения: Sony

Источник изображения: Sony

Об этом сообщает Nikkei Asian Review в контексте недавно состоявшегося мероприятия Sony, посвящённого завершению строительства дополнительных производственных мощностей по выпуску датчиков изображений в Нагасаки. Летом 2022 года здесь началось расширение производственных площадей, в итоге они были увеличены на 60 %. Одновременно Sony рассчитывает расширить производство датчиков изображений на предприятии, которое соседствует со строящимся в Кумамото заводом JASM по выпуску чипов, акционером которого Sony является в партнёрстве с TSMC и Denso. По сути, финансирование совместного предприятия JASM изначально входило в планы Sony именно с прицелом на расширение производства датчиков изображений.

Имеющихся профильных мощностей Sony едва хватает для удовлетворения спроса со стороны Apple, но с появлением дополнительных линий у японской компании появится возможность привлечь заказы со стороны китайских производителей смартфонов — Xiaomi и Oppo, прежде всего. В прошлом году для китайского рынка были представлены датчики изображений Sony Lytia. Компания также разрабатывает перспективные датчики изображений для смартфонов Apple, которые улучшат качество снимков в темноте.

Присматривается Sony и к новым сферам применения датчиков изображений. В секторе логистики, например, специальные камеры могут использоваться для слежения за перемещением грузового транспорта и работой грузчиков с целью выявления «узких мест» в бизнес-процессах. Камеры также позволят автоматизировать некоторые процессы в этой сфере.

Запущен обновлённый ИИ-художник Midjourney V6 — он научился писать

Состоялся выход альфа-версии Midjourney V6 — ИИ-генератора изображений. Среди наиболее примечательных нововведений разработчики отмечают более реалистичные и детализированные картинки, а также способность модели генерировать разборчивый текст внутри изображений.

 Источник изображения: twitter.com/OrctonAI

Источник изображения: twitter.com/OrctonAI

Midjourney V6 на самом деле является «третьей моделью, обученной с нуля на наших суперкластерах ИИ», и на её разработку ушли девять месяцев, пояснил глава компании Дэвид Хольц (David Holz). Подключение к обновлённой нейросети не происходит для всех пользователей по умолчанию — в чате Discord с ботом Midjourney необходимо перейти в режим настроек командой «/settings», после чего в раскрывающемся меню сверху выбрать «V6». В качестве альтернативы можно после каждого описания изображения добавлять параметр «-v 6».

 Источник изображения: twitter.com/Boris_Jov

Источник изображения: twitter.com/Boris_Jov

Господин Хольц обратил внимание на следующие нововведения: «гораздо более точное следование описаниям и более длинные описания; улучшенная согласованность и знания модели; улучшены механизмы подсказок и правок; некоторые возможности рисования текста — он указывается в кавычках, помочь могут параметры „--style raw” и низкие значения „--stylize”; улучшены средства масштабирования с „точным” и „творческим” режимами».

 Источник изображения: twitter.com/giffboake

Источник изображения: twitter.com/giffboake

Механизм создания описаний изображений в Midjourney полностью переработан: параметры вроде «фотореализм» или «4K» больше не работают, и пользователям придётся переучиваться. Разработчики советуют быть более откровенными в том, чего хотят пользователи. Так, если требуется фотореалистичное изображение, рекомендуется использовать параметр «--style raw». Следует также выбрать нужный баланс параметра «--stylize», значение которого по умолчанию равно «100». Чем меньше значение, тем буквальнее модель воспринимает команду, а с его увеличением растёт эстетический аспект изображения.

 Источник изображения: chrisperna / ***

Источник изображения: chrisperna / Instagram

Глава Midjourney подчеркнул, что V6 выпущена в рамках альфа-тестирования — её работа может со временем кардинально меняться, и зачастую без предварительного уведомления аудитории. С полноценным выходом модели, выразили надежду разработчики, «вы все почувствуете развитие чего-то более значительного, что глубоко переплетается с силой нашего коллективного воображения». Но пока в Midjourney V6 отсутствуют некоторые функции, которые есть в V5.2, в том числе панорамирование влево и вправо, а также уменьшение масштаба, но в последующих обновлениях они добавятся.

Samsung представила датчик изображения с глобальным затвором и ToF-сенсор со встроенным процессором — оба для XR-устройств и робототехники

Компания Samsung пополнила серию своих оптических сенсоров ISOCELL Vizion двумя новыми датчиками. Первый — это ToF-сенсор ISOCELL Vizion 63D, предназначенный для измерения расстояния до объектов, второй — датчик с технологией глобального затвора ISOCELL Vizion 931.

 Источник изображений: Samsung

Источник изображений: Samsung

Samsung ISOCELL Vizion 63D представляет собой первый в отрасли датчик со встроенным ISP для измерения глубины сцены, поэтому он может выполнять вычисления самостоятельно, не полагаясь на дополнительный внешний чип. Эта особенность позволяет снизить энергопотребление системы до 40 % по сравнению с предыдущим датчиком Vizion 33D.

Samsung ISOCELL Vizion 63D — это сенсор размером 1/6,4 дюйма с размером пикселей 3,5 мкм. Он может захватывать информацию о глубине с разрешением 320 × 240 пикселей со скоростью до 60 кадров в секунду, а также поддерживает режим 640 × 480 пикселей. Это непрямой датчик ToF, поэтому он измеряет фазовый переход между излучаемым и поступающим светом, что делает расчёты более точными.

Датчик поддерживает модели как заполняющего, так и точечного освещения, в первом случае обеспечивая высокое разрешение на небольшом расстоянии 5 м, а во втором — расширяя максимальный диапазон до 10 м за счёт снижения разрешения. В основе ISOCELL Vizion 63D используется технология обратного рассеивания (BST), которая делает его более чувствительным к используемому инфракрасному излучению.

Samsung ISOCELL Vizion 63D будет использоваться в сервисных и промышленных роботах, а также в XR-устройства и системах распознавания лиц. Область XR (то есть AR и VR) также является основным полем применения для другого датчика — ISOCELL Vizion 931.

Samsung ISOCELL Vizion 931 — это датчик изображения с глобальным затвором. Обычные датчики изображения считывают данные построчно. Однако в таком случае возможны ситуации, когда быстро движущийся объект в кадре будет смещаться между рядами и изображение получится искажённым. Возникает так называемый эффект скользящего затвора или роллинг-шаттер, как показано на примере ниже.

В отличие от обычных датчиков, ISOCELL Vizion 931 с технологией глобального затвора способен мгновенно запечатлеть всю сцену, обеспечивая четкое неискажённое изображение движущихся объектов. Благодаря этой характеристике он идеально подходит для отслеживания движения в устройствах XR, игровых системах, а также сервисных, логистических роботах и дронах.

ISOCELL Vizion 931 обладает разрешением VGA (640 × 640 пикселей) и соотношением сторон 1:1. В Samsung отмечают, что его можно использовать для распознавания радужной оболочки глаз, отслеживания глаз, а также распознавания лиц и жестов в устройствах отображения, например, в тех же XR-гарнитурах. В последнем случае, вероятно, потребуется использование нескольких датчиков, поэтому Samsung реализовала возможность объединения нескольких сенсоров ISOCELL Vizion 931 в единую сеть посредством всего одного провода, что упрощает задачу по размещению проводки внутри устройств.

Компания Samsung уже приступила к поставкам образцов датчиков ISOCELL Vizion 63D и ISOCELL Vizion 931 OEM-производителям по всему миру.

Технология масштабирования изображения Apple MetalFX основана на AMD FSR

Документы компании Apple раскрыли подробности о технологии масштабирования MetalFX. Информация, содержащаяся в разделе Legal & Regulatory программных продуктов Apple, указывает, что в основе MetalFX используется технология масштабирования FidelityFX Super Resolution (FSR) компании AMD, пишет портал Notebook Check.

 Источник изображений: Apple

Источник изображений: Apple

Apple описывает MetalFX, как фреймворк, который интегрируется вместе с API Metal для повышения качества изображения из более низкого входного разрешения в более высокое выходное разрешение. При этом с задачей он справляется за меньшее время, чем GPU требуется отрисовать изображение в изначально высоком родном разрешении.

Иными словами, технология позволяет снизить уровень использования аппаратных ресурсов и одновременно повысить уровень игровой производительности. До недавнего времени предполагалось, что Apple разработала MetalFX полностью самостоятельно. Однако более внимательное знакомство с лицензионными соглашениями для программного обеспечения компании раскрыло, что в основе MetalFX используется технология AMD FSR.

В отличие от FSR-масштабирования MetalFX не имеет открытого исходного кода. Вероятно, Apple доработала технологию под свои нужды. Примечательно, что в состав MetalFX входит поддержка технологий временного и пространственного масштабирования, а также различные методы сглаживания, которые являются основными элементами технологии FSR от AMD. Также любопытно, что множество игр, которые уже вышли для устройств Apple или готовятся выйти, а это Death Stranding, No Man’s Sky, Resident Evil Village, Myst, Resident Evil 4, Assassin’s Creed Mirage, Lies of P, Baldur’s Gate 3 и The Medium, поддерживают в том числе AMD FSR.

Для разработчиков игр, которые портируют свои проекты с поддержкой AMD FSR на macOS, очевидно удобнее реализовывать в этих играх поддержку MetalFX, поскольку обе технологии очень похожи. Это также помогает объяснить, каким образом полноценная ПК-игра Resident Evil Village без проблем работает на мобильном процессоре A17 Pro смартфона iPhone 15 Pro.

Даже если Apple в итоге не платит никаких роялти за использование FidelityFX Super Resolution компании AMD, последняя всё равно может извлечь из этого пользу. Разработчики игр, зная, что FSR служит основной MetalFX, будут активнее внедрять поддержку FSR в свои проекты. Таким образом это поможет более быстрому распространению технологии AMD. С точки зрения Apple, чем больше разработчиков будут создавать игры с поддержкой FSR, тем больше шансов, что эти игры в итоге также окажутся и на её платформе.

Масштабирование FSR 3 теперь можно прикрутить к любой игре — AMD опубликовала исходный код технологии

Компания AMD сделала свою технологию интеллектуального масштабирования изображения в играх AMD FidelityFX Super Resolution 3 (FSR 3) открытой, опубликовав её исходный код под лицензией MIT. Теперь разработчики и энтузиасты могут её изучить и интегрировать в свои игры и другие разработки.

 Источник изображения: VideoCardz

Источник изображения: VideoCardz

На данный момент релиз открытого исходного кода включает поддержку технологии только для DirectX 12 и Unreal Engine 5. Поддержка Vulkan пока находится в разработке. Её планируют выпустить позднее.

 Источник изображения здесь и ниже: AMD

Источник изображения здесь и ниже: AMD

В состав FSR 3 входит компонент Frame Generation или генератор кадров. Сам по себе Frame Generation опционален. Его необязательно использовать в рамках интеграции FSR 3. Тем не менее компания опубликовала все необходимые DLL-библиотеки для его использования. И это первый случай, когда какая либо-компания публикует свою технологию генерации кадров открытым исходным кодом. Для игр, в которых уже есть поддержка FSR2, AMD рекомендует заменить FSR2 на версию 3.0.

AMD сообщает, что в версии FSR3 v3.0.3 были внесены улучшения качества и расширена поддержка мониторов с переменной частотой обновления (VRR) в логике управления кадрами.

Весь необходимый инструментарий, а также инструкции по интеграции FSR 3 можно найти на сайте GPU Open. Сам исходный код технологии также опубликован в репозитории на сайте GitHub.

Snapchat теперь позволяет дорисовывать фото с помощью ИИ, но только платным пользователям

Функции генеративного искусственного интеллекта появились в мессенджере Snapchat достаточно давно: пакет приложений My AI включает в себя чат-бот на базе ChatGPT, доступны ИИ-эффекты Dreams для селфи и многое другое. В последнем обновлении пользователи платной подписки Snapchat+ получили возможность дорисовывать фото при помощи ИИ.

 Источник изображения: snap.com

Источник изображения: snap.com

Дорисовка фотографий или «уменьшение масштаба» пригодится, если объект на снимке оказался слишком крупным — достаточно нажать кнопку обрезки в правом верхнем углу кадра, выбрать кнопку «Расширить» (Extend), и дальше приложение сделает всё самостоятельно. Обновлённый пакет My AI позволяет и просто генерировать изображения по текстовому описанию, Snapchat даже готов предложить свои варианты таких описаний.

Функция Dreams теперь помогает делать совместные фото с друзьями, не делая снимков в реальности — достаточно выбрать имя друга из списка контактов, и «снимок» можно опубликовать. Подписчикам Snapchat+ доступен пакет из восьми таких селфи Dreams, а пользователям бесплатной версии платформы предлагается воспользоваться этой функцией лишь один раз в тестовом режиме, после чего будет предложено либо оформить подписку, либо приобрести пакет за $0,99.

Внедрение функций ИИ в Snapchat приносит свои плоды: к сентябрю платную подписку оформили 5 млн человек, к настоящему моменту их число увеличилось до 7 млн, а «среднесрочная цель» Snapchat+ установлена на отметке в 10 млн. И это непростая задача, ведь сервисы Meta предлагают аналогичные возможности бесплатно.

Представлен ИИ-генератор изображений Imagine with Meta✴

Вслед за DALL-E, Midjourney и Stable Diffusion собственный отдельный генератор изображений представила компания Meta. В основу платформы, которая создаёт картинки по текстовым командам, легла обученная работе с графикой модель искусственного интеллекта Emu. Генератор получил название Imagine with Meta — он предлагает четыре картинки по одному запросу, но пока доступен только в США.

 Источник изображений: ***

Источник изображений: Meta

«Нам было приятно получать от людей отзывы о том, как они пользуются Imagine — функцией генерации изображений по тексту Meta AI для создания забавного и креативного контента в чатах. Сегодня мы расширяем доступ к Imagine за пределы чатов. Наша платформа обмена сообщениями предназначена для озорной двусторонней переписки, а теперь можно бесплатно генерировать изображения и в веб-интерфейсе», — рассказали в блоге компании.

Пока созданные Imagine with Meta картинки маркируются видимым водяным знаком, но в перспективе разработчик пообещал заменить его на невидимый — его будет генерировать ИИ, и обнаруживать его сможет тоже соответствующая модель. Такой водяной знак будет устойчив к традиционным манипуляциям с изображениями: к обрезке, изменению размера и цвета, снятию снимков экрана, сжатию, наложению шума, стикеров и многому другому, уточнили в Meta. В перспективе компания планирует внедрять такую маркировку во многие свои продукты с изображениями, созданными ИИ.

Пока служба Imagine with Meta доступна только для пользователей из США. Ранее Meta предложила пользователям Instagram и Facebook ИИ-генератор стикеров, но пользователи соцсетей начали использовать его для создания непристойностей — фильтры сервиса оказались недостаточно надёжными.

Amazon представила свой ИИ-генератор изображений Titan Image Generator

На конференции AWS re:Invent компания Amazon представила собственный ИИ-генератор изображений Titan Image Generator на платформе Bedrock. Он предназначен для создания изображений на основе текстовых запросов, а также предлагает поддержку различных дополнительных функций редактирования уже готовых изображений.

 Источник изображения: Amazon

Источник изображения: Amazon

По словам Amazon, инструмент способен генерировать «огромные объёмы реалистичных изображения студийного качества при низкой цене». Компания заявляет, что Titan Image Generator способен создавать изображения на основе сложных текстовых подсказок, одновременно обеспечивая при этом точность композиции генерируемых объектов на изображении с минимальными искажениями. По мнению разработчиков Amazon, это поможет «сократить объёмы создания вредного контента и смягчить распространение дезинформации».

Функции Titan Image Generator также позволяют редактировать отдельные элементы на изображении, удаляя или добавляя дополнительные детали. Например, инструмент позволяет заменить задний фон на изображении, а также заменить или удалить предмет, который может находиться в руках человека, изображенного в кадре. Использующиеся в составе Titan Image Generator ИИ-алгоритмы также могут расширять композицию изображения, добавляя дополнительные искусственные детали, аналогично функции Generative Expand в Photoshop.

В компании отмечают, что их ИИ-генератор изображений Titan накладывает на каждое созданное им изображение невидимый невооружённому глазу специальный водяной знак. По мнению компании, эта функция поможет «уменьшить распространение дезинформации, предоставив незаметный механизм для идентификации изображений, созданных ИИ, а также будет способствовать безопасному, надежному и прозрачному развитию технологий искусственного интеллекта». Amazon заявляет, что эти водяные знаки невозможно удалить или изменить.

Согласно опубликованному видео с демонстрацией работы Titan Image Generator, инструмент также может создавать описания изображений или релевантный текст для последующего использования в публикации в социальных сетях.

Paint в Windows 11 обзавёлся ИИ-генератором изображений на базе DALL-E 3

Microsoft представила долгожданную интеграцию генеративной нейросети DALL-E 3 с графическим редактором Paint в Windows 11. Благодаря этому пользователи программной платформы теперь смогут задействовать ИИ-генератор для создания изображений в Paint через функцию под названием Cocreator.

 Источник изображений: windowslatest.com

Источник изображений: windowslatest.com

В сентябре этого года упомянутое нововведение стало доступно участникам программы предварительной оценки на каналах Dev и Canary. Ранее в этом месяце возможность использования генеративной нейросети появилась на канале Release Preview, а теперь она становится доступна всем пользователям Windows 11.

Для генерации изображений достаточно открыть чистый лист Paint, выбрать функцию Cocreator в правой части панели инструментов и ввести текстовое описание изображения, которое алгоритм должен создать. Пользователи, которые только начинают знакомство с инструментами на базе нейросетей, могут ознакомиться с четырёхэтапным руководством прямо в приложении. С его помощью можно узнать порядок работы с алгоритмом и быстро приступить к генерации изображений.

Отмечается, что на данном этапе некоторые пользователи Windows 11 могут получить доступ к новой функции только через регистрацию в списке ожидания, поэтому до получения одобрения от вендора может пройти несколько дней. Пользователям, которые не видят кнопку Cocreator, рекомендуется убедиться в том, что они используют наиболее актуальную версию Paint, а также зарегистрироваться в списке ожидания.

«Сбер» запретил ИИ-художнику Kandinsky генерировать изображения с государственной символикой

«Сбер» скорректировал работу нейросети Kandinsky 2.1 после вызова сотрудников компании в прокуратуру из-за генерации изображения на флаге России. Об этом сообщил председатель правления Сбербанка Герман Греф на пленарной сессии форума Finopolis 2023.

 Источник изображений: sberbank.com

Источник изображений: sberbank.com

Греф рассказал, что вскоре после запуска ИИ-алгоритма сотрудников «Сбера» вызвали в прокуратуру. Поводом для этого стало обращение депутатов Госдумы после того, как нейросеть нарисовала на государственном флаге России купола собора Василия Блаженного. «Депутаты посчитали, что это издевательство над нашими национальными флагами. Соответственно, мы тут же остановились. Определённые вещи — символы государственные и прочее — она не генерирует уже», — сообщил Герман Греф.

Теперь алгоритм Kandinsky 2.1 по запросу пользователя выдаёт заранее заданное изображение без добавления к нему каких-либо иных элементов на его основе. «Но при этом она теряет в генерации», — отметил топ-менеджер Сбербанка, добавив, что в течение полугода «Сбер» корректировал настройки нейросети, из-за чего доступная широкому кругу пользователей версия алгоритма «потеряла 12 % в креативности и точности».

Господин Греф также сказал, что при развитии технологий на основе искусственного интеллекта компаниям требуются, прежде всего, «снисхождение и понимание» со стороны органов власти. Что касается разбирательства в прокуратуре, то оно закончилось без последствий для банка. «Хорошо, что прокурор современный попался, с чувством юмора: он всё изучил, слава богу, нас никуда не привлекли», — резюмировал Греф.

Суд отклонил большинство исков художниц против ИИ-генераторов изображений

Окружной судья в Калифорнии Уильям Оррик (William Orrick) отклонил иск, поданный тремя художницами против трёх платформ — ИИ-генераторов изображений Stability AI, DeviantArt и Midjourney. По версии истцов, администрации платформ нарушили их авторские права, использовав авторские произведения для обучения систем искусственного интеллекта.

 Источник изображения: succo / pixabay.com

Источник изображения: succo / pixabay.com

Судья вынес решение, что иск Сары Андерсен (Sarah Andersen), Келли МакКернан (Kelly McKernan) и Карлы Ортиз (Karla Ortiz) о нарушении авторских прав платформами DeviantArt и Midjourney является «неполноценным во многих отношениях» и не может быть обоснован. Но он допустил до рассмотрения жалобу о прямом нарушении прав Stability AI. Художницы утверждают, что компания Stability AI использовала принадлежащие им произведения, защищённые авторским правом, для обучения преобразующей текст в изображения системы ИИ, не получив согласия авторов.

По словам судьи Оррика, двое художниц-истцов, МакКернан и Ортиз, не зарегистрировали авторских прав ни на одно из своих произведений, а значит, у них не было достаточных оснований для предъявления претензий. Чтобы продолжить рассмотрение дела, он попросил их доказать, что создаваемые генераторами произведения по существу похожи на их собственные работы. Части иска против DeviantArt и Midjourney были отклонены, поскольку эти платформы не связаны с компанией Stability AI, которая стала основным объектом обвинений.

«Истцы надлежащим образом заявили о прямом нарушении авторских прав, основываясь на утверждениях, что Stability „загрузила или иным образом получила копии миллиардов защищённых авторским правом изображений без разрешения для создания Stable Diffusion”, использовала эти изображения для обучения Stable Diffusion и содействовала хранению этих изображений и включению их в Stable Diffusion в виде сжатых копий», — заявил судья Оррик. В своём решении он добавил, что даст истцам возможность внести изменения в своё заявление.

Поиск Google начал показывать происхождение и эволюцию изображений

Google начала внедрять новую функцию поисковой машины — появился блок «Об этом изображении» со справочной информацией и контекстом. Компания анонсировала функцию в мае, а теперь сделала её доступной для англоязычных пользователей по всему миру. Открыть блок можно, выбрав соответствующий пункт выпадающего меню в результатах поиска по картинкам.

 Источник изображения: blog.google

Источник изображения: blog.google

Блок «Об этом изображении» предназначен для того, чтобы продемонстрировать пользователю происхождение картинки, включая метаданные, если таковые доступны, а также контекст того, как изображение с течением времени описывалось новостными ресурсами и сайтами проверки фактов. Можно понять, когда картинка была впервые проиндексирована Google, а метаданные помогут разобраться, не создал ли её искусственный интеллект.

Функция появится и в программных продуктах Google: в браузере Chrome ей можно будет воспользоваться через щелчок правой кнопкой мыши или долгое нажатие на изображение, а в поисковом приложении Google — через жест пролистывания вверх. Эти функции пока разрабатываются и тестируются, а общедоступными они станут в ближайшие месяцы, уточнили в компании.

Google также расширила возможности функции Fact Check Explorer — она была запущена в рамках бета-тестирования минувшим летом, предлагая возможности для проверки фактов посредством загрузки изображения или его поиска по URL-адресу. Тестирование ещё продолжается, но в Google уже подготовили инструменты API, которые помогут автоматизировать работу по проверке фактов. Наконец, компания сообщила, что стала размещать больше информации об источниках данных в блоке «Об этом результате» при работе в режиме SGE (Search Generative Experience) — поиске с генеративным ИИ.


window-new
Soft
Hard
Тренды 🔥
Еврокомиссия вынудила TikTok приостановить программу вознаграждения за просмотр видео в Lite-версии приложения 5 ч.
«Будьте уверены — мы никуда не денемся», — TikTok прокомментировал закон о своём запрете в США 9 ч.
Apple представила малые языковые модели OpenELM, которые работают локально на смартфонах и ноутбуках 9 ч.
NVIDIA приобрела за $700 млн платформу оркестрации ИИ-нагрузок Run:ai 9 ч.
В ранний доступ Steam ворвался стильный кооперативный роглайк Rotwood от создателей Don’t Starve 10 ч.
Британские антимонопольщики заинтересовались инвестициями Microsoft и Amazon в ИИ-стартапы 10 ч.
NetEase раскрыла, когда начнётся закрытая «альфа» командного шутера Marvel Rivals в духе Overwatch 10 ч.
Не помешал бы Dark Souls: ведущий разработчик No Rest for the Wicked встал на защиту раннего доступа 11 ч.
Байден подписал закон о запрете TikTok в США, если ByteDance его не продаст 12 ч.
Вышла новая версия системы резервного копирования «Кибер Бэкап Облачный» с расширенной поддержкой Linux-платформ 13 ч.