Сегодня 30 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Stability AI выпустил ИИ-генератор изображений Stable Diffusion XL 1.0, который может работать на более «простом» вычислительном оборудовании

ИИ-стартап Stability AI выпустил новую версию своей флагманской модели преобразования текста в изображение Stable Diffusion XL 1.0 (SDXL 1.0) с открытым исходным кодом, которую он позиционирует как свою «самую продвинутую» модель на сегодняшний день.

 Источник изображения: Pixabay

Источник изображения: Pixabay

По словам Stability, SDXL 1.0, доступная на GitHub в дополнение к API Stability и потребительским приложениям Clipdrop и DreamStudio, обеспечивает «более яркие» и «точные» цвета и лучшую контрастность, тени и освещение по сравнению с предыдущей версией.

Джо Пенна (Joe Penna), руководитель отдела прикладного машинного обучения Stability AI, сообщил в интервью TechCrunch, что SDXL 1.0, содержащая 3,5 млрд параметров, может выдавать изображения с разрешением 1 мегапиксель «за секунды» с различными соотношениями сторон.

Модель предыдущего поколения Stable Diffusion XL 0.9 также могла создавать изображения с высоким разрешением, но для её запуска требовалось больше вычислительной мощности. Как отметил ресурс SiliconANGLE, открытый исходный код наряду с возможностью работать на относительно простом оборудовании делают SDXL 1.0 гораздо более доступной, чем конкурирующие модели создания изображений.

«SDXL 1.0 — кастомизируемая и готова к тонкой настройке в соответствии с концепциями и стилями, — рассказал Пенна. — Она также проста в использовании, обладает способностью создавать сложные проекты с базовыми запросами на обработку естественного языка».

Кроме того, SDXL 1.0 получила улучшения в области генерации текста. В то время как даже у многих лучших моделей преобразования текста в изображение наблюдаются проблемы с генерацией изображения с разборчивыми логотипами, не говоря уже о каллиграфии или шрифтах, SDXL 1.0 способна на «продвинутое» генерирование текста и обеспечение его разборчивости, говорит Пенна.

SDXL 1.0 имеет функции inpainting, позволяющую восстанавливать недостающие части изображения, outpainting (расширение существующих изображений) и подсказки «изображение-к-изображению», позволяющую после ввода изображения добавлять несколько текстовых подсказок для создания более подробных вариантов этого изображения. Кроме того, модель «понимает» сложные инструкции, состоящие из нескольких частей, которые даются в коротких подсказках, тогда как в предыдущих моделях Stable Diffusion требовались более длинные текстовые подсказки.

Тренировочный набор SDXL 1.0 также включает в себя работы художников, протестовавших против использования компаниями, включая Stability AI, их работ в качестве обучающих данных для генеративных моделей ИИ. Stability AI утверждает, что она защищена от юридической ответственности доктриной добросовестного использования, по крайней мере, в США. Хотя это не помешало Getty Images подать в суд на Stability AI с обвинением в незаконном использовании изображений сервиса для обучения своей генеративной нейросети.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Смута» получила первые улучшения боевой системы и исправления ошибок, которые «делали очень больно игрокам» 8 ч.
Activision отсудила у создателей читов для Call of Duty ещё 14 миллионов долларов, но не всё так просто 9 ч.
ЕС учредил орган, который будет следить за безопасным развитием ИИ 11 ч.
Кошачий ролевой экшен Kristala с духом Dark Souls ворвётся в ранний доступ Steam на следующей неделе — дата выхода и новый трейлер 11 ч.
Интернет-архив Wayback Machine подвергся мощной и продолжительной кибератаке 12 ч.
Sony всё-таки подтвердила майский выпуск State of Play — где и когда смотреть, что могут показать 12 ч.
PayPal добавила стейблкоин PYUSD в популярный среди мемкоинов блокчейн Solana 12 ч.
В Windows появится магазин Android-приложений от Tencent 14 ч.
В сентябре TikTok оспорит свою блокировку в суде США 14 ч.
Суд отправил в тюрьму на 7,5 лет топ-менеджера разорившейся криптобиржи FTX 14 ч.
Новая статья: Обзор ноутбука AORUS 16X 9KG: перед таким экраном играть — одно удовольствие 7 ч.
Cadillac представила Optiq — роскошный электрический кроссовер по цене от $54 000 7 ч.
TeamGroup представила модули памяти T-Create Expert AI LPDDR5X CAMM2 со скоростью до 7200 МТ/с 8 ч.
Конкурент Neuralink установил рекорд по числу электродов в мозге человека — 4096 штук на площади со спичечный коробок 8 ч.
Apple решит проблему конфиденциальности в облаке с помощью «Черного ящика» 8 ч.
Arm представила процессорные ядра Cortex-X925, Cortex-A725 и Cortex-A520, а также GPU Immortalis G925 — все для 3-нм чипов нового поколения 9 ч.
Verizon подключит обычные смартфоны к спутникам почти по всем США с помощью AST SpaceMobile 10 ч.
Lenovo планирует увеличить выручку в 2025 году благодаря ИИ 11 ч.
Google представила первые детские смарт-часы Fitbit Ace LTE с наградами за активности и тамагочи 11 ч.
Xiaomi ответит в суде за нарушение патентов на LTE-A 12 ч.