Сегодня 12 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Stability AI выпустил ИИ-генератор изображений Stable Diffusion XL 1.0, который может работать на более «простом» вычислительном оборудовании

ИИ-стартап Stability AI выпустил новую версию своей флагманской модели преобразования текста в изображение Stable Diffusion XL 1.0 (SDXL 1.0) с открытым исходным кодом, которую он позиционирует как свою «самую продвинутую» модель на сегодняшний день.

 Источник изображения: Pixabay

Источник изображения: Pixabay

По словам Stability, SDXL 1.0, доступная на GitHub в дополнение к API Stability и потребительским приложениям Clipdrop и DreamStudio, обеспечивает «более яркие» и «точные» цвета и лучшую контрастность, тени и освещение по сравнению с предыдущей версией.

Джо Пенна (Joe Penna), руководитель отдела прикладного машинного обучения Stability AI, сообщил в интервью TechCrunch, что SDXL 1.0, содержащая 3,5 млрд параметров, может выдавать изображения с разрешением 1 мегапиксель «за секунды» с различными соотношениями сторон.

Модель предыдущего поколения Stable Diffusion XL 0.9 также могла создавать изображения с высоким разрешением, но для её запуска требовалось больше вычислительной мощности. Как отметил ресурс SiliconANGLE, открытый исходный код наряду с возможностью работать на относительно простом оборудовании делают SDXL 1.0 гораздо более доступной, чем конкурирующие модели создания изображений.

«SDXL 1.0 — кастомизируемая и готова к тонкой настройке в соответствии с концепциями и стилями, — рассказал Пенна. — Она также проста в использовании, обладает способностью создавать сложные проекты с базовыми запросами на обработку естественного языка».

Кроме того, SDXL 1.0 получила улучшения в области генерации текста. В то время как даже у многих лучших моделей преобразования текста в изображение наблюдаются проблемы с генерацией изображения с разборчивыми логотипами, не говоря уже о каллиграфии или шрифтах, SDXL 1.0 способна на «продвинутое» генерирование текста и обеспечение его разборчивости, говорит Пенна.

SDXL 1.0 имеет функции inpainting, позволяющую восстанавливать недостающие части изображения, outpainting (расширение существующих изображений) и подсказки «изображение-к-изображению», позволяющую после ввода изображения добавлять несколько текстовых подсказок для создания более подробных вариантов этого изображения. Кроме того, модель «понимает» сложные инструкции, состоящие из нескольких частей, которые даются в коротких подсказках, тогда как в предыдущих моделях Stable Diffusion требовались более длинные текстовые подсказки.

Тренировочный набор SDXL 1.0 также включает в себя работы художников, протестовавших против использования компаниями, включая Stability AI, их работ в качестве обучающих данных для генеративных моделей ИИ. Stability AI утверждает, что она защищена от юридической ответственности доктриной добросовестного использования, по крайней мере, в США. Хотя это не помешало Getty Images подать в суд на Stability AI с обвинением в незаконном использовании изображений сервиса для обучения своей генеративной нейросети.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Вышла новая версия песочницы Kaspersky Research Sandbox 3.0 с расширенными возможностями для ИБ-специалистов 23 мин.
«Игра, которую невозможно создать в наше время»: издатель «Приключений капитана Блада» призвал не судить воскресший экшен по современным меркам 37 мин.
Смартфоны Honor 400 смогут анимировать фото с помощью ИИ-генератора от Google 2 ч.
Датамайнер рассекретил планы Rockstar на ремастеры GTA IV и Max Payne 3 2 ч.
Основатель Amazon вложит в бывший ИИ-проект «Яндекса» $72 млн 2 ч.
В 2025 году объем рынка коммерческих платформ контейнеризации вырастет на 30 % 3 ч.
Разработчик-одиночка выпустит игру Odd Dorable, сделанную из рисунков своей четырёхлетней дочери 5 ч.
Российскому национальному домену .РФ — 15 лет 6 ч.
Без суеты: бывший художник Rockstar подтвердил, как долго GTA VI находится в разработке 8 ч.
Интернет наводнили спойлеры к Doom: The Dark Ages — геймер получил копию игры за неделю до релиза 10 ч.
Оперативная память скоро подорожает: Samsung подняла контрактные цены на DRAM 2 мин.
Космический телескоп «Джеймс Уэбб» показал полярное сияние на Юпитере — в сотни раз ярче, чем на Земле 12 мин.
CoreWeave всего через несколько недель после IPO захотела взять в долг ещё $1,5 млрд 39 мин.
Облако.ру предлагает ИИ-системы, которые позволят запускать даже мощные ИИ-модели 2 ч.
Apple поднимет цены на iPhone, но пока не придумала, чем это объяснить 2 ч.
Акции техногигантов подскочили после приостановки тарифов между США и Китаем 2 ч.
Nvidia негласно подняла цены на все чипы: GeForce подорожали на 5–10 %, а ИИ-ускорители — на 10–15 % 3 ч.
Малайзия — это не просто ещё одна точка на карте. 5 причин, почему стоит выбрать серверы именно там 3 ч.
Klein Vision запустит массовое производство летающих автомобилей Aircar 2 в начале 2026 года 4 ч.
Огромную невышедшую видеокарту Nvidia RTX Titan Ada сравнили с RTX 4090 и RTX 5090 в играх и бенчмарках 5 ч.