Сегодня 31 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Стартап Black Forest Labs представил ИИ-генератор изображений FLUX.1 — он отлично справляется с прорисовкой рук человека

В конце прошлой недели стартап Black Forest Labs объявил о начале своей деятельности в сфере разработки генеративных нейросетей. Вместе с этим компания, созданная выходцами из Stability AI, представила семейство моделей генерации изображений по текстовому описанию под названием FLUX.1, которые претендуют на звание лучших в своём классе.

 Источник изображений: FLUX.1

Источник изображений: FLUX.1

Запуск FLUX.1 произошёл примерно через семь недель после того, как в середине июня Stability AI выпустила ИИ-генератор Stable Diffusion 3 Medium, который собрал много критики из-за невысокого качества при создании изображений, на которых есть люди. Пользователи активно делились в соцсетях результатами генерации алгоритма с искажёнными конечностями и телами людей.

Запуск Stable Diffusion 3 Medium последовал за уходом из Stability AI трёх ключевых сотрудников — Робина Ромбаха (Robin Rombach), Андреаса Блаттманна (Andreas Blattmann) и Доминика Лоренца (Dominik Lorenz). Именно они вместе с Патриком Эссером (Patrick Esser), который участвовал в разработке первой версии Stable Diffusion и с тех пор работал над разными ИИ-алгоритмами, а также другими инженерами, основали компанию Black Forest Lab.

На данный момент стартап представил три модели для генерации по текстовому описанию FLUX.1. ИИ-модель FLUX.1 pro представляет собой наиболее производительный генератор изображений, предназначенный для коммерческого использования через соответствующий API. Вместе с этим были выпущены FLUX.1 dev, доступная для некоммерческого использования, а также более лёгкая и быстрая FLUX.1 schnell (в переводе с немецкого — «быстрый» или «стремительный»).

Разработчики утверждают, что их ИИ-модели превосходят существующие аналоги, такие как Midjourney и DALL-E, по целому ряду показателей, включая качество создаваемых изображений и точность следования исходному описанию. В целом результаты генерации FLUX.1 сопоставимы с тем, что можно создать с помощью DALL-E 3 от OpenAI по точности следования описанию, и близки по фотореалистичности к Midjourney 6. При этом алгоритм явно более качественно работает по сравнению со Stable Diffusion XL, последним крупным релизом команды этих разработчиков, когда они ещё были частью Stability AI, не считая Stable Diffusion XL Turbo.

Модели Black Forest Lab построены на базе гибридной архитектуры, которая объединяет методы трансформации и диффузии, с масштабированием до 12 млрд параметров. Похоже, что такой подход делает нейросеть FLUX.1 способной качественно генерировать руки человека, что было слабым местом многих уже выпущенных на рынок аналогов. При этом разработчики не уточнили, на каких данных обучались модели FLUX.1.

Отметим, что Black Forest Lab уже привлекла финансирование в размере $31 млн. Желающим опробовать FLUX.1 в действии можно воспользоваться сервисами Fal.ai или Replicate.com, где придётся платить деньги для работы с алгоритмами.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Бесплатный ChatGPT стал «умнее по всем параметрам» — OpenAI обновила модель GPT-4o 44 мин.
«Наконец-то хорошая Horizon на PlayStation»: популярная гонка Forza Horizon 5 станет следующим эксклюзивом Xbox на PS5 3 ч.
Уютная градостроительная игра Town to City от авторов Station to Station отправит в XIX век возводить безмятежные средиземноморские города 5 ч.
Маркетинговый директор Ubisoft рассекретил продажи Prince of Persia: The Lost Crown за первый год после релиза 7 ч.
Китайская ИИ-модель Kimi k1.5 освоила мультимодальные рассуждения и превзошла OpenAI o1 7 ч.
Группа инвесторов во главе с MrBeast готова предложить за TikTok «значительно» больше $20 млрд 9 ч.
Следующий большой патч для Warhammer 40,000: Space Marine 2 выйдет в феврале: шлем-клюв, гробница для PvP и другое в обновлении 6.0 9 ч.
Выручка Microsoft от Azure AI выросла на 157 %, но для удовлетворения спроса нужно ещё больше ЦОД 9 ч.
Google научила ИИ-чат-бот Gemini создавать диаграммы и визуализировать данные из таблиц 10 ч.
SoftBank не прочь вложить до $25 млрд в OpenAI 11 ч.
Microsoft представила ИИ-планшет Surface Pro 11 и ИИ-ноутбук Surface Laptop 7 на базе Intel Lunar Lake 57 мин.
Первая очередь ЦОД для ИИ-мегапроекта Stargate обойдётся всего в $1,1 млрд 3 ч.
Финны научат производителей 3D NAND выпускать чипы рекордной плотности 5 ч.
Канадцы построили фотонный квантовый компьютер и пообещали быстро масштабировать его до миллиона кубитов 7 ч.
Острый дефицит GeForce RTX 5080 и RTX 5090 обернулся беспорядками в Японии 7 ч.
Стартовали мировые продажи GeForce RTX 5090 и RTX 5080 — первые партии смели мгновенно 7 ч.
Более 80 % планшетов Росстата на «Авроре» оказались невостребованными после переписи населения в 2021 году 9 ч.
Chevron и Engine No. 1 построят в США газовые электростанции мощностью до 4 ГВт для прямого питания ИИ ЦОД 9 ч.
Новая статья: Обзор видеокарты NVIDIA GeForce RTX 5080 и архитектуры Blackwell 10 ч.
Veir разработала сверхпроводящие силовые кабели для ЦОД 10 ч.