Сегодня 29 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

В MIT придумали, как в 30 раз ускорить генерацию изображений с помощью ИИ

Исследователи из Массачусетского технологического института (MIT) смогли заметно ускорить создание изображений по текстовым описаниям с помощью генеративного искусственного интеллекта. Новый метод позволяет генерировать изображения высокой чёткости в 30 раз быстрее существующих.

 Источник изображения: pixabay.com

Источник изображения: pixabay.com

Обычно в генеративных ИИ применяется техника так называемой «диффузии», когда создаётся максимально размытая картинка, а затем она детализируется до окончательного результата, максимально соответствующего тому, что ИИ может выдать в ответ на запрос пользователя. Диффузия занимает довольно много времени, поэтому исследователи MIT поставили цель её ускорить.

 Источник изображений: tianweiy.github.io

Источник изображений: tianweiy.github.io

Исследователи из Лаборатории компьютерных наук и искусственного интеллекта MIT свели генерацию изображений к единственному проходу, а новый метод назвали «дистилляцией с согласованным распределением» (distribution matching distillation). Очевидно, что генерация картинки в один проход заметно быстрее, чем за типичные для диффузионных моделей 30–50 шагов. Так, на современном оборудовании Stable Diffusion 1.5 создаёт изображение за 1,5 секунды, в то время как новая модель на основе DMD справляется за 0,05 секунды.

Это не первая попытка дистилляции диффузионных моделей для ускорения генерации изображений. В Instaflow и LCM пытались применить похожий подход, но результаты не впечатляли. Компания Stability AI также пыталась ускорить диффузионные модели и добилась некоторых успехов, выпустив Stable Diffusion Turbo, создающую картинку с разрешением до 1 мегапикселя за один проход, однако сгенерированные в несколько проходов изображения всё равно получались заметно лучше.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Sony подала в суд на Tencent из-за боевика Light of Motiram, который подозрительно похож на Horizon Zero Dawn 2 ч.
Microsoft превратила Edge в ИИ-браузер, начав тестирование режима Copilot Mode — пока бесплатно 4 ч.
«Лихо одноглазое» пробудилось в Steam и VK Play — это мрачный фольклорный хоррор от создателей «Чёрной книги» 4 ч.
Microsoft напомнила, что прекратит поддержку Windows 11 22H2 в октябре 5 ч.
Это шанс для VR: Tencent выпустила открытую ИИ-модель Hunyuan 3D World Model 1.0, которая генерирует интерактивные 3D-миры 7 ч.
Hollow Knight: Silksong скоро выйдет из тени — Microsoft привезёт игру на Gamescom 2025 8 ч.
У Techland большие планы на Dying Light, поэтому в Dying Light: The Beast не будет выбора концовки 9 ч.
В отключениях интернета в России появятся исключения — предлагается сохранять доступ к «Госуслугам» и банкам 11 ч.
Завирусившийся симулятор Quarantine Zone: The Last Check от российских разработчиков достиг «грандиозного рубежа» и нашёл издателя 12 ч.
Хакеры взломали системы «Аэрофлота» — отменены десятки рейсов 13 ч.
Новая статья: Обзор смартфона Nothing Phone (3): неординарный флагман с двумя экранами 2 ч.
Sony показала FlexStrike — аркадный геймпад для хардкорных фанатов файтингов 3 ч.
Meta возобновила разработку умных часов, но это не точно — выпускать их будут в Китае 5 ч.
MSI догонит Gigabyte: компания впервые поставит 10 млн материнских плат за год 5 ч.
Китай изо всех сил стремится создать аналог Starlink, но пока драматически отстаёт от SpaceX 6 ч.
Huawei вернула лидерство на китайском рынке смартфонов — Apple только на пятом месте 7 ч.
Xiaomi анонсировала смартфон Redmi Note 14 SE с разъёмом для наушников и ценой $173 8 ч.
«Мы не можем полагаться на человека»: учёные создали робота-каннибала, который ремонтируется за счёт других машин 8 ч.
Sapphire представила профессиональную видеокарту Radeon AI Pro R9700 с турбиной и 12V-2×6 8 ч.
Первый лунный радиотелескоп будет установлен на обратной стороне Луны в следующем году 8 ч.