Сегодня 21 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

В MIT придумали, как в 30 раз ускорить генерацию изображений с помощью ИИ

Исследователи из Массачусетского технологического института (MIT) смогли заметно ускорить создание изображений по текстовым описаниям с помощью генеративного искусственного интеллекта. Новый метод позволяет генерировать изображения высокой чёткости в 30 раз быстрее существующих.

 Источник изображения: pixabay.com

Источник изображения: pixabay.com

Обычно в генеративных ИИ применяется техника так называемой «диффузии», когда создаётся максимально размытая картинка, а затем она детализируется до окончательного результата, максимально соответствующего тому, что ИИ может выдать в ответ на запрос пользователя. Диффузия занимает довольно много времени, поэтому исследователи MIT поставили цель её ускорить.

 Источник изображений: tianweiy.github.io

Источник изображений: tianweiy.github.io

Исследователи из Лаборатории компьютерных наук и искусственного интеллекта MIT свели генерацию изображений к единственному проходу, а новый метод назвали «дистилляцией с согласованным распределением» (distribution matching distillation). Очевидно, что генерация картинки в один проход заметно быстрее, чем за типичные для диффузионных моделей 30–50 шагов. Так, на современном оборудовании Stable Diffusion 1.5 создаёт изображение за 1,5 секунды, в то время как новая модель на основе DMD справляется за 0,05 секунды.

Это не первая попытка дистилляции диффузионных моделей для ускорения генерации изображений. В Instaflow и LCM пытались применить похожий подход, но результаты не впечатляли. Компания Stability AI также пыталась ускорить диффузионные модели и добилась некоторых успехов, выпустив Stable Diffusion Turbo, создающую картинку с разрешением до 1 мегапикселя за один проход, однако сгенерированные в несколько проходов изображения всё равно получались заметно лучше.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Би-би-си угрожает Perplexity судом из-за нарушения авторских прав при обучении нейросетей 53 мин.
Найден новый способ поиска простых чисел — теперь RSA-шифрование устоит перед квантовыми компьютерами 2 ч.
Китайская MiniMax представила ИИ-модель M1 — её обучение обошлось в 200 раз дешевле GPT-4 4 ч.
Акционеры обвинили Apple в обмане относительно сроков выхода обновлённого Siri на базе ИИ 9 ч.
«Крупнейшая утечка в истории» оказалась устаревшим сборником архивов паролей 12 ч.
Sega случайно раскрыла актуальные продажи последних Persona, Yakuza, Sonic и Total War, а Persona 4 Revival придётся подождать 13 ч.
Для достижения своих целей продвинутые модели ИИ будут хитрить, обманывать и воровать 15 ч.
Microsoft начала масштабное удаление устаревших драйверов из «Центра обновления Windows» 16 ч.
Apple тоже интересовалась покупкой ИИ-стартапа Perplexity 16 ч.
Samsung запустит собственную систему оповещения о землетрясениях с функциями, которых нет у Google 17 ч.
Hisense представила для российского рынка новейшие телевизоры, проекторы и многое другое 28 мин.
На китайских торговых площадках появились материнские платы для Nintendo Switch 2 стоимостью $124 2 ч.
TP-Link выпустила водонепроницаемый роутер EAP772-Outdoor с поддержкой Wi-Fi 7 4 ч.
Наблюдатели заметили секретную встречу китайских спутников в космосе — возможно, для дозаправки 7 ч.
Transcend выпустила индустриальные SATA SSD серии SSD475P вместимостью до 8 Тбайт 8 ч.
Крупнейший в мире квантовый компьютер на сверхпроводящих кубитах запущен в Японии 10 ч.
Межпланетная станция NASA «Психея» поддала газу и ускорилась по направлению к Марсу 12 ч.
Meta выпустит VR-гарнитуру Quest 3S Xbox Edition на следующей неделе 12 ч.
Через 10 лет ИИ-ускорители получат терабайты HBM и будут потреблять 15 кВт — это изменит подход к проектированию, питанию и охлаждению ЦОД 15 ч.
В роботакси Tesla нельзя будет попасть просто с улицы, а страхующий оператор всегда будет сидеть в кресле переднего пассажира 16 ч.