Сегодня 16 февраля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Китайская Tencent представила генератор видео HunyuanVideo, который пользователи назвали лучшим из существующих

Китайский технологический гигант Tencent анонсировал HunyuanVideo — передовую модель искусственного интеллекта для генерации видео, опубликованную с открытым исходным кодом. Впервые код вывода и веса модели ИИ с такими возможностями доступны всем желающим.

 Источник изображения: Tencent

Источник изображения: Tencent

HunyuanVideo, как утверждает Tencent, способна генерировать видеоролики на уровне ведущих мировых систем с закрытым исходным кодом — эти видео отличают высокое качество картинки, разнообразие движений объектов в кадре, способность синхронизировать визуальный и звуковой ряд, а также стабильность генерации. Это крупнейшая модель для генерации видео — у неё 13 млрд параметров. Пакет HunyuanVideo включает в себя фреймворк с инструментами для управления данными; инструментами для совместного обучения моделей, работающих с изображениями и видео; а также инфраструктуру с поддержкой крупномасштабного обучения моделей и их запуска.

Tencent протестировала модель при поддержке профессионального сообщества, которое установило, что HunyuanVideo превосходит по качеству закрытые проекты Runway Gen-3 и Luma 1.6. Чтобы добиться такого результата, разработчик обратился к гибридной архитектуре передачи «двойного потока в одинарный» (Dual-stream to Single-stream). На начальном этапе видео- и текстовые токены обрабатываются независимо несколькими блоками модели-трансформера, благодаря чему данные разных форматов преобразуются без помех. На этапе единого потока видео- и текстовые токены передаются в последующие блоки трансформера, обеспечивая эффективное слияние мультимодальных данных. Это позволяет зафиксировать сложные отношения между визуальной и семантической информацией, а общая производительность модели повышается.

Выпустив HunyuanVideo, компания Tencent сделала значительный шаг к демократизации технологий создания видео при помощи ИИ. Благодаря открытому исходному коду модель способна произвести революцию в экосистеме генерации видео.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Orcs Must Die! Deathtrap — в ловушке дисбаланса. Рецензия 14 ч.
Новая статья: Gamesblender № 713: анонсы State of Play, «революция» Overwatch 2 и заморозка Crysis 4 15 ч.
VK купил 25-% долю в Р7 для усиления позиций VK Tech перед IPO 16 ч.
Perplexity запустила почти бесплатную альтернативу Deep Research от OpenAI и Google 15-02 11:07
Google отключила на Android оповещения о землетрясениях в Бразилии после ложной тревоги 15-02 07:19
Совет директоров OpenAI единогласно отверг предложение Маска о покупке стартапа за $97,4 млрд 15-02 05:43
Instagram начал тестировать скрытую реакцию «не нравится» для комментариев 15-02 05:10
Новая статья: Эмулируй меня полностью: состояние эмуляции игровых консолей в 2025 году 15-02 00:09
295 млн пользователей, проверенные хиты продаж и 7,7 млрд часов в играх: Epic Games Store подвёл итоги 2024 года и раскрыл планы по улучшению магазина 14-02 22:34
«Доверьтесь нам»: разработчики Okami 2 поделились первыми подробностями сиквела легендарной приключенческой игры 14-02 21:16
Apple Vision Pro в апреле получит самое большое обновление в истории 3 ч.
SanDisk выпустит SSD со скоростью до 14 500 Мбайт/с при энергопотреблении всего 7 Вт 4 ч.
Broadcom интересуется покупкой той части Intel, которая останется после отделения предприятий 7 ч.
HBF вместо HBM: SanDisk предлагает увеличить объём памяти ИИ-ускорителей в 16 раз, заменив DRAM на сверхбыструю флеш-память 14 ч.
Selectel: количество DDoS-атак во II полугодии 2024 года выросло в 2,6 раза 14 ч.
50 тыс. км под водой: Meta представила проект Waterworth по созданию самого протяжённого в мире интернет-кабеля 15 ч.
xAI может построить второй ЦОД и купить у Dell ИИ-серверы на $5 млрд 15 ч.
Представлен самый большой в мире OLED-дисплей размером с теннисный корт 16 ч.
Представлен смартфон ZTE Blade V70 Max с 6,9-дюймовым дисплеем и батареей на 6000 мА·ч 16 ч.
Аэропорт Далласа начал вырабатывать энергию от реактивных струй взлетающих самолётов 17 ч.