Сегодня 09 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Китайская Tencent представила генератор видео HunyuanVideo, который пользователи назвали лучшим из существующих

Китайский технологический гигант Tencent анонсировал HunyuanVideo — передовую модель искусственного интеллекта для генерации видео, опубликованную с открытым исходным кодом. Впервые код вывода и веса модели ИИ с такими возможностями доступны всем желающим.

 Источник изображения: Tencent

Источник изображения: Tencent

HunyuanVideo, как утверждает Tencent, способна генерировать видеоролики на уровне ведущих мировых систем с закрытым исходным кодом — эти видео отличают высокое качество картинки, разнообразие движений объектов в кадре, способность синхронизировать визуальный и звуковой ряд, а также стабильность генерации. Это крупнейшая модель для генерации видео — у неё 13 млрд параметров. Пакет HunyuanVideo включает в себя фреймворк с инструментами для управления данными; инструментами для совместного обучения моделей, работающих с изображениями и видео; а также инфраструктуру с поддержкой крупномасштабного обучения моделей и их запуска.

Tencent протестировала модель при поддержке профессионального сообщества, которое установило, что HunyuanVideo превосходит по качеству закрытые проекты Runway Gen-3 и Luma 1.6. Чтобы добиться такого результата, разработчик обратился к гибридной архитектуре передачи «двойного потока в одинарный» (Dual-stream to Single-stream). На начальном этапе видео- и текстовые токены обрабатываются независимо несколькими блоками модели-трансформера, благодаря чему данные разных форматов преобразуются без помех. На этапе единого потока видео- и текстовые токены передаются в последующие блоки трансформера, обеспечивая эффективное слияние мультимодальных данных. Это позволяет зафиксировать сложные отношения между визуальной и семантической информацией, а общая производительность модели повышается.

Выпустив HunyuanVideo, компания Tencent сделала значительный шаг к демократизации технологий создания видео при помощи ИИ. Благодаря открытому исходному коду модель способна произвести революцию в экосистеме генерации видео.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Хоррор-шутер Alien: Rogue Incursion Evolved Edition отправит игроков выживать под натиском небывало хитрых ксеноморфов — трейлер и дата выхода 2 ч.
Сэм Альтман передал управление ChatGPT новому руководителю, а сам займётся исследованиями 4 ч.
Google защитит пользователей Chrome от фишинга с помощью локальной ИИ-модели Gemini Nano 4 ч.
Microsoft упростит установку приложений в Windows 11, но это может привести к засорению системы 12 ч.
Первое сюжетное дополнение к Kingdom Come: Deliverance 2 не заставит себя долго ждать — новый трейлер и дата выхода Brushes with Death 13 ч.
Meta наделит следующие умные очки Ray-Ban «супервосприятием» — функцией распознавания лиц окружающих 15 ч.
Первый геймплейный трейлер подтвердил дату выхода Mafia: The Old Country — игру будут продавать за $50 15 ч.
ИИ-боты начинают чаще привирать, когда их просят о лаконичных ответах — исследование 16 ч.
Перенос GTA VI прибавил Electronic Arts уверенности в успехе новой Battlefield 16 ч.
Apple начала принимать заявки на компенсации по иску о подслушивании Siri 17 ч.
Китайские дилеры уже начали демонстрировать электромобиль Audi E5 23 мин.
OpenAI планирует развивать ИИ-инфраструктуру Stargate за пределами США 38 мин.
Apple продвинулась в разработке новых процессоров для умных очков и компьютеров 2 ч.
ASML ускорит строительство нового кампуса, где будет производиться оборудование для выпуска чипов 3 ч.
Продажи Tesla в апреле резко упали как в Китае, так и в Европе 3 ч.
Первая фаза ИИ-кластера xAI Colossus полностью обеспечена энергией 9 ч.
Новая статья: Двумерные полупроводники: ещё один подход к снаряду 10 ч.
Квартальная выручка Arm впервые превысила $1 млрд, но акции упали из-за слабого прогноза 11 ч.
Lenovo возродила 3D-гейминг — представлен ноутбук Legion 9i с RTX 5090, безочковым 3D-экраном и крышкой из кованного углеволокна 12 ч.
Razer выпустила компактные игровые мышь Basilisk Mobile и клавиатуру Joro для мобильного гейминга 12 ч.