Сегодня 09 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Китайская Tencent представила генератор видео HunyuanVideo, который пользователи назвали лучшим из существующих

Китайский технологический гигант Tencent анонсировал HunyuanVideo — передовую модель искусственного интеллекта для генерации видео, опубликованную с открытым исходным кодом. Впервые код вывода и веса модели ИИ с такими возможностями доступны всем желающим.

 Источник изображения: Tencent

Источник изображения: Tencent

HunyuanVideo, как утверждает Tencent, способна генерировать видеоролики на уровне ведущих мировых систем с закрытым исходным кодом — эти видео отличают высокое качество картинки, разнообразие движений объектов в кадре, способность синхронизировать визуальный и звуковой ряд, а также стабильность генерации. Это крупнейшая модель для генерации видео — у неё 13 млрд параметров. Пакет HunyuanVideo включает в себя фреймворк с инструментами для управления данными; инструментами для совместного обучения моделей, работающих с изображениями и видео; а также инфраструктуру с поддержкой крупномасштабного обучения моделей и их запуска.

Tencent протестировала модель при поддержке профессионального сообщества, которое установило, что HunyuanVideo превосходит по качеству закрытые проекты Runway Gen-3 и Luma 1.6. Чтобы добиться такого результата, разработчик обратился к гибридной архитектуре передачи «двойного потока в одинарный» (Dual-stream to Single-stream). На начальном этапе видео- и текстовые токены обрабатываются независимо несколькими блоками модели-трансформера, благодаря чему данные разных форматов преобразуются без помех. На этапе единого потока видео- и текстовые токены передаются в последующие блоки трансформера, обеспечивая эффективное слияние мультимодальных данных. Это позволяет зафиксировать сложные отношения между визуальной и семантической информацией, а общая производительность модели повышается.

Выпустив HunyuanVideo, компания Tencent сделала значительный шаг к демократизации технологий создания видео при помощи ИИ. Благодаря открытому исходному коду модель способна произвести революцию в экосистеме генерации видео.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
На Пхукете туристам разрешили платить криптовалютой за товары и услуги 7 мин.
Square Enix показала трейлер ПК-версии Final Fantasy VII Rebirth и объявила системные требования для игры в 4K и 60 FPS 38 мин.
xAI выпустил самостоятельное приложение для фривольного ИИ-бота Grok — пока в тестовом режиме и только на iOS 2 ч.
«В этом была бы трагедия Дженсена»: бывший сценарист Eidos Montreal рассказал, каким могло стать продолжение Deus Ex: Mankind Divided 2 ч.
Microsoft подтвердила презентацию Developer_Direct — Doom: The Dark Ages, игра-сюрприз и не только 2 ч.
Медиаплеер VLC получил ИИ-генератор субтитров с переводом на более чем 100 языков — он работает оффлайн 3 ч.
Meta освободила от стандартной модерации рекламодателей, которые приносят больше всех денег 5 ч.
Microsoft вернула старый ИИ-генератор картинок Bing Image Creator, потому что новый работал хуже 5 ч.
Российское подразделение Oracle подало в суд на инициаторов своего банкротства 6 ч.
ИИ лишит работы сотрудников 41 % крупнейших мировых компаний в ближайшие пять лет 6 ч.
PowerColor показала свои Radeon RX 9070 XT и RX 9070 в версиях Red Devil, Hellhound и Reaper 25 мин.
Xpeng Aero HT представила на CES 2025 модульный летающий автомобиль Land Aircraft Carrier, который стоит меньше $300 000 32 мин.
Мощнейший в истории гамма-всплеск может пролить свет на новую физику — аксионы и тайну тёмной материи 33 мин.
Lenovo обновила профессиональные мониторы ThinkVision: от 27 до 34 дюймов, QHD или WQHD и 120 Гц 2 ч.
Zotac показала прототип портативной игровой консоли Zone Gaming на чипе AMD Ryzen AI 9 HX 370 2 ч.
SoftBank и Arm заинтересовались покупкой Ampere, но о переговорах говорить рано 2 ч.
Palit представила компактный ИИ-компьютер Pandora на базе Nvidia Jetson Orin NX Super 2 ч.
Одноплатный компьютер Raspberry Pi 5 стал доступен с 16 Гбайт ОЗУ за $120 3 ч.
Deep Fission запитает ЦОД Endeavour от подземных малых ядерных реакторов на глубине более 1,5 км 3 ч.
На создание российского оборудования для 5G Advanced и 6G власти выделят в пять раз меньше запрошенной суммы 3 ч.