Сегодня 03 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Xiaomi представила ИИ-модели MiMo V2.5 для преобразования текста в речь и обратно

Xiaomi представила две модели искусственного интеллекта, предназначенные для работы с голосом. MiMo-V2.5-TTS позволяет преобразовывать текст в речь, предлагая широкие возможности настройки с минимальными усилиями; MiMo-V2.5-ASR — напротив, создаёт текстовые расшифровки по звуку речи и пения.

 Источник изображения: Xiaomi

Источник изображения: Xiaomi

Семейство Xiaomi MiMo-V2.5-TTS включает три модели, которые какое-то время будут доступны бесплатно на платформе Xiaomi MiMo Studio. Базовая MiMo-V2.5-TTS позволяет преобразовывать текст в речь с минимальными возможностями: есть набор предустановленных голосов, а также функции настройки скорости речи, тона и эмоционального окраса. MiMo-V2.5-TTS-VoiceDesign позволяет создавать новые тембры голоса, используя короткую фразу. MiMo-V2.5-TTS-VoiceClone, как можно догадаться по названию, предназначена для воспроизведения определённого голоса по небольшому набору образцов, сохраняя согласованность по стилям и инструкциям.

Чтобы добиться нужного результата, пользователь может разметить текст заданными тегами или поступить проще — простым естественным языком описать, как должен звучать голос. Можно даже составить сценарий для виртуальных постановок с несколькими голосами сразу. Поддерживаются инструкции на китайском и английском языках.

Открытая модель Xiaomi MiMo-V2.5-ASR предназначена для распознавания устной речи даже в сложных условиях. Она поддерживает несколько китайских диалектов и английский язык, может создавать расшифровки двуязычных диалогов, даже записывать тексты песен, разбирая вокал, который звучит вместе с музыкой, а также распознавать речь в условиях сильного постороннего шума. Важным достоинством Xiaomi MiMo-V2.5-ASR является поддержка пунктуации — знаки препинания расставляются на основе интонаций. Это значит, что для готовой расшифровки достаточно минимальных усилий по редактированию.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Цукерберг хочет, чтобы ИИ Meta управлял всем бизнесом пользователей 3 мин.
Meta в европейском суде не смогла избавиться от статуса «привратника» 8 мин.
Колонку Creative превратили в инструмент для взлома ПК — компания уязвимость отрицает и исправлять не будет 10 мин.
Microsoft планирует «вызвать зависимость» пользователей от своего нового ИИ-помощника Scout 2 ч.
Новая игра разработчиков Shovel Knight обеспечила студии светлое будущее — раскрыты продажи Mina the Hollower 2 ч.
Meta, Microsoft, SpaceX и спецслужбы разгромили международную сеть интернет-мошенников 2 ч.
Исследователи создали червя на основе ИИ — он может использовать любую известную компьютерную уязвимость 3 ч.
В один день с Control Resonant выйдет психологический хоррор Silent Hill: Townfall — с туманным островом конца 90-х и видом от первого лица 6 ч.
Meta передумала следить за всеми действиями сотрудников после волны недовольства 7 ч.
Трамп всё-таки подписал указ об обязательных проверках ИИ-моделей — его считают угрозой для отрасли ИИ 7 ч.
Репортаж со стенда MSI на Computex 2026: материнские платы, уникальные видеокарты, СЖО, корпуса и блоки питания 2 ч.
Thermaltake показала CAPO X — огромный корпус за $190 для сборки сразу двух игровых ПК 2 ч.
Microsoft придумала очередной носимый ИИ-гаджет — умный бейдж с камерой 2 ч.
Xiaomi выпустила пауэрбанк на 20 000 мАч со встроенным кабелем USB-C за €19 2 ч.
AMD раскрыла детали EXPO ULL — бесплатный прирост FPS оказался проще, чем ожидалось 2 ч.
Enermax представила свой вариант СЖО, которая обходится без помпы 2 ч.
Инвесторы уверены, что человекоподобные роботы изменят жизнь людей и промышленность за 10 лет 3 ч.
Научное сообщество скептически отнеслось к квантовому процессору Microsoft Majorana 2 3 ч.
ЦОД проекта Fairwater заработал в Висконсине, Microsoft одобрила использование систем NVIDIA Vera Rubin 4 ч.
Ayar Labs присоединилась к экосистеме NVIDIA NVLink Fusion с собственной CPO-технологией 4 ч.