Сегодня 31 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ научила ИИ-модель SeamlessM4T переводить текст и речь быстрее и естественнее

Meta обновила свою ИИ-модель SeamlessM4T, предназначенную для перевода речи и текста. Теперь платформа поддерживает переводы почти на 100 языках, включая русский, в текстовом формате и на 36 — в устной речи. С новой архитектурой решения технологический гигант стремится сделать перевод более естественным и выразительным, что обещает стать прорывом в коммуникациях между людьми и производстве контента.

 Источник изображения: ***

Источник изображения: Meta

Meta построила SeamlessM4T на основе своей архитектуры многофункциональной модели UnitY на базе PyTorch, которая выполняет различные модальные переводы, а также автоматическое распознавание речи. Она использует систему BERT 2.0 для аудиокодирования, разбивая входные данные на составляющие токены для анализа, и HiFi-GAN unit vocoder для генерации голосовых ответов.

Первая из двух новых функций SeamlessM4T называется SeamlessExpressive. Как можно понять из названия, она переносит эмоциональные интонации голоса в переведённую речь. Система учитывает такие составляющие, как тон речи, её громкость, эмоциональный окрас (возбуждение, печаль или шёпот), темп речи и паузы. Всё это делает переводы менее механическими и более живыми. Поддерживаются английский, испанский, немецкий, французский, итальянский и китайский языки.

Вторая функция, SeamlessStreaming, начинает переводить речь, пока говорящий ещё не закончил предложение, что позволяет другим слушателям быстрее услышать перевод. Задержка составляет чуть менее двух секунд. По словам Meta, основной трудностью здесь было различие в структуре предложений разных языков, поэтому был разработан специальный алгоритм, который анализирует неполные аудиофрагменты и решает, достаточно ли контекста для начала генерации перевода или стоит ещё послушать говорящего.

Как и большинство предыдущих разработок Meta в области машинного перевода, будь то Llama 2, Massively Multilingual Speech (MMS), Universal Speech Translator (UST) или амбициозный проект No Language Left Behind (NLLB), SeamlessM4T находится в открытом доступе на GitHub. «Мы считаем, что SeamlessM4T является важным прорывом в стремлении сообщества ИИ к созданию универсальных многофункциональных систем», — написала команда исследователей.

Развитие компанией Meta ИИ-технологий перевода с различных языков открывает новые перспективы в области межъязыкового общения. Эти инновации могут значительно превзойти существующие решения, такие как инструменты перевода, разработанные компаниями Google и Samsung. Пока нет точной информации о сроках внедрения Meta этих функций, но их потенциальное применение, например, в умных очках Meta, обещает сделать их незаменимыми в повседневной жизни и профессиональной сфере.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Утечка подтвердила дату выхода Battlefield 6 — Electronic Arts раньше времени показала тизер нового трейлера 8 мин.
Инсайдер раскрыл планы Electronic Arts на открытую «бету» Battlefield 6 — когда тестирование и как получить ранний доступ 11 ч.
«Абсолютно нормальное» обновление на радость фанатам добавило в инди-хит Peak каннибализм 13 ч.
Google выпустила экстренное обновление для Chrome, закрывшее опасную уязвимость 14 ч.
Devil May Cry 5 стала самой продаваемой игрой квартала для Capcom, а Monster Hunter Wilds весь запал растеряла 14 ч.
ИИ-приложения захватили смартфоны и удвоили выручку — ChatGPT уже дышит в затылок Google 14 ч.
Google заявила, что Великобритания не требовала от неё создать бэкдор в облаке — в отличие от Apple 15 ч.
Тысячи камер Hikvision остаются уязвимы ко взлому почти год — доступ к ним активно продают в даркнете 15 ч.
TikTok запустил систему проверки фактов и новые инструменты родительского контроля 16 ч.
Генерация кадров и востребованные функции: для Clair Obscur: Expedition 33 вышло крупное обновление 16 ч.
В России начались продажи роботов-пылесосов Dreame F10 и F10 Plus 5 мин.
Сообщение о ликвидации утечки воздуха в модуле «Звезда» на МКС оказалось преждевременным 21 мин.
Выделение сетевого бизнеса Intel в отдельную компанию угрожает бизнесу Ericsson и других поставщиков 5G-решений 52 мин.
Огорчив инвесторов квартальным отчётом, Arm всё же призналась, что размышляет о выпуске собственных чипов 2 ч.
Qualcomm разочаровала инвесторов размером выручки от реализации мобильных чипов 3 ч.
Прибыль Samsung на полупроводниковом направлении сократилась в 16 раз 5 ч.
Новая статья: Обзор гибкого смартфона Samsung Galaxy Z Fold7: догнал одним прыжком 8 ч.
Макеты всех версий iPhone 17 показались на фото в новых цветах — оранжевый Pro стал сюрпризом 9 ч.
Новая статья: Система жидкостного охлаждения Arctic Liquid Freezer III Pro 360 A-RGB: новые вентиляторы — и точка 10 ч.
AOC представила 610-Гц киберспортивные мониторы Agon Pro CS24A и Agon Pro AG246FK6 13 ч.