Сегодня 20 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ научила ИИ-модель SeamlessM4T переводить текст и речь быстрее и естественнее

Meta обновила свою ИИ-модель SeamlessM4T, предназначенную для перевода речи и текста. Теперь платформа поддерживает переводы почти на 100 языках, включая русский, в текстовом формате и на 36 — в устной речи. С новой архитектурой решения технологический гигант стремится сделать перевод более естественным и выразительным, что обещает стать прорывом в коммуникациях между людьми и производстве контента.

 Источник изображения: ***

Источник изображения: Meta

Meta построила SeamlessM4T на основе своей архитектуры многофункциональной модели UnitY на базе PyTorch, которая выполняет различные модальные переводы, а также автоматическое распознавание речи. Она использует систему BERT 2.0 для аудиокодирования, разбивая входные данные на составляющие токены для анализа, и HiFi-GAN unit vocoder для генерации голосовых ответов.

Первая из двух новых функций SeamlessM4T называется SeamlessExpressive. Как можно понять из названия, она переносит эмоциональные интонации голоса в переведённую речь. Система учитывает такие составляющие, как тон речи, её громкость, эмоциональный окрас (возбуждение, печаль или шёпот), темп речи и паузы. Всё это делает переводы менее механическими и более живыми. Поддерживаются английский, испанский, немецкий, французский, итальянский и китайский языки.

Вторая функция, SeamlessStreaming, начинает переводить речь, пока говорящий ещё не закончил предложение, что позволяет другим слушателям быстрее услышать перевод. Задержка составляет чуть менее двух секунд. По словам Meta, основной трудностью здесь было различие в структуре предложений разных языков, поэтому был разработан специальный алгоритм, который анализирует неполные аудиофрагменты и решает, достаточно ли контекста для начала генерации перевода или стоит ещё послушать говорящего.

Как и большинство предыдущих разработок Meta в области машинного перевода, будь то Llama 2, Massively Multilingual Speech (MMS), Universal Speech Translator (UST) или амбициозный проект No Language Left Behind (NLLB), SeamlessM4T находится в открытом доступе на GitHub. «Мы считаем, что SeamlessM4T является важным прорывом в стремлении сообщества ИИ к созданию универсальных многофункциональных систем», — написала команда исследователей.

Развитие компанией Meta ИИ-технологий перевода с различных языков открывает новые перспективы в области межъязыкового общения. Эти инновации могут значительно превзойти существующие решения, такие как инструменты перевода, разработанные компаниями Google и Samsung. Пока нет точной информации о сроках внедрения Meta этих функций, но их потенциальное применение, например, в умных очках Meta, обещает сделать их незаменимыми в повседневной жизни и профессиональной сфере.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Ярость войны, напалм и масштаб: анонсирован многопользовательский шутер Hell Let Loose: Vietnam 46 мин.
Сюжетная ролевая игра Rue Valley, вдохновлённая Disco Elysium и «Днём сурка», получила дату выхода и новый геймплейный трейлер 3 ч.
«Не терпится купить 12 DLC, чтобы получить полную игру»: Paradox раскрыла дату выхода Europa Universalis V, но фанаты делать предзаказ не спешат 4 ч.
Китайцы запустили ИИ-стримера-продавца, который превосходит человека и готов работать круглосуточно 5 ч.
Как Overwatch, но с танками: создатели World of Tanks анонсировали геройский шутер World of Tanks: Heat 5 ч.
Тысячи приватных диалогов с Grok утекли в поиск Google 6 ч.
Больше никаких «Меня слышно?» — в Microsoft Teams появится индикатор работы микрофона 6 ч.
Популярное VPN-расширение для Chrome уличили в создании скриншотов всех сайтов и отправке их неизвестно куда 6 ч.
В новом трейлере Resident Evil Requiem показали встречу главной героини с матерью, которая пошла не по плану 7 ч.
S.T.A.L.K.E.R. 2: Heart of Chornobyl выйдет на PS5 спустя ровно год после релиза на PC и Xbox — GSC показала новый трейлер 7 ч.
Qualcomm представила процессоры Snapdragon W5 Gen 2 и W5+ Gen 2 для смарт-часов со спутниковой связью 48 мин.
Google представила смарт-часы Pixel Watch 4 с поддержкой спутниковой связи 2 ч.
Google сделала свой MagSafe: магнитное крепление Pixelsnap для зарядки и не только 2 ч.
Портрет всего человечества с расстояния 290 млн км: межпланетная станция «Психея» запечатлела Землю и Луну 2 ч.
«Роскосмос» запустил на орбиту 75 мышей и 1500 мух на спутнике «Бион-М» — через месяц они вернутся в Россию 2 ч.
Google представила беспроводные наушники Pixel Buds 2a со сменной батареей в чехле и активным шумоподавлением за $129 2 ч.
MSI представила самую оверклокерскую плату MEG X870E Godlike X Edition, а также модели X870E MAX попроще 3 ч.
MSI показала видеокарту GeForce RTX 5000 в стиле World of Warcraft: Midnight 3 ч.
Портативные приставки Xbox от Asus поступят в продажу 16 октября 3 ч.
Представлен Google Pixel 10 Pro Fold — первый складной смартфон с полной защитой от пыли 3 ч.