Сегодня 19 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ научила ИИ-модель SeamlessM4T переводить текст и речь быстрее и естественнее

Meta обновила свою ИИ-модель SeamlessM4T, предназначенную для перевода речи и текста. Теперь платформа поддерживает переводы почти на 100 языках, включая русский, в текстовом формате и на 36 — в устной речи. С новой архитектурой решения технологический гигант стремится сделать перевод более естественным и выразительным, что обещает стать прорывом в коммуникациях между людьми и производстве контента.

 Источник изображения: ***

Источник изображения: Meta

Meta построила SeamlessM4T на основе своей архитектуры многофункциональной модели UnitY на базе PyTorch, которая выполняет различные модальные переводы, а также автоматическое распознавание речи. Она использует систему BERT 2.0 для аудиокодирования, разбивая входные данные на составляющие токены для анализа, и HiFi-GAN unit vocoder для генерации голосовых ответов.

Первая из двух новых функций SeamlessM4T называется SeamlessExpressive. Как можно понять из названия, она переносит эмоциональные интонации голоса в переведённую речь. Система учитывает такие составляющие, как тон речи, её громкость, эмоциональный окрас (возбуждение, печаль или шёпот), темп речи и паузы. Всё это делает переводы менее механическими и более живыми. Поддерживаются английский, испанский, немецкий, французский, итальянский и китайский языки.

Вторая функция, SeamlessStreaming, начинает переводить речь, пока говорящий ещё не закончил предложение, что позволяет другим слушателям быстрее услышать перевод. Задержка составляет чуть менее двух секунд. По словам Meta, основной трудностью здесь было различие в структуре предложений разных языков, поэтому был разработан специальный алгоритм, который анализирует неполные аудиофрагменты и решает, достаточно ли контекста для начала генерации перевода или стоит ещё послушать говорящего.

Как и большинство предыдущих разработок Meta в области машинного перевода, будь то Llama 2, Massively Multilingual Speech (MMS), Universal Speech Translator (UST) или амбициозный проект No Language Left Behind (NLLB), SeamlessM4T находится в открытом доступе на GitHub. «Мы считаем, что SeamlessM4T является важным прорывом в стремлении сообщества ИИ к созданию универсальных многофункциональных систем», — написала команда исследователей.

Развитие компанией Meta ИИ-технологий перевода с различных языков открывает новые перспективы в области межъязыкового общения. Эти инновации могут значительно превзойти существующие решения, такие как инструменты перевода, разработанные компаниями Google и Samsung. Пока нет точной информации о сроках внедрения Meta этих функций, но их потенциальное применение, например, в умных очках Meta, обещает сделать их незаменимыми в повседневной жизни и профессиональной сфере.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Итоги Steam за 2024 год открыты — пользователи могут взглянуть на своё игровое прошлое в «приятной компании фактов и друзей» 2 ч.
Valve изменила правила отбора номинантов на премию Steam 2024, но никому об этом не сказала 2 ч.
Судьбу TikTok в США решит Верховный суд за неделю до возможной блокировки 3 ч.
Разработчики Helldivers 2 устроили кроссовер с Killzone 2 и возмутили игроков 4 ч.
Новый геймплейный трейлер Lost Soul Aside подтвердил перенос релиза на 2025 год — в Steam игра потребует привязку аккаунта PSN 6 ч.
Комиссия по азартным играм Великобритании выявила нелегальные казино в Roblox 8 ч.
Люксовые бренды начали принимать оплату криптовалютой после взлёта биткоина 8 ч.
МТС выделит облачные сервисы, ИИ-технологии и большие данные в самостоятельную компанию 10 ч.
Вместе с Apple Intelligence на старые iPhone пришёл перегрев 10 ч.
Участники рынка выступили за доработку законопроекта по регулированию индустрии игр в России, а в Минцифры подготовили альтернативный акт 11 ч.
Новая статья: Обзор блока питания MSI MPG A1000G PCIE5 55 мин.
AMD прекратила производство Radeon RX 7900 GRE в преддверии выхода Radeon RX 8000 3 ч.
Китай испытал прямоточный воздушно-реактивный двигатель с детонацией для самолётов вдвое быстрее Ту-144 и «Конкорда» 3 ч.
Китай заявил, что создал квантовый процессор ничуть не хуже нашумевшего Google Willow 4 ч.
Intel раскрыла характеристики мобильных процессоров Core 200H — это не новые чипы 6 ч.
Наш мозг работает медленнее 50-летнего процессора — учёные из Калтеха измерили скорость человеческой мысли 6 ч.
Первая частная японская ракета Kairos впервые достигла космоса и почти сразу самоуничтожилась 7 ч.
«Intel решила свои проблемы»: видеокарты Intel Arc B580 разлетелись как горячие пирожки 8 ч.
США столкнутся с дефицитом электроэнергии из-за ИИ уже в 2025 году, предупредил отраслевой регулятор 8 ч.
США нащупали угрозу нацбезопасности в роутерах TP-Link и собираются их запретить 8 ч.