Сегодня 12 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ представила SeamlessM4T — универсальную ИИ-модель для перевода текста и речи почти на 100 языков, включая русский

Сегодня Meta представила SeamlessM4T, первую универсальную мультимодальную и многоязычную модель перевода с использованием ИИ, которая позволяет пользователям общаться, не замечая языковых барьеров. SeamlessM4T на данный момент доступна исследователям и разработчикам под соответствующей лицензией. Также опубликованы метаданные SeamlessAlign, крупнейшего открытого набора данных для мультимодального перевода, включающего 270 000 часов изученной речи.

 Источник изображения: ***

Источник изображения: Meta

Создание универсального языкового переводчика, подобного вымышленной «Вавилонской рыбке» из романов Дугласа Адамса «Автостопом по Галактике», является непростой задачей, а существующие системы преобразования речи в речь и речи в текст охватывают лишь небольшую часть языков мира. SeamlessM4T основана на достижениях исследователей всего мира за многие годы в стремлении создать универсальный переводчик. По сравнению с подходами, использующими отдельные модели, единый системный подход SeamlessM4T уменьшает количество ошибок и задержек, повышая эффективность и качество процесса перевода.

 Прикольный гаджет!  / Источник изображения: Фильм «Автостопом по Галактике»

Прикольный гаджет! / Источник изображения: Фильм «Автостопом по Галактике»

В прошлом году разработчики Meta выпустили No Language Left Behind (NLLB), модель машинного перевода текста в текст, которая поддерживает 200 языков и с тех пор интегрирована в Википедию в качестве одного из поставщиков услуг перевода. Ранее они продемонстрировали универсальный переводчик речи, который стал первой системой прямого преобразования речи в речь для южноминьского языка (диалект китайского). Ещё один языковой проект Meta — Massively Multilingual Speech, система по распознаванию, идентификации и синтезу речи на более чем 1100 языках.

SeamlessM4T опирается на результаты всех этих проектов, обеспечивая многоязычный и мультимодальный перевод на основе единой модели, построенной на широком спектре устных источников данных с самыми современными результатами. SeamlessM4T поддерживает:

  • Распознавание речи почти на 100 языках;
  • Преобразование речи в текст почти для 100 языков ввода и вывода;
  • Преобразование речи в речь, поддержка почти 100 языков ввода и 36 (включая английский и русский) языков вывода;
  • Текстовый перевод почти на 100 языков;
  • Преобразование текста в речь, поддержка почти 100 языков ввода и 35 (включая английский и русский) языков вывода.

SeamlessM4T — очередной шаг в усилиях исследователей по созданию технологии на базе ИИ, которая поможет соединять людей, говорящих на разных языках. Узнать больше о SeamlessM4T можно в блоге Meta AI.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Персонализация поиска Google стала по-настоящему персональной — теперь можно самому выбирать источники 14 мин.
Capcom устроит «эксклюзивный показ» Resident Evil Requiem на Gamescom: Opening Night Live 36 мин.
Microsoft прекратит поддержку Windows 11 23H2 Home и Pro уже в ноябре 2 ч.
ИИ в работе и учёбе: почему непозволительно отключать голову 2 ч.
Веб-камеры Lenovo превратили в хакерские мультитулы — через них можно даже тайно взламывать ПК 2 ч.
«Победа для разработчиков и потребителей»: Fortnite вернётся на iOS в Австралии 3 ч.
League of Legends вскоре получит WASD-управление — игра станет дружелюбнее к новичкам 3 ч.
Nvidia выпустила драйвер, добавляющий поддержку DLSS 4 в GTA V Enhanced и Senua’s Saga: Hellblade II Enhanced 5 ч.
Sk Capital вложит в Softline 5 млрд рублей — это одна из крупнейших сделок на рынке 5 ч.
Геймплейный трейлер раскрыл дату выхода Henry Halfhead — поучительного приключения про половину головы с умением вселяться в предметы 6 ч.
Samsung выпустила первый телевизор с подсветкой Micro RGB и улучшенной цветопередачей 11 мин.
Учёные придумали невидимые для глаз световые водяные знаки для выявления дипфейков 2 ч.
Анонсирован смартфон Vivo V60 с оптикой Zeiss и ценой от $425 3 ч.
Мобильная графика Arm станет производительнее — в GPU встроят нейронные ускорители 3 ч.
Nvidia представила GeForce RTX 5090D V2: специальный флагман для Китая с урезанной памятью за те же деньги 4 ч.
Жаркая катка: видеокарта GeForce RTX 5090 вспыхнула во время игры в Battlefield 6 4 ч.
Supermicro представила 4U-сервер на базе NVIDIA HGX B200 с СЖО 4 ч.
Tesla запустила редкую рекламу своего автопилота, но пытается скрыть его несовершенство 4 ч.
Alibaba, ByteDance и другим китайским IT-гигантам придётся объясниться за закупки ИИ-ускорителей Nvidia H20 5 ч.
Китайские учёные отправили в Тибет робота-антилопу, который проследил за стадом настоящих 5 ч.