Сегодня 06 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ представила SeamlessM4T — универсальную ИИ-модель для перевода текста и речи почти на 100 языков, включая русский

Сегодня Meta представила SeamlessM4T, первую универсальную мультимодальную и многоязычную модель перевода с использованием ИИ, которая позволяет пользователям общаться, не замечая языковых барьеров. SeamlessM4T на данный момент доступна исследователям и разработчикам под соответствующей лицензией. Также опубликованы метаданные SeamlessAlign, крупнейшего открытого набора данных для мультимодального перевода, включающего 270 000 часов изученной речи.

 Источник изображения: ***

Источник изображения: Meta

Создание универсального языкового переводчика, подобного вымышленной «Вавилонской рыбке» из романов Дугласа Адамса «Автостопом по Галактике», является непростой задачей, а существующие системы преобразования речи в речь и речи в текст охватывают лишь небольшую часть языков мира. SeamlessM4T основана на достижениях исследователей всего мира за многие годы в стремлении создать универсальный переводчик. По сравнению с подходами, использующими отдельные модели, единый системный подход SeamlessM4T уменьшает количество ошибок и задержек, повышая эффективность и качество процесса перевода.

 Прикольный гаджет!  / Источник изображения: Фильм «Автостопом по Галактике»

Прикольный гаджет! / Источник изображения: Фильм «Автостопом по Галактике»

В прошлом году разработчики Meta выпустили No Language Left Behind (NLLB), модель машинного перевода текста в текст, которая поддерживает 200 языков и с тех пор интегрирована в Википедию в качестве одного из поставщиков услуг перевода. Ранее они продемонстрировали универсальный переводчик речи, который стал первой системой прямого преобразования речи в речь для южноминьского языка (диалект китайского). Ещё один языковой проект Meta — Massively Multilingual Speech, система по распознаванию, идентификации и синтезу речи на более чем 1100 языках.

SeamlessM4T опирается на результаты всех этих проектов, обеспечивая многоязычный и мультимодальный перевод на основе единой модели, построенной на широком спектре устных источников данных с самыми современными результатами. SeamlessM4T поддерживает:

  • Распознавание речи почти на 100 языках;
  • Преобразование речи в текст почти для 100 языков ввода и вывода;
  • Преобразование речи в речь, поддержка почти 100 языков ввода и 36 (включая английский и русский) языков вывода;
  • Текстовый перевод почти на 100 языков;
  • Преобразование текста в речь, поддержка почти 100 языков ввода и 35 (включая английский и русский) языков вывода.

SeamlessM4T — очередной шаг в усилиях исследователей по созданию технологии на базе ИИ, которая поможет соединять людей, говорящих на разных языках. Узнать больше о SeamlessM4T можно в блоге Meta AI.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Ничего стыдного в этом нет»: разработчики The Witcher 4 признались, что вдохновляются Kingdom Come: Deliverance и Baldur’s Gate 3 59 мин.
Google навела порядок в Gemini 2.5 Pro — исправлены накопившиеся у ИИ-модели «регрессии» 2 ч.
Game Science подтвердила дату выхода Black Myth: Wukong на Xbox и анонсировала первую скидку на игру 3 ч.
Акции Microsoft установили новый рекорд стоимости вопреки падающему рынку 4 ч.
Apple представила данные о $1,3 трлн оборота App Store перед WWDC25 13 ч.
Windows 11 получит лёгкий текстовой редактор Edit — «Блокнот» стал слишком перегружен 16 ч.
В России заработала система блокировки мошеннических сайтов и приложений 18 ч.
AMD выпустила драйвер с поддержкой видеокарт Radeon RX 9060 XT и Radeon AI Pro R9700 18 ч.
Классические Baldur’s Gate, EA Sports FC 25 и четыре новых релиза: Microsoft раскрыла, чем порадует подписчиков Game Pass в начале июня 19 ч.
Живописное приключение Sword of the Sea от создателей Abzu и The Pathless выглядит как наследник Journey — новый трейлер и дата выхода 20 ч.
После рекордного обвала акции Tesla пошли вверх, поскольку Трамп и Маск готовят примирение 43 мин.
Японский лунный аппарат Resilience с мини-луноходом долетел до Луны — и мгновенно разобрался 45 мин.
В Китае испытали сверхзащищённый канал уникальной квантовой связи с взлетающей ракетой 2 ч.
Huawei и XPeng представили гигантский 87-дюймовый проекционный дисплей для авто 2 ч.
Nvidia захватила 92 % рынка видеокарт, но Intel осталась лидером на рынке GPU 2 ч.
Представлены графеновые термопрокладки для процессоров AMD AM5 с рекордной теплопроводностью и долговечностью 2 ч.
Razer выпустила Phantom Collection — клавиатуру, мышь, гарнитуру и коврик в полупрозрачных корпусах 3 ч.
Endeavour предложила ЦОД натриевые батареи Tiamat 3 ч.
Созданы первые устойчивые к ошибкам фотонные квантовые процессоры — миллионы кубитов уже не за горами 4 ч.
Castrol запустила сервис управления оборотом жидкостей для охлаждения дата-центров 4 ч.