Сегодня 15 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ представила SeamlessM4T — универсальную ИИ-модель для перевода текста и речи почти на 100 языков, включая русский

Сегодня Meta представила SeamlessM4T, первую универсальную мультимодальную и многоязычную модель перевода с использованием ИИ, которая позволяет пользователям общаться, не замечая языковых барьеров. SeamlessM4T на данный момент доступна исследователям и разработчикам под соответствующей лицензией. Также опубликованы метаданные SeamlessAlign, крупнейшего открытого набора данных для мультимодального перевода, включающего 270 000 часов изученной речи.

 Источник изображения: ***

Источник изображения: Meta

Создание универсального языкового переводчика, подобного вымышленной «Вавилонской рыбке» из романов Дугласа Адамса «Автостопом по Галактике», является непростой задачей, а существующие системы преобразования речи в речь и речи в текст охватывают лишь небольшую часть языков мира. SeamlessM4T основана на достижениях исследователей всего мира за многие годы в стремлении создать универсальный переводчик. По сравнению с подходами, использующими отдельные модели, единый системный подход SeamlessM4T уменьшает количество ошибок и задержек, повышая эффективность и качество процесса перевода.

 Прикольный гаджет!  / Источник изображения: Фильм «Автостопом по Галактике»

Прикольный гаджет! / Источник изображения: Фильм «Автостопом по Галактике»

В прошлом году разработчики Meta выпустили No Language Left Behind (NLLB), модель машинного перевода текста в текст, которая поддерживает 200 языков и с тех пор интегрирована в Википедию в качестве одного из поставщиков услуг перевода. Ранее они продемонстрировали универсальный переводчик речи, который стал первой системой прямого преобразования речи в речь для южноминьского языка (диалект китайского). Ещё один языковой проект Meta — Massively Multilingual Speech, система по распознаванию, идентификации и синтезу речи на более чем 1100 языках.

SeamlessM4T опирается на результаты всех этих проектов, обеспечивая многоязычный и мультимодальный перевод на основе единой модели, построенной на широком спектре устных источников данных с самыми современными результатами. SeamlessM4T поддерживает:

  • Распознавание речи почти на 100 языках;
  • Преобразование речи в текст почти для 100 языков ввода и вывода;
  • Преобразование речи в речь, поддержка почти 100 языков ввода и 36 (включая английский и русский) языков вывода;
  • Текстовый перевод почти на 100 языков;
  • Преобразование текста в речь, поддержка почти 100 языков ввода и 35 (включая английский и русский) языков вывода.

SeamlessM4T — очередной шаг в усилиях исследователей по созданию технологии на базе ИИ, которая поможет соединять людей, говорящих на разных языках. Узнать больше о SeamlessM4T можно в блоге Meta AI.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Samsung рассказала, когда смартфоны Galaxy начнут получать One UI 8 на базе Android 16 15 мин.
ИИ в поиске нового Пеле: нейросети подключили к отбору талантливых футболистов в Бразилии 18 мин.
«Аквариус» предложил президенту распространить на весь ИТ-сектор меры поддержки выхода на фондовый рынок 41 мин.
Объём российского рынка СУБД к 2031 году превысит 251 млрд рублей 2 ч.
Российский суд запретил Google Ireland мешать банкротству «Гугл» в суде США 2 ч.
Успех Assassin’s Creed Shadows подтолкнул Ubisoft тратить больше времени на разработку — сразу несколько «наиболее крупных» игр перенесены 2 ч.
«Выпускайте Палача»: спустя пять лет после Doom Eternal на ПК и консолях вышла Doom: The Dark Ages 3 ч.
«Hey, Copilot!»: Microsoft начала тестировать голосовой запуск ИИ в Windows 3 ч.
Российский суд оштрафовал WhatsApp и Signal на 800 000 рублей каждого 3 ч.
VK похвалилась, что почти удвоила число блогеров в «VK Видео» за девять месяцев 4 ч.
Asus представила белую видеокарту TUF RTX 5070 Ti BTF с альтернативным съёмным разъёмом питания 11 мин.
Спрос на AMD Instinct MI325X со стороны крупных компаний оказался ниже ожиданий из-за ограниченных возможностей масштабирования 22 мин.
Китайские автопроизводители запустили гонку по созданию электрических летательных аппаратов 2 ч.
Учёные США массово ищут работу за границей — этим воспользуются Китай и Европа 2 ч.
Oracle выделит $14 млрд на развитие ИИ и облака в Саудовской Аравии 3 ч.
Игровые видеокарты Nvidia подорожали в Китае после запрета ускорителей H20 3 ч.
vStack и TERA IT готовят HCI ПАК для бизнеса и госсектора 3 ч.
Tencent заявила о запасах ИИ-ускорителей на годы вперёд — санкции США не остановят развитие китайского ИИ 3 ч.
Китай начал стоить дата-центр с ИИ на орбите — запущены первые 12 из 2800 спутников 3 ч.
Synology готовит All-Flash СХД PAS7700 на платформе AMD 3 ч.