Сегодня 02 ноября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ представила SeamlessM4T — универсальную ИИ-модель для перевода текста и речи почти на 100 языков, включая русский

Сегодня Meta представила SeamlessM4T, первую универсальную мультимодальную и многоязычную модель перевода с использованием ИИ, которая позволяет пользователям общаться, не замечая языковых барьеров. SeamlessM4T на данный момент доступна исследователям и разработчикам под соответствующей лицензией. Также опубликованы метаданные SeamlessAlign, крупнейшего открытого набора данных для мультимодального перевода, включающего 270 000 часов изученной речи.

 Источник изображения: ***

Источник изображения: Meta

Создание универсального языкового переводчика, подобного вымышленной «Вавилонской рыбке» из романов Дугласа Адамса «Автостопом по Галактике», является непростой задачей, а существующие системы преобразования речи в речь и речи в текст охватывают лишь небольшую часть языков мира. SeamlessM4T основана на достижениях исследователей всего мира за многие годы в стремлении создать универсальный переводчик. По сравнению с подходами, использующими отдельные модели, единый системный подход SeamlessM4T уменьшает количество ошибок и задержек, повышая эффективность и качество процесса перевода.

 Прикольный гаджет!  / Источник изображения: Фильм «Автостопом по Галактике»

Прикольный гаджет! / Источник изображения: Фильм «Автостопом по Галактике»

В прошлом году разработчики Meta выпустили No Language Left Behind (NLLB), модель машинного перевода текста в текст, которая поддерживает 200 языков и с тех пор интегрирована в Википедию в качестве одного из поставщиков услуг перевода. Ранее они продемонстрировали универсальный переводчик речи, который стал первой системой прямого преобразования речи в речь для южноминьского языка (диалект китайского). Ещё один языковой проект Meta — Massively Multilingual Speech, система по распознаванию, идентификации и синтезу речи на более чем 1100 языках.

SeamlessM4T опирается на результаты всех этих проектов, обеспечивая многоязычный и мультимодальный перевод на основе единой модели, построенной на широком спектре устных источников данных с самыми современными результатами. SeamlessM4T поддерживает:

  • Распознавание речи почти на 100 языках;
  • Преобразование речи в текст почти для 100 языков ввода и вывода;
  • Преобразование речи в речь, поддержка почти 100 языков ввода и 36 (включая английский и русский) языков вывода;
  • Текстовый перевод почти на 100 языков;
  • Преобразование текста в речь, поддержка почти 100 языков ввода и 35 (включая английский и русский) языков вывода.

SeamlessM4T — очередной шаг в усилиях исследователей по созданию технологии на базе ИИ, которая поможет соединять людей, говорящих на разных языках. Узнать больше о SeamlessM4T можно в блоге Meta AI.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google представила Learn About — инструмент интерактивного обучения на базе искусственного интеллекта 37 мин.
Аудитория Threads превысила 275 млн пользователей за год с момента её запуска 4 ч.
У VK Cloud появился ИИ-консультант по облачным сервисам 7 ч.
На «Госуслугах» появилась форма для регистрации блогеров с аудиторией более 10 тыс. подписчиков 8 ч.
Правительство запретило незарегистрированным майнерам расходовать более 6000 кВт·ч электроэнергии в месяц 8 ч.
Apple объявила о покупке популярного редактора изображений Pixelmator литовской разработки 14 ч.
Новая статья: Neva — белый Бим Черные рога. Рецензия 19 ч.
Авторы «Мора» объяснили, зачем превратили кампанию Бакалавра в Pathologic 3, и вспомнили про Самозванку 19 ч.
Google начал внедрять генеративный ИИ в «Карты» и другие геосервисы 20 ч.
Создатель DayZ анонсировал «убийцу Kerbal Space Program» — Kitten Space Agency 21 ч.
Тесты Qualcomm Snapdragon 8 Elite показали, что смартфоны на нём склонны к перегреву 29 мин.
В гонке за передовым ИИ техногиганты потратят в 2024 году более $200 млрд 3 ч.
Intel до сих пор не начала зарабатывать на контрактном производстве чипов — заказов очень мало 3 ч.
Созданы сверхтонкие солнечные панели для дирижаблей — их масса меньше 700 г на квадратный метр 4 ч.
OnePlus 13 возглавил рейтинг самых мощных Android-смартфонов по итогам октября 4 ч.
В США задумались о санкциях против китайских производителей дисплеев — они вытесняют всех конкурентов 4 ч.
Спутники мобильной связи AST SpaceMobile стали ярчайшими объектами на ночном небе — астрономы в шоке 4 ч.
Власти США готовят «план спасения Intel» на случай дальнейшего ухудшения её финансового положения 4 ч.
Samsung в 2025 году выпустит собственную гарнитуру смешанной реальности по цене до $1500 4 ч.
Австралия взялась заменить Китай на рынке редкоземельных металлов в случае обострения санкционной войны 5 ч.