Сегодня 25 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ представила SeamlessM4T — универсальную ИИ-модель для перевода текста и речи почти на 100 языков, включая русский

Сегодня Meta представила SeamlessM4T, первую универсальную мультимодальную и многоязычную модель перевода с использованием ИИ, которая позволяет пользователям общаться, не замечая языковых барьеров. SeamlessM4T на данный момент доступна исследователям и разработчикам под соответствующей лицензией. Также опубликованы метаданные SeamlessAlign, крупнейшего открытого набора данных для мультимодального перевода, включающего 270 000 часов изученной речи.

 Источник изображения: ***

Источник изображения: Meta

Создание универсального языкового переводчика, подобного вымышленной «Вавилонской рыбке» из романов Дугласа Адамса «Автостопом по Галактике», является непростой задачей, а существующие системы преобразования речи в речь и речи в текст охватывают лишь небольшую часть языков мира. SeamlessM4T основана на достижениях исследователей всего мира за многие годы в стремлении создать универсальный переводчик. По сравнению с подходами, использующими отдельные модели, единый системный подход SeamlessM4T уменьшает количество ошибок и задержек, повышая эффективность и качество процесса перевода.

 Прикольный гаджет!  / Источник изображения: Фильм «Автостопом по Галактике»

Прикольный гаджет! / Источник изображения: Фильм «Автостопом по Галактике»

В прошлом году разработчики Meta выпустили No Language Left Behind (NLLB), модель машинного перевода текста в текст, которая поддерживает 200 языков и с тех пор интегрирована в Википедию в качестве одного из поставщиков услуг перевода. Ранее они продемонстрировали универсальный переводчик речи, который стал первой системой прямого преобразования речи в речь для южноминьского языка (диалект китайского). Ещё один языковой проект Meta — Massively Multilingual Speech, система по распознаванию, идентификации и синтезу речи на более чем 1100 языках.

SeamlessM4T опирается на результаты всех этих проектов, обеспечивая многоязычный и мультимодальный перевод на основе единой модели, построенной на широком спектре устных источников данных с самыми современными результатами. SeamlessM4T поддерживает:

  • Распознавание речи почти на 100 языках;
  • Преобразование речи в текст почти для 100 языков ввода и вывода;
  • Преобразование речи в речь, поддержка почти 100 языков ввода и 36 (включая английский и русский) языков вывода;
  • Текстовый перевод почти на 100 языков;
  • Преобразование текста в речь, поддержка почти 100 языков ввода и 35 (включая английский и русский) языков вывода.

SeamlessM4T — очередной шаг в усилиях исследователей по созданию технологии на базе ИИ, которая поможет соединять людей, говорящих на разных языках. Узнать больше о SeamlessM4T можно в блоге Meta AI.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Стараниями Илона Маска IBM потеряла миллионные контракты, но всё равно превзошла ожидания аналитиков по итогам квартала 2 ч.
Remedy подтвердила дату выхода и показала много геймплея кооперативного шутера FBC: Firebreak во вселенной Control 3 ч.
Epic Games Store запустил на PC, Android и iOS раздачу комедийного приключения Chuchel от создателей Machinarium и Botanicula 3 ч.
Европейские правозащитники обвинили Ubisoft в незаконном сборе данных игроков 5 ч.
Браузер Chrome для Android наконец-то научился открывать PDF-файлы 6 ч.
9 из 10 россиян хотя бы раз в месяц посещают «ВКонтакте» — VK похвасталась популярностью сервисов и отчиталась о росте выручки 8 ч.
Adobe создала аналог robots.txt для изображений, чтобы запретить обучать ИИ на них 8 ч.
Сюжетный трейлер раскрыл дату выхода Unfinished Business — самостоятельного дополнения к RoboCop: Rogue City 9 ч.
Видеосервис для совместной работы MWS TeamStream на треть сократит время общения сотрудников 9 ч.
Meta предложила Amazon и Microsoft «скинуться» на обучение ИИ-моделей Llama 10 ч.
Новая статья: Обзор смартфона Samsung Galaxy A56: игра в классики 5 мин.
Новая статья: Корпус DeepCool CG580: максимум функциональности, минимум стоимости 2 ч.
Razer выпустила свою первую мышь с «рукопожатным» хватом — Pro Click V2 Vertical Edition 3 ч.
Квантовым процессорам из кремния быть — австралийский стартап впервые запутал квантовые «транзисторы» 3 ч.
Motorola представила мощные смартфоны Edge 60 и Edge 60 Pro с ёмкими батареями и Pantone-дисплеями 3 ч.
Xiaomi представила первый в мире смартфон на Snapdragon 8s Gen 4 — Redmi Turbo 4 Pro по цене от $275 5 ч.
Швеция не нашла следов намеренного повреждения кабелей на Балтике, но Китай всё равно мешает расследованию 5 ч.
Xiaomi выпустила игровой монитор Redmi G Pro 27U с Mini-LED и поддержкой 4K со 160 Гц и 1080p с 320 Гц всего за $370 5 ч.
AMD всё же выпустит ещё одну модификацию Radeon RX 9070 — она будет медленнее остальных 6 ч.
Минцифры продаст «фактически последние свободные частоты» для 5G за более чем ₽40 млрд 7 ч.