Сегодня 18 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ выпустила ИИ, который налету переводит текст с русского и ещё ста языков

Meta выпустила модель искусственного интеллекта SeamlessM4T, способную осуществлять перевод со 101 языка. Проект является шагом к созданию универсального переводчика в реальном времени, который сможет обрабатывать устную речь, как только она произносится.

 Источник изображения: Sophia Richards / unsplash.com

Источник изображения: Sophia Richards / unsplash.com

Традиционные модели ИИ для перевода работают по многоэтапной схеме: сначала устная речь превращается в текст, затем осуществляется перевод этого текста на другой язык, после чего текст на новом языке снова превращается в устную речь. Этот метод не всегда достаточно эффективен, поскольку на каждом этапе существует вероятность возникновения ошибок, которые грозят неправильным результатом перевода. Новая модель Meta SeamlessM4T осуществляет перевод напрямую и срабатывает, по словам разработчиков, на 23 % точнее, чем лучшие современные модели. В арсенале Google значится модель AudioPaLM, которая поддерживает 113 языков, но осуществляет перевод только на английский; SeamlessM4T переводит со 101 языка на 36.

Залогом успеха проекта стал процесс параллельного сбора данных: ИИ фиксирует случаи в просканированных данных источников в вебе совпадения звука или видео с субтитрами на другом языке. В результате модель научилась связывать эти звуки на одном языке с соответствующими фрагментами текста на другом. Авторы проекта, однако, признают, что участие человека в переводе остаётся важным: человек способен учитывать культурный контекст и обеспечить передачу смысла высказывания с одного языка на другой. В медицине или юриспруденции машинный перевод должен тщательно проверяться человеком — в противном случае могут возникать недоразумения.

Следует также учесть, что у моделей ИИ могут быть разные объёмы обучающих данных для разных языков: может быть много примеров перевода с греческого на английский, но отсутствовать данные для перевода с суахили на греческий. Чтобы решить эту проблему, разработчики SeamlessM4T предварительно обучали модель на миллионах часов аудиозаписей разговоров на разных языках. Эта подготовка помогла ИИ распознавать общие закономерности языков — в результате упростилась обработка менее распространённых языков, поскольку модель уже располагала основными данными о том, как должна звучать разговорная речь на них.

Система доступна с открытым исходным кодом, что, как надеются разработчики, побудит других развивать её текущие возможности. Некоторые эксперты пока сомневаются в том, насколько SeamlessM4T может быть полезна на практике и указывают, что закрытая модель Google работает значительно быстрее. В Meta же утверждают, что специалисты компании уже создали более свежую версию Seamless, которая по скорости работы не уступает переводчикам-людям.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
TikTok предупредил, что завтра прекратит работу в США, если Байден не вмешается 7 мин.
Instagram добавил новые функции в Reels в преддверии блокировки TikTok в США 3 ч.
Новая статья: Marvel Rivals — нужна ли теперь Overwatch? Рецензия 13 ч.
Ремастер Tomb Raider: The Angel of Darkness для сборника Tomb Raider IV-VI Remastered раскроет потенциал худшей игры серии — подробности улучшений 15 ч.
Первый «геймплей» Virtua Fighter 6 оказался точной копией боевой сцены из фильма «Драконы навсегда» с Джеки Чаном 17 ч.
Руководитель разработки Dragon Age: The Veilguard покинет BioWare после 18 лет в Electronic Arts 18 ч.
Верховный суд США поддержал закон о блокировке TikTok — соцсети осталось два дня 18 ч.
ЕС потребовал от соцсети X раскрыть алгоритм рекомендаций и политику модерирования 19 ч.
Российские пользователи пожаловались на сбой Steam, но Роскомнадзор тут ни при чём 19 ч.
Планшеты Android 16 смогут запускать до трёх приложений на одном экране 20 ч.
Amazon прекратила доставлять товары дронами после инцидента на испытательном полигоне 2 ч.
Во Франции создали крошечного робота-хирурга, который очень аккуратно покопается в мозгах 2 ч.
SpaceX запретили запускать Starship на время расследования взрыва при последнем полёте 3 ч.
Стартап по выпуску электромобилей Canoo объявил о своём банкротстве и прекращении деятельности 5 ч.
GlobalFoundries построить в США исследовательский центр и новую фабрику на субсидии по «Закону о чипах» 6 ч.
Трамп планирует объявить криптовалюту национальным приоритетом и создать консультативный совет по криптовалютам 12 ч.
Sparkle и OEC переработают 22 тыс. км подводных кабелей 13 ч.
Lenovo купила поставщика СХД Infinidat 14 ч.
Aligned Data Centers получила $12 млрд на расширение парка ИИ ЦОД 15 ч.
Вышел смартфон RedMagic X Golden Saga с позолоченной системой охлаждения и карбоновой крышкой 16 ч.