Сегодня 18 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-переводчик Meta✴ научился переводить языки, не имеющие письменности

Приблизительно 2,8 тысяч языков мира из семи тысяч известных существуют без письменности. Такие языки не подходят для современных систем перевода на основе алгоритмов машинного обучения, поскольку обычно компьютеры переводят устную речь в письменную для последующего перевода на другой язык. Компании Meta, похоже, удалось решить эту проблему, благодаря новому ИИ-инструменту.

 Источник изображения:  bruce mars/unsplash.com

Источник изображения: bruce mars/unsplash.com

В рамках разработанной Meta программы Universal Speech Translator (UST) устная речь на одном языке будет переводиться в устную же на другом, благодаря чему будущие жители метавселенной, смогут намного легче взаимодействовать друг с другом.

В рамках проекта исследователи обратились к диалекту хоккиен — одному из официальных языков Тайваня и довольно широко распространённому в Азии, при этом не имеющему собственной письменности.

Для тренировки системам машинного перевода обычно необходимы письменные и устные образцы языка. Для того чтобы обойти подобные ограничения, используется модель т.н. speech-to-unit translation (S2UT), в рамках которой устная речь преобразуется в «акустические единицы» в режиме реального времени.

Речь на не имеющем письменности языке конвертируется сначала в текст на родственном языке-посреднике, имеющем письменность (в данном случае на мандаринском диалекте), который уже можно переводить на английский и наоборот с последующим машинным обучением системы. Пока система обеспечивает ограниченное общение носителей хоккиена и говорящих по-английски. Она переводит по предложению за раз, но глава Meta Марк Цукерберг (Mark Zuckerberg) уверен, что со временем модель будет использована с разными языками и позволит общаться в режиме реального времени.

Помимо моделей и тренировочных данных, уже выложенных Meta в открытый доступ, компания опубликовала и другие инструменты, потенциально позволяющие исследователям создавать собственные системы для перевода устной речи в устную (S2ST).

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Первый сторонний магазин iOS-приложений стал доступен в Евросоюзе 27 мин.
В России открыли Ассоциацию развития киберспортивной инфраструктуры — владельцы компьютерных клубов хотят добиться налоговых льгот 31 мин.
OpenAI GPT-4 достигла уровня врачей-офтальмологов в диагностике глазных заболеваний 55 мин.
Российский суд оштрафовал Twitch и Pinterest — каждого на 1 млн рублей 59 мин.
Игровой движок Unigine вернулся в реестр российского ПО благодаря усилиям разработчиков 2 ч.
Bethesda удалила Denuvo из Ghostwire: Tokyo, но умолчала об этом 3 ч.
Т1 и МФТИ предложат российскому бизнесу решения на базе квантовых алгоритмов 3 ч.
TikTok начал тестировать Notes — конкурента Instagram 3 ч.
Необычный платформер-головоломка Schim о потерявшем своего человека духе выйдет из тени в июле — дата релиза и новый трейлер 5 ч.
Криптовалюта продолжила падение: биткоин опустился ниже $60 тысяч, а Ethereum — ниже $3 тысяч 5 ч.
Китайские Dongfeng и Chery задумались о локализации выпуска электромобилей в Европе 51 мин.
«Ангару» снов запустят с Восточного только в 2027 году, зато сразу с кораблём «Орёл» 52 мин.
Компания Gagar>n представила OCP-серверы «Оракул Gen 3» и «Простор Gen 1» на базе Intel Xeon 2 ч.
Toyota готовит электрический кроссовер Highlander с тремя рядами сидений 2 ч.
Более 1000 км без подзарядки: электромобиль Nio ET7 с полутвердотельной батареей испытали в реальных условиях 2 ч.
Eviden и CEA анонсировали второй суперкомпьютер EXA1 — HE на базе Arm-суперчипов NVIDIA Grace Hopper 2 ч.
Прототип гражданского самолёта Boom Supersonic допустили к первому сверхзвуковому полёту 2 ч.
Huawei представила флагманские смартфоны Pura 70, 70 Pro, 70 Pro+ с чипами Kirin и камерами с переменной диафрагмой 3 ч.
Rivos, разработчик ИИ-ускорителей на базе RISC-V, получил на развитие более $250 млн 3 ч.
Россияне купили более миллиона умных колонок с января по март — подавляющее большинства от «Яндекса» 3 ч.