Сегодня 13 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ сделала открытой ИИ-модель с поддержкой 4000 языков

Компания Meta выложила в открытый доступ модель искусственного интеллекта Massively Multilingual Speech (MMS), которая распознаёт разговорную речь на 4000 языках и воспроизводит её, то есть преобразует текст в речь более чем на 1100 языках.

 Источник изображения: Gerd Altmann / pixabay.com

Источник изображения: Gerd Altmann / pixabay.com

Модели распознавания речи и преобразования текста в речь обычно предполагают обучение на нескольких тысяч часов аудиозаписей с текстовой расшифровкой и разметкой. Но задача сильно усложняется для языков, которые в индустриальном мире не используются — для них исходных данных в традиционном формате просто не существует, рассказали в Meta. Поэтому в компании прибегли к нестандартному подходу и обратились к религиозным текстам — Библия и другие основополагающие книги переведены на большое количество языков, и существует множество общедоступных аудиозаписей, на которых эти тексты зачитываются. Обучение модели усложнилось из-за того, что аудиозаписи не имели точной текстовой разметки, но в итоге число поддерживаемых языков превысило 4000.

Авторы проекта подчеркнули, что, несмотря на содержание обучающих материалов, у обученной на этих текстах модели не появилось уклона в сторону религиозного мировоззрения; не возникло и гендерного перекоса, хотя большинство взятых за образец аудиозаписей зачитывали мужчины. Проблему с отсутствием текстовой разметки у аудиозаписей удалось преодолеть за счёт wav2vec 2.0 — ещё одной ИИ-модели Meta, предназначенной для «обучения представлению речи с самоконтролем». В компании предупредили, что результат может быть не идеальным — есть риск, что модель преобразования речи в текст могла неверно интерпретировать некоторые слова и фразы, и в некоторых контекстах такие ошибки порой носят оскорбительный характер. Но на практике, утверждают разработчики, MMS демонстрирует вдвое меньше ошибок, чем существующие аналоги, включая модель OpenAI Whisper, и поддерживает в 11 раз больше языков.

На практике проект откроет носителям редких языков доступ к информации и технологическим продуктам — большинство сервисов современных технологических гигантов ограничено набором в 100 языков, и такое положение вещей в Meta считают неприемлемым.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Мы рады подорвать мир снова»: Amazon подтвердила, когда выйдет второй сезон «Фоллаут», и продлила сериал на третий 8 мин.
iPhone научатся дольше работать от батареи — Apple поручит ИИ управление питанием 10 ч.
Sony случайно «слила» трейлер с датой выхода Stellar Blade на ПК 11 ч.
Doom: The Dark Ages по ошибке вышла в Steam раньше времени, но не для всех 12 ч.
«Давайте нам деньги и вычислительные ресурсы и не путайтесь под ногами»: OpenAI и Microsoft пытаются договориться о продолжении сотрудничества на фоне роста амбиций стартапа 13 ч.
Календарь релизов — 12–18 мая: Doom: The Dark Ages, The Precinct и Preserve 14 ч.
Remedy анонсировала закрытое тестирование шутера FBC: Firebreak по мотивам Control — сроки, системные требования, доступный контент 14 ч.
Nvidia выпустила драйвер GeForce с поддержкой Doom: The Dark Ages 15 ч.
Вышла новая версия песочницы Kaspersky Research Sandbox 3.0 с расширенными возможностями для ИБ-специалистов 16 ч.
Смартфоны Honor 400 смогут анимировать фото с помощью ИИ-генератора от Google 17 ч.
Microsoft надеется, что ИИ ускорит создания термоядерных реакторов, которые смогут запитать ещё больше ЦОД для ИИ 32 мин.
NASA превратило крики умирающей звезды в музыкальную композицию 48 мин.
Samsung снизила уровень брака в 2-нм техпроцессе и нацелилась на заказы от Nvidia и Qualcomm 2 ч.
Суперконденсаторы могут спасти энергосети от скачков потребления, вызванных ИИ ЦОД 2 ч.
Американские регуляторы заинтересовались способностью роботакси Tesla передвигаться в условиях ограниченной видимости 4 ч.
Смартфонный патриотизм: поставки iPhone, Galaxy и других иностранных брендов в Китай рухнули почти на 50 % 5 ч.
Аналоговый электропикап Slate Auto собрал 100 000 предзаказов всего за две недели 5 ч.
Новая статья: Обзор робота-пылесоса Midea VCR S10 Plus: одноразовые мешки для сбора мусора, прощайте! 10 ч.
Google и Elementl реализуют в США три 600-МВт атомных проекта 13 ч.
Western Digital инвестирует в технологию вечного хранения данных на керамике Cerabyte 14 ч.