Сегодня 22 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

DeepL запустила переводчик устной речи в реальном времени — с поддержкой русского

Немецкая компания DeepL представила в своём онлайн-переводчике новую функцию DeepL Voice, ориентированную на использование в живых беседах и видеоконференциях. Теперь пользователи могут переводить устную речь с одного языка на другой и конвертировать в текст в режиме реального времени, сообщает TechCrunch. Этот шаг стал очередным ответом на растущий интерес к сервисам на основе искусственного интеллекта.

 Источник изображения: deepl.com

Источник изображения: deepl.com

Система машинного перевода DeepL Voice, выполняющая, по мнению самой компании, переводы «беспрецедентно высокого качества», поддерживает 13 языков — английский, немецкий, японский, корейский, шведский, голландский, французский, турецкий, польский, португальский, русский, испанский и итальянский. При этом текстовые субтитры доступны для 33 языков, поддерживаемых платформой.

Новый продукт DeepL может работать как в формате «зеркал», когда переводы отображаются на экране телефона, чтобы участники встречи могли видеть переведённый текст, так и в виде субтитров для видеоконференций. Пока DeepL Voice поддерживает интеграцию только с Microsoft Teams, что, по словам основателя компании Ярека Кутыловского (Jarek Kutylowski), на самом деле покрывает большую часть их клиентской базы. О поддержке других сервисов, таких как Zoom или Google Meet, информации пока нет.

Кутыловский отметил, что DeepL Voice является первым шагом компании в области голосовых технологий, и планируется дальнейшее развитие продукта. Он подчеркнул, что голосовой перевод занял одно из ключевых направлений, которое будет активно развиваться в ближайшие годы, при этом DeepL продолжит улучшать качество своих переводов, разрабатывая собственные ИИ-модели, благодаря которым возможно достичь более высокой точности, особенно в режиме реального времени.

Глава компании также рассказал о возможных сценариях использования новой функции. Например, в сфере обслуживания, где сотрудники ресторанов, кафе и отелей смогут общаться с клиентами, говорящими на разных языках. Что же касается конфиденциальности данных, ведь обработка голосов пользователей происходит на серверах компании, Кутыловский заверил, что DeepL не сохраняет и не использует аудиозаписи для обучения своих моделей, а также соблюдает все требования GDPR и других нормативных актов.

Стоит отметить, что DeepL не единственная компания, работающая над подобными решениями. Google и другие стартапы, такие как Eleven Labs и Panjaya, также разрабатывают сервисы голосового перевода с конвертацией аудио в текст.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Foxconn немного охладела к покупке Nissan, но вернётся к этой теме, если слияние с Honda не состоится 4 ч.
В следующем году выйдет умная колонка Apple HomePod с 7-дюймовым дисплеем и поддержкой ИИ 4 ч.
Продажи AirPods превысили выручку Nintendo, они могут стать третьим по прибыльности продуктом Apple 5 ч.
Прорывы в науке, сделанные ИИ в 2024 году: археологические находки, разговоры с кашалотами и сворачивание белков 13 ч.
Arm будет добиваться повторного разбирательства нарушений лицензий компанией Qualcomm 17 ч.
Поставки гарнитур VR/MR достигнут почти 10 млн в 2024 году, но Apple Vision Pro занимает лишь 5 % рынка 19 ч.
Первая частная космическая станция появится на два года раньше, но летать на неё будет нельзя 20 ч.
В США выпущены федеральные нормы для автомобилей без руля и педалей 20 ч.
Для невыпущенного суперчипа Tachyum Prodigy выпустили 1600-страничное руководство по оптимизации производительности 22 ч.
Qualcomm выиграла в судебном разбирательстве с Arm — нарушений лицензий не было 21-12 08:39