Сегодня 22 октября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → переводчик
Быстрый переход

«Яндекс Переводчик» получит поддержку более 20 языков народов России

Разработчики из «Яндекса» добавят в «Переводчик» поддержку более 20 языков народов России, которые ранее не были представлены в сервисе. Реализация проекта займёт три года, а первый из новых языков — осетинский — уже доступен в «Переводчике».

 Источник изображения: «Яндекс»

Источник изображения: «Яндекс»

В дополнение к этому для некоторых новых языков будут доступны функции распознавания и синтеза речи, построенные на основе нейросетей. За счёт этого пользователи смогут узнать, как звучат те или иные слова на разных языках, а также получат возможность вести диалог с носителями языков. В мобильной версии сервиса доступен мгновенный перевод реплик, их отображение на экране устройства, а также озвучивание на выбранном языке. Первым языком, для которого будут реализованы эти возможности, станет татарский.

Позднее распознавание и синтез речи станут доступны для более чем 10 популярных языков, на каждом из которых в России говорят свыше 300 тыс. человек. «Яндекс» также сделает возможным перевод сайтов в «Браузере», добавит поддержку голосового ввода в «Поиске», «Картах» и мессенджерах посредством «Яндекс Клавиатуры». За счёт этого пользователи будут иметь возможность ознакомления с культурными особенностями народов страны через перевод их легенд, преданий и др. Вместе с этим виртуальный помощник «Алиса» сможет читать народные сказки на этих языках.

Данные поисковика «Яндекса» указывают на то, что россияне чаще всего ищут перевод фраз на татарском языке. Также популярностью пользуются башкирский и чувашский языки. В переводчике уже доступны эти и другие языки, такие как удмуртский, якутский и марийский. В дальнейшем «Яндекс» будет улучшать качество перевода на доступные языки и расширять их количество.

«Google Переводчик» получит поддержку более 110 новых языков, включая бурятский и чеченский

Служба «Google Переводчик» получит поддержку 110 новых языков, сообщили в компании. До настоящего времени служба работала со 133 языками, поэтому последнее обновление, которое в Google назвали самым значительным за всю историю, знаменует собой крупный скачок.

 Источник изображения: blog.google

Источник изображения: blog.google

«Выучить» новые языки «Переводчику» помогла большая языковая модель Google PaLM 2 — особенно хорошо она справилась с близкими друг к другу языками, например, с «близкими к Хинди, такими как авадхи и марвади, а также французскими креольскими языками, такими как сейшельский креольский и маврикийский креольский», рассказали в компании.

На 13 языках из списка добавленных в «Переводчик» говорят в России: это аварский, башкирский, бурятский, чеченский, чувашский, осетинский, удмуртский, чукотский, тувинский, якутский, крымско-татарский, коми и луговомарийский языки.

Список новых поддерживаемых языков «Google Переводчика» включает в себя кантонский диалект китайского — он «долгое время был одним из самых востребованных» на платформе. Найти данные для обучения модели было непросто, поскольку он в значительной степени пересекается с мандаринским на письме. Ещё около четверти новых языков происходят из Африки. На большинстве из новых языков говорят по меньше мере миллион человек, а в некоторых случаях речь идёт о сотнях миллионов.

«Яндекс» повысила качество работы «Переводчика» с помощью YandexGPT

Компания «Яндекс» повысила качество работы своей службы машинного перевода, произведя дополнительное обучение лежащей в её основе нейросети при помощи большой языковой модели YandexGPT. В результате «Яндекс Переводчик» стал лучше ориентироваться в контексте, фразеологизмах и профессиональной лексике.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Дополнительное обучение помогло сервису более качественно устанавливать связь между предложениями, и теперь он лучше справляется с длинными текстами. Благодаря навыкам анализа контекста машинный переводчик определяет профессиональную направленность текста и оставляет необходимые термины без перевода.

«Яндекс» начал использовать ИИ в «Переводчике» с 2018 года, обучив его на парах текстов — в оригинале и переводе на другой язык. Это легковесная нейросеть, которая может в реальном времени обрабатывать большое число запросов. YandexGPT, напротив, генерирует сложные тексты в лексическом и стилистическом разнообразии, включая специфическую терминологию. Поэтому большую языковую модель решили привлечь для дополнительного обучения нейросети-переводчика.

Инженеры «Яндекса» подготовили специальную версию YandexGPT, оптимизированную для перевода текстов. На этапе предварительного обучения она обработала большой объём текстов на русском и английском языках, изучила лексику, морфологию и синтаксис. Далее была произведена тонкая настройка большой языковой модели под задачи перевода; на этапе Reinforcement Learning (RL) производилась оценка качества перевода YandexGPT, а результаты ранжировались от лучших к худшим.

По завершении дополнительного обучения нейросети «Яндекс Переводчика» её работу подвергли сравнительной оценке. Владеющие русским и английским языками специалисты сравнивали пары длинных и сложных текстов, переведённых двумя версиями нейросети — новая справилась со своей задачей лучше в 57 % случаев. Обновлённая платформа уже подключена к «Яндекс Переводчику», поисковой системе и службе перевода видео в «Яндекс Браузере».

«Яндекс Переводчик» научился редактировать тексты на английском с помощью YandexGPT

«Яндекс» сообщил о расширении возможностей сервиса «Яндекс Переводчик», который теперь не только поможет пользователям сделать перевод контента, но отредактировать тексты на английском с помощью нейросети YandexGPT без глубокого знания языка.

 Источник изображения: «Яндекс»

Источник изображения: «Яндекс»

В новом разделе под названием «Редактор», который доступен для пользователей десктопной версии переводчика, можно улучшить текст, не исказив смысл написанного, переписать в более подходящем стиле с учётом характера общения, а также исправить ошибки. Функцию можно применить как ко всему тексту, так и к выделенному фрагменту.

Также с помощью переводчика можно подобрать синонимы для слова или выражения, выбрав подходящий из предложенных вариантов, что позволит разнообразить лексику.

Перечень опций раздела «Редактор» можно выбрать в колонке справа. Там же указано, что вскоре в разделе появятся ещё две опции, позволяющие сделать лексику проще или сложнее. Как отметил «Яндекс», лексику можно будет сделать более «продвинутой», близкой по стилю к академической литературе, научным статьям с помощью добавления в текст сложносоставных конструкций и редко употребляемых слов. Или, наоборот, упростить и сделать текст понятней для людей с базовым уровнем владения английским языком.

Meta✴ научила ИИ-модель SeamlessM4T переводить текст и речь быстрее и естественнее

Meta обновила свою ИИ-модель SeamlessM4T, предназначенную для перевода речи и текста. Теперь платформа поддерживает переводы почти на 100 языках, включая русский, в текстовом формате и на 36 — в устной речи. С новой архитектурой решения технологический гигант стремится сделать перевод более естественным и выразительным, что обещает стать прорывом в коммуникациях между людьми и производстве контента.

 Источник изображения: ***

Источник изображения: Meta

Meta построила SeamlessM4T на основе своей архитектуры многофункциональной модели UnitY на базе PyTorch, которая выполняет различные модальные переводы, а также автоматическое распознавание речи. Она использует систему BERT 2.0 для аудиокодирования, разбивая входные данные на составляющие токены для анализа, и HiFi-GAN unit vocoder для генерации голосовых ответов.

Первая из двух новых функций SeamlessM4T называется SeamlessExpressive. Как можно понять из названия, она переносит эмоциональные интонации голоса в переведённую речь. Система учитывает такие составляющие, как тон речи, её громкость, эмоциональный окрас (возбуждение, печаль или шёпот), темп речи и паузы. Всё это делает переводы менее механическими и более живыми. Поддерживаются английский, испанский, немецкий, французский, итальянский и китайский языки.

Вторая функция, SeamlessStreaming, начинает переводить речь, пока говорящий ещё не закончил предложение, что позволяет другим слушателям быстрее услышать перевод. Задержка составляет чуть менее двух секунд. По словам Meta, основной трудностью здесь было различие в структуре предложений разных языков, поэтому был разработан специальный алгоритм, который анализирует неполные аудиофрагменты и решает, достаточно ли контекста для начала генерации перевода или стоит ещё послушать говорящего.

Как и большинство предыдущих разработок Meta в области машинного перевода, будь то Llama 2, Massively Multilingual Speech (MMS), Universal Speech Translator (UST) или амбициозный проект No Language Left Behind (NLLB), SeamlessM4T находится в открытом доступе на GitHub. «Мы считаем, что SeamlessM4T является важным прорывом в стремлении сообщества ИИ к созданию универсальных многофункциональных систем», — написала команда исследователей.

Развитие компанией Meta ИИ-технологий перевода с различных языков открывает новые перспективы в области межъязыкового общения. Эти инновации могут значительно превзойти существующие решения, такие как инструменты перевода, разработанные компаниями Google и Samsung. Пока нет точной информации о сроках внедрения Meta этих функций, но их потенциальное применение, например, в умных очках Meta, обещает сделать их незаменимыми в повседневной жизни и профессиональной сфере.

Google Pixel Fold принёс субтитры в реальное общение с новым режимом двухэкранного переводчика

Периодически разработчики создают новые функции программного обеспечения, которые делают тот или иной аппаратный формфактор значительно более полезным. Одной из таких функций может стать режим двухэкранного переводчика, который в скором времени станет доступен владельцам складных смартфонов Google Pixel Fold.

 Источник изображения: Google

Источник изображения: Google

Полностью раскрыв смартфон, пользователь может говорить с кем-то, кто говорит на другом языке, при этом переводы фраз каждого из собеседников будут отображаться по обе стороны. Таким образом, собеседник будет видеть, что вы говорите на его языке, и наоборот. Такие вот синхронные субтитры в реальной жизни. В настоящее время система доступна на 45 языках.

Напомним, выпущенный в середине того года смартфон Pixel Fold является первым устройством Google с гибким дисплеем. Аппарат оснащён 7,6-дюймовым основным дисплеем и 5,8-дюймовым внешним экраном. Его аппаратной основой стал фирменный микропроцессор Google Tensor 2, аналогичный тому, что использовался в Pixel 7 и Pixel 7 Pro. В конструкции задействован прочный шарнирный механизм, способный выдержать 200 тыс. складываний. Что касается цены, то приобрести Pixel Fold можно за $1800.

Мобильную версию Gmail научили автоматическому переводу писем

Интернет-пользователи привыкли воспринимать возможность перевода веб-страниц как что-то должное. Инструмент перевода страниц пользуется большой популярностью, поэтому постепенно разработчики интегрируют его в разные продукты. На этой неделе функция перевода стала доступна в мобильной версии почтового сервиса Google Gmail.

 Источник изображения: Google

Источник изображения: Google

Отметим, что функция автоматического перевода давно доступна пользователям веб-версии Gmail. Теперь же Google добавила полезную функцию в мобильную версию почтового сервиса, которым ежедневно пользуются миллионы людей по всему миру. Для пользователей Gmail на устройствах с Android функция перевода станет доступна на этой неделе, а в iOS-версии приложения она появится в конце месяца.

Как и в случае использования веб-версии, пользователь будет видеть небольшой баннер в верхней части электронного письма. Если в качестве основного языка пользователь использует английский, то баннер будет предлагать перевести сообщение на английский. В дополнение к этому можно выбрать опцию, благодаря которой все поступающие сообщения будут автоматически переводиться на выбранный пользователем язык. При необходимости можно отказаться от использования новой функции, но в Google её оценивают как «очень востребованную», что указывает на популярность переводчика сообщений в веб-версии сервиса.

Google представила технологию автоматического дубляжа видео с переводом и прорисовкой артикуляции

Учёные уже давно записали профессию переводчика в умирающие, поскольку развитие систем машинного перевода ставит её под угрозу существования не первое десятилетие подряд. Компании Google удалось вывести технологию на новый уровень: искусственный интеллект теперь способен не только переводить речь человека, записанного на видео, но и адаптировать его артикуляцию к результату перевода на другой язык.

 Источник изображения: Google

Источник изображения: Google

Другими словами, движения губ человека будут синхронизированы со словами, которые он якобы произносит на другом языке. Работа «универсального переводчика», как незатейливо назвали эту технологию в Google, состоит из нескольких этапов. Сперва система распознаёт речь выступающего на видео человека «на слух» и переводит её в текстовую форму. Данный текст уже переводится на нужный язык, из него тут же синтезируется речь с сохранением тембра и эмоциональной окраски оригинала. Затем под новую речь на другом языке синхронизируются не только движения губ и мимика, но и жестикуляция говорящего. Конечное видео выглядит так, как будто спикер изначально произносил речь на другом языке, чего в реальности он не делал.

Данная технология открывает широкие возможности если не в кинематографе, где дубляж фильмов остаётся сложным процессом, то в сфере образования как минимум. Как справедливо опасается Google, подобный инструмент должен рано или поздно заинтересовать злоумышленников, которые с его помощью захотят фальсифицировать публичные выступления тех же политиков, например. По этой причине корпорация намерена не только распространять технологию «универсального перевода» через доверенных партнёров, но и наделять результирующие видео разного рода водяными знаками, которые позволяют зрителю понять, что ролик является продуктом искусственного интеллекта.

Skype теперь сможет озвучивать автоматический перевод речи голосом самих пользователей

Компания Microsoft выпустила очередное обновление коммуникационного решения Skype. Теперь интегрированный в продукт переводчик позволяет осуществлять перевод и последующее озвучивание речи пользователя его же голосом — только на другом языке.

 Источник изображения: Chase Chappell/unsplash.com

Источник изображения: Chase Chappell/unsplash.com

Функция TruVoice максимально упрощает общение даже тем, кто не знает языка собеседника. Обработка речи с помощью алгоритмов искусственного интеллекта буквально творит чудеса. В Microsoft заявляют, что инструмент Skype Translator комбинирует систему распознавания голоса с алгоритмами обработки естественных языков.

В результате беседы должны становятся более «человечными», что в теории помогает налаживать контакты с людьми из других стран. Другими словами, ещё до перевода система умеет распознавать и интерпретировать слова собеседников.

Известно, что уже поддерживается 10 языков, включая русский, мандаринский диалект китайского, арабский, бразильский португальский, английский, испанский, итальянский, французский и немецкий. Кроме того, разговоры на более 60 языках система способна конвертировать в текст на других языках.

 Источник изображения: Skype

Источник изображения: Skype

Если разговаривать «естественными» голосами по каким-либо причинам неприемлемо, можно выбрать искусственные роботизированные варианты. Пока функция Skype доступна только в разговорах один на один, но в ближайшие месяцы Microsoft обещает добавить её в групповые беседы и даже разговоры с собеседниками по телефону.

Mozilla предложила альтернативу Google Translate — конфиденциальный офлайн-переводчик для Firefox

Большинство сервисов перевода с одного языка на другой используют удалённые серверы и облачные ИИ-фреймворки для выполнения пользовательских задач. Mozilla пошла другим путём и представила конфиденциальный инструмент Firefox Translations для офлайн-переводов в своём браузере.

 Источник изображения: Mozilla

Источник изображения: Mozilla

В отличие от Google Translate, Bing Microsoft Translator, DeepL Translate и прочих онлайн-сервисов подобного типа, алгоритмы расширения Firefox Translations работают полностью в офлайн-режиме. Другими словами, переводы выполняются локально на компьютерах пользователей без передачи обрабатываемых текстовых данных на сторонние серверы.

В настоящий момент Firefox Translations поддерживает работу с 10 языками: английским, испанским, немецким, французским, итальянским, болгарским, португальским, польским, эстонским и чешским. При этом работы продолжаются, на очереди русский, украинский, персидский (фарси), исландский, норвежский нюнорск, норвежский букмол и голландский языки.

В разработке Mozilla сотрудничает с The Bergamot Project Consortium, основной специализацией проекта является организация машинных переводов, локально выполняемых в браузере. Кроме того, в проекте участвуют несколько европейских университетов. Средства получены из европейского фонда программы Horizon 2020.

Firefox Translations продолжает совершенствоваться, а финансирование Евросоюзом, возможно, позволит проекту избежать мрачной судьбы Firefox OS и других, не оправдавших ожиданий инициатив. Пока на странице проекта насчитывается чуть более 40 тыс. пользователей.


window-new
Soft
Hard
Тренды 🔥
ByteDance с треском уволила старжёра за внедрение вредоносного кода в ИИ-модели 39 мин.
Состоялся релиз российской платформы «Аксиома 3.0» для управления материальными активами предприятия 4 ч.
Для Vampire Survivors анонсировали «просто огромное» дополнение по мотивам «Кастлвании» — трейлер и подробности Ode to Castlevania 5 ч.
Календарь релизов 21 – 27 октября: CoD: Black Ops 6, No More Room in Hell 2 и Factorio: Space Age 6 ч.
Проверенный инсайдер сообщил, когда выйдут первые обзоры Dragon Age: The Veilguard 6 ч.
Нелинейная ролевая игра Dawnwalker от ведущих разработчиков The Witcher 3: Wild Hunt и Cyberpunk 2077 нашла издателя 7 ч.
«Не первый, но лучший»: Тим Кук объяснил отставание Apple в области ИИ и других инноваций 8 ч.
Midjourney запустит ИИ-редактор изображений 8 ч.
Анджей Сапковский подтвердил дату выхода следующей книги «Ведьмак» — первой за 11 лет 11 ч.
Надёжный инсайдер раскрыл, как будет называться новая кооперативная игра от создателей It Takes Two и когда её анонсируют 12 ч.
Super Flower представила серию блоков питания Zillion FG мощностью до 1250 Вт 60 мин.
Qualcomm представила самый быстрый мобильный процессор — 3-нм Snapdragon 8 Elite с компьютерными ядрами Oryon 2 ч.
Новая статья: Обзор складного смартфона HONOR Magic V3: тоньше некуда 2 ч.
Zotac опровергла информацию о начале производства видеокарты GeForce RTX 5090 3 ч.
Asus представила карту расширения ThunderboltEX 5 — она превращает PCIe 4.0 x4 в два Thunderbolt 5 и три mini-DP 3 ч.
Hyundai задумала полностью отказаться от экранов в автомобилях в пользу голограмм 4 ч.
Японская Ubitus, обслуживающая Nintendo и Sega, тоже захотела запитать новый ИИ ЦОД от АЭС 4 ч.
Qualcomm вот-вот представит Snapdragon 8 Elite — 3-нм процессор с ядрами Oryon и частотой до 4,3 ГГц 5 ч.
Анонсирован панорамный корпус DeepCool CG580 с поддержкой плат с разъёмами на изнанке от Asus и MSI 6 ч.
Ryzen 7 9800X3D заставили работать на частоте 5,6 ГГц у всех восьми ядер одновременно 6 ч.