Сегодня 28 сентября 2023
18+
MWC 2018 2018 Computex IFA 2018
Новости Software

«Яндекс» запустил гибридную систему перевода

Компания «Яндекс» объявила о внедрении гибридной системы перевода: ожидается, что новый подход позволит повысить качество выдаваемых результатов.

Сервис «Яндекс.Переводчик» изначально использовал статистическую модель. При переводе она разделяет предложения на куски (отдельные слова и фразы) и для каждого из них подбирает все возможные переводы с указанием их вероятности. Затем система составляет из переведённых фрагментов разные варианты нового предложения. Выбирается тот вариант, который содержит переводы с высокими вероятностями и в котором фрагменты хорошо сочетаются друг с другом.

Достоинством метода является то, что система хорошо запоминает и переводит редкие и сложные слова и фразы. Недостаток — «машинность» перевода: текст как бы собран из отдельных кусков.

Теперь к статистическому переводу добавляется перевод на основе нейронной сети. Как и статистический переводчик, нейронная сеть анализирует массив параллельных текстов и учится находить в них закономерности. При этом логика несколько иная: нейросеть работает с целыми предложениями, то есть не происходит дробление на слова и фразы. Такой подход, как утверждается, позволяет учесть смысловые связи внутри предложения, то есть понять контекст. В результате, перевод получается более естественным.

Но у нейросетевого перевода тоже есть свои недостатки: если по каким-то причинам системе не удаётся перевести то или иное предложение, она начинает попросту угадывать правильный ответ.

Поэтому «Яндекс» внедрил гибридную систему. Теперь перевод выполняют обе модели, а затем алгоритм на основе метода машинного обучения CatBoost сравнивает результаты и предлагает лучший.

Сейчас гибридная система используется в веб-версии «Яндекс.Переводчика» для переводов с английского языка на русский. В ближайшие месяцы она заработает и для других направлений.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
США бессрочно разрешат корейским производителям памяти поставлять оборудование в Китай 19 мин.
Южный полюс Луны остался непокорённым, заявили китайские учёные — индийский луноход совершил посадку слишком далеко от него 2 ч.
Память Micron типа HBM3E впечатлила клиентов, NVIDIA готовится её сертифицировать 2 ч.
Выручка Micron обрушилась в два раза в ушедшем фискальном году, но компания уже встала на путь восстановления 3 ч.
Intel начнёт выпускать чипы по техпроцессу Intel 4 в Ирландии на этой неделе 6 ч.
Oracle запустила bare-metal инстансы с NVIDIA H100 9 ч.
InnoGrit представила первый китайский SSD-контроллер стандарта PCIe 5.0 — он уже массово производится 9 ч.
Meta представила смарт-очки Ray-Ban Meta Smart Glasses с 12-Мп камерой, 32 Гбайт памяти и ценой $299 9 ч.
Новая статья: Обзор игрового ноутбука MSI Katana 17 B13VGK-471RU: я — твой Клинок Фронтира 10 ч.
Шведские власти окончательно закрыли Ericsson дорогу в Россию 12 ч.