TechFusion.ruКомпании«Яндекс.Переводчик» объединил статистический перевод с нейросетью

«Яндекс.Переводчик» объединил статистический перевод с нейросетью

Яндекс.Переводчик

В «Яндекс.Переводчик» добавилась технология перевода на нейронной сети. Пользователи переводов с английского на русский уже могут оценить и сравнить результаты гибридного перевода

Сервис «Яндекс.Переводчик» начал использовать гибридную систему перевода. К статистической модели, которая используется с момента запуска, добавилась технология перевода на нейронной сети, рассказала компания «Яндекс» в своем официальном блоге.

Сейчас текст переводят обе модели, а затем алгоритм на основе метода машинного обучения CatBoost сравнивает результаты и предлагает лучший вариант. Пока гибридная система работает только для переводов с английского на русский.

Выбор тестового направления связан с его популярностью: около 80% запросов на перевод идут по модели «английский язык — русский язык». Пользователи веб-версии «Яндекс.Переводчика» могут сравнить результат работы гибридной системы и статистического переводчика и выбрать вариант, который им больше понравится.

В отличие от статистического переводчика, нейросеть не разбивает переводимые тексты на отдельные слова и фразы. Она получает на вход предложение целиком и выдает его перевод также. Такой подход позволяет учесть контекст и лучше передать смысл, а также повысить читаемость перевода.

Кроме того, переводы, выполненные нейросетью, проходят дополнительную проверку для снижения грамматических ошибок. Все переводы ИИ проходят через «модель языка». Это своеобразный свод знаний о языке перевода, накопленный системой. Модель языка содержит список всех употребляемых в языке слов и словосочетаний с указанием частоты их использования. В итоге это поможет избежать несогласований, ошибок в родах, падежах и т.п.

«Яндекс.Переводчик» заработал в 2011 году. Сейчас сервис знает 94 языка, включая экзотические, в том числе косо, папьяменто и даже синдарин — искусственный язык, на котором говорят эльфы в книгах Дж. Р. Р. Толкина.

Фото на обложке: pixabay.com