- CES 2020: Segway представила кресло-капсулу S-Pod для комфортных поездок - 06.01.2020 14:14
- CES 2020: Seagate показала, как работать с данными - 06.01.2020 13:42
- CES 2020: очень «умная» бытовая техника и изогнутые игровые мониторы Odyssey - 05.01.2020 14:22
В «Яндекс.Переводчик» добавилась технология перевода на нейронной сети. Пользователи переводов с английского на русский уже могут оценить и сравнить результаты гибридного перевода
Сервис «Яндекс.Переводчик» начал использовать гибридную систему перевода. К статистической модели, которая используется с момента запуска, добавилась технология перевода на нейронной сети, рассказала компания «Яндекс» в своем официальном блоге.
Сейчас текст переводят обе модели, а затем алгоритм на основе метода машинного обучения CatBoost сравнивает результаты и предлагает лучший вариант. Пока гибридная система работает только для переводов с английского на русский.
Выбор тестового направления связан с его популярностью: около 80% запросов на перевод идут по модели «английский язык — русский язык». Пользователи веб-версии «Яндекс.Переводчика» могут сравнить результат работы гибридной системы и статистического переводчика и выбрать вариант, который им больше понравится.
В отличие от статистического переводчика, нейросеть не разбивает переводимые тексты на отдельные слова и фразы. Она получает на вход предложение целиком и выдает его перевод также. Такой подход позволяет учесть контекст и лучше передать смысл, а также повысить читаемость перевода.
Кроме того, переводы, выполненные нейросетью, проходят дополнительную проверку для снижения грамматических ошибок. Все переводы ИИ проходят через «модель языка». Это своеобразный свод знаний о языке перевода, накопленный системой. Модель языка содержит список всех употребляемых в языке слов и словосочетаний с указанием частоты их использования. В итоге это поможет избежать несогласований, ошибок в родах, падежах и т.п.
«Яндекс.Переводчик» заработал в 2011 году. Сейчас сервис знает 94 языка, включая экзотические, в том числе косо, папьяменто и даже синдарин — искусственный язык, на котором говорят эльфы в книгах Дж. Р. Р. Толкина.
Фото на обложке: pixabay.com