TechFusion.ruНовостиЗаписи ТВ- и радио эфиров расшифруют в облаке

Записи ТВ- и радио эфиров расшифруют в облаке

Звуковая волна

В 3i Technologies разработан облачный сервис для профессиональной обработки ТВ и радио-контента. 3i Speech Recognition API позволяет переводить теле-, радио-эфиры и медиа-архивы ТВ-каналов и радиостанций в текстовый формат

Консорциум 3i Technologies утверждает, что новый сервис распознает речь из эфиров с точностью более 90% и способен работать с аудио и видео любой длительности. Загруженные в облако файлы обрабатываются в несколько раз быстрее реальной длительности звучания. На выходе получается связный текст, разбитый на предложения со знаками препинания.

По словам председателя совета директоров консорциума 3i Technologies Алексея Любимова, представленный сервис ориентирован на обработку именно телевизионного и радио-контента. Но в дальнейшем он может стать частью решений для массового потребителя — например, основой для перевода иностранных каналов и субтитрирования в режиме реального времени.

В 3i Speech Recognition API используются языковые и акустические модели, построенные с применением машинного обучения, технологий рекуррентных нейронных сетей и взвешенных конечных автоматов, говорится в сообщении компании-разработчика. Для повышения качества распознавания языковые модели можно адаптировать под предметную область — например, для перевода в текст отраслевых передач, в которых используется профессиональная лексика.

Представленная версия 3i Speech Recognition поддерживает русский и английский языки. По заявлению разработчика, сервис легко интегрируется в приложения и комплексные решения сторонних разработчиков. Бета-версия продукта открыта для тестирования.