TechFusion.ruКомпанииТехнология распознавания речи ЦРТ признана лучшей на международном конкурсе

Технология распознавания речи ЦРТ признана лучшей на международном конкурсе

распознавания речи ЦРТ

Разработчик интеллектуальных речевых технологий группа компаний ЦРТ одержала победу в международном конкурсе CHiME Speech Separation and Recognition Challenge (CHiME-6). Компания представила на конкурс свою технологию сегментирования аудиопотока и распознавания речи

На конкурсе CHiME технология ЦРТ показала лучшие результаты тестов на распознавание английской речи с нескольких микрофонов в условиях естественной обстановки. Как пояснили в ЦРТ, записи для конкурса были сделаны на 20 ужинах в реальных домах на вечеринках, где люди готовили, ели, мыли посуду, общались, шутили и смеялись. Распознавание в таких условиях осложняет одновременная речь 2–4 человек, реверберация и интенсивный шум: звон приборов, льющаяся из крана вода, гул кондиционера, шаги, смех.

На решении этой задачи сфокусировалась команда ЦРТ. Необходимо было создать систему распознавания, которая «прослушает» записи и выдаст полную расшифровку с наименьшим количеством ошибок. В итоге команда группы ЦРТ заняла первое место.

Помимо группы ЦРТ в конкурсе участвовали научные команды со всего мира: и известные IT-компании (Toshiba и ряд других), и крупные университеты-лидеры в области речевых технологий: Университет Джонса Хопкинса (США), Университет науки и технологии Китая, Технический университет Брно (Чехия) и др.

«В этом году на CHiME-6 впервые в истории стояла самая сложная задача — работа с несегментированной речью. Качественное распознавание речи разных дикторов, при этом перебиваемой шумами, позволяет выводить сервисы из разряда инновационных в повседневное применение, совершенствуя бизнес и упрощая нашу жизнь», — рассказал генеральный директор группы компаний ЦРТ Дмитрий Дырмовский.

По словам руководителя группы ЦРТ, качественная обработка несегментированной речи позволит, к примеру, вести грамотное протоколирование совещаний, где говорит сразу несколько спикеров. Интеллектуальная речевая аналитика поможет автоматизировать работу контактных центров: распознавать спонтанную речь, классифицировать голосовые обращения, выявлять соблюдения скрипта, делать выводы об удовлетворенности клиента и качестве диалога, а значит — существенно оптимизировать работу современных контакт-центров ретейла, e-commerce и телеком-компаний.

Иллюстрация: pixabay.com