TechFusion.ruНовостиНейросеть смогла различить голоса по дыханию

Нейросеть смогла различить голоса по дыханию

голоса

Группа ученых из США обучила искусственный интеллект распознавать голоса людей по вдохам между словами с точностью 91,3%

Исследователи Университета Карнеги — Меллон выяснили, что, в отличие от звуков голоса, дыхание невозможно подделать. Поэтому они использовали для обучения системы распознавания голосов набор данных, состоящий из вдохов между словами. Эффективность нейросети показала 91,3% в умении различить говорящих.

Для тренировки искусственного интеллекта использовались около ста часов записей новостей. Речь людей делили на фонемы, из которых извлекались только звуки между словами. Для итогового распознавания и идентификации говорящих была использована сверточная нейросеть. Результаты исследования были опубликованы в статье Speaker identification from the sound of the human breath в журнале Computer Science.

Стоит отметить, что системы распознавания голоса становятся все более эффективными. Например, разработка лаборатории Mitsubishi Electric в Кембридже способна в реальном времени различать уникальные «голосовые отпечатки» человека, восстанавливая речь даже в условиях нескольких одновременно говорящих людей. Система распознавания речи AISense делает полную письменную запись всех разговоров, ведущихся пользователем в определенной среде — в офисе, на учебе или просто за компьютером — и сохраняет их в облако. А нейронная сеть, обученная исследователями из ВШЭ, в 70% случаев правильно распознает эмоциональный окрас речи.

Фото на обложке: pixabay.com