TechFusion.ruСтатьиЦифровой голос: как технологии меняют жизнь людей, не способных говорить

Цифровой голос: как технологии меняют жизнь людей, не способных говорить

голос

Люди, которые по той или иной причине потеряли возможность говорить, могут вернуть себе голос. The Guardian рассказала историю компании, которая создала банк голосов для людей с расстройствами речи

Потерять язык

В прошлом ноябре Джо Моррис, 31-летний режиссер из Лондона, заметил, что на его языке есть небольшое болезненное повреждение. Он подумал, что прикусил язык во сне, и на несколько месяцев забыл об этом. На зимних каникулах он обнаружил, что проблема никуда не исчезла. В сети он нашел информацию о том, что незаживающая рана на языке может быть симптомом рака, и позвонил своему врачу — скорее на всякий случай. Моррис не был курильщиком, никто в его семье не болел раком — поводов для беспокойства не было.

Семейный доктор заверил, что на первый взгляд все в порядке, но посоветовал обратиться к специалисту. Тот тоже не обеспокоился симптомами, но назначил биопсию. Когда анализы показали, что это рак, врач предположил, что в лаборатории, должно быть, допустили ошибку. Во второй раз результаты биопсии Джо снова показали наличие раковых клеток.

Онкологи госпиталя, в который перевели Морриса, собирались сделать операцию по удалению небольшой части языка, но МРТ нарушило их планы. Томография показала, что опухоль уходит глубоко в основание органа. Прогноз был неутешительный: врач сказал Моррису, что тот потеряет две трети своего языка. «Это серьезно повлияет на вашу способность говорить», — сообщил доктор.

За неделю до операции Джо, чувствуя, что после утраты речи жизнь коренным образом изменится, попросил друга сделать с ним видеоинтервью, чтобы сохранить запись своего голоса. В интервью он рассказывал, каково это — осознавать, что навсегда потеряешь возможность произносить слова.

голос

via Pexels.com

Незадолго до этого интервью друг Морриса, который снимал его, рассказал Джо об компании VocaliD. Она базируется недалеко от Бостона и создает оцифрованные голоса для людей, которым приходится использовать различные устройства, чтобы говорить. Компания могла использовать запись Джо, чтобы воссоздать его речь на компьютере.

Джо и его друг связались с основательницей VocaliD — речевым патологом по имени Рупал Патель. Она объяснила, что голос Джо можно восстановить в цифровом виде. Для этого он должен записать нескольких тысяч предложений на английском языке, которые VocaliD разработала для захвата всех фонетических звуков.

Моррис согласился попробовать. Он записал несколько сотен предложений, а затем, осознав масштаб предстоящей работы, решил посвятить несколько дней отдыху. «Это была моя последняя неделя свободы, и я должен был много чего сделать — увидеть некоторых людей, по-настоящему пожить и поесть стейков», — рассказывал он. За два дня до операции Моррис снова стал записывать фразы. Ему было уже сложно говорить — в последний день он делал записи до поздней ночи. На следующее утро Джо поехал в больницу, где ему вырезали язык.

Механика слов

голос

via WikiMedia Commons

На речь человека влияет множество расстройств: апраксия, моторная болезнь нейронов и церебральный паралич, которые лишают людей контроля мышц, необходимых для артикуляции, травматическое повреждение мозга, инсульт и другие.

Современная адаптивная альтернативная коммуникация (ААК) в основном включает в себя устройства наподобие тех, которыми пользуется Стивен Хокинг, парализованный из-за бокового амиотрофического склероза. Это небольшие компьютеры или планшеты, которые воспроизводят введенные слова. До изобретения в 1969 году первого «переводчика» текста в речь людям с голосовыми и двигательными расстройствами приходилось использовать пишущие машинки, которые управлялись дыханием через специальную трубку (sip-and-puff devices).

К 1986 году технологии значительно продвинулись. В то время Хокинг как раз стал использовать программу Equalizer, которая позволяла ему с помощью переключателя выбирать слова или фразы на десктопном компьютере. Позже эту программу — и небольшой компьютер — установили на его инвалидном кресле.

История Стивена Хокинга — один из самых ярких примеров того, как голос человека формирует личность. Хокинг родился в Англии, но его роботизированный голос получил американский акцент. Сначала это казалось ему неуместным, но со временем именно такая речь стала его отличительной чертой. Спустя годы ученому предложили использовать новый тембр, который стал более человечным и «английским», но тот отказался.

Хокинг

via WikiMedia Commons

«Голос Стивена Хокинга» принадлежит не только Хокингу. С тех пор, как он был создан, его использовали мужчины и женщины, дети и старики разных рас и этнического происхождения. Это одна из странных особенностей мира людей, использующих ААК: все они пользуются ограниченным числом голосов. Хотя сейчас больше разнообразия, чем в прошлом, таким людям все еще доступно всего несколько десятков вариантов. Большинство из них — это голоса взрослых белых мужчин.

Около 10 лет назад на одной из конференций Рупал Патель натолкнулась на маленькую девочку и мужчину за 50, разговаривавших одним и тем же голосом. Патель призналась, что это напугало ее.

Банк речи

Рупал захотелось решить эту проблему — и подарить людям их собственные голоса. В 2007 году она занялась изучением технологий, которые позволили бы ей создавать индивидуальную цифровую речь.

К 2014 году технологию удалось развить настолько, что Патель и ее команда создали первый в мире «голосовой банк». Он представляет собой онлайн-платформу, где любой может «пожертвовать» свою речь, записав набор предложений на английском языке — специально созданная программа VocaliD фиксирует и захватывает все фонемы для дальнейшего использования.

Каждое «пожертвование» пополняет базу VocaliD. Компания предлагает клиентам услугу: голоса на заказ, которые сочетают в звук собственной речи клиента с лексикой, предоставленной «донором». Создание нового цифрового голоса требует выделить два элемента человеческого говорения, которые обычно функционируют как один: источник и фильтр.

голос

via VocaliD

«Источник» — это термин, обозначающий работу голосовых связок, гортани и мышц горла, ответственных за звуки речи, смеха и крика. Как объяснил Джефф Мелцнер, вице-президент VocaliD по исследованиям, источник человека настолько уникален, что его можно сравнить с отпечатком пальца. «Фильтр» — это мышцы (языка, губ, глотки и др.), которые формируют отдельные слова.

Технология VocaliD позволяет создавать тембр, близкий к тому, что был у «донора». Кроме того, можно сделать речь «теплее» или «ярче» — или даже более «авторитетной». Когда новый голос создан, он добавляется как «прошивка» к любому речевому устройству, которое уже использует его владелец. Недавно VocaliD добавила в свое приложение функцию, которая позволяет клиентам настраивать свое звучание, чтобы получить именно тот тембр, который они хотят. Система удобна в использовании, но иногда она все же дает сбой. К примеру, один из подростков стер свой голос, обновив iPhone.

Старое «я»

Для Джо Морриса превращение из трудоспособного человека, который может говорить, в человека, который может только наблюдать, было очень болезненным. Он чувствовал себя в ловушке собственного тела — «полностью запертым» с точки зрения коммуникации. Друзья пришли навестить его в больнице, и первый раз в жизни он не смог участвовать в разговоре, а просто сидел молча. «Мне нравится разговаривать, спорить, быть услышанным. А так очень сложно шутить: ты не можешь выглядеть остроумным, если нужно все записывать — ты упускаешь момент», — сетовал Джо.

Еще одной проблемой оказалось то, что Морриса больше не воспринимали как равного. «Люди воспринимают тебя по-другому. Они не хотят этого, но невольно покровительствуют тебе и относятся как к ребенку», — рассказал он.

голос

via PixaBay.com

За несколько месяцев послеоперационной физиотерапии Моррис заново научился произносить некоторые звуки. Тембр его голоса стал ниже. Спустя некоторое время Джо вновь взялся за работу — он устроился в рекламное агентство, где ему пригодилась собственная синтезированная речь от VocalidD. Он показал своим новым коллегам, как говорил раньше.

Джо не может использовать устройство ААК каждый день. Однако для него важно знать, что его голос где-то существует — он беспокоился о том, что с течением времени мог бы начать забывать его звук.

По словам Рупал Патель, люди, с чьей речью происходят необратимые изменения, часто используют «голосовой банк». Например, это делают трансгендеры на одном из этапов «перехода» — чаще до начала заместительной гормональной терапии. Для них, как и для Джо, VocalidD может служить хранилищем старого «я». Запись хранится на сервере, а человек помнит: вот тот, кем я когда-то был.

Иллюстрация на обложке: PixaBay.com