- CES 2020: Segway представила кресло-капсулу S-Pod для комфортных поездок - 06.01.2020 14:14
- CES 2020: Seagate показала, как работать с данными - 06.01.2020 13:42
- CES 2020: очень «умная» бытовая техника и изогнутые игровые мониторы Odyssey - 05.01.2020 14:22
Компания Тимура Бекмамбетова Screenlife Technologies и разработчик HR-сервиса «Робот Вера» компания «Стафори» запустили проект Vera Voice, который позволяет синтезировать речь знаменитостей
Screenlife Technologies и «Стафори» разрабатывают цифровую платформу Vera Voice. Технология позволит синтезировать речи знаменитых людей и защищать их от подделок. Как сообщили в пресс-службе разработчиков, для развития решения компании создадут совместное предприятие с равными долями.
Vera Voice позволяет «воспроизводить» голоса знаменитостей на русском языке. По словам разработчиков, цель создания платформы — в формировании рынка коммерческого применения синтезированных голосов и создание стандартов защиты голоса от недобросовестного использования цифровой копии речи.
В основе технологии лежат алгоритмы искусственного интеллекта, а именно — нейросеть, которая обучается на примере оригинального голоса и создает его цифровую копию. «Для синтеза голоса достаточно нескольких часов аудиоданных, озвученных обладателем голоса и оцифрованный текст, который он зачитывает. Аудиопоток и текст «выгружаются» в несколько нейронных сетей одновременно: одна — генерирует спектрограмму звука (его визуальное изображение), а вторая — непосредственно звук. Пример голоса обладателя для нейросети — эталон, к которой она стремится. Копия голоса синтезируется с учетом специфического произношения слов, скорости речи, интонаций и тембра», — рассказал сооснователь компании Владимир Свешников.
Первые пилотные проекты новой технологии будут запущены в ближайший месяц. Cтартап планирует запускать интерактивные мобильные приложения по мотивам фильмов и сериалов; синтеза голоса для озвучивания рекламы, объявлений, книг, фильмов, музейных гидов, игр; а также для создания подкастов в умных устройствах и ботах.
Для защиты прав обладателей голоса компания создала инструмент защиты голоса от Deep Fake. Компания будет защищать интересы обладателя голоса и отслеживать появление голосовых клонов. Технология также определяет факт синтеза голоса и его оригинальность.
Стоит отметить, что клонирование голоса — активно развивающийся технологический тренд. По оценкам Markets&Markets, к 2023 году рынок клонирования голоса достигнет 1,8 млрд долларов с учетом темпа роста ежегодно в более чем 30%.