В данный момент Adobe ведётся разработка революционного программного обеспечения Project VoCo, позволяющего редактировать и синтезировать человеческую речь с вызывающим мурашки реализмом. На днях компания представила демо-версию программы на конференции MAX, представив её чем-то вроде будущего эквивалента Photoshop при работе со звуком.
Одной из наиболее интересных её особенностей стала функция чтения новых, неизвестных программе слов и предложений на основе записи человеческого голоса. Будучи обеспеченной 20-минутной аудиозаписью речи любого человека, программа сможет проанализировать и понять особенности структуры голоса говорящего. Затем, любые предоставленные слова и предложения будут прочитаны программой голосом, невероятно точно имитирующим речь “вокального донора”.
Видео, демонстрирующее способности Project VoCo можно посмотреть в конце новости, а вот как Adobe комментируют концепцию своего нового детища:
“Во время записи закадрового голоса, диалогов или повествования, люди часто оговариваются и допускают ошибки, которые хотели бы исправить без необходимости повторной записи фрагмента. Мы разработали технологию Project VoCo специально для таких ситуаций. Вручную вбив в неё несколько слов или добавив звукозапись с ними, вы сможете заново синтезировать отрезок, в котором была допущена ошибка, чтобы в последствии вставить его в свою запись. Наш алгоритм сделает всё остальное и позволит добиться идентичного сходства с голосом говорящего”.
С тех пор, как Adobe запустили Photoshop в далеком 1990 году, подделка цифровых изображений стала обыденностью. По тому же принципу, стоит задуматься и об этических последствиях выпуска их новой программы. Ведь неизвестно, в каких целях люди смогут использовать достоверный и полнофункциональный синтезатор чужой речи. Но пока что воздержимся от пессимистических предположений и дождемся анонса коммерческого релиза Project VoCo.