Project VoCo позволит имитировать человеческую речь с фантастической точностью

Project VoCo позволит имитировать человеческую речь с фантастической точностью

В данный момент Adobe ведётся разработка революционного программного обеспечения Project VoCo, позволяющего редактировать и синтезировать человеческую речь с вызывающим мурашки реализмом. На днях компания представила демо-версию программы на конференции MAX, представив её чем-то вроде будущего эквивалента Photoshop при работе со звуком.

Одной из наиболее интересных её особенностей стала функция чтения новых, неизвестных программе слов и предложений на основе записи человеческого голоса. Будучи обеспеченной 20-минутной аудиозаписью речи любого человека, программа сможет проанализировать и понять особенности структуры голоса говорящего. Затем, любые предоставленные слова и предложения будут прочитаны программой голосом, невероятно точно имитирующим речь “вокального донора”.

Видео, демонстрирующее способности Project VoCo можно посмотреть в конце новости, а вот как Adobe комментируют концепцию своего нового детища:

“Во время записи закадрового голоса, диалогов или повествования, люди часто оговариваются и допускают ошибки, которые хотели бы исправить без необходимости повторной записи фрагмента. Мы разработали технологию Project VoCo специально для таких ситуаций. Вручную вбив в неё несколько слов или добавив звукозапись с ними, вы сможете заново синтезировать отрезок, в котором была допущена ошибка, чтобы в последствии вставить его в свою запись. Наш алгоритм сделает всё остальное и позволит добиться идентичного сходства с голосом говорящего”.

С тех пор, как Adobe запустили Photoshop в далеком 1990 году, подделка цифровых изображений стала обыденностью. По тому же принципу, стоит задуматься и об этических последствиях выпуска их новой программы. Ведь неизвестно, в каких целях люди смогут использовать достоверный и полнофункциональный синтезатор чужой речи. Но пока что воздержимся от пессимистических предположений и дождемся анонса коммерческого релиза Project VoCo.