Американский разработчик программного обеспечения компания Adobe Systems на ежегодной конференции Adobe MAX представила приложение для редактирования аудиофайлов VoCo. В числе прочего VoCo может синтезировать речь, фактически переписывая слова говорящего.
«На Adobe MAX 2016 разработчик Adobe Зей Джин (Zeyu Jin) представил несколько идей, над которыми работает компания. Все они находятся в стадии прототипа, и неизвестно, будут ли воплощены в коммерческий продукт. В частности, был представлен проект VoCo, который Джин назвал "Photoshop для аудио" – он позволяет редактировать записанную речь, и даже добавлять в аудиофайл слова, которых изначально там не было», – говорится в блоге Adobe на Creative BLOQ.
Демонстрируя возможности VoCo, Джин добавил в аудиофайл текст, которого там не было, просто введя нужное слово в поле редактирования. Присутствующие на презентации очевидцы отметили, что результат был «почти идеальным».
Для того, чтобы VoCo смог сгенерировать новые слова, длина аудиозаписи должна составлять не менее 20 минут, пишет The Verge.
По мнению разработчиков, программа будет востребована аудиозаписывающими компаниями, в частности, создателями аудиокниг. Им не придется платить за лишние часы работы диктора, чтобы сделать идеальную запись: VoCo позволит быстро и безболезненно убрать помарки.
В то же время в Adobe осознают возможные негативные последствия создания VoCo. Но отмечают, что продукт для редактирования фотографий – Photoshop – так же нередко использую во вред, но это не отменяет его пользы.
Разработка находится на стадии прототипа, и пока Adobe не разглашает своих планов о его выпуске на рынок.