Компания OpenAI, известная созданием различных нейросетей, выпустила Voice Engine – платформу преобразования текста в голос человека. Voice Engine находится в разработке около двух лет и способна воссоздать голос, прослушав любой 15-секундный образец с примером звучания настоящего человека.
Голоса, которые генерирует нейросеть, звучат очень реалистично и даже могут передавать эмоции. Отмечается, что технология может быть применена для помощи людям, которые лишились своего голоса из-за болезни, а также для создания аудио-контента. Так клонированным голосом можно озвучить любой текст на языке оригинала или даже на нескольких других языках.
OpenAI заявляет, что планирует предварительно протестировать новую нейросеть лишь среди 10 компаний, и в настоящее время не выпускает данную технологию для широкой публики из-за опасности неправильного использования:
«Мы признаем, что создание речи, напоминающей голоса людей, сопряжено с серьезными рисками, о которых особенно важно в год выборов».
OpenAI помечает звук, созданный с помощью Voice Engine, специальными метками, чтобы всегда можно было определить происхождение записи. Компания работает с правительством и другими экспертами, чтобы найти лучший способ безопасного использования этой технологии.