30.03.2024 в 17:04

OpenAI разработала Voice Engine – нейросеть для генерации голоса по 15-секундному образцу

Компания OpenAI, известная созданием различных нейросетей, выпустила Voice Engine – платформу преобразования текста в голос человека. Voice Engine находится в разработке около двух лет и способна воссоздать голос, прослушав любой 15-секундный образец с примером звучания настоящего человека.

Голоса, которые генерирует нейросеть, звучат очень реалистично и даже могут передавать эмоции. Отмечается, что технология может быть применена для помощи людям, которые лишились своего голоса из-за болезни, а также для создания аудио-контента. Так клонированным голосом можно озвучить любой текст на языке оригинала или даже на нескольких других языках.

OpenAI заявляет, что планирует предварительно протестировать новую нейросеть лишь среди 10 компаний, и в настоящее время не выпускает данную технологию для широкой публики из-за опасности неправильного использования:

«Мы признаем, что создание речи, напоминающей голоса людей, сопряжено с серьезными рисками, о которых особенно важно в год выборов».

OpenAI помечает звук, созданный с помощью Voice Engine, специальными метками, чтобы всегда можно было определить происхождение записи. Компания работает с правительством и другими экспертами, чтобы найти лучший способ безопасного использования этой технологии.

OpenAI Voice Engine

Подпишись вTelegram

По темеOpenAI представила GPT‑5 – самую мощную нейросеть Apple внедрит в Siri нейросеть Google Gemini OpenAI представила модель GPT-5-Codex-Mini для вайб-кодинга OpenAI выпустила GPT-5.5 IP-телефония и мобильные устройства: эволюция голосовой связи