Microsoft анонсировала инструмент искусственного интеллекта под названием VALL-E, который может создавать убедительные реплики человеческих голосов. Для примера потребуется лишь 3-секундный голосовой образец.

Для обучения VALL-E было использовано 60 000 часов данных английской речи от более чем 7000 различных человек. В отличие от многих инструментов искусственного интеллекта, VALL-E может воспроизводить эмоции и тон говорящего, даже при создании записи слов, которые оригинальный говорящий никогда не произносил. Microsoft называет VALL-E «языковой моделью нейронного кодека», и она основана на технологии EnCodec, о которой Meta объявила в октябре прошлого года.

В отличие от других методов преобразования текста в речь, которые обычно синтезируют речь, манипулируя формами сигналов, VALL-E анализирует человеческий голос. Затем разбивает полученную информацию на отдельные компоненты (называемые «токенами») благодаря EnCodec и использует обучающие данные, чтобы сопоставить то, что он услышал в качестве примера и то, как этот голос будет звучать, если произнести другие фразы.

VALL-E

Образцы голоса, предоставленные Microsoft, различаются по качеству. В то время как некоторые из них звучат естественно, другие явно сгенерированы машиной и звучат роботизированно. Конечно, ИИ со временем становится лучше, поэтому в будущем сгенерированные записи, вероятно, будут более убедительными. Кроме того, VALL-E использует только 3-секундные записи в качестве подсказки. Если бы эта технология использовалась с большим набором образцов, она, несомненно, могла бы создавать более реалистичные образцы.

Новая технология пока недоступна ни для широкой публики, ни для тестирования. Возможно, из-за того, что может быть использована в целях мошенничества. На сайте проекта есть множество примеров работы ИИ, с которыми может ознакомиться любой желающий.

Подпишись вTelegram
Motorola выпустила беспроводные наушники Buds Loop

Motorola выпустила беспроводные наушники Buds Loop

Представлены раскладушки Motorola Razr 60 Ultra и Motorola Razr 60

Представлены раскладушки Motorola Razr 60 Ultra и Motorola Razr 60

TSMC представила SoW-X – технологию, которая сделает чипы в 40 раз мощнее

TSMC представила SoW-X – технологию, которая сделает чипы в 40 раз мощнее

Представлен Redmi Turbo 4 Pro – Snapdragon 8s Gen 4, IP69 и 7550 мАч

Представлен Redmi Turbo 4 Pro – Snapdragon 8s Gen 4, IP69 и 7550 мАч

Представлен OnePlus 13T – Snapdragon 8 Elite и 6260 мАч

Представлен OnePlus 13T – Snapdragon 8 Elite и 6260 мАч

Представлен планшет Honor Pad GT

Представлен планшет Honor Pad GT

Прибыль Tesla обвалилась на 71%

Прибыль Tesla обвалилась на 71%

Представлен Realme GT7 – Dimensity 9400+, 7200 мАч, IP69 и немерцающий экран

Представлен Realme GT7 – Dimensity 9400+, 7200 мАч, IP69 и немерцающий экран

Представлен OPPO K12S – батарея на 7000 мАч, защищённый корпус и цена $151

Представлен OPPO K12S – батарея на 7000 мАч, защищённый корпус и цена $151

Представлен Honor X60 GT – Snapdragon 8+ Gen 1 и 6300 мАч

Представлен Honor X60 GT – Snapdragon 8+ Gen 1 и 6300 мАч

Vivo представила умные часы Watch 5 с BlueOS 2.0 и автономностью до 22 дней

Vivo представила умные часы Watch 5 с BlueOS 2.0 и автономностью до 22 дней

Представлен Vivo X200s – MediaTek Dimensity 9400+ и батарея на 6200 мАч

Представлен Vivo X200s – MediaTek Dimensity 9400+ и батарея на 6200 мАч