Microsoft анонсировала инструмент искусственного интеллекта под названием VALL-E, который может создавать убедительные реплики человеческих голосов. Для примера потребуется лишь 3-секундный голосовой образец.

Для обучения VALL-E было использовано 60 000 часов данных английской речи от более чем 7000 различных человек. В отличие от многих инструментов искусственного интеллекта, VALL-E может воспроизводить эмоции и тон говорящего, даже при создании записи слов, которые оригинальный говорящий никогда не произносил. Microsoft называет VALL-E «языковой моделью нейронного кодека», и она основана на технологии EnCodec, о которой Meta объявила в октябре прошлого года.

В отличие от других методов преобразования текста в речь, которые обычно синтезируют речь, манипулируя формами сигналов, VALL-E анализирует человеческий голос. Затем разбивает полученную информацию на отдельные компоненты (называемые «токенами») благодаря EnCodec и использует обучающие данные, чтобы сопоставить то, что он услышал в качестве примера и то, как этот голос будет звучать, если произнести другие фразы.

VALL-E

Образцы голоса, предоставленные Microsoft, различаются по качеству. В то время как некоторые из них звучат естественно, другие явно сгенерированы машиной и звучат роботизированно. Конечно, ИИ со временем становится лучше, поэтому в будущем сгенерированные записи, вероятно, будут более убедительными. Кроме того, VALL-E использует только 3-секундные записи в качестве подсказки. Если бы эта технология использовалась с большим набором образцов, она, несомненно, могла бы создавать более реалистичные образцы.

Новая технология пока недоступна ни для широкой публики, ни для тестирования. Возможно, из-за того, что может быть использована в целях мошенничества. На сайте проекта есть множество примеров работы ИИ, с которыми может ознакомиться любой желающий.

Подпишись вTelegram
Представлен Honor 400 Lite со 108 Мп камерой

Представлен Honor 400 Lite со 108 Мп камерой

Пошлины Трампа пока не распространяются на полупроводники

Пошлины Трампа пока не распространяются на полупроводники

Журналистам дали ознакомиться с Nintendo Switch 2

Журналистам дали ознакомиться с Nintendo Switch 2

MediaTek представила Kompanio Ultra 910 – процессор для ноутбуков

MediaTek представила Kompanio Ultra 910 – процессор для ноутбуков

Техника Apple резко подорожает из-за новых торговых пошлин Трампа

Техника Apple резко подорожает из-за новых торговых пошлин Трампа

Samsung представила планшеты Galaxy Tab S10 FE

Samsung представила планшеты Galaxy Tab S10 FE

Портативная приставка Nintendo Switch 2 официально представлена

Портативная приставка Nintendo Switch 2 официально представлена

Новый процессор Qualcomm Snapdragon 8s Gen 4 на 49% мощнее Snapdragon 8s Gen 3

Новый процессор Qualcomm Snapdragon 8s Gen 4 на 49% мощнее Snapdragon 8s Gen 3

Motorola представила смартфон Edge 60 Fusion

Motorola представила смартфон Edge 60 Fusion

ТОП-10 самых мощных смартфонов за март 2025 года

ТОП-10 самых мощных смартфонов за март 2025 года

GMKtec представила мини-ПК с AMD Ryzen AI MAX+ 395 и 128 ГБ оперативной памяти за $2000+

GMKtec представила мини-ПК с AMD Ryzen AI MAX+ 395 и 128 ГБ оперативной памяти за $2000+

Представлен Redmi A5 со 120-герцевым экраном и батареей на 5200 мАч за $79

Представлен Redmi A5 со 120-герцевым экраном и батареей на 5200 мАч за $79