Microsoft анонсировала инструмент искусственного интеллекта под названием VALL-E, который может создавать убедительные реплики человеческих голосов. Для примера потребуется лишь 3-секундный голосовой образец.

Для обучения VALL-E было использовано 60 000 часов данных английской речи от более чем 7000 различных человек. В отличие от многих инструментов искусственного интеллекта, VALL-E может воспроизводить эмоции и тон говорящего, даже при создании записи слов, которые оригинальный говорящий никогда не произносил. Microsoft называет VALL-E «языковой моделью нейронного кодека», и она основана на технологии EnCodec, о которой Meta объявила в октябре прошлого года.

В отличие от других методов преобразования текста в речь, которые обычно синтезируют речь, манипулируя формами сигналов, VALL-E анализирует человеческий голос. Затем разбивает полученную информацию на отдельные компоненты (называемые «токенами») благодаря EnCodec и использует обучающие данные, чтобы сопоставить то, что он услышал в качестве примера и то, как этот голос будет звучать, если произнести другие фразы.

VALL-E

Образцы голоса, предоставленные Microsoft, различаются по качеству. В то время как некоторые из них звучат естественно, другие явно сгенерированы машиной и звучат роботизированно. Конечно, ИИ со временем становится лучше, поэтому в будущем сгенерированные записи, вероятно, будут более убедительными. Кроме того, VALL-E использует только 3-секундные записи в качестве подсказки. Если бы эта технология использовалась с большим набором образцов, она, несомненно, могла бы создавать более реалистичные образцы.

Новая технология пока недоступна ни для широкой публики, ни для тестирования. Возможно, из-за того, что может быть использована в целях мошенничества. На сайте проекта есть множество примеров работы ИИ, с которыми может ознакомиться любой желающий.

Подпишись вTelegram
Gigabyte представила 4K и 2K QD-OLED мониторы

Gigabyte представила 4K и 2K QD-OLED мониторы

Realme GT Neo 7 получит батарею на 7000 мАч

Realme GT Neo 7 получит батарею на 7000 мАч

Камера iPhone 16 заняла 20-е место в рейтинге DxOMark

Камера iPhone 16 заняла 20-е место в рейтинге DxOMark

Планшет OPPO Pad 3 Pro вышел на глобальный рынок  – Snapdragon 8 Gen 3, 144 Гц и 12 ГБ ОЗУ

Планшет OPPO Pad 3 Pro вышел на глобальный рынок – Snapdragon 8 Gen 3, 144 Гц и 12 ГБ ОЗУ

Представлена Sony Alpha 1 II – беззеркальная камера за $6500

Представлена Sony Alpha 1 II – беззеркальная камера за $6500

Представлен Nubia Z70 Ultra – фотофлагман на Snapdragon 8 Elite

Представлен Nubia Z70 Ultra – фотофлагман на Snapdragon 8 Elite

Представлен Redmi A4 5G – 120 Гц, Snapdragon 4s Gen 2 и цена $101

Представлен Redmi A4 5G – 120 Гц, Snapdragon 4s Gen 2 и цена $101

Microsoft выпустила мини-ПК Windows 365 Link, напоминающий Mac mini

Microsoft выпустила мини-ПК Windows 365 Link, напоминающий Mac mini

Valve разрабатывает Steam Controller 2 и геймпад для VR-гарнитуры

Valve разрабатывает Steam Controller 2 и геймпад для VR-гарнитуры

Apple выпустила iOS 18.1.1

Apple выпустила iOS 18.1.1

MacBook Pro на M4 Max протестировали в играх

MacBook Pro на M4 Max протестировали в играх

ASUS представила игровые смартфоны ROG Phone 9 и ROG Phone 9 Pro – 5800 мАч, 185 Гц и Snapdragon 8 Elite

ASUS представила игровые смартфоны ROG Phone 9 и ROG Phone 9 Pro – 5800 мАч, 185 Гц и Snapdragon 8 Elite