Stability AI, известная прежде всего своей нейросетью Stable Diffusion, объявила о выпуске Stable Audio – первого ИИ-продукта компании для преобразования текста в музыку через простой в использовании веб-интерфейс.
Stable Audio идеально подходит для музыкантов, стремящихся создавать сэмплы для использования в своей музыке. Музыкальные треки генерируются в ответ на описательные текстовые запросы, предоставленные пользователем, а также желаемую длину композиции. Сервис может создавать не только песни, но также имитировать звук проезжающей мимо машины или соло барабана.
По данным компании, она обучила Stable Audio «набору данных, состоящему из более чем 800 000 аудиофайлов, содержащих музыку, звуковые эффекты и основы отдельных инструментов» и текстовым метаданным от компании AudioSparx, лицензирующей музыку. Набор данных представляет собой более 19 500 часов звуков. Сотрудничая с лицензирующей компанией, Stability AI заявляет, что имеет разрешение на использование материалов, защищённых авторским правом.
В Stable Audio будет доступно три ценовых уровня:
- 1. Бесплатная версия, позволяющая пользователям создавать до 45 секунд аудио для 20 треков в месяц;
- 2. Professional – 500 треков продолжительностью до 90 секунд ($11,99 в месяц);
- 3. Enterprise предлагает пользователям самим настраивать использование и цену.
Те, кто использует бесплатную версию, не могут коммерчески использовать аудио, созданное с помощью Stable Audio.