Google выпускает две новые модели искусственного интеллекта: Imagen 3 и Veo. Imagen 3 позволяет создавать изображения на основе текстовой команды, а Veo – преобразует картинки и текст в анимацию.
Эти модели могут работать по отдельности, но также могут использоваться совместно.
Imagen 3
Imagen 3 представляет собой модель преобразования текста в изображение высочайшего качества. Пользователи могут генерировать изображения и видеоролики высокой четкости на основе простого текстового запроса. Все клиенты Google Cloud смогут использовать Imagen 3 на платформе Vertex AI.
Дополнительно Google предлагает своим клиентам из разрешенного списка возможность редактировать и настраивать изображения в соответствии с потребностями их бизнеса. Imagen 3 станет доступна со следующей недели для всех пользователей Vertex AI.
Veo
Veo, разработанный компанией Google DeepMind, создает высококачественные видеоролики на основе текстовых или графических подсказок. Модель поддерживает широкий диапазон кинематографических и визуальных стилей и работает с исключительной скоростью.
Veo генерирует последовательные и связные кадры, обеспечивая реалистичное движение людей, животных и объектов на протяжении всего видео.
По словам Google, эта модель обладает широкими возможностями, которые позволяют создавать видеоролики за считанные минуты. Пользователи могут выбирать различные визуальные и кинематографические стили. На данный момент Veo доступен в частной предварительной версии.
Google подчеркивает, что модели Veo и Imagen 3 имеют встроенные средства защиты, предотвращающие нарушение прав и блокирующие неприемлемый контент. Кроме того, создаваемый контент содержит невидимый цифровой водяной знак, созданный с помощью технологии SynthID от DeepMind, который позволяет определить, был ли контент создан искусственным интеллектом.