Группа исследователей из Apple и Калифорнийского университета в Санта-Барбаре представила систему искусственного интеллекта MGIE, которая позволяет пользователям редактировать изображения с помощью команд на естественном языке.

На рынке существует множество моделей искусственного интеллекта, которые предоставляют возможность редактировать изображения с помощью инструкций на естественном языке. Чтобы правильно выполнить редактирование, такие модели требуют от пользователя предоставления подробного описания изменений, которые необходимо выполнить.

Однако на практике пользователи часто вводят лишь краткие инструкции, что ограничивает полезность инструментов редактирования изображений на базе искусственного интеллекта. Система MGIE призвана устранить это ограничение. По словам разработчиков, программное обеспечение может надежно редактировать изображение, даже если пользователь описывает изменения, которые необходимо внести, всего в нескольких словах. MGIE достигает такой надежности за счёт объединения стандартного ИИ для редактирования изображений с большой языковой моделью.

Исследователи привели несколько примеров того, как можно использовать MGIE. Во время одного из тестов они ввели в MGIE фотографию пиццы вместе с инструкцией «сделай ее более полезной». В ответ система выдала отредактированную версию фотографии, на которой изображена пицца с большим количеством овощных начинок.

MGIE может не только добавлять объекты к изображению, но и удалять существующие. Более того, система предоставляет возможность выполнять более широкие правки, затрагивающие всю фотографию, а не только отдельные ее части. Пользователь может, например, попросить MGIE изменить яркость изображения или повысить уровень детализации.

Фирменный сервис пока поддерживает только описания на английском языке. MGIE пока не оформлен как отдельный сервис. Исходный код системы можно установить с GitHub, а в виде рабочего демо он представлен на сайте HuggingFace. Будет ли Apple использовать нейросеть в собственных продуктах пока не сообщается.

Подпишись вTelegram
Блогеры продемонстрировали преимущества AMD FSR 4 над версией 3.1

Блогеры продемонстрировали преимущества AMD FSR 4 над версией 3.1

ASUS представила компактный ПК ROG NUC 2025 с видеокартой RTX 5080

ASUS представила компактный ПК ROG NUC 2025 с видеокартой RTX 5080

Представлен Redmi Note 14 Pro и Pro+ 5G – глобалки с 200-Мп камерой

Представлен Redmi Note 14 Pro и Pro+ 5G – глобалки с 200-Мп камерой

Представлены игровые ноутбуки с NVIDIA RTX 5090 и AMD Ryzen 9 9955HX3D

Представлены игровые ноутбуки с NVIDIA RTX 5090 и AMD Ryzen 9 9955HX3D

Lenovo ThinkBook Plus Gen 6 Rollable – ноутбук с раздвижным экраном

Lenovo ThinkBook Plus Gen 6 Rollable – ноутбук с раздвижным экраном

Xiaomi представила POCO X7 и POCO X7 Pro

Xiaomi представила POCO X7 и POCO X7 Pro

Дизайн Nintendo Switch 2 раскрыт на рендерах

Дизайн Nintendo Switch 2 раскрыт на рендерах

Нотбук Lenovo Legion Pro 7i – получил RTX 5090, Intel Core Ultra 9 275HX и OLED-дисплей

Нотбук Lenovo Legion Pro 7i – получил RTX 5090, Intel Core Ultra 9 275HX и OLED-дисплей

Тест производительности NVIDIA RTX 5080 с DLSS 4 в Cyberpunk 2077

Тест производительности NVIDIA RTX 5080 с DLSS 4 в Cyberpunk 2077

Ультратонкий Razer Blade 16 получил OLED-экран и видеокарту RTX 5090

Ультратонкий Razer Blade 16 получил OLED-экран и видеокарту RTX 5090

Lenovo представила консоли Legion Go 2 и Legion Go S на базе SteamOS

Lenovo представила консоли Legion Go 2 и Legion Go S на базе SteamOS

Представлены ASUS Vivobook 14 и 16 – чип Snapdragon X и до 20 часов без подзарядки

Представлены ASUS Vivobook 14 и 16 – чип Snapdragon X и до 20 часов без подзарядки