Группа исследователей из Apple и Калифорнийского университета в Санта-Барбаре представила систему искусственного интеллекта MGIE, которая позволяет пользователям редактировать изображения с помощью команд на естественном языке.

На рынке существует множество моделей искусственного интеллекта, которые предоставляют возможность редактировать изображения с помощью инструкций на естественном языке. Чтобы правильно выполнить редактирование, такие модели требуют от пользователя предоставления подробного описания изменений, которые необходимо выполнить.

Однако на практике пользователи часто вводят лишь краткие инструкции, что ограничивает полезность инструментов редактирования изображений на базе искусственного интеллекта. Система MGIE призвана устранить это ограничение. По словам разработчиков, программное обеспечение может надежно редактировать изображение, даже если пользователь описывает изменения, которые необходимо внести, всего в нескольких словах. MGIE достигает такой надежности за счёт объединения стандартного ИИ для редактирования изображений с большой языковой моделью.

Исследователи привели несколько примеров того, как можно использовать MGIE. Во время одного из тестов они ввели в MGIE фотографию пиццы вместе с инструкцией «сделай ее более полезной». В ответ система выдала отредактированную версию фотографии, на которой изображена пицца с большим количеством овощных начинок.

MGIE может не только добавлять объекты к изображению, но и удалять существующие. Более того, система предоставляет возможность выполнять более широкие правки, затрагивающие всю фотографию, а не только отдельные ее части. Пользователь может, например, попросить MGIE изменить яркость изображения или повысить уровень детализации.

Фирменный сервис пока поддерживает только описания на английском языке. MGIE пока не оформлен как отдельный сервис. Исходный код системы можно установить с GitHub, а в виде рабочего демо он представлен на сайте HuggingFace. Будет ли Apple использовать нейросеть в собственных продуктах пока не сообщается.

Подпишись вTelegram
Планшет OPPO Pad 3 Pro вышел на глобальный рынок  – Snapdragon 8 Gen 3, 144 Гц и 12 ГБ ОЗУ

Планшет OPPO Pad 3 Pro вышел на глобальный рынок – Snapdragon 8 Gen 3, 144 Гц и 12 ГБ ОЗУ

Представлена Sony Alpha 1 II – беззеркальная камера за $6500

Представлена Sony Alpha 1 II – беззеркальная камера за $6500

Представлен Nubia Z70 Ultra – фотофлагман на Snapdragon 8 Elite

Представлен Nubia Z70 Ultra – фотофлагман на Snapdragon 8 Elite

Представлен Redmi A4 5G – 120 Гц, Snapdragon 4s Gen 2 и цена $101

Представлен Redmi A4 5G – 120 Гц, Snapdragon 4s Gen 2 и цена $101

Microsoft выпустила мини-ПК Windows 365 Link, напоминающий Mac mini

Microsoft выпустила мини-ПК Windows 365 Link, напоминающий Mac mini

Valve разрабатывает Steam Controller 2 и геймпад для VR-гарнитуры

Valve разрабатывает Steam Controller 2 и геймпад для VR-гарнитуры

Apple выпустила iOS 18.1.1

Apple выпустила iOS 18.1.1

MacBook Pro на M4 Max протестировали в играх

MacBook Pro на M4 Max протестировали в играх

ASUS представила игровые смартфоны ROG Phone 9 и ROG Phone 9 Pro – 5800 мАч, 185 Гц и Snapdragon 8 Elite

ASUS представила игровые смартфоны ROG Phone 9 и ROG Phone 9 Pro – 5800 мАч, 185 Гц и Snapdragon 8 Elite

Представлен VAIO SX14-R – ноутбук весом 999 грамм с автономностью до 38 часов

Представлен VAIO SX14-R – ноутбук весом 999 грамм с автономностью до 38 часов

Samsung представила технологию ALoP (All Lenses on Prism), улучшающую перископическую камеру в смартфонах

Samsung представила технологию ALoP (All Lenses on Prism), улучшающую перископическую камеру в смартфонах

На смартфоне со Snapdragon 8 Elite запустили Cyberpunk 2077

На смартфоне со Snapdragon 8 Elite запустили Cyberpunk 2077