Группа исследователей из Apple и Калифорнийского университета в Санта-Барбаре представила систему искусственного интеллекта MGIE, которая позволяет пользователям редактировать изображения с помощью команд на естественном языке.

На рынке существует множество моделей искусственного интеллекта, которые предоставляют возможность редактировать изображения с помощью инструкций на естественном языке. Чтобы правильно выполнить редактирование, такие модели требуют от пользователя предоставления подробного описания изменений, которые необходимо выполнить.

Однако на практике пользователи часто вводят лишь краткие инструкции, что ограничивает полезность инструментов редактирования изображений на базе искусственного интеллекта. Система MGIE призвана устранить это ограничение. По словам разработчиков, программное обеспечение может надежно редактировать изображение, даже если пользователь описывает изменения, которые необходимо внести, всего в нескольких словах. MGIE достигает такой надежности за счёт объединения стандартного ИИ для редактирования изображений с большой языковой моделью.

Исследователи привели несколько примеров того, как можно использовать MGIE. Во время одного из тестов они ввели в MGIE фотографию пиццы вместе с инструкцией «сделай ее более полезной». В ответ система выдала отредактированную версию фотографии, на которой изображена пицца с большим количеством овощных начинок.

MGIE может не только добавлять объекты к изображению, но и удалять существующие. Более того, система предоставляет возможность выполнять более широкие правки, затрагивающие всю фотографию, а не только отдельные ее части. Пользователь может, например, попросить MGIE изменить яркость изображения или повысить уровень детализации.

Фирменный сервис пока поддерживает только описания на английском языке. MGIE пока не оформлен как отдельный сервис. Исходный код системы можно установить с GitHub, а в виде рабочего демо он представлен на сайте HuggingFace. Будет ли Apple использовать нейросеть в собственных продуктах пока не сообщается.

Подпишись вTelegram
Honor представила часы с 23-дневной автономностью за $59

Honor представила часы с 23-дневной автономностью за $59

ASUS ROG Ally станет портативной Xbox

ASUS ROG Ally станет портативной Xbox

Представлен Honor Pad 10 – доступный планшет для учёбы и отдыха

Представлен Honor Pad 10 – доступный планшет для учёбы и отдыха

Представлены смартфоны Vivo S30 и S30 Pro mini

Представлены смартфоны Vivo S30 и S30 Pro mini

Представлен Realme Neo 7 Turbo – 7200 мАч, 144 Гц, IP69 и Dimensity 9400e

Представлен Realme Neo 7 Turbo – 7200 мАч, 144 Гц, IP69 и Dimensity 9400e

Motorola представила смартфон Edge 2025

Motorola представила смартфон Edge 2025

Нейросеть Grok на 1 год станет частью Telegram

Нейросеть Grok на 1 год станет частью Telegram

PS5 ограниченное время будет дешевле Nintendo Switch 2

PS5 ограниченное время будет дешевле Nintendo Switch 2

Realme GT 7 и GT 7T с батареями на 7000 мАч и зарядкой 120 Вт вышли на мировой рынок

Realme GT 7 и GT 7T с батареями на 7000 мАч и зарядкой 120 Вт вышли на мировой рынок

Каждый десятый комментатор в Telegram – бот

Каждый десятый комментатор в Telegram – бот

Lenovo Legion Go S на SteamOS на 20% производительней Windows-версии

Lenovo Legion Go S на SteamOS на 20% производительней Windows-версии

OnePlus выпустила смартфон с Dimensity 9400e и АКБ на 7100 мАч за $250

OnePlus выпустила смартфон с Dimensity 9400e и АКБ на 7100 мАч за $250