Группа исследователей из Apple и Калифорнийского университета в Санта-Барбаре представила систему искусственного интеллекта MGIE, которая позволяет пользователям редактировать изображения с помощью команд на естественном языке.

На рынке существует множество моделей искусственного интеллекта, которые предоставляют возможность редактировать изображения с помощью инструкций на естественном языке. Чтобы правильно выполнить редактирование, такие модели требуют от пользователя предоставления подробного описания изменений, которые необходимо выполнить.

Однако на практике пользователи часто вводят лишь краткие инструкции, что ограничивает полезность инструментов редактирования изображений на базе искусственного интеллекта. Система MGIE призвана устранить это ограничение. По словам разработчиков, программное обеспечение может надежно редактировать изображение, даже если пользователь описывает изменения, которые необходимо внести, всего в нескольких словах. MGIE достигает такой надежности за счёт объединения стандартного ИИ для редактирования изображений с большой языковой моделью.

Исследователи привели несколько примеров того, как можно использовать MGIE. Во время одного из тестов они ввели в MGIE фотографию пиццы вместе с инструкцией «сделай ее более полезной». В ответ система выдала отредактированную версию фотографии, на которой изображена пицца с большим количеством овощных начинок.

MGIE может не только добавлять объекты к изображению, но и удалять существующие. Более того, система предоставляет возможность выполнять более широкие правки, затрагивающие всю фотографию, а не только отдельные ее части. Пользователь может, например, попросить MGIE изменить яркость изображения или повысить уровень детализации.

Фирменный сервис пока поддерживает только описания на английском языке. MGIE пока не оформлен как отдельный сервис. Исходный код системы можно установить с GitHub, а в виде рабочего демо он представлен на сайте HuggingFace. Будет ли Apple использовать нейросеть в собственных продуктах пока не сообщается.

Подпишись вTelegram
ASUS представила игровой ноутбук TUF Gaming A14 с видеокартой RTX 5060

ASUS представила игровой ноутбук TUF Gaming A14 с видеокартой RTX 5060

Вышла iOS 18.4.1 с исправлением критических ошибок

Вышла iOS 18.4.1 с исправлением критических ошибок

Представлен Samsung Galaxy M56 – 5000 мАч и Exynos 1480

Представлен Samsung Galaxy M56 – 5000 мАч и Exynos 1480

Motorola представила свой первый ноутбук – OLED на 120 Гц и Intel Core 7

Motorola представила свой первый ноутбук – OLED на 120 Гц и Intel Core 7

Планшет Motorola Pad 60 Pro получил 144-герцевый экран и батарею на 10 200 мАч

Планшет Motorola Pad 60 Pro получил 144-герцевый экран и батарею на 10 200 мАч

OpenAI тратит «десятки миллионов долларов» на благодарность ChatGPT

OpenAI тратит «десятки миллионов долларов» на благодарность ChatGPT

Schenker выпустила ноутбук с 256 ГБ ОЗУ и RTX 5090

Schenker выпустила ноутбук с 256 ГБ ОЗУ и RTX 5090

Наушники Skullcandy Method 360 ANC могут проработать до 11 часов

Наушники Skullcandy Method 360 ANC могут проработать до 11 часов

Acer выпустила смартфоны Super ZX и ZX Pro

Acer выпустила смартфоны Super ZX и ZX Pro

Представлен Red Magic 10 Air – тонкий смартфон на Snapdragon 8 Gen 3 и с батареей на 6000 мАч

Представлен Red Magic 10 Air – тонкий смартфон на Snapdragon 8 Gen 3 и с батареей на 6000 мАч

Polaroid Flip – моментальная камера за $200

Polaroid Flip – моментальная камера за $200

NVIDIA представила десктопную RTX 5060 за $299

NVIDIA представила десктопную RTX 5060 за $299