OpenAI объявила о значительном обновлении ChatGPT, которое позволит моделям искусственного интеллекта GPT-3.5 и GPT-4 анализировать изображения и реагировать на них в рамках текстового разговора.
OpenAI, стартап в области искусственного интеллекта из Сан-Франциско, в понедельник выпустил версию своего популярного чат-бота, который может взаимодействовать с людьми с помощью устной речи. Как и в случае с Alexa от Amazon, Siri от Apple и другими цифровыми помощниками, пользователи могут разговаривать с ChatGPT, и он ответит им.
Нововведения
Компания заявляет, что после запуска данной функции пользователи смогут задействовать её, включив голосовое общение в настройках приложения, а затем выбрав один из пяти различных синтетических голосов с такими именами, как «Можжевельник», «Небо», «Бухта», «Эмбер» и «Бриз». OpenAI утверждает, что эти голоса были созданы в сотрудничестве с профессиональными актёрами озвучивания.
Впервые ChatGPT также может реагировать на изображения. Люди могут, например, загрузить фотографию внутренней части своего холодильника, а чат-бот может предоставить им список блюд, которые они могли бы приготовить из имеющихся у них ингредиентов. Также можно сфотографировать свой велосипед и спросить ChatGPT, как опустить сиденье. Затем чат-бот с искусственным интеллектом может порекомендовать правильные инструменты и инструкции, исходя из изображения руководства.
Доступность
Новые функции в ChatGPT будут доступны для подписчиков Plus и Enterprise в течение следующих двух недель. Отмечается, что синтез речи появится только на iOS и Android, а распознавание изображений будет доступно как в веб-интерфейсе, так и в мобильных приложениях.