OpenAI представила новую флагманскую модель генеративного искусственного интеллекта под названием GPT-4 Omni (GPT-4o). Буква «o» означает «omni», что указывает на способность модели обрабатывать текст, речь и видео.
Среди новых возможностей Gpt4-o – загрузка скриншотов с возможностью задавать вопросы на их основе, а также запоминание предыдущих вопросов и доступ к интернету.
Особенности
В ходе презентации были продемонстрированы возможности GPT-4 Omni, которая способна вести устные беседы в режиме реального времени. Речь GPT-4o имеет эмоциональную интонацию, в одних моментах она демонстрирует волнение, а в других – смех. Кроме того, она также может идентифицировать эмоции и тон в речи пользователей.
Модель говорит как человек, и мгновенно реагирует на подсказки дружелюбным голосом. Обновленная версия чат-бота может реагировать на аудио вход только за 232 миллисекунды (в среднем 320 миллисекунд), что соответствует реакции человека в разговоре. До этого использовать голосовой режим для разговора с ChatGPT можно было со средней задержкой 2,8 секунды (GPT-3,5) и 5,4 секунды (GPT-4).
Сотрудники OpenAI демонстрировали разговоры с чат-ботами с искусственным интеллектом практически без задержек. Они даже могли прерывать ChatGPT, пока он отвечал.
«GPT-4o обеспечивает интеллект уровня GPT-4, но работает намного быстрее», – сказал главный технический директор Мира Мурати. А в будущем функции GPT-4 Omni будут совершенствоваться.
Среди прочего также стоит отметить:
- GPT-4 Omni может искать информацию в интернете.
- Знает 50 языков, а качество перевода текстов улучшили на 50%.
- Нейросеть пишет код в 10 раз быстрее обычной GPT-4.
Сроки выхода
GPT-4o доступна как платным, так и бесплатным пользователям ChatGPT, уже сегодня. Однако подписчики платных тарифных планов ChatGPT Plus и Team смогут отправлять в 5 раз больше сообщений. Если бесплатные пользователи превышают лимит сообщений, ChatGPT автоматически переключится на GPT-3.5, тогда как платные пользователи перейдут на стандартную версию GPT-4.
Бесплатные пользователи ChatGPT получат доступ к некоторым функциям, ранее доступным только подписчикам. Обновлённый чат-бот GPT-4o теперь сможет искать информацию в интернете, анализировать данные и создавать графики, работать с изображениями и файлами пользователей, а также лучше запоминать предыдущие взаимодействия. Кроме того, бесплатные пользователи смогут пользоваться GPT Store.
Производитель планирует «итеративно» внедрять модель в своих продуктах для разработчиков и потребителей в течение следующих нескольких недель.