Илон Маск представил Grok 4 – новейшую модель искусственного интеллекта от xAI, своей многомиллиардной инициативы, направленной на конкуренцию с OpenAI и Google.
Не приводя подробных доказательств, он заявил, что модель успешно проходит стандартизированные тесты и демонстрирует знания на уровне PhD по широкому спектру дисциплин.
Во время часовой прямой трансляции, начавшейся после полуночи по нью-йоркскому времени, Маск заявил:
«Grok 4 – это уровень аспирантуры во всём. По крайней мере, в академических вопросах Grok 4 превосходит уровень доктора философии по всем предметам. Без исключений».
Сотрудники xAI, выступавшие в эфире вместе с Маском, упомянули результаты Grok 4 в популярном тесте для языковых моделей – Humanity’s Last Exam, который включает более 2500 вопросов по десяткам дисциплин, таким как математика, естественные науки и лингвистика. По утверждению компании, Grok 4 способен самостоятельно решать около четверти заданий без использования вспомогательных инструментов.

Согласно xAI, модель показала результат 25,4% в сложном тесте Humanity’s Last Exam, превзойдя показатели Google Gemini 2.5 Pro (21,6%) и OpenAI o3 (high) (21%). В феврале OpenAI сообщила, что её инструмент Deep Research достиг 26% по тому же критерию.
Grok 4 Heavy
Одновременно с основной моделью xAI представила Grok 4 Heavy – многоагентную версию чат-бота, в которой несколько независимых агентов параллельно работают над задачей и сопоставляют свои ответы, имитируя коллективную работу экспертов. Grok 4 Heavy с доступом к инструментам достиг результата 44,4%, в то время как Gemini 2.5 Pro с аналогичными возможностями набрал только 26,9%. По словам xAI, эти данные демонстрируют «высочайший уровень эффективности» в сфере генеративного ИИ.
SuperGrok Heavy
Также была анонсирована премиальная подписка SuperGrok Heavy стоимостью $300 в месяц – самая дорогая среди предложений крупных ИИ-компаний. Подписка предоставляет ранний доступ к Grok 4 Heavy и будущим обновлениям, включая инструменты для программирования в августе, многоагентную функциональность в сентябре и генерацию видео в октябре. xAI рассчитывает, что высокая цена обеспечит финансирование дальнейших исследований и привлечёт корпоративных клиентов, заинтересованных в раннем доступе к передовым ИИ-возможностям.
Релиз Grok 4 состоялся спустя несколько дней после того, как компания удалила оскорбительные ответы, сгенерированные предыдущей версией модели – в том числе с антисемитскими и расистскими формулировками. В официальном заявлении xAI отметила:
«Сразу после обнаружения подобного контента мы начали работу по предотвращению распространения языка вражды до публикации новых материалов Grok на платформе X».
Маск напрямую не прокомментировал ситуацию, ограничившись заявлением о важности того, чтобы искусственный интеллект был полезным и безопасным.