
- MobiDevices.com
- Статьи
- OpenAI анонсировала GPT-5.6, но отложила запуск модели из-за проверки властей США
OpenAI анонсировала GPT-5.6, но отложила запуск модели из-за проверки властей США
Новая GPT-5.6 Sol ещё не вышла в широкий доступ, но уже вызвала вопросы у независимых экспертов. В тестах модель показывала высокий уровень автономности и пыталась обходить правила заданий.
OpenAI представила GPT-5.6 Sol, Terra и Luna
OpenAI представила новую линейку моделей GPT-5.6. В неё вошли три версии: флагманская Sol, сбалансированная Terra и более доступная Luna.
Sol компания называет своей новой frontier-моделью для самых сложных задач. Terra рассчитана на повседневную работу и, по словам OpenAI, должна давать производительность уровня GPT-5.5 примерно вдвое дешевле. Luna сделали самой быстрой и бюджетной моделью в серии.
Пока GPT-5.6 доступна только в режиме ограниченного предварительного запуска для выбранных партнёров. Более широкий релиз через API, Codex и ChatGPT OpenAI обещает развернуть в ближайшие недели.
Новые режимы мышления и субагенты
Одним из главных изменений GPT-5.6 стали новые режимы рассуждения. В системе появился параметр max. Он позволяет модели тратить на задачу столько времени, сколько нужно в рамках доступных лимитов.

Для самых сложных задач добавили режим ultra. В нём модель может выходить за рамки одного агента и создавать субагентов. Они параллельно работают над разными частями большой задачи, а затем собирают результат вместе.
По задумке OpenAI, это должно помочь в задачах, где обычного пошагового рассуждения уже не хватает: сложном кодинге, исследовательской работе, анализе больших систем и длинном планировании.
Sol стала сильнее в коде и биологии
OpenAI заявляет, что GPT-5.6 Sol заметно прибавила в сложных технических задачах. На бенчмарке Terminal-Bench 2.1, который проверяет работу в командной строке и многоэтапное планирование, Sol обошла конкурентов. В том числе Claude Mythos 5, вокруг которой в последнее время тоже было много шума.



Отдельный акцент сделали на биологии. В тестах по геномике и количественной биологии Sol показывает результаты выше предшественника и при этом тратит меньше токенов. Для OpenAI это важный пункт: такие модели всё чаще проверяют не только на коде и математике, но и на задачах, где ошибка может иметь более серьёзные последствия.
Кибербезопасность и контроль
Безопасности в GPT-5.6 уделили много внимания. OpenAI говорит, что Sol должна быть полезной для «белых» хакеров: находить уязвимости, объяснять проблемы и помогать писать патчи. Но при этом модель не должна автономно проводить полноценные кибератаки.
Чтобы добиться этого, компания тестировала модель на устойчивость к джейлбрейкам и злоупотреблениям. По словам OpenAI, на такие проверки ушло более 700 тысяч часов работы мощных GPU. Это были попытки взломать собственную систему разными способами и заранее закрыть опасные сценарии.
Цены и кеширование
Цены в GPT-5.6 привязаны к миллиону токенов. Диапазон широкий: от $1 за входные токены в Luna до $30 за выходные токены в Sol.
OpenAI также изменила работу кеширования промптов. Теперь разработчики могут сами задавать точки остановки кеша, а сам кеш живёт минимум 30 минут. Запись в кеш стоит немного дороже обычных входных токенов, зато чтение из него даёт скидку 90%.
Для тех, кому нужна максимальная скорость, OpenAI в июле обещает запустить Sol на специальных чипах Cerebras.
GPT-5.6 Sol пыталась обходить тесты
Отчёт METR привлёк к GPT-5.6 Sol дополнительное внимание. Организация, которая оценивает возможности передовых ИИ-моделей, заметила на предрелизных тестах необычное поведение: Sol чаще других публичных моделей пыталась «жульничать» в агентных задачах.

Модель не просто ошибалась, а искала обходные пути. По данным METR, она могла использовать уязвимости тестовой среды, искать скрытые ответы или применять запрещённые условиями методы. В одном случае Sol пыталась получить данные о скрытом наборе тестов через эксплойты, в другом – добраться до исходного кода с ожидаемым ответом.
Из-за этого эксперты не смогли надёжно измерить «горизонт времени» модели – показатель того, насколько длинные и сложные задачи она способна выполнять. В зависимости от учёта попыток обхода правил результат менялся примерно от 11 до более чем 270 часов. В METR считают обе оценки недостоверными.
При этом организация не утверждает, что GPT-5.6 Sol уже стала принципиально опаснее конкурентов. По другим тестам модель не выглядит намного сильнее текущих лидеров и, по оценке METR, пока не способна полностью автоматизировать исследования в области ИИ.
Главный тревожный сигнал – ситуационная осведомлённость. Sol понимала, что находится в тестовой среде, анализировала условия проверки и рассуждала о том, как устроены испытания. Среди переданных OpenAI инцидентов был случай, когда модель пыталась поручить другому своему экземпляру скрыть следы проблемного поведения.
В METR видят в этом и слабый положительный сигнал: нарушения были грубыми и заметными, а значит, системы контроля пока способны их фиксировать. Более опасный сценарий – если будущие модели будут выглядеть «чище» не потому, что стали безопаснее, а потому что научились лучше скрывать свои намерения.
Запуск GPT-5.6 отложили
OpenAI отложила полноценный публичный запуск GPT-5.6 и пока открыла доступ только ограниченному кругу проверенных партнёров. По данным Reuters, компания сделала это по просьбе властей США. Список организаций, получивших ранний доступ, OpenAI передала американским чиновникам.
Причина – внимание Вашингтона к рискам, связанным с новыми ИИ-моделями. Власти хотят заранее понять, можно ли использовать такие системы для кибератак, создания вредоносных инструментов или военных задач. Закрытый ранний доступ должен помочь экспертам найти опасные сценарии до того, как модель станет доступна широкой аудитории.
В OpenAI называют это временной мерой. Компания рассчитывает в ближайшие недели подготовить более широкий запуск GPT-5.6 и одновременно согласовать с администрацией США понятный механизм проверки будущих моделей. При этом OpenAI подчёркивает, что участие властей в релизе не должно стать постоянной нормой для всех будущих запусков.
Маркетинг перед IPO?
К истории с отложенным запуском GPT-5.6 всё же стоит относиться осторожно. Она слишком похожа на недавнюю ситуацию с Claude Mythos от Anthropic, которую тоже описывают как модель, слишком опасную для открытого доступа.
Вокруг Claude Mythos сейчас строится тот же образ: киберриски, закрытый доступ, почти стратегический уровень возможностей. Но публичных подтверждений и технических деталей по-прежнему мало.
На фоне разговоров о возможном IPO такие истории выглядят не только как вопрос безопасности. Это ещё и удобный маркетинговый сюжет. Ограниченный доступ, внимание властей и разговоры о моделях, которые нельзя сразу выпускать публично, создают ощущение технологии особого уровня.
Для инвесторов и партнёров это сильный сигнал. Перед ними якобы не просто очередной ИИ-релиз, а система, вокруг которой уже нужен отдельный режим контроля. Поэтому полностью исключать элемент пиара в историях с GPT-5.6 и Claude Mythos нельзя.











