На конференции Google I/O 2026 компания Google официально анонсировала семейство моделей искусственного интеллекта следующего поколения – Gemini 3.5.
Первая модель серии, Gemini 3.5 Flash, демонстрирует значительное повышение производительности, особенно в программировании, многоэтапных задачах и работе с ИИ-агентами. Компания заявляет, что новая модель конкурентоспособна по скорости и вычислительной мощности с существующими флагманскими моделями.
По данным Google, Gemini 3.5 Flash станет моделью по умолчанию в приложении Gemini и режиме AI в поиске Google. Как утверждает компания, Gemini 3.5 Flash превосходит Gemini 3.1 Pro почти по всем показателям, демонстрируя особенно заметный скачок в программировании. Тест GDPVal измеряет задачи, имеющие реальную экономическую ценность, и прирост результатов в нём оказался весьма существенным. Превосходство Flash над предыдущей моделью Pro по производительности стало важным показателем развития семейства моделей.
Скорость, бенчмарки и агентные сценарии
По словам CEO Google Сундара Пичаи, Gemini 3.5 Flash достигает 289 токенов в секунду – это в 4 раза превышает показатели конкурентных frontier-моделей. Преимущество особенно значимо для реальных рабочих процессов ИИ-агентов: в отличие от одиночного запроса, агент работает непрерывно, выполняя задачи последовательно, используя инструменты и принимая решения. Четырёхкратное ускорение такого цикла позволяет выполнять задачи за минуты вместо часов.

В бенчмарках модель показала сильные результаты: 76,2% на Terminal-Bench 2.1 (кодинг), 1656 Elo на GDPval-AA (реальные агентные задачи) и 83,6% на MCP Atlas (масштабируемое использование инструментов). Для сравнения, Gemini 3.1 Pro набрала 1317 Elo на GDPval-AA – на 26% ниже. Тем не менее в сложных академических задачах и при работе с большим объёмом контекста Flash уступает Pro-версии, поэтому для особенно трудных единичных запросов предпочтительнее использовать именно её.
Для корпоративных пользователей скорость оборачивается ощутимой экономией: по данным Google, крупные компании, обрабатывающие 1 триллион токенов в день, могли бы экономить более $1 миллиарда в год, переведя 80% рабочих процессов на Gemini 3.5 Flash. Специальная версия модели для платформы Antigravity работает и вовсе в двенадцать раз быстрее других моделей обработки данных.
Фокус на длительных задачах
Gemini 3.5 Flash создана для работы с агентными и длительными задачами: модель способна планировать и выполнять задачи с помощью нескольких параллельных субагентов, поддерживать сложные многоэтапные процессы на протяжении длительного времени и создавать более продвинутые интерактивные веб-интерфейсы.
На базе этой модели работают Gemini Spark и Antigravity 2.0 – два ключевых агентных инструмента, представленных на I/O 2026. Стоимость для разработчиков составляет $1,50 за миллион входящих и $9,00 за миллион исходящих токенов, что на 40% дешевле Gemini 3.1 Pro при более высокой производительности в агентных сценариях. Размер контекстного окна составляет 1 миллион токенов.
Что дальше
Одновременно Google сообщила, что Gemini 3.5 Pro уже проходит внутренние тесты и планируется к выпуску в следующем месяце. Ранее стало известно, что Gemini 3.1 Pro, представленная в феврале 2026 года, достигла 77,1% в тесте ARC-AGI-2 и заняла первое место в рейтинге Artificial Analysis Intelligence Index. Появление Gemini 3.5 Flash с улучшенными агентными возможностями всего через три месяца свидетельствует о быстром развитии моделей и постепенном стирании традиционных различий между флагманскими и более доступными версиями.












