Track
19 мая на I/O 2026 Google анонсировала Gemini 3.5 Flash — модель, которая обходит Gemini 3.1 Pro в агентных и кодовых бенчмарках и работает в четыре раза быстрее других передовых моделей того же класса.
Релиз вышел на фоне смещения конкуренции в индустрии ИИ к агентной производительности. Кодовые агенты, многошаговая автоматизация рабочих процессов и выполнение задач с длинным горизонтом стали полем основной борьбы, и Google позиционирует 3.5 Flash как свой ответ на этот запрос.
Для разных специалистов — от дата-сайентистов и ML‑инженеров до разработчиков — это важно, потому что 3.5 Flash уже стал (или в ближайшее время станет) моделью по умолчанию в приложении Gemini и в режиме AI в Поиске, а также доступен сегодня через Gemini API. В этой статье я разберу, что было объявлено, что выделяется, приведу цифры бенчмарков и объясню, что это значит для вашей работы.
Что нового в Gemini 3.5 Flash
Ключевое заявление по поводу Gemii 3.5 Flash — это скорость в сочетании с уровнем производительности фронтира. По словам Google, 3.5 Flash в четыре раза быстрее по числу выходных токенов в секунду, чем другие передовые модели, при этом превосходит Gemini 3.1 Pro в бенчмарках, наиболее важных для агентной работы.
На Terminal-Bench 2.1 модель набирает 76,2%. На GDPval-AA — 1 656 Elo. На MCP Atlas — 83,6%. По мультимодальному пониманию — 84,2% на CharXiv Reasoning.
В двух словах, эти цифры означают, что прежнее правило «быстро, дёшево или умно — выберите два» в ИИ стало менее актуальным. Мы получаем лёгкую модель, способную обрабатывать сложные многошаговые агентные процессы без огромных задержек.
Google говорит, что модель уже доступна в Google AI Studio, Gemini API, Android Studio, Gemini Enterprise Agent Platform и Gemini Enterprise. Также она стала моделью по умолчанию в приложении Gemini и в режиме AI в Поиске по всему миру.
Google также объявила, что Gemini 3.5 Pro находится в разработке, уже используется внутри компании и ожидается к запуску в следующем месяце. Релиз 3.5 Flash — это первый шаг в направлении нового семейства моделей, ориентированных на агентное исполнение.
Предпосылки Gemini 3.5
Серия Gemini 3 закрепила текущие позиции Google в гонке фронтирных моделей. Выпущенная в феврале 2026 года Gemini 3.1 Pro возглавила Artificial Analysis Intelligence Index на старте и набрала 77,1% на ARC-AGI-2, более чем вдвое превысив результат Gemini 3 Pro (31,1%) на том же бенчмарке.
Как мы отмечали в нашем сравнении GPT‑5.5 и Gemini 3.1 Pro, сильная сторона Gemini 3.1 Pro — сложное визуальное рассуждение и мультимодальные задачи.
Обозначение Flash в семействе Gemini традиционно указывает на модели, оптимизированные по скорости. Отличие 3.5 Flash в том, что Google заявляет фронтирный уровень «интеллекта» при скоростях уровня Flash, без компромисса по качеству. Индекс Artificial Analysis помещает 3.5 Flash в правый верхний квартиль (по данным Google), то есть одновременно высокая «интеллектуальность» и высокая скорость генерации.
Каркас Antigravity — фреймворк Google для развёртывания сотрудничающих субагентов — играет ключевую роль в позиционировании 3.5 Flash. Это не просто автономная модель, а компонент многоагентной архитектуры, которую Google развивала параллельно с самой моделью.
Ключевые возможности Gemini 3.5
Ниже — самое интересное из анонса.
Производительность в бенчмарках
Заявления Google по бенчмаркам 3.5 Flash конкретны и заслуживают прямого внимания. Модель превосходит Gemini 3.1 Pro по следующим метрикам:
- Terminal-Bench 2.1: 76,2% (Gemini 3.1 Pro тестировалась на Terminal-Bench 2.0 с результатом 68,5%, согласно нашим предыдущим материалам)
- GDPval-AA: 1 656 Elo (на момент запуска лидировал Claude Opus 4.7 с 1 753 Elo, см. наш обзор Claude Opus 4.7 vs Gemini 3.1 Pro)
- MCP Atlas: 83,6% (Gemini 3.1 Pro набрала 73,9% на MCP Atlas в наших прошлых тестах)
- CharXiv Reasoning: 84,2% по мультимодальному пониманию
Заявление о скорости тоже примечательно: в четыре раза больше выходных токенов в секунду, чем у других фронтирных моделей. В исследовательских заметках Google не указывает конкретные модели для сравнения, поэтому стоит воспринимать эту цифру как ориентир, а не точное сравнение лоб в лоб.
Агентная архитектура и Antigravity
3.5 Flash спроектирована для работы с каркасом Antigravity — фреймворком Google для запуска сотрудничающих субагентов. С Antigravity модель может параллельно развёртывать несколько субагентов, выполнять многошаговые рабочие процессы и поддерживать производительность на задачах с длинным горизонтом.
Среди примеров Google — синтез статьи AlphaZero и разработка полностью играбельной игры за шесть часов силами двух агентов, а также перенос легаси-кодовой базы на Next.js. Это не демонстрационные «игрушки». Это отражение многодневных задач разработчиков, которые сегодня поручают агентным системам.
Реальные внедрения в компаниях
Ряд компаний уже запустили 3.5 Flash в продакшене или пилотах. Конкретные кейсы важны, так как показывают, где проявляются агентные сильные стороны модели:
- Shopify: Параллельный запуск субагентов для анализа сложных данных на длинном горизонте при подготовке прогнозов роста для мерчантов
- Macquarie Bank: Пилот онбординга клиентов с рассуждением по документам объёмом 100+ страниц при низкой задержке
- Salesforce: Интеграция в Agentforce для автоматизации корпоративных задач с несколькими субагентами и многоходовым вызовом инструментов
- Xero: Развёртывание агентов для управления многонедельными процессами, включая подготовку форм 1099 для малого бизнеса
- Databricks: Агентные процессы для мониторинга информации в реальном времени, диагностики проблем и предложения решений на больших массивах данных
- Ramp: Повышение точности OCR на сложных счетах за счёт мультимодального понимания в сочетании с рассуждением по историческим паттернам
Gemini Spark и доступ для пользователей
3.5 Flash также лежит в основе Gemini Spark — нового персонального ИИ‑агента Google, который работает 24/7 и выполняет действия от имени пользователей. Сейчас Google предоставляет Spark доверенным тестировщикам, а Бета для подписчиков Google AI Ultra в США запланирована на неделю после анонса на I/O.
Модель доступна сегодня миллиардам пользователей по всему миру через приложение Gemini и режим AI в Поиске — это один из самых масштабных одновременных запусков для потребителей и разработчиков среди моделей Gemini.
Безопасность и меры защиты
По словам Google, 3.5 Flash создана в рамках Frontier Safety Framework с усиленными кибер‑ и CBRN‑мерами защиты. Компания использует инструменты интерпретируемости, которые проверяют внутреннее рассуждение модели перед ответом, чтобы снизить как вредоносные выходы, так и ложные отказы на безопасные запросы.
Gemini 3.5 для специалистов по данным и ИИ
Самое практическое последствие — 3.5 Flash в ближайшее время доступна через Gemini API в Google AI Studio. Если вы строите агентные пайплайны, сочетание результата MCP Atlas (83,6%) и многоагентного каркаса Antigravity делает модель достойной тестирования в сравнении с тем, что вы используете сейчас.
Показатель GDPval-AA в 1 656 Elo уступает 1 753 Elo у Claude Opus 4.7 в нашем раннем обзоре, но преимущество 3.5 Flash в скорости может оказаться важнее в зависимости от ваших требований к задержкам.
Для команд, запускающих долгосрочные процессы, кейсы Xero и Shopify — самые показательные. Сжатие многонедельных рабочих процессов до автоматизированных прогонов агентов — это тот сценарий, под который Google оптимизирует решения, а каркас Antigravity — инфраструктурный слой, который это обеспечивает. Если вы ещё не знакомы с паттернами оркестрации многоагентных систем, сейчас хороший момент наверстать.
На что я бы обратил особое внимание: Google утверждает, что 3.5 Flash стоит менее половины цены других фронтирных моделей на сопоставимых задачах. Это заявление сильно зависит от конкретной нагрузки, но если оно подтвердится на практике, экономика масштабных агентных систем изменится. Модель 3.5 Pro, ожидаемая в следующем месяце, будет ещё более интересной точкой сравнения для команд с самыми тяжёлыми задачами рассуждения.
Заключение
Gemini 3.5 Flash показывает, что Google намерена конкурировать по обеим осям «производительность—скорость», а не только в флагманском сегменте. Превосходство над Gemini 3.1 Pro в агентных бенчмарках при скоростях уровня Flash — серьёзный сдвиг, а внедрения в Shopify, Macquarie и Salesforce указывают, что модель выдерживает проверку вне контролируемых тестов.
В более широком контексте Google делает серьёзную ставку на агентную инфраструктуру: Antigravity, Gemini Spark и 3.5 Flash двигаются в одном направлении. Оправдается ли ставка, зависит от того, как покажет себя 3.5 Pro при выходе в следующем месяце и как каркас Antigravity будет сопоставляться с конкурирующими многоагентными фреймворками в реальных рабочих процессах разработчиков.
Если вы хотите быстро разобраться в концепциях агентного ИИ и в том, как строить решения на подобных моделях, рекомендуем изучить трек навыков AI Agent Fundamentals на DataCamp.