Google I/O 2026: начало агентной эры Gemini

От Gemini 3.5 Flash и Gemini Omni до Antigravity 2.0 и Gemini Spark — главное из ключевого выступления Google на I/O 2026, посвящённого агентам.

Обновлено 20 мая 2026 г. · 12 мин читать

Сквозная тема почти каждого анонса в первый день конференции Google I/O 2026 была одна и та же: агенты. Не чат-боты и не ассистенты, а постоянные, выполняющие задачи агенты, работающие в фоне и интегрированные во весь продуктовый стек Google. Генеральный директор Сундар Пичай прямо назвал это «агентной эрой Gemini», и представленные анонсы это подтверждают.

Google также ответила на подписки Anthropic Claude Max и OpenAI ChatGPT Pro, представив на I/O новый тариф Google AI Ultra по той же цене $100 в месяц, который открывает доступ к части агентных функций, описанных ниже.

В этой статье я разберу анонсы, которые важнее всего для специалистов по ИИ и разработчиков. Сфокусируюсь на обновлениях, которые доступны уже сейчас или появятся в ближайшее время.

Gemini 3.5 Flash

Gemini 3.5 Flash — главный релиз модели с I/O 2026. Он обходит Gemini 3.1 Pro в агентных и кодовых бенчмарках, а Google утверждает, что модель генерирует выходные токены в 4 раза быстрее, чем другие передовые модели. Пока мы не можем это подтвердить, но заявление, безусловно, смелое.

Если смотреть на бенчмарки, скачок производительности заметен, особенно в MCP Atlas, CharXiV Reasoning и Finance Agent v2, где Gemini 3.5 Flash лидирует. В целом 3.5 Flash выглядит конкурентоспособной по сравнению с Claude Opus 4.7 и GPT-5.5.

Бенчмарк	3.5 Flash	3 Flash	3.1 Pro	Claude Sonnet 4.6	Opus 4.7	GPT-5.5
Terminal-bench 2.1	76,2%	58,0%	70,3%	--	66,1%	78,2%
SWE-Bench Pro	55,1%	49,6%	54,2%	--	64,3%	58,6%
MCP Atlas	83,6%	62,0%	78,2%	69,5%	79,1%	75,3%
OSWorld	78,4%	65,1%	76,2%	72,5%	78,0%	78,7%
Finance Agent v2	57,9%	42,6%	43,0%	51,0%	51,5%	51,8%
CharXiv Reasoning	84,2%	80,3%	83,3%	72,4%	82,1%	84,1%
Humanity's Last Exam	40,2%	33,7%	44,4%	33,2%	46,9%	41,4%
ARC-AGI-2	72,1%	33,6%	77,1%	58,3%	75,8%	84,6%

Здесь стоит отметить и стоимость. По заявлению Google, предприятия, обрабатывающие около 1 триллиона токенов в день, могут экономить более $1 млрд в год, перенеся 80% нагрузок с других передовых моделей на 3.5 Flash. Это прямое обращение к корпоративным клиентам OpenAI и Anthropic. Gemini 3.5 Flash доступна уже сегодня через Gemini API, Google AI Studio и приложение Gemini. Gemini 3.5 Pro уже используется внутри компании и ожидается в следующем месяце.

Подробнее — в нашей статье о Gemini 3.5 Flash, где мы разбираем новую модель глубже.

Gemini Omni

Gemini Omni — новая нативно мультимодальная генеративная медиа-модель Google, способная принимать на вход любые комбинации текста, изображений, аудио и видео и выдавать видео. Первая модель в семействе, Gemini Omni Flash, доступна сегодня в приложении Gemini, Google Flow и YouTube Shorts.

Ключевой архитектурный момент в том, что Omni объединяет ранее раздельный стек (видео — Veo, изображения — Imagen, отдельные аудиосистемы) в одну модель. Это означает более связные правки и меньше артефактов конвейера при работе между модальностями. Google не опубликовала числовых бенчмарков Omni к запуску, так что независимая оценка ещё впереди. Доступ к API для разработчиков и корпоративных клиентов появится в недели после I/O.

Мы протестировали модель и подробно описали её в статье о Gemini Omni. Первые результаты генерации видео получились неровными (по крайней мере с учётом высоких стандартов, заданных такими инструментами, как Seedance 2.0), но более мощная Gemini Omni Pro ожидается совсем скоро.

Antigravity 2.0

Antigravity — ориентированная на агентов платформа разработки от Google, и релиз 2.0 на I/O — серьёзное расширение. Ранее позиционируясь как среда для кодинга, теперь это полноценная платформа для разработки, развёртывания и управления когортами автономных ИИ-агентов. Центральный элемент — новое самостоятельное десктопное приложение, выступающее в роли хаба для оркестрации агентов и позволяющее запускать несколько агентов параллельно на разных задачах одновременно.

В экосистеме теперь четыре отдельных поверхности для разработчиков:

Десктопное приложение Antigravity 2.0: Оркеструет несколько агентов параллельно и поддерживает запланированные фоновые задачи. Интегрируется с Google AI Studio, Android и Firebase.
Antigravity CLI: Терминальная среда для создания и запуска агентов без графического интерфейса. Пользователям Gemini CLI предлагается мигрировать на неё.
Antigravity SDK: Программный доступ к тому же каркасу агентов, который питает продукты Google, с поддержкой пользовательских поведений агентов на вашей собственной инфраструктуре.
Antigravity в Gemini Enterprise Agent Platform: Подключает Antigravity напрямую к проектам Google Cloud для корпоративных нагрузок.

Есть и несколько очень полезных новых функций для ядра агента. Самая важная: теперь он может на лету порождать модульные субагенты, каждый из которых работает параллельно с изоляцией рабочих пространств и наследует конфигурацию инструментов и разрешения родителя. Долгоидущие операции выполняются асинхронно и больше не блокируют цикл агента.

По аналогии с Claude Code Hooks, JSON Hooks позволяют пользователям прикреплять пользовательские shell-скрипты на ключевых этапах выполнения (до/после вызовов инструментов, вызовов модели или при условиях остановки) для логирования, настройки аргументов или инъекции инструкций. Запланированные задачи позволяют задавать cron-подсказки для периодических запусков агента, вроде ежедневных дайджестов PR или почасовых проверок деплоймента, с результатами в боковой панели для бесшовной передачи в контур человека.

В части управления Antigravity вводит «проекты» как организационный примитив, который ограничивает настройки, ресурсы и разрешения на уровне группы агентов, а не требует максимально широких глобальных прав на всё. Обновлённая боковая панель поддерживает группировку разговоров по проекту, статусу или давности, с родной поддержкой Git worktree. Такая проектная компоновка сопоставима с многоконным управлением рабочими пространствами в Cursor и очередью задач в Codex, но с более жёстким ограничением прав на уровне проекта.

Голосовой ввод через аудиомодели Gemini и новые слэш-команды (/goal для автономных запусков, /grill-me для уточнений до задачи, /schedule для cron-подсказок, /browser для опционального браузера) дополняют UX.

Antigravity 2.0 доступна пользователям с сегодняшнего дня. План Google AI Ultra ($100 в месяц) включает в 5 раз более высокие лимиты использования в Antigravity по сравнению с планом Google AI Pro.

Управляемые агенты в Gemini API

Вместе с Antigravity 2.0 Google анонсировала Managed Agents в Gemini API, что приносит агентные возможности прямо на уровень API для разработчиков, желающих создавать приложения на базе агентов без самостоятельного управления инфраструктурой оркестрации. Это API-комплимент к десктопному опыту Antigravity.

Практическое следствие для разработчиков: теперь вы можете определять поведение агентов, интеграции инструментов и многошаговые рабочие процессы через Gemini API, а выполнение будет обрабатываться инфраструктурой Google. Это может стать настоящим переломным моментом для команд, создающих продакшен-приложения с долгими горизонтами задач без поднятия и управления собственным каркасом агентов. Доступ предоставляется через Google AI Studio, а корпоративные клиенты могут пользоваться им через Gemini Enterprise Agent Platform.

Одна честная оговорка: ранние отзывы разработчиков в материалах об I/O отмечают, что документация по сложным потокам агентов и обработке ошибок пока скудна. Также как точки трения обозначены лимиты и квоты. Вероятно, со временем эти проблемы станут менее острыми, но о них стоит знать до того, как вы решите строить на этом стеке.

Gemini Spark

Gemini Spark (не путать с последней LLM от Meta, Muse Spark) — новый персональный ИИ-агент от Google, и это самый ориентированный на потребителя из агентных анонсов. Он работает 24/7 на выделенных виртуальных машинах в Google Cloud, то есть вашему ноутбуку не нужно быть открытым, чтобы он продолжал работу. Spark работает на Gemini 3.5 и каркасе Antigravity, что даёт ему возможность выполнять долгосрочные задачи в фоне.

Набор функций на старте включает:

Интеграцию с инструментами Google (Workspace, Gmail, Calendar) на запуске, с поддержкой сторонних инструментов через MCP в последующие недели.
Взаимодействие через приложение Gemini, а вскоре — по email и в чате.
Работу прямо в Chrome как агентного слоя браузера, позже этим летом.
Отображение прогресса задач в реальном времени через Android Halo, новое пространство интерфейса на Android, позже в этом году.

Напрашивается прямое сравнение с экосистемой агентов OpenAI и возможностями использования инструментов в Anthropic. Дифференциатор Spark — это круглосуточное постоянное выполнение на инфраструктуре Google Cloud в сочетании с глубокой интеграцией в собственный пакет продуктивности Google. Если ваша работа уже живёт в Google Workspace, это существенное преимущество. Если нет — ценность менее очевидна.

Здесь уместно говорить о приватности. Агент, который непрерывно мониторит вашу почту, календарь и документы, поднимает серьёзные вопросы о размещении данных и комплаенсе в регулируемых отраслях. Например, я спрашивал себя: «Что происходит с памятью агента, когда сотрудник уходит?» Подробных ответов Google пока не дала.

Spark будет развёртываться у доверенных тестировщиков на этой неделе, а на следующей — бета для подписчиков Google AI Ultra ($100 в месяц) в США. Мы подробно освещаем это в статье о Gemini Spark.

Поисковые агенты и режим AI

Режим AI в Поиске представили на прошлом I/O. Спустя год у него более миллиарда активных пользователей в месяц. Теперь Google идёт дальше с двумя новыми агентными возможностями.

Первая — информационные агенты в Поиске: персональные фоновые агенты, которые вы настраиваете для мониторинга тем и вывода релевантной информации в нужный момент. Их начнут развёртывать этим летом, начиная с подписчиков Google AI Pro и Ultra.

Второе — генеративный интерфейс в Поиске, на базе Gemini 3.5 Flash и Antigravity. Поиск теперь будет собирать пользовательские макеты, интерактивные визуализации и даже постоянные панели или мини‑приложения для сложных, долгих запросов. Возможности генеративного интерфейса этим летом бесплатно получат все пользователи. Функции постоянных панелей и пользовательских приложений сначала станут доступны подписчикам Pro и Ultra в США.

Это серьёзная проблема для издателей и SEO-специалистов (как уже были введение AI Overview и режима AI). Когда ответы, сгенерированные ИИ, полностью закрывают запрос пользователя прямо в Поиске, нет причин переходить на сайт-источник. Мы уже видели это на практике: и AI Overviews, и первый запуск режима AI привели к существенному падению трафика по индустрии. Google до сих пор не предложила прозрачного способа делиться выручкой или гарантировать трафик издателям, чей контент питает эти ответы.

Google Flow

Google Flow, дебютировавший на I/O 2025 как инструмент для создания фильмов с ИИ, сделал большой шаг вперёд благодаря трём ключевым обновлениям:

Более умный планирующий агент. Обновлённый агент Flow теперь умеет планировать и продумывать многошаговые творческие проекты. Вы даёте ему входные данные (скажем, концепцию, несколько референсов, черновик сценария), а он помогает пройти путь от раннего брейнсторминга до создания и редактирования — всё в одной среде. Новый агент доступен всем уже сегодня.
Нативное видео через Gemini Omni. Flow теперь нативно обрабатывает генерацию и редактирование видео через модель Omni. Вы можете описать изменения к ролику с вашей камеры простым языком и итеративно дорабатывать. Улучшилась согласованность персонажей, так что личность и голос сохраняются между сценами. Это особенно полезно при создании короткометражек или рекламных кампаний с повторяющимися персонажами.
Vibe‑кодинг для пользовательских инструментов. Вместо ограничений предустановленными инструментами вы теперь можете создавать свои прямо на платформе. Google показала примеры разработки пользовательских видеоеффектов, инструментов для рисованной анимации и конвейеров наложения текста — не покидая Flow.

В совокупности эти обновления делают Flow больше, чем просто творческим ассистентом. Он становится платформой для построения творческих рабочих процессов, при этом мобильное приложение уже в бете на Android и скоро выйдет на iOS.

Расширение SynthID

SynthID, невидимая система водяных знаков для ИИ-контента от Google, с момента запуска три года назад пометила уже более 100 миллиардов изображений и видео и эквивалент 60 000 лет аудиоматериалов. Важнее масштаба — партнёры: OpenAI, Kakao и Eleven Labs внедряют SynthID вместе с Nvidia, которая присоединилась в прошлом году.

Именно межотраслевая поддержка делает это значимым. Стандарт водяных знаков работает только тогда, когда он достаточно распространён, чтобы «без водяного знака» было полезным сигналом. Google также расширяет проверку Content Credentials (стандарт C2PA) на Поиск и Chrome, которые будут показывать пользователям, был ли контент создан ИИ или камерой и редактировался ли генеративными инструментами. Сочетание SynthID и C2PA даёт два независимых слоя происхождения — верный подход, учитывая, как легко каждый по отдельности можно снять.

Стоит упомянуть

Ещё несколько анонсов с I/O заслуживают краткого упоминания:

Docs Live: Новая голосо‑первая функция для Google Docs, позволяющая «словесно выгрузить» идеи, а Gemini структурирует их в документ. Развёртывание для подписчиков этим летом; голосовые возможности одновременно придут в Gmail и Keep.
Google Pics: Новый инструмент создания и редактирования изображений на базе модели Nano Banana, который рассматривает каждый элемент как отдельный объект, а не плоскую картинку. Доступен доверенным тестировщикам сейчас, будет развёрнут для подписчиков Google AI Pro и Ultra позже этим летом.
Android Halo: Новое пространство интерфейса на Android для просмотра живых обновлений и прогресса задач от таких агентов, как Gemini Spark. Ожидается позже в этом году.
Daily Brief: Готовый к использованию агент в приложении Gemini, который собирает персонализированный утренний дайджест из вашей почты, календаря и задач с предложенными следующими шагами. Отдельное ценообразование не объявлено; ожидается как часть опыта приложения Gemini.
TPU 8t и 8i: Восьмое поколение TPU от Google реализует подход с двумя чипами: 8t оптимизирован под крупномасштабный предобучение (почти в 3 раза больше «сырой» вычислительной мощности по сравнению с предыдущим поколением, масштабируемый более чем на 1 миллион TPU по всему миру), а 8i — под инференс. Обе линии обеспечивают до 2 раз лучшую производительность на ватт относительно прошлого поколения.
Gemini for Science: Набор инструментов ИИ, соединяющий Antigravity с более чем 30 крупными базами данных по бионаукам. Science Skills доступен сегодня на GitHub и прямо в Antigravity.

Итоги

Google I/O 2026 — ставка на агентов как основное направление ИИ, при этом Gemini 3.5 Flash и Antigravity 2.0 — инфраструктура под почти всеми остальными анонсами. То, чем вы можете пользоваться уже сейчас: Gemini 3.5 Flash (через Gemini API и AI Studio), новый агент Flow, Gemini Omni Flash и десктопное приложение Antigravity 2.0. Gemini Spark, поисковые агенты и генеративные функции интерфейса в Поиске будут развёртываться летом, в основном за «пэйволлом» нового тарифа AI Ultra за $100 в месяц (по крайней мере поначалу).

Лично для меня обновление Antigravity — самый интересный релиз, потому что оно одновременно работает на двух уровнях: как самостоятельное приложение для разработчиков оно напрямую конкурирует с Codex и Claude Code; как платформа — его базовые ADK и Managed Agents API бросают вызов фреймворкам оркестрации вроде LangChain, AutoGen и OpenAI Agents SDK. Интеграция с Gemini и слой развёртывания на Google Cloud — отличительные черты (и риск привязки) в обоих аспектах.

Как Gemini 3.5 Flash сравнивается с GPT-5.5 и Claude Opus 4.7?

Gemini 3.5 Flash лидирует в ряде агентных бенчмарков, таких как MCP Atlas (83,6%) и Finance Agent v2 (57,9%), в то время как GPT-5.5 чуть впереди на SWE-Bench Pro и ARC-AGI-2. Claude Opus 4.7 остаётся сильнейшей на Humanity's Last Exam (46,9%). Главное: модель конкурирует с передовыми системами, работая быстрее и значительно дешевле в масштабе — как и подсказывает название. Более мощная версия Pro ожидается в скором времени.

Чем Google Antigravity отличается от Claude Code или Codex?

Google Antigravity 2.0 — это ориентированная на агентов платформа разработки, позволяющая оркестрировать несколько ИИ-агентов параллельно через десктопное приложение, CLI, SDK и корпоративный API. В отличие от Claude Code (терминального кодового агента) или Codex (системы на очередях задач), Antigravity предлагает более жёсткое разграничение прав на уровне проекта, порождение субагентов и прямую интеграцию с Google Cloud и Firebase. Её двойная роль и как инструмента разработчика, и как платформенного SDK делает её ближе к фреймворку оркестрации, чем к отдельному кодовому ассистенту.

Стоит ли план Google AI Ultra за $100 в месяц по сравнению с ChatGPT Pro или Claude Max?

Все три плана стоят $100 в месяц, но ценность зависит от вашей экосистемы. Отличие Google AI Ultra — доступ к Gemini Spark (постоянному агенту 24/7), пятикратно увеличенные лимиты использования в Antigravity и глубокая интеграция с Google Workspace. Если ваш рабочий процесс уже живёт в Gmail, Docs и Calendar, у Ultra естественное преимущество. Если вам в первую очередь нужна помощь в кодинге или гибкость на уровне API, ChatGPT Pro или Claude Max могут подойти лучше.

Что такое Gemini Omni и как она справляется с генерацией видео?

Gemini Omni — нативно мультимодальная модель Google, которая принимает на вход любые комбинации текста, изображений, аудио и видео и выдаёт видео. Она объединяет ранее раздельные системы (Veo для видео, Imagen для изображений) в одну модель, что должно дать более связные межмодальные правки. Первая версия, Omni Flash, доступна уже сейчас, более мощная Omni Pro ожидается скоро. Независимые бенчмарки пока не опубликованы, поэтому реальное качество ещё оценивается.

Темы

Искусственный интеллект

AI Agents