Track
Лейтмотив почти всех анонсов в первый день конференции Google I/O 2026 один и тот же: агенты. Не чат-боты, не ассистенты, а постоянные, выполняющие задачи агенты, которые работают в фоновом режиме и интегрируются во всю продуктовую экосистему Google. Генеральный директор Сундар Пичаи прямо назвал это «эпохой агентного Gemini», и анонсы это подтвердили.
Google также ответила на подписки Claude Max от Anthropic и ChatGPT Pro от OpenAI, представив на I/O новый тариф Google AI Ultra, который стоит те же $100 в месяц и ограничивает доступ к некоторым из агентных функций, описанных ниже.
В этой статье я расскажу о самых важных анонсах для специалистов по ИИ и разработчиков. Я сосредоточусь на обновлениях, которые доступны уже сейчас или ожидаются в ближайшее время.
Gemini 3.5 Flash
Gemini 3.5 Flash — главный релиз модели на I/O 2026. Он превосходит Gemini 3.1 Pro на агентных и кодерских бенчмарках, при этом, по заявлению Google, генерирует выходные токены в 4 раза быстрее, чем другие передовые модели. Мы пока не можем этого подтвердить, но это, безусловно, смелое заявление.
Если смотреть на бенчмарки, скачок производительности заметен, особенно в MCP Atlas, CharXiV Reasoning и Finance Agent v2, где Gemini 3.5 Flash лидирует. В целом 3.5 Flash выглядит конкурентоспособным с Claude Opus 4.7 и GPT-5.5.
|
Бенчмарк |
3.5 Flash |
3 Flash |
3.1 Pro |
Claude Sonnet 4.6 |
Opus 4.7 |
GPT-5.5 |
|
Terminal-bench 2.1 |
76.2% |
58.0% |
70.3% |
-- |
66.1% |
78.2% |
|
SWE-Bench Pro |
55.1% |
49.6% |
54.2% |
-- |
64.3% |
58.6% |
|
MCP Atlas |
83.6% |
62.0% |
78.2% |
69.5% |
79.1% |
75.3% |
|
OSWorld |
78.4% |
65.1% |
76.2% |
72.5% |
78.0% |
78.7% |
|
Finance Agent v2 |
57.9% |
42.6% |
43.0% |
51.0% |
51.5% |
51.8% |
|
CharXiv Reasoning |
84.2% |
80.3% |
83.3% |
72.4% |
82.1% |
84.1% |
|
Humanity's Last Exam |
40.2% |
33.7% |
44.4% |
33.2% |
46.9% |
41.4% |
|
ARC-AGI-2 |
72.1% |
33.6% |
77.1% |
58.3% |
75.8% |
84.6% |
Здесь стоит отметить и вопрос стоимости. По утверждению Google, предприятия, обрабатывающие около 1 трлн токенов в день, могут экономить свыше $1 млрд в год, если перенесут 80% нагрузок с других передовых моделей на 3.5 Flash. Это прямое предложение корпоративным клиентам OpenAI и Anthropic. Gemini 3.5 Flash доступен уже сегодня через Gemini API, Google AI Studio и приложение Gemini. Gemini 3.5 Pro уже используется внутри компании и ожидается в следующем месяце.
Подробнее — в нашей статье о Gemini 3.5 Flash, где мы рассматриваем новую модель детальнее.
Gemini Omni
Gemini Omni — новый нативно мультимодальный генеративный медиа-модель Google, способная принимать на вход любые сочетания текста, изображений, аудио и видео и выдавать видео. Первая модель в семействе, Gemini Omni Flash, доступна сегодня в приложении Gemini, Google Flow и YouTube Shorts.
Ключевой архитектурный момент: Omni объединяет ранее раздельный стек (Veo для видео, Imagen для изображений, отдельные аудиосистемы) в одну модель. Это означает более согласованные правки и меньше артефактов пайплайна при работе между модальностями. Числовые бенчмарки для Omni при запуске не опубликованы, поэтому независимая оценка ещё впереди. Доступ к API для разработчиков и корпоративных клиентов появится в ближайшие недели после I/O.
Мы протестировали её и подробно описали в статье о Gemini Omni. Первые результаты генерации видео получились неровными (по крайней мере на фоне высоких стандартов, заданных инструментами вроде Seedance 2.0), но более мощная Gemini Omni Pro должна выйти совсем скоро.
Antigravity 2.0
Antigravity — ориентированная на агентов платформа разработки Google, и релиз 2.0 на I/O — значительное расширение. Ранее позиционируясь как среда для кодинга, теперь это полноценная платформа для разработки, развёртывания и управления когортами автономных ИИ-агентов. Центральный элемент — новое отдельное настольное приложение, которое служит хабом оркестрации агентов и позволяет запускать несколько агентов параллельно на разных задачах одновременно.
В экосистеме теперь четыре отдельных интерфейса для разработчиков:
- Настольное приложение Antigravity 2.0: Оркестрация нескольких агентов параллельно и поддержка запланированных фоновых задач. Интеграция с Google AI Studio, Android и Firebase.
- Antigravity CLI: Терминальный интерфейс для создания и запуска агентов без графического интерфейса. Google просит пользователей Gemini CLI перейти на него.
- Antigravity SDK: Программный доступ к тому же каркасу агентов, который питает продукты Google, с поддержкой пользовательских поведений агентов на вашей собственной инфраструктуре.
- Antigravity в Gemini Enterprise Agent Platform: Подключает Antigravity напрямую к проектам Google Cloud для корпоративных нагрузок.
Есть и несколько очень полезных новинок для базового агента. Самая важная: теперь он может на лету порождать модульные субагенты, каждый из которых работает параллельно с изоляцией рабочих пространств и наследует конфигурации инструментов и разрешения родителя. Длительные операции выполняются асинхронно, поэтому больше не блокируют цикл агента.
По аналогии с Claude Code Hooks, JSON Hooks позволяют прикреплять пользовательские shell-скрипты на ключевых этапах выполнения (до/после вызовов инструментов, вызовов модели или при условиях остановки) для логирования, настройки аргументов или инъекции инструкций. Запланированные задачи позволяют задавать cron-подсказки для периодических запусков агента — например, ежедневные дайджесты PR или почасовые проверки деплоя — с выводом результатов в боковую панель для удобной передачи человеку в цикле.
В части управления Antigravity вводит «проекты» как организационный примитив, который задаёт настройки, ресурсы и разрешения на уровне групп агентов, а не требует максимально широких глобальных прав. Обновлённая боковая панель поддерживает группировку разговоров по проекту, статусу или давности, со встроенной нативной поддержкой Git worktree. Такая проектная компоновка сопоставима с многооконным управлением рабочими пространствами в Cursor и очередью задач в Codex, но с более строгим разграничением разрешений по проектам.

Голосовой ввод через модели Gemini Audio и новые слэш-команды (/goal для автономных запусков, /grill-me для уточнений перед задачей, /schedule для cron-подсказок, /browser для добровольного использования браузера) дополняют UX.
Antigravity 2.0 доступна пользователям начиная с сегодняшнего дня. План Google AI Ultra ($100 в месяц) включает в 5 раз более высокие лимиты использования в Antigravity по сравнению с планом Google AI Pro.
Управляемые агенты в Gemini API
Вместе с Antigravity 2.0 Google объявила об Управляемых агентах в Gemini API — это приносит агентные возможности прямо на уровень API для разработчиков, которые хотят создавать приложения на агентах без самостоятельного управления инфраструктурой оркестрации. Это API-уровневое дополнение к опыту настольного приложения Antigravity.
Практическое следствие для разработчиков: теперь вы можете определять поведение агентов, интеграции инструментов и многошаговые рабочие процессы через Gemini API, а выполнение возьмёт на себя инфраструктура Google. Это может стать действительно переломным моментом для команд, которые строят продакшн-приложения с длительными задачами, не разворачивая и не поддерживая собственный каркас агентов. Доступ предоставляется через Google AI Studio, а корпоративные клиенты могут пользоваться им через Gemini Enterprise Agent Platform.
Честная оговорка: ранние отзывы разработчиков по материалам с I/O отмечают, что документация по сложным агентным потокам и обработке ошибок пока скудна. Также выделяют ограничения по скоростям и квотам как источник трения. Вероятно, со временем эти проблемы станут менее острыми, но о них стоит знать до того, как вы решите строить стек на этой платформе.
Gemini Spark
Gemini Spark (не путать с последней LLM от Meta, Muse Spark) — новый персональный ИИ-агент Google и самый ориентированный на потребителя из всех агентных анонсов. Он работает круглосуточно на выделенных виртуальных машинах в Google Cloud, то есть ему не нужно, чтобы ваш ноутбук был открыт. Spark работает на базе Gemini 3.5 и каркаса Antigravity, что даёт ему возможность обрабатывать долгосрочные задачи в фоне.
Набор функций на старте включает:
- Интеграцию с инструментами Google (Workspace, Gmail, Calendar) на старте, с поддержкой сторонних инструментов через MCP в последующие недели.
- Взаимодействие через приложение Gemini, а скоро — через email и чат.
- Работу прямо в Chrome как агентный слой браузера — этим летом.
- Отображение прогресса задач в реальном времени через Android Halo — новое пространство интерфейса на Android, позже в этом году.
Сравнение с экосистемой агентов OpenAI и возможностями использования инструментов у Anthropic напрашивается. Отличие Spark — круглосуточное непрерывное выполнение на инфраструктуре Google Cloud в сочетании с глубокой интеграцией в собственный пакет продуктивности Google. Если ваша работа уже живёт в Google Workspace, это серьёзное преимущество. Если нет — ценность не столь очевидна.
Главная здесь — конфиденциальность. Агент, который постоянно мониторит вашу почту, календарь и документы, поднимает реальные вопросы о расположении данных и соответствии требованиям в регулируемых отраслях. Например, я задавался вопросом: «Что происходит с памятью агента, когда сотрудник уходит?» Google пока не дала подробных ответов. Spark начинает раскатываться для доверенных тестировщиков на этой неделе, а на следующей — бета для подписчиков Google AI Ultra ($100 в месяц) в США.

Поисковые агенты и режим AI
Режим AI в Поиске был представлен на прошлом I/O. Спустя год он превысил миллиард активных пользователей в месяц. Теперь Google идёт дальше с двумя новыми агентными возможностями.
Первая — это информационные агенты в Поиске: персональные фоновые агенты, которые вы настраиваете для мониторинга тем и выдачи релевантной информации в нужный момент. Они начнут раскатываться этим летом, начиная с подписчиков Google AI Pro и Ultra.
Вторая — генеративный интерфейс в Поиске, на базе Gemini 3.5 Flash и Antigravity. Теперь Поиск будет строить пользовательские макеты, интерактивные визуализации и даже постоянные панели или мини-приложения для сложных, долгосрочных запросов. Генеративные возможности UI появятся этим летом у всех пользователей бесплатно. Функции постоянных панелей и пользовательских приложений сначала будут доступны подписчикам Pro и Ultra в США.
Это реальная проблема для издателей и SEO-специалистов (как уже были вводы AI Overview и режима AI). Когда сгенерированные ИИ ответы полностью закрывают запрос пользователя прямо в Поиске, нет причин переходить на исходный сайт. Мы уже это видели: и AI Overviews, и первоначальный запуск режима AI привели к заметным падениям трафика по отрасли. Google по-прежнему не предложила понятного способа делиться выручкой или гарантировать трафик издателям, чей контент питает эти ответы.
Google Flow
Google Flow, дебютировавший на I/O 2025 как инструмент для создания фильмов с ИИ, сделал серьёзный шаг вперёд благодаря трём ключевым обновлениям:
- Более умный планирующий агент. Обновлённый агент Flow теперь умеет планировать и рассуждать в рамках многошаговых творческих проектов. Вы даёте ему входные данные (скажем, концепцию, референсные изображения, черновой сценарий), а он помогает пройти путь от брейншторма до создания и монтажа — всё в одной среде. Новый агент доступен всем уже сегодня.
- Нативное видео через Gemini Omni. Flow теперь нативно обрабатывает генерацию и редактирование видео через модель Omni. Вы можете на естественном языке описывать изменения клипа из вашей плёнки и итеративно дорабатывать. Улучшена и консистентность персонажей — сохраняются идентичность и голос между сценами. Это особенно полезно при производстве короткометражек или рекламных кампаний с повторяющимися героями.
- Vibe‑кодинг для пользовательских инструментов. Вместо ограничений штатным набором инструментов вы теперь можете создавать свои прямо на платформе. Google показала примеры: проектирование пользовательских видеоэффектов, создание инструментов для рисованной анимации и сборка пайплайнов наложения текста — не покидая Flow.
В совокупности эти обновления делают Flow не просто творческим ассистентом. Он становится платформой для построения творческих рабочих процессов; мобильное приложение уже в бете на Android и скоро появится на iOS.
Расширение SynthID
SynthID, невидимая система водяных знаков ИИ от Google, со времени запуска три года назад отметила более 100 миллиардов изображений и видео и 60 000 лет аудиоактивов. Но самое важное в анонсе на I/O — партнёры: OpenAI, Kakao и Eleven Labs присоединяются к SynthID наряду с Nvidia, которая подключилась в прошлом году.
Значимость — в межотраслевом принятии. Стандарт водяных знаков работает только тогда, когда он настолько распространён, что «без водяного знака» становится полезным сигналом. Google также расширяет проверку Content Credentials (стандарт C2PA) на Поиск и Chrome, которые будут показывать, создан ли контент ИИ или камерой и редактировался ли он генеративными инструментами. Комбинация SynthID и C2PA даёт два независимых слоя установления происхождения — это верный подход, учитывая, как легко по отдельности снять каждый из них.
Отдельно отметим
Несколько других анонсов с I/O заслуживают краткого упоминания:
- Docs Live: Новый голосовой режим для Google Docs, который позволяет «выгрузить» идеи голосом, а Gemini структурирует их в документ. Роллаут для подписчиков этим летом; голосовые функции в то же время придут и в Gmail и Keep.
- Google Pics: Новый инструмент ИИ для создания и редактирования изображений на базе модели Nano Banana, где каждый элемент рассматривается как отдельный объект, а не плоское изображение. Доступен доверенным тестировщикам сейчас, этим летом будет раскатан для подписчиков Google AI Pro и Ultra.
- Android Halo: Новое пространство интерфейса на Android для просмотра живых обновлений и прогресса задач от агентов вроде Gemini Spark. Позже в этом году.
- Daily Brief: Готовый агент в приложении Gemini, который собирает персонализированную утреннюю выжимку из почты, календаря и задач с предложенными следующими шагами. Отдельное ценообразование не объявлено; ожидается как часть опыта в приложении Gemini.
- TPU 8t и 8i: TPU восьмого поколения от Google реализованы в виде двух чипов: 8t оптимизирован для крупномасштабного предобучения (почти втрое больше «сырой» вычислительной мощности по сравнению с прошлым поколением, с масштабированием более чем на 1 млн TPU по всему миру), а 8i — для инференса. Обе линии дают до 2 раз лучшую энергоэффективность, чем предыдущее поколение.
- Gemini for Science: Набор ИИ-инструментов, соединяющий Antigravity с более чем 30 крупными базами данных по наукам о жизни. Science Skills доступен сегодня на GitHub и напрямую в Antigravity.
Итоги
Google I/O 2026 сделала ставку на агентов как на основное направление развития ИИ, а Gemini 3.5 Flash и Antigravity 2.0 стали инфраструктурой для почти всех остальных анонсов. Уже сейчас вы можете использовать Gemini 3.5 Flash (через Gemini API и AI Studio), нового агента Flow, Gemini Omni Flash и настольное приложение Antigravity 2.0. Gemini Spark, поисковые агенты и генеративные функции UI в Поиске будут раскатываться летом, в основном за пейволлом нового тарифа AI Ultra за $100 в месяц (по крайней мере поначалу).
Лично для меня самым интересным стал апгрейд Antigravity, потому что он работает сразу на двух уровнях: как самостоятельное приложение для разработчиков он напрямую конкурирует с Codex и Claude Code; как платформа, его базовые ADK и Managed Agents API бросают вызов каркасам оркестрации вроде LangChain, AutoGen и OpenAI's Agents SDK. Интеграция с Gemini и слой развёртывания в Google Cloud — это отличия (и риск привязки) на обоих фронтах.
Google I/O 2026: часто задаваемые вопросы
Как Gemini 3.5 Flash сравнивается с GPT-5.5 и Claude Opus 4.7?
Gemini 3.5 Flash лидирует на ряде агентных бенчмарков, таких как MCP Atlas (83.6%) и Finance Agent v2 (57.9%), в то время как GPT-5.5 опережает на SWE-Bench Pro и ARC-AGI-2. Claude Opus 4.7 остаётся сильнейшим на Humanity's Last Exam (46.9%). Главный вывод: модель сопоставима с передовыми решениями, при этом работает быстрее и значительно дешевле в масштабе — что отражено и в названии. Более мощный вариант Pro ожидается к скорому релизу.
Чем Google Antigravity отличается от Claude Code или Codex?
Google Antigravity 2.0 — платформа разработки с приоритетом на агентов, которая позволяет оркестрировать несколько ИИ-агентов параллельно через настольное приложение, CLI, SDK и корпоративный API. В отличие от Claude Code (терминально-нативного кодирующего агента) или Codex (системы с очередью задач), Antigravity предлагает более точное разграничение разрешений по проектам, порождение субагентов и прямую интеграцию с Google Cloud и Firebase. Её двойная роль — и инструмента разработчика, и платформенного SDK — делает её ближе к фреймворку оркестрации, чем к самостоятельному помощнику по кодингу.
Стоит ли тариф Google AI Ultra за $100/месяц по сравнению с ChatGPT Pro или Claude Max?
Все три плана стоят $100 в месяц, но ценность зависит от вашей экосистемы. Отличие Google AI Ultra — доступ к Gemini Spark (круглосуточному постоянному агенту), пятикратно повышенные лимиты использования в Antigravity и глубокая интеграция с Google Workspace. Если ваш рабочий процесс уже живёт в Gmail, Docs и Calendar, Ultra имеет естественное преимущество. Если вам в основном нужны помощь в кодинге или гибкость на уровне API, ChatGPT Pro или Claude Max могут подойти лучше.
Что такое Gemini Omni и как она справляется с генерацией видео?
Gemini Omni — нативно мультимодальная модель Google, принимающая любые комбинации текста, изображений, аудио и видео на вход и выдающая видео. Она объединяет ранее отдельные системы (Veo для видео, Imagen для изображений) в одну модель, что должно привести к более согласованным кросс-модальным правкам. Первая версия, Omni Flash, доступна уже сейчас, более мощная Omni Pro ожидается скоро. Независимых бенчмарков пока не публиковали, поэтому качество в реальном мире ещё оценивается.