Google I/O 2026：代理式 Gemini 时代的开端

从 Gemini 3.5 Flash 与 Gemini Omni 到 Antigravity 2.0 和 Gemini Spark，速览 Google 在 2026 年 I/O 上以代理为核心的重磅发布。

更新 2026年5月20日 · 12分钟读

Google I/O 2026 首日几乎所有发布的主线都是同一个词：代理（agents）。不是聊天机器人、也不是助手，而是能够在后台持续运行、执行任务，并贯穿整套 Google 产品栈的持久型代理。CEO Sundar Pichai 明确将其定位为“代理式 Gemini 时代”，随后的发布也与这一定位相呼应。

Google 还通过在 I/O 上推出新的 Google AI Ultra 订阅层级，回应了 Anthropic 的 Claude Max 和 OpenAI 的 ChatGPT Pro，定价同为每月 100 美元，并将部分下文提到的代理功能纳入其访问门槛。

本文将带您梳理对 AI 从业者与开发者最重要的发布，重点关注已可用或即将上线的更新。

Gemini 3.5 Flash

Gemini 3.5 Flash 是 I/O 2026 的重磅模型。它在代理与编程类基准上优于 Gemini 3.1 Pro，同时 Google 声称其输出令牌每秒速度较其他前沿模型快 4 倍。虽然我们暂无法确认，但这无疑是个大胆的说法。

从基准表现看，提升清晰可见，尤其在 MCP Atlas、CharXiV Reasoning 和 Finance Agent v2 上，Gemini 3.5 Flash 均名列前茅。整体而言，3.5 Flash 似乎可与 Claude Opus 4.7 和 GPT-5.5 抗衡。

Benchmark	3.5 Flash	3 Flash	3.1 Pro	Claude Sonnet 4.6	Opus 4.7	GPT-5.5
Terminal-bench 2.1	76.2%	58.0%	70.3%	--	66.1%	78.2%
SWE-Bench Pro	55.1%	49.6%	54.2%	--	64.3%	58.6%
MCP Atlas	83.6%	62.0%	78.2%	69.5%	79.1%	75.3%
OSWorld	78.4%	65.1%	76.2%	72.5%	78.0%	78.7%
Finance Agent v2	57.9%	42.6%	43.0%	51.0%	51.5%	51.8%
CharXiv Reasoning	84.2%	80.3%	83.3%	72.4%	82.1%	84.1%
Humanity's Last Exam	40.2%	33.7%	44.4%	33.2%	46.9%	41.4%
ARC-AGI-2	72.1%	33.6%	77.1%	58.3%	75.8%	84.6%

成本维度同样值得关注。Google 称，若企业每天处理约 1 万亿个令牌，将 80% 的工作负载从其他前沿模型迁移至 3.5 Flash，每年可节省超过 10 亿美元。这是直指 OpenAI 与 Anthropic 企业客户的“投标”。Gemini 3.5 Flash 今日已在 Gemini API、Google AI Studio 与 Gemini 应用中可用。Gemini 3.5 Pro 已在内部使用，预计下月发布。

欲了解更多细节，建议阅读我们的 Gemini 3.5 Flash 文章，其中有更深入的解读。

Gemini Omni

Gemini Omni 是 Google 新的原生多模态生成媒体模型，能接收文本、图像、音频与视频的任意组合输入，并生成视频输出。该系列的首个模型 Gemini Omni Flash 今日已在 Gemini 应用、Google Flow 与 YouTube Shorts 中可用。

架构上的关键在于，Omni 将此前分裂的技术栈（视频用 Veo，图像用 Imagen，音频为独立系统）整合为单一模型。这意味着跨模态编辑更连贯，管线伪影更少。Omni 发布时 Google 并未同时公布数值基准，独立评估尚待进行。面向开发者与企业客户的 API 访问将在 I/O 后数周内开放。

我们已对其进行测试，并在Gemini Omni 文章中做了完整总结。首批视频生成结果好坏参半（至少相较于 Seedance 2.0 等工具树立的高标准），但更强大的 Gemini Omni Pro 预计很快推出。

Antigravity 2.0

Antigravity 是 Google 的“代理优先”开发平台，而 I/O 发布的 2.0 版本是一次重大扩展。它此前更多被定位为编程环境，如今已成为用于开发、部署与管理自主 AI 代理编组的完整平台。核心是全新的独立桌面应用，作为代理编排中枢，允许您并行运行多个代理，同时处理不同任务。

该生态面向开发者现有四类界面：

Antigravity 2.0 桌面应用： 并行编排多个代理并支持计划的后台任务。可与 Google AI Studio、Android 和 Firebase 集成。
Antigravity CLI： 面向终端的界面，无需 GUI 即可创建与运行代理。Google 建议 Gemini CLI 用户迁移至此。
Antigravity SDK： 以编程方式访问与 Google 自有产品同源的代理框架，支持在您自有基础设施上托管自定义代理行为。
Gemini 企业代理平台中的 Antigravity： 将 Antigravity 直接连接至 Google Cloud 项目，用于企业级工作负载。

核心代理也新增了数个非常实用的特性。最大亮点是：它现在可以即时派生模块化子代理，各自并行运行、工作区隔离，并继承父代理的工具配置与权限。长耗时操作将以异步方式执行，不再阻塞代理循环。

类似于 Claude Code Hooks，JSON Hooks 允许用户在执行关键阶段（工具调用前后、模型调用前后或停止条件处）挂载自定义 shell 脚本，用于日志记录、参数定制或注入指令。计划任务支持基于 cron 的提示，定期运行代理（如每日 PR 摘要、每小时部署检查），结果显示在侧边栏，便于无缝移交至人机协同。

在管理侧，Antigravity 引入“项目”作为组织原语，以代理组为作用域管理设置、资源与权限，而非为所有内容申请最宽泛的全局权限。全新侧边栏支持按项目、状态或时间分组会话，并内置原生 Git worktree 支持。这种基于项目的布局可与 Cursor 的多窗口工作区管理与 Codex 的任务队列相类比，但对每个项目的权限限定更为严格。

语音输入（通过 Gemini 音频模型）与全新斜杠命令（/goal 用于自主运行，/grill-me 用于任务前澄清，/schedule 用于 cron 提示，/browser 用于选择性启用浏览器）完善了整体体验。

Antigravity 2.0 从今天起面向用户开放。Google AI Ultra 方案（每月 100 美元）在 Antigravity 中提供比 Google AI Pro 高 5 倍的使用额度。

Gemini API 中的托管代理

与 Antigravity 2.0 同步，Google 在 Gemini API 中推出了托管代理（Managed Agents），将代理能力直接下沉至 API 层，供希望构建代理驱动应用、又不想自建或维护编排基础设施的开发者使用。这是对 Antigravity 桌面体验的 API 级补充。

对开发者而言，实际意义在于：您现在可以通过 Gemini API 定义代理行为、工具集成与多步工作流，由 Google 的基础设施负责执行。对于需要长周期任务执行、又不想自建代理框架的生产团队而言，这可能会带来真正的改变。可通过 Google AI Studio 访问，企业客户可经由 Gemini 企业代理平台接入。

需要坦诚的一点是：I/O 报道中的早期开发者反馈提到，复杂代理流程与错误处理的文档仍显不足。速率限制与配额管理也被指出存在摩擦。这些问题大概率会随时间改善，但在您决定基于该栈建设之前，值得了解。

Gemini Spark

Gemini Spark（不要与 Meta 最新的 LLM Muse Spark 混淆）是 Google 的新个人 AI 代理，也是本次代理相关发布中最面向消费者的一项。它 24/7 运行在 Google Cloud 的专用虚拟机上，这意味着无需打开您的笔记本电脑也能持续工作。Spark 由 Gemini 3.5 与 Antigravity 框架驱动，具备在后台处理长周期任务的能力。

首发功能包括：

与Google 自有工具（Workspace、Gmail、Calendar）集成作为起步，未来数周将通过 MCP 引入第三方工具支持。
通过Gemini 应用进行交互，后续很快将支持邮件与聊天。
作为Chrome中的代理式浏览层直接运行，今夏晚些时候上线。
通过Android Halo（Android 上的新 UI 空间）查看任务实时进度，年内上线。

与 OpenAI 的代理生态与 Anthropic 的工具使用能力相比，Spark 的差异点在于：在 Google Cloud 基础设施上 24/7 持续执行，并与 Google 自家生产力套件深度整合。如果您的工作已深度依赖 Google Workspace，这将是实打实的优势；若非如此，其价值主张就没那么直观。

隐私是一个正当的担忧。一个持续监测您收件箱、日历与文档的代理，确实会引发关于数据属地与合规的疑问，尤其是在受监管行业。比如我就在想，“员工离职后，代理的记忆会如何处理？”Google 目前尚未对此给出详尽解答。

Spark 本周起向受信测试者开放，下周面向美国地区的 Google AI Ultra 订阅用户（每月 100 美元）开启 Beta。我们在Gemini Spark 文章中会有更详细的报道。

搜索代理与 AI 模式

AI 模式（AI Mode）在去年的 I/O 上首次发布。一年过去，其月活跃用户已超过 10 亿。如今，Google 进一步推出两项新的代理能力。

其一是搜索中的信息代理：您可自定义的个性化后台代理，用于持续监控话题并在合适时机推送相关信息。今夏起向 Google AI Pro 与 Ultra 订阅者陆续推出。

其二是由 Gemini 3.5 Flash 与 Antigravity 驱动的搜索中的生成式 UI。面对复杂且长周期的查询，搜索将构建自定义布局、交互式可视化，甚至是持久化仪表板或小型应用。生成式 UI 功能将于今夏免费向所有用户开放；而持久化仪表板与自定义应用功能将率先面向美国地区的 Pro 与 Ultra 订阅者开放。

这对出版商与 SEO 从业者而言是切实的忧虑（此前的 AI Overview 与 AI Mode 已经有所体现）。当 AI 生成的答案能够在搜索页内直接完整解决用户问题，用户就没有理由再点击访问源站点。事实已经发生：AI Overviews 与 AI Mode 的初始上线曾在全行业造成显著流量下滑。Google 迄今尚未提出清晰的分成机制，或对为这些答案提供内容的出版商保证流量。

Google Flow

Google Flow 在 I/O 2025 以 AI 电影制作工具的身份亮相，此次通过三项关键更新显著进化：

更聪明的规划代理。 更新后的 Flow 代理可以规划与推理多步的创意项目。您给出输入（例如概念、参考图片、粗略剧本），它就能帮助您在同一环境中，从早期头脑风暴一路推进到创作与剪辑。新代理今日向所有人开放。
通过 Gemini Omni 的原生视频能力。Flow 现已通过 Omni 模型原生支持视频生成与编辑。您可以用自然语言描述对相册片段的修改，并进行对话式迭代。人物一致性也得到了提升，身份与声音可跨场景保持。这对于制作有反复出场角色的短片或广告尤其有用。
用于自定义工具的 Vibe 编程。 不再局限于 Flow 自带工具，您现在可以直接在平台上构建自有工具。Google 演示了诸如自定义视频特效、手绘动画工具、文本分层工作流等示例，全程无需离开 Flow。

综合来看，这些更新让 Flow 不只是一个创意助手，而是在走向一个搭建创意工作流的平台；其移动应用已在 Android 上开启测试，iOS 版即将推出。

SynthID 扩展

SynthID 是 Google 的隐形 AI 水印系统，自三年前发布以来，已为超过 1000 亿张图像与视频以及相当于 6 万年时长的音频资产添加水印。本次 I/O 中最重要的不是规模，而是合作方：OpenAI、Kakao 与 Eleven Labs 正与去年已加入的 Nvidia 一同采用 SynthID。

跨行业的采用才让这一切变得有意义。水印标准只有在足够广泛时，“未加水印”才是一个有用信号。Google 也将内容凭证（C2PA 标准）的验证扩展至搜索与 Chrome，向用户展示内容是来自 AI 还是相机，以及是否使用了生成式工具进行编辑。SynthID 与 C2PA 的组合为来源认证提供了两层独立保障，这在单一机制容易被剥离的情况下，是更稳妥的路径。

值得一提

I/O 上的其他一些发布也值得速览：

Docs Live： Google Docs 的语音优先功能，允许您口述想法，交由 Gemini 结构化为文档。今夏向订阅者推出，同期语音能力也将登陆 Gmail 与 Keep。
Google Pics： 基于 Nano Banana 模型的全新 AI 图像创作与编辑工具，将每个元素视为独立对象而非平面图。现已向受信测试者开放，今夏晚些时候面向 Google AI Pro 与 Ultra 订阅者推出。
Android Halo： Android 上用于查看代理（如 Gemini Spark）实时更新与任务进度的新 UI 空间。年内上线。
Daily Brief： Gemini 应用内置代理，从收件箱、日历与任务中汇总个性化晨间简报，并给出后续建议。未单独定价，预计作为 Gemini 应用体验的一部分提供。
TPU 8t 与 8i： Google 第八代 TPU 采用双芯片思路，8t 面向大规模预训练（原始算力接近上代的 3 倍，可在全球逾 100 万颗 TPU 上扩展），8i 面向推理。两者的性能/功耗比均较上代最高提升 2 倍。
面向科学的 Gemini： 一组将 Antigravity 连接至 30 多个生命科学主流数据库的 AI 工具。Science Skills 今日已在 GitHub 与 Antigravity 中提供。

结语

Google I/O 2026 押注“代理”作为 AI 的主方向，Gemini 3.5 Flash 与 Antigravity 2.0 则构成几乎所有发布背后的基础设施。您现在即可使用的是 Gemini 3.5 Flash（通过 Gemini API 与 AI Studio）、全新 Flow 代理、Gemini Omni Flash，以及 Antigravity 2.0 桌面应用。Gemini Spark、搜索代理与搜索中的生成式 UI 将在今夏陆续推出，多数最初将纳入每月 100 美元的 AI Ultra 新层级作为访问门槛。

对我而言，Antigravity 的升级最令人关注，因为它同时在两个层面运作：作为独立的开发者应用，它直接对标 Codex 与 Claude Code；作为平台，其底层 ADK 与托管代理 API 则向 LangChain、AutoGen 与 OpenAI 的 Agents SDK 等编排框架发起挑战。Gemini 的一体化集成与 Google Cloud 的部署层，既是差异化优势，也构成两端的潜在锁定风险。