跳至内容

Google I/O 2026:代理式 Gemini 时代的开端

从 Gemini 3.5 Flash 与 Gemini Omni 到 Antigravity 2.0 和 Gemini Spark,速览 Google 在 2026 年 I/O 上以代理为核心的重磅发布。
更新 2026年5月20日  · 12分钟

Google I/O 2026 首日几乎所有发布的主线都是同一个词:代理(agents)。不是聊天机器人、也不是助手,而是能够在后台持续运行、执行任务,并贯穿整套 Google 产品栈的持久型代理。CEO Sundar Pichai 明确将其定位为“代理式 Gemini 时代”,随后的发布也与这一定位相呼应。

Google 还通过在 I/O 上推出新的 Google AI Ultra 订阅层级,回应了 Anthropic 的 Claude Max 和 OpenAI 的 ChatGPT Pro,定价同为每月 100 美元,并将部分下文提到的代理功能纳入其访问门槛。

本文将带您梳理对 AI 从业者与开发者最重要的发布,重点关注已可用或即将上线的更新。

Gemini 3.5 Flash

Gemini 3.5 Flash 是 I/O 2026 的重磅模型。它在代理与编程类基准上优于 Gemini 3.1 Pro,同时 Google 声称其输出令牌每秒速度较其他前沿模型快 4 倍。虽然我们暂无法确认,但这无疑是个大胆的说法。

从基准表现看,提升清晰可见,尤其在 MCP Atlas、CharXiV Reasoning 和 Finance Agent v2 上,Gemini 3.5 Flash 均名列前茅。整体而言,3.5 Flash 似乎可与 Claude Opus 4.7GPT-5.5 抗衡。

Benchmark

3.5 Flash

3 Flash

3.1 Pro

Claude Sonnet 4.6

Opus 4.7

GPT-5.5

Terminal-bench 2.1

76.2%

58.0%

70.3%

--

66.1%

78.2%

SWE-Bench Pro

55.1%

49.6%

54.2%

--

64.3%

58.6%

MCP Atlas

83.6%

62.0%

78.2%

69.5%

79.1%

75.3%

OSWorld

78.4%

65.1%

76.2%

72.5%

78.0%

78.7%

Finance Agent v2

57.9%

42.6%

43.0%

51.0%

51.5%

51.8%

CharXiv Reasoning

84.2%

80.3%

83.3%

72.4%

82.1%

84.1%

Humanity's Last Exam

40.2%

33.7%

44.4%

33.2%

46.9%

41.4%

ARC-AGI-2

72.1%

33.6%

77.1%

58.3%

75.8%

84.6%

成本维度同样值得关注。Google 称,若企业每天处理约 1 万亿个令牌,将 80% 的工作负载从其他前沿模型迁移至 3.5 Flash,每年可节省超过 10 亿美元。这是直指 OpenAI 与 Anthropic 企业客户的“投标”。Gemini 3.5 Flash 今日已在 Gemini API、Google AI Studio 与 Gemini 应用中可用。Gemini 3.5 Pro 已在内部使用,预计下月发布。

欲了解更多细节,建议阅读我们的 Gemini 3.5 Flash 文章,其中有更深入的解读。

Gemini Omni

Gemini Omni 是 Google 新的原生多模态生成媒体模型,能接收文本、图像、音频与视频的任意组合输入,并生成视频输出。该系列的首个模型 Gemini Omni Flash 今日已在 Gemini 应用、Google Flow 与 YouTube Shorts 中可用。

架构上的关键在于,Omni 将此前分裂的技术栈(视频用 Veo,图像用 Imagen,音频为独立系统)整合为单一模型。这意味着跨模态编辑更连贯,管线伪影更少。Omni 发布时 Google 并未同时公布数值基准,独立评估尚待进行。面向开发者与企业客户的 API 访问将在 I/O 后数周内开放。

我们已对其进行测试,并在Gemini Omni 文章中做了完整总结。首批视频生成结果好坏参半(至少相较于 Seedance 2.0 等工具树立的高标准),但更强大的 Gemini Omni Pro 预计很快推出。

Antigravity 2.0

Antigravity 是 Google 的“代理优先”开发平台,而 I/O 发布的 2.0 版本是一次重大扩展。它此前更多被定位为编程环境,如今已成为用于开发、部署与管理自主 AI 代理编组的完整平台。核心是全新的独立桌面应用,作为代理编排中枢,允许您并行运行多个代理,同时处理不同任务。

该生态面向开发者现有四类界面:

  • Antigravity 2.0 桌面应用: 并行编排多个代理并支持计划的后台任务。可与 Google AI Studio、Android 和 Firebase 集成。
  • Antigravity CLI: 面向终端的界面,无需 GUI 即可创建与运行代理。Google 建议 Gemini CLI 用户迁移至此。
  • Antigravity SDK: 以编程方式访问与 Google 自有产品同源的代理框架,支持在您自有基础设施上托管自定义代理行为。
  • Gemini 企业代理平台中的 Antigravity: 将 Antigravity 直接连接至 Google Cloud 项目,用于企业级工作负载。

核心代理也新增了数个非常实用的特性。最大亮点是:它现在可以即时派生模块化子代理,各自并行运行、工作区隔离,并继承父代理的工具配置与权限。长耗时操作将以异步方式执行,不再阻塞代理循环。

类似于 Claude Code HooksJSON Hooks 允许用户在执行关键阶段(工具调用前后、模型调用前后或停止条件处)挂载自定义 shell 脚本,用于日志记录、参数定制或注入指令。计划任务支持基于 cron 的提示,定期运行代理(如每日 PR 摘要、每小时部署检查),结果显示在侧边栏,便于无缝移交至人机协同。

在管理侧,Antigravity 引入“项目”作为组织原语,以代理组为作用域管理设置、资源与权限,而非为所有内容申请最宽泛的全局权限。全新侧边栏支持按项目、状态或时间分组会话,并内置原生 Git worktree 支持。这种基于项目的布局可与 Cursor 的多窗口工作区管理与 Codex 的任务队列相类比,但对每个项目的权限限定更为严格。

在开始新对话时,可以轻松创建原生 Git worktree。

语音输入(通过 Gemini 音频模型)与全新斜杠命令/goal 用于自主运行,/grill-me 用于任务前澄清,/schedule 用于 cron 提示,/browser 用于选择性启用浏览器)完善了整体体验。

Antigravity 2.0 从今天起面向用户开放。Google AI Ultra 方案(每月 100 美元)在 Antigravity 中提供比 Google AI Pro 高 5 倍的使用额度。

Gemini API 中的托管代理

与 Antigravity 2.0 同步,Google 在 Gemini API 中推出了托管代理(Managed Agents),将代理能力直接下沉至 API 层,供希望构建代理驱动应用、又不想自建或维护编排基础设施的开发者使用。这是对 Antigravity 桌面体验的 API 级补充。

对开发者而言,实际意义在于:您现在可以通过 Gemini API 定义代理行为、工具集成与多步工作流,由 Google 的基础设施负责执行。对于需要长周期任务执行、又不想自建代理框架的生产团队而言,这可能会带来真正的改变。可通过 Google AI Studio 访问,企业客户可经由 Gemini 企业代理平台接入。

需要坦诚的一点是:I/O 报道中的早期开发者反馈提到,复杂代理流程与错误处理的文档仍显不足。速率限制与配额管理也被指出存在摩擦。这些问题大概率会随时间改善,但在您决定基于该栈建设之前,值得了解。

Gemini Spark

Gemini Spark(不要与 Meta 最新的 LLM Muse Spark 混淆)是 Google 的新个人 AI 代理,也是本次代理相关发布中最面向消费者的一项。它 24/7 运行在 Google Cloud 的专用虚拟机上,这意味着无需打开您的笔记本电脑也能持续工作。Spark 由 Gemini 3.5 与 Antigravity 框架驱动,具备在后台处理长周期任务的能力。

首发功能包括:

  • Google 自有工具(Workspace、Gmail、Calendar)集成作为起步,未来数周将通过 MCP 引入第三方工具支持。
  • 通过Gemini 应用进行交互,后续很快将支持邮件与聊天。
  • 作为Chrome中的代理式浏览层直接运行,今夏晚些时候上线。
  • 通过Android Halo(Android 上的新 UI 空间)查看任务实时进度,年内上线。

与 OpenAI 的代理生态与 Anthropic 的工具使用能力相比,Spark 的差异点在于:在 Google Cloud 基础设施上 24/7 持续执行,并与 Google 自家生产力套件深度整合。如果您的工作已深度依赖 Google Workspace,这将是实打实的优势;若非如此,其价值主张就没那么直观。

隐私是一个正当的担忧。一个持续监测您收件箱、日历与文档的代理,确实会引发关于数据属地与合规的疑问,尤其是在受监管行业。比如我就在想,“员工离职后,代理的记忆会如何处理?”Google 目前尚未对此给出详尽解答。

Spark 本周起向受信测试者开放,下周面向美国地区的 Google AI Ultra 订阅用户(每月 100 美元)开启 Beta。我们在Gemini Spark 文章中会有更详细的报道。

托管代理 vs Gemini Spark

搜索代理与 AI 模式

AI 模式(AI Mode)在去年的 I/O 上首次发布。一年过去,其月活跃用户已超过 10 亿。如今,Google 进一步推出两项新的代理能力。

其一是搜索中的信息代理:您可自定义的个性化后台代理,用于持续监控话题并在合适时机推送相关信息。今夏起向 Google AI Pro 与 Ultra 订阅者陆续推出。

其二是由 Gemini 3.5 Flash 与 Antigravity 驱动的搜索中的生成式 UI。面对复杂且长周期的查询,搜索将构建自定义布局、交互式可视化,甚至是持久化仪表板或小型应用。生成式 UI 功能将于今夏免费向所有用户开放;而持久化仪表板与自定义应用功能将率先面向美国地区的 Pro 与 Ultra 订阅者开放。

这对出版商与 SEO 从业者而言是切实的忧虑(此前的 AI Overview 与 AI Mode 已经有所体现)。当 AI 生成的答案能够在搜索页内直接完整解决用户问题,用户就没有理由再点击访问源站点。事实已经发生:AI Overviews 与 AI Mode 的初始上线曾在全行业造成显著流量下滑。Google 迄今尚未提出清晰的分成机制,或对为这些答案提供内容的出版商保证流量。

Google Flow

Google Flow 在 I/O 2025 以 AI 电影制作工具的身份亮相,此次通过三项关键更新显著进化:

  • 更聪明的规划代理。 更新后的 Flow 代理可以规划与推理多步的创意项目。您给出输入(例如概念、参考图片、粗略剧本),它就能帮助您在同一环境中,从早期头脑风暴一路推进到创作与剪辑。新代理今日向所有人开放。
  • 通过 Gemini Omni 的原生视频能力。Flow 现已通过 Omni 模型原生支持视频生成与编辑。您可以用自然语言描述对相册片段的修改,并进行对话式迭代。人物一致性也得到了提升,身份与声音可跨场景保持。这对于制作有反复出场角色的短片或广告尤其有用。
  • 用于自定义工具的 Vibe 编程。 不再局限于 Flow 自带工具,您现在可以直接在平台上构建自有工具。Google 演示了诸如自定义视频特效、手绘动画工具、文本分层工作流等示例,全程无需离开 Flow。

综合来看,这些更新让 Flow 不只是一个创意助手,而是在走向一个搭建创意工作流的平台;其移动应用已在 Android 上开启测试,iOS 版即将推出。

SynthID 扩展

SynthID 是 Google 的隐形 AI 水印系统,自三年前发布以来,已为超过 1000 亿张图像与视频以及相当于 6 万年时长的音频资产添加水印。本次 I/O 中最重要的不是规模,而是合作方:OpenAI、Kakao 与 Eleven Labs 正与去年已加入的 Nvidia 一同采用 SynthID。

跨行业的采用才让这一切变得有意义。水印标准只有在足够广泛时,“未加水印”才是一个有用信号。Google 也将内容凭证(C2PA 标准)的验证扩展至搜索与 Chrome,向用户展示内容是来自 AI 还是相机,以及是否使用了生成式工具进行编辑。SynthID 与 C2PA 的组合为来源认证提供了两层独立保障,这在单一机制容易被剥离的情况下,是更稳妥的路径。

值得一提

I/O 上的其他一些发布也值得速览:

  • Docs Live: Google Docs 的语音优先功能,允许您口述想法,交由 Gemini 结构化为文档。今夏向订阅者推出,同期语音能力也将登陆 Gmail 与 Keep。
  • Google Pics: 基于 Nano Banana 模型的全新 AI 图像创作与编辑工具,将每个元素视为独立对象而非平面图。现已向受信测试者开放,今夏晚些时候面向 Google AI Pro 与 Ultra 订阅者推出。
  • Android Halo: Android 上用于查看代理(如 Gemini Spark)实时更新与任务进度的新 UI 空间。年内上线。
  • Daily Brief: Gemini 应用内置代理,从收件箱、日历与任务中汇总个性化晨间简报,并给出后续建议。未单独定价,预计作为 Gemini 应用体验的一部分提供。
  • TPU 8t 与 8i: Google 第八代 TPU 采用双芯片思路,8t 面向大规模预训练(原始算力接近上代的 3 倍,可在全球逾 100 万颗 TPU 上扩展),8i 面向推理。两者的性能/功耗比均较上代最高提升 2 倍。
  • 面向科学的 Gemini: 一组将 Antigravity 连接至 30 多个生命科学主流数据库的 AI 工具。Science Skills 今日已在 GitHub 与 Antigravity 中提供。

结语

Google I/O 2026 押注“代理”作为 AI 的主方向,Gemini 3.5 Flash 与 Antigravity 2.0 则构成几乎所有发布背后的基础设施。您现在即可使用的是 Gemini 3.5 Flash(通过 Gemini API 与 AI Studio)、全新 Flow 代理、Gemini Omni Flash,以及 Antigravity 2.0 桌面应用。Gemini Spark、搜索代理与搜索中的生成式 UI 将在今夏陆续推出,多数最初将纳入每月 100 美元的 AI Ultra 新层级作为访问门槛。

对我而言,Antigravity 的升级最令人关注,因为它同时在两个层面运作:作为独立的开发者应用,它直接对标 Codex 与 Claude Code;作为平台,其底层 ADK 与托管代理 API 则向 LangChain、AutoGen 与 OpenAI 的 Agents SDK 等编排框架发起挑战。Gemini 的一体化集成与 Google Cloud 的部署层,既是差异化优势,也构成两端的潜在锁定风险。

Google I/O 2026 常见问答

Gemini 3.5 Flash 与 GPT-5.5 和 Claude Opus 4.7 相比如何?

Gemini 3.5 Flash 在多项代理基准上领先,如 MCP Atlas(83.6%)与 Finance Agent v2(57.9%);而 GPT-5.5 在 SWE-Bench Pro 与 ARC-AGI-2 上略胜一筹。Claude Opus 4.7 则在 Humanity's Last Exam(46.9%)上表现最强。总体结论是:它在保持与前沿模型竞争力的同时,速度更快、规模化成本明显更低,其命名也暗示了这一点。更强的 Pro 变体预计很快发布。

Google Antigravity 与 Claude Code 或 Codex 有何不同?

Google Antigravity 2.0 是一个“代理优先”的开发平台,可通过桌面应用、CLI、SDK 与企业 API 并行编排多个 AI 代理。不同于以终端为主的编程代理 Claude Code,或基于任务队列的 Codex,Antigravity 提供更严格的按项目权限范围、子代理派生,以及与 Google Cloud 与 Firebase 的直接集成。它既是开发者工具,又是平台级 SDK,更接近编排框架,而非单一的编程助手。

与 ChatGPT Pro 或 Claude Max 相比,每月 100 美元的 Google AI Ultra 值得吗?

三种方案均为每月 100 美元,但价值取决于您的生态偏好。Google AI Ultra 的差异点在于可访问 Gemini Spark(24/7 持续运行的代理)、在 Antigravity 中 5 倍的使用额度,以及与 Google Workspace 的深度整合。若您的工作流程主要在 Gmail、Docs 与 Calendar 中开展,Ultra 具有天然优势;若您更看重编程辅助或 API 层的灵活性,ChatGPT Pro 或 Claude Max 可能更适合。

什么是 Gemini Omni?它如何实现视频生成?

Gemini Omni 是 Google 的原生多模态模型,可接收文本、图像、音频与视频的任意组合输入,并输出视频。它将此前分离的系统(视频的 Veo、图像的 Imagen)整合为单一模型,从而带来更连贯的跨模态编辑。首个版本 Omni Flash 已上线,更强的 Omni Pro 预计很快推出。独立基准尚未发布,真实世界的质量仍在评估中。

主题

了解 Google 的 AI 生态

Tracks

Google Workspace 与 Gemini

4小时
你将了解 Gemini 的主要功能,以及如何利用它们提升 Google Workspace 中的生产力和效率。
查看详情Right Arrow
开始课程
查看更多Right Arrow