Tracks
在 Google I/O 2026 上,Google 发布了 Gemini Spark——一款个人 AI 代理,即使您合上笔记本或锁定手机,它也会持续在 Google 的云基础设施上运行。它会监控您的 Gmail、管理日历、在 Google 文档中起草文件,并将在不久的将来可代表您完成购买。
这项发布正值 Google 与 OpenAI、Anthropic 和 Microsoft 在代理集成路径上激烈竞争之际。与 Claude Cowork 或 ChatGPT Agent 不同,Google 押注的 Spark 将“持久云端执行”与其自家消费级服务(从 Gmail 到 Google 幻灯片)的深度集成结合在一起。
本文将介绍 Gemini Spark 实际能做什么、Google 自行提示的隐私权衡、它与竞品代理的比较,以及定价 100 美元/月的 AI Ultra(测试版)是否值得。您也可以阅读我们对 Gemini 3.5 Flash(Spark 的底层模型)和更早的 Gemini Personal Intelligence 的报道,以更全面了解 Google 的个性化战略。
Gemini Spark 是什么?
Gemini Spark 是一款基于 Gemini 3.5 Flash 和 Google Antigravity 框架、全天候 24/7 运行的个人 AI 代理。不同于需要您打开和关闭的聊天机器人,Spark 运行在 Google Cloud 的专用虚拟机上,即使您合上笔记本或锁定手机,它也会在后台持续工作。
它通过结构化 API 集成而非屏幕读取连接 Gmail、文档、幻灯片等 Workspace 工具,这比逐像素操控桌面的代理更可预测。

循环任务与触发器
Spark 能处理按计划重复的任务或在满足条件时触发的任务。以下是其瞄准的复杂度示例:
- 让 Spark 从某个 Google 表格中获取您记录的工时,在文档中生成发票,并在每月第一天通过邮件发送给客户
- 让它解析信用卡账单,自动标记隐藏的订阅费用
可教授的技能
您可以用自然语言描述需求,教给 Spark 可复用的行为。例如,如果您经常写外联邮件,可以让 Spark 分析最近 50 封已发送邮件,将您的写作风格提炼为“代笔”技能,并在每次起草时应用。技能会在会话间持久保存,您只需构建一次,后续 Spark 会持续应用。
端到端工作流
Spark 能在多个应用间串联多步操作。比如,作为刚结束规划会议的团队负责人,您可以让 Spark 从 Gmail 的会议聊天中提取行动项,在表格中创建含负责人与截止日期的项目跟踪表,起草团队启动邮件,并在日历中安排后续提醒,这些都可通过单个提示完成。
Google CEO Sundar Pichai 在 I/O 主旨演讲中将其描述为一款“永不停工”的代理,因为“您不必保持笔记本电脑开启才能确保它在运行”。
通过 MCP 的第三方集成
随 Spark 一同推出了新的 MCP 连接,更多合作伙伴正在集成中。首发支持的第三方应用包括:
- Canva
- OpenTable
- Instacart
接下来数周,Spark 将通过这些连接在第三方应用中执行操作,而不仅限于 Google 自家的服务。Google 还在路线图中规划了多项功能:
- 可直接通过短信和电子邮件与 Spark 交互
- 您可自行创建的自定义子代理
- 桌面应用中的本地浏览器控制
macOS 上的 Gemini Spark
今年夏天,Google 将把 Spark 引入面向 macOS 的 Gemini 桌面应用,使其可处理涉及本地文件的任务,并在桌面上自动化工作流。该应用还新增语音功能,能将自由表达的语音转化为精准草稿,并利用屏幕上下文更好地捕捉您的意图。macOS 应用现已提供下载,Spark 和语音功能将于今夏晚些时候陆续推出。
隐私方面需要注意什么
Spark 是一款持续运行的代理,它会连接您的 Gmail、日历、文档以及 OpenTable、Instacart 等第三方服务。为完成任务,它需要与这些服务共享相关信息。如果您让它预订晚餐,它会传递您的姓名与偏好。这不是隐藏成本,而是产品运行的方式。
Google 对此相当透明。Spark 的官方产品页提醒用户“检查回复”,“密切监督,需要时中断”。Google 还表示,Spark“在执行诸如花钱或发送电子邮件等高风险操作前,会先征求您的同意”。权限默认关闭;您选择它可连接的应用,也可随时全部禁用。
更广泛需要记住的一点是:拥有对您收件箱和日历访问权限的 24/7 云代理,其信任模型不同于您打开、提问、然后关闭的聊天机器人。您授予的是持续访问,而非一次性许可。这并不意味着它危险,但确实让初始设置比以往更重要。
明智的方法是从保守的白名单开始。只连接一两项您确实希望 Spark 采取行动的服务,观察其表现,再逐步扩展。没有必要在第一天就授予全部访问权限,而 Google 的界面也便于您进行选择性授权。
Gemini 应用还有哪些变化?
I/O 2026 的更新在 Spark 之外也触及了 Gemini 应用的多个部分。Google 推出了名为 Neural Expressive 的全新界面设计,一款名为 Gemini Omni 的新视频生成模型,以及一个名为 Daily Brief 的主动式晨间摘要。以下分别介绍其功能。
Daily Brief:主动式晨间摘要
Daily Brief 是一个独立代理,夜间运行并在清晨提供个性化总结。它会提取电子邮件和日历事件,结合您的目标进行推理,最终整理成便于速览的简报,并附带推荐后续步骤。
它基于 Google Labs 的 CC 实验构建。您可以通过点赞或点踩反馈来引导其行为。Daily Brief 今日起面向美国地区的 Google AI Plus、Pro 和 Ultra 订阅用户上线。
Neural Expressive:重设计界面
Google 以名为 Neural Expressive 的全新设计语言重塑了整个 Gemini 应用界面,更新了动画、字体排印,并引入可处理更长、不被打断语音的麦克风。更实用的变化是,Gemini 现在会生成混合格式的响应(如时间线、交互式图形、解说视频),而非默认纯文本,从而让答案更易浏览和执行。
Neural Expressive 今日起在网页、Android 和 iOS 全球陆续推出。
Gemini Omni:任意输入的视频生成
Gemini Omni 是一款新模型,可接受文本、图像和视频的任意组合作为输入,并生成视频输出。您可以通过对话式提示实现电影感变焦、替换背景,或创建自定义 AI 虚拟形象。我们在 Gemini Omni 文章中详细介绍了 Omni,包括对其物理模拟与风格迁移能力的上手测试。
Omni 今日起向全球的 Google AI Plus、Pro 和 Ultra 订阅用户推出。
为何重要?
从“回答问题的助手”向“完成任务的代理”的转变,是当前各大 AI 平台的共同方向。OpenAI 的 ChatGPT agent 主要通过浏览器操作。Anthropic 的 Claude Cowork 直接在用户桌面上工作。Microsoft 的 Copilot Cowork 基于 Office 365 数据。Apple 正在为 WWDC 2026 准备改版的 Siri,部分功能将通过与 Google 的多年合作使用 Gemini 模型提供支持。
Spark 与竞品的不同在于,它全天候运行在 Google 的服务器上,并直接接入 Google 自家应用。由于通过正式 API 连接 Gmail、文档和日历,而不是尝试读取屏幕内容,它更可靠,但也更受限。当前,Spark 只能与已连接的服务协作,因此如果您本就主要使用 Google 的工具,它才会最有用。
如果您是数据科学家或机器学习工程师,值得单独关注 Spark 背后的基础设施。Spark 运行在 Google 的 Antigravity 框架上,该框架可并行运行多个子代理,并处理耗时较长的任务。Spark 是其之上的消费级产品,但同样的底层架构也可通过 Gemini API 使用。
如何获取 Gemini Spark?
使用 Spark 需要订阅 Google AI Ultra。Google 在 I/O 公告中重组了订阅层级,目前如下:
- AI Ultra,100 美元/月: 比 Pro 计划高 5 倍的使用上限、20TB 云存储、YouTube Premium、Antigravity 优先访问,以及 Gemini Spark(仅限美国,测试版)
- AI Ultra,200 美元/月: 比 Pro 高 20 倍的使用上限,具备同等 Spark 访问权限,另含 Project Genie 与完整能力套件。本层级从 250 美元/月下调。
- AI Plus 与 Pro: 可用 Daily Brief 和 Gemini Omni,但不含 Spark
Spark 将于本周向受信任测试者推送。面向美国 Google AI Ultra 订阅用户的更广泛测试版计划在下一周推出。当前没有自助加入受信任测试者的方式;您需要等待测试版上线。
获得访问权限后,设置流程如下:
- 打开 Gemini 应用并进入 Spark 设置
- 选择 Spark 可连接的应用(Gmail、文档、幻灯片,以及新的 MCP 合作伙伴,包括 Canva、OpenTable 和 Instacart)
- 设置偏好:何时需先询问再执行,何时可自主执行
- 用自然语言描述任务进行分配;Spark 会在后台处理执行
macOS 桌面应用现已可在 gemini.google/mac 下载。面向桌面应用的 Spark 支持及将自由语音转为精准草稿的新语音功能,预计今夏晚些时候推出。
100 美元/月值得吗?
Google、Anthropic 和 OpenAI 目前均提供 100 美元/月的档位。以下是侧重代理能力的对比:
| Google AI Ultra($100/月) | Claude Max($100/月) | ChatGPT Pro($100/月) | |
|---|---|---|---|
| 始终在线代理 | Gemini Spark(24/7、云端、设备关闭仍运行) | 无持久代理 | 无持久代理 |
| 代理式编程 | Antigravity(优先访问,较 Pro 高 5 倍用量) | Claude Code(基于终端,较 Pro 高 5 倍用量) | Codex(云端沙盒,较 Plus 高 5 倍用量) |
| 桌面代理 | Spark on macOS(2026 年夏季推出) | Claude Cowork(屏幕感知,多步任务) | ChatGPT Agent(基于浏览器的深度研究) |
| 第三方集成 | MCP(首发支持 Canva、OpenTable、Instacart) | MCP + Agent SDK 外部代理额度 | 1000+ 自定义 GPT 和插件 |
| 模型访问 | Gemini 3.5 Flash | Claude Opus 4.7、Sonnet 4.6 | GPT-5.5 Pro、GPT-5.3-Codex |
| 使用上限 | 5 倍 Pro | 5 倍 Pro | 5 倍 Plus |
| 云存储 | 20TB(Google One) | 无 | 无 |
| 其他权益 | 含 YouTube Premium | 无 | 无限制图像生成 |
| 可用性 | Spark:仅限美国(测试版) | 全面可用 | 全面可用 |
Google 的 100 美元档是唯一包含持久云代理的方案,这使其与 Anthropic 和 OpenAI 区分度明显。此外,它还包含一些 Google 特有的权益,如 20TB 存储和捆绑的 YouTube Premium。从纸面上看,这是功能最齐全的方案。但需要注意,Spark 仍是带有实验性免责声明的美国区测试版,而 Claude Max 和 ChatGPT Pro 则已全面可用,其代理工具更为成熟。
如果您已深度使用 Google 生态(Gmail、文档、表格是您的日常工具),100 美元档最具说服力。Spark 为 Workspace 提供的始终在线自动化,是另外两家目前尚未提供的,而且 20TB 存储与 YouTube Premium 也提升了性价比。
如果您是开发者,看重 Antigravity 与更高的 Gemini API 配额,那么价值点在于基础设施访问,而非 Spark 本身。
如果您当下主要想要一款成熟可用的 AI 代理,Claude Max 和 ChatGPT Pro 更稳妥。它们已全面可用、非测试版,代理工具更成熟。Spark 的持久执行确实差异化,但要为仍处于美国区、实验性的功能支付 100 美元/月,并不容易推荐。
总结
Gemini Spark 是 Google 迄今对“AI 助手究竟该做什么”这一问题最直接的回答。其持久云端执行模式在架构上与聊天机器人明显不同,而 Workspace 的深度集成也是竞争对手短期内难以复制的。
围绕 Spark 更大的问题并不特指 Google,而是当我们让任何 AI 代理获得对邮箱、日历、以及最终支付方式的持续访问时,这意味着什么。我们仍处在探索这些工具应默认拥有多大自主权、用户又应如何主动管理的早期阶段。Google 采取“权限默认关闭、由用户白名单授权”的做法是一个合理起点,但关于“始终在线”代理的行业规范,仍在全行业的实时实践中逐步形成。
如果您想在 Gmail、文档和云端硬盘等 Google Workspace 应用中探索 Gemini 的用法,建议学习 Practical AI with Google Gemini and NotebookLM 课程。若想了解代理式 AI 背后的概念,请加入我们的 AI Agent Fundamentals 技能路径。
Gemini Spark 常见问题
Gemini Spark 是否在美国以外地区可用?
暂未开放。Spark 目前仅在美国以测试版形式提供,限 100 美元/月的 Google AI Ultra 订阅用户使用。Google 尚未公布国际可用时间表。若您在美国以外地区,仍可在较低档位计划中使用 Daily Brief 和 Gemini Omni 等其他 I/O 2026 功能。
Gemini Spark 与普通聊天机器人有何不同?
聊天机器人在您打开时响应,在您关闭时停止。Spark 则持续在 Google 的云服务器上运行,即使您的设备关闭也能在后台执行任务。它可以监控收件箱、运行计划工作流,并在无需您在线时跨 Google Workspace 采取操作。
Gemini Spark 会在未经我许可的情况下购买商品吗?
Google 表示,Spark 在执行如花钱等高风险操作前“会先征求您的同意”。权限默认关闭,您可自行控制 Spark 能访问的应用。但鉴于产品仍处测试阶段,建议以保守的权限集开始,并在观察其行为后逐步放开。
Gemini Spark 能与 Google Workspace 之外的应用协同工作吗?
可以,通过 MCP(模型上下文协议)集成。在首发阶段,Spark 支持 Canva、OpenTable 和 Instacart,且会陆续增加更多第三方伙伴。不过,与 ChatGPT 的插件生态或 Claude 的 MCP 集成相比,受支持应用的覆盖面目前仍相对有限。