Tracks
Google I/O 2026で、GoogleはGemini Sparkを発表しました。ノートパソコンを閉じたりスマートフォンをロックした後でも、Googleのクラウド基盤上で動き続ける個人向けAIエージェントです。Gmailの監視、カレンダーの管理、Googleドキュメントでの文書作成に対応し、近い将来は代理での購入処理も行う予定です。
この発表は、OpenAI、Anthropic、Microsoftによるエージェント統合競争が激化する最中に行われました。Sparkの狙いは、Claude CoworkやChatGPT Agentとは異なり、永続的なクラウド実行と、GmailからGoogleスライドまで自社コンシューマーサービスへの深い統合にあります。
本記事では、Gemini Sparkの実際の機能、Google自身が示すプライバシー上のトレードオフ、競合エージェントとの比較、そしてベータ製品に月額$100のAI Ultraの価格が妥当かどうかを解説します。Sparkを支えるモデルであるGemini 3.5 Flashや、Googleのパーソナライゼーション戦略の文脈を補うGemini Personal Intelligenceの関連記事もあわせてご覧ください。
Gemini Sparkとは?
Gemini Sparkは、Gemini 3.5 FlashとGoogleのAntigravityハーネス上で稼働する24時間365日のパーソナルAIエージェントです。開いて閉じるだけのチャットボットと異なり、SparkはGoogle Cloud上の専用仮想マシンで動作し、ノートパソコンを閉じたりスマートフォンをロックした後もバックグラウンドで作業を続けます。
Gmail、ドキュメント、スライドなどのWorkspaceツールには、画面読み取りではなく構造化されたAPI連携で接続します。これにより、デスクトップをピクセル単位で操作するエージェントよりも予測可能に動作します。

定期タスクとトリガー
Sparkは、スケジュールに沿って繰り返すタスクや条件を満たしたときに発火するタスクを処理できます。想定している複雑さの例をいくつか挙げます。
- Googleスプレッドシートから記録済みの作業時間を取得し、ドキュメントで請求書を作成し、毎月1日にクライアントへメール送信するようSparkに指示する
- クレジットカード明細を解析して、見落としがちなサブスクリプション料金を自動でフラグ付けする
教えられるスキル
自然言語で要望を説明すれば、Sparkに再利用可能な振る舞いを教えられます。たとえばアウトリーチメールを頻繁に書く場合、直近50件の送信メッセージを分析させて文体を「ゴーストライター」スキルとして抽出し、以後の下書き依頼時に適用させることができます。スキルはセッションをまたいで保持されるため、一度作れば今後も継続的に使われます。
エンドツーエンドのワークフロー
Sparkはアプリをまたいで複数のステップを連鎖できます。たとえばチームリードが計画会議を終えた後、SparkにGmailのミーティングチャットからアクションアイテムを抽出させ、担当者と期限つきのプロジェクトトラッカーをスプレッドシートに作成し、チーム向けのキックオフメールを下書きし、カレンダーにフォローアップのリマインダーを設定する、といったことを1つのプロンプトで依頼できます。
GoogleのCEOであるSundar PichaiはI/O基調講演で、「実行中であることを確認するためにノートパソコンを開いたままにしておく必要がない」ため、決して働くのをやめないエージェントだと説明しました。
MCPによるサードパーティ連携
新たなMCP接続がSparkと同時に公開され、現在も多くのパートナーが統合を進めています。ローンチ時点で対応するサードパーティアプリは以下のとおりです。
- Canva
- OpenTable
- Instacart
今後数週間で、Sparkはこれらの接続を使い、Googleのサービスだけでなくサードパーティアプリ内でもアクションを実行できるようになります。さらに、Googleは次の機能もロードマップに載せています。
- Sparkへ直接テキストやメールを送れる機能
- ユーザー自身が作成できるカスタムサブエージェント
- デスクトップアプリからのローカルブラウザ制御
macOS版のGemini Spark
Googleは今夏、macOS向けのGeminiデスクトップアプリにSparkを導入し、ローカルファイルを伴うタスクの支援やデスクトップ全体のワークフロー自動化を可能にします。このアプリには、フリースタイルの音声を画面コンテキストを踏まえて的確な下書きへと変換する新しい音声機能も追加されます。macOSアプリは本日ダウンロード可能で、Sparkと音声機能は今夏後半に順次展開されます。
プライバシーに関して留意すべき点
SparkはGmail、カレンダー、ドキュメント、OpenTableやInstacartなどのサードパーティサービスに接続する常時稼働のエージェントです。機能を果たすには、これらのサービスと必要な情報を共有する必要があります。夕食の予約を依頼すれば、氏名や好みを渡すことになります。これは隠れたコストではなく、製品の仕組みそのものです。
この点についてGoogleは比較的透明です。公式のSpark製品ページでは、ユーザーに「回答を確認する」「必要に応じて注意深く監督し、介入する」よう促しています。また、GoogleはSparkが「お金を使う、メールを送るといった重要な操作の前には、まずユーザーに確認するよう設計されている」と述べています。権限はデフォルトでオフで、接続するアプリはユーザーが選び、機能を完全に無効化することも可能です。
より広い観点では、受信トレイやカレンダーへ常時アクセスできるクラウドエージェントは、開いて質問して閉じるだけのチャットボットとはまったく異なる信頼モデルです。都度の許可ではなく、継続的なアクセスを与えることになります。危険だという意味ではありませんが、初期設定の選択がいつも以上に重要になるということです。
妥当なアプローチは、控えめなホワイトリストから始めることです。実際にSparkに行動させたい1〜2のサービスだけを接続し、挙動を確認しながら徐々に拡大してください。初日からすべてにアクセスを与える理由はなく、Googleのインターフェース自体も選択的に設定しやすくなっています。
Geminiアプリで他に変わった点は?
I/O 2026のアップデートは、Spark以外にもGeminiアプリの複数の領域に及びます。GoogleはNeural Expressiveと呼ばれる新しいデザインのインターフェース、Gemini Omniという新しい動画生成モデル、そして朝の情報を先回りしてまとめるDaily Briefも提供開始しました。各機能の実像は次のとおりです。
Daily Brief:先回りの朝サマリー
Daily Briefは夜間に稼働し、パーソナライズされた朝の要約を届ける別のエージェントです。メールやカレンダー予定を収集し、目標に照らして整理・判断したうえで、次のアクション案付きの流し読みしやすいブリーフィングにまとめます。
これはGoogle LabsのCC実験を基盤としており、時間をかけて評価(賛成/反対)で方向付けできます。Daily Briefは米国のGoogle AI Plus、Pro、Ultraの各プランで本日から順次展開されます。
Neural Expressive:刷新されたインターフェース
GoogleはNeural Expressiveという新しいデザイン言語の下、Geminiアプリ全体のインターフェースを刷新しました。アニメーションやタイポグラフィが更新され、長く途切れない音声入力に対応するマイクも備えています。実務的な変化としては、Geminiが既定のプレーンテキストではなく、タイムライン、インタラクティブなグラフィック、ナレーション付き動画などの混在フォーマットで回答を生成するようになり、内容をスキャンして行動に移しやすくなりました。
Neural Expressiveは、Web、Android、iOSで本日より世界的に展開されます。
Gemini Omni:あらゆる入力から動画生成
Gemini Omniは、テキスト、画像、動画の任意の組み合わせを入力として受け取り、動画を出力する新モデルです。シネマティックなズーム、背景の差し替え、会話型プロンプトによるカスタムAIアバターの作成などが可能です。物理シミュレーションやスタイル転写の実力検証を含む詳細は、Gemini Omniの記事で扱っています。
Omniは本日より、世界中のGoogle AI Plus、Pro、Ultra加入者に順次展開されます。
なぜ重要か?
「質問に答えるアシスタント」から「タスクを完了させるエージェント」への転換は、現時点で主要なAIプラットフォームが一斉に向かっている方向です。OpenAIのChatGPT agentは主にブラウザ経由で動作し、AnthropicのClaude Coworkはユーザーのデスクトップ上で直接動きます。MicrosoftのCopilot CoworkはOffice 365のデータに基づき、AppleはWWDC 2026に向けて、GoogleのGeminiモデルを部分的に活用する複数年契約のもとで刷新版Siriを準備中です。
Sparkが競合と異なるのは、Googleのサーバー上で常時稼働し、Googleのアプリに直接接続する点です。画面の内容を読み取ろうとするのではなく、正規のAPIを通じてGmail、ドキュメント、カレンダーに接続するため、より信頼性は高くなりますが、その分制約もあります。現状、Sparkが連携できるのは接続を設定したサービスに限られるため、日頃からGoogleのツールを主に使っている場合に最も有用です。
データサイエンティストやMLエンジニアであれば、Sparkの背後にある基盤にも注目する価値があります。SparkはGoogleのAntigravityハーネス上で動作し、複数のサブエージェントを並列に走らせ、長時間かかるタスクを処理できます。Sparkはその上に構築されたコンシューマー製品ですが、同じ基盤アーキテクチャはGemini API経由でも利用可能です。
Gemini Sparkへのアクセス方法
Sparkの利用にはGoogle AI Ultraのサブスクリプションが必要です。I/Oの発表に合わせてプラン体系が再編されたため、現状は以下のとおりです。
- $100/月のAI Ultra:Proプランの5倍の使用上限、20TBのクラウドストレージ、YouTube Premium、Antigravityへの優先アクセス、Gemini Spark(米国限定、ベータ)
- $200/月のAI Ultra:Proの20倍の使用上限、Sparkへの同等のアクセスに加え、Project Genieとフル機能群。価格は$250/月から引き下げ。
- AI PlusおよびPro:Daily BriefとGemini Omniは利用可能、Sparkは対象外
Sparkは今週、信頼できるテスター向けに展開開始されます。米国内のGoogle AI Ultra加入者向けの広範なベータは翌週を予定。信頼できるテスター枠に自己申請で参加する方法はなく、ベータ展開を待つ必要があります。
アクセス権が付与されたら、セットアップは次のとおりです。
- Geminiアプリを開き、Sparkの設定に移動する
- Sparkが接続できるアプリを選ぶ(Gmail、ドキュメント、スライド、Canva、OpenTable、Instacartなど新たなMCPパートナー)
- 事前確認が必要な場面と自律的に進めてよい場面の希望を設定する
- 自然言語でタスクを指示する。Sparkはバックグラウンドで実行を担当
macOSデスクトップアプリは本日gemini.google/macでダウンロード可能です。自由な話し言葉を的確な下書きに変換する新しい音声機能とともに、デスクトップアプリでのSpark対応は今夏後半に予定されています。
$100/月の価値はあるか?
Google、Anthropic、OpenAIはいずれも$100/月のティアを提供しています。エージェント機能に焦点を当てて比較します。
| Google AI Ultra ($100/mo) | Claude Max ($100/mo) | ChatGPT Pro ($100/mo) | |
|---|---|---|---|
| 常時稼働エージェント | Gemini Spark(24/7、クラウド型、デバイスOFFでも稼働) | 永続エージェントなし | 永続エージェントなし |
| エージェント型コーディング | Antigravity(優先アクセス、Pro比5倍の使用量) | Claude Code(ターミナル型、Pro比5倍の使用量) | Codex(クラウドサンドボックス、Plus比5倍の使用量) |
| デスクトップエージェント | macOS版Spark(2026年夏予定) | Claude Cowork(画面認識、マルチステップ) | ChatGPT Agent(ブラウザ型のディープリサーチ) |
| サードパーティ連携 | MCP(ローンチ時はCanva、OpenTable、Instacart) | MCP + 外部エージェント向けAgent SDKクレジット | 1,000+のカスタムGPTとプラグイン |
| モデルアクセス | Gemini 3.5 Flash | Claude Opus 4.7、Sonnet 4.6 | GPT-5.5 Pro、GPT-5.3-Codex |
| 使用上限 | Proの5倍 | Proの5倍 | Plusの5倍 |
| クラウドストレージ | 20TB(Google One) | なし | なし |
| 特典 | YouTube Premium込み | なし | 画像生成無制限 |
| 提供状況 | Spark:米国限定(ベータ) | 一般提供 | 一般提供 |
Googleの$100ティアは、永続的なクラウドエージェントを備える唯一のプランで、AnthropicやOpenAIとの差別化要因になっています。さらに、20TBのストレージやYouTube PremiumといったGoogle特有の特典も含まれます。紙の上では最も機能が豊富です。ただし、Sparkは米国限定のベータで注意書きもある一方、Claude MaxとChatGPT Proは一般提供で成熟したエージェント機能を備えています。
すでにGoogleのエコシステムに深く依存している場合(Gmail、ドキュメント、スプレッドシートが日常ツール)、$100ティアは有力な選択肢です。Workspace向けの常時オン自動化は、他の2つがまだ提供していない強みで、20TBのストレージとYouTube Premiumも魅力です。
開発者の方でAntigravityやより高いGemini API上限に関心があるなら、価値はSparkそのものではなく、基盤へのアクセスにあります。
今すぐ有能なAIエージェントを使いたいだけなら、Claude MaxやChatGPT Proが無難です。いずれもベータではなく一般提供で、エージェント機能も成熟しています。Sparkの永続実行は確かな差別化要因ですが、米国内限定かつ実験段階の機能に$100/月を払う判断は難しいでしょう。
まとめ
Gemini Sparkは、AIアシスタントが実際に何をすべきかという問いに対する、Googleからのこれまでで最も直接的な回答です。永続的なクラウド実行というモデルはチャットボットと本質的に異なるアーキテクチャであり、Workspaceへの深い統合は競合が短期間で再現しにくい強みです。
より大きな論点は、Googleに限らず、いかなるAIエージェントに対しても受信トレイやカレンダー、将来的には決済手段への常時アクセスを与えることの意味です。これらのツールが既定でどれだけの自律性を持つべきか、ユーザーがどの程度積極的に管理すべきかは、まだ模索段階にあります。権限をデフォルトでオフにし、ホワイトリスト方式でサービスを許可するというGoogleの方針は妥当な出発点ですが、常時稼働エージェントの常識は業界全体で今まさに形作られている最中です。
Gmail、ドキュメント、ドライブなどGoogleのWorkspaceアプリでGeminiをどう活用できるか確かめたい方は、Practical AI with Google Gemini and NotebookLMコースをおすすめします。エージェント型AIの概念を学ぶには、AI Agent Fundamentalsスキルトラックにご登録ください。
Gemini SparkのFAQ
Gemini Sparkは米国外でも使えますか?
まだ利用できません。Sparkは現在、米国内限定のベータで、$100/月のGoogle AI Ultra加入者に限られます。国際展開の時期は発表されていません。米国外でも、下位プランでDaily BriefやGemini OmniといったI/O 2026の他機能は利用できます。
Gemini Sparkは通常のチャットボットとどう違いますか?
チャットボットは開いている間に応答し、閉じると止まります。SparkはGoogleのクラウドサーバー上で継続的に稼働し、デバイスがオフでもバックグラウンドでタスクを実行します。受信トレイの監視、スケジュールされたワークフローの実行、Google Workspace全体でのアクションを、ユーザーが能動的に操作していない間も行えます。
Gemini Sparkは許可なしに購入できますか?
Googleによると、Sparkはお金を使うなどの重要な操作の前に「まずユーザーに確認するよう設計」されています。権限はデフォルトでオフで、Sparkがアクセスできるアプリはユーザーが管理します。とはいえ、製品はまだベータ段階のため、まずは控えめな権限設定から始め、挙動を見ながら拡大するのが賢明です。
Gemini SparkはGoogle Workspace以外のアプリでも動作しますか?
はい、MCP(Model Context Protocol)連携を通じて可能です。ローンチ時点ではCanva、OpenTable、Instacartに対応しており、今後さらにパートナーが追加されます。ただし、対応アプリの範囲は、ChatGPTのプラグインエコシステムやClaudeのMCP連携に比べると、まだ限られています。