Google I/O 2026：エージェント型 Gemini 時代の幕開け

Gemini 3.5 Flash と Gemini Omni から Antigravity 2.0、Gemini Spark まで――Google のエージェント重視の I/O 2026 基調講演で重要なポイントをまとめました。

更新 2026年5月20日 · 12 分読む

Google I/O 2026 の初日に発表されたほぼすべてのトピックを貫いていたキーワードは「エージェント」でした。チャットボットでもアシスタントでもなく、バックグラウンドで動作し、Google のプロダクトスタック全体に統合された、永続的にタスクを実行するエージェントです。CEO の Sundar Pichai はこれを明確に「エージェント型 Gemini の時代」と位置づけ、その表現にふさわしい発表が続きました。

また Google は、Anthropic の Claude Max と OpenAI の ChatGPT Pro のサブスクリプションに対抗して、I/O にて新たに Google AI Ultra というティアを導入しました。月額 $100 と価格は同等で、以下で取り上げる一部のエージェント機能へのアクセスが制限付きで提供されます。

本記事では、AI 実務者と開発者にとってとりわけ重要な発表をピックアップして解説します。すでに利用可能、もしくは近く提供予定のアップデートに焦点を当てます。

Gemini 3.5 Flash

Gemini 3.5 Flash は I/O 2026 における目玉のモデルリリースです。エージェント系およびコーディング系ベンチマークで Gemini 3.1 Pro を上回り、さらに Google は他の最先端モデルと比べて出力トークン毎秒が 4 倍高速だと主張しています。現時点でその検証はできませんが、非常に大胆な主張であることは確かです。

ベンチマーク面では、特に MCP Atlas、CharXiV Reasoning、Finance Agent v2 での伸びが目立ち、いずれも Gemini 3.5 Flash がリードしています。総合的には、Claude Opus 4.7 や GPT-5.5 と十分に競合できる水準です。

ベンチマーク	3.5 Flash	3 Flash	3.1 Pro	Claude Sonnet 4.6	Opus 4.7	GPT-5.5
Terminal-bench 2.1	76.2%	58.0%	70.3%	--	66.1%	78.2%
SWE-Bench Pro	55.1%	49.6%	54.2%	--	64.3%	58.6%
MCP Atlas	83.6%	62.0%	78.2%	69.5%	79.1%	75.3%
OSWorld	78.4%	65.1%	76.2%	72.5%	78.0%	78.7%
Finance Agent v2	57.9%	42.6%	43.0%	51.0%	51.5%	51.8%
CharXiv Reasoning	84.2%	80.3%	83.3%	72.4%	82.1%	84.1%
Humanity's Last Exam	40.2%	33.7%	44.4%	33.2%	46.9%	41.4%
ARC-AGI-2	72.1%	33.6%	77.1%	58.3%	75.8%	84.6%

コスト面の主張も注目に値します。Google は、1 日あたり約 1 兆トークンを処理するエンタープライズが、他の最先端モデルから 80% のワークロードを 3.5 Flash に移行すれば、年間で 10 億ドル以上のコスト削減が見込めるとしています。これは OpenAI と Anthropic のエンタープライズ顧客に対する直接的な訴求です。Gemini 3.5 Flash は本日より Gemini API、Google AI Studio、Gemini アプリで利用可能。Gemini 3.5 Pro はすでに社内利用が始まっており、来月の提供が見込まれています。

詳しくは、Gemini 3.5 Flash の記事をご覧ください。新モデルをさらに深掘りしています。

Gemini Omni

Gemini Omni は、テキスト・画像・音声・動画のあらゆる組み合わせを入力として受け取り、動画を出力できる Google の新しいネイティブ多モーダル生成メディアモデルです。ファミリーの最初のモデルである Gemini Omni Flash は、Gemini アプリ、Google Flow、YouTube Shorts で本日より利用可能です。

アーキテクチャ上の重要点は、Omni が従来分かれていたスタック（動画は Veo、画像は Imagen、音声は別系統）を単一モデルに統合したことです。これにより、モダリティをまたぐ作業でも一貫性のある編集が可能になり、パイプライン由来のアーティファクトが減るはずです。なお、ローンチ時点では Omni の数値ベンチマークは未公開のため、独立した評価は今後となります。開発者およびエンタープライズ向けの API アクセスは、I/O 後の数週間で提供予定です。

実際に検証し、詳細は Gemini Omni の記事にまとめました。初回の動画生成結果は玉石混交でした（少なくとも Seedance 2.0 などが引き上げた高い基準を踏まえると）が、より強力な Gemini Omni Pro がまもなく登場すると見込まれています。

Antigravity 2.0

Antigravity は Google のエージェントファーストな開発プラットフォームで、I/O での 2.0 リリースは大幅な拡張です。従来はコーディング環境として位置づけられていましたが、いまや自律型 AI エージェントの群を開発・デプロイ・管理するためのフルプラットフォームとなりました。中心となるのは、新たなスタンドアロンのデスクトップアプリで、エージェントのオーケストレーションを一元的に扱い、複数のエージェントを並行して異なるタスクに同時実行できます。

エコシステムには、開発者向けに次の 4 つの明確なサーフェスが加わりました。

Antigravity 2.0 デスクトップアプリ： 複数エージェントを並行オーケストレーションし、スケジュールされたバックグラウンドタスクをサポート。Google AI Studio、Android、Firebase と統合。
Antigravity CLI： GUI なしでエージェントを作成・実行できるターミナルネイティブなサーフェス。Gemini CLI ユーザーには移行が推奨されています。
Antigravity SDK： Google 自身のプロダクトを支えるエージェント基盤と同等の機能にプログラムからアクセス可能。独自インフラ上でホストするカスタムエージェントの振る舞いにも対応。
Gemini Enterprise Agent Platform における Antigravity： エンタープライズのワークロード向けに、Antigravity を Google Cloud のプロジェクトへ直接接続。

コアエージェントにも有用な新機能がいくつか追加されました。最大のポイントは、状況に応じてモジュール式サブエージェントを動的に生成できるようになったことです。各サブエージェントはワークスペースを分離した並列実行で動作し、親エージェントのツール構成と権限を継承します。長時間処理は非同期で実行され、エージェントループをブロックしなくなりました。

Claude Code Hooks に近い機能として、JSON Hooks は実行の主要な段階（ツール呼び出しやモデル呼び出しの前後、停止条件など）にカスタムシェルスクリプトをアタッチでき、ロギング、引数のカスタマイズ、指示の差し込みが可能です。Scheduled Tasks は cron ベースのプロンプトで定期実行（毎朝の PR ダイジェストや毎時のデプロイ確認など）を設定でき、結果はサイドバーに表示され、ヒューマン・イン・ザ・ループへの引き継ぎがシームレスになります。

管理面では、Antigravity は「プロジェクト」という組織単位を導入し、設定・リソース・権限をエージェントグループごとにスコープします。これにより、すべてに対して最も広範なグローバル権限を要求する必要がなくなります。刷新されたサイドパネルは、会話をプロジェクト・ステータス・新着順でグルーピングでき、ネイティブの Git worktree サポートも内蔵しています。このプロジェクトベースのレイアウトは、Cursor のマルチウィンドウ型ワークスペース管理や Codex のタスクキューに近いものの、プロジェクト単位での権限スコープがより厳密です。

音声入力（Gemini Audio モデル経由）と、新しいスラッシュコマンド（自律実行用の /goal、事前確認用の /grill-me、cron プロンプト用の /schedule、任意でブラウザ使用を指示する /browser）も UX を補完します。

Antigravity 2.0 は本日から利用可能です。Google AI Ultra プラン（$100/月）は、Google AI Pro プランと比べて Antigravity の使用上限が 5 倍になります。

Gemini API の Managed Agents

Antigravity 2.0 とあわせて、Google は Gemini API における Managed Agents を発表しました。これは、オーケストレーション基盤を自前で管理することなく、エージェント駆動のアプリケーションを構築したい開発者向けに、エージェント機能を API レイヤーに直接取り込むものです。Antigravity デスクトップ体験の API 版とも言えます。

開発者にとっての実務的な意味は、Gemini API 上でエージェントの振る舞い、ツール連携、マルチステップのワークフローを定義し、実行は Google のインフラに任せられるようになったことです。長期にわたるタスク実行を必要とする本番アプリケーションを、独自のエージェント基盤を立ち上げ・運用することなく構築できる可能性があり、これは本当にゲームチェンジャーになり得ます。アクセスは Google AI Studio から可能で、エンタープライズ顧客は Gemini Enterprise Agent Platform 経由で利用できます。

正直な注意点を一つ。I/O 報道に対する初期の開発者フィードバックでは、複雑なエージェントフローとエラーハンドリングに関するドキュメントがまだ不十分との指摘がありました。また、レート制限やクォータ管理も摩擦点として挙げられています。時間の経過とともに改善される類の問題ではありますが、このスタックでの開発に踏み切る前に知っておく価値はあります。

Gemini Spark

Gemini Spark（Meta の最新 LLM Muse Spark と混同しないように）は、Google の新しい個人向け AI エージェントで、今回のエージェント関連発表の中では最もコンシューマー寄りです。Google Cloud 上の専用仮想マシンで 24 時間 365 日稼働し、作業を継続するのにノート PC を開いておく必要がありません。Spark は Gemini 3.5 と Antigravity の基盤により、バックグラウンドで長期タスクを処理できます。

ローンチ時点の主な機能は次のとおりです。

ローンチ時点でのGoogle 製ツール（Workspace、Gmail、Calendar）との統合。数週間以内に MCP 経由のサードパーティツール対応を予定。
Gemini アプリからの対話。まもなくメールやチャットからも操作可能に。
この夏後半、Chrome 内でエージェント型ブラウザレイヤーとして直接動作。
年内に提供予定の Android の新 UI スペース「Android Halo」で、ライブのタスク進行状況を可視化。

OpenAI のエージェントエコシステムや Anthropic のツール使用機能との比較は避けて通れません。Spark の差別化要因は、Google Cloud インフラ上での 24/7 の永続実行と、Google の生産性スイートへの深い統合です。すでに業務が Google Workspace に載っている場合は大きな利点になります。そうでない場合は、価値提案はやや不明瞭かもしれません。

ここでの懸念はプライバシーです。受信トレイ、カレンダー、ドキュメントを継続的に監視するエージェントは、規制産業におけるデータの所在やコンプライアンスに関して正当な疑問を生じさせます。例えば「従業員が退職したとき、エージェントのメモリはどうなるのか？」といった点です。Google はこれらの問いに対する詳細をまだ提示していません。Spark は今週、信頼できるテスターに提供が始まり、翌週には米国の Google AI Ultra 購読者（$100/月）向けにベータが開始されます。

検索エージェントと AI モード

検索の AI モードは前回の I/O で導入され、1 年後の現在、月間 10 億人以上のアクティブユーザーを突破しました。今回 Google は、さらに 2 つのエージェント機能を追加します。

1 つ目は検索の情報エージェントです。関心のあるトピックをバックグラウンドでモニタリングし、最適なタイミングで関連情報を提示する、パーソナライズされた常駐エージェントです。今夏、Google AI Pro と Ultra の購読者から順次展開されます。

2 つ目は、Gemini 3.5 Flash と Antigravity によって強化された検索の生成 UIです。検索が、複雑で長期にわたるクエリに対して、カスタムレイアウト、インタラクティブなビジュアル、さらには永続的なダッシュボードやミニアプリまで構築します。生成 UI 機能は今夏、すべてのユーザーに無料で提供開始。永続ダッシュボードとカスタムアプリ機能は、米国の Pro と Ultra 購読者から先行提供されます。

これはパブリッシャーや SEO 関係者にとって重大な懸念です（AI Overview や AI モードの導入時と同様に）。AI 生成の回答が検索内でユーザーの疑問を完全に解決してしまうと、ソースサイトへクリックする理由がなくなります。実際に、AI Overview と AI モードの初期展開の双方で、業界全体に大幅なトラフィック減が生じました。こうした回答の基盤となるコンテンツを提供するパブリッシャーに対し、収益を分配したりトラフィックを保証したりする明確な方法は、いまだ Google から示されていません。

Google Flow

I/O 2025 で AI 映像制作ツールとして登場した Google Flow は、3 つの大きなアップデートで大きく前進しました。

より賢いプランニングエージェント。 更新された Flow エージェントは、マルチステップのクリエイティブプロジェクトを計画・推論できるようになりました。コンセプト、参考画像、ラフスクリプトなどの入力を渡すと、初期のブレストから制作、編集まで、1 つの環境で伴走します。新エージェントは本日より全ユーザーが利用可能です。
Gemini Omni によるネイティブ動画対応。 Flow は Omni モデル経由で、動画の生成と編集をネイティブに扱えるようになりました。カメラロールのクリップに対する変更を自然言語で指示し、対話的に反復できます。キャラクターの一貫性も向上し、シーンをまたいでも人物像や声が維持されます。繰り返し登場するキャラクターを用いた短編や広告制作に特に有用です。
カスタムツールのための Vibe コーディング。 Flow 同梱のツールに限定されず、プラットフォーム上で直接カスタムツールを作成できます。Google は、カスタム動画エフェクトの設計、手描きアニメーションツールの作成、テキストレイヤーのワークフロー構築など、すべて Flow 内で完結する例を紹介しました。

これらを総合すると、Flow は単なるクリエイティブアシスタントを超え、クリエイティブなワークフローを構築するためのプラットフォームとして位置づけられます。モバイルアプリは Android でベータ提供中で、iOS にも近日対応予定です。

SynthID の拡大

Google の不可視 AI 透かしシステムである SynthID は、3 年前のローンチ以来、1000 億枚以上の画像・動画と、合計 6 万年分に相当する音声アセットに透かしを付与しました。今回の I/O で特に重要なのは規模ではなくパートナーです。OpenAI、Kakao、Eleven Labs が昨年参加した Nvidia に続き、SynthID を採用します。

意味が大きいのは業界横断の採用です。透かしの標準は、十分に広く普及してこそ「透かしがない」という状態自体が有益なシグナルとなります。Google はまた、コンテンツクレデンシャルの検証（C2PA 標準）を検索と Chrome に拡大し、コンテンツが AI 由来かカメラ由来か、生成ツールで編集されたかどうかをユーザーに示します。SynthID と C2PA を組み合わせることで、真正性の証明に独立した 2 層を持たせられ、どちらか一方だけでは容易に剥がされ得る現状に対して正しいアプローチとなります。

注目トピック（Honourable Mentions）

I/O からのその他の発表も、簡単に触れておきます。

Docs Live： 音声主体で Google ドキュメントにアイデアを話し込み、Gemini が文書に構造化してくれる新機能。今夏に購読者向けに展開予定。同時期に Gmail と Keep にも音声機能が導入されます。
Google Pics： Nano Banana モデルを基盤に、各要素を平面画像ではなく個別のオブジェクトとして扱う新しい AI 画像作成・編集ツール。現在は信頼できるテスターに提供中で、今夏後半に Google AI Pro と Ultra の購読者へ展開予定。
Android Halo： Gemini Spark などのエージェントから、ライブ更新やタスクの進行状況を表示する Android の新 UI スペース。年内提供予定。
Daily Brief： Gemini アプリ内のすぐ使えるエージェント。受信トレイ、カレンダー、タスクからパーソナライズされた朝のダイジェストを作成し、次のアクションを提案。追加料金の発表はなく、Gemini アプリ体験の一部となる見込み。
TPU 8t と 8i： 第 8 世代 TPU はデュアルチップ構成。8t は大規模事前学習向けに最適化（前世代比で生の計算性能が約 3 倍、世界で 100 万台超の TPU へスケール）、8i は推論向けに最適化。いずれも前世代比で最大 2 倍の性能/電力効率を実現。
Gemini for Science： Antigravity と 30 を超える主要ライフサイエンスデータベースをつなぐ AI ツール群。Science Skills は本日より GitHub と Antigravity で利用可能。

総括

Google I/O 2026 は、AI の主要な進路としてエージェントに賭けたイベントでした。その基盤となるのが、ほぼすべての発表を下支えする Gemini 3.5 Flash と Antigravity 2.0 です。いますぐ使えるものとしては、Gemini 3.5 Flash（Gemini API と AI Studio 経由）、新しい Flow エージェント、Gemini Omni Flash、そして Antigravity 2.0 デスクトップアプリが挙げられます。 Gemini Spark、検索エージェント、検索の生成 UI は今夏にかけて順次展開され、当面は新しい $100/月の AI Ultra ティアでゲートされる部分が多くなりそうです。

個人的には、Antigravity のアップグレードが最も興味深い発表でした。というのも、これは同時に二層で機能するからです。スタンドアロンの開発者向けアプリとしては Codex や Claude Code と真っ向から競合し、プラットフォームとしては基盤の ADK と Managed Agents API により、LangChain、AutoGen、OpenAI の Agents SDK のようなオーケストレーションフレームワークに挑みます。Gemini との統合と Google Cloud のデプロイ層は、両面での差別化要因（そしてロックインのリスク）になります。

Gemini 3.5 Flash は GPT-5.5 や Claude Opus 4.7 と比べてどうですか？

Gemini 3.5 Flash は MCP Atlas（83.6%）や Finance Agent v2（57.9%）など、複数のエージェント系ベンチマークでリードしています。一方で、SWE-Bench Pro と ARC-AGI-2 では GPT-5.5 がわずかに優位です。Humanity's Last Exam では Claude Opus 4.7 が引き続き最強（46.9%）です。要点としては、最先端モデルと競合できる性能を保ちつつ、大規模運用で高速かつ大幅に安価であること（その名が示す通り）です。より強力な Pro 版も間もなく公開される見込みです。

Google Antigravity は Claude Code や Codex とどう違いますか？

Google Antigravity 2.0 は、デスクトップアプリ、CLI、SDK、エンタープライズ API を横断して複数の AI エージェントを並行オーケストレーションできる、エージェントファーストの開発プラットフォームです。ターミナル主体のコーディングエージェントである Claude Code や、タスクキュー型の Codex と異なり、Antigravity はプロジェクト単位の厳密な権限スコープ、サブエージェントの生成、Google Cloud と Firebase への直接統合を提供します。開発ツールでありつつプラットフォーム SDK でもある二面性により、単体のコーディングアシスタントというよりオーケストレーションフレームワークに近い存在です。

$100/月の Google AI Ultra プランは、ChatGPT Pro や Claude Max と比べて価値がありますか？

3 つのプランはいずれも月額 $100 ですが、価値は使うエコシステム次第です。Google AI Ultra の差別化要因は、Gemini Spark（24/7 の永続エージェント）へのアクセス、Antigravity の使用上限 5 倍、そして Google Workspace との深い統合です。ワークフローが Gmail、Docs、Calendar に載っている場合は Ultra が有利でしょう。主にコーディング支援や API レベルの柔軟性が必要であれば、ChatGPT Pro や Claude Max の方が適する場合もあります。

Gemini Omni とは何ですか？動画生成はどのように処理しますか？

Gemini Omni は、テキスト・画像・音声・動画のあらゆる組み合わせを入力とし、動画を出力する Google のネイティブ多モーダルモデルです。従来別系統だった（動画の Veo、画像の Imagen）システムを単一モデルに統合しており、モダリティをまたぐ編集の一貫性向上が期待できます。初期バージョンの Omni Flash はすでに利用可能で、より高性能な Omni Pro も間もなく登場予定です。独立ベンチマークは未公開のため、実運用での品質評価は進行中です。

トピック

人工知能

AIエージェント