メインコンテンツへスキップ

Google I/O 2026:エージェント主導の「Gemini時代」の幕開け

Gemini 3.5 Flash と Gemini Omni から Antigravity 2.0 と Gemini Spark まで。Google のエージェントに焦点を当てた I/O 2026 基調講演の重要ポイントを紹介します。
更新 2026年5月20日  · 12 分 読む

Google I/O 2026 初日の発表の多くに共通していたキーワードはただ一つ:エージェントです。チャットボットでもアシスタントでもなく、バックグラウンドで動作し、Google のプロダクト全体に統合される、持続的にタスクを実行するエージェント。CEO の Sundar Pichai はこれを明確に「エージェント主導の Gemini 時代」と位置づけ、発表内容もそれを裏づけるものでした。

Google はまた、Anthropic の Claude Max や OpenAI の ChatGPT Pro のサブスクリプションに対抗し、I/O で新しい Google AI Ultra ティアを導入しました。価格は同じく月額 $100 で、以下で取り上げる一部のエージェント機能へのアクセスが制限されています。

本記事では、AI 実務者と開発者にとって重要な発表を中心に解説します。すでに利用可能、もしくは近く提供予定のアップデートに絞って取り上げます。

Gemini 3.5 Flash

Gemini 3.5 Flash は I/O 2026 における注目のモデルリリースです。エージェント系およびコーディング系のベンチマークで Gemini 3.1 Pro を上回り、出力トークン毎秒では他のフロンティアモデルより 4 倍高速だと Google は主張しています。現時点での検証はできませんが、大胆な主張であることは確かです。

ベンチマークの観点では、特に MCP Atlas、CharXiV Reasoning、Finance Agent v2 での伸びが顕著で、いずれも Gemini 3.5 Flash が首位です。総合的には、Claude Opus 4.7GPT-5.5 と競合できる水準に見えます。

Benchmark

3.5 Flash

3 Flash

3.1 Pro

Claude Sonnet 4.6

Opus 4.7

GPT-5.5

Terminal-bench 2.1

76.2%

58.0%

70.3%

--

66.1%

78.2%

SWE-Bench Pro

55.1%

49.6%

54.2%

--

64.3%

58.6%

MCP Atlas

83.6%

62.0%

78.2%

69.5%

79.1%

75.3%

OSWorld

78.4%

65.1%

76.2%

72.5%

78.0%

78.7%

Finance Agent v2

57.9%

42.6%

43.0%

51.0%

51.5%

51.8%

CharXiv Reasoning

84.2%

80.3%

83.3%

72.4%

82.1%

84.1%

Humanity's Last Exam

40.2%

33.7%

44.4%

33.2%

46.9%

41.4%

ARC-AGI-2

72.1%

33.6%

77.1%

58.3%

75.8%

84.6%

コスト面も注目です。Google は、1 日あたり約 1 兆トークンを処理する企業が、他のフロンティアモデルから 80% のワークロードを 3.5 Flash に移行すれば、年間 10 億ドル以上の節約につながる可能性があるとしています。これは OpenAI と Anthropic のエンタープライズ顧客に対する直接的な提案です。Gemini 3.5 Flash は本日より Gemini API、Google AI Studio、Gemini アプリで利用可能。Gemini 3.5 Pro はすでに社内で使用されており、来月の提供が見込まれています。

詳しくは、より深く解説した Gemini 3.5 Flash の記事をおすすめします。

Gemini Omni

Gemini Omni は、テキスト・画像・音声・動画のあらゆる組み合わせを入力として受け取り、動画を出力できる、Google の新しいネイティブ多モーダル生成メディアモデルです。ファミリーの初号機である Gemini Omni Flash は、本日より Gemini アプリ、Google Flow、YouTube Shorts で利用可能です。

アーキテクチャ上の要点は、Omni がこれまで分かれていたスタック(動画の Veo、画像の Imagen、個別の音声システム)を単一モデルに統合したことです。これにより、モダリティをまたぐ編集の一貫性が増し、パイプライン由来のアーティファクトが減少します。なお、Omni の数値ベンチマークはローンチ時点では未公開のため、独立評価はこれからです。開発者およびエンタープライズ向けの API アクセスは、I/O 後の数週間で提供予定です。

実際にテストし、詳細は Gemini Omni の記事にまとめました。初期の動画生成は当たり外れがありました(少なくとも Seedance 2.0 の高い水準を踏まえると)が、より強力な Gemini Omni Pro がまもなく登場すると見られます。

Antigravity 2.0

Antigravity は Google のエージェントファーストな開発プラットフォームで、I/O での 2.0 リリースは大幅な拡張となりました。従来はコーディング環境としての位置づけでしたが、現在は自律型 AI エージェントのコホートを開発・デプロイ・管理できるフルプラットフォームです。中心となるのは、エージェントのオーケストレーションのハブとして機能する新しいスタンドアロンのデスクトップアプリで、複数のエージェントを並行して別々のタスクで同時に実行できます。

エコシステムには、開発者向けの 4 つの明確なサーフェスが加わりました。

  • Antigravity 2.0 デスクトップアプリ:複数エージェントを並行オーケストレーションし、スケジュールされたバックグラウンドタスクをサポート。Google AI Studio、Android、Firebase と統合。
  • Antigravity CLI:GUI なしでエージェントを作成・実行できるターミナルネイティブのサーフェス。Gemini CLI のユーザーには移行が推奨されています。
  • Antigravity SDK:Google 自身のプロダクトを支えるのと同じエージェント基盤へのプログラマティックアクセスを提供し、独自インフラ上でホストするカスタムエージェント挙動にも対応。
  • Gemini Enterprise Agent Platform における Antigravity:エンタープライズワークロード向けに、Antigravity を Google Cloud プロジェクトに直接接続。

中核エージェントにも有用な新機能がいくつか加わりました。最大のポイントは、モジュール式のサブエージェントをその場で生成できるようになったことです。各サブエージェントはワークスペースを分離した上で並行実行され、親のツール設定と権限を継承します。長時間の処理は非同期で走るため、エージェントループをブロックしません。

Claude Code Hooks に似た JSON Hooks により、実行の重要な段階(ツール呼び出しやモデル呼び出しの前後、停止条件など)にカスタムシェルスクリプトを接続し、ログ取得、引数のカスタマイズ、指示の挿入が可能です。Scheduled Tasks では cron ベースのプロンプトを設定でき、日次の PR ダイジェストや毎時のデプロイ確認などの定期実行が可能で、結果はサイドバーに表示され、人間の介入への引き継ぎがシームレスになります。

管理面では、Antigravity は「プロジェクト」を組織化の基本単位として導入し、エージェントグループごとに設定・リソース・権限をスコープできるようにしました。すべてに対して最も広いグローバル権限を要求する必要はありません。刷新されたサイドパネルでは、会話をプロジェクト・ステータス・新しさでグルーピングでき、ネイティブの Git worktree 対応も内蔵しています。このプロジェクト中心のレイアウトは、Cursor のマルチウィンドウ型ワークスペース管理や Codex のタスクキューに相当しますが、プロジェクト単位の権限スコープがより厳密です。

新しい会話を始める際に、ネイティブの Git worktree を簡単に作成できます。

音声入力(Gemini Audio モデル経由)と、新しいスラッシュコマンド(自律実行用の /goal、タスク前の確認用 /grill-me、cron プロンプト用 /schedule、任意でブラウザ使用を有効化する /browser)で UX が充実しました。

Antigravity 2.0 は本日から利用可能です。Google AI Ultra プラン(月額 $100)は、Google AI Pro プランと比べて Antigravity の使用上限が 5 倍に引き上げられます。

Gemini API の Managed Agents

Antigravity 2.0 と併せて、Gemini API における Managed Agents も発表されました。これは、オーケストレーション基盤を自前で管理せずに、エージェント駆動のアプリケーションを構築したい開発者向けに、エージェント機能を API レイヤーへ直接提供するものです。Antigravity デスクトップ体験の API 版と言えます。

開発者にとっての実務的な意味は、Gemini API を通じてエージェントの振る舞い、ツール連携、マルチステップのワークフローを定義し、その実行を Google のインフラに任せられるようになったことです。長期的なタスク実行を要する本番アプリケーションを、独自のエージェント基盤を立ち上げ・管理せずに構築できる可能性があり、これは大きな転換点になり得ます。アクセスは Google AI Studio 経由で提供され、エンタープライズ顧客は Gemini Enterprise Agent Platform から利用できます。

率直な注意点も一つ。I/O の取材に基づく初期の開発者フィードバックでは、複雑なエージェントフローやエラーハンドリングに関するドキュメントがまだ乏しいとの指摘があります。レート制限やクォータ管理も摩擦点として挙げられています。時間の経過とともに解消される可能性が高い課題ではありますが、このスタックで開発を進める前に知っておくべきポイントです。

Gemini Spark

Gemini Spark(Meta の最新 LLM Muse Spark と混同しないようご注意)は、Google の新しいパーソナル AI エージェントで、今回のエージェント関連発表の中でも最も消費者寄りの存在です。Google Cloud 上の専用仮想マシンで 24 時間 365 日動作するため、作業を継続するのにノート PC を開いておく必要はありません。Spark は Gemini 3.5 と Antigravity 基盤を用いており、バックグラウンドで長期的なタスクを処理できます。

ローンチ時点の機能は以下のとおりです。

  • 開始時点でGoogle 独自のツール(Workspace、Gmail、Calendar)と統合。MCP 経由のサードパーティツール連携は今後数週間で対応予定。
  • Gemini アプリ経由での対話に対応。まもなくメールやチャットにも対応予定。
  • 今夏後半に、Chrome 内でエージェント的なブラウザレイヤーとして直接動作。
  • 年内に、Android Halo(Android 上の新しい UI スペース)を通じ、タスクの進捗をライブで可視化。

OpenAI のエージェントエコシステムや Anthropic のツール活用機能との比較は避けて通れません。Spark の差別化要因は、Google Cloud インフラ上での 24/7 の持続実行と、Google の生産性スイートとの深い統合です。すでに仕事が Google Workspace 中心であれば、これは大きな利点です。そうでない場合、価値はやや見えにくくなります。

懸念としてはプライバシーが挙げられます。受信トレイやカレンダー、ドキュメントを継続的に監視するエージェントは、規制産業におけるデータ所在地やコンプライアンスに関する正当な疑問を生みます。たとえば「従業員が退職した際、エージェントのメモリはどうなるのか?」といった点です。こうした問いに関する詳細は、現時点で Google から示されていません。

Spark は今週、信頼できるテスター向けに展開され、翌週には米国の Google AI Ultra 購読者(月額 $100)向けにベータ提供が始まります。詳しくは Gemini Spark の記事で取り上げています。

Managed Agents と Gemini Spark の比較

検索エージェントと AI モード

検索の AI モードは前回の I/O で導入されました。1 年が経ち、月間アクティブユーザーは 10 億人を超えています。今回、Google はさらに二つのエージェント機能を追加します。

一つ目は検索における情報エージェントです。関心のあるトピックを監視し、適切なタイミングで関連情報を提示する、パーソナライズされたバックグラウンドエージェントを設定できます。今夏、Google AI Pro と Ultra の購読者から順次展開されます。

二つ目は、Gemini 3.5 Flash と Antigravity によって実現される検索における生成 UIです。複雑で長期的なクエリに対して、検索がカスタムレイアウトやインタラクティブなビジュアル、さらには持続的なダッシュボードやミニアプリまで構築します。生成 UI の機能自体は今夏、全ユーザーに無料で提供されます。持続的ダッシュボードとカスタムアプリの機能は、まず米国の Pro と Ultra 購読者に提供されます。

これは出版社や SEO 関係者にとって現実的な懸念事項です(AI Overview や AI モードの導入時と同様に)。AI が生成した回答が検索内でユーザーの疑問を完全に解決してしまえば、元サイトへクリックする理由はなくなります。すでにこの影響は現れており、AI Overview と AI モードの初期展開はいずれも業界全体で大幅なトラフィック減につながりました。Google は、これらの回答を支えるコンテンツを提供する出版社に対し、収益を分配したりトラフィックを保証したりする明確な仕組みをいまだ提示していません。

Google Flow

I/O 2025 で AI 映画制作ツールとして登場した Google Flow は、今回の 3 つの重要なアップデートで大きく前進しました。

  • より賢いプランニングエージェント。更新された Flow のエージェントは、マルチステップのクリエイティブプロジェクトを計画・推論できるようになりました。コンセプト、参考画像、ラフスクリプトといった入力を渡すと、初期のブレインストーミングから制作・編集までを、一つの環境内で前に進めてくれます。新エージェントは本日より全ユーザーが利用可能です。
  • Gemini Omni によるネイティブ動画対応。Flow は Omni モデルを介して、動画の生成と編集をネイティブに扱えるようになりました。カメラロールのクリップに対して自然言語で変更点を指示し、対話的に反復できます。キャラクターの一貫性も向上し、シーンをまたいでも人物のアイデンティティや声が維持されます。繰り返し登場するキャラクターの短編や広告制作に特に有用です。
  • カスタムツールのための Vibe コーディング。標準搭載のツールに限定されるのではなく、プラットフォーム上で直接、自分専用のツールを構築できます。Google は、カスタム動画エフェクトの設計、手描きアニメーションツールの作成、テキストレイヤー処理のワークフロー構築など、Flow から離れずに行える例を紹介しました。

これらを総合すると、Flow は単なるクリエイティブアシスタントを超え、クリエイティブなワークフローを構築するためのプラットフォームへと進化しつつあります。Android 版のモバイルアプリは現在ベータで、iOS にもまもなく対応予定です。

SynthID の拡大

Google の不可視 AI 透かしシステムである SynthID は、3 年前のローンチ以来、1000 億枚以上の画像・動画と 6 万年分の音声アセットに透かしを付与してきました。ここで注目すべきは規模ではなくパートナーです。OpenAI、Kakao、Eleven Labs が昨年参加した Nvidia に続き、SynthID を採用します。

意味があるのは、この業界横断の採用が進んでいる点です。透かしの標準は、十分に広く普及して初めて「透かしなし」が有益なシグナルになります。Google はまた、コンテンツの来歴を示す C2PA 標準である Content Credentials の検証を Search と Chrome に拡大し、コンテンツが AI 由来かカメラ由来か、生成ツールで編集されたかどうかをユーザーに示します。SynthID と C2PA を組み合わせることで、来歴に独立した二つのレイヤーが与えられ、個別に剥がされやすいという弱点に対して適切なアプローチとなります。

その他の注目トピック

I/O の他の発表の中から、簡単に触れておくべきものをいくつか挙げます。

  • Docs Live:音声ファーストで Google ドキュメントにアイデアを口述し、Gemini が文書へと構造化してくれる新機能。今夏、購読者向けに展開予定。音声機能は同時期に Gmail と Keep にも提供。
  • Google Pics:Nano Banana モデルを基盤とした新しい AI 画像生成・編集ツール。各要素をフラットな画像ではなく個別のオブジェクトとして扱います。現在は信頼できるテスター向け、今夏後半に Google AI Pro と Ultra の購読者へ展開予定。
  • Android Halo:Gemini Spark などのエージェントからのライブ更新やタスク進捗を表示する、Android 上の新しい UI スペース。年内提供予定。
  • Daily Brief:Gemini アプリ内のすぐに使えるエージェント。受信トレイ、カレンダー、タスクからパーソナライズされた朝のダイジェストを作成し、次のアクションを提案します。個別の価格は未発表で、Gemini アプリ体験の一部となる見込みです。
  • TPU 8t と 8i:Google の第 8 世代 TPU はデュアルチップ構成で、8t は大規模な事前学習に最適化(前世代比で生の計算量がほぼ 3 倍、世界で 100 万台超へスケール可能)、8i は推論に最適化。いずれも前世代比で最大 2 倍の性能/電力を達成。
  • Gemini for Science:Antigravity を 30 を超える主要ライフサイエンス系データベースに接続する AI ツール群。Science Skills は本日より GitHub と Antigravity 内で利用可能。

まとめ

Google I/O 2026 は、AI の主要な方向性としてエージェントに賭けたイベントでした。その土台となるのが、ほぼすべての発表を下支えする Gemini 3.5 Flash と Antigravity 2.0 です。今すぐ使えるのは、Gemini 3.5 Flash(Gemini API と AI Studio 経由)、新しい Flow のエージェント、Gemini Omni Flash、そして Antigravity 2.0 のデスクトップアプリです。Gemini Spark、検索エージェント、検索の生成 UI 機能は今夏に順次展開され、当面は新設の月額 $100 の AI Ultra ティアの背後に置かれるものが中心です。

個人的には、Antigravity のアップグレードが最も興味深いリリースでした。というのも、これは同時に二つのレベルで機能するからです。スタンドアロンの開発者向けアプリとしては Codex や Claude Code に真っ向から競合し、プラットフォームとしては基盤の ADK と Managed Agents API により、LangChain、AutoGen、OpenAI の Agents SDK といったオーケストレーションフレームワークに挑みます。Gemini との統合と Google Cloud のデプロイ層は、いずれの側面でも差別化要因(同時にロックインのリスク)となります。

Google I/O 2026 のよくある質問

Gemini 3.5 Flash は GPT-5.5 や Claude Opus 4.7 と比べてどうですか?

Gemini 3.5 Flash は、MCP Atlas(83.6%)や Finance Agent v2(57.9%)といった複数のエージェント系ベンチマークで首位に立つ一方、SWE-Bench Pro と ARC-AGI-2 では GPT-5.5 がわずかに上回ります。Humanity's Last Exam では Claude Opus 4.7 が依然として最強(46.9%)です。要するに、フロンティアモデルと十分に競合できる性能でありつつ、大規模運用時に高速かつ大幅に低コスト(名前が示すとおり)というのが主なポイントです。より強力な Pro 版のリリースも近いと見られます。

Google Antigravity は Claude Code や Codex とどう違いますか?

Google Antigravity 2.0 は、デスクトップアプリ、CLI、SDK、エンタープライズ API を横断して、複数の AI エージェントを並行してオーケストレーションできるエージェントファーストな開発プラットフォームです。ターミナルネイティブのコーディングエージェントである Claude Code や、タスクキュー型の Codex と異なり、Antigravity はプロジェクト単位の厳密な権限スコープ、サブエージェントの生成、Google Cloud および Firebase との直接統合を提供します。開発者ツールとプラットフォーム SDK の二面性を持つため、単体のコーディングアシスタントというよりは、オーケストレーションフレームワークに近い存在です。

月額 $100 の Google AI Ultra は、ChatGPT Pro や Claude Max と比べて価値がありますか?

3 つのプランはいずれも月額 $100 ですが、価値は利用エコシステムに依存します。Google AI Ultra の差別化要因は、Gemini Spark(24/7 の持続エージェント)へのアクセス、Antigravity の 5 倍の使用上限、そして Google Workspace との深い統合です。ワークフローがすでに Gmail、Docs、Calendar を中心としている場合は Ultra に自然な優位性があります。主にコーディング支援や API レベルの柔軟性を求めるのであれば、ChatGPT Pro や Claude Max の方が適している場合もあります。

Gemini Omni とは何ですか?また、動画生成にはどう対応しますか?

Gemini Omni は、テキスト・画像・音声・動画の任意の組み合わせを入力として受け取り、動画を出力する、Google のネイティブ多モーダルモデルです。従来は別システムだった(動画の Veo、画像の Imagen)ものを 1 つのモデルに統合しているため、モダリティをまたぐ編集の一貫性が高まるはずです。初版の Omni Flash は現在利用可能で、より高性能な Omni Pro もまもなく登場見込みです。独立したベンチマークはまだ公開されていないため、実運用での品質評価は進行中です。

トピック

Google の AI エコシステムを学ぶ

Tracks

Gemini を活用した Google Workspace

4時間
Geminiの主要機能を学び、それらをGoogle Workspaceで活用して生産性と効率を向上させる方法を身につけます。
詳細を見るRight Arrow
コースを開始
もっと見るRight Arrow