Gemini 3.5 Flash：Google史上最速のエージェント型モデル

Google は I/O 2026 で Gemini 3.5 Flash を発表。競合比で4倍の速度を実現しつつ、エージェント性とコーディングの各種ベンチマークで Gemini 3.1 Pro を上回るモデルです。

更新 2026年5月19日 · 8 分読む

Googleは5月19日の I/O 2026 で Gemini 3.5 Flash を発表しました。これは、同クラスの最先端モデルに比べて出力速度が4倍でありながら、エージェント性やコーディング系のベンチマークで Gemini 3.1 Pro を上回るモデルです。

この発表は、AI 業界の競争軸がエージェント性能へと明確にシフトする中で行われました。コーディングエージェント、多段のワークフロー自動化、長期タスクの遂行が主戦場となるなか、Googleは 3.5 Flash をその解として位置づけています。

データサイエンティスト、ML エンジニア、開発者を含むあらゆる専門職にとって重要なのは、3.5 Flash が現在（または近く）Gemini アプリや検索の AI モードでデフォルトモデルとなり、本日から Gemini API でも利用可能であることです。この記事では、発表内容の要点、注目点、ベンチマーク結果、そして実務への意味合いを解説します。

Gemini 3.5 Flash の新機能

Gemii 3.5 Flash の目玉は、フロンティア水準の性能と速度の両立です。Google によれば、3.5 Flash は出力トークン毎秒が4倍高速であり、エージェント作業で最重要のベンチマークにおいて Gemini 3.1 Pro を上回ります。

Terminal-Bench 2.1 で 76.2%。GDPval-AA で 1,656 Elo。MCP Atlas で 83.6%。マルチモーダル理解では CharXiv Reasoning で 84.2% を記録。

要するに、AI における「速い・安い・賢いのうち2つだけ」という古いルールの適用範囲が狭まっています。大きな遅延なしに複雑な多段のエージェントワークフローをこなせる軽量モデルが登場したということです。

このモデルは、本日より Google AI Studio、Gemini API、Android Studio、Gemini Enterprise Agent Platform、Gemini Enterprise で一般提供されます。さらに、Gemini アプリと検索の AI モードにおける新たなデフォルトモデルでもあります。

また Google は、Gemini 3.5 Pro が開発中で社内利用が始まっており、来月の提供開始を見込んでいると発表しました。3.5 Flash は、エージェント実行を中核に据えた新しいモデルファミリーの幕開けだと位置づけられています。

Gemini 3.5 の背景

Gemini 3 シリーズは、最先端モデル競争における Google の現在の立ち位置を確立しました。2026年2月に公開された Gemini 3.1 Pro は、公開時に Artificial Analysis Intelligence Index をリードし、ARC-AGI-2 で 77.1% を記録しました。これは、同ベンチマークでの Gemini 3 Pro の 31.1% を大きく上回るものです。

当社のGPT-5.5 と Gemini 3.1 Pro の比較で取り上げたとおり、Gemini 3.1 Pro の強みは複雑な視覚推論とマルチモーダルタスクにありました。

Gemini ファミリーにおける Flash の呼称は、従来から速度最適化モデルを示してきました。3.5 Flash で異なるのは、品質を犠牲にせず、Flash の速度でフロンティア級の知能を謳っている点です。Artificial Analysis の指標では（Google によれば）3.5 Flash は右上象限、すなわち高知能かつ高出力速度に位置づけられています。

Antigravity ハーネス（協調型サブエージェントを展開するための Google のフレームワーク）は、3.5 Flash の位置づけの中心にあります。単体モデルというより、Google がモデルと並行して構築してきたマルチエージェントアーキテクチャの一要素です。

Gemini 3.5 の主な特長

発表内容のうち、特に注目すべきポイントを整理します。

ベンチマーク性能

3.5 Flash に関する Google のベンチマーク結果は具体的で、直接検討に値します。以下で Gemini 3.1 Pro を上回っています。

Terminal-Bench 2.1：76.2%（当社の過去記事では、Gemini 3.1 Pro は Terminal-Bench 2.0 で 68.5%）
GDPval-AA：1,656 Elo（Claude Opus 4.7 は公開時点で 1,753 Elo とリード、詳しくはClaude Opus 4.7 と Gemini 3.1 Pro の比較レビュー）
MCP Atlas：83.6%（当社の従前のテストで Gemini 3.1 Pro は 73.9%）
CharXiv Reasoning：マルチモーダル理解で 84.2%

速度の主張も注目に値します。最先端モデルに比べ、出力トークン毎秒で4倍高速というものです。研究ノートでは比較対象モデルが明記されていないため、精密な一対一比較というよりは方向性を示す数字として捉えてください。

エージェントアーキテクチャと Antigravity

3.5 Flash は、協調型サブエージェントを実行する Google のフレームワークである Antigravity ハーネスと連携するよう設計されています。Antigravity により、モデルは複数のサブエージェントを並列に展開し、多段のワークフローを実行し、長期タスクでも性能を維持できます。

Google の事例には、AlphaZero 論文の要約作成や、2 つのエージェントを用いた 6 時間で完全プレイ可能なゲームのコーディング、レガシーコードベースの Next.js への変換などが含まれます。これはお遊びのデモではなく、いまやエージェント型システムに期待される、数日にわたる開発タスクの典型例です。

実運用でのエンタープライズ事例

すでに複数の企業が 3.5 Flash を本番またはパイロットで稼働させています。具体的なユースケースは、モデルのエージェント的な強みがどこで活かされているかを示す好例です。

Shopify：サブエージェントを並列実行し、長期にわたる複雑データの分析による加盟店の成長予測を実施
Macquarie Bank：100ページ超の文書を高速に推論して顧客オンボーディングをパイロット運用
Salesforce：Agentforce に統合し、複数サブエージェントによるエンタープライズタスク自動化とマルチターンのツール呼び出しを実現
Xero：数週間に及ぶワークフロー管理のためエージェントを展開（小規模事業者向け 1099 税務フォームの作成など）
Databricks：エージェント型ワークフローでリアルタイム情報を監視し、大規模データセット全体で問題診断と解決策の提示を実施
Ramp：マルチモーダル理解と過去パターンに基づく推論を組み合わせ、複雑な請求書の OCR 精度を向上

Gemini Spark とコンシューマー向け提供

3.5 Flash は、Google の新しいパーソナル AI エージェント「Gemini Spark」を支えるモデルでもあります。Spark は 24 時間 365 日稼働し、ユーザーに代わって行動します。現在、信頼できるテスターに順次展開中で、I/O 発表の翌週には米国の Google AI Ultra 契約者向けにベータ提供が予定されています。

また、このモデルは Gemini アプリと検索の AI モードを通じて、世界中の数十億人のユーザーが本日から利用可能です。Gemini モデルとしては、開発者と一般ユーザーへの同時提供として過去最大級の規模と言えるでしょう。

安全性とセーフガード

Google によれば、3.5 Flash は Frontier Safety Framework の下で開発され、サイバーおよび CBRN に関するセーフガードが強化されています。同社は、応答前にモデルの内部推論をチェックする解釈可能性ツールを用いており、有害な出力と、安全な問い合わせに対する過剰な拒否の双方を抑制することを目指しています。

データ／AI 実務者にとっての Gemini 3.5

もっとも即効性のあるポイントは、3.5 Flash が Google AI Studio の Gemini API から間もなく（事実上ただちに）利用可能であることです。エージェント型のパイプラインを構築している場合、MCP Atlas の 83.6% というスコアと、Antigravity のマルチエージェントハーネスの組み合わせは、現行のモデルに対する有力な比較対象になります。

GDPval-AA の 1,656 Elo は、先のレビューで取り上げた Claude Opus 4.7 の 1,753 Elo に及ばないものの、3.5 Flash の速度優位は、許容レイテンシによってはそれ以上に重要となり得ます。

長期のワークフローを運用するチームにとっては、Xero と Shopify の事例が最も示唆的です。数週間のワークフローを自動エージェント実行へ圧縮する——これが Google の最適化対象であり、それを可能にする基盤が Antigravity ハーネスです。マルチエージェントのオーケストレーションパターンにまだ馴染みがない場合、今がキャッチアップの好機です。

注視したい点が一つ。Google は、同等のタスクで 3.5 Flash が他のフロンティアモデルの半額以下だと述べています。この主張はワークロードの特性に大きく依存しますが、実運用で成立するなら、エージェント型システムの大規模展開における経済性が変わります。来月予定の 3.5 Pro は、最も重い推論を要するチームにとって、より興味深い比較対象となるでしょう。

まとめ

Gemini 3.5 Flash は、Google がフラッグシップだけでなく、性能と速度の両端で勝負する意思を示しています。エージェント系ベンチマークで Gemini 3.1 Pro を上回りつつ、Flash の速度で動くというのは意味のある転換であり、Shopify、Macquarie、Salesforce における企業導入事例は、管理されたベンチマークの外でもモデルが通用することを示唆しています。

より広い視点では、Google は Antigravity、Gemini Spark、3.5 Flash を通じて、エージェント基盤へ大きく賭けています。その是非は、来月登場する 3.5 Pro の性能と、実際の開発ワークフローにおいて Antigravity ハーネスが競合のマルチエージェントフレームワークとどう渡り合うかにかかっています。

エージェント型 AI の基本概念や、こうしたモデルを使った構築方法を効率的に学びたい方には、DataCamp のAI Agent Fundamentals スキルトラックをおすすめします。

トピック

人工知能

AIエージェント