Gemini 3.5 Flash: Googles schnellstes agentisches Modell

Google hat auf der I/O 2026 Gemini 3.5 Flash vorgestellt – ein Modell, das Gemini 3.1 Pro auf agentischen und Coding-Benchmarks übertrifft und dabei viermal schneller läuft als Wettbewerber.

Aktualisiert 19. Mai 2026 · 8 Min. lesen

Google hat am 19. Mai auf der I/O 2026 Gemini 3.5 Flash angekündigt – ein Modell, das Gemini 3.1 Pro auf agentischen und Coding-Benchmarks übertrifft und dabei viermal schneller läuft als andere Spitzenmodelle derselben Klasse.

Die Veröffentlichung kommt zu einem Zeitpunkt, an dem sich der Wettbewerb in der KI-Branche klar auf agentische Leistung verlagert hat. Coding-Agents, mehrstufige Workflow-Automatisierung und die Ausführung langfristiger Aufgaben sind zum Hauptschauplatz geworden – und Google positioniert 3.5 Flash als Antwort auf genau diesen Moment.

Für alle Arten von Fachleuten – einschließlich Data Scientists, ML-Engineers und Entwicklerinnen und Entwickler – ist das relevant, weil 3.5 Flash jetzt (oder in Kürze) das Standardmodell in der Gemini-App und im AI Mode in der Suche ist und heute über die Gemini API bereitsteht. In diesem Artikel erkläre ich, was angekündigt wurde, was heraussticht, die Benchmark-Zahlen und was das für deine Arbeit bedeutet.

Was ist neu bei Gemini 3.5 Flash

Die zentrale Aussage zu Gemini 3.5 Flash ist Tempo kombiniert mit Leistung auf Spitzen-Niveau. Google sagt, 3.5 Flash sei viermal schneller bei Ausgabetokens pro Sekunde als andere Frontier-Modelle – und übertrifft Gemini 3.1 Pro auf den Benchmarks, die für agentische Arbeit am wichtigsten sind.

Auf Terminal-Bench 2.1 erreicht es 76,2%. Auf GDPval-AA kommt es auf 1.656 Elo. Auf MCP Atlas liegt es bei 83,6%. Für multimodales Verständnis erzielt es 84,2% auf CharXiv Reasoning.

Kurz gesagt: Diese Zahlen zeigen, dass die alte Regel „schnell, günstig oder smart – such dir zwei aus“ in der KI weniger zutrifft. Wir bekommen ein schlankes Modell, das komplexe, mehrstufige Agent-Workflows ohne massive Latenz bewältigt.

Google sagt, das Modell ist ab heute allgemein verfügbar – in Google AI Studio, über die Gemini API, in Android Studio, auf der Gemini Enterprise Agent Platform und in Gemini Enterprise. Außerdem ist es weltweit das neue Standardmodell in der Gemini-App und im AI Mode in der Suche.

Google kündigte zudem an, dass Gemini 3.5 Pro in Entwicklung ist, intern bereits genutzt wird und voraussichtlich nächsten Monat ausgerollt wird. Der Release von 3.5 Flash ist der erste Schritt einer neuen Modellfamilie, die auf agentische Ausführung ausgerichtet ist.

Hintergrund zu Gemini 3.5

Die Gemini-3-Reihe hat Googles aktuelle Position im Rennen der Frontier-Modelle gefestigt. Gemini 3.1 Pro, im Februar 2026 veröffentlicht, führte zum Start den Artificial Analysis Intelligence Index an und erzielte 77,1% auf ARC-AGI-2 – mehr als doppelt so viel wie Gemini 3 Pro mit 31,1% auf demselben Benchmark.

Wie wir in unserem Vergleich GPT-5.5 vs. Gemini 3.1 Pro beschrieben haben, lag die Stärke von Gemini 3.1 Pro bei komplexem visuellen Schlussfolgern und multimodalen Aufgaben.

Die Bezeichnung Flash in der Gemini-Familie stand stets für geschwindigkeitsoptimierte Modelle. Neu an 3.5 Flash ist, dass Google Intelligenz auf Frontier-Niveau bei Flash-Tempo beansprucht – ohne Qualitätskompromiss. Der Artificial Analysis Index verortet 3.5 Flash (laut Google) im oberen rechten Quadranten, also hohe Intelligenz und hohe Ausgabegeschwindigkeit zugleich.

Das Antigravity-Harness, Googles Framework für die Orchestrierung kollaborativer Subagenten, ist zentral für die Positionierung von 3.5 Flash. Es ist nicht nur ein Standalone-Modell, sondern eine Komponente in einer Multi-Agent-Architektur, die Google parallel zum Modell aufgebaut hat.

Wichtigste Features von Gemini 3.5

Hier ist die spannendste Essenz der Ankündigung.

Benchmark-Leistung

Googles Benchmark-Aussagen zu 3.5 Flash sind konkret und lohnen den direkten Blick. Das Modell übertrifft Gemini 3.1 Pro bei Folgendem:

Terminal-Bench 2.1: 76,2% (Gemini 3.1 Pro wurde auf Terminal-Bench 2.0 mit 68,5% gemessen, siehe unsere frühere Berichterstattung)
GDPval-AA: 1.656 Elo (Claude Opus 4.7 führte diesen Benchmark zum Launch mit 1.753 Elo an, siehe unsere Review Claude Opus 4.7 vs. Gemini 3.1 Pro)
MCP Atlas: 83,6% (Gemini 3.1 Pro erzielte in unseren früheren Tests 73,9% auf MCP Atlas)
CharXiv Reasoning: 84,2% für multimodales Verständnis

Bemerkenswert ist auch die Geschwindigkeitsaussage: viermal schneller bei Ausgabetokens pro Sekunde als andere Frontier-Modelle. Google nennt in den Research Notes nicht, gegen welche Modelle verglichen wurde – dieser Wert ist daher eher richtungsweisend als ein präziser Direktvergleich.

Agentische Architektur und Antigravity

3.5 Flash ist für die Zusammenarbeit mit dem Antigravity-Harness ausgelegt, Googles Framework für kollaborativ arbeitende Subagenten. Mit Antigravity kann das Modell mehrere Subagenten parallel einsetzen, mehrstufige Workflows ausführen und die Leistung über lange Aufgabenhorizonte hinweg aufrechterhalten.

Googles Beispiele umfassen die Synthese des AlphaZero-Papers und das Coden eines voll spielbaren Games in sechs Stunden mit zwei Agenten sowie die Umstellung eines Legacy-Codebases auf Next.js. Das sind keine Spielereien, sondern spiegeln die mehrtägigen Entwickleraufgaben wider, die agentische Systeme zunehmend übernehmen sollen.

Reale Enterprise-Einsätze

Mehrere Unternehmen betreiben 3.5 Flash bereits produktiv oder im Pilotbetrieb. Die konkreten Use Cases sind aufschlussreich, weil sie zeigen, wo die agentischen Stärken des Modells eingesetzt werden:

Shopify: Paralleler Einsatz von Subagenten zur Analyse komplexer Daten über lange Zeiträume für Wachstumsprognosen von Händlerinnen und Händlern
Macquarie Bank: Pilotiert das Kunden-Onboarding, indem über 100-seitige Dokumente mit geringer Latenz ausgewertet werden
Salesforce: Integration in Agentforce für unternehmensweite Aufgabenautomatisierung mit mehreren Subagenten und Multi-Turn-Toolaufrufen
Xero: Einsatz von Agenten zur Steuerung mehrwöchiger Workflows, einschließlich der Vorbereitung von 1099-Steuerformularen für kleine Unternehmen
Databricks: Nutzung agentischer Workflows, um Echtzeitinformationen zu überwachen, Probleme zu diagnostizieren und Lösungen über große Datensätze hinweg vorzuschlagen
Ramp: Verbesserung der OCR-Genauigkeit bei komplexen Rechnungen durch multimodales Verständnis in Kombination mit dem Schlussfolgern über historische Muster

Gemini Spark und Verfügbarkeit für Endnutzer

3.5 Flash treibt auch Gemini Spark an, Googles neuen persönlichen KI-Agenten, der rund um die Uhr läuft und im Namen der Nutzerinnen und Nutzer handelt. Google rollt Spark derzeit an vertrauenswürdige Tester aus, eine Beta ist für die Woche nach der I/O-Ankündigung für Google AI Ultra-Abonnentinnen und -Abonnenten in den USA geplant.

Das Modell ist ab heute für Milliarden von Nutzerinnen und Nutzern weltweit über die Gemini-App und den AI Mode in der Suche verfügbar – eine der breitesten gleichzeitigen Consumer- und Entwickler-Einführungen, die Google für ein Gemini-Modell umgesetzt hat.

Sicherheit und Schutzmechanismen

Google sagt, 3.5 Flash wurde unter dem Frontier Safety Framework entwickelt – mit verstärkten Cyber- und CBRN-Schutzmechanismen. Das Unternehmen nutzt Interpretierbarkeits-Tools, die die internen Schlussfolgerungen des Modells vor der Antwort prüfen, um sowohl schädliche Ausgaben als auch falsche Ablehnungen bei unkritischen Anfragen zu reduzieren.

Gemini 3.5 für Data- und KI-Praktiker

Die unmittelbarste praktische Folge: 3.5 Flash ist über die Gemini API in Google AI Studio sehr zeitnah verfügbar. Wenn du agentische Pipelines baust, macht die Kombination aus dem MCP-Atlas-Score (83,6%) und dem Antigravity-Multi-Agent-Harness einen Vergleich mit deinem aktuellen Stack lohnend.

Der GDPval-AA-Score von 1.656 Elo liegt hinter den 1.753 Elo von Claude Opus 4.7 aus unserem früheren Review, aber der Geschwindigkeitsvorteil von 3.5 Flash kann je nach Latenzanforderungen stärker ins Gewicht fallen.

Für Teams mit langfristigen Workflows sind die Einsätze bei Xero und Shopify die aussagekräftigsten Signale. Mehrwöchige Workflows, die zu automatisierten Agentenläufen verdichtet werden, sind der Use Case, auf den Google optimiert – und das Antigravity-Harness ist die Infrastrukturschicht, die das ermöglicht. Wenn du noch nicht mit Multi-Agent-Orchestrierungsmustern vertraut bist, ist jetzt ein guter Zeitpunkt, aufzuschließen.

Eine Sache würde ich genau beobachten: Google sagt, 3.5 Flash koste weniger als die Hälfte anderer Frontier-Modelle für vergleichbare Aufgaben. Diese Aussage hängt stark von deiner konkreten Workload ab – wenn sie sich in der Praxis bestätigt, verändert sie die Wirtschaftlichkeit agentischer Systeme im großen Maßstab. Das Modell 3.5 Pro, das nächsten Monat erwartet wird, wird der spannendere Vergleichspunkt für Teams mit besonders anspruchsvollem Reasoning sein.

Fazit

Gemini 3.5 Flash zeigt, dass Google an beiden Enden der Leistung-Geschwindigkeit-Kurve konkurrieren will – nicht nur im Flaggschiff-Segment. Gemini 3.1 Pro auf agentischen Benchmarks zu übertreffen und dabei Flash-Tempo zu liefern, ist ein bedeutender Schritt. Die Enterprise-Einsätze bei Shopify, Macquarie und Salesforce deuten darauf hin, dass das Modell auch außerhalb kontrollierter Benchmarks überzeugt.

Im größeren Bild setzt Google stark auf agentische Infrastruktur: Antigravity, Gemini Spark und 3.5 Flash weisen alle in dieselbe Richtung. Ob diese Wette aufgeht, hängt davon ab, wie 3.5 Pro beim Start nächsten Monat abschneidet – und wie sich das Antigravity-Harness in echten Entwickler-Workflows gegen konkurrierende Multi-Agent-Frameworks behauptet.

Wenn du dich schnell in agentische KI-Konzepte und das Bauen mit solchen Modellen einarbeiten willst, schau dir den AI Agent Fundamentals Skill Track auf DataCamp an.

Author

Matt Crabtree

Themen

Künstliche Intelligenz

KI-Agenten

Top-DataCamp-Kurse

Lernpfad

KI-Agent-Grundlagen

6 Std.

Entdecke, wie KI-Agenten deine Arbeitsweise verändern und Mehrwert für dein Unternehmen schaffen können!

Details anzeigen

Kurs starten

Kurs

Einführung in KI im Beruf

2 Std.

87.4K

Du lernst die Grundlagen von KI kennen und wie du sie verantwortungsbewusst nutzt, um smarter und produktiver zu arbeiten.

Details anzeigen

Kurs starten

Kurs

Praxisnahe KI mit Google Gemini und NotebookLM

2 Std.

7.4K

Lerne Gemini und NotebookLM, um Aufgaben zu automatisieren, produktiver zu sein und im KI-Ökosystem von Google smarter zu arbeiten.

Details anzeigen

Kurs starten

Verwandt

Blog

Die 36 wichtigsten Fragen und Antworten zum Thema generative KI für 2026

Dieser Blog hat eine ganze Reihe von Fragen und Antworten zu generativer KI, von den Grundlagen bis hin zu fortgeschrittenen Themen.

Hesam Sheikh Hassani

15 Min.

Blog

Arten von KI-Agenten: Ihre Rollen, Strukturen und Anwendungen verstehen

Lerne die wichtigsten Arten von KI-Agenten kennen, wie sie mit ihrer Umgebung interagieren und wie sie in verschiedenen Branchen eingesetzt werden. Verstehe einfache reflexive, modellbasierte, zielbasierte, nutzenbasierte, lernende Agenten und mehr.

Blog

Ein kompletter Leitfaden zu den Gehältern von Business-Analysten im Jahr 2026

Finde raus, wie viel du als Business Analyst verdienen kannst und wie du dein jetziges Gehalt aufbessern kannst.

Matt Crabtree

14 Min.

Blog

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

Bist du gerade auf der Suche nach einem Job, der Snowflake nutzt? Bereite dich mit diesen 20 besten Snowflake-Interview-Fragen vor, damit du den Job bekommst!

Nisha Arya Ahmed

15 Min.

Mehr anzeigen Mehr anzeigen

Was ist neu bei Gemini 3.5 Flash

Hintergrund zu Gemini 3.5

Wichtigste Features von Gemini 3.5

Benchmark-Leistung

Agentische Architektur und Antigravity

Reale Enterprise-Einsätze

Gemini Spark und Verfügbarkeit für Endnutzer

Sicherheit und Schutzmechanismen

Gemini 3.5 für Data- und KI-Praktiker

Fazit

Die 36 wichtigsten Fragen und Antworten zum Thema generative KI für 2026

Arten von KI-Agenten: Ihre Rollen, Strukturen und Anwendungen verstehen

Ein kompletter Leitfaden zu den Gehältern von Business-Analysten im Jahr 2026

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}KI-Agent-Grundlagen

Einführung in KI im Beruf

Praxisnahe KI mit Google Gemini und NotebookLM

Die 36 wichtigsten Fragen und Antworten zum Thema generative KI für 2026

Arten von KI-Agenten: Ihre Rollen, Strukturen und Anwendungen verstehen

Ein kompletter Leitfaden zu den Gehältern von Business-Analysten im Jahr 2026

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

KI-Agent-Grundlagen