Lernpfad
Google hat am 19. Mai auf der I/O 2026 Gemini 3.5 Flash angekündigt – ein Modell, das Gemini 3.1 Pro auf agentischen und Coding-Benchmarks übertrifft und dabei viermal schneller läuft als andere Spitzenmodelle derselben Klasse.
Die Veröffentlichung kommt zu einem Zeitpunkt, an dem sich der Wettbewerb in der KI-Branche klar auf agentische Leistung verlagert hat. Coding-Agents, mehrstufige Workflow-Automatisierung und die Ausführung langfristiger Aufgaben sind zum Hauptschauplatz geworden – und Google positioniert 3.5 Flash als Antwort auf genau diesen Moment.
Für alle Arten von Fachleuten – einschließlich Data Scientists, ML-Engineers und Entwicklerinnen und Entwickler – ist das relevant, weil 3.5 Flash jetzt (oder in Kürze) das Standardmodell in der Gemini-App und im AI Mode in der Suche ist und heute über die Gemini API bereitsteht. In diesem Artikel erkläre ich, was angekündigt wurde, was heraussticht, die Benchmark-Zahlen und was das für deine Arbeit bedeutet.
Was ist neu bei Gemini 3.5 Flash
Die zentrale Aussage zu Gemini 3.5 Flash ist Tempo kombiniert mit Leistung auf Spitzen-Niveau. Google sagt, 3.5 Flash sei viermal schneller bei Ausgabetokens pro Sekunde als andere Frontier-Modelle – und übertrifft Gemini 3.1 Pro auf den Benchmarks, die für agentische Arbeit am wichtigsten sind.
Auf Terminal-Bench 2.1 erreicht es 76,2%. Auf GDPval-AA kommt es auf 1.656 Elo. Auf MCP Atlas liegt es bei 83,6%. Für multimodales Verständnis erzielt es 84,2% auf CharXiv Reasoning.
Kurz gesagt: Diese Zahlen zeigen, dass die alte Regel „schnell, günstig oder smart – such dir zwei aus“ in der KI weniger zutrifft. Wir bekommen ein schlankes Modell, das komplexe, mehrstufige Agent-Workflows ohne massive Latenz bewältigt.
Google sagt, das Modell ist ab heute allgemein verfügbar – in Google AI Studio, über die Gemini API, in Android Studio, auf der Gemini Enterprise Agent Platform und in Gemini Enterprise. Außerdem ist es weltweit das neue Standardmodell in der Gemini-App und im AI Mode in der Suche.
Google kündigte zudem an, dass Gemini 3.5 Pro in Entwicklung ist, intern bereits genutzt wird und voraussichtlich nächsten Monat ausgerollt wird. Der Release von 3.5 Flash ist der erste Schritt einer neuen Modellfamilie, die auf agentische Ausführung ausgerichtet ist.
Hintergrund zu Gemini 3.5
Die Gemini-3-Reihe hat Googles aktuelle Position im Rennen der Frontier-Modelle gefestigt. Gemini 3.1 Pro, im Februar 2026 veröffentlicht, führte zum Start den Artificial Analysis Intelligence Index an und erzielte 77,1% auf ARC-AGI-2 – mehr als doppelt so viel wie Gemini 3 Pro mit 31,1% auf demselben Benchmark.
Wie wir in unserem Vergleich GPT-5.5 vs. Gemini 3.1 Pro beschrieben haben, lag die Stärke von Gemini 3.1 Pro bei komplexem visuellen Schlussfolgern und multimodalen Aufgaben.
Die Bezeichnung Flash in der Gemini-Familie stand stets für geschwindigkeitsoptimierte Modelle. Neu an 3.5 Flash ist, dass Google Intelligenz auf Frontier-Niveau bei Flash-Tempo beansprucht – ohne Qualitätskompromiss. Der Artificial Analysis Index verortet 3.5 Flash (laut Google) im oberen rechten Quadranten, also hohe Intelligenz und hohe Ausgabegeschwindigkeit zugleich.
Das Antigravity-Harness, Googles Framework für die Orchestrierung kollaborativer Subagenten, ist zentral für die Positionierung von 3.5 Flash. Es ist nicht nur ein Standalone-Modell, sondern eine Komponente in einer Multi-Agent-Architektur, die Google parallel zum Modell aufgebaut hat.
Wichtigste Features von Gemini 3.5
Hier ist die spannendste Essenz der Ankündigung.
Benchmark-Leistung
Googles Benchmark-Aussagen zu 3.5 Flash sind konkret und lohnen den direkten Blick. Das Modell übertrifft Gemini 3.1 Pro bei Folgendem:
- Terminal-Bench 2.1: 76,2% (Gemini 3.1 Pro wurde auf Terminal-Bench 2.0 mit 68,5% gemessen, siehe unsere frühere Berichterstattung)
- GDPval-AA: 1.656 Elo (Claude Opus 4.7 führte diesen Benchmark zum Launch mit 1.753 Elo an, siehe unsere Review Claude Opus 4.7 vs. Gemini 3.1 Pro)
- MCP Atlas: 83,6% (Gemini 3.1 Pro erzielte in unseren früheren Tests 73,9% auf MCP Atlas)
- CharXiv Reasoning: 84,2% für multimodales Verständnis
Bemerkenswert ist auch die Geschwindigkeitsaussage: viermal schneller bei Ausgabetokens pro Sekunde als andere Frontier-Modelle. Google nennt in den Research Notes nicht, gegen welche Modelle verglichen wurde – dieser Wert ist daher eher richtungsweisend als ein präziser Direktvergleich.
Agentische Architektur und Antigravity
3.5 Flash ist für die Zusammenarbeit mit dem Antigravity-Harness ausgelegt, Googles Framework für kollaborativ arbeitende Subagenten. Mit Antigravity kann das Modell mehrere Subagenten parallel einsetzen, mehrstufige Workflows ausführen und die Leistung über lange Aufgabenhorizonte hinweg aufrechterhalten.
Googles Beispiele umfassen die Synthese des AlphaZero-Papers und das Coden eines voll spielbaren Games in sechs Stunden mit zwei Agenten sowie die Umstellung eines Legacy-Codebases auf Next.js. Das sind keine Spielereien, sondern spiegeln die mehrtägigen Entwickleraufgaben wider, die agentische Systeme zunehmend übernehmen sollen.
Reale Enterprise-Einsätze
Mehrere Unternehmen betreiben 3.5 Flash bereits produktiv oder im Pilotbetrieb. Die konkreten Use Cases sind aufschlussreich, weil sie zeigen, wo die agentischen Stärken des Modells eingesetzt werden:
- Shopify: Paralleler Einsatz von Subagenten zur Analyse komplexer Daten über lange Zeiträume für Wachstumsprognosen von Händlerinnen und Händlern
- Macquarie Bank: Pilotiert das Kunden-Onboarding, indem über 100-seitige Dokumente mit geringer Latenz ausgewertet werden
- Salesforce: Integration in Agentforce für unternehmensweite Aufgabenautomatisierung mit mehreren Subagenten und Multi-Turn-Toolaufrufen
- Xero: Einsatz von Agenten zur Steuerung mehrwöchiger Workflows, einschließlich der Vorbereitung von 1099-Steuerformularen für kleine Unternehmen
- Databricks: Nutzung agentischer Workflows, um Echtzeitinformationen zu überwachen, Probleme zu diagnostizieren und Lösungen über große Datensätze hinweg vorzuschlagen
- Ramp: Verbesserung der OCR-Genauigkeit bei komplexen Rechnungen durch multimodales Verständnis in Kombination mit dem Schlussfolgern über historische Muster
Gemini Spark und Verfügbarkeit für Endnutzer
3.5 Flash treibt auch Gemini Spark an, Googles neuen persönlichen KI-Agenten, der rund um die Uhr läuft und im Namen der Nutzerinnen und Nutzer handelt. Google rollt Spark derzeit an vertrauenswürdige Tester aus, eine Beta ist für die Woche nach der I/O-Ankündigung für Google AI Ultra-Abonnentinnen und -Abonnenten in den USA geplant.
Das Modell ist ab heute für Milliarden von Nutzerinnen und Nutzern weltweit über die Gemini-App und den AI Mode in der Suche verfügbar – eine der breitesten gleichzeitigen Consumer- und Entwickler-Einführungen, die Google für ein Gemini-Modell umgesetzt hat.
Sicherheit und Schutzmechanismen
Google sagt, 3.5 Flash wurde unter dem Frontier Safety Framework entwickelt – mit verstärkten Cyber- und CBRN-Schutzmechanismen. Das Unternehmen nutzt Interpretierbarkeits-Tools, die die internen Schlussfolgerungen des Modells vor der Antwort prüfen, um sowohl schädliche Ausgaben als auch falsche Ablehnungen bei unkritischen Anfragen zu reduzieren.
Gemini 3.5 für Data- und KI-Praktiker
Die unmittelbarste praktische Folge: 3.5 Flash ist über die Gemini API in Google AI Studio sehr zeitnah verfügbar. Wenn du agentische Pipelines baust, macht die Kombination aus dem MCP-Atlas-Score (83,6%) und dem Antigravity-Multi-Agent-Harness einen Vergleich mit deinem aktuellen Stack lohnend.
Der GDPval-AA-Score von 1.656 Elo liegt hinter den 1.753 Elo von Claude Opus 4.7 aus unserem früheren Review, aber der Geschwindigkeitsvorteil von 3.5 Flash kann je nach Latenzanforderungen stärker ins Gewicht fallen.
Für Teams mit langfristigen Workflows sind die Einsätze bei Xero und Shopify die aussagekräftigsten Signale. Mehrwöchige Workflows, die zu automatisierten Agentenläufen verdichtet werden, sind der Use Case, auf den Google optimiert – und das Antigravity-Harness ist die Infrastrukturschicht, die das ermöglicht. Wenn du noch nicht mit Multi-Agent-Orchestrierungsmustern vertraut bist, ist jetzt ein guter Zeitpunkt, aufzuschließen.
Eine Sache würde ich genau beobachten: Google sagt, 3.5 Flash koste weniger als die Hälfte anderer Frontier-Modelle für vergleichbare Aufgaben. Diese Aussage hängt stark von deiner konkreten Workload ab – wenn sie sich in der Praxis bestätigt, verändert sie die Wirtschaftlichkeit agentischer Systeme im großen Maßstab. Das Modell 3.5 Pro, das nächsten Monat erwartet wird, wird der spannendere Vergleichspunkt für Teams mit besonders anspruchsvollem Reasoning sein.
Fazit
Gemini 3.5 Flash zeigt, dass Google an beiden Enden der Leistung-Geschwindigkeit-Kurve konkurrieren will – nicht nur im Flaggschiff-Segment. Gemini 3.1 Pro auf agentischen Benchmarks zu übertreffen und dabei Flash-Tempo zu liefern, ist ein bedeutender Schritt. Die Enterprise-Einsätze bei Shopify, Macquarie und Salesforce deuten darauf hin, dass das Modell auch außerhalb kontrollierter Benchmarks überzeugt.
Im größeren Bild setzt Google stark auf agentische Infrastruktur: Antigravity, Gemini Spark und 3.5 Flash weisen alle in dieselbe Richtung. Ob diese Wette aufgeht, hängt davon ab, wie 3.5 Pro beim Start nächsten Monat abschneidet – und wie sich das Antigravity-Harness in echten Entwickler-Workflows gegen konkurrierende Multi-Agent-Frameworks behauptet.
Wenn du dich schnell in agentische KI-Konzepte und das Bauen mit solchen Modellen einarbeiten willst, schau dir den AI Agent Fundamentals Skill Track auf DataCamp an.

Autorin und Redakteurin im Bereich der Bildungstechnologie. Engagiert bei der Erforschung von Datentrends und begeistert davon, Data Science zu lernen.