Weiter zum Inhalt

Google I/O 2026: Der Start der agentischen Gemini-Ära

Von Gemini 3.5 Flash und Gemini Omni bis Antigravity 2.0 und Gemini Spark: Das ist wirklich wichtig aus der agentenfokussierten I/O-2026-Keynote von Google.
Aktualisiert 20. Mai 2026  · 12 Min. lesen

Der rote Faden durch nahezu jede Ankündigung am ersten Tag der Google I/O 2026 war derselbe: Agents. Keine Chatbots, keine Assistenten, sondern persistente, aufgabenorientierte Agents, die im Hintergrund laufen und sich über Googles komplette Produktlandschaft integrieren. CEO Sundar Pichai hat es ausdrücklich als die "agentische Gemini-Ära" bezeichnet, und die Ankündigungen haben diese Einordnung untermauert.

Außerdem reagierte Google auf die Abos Claude Max von Anthropic und ChatGPT Pro von OpenAI mit einem neuen Google AI Ultra-Tarif auf der I/O, der mit 100 $/Monat gleich bepreist ist und den Zugang zu einigen der unten beschriebenen agentischen Funktionen reglementiert.

In diesem Artikel führe ich dich durch die wichtigsten Ankündigungen für KI-Praktiker und Entwickler. Der Fokus liegt auf Updates, die entweder schon verfügbar sind oder in Kürze erwartet werden.

Gemini 3.5 Flash

Gemini 3.5 Flash ist das Modell-Highlight der I/O 2026. Es übertrifft Gemini 3.1 Pro bei agentischen und Coding-Benchmarks, während Google behauptet, es sei bei Ausgabetokens pro Sekunde viermal schneller als andere Spitzenmodelle. Bestätigen können wir das noch nicht, aber die Ansage ist selbstbewusst.

Bei den Benchmarks ist der Leistungsprung sichtbar, besonders bei MCP Atlas, CharXiV Reasoning und Finance Agent v2, die Gemini 3.5 Flash alle anführt. Insgesamt scheint 3.5 Flash auf Augenhöhe mit Claude Opus 4.7 und GPT-5.5 zu liegen.

Benchmark

3.5 Flash

3 Flash

3.1 Pro

Claude Sonnet 4.6

Opus 4.7

GPT-5.5

Terminal-bench 2.1

76,2%

58,0%

70,3%

--

66,1%

78,2%

SWE-Bench Pro

55,1%

49,6%

54,2%

--

64,3%

58,6%

MCP Atlas

83,6%

62,0%

78,2%

69,5%

79,1%

75,3%

OSWorld

78,4%

65,1%

76,2%

72,5%

78,0%

78,7%

Finance Agent v2

57,9%

42,6%

43,0%

51,0%

51,5%

51,8%

CharXiv Reasoning

84,2%

80,3%

83,3%

72,4%

82,1%

84,1%

Humanity's Last Exam

40,2%

33,7%

44,4%

33,2%

46,9%

41,4%

ARC-AGI-2

72,1%

33,6%

77,1%

58,3%

75,8%

84,6%

Bemerkenswert ist hier auch die Kostenseite. Google behauptet, Unternehmen, die rund 1 Billion Tokens pro Tag verarbeiten, könnten jährlich über 1 Milliarde Dollar sparen, wenn sie 80% der Workloads von anderen Spitzenmodellen auf 3.5 Flash verlagern. Das ist ein direkter Angriff auf die Enterprise-Kunden von OpenAI und Anthropic. Gemini 3.5 Flash ist ab heute über die Gemini API, Google AI Studio und die Gemini-App verfügbar. Gemini 3.5 Pro ist bereits intern im Einsatz und wird für den nächsten Monat erwartet.

Für mehr Details lies am besten unseren Artikel zu Gemini 3.5 Flash, in dem wir das neue Modell ausführlicher beleuchten.

Gemini Omni

Gemini Omni ist Googles neues, nativ multimodales generatives Medienmodell, das beliebige Kombinationen aus Text, Bildern, Audio und Video als Eingaben annimmt und Video ausgibt. Das erste Modell der Reihe, Gemini Omni Flash, ist ab heute in der Gemini-App, in Google Flow und in YouTube Shorts verfügbar.

Architektonisch entscheidend ist, dass Omni den zuvor geteilten Stack (Veo für Video, Imagen für Bilder, separate Audiosysteme) in einem einzigen Modell zusammenführt. Das bedeutet konsistentere Bearbeitungen und weniger Pipeline-Artefakte beim Arbeiten über Modalitäten hinweg. Google hat zum Start keine numerischen Benchmarks für Omni veröffentlicht, unabhängige Evaluierungen stehen also noch aus. API-Zugriff für Entwickler und Unternehmenskunden folgt in den Wochen nach der I/O.

Wir haben es getestet und ausführlich in unserem Gemini Omni-Artikel beschrieben. Die ersten Ergebnisse der Videogenerierung waren durchwachsen (zumindest gemessen an den hohen Maßstäben, die Tools wie Seedance 2.0 gesetzt haben), aber ein leistungsstärkeres Gemini Omni Pro soll bald erscheinen.

Antigravity 2.0

Antigravity ist Googles agent-first-Entwicklungsplattform, und das 2.0-Release auf der I/O ist ein großer Ausbau. Zuvor als Coding-Umgebung positioniert, ist es nun eine vollständige Plattform zum Entwickeln, Bereitstellen und Verwalten von Kohorten autonomer KI-Agents. Das Herzstück ist eine neue eigenständige Desktop-App als zentraler Hub für die Orchestrierung, mit der du mehrere Agents parallel auf unterschiedlichen Aufgaben gleichzeitig laufen lassen kannst.

Das Ökosystem bietet nun vier klar getrennte Oberflächen für Entwickler:

  • Antigravity 2.0 Desktop-App: Orchestriert mehrere Agents parallel und unterstützt geplante Hintergrundaufgaben. Integriert mit Google AI Studio, Android und Firebase.
  • Antigravity CLI: Eine terminal-native Oberfläche zum Erstellen und Ausführen von Agents ohne GUI. Google bittet Gemini-CLI-Nutzende, darauf zu migrieren.
  • Antigravity SDK: Programmatischer Zugriff auf das gleiche Agentengerüst, das Googles eigene Produkte antreibt, mit Unterstützung für benutzerdefinierte Agent-Verhalten auf der eigenen Infrastruktur.
  • Antigravity in Gemini Enterprise Agent Platform: Verbindet Antigravity direkt mit Google-Cloud-Projekten für Enterprise-Workloads.

Auch für den Kernagenten gibt es ein paar sehr nützliche Neuerungen. Die größte: Er kann jetzt modulare Subagents dynamisch starten, die jeweils parallel mit Workspace-Isolation laufen und die Tool-Konfigurationen und Berechtigungen des Eltern-Agents erben. Langlaufende Operationen laufen asynchron, blockieren also nicht länger die Agent-Schleife.

Ähnlich wie Claude Code Hooks erlauben JSON Hooks, benutzerdefinierte Shell-Skripte an Schlüsselstellen der Ausführung anzuhängen (vor/nach Tool-Calls, Model-Calls oder bei Stop-Bedingungen) für Logging, Argumentanpassung oder das Injizieren von Instruktionen. Scheduled Tasks lassen dich Cron-basierte Prompts für periodische Agent-Läufe setzen, etwa tägliche PR-Digests oder stündliche Deployment-Checks; die Ergebnisse erscheinen in der Seitenleiste für einen reibungslosen Hand-off an Human-in-the-Loop-Interaktion.

Auf der Management-Seite führt Antigravity "Projects" als organisatorische Grundeinheit ein, die Einstellungen, Ressourcen und Berechtigungen pro Agent-Gruppe scoped, statt überall die weitesten Globalberechtigungen zu verlangen. Das überarbeitete Seitenpanel unterstützt das Gruppieren von Konversationen nach Projekt, Status oder Aktualität, mit nativem Git-Worktree-Support an Bord. Dieses projektbasierte Layout ist vergleichbar mit Cursors Multi-Window-Workspace-Management und Codex' Task-Queue, aber mit engerer Berechtigungsscope pro Projekt.

Native Git-Worktrees lassen sich beim Start einer neuen Unterhaltung leicht anlegen.

Spracheingabe über Gemini-Audio-Modelle und neue Slash-Befehle (/goal für autonome Läufe, /grill-me für Vorab-Klärung, /schedule für Cron-Prompts, /browser für die optionale Browser-Nutzung) runden die UX ab.

Antigravity 2.0 ist ab heute verfügbar. Der Google AI Ultra-Plan (100 $/Monat) bietet in Antigravity ein fünffach höheres Nutzungslimit als der Google AI Pro-Plan.

Managed Agents in der Gemini API

Parallel zu Antigravity 2.0 hat Google Managed Agents in der Gemini API vorgestellt. Damit kommen agentische Fähigkeiten direkt auf die API-Ebene für Entwickler, die agentengestützte Anwendungen bauen wollen, ohne selbst die Orchestrierungsinfrastruktur zu betreiben. Das ist das API-Pendant zur Antigravity-Desktop-Erfahrung.

Praktisch bedeutet das für Entwickler: Du kannst Agent-Verhalten, Tool-Integrationen und mehrstufige Workflows über die Gemini API definieren und die Ausführung von Googles Infrastruktur handhaben lassen. Für Teams, die Produktionsanwendungen mit langlaufenden Aufgaben bauen müssen, ohne ein eigenes Agentengerüst hochzuziehen und zu managen, kann das ein echter Gamechanger sein. Der Zugriff erfolgt über das Google AI Studio, Unternehmenskunden erreichen es über die Gemini Enterprise Agent Platform.

Ein ehrlicher Vorbehalt: Frühes Entwicklerfeedback aus der I/O berichtet, dass die Doku für komplexe Agent-Flows und Fehlerbehandlung noch dünn ist. Auch Rate Limits und Quotenmanagement werden als Reibungspunkte genannt. Beides dürfte mit der Zeit besser werden, ist aber gut zu wissen, bevor du dich auf diesen Stack festlegst.

Gemini Spark

Gemini Spark (nicht zu verwechseln mit Metas jüngstem LLM, Muse Spark) ist Googles neuer persönlicher KI-Agent und die verbrauchernächste der agentischen Ankündigungen. Er läuft 24/7 auf dedizierten virtuellen Maschinen in der Google Cloud, dein Laptop muss also nicht geöffnet sein. Spark wird von Gemini 3.5 und dem Antigravity-Gerüst angetrieben, was ihm ermöglicht, langlaufende Aufgaben im Hintergrund zu erledigen.

Zum Start umfasst der Funktionsumfang:

  • Integration in Googles eigene Tools (Workspace, Gmail, Kalender) zum Launch, Unterstützung für Drittanbieter-Tools via MCP in den folgenden Wochen.
  • Interaktion über die Gemini-App und bald auch per E-Mail und Chat.
  • Betrieb direkt in Chrome als agentische Browser-Schicht, später im Sommer.
  • Live-Task-Fortschritt sichtbar über Android Halo, einen neuen UI-Bereich auf Android, später dieses Jahr.

Der Vergleich mit OpenAIs Agent-Ökosystem und Anthropics Tool-Nutzung liegt nahe. Sparks Unterscheidungsmerkmal ist die 24/7-persistente Ausführung auf Google-Cloud-Infrastruktur, kombiniert mit tiefer Integration in Googles Produktivitätssuite. Wenn deine Arbeit ohnehin in Google Workspace stattfindet, ist das ein echter Pluspunkt. Wenn nicht, ist der Mehrwert weniger eindeutig.

Privatsphäre ist hier das berechtigte Thema. Ein Agent, der ständig Posteingang, Kalender und Dokumente überwacht, wirft ernsthafte Fragen zu Datenstandort und Compliance in regulierten Branchen auf. Eine Frage, die ich mir stellte, war zum Beispiel: "Was passiert mit der Agenten-Memory, wenn Mitarbeitende das Unternehmen verlassen?" Detaillierte Antworten hat Google darauf bisher nicht gegeben.

Spark wird diese Woche an vertrauenswürdige Tester ausgerollt, mit einer Beta für Google AI Ultra-Abonnenten (100 $/Monat) in den USA in der Folgewoche. Wir beleuchten es ausführlicher in unserem Artikel zu Gemini Spark.

Managed Agents vs Gemini Spark

Such-Agents und AI Mode

Der AI Mode in der Suche wurde auf der letzten I/O eingeführt. Ein Jahr später hat er die Marke von einer Milliarde monatlich aktiver Nutzer überschritten. Jetzt geht Google mit zwei neuen agentischen Funktionen den nächsten Schritt.

Erstens Informations-Agents in der Suche: personalisierte Hintergrund-Agents, die du konfigurierst, um Themen zu beobachten und relevante Infos zum richtigen Zeitpunkt einzublenden. Der Rollout startet diesen Sommer, zunächst für Google AI Pro- und Ultra-Abonnenten.

Zweitens eine generative UI in der Suche, angetrieben von Gemini 3.5 Flash und Antigravity. Die Suche baut nun eigene Layouts, interaktive Visuals und sogar persistente Dashboards oder Mini-Apps für komplexe, langlaufende Anfragen. Die generativen UI-Funktionen kommen diesen Sommer kostenlos für alle. Persistente Dashboards und Custom-Apps sind zuerst für Pro- und Ultra-Abonnenten in den USA verfügbar.

Für Publisher und SEO-Profis ist das ein echtes Problem (wie schon bei AI Overview und AI Mode). Wenn KI-generierte Antworten die Nutzeranfrage direkt in der Suche vollständig lösen, gibt es keinen Grund mehr, auf die Quellseite zu klicken. Das haben wir bereits erlebt: Sowohl AI Overviews als auch der erste Rollout des AI Mode führten branchenweit zu deutlichen Trafficrückgängen. Google hat weiterhin keinen klaren Weg geschaffen, Erlöse zu teilen oder Traffic für die Publisher zu garantieren, deren Inhalte diese Antworten speisen.

Google Flow

Google Flow, das auf der I/O 2025 als KI-Filmmaking-Tool debütierte, macht mit drei zentralen Updates einen großen Sprung nach vorn:

  • Klügerer Planungs-Agent. Der aktualisierte Flow-Agent kann nun mehrstufige kreative Projekte planen und nachvollziehbar begründen. Du lieferst deine Inputs (z. B. eine Idee, Referenzbilder, ein Grobdrehbuch) und er begleitet dich vom frühen Brainstorming bis zur Erstellung und zum Schnitt – alles in einer Umgebung. Der neue Agent ist ab heute für alle verfügbar.
  • Native Videoverarbeitung durch Gemini Omni. Flow übernimmt Videogenerierung und -schnitt nun nativ über das Omni-Modell. Du kannst Änderungen an Clips aus deiner Kamerarolle in Alltagssprache beschreiben und im Dialog iterieren. Die Konsistenz von Figuren ist ebenfalls besser, sodass Identität und Stimme über Szenen hinweg erhalten bleiben – besonders hilfreich bei Kurzfilmen oder Kampagnen mit wiederkehrenden Charakteren.
  • Vibe Coding für eigene Tools. Statt auf die vorinstallierten Tools beschränkt zu sein, kannst du jetzt direkt auf der Plattform eigene Tools bauen. Google zeigte Beispiele wie maßgeschneiderte Videoeffekte, handgezeichnete Animationstools und Text-Layer-Workflows – ohne Flow zu verlassen.

Zusammengenommen positionieren diese Updates Flow als mehr als nur einen Kreativassistenten. Es entwickelt sich zu einer Plattform für kreative Workflows, mit einer mobilen App, die jetzt auf Android in Beta ist und bald für iOS kommt.

SynthID-Ausbau

SynthID, Googles unsichtbares KI-Wasserzeichensystem, hat seit dem Start vor drei Jahren über 100 Milliarden Bilder und Videos sowie 60.000 Jahre Audioinhalte markiert. Die wichtigste I/O-Neuigkeit ist hier nicht die Größenordnung, sondern die Partner: OpenAI, Kakao und Eleven Labs übernehmen SynthID neben Nvidia, das bereits letztes Jahr an Bord kam.

Die branchenübergreifende Adoption macht das relevant. Ein Wasserzeichen-Standard funktioniert nur, wenn er so verbreitet ist, dass "nicht markiert" ein aussagekräftiges Signal wird. Google erweitert zudem die Content-Credentials-Verifizierung (den C2PA-Standard) auf Search und Chrome, die Nutzer darüber informieren, ob Inhalte aus KI oder einer Kamera stammen und ob sie mit generativen Tools bearbeitet wurden. Die Kombination aus SynthID und C2PA verleiht der Herkunftssicherung zwei unabhängige Ebenen – der richtige Ansatz, da sich jede für sich genommen relativ leicht entfernen lässt.

Honourable Mentions

Mehrere weitere I/O-Ankündigungen verdienen eine kurze Notiz:

  • Docs Live: Eine neue Voice-first-Funktion für Google Docs, mit der du Ideen frei einsprechen kannst und Gemini sie in ein Dokument strukturiert. Rollout für Abonnenten diesen Sommer, Sprachfunktionen kommen zeitgleich auch zu Gmail und Keep.
  • Google Pics: Ein neues KI-Tool zur Bilderstellung und -bearbeitung auf Basis des Nano Banana-Modells, das jedes Element als eigenes Objekt statt als flaches Bild behandelt. Jetzt für vertrauenswürdige Tester verfügbar, später im Sommer für Google AI Pro- und Ultra-Abonnenten.
  • Android Halo: Ein neuer UI-Bereich auf Android, um Live-Updates und Task-Fortschritt von Agents wie Gemini Spark zu sehen. Später dieses Jahr.
  • Daily Brief: Ein out-of-the-box-Agent in der Gemini-App, der einen personalisierten Morgenüberblick aus Posteingang, Kalender und Aufgaben erstellt – inklusive nächster Schritte. Keine separaten Preise angekündigt; voraussichtlich Teil der Gemini-App-Erfahrung.
  • TPU 8t und 8i: Googles achte TPU-Generation setzt auf ein Dual-Chip-Design, mit 8t für großskaliges Pretraining optimiert (nahezu das 3-Fache der Rechenleistung der Vorgängergeneration, skalierbar auf über 1 Million TPUs weltweit) und 8i für Inferenz optimiert. Beide liefern bis zu doppelt so gute Performance pro Watt wie die Vorgänger.
  • Gemini for Science: Eine Sammlung von KI-Tools, die Antigravity mit über 30 großen Life-Science-Datenbanken verbinden. Science Skills ist ab heute auf GitHub und direkt in Antigravity verfügbar.

Fazit

Die Google I/O 2026 ist eine Wette darauf, dass Agents die primäre Richtung für KI sind – mit Gemini 3.5 Flash und Antigravity 2.0 als Infrastruktur unter fast allem, was sonst angekündigt wurde. Was du sofort nutzen kannst: Gemini 3.5 Flash (über die Gemini API und AI Studio), den neuen Flow-Agent, Gemini Omni Flash und die Antigravity 2.0-Desktop-App. Gemini Spark, Such-Agents und die generativen UI-Funktionen in der Suche rollen über den Sommer aus, meist zunächst hinter dem neuen AI Ultra-Tarif für 100 $/Monat.

Für mich war das Antigravity-Upgrade der spannendste Release, weil es gleichzeitig auf zwei Ebenen spielt: Als eigenständige Entwickler-App konkurriert es direkt mit Codex und Claude Code; als Plattform fordern das zugrunde liegende ADK und die Managed-Agents-API Orchestrierungsframeworks wie LangChain, AutoGen und OpenAIs Agents SDK heraus. Die Gemini-Integration und die Google-Cloud-Bereitstellung sind in beiden Fällen die Differenzierungsmerkmale – und das Lock-in-Risiko.

Google I/O 2026 FAQs

How does Gemini 3.5 Flash compare to GPT-5.5 and Claude Opus 4.7?

Gemini 3.5 Flash führt auf mehreren agentischen Benchmarks wie MCP Atlas (83,6%) und Finance Agent v2 (57,9%), während GPT-5.5 bei SWE-Bench Pro und ARC-AGI-2 knapp vorne liegt. Claude Opus 4.7 bleibt bei Humanity's Last Exam am stärksten (46,9%). Die Quintessenz: Es ist konkurrenzfähig zu den Spitzenmodellen, läuft schneller und deutlich günstiger in großem Maßstab – wie der Name andeutet. Eine leistungsstärkere Pro-Variante wird in Kürze erwartet.

How does Google Antigravity differ from Claude Code or Codex?

Google Antigravity 2.0 ist eine agent-first-Entwicklungsplattform, mit der du mehrere KI-Agents parallel über Desktop-App, CLI, SDK und Enterprise-API orchestrierst. Anders als Claude Code (ein terminal-nativer Coding-Agent) oder Codex (ein Task-Queue-System) bietet Antigravity engere Berechtigungsscopings pro Projekt, das Starten von Subagents und direkte Integration mit Google Cloud und Firebase. Die Doppelfunktion als Entwickler-Tool und Plattform-SDK macht es eher vergleichbar mit einem Orchestrierungsframework als mit einem isolierten Coding-Assistenten.

Is the $100/month Google AI Ultra plan worth it compared to ChatGPT Pro or Claude Max?

Alle drei Pläne kosten 100 $/Monat, aber der Wert hängt vom Ökosystem ab. Der Vorteil von Google AI Ultra ist der Zugang zu Gemini Spark (ein 24/7 persistenter Agent), fünffach höhere Antigravity-Nutzungslimits und die tiefe Integration in Google Workspace. Wenn dein Workflow bereits in Gmail, Docs und Kalender lebt, hat Ultra einen natürlichen Vorsprung. Brauchst du primär Coding-Unterstützung oder API-Flexibilität, könnten ChatGPT Pro oder Claude Max besser passen.

What is Gemini Omni and how does it handle video generation?

Gemini Omni ist Googles nativ multimodales Modell, das beliebige Kombinationen aus Text, Bildern, Audio und Video als Eingabe akzeptiert und Video ausgibt. Es vereinheitlicht zuvor getrennte Systeme (Veo für Video, Imagen für Bilder) in einem Modell, was konsistentere Crossmodal-Bearbeitungen ermöglichen sollte. Die erste Version, Omni Flash, ist jetzt verfügbar; ein leistungsfähigeres Omni Pro wird bald erwartet. Unabhängige Benchmarks wurden noch nicht veröffentlicht, daher wird die Praxisqualität noch evaluiert.


Tom Farnschläder's photo
Author
Tom Farnschläder
LinkedIn

Datenwissenschaftsredakteur bei DataCamp | Prognosen erstellen und mit APIs arbeiten ist genau mein Ding.

Themen

Entdecke Googles KI-Ökosystem

Lernpfad

Google Workspace with Gemini

4 Std.
You learn about the key features of Gemini and how they can be used to improve productivity and efficiency in Google Workspace.
Details anzeigenRight Arrow
Kurs starten
Mehr anzeigenRight Arrow
Verwandt

Blog

Die 36 wichtigsten Fragen und Antworten zum Thema generative KI für 2026

Dieser Blog hat eine ganze Reihe von Fragen und Antworten zu generativer KI, von den Grundlagen bis hin zu fortgeschrittenen Themen.
Hesam Sheikh Hassani's photo

Hesam Sheikh Hassani

15 Min.

Blog

Arten von KI-Agenten: Ihre Rollen, Strukturen und Anwendungen verstehen

Lerne die wichtigsten Arten von KI-Agenten kennen, wie sie mit ihrer Umgebung interagieren und wie sie in verschiedenen Branchen eingesetzt werden. Verstehe einfache reflexive, modellbasierte, zielbasierte, nutzenbasierte, lernende Agenten und mehr.

Blog

Q2 2023 DataCamp Donates Digest

DataCamp Donates hat im zweiten Quartal 2023 über 20.000 Stipendien an unsere gemeinnützigen Partner vergeben. Erfahre, wie fleißige benachteiligte Lernende diese Chancen in lebensverändernde berufliche Erfolge verwandelt haben.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

Blog

Ein kompletter Leitfaden zu den Gehältern von Business-Analysten im Jahr 2026

Finde raus, wie viel du als Business Analyst verdienen kannst und wie du dein jetziges Gehalt aufbessern kannst.
Matt Crabtree's photo

Matt Crabtree

14 Min.

Blog

2022-2023 DataCamp Classrooms Jahresbericht

Zu Beginn des neuen Schuljahres ist DataCamp Classrooms motivierter denn je, das Lernen mit Daten zu demokratisieren. In den letzten 12 Monaten sind über 7.650 neue Klassenzimmer hinzugekommen.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

8 Min.

Mehr anzeigenMehr anzeigen