Direkt zum Inhalt

Das Agent2Agent-Protokoll (A2A) von Google: Ein Leitfaden mit Beispielen

Lerne Googles Agent2Agent (A2A) kennen, ein offenes Protokoll für die Zusammenarbeit von KI-Agenten über verschiedene Systeme hinweg.
Aktualisierte 6. Mai 2025  · 5 Min. Lesezeit

KI-Agenten verändern die Art und Weise, wie Aufgaben automatisiert werden, Entscheidungen getroffen werden und Softwaresysteme zusammenarbeiten. Da Unternehmen aber immer mehr autonome Agenten entwickeln, wird die Notwendigkeit einer standardisierten Kommunikation zwischen verschiedenen Anbietern und Frameworks immer wichtiger. An dieser Stelle kommt Agent2Agent (A2A) ins Spiel.

A2A ist ein offenes, herstellerneutrales Protokoll, das von Google entwickelt wurde, um die Zusammenarbeit zwischen KI-Agenten über verschiedene Systeme hinweg zu standardisieren.

In diesem Tutorial erkläre ich dir, wie A2A funktioniert, welche Designprinzipien es hat, wie es reale Multi-Agenten-Workflows in verschiedenen Domänen unterstützen kann und worin der Unterschied zu MCP besteht.

Was ist Agent 2 Agent (A2A)?

Agent2Agent (A2A) ist ein offenes Protokoll, das die Interoperabilität zwischen undurchsichtigen (Blackbox-)Agenten ermöglicht. Sie ermöglicht es KI-Agenten,..:

  • Einander entdecken
  • Strukturierte Aufgaben austauschen
  • Antworten streamen
  • Führen von Gesprächen mit mehreren Personen
  • Arbeite mit verschiedenen Modalitäten wie Text, Bildern, Video und Daten.

Lass mich versuchen, die Hauptidee von A2A zu erklären, indem ich dich durch das folgende Diagramm führe:

agent2agent (a2a)

Quelle: Google

Auf dem Bild sind zwei Agenten zu sehen: ein Google-Agent (in blau) und ein weiterer Agent (in grün), der wahrscheinlich von einem Drittanbieter stammt. Beide Agenten versuchen, zwei Arten von Dokumenten oder Aufgaben zu bearbeiten. Der grüne Agent ist in beiden Fällen erfolgreich, was durch die grünen Häkchen angezeigt wird, während der Google-Agent in einem Fall erfolgreich ist und im anderen Fall scheitert.

Diese Diskrepanz verdeutlicht die Notwendigkeit von Verhandlungen und Informationsaustausch, die zentrale Bestandteile des A2A-Protokolls sind.

Agent2Agent Gestaltungsprinzipien

A2A wurde um fünf Kernprinzipien herum entwickelt, um Aufgaben für Endnutzer/innen zu erledigen, ohne Speicher, Gedanken oder Werkzeuge zu teilen. Zu diesen fünf Prinzipien gehören:

  • Mach dir die Fähigkeiten von Agenten zu eigen: Agenten arbeiten zusammen, ohne Speicher, Werkzeuge oder Ausführungspläne zu teilen.
  • Basierend auf offenen Standards: A2A verwendet HTTP, JSON-RPC und SSE, um eine einfache Interoperabilität mit bestehenden Technologie-Stacks zu gewährleisten.
  • Standardmäßig sicher: Sie folgt dem OpenAPI-Authentifizierungsverfahren und bietet Sicherheit auf Unternehmensniveau.
  • Unterstützt lang andauernde Aufgaben: A2A wurde entwickelt, um Hintergrundaufgaben, menschliche Genehmigungen und Streaming-Updates zu erledigen.
  • Modality agnostic: Es verarbeitet Bilder, Audio, PDFs, HTML, JSON und andere strukturierte/unstrukturierte Formate.

Diese Designprinzipien machen A2A zum Rückgrat skalierbarer, unternehmenstauglicher Multi-Agenten-Ökosysteme.

Wie funktioniert A2A?

In diesem Abschnitt werden wir in das Innenleben des Agent2Agent-Protokolls eintauchen und die Architektur und den Lebenszyklus der Agenten-Kommunikation verstehen. Wir werden die wichtigsten beteiligten Akteure, die Transport- und Authentifizierungsschicht und die Erkennung über Agentenkarten untersuchen.

Akteure und Protokolle

Das A2A-Protokoll definiert drei Hauptakteure:

  • Benutzer: Der Endbenutzer, der eine Aufgabe initiiert.
  • Client-Agent: Der Anforderer, der eine Aufgabe im Namen des Nutzers formuliert und versendet.
  • Remote Agent: Der Empfänger-Agent, der die Aufgabe ausführt und die Ergebnisse zurückschickt.

Um auf unser obiges Beispiel zurückzukommen: Der blaue Agent ist der Client-Agent und der grüne Agent ist der Remote-Agent.

Agentenkarten und Entdeckung

Agenten veröffentlichen ihre Metadaten und Fähigkeiten über ein standardisiertes JSON-Dokument, die sogenannte Agentenkarte, die in der Regel auf /.well-known/agent.json gehostet wird. Diese Karte enthält:

  • Name, Version und Hosting-URL
  • Beschreibung und Dienstanbieter
  • Unterstützte Ein- und Ausgabemodalitäten und Inhaltstypen
  • Authentifizierungsmethoden 
  • Liste der Agentenfähigkeiten mit Tags und Beispielen

Die Suche kann über DNS, Registries, Marktplätze oder private Kataloge erfolgen.

Zentrale Kommunikationsobjekte

Das Herzstück der A2A-Kommunikation ist das Task, d. h. ein strukturiertes Objekt, das eine atomare Arbeitseinheit darstellt. Aufgaben haben Lebenszyklusstatus wie "eingereicht", "in Arbeit", "Eingabe erforderlich" oder "abgeschlossen".

Jedes Task enthält:

  • Nachrichten: Diese werden für die Konversation zwischen dem Client und dem Remote Agent verwendet
  • Artefakte: Diese sind für unveränderliche Ergebnisse, die vom entfernten Agenten erstellt werden.
  • Teile: In sich geschlossene Datenblöcke in Nachrichten oder Artefakten wie Klartext, Dateiblobs oder JSON.

A2A Workflow Beispiel

Lass uns anhand eines Beispiel-Workflows verstehen, wie A2A funktioniert:

  1. Der Benutzer initiiert eine Aufgabe: Der Nutzer sendet eine Anfrage an einen Client Agent, z.B. "Planen Sie den Austausch eines Laptops".
  2. Der Client Agent entdeckt einen Remote Agent: Der Client-Agent sucht andere fähige Agenten mithilfe einer Agentenkarte, die unter einer öffentlichen oder privaten URL gehostet wird. Diese JSON-Datei enthält Fähigkeiten, unterstützte Modalitäten, Authentifizierung und die Service-URL.
  3. Der Client Agent sendet eine Task: Der Client-Agent sendet eine task/send -Anfrage an den ausgewählten Remote-Agenten, indem er JSON-RPC 2.0 über HTTP verwendet. Der Payload enthält:
    • A Aufgaben-ID
    • Eine Sitzungs-ID (optional)
    • Eine Nachricht mit einem oder mehreren Teilen (z. B. Text, Datei, JSON)
  4. Der Remote Agent antwortet: Der entfernte Agent bearbeitet die Aufgabe und antwortet mit:
    • Unmittelbare Ergebnisse (über Artefakt)
    • Zwischennachrichten (über Nachricht)
    • Oder fordert mehr Informationen an (Status auf Eingabe erforderlich setzen)
  5. Streaming und Push-Updates (wenn asynchron): Wenn die Aufgabe lange läuft, kann der Remote Agent Teilergebnisse mit Hilfe von Server-Sent Events (SSE)zurückschicken . Wenn der Kunde die Verbindung trennt, können Push-Benachrichtigungen an einen sicheren Webhook gesendet werden, der vom Kunden bereitgestellt wird.
  6. Zustandsübergänge von Aufgaben: Die Aufgabe durchläuft folgende Zustände: eingereicht → in Arbeit → eingabepflichtig → abgeschlossen. Der Agent kann zu jedem Zeitpunkt Aktualisierungen oder neue Artefakte für den Kunden herausgeben.
  7. Artefakte und Botschaften: Während Nachrichten zur Kommunikation oder Klärung dienen (z.B. "Bitte laden Sie Ihre Belege hoch."), werden Artefakte für die Präsentation der endgültigen Ergebnisse wie PDF-Berichte, Analysezusammenfassungen, JSON-Listen usw. verwendet.
  8. Der Client Agent nimmt die Aufgabe wieder auf oder schließt sie ab: Wenn Eingaben erforderlich sind, sammelt der Client-Agent diese vom Nutzer ein und sendet eine Folgeanfrage an task/send. Sobald die Aufgabe abgeschlossen ist, kann der Client alle Artefakte mit task/get abrufen.

A2A Beispiel: Lösung von IT-Helpdesk-Tickets

Stell dir ein unternehmensweites IT-Helpdesksystem vor, das KI-Agenten einsetzt, um Support-Tickets selbstständig zu verwalten und zu lösen. In diesem Fall erhält ein User Agent eine Anfrage wie:

“My laptop isn’t turning on after the last software update.”

Der User Agent orchestriert dann einen Lösungsworkflow, indem er mit mehreren Remote Agents über A2A zusammenarbeitet.

A2A Beispiel

So interagieren die Agenten im obigen Szenario über A2A:

  • Der Client Agent sendet eine Aufgabe an den Hardware-Diagnose-Agenten und bittet um eine Geräteprüfung.
  • Wenn die Hardware in Ordnung ist, wird der Software-Rollback-Agent eingeschaltet, der die neuesten Updates prüft.
  • Wenn das Rollback fehlschlägt, wird der Device Replacement Agent eingeschaltet, um einen Hardwaretausch zu initiieren.

Jeder Agent arbeitet unabhängig, stellt eine Agentenkarte mit seinen Fähigkeiten zur Verfügung und kommuniziert asynchron über strukturierte Tasks. Die Agenten können:

  • Streamen von Protokollen oder Diagnosen als Artefakte
  • Den Fluss anhalten, wenn Benutzereingaben erforderlich sind
  • Sende Push-Updates, wenn sie ihren Teil erledigt haben

Dies ist ein reiner A2A Anwendungsfall, denn:

  • Es sind keine strukturierten Tools wie APIs oder OCR-Engines beteiligt
  • Die gesamte Koordination findet zwischen undurchsichtigen, zusammenarbeitenden Agenten statt
  • Agenten handeln wie Gleichgestellte mit individueller Entscheidungslogik und nativer Modalitätsbehandlung

A2A vs MCP: Wann wird was verwendet?

A2A und MCP lösen unterschiedliche, aber komplementäre Herausforderungen in agentenbasierten Systemen. Während sich A2A darauf konzentriert, dass Agenten als autonome Peers zusammenarbeiten können, ist das Model Context Protocol (MCP) ist darauf ausgerichtet, Agenten mit strukturierten Tools und externen Ressourcen zu verbinden.

Warum brauchen wir sowohl A2A als auch MCP?

Protokolle schaffen Standards für die Interoperabilität. In der Welt der Agenten sind zwei Arten der Interoperabilität entscheidend:

  • Interoperabilität der Werkzeuge (MCP): Agenten, die strukturierte Funktionen, APIs oder Tools aufrufen.
  • Agenten-Interoperabilität (A2A): Agenten, die in natürlicher Sprache oder gemischten Modalitäten zusammenarbeiten.

Beispiel: Arbeitsablauf bei der Darlehensgenehmigung

Stell dir ein Multi-Agenten-System vor, das die Kreditvergabe für ein Finanzinstitut automatisiert.

A2A und MCP Arbeitsablauf

Hier siehst du, wie A2A und MCP in diesem Szenario zusammenarbeiten:

Schritt 1: Vorverarbeitung der Anwendung über Tools und APIs (MCP)

Ein LoanProcessor Agent erhält einen Kreditantrag von einem Nutzer. Sie nutzt MCP, um:

  • Ruf eine Kreditscore-API auf
  • Ruft dann den Verlauf der Banktransaktionen aus einer sicheren Datenquelle ab
  • Validiert schließlich hochgeladene Dokumente mit einer OCR

Schritt 2: Multi-Agenten-Koordination für die endgültige Entscheidungsfindung (A2A)

Basierend auf den strukturierten Daten aus Schritt 1 verwendet der Agent A2A, um:

  • Arbeite mit RiskAssessmentAgent zusammen, um das Risiko des Kreditnehmers zu bewerten
  • Er konsultiert dann eine ComplianceAgent, um sicherzustellen, dass der Kredit den rechtlichen und regulatorischen Anforderungen entspricht.
  • Wenn sie genehmigt ist, wird sie an DisbursementAgent weitergeleitet, um den Geldtransfer zu planen.

Fazit

Agent2Agent (A2A) ist das fehlende Glied in groß angelegten Multiagentensystemen. Mit klaren Agentengrenzen, strukturierter aufgabenbasierter Kommunikation und eingebauter Unterstützung für Streaming und Push ermöglicht es modulare, auffindbare und skalierbare Agenten-Ökosysteme.

A2A wurde für die realen Bedürfnisse von Unternehmen entwickelt und ist sicher, asynchron, modalitätsflexibel und anbieterunabhängig. Egal, ob du Googles ADK, LangGraph, CrewAI oder dein Framework verwendest, A2A hilft deinen Agenten, mit Agenten zu sprechen.

Um mehr über KI-Agenten zu erfahren, empfehle ich diese Blogs:


Aashi Dutt's photo
Author
Aashi Dutt
LinkedIn
Twitter

Ich bin ein Google Developers Expert in ML (Gen AI), ein Kaggle 3x Expert und ein Women Techmakers Ambassador mit mehr als 3 Jahren Erfahrung im Tech-Bereich. Ich habe 2020 ein Startup im Bereich Gesundheitstechnologie mitbegründet und mache einen Master in Informatik an der Georgia Tech, der sich auf maschinelles Lernen spezialisiert.

Themen

Lerne KI mit diesen Kursen!

Lernpfad

KI-Grundlagen für Unternehmen

0 Min.
Beschleunige deinen Einstieg in die KI, meistere ChatGPT und entwickle eine umfassende KI-Strategie.
Siehe DetailsRight Arrow
Kurs starten
Mehr anzeigenRight Arrow
Verwandt

Der Blog

Arten von KI-Agenten: Ihre Rollen, Strukturen und Anwendungen verstehen

Lerne die wichtigsten Arten von KI-Agenten kennen, wie sie mit ihrer Umgebung interagieren und wie sie in verschiedenen Branchen eingesetzt werden. Verstehe einfache reflexive, modellbasierte, zielbasierte, nutzenbasierte, lernende Agenten und mehr.
Vinod Chugani's photo

Vinod Chugani

14 Min.

Der Blog

Top 30 Generative KI Interview Fragen und Antworten für 2024

Dieser Blog bietet eine umfassende Sammlung von Fragen und Antworten zu generativen KI-Interviews, die von grundlegenden Konzepten bis hin zu fortgeschrittenen Themen reichen.
Hesam Sheikh Hassani's photo

Hesam Sheikh Hassani

15 Min.

Der Blog

Die 50 besten AWS-Interview-Fragen und Antworten für 2025

Ein kompletter Leitfaden zur Erkundung der grundlegenden, mittleren und fortgeschrittenen AWS-Interviewfragen, zusammen mit Fragen, die auf realen Situationen basieren.
Zoumana Keita 's photo

Zoumana Keita

15 Min.

Der Blog

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

Bist du gerade auf der Suche nach einem Job, der Snowflake nutzt? Bereite dich mit diesen 20 besten Snowflake-Interview-Fragen vor, damit du den Job bekommst!
Nisha Arya Ahmed's photo

Nisha Arya Ahmed

15 Min.

Der Blog

Lehrer/innen und Schüler/innen erhalten das Premium DataCamp kostenlos für ihre gesamte akademische Laufbahn

Keine Hacks, keine Tricks. Schüler/innen und Lehrer/innen, lest weiter, um zu erfahren, wie ihr die Datenerziehung, die euch zusteht, kostenlos bekommen könnt.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

4 Min.

Der Blog

Q2 2023 DataCamp Donates Digest

DataCamp Donates hat im zweiten Quartal 2023 über 20.000 Stipendien an unsere gemeinnützigen Partner vergeben. Erfahre, wie fleißige benachteiligte Lernende diese Chancen in lebensverändernde berufliche Erfolge verwandelt haben.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

Mehr anzeigenMehr anzeigen