Lernpfad
KI-Agenten verändern die Art und Weise, wie Aufgaben automatisiert werden, Entscheidungen getroffen werden und Softwaresysteme zusammenarbeiten. Da Unternehmen aber immer mehr autonome Agenten entwickeln, wird die Notwendigkeit einer standardisierten Kommunikation zwischen verschiedenen Anbietern und Frameworks immer wichtiger. An dieser Stelle kommt Agent2Agent (A2A) ins Spiel.
A2A ist ein offenes, herstellerneutrales Protokoll, das von Google entwickelt wurde, um die Zusammenarbeit zwischen KI-Agenten über verschiedene Systeme hinweg zu standardisieren.
In diesem Tutorial erkläre ich dir, wie A2A funktioniert, welche Designprinzipien es hat, wie es reale Multi-Agenten-Workflows in verschiedenen Domänen unterstützen kann und worin der Unterschied zu MCP besteht.
Was ist Agent 2 Agent (A2A)?
Agent2Agent (A2A) ist ein offenes Protokoll, das die Interoperabilität zwischen undurchsichtigen (Blackbox-)Agenten ermöglicht. Sie ermöglicht es KI-Agenten,..:
- Einander entdecken
- Strukturierte Aufgaben austauschen
- Antworten streamen
- Führen von Gesprächen mit mehreren Personen
- Arbeite mit verschiedenen Modalitäten wie Text, Bildern, Video und Daten.
Lass mich versuchen, die Hauptidee von A2A zu erklären, indem ich dich durch das folgende Diagramm führe:
Quelle: Google
Auf dem Bild sind zwei Agenten zu sehen: ein Google-Agent (in blau) und ein weiterer Agent (in grün), der wahrscheinlich von einem Drittanbieter stammt. Beide Agenten versuchen, zwei Arten von Dokumenten oder Aufgaben zu bearbeiten. Der grüne Agent ist in beiden Fällen erfolgreich, was durch die grünen Häkchen angezeigt wird, während der Google-Agent in einem Fall erfolgreich ist und im anderen Fall scheitert.
Diese Diskrepanz verdeutlicht die Notwendigkeit von Verhandlungen und Informationsaustausch, die zentrale Bestandteile des A2A-Protokolls sind.
Agent2Agent Gestaltungsprinzipien
A2A wurde um fünf Kernprinzipien herum entwickelt, um Aufgaben für Endnutzer/innen zu erledigen, ohne Speicher, Gedanken oder Werkzeuge zu teilen. Zu diesen fünf Prinzipien gehören:
- Mach dir die Fähigkeiten von Agenten zu eigen: Agenten arbeiten zusammen, ohne Speicher, Werkzeuge oder Ausführungspläne zu teilen.
- Basierend auf offenen Standards: A2A verwendet HTTP, JSON-RPC und SSE, um eine einfache Interoperabilität mit bestehenden Technologie-Stacks zu gewährleisten.
- Standardmäßig sicher: Sie folgt dem OpenAPI-Authentifizierungsverfahren und bietet Sicherheit auf Unternehmensniveau.
- Unterstützt lang andauernde Aufgaben: A2A wurde entwickelt, um Hintergrundaufgaben, menschliche Genehmigungen und Streaming-Updates zu erledigen.
- Modality agnostic: Es verarbeitet Bilder, Audio, PDFs, HTML, JSON und andere strukturierte/unstrukturierte Formate.
Diese Designprinzipien machen A2A zum Rückgrat skalierbarer, unternehmenstauglicher Multi-Agenten-Ökosysteme.
Wie funktioniert A2A?
In diesem Abschnitt werden wir in das Innenleben des Agent2Agent-Protokolls eintauchen und die Architektur und den Lebenszyklus der Agenten-Kommunikation verstehen. Wir werden die wichtigsten beteiligten Akteure, die Transport- und Authentifizierungsschicht und die Erkennung über Agentenkarten untersuchen.
Akteure und Protokolle
Das A2A-Protokoll definiert drei Hauptakteure:
- Benutzer: Der Endbenutzer, der eine Aufgabe initiiert.
- Client-Agent: Der Anforderer, der eine Aufgabe im Namen des Nutzers formuliert und versendet.
- Remote Agent: Der Empfänger-Agent, der die Aufgabe ausführt und die Ergebnisse zurückschickt.
Um auf unser obiges Beispiel zurückzukommen: Der blaue Agent ist der Client-Agent und der grüne Agent ist der Remote-Agent.
Agentenkarten und Entdeckung
Agenten veröffentlichen ihre Metadaten und Fähigkeiten über ein standardisiertes JSON-Dokument, die sogenannte Agentenkarte, die in der Regel auf /.well-known/agent.json
gehostet wird. Diese Karte enthält:
- Name, Version und Hosting-URL
- Beschreibung und Dienstanbieter
- Unterstützte Ein- und Ausgabemodalitäten und Inhaltstypen
- Authentifizierungsmethoden
- Liste der Agentenfähigkeiten mit Tags und Beispielen
Die Suche kann über DNS, Registries, Marktplätze oder private Kataloge erfolgen.
Zentrale Kommunikationsobjekte
Das Herzstück der A2A-Kommunikation ist das Task
, d. h. ein strukturiertes Objekt, das eine atomare Arbeitseinheit darstellt. Aufgaben haben Lebenszyklusstatus wie "eingereicht", "in Arbeit", "Eingabe erforderlich" oder "abgeschlossen".
Jedes Task
enthält:
- Nachrichten: Diese werden für die Konversation zwischen dem Client und dem Remote Agent verwendet
- Artefakte: Diese sind für unveränderliche Ergebnisse, die vom entfernten Agenten erstellt werden.
- Teile: In sich geschlossene Datenblöcke in Nachrichten oder Artefakten wie Klartext, Dateiblobs oder JSON.
A2A Workflow Beispiel
Lass uns anhand eines Beispiel-Workflows verstehen, wie A2A funktioniert:
- Der Benutzer initiiert eine Aufgabe: Der Nutzer sendet eine Anfrage an einen Client Agent, z.B. "Planen Sie den Austausch eines Laptops".
- Der Client Agent entdeckt einen Remote Agent: Der Client-Agent sucht andere fähige Agenten mithilfe einer Agentenkarte, die unter einer öffentlichen oder privaten URL gehostet wird. Diese JSON-Datei enthält Fähigkeiten, unterstützte Modalitäten, Authentifizierung und die Service-URL.
- Der Client Agent sendet eine
Task
: Der Client-Agent sendet einetask/send
-Anfrage an den ausgewählten Remote-Agenten, indem er JSON-RPC 2.0 über HTTP verwendet. Der Payload enthält: - A Aufgaben-ID
- Eine Sitzungs-ID (optional)
- Eine Nachricht mit einem oder mehreren Teilen (z. B. Text, Datei, JSON)
- Der Remote Agent antwortet: Der entfernte Agent bearbeitet die Aufgabe und antwortet mit:
- Unmittelbare Ergebnisse (über Artefakt)
- Zwischennachrichten (über Nachricht)
- Oder fordert mehr Informationen an (Status auf Eingabe erforderlich setzen)
- Streaming und Push-Updates (wenn asynchron): Wenn die Aufgabe lange läuft, kann der Remote Agent Teilergebnisse mit Hilfe von Server-Sent Events (SSE)zurückschicken . Wenn der Kunde die Verbindung trennt, können Push-Benachrichtigungen an einen sicheren Webhook gesendet werden, der vom Kunden bereitgestellt wird.
- Zustandsübergänge von Aufgaben: Die Aufgabe durchläuft folgende Zustände: eingereicht → in Arbeit → eingabepflichtig → abgeschlossen. Der Agent kann zu jedem Zeitpunkt Aktualisierungen oder neue Artefakte für den Kunden herausgeben.
- Artefakte und Botschaften: Während Nachrichten zur Kommunikation oder Klärung dienen (z.B. "Bitte laden Sie Ihre Belege hoch."), werden Artefakte für die Präsentation der endgültigen Ergebnisse wie PDF-Berichte, Analysezusammenfassungen, JSON-Listen usw. verwendet.
- Der Client Agent nimmt die Aufgabe wieder auf oder schließt sie ab: Wenn Eingaben erforderlich sind, sammelt der Client-Agent diese vom Nutzer ein und sendet eine Folgeanfrage an
task/send
. Sobald die Aufgabe abgeschlossen ist, kann der Client alle Artefakte mittask/get
abrufen.
A2A Beispiel: Lösung von IT-Helpdesk-Tickets
Stell dir ein unternehmensweites IT-Helpdesksystem vor, das KI-Agenten einsetzt, um Support-Tickets selbstständig zu verwalten und zu lösen. In diesem Fall erhält ein User Agent eine Anfrage wie:
“My laptop isn’t turning on after the last software update.”
Der User Agent orchestriert dann einen Lösungsworkflow, indem er mit mehreren Remote Agents über A2A zusammenarbeitet.
So interagieren die Agenten im obigen Szenario über A2A:
- Der Client Agent sendet eine Aufgabe an den Hardware-Diagnose-Agenten und bittet um eine Geräteprüfung.
- Wenn die Hardware in Ordnung ist, wird der Software-Rollback-Agent eingeschaltet, der die neuesten Updates prüft.
- Wenn das Rollback fehlschlägt, wird der Device Replacement Agent eingeschaltet, um einen Hardwaretausch zu initiieren.
Jeder Agent arbeitet unabhängig, stellt eine Agentenkarte mit seinen Fähigkeiten zur Verfügung und kommuniziert asynchron über strukturierte Tasks. Die Agenten können:
- Streamen von Protokollen oder Diagnosen als Artefakte
- Den Fluss anhalten, wenn Benutzereingaben erforderlich sind
- Sende Push-Updates, wenn sie ihren Teil erledigt haben
Dies ist ein reiner A2A Anwendungsfall, denn:
- Es sind keine strukturierten Tools wie APIs oder OCR-Engines beteiligt
- Die gesamte Koordination findet zwischen undurchsichtigen, zusammenarbeitenden Agenten statt
- Agenten handeln wie Gleichgestellte mit individueller Entscheidungslogik und nativer Modalitätsbehandlung
A2A vs MCP: Wann wird was verwendet?
A2A und MCP lösen unterschiedliche, aber komplementäre Herausforderungen in agentenbasierten Systemen. Während sich A2A darauf konzentriert, dass Agenten als autonome Peers zusammenarbeiten können, ist das Model Context Protocol (MCP) ist darauf ausgerichtet, Agenten mit strukturierten Tools und externen Ressourcen zu verbinden.
Warum brauchen wir sowohl A2A als auch MCP?
Protokolle schaffen Standards für die Interoperabilität. In der Welt der Agenten sind zwei Arten der Interoperabilität entscheidend:
- Interoperabilität der Werkzeuge (MCP): Agenten, die strukturierte Funktionen, APIs oder Tools aufrufen.
- Agenten-Interoperabilität (A2A): Agenten, die in natürlicher Sprache oder gemischten Modalitäten zusammenarbeiten.
Beispiel: Arbeitsablauf bei der Darlehensgenehmigung
Stell dir ein Multi-Agenten-System vor, das die Kreditvergabe für ein Finanzinstitut automatisiert.
Hier siehst du, wie A2A und MCP in diesem Szenario zusammenarbeiten:
Schritt 1: Vorverarbeitung der Anwendung über Tools und APIs (MCP)
Ein LoanProcessor
Agent erhält einen Kreditantrag von einem Nutzer. Sie nutzt MCP, um:
- Ruf eine Kreditscore-API auf
- Ruft dann den Verlauf der Banktransaktionen aus einer sicheren Datenquelle ab
- Validiert schließlich hochgeladene Dokumente mit einer OCR
Schritt 2: Multi-Agenten-Koordination für die endgültige Entscheidungsfindung (A2A)
Basierend auf den strukturierten Daten aus Schritt 1 verwendet der Agent A2A, um:
- Arbeite mit
RiskAssessmentAgent
zusammen, um das Risiko des Kreditnehmers zu bewerten - Er konsultiert dann eine
ComplianceAgent
, um sicherzustellen, dass der Kredit den rechtlichen und regulatorischen Anforderungen entspricht. - Wenn sie genehmigt ist, wird sie an
DisbursementAgent
weitergeleitet, um den Geldtransfer zu planen.
Fazit
Agent2Agent (A2A) ist das fehlende Glied in groß angelegten Multiagentensystemen. Mit klaren Agentengrenzen, strukturierter aufgabenbasierter Kommunikation und eingebauter Unterstützung für Streaming und Push ermöglicht es modulare, auffindbare und skalierbare Agenten-Ökosysteme.
A2A wurde für die realen Bedürfnisse von Unternehmen entwickelt und ist sicher, asynchron, modalitätsflexibel und anbieterunabhängig. Egal, ob du Googles ADK, LangGraph, CrewAI oder dein Framework verwendest, A2A hilft deinen Agenten, mit Agenten zu sprechen.
Um mehr über KI-Agenten zu erfahren, empfehle ich diese Blogs:

Ich bin ein Google Developers Expert in ML (Gen AI), ein Kaggle 3x Expert und ein Women Techmakers Ambassador mit mehr als 3 Jahren Erfahrung im Tech-Bereich. Ich habe 2020 ein Startup im Bereich Gesundheitstechnologie mitbegründet und mache einen Master in Informatik an der Georgia Tech, der sich auf maschinelles Lernen spezialisiert.