Saltar al contenido principal

Protocolo Agente2Agente (A2A) de Google: Una guía con ejemplos

Conoce el Agent2Agent (A2A) de Google, un protocolo abierto para la colaboración de agentes de IA entre distintos sistemas.
Actualizado 6 may 2025  · 5 min de lectura

Los agentes de IA están remodelando la forma en que se automatizan las tareas, se toman las decisiones y colaboran los sistemas de software. Pero a medida que las organizaciones construyen más agentes autónomos, la necesidad de una comunicación estandarizada entre proveedores y marcos de trabajo se hace esencial. Ahí es donde entra Agente2Agente (A2A).

A2A es un protocolo abierto e independiente del proveedor desarrollado por Google para estandarizar la colaboración entre agentes de IA de distintos sistemas.

En este tutorial, te guiaré para que entiendas cómo funciona A2A, sus principios de diseño y cómo puede impulsar flujos de trabajo multiagente en el mundo real a través de dominios, y en qué se diferencia de MCP.

¿Qué es Agente a Agente (A2A)?

Agent2Agent (A2A) es un protocolo abierto que permite la interoperabilidad entre agentes opacos (black-box). Permite a los agentes de IA

  • Descubrirse mutuamente
  • Intercambiar tareas estructuradas
  • Respuestas de la corriente
  • Manejar conversaciones de varios turnos
  • Opera a través de modalidades como texto, imágenes, vídeo y datos.

Permíteme intentar explicarte la idea principal del A2A guiándote por el diagrama que aparece a continuación:

agente2agente (a2a)

Fuente: Google

En la imagen, se representan dos agentes: un Agente de Google (en azul) y otro agente (en verde), probablemente de un servicio de terceros. Ambos agentes intentan procesar dos tipos de documentos o tareas. El agente verde tiene éxito con ambos, como indican las marcas de verificación verdes, mientras que el agente Google tiene éxito con uno y falla con el otro.

Esta discrepancia pone de manifiesto la necesidad de negociación e intercambio de información, componentes centrales del protocolo A2A.

Principios de diseño Agent2Agent

A2A está diseñado en torno a cinco principios básicos para realizar tareas para los usuarios finales sin compartir memoria, pensamientos o herramientas. Estos cinco principios incluyen:

  • Adopta las capacidades agénticas: Los agentes colaboran sin compartir memoria, herramientas ni planes de ejecución.
  • Construido sobre estándares abiertos: A2A utiliza HTTP, JSON-RPC y SSE para garantizar una fácil interoperabilidad con las pilas tecnológicas existentes.
  • Seguro por defecto: Sigue los esquemas de autenticación OpenAPI y proporciona seguridad de nivel empresarial.
  • Admite tareas de larga duración: A2A está diseñado para gestionar tareas en segundo plano, aprobaciones humanas y actualizaciones en tiempo real.
  • Modalidad agnóstica: Maneja imágenes, audio, PDF, HTML, JSON y otros formatos estructurados/no estructurados.

Estos principios de diseño convierten a A2A en la columna vertebral de ecosistemas multiagente escalables y preparados para la empresa.

¿Cómo funciona el A2A?

En esta sección, nos sumergiremos en el funcionamiento interno del protocolo Agente2Agente y comprenderemos la arquitectura y el ciclo de vida de la comunicación entre agentes. Exploraremos los principales actores implicados, las capas de transporte y autenticación, y el descubrimiento mediante Tarjetas de Agente.

Actores y protocolos

El protocolo A2A define tres actores principales:

  • Usuario: El usuario final que inicia una tarea.
  • Agente cliente: El solicitante que formula y envía una tarea en nombre del usuario.
  • Agente remoto: El agente receptor que realiza la tarea y devuelve los resultados.

Volviendo a nuestro ejemplo del diagrama anterior, el agente azul es el agente cliente, y el agente verde es el agente remoto.

Tarjetas de agente y descubrimiento

Los agentes publican sus metadatos y capacidades a través de un documento JSON estandarizado llamado Ficha de Agente, normalmente alojado en /.well-known/agent.json. Esta tarjeta contiene:

  • Nombre, versión y URL de alojamiento
  • Descripción y proveedor de servicios
  • Modalidades de entrada/salida y tipos de contenido admitidos
  • Métodos de autenticación 
  • Lista de habilidades de los agentes con etiquetas y ejemplos

El descubrimiento puede realizarse mediante DNS, registros, mercados o catálogos privados.

Objetos centrales de comunicación

En el corazón de la comunicación A2A está el Task, es decir, un objeto estructurado que representa una unidad atómica de trabajo. Las tareas tienen estados de ciclo de vida como enviada, trabajando, requiere entrada de datos o completada.

Cada Task incluye:

  • Mensajes: Se utilizan para los intercambios conversacionales entre el Cliente y el agente Remoto
  • Artefactos: Son para resultados inmutables creados por el agente remoto.
  • Piezas: Bloques de datos autocontenidos dentro de mensajes o artefactos como texto plano, blobs de archivos o JSON.

Ejemplo de flujo de trabajo A2A

Vamos a entender cómo funciona el A2A a través de un ejemplo de flujo de trabajo:

  1. El usuario inicia una tarea: El usuario envía una solicitud a un Agente Cliente, por ejemplo, "Programar la sustitución de un portátil".
  2. El Agente Cliente descubre un Agente Remoto: El agente cliente busca otros agentes capacitados utilizando una Tarjeta de Agente alojada en una URL pública o privada. Este archivo JSON incluye habilidades, modalidades admitidas, autenticación y URL del servicio.
  3. El Agente Cliente envía un Task: El agente cliente envía una petición task/send al Agente Remoto seleccionado, utilizando JSON-RPC 2.0 sobre HTTP. La carga útil contiene:
    • A ID de tarea
    • Un ID de sesión (opcional)
    • Un Mensaje con una o más Partes (por ejemplo, texto, archivo, JSON)
  4. El Agente Remoto responde: El agente remoto procesa la tarea y responde con:
    • Resultados inmediatos (mediante artefacto)
    • Mensajes intermedios (mediante mensaje)
    • O solicita más información (estableciendo el estado a entrada requerida)
  5. Streaming y actualizaciones push (si son asíncronas): Si la tarea es de larga duración, el agente remoto puede enviar resultados parciales utilizando Eventos Enviados por el Servidor (SSE). Si el cliente se desconecta, las notificaciones push pueden enviarse a un webhook seguro proporcionado por el cliente.
  6. Transiciones de estado de la tarea: La tarea pasa por los siguientes estados: enviada → trabajando → entrada requerida → completada. En cualquier momento, el agente puede emitir actualizaciones o nuevos artefactos para el cliente.
  7. Artefactos y mensajes: Mientras que los Mensajes se utilizan para la comunicación o aclaración (por ejemplo, "Por favor, sube tus recibos"), los Artefactos se utilizan para mostrar los resultados finales, como el PDF del informe, el resumen del análisis, la lista JSON, etc.
  8. El Agente Cliente reanuda o completa la tarea: Si se necesita una entrada, el agente cliente la recoge del usuario y envía un seguimiento task/send. Una vez completada la tarea, el cliente puede recuperar todos los artefactos utilizando task/get.

Ejemplo A2A: Resolución de incidencias del servicio de asistencia informática

Imagina un sistema de asistencia informática empresarial que utilice agentes de IA para gestionar y resolver de forma autónoma los tickets de asistencia. En esta configuración, un agente de usuario recibe una petición como

“My laptop isn’t turning on after the last software update.”

A continuación, el agente de usuario orquesta un flujo de trabajo de resolución colaborando con varios agentes remotos mediante A2A.

Ejemplo de A2A

He aquí cómo interactúan los agentes mediante A2A en el escenario anterior:

  • El Agente Cliente envía una tarea al Agente de Diagnóstico de Hardware, solicitando una comprobación del dispositivo.
  • Si el hardware está bien, pasa al Agente de Retroceso de Software, que evalúa las actualizaciones recientes.
  • Si la reversión falla, se activa el Agente de Sustitución de Dispositivos para iniciar un intercambio de hardware.

Cada agente funciona de forma independiente, expone una Tarjeta de Agente con sus capacidades y se comunica de forma asíncrona mediante Tareas estructuradas. Los agentes pueden:

  • Transmitir registros o diagnósticos como artefactos
  • Pausa el flujo si se necesita la entrada del usuario
  • Envía actualizaciones push cuando completen su parte

Este es un caso de uso A2A puro, porque:

  • No intervienen herramientas estructuradas como API o motores OCR
  • Toda la coordinación se produce entre agentes opacos y colaboradores
  • Los agentes actúan como iguales con lógica de decisión individual y manejo nativo de la modalidad

A2A vs MCP: ¿Cuándo utilizar qué?

A2A y MCP resuelven retos diferentes pero complementarios en los sistemas agénticos. Mientras que el A2A se centra en permitir que los agentes colaboren como iguales autónomos, el protocolo de contexto modelo (MCP) está orientado a conectar a los agentes con herramientas estructuradas y recursos externos.

¿Por qué necesitamos tanto A2A como MCP?

Los protocolos crean normas para la interoperabilidad. En el mundo agéntico, dos tipos de interoperabilidad son cruciales:

  • Interoperabilidad de herramientas (MCP): Agentes que llaman a funciones estructuradas, API o herramientas.
  • Interoperabilidad de agentes (A2A): Agentes que colaboran en lenguaje natural o modalidades mixtas.

Ejemplo: Flujo de trabajo de aprobación de préstamos

Imagina un sistema multiagente que automatiza la aprobación de préstamos para una entidad financiera.

Flujo de trabajo A2A y MCP

Así es como A2A y MCP trabajan juntos en este escenario:

Paso 1: Preprocesar la aplicación mediante herramientas y API (MCP)

Un agente de LoanProcessor recibe una solicitud de préstamo del usuario. Utiliza MCP para:

  • Llamar a una API de puntuación de crédito
  • A continuación, recupera el historial de transacciones bancarias de una fuente de datos segura
  • Por último, valida los documentos cargados mediante un OCR

Paso 2: Coordinación multiagente para la toma de decisiones finales (A2A)

Basándose en los datos estructurados del paso 1, el agente utiliza A2A para:

  • Colabora con un RiskAssessmentAgent para evaluar el riesgo del prestatario
  • A continuación, consulta a un ComplianceAgent para asegurarte de que el préstamo cumple los requisitos legales y reglamentarios
  • Si se aprueba, pasa a un DisbursementAgent para que programe la transferencia de fondos.

Conclusión

Agente2Agente (A2A) es el eslabón perdido en los sistemas multiagente a gran escala. Con unos límites claros para los agentes, una comunicación estructurada basada en tareas y soporte incorporado para streaming y push, permite ecosistemas de agentes modulares, descubribles y escalables.

A2A está diseñado para las necesidades reales de las empresas y es seguro, asíncrono, flexible en cuanto a modalidades y agnóstico en cuanto a proveedores. Tanto si utilizas ADK de Google, LangGraph, CrewAI o tu framework, A2A ayuda a tus agentes a hablar con otros agentes.

Para saber más sobre los agentes de IA, te recomiendo estos blogs:


Aashi Dutt's photo
Author
Aashi Dutt
LinkedIn
Twitter

Soy una Google Developers Expert en ML(Gen AI), una Kaggle 3x Expert y una Women Techmakers Ambassador con más de 3 años de experiencia en tecnología. Cofundé una startup de tecnología sanitaria en 2020 y estoy cursando un máster en informática en Georgia Tech, especializándome en aprendizaje automático.

Temas

Aprende IA con estos cursos

Programa

Fundamentos empresariales de la IA

11 horas hr
Acelera tu viaje hacia la IA, conquista ChatGPT y desarrolla una estrategia global de Inteligencia Artificial.
Ver detallesRight Arrow
Comienza el curso
Ver másRight Arrow
Relacionado
An AI juggles tasks

blog

Cinco proyectos que puedes crear con modelos de IA generativa (con ejemplos)

Aprende a utilizar modelos de IA generativa para crear un editor de imágenes, un chatbot similar a ChatGPT con pocos recursos y una aplicación clasificadora de aprobación de préstamos y a automatizar interacciones PDF y un asistente de voz con GPT.
Abid Ali Awan's photo

Abid Ali Awan

10 min

Tutorial

Tutorial de la API de OpenAI Assistants

Una visión completa de la API Assistants con nuestro artículo, que ofrece una mirada en profundidad a sus características, usos en la industria, guía de configuración y las mejores prácticas para maximizar su potencial en diversas aplicaciones empresariales.
Zoumana Keita 's photo

Zoumana Keita

14 min

Tutorial

Construir agentes LangChain para automatizar tareas en Python

Un tutorial completo sobre la construcción de agentes LangChain multiherramienta para automatizar tareas en Python utilizando LLMs y modelos de chat utilizando OpenAI.
Bex Tuychiev's photo

Bex Tuychiev

14 min

Tutorial

Guía para principiantes de la API de OpenAI: Tutorial práctico y prácticas recomendadas

Este tutorial te presenta la API de OpenAI, sus casos de uso, un enfoque práctico para utilizar la API y todas las prácticas recomendadas que debes seguir.
Arunn Thevapalan's photo

Arunn Thevapalan

13 min

Tutorial

Guía para principiantes sobre la ingeniería de avisos ChatGPT

Descubra cómo conseguir que ChatGPT le proporcione los resultados que desea dándole las entradas que necesita.
Matt Crabtree's photo

Matt Crabtree

6 min

Tutorial

Guía para principiantes sobre el uso de la API ChatGPT

Esta guía te acompanya a través de los fundamentos de la API ChatGPT, demostrando su potencial en el procesamiento del lenguaje natural y la comunicación impulsada por la IA.
Moez Ali's photo

Moez Ali

11 min

Ver másVer más