Ir al contenido principal

Google I/O 2026: el inicio de la era agentic de Gemini

De Gemini 3.5 Flash y Gemini Omni a Antigravity 2.0 y Gemini Spark, esto es lo más importante del keynote de Google I/O 2026 centrado en agentes.
Actualizado 20 may 2026  · 12 min leer

El hilo conductor de casi todos los anuncios del primer día de la conferencia Google I/O 2026 fue el mismo: los agentes. No chatbots ni asistentes, sino agentes persistentes, capaces de ejecutar tareas en segundo plano e integrarse en toda la pila de productos de Google. El CEO Sundar Pichai lo definió explícitamente como la "era agentic de Gemini", y los anuncios estuvieron a la altura.

Google también respondió a las suscripciones Claude Max de Anthropic y ChatGPT Pro de OpenAI presentando en el I/O un nuevo plan Google AI Ultra, que iguala el precio de 100 $ al mes y limita el acceso a algunas de las funciones agentic que verás a continuación.

En este artículo te cuento los anuncios que más importan a practicantes de IA y desarrolladores. Me centro en actualizaciones disponibles ya o que llegarán en breve.

Gemini 3.5 Flash

Gemini 3.5 Flash es el gran lanzamiento de modelos del I/O 2026. Supera a Gemini 3.1 Pro en benchmarks de agentes y de código, y Google afirma que genera tokens de salida 4 veces más rápido que otros modelos de frontera. Aún no podemos confirmarlo, pero desde luego es una afirmación ambiciosa.

En cuanto a benchmarks, la mejora se nota, especialmente en MCP Atlas, CharXiV Reasoning y Finance Agent v2, donde Gemini 3.5 Flash lidera. En conjunto, 3.5 Flash parece competir con Claude Opus 4.7 y GPT-5.5.

Benchmark

3.5 Flash

3 Flash

3.1 Pro

Claude Sonnet 4.6

Opus 4.7

GPT-5.5

Terminal-bench 2.1

76.2%

58.0%

70.3%

--

66.1%

78.2%

SWE-Bench Pro

55.1%

49.6%

54.2%

--

64.3%

58.6%

MCP Atlas

83.6%

62.0%

78.2%

69.5%

79.1%

75.3%

OSWorld

78.4%

65.1%

76.2%

72.5%

78.0%

78.7%

Finance Agent v2

57.9%

42.6%

43.0%

51.0%

51.5%

51.8%

CharXiv Reasoning

84.2%

80.3%

83.3%

72.4%

82.1%

84.1%

Humanity's Last Exam

40.2%

33.7%

44.4%

33.2%

46.9%

41.4%

ARC-AGI-2

72.1%

33.6%

77.1%

58.3%

75.8%

84.6%

El factor coste aquí es relevante. Google asegura que las empresas que procesan alrededor de un billón de tokens al día podrían ahorrar más de 1.000 millones de dólares al año si trasladan el 80% de sus cargas de trabajo desde otros modelos de frontera a 3.5 Flash. Es un mensaje directo a los clientes enterprise de OpenAI y Anthropic. Gemini 3.5 Flash está disponible hoy en la API de Gemini, Google AI Studio y la app de Gemini. Gemini 3.5 Pro ya se usa internamente y se espera para el mes que viene.

Para más detalle, te recomendamos leer nuestro artículo sobre Gemini 3.5 Flash, donde profundizamos en el nuevo modelo.

Gemini Omni

Gemini Omni es el nuevo modelo generativo de medios nativamente multimodal de Google, capaz de recibir como entrada cualquier combinación de texto, imágenes, audio y vídeo y producir salida en vídeo. El primer modelo de la familia, Gemini Omni Flash, está disponible hoy en la app de Gemini, Google Flow y YouTube Shorts.

La clave arquitectónica es que Omni unifica lo que antes era una pila dividida (Veo para vídeo, Imagen para imágenes y sistemas de audio por separado) en un único modelo. Esto implica ediciones más coherentes y menos artefactos de pipeline al trabajar entre modalidades. Google no ha publicado benchmarks numéricos de Omni con el lanzamiento, así que falta evaluación independiente. El acceso por API para desarrolladores y clientes enterprise llegará en las semanas posteriores al I/O.

Lo hemos probado y lo contamos en detalle en nuestro artículo sobre Gemini Omni. Los primeros resultados de generación de vídeo han sido irregulares (al menos con el listón tan alto que han puesto herramientas como Seedance 2.0), pero se espera que pronto llegue un Gemini Omni Pro más potente.

Antigravity 2.0

Antigravity es la plataforma de desarrollo de Google centrada en agentes, y la versión 2.0 presentada en el I/O supone una ampliación importante. Antes se posicionaba como un entorno de programación; ahora es una plataforma completa para desarrollar, desplegar y gestionar cohortes de agentes de IA autónomos. La pieza central es una nueva aplicación de escritorio independiente que actúa como hub de orquestación de agentes, permitiéndote ejecutar varios agentes en paralelo en tareas distintas de forma simultánea.

El ecosistema ahora ofrece cuatro superficies diferenciadas para desarrolladores:

  • App de escritorio Antigravity 2.0: orquesta múltiples agentes en paralelo y admite tareas programadas en segundo plano. Se integra con Google AI Studio, Android y Firebase.
  • Antigravity CLI: una interfaz nativa de terminal para crear y ejecutar agentes sin GUI. Google pide a los usuarios de Gemini CLI que migren aquí.
  • Antigravity SDK: acceso programático al mismo arnés de agentes que impulsa los productos de Google, con soporte para comportamientos personalizados alojados en tu propia infraestructura.
  • Antigravity en Gemini Enterprise Agent Platform: conecta Antigravity directamente con proyectos de Google Cloud para cargas de trabajo enterprise.

También hay un par de novedades muy útiles para el agente principal. La más importante: ahora puede generar subagentes modulares al vuelo, cada uno ejecutándose en paralelo con aislamiento de espacio de trabajo y heredando la configuración de herramientas y permisos del agente padre. Las operaciones de larga duración se ejecutan de forma asíncrona, por lo que ya no bloquean el bucle del agente.

De forma similar a Claude Code Hooks, los JSON Hooks permiten adjuntar scripts de shell personalizados en fases clave de la ejecución (antes/después de llamadas a herramientas o al modelo, o en condiciones de parada) para registro, personalización de argumentos o inyección de instrucciones. Las tareas programadas te permiten fijar prompts tipo cron para ejecuciones periódicas del agente, como resúmenes diarios de PR o comprobaciones horarias de despliegue, con resultados que aparecen en la barra lateral para un traspaso fluido con intervención humana.

En la parte de gestión, Antigravity introduce los "proyectos" como unidad organizativa que delimita ajustes, recursos y permisos por grupo de agentes, en lugar de exigir permisos globales amplios para todo. El panel lateral renovado permite agrupar conversaciones por proyecto, estado o recencia, con soporte nativo de Git worktree integrado. Este diseño por proyectos es comparable a la gestión multi-ventana de Cursor y a la cola de tareas de Codex, pero con un control de permisos por proyecto más estricto.

Es muy sencillo crear worktrees nativos de Git al iniciar una conversación nueva.

Entrada por voz mediante los modelos de audio de Gemini y nuevos comandos de barra (/goal para ejecuciones autónomas, /grill-me para aclaraciones previas a la tarea, /schedule para prompts cron, /browser para activar el navegador bajo demanda) completan la experiencia.

Antigravity 2.0 está disponible para usuarios desde hoy. El plan Google AI Ultra (100 $/mes) incluye un límite de uso 5 veces mayor en Antigravity frente al plan Google AI Pro.

Managed Agents en la API de Gemini

Junto con Antigravity 2.0, Google presentó Managed Agents en la API de Gemini, que lleva las capacidades agentic directamente a la capa de API para desarrolladores que quieran crear aplicaciones impulsadas por agentes sin gestionar ellos mismos la infraestructura de orquestación. Es el complemento a nivel de API de la experiencia de escritorio de Antigravity.

La implicación práctica para desarrolladores es que ahora puedes definir comportamientos de agente, integraciones de herramientas y flujos de trabajo multi‑paso a través de la API de Gemini y dejar que la infraestructura de Google se encargue de la ejecución. Esto puede cambiar las reglas del juego para equipos que construyen aplicaciones en producción que necesitan ejecutar tareas de largo recorrido sin montar y mantener su propio arnés de agentes. Se accede a través de Google AI Studio, y los clientes enterprise pueden usarlo mediante la Gemini Enterprise Agent Platform.

Un matiz honesto: los primeros comentarios de desarrolladores en la cobertura del I/O señalan que aún falta documentación para flujos de agente complejos y gestión de errores. Los límites de tasa y la gestión de cuotas también se han señalado como fricciones. Probablemente ambos problemas se reduzcan con el tiempo, pero conviene saberlo antes de comprometerte con esta pila.

Gemini Spark

Gemini Spark (que no debe confundirse con el LLM más reciente de Meta, Muse Spark) es el nuevo agente personal de IA de Google y es el más orientado al consumidor de los anuncios agentic. Funciona 24/7 en máquinas virtuales dedicadas en Google Cloud, lo que significa que no necesita que tengas el portátil abierto para seguir trabajando. Spark está impulsado por Gemini 3.5 y el arnés de Antigravity, lo que le permite manejar tareas de largo recorrido en segundo plano.

El conjunto de funciones de lanzamiento incluye:

  • Integración con las herramientas propias de Google (Workspace, Gmail, Calendar) desde el inicio, con soporte para herramientas de terceros vía MCP en las semanas siguientes.
  • Interacción a través de la app de Gemini y, próximamente, por email y chat.
  • Operación directamente en Chrome como una capa de navegación agentic, disponible a finales de este verano.
  • Progreso de tareas en tiempo real visible mediante Android Halo, un nuevo espacio de interfaz en Android, para finales de año.

Merece la pena compararlo con el ecosistema de agentes de OpenAI y las capacidades de uso de herramientas de Anthropic. El diferenciador de Spark es la ejecución persistente 24/7 sobre la infraestructura de Google Cloud, combinada con una integración profunda en la suite de productividad de Google. Si ya trabajas en Google Workspace, es una ventaja importante. Si no es así, la propuesta de valor es menos obvia.

La privacidad es la preocupación legítima aquí. Un agente que monitoriza continuamente tu bandeja de entrada, calendario y documentos plantea preguntas reales sobre residencia de datos y cumplimiento en sectores regulados. Una de las preguntas que me hacía, por ejemplo, era: "¿Qué pasa con la memoria del agente cuando una persona deja la organización?" Google aún no ha dado respuestas detalladas.

Spark se está desplegando a testers de confianza esta semana, con una Beta para suscriptores de Google AI Ultra (100 $/mes) en EE. UU. la semana siguiente. Lo cubrimos con más detalle en nuestro artículo sobre Gemini Spark.

Managed Agents vs Gemini Spark

Agentes de búsqueda y modo IA

El modo IA en Search se presentó en el último I/O. Un año después, ha superado los mil millones de usuarios activos mensuales. Ahora Google va más allá con dos capacidades agentic nuevas.

La primera son los agentes de información en Search: agentes personales en segundo plano que configuras para monitorizar temas y mostrar la información relevante en el momento oportuno. Se lanzan este verano, empezando por suscriptores de Google AI Pro y Ultra.

La segunda es la UI generativa en Search, impulsada por Gemini 3.5 Flash y Antigravity. Search ahora construirá diseños a medida, visuales interactivos e incluso paneles persistentes o mini‑apps para consultas complejas y de largo recorrido. Las capacidades de UI generativa llegarán gratis para todos los usuarios este verano. Las funciones de panel persistente y apps personalizadas estarán disponibles primero para suscriptores Pro y Ultra en EE. UU.

Esto es un problema real para editores y profesionales de SEO (como ya lo fueron AI Overview y el modo IA). Cuando las respuestas generadas por IA resuelven por completo la consulta de una persona directamente en Search, no hay motivo para hacer clic en el sitio de origen. Ya lo hemos visto: tanto AI Overviews como el primer despliegue del modo IA provocaron caídas de tráfico significativas en todo el sector. Google sigue sin proponer una forma clara de compartir ingresos o garantizar tráfico a los editores cuyo contenido alimenta esas respuestas.

Google Flow

Google Flow, que debutó en el I/O 2025 como herramienta de cine con IA, ha dado un gran salto con tres actualizaciones clave:

  • Agente de planificación más inteligente. El agente de Flow actualizado ahora puede planificar y razonar a través de proyectos creativos de varios pasos. Le das tus entradas (por ejemplo, un concepto, imágenes de referencia, un guion preliminar) y te ayuda a pasar de la lluvia de ideas inicial a la creación y edición, todo en un mismo entorno. El nuevo agente está disponible para todo el mundo desde hoy.
  • Vídeo nativo con Gemini Omni. Flow ahora gestiona la generación y edición de vídeo de forma nativa mediante el modelo Omni. Puedes describir en lenguaje natural los cambios a un clip de tu carrete y iterar conversacionalmente. También ha mejorado la coherencia de personajes, de modo que identidad y voz se conservan entre escenas. Esto es especialmente útil si produces un corto o una campaña publicitaria con personajes recurrentes.
  • Vibe coding para herramientas a medida. En lugar de limitarte a las herramientas que trae Flow, ahora puedes crear las tuyas directamente en la plataforma. Google mostró ejemplos como diseñar efectos de vídeo personalizados, crear herramientas de animación a mano y construir flujos de capas de texto, sin salir de Flow.

En conjunto, estas novedades posicionan a Flow como algo más que un asistente creativo. Se está convirtiendo en una plataforma para construir flujos de trabajo creativos, con app móvil en beta en Android y próximamente en iOS.

Ampliación de SynthID

SynthID, el sistema invisible de marcas de agua para IA de Google, ha marcado ya más de 100.000 millones de imágenes y vídeos y el equivalente a 60.000 años de audio desde su lanzamiento hace tres años. Lo más relevante del anuncio del I/O no es la escala, sino los socios: OpenAI, Kakao y Eleven Labs adoptan SynthID junto a Nvidia, que se sumó el año pasado.

La adopción transversal es lo que lo hace significativo. Un estándar de marcado solo funciona si está lo bastante extendido como para que "sin marca de agua" sea una señal útil. Google también amplía la verificación de Content Credentials (el estándar C2PA) a Search y Chrome, que mostrará si el contenido se originó con IA o con una cámara y si se editó con herramientas generativas. La combinación de SynthID y C2PA aporta dos capas independientes de procedencia, el enfoque adecuado dado lo fácil que es eliminar cualquiera de ellas por separado.

Menciones destacadas

Otros anuncios del I/O que merecen mención rápida:

  • Docs Live: una función de voz primero para Google Docs que te permite soltar ideas hablando y que Gemini las estructure en un documento. Llega a suscriptores este verano, con capacidades de voz también en Gmail y Keep al mismo tiempo.
  • Google Pics: nueva herramienta de creación y edición de imágenes con IA basada en el modelo Nano Banana, que trata cada elemento como un objeto individual y no como una imagen plana. Disponible ya para testers de confianza; llegará a suscriptores de Google AI Pro y Ultra a finales de verano.
  • Android Halo: nuevo espacio de interfaz en Android para ver actualizaciones en vivo y el progreso de tareas de agentes como Gemini Spark. Para finales de este año.
  • Daily Brief: un agente listo para usar en la app de Gemini que compila un resumen matinal personalizado a partir de tu bandeja de entrada, calendario y tareas, con próximos pasos sugeridos. Sin precio aparte; se espera que forme parte de la experiencia de la app de Gemini.
  • TPU 8t y 8i: la octava generación de TPUs de Google adopta un enfoque de doble chip: 8t optimizado para preentrenamiento a gran escala (casi 3× el cómputo bruto de la generación anterior, escalable a más de 1 millón de TPUs en todo el mundo) y 8i optimizado para inferencia. Ambos duplican aproximadamente el rendimiento por vatio respecto a la generación previa.
  • Gemini for Science: un conjunto de herramientas de IA que conecta Antigravity con más de 30 grandes bases de datos de ciencias de la vida. Science Skills está disponible hoy en GitHub y directamente en Antigravity.

Reflexiones finales

Google I/O 2026 ha apostado por los agentes como la dirección principal de la IA, con Gemini 3.5 Flash y Antigravity 2.0 como la infraestructura bajo casi todo lo anunciado. Lo que ya puedes usar ahora mismo es Gemini 3.5 Flash (vía la API de Gemini y AI Studio), el nuevo agente de Flow, Gemini Omni Flash y la app de escritorio Antigravity 2.0. Gemini Spark, los agentes de Search y las funciones de UI generativa en Search se desplegarán durante el verano, en su mayoría tras el nuevo plan AI Ultra de 100 $/mes (al menos inicialmente).

Para mí, la mejora de Antigravity fue lo más interesante, porque opera en dos niveles a la vez: como app independiente para desarrolladores, compite directamente con Codex y Claude Code; como plataforma, su ADK subyacente y la API de Managed Agents desafían a marcos de orquestación como LangChain, AutoGen y el Agents SDK de OpenAI. La integración con Gemini y la capa de despliegue en Google Cloud son los diferenciadores (y el riesgo de lock‑in) en ambos frentes.

Preguntas frecuentes sobre Google I/O 2026

¿Cómo se compara Gemini 3.5 Flash con GPT-5.5 y Claude Opus 4.7?

Gemini 3.5 Flash lidera en varios benchmarks agentic como MCP Atlas (83,6%) y Finance Agent v2 (57,9%), mientras que GPT-5.5 se impone en SWE-Bench Pro y ARC-AGI-2. Claude Opus 4.7 sigue siendo el más fuerte en Humanity's Last Exam (46,9%). La conclusión es que compite con los modelos de frontera, a la vez que funciona más rápido y es sensiblemente más barato a escala, como su propio nombre sugiere. Se espera que pronto llegue una variante Pro más potente.

¿En qué se diferencia Google Antigravity de Claude Code o Codex?

Google Antigravity 2.0 es una plataforma de desarrollo centrada en agentes que te permite orquestar múltiples agentes de IA en paralelo a través de una app de escritorio, CLI, SDK y una API enterprise. A diferencia de Claude Code (un agente de programación nativo de terminal) o Codex (un sistema basado en cola de tareas), Antigravity ofrece un control de permisos más fino por proyecto, creación de subagentes y una integración directa con Google Cloud y Firebase. Su doble papel como herramienta para desarrolladores y como SDK de plataforma lo hace más comparable a un framework de orquestación que a un simple asistente de código.

¿Merece la pena el plan Google AI Ultra de 100 $/mes frente a ChatGPT Pro o Claude Max?

Los tres planes cuestan 100 $ al mes, pero el valor depende de tu ecosistema. Lo diferencial de Google AI Ultra es el acceso a Gemini Spark (un agente persistente 24/7), límites de uso 5× mayores en Antigravity e integración profunda con Google Workspace. Si tu flujo de trabajo ya vive en Gmail, Docs y Calendar, Ultra tiene ventaja natural. Si lo que más necesitas es ayuda para programar o flexibilidad a nivel de API, ChatGPT Pro o Claude Max pueden encajarte mejor.

¿Qué es Gemini Omni y cómo gestiona la generación de vídeo?

Gemini Omni es el modelo nativamente multimodal de Google que acepta cualquier combinación de texto, imágenes, audio y vídeo como entrada y produce salida en vídeo. Unifica sistemas antes separados (Veo para vídeo, Imagen para imágenes) en un único modelo, lo que debería dar como resultado ediciones intermodales más coherentes. La primera versión, Omni Flash, ya está disponible, y pronto se espera un Omni Pro más capaz. Aún no hay benchmarks independientes publicados, así que la calidad en uso real está en evaluación.


Tom Farnschläder's photo
Author
Tom Farnschläder
LinkedIn

Editor de ciencia de datos en DataCamp | Me encanta hacer previsiones y crear con API.

Temas

Conoce el ecosistema de IA de Google

programa

Google Workspace with Gemini

4 h
You learn about the key features of Gemini and how they can be used to improve productivity and efficiency in Google Workspace.
Ver detallesRight Arrow
Iniciar curso
Ver másRight Arrow
Relacionado

blog

Todo lo que sabemos sobre GPT-5

Descubre cómo GPT-5 evolucionará hasta convertirse en un sistema unificado con funciones avanzadas, cuyo lanzamiento está previsto para el verano de 2025, basándose en la última hoja de ruta de OpenAI y en la historia de GPT.
Josep Ferrer's photo

Josep Ferrer

8 min

blog

Cómo aprender IA desde cero en 2026: Guía completa de los expertos

Descubre todo lo que necesitas saber sobre el aprendizaje de la IA en 2026, desde consejos para empezar, recursos útiles e información de expertos del sector.
Adel Nehme's photo

Adel Nehme

15 min

blog

10 de los mejores plugins de ChatGPT para sacar el máximo partido a la IA en 2023

Libera todo el potencial de ChatGPT con nuestra guía de expertos sobre los 10 mejores plugins para 2023. Mejora la productividad, agiliza los flujos de trabajo y descubre nueva funcionalidad para elevar tu experiencia ChatGPT.
Matt Crabtree's photo

Matt Crabtree

12 min

blog

Los 7 mejores generadores de vídeo con IA para 2026 con vídeos de ejemplo

Descubre los mejores generadores de vídeo con IA disponibles en la actualidad, entre los que se incluyen RunwayML, Synthesia, Colossyan, Pictory, DeepBrain AI, Invideo y los muy esperados Sora y Veo de DeepMind.
Dr Ana Rojo-Echeburúa's photo

Dr Ana Rojo-Echeburúa

9 min

An AI juggles tasks

blog

Cinco proyectos que puedes crear con modelos de IA generativa (con ejemplos)

Aprende a utilizar modelos de IA generativa para crear un editor de imágenes, un chatbot similar a ChatGPT con pocos recursos y una aplicación clasificadora de aprobación de préstamos y a automatizar interacciones PDF y un asistente de voz con GPT.
Abid Ali Awan's photo

Abid Ali Awan

10 min

Tutorial

Cómo ajustar GPT 3.5: Liberar todo el potencial de la IA

Explore GPT-3.5 Turbo y descubra el potencial transformador del ajuste fino. Aprenda a personalizar este modelo de lenguaje avanzado para aplicaciones especializadas, mejore su rendimiento y comprenda los costes asociados, la seguridad y las consideraciones de privacidad.
Moez Ali's photo

Moez Ali

Ver másVer más