programa
El hilo conductor de prácticamente todos los anuncios del primer día de Google I/O 2026 fue el mismo: los agentes. No chatbots, no asistentes, sino agentes persistentes que ejecutan tareas, funcionan en segundo plano e integran todo el stack de productos de Google. El CEO Sundar Pichai lo definió explícitamente como la "era agentic de Gemini", y los anuncios reforzaron esa idea.
Google también respondió a las suscripciones Claude Max de Anthropic y ChatGPT Pro de OpenAI con un nuevo plan Google AI Ultra presentado en I/O, al mismo precio de 100 $ al mes, que además restringe el acceso a algunas de las funciones agentic que repasamos más abajo.
En este artículo te guío por los anuncios que más importan a profesionales y desarrolladores de IA. Me centro en las novedades disponibles ya o que llegarán en breve.
Gemini 3.5 Flash
Gemini 3.5 Flash es el lanzamiento estrella de modelos de I/O 2026. Supera a Gemini 3.1 Pro en benchmarks de agentes y de código, y Google afirma que genera hasta 4 veces más tokens por segundo que otros modelos punteros. Aún no podemos confirmarlo, pero es una apuesta fuerte.
En benchmarks, el salto de rendimiento se nota, especialmente en MCP Atlas, CharXiV Reasoning y Finance Agent v2, donde Gemini 3.5 Flash lidera. En conjunto, 3.5 Flash parece competir con Claude Opus 4.7 y GPT-5.5.
|
Benchmark |
3.5 Flash |
3 Flash |
3.1 Pro |
Claude Sonnet 4.6 |
Opus 4.7 |
GPT-5.5 |
|
Terminal-bench 2.1 |
76.2% |
58.0% |
70.3% |
-- |
66.1% |
78.2% |
|
SWE-Bench Pro |
55.1% |
49.6% |
54.2% |
-- |
64.3% |
58.6% |
|
MCP Atlas |
83.6% |
62.0% |
78.2% |
69.5% |
79.1% |
75.3% |
|
OSWorld |
78.4% |
65.1% |
76.2% |
72.5% |
78.0% |
78.7% |
|
Finance Agent v2 |
57.9% |
42.6% |
43.0% |
51.0% |
51.5% |
51.8% |
|
CharXiv Reasoning |
84.2% |
80.3% |
83.3% |
72.4% |
82.1% |
84.1% |
|
Humanity's Last Exam |
40.2% |
33.7% |
44.4% |
33.2% |
46.9% |
41.4% |
|
ARC-AGI-2 |
72.1% |
33.6% |
77.1% |
58.3% |
75.8% |
84.6% |
El ángulo del coste también importa. Google asegura que empresas que procesan en torno a 1 billón de tokens al día podrían ahorrar más de 1.000 millones de dólares al año si trasladan el 80% de las cargas desde otros modelos punteros a 3.5 Flash. Es un mensaje directo para los clientes enterprise de OpenAI y Anthropic. Gemini 3.5 Flash está disponible hoy en la API de Gemini, Google AI Studio y la app de Gemini. Gemini 3.5 Pro ya se usa internamente y se espera para el mes que viene.
Si quieres más detalle, te recomendamos leer nuestro artículo sobre Gemini 3.5 Flash, donde cubrimos el nuevo modelo en profundidad.
Gemini Omni
Gemini Omni es el nuevo modelo de medios generativos nativamente multimodal de Google, capaz de recibir cualquier combinación de texto, imágenes, audio y vídeo como entrada y producir vídeo como salida. El primer modelo de la familia, Gemini Omni Flash, está disponible hoy en la app de Gemini, Google Flow y YouTube Shorts.
La clave arquitectónica es que Omni unifica lo que antes era un stack separado (Veo para vídeo, Imagen para imágenes, y sistemas de audio aparte) en un único modelo. Eso significa ediciones más coherentes y menos artefactos de pipeline al trabajar entre modalidades. Google no ha publicado benchmarks numéricos de Omni junto al lanzamiento, así que falta evaluación independiente. El acceso por API para desarrolladores y clientes enterprise llegará en las semanas posteriores a I/O.
Lo hemos probado y lo contamos al detalle en nuestro artículo sobre Gemini Omni. Los primeros resultados de generación de vídeo fueron irregulares (al menos con el listón que han puesto herramientas como Seedance 2.0), pero se espera un Gemini Omni Pro más potente en breve.
Antigravity 2.0
Antigravity es la plataforma de desarrollo con enfoque en agentes de Google, y la versión 2.0 presentada en I/O es una expansión notable. Antes se posicionaba como un entorno de programación; ahora es una plataforma completa para desarrollar, desplegar y gestionar cohortes de agentes de IA autónomos. La pieza central es una nueva aplicación de escritorio independiente que actúa como centro de orquestación de agentes, permitiéndote ejecutar varios agentes en paralelo en tareas distintas a la vez.
El ecosistema ahora ofrece cuatro superficies diferenciadas para desarrolladores:
- App de escritorio Antigravity 2.0: orquesta múltiples agentes en paralelo y admite tareas programadas en segundo plano. Se integra con Google AI Studio, Android y Firebase.
- Antigravity CLI: interfaz nativa de terminal para crear y ejecutar agentes sin GUI. Google pide a los usuarios de Gemini CLI que migren aquí.
- Antigravity SDK: acceso programático al mismo arnés de agentes que impulsa los productos de Google, con soporte para comportamientos personalizados alojados en tu propia infraestructura.
- Antigravity en Gemini Enterprise Agent Platform: conecta Antigravity directamente con proyectos de Google Cloud para cargas enterprise.
También llegan funciones muy útiles al agente principal. La más importante: ahora puede crear subagentes modulares al vuelo, cada uno ejecutándose en paralelo con aislamiento del espacio de trabajo y heredando las configuraciones de herramientas y permisos del agente padre. Las operaciones de larga duración se ejecutan de forma asíncrona, así que ya no bloquean el bucle del agente.
Similar a Claude Code Hooks, los JSON Hooks permiten adjuntar scripts de shell personalizados en momentos clave de la ejecución (antes/después de llamadas a herramientas o al modelo, o en condiciones de parada) para registro, personalización de argumentos o inyección de instrucciones. Las tareas programadas te dejan definir prompts basados en cron para ejecuciones periódicas, como resúmenes diarios de PR o comprobaciones horarias de despliegues, con resultados visibles en la barra lateral para un traspaso fluido a la interacción humana.
En gestión, Antigravity introduce los "proyectos" como unidad organizativa que delimita ajustes, recursos y permisos por grupo de agentes, en lugar de exigir permisos globales amplios. El panel lateral renovado admite agrupar conversaciones por proyecto, estado o recencia, con soporte nativo de Git worktree integrado. Este diseño por proyectos es comparable a la gestión multiventana de Cursor y a la cola de tareas de Codex, pero con un alcance de permisos por proyecto más ajustado.

Entrada por voz mediante modelos de audio de Gemini y nuevos comandos con barra (/goal para ejecuciones autónomas, /grill-me para aclaraciones previas, /schedule para prompts con cron, /browser para activar el navegador) redondean la experiencia.
Antigravity 2.0 está disponible desde hoy. El plan Google AI Ultra (100 $ al mes) incluye un límite de uso 5 veces mayor en Antigravity que el plan Google AI Pro.
Managed Agents en la API de Gemini
Junto con Antigravity 2.0, Google anunció Managed Agents en la API de Gemini, que lleva las capacidades agentic directamente a la capa de API para desarrolladores que quieran crear aplicaciones potenciadas por agentes sin gestionar ellos mismos la orquestación. Es el complemento a nivel de API de la experiencia de escritorio de Antigravity.
La implicación práctica para desarrolladores es que ahora puedes definir comportamientos de agentes, integraciones de herramientas y flujos de trabajo multi‑paso desde la API de Gemini y delegar la ejecución en la infraestructura de Google. Esto puede ser un cambio de juego para equipos que construyen aplicaciones en producción que requieren ejecución de tareas de largo recorrido sin levantar y mantener su propio arnés de agentes. El acceso está disponible vía Google AI Studio, y los clientes enterprise pueden usarlo a través de Gemini Enterprise Agent Platform.
Un aviso honesto: los primeros comentarios de desarrolladores durante I/O señalan que la documentación para flujos complejos de agentes y gestión de errores aún es escasa. Los límites de tasa y la gestión de cuotas también se marcan como fricciones. Probablemente ambos puntos mejoren con el tiempo, pero conviene saberlo antes de comprometerte con este stack.
Gemini Spark
Gemini Spark (que no debe confundirse con el LLM más reciente de Meta, Muse Spark) es el nuevo agente personal de IA de Google y es el anuncio agentic más orientado al consumidor. Funciona 24/7 en máquinas virtuales dedicadas en Google Cloud, por lo que no necesita que tu portátil esté abierto para seguir trabajando. Spark está impulsado por Gemini 3.5 y el arnés de Antigravity, lo que le permite gestionar tareas de largo recorrido en segundo plano.
Las funciones de lanzamiento incluyen:
- Integración con las herramientas de Google (Workspace, Gmail, Calendar) desde el primer día, con soporte de terceros vía MCP en las semanas siguientes.
- Interacción a través de la app de Gemini, y pronto también por email y chat.
- Operación directamente en Chrome como una capa de navegador agentic, prevista para finales de verano.
- Progreso en vivo de tareas visible en Android Halo, un nuevo espacio de UI en Android, previsto para finales de año.
La comparación con el ecosistema de agentes de OpenAI y las capacidades de uso de herramientas de Anthropic es obligada. El diferenciador de Spark es la ejecución persistente 24/7 en la infraestructura de Google Cloud, combinada con una integración profunda en la suite de productividad de Google. Si tu trabajo ya vive en Google Workspace, es una ventaja real. Si no, la propuesta de valor es menos evidente.
La privacidad es la preocupación legítima aquí. Un agente que monitoriza de forma continua tu bandeja de entrada, calendario y documentos plantea dudas reales sobre residencia de datos y cumplimiento en sectores regulados. Una de las preguntas que me hacía era, por ejemplo, «¿qué pasa con la memoria del agente cuando una persona deja la empresa?». Google aún no ha dado respuestas detalladas. Spark se está desplegando a testers de confianza esta semana, con una beta para suscriptores de Google AI Ultra (100 $ al mes) en EE. UU. la semana siguiente.

Agentes de búsqueda y modo IA
El modo IA en Search se presentó en el último I/O. Un año después, supera los mil millones de usuarios activos al mes. Ahora, Google va más allá con dos nuevas capacidades agentic.
La primera, agentes de información en Search: agentes personalizados en segundo plano que configuras para vigilar temas y mostrarte la información relevante en el momento oportuno. Llegan este verano, empezando por los suscriptores de Google AI Pro y Ultra.
La segunda es la UI generativa en Search, impulsada por Gemini 3.5 Flash y Antigravity. Search ahora construirá diseños a medida, visuales interactivos e incluso paneles persistentes o miniapps para consultas complejas y de larga duración. Las capacidades de UI generativa llegarán gratis a todos los usuarios este verano. Las funciones de panel persistente y apps personalizadas estarán primero para suscriptores Pro y Ultra en EE. UU.
Esto preocupa de verdad a editores y profesionales de SEO (como ya lo hicieron AI Overview y el modo IA). Cuando las respuestas generadas por IA resuelven por completo la consulta en Search, no hay motivo para hacer clic en el sitio de origen. Ya lo hemos visto: tanto AI Overviews como el lanzamiento inicial del modo IA provocaron caídas de tráfico significativas en todo el sector. Google sigue sin ofrecer una vía clara para repartir ingresos o garantizar tráfico a los editores cuyo contenido alimenta esas respuestas.
Google Flow
Google Flow, que debutó en I/O 2025 como herramienta de creación audiovisual con IA, da un salto importante con tres novedades clave:
- Agente de planificación más inteligente. El agente de Flow ahora puede planificar y razonar a través de proyectos creativos de varios pasos. Le das tus inputs (por ejemplo, un concepto, imágenes de referencia, un guion preliminar) y te ayuda a pasar de la lluvia de ideas a la creación y edición, todo en un mismo entorno. El nuevo agente está disponible para todos desde hoy.
- Vídeo nativo con Gemini Omni. Flow ahora gestiona la generación y edición de vídeo de forma nativa mediante el modelo Omni. Puedes describir en lenguaje natural cambios sobre un clip de tu carrete y iterar de forma conversacional. También ha mejorado la consistencia de personajes, así que la identidad y la voz se mantienen entre escenas. Especialmente útil si produces un corto o una campaña publicitaria con personajes recurrentes.
- Vibe coding para herramientas personalizadas. En lugar de limitarte a las herramientas que incluye Flow, ahora puedes crear las tuyas directamente en la plataforma. Google mostró ejemplos como diseñar efectos de vídeo a medida, crear herramientas de animación a mano alzada y construir flujos de superposición de texto, sin salir de Flow.
En conjunto, estas mejoras posicionan a Flow como algo más que un asistente creativo: se está convirtiendo en una plataforma para construir flujos de trabajo creativos, con app móvil en beta en Android y próximamente en iOS.
Ampliación de SynthID
SynthID, el sistema invisible de marcas de agua para IA de Google, ha marcado ya más de 100.000 millones de imágenes y vídeos y 60.000 años de audio desde su lanzamiento hace tres años. El anuncio importante en I/O no es la escala, sino los socios: OpenAI, Kakao y Eleven Labs adoptan SynthID junto a Nvidia, que se sumó el año pasado.
Lo relevante es la adopción transversal en la industria. Un estándar de marca de agua solo funciona si está lo bastante extendido como para que "sin marca de agua" sea una señal útil. Google también amplía la verificación de Content Credentials (el estándar C2PA) a Search y Chrome, para mostrar si el contenido se originó en IA o en una cámara y si se editó con herramientas generativas. La combinación de SynthID y C2PA aporta dos capas independientes de procedencia, el enfoque correcto dado lo fácil que es eliminar cada una por separado.
Menciones destacadas
Otros anuncios de I/O que merecen mención rápida:
- Docs Live: nueva función por voz para Google Docs que te permite volcar ideas de viva voz y que Gemini las estructure en un documento. Llega a suscriptores este verano, con capacidades de voz también para Gmail y Keep al mismo tiempo.
- Google Pics: nueva herramienta de creación y edición de imágenes con IA basada en el modelo Nano Banana, que trata cada elemento como objeto independiente en lugar de imagen plana. Disponible para testers de confianza ahora, y para suscriptores de Google AI Pro y Ultra a finales de verano.
- Android Halo: nuevo espacio de UI en Android para ver actualizaciones en vivo y progreso de tareas de agentes como Gemini Spark. Llegará a final de año.
- Daily Brief: agente preconfigurado en la app de Gemini que compila un resumen matinal personalizado a partir de tu bandeja, calendario y tareas, con próximos pasos sugeridos. Sin precio aparte anunciado; se espera como parte de la experiencia de la app de Gemini.
- TPU 8t y 8i: las TPU de 8.ª generación adoptan un enfoque de doble chip: 8t optimizada para preentrenamiento a gran escala (casi 3 veces el cómputo bruto de la generación anterior, escalable a más de 1 millón de TPU en todo el mundo) y 8i optimizada para inferencia. Ambas ofrecen hasta 2 veces mejor rendimiento por vatio que la generación previa.
- Gemini for Science: conjunto de herramientas de IA que conecta Antigravity con más de 30 grandes bases de datos de ciencias de la vida. Science Skills está disponible hoy en GitHub y directamente en Antigravity.
Reflexiones finales
Google I/O 2026 ha apostado por los agentes como dirección principal de la IA, con Gemini 3.5 Flash y Antigravity 2.0 como la infraestructura bajo casi todo lo demás. Lo que puedes usar ya mismo es Gemini 3.5 Flash (vía la API de Gemini y AI Studio), el nuevo agente de Flow, Gemini Omni Flash y la app de escritorio Antigravity 2.0. Gemini Spark, los agentes de Search y las funciones de UI generativa en Search llegarán a lo largo del verano, en su mayoría detrás del nuevo plan AI Ultra de 100 $ al mes (al menos al principio).
Para mí, la actualización de Antigravity fue lo más interesante, porque opera en dos niveles a la vez: como app independiente para desarrolladores compite directamente con Codex y Claude Code; como plataforma, su ADK subyacente y la API de Managed Agents desafían a frameworks de orquestación como LangChain, AutoGen y el Agents SDK de OpenAI. La integración con Gemini y la capa de despliegue en Google Cloud son los diferenciadores (y el riesgo de lock‑in) en ambos frentes.
Google I/O 2026: preguntas frecuentes
¿Cómo se compara Gemini 3.5 Flash con GPT-5.5 y Claude Opus 4.7?
Gemini 3.5 Flash lidera en varios benchmarks de agentes como MCP Atlas (83,6%) y Finance Agent v2 (57,9%), mientras que GPT-5.5 se impone en SWE-Bench Pro y ARC-AGI-2. Claude Opus 4.7 sigue siendo el más fuerte en Humanity's Last Exam (46,9%). La conclusión: compite con los modelos punteros mientras ofrece más velocidad y un coste sensiblemente menor a escala, como sugiere el propio nombre. Se espera una variante Pro más potente en breve.
¿En qué se diferencia Google Antigravity de Claude Code o Codex?
Google Antigravity 2.0 es una plataforma de desarrollo con enfoque en agentes que te permite orquestar múltiples agentes de IA en paralelo a través de una app de escritorio, una CLI, un SDK y una API enterprise. A diferencia de Claude Code (un agente de programación nativo de terminal) o Codex (un sistema basado en colas de tareas), Antigravity ofrece un control de permisos más fino por proyecto, creación de subagentes y una integración directa con Google Cloud y Firebase. Su doble papel como herramienta para desarrolladores y como SDK de plataforma lo acerca más a un framework de orquestación que a un asistente de código aislado.
¿Merece la pena el plan Google AI Ultra de 100 $ al mes frente a ChatGPT Pro o Claude Max?
Los tres planes cuestan 100 $ al mes, pero el valor depende de tu ecosistema. El diferenciador de Google AI Ultra es el acceso a Gemini Spark (agente persistente 24/7), límites de uso 5x más altos en Antigravity e integración profunda con Google Workspace. Si tu flujo ya vive en Gmail, Docs y Calendar, Ultra tiene ventaja natural. Si sobre todo necesitas ayuda con código o flexibilidad a nivel de API, ChatGPT Pro o Claude Max pueden encajarte mejor.
¿Qué es Gemini Omni y cómo gestiona la generación de vídeo?
Gemini Omni es el modelo nativamente multimodal de Google que acepta cualquier combinación de texto, imágenes, audio y vídeo como entrada y produce vídeo como salida. Unifica sistemas previamente separados (Veo para vídeo, Imagen para imágenes) en un único modelo, lo que debería dar ediciones cross‑modal más coherentes. La primera versión, Omni Flash, está disponible ya, y se espera pronto un Omni Pro más capaz. Aún no hay benchmarks independientes publicados, así que la calidad en el mundo real sigue evaluándose.

Editor de ciencia de datos en DataCamp | Me encanta hacer previsiones y crear con API.

