programa
Google anunció Gemini 3.5 Flash en I/O 2026 el 19 de mayo, un modelo que supera a Gemini 3.1 Pro en benchmarks de agentes y de código mientras funciona cuatro veces más rápido que otros modelos de vanguardia en su misma categoría.
El lanzamiento llega cuando el foco competitivo del sector de la IA se ha desplazado claramente hacia el rendimiento agentic. Los agentes para programar, la automatización de flujos de trabajo en varios pasos y la ejecución de tareas de largo recorrido se han convertido en el campo de batalla principal, y Google posiciona 3.5 Flash como su respuesta para este momento.
Para todo tipo de profesionales —incluyendo científicos de datos, ingenieros de ML y desarrolladores— esto importa porque 3.5 Flash es ahora (o lo será en breve) el modelo predeterminado en la app de Gemini y en el modo IA de la Búsqueda, y ya está disponible a través de la API de Gemini. En este artículo, te cuento qué se anunció, qué destaca, los números de los benchmarks y qué implica para tu trabajo.
Qué hay de nuevo en Gemini 3.5 Flash
La promesa principal de Gemini 3.5 Flash es la velocidad combinada con un rendimiento de nivel frontera. Google afirma que 3.5 Flash es cuatro veces más rápido en tokens de salida por segundo que otros modelos de vanguardia, y que supera a Gemini 3.1 Pro en los benchmarks más relevantes para el trabajo agentic.
En Terminal-Bench 2.1, alcanza un 76,2%. En GDPval-AA, llega a 1.656 Elo. En MCP Atlas, logra un 83,6%. Para comprensión multimodal, obtiene un 84,2% en CharXiv Reasoning.
En resumen, estas cifras indican que la vieja regla de «rápido, barato o listo; elige dos» en IA es menos aplicable. Tenemos un modelo ligero capaz de manejar flujos de trabajo de agentes complejos y de varios pasos sin una latencia enorme.
Google indica que el modelo está disponible desde hoy en Google AI Studio, la API de Gemini, Android Studio, Gemini Enterprise Agent Platform y Gemini Enterprise. También es el nuevo modelo predeterminado en la app de Gemini y en el modo IA de la Búsqueda a nivel global.
Google también anunció que Gemini 3.5 Pro está en desarrollo, ya se usa internamente y se espera su lanzamiento el mes que viene. El lanzamiento de 3.5 Flash es la jugada inicial de lo que Google denomina una nueva familia de modelos centrada en la ejecución agentic.
Contexto de Gemini 3.5
La serie Gemini 3 consolidó la posición actual de Google en la carrera por los modelos de frontera. Gemini 3.1 Pro, lanzado en febrero de 2026, lideró el Artificial Analysis Intelligence Index cuando salió y logró un 77,1% en ARC-AGI-2, más que duplicando el 31,1% de Gemini 3 Pro en ese benchmark.
Como vimos en nuestra comparativa GPT-5.5 vs Gemini 3.1 Pro, el punto fuerte de Gemini 3.1 Pro estaba en el razonamiento visual complejo y en las tareas multimodales.
La denominación Flash en la familia Gemini siempre ha señalado modelos optimizados para la velocidad. Lo diferente con 3.5 Flash es que Google afirma inteligencia de nivel frontera a velocidades Flash, sin sacrificar calidad. El índice Artificial Analysis sitúa a 3.5 Flash en el cuadrante superior derecho (según Google), es decir, alta inteligencia y alta velocidad de salida a la vez.
El framework Antigravity, la infraestructura de Google para desplegar subagentes colaborativos, es clave en el posicionamiento de 3.5 Flash. No es solo un modelo independiente, sino un componente dentro de una arquitectura multiagente que Google ha desarrollado en paralelo.
Características clave de Gemini 3.5
Aquí tienes un resumen de lo más interesante del anuncio.
Rendimiento en benchmarks
Las afirmaciones de Google sobre 3.5 Flash son concretas y merece la pena revisarlas directamente. El modelo supera a Gemini 3.1 Pro en lo siguiente:
- Terminal-Bench 2.1: 76,2% (Gemini 3.1 Pro se evaluó en Terminal-Bench 2.0 con un 68,5%, según nuestra cobertura anterior)
- GDPval-AA: 1.656 Elo (Claude Opus 4.7 lideraba este benchmark con 1.753 Elo cuando se lanzó, según nuestra review de Claude Opus 4.7 vs Gemini 3.1 Pro)
- MCP Atlas: 83,6% (Gemini 3.1 Pro obtuvo un 73,9% en MCP Atlas en nuestras pruebas anteriores)
- CharXiv Reasoning: 84,2% en comprensión multimodal
La afirmación sobre velocidad también destaca: cuatro veces más rápido en tokens de salida por segundo que otros modelos de vanguardia. Google no especifica contra qué modelos compara en las notas de investigación, así que toma esa cifra como orientativa, no como un cara a cara exacto.
Arquitectura agentic y Antigravity
3.5 Flash está diseñado para trabajar con el framework Antigravity, la infraestructura de Google para ejecutar subagentes colaborativos. Con Antigravity, el modelo puede desplegar múltiples subagentes en paralelo, ejecutar flujos de trabajo de varios pasos y mantener el rendimiento en tareas de largo recorrido.
Entre los ejemplos de Google están sintetizar el paper de AlphaZero y programar un juego completamente funcional en seis horas usando dos agentes, además de transformar una base de código heredada a Next.js. No son demos de juguete. Reflejan el tipo de tareas de desarrollo de varios días que ahora se pide a los sistemas agentic que asuman.
Despliegues reales en empresas
Varias empresas ya están usando 3.5 Flash en producción o en piloto. Los casos de uso concretos merecen atención porque ilustran dónde se están aplicando las fortalezas agentic del modelo:
- Shopify: Ejecución de subagentes en paralelo para analizar datos complejos a largo plazo y elaborar previsiones de crecimiento para comercios
- Macquarie Bank: Piloto de onboarding de clientes razonando sobre documentos de más de 100 páginas con baja latencia
- Salesforce: Integración en Agentforce para automatizar tareas empresariales con múltiples subagentes y llamadas a herramientas en varias rondas
- Xero: Despliegue de agentes para gestionar flujos de trabajo de varias semanas, incluida la preparación de formularios fiscales 1099 para pequeñas empresas
- Databricks: Uso de flujos de trabajo agentic para monitorizar información en tiempo real, diagnosticar incidencias y proponer soluciones sobre grandes conjuntos de datos
- Ramp: Mejora de la precisión de OCR en facturas complejas gracias a la comprensión multimodal combinada con el razonamiento sobre patrones históricos
Gemini Spark y disponibilidad para consumidores
3.5 Flash también impulsa Gemini Spark, el nuevo agente personal de IA de Google que funciona 24/7 y actúa en nombre del usuario. Google está desplegando Spark a testers de confianza ahora, con una Beta prevista para suscriptores de Google AI Ultra en EE. UU. la semana posterior al anuncio de I/O.
El modelo está disponible hoy para miles de millones de usuarios a nivel global a través de la app de Gemini y del modo IA en la Búsqueda, lo que convierte este lanzamiento en uno de los más amplios y simultáneos para consumidores y desarrolladores que Google ha hecho con un modelo Gemini.
Seguridad y salvaguardas
Google afirma que 3.5 Flash se desarrolló bajo su Frontier Safety Framework, con salvaguardas reforzadas en ciberseguridad y CBRN. La compañía utiliza herramientas de interpretabilidad que revisan el razonamiento interno del modelo antes de responder, con el objetivo de reducir tanto las salidas dañinas como los rechazos erróneos ante consultas seguras.
Gemini 3.5 para profesionales de datos e IA
La implicación práctica más inmediata es que 3.5 Flash está disponible de forma inminente a través de la API de Gemini en Google AI Studio. Si estás construyendo canalizaciones agentic, la combinación de la puntuación en MCP Atlas (83,6%) y el framework multiagente Antigravity merece que lo pruebes frente a lo que uses actualmente.
La puntuación de 1.656 Elo en GDPval-AA queda por detrás de los 1.753 Elo de Claude Opus 4.7 en nuestro análisis anterior, pero la ventaja en velocidad de 3.5 Flash puede pesar más según tus requisitos de latencia.
Para equipos que ejecutan flujos de trabajo de largo recorrido, los despliegues de Xero y Shopify son las señales más instructivas. Comprimir flujos de varias semanas en ejecuciones automatizadas de agentes es el caso de uso para el que Google está optimizando, y el framework Antigravity es la capa de infraestructura que lo hace posible. Si aún no dominas los patrones de orquestación multiagente, este es un buen momento para ponerte al día.
Algo a vigilar de cerca: Google afirma que 3.5 Flash cuesta menos de la mitad que otros modelos de vanguardia para tareas comparables. Esa afirmación depende mucho de tu carga de trabajo concreta, pero si se confirma en la práctica, cambia la economía de ejecutar sistemas agentic a escala. El modelo 3.5 Pro, previsto para el mes que viene, será el punto de comparación más interesante para los equipos que hacen el trabajo de razonamiento más pesado.
Reflexiones finales
Gemini 3.5 Flash muestra que Google quiere competir en ambos extremos de la curva rendimiento-velocidad, no solo en la gama insignia. Superar a Gemini 3.1 Pro en benchmarks agentic funcionando a velocidades Flash es un cambio relevante, y los despliegues empresariales en Shopify, Macquarie y Salesforce sugieren que el modelo se sostiene fuera de los benchmarks controlados.
En un plano más amplio, Google está apostando fuerte por la infraestructura agentic: Antigravity, Gemini Spark y 3.5 Flash apuntan en la misma dirección. Que esa apuesta salga bien dependerá de cómo rinda 3.5 Pro cuando llegue el mes que viene y de cómo se compare el framework Antigravity con otros marcos multiagente en flujos de trabajo reales de desarrolladores.
Si quieres ponerte al día con los conceptos de IA agentic y aprender a construir con modelos como estos, te recomiendo echar un vistazo al itinerario de aprendizaje AI Agent Fundamentals en DataCamp.

Escritora y editora de contenidos en el ámbito de la tecnología educativa. Comprometido con la exploración de tendencias de datos y entusiasmado con el aprendizaje de la ciencia de datos.


