Ir al contenido principal

Gemini 3.5 Flash: el modelo agentic más rápido de Google

Google lanzó Gemini 3.5 Flash en I/O 2026, un modelo que supera a Gemini 3.1 Pro en benchmarks de agentes y de código mientras funciona cuatro veces más rápido que sus competidores.
Actualizado 19 may 2026  · 8 min leer

Google anunció Gemini 3.5 Flash en I/O 2026 el 19 de mayo, un modelo que supera a Gemini 3.1 Pro en benchmarks de agentes y de código mientras funciona cuatro veces más rápido que otros modelos de vanguardia en su misma categoría.

El lanzamiento llega cuando el foco competitivo del sector de la IA se ha desplazado claramente hacia el rendimiento agentic. Los agentes para programar, la automatización de flujos de trabajo en varios pasos y la ejecución de tareas de largo recorrido se han convertido en el campo de batalla principal, y Google posiciona 3.5 Flash como su respuesta para este momento.

Para todo tipo de profesionales —incluyendo científicos de datos, ingenieros de ML y desarrolladores— esto importa porque 3.5 Flash es ahora (o lo será en breve) el modelo predeterminado en la app de Gemini y en el modo IA de la Búsqueda, y ya está disponible a través de la API de Gemini. En este artículo, te cuento qué se anunció, qué destaca, los números de los benchmarks y qué implica para tu trabajo.

Qué hay de nuevo en Gemini 3.5 Flash

La promesa principal de Gemini 3.5 Flash es la velocidad combinada con un rendimiento de nivel frontera. Google afirma que 3.5 Flash es cuatro veces más rápido en tokens de salida por segundo que otros modelos de vanguardia, y que supera a Gemini 3.1 Pro en los benchmarks más relevantes para el trabajo agentic.

En Terminal-Bench 2.1, alcanza un 76,2%. En GDPval-AA, llega a 1.656 Elo. En MCP Atlas, logra un 83,6%. Para comprensión multimodal, obtiene un 84,2% en CharXiv Reasoning.

En resumen, estas cifras indican que la vieja regla de «rápido, barato o listo; elige dos» en IA es menos aplicable. Tenemos un modelo ligero capaz de manejar flujos de trabajo de agentes complejos y de varios pasos sin una latencia enorme.

Google indica que el modelo está disponible desde hoy en Google AI Studio, la API de Gemini, Android Studio, Gemini Enterprise Agent Platform y Gemini Enterprise. También es el nuevo modelo predeterminado en la app de Gemini y en el modo IA de la Búsqueda a nivel global.

Google también anunció que Gemini 3.5 Pro está en desarrollo, ya se usa internamente y se espera su lanzamiento el mes que viene. El lanzamiento de 3.5 Flash es la jugada inicial de lo que Google denomina una nueva familia de modelos centrada en la ejecución agentic.

Contexto de Gemini 3.5

La serie Gemini 3 consolidó la posición actual de Google en la carrera por los modelos de frontera. Gemini 3.1 Pro, lanzado en febrero de 2026, lideró el Artificial Analysis Intelligence Index cuando salió y logró un 77,1% en ARC-AGI-2, más que duplicando el 31,1% de Gemini 3 Pro en ese benchmark.

Como vimos en nuestra comparativa GPT-5.5 vs Gemini 3.1 Pro, el punto fuerte de Gemini 3.1 Pro estaba en el razonamiento visual complejo y en las tareas multimodales.

La denominación Flash en la familia Gemini siempre ha señalado modelos optimizados para la velocidad. Lo diferente con 3.5 Flash es que Google afirma inteligencia de nivel frontera a velocidades Flash, sin sacrificar calidad. El índice Artificial Analysis sitúa a 3.5 Flash en el cuadrante superior derecho (según Google), es decir, alta inteligencia y alta velocidad de salida a la vez.

El framework Antigravity, la infraestructura de Google para desplegar subagentes colaborativos, es clave en el posicionamiento de 3.5 Flash. No es solo un modelo independiente, sino un componente dentro de una arquitectura multiagente que Google ha desarrollado en paralelo.

Características clave de Gemini 3.5

Aquí tienes un resumen de lo más interesante del anuncio.

Rendimiento en benchmarks

Las afirmaciones de Google sobre 3.5 Flash son concretas y merece la pena revisarlas directamente. El modelo supera a Gemini 3.1 Pro en lo siguiente:

  • Terminal-Bench 2.1: 76,2% (Gemini 3.1 Pro se evaluó en Terminal-Bench 2.0 con un 68,5%, según nuestra cobertura anterior)
  • GDPval-AA: 1.656 Elo (Claude Opus 4.7 lideraba este benchmark con 1.753 Elo cuando se lanzó, según nuestra review de Claude Opus 4.7 vs Gemini 3.1 Pro)
  • MCP Atlas: 83,6% (Gemini 3.1 Pro obtuvo un 73,9% en MCP Atlas en nuestras pruebas anteriores)
  • CharXiv Reasoning: 84,2% en comprensión multimodal

La afirmación sobre velocidad también destaca: cuatro veces más rápido en tokens de salida por segundo que otros modelos de vanguardia. Google no especifica contra qué modelos compara en las notas de investigación, así que toma esa cifra como orientativa, no como un cara a cara exacto.

Arquitectura agentic y Antigravity

3.5 Flash está diseñado para trabajar con el framework Antigravity, la infraestructura de Google para ejecutar subagentes colaborativos. Con Antigravity, el modelo puede desplegar múltiples subagentes en paralelo, ejecutar flujos de trabajo de varios pasos y mantener el rendimiento en tareas de largo recorrido.

Entre los ejemplos de Google están sintetizar el paper de AlphaZero y programar un juego completamente funcional en seis horas usando dos agentes, además de transformar una base de código heredada a Next.js. No son demos de juguete. Reflejan el tipo de tareas de desarrollo de varios días que ahora se pide a los sistemas agentic que asuman.

Despliegues reales en empresas

Varias empresas ya están usando 3.5 Flash en producción o en piloto. Los casos de uso concretos merecen atención porque ilustran dónde se están aplicando las fortalezas agentic del modelo:

  • Shopify: Ejecución de subagentes en paralelo para analizar datos complejos a largo plazo y elaborar previsiones de crecimiento para comercios
  • Macquarie Bank: Piloto de onboarding de clientes razonando sobre documentos de más de 100 páginas con baja latencia
  • Salesforce: Integración en Agentforce para automatizar tareas empresariales con múltiples subagentes y llamadas a herramientas en varias rondas
  • Xero: Despliegue de agentes para gestionar flujos de trabajo de varias semanas, incluida la preparación de formularios fiscales 1099 para pequeñas empresas
  • Databricks: Uso de flujos de trabajo agentic para monitorizar información en tiempo real, diagnosticar incidencias y proponer soluciones sobre grandes conjuntos de datos
  • Ramp: Mejora de la precisión de OCR en facturas complejas gracias a la comprensión multimodal combinada con el razonamiento sobre patrones históricos

Gemini Spark y disponibilidad para consumidores

3.5 Flash también impulsa Gemini Spark, el nuevo agente personal de IA de Google que funciona 24/7 y actúa en nombre del usuario. Google está desplegando Spark a testers de confianza ahora, con una Beta prevista para suscriptores de Google AI Ultra en EE. UU. la semana posterior al anuncio de I/O.

El modelo está disponible hoy para miles de millones de usuarios a nivel global a través de la app de Gemini y del modo IA en la Búsqueda, lo que convierte este lanzamiento en uno de los más amplios y simultáneos para consumidores y desarrolladores que Google ha hecho con un modelo Gemini.

Seguridad y salvaguardas

Google afirma que 3.5 Flash se desarrolló bajo su Frontier Safety Framework, con salvaguardas reforzadas en ciberseguridad y CBRN. La compañía utiliza herramientas de interpretabilidad que revisan el razonamiento interno del modelo antes de responder, con el objetivo de reducir tanto las salidas dañinas como los rechazos erróneos ante consultas seguras.

Gemini 3.5 para profesionales de datos e IA

La implicación práctica más inmediata es que 3.5 Flash está disponible de forma inminente a través de la API de Gemini en Google AI Studio. Si estás construyendo canalizaciones agentic, la combinación de la puntuación en MCP Atlas (83,6%) y el framework multiagente Antigravity merece que lo pruebes frente a lo que uses actualmente.

La puntuación de 1.656 Elo en GDPval-AA queda por detrás de los 1.753 Elo de Claude Opus 4.7 en nuestro análisis anterior, pero la ventaja en velocidad de 3.5 Flash puede pesar más según tus requisitos de latencia.

Para equipos que ejecutan flujos de trabajo de largo recorrido, los despliegues de Xero y Shopify son las señales más instructivas. Comprimir flujos de varias semanas en ejecuciones automatizadas de agentes es el caso de uso para el que Google está optimizando, y el framework Antigravity es la capa de infraestructura que lo hace posible. Si aún no dominas los patrones de orquestación multiagente, este es un buen momento para ponerte al día.

Algo a vigilar de cerca: Google afirma que 3.5 Flash cuesta menos de la mitad que otros modelos de vanguardia para tareas comparables. Esa afirmación depende mucho de tu carga de trabajo concreta, pero si se confirma en la práctica, cambia la economía de ejecutar sistemas agentic a escala. El modelo 3.5 Pro, previsto para el mes que viene, será el punto de comparación más interesante para los equipos que hacen el trabajo de razonamiento más pesado.

Reflexiones finales

Gemini 3.5 Flash muestra que Google quiere competir en ambos extremos de la curva rendimiento-velocidad, no solo en la gama insignia. Superar a Gemini 3.1 Pro en benchmarks agentic funcionando a velocidades Flash es un cambio relevante, y los despliegues empresariales en Shopify, Macquarie y Salesforce sugieren que el modelo se sostiene fuera de los benchmarks controlados.

En un plano más amplio, Google está apostando fuerte por la infraestructura agentic: Antigravity, Gemini Spark y 3.5 Flash apuntan en la misma dirección. Que esa apuesta salga bien dependerá de cómo rinda 3.5 Pro cuando llegue el mes que viene y de cómo se compare el framework Antigravity con otros marcos multiagente en flujos de trabajo reales de desarrolladores.

Si quieres ponerte al día con los conceptos de IA agentic y aprender a construir con modelos como estos, te recomiendo echar un vistazo al itinerario de aprendizaje AI Agent Fundamentals en DataCamp.


Matt Crabtree's photo
Author
Matt Crabtree
LinkedIn

Escritora y editora de contenidos en el ámbito de la tecnología educativa. Comprometido con la exploración de tendencias de datos y entusiasmado con el aprendizaje de la ciencia de datos.

Temas

Cursos destacados de DataCamp

programa

Fundamentos de agentes de IA

6 h
¡Descubre cómo los agentes de IA pueden transformar tu forma de trabajar y aportar valor a tu organización!
Ver detallesRight Arrow
Iniciar curso
Ver másRight Arrow
Relacionado

blog

Todo lo que sabemos sobre GPT-5

Descubre cómo GPT-5 evolucionará hasta convertirse en un sistema unificado con funciones avanzadas, cuyo lanzamiento está previsto para el verano de 2025, basándose en la última hoja de ruta de OpenAI y en la historia de GPT.
Josep Ferrer's photo

Josep Ferrer

8 min

blog

10 de los mejores plugins de ChatGPT para sacar el máximo partido a la IA en 2023

Libera todo el potencial de ChatGPT con nuestra guía de expertos sobre los 10 mejores plugins para 2023. Mejora la productividad, agiliza los flujos de trabajo y descubre nueva funcionalidad para elevar tu experiencia ChatGPT.
Matt Crabtree's photo

Matt Crabtree

12 min

An avian AI exits its cage

blog

12 alternativas de código abierto a GPT-4

Alternativas de código abierto a GPT-4 que pueden ofrecer un rendimiento similar y requieren menos recursos informáticos para funcionar. Estos proyectos vienen con instrucciones, fuentes de código, pesos del modelo, conjuntos de datos e IU de chatbot.
Abid Ali Awan's photo

Abid Ali Awan

9 min

An AI juggles tasks

blog

Cinco proyectos que puedes crear con modelos de IA generativa (con ejemplos)

Aprende a utilizar modelos de IA generativa para crear un editor de imágenes, un chatbot similar a ChatGPT con pocos recursos y una aplicación clasificadora de aprobación de préstamos y a automatizar interacciones PDF y un asistente de voz con GPT.
Abid Ali Awan's photo

Abid Ali Awan

10 min

Tutorial

Cómo ajustar GPT 3.5: Liberar todo el potencial de la IA

Explore GPT-3.5 Turbo y descubra el potencial transformador del ajuste fino. Aprenda a personalizar este modelo de lenguaje avanzado para aplicaciones especializadas, mejore su rendimiento y comprenda los costes asociados, la seguridad y las consideraciones de privacidad.
Moez Ali's photo

Moez Ali

Tutorial

Tutorial de DeepSeek-Coder-V2: Ejemplos, instalación, puntos de referencia

DeepSeek-Coder-V2 es un modelo de lenguaje de código de código abierto que rivaliza con el rendimiento de GPT-4, Gemini 1.5 Pro, Claude 3 Opus, Llama 3 70B o Codestral.
Dimitri Didmanidze's photo

Dimitri Didmanidze

Ver másVer más