Curso
Si estás eligiendo entre Claude Fable 5 (ojo, salió hace apenas dos días) y Gemini 3.5 Flash, en realidad estás comparando dos visiones distintas de lo que debe ser un modelo de vanguardia.
Claude Fable 5 es el techo de capacidades de Anthropic: el modelo más potente disponible públicamente en la mayoría de benchmarks, con un precio acorde de $10/$50 por millón de tokens, y un sistema de clasificadores que puede desviar consultas sensibles a otro modelo a mitad de sesión.
Gemini 3.5 Flash es la apuesta de Google por el punto dulce entre velocidad, coste e inteligencia: un modelo de la gama "Flash" que supera al propio Gemini 3.1 Pro de Google en pruebas de programación y agentes. Funciona aproximadamente 4 veces más rápido que modelos punteros comparables y cuesta $1.50/$9 por millón de tokens; es decir, mucho más barato.
En este artículo comparo ambos modelos en cinco dimensiones:
- rendimiento en programación y tareas con agentes
- velocidad y latencia
- trabajo con contextos largos
- precios
Si estás comparando Fable 5 con el buque insignia de OpenAI, tenemos un artículo aparte: Claude Fable 5 vs GPT-5.5.
Mantenemos a nuestra audiencia al día de lo último en IA con The Median, nuestra newsletter gratuita de los viernes que resume las noticias clave de la semana. Haz clic en el enlace de arriba, suscríbete y mantente al día dedicando solo unos minutos a la semana.
¿Qué es Claude Fable 5?
Claude Fable 5 es el primer modelo de clase Mythos de Anthropic disponible para uso general. Fable 5 comparte el modelo subyacente con Claude Mythos 5, pero se distribuye con clasificadores de seguridad activos: una sonda monitoriza activaciones internas en todo el tráfico y las solicitudes marcadas se escalan a un clasificador LLM entrenado. Las solicitudes bloqueadas se redirigen a Claude Opus 4.8.
Fable 5 es el estado del arte en prácticamente todos los benchmarks probados, y destaca de forma impresionante en ingeniería de software, trabajo de conocimiento, visión y tareas agenticas de largo recorrido. Además, cuanto más larga y compleja es la tarea, mayor es su ventaja frente a modelos Claude anteriores.
¿Qué es Gemini 3.5 Flash?
Gemini 3.5 Flash es el lanzamiento de mayo de Google DeepMind, anunciado en el Google I/O 2026 como el primer modelo de la nueva familia Gemini 3.5. Pese a la marca "Flash", no es un modelo básico en el sentido tradicional: supera al Gemini 3.1 Pro (más grande) de Google en la batería de programación y agentes, mientras corre unas 4 veces más rápido que modelos de vanguardia comparables.
Gemini 3.5 Flash es un modelo de razonamiento con parámetros de esfuerzo de pensamiento configurables (minimal, low, medium, high). (Por defecto está en medium, por si te lo preguntas). El modelo admite una ventana de contexto de 1 millón de tokens, entrada multimodal (texto, imagen, audio, vídeo, PDF) y genera alrededor de 280+ tokens por segundo. Google lo convirtió en el modelo predeterminado en la app de Gemini y en el modo AI de Búsqueda el mismo día del lanzamiento. Esperamos que Gemini 3.5 Pro llegue en cualquier momento.
Un detalle importante: 3.5 Flash cuesta aproximadamente 3 veces más por token que su predecesor, Gemini 3 Flash ($0.50/$3.00). Así que es barato frente a los buques insignia, no frente a su propia línea. Y como los tokens de pensamiento se facturan a la tarifa de salida, las cargas de trabajo con mucho razonamiento a alto esfuerzo pueden costar más de lo que sugiere el precio de etiqueta. Conviene tenerlo presente.
Claude Fable 5 vs. Gemini 3.5 Flash: comparación directa
Aquí va un resumen rápido antes de entrar en los detalles. He preparado dos tablas: una con los resultados de benchmarks y otra con aspectos prácticos como precio, velocidad y acceso.
Resultados de benchmarks
| Benchmark | Claude Fable 5 | Gemini 3.5 Flash |
|---|---|---|
| SWE-Bench Pro | 80.3% | 55.1% (público) |
| Terminal-Bench 2.1 | 88.0%* | 76.2% |
| Humanity's Last Exam (con herramientas) | 64.5% | Va por detrás de Gemini 3.1 Pro (no comparable directamente) |
| OSWorld-Verified | 85.0% | No publicado |
| MCP Atlas (coordinación multi-herramienta) | No publicado | 83.6% |
Como ves, Claude Fable 5 gana en todas las comparativas directas donde hay datos claros para enfrentar a ambos.
Precio, velocidad y acceso
Lo adelantaba antes: el precio de Gemini 3.5 Flash es claramente mejor (mucho mejor).
| Función | Claude Fable 5 | Gemini 3.5 Flash |
|---|---|---|
| Precio de entrada por API (por 1M tokens) | $10 | $1.50 |
| Precio de salida por API (por 1M tokens) | $50 | $9.00 |
| Precio de entrada en caché | — | $0.15 por 1M (90% de descuento) |
| Velocidad de salida | Latencia estándar de modelos punteros | ~280+ tokens/seg, ~4x más rápido que sus pares punteros |
| Ventana de contexto | Se declaran tareas agenticas de varios millones de tokens; sin MRCR publicado a partir de 512K+ | 1M tokens (límite de entrada 1,048,576) |
| Disponibilidad general | Limitada (se requieren créditos de uso después del 22 de junio) | Sí (app de Gemini, AI Studio, Antigravity, API, modo AI en Búsqueda) |
Rendimiento en programación y con agentes
El desempeño en programación y trabajo con agentes merece análisis aparte porque aquí la brecha de capacidades es mayor.
En SWE-Bench Pro, como se ve en la primera tabla, Fable 5 obtiene un 80.3% frente al 55.1% de Gemini 3.5 Flash en el conjunto público. Una brecha de 25 puntos. Para ingeniería a nivel de repositorio en bases de código complejas, esto marca una diferencia real. Probablemente, Fable 5 puede resolver de forma autónoma la mayoría de incidencias reales de GitHub, y no estoy seguro de que se pueda afirmar lo mismo de Gemini 3.5 Flash.
Donde Gemini 3.5 Flash contrapesa es en el rendimiento agentico en términos de throughput, más que en profundidad. Flash está optimizado explícitamente para bucles de ejecución en paralelo, despliegue de subagentes e iteración rápida. Su 83.6% en MCP Atlas — un benchmark de coordinación multi-herramienta en el que supera el 75.3% de GPT-5.5 — sugiere un modelo diseñado para orquestar muchas llamadas de herramientas rápidas en lugar de sostener una única cadena de razonamiento larga y profunda. Google también reporta mejoras sustanciales en eficiencia de tokens en escenarios agenticos reales frente a versiones previas de Flash.
La forma correcta de verlo: si tu agente necesita pensar a fondo en un pequeño número de pasos difíciles (refactors complejos, cambios de arquitectura, debugging enrevesado), gana Fable 5. Si tu agente debe ejecutar muchos pasos moderadamente difíciles en paralelo (tuberías de scraping y resumen, orquestación multi-herramienta, triaje a gran escala), la velocidad y el coste de Flash encajan mejor.
Velocidad y latencia
Gemini 3.5 Flash genera alrededor de 280+ tokens por segundo — varias veces más rápido que los buques insignia de vanguardia típicos.
Fable 5, por su parte, no se posiciona como un modelo rápido. Se posiciona como el modelo al que recurres cuando la tarea es lo bastante difícil como para esperar la respuesta.
Rendimiento con contextos largos
Gemini 3.5 Flash admite aproximadamente 1 millón de tokens de contexto de entrada, y la familia Gemini históricamente ha sido fuerte en recuperación a largo contexto. Sin embargo, según se informa, Flash va por detrás del propio Gemini 3.1 Pro de Google en MRCR v2.
Anthropic afirma que Fable 5 mantiene el foco a lo largo de millones de tokens en tareas prolongadas y mejora las salidas usando sus propias notas. Pero Anthropic no ha publicado puntuaciones tipo MRCR en el rango de 512K–1M, así que no es posible una comparación en igualdad de condiciones.
Para revisión de documentos de un millón de tokens, ninguno de los dos modelos tiene aquí una ventaja publicada y concluyente. Si la fiabilidad en contexto largo es tu variable principal, el 74.0% publicado de GPT-5.5 en MRCR v2 a 512K–1M llama nuestra atención.
Precios y disponibilidad
Hay una brecha de precio. Fable 5 cuesta $10 por millón de tokens de entrada y $50 por millón de tokens de salida. Gemini 3.5 Flash cuesta $1.50 y $9.00 respectivamente, y además ofrece entrada en caché a $0.15 por millón, un 90% de descuento. Gemini 3.5 Flash es aproximadamente seis o siete veces más barato en entrada y cinco o seis veces más barato en salida.
Ahora bien, el precio nunca es tan simple: Para empezar, Flash es un modelo de razonamiento cuyos tokens de pensamiento se facturan a la tarifa de salida, por lo que las cargas de trabajo con razonamiento de alto esfuerzo pueden consumir bastantes más tokens de salida de lo que sugiere el prompt. Mide tu propio caso antes de asumir que Flash será barato para ti. Además, cuando los clasificadores de Fable 5 redirigen una consulta, se te factura a tarifas de Opus 4.8 ($5/$25), no a las de Fable 5. Probablemente sea un factor menor en coste, pero cuenta.
La disponibilidad es la otra asimetría. Gemini 3.5 Flash salió con disponibilidad general desde el primer día en la app de Gemini, Google AI Studio, Antigravity, la API de Gemini y el modo AI en Búsqueda. El acceso por suscripción a Fable 5 tiene una fecha límite: los suscriptores Pro, Max, Team y Enterprise tuvieron acceso gratuito solo hasta el 22 de junio de 2026, fecha que se acerca rápido; a partir de ahí, se requieren créditos de uso además de la suscripción existente.
Cuándo elegir Claude Fable 5 vs Gemini 3.5 Flash
La decisión depende de dos variables:
- si tus tareas son lo bastante complejas como para necesitar el techo de Fable 5
- si la velocidad y el coste por llamada dominan tu economía
| Caso de uso | Recomendado | Por qué |
|---|---|---|
| Ingeniería de software a nivel de repositorio en bases de código complejas | Claude Fable 5 | 80.3% vs 55.1% en SWE-Bench Pro: una brecha de 25 puntos que refleja diferencias reales de capacidad |
| Tuberías agenticas de alto volumen y sensibles a la latencia | Gemini 3.5 Flash | ~280+ tok/s de salida, ejecución de subagentes en paralelo y costes 5–7x menores se multiplican en miles de llamadas |
| Productos de consumo interactivos y experiencias de chat | Gemini 3.5 Flash | La ventaja de 4x en velocidad es una funcionalidad de producto; la latencia y precio de Fable 5 no encajan en usos de consumo de alta frecuencia |
| Finanzas complejas y trabajo de conocimiento | Claude Fable 5 | Lidera el benchmark de finanzas de Hebbia y Humanity's Last Exam con herramientas (64.5%) |
| Orquestación multi-herramienta entre muchos servicios | Gemini 3.5 Flash | El 83.6% en MCP Atlas es la puntuación publicada más fuerte en coordinación multi-herramienta entre modelos punteros |
| Tuberías multimodales (vídeo, audio, PDF de entrada) | Gemini 3.5 Flash | Entrada multimodal nativa en texto, imagen, audio, vídeo y PDF |
| Sectores regulados que requieren retención cero de datos | Gemini 3.5 Flash | La retención obligatoria de 30 días en Fable 5 es un bloqueo insalvable para algunas empresas |
Elige Claude Fable 5 si...
- Tu caso principal es la ingeniería de software a nivel de repositorio
- Necesitas el techo más alto disponible para trabajo analítico complejo — finanzas, razonamiento multidisciplinar, tareas agenticas de largo recorrido — y la latencia es secundaria.
- Tu trabajo no roza ciberseguridad, biología o química, por lo que es poco probable que los clasificadores desvíen tus sesiones.
Elige Gemini 3.5 Flash si...
- Tu economía viene marcada por el volumen: miles de llamadas al día donde la diferencia de coste se multiplica por órdenes de magnitud.
- La velocidad es un requisito de producto — UX interactiva, agentes en tiempo real o tuberías donde el tiempo total de muchas llamadas de herramientas importa más que la profundidad por paso.
- Necesitas entrada multimodal amplia (vídeo, audio, PDF) en un solo modelo.
- La política de datos de tu empresa no permite la retención obligatoria de 30 días de Fable 5, o necesitas un modelo que no cambie en silencio a mitad de la tubería.
Reflexión final
No es exactamente una comparación manzana con manzana. Fable 5 y Gemini 3.5 Flash ocupan posiciones distintas en el mercado: uno representa el techo de capacidades con cierta fricción asociada; el otro, la frontera de eficiencia con un techo más bajo.
Si la capacidad pura en tareas difíciles es tu única variable, Fable 5 gana con claridad. Pero la propuesta de valor de Flash no es "casi igual por menos". No quiero infravalorarlo: ofrece una inteligencia casi de vanguardia, lo bastante rápida y barata como para usarla donde Fable 5 nunca fue viable económicamente.



