Ir al contenido principal

Claude Fable 5 vs. Gemini 3.5 Flash: benchmarks, precios y más

Claude Fable 5 domina en capacidad pura, pero Gemini 3.5 Flash ofrece un rendimiento casi de vanguardia a una fracción del coste y varias veces más rápido. Sigue leyendo para saber más.
Actualizado 11 jun 2026  · 9 min leer

Si estás eligiendo entre Claude Fable 5 (ojo, salió hace apenas dos días) y Gemini 3.5 Flash, en realidad estás comparando dos visiones distintas de lo que debe ser un modelo de vanguardia.

Claude Fable 5 es el techo de capacidades de Anthropic: el modelo más potente disponible públicamente en la mayoría de benchmarks, con un precio acorde de $10/$50 por millón de tokens, y un sistema de clasificadores que puede desviar consultas sensibles a otro modelo a mitad de sesión.

Gemini 3.5 Flash es la apuesta de Google por el punto dulce entre velocidad, coste e inteligencia: un modelo de la gama "Flash" que supera al propio Gemini 3.1 Pro de Google en pruebas de programación y agentes. Funciona aproximadamente 4 veces más rápido que modelos punteros comparables y cuesta $1.50/$9 por millón de tokens; es decir, mucho más barato.

En este artículo comparo ambos modelos en cinco dimensiones:

  • rendimiento en programación y tareas con agentes
  • velocidad y latencia
  • trabajo con contextos largos
  • precios

Si estás comparando Fable 5 con el buque insignia de OpenAI, tenemos un artículo aparte: Claude Fable 5 vs GPT-5.5.

Mantenemos a nuestra audiencia al día de lo último en IA con The Median, nuestra newsletter gratuita de los viernes que resume las noticias clave de la semana. Haz clic en el enlace de arriba, suscríbete y mantente al día dedicando solo unos minutos a la semana.

¿Qué es Claude Fable 5?

Claude Fable 5 es el primer modelo de clase Mythos de Anthropic disponible para uso general. Fable 5 comparte el modelo subyacente con Claude Mythos 5, pero se distribuye con clasificadores de seguridad activos: una sonda monitoriza activaciones internas en todo el tráfico y las solicitudes marcadas se escalan a un clasificador LLM entrenado. Las solicitudes bloqueadas se redirigen a Claude Opus 4.8.

Fable 5 es el estado del arte en prácticamente todos los benchmarks probados, y destaca de forma impresionante en ingeniería de software, trabajo de conocimiento, visión y tareas agenticas de largo recorrido. Además, cuanto más larga y compleja es la tarea, mayor es su ventaja frente a modelos Claude anteriores.

¿Qué es Gemini 3.5 Flash?

Gemini 3.5 Flash es el lanzamiento de mayo de Google DeepMind, anunciado en el Google I/O 2026 como el primer modelo de la nueva familia Gemini 3.5. Pese a la marca "Flash", no es un modelo básico en el sentido tradicional: supera al Gemini 3.1 Pro (más grande) de Google en la batería de programación y agentes, mientras corre unas 4 veces más rápido que modelos de vanguardia comparables.

Gemini 3.5 Flash es un modelo de razonamiento con parámetros de esfuerzo de pensamiento configurables (minimal, low, medium, high). (Por defecto está en medium, por si te lo preguntas). El modelo admite una ventana de contexto de 1 millón de tokens, entrada multimodal (texto, imagen, audio, vídeo, PDF) y genera alrededor de 280+ tokens por segundo. Google lo convirtió en el modelo predeterminado en la app de Gemini y en el modo AI de Búsqueda el mismo día del lanzamiento. Esperamos que Gemini 3.5 Pro llegue en cualquier momento.

Un detalle importante: 3.5 Flash cuesta aproximadamente 3 veces más por token que su predecesor, Gemini 3 Flash ($0.50/$3.00). Así que es barato frente a los buques insignia, no frente a su propia línea. Y como los tokens de pensamiento se facturan a la tarifa de salida, las cargas de trabajo con mucho razonamiento a alto esfuerzo pueden costar más de lo que sugiere el precio de etiqueta. Conviene tenerlo presente.

Claude Fable 5 vs. Gemini 3.5 Flash: comparación directa

Aquí va un resumen rápido antes de entrar en los detalles. He preparado dos tablas: una con los resultados de benchmarks y otra con aspectos prácticos como precio, velocidad y acceso.

Resultados de benchmarks

Benchmark Claude Fable 5 Gemini 3.5 Flash
SWE-Bench Pro 80.3% 55.1% (público)
Terminal-Bench 2.1 88.0%* 76.2%
Humanity's Last Exam (con herramientas) 64.5% Va por detrás de Gemini 3.1 Pro (no comparable directamente)
OSWorld-Verified 85.0% No publicado
MCP Atlas (coordinación multi-herramienta) No publicado 83.6%

Como ves, Claude Fable 5 gana en todas las comparativas directas donde hay datos claros para enfrentar a ambos.

Precio, velocidad y acceso

Lo adelantaba antes: el precio de Gemini 3.5 Flash es claramente mejor (mucho mejor).

Función Claude Fable 5 Gemini 3.5 Flash
Precio de entrada por API (por 1M tokens) $10 $1.50
Precio de salida por API (por 1M tokens) $50 $9.00
Precio de entrada en caché $0.15 por 1M (90% de descuento)
Velocidad de salida Latencia estándar de modelos punteros ~280+ tokens/seg, ~4x más rápido que sus pares punteros
Ventana de contexto Se declaran tareas agenticas de varios millones de tokens; sin MRCR publicado a partir de 512K+ 1M tokens (límite de entrada 1,048,576)
Disponibilidad general Limitada (se requieren créditos de uso después del 22 de junio) Sí (app de Gemini, AI Studio, Antigravity, API, modo AI en Búsqueda)

Rendimiento en programación y con agentes

El desempeño en programación y trabajo con agentes merece análisis aparte porque aquí la brecha de capacidades es mayor.

En SWE-Bench Pro, como se ve en la primera tabla, Fable 5 obtiene un 80.3% frente al 55.1% de Gemini 3.5 Flash en el conjunto público. Una brecha de 25 puntos. Para ingeniería a nivel de repositorio en bases de código complejas, esto marca una diferencia real. Probablemente, Fable 5 puede resolver de forma autónoma la mayoría de incidencias reales de GitHub, y no estoy seguro de que se pueda afirmar lo mismo de Gemini 3.5 Flash.

Donde Gemini 3.5 Flash contrapesa es en el rendimiento agentico en términos de throughput, más que en profundidad. Flash está optimizado explícitamente para bucles de ejecución en paralelo, despliegue de subagentes e iteración rápida. Su 83.6% en MCP Atlas — un benchmark de coordinación multi-herramienta en el que supera el 75.3% de GPT-5.5 — sugiere un modelo diseñado para orquestar muchas llamadas de herramientas rápidas en lugar de sostener una única cadena de razonamiento larga y profunda. Google también reporta mejoras sustanciales en eficiencia de tokens en escenarios agenticos reales frente a versiones previas de Flash.

La forma correcta de verlo: si tu agente necesita pensar a fondo en un pequeño número de pasos difíciles (refactors complejos, cambios de arquitectura, debugging enrevesado), gana Fable 5. Si tu agente debe ejecutar muchos pasos moderadamente difíciles en paralelo (tuberías de scraping y resumen, orquestación multi-herramienta, triaje a gran escala), la velocidad y el coste de Flash encajan mejor.

Velocidad y latencia

Gemini 3.5 Flash genera alrededor de 280+ tokens por segundo — varias veces más rápido que los buques insignia de vanguardia típicos.

Fable 5, por su parte, no se posiciona como un modelo rápido. Se posiciona como el modelo al que recurres cuando la tarea es lo bastante difícil como para esperar la respuesta.

Rendimiento con contextos largos

Gemini 3.5 Flash admite aproximadamente 1 millón de tokens de contexto de entrada, y la familia Gemini históricamente ha sido fuerte en recuperación a largo contexto. Sin embargo, según se informa, Flash va por detrás del propio Gemini 3.1 Pro de Google en MRCR v2.

Anthropic afirma que Fable 5 mantiene el foco a lo largo de millones de tokens en tareas prolongadas y mejora las salidas usando sus propias notas. Pero Anthropic no ha publicado puntuaciones tipo MRCR en el rango de 512K–1M, así que no es posible una comparación en igualdad de condiciones.

Para revisión de documentos de un millón de tokens, ninguno de los dos modelos tiene aquí una ventaja publicada y concluyente. Si la fiabilidad en contexto largo es tu variable principal, el 74.0% publicado de GPT-5.5 en MRCR v2 a 512K–1M llama nuestra atención.

Precios y disponibilidad

Hay una brecha de precio. Fable 5 cuesta $10 por millón de tokens de entrada y $50 por millón de tokens de salida. Gemini 3.5 Flash cuesta $1.50 y $9.00 respectivamente, y además ofrece entrada en caché a $0.15 por millón, un 90% de descuento. Gemini 3.5 Flash es aproximadamente seis o siete veces más barato en entrada y cinco o seis veces más barato en salida.

Ahora bien, el precio nunca es tan simple: Para empezar, Flash es un modelo de razonamiento cuyos tokens de pensamiento se facturan a la tarifa de salida, por lo que las cargas de trabajo con razonamiento de alto esfuerzo pueden consumir bastantes más tokens de salida de lo que sugiere el prompt. Mide tu propio caso antes de asumir que Flash será barato para ti. Además, cuando los clasificadores de Fable 5 redirigen una consulta, se te factura a tarifas de Opus 4.8 ($5/$25), no a las de Fable 5. Probablemente sea un factor menor en coste, pero cuenta.

La disponibilidad es la otra asimetría. Gemini 3.5 Flash salió con disponibilidad general desde el primer día en la app de Gemini, Google AI Studio, Antigravity, la API de Gemini y el modo AI en Búsqueda. El acceso por suscripción a Fable 5 tiene una fecha límite: los suscriptores Pro, Max, Team y Enterprise tuvieron acceso gratuito solo hasta el 22 de junio de 2026, fecha que se acerca rápido; a partir de ahí, se requieren créditos de uso además de la suscripción existente.

Cuándo elegir Claude Fable 5 vs Gemini 3.5 Flash

La decisión depende de dos variables:

  • si tus tareas son lo bastante complejas como para necesitar el techo de Fable 5
  • si la velocidad y el coste por llamada dominan tu economía
Caso de uso Recomendado Por qué
Ingeniería de software a nivel de repositorio en bases de código complejas Claude Fable 5 80.3% vs 55.1% en SWE-Bench Pro: una brecha de 25 puntos que refleja diferencias reales de capacidad
Tuberías agenticas de alto volumen y sensibles a la latencia Gemini 3.5 Flash ~280+ tok/s de salida, ejecución de subagentes en paralelo y costes 5–7x menores se multiplican en miles de llamadas
Productos de consumo interactivos y experiencias de chat Gemini 3.5 Flash La ventaja de 4x en velocidad es una funcionalidad de producto; la latencia y precio de Fable 5 no encajan en usos de consumo de alta frecuencia
Finanzas complejas y trabajo de conocimiento Claude Fable 5 Lidera el benchmark de finanzas de Hebbia y Humanity's Last Exam con herramientas (64.5%)
Orquestación multi-herramienta entre muchos servicios Gemini 3.5 Flash El 83.6% en MCP Atlas es la puntuación publicada más fuerte en coordinación multi-herramienta entre modelos punteros
Tuberías multimodales (vídeo, audio, PDF de entrada) Gemini 3.5 Flash Entrada multimodal nativa en texto, imagen, audio, vídeo y PDF
Sectores regulados que requieren retención cero de datos Gemini 3.5 Flash La retención obligatoria de 30 días en Fable 5 es un bloqueo insalvable para algunas empresas

Elige Claude Fable 5 si...

  • Tu caso principal es la ingeniería de software a nivel de repositorio
  • Necesitas el techo más alto disponible para trabajo analítico complejo — finanzas, razonamiento multidisciplinar, tareas agenticas de largo recorrido — y la latencia es secundaria.
  • Tu trabajo no roza ciberseguridad, biología o química, por lo que es poco probable que los clasificadores desvíen tus sesiones.

Elige Gemini 3.5 Flash si...

  • Tu economía viene marcada por el volumen: miles de llamadas al día donde la diferencia de coste se multiplica por órdenes de magnitud.
  • La velocidad es un requisito de producto — UX interactiva, agentes en tiempo real o tuberías donde el tiempo total de muchas llamadas de herramientas importa más que la profundidad por paso.
  • Necesitas entrada multimodal amplia (vídeo, audio, PDF) en un solo modelo.
  • La política de datos de tu empresa no permite la retención obligatoria de 30 días de Fable 5, o necesitas un modelo que no cambie en silencio a mitad de la tubería.

Reflexión final

No es exactamente una comparación manzana con manzana. Fable 5 y Gemini 3.5 Flash ocupan posiciones distintas en el mercado: uno representa el techo de capacidades con cierta fricción asociada; el otro, la frontera de eficiencia con un techo más bajo.

Si la capacidad pura en tareas difíciles es tu única variable, Fable 5 gana con claridad. Pero la propuesta de valor de Flash no es "casi igual por menos". No quiero infravalorarlo: ofrece una inteligencia casi de vanguardia, lo bastante rápida y barata como para usarla donde Fable 5 nunca fue viable económicamente.


Josef Waples's photo
Author
Josef Waples
Temas

Aprende con DataCamp

Curso

Conceptos de grandes modelos lingüísticos (LLM)

2 h
98.9K
Descubre todo el potencial de los LLM: aplicaciones, metodologías de entrenamiento, consideraciones éticas y avances en investigación.
Ver detallesRight Arrow
Iniciar curso
Ver másRight Arrow
Relacionado
An avian AI exits its cage

blog

12 alternativas de código abierto a GPT-4

Alternativas de código abierto a GPT-4 que pueden ofrecer un rendimiento similar y requieren menos recursos informáticos para funcionar. Estos proyectos vienen con instrucciones, fuentes de código, pesos del modelo, conjuntos de datos e IU de chatbot.
Abid Ali Awan's photo

Abid Ali Awan

9 min

blog

Todo lo que sabemos sobre GPT-5

Descubre cómo GPT-5 evolucionará hasta convertirse en un sistema unificado con funciones avanzadas, cuyo lanzamiento está previsto para el verano de 2025, basándose en la última hoja de ruta de OpenAI y en la historia de GPT.
Josep Ferrer's photo

Josep Ferrer

8 min

Tutorial

Cómo ajustar GPT 3.5: Liberar todo el potencial de la IA

Explore GPT-3.5 Turbo y descubra el potencial transformador del ajuste fino. Aprenda a personalizar este modelo de lenguaje avanzado para aplicaciones especializadas, mejore su rendimiento y comprenda los costes asociados, la seguridad y las consideraciones de privacidad.
Moez Ali's photo

Moez Ali

Tutorial

Tutorial de DeepSeek-Coder-V2: Ejemplos, instalación, puntos de referencia

DeepSeek-Coder-V2 es un modelo de lenguaje de código de código abierto que rivaliza con el rendimiento de GPT-4, Gemini 1.5 Pro, Claude 3 Opus, Llama 3 70B o Codestral.
Dimitri Didmanidze's photo

Dimitri Didmanidze

Tutorial

Primeros pasos con Claude 3 y la API de Claude 3

Conozca los modelos Claude 3, las pruebas de rendimiento detalladas y cómo acceder a ellas. Además, descubra la nueva API Python de Claude 3 para generar texto, acceder a funciones de visión y streaming.
Abid Ali Awan's photo

Abid Ali Awan

Tutorial

Tutorial FLAN-T5: Guía y puesta a punto

Una guía completa para afinar un modelo FLAN-T5 para una tarea de respuesta a preguntas utilizando la biblioteca de transformadores, y ejecutando la inferencia optmizada en un escenario del mundo real.
Zoumana Keita 's photo

Zoumana Keita

Ver másVer más