Ir al contenido principal

Predicción del ganador del Mundial 2026: una guía de MLOps

Descubre cómo una canalización de MLOps de extremo a extremo predice el Mundial 2026: desde el reentrenamiento automático y DVC hasta una simulación de Monte Carlo con 10.000 iteraciones del cuadro.
Actualizado 11 jun 2026  · 15 min leer

Predecir el fútbol es complicado. Es un deporte de pocos goles donde un disparo desviado puede cambiar un resultado, y en cualquier partido la suerte pesa lo suyo. El fútbol de selecciones es aún más difícil: los equipos nacionales juegan solo unos pocos partidos competitivos al año, así que hay mucha menos información que en las ligas de clubes.

\n

Y por si fuera poco, este año la FIFA lo ha complicado aún más. El Mundial ampliado a 48 selecciones introduce un nuevo formato: pasan los dos primeros de cada uno de los doce grupos y, además, ocho de los doce mejores terceros. Eso hace que los desenlaces de la fase de grupos sean impredecibles. Como me gustan los retos (y el fútbol), justo eso es lo que me propuse predecir.

\n

Este artículo es la continuación de mi proyecto de predicción de la EURO 2024, reconstruido casi desde cero. Entonces trabajé íntegramente en cuadernos de Jupyter y predecía un único marcador más probable por partido. Esta vez he construido una canalización de MLOps de extremo a extremo que ingiere resultados frescos, se reentrena sola y ejecuta 10.000 simulaciones de Monte Carlo de todo el torneo, convirtiendo las predicciones por partido en probabilidades de hasta dónde llega cada selección.

\n

En este artículo te guío por el proyecto a alto nivel: los datos y las variables, las prácticas de MLOps que garantizan la reproducibilidad, la arquitectura de la canalización y qué modelo resulta predecir mejor el fútbol de selecciones. Puedes ver el código completo en el repositorio del proyecto. Y, por supuesto, te diré a quién ve el modelo como ganador. (Spoiler: le gustan España y Argentina con alrededor de un 16% cada una, pero lo interesante es el camino hasta esa conclusión).

\n

Si esto te ha puesto en modo torneo, te recomiendo apuntarte a nuestra semana de Data & AI World Cup, una serie de sesiones sobre cómo los datos y la IA están transformando el fútbol, gratis en directo o bajo demanda.

\n

En pocas palabras

\n
    \n
  • Es una canalización de MLOps de extremo a extremo que predice el Mundial de la FIFA 2026, incorpora resultados internacionales recientes y se reentrena automáticamente en Google Cloud, cada dos horas durante el torneo.
  • \n
  • Los datos de API-Football y las valoraciones Elo se procesan con una arquitectura medallón Bronze-Silver-Gold y se versionan con DVC para una reproducibilidad total.
  • \n
  • Se compararon diez modelos de cinco familias en un conjunto de 347 partidos retenidos; XGBoost ganó por poco, los cinco primeros quedaron casi empatados y la diferencia Elo entre equipos hace la mayor parte del trabajo predictivo.
  • \n
  • Una simulación de Monte Carlo juega el torneo completo 10.000 veces, convirtiendo las predicciones de goles por partido en las probabilidades de que cada equipo avance y gane.
  • \n
  • A 10 de junio de 2026, las favoritas del modelo son España y Argentina, con aproximadamente un 16% cada una. Puedes seguir las predicciones en vivo en un dashboard de Streamlit que se actualiza cada dos horas.
  • \n

Desarrolla hoy tus habilidades MLOps

Empieza desde cero y adquiere habilidades MLOps para desarrollar tu carrera profesional.
Empieza a aprender gratis

Los datos detrás de las predicciones

\n

Una predicción solo es tan buena como los datos que la alimentan, así que merece la pena empezar por la materia prima. El modelo aprende de dos fuentes de datos en vivo y las convierte en una única tabla ordenada de variables.

\n

De dónde salen los datos

\n

Todo se construye a partir de dos fuentes. API-Football aporta el calendario y las estadísticas por partido: quién jugó contra quién, cuándo, dónde y cómo terminó. eloratings.net proporciona las valoraciones Elo de cada selección nacional.

\n

Una valoración Elo es un único número que refleja la fortaleza de un equipo. Todos los equipos se sitúan en esa escala y, tras cada partido, la valoración se actualiza: si ganas a un rival fuerte, subes mucho; si pierdes con uno más débil, caes con fuerza. La idea viene del ajedrez y encaja muy bien en el fútbol. Si quieres la intuición completa, este artículo anterior de DataCamp lo explica en el contexto del Mundial 2022.

\n

Juntas, las dos fuentes dan un dataset Gold de unas 6.900 internacionalidades desde 2018 con las que aprender.

\n

Qué predice el modelo

\n

Aquí llega la primera decisión de diseño importante. En lugar de predecir el resultado directamente como victoria, empate o derrota, el modelo predice algo más granular: el número de goles que marca cada equipo en un partido. Los conteos de goles en fútbol siguen, con buena aproximación, una distribución de Poisson, el estándar para modelar cuántas veces ocurre un evento relativamente raro en una ventana de tiempo fija.

\n

Predecir goles y no resultados es lo que hace posible todo lo demás. Una vez que el modelo puede producir un marcador verosímil para cualquier cruce, las preguntas que de verdad importan —quién sale del grupo y quién levanta la copa— pueden responderse simulando esos marcadores miles de veces.

\n

Las variables que importan

\n

Cada partido se describe con un conjunto pequeño y bien escogido de variables:

\n
    \n
  • Diferencia Elo: la brecha de valoración entre ambos equipos. Es con diferencia la variable más importante del modelo, con una importancia aproximadamente dos órdenes de magnitud por encima de la siguiente. Encaja con la intuición: la diferencia de nivel entre los dos lados dice más del resultado probable que casi nada más.
  • \n
  • Suma Elo: las dos valoraciones sumadas, un proxy de la calidad global del partido. La diferencia por sí sola no distingue Argentina–España de San Marino–Andorra, dos duelos igualados pero a niveles muy distintos; la suma recupera esa información.
  • \n
  • Cambio Elo reciente (últimos 5 partidos): cuánto ha variado últimamente la valoración de cada equipo. Capta el estado de forma controlando ya por la fuerza de los rivales.
  • \n
  • Goles a favor y en contra recientes (últimos 5): rendimiento ofensivo y defensivo reciente en términos absolutos, calculado para cada equipo.
  • \n
  • Contexto del partido: el nivel de la competición (un Mundial pesa distinto que una clasificación o la Nations League), si es eliminatoria y si se juega en campo neutral.
  • \n
\n

Todas las variables están diseñadas para evitar fugas de información: cada una usa solo datos disponibles antes del inicio. Suena obvio, pero es de las formas más fáciles de construir sin querer un modelo brillante en pruebas que se desmorona en producción.

\n

Una idea que descarté: había planeado un conjunto de variables de \"estilo de juego\" agrupando selecciones por sus estadísticas en partido, un paso de aprendizaje no supervisado. En la práctica, los equipos no se separaron en grupos significativos y, para no meter ruido al modelo, lo eliminé. Los resultados negativos también son resultados.

\n

Mantener la reproducibilidad de los datos

\n

Con datos que llegan de dos fuentes de forma continua, la ruta desde los ficheros en bruto hasta las variables listas para el modelo debe ser idéntica siempre. Eso es lo que ofrece una arquitectura medallón. Organiza los datos en tres capas:

\n
    \n
  • Bronze: el dato en bruto, tal cual llega, sin tocar.
  • \n
  • Silver: depurado y estandarizado. Aquí hago el mapeo de nombres de selecciones entre fuentes (rara vez coinciden en las grafías), valido el esquema, uno las valoraciones Elo con los registros de partido y gestiono los valores ausentes o mal formados.
  • \n
  • Gold: la capa de modelado, una fila limpia por partido con todas las variables calculadas y listas para entrenar.
  • \n
\n

Cada capa alimenta a la siguiente, así que cuando algo chirría puedo rastrearlo paso a paso en lugar de desenredarlo todo a la vez. Para hacer reproducible toda la ruta uso DVC (Data Version Control). Cuando entran resultados nuevos, un único dvc repro reconstruye Silver y Gold a partir de Bronze, rehaciendo solo los pasos cuyos inputs hayan cambiado, y versiona los datasets resultantes para poder recuperar exactamente cualquier estado anterior.

\n

Elegir el mejor modelo

\n

Predecir goles es un problema muy estudiado y no hay una herramienta única obvia. Así que, en lugar de casarme con un enfoque de entrada, construí diez y los puse a competir.

\n

Los aspirantes

\n

Los diez modelos cubren cinco familias más una línea base sencilla. No necesitas conocer las tripas de cada uno; la idea es que parten de supuestos muy distintos sobre cómo se generan los goles.

\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n
FamiliaModelosLa idea central
Línea basePoisson de tasa mediaAsume que cada equipo anota simplemente su media a largo plazo, ignorando todas las variables. Un mínimo que los demás deben superar.
EstadísticaPoisson bivariante, binomial negativaModelan directamente los dos conteos de goles con distribuciones de probabilidad diseñadas para eventos contables.
BayesianaPoisson bayesiano (MCMC)La misma idea de conteos, pero devuelve un rango completo de incertidumbre alrededor de cada estimación. Mucho más exigente computacionalmente: aproximadamente 100 veces más lento de ajustar que el resto.
Series temporalesSARIMAXTrata los resultados de un equipo como una secuencia en el tiempo y la proyecta hacia adelante.
Machine learningRidge, Random Forest, XGBoostAprenden patrones directamente de las variables sin forzar una ecuación fija.
Deep learningLSTM, CNN 1DRedes neuronales que buscan patrones secuenciales y locales en los datos.
\n

Cómo se evaluaron

\n

Con diez candidatos, elegir a ojo era imposible. En su lugar, cada modelo pasa por tres etapas y es el código el que decide si avanza. A esto nos referimos con despliegue basado en código: los modelos se promocionan de un entorno a otro mediante comprobaciones automáticas en lugar de ajustes manuales, de modo que toda la selección es reproducible y fácil de auditar.

\n
    \n
  • Experimento. Cada modelo se entrena solo con partidos internacionales jugados antes del Mundial 2022. No todos cuentan igual: los más recientes y los de mayor importancia pesan más (ponderación por decaimiento temporal e importancia del partido), así que un resultado competitivo reciente influye más que un amistoso antiguo. Luego se ajustan los hiperparámetros para minimizar la log-verosimilitud negativa de Poisson (NLL) usando validación cruzada. La NLL es una medida de lo bien que las tasas de gol predichas encajan con los goles realmente anotados: cuanto más baja, mejor. El resultado es la mejor versión ajustada de cada modelo.
  • \n
  • Garantía de calidad. Esos modelos ajustados se prueban en partidos nunca vistos: el Mundial 2022 y seis torneos importantes desde entonces (la EURO, dos Copas de África, la Copa América, la Copa Asia y la Gold Cup), 347 partidos en total. Aquí la métrica pasa a ser el ranked probability score (RPS), que mide la calidad de un pronóstico probabilístico cuando los resultados tienen un orden natural (derrota, empate, victoria) y premia la confianza en la dirección correcta. De nuevo, cuanto más bajo, mejor. El modelo más fuerte aquí se convierte en el retador. El RPS es el baremo adecuado porque el objetivo real es predecir hasta dónde llegan los equipos, no solo los totales de goles.
  • \n
  • Despliegue. El retador se compara con el campeón vigente. Si gana, se promociona y se reentrena con todos los partidos disponibles, para llegar al torneo habiendo aprendido de todos los datos.
  • \n
\n

El ganador

\n

Entonces, ¿qué enfoque salió arriba? Este es el ranking completo del holdout, medido por RPS (más bajo es mejor):

\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n
ModeloRPS holdout
XGBoost0.18289
Poisson bayesiano0.18316
Binomial negativa0.18373
Poisson bivariante0.18389
Random Forest0.18392
SARIMAX0.18583
Ridge0.18813
LSTM0.19299
CNN 1D0.20916
Poisson de tasa media (línea base)0.22872
\n

De estos resultados destacan cuatro cosas:

\n
    \n
  • XGBoost ganó, pero por la mínima. Los cinco primeros (XGBoost, Poisson bayesiano, binomial negativa, Poisson bivariante y Random Forest) acabaron separados por unos 0,0011 de RPS. Cuando cinco enfoques tan distintos quedan tan cerca, suele significar que el techo lo ponen los datos y las variables, no el modelo. Aquí, la diferencia Elo hace tanto del trabajo que la elección de modelo apenas mueve la aguja.
  • \n
  • Una variable manda. La diferencia Elo fue con mucho el predictor más importante, alrededor de cien veces más influyente que la siguiente variable. Es tranquilizador más que sorprendente: en un partido, la brecha de fuerza entre dos equipos es casi toda la historia.
  • \n
  • El deep learning quedó último (salvo la línea base). La CNN 1D y la LSTM fueron los más flojos aparte del baseline ingenuo. Con solo unos 7.000 partidos para aprender, no hay datos suficientes para redes con tantos parámetros; los métodos clásicos se defienden mucho mejor con datasets pequeños y estructurados.
  • \n
  • Sin señales de sobreajuste en los modelos clásicos. Normalmente un modelo rinde algo peor en datos no vistos que en entrenamiento. Aquí, casi todos (salvo la LSTM) puntuaron mejor en los torneos retenidos que en validación cruzada. La razón probable: el fútbol de torneo es más predecible que el calendario internacional del día a día; más en juego, equipos más fuertes y conocidos y sedes neutrales quitan parte del azar.
  • \n
\n

\"EloPara el torneo en vivo no ejecuto los diez. Me quedo con una plantilla más corta: la línea base de tasa media como referencia y los tres mejores. XGBoost y Poisson bayesiano ocupan claramente los dos primeros puestos.

\n

El tercer puesto es prácticamente un empate: la binomial negativa y la Poisson bivariante quedan separadas por 0,0002 de RPS y se alternan según la semilla aleatoria, así que, entre dos modelos estadísticamente indistinguibles, me quedé con la Poisson bivariante, cuya formulación tiene más peso en la literatura de predicción futbolística (Karlis y Ntzoufras, 2004).

\n

La plantilla final queda en XGBoost (machine learning), Poisson bivariante (estadística clásica) y Poisson bayesiano (inferencia bayesiana). En la siguiente sección verás cómo se ejecutan, se reentrenan y convierten las predicciones de un solo partido en un pronóstico para todo el torneo.

\n

Llevarlo a producción

\n

Un modelo que vive en un cuaderno solo sirve mientras estás delante. Para predecir partidos durante un torneo de un mes, todo debe funcionar solo: captar nuevos resultados, reentrenar, resinular y refrescar el pronóstico sin intervención humana. De eso se encarga la canalización.

\n

La canalización bianual en GCP

\n

Todo el proyecto se ejecuta como una única tarea programada en Google Cloud Run. Antes del torneo se activa una vez al día; desde el partido inaugural del 11 de junio, corre cada dos horas. Cada ejecución sigue el mismo ciclo:

\n
    \n
  • Comprobar si hay datos nuevos. Si no se han terminado partidos desde la última ejecución, no hay nada que hacer y la tarea termina.
  • \n
  • Ingesta y reconstrucción. Si hay resultados nuevos, se extraen de las fuentes y un único dvc repro reconstruye las capas Silver y Gold para actualizar las variables.
  • \n
  • Reentrenar, predecir, simular. Se ponen al día los modelos de la plantilla (más sobre esto en un momento), se predicen todos los cruces próximos y se simula el torneo completo.
  • \n
  • Puntuación. Cuando se cierra un partido, se puntúan sus predicciones, lo que alimenta la monitorización descrita más abajo.
  • \n
\n

Como cada paso se dispara por código en un horario, no hay que pulsar botones durante el torneo. Entran resultados nuevos, sale el pronóstico actualizado.

\n

Dos modos: congelado vs. por rondas

\n

Aquí es donde el proyecto también funciona como experimento. Durante el torneo, la plantilla corre en dos modos en paralelo, y la diferencia entre ambos es la pregunta que quiero responder con los datos: ¿mejora la retronación a medida que avanza el torneo?

\n
    \n
  • Congelado. Los modelos se bloquean al arrancar el torneo y no se reentrenan. Siguen reaccionando a los resultados, porque cada simulación parte del cuadro actualizado, pero los parámetros del modelo no cambian.
  • \n
  • Por rondas. Los hiperparámetros (la configuración de alto nivel) permanecen fijos, pero los parámetros aprendidos se reajustan con todos los datos disponibles tras cada jornada de grupos y tras cada ronda eliminatoria, de modo que los modelos siguen aprendiendo del torneo en tiempo real.
  • \n
\n

Ejecutarlos en paralelo me permite compararlos al final en dos frentes: precisión predictiva bruta y cuán rápido se reduce su incertidumbre a medida que se estrecha el cuadro. Si gana el modo por rondas, el reentrenamiento regular compensa; si el congelado aguanta, quizá la maquinaria extra no merezca la pena.

\n

De predicciones a torneo: la simulación de Monte Carlo

\n

Predecir un partido es una cosa. Convertirlo en \"qué probabilidad tiene cada equipo de ganar el torneo\" es donde entra la simulación de Monte Carlo.

\n

Primero, la inferencia. En lugar de predecir solo los cruces que ya conocemos, el modelo predice todos los emparejamientos posibles entre las 48 selecciones. Suena excesivo, pero en un torneo cualquiera puede medirse a cualquiera en el KO, así que hay que tener una predicción lista para cada pareja.

\n

Después, hay que codificar las reglas, y el formato de 2026 lo complica especialmente. En los 12 grupos, pasan automáticamente los dos primeros, pero también los ocho mejores terceros, y la casilla de octavos a la que va cada uno de esos ocho depende de qué grupos salgan.

\n

Hay 495 formas de elegir ocho grupos de entre doce (doce sobre ocho), y cada una produce un cuadro distinto para los dieciseisavos. No hay una fórmula limpia: la FIFA publica una tabla. Así que yo (o mejor dicho, mi muy capaz colega Cursor) codifiqué a mano las 495 combinaciones en un mapeo usando la tabla oficial como fuente.

\n
\"best_third_mappings\": {\n  \"EFGHIJKL\": {\n    \"74\": \"3F\",\n    \"77\": \"3G\",\n    \"79\": \"3E\",\n    \"80\": \"3K\",\n    \"81\": \"3I\",\n    \"82\": \"3H\",\n    \"85\": \"3J\",\n    \"87\": \"3L\"\n  }, \n  \"DFGHIJKL\": ...
\n

Cada clave, como EFGHIJKL, lista de qué ocho grupos proceden los terceros clasificados que avanzan, y los valores sitúan a cada uno de esos equipos (3E, 3F, etc.) en un partido concreto de dieciseisavos. Eso es una entrada; el mapeo completo la repite 495 veces, una por combinación.

\n

Las tres anfitrionas (Estados Unidos, Canadá y México) tienen un tratamiento adicional. Cuando una anfitriona juega en su propio país, la simulación aplica un ajuste de localía para ese partido, mientras que el resto del torneo se trata como terreno neutral.

\n

Con las predicciones y las reglas listas, la simulación ejecuta el torneo 10.000 veces. En cada iteración, sigue este procedimiento:

\n
    \n
  1. Extraer un marcador para cada partido muestreando goles locales y visitantes de las distribuciones predichas por el modelo
  2. \n
  3. Jugar la fase de grupos con las reglas reales de puntos y desempates
  4. \n
  5. Resolver la tabla de mejores terceros
  6. \n
  7. Rellenar el cuadro eliminatorio con los mapeos anteriores
  8. \n
  9. Jugar hasta un único campeón.
  10. \n
\n

A lo largo de 10.000 torneos simulados, la proporción de veces que una selección llega a la final o levanta el trofeo se convierte en su probabilidad. Una iteración es una conjetura; diez mil, un pronóstico.

\n

Seguimiento con MLflow

\n

Cada ejecución descrita, en ambos modos, se registra en MLflow (alojado en DagsHub). El seguimiento de experimentos significa registrar sistemáticamente inputs, configuraciones, resultados y outputs de cada ejecución para poder compararlas o reproducirlas exactamente. Destaco algunos puntos:

\n
    \n
  • Reproducibilidad. La simulación usa una semilla aleatoria fija derivada de la ronda del torneo, compartida por los modos congelado y por rondas. Así, cualquier diferencia entre ambos viene de los modelos en sí, no del azar interno de la simulación. Cada ejecución también registra el snapshot exacto de datos que vio (número de filas Gold y timestamp), para poder trazar los resultados hasta sus inputs.
  • \n
  • El experimento. Cada ejecución se etiqueta con su modo (congelado o por rondas) y su etapa en el ciclo de vida, desde experimental y QA hasta las ejecuciones en vivo de inferencia y reentrenamiento, reflejando el flujo de promoción de la sección anterior.
  • \n
  • Comparación. Se registra el RPS del holdout como métrica de selección, junto con una referencia a la ejecución campeona actual para la trazabilidad. También se anota el tiempo de ajuste, donde se ve negro sobre blanco el entrenamiento ~100 veces más lento del modelo bayesiano.
  • \n
\n

Los modelos entrenados y los propios ficheros de predicción (probabilidades del torneo, clasificaciones de grupos y pronósticos de partidos) se guardan como artefactos de ejecución, y son exactamente los que lee el dashboard en vivo. Así se cierra el ciclo: de resultados en bruto, pasando por entrenamiento y simulación, hasta los números que ves online.

\n

Monitorizar el drift

\n

La última pieza entra cuando se cierran los partidos. A medida que llegan resultados reales, se puntúan las predicciones que se hicieron para ellos y se comparan con la línea base de tasa media. Si los modelos completos empiezan a perder terreno frente a un modelo que no sabe nada de los equipos, es una señal de drift: los patrones aprendidos antes del torneo pueden no corresponderse ya con lo que pasa en el campo.

\n

Vigilar esto es práctica habitual en cualquier sistema con predicciones en vivo, y puedes leer más sobre su detección en esta guía sobre data drift y model drift.

\n

Entonces, ¿quién gana el Mundial?

\n

Después de toda esta maquinaria, aquí está el para qué.

\n

Las favoritas

\n

A 10 de junio de 2026, víspera del partido inaugural, el veredicto del modelo es claro en la cima y apretado justo detrás. España y Argentina lideran el grupo, cada una con aproximadamente un 16% de opciones de levantar el trofeo. Que salgan arriba las vigentes campeonas del mundo (Argentina) y de Europa (España) es una buena prueba de cordura: el modelo pisa suelo.

\n

Tras ellas viene un bloque perseguidor muy compacto: Francia, Inglaterra, Brasil y Colombia completan el grupo de candidatas más probables. Estas cifras están vivas y se moverán en cuanto lleguen resultados reales, así que tómalo como una foto del 10 de junio, no como una profecía fija. El dashboard muestra siempre los números actuales, con un máximo de dos horas de retraso.

\n

El dashboard en vivo

\n

Hablando de eso: todos los números de este artículo salen de una app de Streamlit en vivo que se actualiza automáticamente a medida que corre la canalización. Puedes abrirla en wc2026-predictions.streamlit.app y seguir el torneo. Tiene cuatro vistas principales:

\n
    \n
  • Visión general del torneo: de un vistazo, hasta dónde se espera que llegue cada equipo.
  • \n
  • Clasificaciones de grupos: para cada grupo, la probabilidad de que cada selección acabe primera, segunda, tercera (dividida en tercera y clasificada frente a tercera y eliminada, gracias a la regla del mejor tercero) o cuarta.
  • \n
  • Predicciones de partidos: para cada duelo de grupos, la probabilidad de victoria local, empate o victoria visitante, junto con el cuadro eliminatorio más probable.
  • \n
  • Emparejamientos eliminatorios más comunes: los cruces que la simulación genera con más frecuencia.
  • \n
\n

Un detalle a tener en cuenta en la vista de partidos: un par de selecciones aparecen a la vez en dos posibles casillas de dieciseisavos. No es un bug. Pasa cuando un grupo está tan igualado que el modelo no distingue con confianza qué puesto clasificatorio ocupará un equipo. Sumado a la incertidumbre del mejor tercero, los dos desenlaces llevan a casillas distintas en el KO. En el caso de Turquía, incluso les llevó a salir dos veces en octavos.

\n

El siguiente gráfico muestra las rondas finales (de cuartos a la final) que proyecta el modelo XGBoost antes del inicio del torneo:

\n

\"ChatGPT

\n

El equipo cara o cruz: Estados Unidos

\n

Lo divertido de un modelo así está en los equipos que contradicen el ojo. El caso más claro son los Estados Unidos. Si vas a la vista general del torneo en el dashboard, verás enseguida que EE. UU. destaca en color.

\n

Como coanfitriones, jugando en casa, cabría esperar un arranque plácido, pero el modelo es mucho más cauto: les da solo un 54,6% de opciones de salir de su grupo, la 13.ª más baja de todo el cuadro (¡recuerda que pasan dos tercios!), porque su grupo con Australia, Paraguay y Turquía está inusualmente igualado.

\n

Lo interesante llega después. Si logran pasar, EE. UU. ronda prácticamente la moneda al aire en cada ronda siguiente. Encadenando esas monedas al aire, acaban con alrededor de un 2% de probabilidad de ganar el torneo, la 13.ª más alta de las 48 selecciones.

\n

Un equipo que es 13.º por la cola para salir del grupo y 13.º por la cabeza para ganarlo todo encaja casi a la perfección en la definición de \"cara o cruz\": nunca favorito, nunca descartado.

\n

Reflexiones finales

\n

Este proyecto ha sido mucho trabajo y cubre más de lo que cabe en un artículo. En el repo hay mucho que no he podido incluir aquí: el conjunto completo de modelos candidatos, la ingeniería de variables y la orquestación que lo mantiene todo en marcha, por ejemplo.

\n

De momento, el modelo ya ha hecho sus apuestas y el torneo dictará sentencia. Hayas venido por MLOps o por el fútbol, espero que disfrutes viéndolo tanto como yo. Puedes seguir el pronóstico en vivo a medida que llegan los partidos y comprobar cómo aguantan las predicciones.

\n

Si quieres profundizar en algunos conceptos que he mencionado, te recomiendo nuestro curso MLOps Concepts.


Tom Farnschläder's photo
Author
Tom Farnschläder
LinkedIn

Editor de ciencia de datos en DataCamp | Me encanta hacer previsiones y crear con API.

Temas

Los mejores cursos de machine learning

Curso

Comprender el machine learning

2 h
292.4K
Introducción al machine learning, ¡y no hay que programar!
Ver detallesRight Arrow
Iniciar curso
Ver másRight Arrow
Relacionado
Top MLOps Tools

blog

25 Herramientas MLOps que debes conocer en 2025

Descubre las mejores herramientas MLOps para el seguimiento de experimentos, la gestión de metadatos de modelos, la orquestación de flujos de trabajo, el versionado de datos y canalizaciones, el despliegue y servicio de modelos, y la supervisión de modelos en producción.
Abid Ali Awan's photo

Abid Ali Awan

15 min

blog

8 modelos de machine learning explicados en 20 minutos

Descubre todo lo que necesitas saber sobre los tipos de modelos de machine learning, incluyendo para qué se utilizan y ejemplos de cómo ponerlos en práctica.
Natassha Selvaraj's photo

Natassha Selvaraj

15 min

Machine Learning Concept

blog

¿Qué es el machine learning? Definición, tipos, herramientas y más

Descubre todo lo que necesitas saber sobre el machine learning en 2023, incluidos sus tipos, usos, carreras profesionales y cómo iniciarte en el sector.
Matt Crabtree's photo

Matt Crabtree

14 min

MachineLearningLifecycle

blog

Explicación del ciclo de vida del machine learning

Conoce los pasos de un proyecto estándar de machine learning mientras exploramos los entresijos del ciclo de vida del machine learning utilizando CRISP-ML(Q).
Abid Ali Awan's photo

Abid Ali Awan

10 min

blog

La maldición de la dimensionalidad en el aprendizaje automático: Retos, repercusiones y soluciones

Explore la maldición de la dimensionalidad en el análisis de datos y el aprendizaje automático, incluidos sus retos, efectos en los algoritmos y técnicas como PCA, LDA y t-SNE para combatirla.
Abid Ali Awan's photo

Abid Ali Awan

7 min

blog

Los 15 mejores libros sobre machine learning para leer en 2026

Machine learning es uno de los temas más candentes en la ciencia de datos. Aquí tienes una lista de 15 libros para iniciarte en este campo o convertirte en un experto.
Javier Canales Luna's photo

Javier Canales Luna

8 min

Ver másVer más