Kurs
Futbolu tahmin etmek zordur. Az gollü bir spor olduğu için tek bir yön değiştiren şut sonucu tersine çevirebilir ve her maçın hatırı sayılır bir kısmı şansa bağlıdır. Uluslararası futbol ise daha da zordur: milli takımlar yılda yalnızca birkaç ciddi maç oynar, bu da kulüp liglerine kıyasla öğrenilecek veri miktarını çok azaltır.
B yetmezmiş gibi, FIFA bu yılki Dünya Kupası için işi daha da zorlaştırdı. Genişletilmiş 48 takımlı Dünya Kupası, her biri on iki gruptan ilk ikinin yanı sıra en iyi üçüncülerden on ikiden sekizinin de ilerlediği yeni bir format getiriyor; bu da grup aşamasındaki kaderleri öngörülemez kılıyor. İyi bir meydan okumayı (ve futbolu) sevdiğim için, tam da bunu tahmin etmeye koyuldum.
Bu, neredeyse baştan sona yeniden inşa ettiğim EURO 2024 tahmin projemin bir devamıdır. Geçen sefer tamamen Jupyter defterlerinde çalıştım ve maç başına tek bir en olası skor tahmin ettim. Bu kez, taze sonuçları alan, kendini yeniden eğiten ve tüm turnuvanın 10.000 kez Monte Carlo simülasyonunu çalıştıran, böylece maç düzeyindeki tahminleri her takımın ne kadar ilerleyeceğine dair olasılıklara çeviren uçtan uca bir MLOps hattı kurdum.
Bu yazıda, projeyi üst düzeyde anlatacağım: veri ve özellikler, tekrarlanabilirliği sağlayan MLOps uygulamaları, hat mimarisi ve milli takım futbolunu en iyi tahmin eden model hangisi. Tam kodu proje deposunda bulabilirsiniz. Ve elbette, modelin kimin kazanacağını düşündüğünü söyleyeceğim. (Spoiler: İspanya ve Arjantin’i yaklaşık yüzde 16 ile seviyor, ama asıl ilginç olan oraya nasıl vardığı.)
Bu sizi turnuva havasına soktuysa, futbolu veri ve yapay zekânın nasıl dönüştürdüğünü anlatan ve canlı veya isteğe bağlı ücretsiz izlenebilen Data & AI World Cup haftamıza göz atmanızı öneririm.
Kısaca
- Bu, 2026 FIFA Dünya Kupası’nı tahmin eden uçtan uca bir MLOps hattıdır; taze uluslararası sonuçları çeker ve turnuva boyunca Google Cloud üzerinde iki saatte bir otomatik olarak yeniden eğitir.
- API-Football ve Elo derecelendirmelerinden gelen veriler, Bronz-Gümüş-Altın madalya mimarisinden geçirilir ve tam tekrarlanabilirlik için DVC ile sürümlenir.
- Beş aileden on model, 347 maçlık bir ayrık (holdout) üzerinde karşılaştırıldı; XGBoost kıl payı kazandı, ilk beş neredeyse ayırt edilemezdi ve takımlar arasındaki Elo farkı öngörücü işin çoğunu yaptı.
- Bir Monte Carlo simülasyonu, tüm turnuvayı 10.000 kez oynatarak maç düzeyindeki gol tahminlerini her takımın ilerleme ve kazanma olasılıklarına dönüştürür.
- 10 Haziran 2026 itibarıyla modelin favorileri yaklaşık yüzde 16’şar olasılıkla İspanya ve Arjantin. Canlı tahminler, her iki saatte bir yenilenen eşlik eden bir Streamlit panosunda takip edilebilir.
Tahminlerin Arkasındaki Veriler
Bir tahmin, içine giren şey kadar iyidir; bu yüzden ham malzemelerle başlamak gerekir. Model iki canlı veri kaynağından öğrenir ve bunları tek, derli toplu bir özellikler tablosuna dönüştürür.
Veri nereden geliyor
Her şey iki kaynaktan inşa edildi. API-Football fikstürleri ve maç başına istatistikleri sağlar: kim kiminle, ne zaman, nerede oynadı ve nasıl bitti. eloratings.net ise her milli takım için Elo derecelerini sağlar.
Bir Elo derecesi, bir takımın ne kadar güçlü olduğunu tek bir sayıyla özetler. Her takım bu ölçek üzerinde bir yerde durur ve her maçtan sonra derece güncellenir: daha güçlü bir tarafı yenerseniz çok kazanırsınız; daha zayıfa kaybederseniz sert düşersiniz. Fikir satrançtan gelir ve futbola güzel uyarlanır. Tam sezgiyi isterseniz, bu önceki DataCamp yazısı 2022 Dünya Kupası bağlamında adım adım anlatır.
Birlikte ele alındığında, iki kaynak 2018’den bu yana yaklaşık 6.900 uluslararası maçlık bir Altın veri kümesi sunar.
Model neyi tahmin ediyor
İşte ilk önemli tasarım tercihi. Sonucu doğrudan galibiyet, beraberlik veya mağlubiyet olarak tahmin etmek yerine, model daha ince taneli bir şeyi tahmin eder: her takımın bir maçta attığı gol sayısını. Futbolda gol sayıları, oldukça iyi bir yaklaşıklıkla, bir zaman penceresinde nispeten nadir bir olayın ne sıklıkta gerçekleştiğini modellemenin standart yolu olan Poisson dağılımını izler.
Sonuçlar yerine golleri tahmin etmek, sonraki her şeyi mümkün kılar. Model herhangi bir eşleşme için makul bir skor üretebildiğinde, herkesin aslında merak ettiği sorular —kim gruptan çıkacak ve kim kupayı kaldıracak— bu skorların binlerce kez simüle edilmesiyle yanıtlanabilir.
Önemli özellikler
Her maç, küçük ama özenle seçilmiş bir özellik kümesiyle tanımlanır:
- Elo farkı: iki takımın dereceleri arasındaki fark. Bu, modelde açık ara en önemli tek özelliktir; bir sonrakine göre yaklaşık iki büyüklük mertebesi daha yüksek öneme sahiptir. Bu da sezgiyle uyumludur; iki taraf arasındaki güç farkı, olası sonuç hakkında neredeyse her şeyden daha fazla şey söyler.
- Elo toplamı: iki derecenin toplamı, fikstürün genel kalitesinin bir vekili. Fark tek başına Arjantin-İspanya ile San Marino-Andorra maçlarını ayırt edemez; ikisi de dengeli ama tamamen farklı seviyelerdeki maçlardır; toplam bu bilgiyi geri kazandırır.
- Yuvarlanan Elo değişimi (son 5 maç): her takımın derecesinin son dönemde ne kadar değiştiği. Bu, karşılaşılan rakiplerin gücünü zaten hesaba katarak formu yakalar.
- Yuvarlanan atılan ve yenilen goller (son 5 maç): her takım için mutlak terimlerle son hücum ve savunma üretimi.
- Maç bağlamı: turnuva seviyesi (bir Dünya Kupası maçı, elemeye veya Uluslar Ligi maçına göre farklı ağırlık taşır), maçın eleme olup olmadığı ve tarafsız sahada oynanıp oynanmadığı.
Her özellik kesinlikle sızıntı güvenlidir; yani her biri yalnızca başlama vuruşundan önce mevcut olan bilgiyi kullanır. Kulağa bariz gelse de, testte harika görünüp gerçek dünyada dağılan bir model inşa etmenin en kolay yollarından biridir.
Listeye giremeyen bir fikir: Oyun içi istatistiklerinden takımları kümeleyerek oluşturulan bir dizi "oyun tarzı" özelliği planlamıştım; bu bir gözetimsiz öğrenme adımı olacaktı. Pratikte, takımlar anlamlı gruplara ayrılmadı; bu yüzden modele gürültü beslemek yerine vazgeçtim. Olumsuz sonuç da sonuçtur.
Veriyi tekrarlanabilir tutmak
İki kaynaktan sürekli veri gelirken, ham dosyalardan model için hazır özelliklere giden yolun her seferinde birebir aynı olması gerekir. Madalya mimarisi tam da bunu sağlar. Veriyi üç katmanda düzenler:
- Bronz: ham veri, geldiği gibi, dokunulmadan bırakılır.
- Gümüş: temizlenmiş ve standartlaştırılmış. Burada iki kaynak arasında takım adlarını eşliyorum (yazımları nadiren tutarlıdır), şemayı doğruluyorum, maç kayıtlarına Elo derecelerini ekliyorum ve eksik/bozuk olan her şeyle ilgileniyorum.
- Altın: modelleme katmanı; her maç için tüm özellikleri hesaplanmış, eğitime hazır tek bir derli toplu satır.
Her katman bir sonrakini besler; böylece bir şey tuhaf göründüğünde her şeyi bir anda çözmek yerine bir aşama geriye izleyebilirim. Tüm yolu tekrarlanabilir kılmak için DVC (Data Version Control) kullanıyorum. Taze sonuçlar geldiğinde, tek bir dvc repro Gümüş ve Altın’ı Bronz’dan yeniden inşa eder; bir adımı yalnızca girdileri değiştiyse yeniden çalıştırır ve ortaya çıkan veri kümelerini sürümler, böylece önceki herhangi bir duruma birebir geri dönülebilir.
En İyi Modeli Seçmek
Golleri tahmin etmek iyi çalışılmış bir problemdir ve bunun için tek bir bariz araç yoktur. Bu yüzden baştan tek bir yaklaşıma bağlı kalmak yerine on tane kurup birbirleriyle yarıştırdım.
Adaylar
On model, basit bir temel çizgiye ek olarak beş aileye yayılır. Her birinin iç işleyişini bilmeniz gerekmez; önemli olan, gollerin nasıl ortaya çıktığına dair çok farklı varsayımlar yapmalarıdır.
| Aile | Modeller | Çekirdek fikir |
|---|---|---|
| Temel çizgi | Ortalama-oranlı Poisson | Her takımın tüm özellikleri yok sayarak uzun vadeli genel ortalamasını attığını varsayar. Diğerlerinin geçmesi gereken taban. |
| İstatistiksel | Çift değişkenli Poisson, Negatif Binom | İki gol sayısını, olayları saymaya yönelik olasılık dağılımlarıyla doğrudan modeller. |
| Bayesçi | Bayesçi Poisson (MCMC) | Aynı sayma fikri, ancak her tahmin etrafında tam bir belirsizlik aralığı döndürür. Hesaplama açısından çok daha zahmetli: geri kalanlara kıyasla yaklaşık 100 kat daha yavaş uyum sağlar. |
| Zaman serisi | SARIMAX | Bir takımın sonuçlarını zaman içinde bir dizi olarak ele alır ve bu diziyi ileriye projekte eder. |
| Makine öğrenmesi | Ridge, Rastgele Orman, XGBoost | Sabit bir denkleme bağlı kalmadan doğrudan özelliklerden kalıplar öğrenir. |
| Derin öğrenme | LSTM, 1D CNN | Veride sıralı ve yerel kalıpların peşine düşen sinir ağları. |
Nasıl puanlandılar
On adayla, göz kararı bir kazanan seçmek mümkün değildi. Bunun yerine her model üç aşamadan geçer ve yoluna devam edip etmediğine kod karar verir. Kod tabanlı dağıtım denilen şey budur: Modeller bir ortamdan diğerine manuel ayardan ziyade otomatik kontrollerle terfi ettirilir; böylece tüm seçim süreci tekrarlanabilir ve denetlenmesi kolay olur.
- Deney. Her model yalnızca 2022 Dünya Kupası öncesinde oynanmış uluslararası maçlarda eğitilir. Bu maçların hepsi eşit ağırlıkta değildir: daha yeni maçlara ve daha yüksek öneme sahip fikstürlere daha fazla ağırlık verilir (zamanla azalan ve maç önemi ağırlığı); böylece yakın zamandaki ciddi bir sonuç, eski bir hazırlık maçından daha fazla şekillendirir. Ardından her modelin ayarları, çapraz doğrulama kullanılarak Poisson negatif log-olasılık (NLL) en aza inecek şekilde ayarlanır. NLL, tahmin edilen gol oranlarının takımların attığı gollerle ne kadar örtüştüğünü ölçen bir skordur; daha düşük daha iyidir. Sonuç, her modelin en iyi ayarlanmış versiyonudur.
- Kalite güvencesi. Bu ayarlı modeller, hiç görmedikleri maçlarda test edilir: 2022 Dünya Kupası artı o tarihten beri düzenlenen altı büyük turnuva (EURO, iki Afrika Uluslar Kupası, Copa América, Asya Kupası ve Gold Cup) toplam 347 maç. Burada metrik sıralı olasılık skoru (RPS)na döner; bu skor, kayıp, beraberlik, galibiyet gibi doğal bir sıralamaya sahip sonuçlarda olasılıklı bir tahminin ne kadar iyi olduğunu ve kabaca doğru yönde emin olmayı ödüllendirir. Yine daha düşük daha iyidir. Burada en güçlü model mevcut şampiyona meydan okuyan olur. RPS doğru kıstastır; çünkü gerçek amaç yalnızca gol toplamlarını değil, takımların ne kadar ileri gittiğini tahmin etmektir.
- Canlıya al. Meydan okuyan, halihazırdaki şampiyonla karşılaştırılır. Kazanırsa terfi eder ve mevcut tüm maçlarda yeniden eğitilir; böylece turnuvaya tüm verilerden öğrenmiş olarak girer.
Kim kazandı
Peki hangi yaklaşım zirvede yer aldı? İşte RPS ile (düşük daha iyi) puanlanan tam ayrık küme liderlik tablosu:
| Model | Ayrık RPS |
|---|---|
| XGBoost | 0.18289 |
| Bayesçi Poisson | 0.18316 |
| Negatif Binom | 0.18373 |
| Çift değişkenli Poisson | 0.18389 |
| Rastgele Orman | 0.18392 |
| SARIMAX | 0.18583 |
| Ridge | 0.18813 |
| LSTM | 0.19299 |
| 1D CNN | 0.20916 |
| Ortalama-oranlı Poisson (temel) | 0.22872 |
Bu sonuçlardan dört nokta öne çıkıyor:
- XGBoost kazandı ama kıl payı. İlk beş model (XGBoost, Bayesçi Poisson, Negatif Binom, Çift değişkenli Poisson ve Rastgele Orman) birbirinden yaklaşık 0,0011 RPS içinde tamamladı. Birbirinden çok farklı beş yaklaşım bu kadar yakın biterse, tavanın modelden ziyade veriler ve özellikler tarafından belirlendiği anlamına gelir. Burada Elo farkı işin o kadar büyük kısmını yapıyor ki, model seçimi ibreyi zar zor oynatıyor.
- Tek bir özellik baskın. Elo farkı, açık ara en önemli belirleyiciydi; bir sonrakine göre kabaca yüz kat daha etkili. Bu şaşırtmaktan çok güven verici: Tek bir maçta iki takım arasındaki güç farkı gerçekten de hikâyenin büyük kısmıdır.
- Derin öğrenme, temel hariç son sırada. 1D CNN ve LSTM, saf temel dışında en zayıf modeller oldu. Öğrenilecek yalnızca yaklaşık 7.000 maç varken, bu kadar çok parametreli ağları beslemek için yeterli veri yok; klasik yöntemler küçük, yapılandırılmış veri kümeleriyle çok daha iyi başa çıkıyor.
- Klasik modellerde aşırı uyum belirtisi yok. Normalde bir model, görülmemiş veride eğitimdekinden biraz daha kötü performans gösterir. Burada neredeyse her model (LSTM hariç) çapraz doğrulamadan daha iyi puanı ayrık turnuvalarda aldı. Muhtemel sebep, turnuva futbolunun sıradan uluslararası takvime göre daha öngörülebilir olması: daha yüksek önem, daha güçlü ve daha tanıdık takımlar ve tarafsız sahalar rastgeleliği bir miktar azaltır.
Canlı turnuva için onunun hepsini çalıştırmıyorum. Daha küçük bir kadro tutuyorum: referans noktası olarak ortalama-oranlı temel, artı en iyi üç performans gösteren. XGBoost ve Bayesçi Poisson, ilk iki sırayı doğrudan alıyor.
Üçüncülük fiilen berabere: Negatif Binom ve Çift değişkenli Poisson birbirinden 0,0002 RPS içinde bitiriyor ve rastgele tohuma bağlı olarak yer değiştiriyor; bu yüzden istatistiksel olarak ayırt edilemez iki model arasında, formülasyonu futbol tahmin literatüründe daha güçlü temele sahip (Karlis ve Ntzoufras, 2004) olan Çift değişkenli Poisson’u seçtim.
Böylece elimizde XGBoost (makine öğrenmesi), Çift değişkenli Poisson (klasik istatistik) ve Bayesçi Poisson (Bayesçi çıkarım) kadrosu kalıyor. Sonraki bölüm, bu modellerin nasıl çalıştığını, yeniden eğitildiğini ve tek maç tahminlerini tam bir turnuva öngörüsüne nasıl dönüştürdüğünü anlatıyor.
Prodüksiyona Taşımak
Bir defterde yaşayan model, yalnızca önünde oturduğunuz sürece işe yarar. Bir ay sürecek bir turnuva boyunca maçları tahmin etmek için her şeyin kendi kendine çalışması gerekir: yeni sonuçları çekmek, yeniden eğitmek, yeniden simüle etmek ve kimse dokunmadan öngörüleri tazelemek. Bu, hattın işidir.
GCP üzerinde iki saatte bir çalışan hat
Tüm proje Google Cloud Run üzerinde tek bir zamanlanmış iş olarak çalışır. Turnuva öncesinde günde bir kez uyanır; 11 Haziran’daki açılış maçından itibaren her iki saatte bir çalışır. Her çalıştırma aynı döngüyü izler:
- Yeni veri kontrolü. Son çalıştırmadan beri biten maç yoksa yapılacak bir şey yoktur ve iş erken çıkar.
- Alım ve yeniden inşa. Yeni sonuçlar geldiyse, veri kaynaklarından çekilir ve tek bir
dvc reproözellikler güncel olacak şekilde Gümüş ve Altın katmanlarını yeniden inşa eder. - Yeniden eğit, tahmin et, simüle et. Kadrodaki modeller güncellenir (birazdan nasıl olduğuna değineceğim), yaklaşan her eşleşme tahmin edilir ve tüm turnuva simüle edilir.
- Puanla. Bir maç sonuçlandığında, o maç için yapılan tahminler puanlanır; bu da aşağıda anlatılan izlemeyi besler.
Her adım bir zamanlamayla kod tarafından tetiklendiği için, turnuva sırasında manuel düğme basma yoktur. Yeni sonuç girer, tazelenmiş öngörü çıkar.
İki mod: donuk (frozen) vs. tur başına
Projenin deney tarafı burada devreye giriyor. Turnuva sırasında kadro iki paralel modda çalışır ve aralarındaki fark, veriden yanıtlamayı umduğum sorudur: Turnuva ilerledikçe yeniden eğitmek tahminleri iyileştirir mi?
- Donuk. Modeller, turnuva başlar başlamaz kilitlenir ve hiç yeniden eğitilmez. Yine de sonuçlara tepki verirler; çünkü her simülasyon güncellenmiş fikstürden başlar; ancak model parametrelerinin kendisi değişmez.
- Tur başına. Hiperparametreler (üst düzey ayarlar) sabit kalır; ancak modelin öğrendiği parametreler, her tamamlanan grup maç günü ve her eleme turundan sonra mevcut tüm verilerle yeniden uyumlanır; böylece modeller turnuva yaşandıkça öğrenmeye devam eder.
İkisini yan yana çalıştırmak, bittikten sonra iki cephede karşılaştırma yapmama olanak tanır: ham öngörü doğruluğu ve alan daraldıkça her birinin belirsizliğinin ne kadar hızlı çözüldüğü. Tur başına kazanırsa, düzenli yeniden eğitim emeğinin karşılığını verir; donuk ayakta kalırsa, ek mekanizma değmeyebilir.
Tahminlerden turnuvaya: Monte Carlo simülasyonu
Tek bir maçı tahmin etmek başka şey; bunu “her takımın turnuvayı kazanma şansı nedir”e çevirmek başka. Burada Monte Carlo simülasyonu devreye girer.
Önce çıkarım. Yalnızca bildiğimiz fikstürleri tahmin etmek yerine, model 48 takım arasındaki her olası eşleşmeyi tahmin eder. Aşırı gelebilir; ama bir turnuvada herhangi bir takım eleme turlarında herhangi bir takımla eşleşebilir; bu nedenle her ikili için bir tahmin hazır olmalıdır.
Sonra kurallar kodlanmalıdır ve 2026 formatı bunu özellikle zahmetli kılar. 12 grup boyunca, ilk ikiler otomatik olarak ilerler; ancak en iyi üçüncülerden sekizi de ilerler ve bu sekizin hangisinin hangi eleme slotuna düştüğü, geldikleri gruplara bağlıdır.
On iki gruptan sekizini seçmenin 495 yolu vardır (on ikiden sekiz kombinasyonu) ve her biri farklı bir son 32 eşleşme seti üretir. Bunun temiz bir formülü yok; FIFA basitçe bir tablo yayınlar. Bu yüzden ben (daha doğrusu çok yetenekli meslektaşım Cursor) resmi tabloyu kaynak alarak tüm 495 kombinasyonu bir eşlemeye sabit kodladım.
"best_third_mappings": {
"EFGHIJKL": {
"74": "3F",
"77": "3G",
"79": "3E",
"80": "3K",
"81": "3I",
"82": "3H",
"85": "3J",
"87": "3L"
},
"DFGHIJKL": ...
EFGHIJKL gibi her anahtar, ilerleyen üçüncülerin geldiği sekiz grubu listeler ve değerler bu takımları (3E, 3F vb.) belirli bir son 32 maç numarasına yerleştirir. Bu tek bir girdidir; tam eşleme, kombinasyon başına bir kez olmak üzere 495 kez tekrar eder.
Üç ev sahibi ülke (Amerika Birleşik Devletleri, Kanada ve Meksika) için bir ekstra işlem daha var. Bir ev sahibi kendi ülkesinde sahnelenen bir maç oynadığında, simülasyon o fikstür için ev sahibi avantajı ayarı uygular; turnuvanın geri kalanı tarafsız saha kabul edilir.
Tahminler ve kurallar hazır olduğunda, simülasyon tüm turnuvayı 10.000 kez çalıştırır. Her çalıştırmada şu prosedürü izler:
- Modelin tahmin ettiği dağılımlardan iç saha ve deplasman gollerini örnekleyerek her maç için bir skor çek
- Grup aşamasını gerçek puan ve tiebreak kurallarıyla oyna
- En iyi üçüncüler tablosunu çözümler
- Yukarıdaki eşlemelerden eleme fikstürünü doldur
- Tek bir şampiyona kadar oyna.
10.000 simüle turnuva boyunca, bir takımın finale ulaştığı ya da kupayı kaldırdığı koşuların payı o takımın olasılığına dönüşür. Bir koşu bir tahmindir; on bin koşu bir öngörüdür.
Hepsini MLflow ile takip etmek
Şimdiye kadar anlatılan her çalıştırma, her iki modda da MLflow’a ( DagsHub üzerinde barındırılır) kaydedilir. Deney takibi, her çalıştırmanın girdilerini, ayarlarını, sonuçlarını ve çıktılarını sistematik olarak kaydetmek demektir; böylece herhangi ikisi birbiriyle karşılaştırılabilir veya birebir çoğaltılabilir. Kaydedilen birkaç unsur anılmaya değer:
- Tekrarlanabilirlik. Simülasyon, turnuva turundan türetilmiş sabit bir rastgele tohum kullanır ve aynı tohum donuk ve tur başına modları tarafından paylaşılır. Bu, ikisi arasındaki farkın, simülasyon içindeki kura şansından değil, bizzat modellerden kaynaklandığı anlamına gelir. Her çalıştırma ayrıca gördüğü veri anlık görüntüsünü (Altın satır sayısı ve zaman damgası) kaydeder; böylece sonuçlar her zaman girdilerine geri izlenebilir.
- Deney. Her çalıştırma, modu (donuk veya tur başına) ve yaşam döngüsündeki aşamasıyla etiketlenir; deneysel ve QA’dan canlı çıkarım ve yeniden uyum çalıştırmalarına kadar; bir önceki bölümdeki terfi akışını yansıtır.
- Karşılaştırma. Seçim metriği olarak ayrık RPS kaydedilir ve soyağacı için mevcut şampiyon çalıştırmaya bir referans eklenir. Uyum süresi de kaydedilir; burada Bayesçi modelin yaklaşık 100 kat daha yavaş eğitimi siyah beyaz ortaya çıkar.
Eğitilmiş modeller ve tahmin dosyalarının kendisi (turnuva olasılıkları, grup sıralamaları ve maç öngörüleri) koşu artifaktları olarak saklanır ve canlı panonun okuduğu dosyalar tam olarak bunlardır. Böylece döngü kapanır: ham sonuçlardan, eğitim ve simülasyon aracılığıyla çevrimiçi görebileceğiniz sayılara.
Kaymayı izlemek
Son parça, maçlar sonuçlandığında çalışır. Gerçek sonuçlar geldikçe, onlar için yapılan tahminler puanlanır ve basit ortalama-oranlı temel ile karşılaştırılır. Tam modeller, takımlar hakkında hiçbir şey bilmeyen bir modele karşı zemin kaybetmeye başlarsa, bu bir kayma uyarısıdır: turnuva öncesinde öğrenilen kalıplar artık sahada olan bitenle uyuşmuyor olabilir.
Bunu izlemek, canlı tahmin yapan her sistem için standart uygulamadır ve bunun nasıl tespit edildiğini bu veri kayması ve model kayması rehberinde daha fazla okuyabilirsiniz.
Peki, Dünya Kupası’nı Kim Kazanır?
Tüm bu mekanizmanın amacı burada.
Favoriler
11 Haziran 2026’daki açılış maçından bir gün önce, 10 Haziran 2026 itibarıyla, modelin kararı zirvede net, hemen arkasıysa kalabalık. İspanya ve Arjantin, kupayı kaldırma olasılığı yaklaşık yüzde 16 ile başı çekiyor. Son dünya şampiyonu (Arjantin) ve son Avrupa şampiyonu (İspanya) zirvede çıkması, modelin gerçekliğe dayandığına dair rahatlatıcı bir sağlamlık kontrolü.
Arkalarında sıkı bir takip grubu var: Fransa, İngiltere, Brezilya ve Kolombiya en muhtemel kazananları tamamlıyor. Bunlar canlı rakamlardır ve gerçek sonuçlar düşmeye başlar başlamaz oynar; bu yüzden bunları sabit bir kehanetten ziyade 10 Haziran fotoğrafı olarak görün. Pano her zaman güncel sayıları gösterir; en fazla iki saat gecikmeyle.
Canlı pano
Hazır yeri gelmişken: Bu yazıdaki tüm sayılar, hat çalıştıkça otomatik güncellenen canlı bir Streamlit uygulamasından gelir. wc2026-predictions.streamlit.app adresinden açıp turnuva boyunca takip edebilirsiniz. Dört ana görünümü vardır:
- Turnuva genel bakış: her takımın ne kadar ileri gitmesinin beklendiği, tek bakışta.
- Grup sıralamaları: her grup için, her takımın birinci, ikinci, üçüncü (en iyi üçüncü kuralı sayesinde üçüncü ve tur atlayan ile üçüncü ve elenen olarak ayrılmış) veya dördüncü bitirme olasılığı.
- Maç tahminleri: her grup maçı için iç saha galibiyeti, beraberlik veya deplasman galibiyeti olasılığı ve en olası eleme fikstürü.
- En sık görülen eleme eşleşmeleri: simülasyonun en sık ürettiği eşleşmeler.
Maç görünümünde belirtmeye değer bir tuhaflık: birkaç takım aynı anda iki olası son 32 slotunda görünüyor. Bu bir hata değil. Bir grubun o kadar dengeli olduğu durumlarda model, bir takımın hangi eleme pozisyonunu alacağını güvenle söyleyemediğinde olur. En iyi üçüncü belirsizliğiyle birleştiğinde bu iki sonuç farklı eleme slotlarına yol açar. Türkiye özelinde, onları son 16’da iki kez göstermeye bile yol açtı.
Aşağıdaki görsel, XGBoost modelinin, turnuva başlarken projekte ettiği final turlarını (çeyrek finallerden finale kadar) gösteriyor:

Yazı tura takımı: Amerika Birleşik Devletleri
Bu tür bir modelin eğlencesi, göz testine meydan okuyan takımlarda yatar ve en net örnek Amerika Birleşik Devletleri’dir. Panodaki turnuva genel görünümüne giderseniz, ABD’nin renkte hemen öne çıktığını fark edersiniz.
Eş ev sahibi olarak kendi taraftarları önünde oynarken rahat bir başlangıç bekleyebilirsiniz; ancak model çok daha temkinli: gruplarından çıkma olasılıklarını yalnızca yaklaşık yüzde 54,6 olarak veriyor; bu, tüm alan içinde 13. en düşük değer (takımların üçte ikisinin çıktığını unutmayın!), çünkü Avustralya, Paraguay ve Türkiye ile grupları alışılmadık derecede dengeli.
İlginç olan, sonrasında olan. Kıl payı çıktıktan sonra, ABD’nin takip eden her turda aşağı yukarı yazı tura oranında şansı oluyor. Bu yazı turaları üst üste koyduğunuzda, turnuvayı kazanma olasılıkları yaklaşık yüzde 2’ye ulaşıyor ki bu, 48 takımın içinde 13. en yüksek oran.
Grubundan çıkmada alttan 13., kazanmakta üstten 13. sırada yer alan bir takım, yazı tura takımının tam tanımıdır: asla favori değil, asla dışarıda değil.
Son Düşünceler
Bu proje çok emek istedi ve tek bir yazının sığdırabileceğinden çok daha fazla alanı kapsıyor. Depoda buraya girmeyen pek çok şey var: aday modellerin tam seti, özellik mühendisliği ve her şeyi çalışır halde tutan orkestrasyon bunlardan bazıları.
Şimdilik model seçimlerini yaptı ve turnuva hakemlik edecek. MLOps için ya da futbol için geldiyseniz, umarım ben izlerken alacağım kadar keyif alırsınız. Maçlar geldikçe canlı öngörüyü takip edebilir ve tahminlerin ne kadar iyi tuttuğunu görebilirsiniz.
Sözünü ettiğim kavramlara daha yakından bakmak isterseniz, MLOps Concepts kursumuzu öneririm.
Tom bir veri bilimci ve teknik eğitmendir. DataCamp'in veri bilimi eğitim içerikleri ve blog yazılarını yazar ve yönetir. Daha önce Tom, Deutsche Telekom'da veri bilimi alanında çalıştı.

