Futbolda ELO Derecelendirmeleri - Tahminler için Takım Gücünü Ölçme
Her tahmin modelinin, bir takımın şu anda ne kadar güçlü olduğunu ölçmenin bir yoluna ihtiyacı vardır - geçen sezon değil, tarihsel olarak değil, bugün. ELO derecelendirmeleri basit, zarif bir çözüm sağlar. PI derecelendirmeleri, saldırıyı savunmadan ve evi uzaktan ayırarak bunu daha da ileri götürür. Her ikisinin de nasıl çalıştığı ve ExPrysm'nin bunları neden birlikte kullandığı aşağıda açıklanmıştır.
ELO Derecelendirmeleri Nedir?
ELO derecelendirme sistemi, 1960'larda Arpad Elo tarafından satranç oyuncularını sıralamak için icat edildi. Temel fikir çok basit: Her takım bir temel puanla başlar (tipik olarak 1500) ve her maçtan sonra kazanan puan kazanırken kaybeden puan kaybeder. Aktarılan miktar, sonucun ne kadar şaşırtıcı olduğuna bağlıdır.
Güçlü bir takım zayıf bir takımı yenirse, birkaç puan el değiştirir - sonuç bekleniyordu. Zayıf takım kazanırsa, birçok puan transferi - üzüntü daha fazla bilgi taşır. Zamanla, derecelendirmeler gerçek takım gücünü yansıtacak şekilde birleşir.
ELO, FIFA (2018'e kadar dünya sıralamaları için) ve FiveThirtyEight dahil olmak üzere çeşitli araştırmacılar ve kuruluşlar tarafından futbol için uyarlandı. İyi çalışıyor çünkü futbolun net galibiyet/beraberlik/kayıp sonuçları var ve takımlar reytinglerin güncel kalması için yeterince sık oynuyor.
ELO Nasıl Çalışır
ELO güncelleme kuralının üç bileşeni vardır:
Beklenen Puan
Bir maçtan önce ev sahibi takım için beklenen skor puan farkından hesaplanır:
Eev = 1 / (1 + 10(Ruzakta − Rev − HFA)/400)
Burada R mevcut derecelendirmedir ve HFA iç saha avantajı ayarıdır (tipik olarak 50-100 puan).
K-Faktörü
K-faktörü, her maçtan sonra derecelendirmelerin ne kadar değiştiğini kontrol eder. Daha yüksek bir K, derecelendirmelerin son sonuçlara daha hızlı tepki verdiği anlamına gelir (daha değişken), daha düşük bir K, derecelendirmelerin daha kararlı ancak uyum sağlamasının daha yavaş olduğu anlamına gelir. Tipik değerler futbol için 20 ila 40 arasında değişir.
Kuralı Güncelle
Maçtan sonra, puanlar gerçek sonuç ile beklenen skor arasındaki farka göre güncellenir:
Rnew = Rold + K × (Sgerçek − Ebeklenen)
Nerede Sgerçek = Bir galibiyet için 1, beraberlik için 0,5, bir mağlubiyet için 0.
A Takımı (1650 puan) evinde B Takımına karşı oynuyor (puan 1500). K = 30 ve HFA = 65 ile:
EA = 1 / (1 + 10(1500 − 1650 − 65) /400) = 0.78
Takım A kazanırsa: RA = 1650 + 30 × (1 − 0,78) = 1656.6 (+6.6)
B Takımı kazanırsa: RA = 1650 + 30 × (0 − 0,78) = 1626,6 (−23,4)
Üzüntü, beklenen sonuçtan çok daha fazla puan aktarıyor.
Futbol Bağlamında ELO
Neden Çalışır?
ELO aynı anda iki şeyi yakalar: temel takım kalitesi ve son form. Kazanma serisindeki bir takım, hem gerçek gelişmeyi hem de ivmeyi yansıtan derecelendirme yükselişini görecektir. Bu, ELO"yu tahmin modelleri için kompakt, bilgi açısından zengin bir özellik haline getirir.
Sınırlamalar
Standart ELO'nun futbol için temel bir sınırlaması vardır: takım başına tek bir sayı üretir. Bu, saldırıda güçlü ancak savunmada zayıf olan bir takım ile evinde ve deplasmanda farklı performans gösteren bir takım arasında ayrım yapamayacağı anlamına gelir. 1600 puan alan bir takım 3-2 veya 1-0 takım olabilir - ELO onlara aynı şekilde davranır.
Pi-ratings: Bir Sonraki Evrim
2013 yılında Anthony Constantinou ve Norman Fenton, ELO'nun temel sınırlamalarını ele alan futbol için özel olarak tasarlanmış bir derecelendirme sistemi olan PI derecelendirmelerini tanıtan bir makale yayınladılar. Takım başına bir sayı yerine, PI derecelendirmeleri dört sayı korur:
PI derecelendirme sistemi, orijinal kağıttan üç temel parametreyi kullanır:
| Parametre | Değer | Amaç |
|---|---|---|
| b | 10 | Derecelendirme güncellemeleri için temel çarpan |
| c | 3 | Gol farkına duyarlılığı kontrol eder |
| lr | 0.1 | Öğrenme oranı - derecelendirmeler ne kadar hızlı uyum sağlar |
Her maçtan sonra, her iki takım için dört reytingin tümü, atılan ve alınan gollere göre güncellenir. Takım evinde gol attığında ev sahibi saldırı derecesi artar; rakibin deplasman savunma puanı düşer. Bu, ekip gücünün zengin, çok boyutlu bir resmini yaratır.
PI derecelendirmeleri her maç gününden sonra aşamalı olarak güncellenir. ExPrysm, tahminler oluşturmadan önce derecelendirmelerin en son sonuçları yansıtmasını sağlamak için günlük güncellemeler çalıştırır.
ExPrysm Takım Derecelendirmelerini Nasıl Kullanır
ExPrysm bağımsız öngörücüler olarak ELO veya PI derecelendirmelerini kullanmaz. Bunun yerine, CatBoost gradyan artırma modellerinde özellikler olarak hizmet ederler:
- Maç Sonucu Modeli: 69 özelliği arasında hem ELO derecelendirmelerini hem de PI derecelendirmelerini kullanır. CatBoost sınıflandırıcısı, maç sonuçlarını tahmin etmek için derecelendirme farklılıklarının diğer özelliklerle (form, kafa kafaya, lig pozisyonu) nasıl etkileşime girdiğini öğrenir.
- Goller Modeli: Poisson regresyon modelleri (53 özellik) beklenen golleri tahmin etmeye yardımcı olmak için PI derecelendirmelerini kullanır. Saldırı/savunma ayrımı burada özellikle değerlidir - bir takımın ev saldırısı derecesi, kaç gol atacaklarını doğrudan bildirir.
- Özellik Önemi: PI derecelendirmeleri, maç sonucu modelindeki toplam özellik öneminin yaklaşık% 24,5'ini oluşturarak onları en etkili özellik grubu haline getirir. Bu, takım gücü ölçümünün doğru tahminin temeli olduğunu doğrular.
ExPrysm'deki temel tasarım kararı, modellerin tekil tabanlı özellikler kullanmamasıdır. Takım derecelendirmeleri, modelin bahis oranlarına bağlanmadan kendi olasılık tahminlerini oluşturmasına olanak tanıyan “piyasadan bağımsız” güç sinyali sağlar.
ELO vs Pi-Derecelendirmeleri Karşılaştırması
| Görünüm | ELO | Pi-Derecelendirmeleri |
|---|---|---|
| Takım başına değerler | 1 | 4 |
| Saldırı/Savunma bölünmesi | No | Yes |
| Ana Sayfa/Away split | Hayır (sabit HFA) | Evet (ayrı derecelendirmeler) |
| Kullanılan gol farkı | İsteğe Bağlı | Yerleşik |
| Karmaşıklık | Basit | Orta |
| Yorumlanabilirlik | Çok yüksek | Yüksek |
| Bilgi yoğunluğu | Low | Yüksek |
| Akademik temel | Elo (1960'lar) | Constantine ve Fenton (2013) |
Her iki sistemin de değeri vardır. ELO basit ve yorumlanabilir bir temel sağlar - 1700 dereceli bir takımın 1500 puan alan bir takımdan daha güçlü olduğunu hemen anlayabilirsiniz. PI derecelendirmeleri, özellikle saldırı/savunma ve ev/deplasman ayrımları olmak üzere makine öğrenimi modellerinin yararlanabileceği daha zengin bilgiler sağlar.
Tahminler Üzerindeki Pratik Etki
Derecelendirme farklılıkları kazanma olasılıklarına nasıl dönüşür? İşte ELO farklılıklarından yaklaşık bir eşleme:
| ELO Farkı | Daha Güçlü Takım Kazanışı % | Beraberlik % | Zayıf Takım Kazanışı % |
|---|---|---|---|
| 0 (eşit) | ~36% | ~28% | ~36% |
| +100 | ~45% | ~27% | ~28% |
| +200 | ~55% | ~24% | ~21% |
| +300 | ~64% | ~21% | ~15% |
| +400 | ~72% | ~17% | ~11% |
Bunlar kaba tahminlerdir - ExPrysm'nin CatBoost modeli, sadece derecelendirme farkını değil, 69 özelliğin tümünü birlikte ele alarak daha nüanslı olasılıklar üretir. Ancak bu tablo, derecelendirmelerin neden bu kadar değerli olduğunu göstermektedir: Bir takımın tüm maç geçmişini tek bir tahmine dayalı sinyalde sıkıştırırlar.
PI derecelendirmeleri ile model daha da ayrıntılı hale gelir. Ev saldırısı derecesi yüksek ancak deplasman savunma derecesi düşük olan bir takım, evde mi yoksa deplasmanda mı oynadıklarına bağlı olarak çok farklı tahminler üretecektir - tek bir ELO numarasının yakalayamayacağı bir şey.
Sonuç
ELO derecelendirmeleri, onlarca yıldır sporlarda işe yarayan, kanıtlanmış, yorumlanabilir bir takım gücü ölçüsünü sağlar. Pi-derecelendirmeleri, futbolun talep ettiği saldırı/savunma ve ev/deplasman boyutlarıyla bu konsepti genişletir. ExPrysm, tek başına Pi-derecelendirmelerinin özellik öneminin ~ %24,5'ini oluşturduğu CatBoost modellerinde her ikisini de özellik olarak kullanır ve doğru takım gücü ölçümünün futbol tahmininde en önemli bileşen olduğunu doğrular.
Platformun tamamını anlamak ister misiniz? Okumak ExPrysm Nedir? tüm modellerin birlikte nasıl çalıştığına dair tam bir genel bakış için.