Czym są rankingi ELO?

System rankingowy ELO został wynaleziony przez Arpada Elo w latach 60. XX wieku do klasyfikowania szachistów. Podstawowa idea jest pięknie prosta: każda drużyna zaczyna z bazowym rankingiem (zazwyczaj 1500), a po każdym meczu zwycięzca zyskuje punkty, a przegrany je traci. Ilość transferowanych punktów zależy od tego, jak niespodziewany był wynik.

Jeśli silna drużyna pokonuje słabą, zmienia się niewiele punktów — wynik był oczekiwany. Jeśli wygrywa słabsza drużyna, transferuje się wiele punktów — niespodzianka niesie więcej informacji. Z czasem rankingi zbiegają się do odzwierciedlenia prawdziwej siły drużyny.

ELO zostało zaadaptowane do piłki nożnej przez kilku badaczy i organizacje, w tym FIFA (do ich rankingu światowego do 2018 roku) oraz FiveThirtyEight. Działa dobrze, ponieważ piłka nożna ma jasne wyniki wygrana/remis/przegrana, a drużyny grają wystarczająco często, by rankingi pozostawały aktualne.

Jak działa ELO

Reguła aktualizacji ELO składa się z trzech elementów:

Oczekiwany wynik

Przed meczem oczekiwany wynik dla drużyny gospodarzy jest obliczany na podstawie różnicy rankingów:

Wzór na oczekiwany wynik

Ehome = 1 / (1 + 10(Raway − Rhome − HFA) / 400)

Gdzie R to aktualny ranking, a HFA to korekta przewagi gospodarzy (zazwyczaj 50–100 punktów).

Współczynnik K

Współczynnik K kontroluje, jak bardzo rankingi zmieniają się po każdym meczu. Wyższe K oznacza, że rankingi szybciej reagują na ostatnie wyniki (większa zmienność), podczas gdy niższe K oznacza bardziej stabilne, ale wolniej adaptujące się rankingi. Typowe wartości dla piłki nożnej wynoszą od 20 do 40.

Reguła aktualizacji

Po meczu rankingi są aktualizowane na podstawie różnicy między rzeczywistym wynikiem a oczekiwanym:

Aktualizacja ELO

Rnew = Rold + K × (Sactual − Eexpected)

Gdzie Sactual = 1 za wygraną, 0,5 za remis, 0 za przegraną.

Przykład

Drużyna A (ranking 1650) gra u siebie z Drużyną B (ranking 1500). Przy K=30 i HFA=65:

EA = 1 / (1 + 10(1500 − 1650 − 65)/400) = 0,78

Jeśli wygra Drużyna A: RA = 1650 + 30 × (1 − 0,78) = 1656,6 (+6,6)

Jeśli wygra Drużyna B: RA = 1650 + 30 × (0 − 0,78) = 1626,6 (−23,4)

Niespodzianka transferuje znacznie więcej punktów rankingowych niż oczekiwany wynik.

ELO w kontekście piłki nożnej

Dlaczego to działa

ELO jednocześnie uchwytuje dwie rzeczy: podstawową jakość drużyny i ostatnią formę. Drużyna będąca na serii zwycięstw zobaczy wzrost swojego rankingu, odzwierciedlający zarówno rzeczywistą poprawę, jak i momentum. Sprawia to, że ELO jest zwartą, bogatą w informacje cechą dla modeli predykcyjnych.

Ograniczenia

Standardowe ELO ma fundamentalne ograniczenie w piłce nożnej: produkuje jedną liczbę na drużynę. Oznacza to, że nie może odróżnić drużyny silnej w ataku, ale słabej w obronie, ani drużyny grającej inaczej u siebie niż na wyjeździe. Drużyna z rankingiem 1600 może być drużyną wygrywającą 3:2 lub 1:0 — ELO traktuje je identycznie.

Pi-ratings: Kolejna ewolucja

W 2013 roku Anthony Constantinou i Norman Fenton opublikowali artykuł wprowadzający Pi-ratings — system rankingowy zaprojektowany specjalnie dla piłki nożnej, który rozwiązuje kluczowe ograniczenia ELO. Zamiast jednej liczby na drużynę, Pi-ratings utrzymują cztery:

⚔️
Atak u siebie
Siła ataku podczas gry u siebie
🛡️
Obrona u siebie
Siła obrony podczas gry u siebie
⚔️
Atak na wyjeździe
Siła ataku podczas gry na wyjeździe
🛡️
Obrona na wyjeździe
Siła obrony podczas gry na wyjeździe

System Pi-ratings używa trzech kluczowych parametrów z oryginalnego artykułu:

ParametrWartośćCel
b10Bazowy mnożnik aktualizacji rankingu
c3Kontroluje wrażliwość na różnicę bramek
lr0,1Współczynnik uczenia — jak szybko adaptują się rankingi

Po każdym meczu wszystkie cztery rankingi obu drużyn są aktualizowane na podstawie zdobytych i straconych bramek. Ranking ataku u siebie rośnie, gdy drużyna strzela u siebie; ranking obrony na wyjeździe przeciwnika maleje. Tworzy to bogaty, wielowymiarowy obraz siły drużyny.

Pi-ratings są aktualizowane przyrostowo po każdej kolejce meczów. ExPrysm przeprowadza codzienne aktualizacje, aby rankingi odzwierciedlały najnowsze wyniki przed generowaniem prognoz.

Jak ExPrysm wykorzystuje rankingi drużyn

ExPrysm nie używa ELO ani Pi-ratings jako samodzielnych predyktorów. Zamiast tego służą jako cechy w modelach gradient boosting CatBoost:

  • Model wyniku meczu: Używa zarówno rankingów ELO, jak i Pi-ratings wśród swoich 69 cech. Klasyfikator CatBoost uczy się, jak różnice rankingów oddziałują z innymi cechami (forma, historia bezpośrednich spotkań, pozycja w lidze) do prognozowania wyników meczów.
  • Model bramek: Modele regresji Poisson (53 cechy) używają Pi-ratings, aby pomóc prognozować oczekiwane bramki. Rozdzielenie ataku i obrony jest tu szczególnie cenne — ranking ataku u siebie drużyny bezpośrednio informuje o tym, ile bramek prawdopodobnie zdobędzie.
  • Ważność cech: Pi-ratings odpowiadają za około 24,5% całkowitej ważności cech w modelu wyniku meczu, co czyni je pojedynczą najważniejszą grupą cech. Potwierdza to, że pomiar siły drużyny jest fundamentem dokładnych prognoz.

Kluczową decyzją projektową w ExPrysm jest to, że modele nie używają żadnych cech opartych na kursach bukmacherskich. Rankingi drużyn dostarczają „niezależnego od rynku" sygnału siły, który pozwala modelowi generować własne szacunki prawdopodobieństwa bez zakotwiczenia w kursach bukmacherskich.

Porównanie ELO i Pi-ratings

AspektELOPi-ratings
Wartości na drużynę14
Podział atak/obronaNieTak
Podział dom/wyjazdNie (stałe HFA)Tak (osobne rankingi)
Uwzględnienie różnicy bramekOpcjonalneWbudowane
ZłożonośćProstaUmiarkowana
InterpretowalnośćBardzo wysokaWysoka
Gęstość informacjiNiskaWysoka
Podstawa naukowaElo (lata 60.)Constantinou & Fenton (2013)

Oba systemy mają wartość. ELO zapewnia prosty, interpretowalny punkt odniesienia — od razu rozumiesz, że drużyna z rankingiem 1700 jest silniejsza od tej z rankingiem 1500. Pi-ratings dostarczają bogatszych informacji, które modele uczenia maszynowego mogą wykorzystać, szczególnie rozdzielenie ataku/obrony i domu/wyjazdu.

Praktyczny wpływ na prognozy

Jak różnice rankingów przekładają się na prawdopodobieństwa wygranej? Oto przybliżone odwzorowanie różnic ELO:

Różnica ELOWygrana silniejszej drużyny %Remis %Wygrana słabszej drużyny %
0 (równe)~36%~28%~36%
+100~45%~27%~28%
+200~55%~24%~21%
+300~64%~21%~15%
+400~72%~17%~11%

To są przybliżone szacunki — model CatBoost ExPrysm produkuje bardziej szczegółowe prawdopodobieństwa, biorąc pod uwagę wszystkie 69 cech razem, nie tylko różnicę rankingów. Jednak ta tabela ilustruje, dlaczego rankingi są tak cenne: kompresują całą historię meczów drużyny w jeden, predykcyjny sygnał.

Dzięki Pi-ratings model staje się jeszcze bardziej szczegółowy. Drużyna z wysokim rankingiem ataku u siebie, ale niskim rankingiem obrony na wyjeździe, będzie generować bardzo różne prognozy w zależności od tego, czy gra u siebie czy na wyjeździe — czego pojedyncza liczba ELO nie może uchwycić.

Podsumowanie

Rankingi ELO zapewniają sprawdzony, interpretowalny pomiar siły drużyny, który sprawdza się w różnych sportach od dziesięcioleci. Pi-ratings rozszerzają tę koncepcję o wymiary ataku/obrony i domu/wyjazdu, których wymaga piłka nożna. ExPrysm używa obu jako cech w swoich modelach CatBoost, gdzie same Pi-ratings odpowiadają za ~24,5% ważności cech — potwierdzając, że dokładny pomiar siły drużyny jest najważniejszym składnikiem prognozowania piłkarskiego.

Chcesz poznać całą platformę? Przeczytaj Czym jest ExPrysm?, aby uzyskać pełny przegląd tego, jak wszystkie modele działają razem.