Metodologia

Rankingi ELO w piłce nożnej — Mierzenie siły drużyn do prognoz

8 min czytania 26 lutego 2026 Techniczne

Każdy model predykcji potrzebuje sposobu na zmierzenie, jak silna jest drużyna teraz — nie w poprzednim sezonie, nie historycznie, ale dziś. Rankingi ELO oferują proste, eleganckie rozwiązanie. Pi-ratings idą o krok dalej, rozdzielając atak od obrony oraz grę u siebie od gry na wyjeździe. Oto jak działają oba systemy i dlaczego ExPrysm używa ich razem.

Czym są rankingi ELO?

System rankingowy ELO został wynaleziony przez Arpada Elo w latach 60. XX wieku do klasyfikowania szachistów. Podstawowa idea jest pięknie prosta: każda drużyna zaczyna z bazowym rankingiem (zazwyczaj 1500), a po każdym meczu zwycięzca zyskuje punkty, a przegrany je traci. Ilość transferowanych punktów zależy od tego, jak niespodziewany był wynik.

Jeśli silna drużyna pokonuje słabą, zmienia się niewiele punktów — wynik był oczekiwany. Jeśli wygrywa słabsza drużyna, transferuje się wiele punktów — niespodzianka niesie więcej informacji. Z czasem rankingi zbiegają się do odzwierciedlenia prawdziwej siły drużyny.

ELO zostało zaadaptowane do piłki nożnej przez kilku badaczy i organizacje, w tym FIFA (do ich rankingu światowego do 2018 roku) oraz FiveThirtyEight. Działa dobrze, ponieważ piłka nożna ma jasne wyniki wygrana/remis/przegrana, a drużyny grają wystarczająco często, by rankingi pozostawały aktualne.

Jak działa ELO

Reguła aktualizacji ELO składa się z trzech elementów:

Oczekiwany wynik

Przed meczem oczekiwany wynik dla drużyny gospodarzy jest obliczany na podstawie różnicy rankingów:

Wzór na oczekiwany wynik

E_home = 1 / (1 + 10^{(R_away − R_home − HFA) / 400})

Gdzie R to aktualny ranking, a HFA to korekta przewagi gospodarzy (zazwyczaj 50–100 punktów).

Współczynnik K

Współczynnik K kontroluje, jak bardzo rankingi zmieniają się po każdym meczu. Wyższe K oznacza, że rankingi szybciej reagują na ostatnie wyniki (większa zmienność), podczas gdy niższe K oznacza bardziej stabilne, ale wolniej adaptujące się rankingi. Typowe wartości dla piłki nożnej wynoszą od 20 do 40.

Reguła aktualizacji

Po meczu rankingi są aktualizowane na podstawie różnicy między rzeczywistym wynikiem a oczekiwanym:

Aktualizacja ELO

R_new = R_old + K × (S_actual − E_expected)

Gdzie S_actual = 1 za wygraną, 0,5 za remis, 0 za przegraną.

Przykład

Drużyna A (ranking 1650) gra u siebie z Drużyną B (ranking 1500). Przy K=30 i HFA=65:

E_A = 1 / (1 + 10^{(1500 − 1650 − 65)/400}) = 0,78

Jeśli wygra Drużyna A: R_A = 1650 + 30 × (1 − 0,78) = 1656,6 (+6,6)

Jeśli wygra Drużyna B: R_A = 1650 + 30 × (0 − 0,78) = 1626,6 (−23,4)

Niespodzianka transferuje znacznie więcej punktów rankingowych niż oczekiwany wynik.

ELO w kontekście piłki nożnej

Dlaczego to działa

ELO jednocześnie uchwytuje dwie rzeczy: podstawową jakość drużyny i ostatnią formę. Drużyna będąca na serii zwycięstw zobaczy wzrost swojego rankingu, odzwierciedlający zarówno rzeczywistą poprawę, jak i momentum. Sprawia to, że ELO jest zwartą, bogatą w informacje cechą dla modeli predykcyjnych.

Ograniczenia

Standardowe ELO ma fundamentalne ograniczenie w piłce nożnej: produkuje jedną liczbę na drużynę. Oznacza to, że nie może odróżnić drużyny silnej w ataku, ale słabej w obronie, ani drużyny grającej inaczej u siebie niż na wyjeździe. Drużyna z rankingiem 1600 może być drużyną wygrywającą 3:2 lub 1:0 — ELO traktuje je identycznie.

Pi-ratings: Kolejna ewolucja

W 2013 roku Anthony Constantinou i Norman Fenton opublikowali artykuł wprowadzający Pi-ratings — system rankingowy zaprojektowany specjalnie dla piłki nożnej, który rozwiązuje kluczowe ograniczenia ELO. Zamiast jednej liczby na drużynę, Pi-ratings utrzymują cztery:

⚔️

Atak u siebie

Siła ataku podczas gry u siebie

🛡️

Obrona u siebie

Siła obrony podczas gry u siebie

⚔️

Atak na wyjeździe

Siła ataku podczas gry na wyjeździe

🛡️

Obrona na wyjeździe

Siła obrony podczas gry na wyjeździe

System Pi-ratings używa trzech kluczowych parametrów z oryginalnego artykułu:

Parametr	Wartość	Cel
b	10	Bazowy mnożnik aktualizacji rankingu
c	3	Kontroluje wrażliwość na różnicę bramek
lr	0,1	Współczynnik uczenia — jak szybko adaptują się rankingi

Po każdym meczu wszystkie cztery rankingi obu drużyn są aktualizowane na podstawie zdobytych i straconych bramek. Ranking ataku u siebie rośnie, gdy drużyna strzela u siebie; ranking obrony na wyjeździe przeciwnika maleje. Tworzy to bogaty, wielowymiarowy obraz siły drużyny.

Pi-ratings są aktualizowane przyrostowo po każdej kolejce meczów. ExPrysm przeprowadza codzienne aktualizacje, aby rankingi odzwierciedlały najnowsze wyniki przed generowaniem prognoz.

Jak ExPrysm wykorzystuje rankingi drużyn

ExPrysm nie używa ELO ani Pi-ratings jako samodzielnych predyktorów. Zamiast tego służą jako cechy w modelach gradient boosting CatBoost:

Model wyniku meczu: Używa zarówno rankingów ELO, jak i Pi-ratings wśród swoich 69 cech. Klasyfikator CatBoost uczy się, jak różnice rankingów oddziałują z innymi cechami (forma, historia bezpośrednich spotkań, pozycja w lidze) do prognozowania wyników meczów.
Model bramek: Modele regresji Poisson (53 cechy) używają Pi-ratings, aby pomóc prognozować oczekiwane bramki. Rozdzielenie ataku i obrony jest tu szczególnie cenne — ranking ataku u siebie drużyny bezpośrednio informuje o tym, ile bramek prawdopodobnie zdobędzie.
Ważność cech: Pi-ratings odpowiadają za około 24,5% całkowitej ważności cech w modelu wyniku meczu, co czyni je pojedynczą najważniejszą grupą cech. Potwierdza to, że pomiar siły drużyny jest fundamentem dokładnych prognoz.

Kluczową decyzją projektową w ExPrysm jest to, że modele nie używają żadnych cech opartych na kursach bukmacherskich. Rankingi drużyn dostarczają „niezależnego od rynku" sygnału siły, który pozwala modelowi generować własne szacunki prawdopodobieństwa bez zakotwiczenia w kursach bukmacherskich.

Porównanie ELO i Pi-ratings

Aspekt	ELO	Pi-ratings
Wartości na drużynę	1	4
Podział atak/obrona	Nie	Tak
Podział dom/wyjazd	Nie (stałe HFA)	Tak (osobne rankingi)
Uwzględnienie różnicy bramek	Opcjonalne	Wbudowane
Złożoność	Prosta	Umiarkowana
Interpretowalność	Bardzo wysoka	Wysoka
Gęstość informacji	Niska	Wysoka
Podstawa naukowa	Elo (lata 60.)	Constantinou & Fenton (2013)

Oba systemy mają wartość. ELO zapewnia prosty, interpretowalny punkt odniesienia — od razu rozumiesz, że drużyna z rankingiem 1700 jest silniejsza od tej z rankingiem 1500. Pi-ratings dostarczają bogatszych informacji, które modele uczenia maszynowego mogą wykorzystać, szczególnie rozdzielenie ataku/obrony i domu/wyjazdu.

Praktyczny wpływ na prognozy

Jak różnice rankingów przekładają się na prawdopodobieństwa wygranej? Oto przybliżone odwzorowanie różnic ELO:

Różnica ELO	Wygrana silniejszej drużyny %	Remis %	Wygrana słabszej drużyny %
0 (równe)	~36%	~28%	~36%
+100	~45%	~27%	~28%
+200	~55%	~24%	~21%
+300	~64%	~21%	~15%
+400	~72%	~17%	~11%

To są przybliżone szacunki — model CatBoost ExPrysm produkuje bardziej szczegółowe prawdopodobieństwa, biorąc pod uwagę wszystkie 69 cech razem, nie tylko różnicę rankingów. Jednak ta tabela ilustruje, dlaczego rankingi są tak cenne: kompresują całą historię meczów drużyny w jeden, predykcyjny sygnał.

Dzięki Pi-ratings model staje się jeszcze bardziej szczegółowy. Drużyna z wysokim rankingiem ataku u siebie, ale niskim rankingiem obrony na wyjeździe, będzie generować bardzo różne prognozy w zależności od tego, czy gra u siebie czy na wyjeździe — czego pojedyncza liczba ELO nie może uchwycić.

Podsumowanie

Rankingi ELO zapewniają sprawdzony, interpretowalny pomiar siły drużyny, który sprawdza się w różnych sportach od dziesięcioleci. Pi-ratings rozszerzają tę koncepcję o wymiary ataku/obrony i domu/wyjazdu, których wymaga piłka nożna. ExPrysm używa obu jako cech w swoich modelach CatBoost, gdzie same Pi-ratings odpowiadają za ~24,5% ważności cech — potwierdzając, że dokładny pomiar siły drużyny jest najważniejszym składnikiem prognozowania piłkarskiego.

Chcesz poznać całą platformę? Przeczytaj Czym jest ExPrysm?, aby uzyskać pełny przegląd tego, jak wszystkie modele działają razem.