Valutazioni ELO nel Calcio — Misurare la Forza delle Squadre per le Previsioni
Ogni modello di previsione ha bisogno di un modo per misurare quanto sia forte una squadra in questo momento — non la scorsa stagione, non storicamente, ma oggi. Le valutazioni ELO offrono una soluzione semplice ed elegante. Le Pi-ratings vanno oltre, separando attacco da difesa e casa da trasferta. Ecco come funzionano entrambe e perché ExPrysm le utilizza insieme.
Cosa Sono le Valutazioni ELO?
Il sistema di valutazione ELO fu inventato da Arpad Elo negli anni '60 per classificare i giocatori di scacchi. L'idea di base è di una semplicità elegante: ogni squadra parte con una valutazione base (tipicamente 1500), e dopo ogni partita il vincitore guadagna punti mentre il perdente ne perde. La quantità trasferita dipende da quanto il risultato era sorprendente.
Se una squadra forte batte una squadra debole, pochi punti cambiano di mano — il risultato era atteso. Se la squadra debole vince, molti punti vengono trasferiti — il colpo di scena porta più informazioni. Nel tempo, le valutazioni convergono per riflettere la vera forza della squadra.
L'ELO è stato adattato al calcio da diversi ricercatori e organizzazioni, tra cui la FIFA (per le sue classifiche mondiali fino al 2018) e FiveThirtyEight. Funziona bene perché il calcio ha risultati chiari di vittoria/pareggio/sconfitta e le squadre giocano abbastanza frequentemente da mantenere le valutazioni aggiornate.
Come Funziona l'ELO
La regola di aggiornamento ELO ha tre componenti:
Punteggio Atteso
Prima di una partita, il punteggio atteso per la squadra di casa viene calcolato dalla differenza di valutazione:
Ehome = 1 / (1 + 10(Raway − Rhome − HFA) / 400)
Dove R è la valutazione attuale e HFA è la correzione per il vantaggio del campo di casa (tipicamente 50–100 punti).
Fattore K
Il fattore K controlla quanto cambiano le valutazioni dopo ogni partita. Un K più alto significa che le valutazioni reagiscono più rapidamente ai risultati recenti (più volatili), mentre un K più basso significa che le valutazioni sono più stabili ma più lente ad adattarsi. I valori tipici vanno da 20 a 40 per il calcio.
Regola di Aggiornamento
Dopo la partita, le valutazioni vengono aggiornate in base alla differenza tra il risultato effettivo e il punteggio atteso:
Rnew = Rold + K × (Sactual − Eexpected)
Dove Sactual = 1 per una vittoria, 0.5 per un pareggio, 0 per una sconfitta.
La Squadra A (valutazione 1650) gioca in casa contro la Squadra B (valutazione 1500). Con K=30 e HFA=65:
EA = 1 / (1 + 10(1500 − 1650 − 65)/400) = 0.78
Se vince la Squadra A: RA = 1650 + 30 × (1 − 0.78) = 1656.6 (+6.6)
Se vince la Squadra B: RA = 1650 + 30 × (0 − 0.78) = 1626.6 (−23.4)
Il colpo di scena trasferisce molti più punti di valutazione rispetto al risultato atteso.
L'ELO nel Contesto del Calcio
Perché Funziona
L'ELO cattura due cose simultaneamente: la qualità intrinseca della squadra e la forma recente. Una squadra in una serie di vittorie vedrà la sua valutazione salire, riflettendo sia un miglioramento genuino che il momentum. Questo rende l'ELO una caratteristica compatta e ricca di informazioni per i modelli di previsione.
Limitazioni
L'ELO standard ha una limitazione fondamentale per il calcio: produce un singolo numero per squadra. Ciò significa che non può distinguere tra una squadra forte in attacco ma debole in difesa, o una squadra che si comporta diversamente in casa rispetto alla trasferta. Una squadra valutata 1600 potrebbe essere una squadra da 3-2 o da 1-0 — l'ELO le tratta in modo identico.
Pi-Ratings: La Prossima Evoluzione
Nel 2013, Anthony Constantinou e Norman Fenton pubblicarono un articolo che introduceva le Pi-ratings — un sistema di valutazione specificamente progettato per il calcio che affronta le principali limitazioni dell'ELO. Invece di un numero per squadra, le Pi-ratings mantengono quattro valori:
Il sistema Pi-ratings utilizza tre parametri chiave tratti dall'articolo originale:
| Parametro | Valore | Scopo |
|---|---|---|
| b | 10 | Moltiplicatore base per gli aggiornamenti delle valutazioni |
| c | 3 | Controlla la sensibilità alla differenza reti |
| lr | 0.1 | Tasso di apprendimento — velocità di adattamento delle valutazioni |
Dopo ogni partita, tutti e quattro i valori per entrambe le squadre vengono aggiornati in base ai gol segnati e subiti. La valutazione dell'attacco in casa aumenta quando la squadra segna in casa; la valutazione della difesa in trasferta dell'avversario diminuisce. Questo crea un quadro ricco e multidimensionale della forza della squadra.
Le Pi-ratings vengono aggiornate in modo incrementale dopo ogni giornata di partite. ExPrysm esegue aggiornamenti giornalieri per garantire che le valutazioni riflettano i risultati più recenti prima di generare le previsioni.
Come ExPrysm Utilizza le Valutazioni delle Squadre
ExPrysm non utilizza le valutazioni ELO o Pi-ratings come predittori autonomi. Servono invece come caratteristiche all'interno dei modelli di gradient boosting CatBoost:
- Modello Risultato Partita: Utilizza sia le valutazioni ELO che le Pi-ratings tra le sue 69 caratteristiche. Il classificatore CatBoost apprende come le differenze di valutazione interagiscono con altre caratteristiche (forma, testa a testa, posizione in classifica) per prevedere i risultati delle partite.
- Modello Gol: I modelli di regressione Poisson (53 caratteristiche) utilizzano le Pi-ratings per aiutare a prevedere i gol attesi. La separazione attacco/difesa è particolarmente preziosa qui — la valutazione dell'attacco in casa di una squadra informa direttamente quanti gol è probabile che segni.
- Importanza delle Caratteristiche: Le Pi-ratings rappresentano circa il 24,5% dell'importanza totale delle caratteristiche nel modello di risultato della partita, rendendole il singolo gruppo di caratteristiche più influente. Questo conferma che la misurazione della forza della squadra è il fondamento di una previsione accurata.
La decisione progettuale chiave in ExPrysm è che i modelli non utilizzano caratteristiche basate sulle quote. Le valutazioni delle squadre forniscono il segnale di forza "indipendente dal mercato" che consente al modello di generare le proprie stime di probabilità senza essere ancorato alle quote dei bookmaker.
Confronto ELO vs Pi-Ratings
| Aspetto | ELO | Pi-Ratings |
|---|---|---|
| Valori per squadra | 1 | 4 |
| Separazione Attacco/Difesa | No | Sì |
| Separazione Casa/Trasferta | No (HFA fisso) | Sì (valutazioni separate) |
| Differenza reti utilizzata | Opzionale | Integrata |
| Complessità | Semplice | Moderata |
| Interpretabilità | Molto alta | Alta |
| Densità informativa | Bassa | Alta |
| Base accademica | Elo (anni '60) | Constantinou & Fenton (2013) |
Entrambi i sistemi hanno valore. L'ELO fornisce una base semplice e interpretabile — si può immediatamente capire che una squadra valutata 1700 è più forte di una valutata 1500. Le Pi-ratings forniscono informazioni più ricche che i modelli di machine learning possono sfruttare, in particolare le separazioni attacco/difesa e casa/trasferta.
Impatto Pratico sulle Previsioni
Come si traducono le differenze di valutazione in probabilità di vittoria? Ecco una mappatura approssimativa dalle differenze ELO:
| Differenza ELO | % Vittoria Squadra Più Forte | % Pareggio | % Vittoria Squadra Più Debole |
|---|---|---|---|
| 0 (pari) | ~36% | ~28% | ~36% |
| +100 | ~45% | ~27% | ~28% |
| +200 | ~55% | ~24% | ~21% |
| +300 | ~64% | ~21% | ~15% |
| +400 | ~72% | ~17% | ~11% |
Queste sono stime approssimative — il modello CatBoost di ExPrysm produce probabilità più sfumate considerando tutte le 69 caratteristiche insieme, non solo la differenza di valutazione. Ma questa tabella illustra perché le valutazioni sono così preziose: comprimono l'intera storia delle partite di una squadra in un unico segnale predittivo.
Con le Pi-ratings, il modello ottiene una granularità ancora maggiore. Una squadra con un'alta valutazione dell'attacco in casa ma una bassa valutazione della difesa in trasferta produrrà previsioni molto diverse a seconda che giochi in casa o in trasferta — qualcosa che un singolo numero ELO non può catturare.
Conclusione
Le valutazioni ELO forniscono una misura comprovata e interpretabile della forza della squadra che ha funzionato in tutti gli sport per decenni. Le Pi-ratings estendono questo concetto con le dimensioni attacco/difesa e casa/trasferta che il calcio richiede. ExPrysm utilizza entrambe come caratteristiche nei suoi modelli CatBoost, dove le sole Pi-ratings rappresentano circa il 24,5% dell'importanza delle caratteristiche — confermando che una misurazione accurata della forza della squadra è l'ingrediente più importante nella previsione del calcio.
Vuoi capire la piattaforma completa? Leggi Cos'è ExPrysm? per una panoramica completa di come tutti i modelli lavorano insieme.