Que sont les évaluations ELO ?

Le système de classement ELO a été inventé par Arpad Elo dans les années 1960 pour classer les joueurs d'échecs. L'idée de base est très simple : chaque équipe commence avec une note de base (généralement 1500), et après chaque match, le gagnant gagne des points tandis que le perdant en perd. Le montant transféré dépend de la surprise du résultat.

Si une équipe forte bat une équipe faible, peu de points changent de mains : le résultat était attendu. Si l'équipe la plus faible gagne, de nombreux points sont transférés. La défaite apporte plus d'informations. Au fil du temps, les notes convergent pour refléter la véritable force de l'équipe.

ELO a été adapté au football par plusieurs chercheurs et organisations, dont la FIFA (pour son classement mondial jusqu'en 2018) et FiveThirtyEight. Cela fonctionne bien car le football a des résultats clairs en termes de victoires/nuls et de défaites et les équipes jouent assez fréquemment pour que les classements restent à jour.

Comment fonctionne ELO

La règle de mise à jour ELO comporte trois éléments :

Score attendu

Avant un match, le score attendu pour l'équipe à domicile est calculé à partir de la différence de classement :

Formule de score attendu

Emaison = 1 / (1 + 10(Rloin − Rmaison (− HFA)/400)

Où R est la note actuelle et HFA est l'ajustement de l'avantage sur le terrain (généralement 50 à 100 points).

Facteur K

Le facteur K contrôle l'évolution des notes après chaque match. Un K élevé signifie que les notations réagissent plus rapidement aux résultats récents (plus volatils), tandis qu'un K plus faible signifie que les notations sont plus stables mais plus lentes à s'adapter. Les valeurs typiques vont de 20 à 40 pour le football.

Mettre à jour la règle

Après le match, les notes sont mises à jour en fonction de la différence entre le résultat réel et le score attendu :

Mise à jour ELO

Rnew = Rold + K × (S)réel − Eattendu)

Où Sréel = 1 pour une victoire, 0,5 pour un match nul, 0 pour une défaite.

Exemple

L'équipe A (classement 1650) joue à domicile contre l'équipe B (classement 1500). Avec K=30 et HFA=65 :

EA = 1 / (1 + 10(1500 à 1650 et 65) /400) = 0.78

Si l'équipe A gagne : RA = 1 650 + 30 × (1 − 0,78) = 1656,6 (+6,6)

Si l'équipe B gagne : RA = 1 650 + 30 × (0 − 0,78) = 1 626,6 (−23,4)

Le bouleversement rapporte bien plus de points que le résultat attendu.

L'ELO dans le contexte du football

Pourquoi ça marche

ELO saisit deux éléments simultanément : la qualité sous-jacente de l'équipe et la forme récente de l'équipe. Une équipe sur une série de victoires verra son classement grimper, reflétant à la fois une véritable amélioration et une dynamique. Cela fait d'ELO une fonctionnalité compacte et riche en informations pour les modèles de prédiction.

Restrictions

L'ELO standard présente une limite fondamentale pour le football : il ne produit qu'un seul numéro par équipe. Cela signifie qu'il ne peut pas faire la distinction entre une équipe forte en attaque mais faible en défense, ou une équipe qui se comporte différemment à domicile et à l'extérieur. Une équipe classée 1600 peut être une équipe 3-2 ou 1-0. ELO les traite de la même manière.

Pi-ratings : la prochaine évolution

En 2013, Anthony Constantinou et Norman Fenton ont publié un article présentant Pi-ratings, un système de notation spécialement conçu pour le football qui répond aux principales limites de l'ELO. Au lieu d'un chiffre par équipe, les évaluations PI en maintiennent quatre :

⚔️
Attaque à domicile
Force d'attaque lorsque vous jouez à domicile
🛡️
Défense domestique
Force défensive lorsque vous jouez à domicile
⚔️
Attaque à l'extérieur
Force d'attaque lorsque vous jouez à l'extérieur
🛡️
Défense à l'extérieur
Force défensive lorsque vous jouez à l'extérieur

Le système d'évaluation PI utilise trois paramètres clés issus de l'article original :

ParamètreValeurObjectif
b10Multiplicateur de base pour les mises à jour
c3Contrôle la sensibilité à la différence de buts
lr0.1Taux d'apprentissage : rapidité avec laquelle les évaluations s'adaptent

Après chaque match, les quatre classements des deux équipes sont mis à jour en fonction des buts marqués et encaissés. Le score d'attaque à domicile augmente lorsque l'équipe marque à domicile ; le score de défense de l'adversaire à l'extérieur diminue. Cela crée une image riche et multidimensionnelle de la force de l'équipe.

Les évaluations PI sont mises à jour progressivement après chaque jour de match. ExPrysm effectue des mises à jour quotidiennes pour s'assurer que les évaluations reflètent les résultats les plus récents avant de générer des prévisions.

Comment ExPrysm utilise les évaluations des équipes

ExPrysm n'utilise pas les évaluations ELO ou PI comme prédicteurs autonomes. Au lieu de cela, ils font office de fonctionnalités dans les modèles d'amplification du gradient CatBoost :

  • Modèle de résultat du match : Utilise à la fois les notations ELO et PI parmi ses 69 fonctionnalités. Le classificateur CatBoost apprend comment les différences de classement interagissent avec d'autres caractéristiques (forme, face-à-face, position dans la ligue) pour prédire les résultats des matchs.
  • Modèle d'objectifs : Les modèles de régression de Poisson (53 caractéristiques) utilisent des indices PI pour aider à prévoir les objectifs attendus. La séparation entre attaque et défense est particulièrement importante ici : le score d'attaque à domicile d'une équipe indique directement le nombre de buts qu'elle est susceptible de marquer.
  • Importance de la fonctionnalité : Les évaluations PI représentent environ 24,5 % de l'importance totale des caractéristiques dans le modèle de résultat des matchs, ce qui en fait le groupe de caractéristiques le plus influent. Cela confirme que la mesure de la force de l'équipe est la base d'une prédiction précise.

La principale décision de conception d'ExPrysm est que les modèles n'utilisent aucune fonctionnalité basée sur les probabilités. Les évaluations des équipes fournissent le signal de force « indépendant du marché » qui permet au modèle de générer ses propres estimations de probabilité sans être lié aux cotes des bookmakers.

Comparaison entre ELO et Pi-ratings

AspectELOÉvaluations Pi
Valeurs par équipe14
Division attaque/défenseNoYes
Accueil/Away splitNon (HFA fixe)Oui (évaluations séparées)
Différence de buts utiliséeFacultatifIntégré
ComplexitéSimpleModéré
InterprétabilitéTrès élevéHaut
Densité de l'informationLowHaut
Bases académiquesElo (années 1960)Constantinou et Fenton (2013)

Les deux systèmes ont de la valeur. ELO fournit une base de référence simple et interprétable : vous pouvez immédiatement comprendre qu'une équipe notée 1700 est plus forte qu'une équipe notée 1500. Les évaluations PI fournissent des informations plus riches que les modèles d'apprentissage automatique peuvent exploiter, en particulier en ce qui concerne les séparations attaque/défense et domicile/extérieur.

Impact pratique sur les prévisions

Comment les différences de classement se traduisent-elles en probabilités de gagner ? Voici une cartographie approximative des différences ELO :

Différence ELO% de victoires de l'équipe la plus forte% du tirage% de victoires de l'équipe la plus faible
0 (égal)~36%~28%~36%
+100~45%~27%~28%
+200~55%~24%~21%
+300~64%~21%~15%
+400~72%~17%~11%

Il s'agit d'estimations approximatives : le modèle CatBoost d'ExPrysm produit des probabilités plus nuancées en considérant les 69 caractéristiques ensemble, et pas seulement la différence de notation. Mais ce tableau montre pourquoi les notes sont si importantes : elles compressent l'historique complet des matchs d'une équipe en un seul signal prédictif.

Avec les évaluations PI, le modèle devient encore plus granulaire. Une équipe ayant une cote d'attaque à domicile élevée mais une faible cote de défense à l'extérieur produira des pronostics très différents selon qu'elle joue à domicile ou à l'extérieur, ce qu'un seul numéro ELO ne peut pas capturer.

Conclusion

Les évaluations ELO fournissent une mesure éprouvée et interprétable de la force d'une équipe qui fonctionne dans tous les sports depuis des décennies. Les évaluations PI étendent ce concept aux dimensions attaque/défense et maison/extérieur qu'exige le football. ExPrysm utilise ces deux fonctionnalités dans ses modèles CatBoost, où les évaluations PI représentent à elles seules ~ 24,5 % de l'importance des fonctionnalités, ce qui confirme que la mesure précise de la force d'une équipe est l'ingrédient le plus important des pronostics footballistiques.

Vous voulez comprendre l'intégralité de la plateforme ? Lisez Qu'est-ce qu'ExPrysm ? pour un aperçu complet de la manière dont tous les modèles fonctionnent ensemble.