Що таке рейтинги ELO?

Система рейтингу ELO була винайдена Арпадом Ело в 1960-х роках для ранжування шахістів. Основна ідея дуже проста: кожна команда починає з базового рейтингу (зазвичай 1500), і після кожного матчу переможець набирає очки, а програш втрачає очки. Переведена сума залежить від того, наскільки дивним виявився результат.

Якщо сильна команда перемагає слабку команду, кілька очок змінюють руки - результат був очікуваний. Якщо перемагає слабка команда, багато очок передаються - засмучення несе більше інформації. З часом рейтинги сходяться, щоб відобразити справжню силу команди.

ELO був адаптований для футболу кількома дослідниками та організаціями, включаючи FIFA (для їх світового рейтингу до 2018 року) та FiveThirtyEight. Це добре працює, оскільки футбол має чіткі результати перемога/нічиї/програш, а команди грають досить часто, щоб рейтинги залишалися актуальними.

Як працює ELO

Правило оновлення ELO складається з трьох компонентів:

Очікуваний бал

Перед матчем очікуваний рахунок домашньої команди розраховується з різниці в рейтингу:

Формула очікуваної оцінки

Eдім = 1 / (1 + 10(Rгеть − Rдім − ХФА)/400)

Де R - поточний рейтинг, а HFA - коригування переваг домашнього поля (зазвичай 50—100 балів).

К-фактор

K-фактор контролює, скільки оцінок змінюється після кожного матчу. Більш високий K означає, що рейтинги швидше реагують на останні результати (більш мінливі), тоді як нижчий K означає, що рейтинги більш стабільні, але повільніше адаптуються. Типові значення коливаються від 20 до 40 для футболу.

Правило оновлення

Після матчу рейтинги оновлюються виходячи з різниці між фактичним результатом і очікуваним рахунком:

Оновлення ELO

Rnew = Rold + K × (Сфактичний − Eочікуваний)

Де Sфактичний = 1 за виграш, 0,5 за нічию, 0 за програш.

Приклад

Команда А (рейтинг 1650) грає вдома проти команди В (рейтинг 1500). З K = 30 і HFA = 65:

EA = 1 / (1 + 10(1500 − 1650 − 65) /400) = 0.78

Якщо команда А переможе: RA = 1650 + 30 × (1 − 0,78) = 1656,6 (+6,6)

Якщо команда B переможе: RA = 1650 + 30 × (0 − 0,78) = 1626,6 (−23,4)

Засмучений передає набагато більше рейтингових балів, ніж очікуваний результат.

ELO у футбольному контексті

Чому це працює

ELO фіксує дві речі одночасно: основну якість команди та недавню форму. Команда з переможною серією побачить зростання рейтингу, що відображає як справжнє покращення, так і імпульс. Це робить ELO компактною, багатою інформацією функцією для моделей прогнозування.

Обмеження

Стандартний ELO має принципове обмеження для футболу: він виробляє єдине число на команду. Це означає, що він не може розрізняти команду, яка сильна в атаці, але слабка в обороні, або команду, яка працює по-різному вдома та на виїзді. Команда з рейтингом 1600 може бути командою 3-2 або командою 1-0 — ELO ставиться до них однаково.

Pi-Рейтинги: Наступна еволюція

У 2013 році Ентоні Константину та Норман Фентон опублікували статтю, яка представила Pi-ratings - рейтингову систему, спеціально розроблену для футболу, яка усуває ключові обмеження ELO. Замість одного числа на команду рейтинги PI підтримують чотири:

⚔️
Домашня атака
Атакуюча сила при грі вдома
🛡️
Домашня оборона
Оборонна сила при грі вдома
⚔️
Виїзна атака
Сила атаки під час гри на виїзді
🛡️
Захист на виїзді
Оборонна сила під час гри на виїзді

Система PI-рейтингу використовує три ключові параметри з оригінальної статті:

ПараметрЗначенняПризначення
b10Базовий множник для оновлення рейтингу
c3Контролює чутливість до різниці цілей
lr0.1Швидкість навчання — як швидко адаптуються рейтинги

Після кожного матчу всі чотири рейтинги обох команд оновлюються на основі забитих і пропущених голів. Рейтинг домашньої атаки збільшується, коли команда забиває домашні бали; рейтинг захисту суперника на виїзді зменшується. Це створює багату, багатовимірну картину сили команди.

Рейтинги PI оновлюються поступово після кожного дня матчу. ExPrysm проводить щоденні оновлення, щоб переконатися, що рейтинги відображають останні результати, перш ніж генерувати прогнози.

Як ExPrysm використовує рейтинги команд

ExPrysm не використовує ELO або Pi-рейтинги як окремі предиктори. Натомість вони служать функціями в моделях посилення градієнта CatBoost:

  • Модель результату матчу: Використовує як рейтинги ELO, так і рейтинги PI серед своїх 69 функцій. Класифікатор CatBoost дізнається, як різниці в рейтингу взаємодіють з іншими ознаками (форма, голова в голові, позиція в лізі) для прогнозування результатів матчу.
  • Модель цілей: Моделі регресії Пуассона (53 функції) використовують рейтинги PI, щоб допомогти передбачити очікувані цілі. Поділ атаки/оборони тут особливо цінний - рейтинг домашньої атаки команди безпосередньо інформує, скільки голів вони, ймовірно, заб'ють.
  • Важливість функції: Рейтинги PI становлять приблизно 24,5% загальної важливості функцій у моделі результатів матчу, що робить їх єдиною найвпливовішою групою ознак. Це підтверджує, що вимірювання сили команди є основою точного прогнозування.

Ключовим дизайнерським рішенням в ExPrysm є те, що моделі не використовують функцій на основі парних партій. Рейтинги команд дають сигнал сили «незалежний від ринку», який дозволяє моделі генерувати власні оцінки ймовірностей без прив'язки до коефіцієнтів букмекерської контори.

Порівняння рейтингів ELO проти Pi-

АспектELOРейтинги Pi-
Цінності на команду14
Розділ атаки/оборониNoYes
Головна/Виїзний сплітНі (фіксований HFA)Так (окремі оцінки)
Використовується різниця голівНеобов'язковоВбудований
складністьПростийПомірний
ТлумачуваністьДуже високийВисокий
Щільність інформаціїLowВисокий
Академічна основаЕло (1960-ті роки)Константину та Фентон (2013)

Обидві системи мають цінність. ELO забезпечує просту, інтерпретовану базову лінію - ви відразу можете зрозуміти, що команда з рейтингом 1700 сильніша за одну з оцінками 1500. Рейтинги PI надають більш багату інформацію, яку можуть використовувати моделі машинного навчання, зокрема атаку/оборона та розділення домів/поза межами.

Практичний вплив на прогнози

Як різниця в рейтингу перетворюється на ймовірність виграшу? Ось приблизне відображення відмінностей ELO:

Різниця ELOСильніша команда Виграш%Нічий%% Перемоги слабших команд
0 (дорівнює)~36%~28%~36%
+100~45%~27%~28%
+200~55%~24%~21%
+300~64%~21%~15%
+400~72%~17%~11%

Це приблизні оцінки - модель CatBoost ExPrysm створює більш нюансові ймовірності, розглядаючи всі 69 функцій разом, а не лише різницю в рейтингу. Але ця таблиця ілюструє, чому рейтинги настільки цінні: вони стискають всю історію матчів команди в єдиний прогнозний сигнал.

Завдяки PI-рейтингам модель стає ще більш гранульованою. Команда з високим рейтингом домашньої атаки, але низьким рейтингом захисту на виїзді, буде давати дуже різні прогнози залежно від того, грає вона вдома чи на виїзді - те, що один номер за ELO не може захопити.

Висновок

Рейтинги ELO забезпечують перевірений, інтерпретований показник сили команди, який працює в різних видах спорту десятиліттями. Рейтинги PI розширюють цю концепцію розмірами атаки/оборони та домашні/виїзних розмірів, яких вимагає футбол. ExPrysm використовує обидві функції в своїх моделях CatBoost, де лише рейтинги PI становлять ~ 24,5% важливості функцій, що підтверджує, що точне вимірювання сили команди є найважливішим компонентом прогнозування футболу.

Хочете зрозуміти повну платформу? Читати Що таке ExPrysm? для повного огляду того, як всі моделі працюють разом.