Methodology

Рейтинги ELO у футболі - Вимірювання сили команди для прогнозів

8 хв читання Лютого 26, 2026 Технічні

Кожна модель прогнозування потребує способу виміряти, наскільки сильна команда зараз - не минулого сезону, не історично, а сьогодні. Рейтинги ELO забезпечують просте, елегантне рішення. Рейтинги PI продовжують це робити, відокремлюючи атаку від оборони та будинок від віддаленого. Ось як працюють обидва та чому ExPrysm використовує їх разом.

Що таке рейтинги ELO?

Система рейтингу ELO була винайдена Арпадом Ело в 1960-х роках для ранжування шахістів. Основна ідея дуже проста: кожна команда починає з базового рейтингу (зазвичай 1500), і після кожного матчу переможець набирає очки, а програш втрачає очки. Переведена сума залежить від того, наскільки дивним виявився результат.

Якщо сильна команда перемагає слабку команду, кілька очок змінюють руки - результат був очікуваний. Якщо перемагає слабка команда, багато очок передаються - засмучення несе більше інформації. З часом рейтинги сходяться, щоб відобразити справжню силу команди.

ELO був адаптований для футболу кількома дослідниками та організаціями, включаючи FIFA (для їх світового рейтингу до 2018 року) та FiveThirtyEight. Це добре працює, оскільки футбол має чіткі результати перемога/нічиї/програш, а команди грають досить часто, щоб рейтинги залишалися актуальними.

Як працює ELO

Правило оновлення ELO складається з трьох компонентів:

Очікуваний бал

Перед матчем очікуваний рахунок домашньої команди розраховується з різниці в рейтингу:

Формула очікуваної оцінки

E_дім = 1 / (1 + 10^{(R_геть − R_дім − ХФА)/400})

Де R - поточний рейтинг, а HFA - коригування переваг домашнього поля (зазвичай 50—100 балів).

К-фактор

K-фактор контролює, скільки оцінок змінюється після кожного матчу. Більш високий K означає, що рейтинги швидше реагують на останні результати (більш мінливі), тоді як нижчий K означає, що рейтинги більш стабільні, але повільніше адаптуються. Типові значення коливаються від 20 до 40 для футболу.

Правило оновлення

Після матчу рейтинги оновлюються виходячи з різниці між фактичним результатом і очікуваним рахунком:

Оновлення ELO

R_new = R_old + K × (С_{фактичний} − E_{очікуваний})

Де S_{фактичний} = 1 за виграш, 0,5 за нічию, 0 за програш.

Приклад

Команда А (рейтинг 1650) грає вдома проти команди В (рейтинг 1500). З K = 30 і HFA = 65:

E_A = 1 / (1 + 10^{(1500 − 1650 − 65) /400}) = 0.78

Якщо команда А переможе: R_A = 1650 + 30 × (1 − 0,78) = 1656,6 (+6,6)

Якщо команда B переможе: R_A = 1650 + 30 × (0 − 0,78) = 1626,6 (−23,4)

Засмучений передає набагато більше рейтингових балів, ніж очікуваний результат.

ELO у футбольному контексті

Чому це працює

ELO фіксує дві речі одночасно: основну якість команди та недавню форму. Команда з переможною серією побачить зростання рейтингу, що відображає як справжнє покращення, так і імпульс. Це робить ELO компактною, багатою інформацією функцією для моделей прогнозування.

Обмеження

Стандартний ELO має принципове обмеження для футболу: він виробляє єдине число на команду. Це означає, що він не може розрізняти команду, яка сильна в атаці, але слабка в обороні, або команду, яка працює по-різному вдома та на виїзді. Команда з рейтингом 1600 може бути командою 3-2 або командою 1-0 — ELO ставиться до них однаково.

Pi-Рейтинги: Наступна еволюція

У 2013 році Ентоні Константину та Норман Фентон опублікували статтю, яка представила Pi-ratings - рейтингову систему, спеціально розроблену для футболу, яка усуває ключові обмеження ELO. Замість одного числа на команду рейтинги PI підтримують чотири:

⚔️

Домашня атака

Атакуюча сила при грі вдома

🛡️

Домашня оборона

Оборонна сила при грі вдома

⚔️

Виїзна атака

Сила атаки під час гри на виїзді

🛡️

Захист на виїзді

Оборонна сила під час гри на виїзді

Система PI-рейтингу використовує три ключові параметри з оригінальної статті:

Параметр	Значення	Призначення
b	10	Базовий множник для оновлення рейтингу
c	3	Контролює чутливість до різниці цілей
lr	0.1	Швидкість навчання — як швидко адаптуються рейтинги

Після кожного матчу всі чотири рейтинги обох команд оновлюються на основі забитих і пропущених голів. Рейтинг домашньої атаки збільшується, коли команда забиває домашні бали; рейтинг захисту суперника на виїзді зменшується. Це створює багату, багатовимірну картину сили команди.

Рейтинги PI оновлюються поступово після кожного дня матчу. ExPrysm проводить щоденні оновлення, щоб переконатися, що рейтинги відображають останні результати, перш ніж генерувати прогнози.

Як ExPrysm використовує рейтинги команд

ExPrysm не використовує ELO або Pi-рейтинги як окремі предиктори. Натомість вони служать функціями в моделях посилення градієнта CatBoost:

Модель результату матчу: Використовує як рейтинги ELO, так і рейтинги PI серед своїх 69 функцій. Класифікатор CatBoost дізнається, як різниці в рейтингу взаємодіють з іншими ознаками (форма, голова в голові, позиція в лізі) для прогнозування результатів матчу.
Модель цілей: Моделі регресії Пуассона (53 функції) використовують рейтинги PI, щоб допомогти передбачити очікувані цілі. Поділ атаки/оборони тут особливо цінний - рейтинг домашньої атаки команди безпосередньо інформує, скільки голів вони, ймовірно, заб'ють.
Важливість функції: Рейтинги PI становлять приблизно 24,5% загальної важливості функцій у моделі результатів матчу, що робить їх єдиною найвпливовішою групою ознак. Це підтверджує, що вимірювання сили команди є основою точного прогнозування.

Ключовим дизайнерським рішенням в ExPrysm є те, що моделі не використовують функцій на основі парних партій. Рейтинги команд дають сигнал сили «незалежний від ринку», який дозволяє моделі генерувати власні оцінки ймовірностей без прив'язки до коефіцієнтів букмекерської контори.

Порівняння рейтингів ELO проти Pi-

Аспект	ELO	Рейтинги Pi-
Цінності на команду	1	4
Розділ атаки/оборони	No	Yes
Головна/Виїзний спліт	Ні (фіксований HFA)	Так (окремі оцінки)
Використовується різниця голів	Необов'язково	Вбудований
складність	Простий	Помірний
Тлумачуваність	Дуже високий	Високий
Щільність інформації	Low	Високий
Академічна основа	Ело (1960-ті роки)	Константину та Фентон (2013)

Обидві системи мають цінність. ELO забезпечує просту, інтерпретовану базову лінію - ви відразу можете зрозуміти, що команда з рейтингом 1700 сильніша за одну з оцінками 1500. Рейтинги PI надають більш багату інформацію, яку можуть використовувати моделі машинного навчання, зокрема атаку/оборона та розділення домів/поза межами.

Практичний вплив на прогнози

Як різниця в рейтингу перетворюється на ймовірність виграшу? Ось приблизне відображення відмінностей ELO:

Різниця ELO	Сильніша команда Виграш%	Нічий%	% Перемоги слабших команд
0 (дорівнює)	~36%	~28%	~36%
+100	~45%	~27%	~28%
+200	~55%	~24%	~21%
+300	~64%	~21%	~15%
+400	~72%	~17%	~11%

Це приблизні оцінки - модель CatBoost ExPrysm створює більш нюансові ймовірності, розглядаючи всі 69 функцій разом, а не лише різницю в рейтингу. Але ця таблиця ілюструє, чому рейтинги настільки цінні: вони стискають всю історію матчів команди в єдиний прогнозний сигнал.

Завдяки PI-рейтингам модель стає ще більш гранульованою. Команда з високим рейтингом домашньої атаки, але низьким рейтингом захисту на виїзді, буде давати дуже різні прогнози залежно від того, грає вона вдома чи на виїзді - те, що один номер за ELO не може захопити.

Висновок

Рейтинги ELO забезпечують перевірений, інтерпретований показник сили команди, який працює в різних видах спорту десятиліттями. Рейтинги PI розширюють цю концепцію розмірами атаки/оборони та домашні/виїзних розмірів, яких вимагає футбол. ExPrysm використовує обидві функції в своїх моделях CatBoost, де лише рейтинги PI становлять ~ 24,5% важливості функцій, що підтверджує, що точне вимірювання сили команди є найважливішим компонентом прогнозування футболу.

Хочете зрозуміти повну платформу? Читати Що таке ExPrysm? для повного огляду того, як всі моделі працюють разом.