Рейтинги ELO в футболе — оценка силы команды при составлении прогнозов
Каждая модель прогнозирования должна измерять, насколько сильна команда сейчас — не в прошлом сезоне, не в прошлом сезоне, не в истории, а сегодня. Рейтинги ELO — простое и элегантное решение. Рейтинги PI позволяют еще больше разграничить атаку и защиту, а дома — на выезде. Вот как работают оба метода и почему ExPrysm использует их вместе.
Что такое рейтинги ELO?
Рейтинговая система ELO была изобретена Арпадом Эло в 1960-х годах для ранжирования шахматистов. Основная идея очень проста: каждая команда начинает с базового рейтинга (обычно 1500), и после каждого матча победитель получает очки, а проигравшая теряет очки. Сумма перевода зависит от того, насколько неожиданным оказался результат.
Если сильная команда побеждает слабую команду, мало очков переходит из рук в руки — результат был ожидаемым. Если побеждает слабая команда, многие очки переводятся на другую сторону — в проигрыше больше информации. Со временем рейтинги сходятся, что отражает реальную силу команды.
ELO был адаптирован для футбола несколькими исследователями и организациями, включая FIFA (мировой рейтинг до 2018 года) и FiveThirtyEight. Это хорошо работает, потому что в футболе есть четкие результаты побед, ничьих и поражений, а команды играют достаточно часто, чтобы рейтинги оставались актуальными.
Как работает ELO
Правило обновления ELO состоит из трех компонентов:
Ожидаемый балл
Перед матчем ожидаемое количество очков хозяев поля рассчитывается на основе разницы в рейтингах:
Eглавная = 1 / (1 + 10(Rпрочь − Rглавная − HFA)/400)
Где R — текущий рейтинг, а HFA — корректировка преимущества домашнего поля (обычно 50—100 баллов).
K-фактор
Коэффициент K определяет, насколько сильно изменяются рейтинги после каждого матча. Более высокое значение K означает, что рейтинги быстрее реагируют на последние результаты (более изменчивы), а меньшее значение K означает, что рейтинги более стабильны, но адаптируются медленнее. Типичные значения для футбола варьируются от 20 до 40.
Правило обновления
После матча рейтинги обновляются на основе разницы между фактическим результатом и ожидаемым результатом:
Rnew = Rold + K × (С)фактический − Eожидаемый)
Где Sфактический = 1 за победу, 0,5 за ничью, 0 за проигрыш.
Команда A (рейтинг 1650) играет дома против команды B (рейтинг 1500). При значении K = 30 и HFA = 65:
EA = 1 / (1 + 10(1500 − 1650 − 65) /400) = 0.78
Если команда A выиграет: RA = 1650 + 30 × (1 − 0,78) = 1656,6 (+6,6)
Если команда B выиграет: RA = 1650 + 30 × (0 − 0,78) = 1626,6 (−23,4)
Огорчение приносит гораздо больше рейтинговых очков, чем ожидаемый результат.
ELO в футбольном контексте
Почему это работает
ELO учитывает две вещи одновременно: качество основной команды и ее текущую форму. Рейтинг команды, добившейся серии побед, повысится, что будет отражать как реальные улучшения, так и динамику. Таким образом, ELO представляет собой компактную и насыщенную информацией функцию для моделей прогнозирования.
Ограничения
Стандартное ELO имеет фундаментальное ограничение в футболе: каждая команда получает один номер. Это означает, что нельзя отличить команду, которая сильна в атаке, но слаба в защите, или команду, которая играет дома или в гостях по-разному. Команда с рейтингом 1600 может быть командой со счетом 3:2 или 1:0. ELO относится к ним одинаково.
Pi-ratings: новая эволюция
В 2013 году Энтони Константину и Норман Фентон опубликовали статью, в которой представили Pi-ratings — рейтинговую систему, специально разработанную для футбола и учитывающую ключевые ограничения ELO. Вместо одного числа на команду в рейтингах PI используется четыре цифры:
Система Pi-ratings использует три ключевых параметра из оригинальной статьи:
| Параметр | Ценность | Назначение |
|---|---|---|
| b | 10 | Базовый множитель для обновления рейтинга |
| c | 3 | Контролирует чувствительность к разнице мячей |
| lr | 0.1 | Скорость обучения — как быстро рейтинги адаптируются |
После каждого матча все четыре рейтинга обеих команд обновляются на основе забитых и пропущенных голов. Рейтинг атаки хозяев увеличивается, когда команда забивает гол дома; рейтинг защиты соперника на выезде снижается. Это создает богатую многомерную картину силы команды.
Pi-рейтинги обновляются постепенно после каждого игрового дня. ExPrysm ежедневно обновляет рейтинги, чтобы до составления прогнозов они отражали последние результаты.
Как ExPrysm использует командные рейтинги
ExPrysm не использует рейтинги ELO или PI в качестве автономных предикторов. Вместо этого они служат функциями моделей повышения градиентов CatBoost:
- Модель результатов матча: Среди 69 функций использует как рейтинги ELO, так и Pi-рейтинги. Классификатор CatBoost изучает, как различия в рейтингах взаимодействуют с другими характеристиками (форма, личные встречи, позиция в лиге) для прогнозирования результатов матчей.
- Модель целей: Регрессионные модели Пуассона (53 функции) используют рейтинги PI для прогнозирования ожидаемых целей. Разделение атаки и защиты здесь особенно важно: рейтинг атаки хозяев команды напрямую влияет на то, сколько голов она может забить.
- Важность функции: Рейтинги PI составляют примерно 24,5% от общей важности функций в модели результатов матчей, что делает их самой влиятельной группой функций. Это подтверждает, что измерение силы команды является основой точного прогнозирования.
Ключевое дизайнерское решение в ExPrysm заключается в том, что модели не используют функции, основанные на коэффициентах. Рейтинги команд являются «независимым от рынка» показателем эффективности, позволяющим модели самостоятельно составлять оценки вероятности без привязки к коэффициентам букмекеров.
Сравнение рейтингов ELO и Pi
| Аспект | ELO | Рейтинги Pi |
|---|---|---|
| Ценности для каждой команды | 1 | 4 |
| Разделение атаки и защиты | No | Yes |
| Разделение на гостях и | Нет (фиксированный HFA) | Да (отдельные оценки) |
| Используемая разница мячей | Опционально | Встроенный |
| Сложность | Простой | Умеренный |
| Интерпретируемость | Очень высокий | Высокое |
| Плотность информации | Low | Высокое |
| Академическая основа | Эло (1960-е годы) | Константину и Фентон (2013) |
Обе системы имеют ценность. Система ELO предлагает простой и понятный исходный показатель: вы сразу поймете, что команда с рейтингом 1700 сильнее команды с рейтингом 1500. Рейтинги PI предоставляют более подробную информацию, которую могут использовать модели машинного обучения, особенно в том, что касается разграничения атаки и защиты, а также разницы между хозяевами и гостями.
Практическое влияние на прогнозы
Как разница в рейтингах влияет на вероятность выигрыша? Вот примерное сопоставление различий в ELO:
| Разница в ELO | % побед более сильной команды | Ничья% | % побед слабой команды |
|---|---|---|---|
| 0 (равно) | ~36% | ~28% | ~36% |
| +100 | ~45% | ~27% | ~28% |
| +200 | ~55% | ~24% | ~21% |
| +300 | ~64% | ~21% | ~15% |
| +400 | ~72% | ~17% | ~11% |
Это приблизительные оценки: модель ExPrysm CatBoost дает более детальные вероятности, учитывая все 69 функций вместе, а не только разницу в рейтингах. Но эта таблица показывает, почему рейтинги так ценны: они сводят всю историю матчей команды к единому прогнозирующему сигналу.
Благодаря рейтингу PI модель становится еще более детализированной. Команда с высоким рейтингом атаки хозяев, но с низким рейтингом защиты на выезде может давать совершенно разные прогнозы в зависимости от того, играет ли она дома или в гостях, что невозможно отразить по одному номеру ELO.
Заключение
Рейтинги ELO — это проверенный и поддающийся интерпретации показатель силы команды, который десятилетиями использовался в различных видах спорта. Рейтинги PI расширяют эту концепцию, включая такие аспекты, как атака, защита и домашняя игра на выезде, в соответствии с требованиями футбола. ExPrysm использует и то, и другое в своих моделях CatBoost, где только рейтинги PI играют важную роль примерно в 24,5%. Это подтверждает, что точное измерение силы команды является самым важным фактором при составлении футбольных прогнозов.
Хотите разобраться в полной версии платформы? Прочтите Что такое ExPrysm? для полного обзора того, как все модели работают вместе.