Classificações ELO no futebol — Medindo a força da equipe para fazer previsões
Todo modelo de previsão precisa de uma forma de medir a força de uma equipe no momento — não na temporada passada, não historicamente, mas hoje. As classificações ELO fornecem uma solução simples e elegante. As classificações de PI vão mais longe ao separar o ataque da defesa e a casa da distância. Veja como ambos funcionam e por que o ExPrysm os usa juntos.
O que são classificações ELO?
O sistema de classificação ELO foi inventado por Arpad Elo na década de 1960 para classificar jogadores de xadrez. A ideia central é muito simples: cada equipe começa com uma classificação básica (normalmente 1500) e, após cada partida, o vencedor ganha pontos enquanto o perdedor perde pontos. O valor transferido depende de quão surpreendente foi o resultado.
Se uma equipe forte vence uma equipe fraca, poucos pontos mudam de mãos — o resultado era esperado. Se a equipe fraca vencer, muitos pontos serão transferidos — a virada traz mais informações. Com o tempo, as classificações convergem para refletir a verdadeira força da equipe.
O ELO foi adaptado para o futebol por vários pesquisadores e organizações, incluindo a FIFA (para seus rankings mundiais até 2018) e FiveThirtyEight. Funciona bem porque o futebol tem resultados claros de vitórias/empates/derrotas e as equipes jogam com frequência suficiente para que as classificações se mantenham atualizadas.
Como funciona o ELO
A regra de atualização do ELO tem três componentes:
Pontuação esperada
Antes de uma partida, a pontuação esperada para o time da casa é calculada a partir da diferença de classificação:
Ecasa = 1 / (1 + 10(Rlonge − Rcasa − HFA)/400)
Onde R é a classificação atual e HFA é o ajuste da vantagem de jogar em casa (normalmente de 50 a 100 pontos).
Fator K
O fator K controla o quanto as avaliações mudam após cada partida. Um K mais alto significa que as classificações reagem mais rapidamente aos resultados recentes (mais voláteis), enquanto um K mais baixo significa que as classificações são mais estáveis, mas mais lentas para se adaptar. Os valores típicos variam de 20 a 40 para futebol.
Regra de atualização
Após a partida, as classificações são atualizadas com base na diferença entre o resultado real e a pontuação esperada:
Rnew = Rold + K × (S)real − Eesperado)
Onde Sreal = 1 por vitória, 0,5 por empate, 0 por derrota.
A equipe A (classificação 1650) joga em casa contra a equipe B (classificação 1500). Com K = 30 e HFA = 65:
EA = 1 / (1 + 10(1500 − 1650 − 65) /400) = 0.78
Se a equipe A vencer: RA = 1650 + 30 × (1 − 0,78) = 1656,6 (+6,6)
Se a equipe B vencer: RA = 1650 + 30 × (0 − 0,78) = 1626,6 (−23,4)
A virada transfere muito mais pontos de classificação do que o resultado esperado.
ELO no contexto do futebol
Por que funciona
O ELO captura duas coisas simultaneamente: a qualidade subjacente da equipe e a forma recente. Uma equipe em uma sequência de vitórias verá sua classificação subir, refletindo uma melhoria genuína e um impulso. Isso torna o ELO um recurso compacto e rico em informações para modelos de previsão.
Limitações
O padrão ELO tem uma limitação fundamental para o futebol: ele produz um único número por equipe. Isso significa que não é possível distinguir entre uma equipe que é forte no ataque, mas fraca na defesa, ou uma equipe que tem um desempenho diferente em casa e fora. Uma equipe classificada como 1600 pode ser uma equipe de 3-2 ou uma equipe de 1-0 — a ELO as trata de forma idêntica.
Pi-ratings: a próxima evolução
Em 2013, Anthony Constantinou e Norman Fenton publicaram um artigo apresentando o Pi-ratings — um sistema de classificação projetado especificamente para futebol que aborda as principais limitações da ELO. Em vez de um número por equipe, as classificações de PI mantêm quatro:
O sistema de classificação PI usa três parâmetros principais do artigo original:
| Parâmetro | Valor | Propósito |
|---|---|---|
| b | 10 | Multiplicador básico para atualizações de classificação |
| c | 3 | Controla a sensibilidade à diferença de gols |
| lr | 0.1 | Taxa de aprendizado — a rapidez com que as classificações se adaptam |
Depois de cada partida, todas as quatro classificações de ambas as equipes são atualizadas com base nos gols marcados e sofridos. A classificação do ataque em casa aumenta quando a equipe marca em casa; a classificação de defesa fora de casa do oponente diminui. Isso cria uma imagem rica e multidimensional da força da equipe.
As classificações de PI são atualizadas de forma incremental após cada dia de jogo. O ExPrysm executa atualizações diárias para garantir que as classificações reflitam os resultados mais recentes antes de gerar previsões.
Como a ExPrysm usa as classificações da equipe
O ExPrysm não usa classificações ELO ou PI como preditores autônomos. Em vez disso, eles servem como recursos nos modelos de aumento de gradiente CatBoost:
- Modelo de resultado da partida: Usa classificações ELO e classificações PI entre seus 69 recursos. O classificador CatBoost aprende como as diferenças de classificação interagem com outros recursos (forma, confronto direto, posição na liga) para prever os resultados das partidas.
- Modelo de metas: Os modelos de regressão de Poisson (53 recursos) usam classificações de PI para ajudar a prever as metas esperadas. A separação entre ataque e defesa é particularmente valiosa aqui — a classificação de ataque em casa de uma equipe informa diretamente quantos gols ela provavelmente marcará.
- Importância do recurso: As classificações de PI representam aproximadamente 24,5% da importância total dos recursos no modelo de resultados da partida, tornando-os o grupo de longas-metragens mais influente. Isso confirma que a medição da força da equipe é a base de uma previsão precisa.
A principal decisão de design no ExPrysm é que os modelos não usam recursos baseados em probabilidades. As classificações das equipes fornecem o sinal de força “independente do mercado” que permite que o modelo gere suas próprias estimativas de probabilidade sem se basear nas probabilidades das casas de apostas.
Comparação entre ELO e Pi-ratings
| Aspecto | ELO | Classificações Pi |
|---|---|---|
| Valores por equipe | 1 | 4 |
| Divisão de Ataque/Defesa | No | Yes |
| Início/Away split | Não (HFA fixo) | Sim (classificações separadas) |
| Diferença de gols usada | Opcional | Embutido |
| Complexidade | Simples | Moderado |
| Interpretabilidade | Muito alto | Alto |
| Densidade da informação | Low | Alto |
| Base acadêmica | Elo (década de 1960) | Constantino e Fenton (2013) |
Ambos os sistemas têm valor. O ELO fornece uma linha de base simples e interpretável — você pode entender imediatamente que uma equipe avaliada em 1700 é mais forte do que uma com classificação em 1500. As classificações de PI fornecem informações mais ricas que os modelos de aprendizado de máquina podem explorar, particularmente as separações de ataque/defesa e casa/fora de casa.
Impacto prático nas previsões
Como as diferenças de classificação se traduzem em probabilidades de vitória? Aqui está um mapeamento aproximado das diferenças do ELO:
| Diferença ELO | % de vitórias de equipe mais fortes | Sorteio% | % de vitórias da equipe mais fraca |
|---|---|---|---|
| 0 (igual) | ~36% | ~28% | ~36% |
| +100 | ~45% | ~27% | ~28% |
| +200 | ~55% | ~24% | ~21% |
| +300 | ~64% | ~21% | ~15% |
| +400 | ~72% | ~17% | ~11% |
Essas são estimativas aproximadas — o modelo CatBoost da ExPrysm produz probabilidades mais sutis ao considerar todos os 69 recursos juntos, não apenas a diferença de classificação. Mas essa tabela ilustra por que as classificações são tão valiosas: elas comprimem todo o histórico de partidas de uma equipe em um único sinal preditivo.
Com classificações de PI, o modelo fica ainda mais granular. Uma equipe com uma alta classificação de ataque em casa, mas baixa classificação de defesa fora de casa, produzirá previsões muito diferentes, dependendo de estar jogando em casa ou fora - algo que um único número ELO não pode capturar.
Conclusão
As classificações ELO fornecem uma medida comprovada e interpretável da força da equipe que funciona em todos os esportes há décadas. As classificações de PI ampliam esse conceito com as dimensões de ataque/defesa e casa/fora de casa que o futebol exige. A ExPrysm usa ambos como recursos em seus modelos CatBoost, onde as classificações de PI sozinhas representam ~ 24,5% da importância das características, confirmando que a medição precisa da força da equipe é o ingrediente mais importante na previsão de futebol.
Quer entender a plataforma completa? Leia O que é o ExPrysm? para uma visão geral completa de como todos os modelos funcionam juntos.