Clasificaciones ELO en el fútbol: medición de la fuerza del equipo para las predicciones
Cada modelo de predicción necesita una forma de medir qué tan fuerte es un equipo en este momento, no la temporada pasada, no históricamente, sino hoy. Las clasificaciones ELO proporcionan una solución simple y elegante. Las clasificaciones PI van más allá al separar el ataque de la defensa y el hogar del visitante. A continuación te explicamos cómo funcionan ambas y por qué ExPrysm las usa juntas.
¿Qué son las calificaciones ELO?
El sistema de clasificación ELO fue inventado por Arpad Elo en la década de 1960 para clasificar a los jugadores de ajedrez. La idea central es muy simple: todos los equipos comienzan con una puntuación base (normalmente 1500) y, después de cada partida, el ganador gana puntos mientras que el perdedor pierde puntos. La cantidad transferida depende de lo sorprendente que haya sido el resultado.
Si un equipo fuerte vence a un equipo débil, pocos puntos cambian de manos: el resultado era esperado. Si el equipo débil gana, se transfieren muchos puntos; la sorpresa aporta más información. Con el tiempo, las puntuaciones convergen para reflejar la verdadera fortaleza del equipo.
El ELO fue adaptado para el fútbol por varios investigadores y organizaciones, como la FIFA (para su clasificación mundial hasta 2018) y FiveThirtyEight. Funciona bien porque el fútbol tiene unos resultados claros en cuanto a victorias, empates y derrotas, y los equipos juegan con la suficiente frecuencia como para que las puntuaciones se mantengan actualizadas.
Cómo funciona ELO
La regla de actualización de ELO tiene tres componentes:
Puntuación esperada
Antes de un partido, la puntuación esperada para el equipo local se calcula a partir de la diferencia de puntuación:
Ecasa = 1 / (1 + 10(Rlejos − Rcasa − HFA)/400)
Donde R es la clasificación actual y HFA es el ajuste de la ventaja de jugar en casa (normalmente entre 50 y 100 puntos).
Factor K
El factor K controla cuánto cambian las puntuaciones después de cada partida. Una K más alta significa que las puntuaciones reaccionan más rápido a los resultados recientes (más volátiles), mientras que una K más baja significa que las puntuaciones son más estables pero que se adaptan más lentamente. Los valores típicos oscilan entre 20 y 40 en el fútbol.
Regla de actualización
Tras el partido, las puntuaciones se actualizan en función de la diferencia entre el resultado real y la puntuación esperada:
Rnew = Rold + K × (S)verdadero − Eanticipado)
Dónde Sverdadero = 1 por victoria, 0,5 por empate, 0 por derrota.
El equipo A (puntuación 1650) juega en casa contra el equipo B (puntuación 1500). Con K=30 y HFA=65:
EA = 1 / (1 + 10(1500 − 1650 − 65) /400) = 0.78
Si el equipo A gana: RA = 1650 + 30 × (1 − 0,78) = 1656,6 (+6,6)
Si el equipo B gana: RA = 1650 + 30 × (0 − 0,78) = 1626,6 (−23,4)
La sorpresa transfiere muchos más puntos de calificación que el resultado esperado.
ELO en el contexto del fútbol
Por qué funciona
ELO captura dos cosas simultáneamente: la calidad subyacente del equipo y la forma reciente. Un equipo con una racha de victorias verá subir su clasificación, lo que refleja tanto una mejora genuina como un impulso. Esto convierte a ELO en una función compacta y rica en información para los modelos de predicción.
Limitaciones
El ELO estándar tiene una limitación fundamental para el fútbol: produce un único número por equipo. Esto significa que no puede distinguir entre un equipo que es fuerte en ataque pero débil en defensa, o un equipo que se desempeña de manera diferente en casa y fuera. Un equipo con una puntuación de 1600 puede ser un equipo de 3-2 o un equipo de 1-0; la ELO los trata de forma idéntica.
Pi-Rating: la próxima evolución
En 2013, Anthony Constantinou y Norman Fenton publicaron un artículo en el que presentaban las clasificaciones PI, un sistema de clasificación diseñado específicamente para el fútbol que aborda las principales limitaciones de ELO. En lugar de utilizar un número por equipo, las puntuaciones PI mantienen cuatro:
El sistema de clasificación PI utiliza tres parámetros clave del artículo original:
| Parámetro | Valor | Propósito |
|---|---|---|
| b | 10 | Multiplicador base para actualizaciones de calificación |
| c | 3 | Controla la sensibilidad a la diferencia de goles |
| lr | 0.1 | Tasa de aprendizaje: qué tan rápido se adaptan las calificaciones |
Después de cada partido, las cuatro puntuaciones de ambos equipos se actualizan en función de los goles marcados y recibidos. La calificación de ataque local aumenta cuando el equipo marca en casa; la calificación de defensa visitante del oponente disminuye. Esto crea una imagen rica y multidimensional de la fuerza del equipo.
Las puntuaciones de PI se actualizan de forma gradual después de cada día de partido. ExPrysm realiza actualizaciones diarias para garantizar que las puntuaciones reflejen los resultados más recientes antes de generar predicciones.
Cómo usa ExPrysm las calificaciones de los equipos
ExPrysm no utiliza las clasificaciones ELO o PI como predictores independientes. En su lugar, sirven como características dentro de los modelos de aumento de gradiente de CatBoost:
- Modelo de resultado del partido: Utiliza tanto las clasificaciones ELO como las clasificaciones PI entre sus 69 funciones. El clasificador CatBoost aprende cómo las diferencias de puntuación interactúan con otras características (forma, cara a cara, posición en la liga) para predecir los resultados de los partidos.
- Modelo de objetivos: Los modelos de regresión de Poisson (53 características) utilizan calificaciones PI para ayudar a predecir los objetivos esperados. La separación entre ataque y defensa es particularmente valiosa en este caso: la puntuación de ataque en casa de un equipo informa directamente del número de goles que es probable que marque.
- Importancia de la función: Las puntuaciones PI representan aproximadamente el 24,5% de la importancia total de las funciones en el modelo de resultados de partidos, lo que las convierte en el grupo de largometrajes más influyente. Esto confirma que la medición de la fuerza del equipo es la base de una predicción precisa.
La decisión clave de diseño en ExPrysm es que los modelos no utilizan funciones basadas en probabilidades. Las puntuaciones de los equipos proporcionan una señal de fortaleza «independiente del mercado» que permite al modelo generar sus propias estimaciones de probabilidad sin depender de las cuotas de las casas de apuestas.
Comparación entre las calificaciones ELO y Pi
| Aspecto | ELO | Clasificaciones PI |
|---|---|---|
| Valores por equipo | 1 | 4 |
| División de ataque/defensa | No | Yes |
| Inicio/Fuera de casa | No (HFA fijo) | Sí (clasificaciones separadas) |
| Diferencia de goles utilizada | Opcional | Incorporado |
| Complejidad | Sencillo | Moderado |
| Interpretabilidad | Muy alto | Alto |
| Densidad de información | Low | Alto |
| Base académica | Elo (década de 1960) | Constantino y Fenton (2013) |
Ambos sistemas tienen valor. ELO proporciona una base de referencia simple e interpretable: puedes comprender de inmediato que un equipo con una calificación de 1700 es más fuerte que uno con una calificación de 1500. Las puntuaciones de PI proporcionan información más completa que los modelos de aprendizaje automático pueden aprovechar, en particular, las separaciones entre ataque y defensa y casa/fuera de casa.
Impacto práctico en las predicciones
¿Cómo se traducen las diferencias de calificación en probabilidades de ganar? Esta es una representación aproximada de las diferencias de ELO:
| Diferencia ELO | % de victorias por equipos más fuertes | % de sorteo | % de victorias de equipos más débiles |
|---|---|---|---|
| 0 (igual) | ~36% | ~28% | ~36% |
| +100 | ~45% | ~27% | ~28% |
| +200 | ~55% | ~24% | ~21% |
| +300 | ~64% | ~21% | ~15% |
| +400 | ~72% | ~17% | ~11% |
Estas son estimaciones aproximadas: el modelo CatBoost de ExPrysm produce probabilidades más matizadas al considerar las 69 características juntas, no solo la diferencia de calificación. Pero esta tabla ilustra por qué las puntuaciones son tan valiosas: comprimen todo el historial de partidos de un equipo en una única señal predictiva.
Con las clasificaciones PI, el modelo se vuelve aún más granular. Un equipo con un índice de ataque local alto pero un índice de defensa bajo a domicilio producirá predicciones muy diferentes en función de si juega en casa o fuera, algo que un solo número ELO no puede captar.
Conclusión
Las clasificaciones ELO proporcionan una medida comprobada e interpretable de la fuerza de un equipo que ha funcionado en todos los deportes durante décadas. Las puntuaciones PI amplían este concepto con las dimensiones de ataque/defensa y de casa/visitante que exige el fútbol. ExPrysm utiliza ambas características en sus modelos CatBoost, en los que las puntuaciones por PI por sí solas representan alrededor del 24,5% de la importancia de las características, lo que confirma que la medición precisa de la fuerza de un equipo es el ingrediente más importante a la hora de predecir el fútbol.
¿Quieres entender la plataforma completa? Lea ¿Qué es ExPrysm? para obtener una visión general completa de cómo funcionan todos los modelos en conjunto.