¿Puede la ciencia predecir los resultados de los partidos de fútbol?

Publicado: 21 diciembre 2023 a las 8:00 pm

Categorías: Ciencia

[responsivevoice_button buttontext=”Escuchar la noticia” voice=”Spanish Latin American Female”]

Por Laura Hervert Escobar

Un método predictivo le permite pronosticar los resultados de futuros partidos de fútbol. Este modelo se basa en el aprendizaje automático, una disciplina de Inteligencia Artificial.

Los deportes son actividades físicas que el ser humano realiza principalmente con fines recreativos y/o para mejorar su condición física. A lo largo de la historia de la humanidad, los deportes han tenido una gran influencia en la cultura y en la construcción de una identidad nacional. También tienen un impacto positivo en el desarrollo de un país en áreas como la educación, la economía y la salud pública.

Debido a la cantidad de atención que reciben ciertas disciplinas deportivas, se han convertido en uno de los negocios más grandes del mundo y han demostrado ser una parte importante del crecimiento económico. De todos los deportes que existen, muchos expertos coinciden en que el fútbol es el más popular del mundo ya que genera grandes movimientos de dinero a través de apuestas, patrocinios, asistencia a los partidos, venta de camisetas, complementos, etc. Interés en la creación de modelos predictivos y estadísticos.

Además, la gran cantidad de información disponible, como resultados de partidos, inversiones realizadas y características de los jugadores, permite encontrar mecanismos que proporcionen ventajas competitivas.

La propuesta

Hay varios factores que tienen un impacto en el resultado de un partido de fútbol, ​​como la moral y las habilidades del equipo y/o del jugador, la estrategia de entrenamiento y el equipamiento. Todo esto hace que predecir el resultado de un partido sea complejo, incluso para los expertos en la materia.

También genera interesantes preguntas de investigación cuando queremos obtener un modelo de predicción general que pueda aplicarse a cualquier partido de fútbol. Por ejemplo: ¿Qué impacto tienen las reglas de cada liga en el resultado? ¿Es lo mismo predecir un partido de liga regular, un partido de un torneo de liga o un torneo internacional? ¿Cómo es posible obtener una buena predicción conociendo sólo los resultados de partidos anteriores?

Para responder a estas preguntas, nos propusimos predecir los resultados de partidos de fútbol de 52 ligas de todo el mundo utilizando alrededor de 200.000 resultados de partidos anteriores de partidos de liga regulares (sin incluir los torneos de liga). El mismo modelo de predicción se utilizaría luego para predecir la fase de grupos de la Copa Mundial de Fútbol organizada por la FIFA.

La construcción del modelo se basa en Machine Learning. Esta disciplina del campo de la Inteligencia Artificial crea sistemas que aprenden de forma automática. Aprender en este contexto significa identificar patrones complejos entre millones de puntos de datos. A través de la identificación de patrones es posible construir modelos predictivos o de clasificación.

En esta propuesta utilizamos un modelo basado en dos ejes. El primero es un modelo bayesiano basado en la clasificación de cada equipo y el segundo se basa en la historia compartida de los equipos en cuestión.

La clasificacion

Los equipos se clasifican una vez finalizada la temporada. Para ello se utiliza el método de ranking FIFA, combinando el número total de goles marcados y encajados durante toda la temporada.

Cuando un nuevo equipo ingresa a la liga, esto puede penalizar su clasificación. El método elegido para equilibrar el marcador es tener en cuenta el historial de puntos de los equipos veteranos. Así, la puntuación de un equipo veterano se compone del 20% de su puntuación anterior y del 80% de su puntuación actual.

El modelo

El modelo bayesiano utiliza la posición en el ranking de cada equipo en competición para obtener una probabilidad de éxito o fracaso. Posteriormente, utilizando variables aleatorias generadas con distribución triangular, se obtiene una medida de ajuste para recalcular la probabilidad de ganar o perder. Cuando la diferencia en las cuotas de los equipos es inferior al 10%, se declara empate.

La predicción también tiene en cuenta la historia compartida de los equipos competidores. El análisis de datos históricos detectó que los equipos que se enfrentan consistentemente en algunas ligas desarrollan patrones de resultados que son independientes de la posición en la que se clasifican.

Por lo tanto, el modelo completo considera este patrón de comportamiento junto con la clasificación del equipo para determinar la probabilidad de ganar, perder o empatar un partido.

La previsión

Para realizar el pronóstico regular de la liga se utilizó una base de datos de aproximadamente 200.000 resultados de partidos de fútbol de 52 ligas de todo el mundo. La base de datos contiene información sobre la temporada, liga, fecha del partido, equipo local, equipo visitante y el resultado del partido. Se realizó una predicción del día del partido que se celebrará para cada liga después de la última fecha registrada en la base de datos.

Para realizar el pronóstico para el Mundial se utilizó la lista de resultados FIFA de cada equipo clasificado al Mundial, así como información de equipos por grupo y fecha de los partidos. Se hizo una previsión para la fase eliminatoria de grupos, en la que se disputarán tres rondas de partidos entre los integrantes de cada grupo. Los dos equipos con mejor puntuación de cada grupo se clasifican para la siguiente fase.

Los resultados

Se utilizó una puntuación de probabilidad clasificada (RPS) para medir la eficacia de la predicción. Esta medida penaliza más severamente los pronósticos cuando sus probabilidades están más alejadas del resultado real. El valor obtenido con esta medición está dentro del rango de 0-1, siendo cero el valor más deseado.

Otra medida utilizada es la precisión absoluta del pronóstico, comprobándose el porcentaje de acierto en la predicción con esta medida.

El siguiente gráfico muestra los resultados de la predicción por liga, siendo el RPS medio obtenido de 0,2620, mientras que la precisión es del 46%. Estos resultados son competitivos en comparación con el estado del arte. El gráfico muestra el resultado medio obtenido por liga, indicando el tamaño del círculo el número de pronósticos realizados. Como puede verse, la mayoría de los resultados tienden a estar en la parte superior izquierda del gráfico, lo que indica una mayor precisión y un pequeño error de predicción.

Los resultados de la Copa del Mundo se muestran en el siguiente gráfico. Las barras indican la precisión media obtenida en las predicciones de los partidos de las tres jornadas por grupo, con un resultado medio de 0,48. La línea naranja indica el RPS obtenido para la predicción de partidos, con una media de 0,276. Finalmente, la línea azul indica la precisión de los equipos seleccionados para la fase 2, con una media de 0,68.

 

En conclusión

La principal motivación de este trabajo es la oportunidad de probar modelos de pronóstico en un tema tan popular como el fútbol. A pesar de la falta de conocimiento sobre el fútbol en general, primero pudimos comprender el desafío y luego desarrollar un modelo predictivo que fue fácil de implementar.

Cada liga está impulsada por diferentes motivaciones que influyen en el resultado de un partido. Esto puede dificultar el reconocimiento de patrones cuando sólo se conoce el resultado de partidos anteriores. Sin embargo, el modelo nos permite reconocer patrones útiles para la predicción.

En este desarrollo, la mayor parte del tiempo se invirtió en definir la mejor forma de clasificar y acomodar los datos y programar los procedimientos, tratando de hacerlos lo más eficientes posible.

La metodología propuesta es simplemente un ejemplo de un marco más general, aplicado aquí al fútbol. Aunque el marco puede, en principio, adaptarse a una amplia gama de ámbitos deportivos, no puede utilizarse en ámbitos con datos insuficientes.

Otro enfoque a explorar en el futuro es un sistema basado en el conocimiento. Por lo general, esto requiere conocimientos de relativamente buena calidad, mientras que la mayoría de los sistemas de aprendizaje automático dependen de una gran cantidad de datos para obtener buenas predicciones.

Es importante entender que cada liga de fútbol se comporta según un entorno particular. Por lo tanto, un mejor modelo de predicción debería incluir características particulares del partido que se juega, como la importancia del partido, lo que podría ayudar a mejorar la precisión de la predicción.

El trabajo futuro en esta área incluye el desarrollo de un modelo que intenta predecir la puntuación del partido, técnicas más avanzadas y el uso de diferentes parámetros para evaluar la calidad del resultado.

El autor

Laura Hervert Escobar es Licenciada en Ingeniería Industrial por el Instituto Politécnico Nacional. Tiene un doctorado. en Gestión de Ingeniería y Sistemas de la Universidad Tecnológica de Texas y un Ph.D. en Ciencias de la Ingeniería del Tecnológico de Monterrey, donde actualmente se desempeña como investigadora postdoctoral. Su investigación incluye el desarrollo, análisis e implementación de técnicas metaheurísticas para resolver problemas combinatorios complejos de la vida real con diversos objetivos.

Fuente:

Can science predict soccer match results?