Machine Learning

Finding “La Liga” Best Players using Anomaly Detector

December 27, 2016

|Ramon Julià

Los algoritmos de  detección de anomalías se utilizan para encontrar  registros no  usuales en un conjunto de datos. Los campos de  aplicación son muy diversos :

– El análisis de eventos en redes informáticas y servidores para detectar los eventos sospechosos ( Hackers).

– Estudio de las transacciones de tarjetas de crédito u otro tipo de transacciones electrónicas, para detectar operaciones fraudulentas.

En este post analizaremos su viabilidad para detectar la clase minoritaria, que en esta ocasión  serán los mejores jugadores de La Liga de Futbol profesional de la temporada 2015-16.

Objetivo

Nuestro objetivo será buscar los mejores jugadores de futbol de la primera división de la liga Española de la temporada 2015-16, mediante la búsqueda de los jugadores que presentan una “anomalía” mayor dentro del conjunto.

Que quede dicho de antemano, que un jugador presente una “anomalía” mayor respecto al resto, no necesariamente significa que sea un jugador destacado. Puede que se detecte una “anomalía” por ser especialmente único en alguna de sus características o realmente su rendimiento este muy por debajo del conjunto de sus compañeros.

Análisis

Para iniciar el proyecto debemos tener una fuente de datos con todos los jugadores que han intervenido en la liga durante la temporada 2015-16 y los datos estadísticos de su rendimiento. Para ellos utilizaremos los datos recopilados en la web futbolfantasy (www.futbolfantasy.com).

Para cada jugador disponemos de los siguientes datos : partidos jugados, minutos, goles marcados, asistencias, paradas, goles encajados, tiros, tiros a puerta, % precisión  tiros, centros, etc., hasta un total de 29 registros.

Para realizar el análisis utilizaremos la herramienta  Bigml (www.bigml.com)  que por su diseño y versatilidad nos permitirá realizar nuestro experimento de  una forma rápida y sencilla.

En primer paso, una vez obtenemos los datos de los jugadores,  será crearnos un dataset para lo que utilizaremos la opción “1-click dataset” de Bigml y obtenemos:

 

                                                                                                        ( imagen parcial del dataset)

 

Donde podemos observar la distribución estadística de cada uno de los campos.

Una vez disponemos de nuestro dataset, crearemos nuestro detector de anomalias ( 1-click anomaly) y lo aplicamos a toda fuente de datos para realizar un “scoring” de cada uno de los jugadores para conocer su grado de “anomalia” y asi poder establecer un ranking.

 

 

El resultado que se obtiene para los 11 jugadores más “anomalos “ de la temporada 2015-2016 son:

 

 

 

 

Conclusiones :

En primer lugar he de confesar que no soy un experto en materia futbolistica, sin embargo a la vista de los resultados que el algoritmo de deteccion de anomalias presenta, podemos decir que funciona razonablemente bien. Las cuatro primeras posiciones del ranking que ha calculado el algorittmo,  claramente se corresponden con los jugadores “estrella” de la Liga Española.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *