Guillermo Ortega es doctor en Física (UBA) y docente de esta casa de estudios. Concentra sus investigaciones en el análisis de datos en diversas áreas y, en este caso, ha participado como uno de los autores de la investigación “Las actividades en el mercado de transferencias y el rendimiento deportivo en las principales ligas europeas”, publicada recientemente en la prestigiosa revista PLOS ONE. La premisa es sencilla y el círculo se torna virtuoso (o vicioso, dependiendo desde dónde se lo mire): los equipos de primer nivel mundial incorporan mejores jugadores, cosechan más éxitos deportivos, ganan más dinero y se vuelven más poderosos. A continuación, este investigador del Conicet describe y analiza en qué consiste la aplicación de las técnicas de machine learning al deporte más popular de la Tierra.

En principio, ¿de qué manera se vincula el mercado de transferencias con el rendimiento deportivo?

Existe una relación directa entre la política de transferencias que emplea un club y sus éxitos deportivos. Si bien la compra de jugadores es una de las dos formas en que un club forma a sus primeros equipos –jugadores provenientes de divisiones inferiores y aquellos que adquiere en el mercado– el éxito en el rendimiento deportivo está claramente ligado a la compra más que a la producción de buenos jóvenes talentos. Si bien es verdad que los equipos exitosos (Barcelona, Real Madrid) forman muchos excelentes jugadores que llegan a jugar en sus primeros equipos (sin ir más lejos el propio Lionel Messi), la mayoría de ellos terminan en otros y, por lo tanto, sirven para aumentar la rentabilidad del club, que finalmente comprará jugadores más caros y tendrá, en efecto, más éxito en las competencias europeas.

¿Por qué eligieron las ligas europeas?

El futbol es el deporte más popular del mundo con más de 4000 millones de seguidores. Sin dudas, las ligas europeas son las más importantes y en particular las “5 grandes”, España, Inglaterra, Italia, Alemania y Francia, acaparan la mayor atención y mueven las mayores cantidades de dinero. El mercado de transferencias de los equipos en las ligas europeas es mundial ya que compran/venden jugadores a todo el mundo y por lo tanto el estudio de la actividad de transferencias en estas ligas es altamente relevante. De la misma forma, al ser este mercado tan importante desde el punto de vista económico es que existen estadísticas desde hace mucho tiempo y por esa razón hemos decidido estudiar numéricamente su evolución, marcada en algunas características.

¿Qué datos extrajeron?

Una parte del equipo de investigación se encargó de bajar toda la información de las páginas relacionadas con transferencias de jugadores (por ejemplo www.soccerway.com) y me enviaron esos datos. Una de las ocho planillas Excel que recibí contenía más de 260 mil filas y 30 columnas y estaba relacionada con las otras planillas, pero no fue ningún problema convertir todo eso para poder trabajarlo numéricamente.

Es muchísimo, ¿cómo se manipula tanta información?

Se requiere pasar todo a algún entorno de trabajo apto para cálculos numéricos, como por ejemplo el lenguaje R, que es el que principalmente utilizo en mi labor cotidiana. El resto es simplemente explorar los datos y decidir qué herramienta usar. La forma de explorar los datos ha sido por medio de la metodología de redes, ampliamente usada hoy en muchos campos. En este caso, cada club de futbol está representado por un nodo de la red y las conexiones con los otros son las transferencias realizadas entre ellos. A su vez, los enlaces (transferencias) tienen varias características que diferencian unos de otros. Una vez que el análisis exploratorio nos da una idea por donde atacar los datos es que decidimos cual será la mejor herramienta. Desde aquí, ante el gran número de transferencias estudiadas –más de 130.000– no fue difícil decidirlo por un método de machine learning.

¿Qué es?

Lo que se conoce como machine learning no es más que un conjunto de algoritmos desarrollados en los últimos 30 años al amparo del uso de las computadoras y que, por lo tanto, son especialmente útiles en el análisis de grandes cantidades de datos. Podrían agruparse desde el punto de vista del objetivo específico al que están orientados: clasificación, agrupamiento, regresiones, deeplearning, etc. Mi trabajo básicamente es el análisis de datos, y si hay algo que me gusta es explorar cualquier tipo de datos, visualizarlos y “exprimirlos” hasta que comiencen a revelar el secreto que guardan oculto. Si bien trabajo principalmente con datos biomédicos, cuando me dijeron que teníamos la posibilidad de trabajar con datos sobre Neymar, Ronaldo o Di María, o clubes como el Barcelona o el Manchester City, dije que sí desde el primer momento.

En este marco, ¿a qué conclusiones llegaron? ¿Cuál es la novedad del avance?

En el futbol profesional “el éxito se compra”. Los datos muestran que cuanto más dinero gastan los equipos en el mercado de transferencias, más éxitos obtienen desde el punto de vista deportivo. Pero lo que es peor aun es que existe una re alimentación positiva que hace que los equipos exitosos sean los que más dinero ganan, tanto por recaudación de asistencia a los estadios como por derechos de televisión, merchandising, venta de jugadores “exitosos”, etc. Lo que impulsa al club a ganar más dinero que a su vez invierte en jugadores más caros. Además, esta relación se ha reforzado en el tiempo, puntualmente desde 1996 que es cuando empieza nuestro análisis. Esta creo que es la principal novedad que se desprende del trabajo. Es fácil ver que en los últimos años solo existe un grupo muy pequeño de clubes –Barcelona, Real Madrid, Manchester City, etc.– “abonados” a los premios internacionales y locales y los datos nos muestran que eso va a seguir así en los próximos años. La incertidumbre en los resultados deportivos es esencial ya que nadie quiere ver ganar siempre a los mismos.