Respuestas a algunas preguntas posibles

Algunas preguntas que pueden surgir sobre el funcionamiento del modelo y sus respuestas. A aquellos que quieran más detalle técnico les sugerimos que nos escriban a treinta1060@gmail.com.

1. Mano a mano

La idea principal del modelo es calcular una fuerza ataque y defensa (y sus plus de localía) para cada equipo. Para esto se utilizan los partidos ya jugados de cada selección.

1.1 ¿Qué partidos se utilizan?

Tomamos todos los partidos a partir del Mundial 2014 (incluido) donde ambos equipos sean parte de las selecciones que disputan las eliminatorias.

1.2 ¿Todos los partidos tienen la misma importancia?

Aquí debemos mencionar varios factores, pero la respuesta es no.

1.2.1 Fecha

Primero que nada se le da más importancia a los resultados más recientes. Esto hace que un equipo que viene “en subida”, tenga más ventaja contra uno que viene decayendo.

1.2.2 Importancia de la competencia

Todos sabemos que para jugar una final del mundo, las selecciones ponen sus mejores equipos y los jugadores hacen sus mayores esfuerzos, sin embargo en los amistosos se prueba y se cuidan más. Es por esto que a los partidos mundialistas se le da más relevancia (ya que le damos importancia a la fecha, tomamos como si se hubiesen jugado un año más cercano a la fecha) y a los amistosos se les quita peso (se toma como si jugaron un año antes).

1.2.3 Localía

Jugar de local siempre da un plus a los equipos, por lo que para cada selección se calcula cierto "plus" de local tanto de ataque como de defensa (los cuales no necesariamente son "positivos").

1.2.4 Formaciones

¿Se tienen en cuenta? En este caso la respuesta es no. No se tienen en cuenta qué jugadores fueron parte de cada encuentro, a priori es un tema complejo de incorporar al modelo. Si uno pudiera detectar partidos donde uno o ambos equipos presentan formaciones muy alejadas de su 11 ideal, podría eliminar esos partidos de la base de datos, por ejemplo. Pero es algo que no hemos hecho.

1.2.5 Importancia del Rival

El modelo toma en cuenta contra qué rivales juega cada equipo. Por ejemplo, si pierde contra un equipo con "buenos coeficientes", no le va a afectar demasiado a los suyos.

1.3 ¿Cómo se calcula la probabilidad de que, por ejemplo, Argentina le gane 2-0 a Ecuador?

Una vez que tenemos la base de datos con los partidos ponderados como se explicó más arriba, mediante un modelo matemático con ayuda de la computación, calculamos la ’fuerza’ de ataque y de defensa de ambos equipos. De esta forma, podemos obtener las probabilidades de que Argentina le haga 2 goles a Ecuador y de que no reciba ninguno. Técnicamente la probabilidad de que Argentina le haga x goles a Ecuador sigue una distribución de Poisson con parámetro la fuerza de ataque de Argentina multiplicada por la fuerza de defensa de Ecuador (cuanto más alto es este valor, más débil es la defensa, a diferencia de lo que pasa con la fuerza de ataque), mientras que la probabilidad de que Ecuador le haga y goles a Argentina sigue una distribución de Poisson con parámetro la fuerza de ataque de Ecuador multiplicada por la fuerza de defensa de Argentina. Se calculan todos los posibles resultados de ese partido (acotando razonablemente el número de goles que un equipo puede hacer o recibir).

1.4 ¿Por qué no figura el 7-1 como resultado posible, si ya sabemos que puede darse?

El modelo está armado suponiendo que ningún equipo va a hacer más de 9 goles en un partido. Sin embargo, como las probabilidades de resultados con más de 5 goles son muy bajas, decidimos sumarlas en una sola. Por lo que, por ejemplo, la probabilidad del 7-1 está sumada a la del 5-0 (a la hora de mostrar las tablas en el sitio fijamos en 5 el máximo número de goles que un equipo puede hacer o recibir e intentamos mantener lo más cercana posible la diferencia de goles), la de 7-5 al 5-3, y la de 6-6 al 5-5.

2. ¿Cómo se calcula la probabilidad de Argentina de clasificar?

Para calcular las probabilidades de la eliminatoria, simulamos cien mil veces y vamos guardando en qué posición finalizó cada equipo. Luego sumamos las veces que Argentina estuvo en los primeros 6 puestos y dividimos por la cantidad de simulaciones del torneo. Por eso decimos que es una “probabilidad empírica”.

2.1 ¿Cómo se simula un partido?

Dividimos el intervalo [0,1] en 36 segmentos donde la longitud de cada uno es la probabilidad de que se de ese resultado (como la suma de probabilidades da 1, se "llena" perfectamente el intervalo). Una vez hecho esto, tomamos un número aleatorio entre 0 y 1 (esto lo hace la computadora) y vemos en qué segmento cae. Por ejemplo, supongamos que tan solo tenemos 3 resultados posibles: 1-0, 0-0 y 0-1, con sus respectivas probabilidades (P(1-0), P(0-0) y P(0-1)). Creamos los intervalos, el cual nos quedaría [0, P(1-0), P(1-0)+P(0-0), P(1-0)+P(0-0)+P(0-1)=1] Una vez terminado esto, tomamos aleatoriamente un número ’t’ entre 0 y 1, y vemos en qué intervalo quedó. A continuación una imagen a modo de ejemplo:

En esta simulación, concluimos que el resultado es 0-0. O sea, el insumo fundamental de la simulación es la probabilidad de cada resultado de cada partido de las eliminatorias.

2.2 Si se tienen las probabilidades de cada partido, ¿por qué se simula? ¿No se puede calcular?

La realidad es que con el insumo de las probabilidades de cada resultado de cada partido, se podrían calcular las probabilidades exactas, sin embargo, son tantos los posibles resultados una única fecha (para dar una idea, para tan solo una fecha hay 36⁵, más de sesenta millones, combinaciones) que se hace imposible en términos computacionales calcularlas exactamente. Al simularlo tantas veces, nos aseguramos que los valores obtenidos se parezcan bastante a los reales.

2.3 Si se vuelve a simular, ¿los resultados van a cambiar?

Sí, pero tan levemente que los cambios son despreciables. Hemos comprobado que con cien mil simulaciones las diferencias entre dos simulaciones distintas no afectan al resultado con 2 decimales (que es lo que subimos al sitio).