La comparación entre la utilización del VAR por parte de Clos y el método Chi-cuadrado.
Con el permiso. Tomemos las cosas paso a paso. Imaginad que en una tarde de completa monotonía, deciden llevar a cabo un experimento debido al aburrimiento extremo que están experimentando. La prueba implica arrojar un dado en 600 ocasiones y registrar los resultados obtenidos. Si nos ponemos a pensar, el número 6 ha salido en un total de 250 ocasiones. Son conscientes de que no podrán lograrlo. Entienden que hay una posibilidad de 1 entre 6 de sacar un 6 al tirar un dado. Además, son conscientes de que en 600 intentos, es muy probable que el número 6 aparezca casi 100 veces, ya sea más o menos. De manera instintiva, reconocen que si el número se aleja significativamente de 100, algo no está bien.
¿Desde qué punto comienza a detectarse una situación sospechosa en Dinamarca? Hay herramientas estadísticas disponibles que nos ayudan a establecer un umbral a partir del cual las disparidades entre lo esperado y lo observado son tan grandes que sugieren que la causalidad no es simplemente aleatoria. El misterio no resuelto o el mal olor en Dinamarca. Ahora hablemos sobre el fútbol nacional y la tecnología conocida como VAR, diseñada para asistir a los árbitros en decisiones difíciles durante los partidos. Esa herramienta está a cargo de individuos imparciales, objetivos y sin vínculos de interés con otras instituciones.
Después de esta breve introducción, me encontraba paseando por X cuando me topé con varios posts que mostraban capturas de pantalla de tablas con datos estadísticos sobre goles anulados por el VAR. Es muy probable que aquellos que tienen cuenta en X ya estén familiarizados con lo que estoy mencionando. Dos ingenieros de telecomunicaciones dieron a conocer esta información a través de las cuentas @AtalayaBro37373 y @imlsaman en la plataforma X. Les sugeriría que sigan a X en sus redes sociales y también se suscriban al canal de YouTube de El Teleco Calvo, les garantizo que se divertirán mucho. A primera vista, la situación me pareció tan descortés que no podía creerlo. En ese momento recordé la situación de los dados manipulados que solían usar como ilustración en la Universidad para enseñarnos acerca de la homogeneidad e independencia de contrastes. La información que les proporciono a continuación tiene una similitud notable con el ejemplo de los dados que mencioné en el párrafo anterior.
Fotografía del artículo: La comparación entre el VAR de Clos y la prueba estadística Chi-cuadrado.
Esta información es suficiente por sí sola y no requiere de complementos ni aclaraciones. La descripción en sí misma es adecuada. Parece que el dado que estamos utilizando podría estar manipulado, ¿en qué punto podríamos confirmar esta sospecha basándonos en datos concretos? Para descubrirlo, recordé mis conocimientos universitarios y recurrí al análisis estadístico de la prueba de Chi-cuadrado. Este examen nos brinda un valor sin dimensiones ni tamaño. Resumiendo, el número X2, que a partir de ahora mencionaremos como La Palanka, nos muestra la disparidad entre los goles anotados y los goles proyectados, para que sea más accesible y menos formal o pretencioso. Ya sea para los aprobados o para los rechazados. De manera instintiva, a medida que este número aumenta, también lo hace la disparidad entre la realidad y las expectativas. Nos dice si tenemos razones para cuestionar si la realidad se distancia significativamente de lo que debería haber ocurrido en teoría.
Estoy familiarizado con lo tangible, es lo que hemos presenciado. En lo que respecta al Real Madrid, se han confirmado 489 goles y se han anulado 33 goles. ¿Cómo se puede determinar la esperanza matemática? En el caso de lanzar dados, el cálculo es bastante fácil. Si arrojo un dado en 600 ocasiones, espero que el número 6, que tiene una probabilidad de 1/6 de salir en cada lanzamiento, aparezca al menos unas 100 veces ya que es el resultado más probable. Se espera que cada uno de los seis números del dado tenga una distribución teórica de 100. Vamos a contrastar la distribución teórica con los resultados obtenidos en nuestra muestra experimental.
Comparación entre el VAR de Clos y el análisis de la chi-cuadrado en el artículo.
En nuestra situación, es necesario tener en cuenta la probabilidad de que un gol sea invalidado por el VAR al calcular los valores esperados. Aunque no conozco el dato exacto, puedo obtener una estimación dividiendo 165 entre 4120, lo cual da como resultado 0,04. Después de eso, en el caso del Real Madrid, se calculó de la siguiente forma: multiplicando 0.04 por 522, se obtiene un total de 20.91 goles esperados anulados. Restando 20,91 a 33, obtenemos una diferencia de 12,09 entre lo observado y lo esperado. En otras palabras, en teoría se han descartado 12,09 goles adicionales a los que se esperaba. Después de eso, los goles esperados que no fueron anulados serán 501,09 goles validados. En otras palabras, se esperan 501.09 goles.
Es importante considerar tanto los goles anulados como los goles validados para calcular La Palanka, ya que representan diferencias que están siendo observadas y anticipadas. Con las dos discrepancias presentes, procedo a realizar las operaciones matemáticas correspondientes para encontrar los valores que se encuentran en las últimas dos columnas del cuadro que se muestra un poco más abajo.
Y no quiero seguir aburriéndoles con más cálculos obsesivos. Después de realizar el cálculo mencionado anteriormente con cada uno de los equipos, procedo a realizar una serie de operaciones con las diferencias, sumando los resultados para obtener La Palanka. Estoy adjuntando los resultados, por si acaso hay alguien con intereses especiales en la sala que pueda encontrarlos sorprendentemente interesantes.
Fotografía del artículo: El uso del VAR por parte de Clos comparado con la Chi-cuadrado.
Los datos presentados son obtenidos realizando la operación de elevar al cuadrado cada diferencia y luego dividiendo el resultado entre el valor esperado.
Al sumar 0,8068 y 19,3384 se obtendría como resultado La Palanka. Es decir, veinte mil ciento cincuenta y dos.
Antes de analizar el resultado de La Palanka, hay algo más que debemos tener en cuenta. La información se refiere a los primeros partidos de la temporada 2018/2019 hasta la vigésima jornada de la temporada en curso. Debido a que el VAR se introdujo por primera vez en España en la temporada 18/19, hemos podido analizar cerca de 300 partidos por equipo. Por lo tanto, la ausencia de datos de la jornada 21 apenas tendrá impacto en las conclusiones finales, debido a la gran cantidad de información disponible.
Los dos ingenieros comparten una gran cantidad de información sumamente intrigante. Sugiero que revisen sus cuentas de X y las estudien con calma, sin perder los estribos. Agradezco a quienes me han proporcionado esta pequeña fracción de información, ya que sabemos que el proceso de recopilación, depuración y presentación de datos estadísticos es una tarea ardua.
Continuamos con lo más importante, la parte fundamental de este sencillo escrito.
Voy a tratar de explicarlo de la manera en que prefiero que me expliquen las cosas. Lo que viene a continuación no es información descriptiva estadística que, como su nombre lo indica, proporciona una descripción. En este momento estamos discutiendo la toma de decisiones y la deducción a partir de la conducta de variables aleatorias.
Nos interesa averiguar si la cantidad de goles invalidados por el VAR es uniforme entre todos los equipos. Esta será la hipótesis nula que estamos planteando. En el ámbito de la estadística, al formular una hipótesis nula, es necesario establecer un nivel de significancia que determine el riesgo que estamos dispuestos a aceptar. El nivel de significancia es un concepto importante en estadística, siendo comúnmente utilizado en porcentajes del 10%, 5% y 1%. Estableceremos un nivel de significación del 5% para nuestro estudio. Esto significa que estamos listos para rechazar la hipótesis nula, incluso si es cierta, solo en el 5% de las ocasiones.
El VAR de Clos y su comparación con la Chi-cuadrada en el artículo.
El valor estimado (La Palanka) es en realidad una medida estadística que se adapta a una función matemática conocida como función de densidad de probabilidad, la cual nos da la probabilidad en relación al valor estimado. Al revés, la función me indica cuál es el valor de dicho estadístico para una probabilidad específica (La Palanka). Pongamos un ejemplo: piensen en una función que nos indique cuántos tomates podríamos adquirir con cierta cantidad de dinero, o al revés, cuánto dinero necesitaríamos para adquirir una cantidad específica de tomates. La densidad de población y el valor de La Palanka son equivalentes.
En lo que respecta a nuestra situación específica, estamos preparados para aceptar un margen de error del 5%. Aquí se puede ver la probabilidad establecida. El valor máximo asociado con esa probabilidad es de 18.3070, el cual Excel nos proporciona. Cualquier número menor a ese valor es suficiente para que pueda confirmar mi hipótesis de que el VAR anula goles de manera equitativa para todos los equipos. No obstante, al calcular el valor basado en la discrepancia entre la muestra observada y la esperada, obtenemos un número más alto de 20,1452. Después de realizar un análisis estadístico con un nivel de significación del 5%, hemos concluido que no se puede aceptar la idea de que el VAR anula goles a los equipos de manera equitativa, a excepción de las variaciones normales causadas por el azar o la casualidad. Existe un respaldo estadístico que indica que la hipótesis nula no se cumple.
No aceptamos la idea de que el VAR, por diversas razones, no anula tantos goles como debería. Claro, ¡por supuesto! Y cada persona puede sacar sus propias conclusiones sobre el tema.
Siguiendo el caso de los tomates como referencia. Parten de la premisa de que, a cambio de una suma de dinero, pueden adquirir una cantidad específica de tomates. Después de verificar la cantidad de efectivo que teníamos y el precio de los tomates, nos informaron que no podíamos adquirir los tomates deseados debido a la falta de fondos disponibles.
Descartar la hipótesis nula no implica necesariamente respaldar una hipótesis alternativa como la que sugiere que el VAR opera de manera fraudulenta debido a posibles conflictos de interés. No aceptamos la idea de que el VAR, por cualquier motivo, no cancele goles en igual medida. Sin ninguna otra cosa que añadir. Cada persona puede sacar las conclusiones que desee.
Y así concluye. Para aquellos que son extremadamente escépticos: si estuviéramos dispuestos a aceptar un riesgo del 1%, la hipótesis nula no sería descartada. Pero quiero dejar en claro que si la tendencia de los goles anulados continúa como hasta ahora, en un plazo máximo de una o dos temporadas, incluso el riesgo mínimo que representa no permitirá aceptar la hipótesis nula.
Lo siento por aburrirte. Tomar una aspirina hará que el dolor desaparezca. Y te doy las gracias por haber llegado tan lejos.
.