Las matemáticas detrás del concurso “Atrapa un millón” (incluye simulador)

(English version: “The Maths behind The Million Pound Drop Live“)


¿Qué probabilidad tendrías de ganar algo sin tener ni idea en ninguna de las preguntas? En el sentido de teoría de la decisión con incertidumbre y en caso de dudar en una pregunta, ¿es mejor apostar todo a una respuesta o repartir los fajos de billetes?

Para resolver todas estas cuestiones que seguro te quitan el sueño he creado un simulador online y, para los inquietos, explicaré el desarrollo matemático en el que está basado.

Si no te interesan las fórmulas, ve directamente al punto 2 de conclusiones.

1. Reglas del juego
En este programa de televisión, inicialmente se tienen 40 fajos de billetes y el juego consiste en dividirlos entre las respuestas durante una serie de ocho preguntas tipo test. Las cuatro primeras preguntas tienen cuatro respuestas, las tres siguientes tres, y la octava y última solamente dos posibles respuestas.

Como mínimo, siempre hay que dejar una respuesta sin apuesta. Por ejemplo, en las cuatro primeras se pueden dividir los fajos entre tres respuestas como máximo. El número de fajos que pasen de la última pregunta es el premio de los concursantes, que van en parejas y se (suelen) ayudar mutuamente…

2. Conclusiones (para impacientes)

  • Si no tienes ni idea de cuáles son las respuestas y…
    • …apuestas siempre los 40 fajos al azar a una única respuesta, podrás llegar al final con una probabilidad del 0,0046%. Eso sí…en el improbable caso de llegar ¡será con el premio máximo!. Aunque si quieres una dosis de realismo, hay un 99,61% de que no llegues ni a la quinta pregunta.
  • divides equitativamente entre el máximo de respuestas posibles (descartando una de ellas al azar), tendrás “muchas” más opciones: con un 12,39% llegarás a la quinta pregunta, aunque superar la octava pregunta con saldo positivo sólo ocurrirá con un 0,285%. En concreto, con un 0,2765% de ganar 1 fajo, 0,0083% de ganar 2 fajos y un 0,0003% de ganar 3 fajos. ¡Y olvídate de premios superiores porque demasiado lejos has llegado sin tener ni idea! Más te vale conformarte con el juego que regalan de consolación.
  • Ahora, lo más normal es que haya al menos una respuesta que se pueda descartar por sentido común o porque el concursante sepa seguro que no es correcta (en todas excepto en la octava que sólo tiene dos respuestas y puede ser más difícil). Asumamos que ese es el único conocimiento que tiene el concursante, por lo que esa respuesta descartada se deja sin fajos y el resto se reparte equitativamente entre las demás respuestas. En ese caso, resumiendo: ¡hay un 3% de probabilidades de llevarse algún premio!… aunque con un 2,906% será solamente 1 fajo. El juego tendrá un poco más de vidilla porque con un 39,16% se superará la cuarta pregunta. Los resultados completos de este caso se muestran en la siguiente imagen (sacados del simulador de abajo).
  • Un último caso para ilustrar el efecto diezmador de las cuatro primeras preguntas: asumiendo que se está al 100% seguro de las cuatro primeras respuestas y se apuesta todo a la opción verdadera, si se juega el resto del juego totalmente al azar se tendrán hasta un 15% de probabilidades de ganar algo. Comparar con el 0,0046% del caso de juego al azar desde el principio. De hecho, en caso de ganar algo, lo más probable es que se ganen no 1 ni 2 fajos, sino ¡5 fajos!, lo que ocurriría con un 2,82%.

3. Simulador
Os dejo la calculadora que he realizado para este juego. Es mi primer programa en JavaScript y aunque me ha gustado la experiencia, ¡no prometo que funcione en el 100% de navegadores!.

Podéis jugar con el número de respuestas que se descartan (se llevan cero fajos) en cada una de las ocho preguntas, así como la certeza o seguridad que tiene el jugador de que esos descartes los está haciendo bien. Los fajos restantes en cada etapa se repartirán al azar (uniformemente) entre las respuestas no descartadas.

Os recomiendo empezar jugando con las barras de las probabilidades e ir observando como varían los histogramas (estrictamente hablando, son funciones de probabilidad discretas). Existen literalmente millones de posibles desenlaces diferentes pero como ves se pueden calcular las probabilidades de cada caso de manera casi instantánea. ¿Te pica la curiosidad matemática? Pues sigue leyendo más abajo.






4. Las mates

Lo primero es definir el espacio de estado, con qué variables debemos modelar el problema.

Tenemos nueve etapas: una etapa inicial (0) y una etapa tras cada una de las preguntas (1-8). En cada etapa el estado del jugador se resume en un único número entero: el número de fajos que aún tiene en su poder.

Llamamos K_i a ese número de fajos en cada una de las etapas, con i=0…8. Sabemos que se empieza con 40 fajos, así que K_0=40. Para el resto de etapas, necesitamos echar mano de la estadística porque no sabemos exactamente qué pasa, así que necesitamos modelar la incertidumbre.

Se llama distribución de probabilidad discreta o función de masa de probabilidad (fmp) a la función que nos dice la probabilidad de que se dé cada posible estado en un problema. Lo denotamos con una P() mayúscula. Su valor será de 0 para eventos que son imposibles y de 1 para los que son inevitables. Si no estás acostumbrado a cálculos de probabilidad posiblemente te suenen más sus valores multiplicados por 100 y dados como porcentajes de probabilidad.

Para el estado inicial conocemos la fmp a la perfección, ya que es imposible que se tengan 0,1,2…, hasta 39 fajos, y es inevitable tener 40. Resulta una función con todo ceros menos un uno en el valor 40:

Fíjate como la gráfica para “P0″ en el simulador de arriba es justamente esta función.

Ahora llega lo chulo. ¿Qué pasa tras la pregunta 1?  Hagámoslo aún mejor: ¿qué pasa con la fmp entre una etapa i y la siguiente i+1, en general? Pueden pasar muchas cosas: se pueden distribuir los fajos de muy distintas formas, se puede perder cualquier número de ellos, etc.

Para hacer tratable el problema, echamos mano de la ley de la probabilidad total. Si queremos calcular la fmp para el paso i+1, P(N_{i+1}) podemos calcularla como:

En palabras: hay que tener en cuenta todos los posibles caminos independientes (el sumatorio) por los que se puede llegar a tener k fajos, usando las distribuciones condicionales (las del simbolo A|B) de que antes tuviésemos q fajos y, naturalmente, ponderando cada una de esas posibilidad por su probabilidad .

Esa fórmula tiene dos propiedades maravillosas: al tratarse de un espacio de estados discreto podemos hacer la suma de manera exacta (si fueran continuas e integrales la cosa se complica) y además, permite calcular secuencialmente cualquier estado a partir de uno inicial conocido (¡y conocemos la fmp inicial!).

Si conoces la convolución de funciones y miras los histogramas del simulador arriba verás que el efecto es muy parecido: cada fmp es “más ancha” que la anterior. Aunque a diferencia de convolución de funciones continuas, aquí no podemos bajar del valor mínimo (k=0), por lo que todas las probabilidades tienden a acumularse ahí… ¡y nuestro pobre concursante a irse con las manos vacías!

Solo nos queda definir el modelo de transición probabilístico entre etapas, que aparece en la fórmula como la distribución condicional. De nuevo aplicando la ley de la probabilidad total, vemos que tenemos la mezcla de dos distribuciones, cada una ponderada por la probabilidad de haber acertado a la hora de descartar respuestas (P=α) o de haber fallado (P=1-α):

El caso del fallo es sencillo: si te equivocaste al descartar significa que no apostaste nada por la respuesta válida, luego en el siguiente paso tendrás con un 100% de probabilidad cero fajos:
En caso de acertar en el descarte y distribuir los q fajos al azar entre M respuestas, pensando un poco nos podemos dar cuenta de que las probabilidades de acertar son equivalentes a si apostásemos los fajos de uno en uno, colocándolos al azar y por supuesto ciegamente (sin saber cuál es la correcta).

Ese patrón está muy bien estudiado y da lugar a la distribución binomial, por lo que:

donde β=1/M es la probabilidad de acertar habiendo distribuido al azar entre las M respuestas entre las que estamos asumiendo que se encuentra la correcta.

Si quieres ver todos los detalles del cálculo, puedes ver el código fuente (GNU GPL3).

En conclusión… ¡ya no enciendo más la tele, que luego me pico!

Share

Publicado en: Estadística Etiquetado con: ,
  • http://www.blogger.com/profile/00692548259448057451 Aviador

    Acabo de tener una diarrea mental. Impresionante.

  • http://www.blogger.com/profile/15252365705855432569 Ash Sinketchum

    Muy buen análisis :)

    • http://www.blogger.com/profile/04450377732634807411 José Luis Blanco

      Gracias!

  • http://www.blogger.com/profile/10931637791583901856 mikel

    me gusta mucho ese programa, pero relacionado, con lo que aqui se expone, estoy algo fustrado, no me gusta el modelo de juego,no comprendo el porque de que cuantas mas preguntas aciertes mas dinero pierdes , no es logico,que se pierda dinero en las casillas erroneas lo veo normal pero en la que aciertas deberia doblarse el dinero apostado, por que si cada vez vas dividiendo, cuantas mas preguntas menos dinero.

  • http://www.blogger.com/profile/15878182697999729501 Eien

    Gracias por el análisis… Pero tengo una duda:

    “Si no tienes ni idea de cuáles son las respuestas y…

    …divides equitativamente entre el máximo de respuestas posibles (descartando una de ellas al azar), tendrás “muchas” más opciones: con un 12,39% llegarás a la quinta pregunta,”

    Como llegas a eso? Tienes un 75% de posibilidades de pasar la primera, de este 75%, un 75% de pasar la segunda y así cuatro veces.

    Con ese análisis, a mi me sale 31.64% de posibilidades de llegar con algo a la quinta, que me sale de elevar 0.75 a 4 (las posibilidades de pasar cada una de las fases por cuatro).

    Analizando las posibilidades de eliminarse antes de la 5ª pregunta me sale justo el porcentaje complementario: 0.25 (falla en la primera) + 0.75*0.25 (acertar la primera, fallar la segunda) + 0.75*0.75*0.25 + 0.75*0.75*0.75*0.25 = 68.36%

    A veces los cálculos estadísticos son muy anti-intuitivos, así que desde el desconocimiento pregunto: Estoy haciendo algo mal?

    Gracias!

    • http://www.blogger.com/profile/04450377732634807411 José Luis Blanco

      Muy buena pregunta :-)

      Primero respondo a la aparente paradoja a la que has llegado: no es tal, evidentemente.

      Para entender donde está tu error te recomiendo dibujar los posibles estados como un grafo. Tienes un nodo/estado inicial (0) del que puedes pasar a la siguiente etapa (1) con probabilidad p o perder (estado X) con 1-p.

      Una vez en (1), vuelves a tener p de pasar al siguiente (2), pero 1-p de ir… al MISMO estado X que antes.

      Tras N pasos, verás que parar no haber perdido necesitas repetir N veces (independientes) el acierto de probabilidad p, luego P(N)=p^N, como correctamente hiciste.

      Pero hay muchos caminos para llegar al estado de perder “X”: desde 0 con 1-p, desde (1) con 1-p, etc. Si haces la suma, verás como los sucesivos términos se van eliminando, casi todos, hasta dejarte exactamente P(X)=1-p^N, que no puede ser otra cosa más que P(X)=1-P(N) porque tras N pasos el problema sólo puede estar en uno de esos dos estados ;-)

      Y sobre el 12,39% que me sale, realmente es por asumir que cada fajo se reparte aleatoriamente (uniformemente), lo que da lugar a una distribución Binomial: es decir, que si de 4 casillas descartas bien una opción (no apuestes nada a una casilla que es realmente errónea) no te quedarán (1/3)*numero_fajos, sino un número aleatorio con esa media y distribución binomial.

      Los “faldones” de esa distribución se llegan a meter en el 0, es decir, que teniendo 10 fajos a dividir entre 3 casillas podrías perfectamente no apostar NINGUNO en alguna de ellas.

      Saludos,
      JL

  • http://www.blogger.com/profile/03697049413922025283 Oyagum

    Lo único que aquí no siempre juegan las mates jeje como se puede ver en el programa la primera pregunta acostumbra a ser bastante sencilla dentro lo que cabe para que conserven los 200 mil o el millon, dependiendo del día del programa.

    Luego normalmente la tercera y la cuarta acostumbran a ser más complejas y luego llega la quinta la cual vuelve a ser más fácil.

    Hay que recordar que todos estos programas están algo amañados para conseguir lo que quieren y saben cuando tienen que dar premios gordos y cuando no ;)

    Aún recuerdo en un bote de esos historicos en pasapalabra que yo que no soy un cerebro me sabía casi el 90% de las respuestas del rosco, cosa que normalmente me se el 30%… que raro, no? :P

    Pero mola la explicación cientifica ;)

  • Anonymous

    Las matemáticas aquí sobran. NO ES UN JUEGO DE AZAR. Las preguntas no están en sobres encima de la mesa por lo que las cambian a medida que el jugador interese o no al programa. NO ES UN CONCURSO LIMPIO.

  • Euromillon

    Madre de Dios, no he entiendido ni jota, bueno algo si, que no me va a tocar la lotería en la vida…

  • Anonymous

    totalmente de acuerdo con lo de las preguntas , un concurso donde no ves las preguntas que van a hacer no es de fiar , tambien es clarisimo que cuando han desplumado demasiado pronto a un concursante luego les hacen preguntas mas faciles para que lleguen mas lejos . primero era el millon pero se dieron cuenta que la gente se llevaba demasiada pasta y lo bajaron a 200000 euros . la gente no entiende que esta calculado para que no se lleven nada o casi nada. en fin es peor que avanti que ya es decir.

  • antisobera

    este concurso es un TIMO TOTAL y el presentador un CINICO E HIPOCRITA

Recibir por correo electrónico:

Varios

Naukas   Mapping Ignorance