Ganar un Juego Injusto

Problema 44, libro de Mosteller

Un juego consiste en una secuencia de jugadas; en cada jugada, tú o tu oponente anotan un punto, tú con probabilidad p (menos de \( \frac{1}{2} \)), él con probabilidad \( 1 - p \). El número de jugadas debe ser par—2 o 4 o 6, y así sucesivamente. Para ganar el juego debes obtener más de la mitad de los puntos. Sabes que p es 0.45, y obtienes un premio si ganas. Puedes elegir de antemano el número de jugadas. ¿Cuántas jugadas eliges?

Solución para Ganar un Juego Injusto

No te acobardes solo porque el juego es injusto; después de todo, tú eres el único elegible para un premio. Llamemos a ti jugador A y a tu oponente jugador B. Llamemos al número total de jugadas \( N = 2n \). En una jugada dada, tu probabilidad de ganar un punto es \( p \), la de tu oponente es \( q = 1 - p \).

A primera vista, la mayoría de las personas notan que el juego es injusto y, por lo tanto, a medida que \( N \) aumenta, el valor esperado de la diferencia (los puntos de A menos los puntos de B) crece más y más negativo. Concluyen que A debería jugar tan poco como pueda y aún así ganar—es decir, dos jugadas.

Si se hubiera permitido un número impar de jugadas, este razonamiento basado en valores esperados habría llevado a la respuesta correcta, y A debería elegir solo una jugada. Con un número par de jugadas, entran en juego dos efectos opuestos: (1) el sesgo a favor de B, y (2) la redistribución de la probabilidad en el término medio de la distribución binomial (la probabilidad de un empate) a medida que el número de jugadas aumenta.

Consideremos, por un momento, un juego justo (\( p = \frac{1}{2} \)). Entonces, cuanto mayor sea \( N \), mayor será la probabilidad de que A gane porque a medida que \( 2n \) aumenta, la probabilidad de un empate tiende a cero, y el valor límite de la probabilidad de que A gane es \( \frac{1}{2} \). Para \( N = 2, 4, 6 \), sus probabilidades son \( \frac{1}{4}, \frac{5}{16}, \frac{22}{64} \). La continuidad sugiere que para valores de \( p \)  ligeramente menor que \( \frac{1}{2} \), A debería elegir un número grande pero finito de jugadas. Pero si \( p \) es pequeño, \( N = 2 \) debería ser óptimo para A. Resulta que para \( p < \frac{1}{3} \), \( N = 2 \) es óptimo.

Tu probabilidad de ganar en un juego de \( 2n \) pruebas es la suma de las probabilidades de obtener \( n + 1, n + 2, \ldots, 2n \) puntos, una suma dada por

\[ P_{2n} = \sum_{x=n+1}^{2n} \binom{2n}{x} p^x q^{2n-x}. \]

En un juego de \( 2n + 2 \) jugadas, la probabilidad de ganar al menos \( n + 2 \) puntos y el juego es

\[ P_{2n+2} = \sum_{x=n+2}^{2n+2} \binom{2n+2}{x} p^x q^{2n+2-x}. \]

Un juego compuesto de \( 2n + 2 \) jugadas puede considerarse como si se hubiera creado añadiendo dos jugadas a un juego de \( 2n \) jugadas. A menos que el jugador A haya ganado \( n \) o \( n + 1 \) veces en el juego de \( 2n \), su estado como ganador o perdedor no puede diferir en el juego de \( 2n + 2 \) del juego de \( 2n \).

Excepto por estas dos posibilidades, \( P_{2n+2} \) sería idéntico a \( P_{2n} \). Estas excepciones son: (1) habiendo tenido \( n + 1 \) éxitos en las primeras \( 2n \) jugadas, A pierde las dos siguientes, reduciendo así su probabilidad de ganar en el juego de \( 2n + 2 \) por

\[ q^2 \binom{2n}{n+1} p^{n+1} q^{n-1}, \]

o (2) habiendo ganado \( n \) jugadas en el juego de \( 2n \), gana las siguientes dos, aumentando su probabilidad por

\[ p^2 \binom{2n}{n} p^n q^n. \]

Si \( N = 2n \) es el valor óptimo, entonces tanto \( P_{N-2} \leq P_N \) y \( P_N \geq P_{N+2} \) deben mantenerse. Los resultados del párrafo anterior implican que estas desigualdades son equivalentes a las dos siguientes desigualdades:

\[ q^2 \binom{2n-2}{n} p^n q^{n-2} \leq p^2 \binom{2n-2}{n-1} p^{n-1} q^{n-1}, \]

\[ q^2 \binom{2n}{n+1} p^{n+1} q^{-1} \leq p^2 \binom{2n}{n} p^n q^n. \]

Después de algunas simplificaciones, lo cual puedes verificar (excluimos el caso trivial \( p = 0 \)), reducimos las desigualdades (1) a

Estas desigualdades producen, después de un poco de álgebra, la condición

\[ \frac{1}{1-2p} - 1 \leq 2n \leq \frac{1}{1-2p} + 1. \]

Por lo tanto, a menos que \( 1/(1-2p) \) sea un número entero impar, \( N \) se determina de manera única como el entero par más cercano a \( 1/(1-2p) \). Cuando \( 1/(1-2p) \) es un número entero impar, ambos enteros pares adyacentes dan la misma probabilidad óptima. Y podemos probar incidentalmente que cuando \( 1/(1-2p) = 2n + 1 \), \( P_{2n} = P_{2n+2} \).

En consecuencia, para \( p = 0.45 \), tenemos \( 1/(1-0.9) = 10 \) como el número óptimo de jugadas a elegir.

Este material está abreviado de "Longitud óptima de juego para un juego binomial," Mathematics Teacher, Vol. 54, 1961, pp. 411-412.

P. G. Fox originalmente aludió a un resultado que da origen a este juego en "Un manual para tontos," que apareció en el Saturday Evening Post, el 21 de noviembre de 1959, y discutió la idea más a fondo en correspondencia privada que surgió de ese artículo en una nota titulada "Una curiosidad en la expansión binomial—y una lección en lógica." Estoy en deuda con Clayton Rawson y John Scarne por alertarme sobre el artículo de Fox y con Fox por su correspondencia útil.

 

Simulación con chatGPT

Simulación de un Juego Injusto

Resultados

 

 

Créditos
Traducción del problema 44 del libro Fifty Challenging Problems in Probability with Solutions,  F.  Mosteller,  Dover, New York, 1965 , MOSTELLER

Vídeo introducción con lumen5.com

Simulación realizada por chatGPT

 

 


Consolación Ruiz Gil Mayo 2024

 https://www.matsolin.com/juegoinjusto/index.htm