Ganar un Juego InjustoProblema 44, libro de Mosteller Un juego consiste en una secuencia de jugadas; en cada jugada, tú o tu oponente anotan un punto, tú con probabilidad p (menos de \( \frac{1}{2} \)), él con probabilidad \( 1 - p \). El número de jugadas debe ser par—2 o 4 o 6, y así sucesivamente. Para ganar el juego debes obtener más de la mitad de los puntos. Sabes que p es 0.45, y obtienes un premio si ganas. Puedes elegir de antemano el número de jugadas. ¿Cuántas jugadas eliges?
Solución para Ganar un Juego InjustoNo te acobardes solo porque el juego es injusto; después de todo, tú eres el único elegible para un premio. Llamemos a ti jugador A y a tu oponente jugador B. Llamemos al número total de jugadas \( N = 2n \). En una jugada dada, tu probabilidad de ganar un punto es \( p \), la de tu oponente es \( q = 1 - p \). A primera vista, la mayoría de las personas notan que el juego es injusto y, por lo tanto, a medida que \( N \) aumenta, el valor esperado de la diferencia (los puntos de A menos los puntos de B) crece más y más negativo. Concluyen que A debería jugar tan poco como pueda y aún así ganar—es decir, dos jugadas. Si se hubiera permitido un número impar de jugadas, este razonamiento basado en valores esperados habría llevado a la respuesta correcta, y A debería elegir solo una jugada. Con un número par de jugadas, entran en juego dos efectos opuestos: (1) el sesgo a favor de B, y (2) la redistribución de la probabilidad en el término medio de la distribución binomial (la probabilidad de un empate) a medida que el número de jugadas aumenta. Consideremos, por un momento, un juego justo (\( p = \frac{1}{2} \)). Entonces, cuanto mayor sea \( N \), mayor será la probabilidad de que A gane porque a medida que \( 2n \) aumenta, la probabilidad de un empate tiende a cero, y el valor límite de la probabilidad de que A gane es \( \frac{1}{2} \). Para \( N = 2, 4, 6 \), sus probabilidades son \( \frac{1}{4}, \frac{5}{16}, \frac{22}{64} \). La continuidad sugiere que para valores de \( p \) ligeramente menor que \( \frac{1}{2} \), A debería elegir un número grande pero finito de jugadas. Pero si \( p \) es pequeño, \( N = 2 \) debería ser óptimo para A. Resulta que para \( p < \frac{1}{3} \), \( N = 2 \) es óptimo. Tu probabilidad de ganar en un juego de \( 2n \) pruebas es la suma de las probabilidades de obtener \( n + 1, n + 2, \ldots, 2n \) puntos, una suma dada por \[ P_{2n} = \sum_{x=n+1}^{2n} \binom{2n}{x} p^x q^{2n-x}. \] En un juego de \( 2n + 2 \) jugadas, la probabilidad de ganar al menos \( n + 2 \) puntos y el juego es \[ P_{2n+2} = \sum_{x=n+2}^{2n+2} \binom{2n+2}{x} p^x q^{2n+2-x}. \] Un juego compuesto de \( 2n + 2 \) jugadas puede considerarse como si se hubiera creado añadiendo dos jugadas a un juego de \( 2n \) jugadas. A menos que el jugador A haya ganado \( n \) o \( n + 1 \) veces en el juego de \( 2n \), su estado como ganador o perdedor no puede diferir en el juego de \( 2n + 2 \) del juego de \( 2n \). Excepto por estas dos posibilidades, \( P_{2n+2} \) sería idéntico a \( P_{2n} \). Estas excepciones son: (1) habiendo tenido \( n + 1 \) éxitos en las primeras \( 2n \) jugadas, A pierde las dos siguientes, reduciendo así su probabilidad de ganar en el juego de \( 2n + 2 \) por \[ q^2 \binom{2n}{n+1} p^{n+1} q^{n-1}, \] o (2) habiendo ganado \( n \) jugadas en el juego de \( 2n \), gana las siguientes dos, aumentando su probabilidad por \[ p^2 \binom{2n}{n} p^n q^n. \] Si \( N = 2n \) es el valor óptimo, entonces tanto \( P_{N-2} \leq P_N \) y \( P_N \geq P_{N+2} \) deben mantenerse. Los resultados del párrafo anterior implican que estas desigualdades son equivalentes a las dos siguientes desigualdades: \[ q^2 \binom{2n-2}{n} p^n q^{n-2} \leq p^2 \binom{2n-2}{n-1} p^{n-1} q^{n-1}, \] \[ q^2 \binom{2n}{n+1} p^{n+1} q^{-1} \leq p^2 \binom{2n}{n} p^n q^n. \] Después de algunas simplificaciones, lo cual puedes verificar (excluimos el caso trivial \( p = 0 \)), reducimos las desigualdades (1) a Estas desigualdades producen, después de un poco de álgebra, la condición \[ \frac{1}{1-2p} - 1 \leq 2n \leq \frac{1}{1-2p} + 1. \] Por lo tanto, a menos que \( 1/(1-2p) \) sea un número entero impar, \( N \) se determina de manera única como el entero par más cercano a \( 1/(1-2p) \). Cuando \( 1/(1-2p) \) es un número entero impar, ambos enteros pares adyacentes dan la misma probabilidad óptima. Y podemos probar incidentalmente que cuando \( 1/(1-2p) = 2n + 1 \), \( P_{2n} = P_{2n+2} \). En consecuencia, para \( p = 0.45 \), tenemos \( 1/(1-0.9) = 10 \) como el número óptimo de jugadas a elegir. Este material está abreviado de "Longitud óptima de juego para un juego binomial," Mathematics Teacher, Vol. 54, 1961, pp. 411-412. P. G. Fox originalmente aludió a un resultado que da origen a este juego en "Un manual para tontos," que apareció en el Saturday Evening Post, el 21 de noviembre de 1959, y discutió la idea más a fondo en correspondencia privada que surgió de ese artículo en una nota titulada "Una curiosidad en la expansión binomial—y una lección en lógica." Estoy en deuda con Clayton Rawson y John Scarne por alertarme sobre el artículo de Fox y con Fox por su correspondencia útil.
Créditos
Vídeo introducción con
lumen5.com
Simulación realizada por chatGPT
Consolación Ruiz Gil Mayo 2024
https://www.matsolin.com/juegoinjusto/index.htm
|