Como segunda tarea, el rey quiere que el sabio elija el número más grande entre 100, según las mismas reglas, pero esta vez los números en los papeles se extraen aleatoriamente de los números del 0 al 1 (números aleatorios, distribuidos uniformemente). ¿Cuál debería ser la estrategia del sabio?
El primer número podría ser elegido si fuera lo suficientemente grande, por ejemplo, 0.99900, porque la posibilidad de obtener un número mayor que este más adelante, eligiéndolo solo, es
\(1 - (0.999)^{99} \approx 0.1\).
Como antes, tenemos que elegir entre un candidato en mano y la posibilidad de que un número posterior sea mayor y lo elijamos. Trabajamos desde el final. Si no hemos elegido antes de la última extracción, lo elegimos y gana o pierde. Si no hemos elegido antes de la penúltima extracción y es un candidato (el más grande hasta ahora), lo elegimos si es mayor que \(\frac{1}{2}\), lo rechazamos si es menor y somos indiferentes a \(\frac{1}{2}\) mismo. Si fuera menor que \(\frac{1}{2}\), tenemos una mejor posibilidad de ganar si continuamos.
Si hemos llegado a la tercera extracción desde el final y si tenemos un candidato \(x\) como el valor en el papel, las probabilidades de 0, 1 o 2 números más grandes después son \(x^2\), \(2x(1-x)\), y \((1-x)^2\), respectivamente. Si elegimos el siguiente número mayor que \(x\), la probabilidad de ganar más tarde es
\[
2x(1-x) + \frac{1}{2}(1-x)^2,
\]
porque si hay 0 más tarde, no podemos ganar si continuamos; si 1, estamos seguros de ganar; y si 2 son mayores que \(x\), la posibilidad es solo \(\frac{1}{2}\) de que elijamos el más grande. Si soy indiferente a un número en algún sorteo, no sería indiferente a él en una extracción posterior; en su lugar, querría elegirlo porque no tengo tantas oportunidades para mejorar mis posesiones como antes.
En consecuencia, cuando dos números mayores que el número de indiferencia \(x\) están presentes más adelante en la secuencia, podemos estar seguros de que elegiría el primero. Solo tiene una probabilidad del 50-50 de ser el más grande de los dos. Así, en comparación con lo que sucedería si elegimos un número de indiferencia que se haya sorteado, podemos estar seguros, en general, de que la mejor estrategia elige el próximo número cuyo valor exceda el número de indiferencia en mano.
Queremos determinar el valor de \( x \) al cual somos indiferentes. Para la tercera posición desde el final, es el valor que satisface
\[
x^2 = 2x(1-x) + \frac{1}{2} (1-x)^2.
\]
Aquí \( x^2 \) es la probabilidad de ganar con el número \( x \), y el lado derecho da la probabilidad de ganar si dejamos pasar el \( x \) que tenemos en mano. El número de indiferencia resulta ser
\[
x = \frac{1 + \sqrt{6}}{5} \approx 0.6899.
\]
Así que elegimos un candidato tercero desde el final si su valor excede 0.6899.
Más generalmente, si hay \( r \) sorteos por delante y tenemos un candidato en mano, elegimos el sorteo si excede el valor de indiferencia \( x \) calculado a partir de
\[
(1) \quad x^r = \binom{r}{1} x^{r-1}(1-x) + \frac{1}{2} \binom{r}{2} x^{r-2}(1-x)^2 + \cdots + \frac{1}{r} \binom{r}{r}(1-x)^r.
\]
Podemos resolver esta ecuación numéricamente usando tablas binomiales u otros dispositivos para encontrar valores de \( x \) para valores modestos de \( r \). La tabla de números de indiferencia muestra algunos de estos.
Número restante Solución de la Ecuación (1) \(\frac{r}{r + \alpha}\) 1 0.5000 0.5542 2 0.6899 0.7132 3 0.7758 0.7886 4 0.8246 0.8326 5 0.8559 0.8614 6 0.8778 0.8818 7 0.8939 0.8969 8 0.9063 0.9086 9 0.9160 0.9180 10 0.9240 0.9256 11 0.9305 0.9319 12 0.9361 0.9372 13 0.9408 0.9417 14 0.9448 0.9457 15 0.9484 0.9491
Para aproximarlo más, podríamos notar que a medida que \( r \) aumenta, \( 1 - x \) se hace pequeño, y una contribución mayor al lado derecho de la ecuación (1) viene del término principal. Entonces
\[
x^r \approx r \cdot x^{r-1}(1-x), \quad \text{o} \quad x \approx \frac{r}{r+1}.
\]
Alternativamente, podríamos dividir la ecuación (1) por \( x^r \). Luego, sea \( z = \frac{(1-x)}{x} \) para obtener
\[
(2) \quad 1 = \binom{r}{1} z + \frac{1}{2} \binom{r}{2} z^2 + \cdots + \frac{1}{r} \binom{r}{r} z^r.
\]
Finalmente, usamos la ecuación (2) para las soluciones.
Dado que aproximadamente \( z = \frac{1}{r} \), dejemos que \( z = \alpha(r)/r \), donde \( \alpha(r) \) es una función que no cambia mucho con \( r \). Por ejemplo,
\[
\alpha(1) = 1 \quad \alpha(4) = 0.8509
\]
\[
\alpha(2) = 0.8990 \quad \alpha(5) = 0.8415
\]
\[
\alpha(3) = 0.8668
\]
Cuando establecemos \( z = \alpha(r)/r \) en la ecuación (2) y dejamos crecer \( r \), tenemos en el límite
\[
(3) \quad 1 = \alpha + \frac{\alpha^2}{2!} + \frac{\alpha^3}{3!} + \cdots.
\]
Aquí \( \alpha \) es el valor límite de \( \alpha(r) \) a medida que \( r \) crece. Encontramos \( \alpha \approx 0.8043 \). Aunque podríamos obtener una excelente aproximación para \( \alpha(r) \) ahora, conformémonos con el valor límite y calculemos
\[
x = \frac{r}{r + \alpha} \approx \frac{r}{r + 0.8043},
\]
para obtener los resultados mostrados en la tercera columna de la tabla.
Dado que el presente juego proporciona más información que el problema anterior de decisión inmediata, la posibilidad de ganar debería ser mayor. Si el número de resbalones es 2, el jugador elige el primero si es mayor que \(\frac{1}{2}\), de lo contrario continúa. Su probabilidad de ganar es \(\frac{3}{4}\). Aumentar el número de resbalones de 1 a 2 ha reducido su posibilidad de ganar considerablemente. Algo de geometría que no presento muestra que para \( n = 3 \) la probabilidad de ganar es aproximadamente 0.684. Para \( n \) muy grande, la probabilidad de ganar se reduce a aproximadamente 0.580.
Pulse el botón para simular el juego y seguir la estrategia descrita en el problema.
Números Aleatorios Generados: Número en el que se detuvo: Veces que se gana: 0 Veces que se juega: 0 Cociente (veces que gana / veces que juega): 0
La estrategia consiste en observar los números generados y seleccionar un número solo si es mayor que un umbral determinado. Este umbral se calcula para maximizar la probabilidad de elegir el número más grande. En este caso, el umbral se determina como:
\[
x = \frac{r}{r + \alpha} \approx \frac{r}{r + 0.8043}\approx 0.99202,
\]
donde \( r \) es el número total de números (100 en este caso) y \( \alpha \approx 0.8043 \). Según esta estrategia, seleccionamos el primer número que es mayor o igual a este umbral.
Créditos
Vídeo introducción con
http://www.lumen5.com
Simulación realizada por chatGPT
Consolación Ruiz Gil Mayo 2024
https://www.matsolin.com/mayornumero/index.htm
|