Sie sind auf Seite 1von 22

Qu e dif cil es la aleatoriedad!

(extracciones y azar)
F. Montes & A. Corber an. Universitat de Val` encia

Introducci on

El azar forma parte de nuestra vida cotidiana y se nos maniesta de forma espont anea a trav es de m ultiples circunstancias y fen omenos; pero en otras muchas ocasiones somos nosotros quienes necesitamos convocarlo. La obtenci on de una secuencia aleatoria de n umeros es, sin duda, la m as corriente de estas necesidades. Estas notas pretenden ocuparse de la dicultad de generar con exito una secuencia aleatoria que merezca tal nombre y lo hacen mediante el an alisis de una loter a muy popular, la Primitiva, y sus familiares cercanos, el Bono Loto y el Gordo, y un sorteo relacionado con un llamamiento al servicio militar en los EUA. El orden de presentaci on de los ejemplos no es casual, est an ordenados de mejor a peor atendiendo al exito en alcanzar el objetivo de aleatoriedad perseguido. En el primero de ellos, la loter a Primitiva y sus variantes, las combinaciones ganadoras cumplen con los requisitos de aleatoriedad exigibles a un juego social de azar tan popular (podr a haber sido de otra manera?). En el segundo, el sorteo del servicio militar del a no 70 en los EUA, las cosas son peores porque a pesar de las precauciones que se tomaron el resultado no pas o con exito ninguno de los tests de aleatoriedad a que fue sometido. Un ejemplo m as cercano, en el que un planteamiento err oneo inicial condujo a un mal resultado, fue el sorteo para determinar los excedentes de cupo del reemplazo del 98 en Espa na del que ya nos ocupamos en [2].

La Primitiva

La Primitiva y el resto de loter as conocidas gen ericamente como 6/49, consisten en la extracci on al azar, sin reemplazamiento, de 6 n umeros entre los 49 primeros n umeros naturales. Estos 6 n umeros, cuyo orden de extracci on es irrelevante, constituyen lo que se denomina combinaci on ganadora y su acierto es el objetivo (so nado) de los apostantes, que efect uan sus apuestas mediante la elecci on de 6 n umeros en el correspondiente boleto. La dicultad de acertar la combinaci on ganadora, premio de 1a categor a, se palia otorgando premios de menor categor a basados en el acierto parcial de dicha combinaci on. El premio de a se otorga cuando se aciertan 5 de los 6 n umeros de la combinaci on ganadora m as 2a categor el llamado complementario, n umero que se ha extra do al azar de entre los 43 que no forman a de premios consiste en acertar 5 de los 6 n umeros parte de dicha combinaci on. La 3a categor umeros ganadores y en las categor as 4a y 5a han de acertarse, respectivamente, 4 y 3 de los 6 n
Este texto recoge la conferencia impartida en el curso Un cambio hist orico: el lenguaje de las matem aticas en sus aplicaciones, que tuvo lugar del 11 al 15 de septiembre de 2000 en la UIMP de Santander. Direcci on: Departament dEstad stica i Investigaci o Operativa. Universitat de Val` encia. E-46100 Burjassot. Spain. e-mail: francisco.montes@uv.es, angel.corberan@uv.es.

Montes & Corber an

Qu e dif cil es la aleatoriedad!

de la combinaci on ganadora. Veamos hasta qu e punto somos benevolentes calicando s olo de dif cil la obtenci on de un premio de 1a categor a.

2.1

El espacio muestral de los posibles resultados

El experimento consistente en extraer los 6 n umeros en las condiciones antes descritas es un experimento aleatorio que da lugar a un espacio muestral nito e equiprobable, , con 49 6 = 13.983.816 resultados. La obtenci on de la probabilidad de ocurrencia de cualquier suceso A se lleva a cabo aplicando la f ormula de Laplace, P (A) = casos favorables a la ocurrencia de A . casos posibles

La tabla recoge la probabilidad de acierto para cada categor a. categor a primera segunda tercera cuarta quinta aciertos 6 5+C 5 4 3
6 4 6 3 6 5 6 5

favorables
6 6

probabilidad 7, 15 108 4, 29 107 1, 80 105 9, 69 104 1, 76 102

=1
1 1

43 2 43 3

=6 = 252

42 1

= 13.545 = 246.820

49 6

casos posibles

= 13.983.816

2.2

Aleatoriedad de las extracciones

Probabilidades tan peque nas no impiden que estas loter as gocen de gran popularidad. Dos parecen ser las razones de esta gran aceptaci on: la primera, sin duda, los suculentos premios que reparte, especialmente en aquellas ocasiones en las que hay bote, acumulaci on a los premios de 1a categor a de premios de la misma categor a que no fueron otorgados en sus correspondientes sorteos por no haber habido ning un acertante de la misma. Al n y al cabo, como se nalan algunas de las cu nas publicitarias del ONLAE (Organismo Nacional de Loter as y Apuestas del Estado), so nar cuesta apenas veinte duros (o son ya treinta con la inaci on?). Pero siendo importante, esta raz on no ser a suciente de no estar acompa nada por una segunda: la conanza de los apostantes en que las extracciones se llevan a cabo verdaderamente al azar. Est a justicada esta conanza? El estudio que presentamos a continuaci on responde a la pregunta anterior analizando las combinaciones ganadoras desde distintos puntos de vista. El estudio se basa en los 4.024 sorteos de las tres loter as celebrados desde el 17 de octubre de 1985, fecha en la que tuvo lugar el primer sorteo de la Primitiva, hasta el 9 de julio de 2000 (los sorteos celebrados con posterioridad no han de cambiar el signicado de las conclusiones). La base de datos utilizada para ello proviene parcialmente de la informaci on que el ONLAE pone a disposici on p ublica en su web http://onlae.terra.es, pero en su mayor parte proviene de [9], de donde se han extra do tambi en algunos resultados. Los puntos de vista utilizados para analizar los resultados de los 4.024 sorteos se corresponden con diferentes variables aleatorias y familias de sucesos asociadas al espacio muestral. A saber,

Montes & Corber an

Qu e dif cil es la aleatoriedad!

N umero extra do.- Se trata de una variable aleatoria cuyo valor coincide con el n umero extra do. Figura.- Un criterio de clasicaci on de la combinaci on ganadora es el que atiende a la cantidad de n umeros consecutivos que contiene. Cada gura1 dene un suceso aleatorio y el conjunto de todos ellos forman una partici on del espacio muestral que estudiaremos. Suma.- Es una variable aleatoria que para cada combinaci on ganadora toma el valor de la suma de los n umeros que la constituyen. Si el mecanismo de extracci on funciona aleatoriamente, el comportamiento probabil stico te orico de las variables y sucesos anteriores ser a conocido y podremos compararlo con su comportamiento experimental observado a partir de la muestra de 4.024 sorteos. La medida de la discrepancia entre ambos nos informar a acerca de la bondad del mecanismo. Antes de comenzar con los an alisis espec cos debemos se nalar que las posibilidades de estudio y an alisis que las loter as del tipo 6/49 ofrecen no se agotan, ni con mucho, en los tres elementos anteriores. La propia web del ONLAE y la base de datos que [9] mantiene son buen ejemplo de ello. Para el objetivo que nos hemos marcado, a medio camino entre el rigor y la diversi on, estos tres aspectos son sucientes.

2.3

N umeros

La variable N que toma como valor el n umero obtenido en cada una de las seis extracciones que componen un sorteo, no se obtiene a partir del espacio muestral antes descrito. El espacio muestral ligado a cada extracci on, , es mucho m as sencillo. Bajo el supuesto de aleatoriedad, = {1, 2, . . . , 49} y es equiprobable. La variable N puede denirse sobre el como la identidad y su distribuci on es la uniforme sobre el conjunto de los 49 valores de su soporte, N {1, 2, . . . , 49}. As pues, P (N = k ) = 1 , 49 k = 1, . . . , 49. (1)

El lector estar a seguramente de acuerdo con (1) si piensa en la primera de las extracciones de cada sorteo, pero quiz as le surjan dudas al pensar en alguna de las 5 restantes. Intentaremos disip arselas. Para ello consideremos el espacio muestral resultante de llevar a cabo las extracciones teniendo en cuenta el orden en que se han producido. El n umero de posibles resultados2 ser a V49,6 , las variaciones de 49 elementos tomados de 6 en 6. Para obtener la probabilidad de que N tome el valor k en la extracci on i- esima, {Ni = k }, consideramos el suceso A ={conjuntos de 6 extracciones en las que el n umero k ocupa la posici on i}. Evidentemente P (Ni = k ) = P (A). Los casos favorables a A se obtienen f acilmente excluyendo k de los 49 n umeros, extrayendo 5 de los 48 restantes e insertando a continuaci on k en la posici on deseada, lo que dar a lugar a un total de V48,5 casos. Por lo tanto, como dec amos antes, tenemos P (Ni = k ) = p = 1 V48,5 = . V49,6 49

Los 4.024 sorteos suponen 24.144 extracciones. Estamos ante una muestra aleatoria de tama no n = 24.144 de la variable N . Si las extracciones han sido realizadas al azar, la frecuencia
1 El nombre de gura, tomado directamente de la ONLAE, quiz as no sea el adecuado porque como puede observarse poco o nada tiene que ver con la disposici on geom etrica de los n umeros en el boleto. 2 Este espacio muestral es diferente del manejado en 2.1 porque ahora tenemos en cuenta el orden de las extracciones

Montes & Corber an

Qu e dif cil es la aleatoriedad!

esperada de cada uno de los 49 n umeros es frecuencia esperada de k = np = 24.144 = 492, 7 k = 1, 2, . . . , 49. 49

La tabla nos muestra ambas frecuencias, observada y esperada, para cada n umero a lo largo de las 24.144 extracciones. N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 f obs (o) 503 470 501 488 454 493 491 489 486 484 490 485 485 496 458 483 501 472 491 463 503 509 507 445 f esp (e) 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7
(oe)2 e

0,2139 1,0490 0,1386 0,0455 3,0450 0,0001 0,0061 0,0283 0,0920 0,1548 0,0152 0,1214 0,1214 0,0216 2,4486 0,1923 0,1386 0,8725 0,0061 1,7944 0,2139 0,5369 0,4130 4,6244

N 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49

f obs (o) 491 520 508 471 481 512 516 500 517 512 494 501 468 512 541 465 506 500 480 497 533 469 529 489 485

f esp (e) 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7 492,7

(oe)2 e

0,0061 1,5087 0,4729 0,9587 0,2795 0,7532 1,0985 0,1071 1,1950 0,7532 0,0032 0,1386 1,2417 0,7532 4,7278 1,5611 0,3571 0,1071 0,3291 0,0369 3,2904 1,1433 2,6691 0,0283 0,1214

Estamos en presencia de un fen omeno que se comporta aleatoriamente y no cabe por tanto esperar que las frecuencias observadas de cada n umero y las esperadas coincidan. La cuesti on es hasta qu e punto las diferencias entre unas y otras son debidas al azar o son consecuencia de un mecanismo defectuoso no compatible con la hip otesis de extracciones al azar. Existe una familia de tests estad sticos, conocidos gen ericamente como test de la bondad del ajuste [10], que permiten contrastar si los datos reales se ajustan a la distribuci on de probabilidad de N obtenida bajo dicha hip otesis. En el lenguaje habitual del contraste de hip otesis, pretendemos contrastar H0 : la variable N se distribuye uniformemente en {1,2,. . . ,49}, HA : la variable N no se distribuye uniformemente en {1,2,. . . ,49}, o sus equivalentes, H0 : las extracciones se realizan al azar,

Montes & Corber an

Qu e dif cil es la aleatoriedad!

HA : las extracciones no se realizan al azar. El funcionamiento del test est a basado en medir la discrepancia entre las distribuciones te orica y emp rica. El que nosotros vamos a utilizar, el de la 2 , usa como medida de dicha discrepancia la diferencia, adecuadamente corregida, entre los valores observados de cada n umero, oi , y los esperados, ei . El correspondiente estad stico se obtiene a partir de la expresi on,
49

2 e =
i=1

(oi ei )2 . ei

cuya distribuci on asint otica (cuando el tama no de la muestra crece a innito) es una 2 con 48=49-1 grados de libertad. Valores altos del estad stico, mayores que cierto umbral, implican una elevada discrepancia de los datos observados con la hip otesis establecida en H0 y, por tanto, nos llevan a rechazarla y a aceptar la hip otesis HA . Para los datos de las 24.144 extracciones se obtiene 2 e = 39, 9354 y el umbral del 5% se establece en 65,1707. Como nuestro estad stico no supera este u ltimo valor concluimos que no hay discordancia maniesta entre los datos observados y H0 , lo que nos lleva a aceptar (no rechazar estar a mejor dicho) la hip otesis de que las extracciones han sido realizadas al azar.

2.4

Figuras

El concepto de gura hace referencia a la cantidad de n umeros consecutivos que hay en la combinaci on ganadora. Existen guras con 0, 2, 3, 4, 5 y 6 n umeros consecutivos, o las posibles agrupaciones que con ellos puedan darse. La tabla siguiente contiene las distintas guras que pueden presentarse, las diferentes formas con las que cada una de ellas se maniesta y el n umero de combinaciones favorables a cada forma y gura, necesarias para obtener la correspondiente probabilidad. Si suponemos que la combinaci on extra da est a ordenada de menor a mayor, las formas indican la posici on que los n umeros consecutivos ocupan en ella. Hemos a nadido tambi en una columna con ejemplos de cada gura y forma.

Figura 111111 21111

2211

222 3111

Formas 111111 21111 12111 11211 11121 11112 2211 2121 2112 1221 1212 1122 222 3111 1311 1131 1113

Ejemplo 1:3:5:7:9:11 1:2:4:6:8:10 1:3:4:6:8:10 1:3:5:6:8:10 1:3:5:7:8:10 1:3:5:7:9:10 1:2:4:5:7:9 1:2:4:6:7:9 1:2:4:6:8:9 1:3:4:6:7:9 1:3:4:6:8:9 1:3:5:6:8:9 1:2:4:5:7:8 1:2:3:5:7:9 1:3:4:5:7:9 1:3:5:6:7:9 1:3:5:7:8:9

Favorables 7.059.052 1.086.008 1.086.008 1.086.008 1.086.008 1.086.008 135.751 135.751 135.751 135.751 135.751 135.751 13.244 135.751 135.751 135.751 135.751

Totales 7.059.052

5.430.040

814.506 13.244

543.004

Montes & Corber an

Qu e dif cil es la aleatoriedad!

Figura 321

33 411

42 51 6

Formas 321 312 231 213 132 123 33 411 141 114 42 24 51 15 6

Ejemplo 1:2:3:5:6:8 1:2:3:5:7:8 1:2:4:5:6:8 1:2:4:6:7:8 1:3:4:5:7:8 1:3:4:6:7:8 1:2:3:5:6:7 1:2:3:4:6:8 1:3:4:5:6:8 1:3:5:6:7:8 1:2:3:4:6:7 1:2:4:5:6:7 1:2:3:4:5:7 1:3:4:5:6:7 1:2:3:4:5:6

Favorables 13.244 13.244 13.244 13.244 13.244 13.244 946 13.244 13.244 13.244 946 946 946 946 44

Totales

79.464 946

39.732 1.892 1.892 44

La obtenci on del n umero de combinaciones o casos favorables a cada uno de los sucesos que las formas representan es sencilla pero puede llegar a ser farragosa, particularmente para las guras/formas con pocos o ning un n umero consecutivo3 . Como ilustraci on obtendremos a continuaci on los casos favorables a la forma 321. Casos favorables a la forma 321.- Elegiremos en primer lugar el menor de los n umeros que forman la terna consecutiva, que para esta forma ser a tambi en el menor elemento de la combinaci on ordenada. Este n umero puede ser cualquiera de los 42 primeros, puesto que un n umero posterior impedir a que una forma como la propuesta pudiera aparecer. Design emoslo por i. Los dos n umeros que le siguen deben ser i + 1 e i + 2. Por tanto, el primero de los dos n umeros consecutivos siguientes, j , podr a ser uno cualquiera de los comprendidos entre i + 4 i 46 (i + 4 j 46). El u ltimo n umero de la combinaci on, k , habr a de vericar j + 3 k 49, lo que supone 49 (j + 3) + 1 = 47 j posibilidades. Si sumamos ahora para todos los valores de i y j tendremos
42 46

(47 j )
i=1 j =i+4

1 {47(46 (i + 4) + 1) (46 + i + 4)(46 (i + 4) + 1)} 2 i=1 1 {47 43 47i (50 + i)(43 i)} 2 i=1
42 42 42

42

= =

47 43
i=1 i=1

47i

1 2

42

(50 43 7i i2 )
i=1

= 13.244 En las 4.024 combinaciones estudiadas, la distribuci on de las frecuencias de cada una de las guras es la que mostramos en la tabla. La tabla contiene tambi en las probabilidades para cada gura y las frecuencias esperadas que de ellas se derivan. Con toda esta informaci on podremos
dicultad puede obviarse recurriendo a un PC, puesto que un sencillo programa en cualquiera de los lenguajes habituales contar a r apidamente el n umero de combinaciones asociadas a cada forma y gura. Los autores deben confesar que han hecho uso de este recurso. No hab amos quedado que la tecnolog a inform atica era tambi en para esto?
3 La

Montes & Corber an

Qu e dif cil es la aleatoriedad!

obtener el valor del correspondiente estad stico 2 e y efectuar el pertinente test de bondad del 4 ajuste . gura 111111 21111 2211 3111 321 411 resto 222 42 51 33 6 totales f obs 1994 1610 232 138 33 15 2 2 0 0 0 0 4.024 prob 0,504802 0,388309 0,058246 0,038831 0,005683 0,002841 0,001288 0,000947 0,000135 0,000135 0,000068 0,000003 f esp 2031,32 1562,55 234,38 156,26 22,87 11,43 5,18 3,81 0,54 0,54 0,27 0,01 4.024
(oe)2 e

0,6857 1,4406 0,0242 2,1328 4,4906 1,1126 1,9564

11,8429

on 6=7-1 grados de libertad y el valor Al valor 2 e = 11, 8429 le corresponden en esta situaci umbral correspondiente al 5% se establece en 12,5916, que al no ser superado por nuestro valor nos conduce, como antes, a aceptar la hip otesis de que las extracciones han sido realizadas al azar.

2.5

Sumas

La suma de los n umeros que componen la combinaci on ganadora es una variable aleatoria cuya distribuci on de probabilidad, bajo el supuesto de extracciones al azar, puede conocerse. Podemos comprobar si la distribuci on emp rica que se deriva de los 4.024 sorteos concuerda con aqu ella. La variable suma, S , es una variable discreta cuyo soporte es el conjunto {21,22,. . . ,279} y puede denirse de dos formas equivalentes: Def 1.- Si Ni denota el n umero obtenido en la extracci on i- esima,
6

S=
i=1

Ni ,

Ni {1, 2, . . . , 49},

Ni = Nj , i = j.

Def 2.- Si ordenamos de forma creciente los n umeros extra dos y designamos por N(i) el que ocupa el i- esimo lugar,
6

S=
i=1

N(i) ,

1 N(1) < N(2) < . . . < N(6) 49.

La esperanza y la varianza de S pueden obtenerse f acilmente a partir de la primera de las deniciones. Recordemos que las Ni se distribuyen todas ellas uniformemente en {1,2,. . . ,49},
4 Para evitar problemas con la convergencia del estad stico 2 e , es conveniente que la frecuencia esperada no sea inferior a 5 en ninguna de las categor as. Por esta raz on hemos agrupado en una sola categor a denominada resto las guras con menor probabilidad, que aparecen en cursiva y se naladas con un * en la tabla.

Montes & Corber an

Qu e dif cil es la aleatoriedad!

si bien no son independientes. Como es sabido, E (Ni ) = Tendremos pues para S ,


6

1 + 49 = 25, 2

var(Ni ) =

492 1 , i = 1, . . . , 6 12

E (S ) =
i=1

E (Ni ) = 6 25 = 150,

y puesto que no hay independencia,


6

var(S ) =
i=1

var(Ni ) +
1i=j 6

cov (Ni , Nj ) = 6 var(N1 ) + 30 cov (N1 , N2 ).

(2)

La covarianza entre N1 y N2 la obtendremos a partir de la expresi on cov (N1 , N2 ) = E (N1 N2 ) E (N1 )E (N2 ), de la que nos falta conocer la esperanza del producto. E (N1 N2 ) =
k=l

k l P (N1 = k, N2 = l) =

1 49 48

49 k=l

49

kl =
l=1 l=k

25 1192 . 48

La covarianza valdr a cov (N1 , N2 ) = Sustituyendo en (2),

25 1192 25 252 = . 48 6 25 30 25 = 1.200 = 1.075. 6 6

var(S ) = 6 200 + 30 La funci on de probabilidad de S vale, f (s) = P (S = s) =

||As || V49,6 ,

21 s 279, fuera,

donde ||As || denota el cardinal del conjunto As denido mediante


6

As = {(n1 , n2 , . . . , n6 );
i=1

ni = s, 1 ni 49, ni = nj }.

La obtenci on de los distintos valores de f (s) es larga y tediosa, por lo que convendr a recordar cuanto se dec a en una anterior nota a pie de p agina. El recurso a un PC nos permite obtener sin gran esfuerzo los valores de ||As || y f (s). Corresponde ahora contrastar la distribuci on emp rica obtenida a partir de los 4.024 sorteos con la te orica. La tabla siguiente y la gura 1 resumen la informaci on de ambas distribuciones. La tabla muestra los valores de ||As || y la gura permite comparar visualmente las gr acas de f (s) = on visual de P (S = s) y de f rel(s), la frecuencia relativa observada para S = s. La impresi concordancia que muestran ambas gr acas hemos de corroborarla con el test de bondad del ajuste. Esta concordancia se maniesta tambi en a trav es de la media y de la varianza de las sumas observadas: x = 151, 00, s2 = 1072, 26.

Montes & Corber an

Qu e dif cil es la aleatoriedad!

s 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63

||As || 1 1 2 3 5 7 11 14 20 26 35 44 58 71 90 110 136 163 199 235 282 331 391 454 532 612 709 811 931 1057 1206 1360 1540 1729 1945 2172 2432 2702 3009 3331 3692 4070 4494

s 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106

||As || 4935 5426 5940 6506 7097 7748 8423 9163 9933 10769 11637 12579 13552 14603 15690 16856 18059 19349 20673 22087 23540 25082 26663 28340 30051 31860 33706 35648 37625 39703 41809 44016 46253 48586 50944 53402 55875 58446 61031 63706 66388 69161 71928

s 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149

||As || 74781 77624 80542 83440 86412 89348 92350 95311 98324 101285 104295 107235 110215 113119 116048 118889 121751 124507 127274 129930 132581 135109 137629 140008 142370 144587 146771 148800 150794 152617 154397 156004 157554 158923 160236 161354 162410 163273 164062 164654 165176 165490 165732

s 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192

||As || 165772 165732 165490 165176 164654 164062 163273 162410 161354 160236 158923 157554 156004 154397 152617 150794 148800 146771 144587 142370 140008 137629 135109 132581 129930 127274 124507 121751 118889 116048 113119 110215 107235 104295 101285 98324 95311 92350 89348 86412 83440 80542 77624

s 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235

||As || 74781 71928 69161 66388 63706 61031 58446 55875 53402 50944 48586 46253 44016 41809 39703 37625 35648 33706 31860 30051 28340 26663 25082 23540 22087 20673 19349 18059 16856 15690 14603 13552 12579 11637 10769 9933 9163 8423 7748 7097 6506 5940 5426

s 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279

||As || 4935 4494 4070 3692 3331 3009 2702 2432 2172 1945 1729 1540 1360 1206 1057 931 811 709 612 532 454 391 331 282 235 199 163 136 110 90 71 58 44 35 26 20 14 11 7 5 3 2 1 1

El gran n umero de valores que toma la variable S y la necesidad de efectuar agrupaciones para que los valores esperados de las categor as resultantes sean mayores o iguales que 5, como una correcta aplicaci on del test de la 2 exige, hacen aconsejable recurrir a otro test de la bondad del ajuste concocido como test de Kolmogorov-Smirnov (test K-S), que utiliza como medida de discrepancia la diferencia en valor absoluto entre las funciones de distribuci on te orica, F (x) =
s x

f (s),

Montes & Corber an

Qu e dif cil es la aleatoriedad!

10

y emp rica, Fn (x) =


s x

f rel(s) =

||{si , si x, i = 1, . . . , n}|| , n

donde n es el n umero de observaciones y si la i- esima observaci on de la variable S (en nuestro caso n ser a el n umero de sorteos). El correspondiente estad stico se obtiene mediante la expresi on Dn = sup |Fn (x) F (x)|,
xR

cuya distribuci on permite establecer el umbral del 5% a partir del cual aceptaremos o rechazaremos nuestra hip otesis. Para n sucientemente grande, como es nuestro caso, dicho umbral vale 1, 36/ n. Para los datos de los 4.024 sorteos Dn = 0, 0159, menor que el valor del umbral 0, 0214 = 1, 36/ 4.024. Aceptaremos tambi en ahora que las extracciones se han efectuado al azar.
0,020

0,018

0,016

0,014

0,012

0,010

0,008

0,006

0,004

0,002

0,000

21 30 39 48 57 66 75 84 93 102 111 120 129 138 147 156 165 174 183 192 201 210 219 228 237 246 255 264 273

Figura 1.- Gr acas de f (s) (linea de puntos) y de la f rel(s) (barras verticales).

2.6

C omo juegan los apostantes?

Es dif cil concluir esta secci on sin caer en la tentaci on de mirar el juego desde la perspectiva del comportamiento de los apostantes. Y esto a un a pesar del doble inconveniente que supone, de una parte, situarnos fuera del gui on que nos hemos marcado y, de otra, la carencia de informaci on directa sobre las apuestas. El empe no se justicar a porque lo que en un principio nos parecieron s olo llamativas an ecdotas, son en realidad las manifestaciones de un comportamiento por parte de los apostantes alejado del puro azar. En efecto, se trata de corroborar algo ya sabido: que la gente traslada al boleto sus preferencias, man as, supersticiones y quimeras; actitudes que tienen como resultado una apuesta casi siempre alejada de lo que entendemos por una elecci on al azar de los seis n umeros. Una comprobaci on indirecta de este hecho, puesto que las apuestas son inaccesibles directamente, la proporciona el an alisis conjunto de la combinaci on ganadora y del n umero de acertantes de cada categor a para los 4.024 sorteos. Conocemos la probabilidad de acierto para

10

Montes & Corber an

Qu e dif cil es la aleatoriedad!

11

cada categor a, pi , y el n umero na de apuestas jugadas en cada sorteo, podemos pues conocer ei = pi na , n umero esperado de acertantes la categor a i bajo el supuesto de que las apuestas han sido hechas al azar. El contraste mediante el test de la 2 de la hip otesis de que las apuestas se han realizado al azar en cada uno de los 4.024 sorteos, se resume en la tabla. Hip otesis de apuestas al azar aceptada rechazada 66 3958 1,64% 98,36% Dos comentarios alusivos a la obtenci on de la tabla: las dos primeras categor as de premios han sido agrupadas en una sola porque el n umero de apuestas no siempre daba lugar al m nimo esperado de 5 acertantes en la 1a categor a, los 66 sorteos en los que la elecci on al azar de las apuestas es aceptada son una cota m axima que debe ser en realidad menor. En efecto, el contraste de la bondad del ajuste debe realizarse sobre todas las categor as de acertantes, lo que incluye a los que aciertan 2, 1 y 0 n umeros de la combinaci on ganadora, pero sobre estos no se tiene informaci on alguna. Por esta raz on, la apuesta al azar en cada sorteo la hemos rechazado cuando el valor de 2 as cuyos acertantes conocemos superaba el e obtenida a partir de las categor umero de grados de libertad umbral del 5% obtenido a partir de una 2 6 , puesto que el n cuando se incluyen las categor as desconocidas es 6 = 7 1. Este an alisis depara una u ltima sorpresa. Los 66 sorteos en los que hemos aceptado la hip otesis de que las apuestas han sido elegidas al azar, se distribuyen entre los tres tipos de loter as de forma aparentemente distinta a como lo hace el total de sorteos (4.024). La tabla recoge ambas distribuciones y el test de la bondad del ajuste, que en este contexto se denomina test de homogeneidad, corrobora la diferencia con un valor 2 e = 20, 5996 frente a un umbral 2 2 = 5, 9915. Todo parece indicar que la presencia de 58 Bonolotos excede, por encima de lo que la aleatoriedad explicar a, los 42 esperados, y ello en detrimento de la presencia de Primitivas. Son m as amantes del azar los jugadores de Bonoloto que los de la Primitiva? Vaya Ud. a saber. 4.024 sorteos 66 al azar esperados 2.6.1 Y los de 6 aciertos? Bonoloto 2.576 58 42,25 Gordo 192 5 3,15 Primitiva 1.256 3 20,60

a (6 aciertos) permite El conocimiento completo de la apuesta de los acertantes de 1a categor hacer una incursi on m as detallada en dichas apuestas. Como comprobar a m as adelante el lector el esfuerzo merece la pena. Comencemos con una estad stica de su n umero a lo largo de los 4.024 sorteos. En la tabla, ai es el n umero de apuestas con 6 aciertos y ni la frecuencia (n umero de sorteos) con la que ha aparecido ai .

11

Montes & Corber an

Qu e dif cil es la aleatoriedad!

12

ai 0 1 2 3 4 5 6 7 8 9 10

ni 2379 974 374 146 63 31 18 8 7 4 5

% 59,12 24,20 9,29 3,63 1,57 0,77 0,45 0,20 0,17 0,10 0,12

ai ni 0 974 748 438 252 155 108 56 56 36 50

ai 11 12 15 17 18 19 20 23 24 56 114 totales

ni 1 4 2 1 1 1 1 1 1 1 1 4024

% 0,02 0,10 0,05 0,02 0,02 0,02 0,02 0,02 0,02 0,02 0,02 100

ai ni 11 48 30 17 18 19 20 23 24 56 114 3253

Un par de comentarios a la tabla: De los 4.024 sorteos aproximadamente el 60% no ha tenido acertantes de 6 y han generado por tanto un bote que se ha acumulado a los premios de 1a categor a de otros sorteos. C omo explicar los 114 acertantes de la combinaci on ganadora en un mismo sorteo? Quiz as atendiendo a la popularidad de ciertos n umeros o a la atracci on que ejercen entre la gente. O quiz as la explicaci on sea mucho m as sencilla y est e en la estructura del boleto. O quiz as una mezcla de ambas razones. Para que el lector decida, esta fue la combinaci on ganadora de aquel sorteo,

15

25

26

36

46

y este el boleto con la combinaci on marcada sobre el:

Figura 2.- Combinaci on ganadora del d a 28.10.88 que tuvo 114 acertantes.

Los acertantes de 6 aciertos parecen tener todav a m as agudizada la azarofobia del apostante. La gura 3 apoya esta opini on. En ella hemos representado la frecuencia esperada para cada uno de los 49 n umeros en las 19.518 = 3.253 6 elecciones de n umeros llevadas a cabo en las 3.253 apuestas que aquellos jugaron (ver tabla anterior). Como este valor esperado es el mismo para todos ellos, 398,33, aparece como una linea continua paralela al eje de abcisas. Las frecuencias observadas para cada n umero se han representado mediante puntos, que hemos unido a la recta anterior para que se aprecien mejor las diferencias entre lo esperado y lo observado. El valor 2 del estad stico 2 e = 623, 25 supera con creces el umbral del 5% de la 48 = 65, 17.

12

Montes & Corber an

Qu e dif cil es la aleatoriedad!

13

700

600

500

400

300 200 0 1 2 3 4 5 6 7 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49

Figura 3.- Frecuencias de los 49 n umeros en las apuestas con 6 aciertos.

Finalicemos con el que podemos denominar boleto-robot de 6 aciertos. Podemos obtenerlo eligiendo un c odigo de colores y aplic andolo al boleto, de manera que la casilla de cada n unero se ti na con un color adecuado. Un criterio para elegir el color puede ser asociar los valores m as frecuentes con los colores m as oscuros, adaptando el rango a una escala de grises. Obtendr amos un resultado como el que se muestra en la gura 4.

Figura 4.- Boleto robot de los 6 aciertos.

2.7

Dos conclusiones y un comentario


El buen funcionamiento del mecanismo de extracci on de los n umeros en todos los sorteos de las loter as 6/49 ha de aceptarse en base a las caracter sticas aleatorias analizadas. No arriesgar amos gran cosa si arm aramos que con el estudio de otras caracter sticas el resultado hubiera sido el mismo. No esper abamos otra cosa y habr a que se nalar dos razones para ello. La primera, y m as importante, es la sencillez del mecanismo utilizado, un bombo y 49 bolas homog eneas numeradas, que nos recuerda el comienzo de cualquier enunciado cl asico de un problema de probabilidad: De una urna que contiene bolas numeradas del .... La segunda raz on, de ndole etico, se basar a en la creencia de que un organismo estatal de loter as est a obligado a hacer las cosas bien aunque s olamente sea

Conclusi on acerca de las extracciones

13

Montes & Corber an

Qu e dif cil es la aleatoriedad!

14

por el dinero que hay en juego, no tanto el de los premios como el que ingresa la hacienda p ublica. Conclusi on acerca de las apuestas Nada que a nadir al comentario que hac amos al comienzo del p arrafo 2.6. Los distintos an alisis y an ecdotas all descritos conrman la ausencia de azar en las apuestas de los jugadores. Pero, qu e ocurrir a a medida que transcurra el tiempo y pueda generalizarse el uso por parte de los jugadores de las m aquinas autom aticas de apuestas? Quiz as entonces sea el generador pseudoaleatorio de apuestas el que merezca una revisi on cr tica. Y un comentario bibliogr aco Para cerrar esta secci on dedicada a la Primitiva hemos de insistir en que la miscel anea anterior no agota, ni lo pretende, las posibilidades que este juego ofrece. Los juegos de azar son fuente inagotable de inspiraci on para aquellos que tienen el azar como profesi on o pasi on, una o no necesariamente exclusiva, y han dado lugar por ello a abundante literatura. En la cient ca, la que aqu nos ata ne, son muchos los textos con t tulos inequ vocamente alusivos al tema, especialmente abundantes entre los precursores de la Teor a de la Probabilidad, lo que da fe de un origen ligado a los juegos de azar. Entre ellos: Huygens [8], Montmort [11], De Moivre [4], ... Pero tambi en existen textos muy recientes que se ocupan del tema con amenidad y rigor, es el caso de los libros de Rao [12] y Haigh [7]. Cerrar esta incursi on biliogr aca sin citar a dos autores cl asicos como Feller [5] y R enyi [13] nos parecer a una desconsideraci on hacia el lector por no haberle hecho part cipe de nuestra pasi on por estos dos textos, referencias obligadas cuando se habla de probabilidad discreta (Feller) o de teor a de la probabilidad (R enyi).

El sorteo del servicio militar del a no 70 en los EUA

A nales del a no 69 un decreto del Presidente de los EUA, en aquella epoca Richard Nixon, establec a que los llamamientos para el servicio militar del a no 70 deb an llevarse a cabo mediante una selecci on aleatoria basada en la fecha de nacimiento de los implicados5 . La promulgaci on del decreto tiene su peque na historia por las dicultades y prejuicios que hubo de vencer. En ocasiones anteriores se hab an utilizado sorteos para determinar la incorporaci on a las, adquiriendo algunos de ellos, especialmente el del a no 40, una merecida notoriedad debido a la falta de rigor con la que se llevaron a cabo, lo que supuso que las condiciones de equiprobabilidad e independencia necesarias no se satisfacieran. Se tomaron toda clase de precauciones para que el sorteo del 70 garantizara la igualdad de oportunidades. En un ameno art culo publicado al a no siguiente en Science, Fienberg [6] describe con detalle, desde la forma y tama no de las c apsulas que conten an las 366 fechas de nacimiento (el 29 de febrero estaba tambi en contemplado), hasta la manera en la que las c apsulas eran introducidas en una caja de madera, donde se mezclaban previamente antes de ser alojadas denitivamente en el recipiente del que ser an extra das. El proceso de mezcla merece un comentario m as extenso, por ser probablemente el origen de lo insatisfactorio del resultado. Se comenz o alojando las 31 fechas correspondientes a enero en el fondo de la caja, a continuaci on se hizo otro tanto con las 29 de febrero y se procedi o a mezclar ambas. El proceso se repiti o con cada uno de los restantes meses, mezclando las bolas despu es de cada introducci on. Este proceso supone que mientras las bolas de enero fueron mezcladas en 11 ocasiones, las de noviembre y diciembre s olo lo fueron dos y una vez, respectivamente. Digamos
5 De este sorteo ya nos ocupamos en [2], pero analizaremos aqu un nuevo aspecto que consideramos interesante y que proporciona una perspectiva diferente.

14

Montes & Corber an

Qu e dif cil es la aleatoriedad!

15

por u ltimo que una vez las c apsulas fueron arrojadas en el recipiente de la extracci on, una gran copa de cristal, ya no fueron agitadas.
d a 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 ene. 305 159 251 215 101 224 306 199 194 325 329 221 318 238 17 121 235 140 58 280 186 337 118 59 52 92 355 77 349 164 211 feb. 86 144 297 210 214 347 91 181 338 216 150 68 152 4 89 212 189 292 25 302 363 290 57 236 179 365 205 299 285 mar. 108 29 267 275 293 139 122 213 317 323 136 300 259 354 169 166 33 332 200 239 334 265 256 258 343 170 268 223 362 217 30 abr. 32 271 83 81 269 253 147 312 219 218 14 346 124 231 273 148 260 90 336 345 62 316 252 2 351 340 74 262 191 208 may. 330 298 40 276 364 155 35 321 197 65 37 133 295 178 130 55 112 278 75 183 250 326 319 31 361 357 296 308 226 103 313 jun. 249 228 301 20 28 110 85 366 335 206 134 272 69 356 180 274 73 341 104 360 60 247 109 358 137 22 64 222 353 209 jul. 93 350 115 279 188 327 50 13 277 284 248 15 42 331 322 120 98 190 227 187 27 153 172 23 67 303 289 88 270 287 193 agos. 111 45 261 145 54 114 168 48 106 21 324 142 307 198 102 44 154 141 311 344 291 339 116 36 286 245 352 167 61 333 11 sept. 225 161 49 232 82 6 8 184 263 71 158 242 175 1 113 207 255 246 177 63 204 160 119 195 149 18 233 257 151 315 oct. 359 125 244 202 24 87 234 283 342 220 237 72 138 294 171 254 288 5 241 192 243 117 201 196 176 7 264 94 229 38 79 nov. 19 34 348 266 310 76 51 97 80 282 46 66 126 127 131 107 143 146 203 185 156 9 182 230 132 309 47 281 99 174 dic. 129 328 157 165 56 10 12 105 43 41 39 314 163 26 320 96 304 128 240 135 70 53 162 95 84 173 78 123 16 3 100

El resultado del sorteo se muestra en la tabla anterior, apareciendo al lado de cada fecha el orden en que fue extra da, orden en el que ser an llamados a las los que nacieron ese d a. Este detalle es relevante porque los llamamientos se har an en funci on de las necesidades, pudiendo suceder que despu es de determinado llamamiento no se efectuara ninguno m as. De hecho, fuentes del Ministerio de Defensa y de la propia Casa Blanca reconocieron por aquellas fechas que, agrupando los 366 llamamientos en tres tercios de 122 fechas cada uno, las necesidades del servicio hac an prever que muy probablemente los del tercer tercio no ser an llamados y tampoco parte del segundo. En el art culo citado de Fienberg y en el de Corber an & Montes [2] se describen con detalle varios m etodos para contrastar si el resultado del sorteo era compatible con la extracci on al azar de las fechas de nacimiento. Recordaremos aqu uno de ellos y completaremos una sugerencia de Fienberg.

3.1

Estudio de las medias mensuales del orden de extracci on

El an alisis consiste en obtener los valores medios del orden de extracci on o llamamiento que han correspondido a las fechas de nacimiento de cada mes y representar gr acamente las parejas

15

Montes & Corber an

Qu e dif cil es la aleatoriedad!

16

(mes, valor medio). Si las extracciones fueron hechas verdaderamente al azar, los puntos en dicha gr aca no deber an presentar ning un tipo de patr on, pero tal como se observa en la gura 5, la tendencia lineal decreciente es clara, especialmente para los meses de mayo a diciembre. La ecuaci on de la recta de regresi on es y = 229, 37 7, 05x, y el coeciente de correlaci on vale rxy = 0, 8660. Semejante valor del coeciente de correlaci on nos lleva a aceptar la hip otesis de que las medias se sit uan a lo largo de una recta, lo que resulta incompatible con la supuesta aleatoriedad de las extracciones.
240

220

media orden extraccin

200

180

160

140

120 100 0 2 4 6 8 10 12

mes de nacimiento
Figura 5.- Regresi on de la media del n umero de extracci on sobre el mes correspondiente

Los valores de las medias mensuales se muestran en la tabla siguiente y conrman las primitivas sospechas que el m etodo empleado para mezclar las c apsulas hac a temer. Los primeros 5 valores son aproximadamente iguales, la raz on puede estar en que la mezcla entre ellos fue m as homog enea, pero a medida que aumentaban los meses las c apsulas iban siendo sometidas a menos mezclas. El bajo valor de la media del mes de diciembre refuerza este argumento.

16

Montes & Corber an

Qu e dif cil es la aleatoriedad!

17

mes enero febrero marzo abril mayo junio julio agosto septiembre octubre noviembre diciembre

media orden extracci on 201,1 203,0 225,8 203,7 208,0 195,7 181,5 173,5 157,3 182,5 148,7 121,5

3.2

Un patr on espacial de puntos

Los resultados del sorteo admiten otro tipo de representaci on gr aca, la que hemos llevado a cabo en la gura 6. Se trata de un gr aco de dispersi on en la que hemos representado el orden de extracci on (eje Y) frente a la fecha de nacimiento (eje X).

Figura 6.- Gr aca del orden de extracci on respecto de la fecha de nacimiento

En su art culo, Fienberg analiza visualmente el gr aco y sugiere una cierta escasez de puntos en los extremos de la bisectriz del primer cuadrante. Observa tambi en una tendencia a la agregaci on de puntos, que tiene como consecuencia la aparici on de areas en blanco relativamente extensas. Pero su an alisis no va m as all a de apreciaciones subjetivas que en ning un caso tienen el valor de un contraste de hip otesis. Estamos en presencia de un patr on espacial de puntos sobre un ret culo. Si las extracciones han sido realizadas al azar, el patr on debe ser completamente aleatorio. C omo contrastar la hip otesis de aleatoriedad completa? La obtenci on y exposici on rigurosa de semejante test de hip otesis va m as all a del objetivo de estas l neas. Hay que a nadir, adem as, que el problema no es trivial debido a las dicultades que conlleva la obtenci on de la distribuci on de probabilidad de

17

Montes & Corber an

Qu e dif cil es la aleatoriedad!

18

los estad sticos asociados con la aleatoriedad espacial completa. Lo que en su lugar haremos es desarrollar un m etodo intuitivo y pr actico basado en uno de ellos, la distancia entre los puntos (sucesos) del patr on. 3.2.1 Distancia entre sucesos

Una caracter stica num erica que resume bien los rasgos del patr on espacial de n sucesos observados en un recinto acotado, es la distancia entre dos cualesquiera de ellos. M as concretamente, la funci on de distribuci on emp rica (fded) de las 1 n ( n 1) distancias que generan. Esta es, 2 en realidad, una herramienta propia de los procesos puntuales espaciales denidos sobre R2 , pero nada impide su utilizaci on en el campo discreto. En uno u otro soporte, a un patr on espacial completamente aleatorio podemos oponerle alternativas en dos direcciones: un patr on agregado, en el que los sucesos se nos muestran formando clusters de mayor o menor tama no, o un patr on regular o de rechazo, cuyos sucesos muestran una disposici on m as regular originada por el rechazo entre ellos. La gura 7 nos muestra patrones que representan las tres situaciones descritas. El de la izquierda corresponde a las localizaciones de 62 plantones de secuoias en un cuadrado de 23 ms. de lado, y la agregaci on que nos muestra podr a explicarse por el hecho de que cada grupo de plantones ha crecido alrededor de una sequoia madre que no aparece reresentada en la imagen. En la gr aca central los sucesos son las localizaciones de 63 brotes de pinos negros japoneses. El patr on regular que nos muestra la gr aca de la derecha responde a la localizaci on de los centros de un grupo de c elulas humanas. Las im agenes est an tomadas de [3].

Figura 7.- Patrones espaciales de sucesos: agregado (izqda.), aleatorio (centro) y regular (dcha.).

Para ver la capacidad discriminadora de la fded observemos la gura 8. Se muestran en ella los histogramas y la fded de las distancias entre sucesos de los patrones simulados que aparecen bajo cada gr aca. En todos los casos las simulaciones se han efectuado en un recinto circular de radio 1 y el n umero de sucesos es similar: 48 para el patr on agregado y 50 para los otros dos.

18

Montes & Corber an

Qu e dif cil es la aleatoriedad!

19

100 90 80 70 60 50 40 30 20 10 0 2 1,84 1,68 1,52 1,36 1,2 1,04 0,88 0,72 0,56 0,4 0,24 0,08

100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0%

100 90 80 70 60 50 40 30 20 10 0 2 1,84 1,68 1,52 1,36 1,2 1,04 0,88 0,72 0,56 0,4 0,24 0,08

100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0%

100 90 80 70 60 50 40 30 20 10 0 2 1,84 1,68 1,52 1,36 1,2 1,04 0,88 0,72 0,56 0,4 0,24 0,08

100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0%

Figura 8.- Histogramas y fded para patrones agregado (izqda.), aleatorio (centro) y regular (dcha.).

Puede observarse que: en el patr on agregado, hay una mayor proporci on de distancias peque nas y grandes y una frecuencia mucho menor de distancias intermedias, lo que da lugar a una fded con pendiente pronunciada al inicio, en el patr on regular las distancias peque nas son inexistentes o mucho menos frecuentes que en el caso agregado, mientras que las intermedias tienen mayor presencia con un cierto equilibrio entre ellas, y en el patr on completamente aleatorio la distribuci on, aunque un poco sesgada, recuerda la de una normal, con colas (valores extremos) ligeras y parecidas, y una gradaci on de valores intermedios con mayor presencia de los centrales. La obtenci on de la fded es muy sencilla a partir de su denici on: en cada punto x, es la proporci on de distancias que no superan a x, (x) = ||{dij , dij x}|| . F 1 2 n(n 1) Si conoci esemos F (x), la funci on de distribuci on te orica de las distancias, una primera aprox (x) frente imaci on al contraste de aleatoriedad podr a consistir en representar la ordenada F a la abscisa F (x), lo que dar a lugar, bajo la hip otesis de aleatoriedad completa, a algo muy parecido a la bisectriz del primer cuadrante. Se trata de un m etodo emp rico y subjetivo de comprobar dicha aleatoriedad. Excepto en aquellos casos extremos en que los puntos est en alineados a lo largo de la recta y = x o muestren una gr aca claramente distinta de ella, la decisi on es siempre dif cil de tomar.

19

Montes & Corber an

Qu e dif cil es la aleatoriedad!

20

El recurso a m etodos convencionales de Inferencia Estad stica exige conocer la distribuci on (x) bajo la hip de F otesis de aleatoriedad completa. Desgraciadamente ello es imposible o, como m nimo, muy complicado. Cualquier alternativa pasa por utilizar m etodos basados en la simulaci on de patrones completamente aleatorios de sucesos semejantes al nuestro y comparar las funciones de distribuci on emp ricas, o alguna caracter stica asociada, de unos y otro. Veamos dos de estos m etodos y apliqu emoslos a los datos del sorteo. 3.2.2 M etodo de las envolturas superior e inferior de la fded

Decir que el resultado del sorteo es compatible con la extracci on al azar de las fechas de nacimiento, equivale a decir que el orden de extracci on es una permutaci on aleatoria de los 366 primeros naturales. Lo que haremos ser a generar n 1 de estas permutaciones y obtener i (x), i = 2, . . . , n y compararlas con la F 1 (x) derivada del para cada una de ellas su fded, F sorteo. Una forma sencilla de llevar a cabo la comparaci on es construir las envolturas superior y inferior de las simuladas mediante i (x), S (x) = max F
i=2,...,n

i (x). I (x) = min F


i=2,...,n

1 (x) no deber Si los datos del sorteo son completamente aleatorios, F a distinguirse de las Fi (x), i = 2, . . . , n y se vericar a 1 (x) > S (x)) = P (F 1 (x) < I (x)) = P (F 1 , x. n (3)

1 (x) est Si sistem aticamente la F a por encima de S (x) o debajo de I (x), tendremos entonces un claro indicio en contra de la hip otesis establecida. Para analizar los datos del sorteo hemos generado 99 permutaciones aleatorias del 1 al 366, lo que signica que las probabilidades en (3) valen 0.01, y es por tanto muy improbable 1 (x) supere a S (x) o sea inferior a I (x). La gr que F aca conjunta de las tres funciones no es muy informativa debido a que sus diferencias son muy peque nas, pero si representamos 1 (x) I (x)) y (x, F 1 (x) S (x)), como hemos hecho en la gura conjuntamente las gr acas (x, F 9, veremos que mientras la primera es siempre positiva, como era de esperar, la segunda es positiva entre x = 50 y x = 128, en contra de lo esperado. Habr a que concluir que existen claros indicios de que la extracci on no fue al azar.
,010 ,008 ,006 ,004 ,002 0,000 -,002 -,004 -,006 -,008 1,41

53,15

104,89

156,62

208,36

260,09

311,83

363,57

415,30

467,04

1 (x) y I (x). Figura 9.- Comparaci on de S (x), F

20

Montes & Corber an

Qu e dif cil es la aleatoriedad!

21

3.2.3

Test de Montecarlo para el intervalo intercuart lico

El otro m etodo de contraste propuesto se basa en una caracter stica num erica asociada a la fded de las distancias, y forma parte de una familia de m etodos conocidos gen ericamente como Tests de Montecarlo, introducidos por Barnard en 1963 [1]. En esencia, se trata de comparar la caracter stica num erica estudiada en el patr on observado con los valores que esa misma caracter stica toma en los n 1 patrones completamente aleatorios que hemos simulado. Si la hip otesis de aleatoriedad completa es satisfecha, al ordenar conjuntamente el valor observado y los simulados, aqu el podr a ocupar cualquier posici on con la misma probabilidad, 1/n. Al igual que en un contraste de hip otesis cl asico, posiciones extremas, originadas por valores extremos6 , son evidencias en contra de la hip otesis nula asumida. El m etodo permite establecer el nivel de signicaci on a partir del cual rechazaremos la hip otesis nula. As , si en un contraste bilateral rechazamos la hip otesis cuando el valor observado se encuentra entre los k mayores o los k menores, el nivel de signicaci on del test es = 2k/n. Una elecci on adecuada de n nos permitir a jar el deseado. Volvamos al resultado del sorteo. La caracter stica num erica que vamos a observar es el llamado intervalo intercuart lico, IIQ, de la distribuci on de las distancias entre sucesos. Se trata de una medida de dispersi on denida mediante IIQ = p75 p25 , donde p75 y p25 son, respectivamente, el tercer y el primer cuartiles que, recordemos, son los valores que dejan a su izquierda el 75% y el 25% , respectivamente, de las distancias observadas.

IIQ p25 p75

min

p50 mediana

max

Figura 10.- El intervalo intercuart lico.

El intervalo intercuart lico de las 66.795 = 1 2 366 365 distancias obtenidas a partir del resultado del sorteo vale IIQ = 139, 5. Para las 99 simulaciones los valores de sus IIQ var an entre 138,4 y 136,4. Nuestro valor es el mayor de todos ellos La conclusi on es obvia: rechazaremos la hip otesis de aleatoriedad completa puesto que la probabilidad de encontrar un valor en cualquiera de los extremos es 2 0, 01 (el contraste es bilateral porque la hip otesis alternativa es la ausencia de aleatoriedad completa, que puede manifestarse indistintamente con valores altos o bajos).

3.3

Conclusi on

Todo parece indicar que las precauciones que se tomaron no fueron sucientes. El resultado del sorteo no parece compatible con las condiciones requeridas por las extracciones al azar, como se deduce de las pruebas anteriores y de otras complementarias que pueden consultarse en los art culos de Fienberg [6] y Corber an & Montes [2]. El resultado de los tests de aleatoriedad completa nos conducen al rechazo de esta, pero nos informan tambi en del sentido de la desviaci on respecto de aqu ella. En efecto, los patrones
6 Seg un

que el contraste sea unilateral o bilateral tendremos en cuenta uno o los dos extremos

21

Montes & Corber an

Qu e dif cil es la aleatoriedad!

22

agregados tienen mayor dispersi on que los regulares (una nueva ojeada a la gura 8 puede merecer la pena) y el elevado valor del IIQ observado estar a indic andonos la presencia de un patr on agregado. El resultado de la regresi on va tambi en en este sentido.

Agradecimientos
Los autores quieren manifestar su agradecimiento por la ayuda recibida en el apartado de la Primitiva a D. Pedro R. L opez Torres, inform atico vehemente, para qui en este juego s olo guarda un secreto: acertar la combinaci on ganadora.

Referencias
[1] G.A. Barnard. Contribution to the discussion of Professor Bartletts paper. J.R.Statist.Soc. B , 25:294, 1963. [2] A. Corber an & F. Montes. Perversiones y trampas de la probabilidad. La Gaceta de la RSME, 3:198:229, 2000. [3] P.J. Diggle. Statistics Analysis for Spatial Point Patterns. Academic Press, London, 1983. [4] A De Moivre. The Doctrine of Chances. 3rd. Edition. A. Millar, London, 1756. (Reeditado por Chelsea Pub. Comp., New York, 1967) [5] W. Feller. An Introduction to Probability Theory ans Its Applications. Vol I. 3rd. Edition. John Wiley, New York, 1968. [6] S.E. Fienberg, Randomization and Social Aairs: The 1970 Draft Lottery. Science, 171:255261, 1971. [7] J. Haigh. Taking Chances. Oxford University Press, Oxford, 1999. [8] C. Huygens. Tractatus de Rationiis in Aleae Ludo. In Exercitationes Mathematicae. Ed. F. van Shooten, Amsterdam, 1657. [9] P.R. L opez Torres. Comunicaci on personal. Albacete, 2000. [10] R.J. Larsen and M.L. Marx. An Introduction to Mathematical Statistics ans Its Applications. 3rd. Edition. Prentice Hall College Div., New Jersey, 2000. [11] P.R. Montmort. Essai dAnalyse sur les Jeux dHazard. Ed. Jacques Quillau, Paris, 1713. (Reeditado por Chelsea Pub. Comp., New York, 1980) [12] C.R. Rao. Estad stica y Verdad: Aprovechando el Azar. PPU, Barcelona, 1994. [13] A. R enyi. Probability Theory. North-Holland, Amsterdam, 1970.

22

Das könnte Ihnen auch gefallen