Sie sind auf Seite 1von 4

Todos los mtodos de inferencia se basan en la suposicin de que las muestras son aleatorias; no obstante, hay muchas aplicaciones

en que es difcil decidir si la suposicin es justificable. Esto es verdadero, particularmente, cuando tenemos poco control o ninguno sobre la seleccin de los datos, como es el caso, por ejemplo, cuando confiamos en cualquier registro disponible para hacer pronsticos de largo alcance sobre el clima, cuando usamos cualquier dato disponible para estimar la tasa de mortalidad como consecuencia de una enfermedad o cuando usamos los registros de ventas del mes pasado para pronosticar las ventas de una tienda de departamentos. Ninguna de estas informaciones constituye una muestra aleatoria en forma estricta. Una condicin bsica en casi toda la estadstica deductiva es que un sistema de datos constituye una muestra escogida aleatoria de una poblacin homognea dada. La condicin de la aleatoriedad es esencial para cerciorarse de que la muestra es verdaderamente representativa de la poblacin. La prueba ms usada para la aleatoriedad es la Prueba de corridas (Wald-Wolfowitz). Test de Corrida Hay varios mtodos para juzgar el azar de una muestra con base en el orden en que se obtienen las observaciones; nos permiten decidir, despus de haber recopilado los datos, si se pueden atribuir a la probabilidad los patrones que aparentan ser no aleatorios. La prueba de corrida es generalmente la prueba principal usada para verificar la dependencia. Esta prueba detecta si un patrn inaceptable estadsticamente que se incrementa o decrece existe entre nmeros adyacentes en un flujo de nmeros. Un test de Corridas es un mtodo que nos ayuda a evaluar el carcter de aleatoriedad de una secuencia de nmeros estadsticamente independientes y nmeros uniformemente distribuidos. Es decir dado una serie de nmeros determinar si son o no aleatorios. Existen dos versiones de la prueba de corridas: Prueba de corridas arriba y abajo (ascendente y descendente).- Si tenemos una secuencia de nmeros de tal manera que a cada uno de los nmeros siga otro mayor la secuencia dada ser ascendente (arriba). Si cada nmero va seguido por otro menor, la secuencia ser descendente (abajo). Prueba de corridas arriba y abajo de la media (promedio).- El carcter no aleatorio de las secuencia se sugiere por el hecho de que tenemos una corrida de nmeros por encima de la media, seguida por una corrida por debajo de la media. Es por ello que necesitamos de otro mtodo que nos lleva a la verdadera respuesta. Utilizando entonces el mtodo llamado prueba de corridas por arriba y abajo de la media. Este ltimo es el que ms se utiliza debido a que utiliza las medias de los datos observados. La Prueba de corridas arriba y abajo de la media utiliza las siguientes formulas:

Donde n son los datos por encima del promedio y m son los datos por debajo del promedio. Tambin se calcula un valor Z con la siguiente formula:

Donde R es el valor de las corridas contadas en el conjunto de datos. Generalmente se trabaja a un nivel de confianza de 0.05% de confiabilidad y se maneja las siguiente hipotesis: Ho Ha Los datos son aleatorios Los datos no son aleatorios

El valor tabulado de Zpara un nivel de confianza de 0.05%, segn la distribucion normal es de 1.96; esto quiere decir que nuestro valor calculado de Z debe estar entre este intervalo:
-1.96< z < 1.96 De ser asi acepta la Ho, caso contrario se acepta la Ha Para el entendimiento de este test de corridas seguiremos el siguiente ejemplo: Prueba de corridas en las corrientes fluviales anuales. Los flujos anuales de la Derwent en Yorkshire Bridge, Inglaterra, para el perodo de 1938-1967 se tabulan a continuacin en milmetros de equivalente escurrimiento sobre la zona de captacin por encima del lugar.

946 1058 1133 869 927 742 1113 665 955 1288 1074 838 815 910 1193 1386 955 1187 891 1302 867 837 1138 868 969 737 1143 947 763 1029
Ordenado los datos y realizando los clculos, tenemos: Caso I

Valores de R (Corridas) 1 2 3 4 5 6 7 8 9

Annual flows (mm) 946 1074 867 1058 838 837 1133 815 1138 869 910

Promedio Valores por encima del promedio (Rojo) Valores por debajo del promedio (amarillo) Valores de R (Corridas)

985 12 n

18

20

10 11 12 13 14 15 16 17 18

868 927 1193 969 742 1386 737 1113 955 1143

Ho Ha

Los datos son aleatorios Los datos no son aleatorios

Valor R R 15.4

Valor Var[R] Var[R] 6.653793103

665 1187 947 955 891 763 1288

Valor Z Z
Valor Critico Z al 0.05%

1.98 1.96

19

-1.96<1.98<1.96

20

1302 1029

Caso II Para el mismo ejemplo pero con los datos distribuidos al azar tenemos lo siguiente:

Valores de R (Corridas) 1 2 3 4 5

Annual flows (mm) 946 838 1302 1058 837 1133 910

Promedio Valores por encima del promedio (Rojo) Valores por debajo del

985 12 n

18

6 7 8 9 10 11 12 13 14

869 1138 1074 815 868 927 1193 1386 742 737 1288 1113 891 1143 969 665 1029 1187 947 955 867 763 955

promedio (amarillo) Valores de R (Corridas) Ho Ha 15 R

Los datos son aleatorios Los datos no son aleatorios

Valor R R Valor Var[R] Var[R] 6.653793103 15.40

Valor Z Z
Valor Critico Z al 0.05%

0.04 1.96

15

-1.96<0.04<1.96

Para este caso, aceptamos la Ho y rechazamos la Ha Como se puede observar para ambos casos el nmero de corridas cambia de valor haciendo que, matemticamente, nos diga si nuestros valores son aleatorios o no. Conclusiones Este tipo de test son importantes para poder saber si nuestros datos son independientes y totalmente aleatorios. Esto nos sirve para poder determinar la confiabilidad de los datos y saber que no han sido manipulados de alguna manera Bibliografa Kottegoda, N. T. 1997. Applied statistic for civil and environmental engineers. 2 ed. Editorial McGraw Hill. New york. Pag. 267-267 Estadstica elemental. John E. Freund, Gary A. Simon.

Das könnte Ihnen auch gefallen