Sie sind auf Seite 1von 34

CONTRASTES NO PARAMETRICOS

Conceptos bsicos
En los contrastes paramtricos", se requiere una serie de supuestos estadsticos para asegurar la validez de las pruebas.

Particularmente, las "pruebas paramtricas" sobre la media o sobre la varianza exigen que la variable se mida (como mnimo) en escalas de intervalo. Ello hace que no sea posible efectuarlas cuando la escala sea ordinal.

Las pruebas no paramtricas pueden ser efectuadas cuando el nivel de medida sea ordinal, as como las condiciones de los supuestos estadsticos (como es el caso de homogeneidad de varianzas, normalidad de las puntuaciones) son menos estrictas.

Contraste de Aleatoriedad
En una determinada secuencia de sucesos observables la interaccin entre elementos iguales lo denominaremos como racha. El n de elementos de una racha se llama Longitud. Ejemplo, la secuencia: aaa bb a bb aa aqu existen 5 rachas, de dos sucesos a y b de longitudes (3) ; (2) ; (1) ; (2); (2).

Aplicacin

Ejemplo
Dada la sucesin de eventos: aaa bb a bb aa, tenemos: R1: n de rachas del elemento 1 (a). N1: n de veces que aparece el elemento 1 (a) en la muestra. R2: n de rachas del elemento 2 (b). N2: n de veces que aparece el elemento 2 (b) en la muestra. El total de la muestra es : n = N1+ N2. El total de rachas es : Rexp = R1+ R2 Segn lo visto, en nuestro ejemplo:

Ejemplo

Procedimiento: Hiptesis Ho: La muestra es aleatoria Ha: La muestra no es aleatoria Test (Si Ni > 20). Bajo Ho, el estadstico R tomara valores 2 , 3 , ... N1+ N2 tiene una probabilidad P[ R=r ] y la distribucin asinttica de R es una NORMAL con:

Regla de Decisin Rechazaremos Ho si Zexp > Z1- /2. donde Z sigue una N(0,1).
9

z/2

z1-/2

Para valores pequeos de Ni 20 utilizar la tabla de aleatoriedad, donde para cada nivel de significacin vienen dados los valores crticos RI = ra/2 RS = r1-a/2 . Variables Cuantitativas Cuando los datos son cuantitativos realizar el siguiente proceso: 1. Se calcula la mediana muestral. 2. Se obtiene la diferencia entre cada valor y la mediana, asignndole el signo correspondiente. 3. Para muestras grandes se eliminan los valores 0 (en caso de muestras pequeas los empates arbitrariamente se pueden tomar como positivos o negativos). 4. Se procede igual que en el apartado anterior tomando la sucesin de signos + 10

11

Ejemplo
Una empresa pretende enviar a sus empleados a realizar unos cursillos de formacin en el extranjero y para ello decide escoger entre sus trabajadores a 50 empleados entre ambos sexos (a=masculino y b=femenino). Siendo la sucesin de sexos la siguiente: aaa bb a b aaaaa bbbbbb aa bbb aaaa bbbbb a b a b a bb aaa bbbb aaa b Contrastar si el procedimiento seguido ha sido aleatorio para un nivel del 5%

12

Solucin
Ho: La sucesin por gnero es aleatoria Ha: La sucesin por gnero no es aleatoria

Test

13

Donde;

Como Ni > 20 y |Zexp| = 1.56 < Z0.025 = 1.96 no rechazamos Ho. Por tanto la seleccin por gnero es aleatoria.

14

Test de Kolmogorov Smirnov de Bondad de ajuste


Es un Test alternativo a la Chi-cuadrado. Tiene el mismo objetivo: contrastar la Hiptesis Nula de que X sigue una distribucin especifica F(x) frente a la Hiptesis Alternativa de que no la siga. Debe utilizarse si: Modelo propuesto es de tipo continuo Tamao muestral es pequeo El fundamento del contraste radica en comparar la distribucin de las Frecuencias observadas (Fo) con la distribucin propuesta bajo la Ho: F(x) y si esta comparacin revela diferencias significativas se rechazara la Ho

15

Estadstico D = max {D1 ; D2} donde:

16

Regla de Decisin
Fijado el nivel de significacin buscamos en la tabla los valores crticos (del Test K-S ) el valor D que depende de y de N de manera que: Rechazamos Ho (las desviaciones entre la muestra y la poblacin son significativas) Di >D. No rechazamos Ho (las desviaciones entre la muestra y la poblacin no son significativas) Di < D.
R.R.

D
17

Ejemplo
Realizar un test de K-S para un = 0.1 para saber si los datos procedentes de una muestra de tamao 10 siguen una distribucin Normal de media 10.84 y desviacin 3.5.
{10.5; 8; 15; 12.1; 4.1; 12.1; 8; 10.5; 16; 12.1}

Solucin
Ho: Los datos siguen un modelo normal Ha: Los datos no siguen un modelo normal

18

Las frecuencias esperadas se calculan como:

Test

19

Para un nivel de = 0.1 y N = 10, en la tabla K-S se tiene D0.10 = 0.368.

Decisin
Como D = 0.164 < D = 0.368, entonces no rechazamos Ho.

20

Grfica de Probabilidad
La grfica de probabilidad es un mtodo grfico que permite determinar si una muestra de datos se ajusta a una distribucin propuesta en base a una anlisis visual subjetivo. Originalmente esta grfica se realizaba sobre un papel especial llamado papel de probabilidad diseado con las escalas adecuadas para las diferentes distribuciones.

Procedimiento:
1. Se ordena la muestra de menor a mayor: x1,x2,....,xN 2. Se grafica la frecuencia acumulada observada (i-0.5)/N contra el valor de los datos ordenados 3. Si los puntos obtenidos se desvan significativamente de una lnea recta, el modelo propuesto no ser el apropiado.

21

Ejemplo:
Las siguientes son diez observaciones sobre la duracin en minutos de las bateras de computadoras porttiles: 176, 183, 185, 190, 191, 192, 201, 205, 214, 220 Utilizar la grfica de probabilidad para determinar si la muestra corresponde a una distribucin Normal.

Procedimiento: Formamos la tabla de los datos ordenados y las


frecuencias acumuladas (i-0.5)/N siguiente:
i xi (i-0.5)/10 1 176 2 183 3 185 4 190 5 191 6 192 7 201 8 205 9 214 10 220 0.95
22

0.05 0.15 0.25 0.35 0.45 0.55 0.65

0.75 0.85

1.0

Grfica de Probabilidad Normal

Frecuencia acumulada (i-0.5)/N

0.95 0.90 0.84 0.75

0.50

16
0.25 0.10 0.05 0.0 175

195

180

185

190

195

200

205

210

215

220

Datos (Xi)
23

Observaciones: Al analizar la grfica debe recordarse que el eje vertical est graduado en percentiles, por ello la media se encuentra en el percentil 50. Los puntos ms confiables son los que estn entre el percentil 25 y el 75, de hecho, la lnea trazada debe unir estos percentiles Se puede obtener una grfica sobre papel normal ajustando la escala vertical de acuerdo a zi, donde F(zi) = (i-0.5)/N, para el ejemplo:
i xi (i-0.5)/10 zi Ei 1 176 0.05 -1.64 168.68 2 183 0.15 -1.04 178.42 3 185 0.25 -0.67 184.21 4 190 0.35 -0.39 188.83 5 191 0.45 -0.13 192.99 6 192 0.55 0.13 197.01 7 201 0.65 0.39 201.17 8 205 0.75 0.67 205.79 9 214 0.85 1.04 211.58 10 220 0.95 1.64 221.32

24

Grfica de Probabilidad Normal

25

La Prueba de Signos
La prueba t supone que los datos se distribuyen normalmente. La prueba del signo prescinde de tal hiptesis y es mucho ms fcil de realizar. Se puede utilizar de diferentes formas, la ms simple se describe a continuacin:

Hiptesis
Ho: = o vs. Ha: una alternativa apropiada Equivalente Ho: Me=Meo Ho: p=0.5 Basndose en una muestra aleatoria de tamao n, se reemplaza cada valor muestral mayor que o por un signo ms y cada valor muestral menor que o por un signo menos. Se ignoran por completo aquellos valores que son iguales a o. Para contrastar si la preponderancia de signos menos, es significativa se utiliza la ley 26 de la binomial acumulada.

Test
Esta ley establece que la probabilidad de que aparezcan r signos menos entre n signos.

Si la probabilidad experimental es menor que un nivel de significacin , la hiptesis nula debe rechazarse.

Regla de Decisin
Si Ha: < o debemos hallar p=P(Xr), en este caso r describe el signo menos frecuente. Entonces si p=P(X r)< , rechazamos Ho.

27

Particularmente en el caso unilateral hacia la izquierda y derecha respectivamente: a) Rechazaremos Ho, solo si la proporcin de signos (+) es suficientemente menor que 0.5, entonces P se calcula:

Es menor o igual al nivel de significancia (alfa) preestablecido. b) Rechazamos Ho, si la proporcin de signos (+) es bastante mayor que 0.5 , cuando x es grande.

c) Para el caso bilateral, rechazamos Ho, si la proporcin de signos (+) es significativamente menor o igual a 0.5, depende que x sea bastante grande o pequea. Si:

28

Da 1

Utilidad x 2158.7 1678.15 2316.00 2061.30 2207.50 1708.30 1784.70 2575.10 2357.90 2256.70 2165.20 2399.55 1779.8 2336.75 1765.30 2053.50 2414.40 2200.50 2654.20 1753.70 29

Ejemplo
Se informa acerca de un estudio en el que se modela las utilidades diarias de un empresa como se muestran a continuacin. Se desea probar la hiptesis de que la mediana de las utilidades es de 2000 u.m., utilizando un nivel de significancia de 0.05.

2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Da

x 2158.7 1678.15 2316.00 2061.30 2207.50 1708.30 1784.70 2575.10 2357.90 2256.70 2165.20 2399.55 1779.8 2336.75 1765.30 2053.50 2414.40 2200.50 2654.20 1753.70

Solucin
1 2

DIFERENCIAS X - 2000 +158.7 -321.85 +316 +61.30 +207.5 -291.7 -215.3 +575.1 +357.9 +256.7 +165.2 +399.55 -220.20 +336.75 -234.7 +53.5 +414.4 +200.5 +654.2 -246.3

SIGNO + + + + + + + + + + + + + + -

El parmetro de inters es la mediana de las utilidades.

3 4 5 6 7 8 9

Hiptesis
Ho: Me = 2000 Ha: Me 2000.

Test
El estadstico de prueba de las diferencias es: X: Nro. de signos positivos, X=14

10 11 12 13 14 15 16 17 18 19 20

30

Decisin
Se rechaza Ho si el valor p-value correspondiente a X=14 es menor o igual a 0.05. Como X=14 es mayor que n/2=10, el valor p-value se calcula:

Como P= 0.1153 no es menor que 0.05, no es posible rechazar la hiptesis nula.

31

Ejemplo
Una compaa de taxis trata de decidir si el uso de llantas radiales en lugar de llantas regulares con cinturn mejora la economa de combustible. Se equipan 16 automviles con llantas radiales y se manejan por un recorrido de prueba establecido. Sin cambiar de conductores, se equipan los mismos autos con llantas regulares con cinturn y se manejan una vez ms por el recorrido de prueba. Se registra el consumo de gasolina, en kilmetros por litro, como se muestra en la tabla. Se puede concluir en el nivel de significancia de 0.05 que los autos equipados con llantas radiales obtienen mejores economas de combustible que los equipados con llantas regulares con cinturn?

Automvil 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Llantas radiales 4.2 4.7 6.6 7.0 6.7 4.5 5.7 6.0 7.4 4.9 6.1 5.2 5.7 6.9 6.8 4.9

Llantas con cinturn 4.1 4.9 6.2 6.9 6.8 4.4 5.7 5.8 6.9 4.9 6.0 4.9 5.3 6.5 7.1 4.8 32

Solucin:

Automvil 1 2 3 4 5

Llantas radiales 4.2 4.7 6.6 7.0 6.7 4.5 5.7 6.0 7.4 4.9 6.1 5.2 5.7 6.9 6.8 4.9

Llantas con cinturn 4.1 4.9 6.2 6.9 6.8 4.4 5.7 5.8 6.9 4.9 6.0 4.9 5.3 6.5 7.1 4.8

+ + + + 0 + + 0 + + + + +
33

Al observar las diferencias se ve que slo existe una n=14, ya que se descartan los valores de cero. Test Se tiene X+ = 11

6 7 8 9 10 11 12 13 14 15 16

Decisin y conclusin: Como 2.14 es mayor a 1.645 se rechaza H0 y se concluye con un = 0.05 que las llantas radiales mejoran la economa de combustible.
NOTA: Si n>10 entonces podemos aproximar a la normal (np > 5)
34

Das könnte Ihnen auch gefallen