Beruflich Dokumente
Kultur Dokumente
ESCUELA DE POSGRADO
ESTADSTICA APLICADA
DR. OSWALDO ASPILCUETA FRANCO
MAG. DIANA ANICAMA ORMEO
PRUEBAS NO PARAMETRICAS
INTRODUCCIN
En la mayora de las pruebas de hiptesis se parte de la
suposicin de que la Poblacin de la que se extrae las
muestras aleatorias tiene una distribucin normal. Existen
poblaciones que no satisfacen dicha condicin porque tienen
algn sesgo respecto a la distribucin normal
Cuando las poblaciones no son normales entonces se
aplican las PRUEBAS NO PARAMETRICAS
CARACTERSTICAS DE LA DISTRIBUCIN
NORMAL DE PROBABILIDAD
Descripcin
de la
CURVA NORMAL
El extremo izquierdo se
extiende de manera
indefinida y nunca toca
el eje horizontal
Media
Mediana
Moda
La
distribucin
normal
de
probabilidad es SIMTRICA con
respecto a una lnea vertical que
pase por la media
El extremo derecho se
extiende
de
manera
indefinida y nunca toca el
eje
horizontal
ASINTOTICA
P-1
MEDIA
MEDIANA
MODA
MEDIA
MEDIANA MODA
P-1
CURVA A
CURVA B
Sesgo +
Sesgo -
P-2
KURTOSIS
LEPTOCURTOSIS
MESOCURTOSIS
PLATOCURTOSIS
) y
la desviacin
1
Curva B tiene una desviacin
estndar ms grande
10
50
15
25
40
Curva A tiene la
Media ms
pequea
Curva C tiene la
Media ms
grande
15
10
25
Curva B tiene una Media
y una desviacin
estndar ms grande
40
Curva C tiene una
Media y desviacin
estndar muy grande
15
Curva A tiene una media
y
una
desviacin
estndar pequeas
10
25
Curva B tiene una media y
una desviacin
estndar
ms grande
P-3
40
Curva C tiene una media y
una desviacin
estndar
muy grande
PRUEBAS
PRUEBAS NO
NO PARAMETRICAS
PARAMETRICAS
a) PRUEBA DEL SIGNO
b) PRUEBA DE SUMAS DE RANGO,
- PRUEBA U:
c) PRUEBAS DE KOLMOGOROV-SMIRNOV
) poblacional
por un signo + y cada valor muestral < 0 por un signo - ; despus probamos la
hiptesis nula de que los signos + y son los resultados de ensayos binomiales
con p = . Si un valor muestral es = 0, lo cual puede suceder descartamos dicho
valor
EJEMPLO: Los siguientes datos integran una muestra aleatoria de 11 mediciones
para = 0.05
SOLUCIN:
Dado que uno de los valores muestrales es 98.0, debe descartarse y por tanto el
tamao de la muestra es igual a 10
SOLUCIN
5) TOMA DE DECISIN
En la tabla de la binomial para n = 10 se
tiene que para x 9, p = 0.50, es 0.0107 es
la probabilidad buscada.
Luego esta probabilidad 0.0107 es menor
que 0.05 por lo tanto debe rechazarse a la
hiptesis nula y concluimos que el coeficiente
intelectual promedio de los estudiantes de
pre-grado considerado excede a 98.0
SOLUCIN
1) FORMULACIN DE LA HIPTESIS
Ho:
H1:
= 0.5 (p = )
> 0.5 (p mayor que )
2) NIVEL DE SIGNIFICANCIA
= 0.05
3) CRITERIO
Si x es el nmero de signos positivos, se rechaza
la hiptesis nula cuando la probabilidad de
obtener x o mas signos positivos es menor o igual
a 0.05
4) CALCULOS
45 y 36 73 y 60 45 y 44 45 y 45 124
y 119 36 y 35 50 y 51 83 y 77 34 y
29 26 y 24 17 y 11
5) TOMA DE DECISIN
para 0.05
b)
0,96 0,26 0,39 0,88 0,92 0,53 0,95 0,48 0,89 0,99 0,97
SOLUCIN
El
problema consiste en decidir si las muestras son las mismas o son diferentes,
1) FORMULACIN DE LA HIPOTESIS
Ho: El cumplimiento de las competencias son iguales
H1: El cumplimiento de las competencias son diferentes
2) ELECCIN DE LA PRUEBA
U 1 W1
U 2 W2
n1 n1 1
2
n2 n2 1
2
Donde:
W1 es la suma de los rangos del grupo 1
W2 es la suma de los rangos del grupo 2
1+2+3+4+5=15
n1 n1 1
2
1+2+3+4+5++99 =
99
99 1
2
Adems:
Media del U1
n1n2 ( n1 n2 1)
12
2
U1
n1n2
y,
OSERVACIN
Si dos o mas valores son
iguales se le asigna un rango
que es la media de ellos
U 1 U1
= 0.01
3 ) CRITERIO
Se rechaza la hiptesis nula si Z es menor que -2.58 o mayor que 2.58 (ver tabla z)
4 ) CALCULOS
a) n1 = 15 n2 = 14
b) datos por Grupos
I
0,63 (1) 0,17 (1) 0,35 (1) 0,49 (1) 0,18 (1) 0,43 (1) 0.12 (1)
II
0,98 (2) 0,54 (2) 0,96 (2) 0,26 (2) 0,39 (2) 0,88 (2) 0,92 (2) 0,53 (2) 0,95 (2) 0,48 (2) 0,89 (2) 0,99 (2) 0,97 (2) 0,58 (2)
c) ordenando Grupo I
0,20 (1) 0,47 (1) 0,36 (1) 0,51 (1) 0,45 (1) 0,84 (1) 0,32 (1) 0,40 (1)
Grupo II
0,12 (1) 0,17 (1) 0,18 (1) 0,20 (1) 0,32 (1) 0.35 (1)
II
0,26 (2) 0,39 (2) 0,48 (2) 0,53 (2) 0,54 (2) 0,58 (2) 0,88 (2) 0,89 (2) 0,92 (2) 0,95 (2) 0,96 (2) 0,97 (2) 0,98 (2) 0,99 (2)
0,36 (1) 0,40 (1) 0,43 (1) 0,45 (1) 0,47 (1) 0,49 (1)0,51 (1) 0,63 (1) 0,84 (1)
d) Ordenando (Grupo I
Grupo II)
0,12 (1) 0,17 (1) 0,18 (1) 0,20 (1) 0,26 (2) 0,32 (1) 0,35 (1) 0,36 (2) 0,39 (1) 0,40 (1) 0,43 (1) 0,45 (1) 0,47 (2) 0,48 (1) 0,49 (1)
II
0,51 (1) 0,53 (2) 0,54 (2) 0,58 (2) 0,63 (1) 0,84 (2) 0,88 (2) 0,89 (2) 0,92 (2) 0,95 (2) 0,96 (2) 0,97 (2) 0,98 (2) 0,99 (1)
Grupo II)
0,12 (1) 0,17 (1) 0,18 (1) 0,20 (1) 0,26 (2) 0,32 (1) 0,35 (1) 0,36 (2) 0,39 (1) 0,40 (1) 0,43 (1) 0,45 (1) 0,47 (2) 0,48 (1) 0,49 (1)
II
10
11
12
13
14
15
0,51 (2) 0,53 (2) 0,54 (2) 0,58 (1) 0,63 (1) 0,84 (2) 0,88 (2) 0,89 (2) 0,92 (2) 0,95 (2) 0,96 (2) 0,97 (2) 0,98 (2) 0,99 (1)
16
17
18
19
20
21
22
23
24
25
26
27
28
29
0.12
0.17
0.18
0.20
0.32
0.35
0.36
0.40
0.43
0.45
0.47
0.49
0.51
0.63
0.84
10
11
12
13
15
16
20
21
W1=
II
0.26
0.39
0.48
0.53
0.54
0.58
0.88
0.89
0.92
0.95
0.96
0,97
0,98
0,99
14
16
17
19
21
22
23
24
25
26
27
28
W2=
286
149
U 1 149
1515 1
29
2
15 *14
2
105
15 *14(15 14 1)
12
525
U2
1
U2
29 105
525
z 3,32
5 ) TOMA DE DESICIN
Dado que z =-3.32 es menor que
-2.58 entonces la Ho debe
rechazarse (ver tabla z)
OBSERVACIN:
1+2+3++n=n(n+1)/2
Ejemplo
1 + 2 + 3 + + 15 = 15 ( 15 + 1 ) / 2 = 42
PRUEBAS DE KRUSKL-WALLIS
Es una generalizacin de la PRUEBA U que nos permite probar la
hiptesis nula, en el sentido de que K muestras aleatorias
independientes provienen de poblaciones independientes. R i es la suma
de los rangos ocupados por las ni observaciones, donde n1 + n2+
nk = n es el estadstico que se emplea es:
k
12
Ri2
H
3( n 1)
n( n 1) i 1 ni
.(I)
n1=6
n2=7
n3=5,
n =18
= 0.05
SOLUCIN
1) FORMULACIN DE LA HIPOTESIS
Ho: Las poblaciones son idnticas
H1: Las poblaciones no son idnticas
2) NIVEL DE SIGNIFICANCIA
tabla)
3) CRITERIO
Se rechaza la hiptesis nula si H es mayor que 5.99
4) CALCULOS
- ordenar los datos en forma creciente
-
R 2 = 55.5
R 3 = 31.5
n( n 1) i 1 ni
12 84 2
55.5
31.52
18 *19 6
7
5
3(18 1)
H 6.7
5) TOMA DE DECISIN
Dado que H = 6.7 mayor que 5.99 entonces rechazamos la hiptesis
nula luego los 3 mtodos de aprendizaje no tiene la misma eficacia,
donde Chi cuadrado
para v = k-1 =3-1= 2
X 02.95 5.99
PRUEBA DE KOLMOVOROV-SMIRNOW
LaS prueba de KOLMOVOROV- SMIRNOV son pruebas no parametricas
que se utilizan para diferencias Entre distribuciones acumuladas. La
prueba unimuestral se refiere a la concordancia entre una distribucin
acumulada observada de valores muestrales y una funcin de
distribucin continua determinada; es pues una prueba de bondad de
ajuste. La prueba bimuestral esta relacionada con la conformidad de 2
distribuciones acumuladas observadas.
La prueba K-S unimuestral es en general mas eficiente que el Chi
cuadrado para bondad de ajuste en muestras pequeas y puede
emplearse en muestras muy pequeas donde el Chi cuadrado no se
aplica. La prueba unimuestral se fundamenta en la diferencia absoluta
mxima D, entre los valores de la distribucin acumulada de una
muestra aleatoria de tamao n y una distribucin terica
determinada. Para decidir si esta diferencia es mayor de lo que
razonablemente puede esperarse para un nivel de alfa determinado,
buscamos los valores crticos de D en la tabla de valores crticos.
EJEMPLO
SOLUCIN
x0
0 Para
x Para
0 x 30
F ( x)
30 Para
x30
1
3) CRITERIO
4) CALCULOS
Graficando la distribucin acumulada, tal
como aparece en el grfico (I) se ve que la
diferencia es mayor para x = 6.2 y que su
valor es D = (0.40 6.2)/30 = 0.193
1,0
0,8
0,6
.(I)
0,4
D = 0.193
0,2
0
10
15
20
25
30
5) TOMA DE DESICIN
Puesto que D = 0.40 6.2/30 = 0.193, es el valor mximo se tiene: 0.193
menor que 0.410 que esta en la tabla para n=10 y D=0.05 entonces no
rechazamos la hiptesis nula.
TRABAJO
CONTRASTAR hiptesis por mtodos no paramtricos:
1) En un experimento de laboratorio 18 medidas del coeficiente de friccin
entre cuero y metal, arrojaron los siguientes resultados:
0.59, 0.56, 0.49, 0.55, 0, 65, 0.55, 0.51, 0.60, 056, 0.47, 0.58, 0.61, 0.54,
0.68, 0.56, 0.50, 0.57, 0.53.
Para alfa 0.05 y mediana = 0.55 (hiptesis)
Mediana diferente 0.55
2) El departamento de control de calidad de una gran fabrica obtuvo los
siguientes datos muestrales (en libras) de la resistencia a la ruptura de
cierto tipo de algodn de 2 plg: 153, 159, 144, 160, 158, 153, 171, 162,
159, 137, 159, 159, 148, 162, 154, 159, 160, 157, 140, 168, 163,148,
151, 153, 157, 148, 168, 162, 149. mediante la prueba del signo 0.01 y
la mediana y alternativa mediana mayor que 150