Sie sind auf Seite 1von 32

Estadstica no

paramtrica
Dr. Ignacio Mndez Ramrez

La estadstica no paramtrica consiste en


eliminar algunos supuestos con los que
operan las pruebas llamadas paramtricas,
que suponen normalidad de la distribucin
de los datos dentro de cada poblacin.
En general las pruebas no paramtricas
resultan con menor potencia que las
correspondientes paramtricas.

Pruebas para una sola poblacin

Pruebas de que la mediana de una distribucin


es cero.
Se puede usar para datos apareados, o sea
bloques de dos elementos. En este caso se
obtiene la diferencia:
di=X1i-X2i i = 1,2,n
La hiptesis de mediana cero se puede someter
a contrastacin, con varias pruebas,
consideramos, la del signo y la de Wilcoxon de
rangos con signo.

Prueba del Signo

Si se tienen los n elementos y en cada uno


se mide una variable di y se quiere someter
a contrastacin la hiptesis de que los
valores provienen de una distribucin con
mediana MDo, se cuenta cuantos valores
son inferiores a MDo, n- y cuantos
superiores, n+. Se supone que no hay casos
con valores exactamente iguales a MDo

Prueba del signo 2

Bajo la Hiptesis de que


la mediana es MDo, n+
tiene una distribucin
binomial.
n
Entonces en prueba de
Valor de P 2 n n 2 n
dos colas, el valor de P es
n
el
doble
de
la
probabilidad de que n+
sea mayor que n+obs si
n+obs es mayor que n-obs.

Prueba del signo 3

Bajo la Hiptesis de que la


mediana es MDo, n+ tiene
una distribucin binomial.
Entonces en prueba de una
n
cola, el valor de P es la
Valor de P n n 2 n
probabilidad de que n+
n
sea mayor que n+obs si
n+obs es mayor que n-obs.

Prueba de Wilcoxon de rangos con


signo
En este caso la hiptesis es que la mediana
poblacional es MDo, puede ser MDo=0,
para el caso apareado. Este caso implica la
hiptesis de que las dos poblaciones tienen
la misma distribucin.
Se obtienen los valores de las di ordenadas
y se les asigna un rango 1, 2, 3, n. Luego
se obtiene el signo de cada dato + si di es
mayor que MDo y en caso contrario.

Prueba de Wilcoxon de rangos con


signo 2

ri sign(di )rango( di )
La estadstica de prueba es :

Tobs = ri(+) - ri(-)


Se consideran todas las posibles
asignaciones de signos para los rangos del
1 al n. Estas son 2n

Prueba de Wilcoxon de rangos con


signo
3
Sean los datos:
X1i

X2i

di

absdi rango

50

42

3.5

3.5

57

30

27

27

15

21

-6

-5

42

43

-1

-6

39

31

3.5

3.5

51

42

Tobs=3.5+1+3.5+2-5-6=-1

ri

Com
1
2
3
4
5
6
7
8
9
10
11
12

3.5
-1
1
-1
-1
-1
-1
-1
1
1
1
1
1

1
-1
-1
1
-1
-1
-1
-1
1
-1
-1
-1
-1

5
-1
-1
-1
1
-1
-1
-1
-1
1
-1
-1
-1

6
-1
-1
-1
-1
1
-1
-1
-1
-1
1
-1
-1

3.5
-1
-1
-1
-1
-1
1
-1
-1
-1
-1
1
-1

2
-1
-1
-1
-1
-1
-1
1
-1
-1
-1
-1
1

T
-21
-14
-19
-11
-9
-14
-17
-12
-4
-2
-7
-10

Com
13
14
15
16
17
18
19
20
21
22
23
24

3.5
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
1
1

1
1
1
1
1
-1
-1
-1
-1
-1
-1
1
1

5
1
-1
-1
-1
1
1
1
-1
-1
-1
1
-1

6
-1
1
-1
-1
1
-1
-1
1
1
-1
-1
1

3.5
-1
-1
1
-1
-1
1
-1
1
-1
1
-1
-1

2
-1
-1
-1
1
-1
-1
1
-1
1
1
-1
-1

T
-9
-7
-12
-15
1
-4
-7
-2
-5
-10
-2
0

Com
25
26
27
28
29
30
31
32
33
34
35
36

3.5
1
1
1
1
1
1
1
1
-1
-1
-1
-1

1
1
1
-1
-1
-1
-1
-1
-1
1
1
1
1

5
-1
-1
1
1
1
-1
-1
-1
1
1
1
-1

6
-1
-1
1
-1
-1
1
1
-1
1
-1
-1
1

3.5
1
-1
-1
1
-1
1
-1
1
-1
1
-1
1

2
-1
1
-1
-1
1
-1
1
1
-1
-1
1
-1

T
-5
-8
8
3
0
5
2
-3
3
-2
-5
0

Com
37
38
39
40
41
42
43
44
45
46
47
48

3.5
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
1

1
1
1
-1
-1
-1
-1
-1
1
1
1
1
-1

5
-1
-1
1
1
1
-1
1
-1
1
1
1
-1

6
1
-1
1
1
-1
1
1
1
-1
1
1
1

3.5
-1
1
1
-1
1
1
1
1
1
-1
1
1

2
1
1
-1
1
1
1
1
1
1
1
-1
1

T
-3
-8
8
5
0
2
12
4
2
7
10
9

Com
49
50
51
52
53
54
55
56
57
58
59
60

3.5
1
1
1
1
1
1
1
1
1
-1
1
1

1
-1
-1
-1
1
1
1
1
1
1
1
-1
1

5
1
1
1
-1
-1
-1
1
1
1
1
1
-1

6
-1
1
1
-1
1
1
-1
-1
1
1
1
1

3.5
1
-1
1
1
-1
1
-1
1
-1
1
1
1

2
1
1
-1
1
1
-1
1
-1
-1
1
1
1

T
7
12
15
-1
4
7
2
5
10
14
19
11

com 3.5
61
1
62
1
63
1
64
1

1
1
1
1
1

5
1
1
1
1

6
-1
1
1
1

3.5
1
-1
1
1

2
1
1
-1
1

T
9
14
17
21

Distributions
T
Quantiles

-20

-10

10

20

0.15
0.05

0.05
0.03
0.01

Densi ty Axis

10

0.25

Probabi lity Axi s

15

Count Axis

20

Moments

100.0% max imum

21.000

Mean

99.5%

21.000

Std Dev

10

97.5%

19.750

Std Err Mean

90.0%

13.000

upper 95% Mean

75.0%

quartile

7.000

lower 95% Mean

-2

50.0%

median

0.000

64

25.0%

quartile

-7.000

10.0%

-13.000

2.5%

-19.750

0.5%

-21.000

0.0%

minimum

-21.000

Un valor de T de -1 es muy probable, la P


es de mas de 25%. No se rechaza Ho.
Note la cercana a la normalidad

Prueba de Wilcoxon de Rangos con


signo cont.

Otra forma equivalente de la contrastacin


es sumar solo los valores con signo
positivo.
La estadstica de prueba es :

T+obs = ri(+)

Bajo el supuesto de normalidad, se tiene que


la media esperada (bajo Ho), para T+, es
n(n+1)/4 y la varianza si no hay ceros ni
empates es
Varajus(T+)=(1/4)ri 2 =[n(n+1)(2n+1)]/24

Prueba Kruskal Wallis.


Comparacin de 2 o mas muestras
independientes

Para dos o mas muestras independientes. La escala


de medicin es ordinal o bien se tiene una escala de
razn o intervalo pero no se cumplen algunos
supuestos para la prueba de F.
La hiptesis de nulidad implica que la forma de la
distribucin de las poblaciones de donde vienen las
muestras son iguales, es decir se considera que las
poblaciones son en realidad una sola. No hay
diferencias entre la clasificacin en las muestras.
Una versin de la hiptesis es que las medianas de
las poblaciones son iguales .

Procedimiento y lgica.
1.- Se ordenan los valores de las k muestras sin respetar
la pertenencia a ellas. Pero conservando su identificacin.
Se asignan rangos de menor a mayor. Si hay empates se
obtiene el promedio de los rangos empatados y ese valor
se asigna a las observaciones con empate.
2.- Determinar los valores de Rj , la suma de rangos, y de
Rj promedio de los rangos para cada uno de los k
grupos.
3.- Calcular KW, si hay un gran nmero de empates usar
expresin 2, de otro modo use expresin 1.
4.- Siegel y Castellan dan dos tablas, con k=3 y n1 , n2 y
n3 5 , y otra en caso contrario.

La hiptesis es que los k grupos tienen igual


mediana. Bajo supuesto de igual dispersin
equivale a iguales poblaciones en las k muestras.
Bajo hiptesis se espera que los datos esten
distribuidos entre las muestras al azar y entonces
los promedios de los rangos deben ser iguales o
muy parecidos.
El valor de la estadstica de prueba KW crece si
los promedios de los rangos son muy diferentes.

Expresin 1, pocos empates.


k
12
2
KW
n j R j 3(n 1)

n(n 1) j 1

Expresin 2, muchos empates. Se determina g


el nmero de grupos con empates y ti el
nmero de empates en cada grupo. Obtener

KWc KW / c
Donde:

t
g

c 1

i 1

3
i

ti

n n
3

Muestras grandes

Si las muestras son de tamao grande y k es


grande tambin. La estadstica KW tiene
aproximadamente una distribucin Ji cuadrada
con k-1 grados de libertad

Ejemplo: Tres formas de presentar informacin en el


aprendizaje de relaciones de probabilidad. Donde hay una
relacin funcional X+Y+c=Z X y Y se relacionan
probabilsticamente con Z y c es constante. Pero X es
irrelevante y Y no. Los tratamientos fueron : 1 irrelevante
primero, 2.- Valido primero y 3.- Ambos . Los datos son
calificaciones de prediccin de 12 sujetos
Irrelevante
Primero
.994
.872
.349

Valido
Primero
.795
.884
.816
.981

Ambos
.940
.979
.949
.890
.978

Rangos

Rj
Rj

Irrelevante
Primero
12
4
1

Valido
Primero
2
5
3
11

17
5.67

21
5.25

Ambos
7
10
8
6
9
40
8

k
12
2
KW
n j R j 3(n 1)

n(n 1) j 1

KW

12
2
2
2
35.67 45.25 58.00 3(12 1)
12 (12 1)

KW=1.51
En tabla O de Siegel y Castellan el valor de P es de
0.10. No se rechaza la hiptesis de igualdad de
medianas

Muestras relacionadas. Bloques.


Prueba de Friedman
Es el equivalente no paramtrico del anlisis de varianza
con dos criterios. La escala de medicin es numrica de
razn o de intervalo, pero se obtienen rangos, o bien es
una escala ordinal inicial, sobre la que se obtienen
rangos.

La hiptesis de nulidad es la igualdad de medianas


ajustadas por el factor de formacin de bloques.

Prueba de Friedman
1.- Acomodar los datos en una tabla de doble entrada.
Los renglones son los bloques y las columnas las k
poblaciones o tratamientos
2.- Dentro de cada rengln o bloque obtener los rangos
de los datos del 1 a k.
3.- Obtener la suma de los rangos en cada columna o
poblacin. (Rj)
4.- Obtener la estadstica de prueba Fr. Con o sin
empates.
5.-Para n y k pequeos usar tablas. En caso contrario Fr
sigue una distribucin Ji cuadrada con k-1 grados de
libertad

Sin empates dentro de bloques.


k
12
2
Fr
R j 3b(k 1)

bk (k 1) j 1

Con empates dentro de bloques.


k

Fr

12 R j 3b 2 k (k 1) 2
2

j 1

b gi

3
bk ti. j

1
j

bk (k 1)
k 1

gi es el numero de conjuntos de empates en el bloque i, y


ti.j es el nmero de datos empatados en cada conjunto.

Ejemplo: Tres (k) tratamientos de refuerzo en


habilidad de aprendizaje en ratas. Tres ratas en cada
camada, con 18=b camadas.
Camada

100% de Refuerzo

Refuerzo Parcial

No refuerzo

10

Camada

100% de Refuerzo

Refuerzo Parcial

No refuerzo

11

12

13

14

15

2.5

2.5

16

17

18

Rj

39.5

42.5

26.0

k
12
2
Fr
R j 3b(k 1)

bk
(
k

1
)
j 1

12

Fr
(39.52 42.52 262 ) 3(18)(3 1) 8.58
183(3 1)

Este valor es significativo, con P entre 0.02 y 0.01, con 3-1=2 gl


Hay 52 empates de tamao 1 y uno ( bloque 15) de tamao
2., por tanto:
b

gi

ti. j 1 1 1 ... 1 8 1 ... 1 60


3

i 1 j 1

Fr

12 R j 3b 2 k (k 1) 2
2

j 1

b gi

bk ti. j 3

i 1 j 1

bk (k 1)
k 1

8.70

Este valor tambin es significativo, con P entre 0.02 y 0.01,


con 3-1=2 gl

Das könnte Ihnen auch gefallen