Sie sind auf Seite 1von 17

Prueba de suma de rangos de Mann Whitney

Detectar diferencias entre dos poblaciones sobre la base de


sendas muestras seleccionadas de cada poblacin
Detectar diferencias entre dos muestras provenientes de la
misma poblacin a las que se somete a tratamientos distintos.
Ho: F(x) = F(y) las dos muestras fueron extradas de
la misma poblacin o de poblaciones idnticas
(las diferencias no son significativas)
H1: F(x) F(y) =
2
2 2
2 1 2
1
1 1
2 1 1
2
) 1 (
,
2
) 1 (
R
n n
n n U
R
n n
n n U

+
+ =

+
+ =
Estadstico de Mann Whitney
donde:
n
1
es el tamao de la muestra de la primera poblacin
n
2
es el tamao de la muestra de la segunda poblacin,
R
1
es la suma de rangos de la primera muestra y
R
2
es la suma de rangos de la segunda muestra.
U es un estadstico de rango definido para valores enteros y simtricos con
respecto a su media.
|
.
|

\
|
+ +
~
12
1 (
,
2
2 1 2 1 2 1
n n n n n n
N U
Cuando n>10
1. Asignar rangos a las n observaciones provenientes de las n
1
mediciones
de la primera muestra y de las n
2
mediciones de la segunda muestra.
Se le asigna rango 1 a la mas pequea y 2 a la siguiente y as
sucesivamente. En caso de tener observaciones iguales se le asigna el
promedio aritmtico resultante de las iguales.
2. Sumar los rangos de que corresponden a la muestra 1 y a la muestra 2
3. Como la suma de los n primeros enteros consecutivos es puede
verificar sumando R
1
+ R
2
4. Calcular el estadstico U, dado las razones de simetra es indistinto
calcular U
1
o U
2
Calculando Z
U1
y

Z
U2

5. Delimitar la regin critica. Si la hiptesis nula es cierta, valores
extremos de U (segn corresponda) indican diferencias significativas
6. Fijar la regla de decisin
Proceso de calculo
Test r
s
de Sperman
El coeficiente de correlacin de rangos de Sperman es una medida del grado
de asociacin entre dos variables ordenadas. La informacin a analizar
consiste en una muestra aleatoria de n pares de observaciones relacionadas
(x
1;
y
1
); (x
2;
y
2
); (x
3;
y
3
); ....... ; (x
n;
y
n
), siendo el estadstico de prueba:
|
|
.
|

\
|

=
1
1
, 0
) 1 (
6
1
2
1
2
n
N
n n
d
r
n
i
i
s
Ho: = 0 o sea no existe asociacin entre las variables
H1: <> 0 o sea existe relacin entre las variables
n es el numero de observaciones relacionadas y
d
i
la diferencia entre los rangos de pares relacionados.-
n o = 0.05 n o = 0.05
5 0.900 10 0.636
6 0.828 11 0.609
7 0.745 12 0.580
8 0.714 13 0.555
9 0.683 14 0.534
Tabla para el coeficiente de Sperman

Otra buena aproximacin
es usando la distribucin t
de Student de la siguiente
forma:

2
2
,
1
2
s
s
n
r
n r
t

=
o
Comparacin tabla de Kendall con t de Student
n
Valor limite
de r
s
segn
tabla con o =
0,05
Valor de t
equivalente
al r
s
limite
P(t) a dos colas
10
0,636
2,331 0,042
11
0,608
2,297 0,042
12
0,580
2,252 0,044
13
0,555
2,213 0,045
14
0,534
2,188 0,046
15
0,518
2,183 0,045
16
0,500
2,160 0,046
17
0,485
2,148 0,046
t t t
X Y c | o + + =

n
t
t t
Y Y
1
2
)

(
Mnimo
( ) | |

=
+
n
t
t t
X Y
1
2
| o
(

|
.
|

\
|
|
.
|

\
|
=
c
c
(

|
.
|

\
|
=
c
c


= = =
= =
n
t
t
n
t
t
n
t
t
n
t
t
n
t
t
X X n Y
f
X n Y
f
1 1 1
1 1
2
) 1 ( 2
| o
|
| o
o
Funcin a minimizar
Ecuaciones
Normales


= = =
= =
= +
= +
n
t
t t
n
t
t
n
t
t
n
t
n
t
t t
X Y X X
Y X n
1 1
2
1
1 1
| o
| o
t t
n
t
t
n
t
t
n
t
t
n
t
t
n
t
t t
n
t
t
n
t
t
n
t
t
n
t
t
n
t
t
n
t
n
t
t
n
t
t t t
X Y
X X X n
X X Y X Y
X X X n
X Y Y X n
| o
o
|
=

=




= =
= = = =
= =
= =
1 1 1 ?
2
1 1 1 1
1 1 1 ?
2
1 1 01
Sistema de
ecuaciones
regresin simple
Calculo de cada
uno de los
coeficientes
usando
determinantes
( ) X
YX
2
) (
o
o
| =
El calculo de
beta o de la
pendiente

= =
=
n
t
n
t
t t
Y Y
1 1
2 2
)

( c
) (
1
2
1
2
2
Y n
R
n
t
t
o
c

=
=
1

1
2

=

=
k n
n
t
t
c
o
1
) (
1
) (
1
2
2
1 1
2
1
2
2
1
2
2
1 1
2
2

(

=

(


=
= =
=
=
= =
k n
X X n
X
k n
X X n
n
n
t
t
n
t
t
n
t
t
n
t
t
n
t
t
n
t
t
n
t
t
c
o o
c
| o
c | o | o | o |
c o o o o o o o
c c
c c
= + s s
= + s s


1 )] (

) (

[
1 )] (

) (

[
2 / , 1 2 / , 1
2 / , 1 2 / , 1
k n k n
k n k n
t t P
t t P
Los errores estn incorrelacionados con la variable explicativa o sea
c,X
= 0

Los errores estn incorrelacionados con la variable dependiente o sea
c,Y
= 0

Los errores estn incorrelacionados entre s o sea
1
=
2
=
3
= . . . =
k
= 0.
siendo cada uno de los valores de
k
el coeficiente de Autocorrelacin del
retardo k. Se recomienda para este punto leer la parte correspondiente a la
funcin de autocorrelacin y autocorrelacin parcial de este apunte. Se dice
que si la serie c
t
esta incorrelacionada se esta frente a un proceso aleatorio,
que se lo conoce como ruido blanco, y en consecuencia es un proceso
impredecible

Los errores tienen distribucin N(0,o)

Los errores son estables para todos los valores de t analizados, por lo tanto la
dispersin de la serie de los t datos analizados, o
t,
es igual a la dispersin de la
serie con t-1 datos analizados, o
t-1.
Si este proceso se cumple se dice que el
modelo es homocedastico, por lo tanto la dispersion no esta agrupada en
clusters. En el caso contrario el modelo seria heterocedstico, y habra que
quitarle la heterocedasticidad para volverlo homocedastico
95 . 0 ) 96 . 1

96 . 1

( = + s s
k k
k k k
P

o o
n
x x
n
t
t t
x
x
x
x

=

= =
1
,
,
,
) ( ) (
;
c c
o
o o
o

c
c
c
c
|
.
|

\
|
~
n
N
k
1
, 0
(
(
(
(

=
) 1 (
6
1
2
1
2
n n
d
r
n
i
i
s
2
1
2
s
s
r
n r
t

=
Hay que recordar que d
i
es la diferencia de
rangos asignados a las series | c
i
| y X
i
y el
rango es el orden que le corresponde al i
esimo valor de la serie. La significacin del
coeficiente r
s
estar dada por el valor de t
Student con n grados de libertad para un
nivel de confianza dado.
Si el valor de t excede los valores de una t
Student con n grados de libertad, para cierta
probabilidad, entonces la hiptesis de
heterocedasticidad es aceptada, en caso
contrario esta es rechazada.
Ho : Hay homocedasticidad (no hay relacin)
H1 : Hay heterocedasticidad (hay relacin)

Das könnte Ihnen auch gefallen