Sie sind auf Seite 1von 42

ESTADSTICA

APLICADA

DISTRIBUCIN NO
PARAMTRICA
Las pruebas paramtricas requieren supuestos acerca de la
naturaleza o forma de las poblaciones involucradas. Las pruebas no
paramtricas no requieren estos supuestos. Consecuentemente, las
pruebas no paramtricas de hiptesis son frecuentemente llamadas
pruebas de libre distribucin.

DISTRIBUCIN NO PARAMTRICA

UNIVERSIDAD NACIONAL JOSE FAUSTINO SANCHEZ CARRION

AO DE LA CONSOLIDACIN DEL MAR GRAU

FACULTAD

: INGENIERA QUMICA Y METALRGICA

ESCUELA

: INGENIERA QUMICA

DOCENTE

: MUOZ VILELA, Julio

CURSO

: ESTADSTICA APLICADA

TRABAJO

: DISTRIBUCIN NO PARAMTRICA

CICLO

:V

SEMESTRE

: 2016-I

ALUMNOS

:
*
*
*
*
*

ANICETO AGUACONDO, Grecia Danae


AYALA HUAYNATTE, Sofa Mercedes
CHERO RAMIREZ, Fiorella Dannet
GARCIA DE LOS SANTOS, Freddy Ermel
GONZALO ASCENCIO, Ruth Vanessy

DISTRIBUCIN NO PARAMTRICA

DEDICATORIA

El trabajo monogrfico est dedicado a


nuestros compaeros de clases para que
conozcan a cerca de la distribucin
paramtrica; y al profesor quien nos estima
buenas enseanzas y aprendizajes.

INTRODUCCIN

DISTRIBUCIN NO PARAMTRICA

Las pruebas paramtricas requieren supuestos acerca de la naturaleza o forma de las


poblaciones involucradas. Las pruebas no paramtricas no requieren estos supuestos.
Consecuentemente, las pruebas no paramtricas de hiptesis son frecuentemente
llamadas pruebas de libre distribucin.
Aunque el trmino no paramtrico sugiere que la prueba no est basada en un
parmetro, hay algunas pruebas no paramtricas que dependen de un parmetro tal
como la media. Las pruebas no paramtricas, sin embargo, no requieren una
distribucin particular, de manera que algunas veces son referidas como pruebas de libre
distribucin. Aunque libre distribucin es una descripcin ms exacta, el trmino no
paramtrico es ms comnmente usado. Las siguientes son las mayores ventajas y
desventajas de los mtodos no paramtricos.
Uno de los problemas ms difciles para el principiante y para el investigador
experimentado, es decidir cul de las pruebas estadsticas es la ms adecuada para
analizar un conjunto de datos. La aplicacin de la estadstica en el anlisis de datos es
muy amplia y las reas en las que se aplica son diversas, desde las ciencias exactas hasta
las ciencias sociales. La seleccin de la prueba estadstica necesaria para el caso,
depende de varios factores, en primer lugar se debe saber cul es la escala con la que se
estn midiendo los datos que se analizarn, pues no se puede aplicar la misma prueba
estadstica para el caso en que la variable de inters sea el peso de un producto que
cuando lo es la profesin del usuario de un producto, es por esto que la primera parte de
este artculo se dedicar a las diferentes escalas con las que se pueden medir los datos
que se manejan.

CONTENIDO
DEDICATORIA.................................................................................................. 2
INTRODUCCIN............................................................................................... 3
UN POCO DE HISTORIA..................................................................................... 5
3

DISTRIBUCIN NO PARAMTRICA
DEFINICIN..................................................................................................... 6
VENTAJAS................................................................................................... 6
DESVENTAJAS............................................................................................. 6
ANALISIS DE VARIANZA DE UNA CLASIFICACION POR RANGOS DE KRUSKALWALLIS........................................................................................................... 7
FUNDAMENTO Y MTODO...........................................................................7
EJEMPLO 1: PARA MUESTRAS PEQUEAS....................................................8
EL CASO DE k MUESTRAS INDEPENDIENTES..............................................10
EJEMPLO 2: PARA MUESTRAS GRANDES....................................................10
POTENCIA EFICIENCIA........................................................................... 13
LA PRUEBA DE RANGOS SEALADOS Y PARES IGUALADOS DE WILCOXON.......16
FUNDAMENTO Y MTODO.........................................................................16
EJEMPLO 1: PARA MUESTRAS PEQUEAS..................................................17
EJEMPLO 2: PARA MUESTRAS GRANDES....................................................20
RESUMEN DEL PROCEDIMIENTO...............................................................21
POTENCIA EFICIENCIA........................................................................... 23
EL USO DE LAS PRUEBAS ESTADISTICAS EN INVESTIGACIN...........................24
LA HIPTESIS DE NULIDAD.......................................................................24
LA ELECCION DE LA PRUEBA ESTADSTICA..............................................25
NIVEL DE SIGNIFICAIN Y EL TAMAO DE LA MUESTRA..........................25
LA DISTRIBUCION MUESTRAL...................................................................28
LA REGION DE RECHAZO..........................................................................30
LA DECISION............................................................................................. 31
EJEMPLO 1:.............................................................................................. 31
CONCLUSIONES............................................................................................. 34
BIBLIOGRAFIA............................................................................................... 34

UN POCO DE HISTORIA
Uno de los trabajos ms antiguos conocidos en estadstica no paramtrica data en el ao
1710 y fue realizado por Arbuthnot. En l se utiliza la prueba del signo para examinar
4

DISTRIBUCIN NO PARAMTRICA

las proporciones de nacimientos de hombres y mujeres como prueba de la sabidura de


la providencia divina.
Sin embargo los primeros desarrollos de los mtodos no paramtricos se produjeron a
partir de los aos 30 con los trabajos de Hottelling y Papst (1936), Friedman (1937(,
Kendall (1938). Un desarrollo sistemtico de la teora se inici con los trabajos de
Wilcoxon (1945) y Mann y Whitney (1947), en los que descubrieron el sorprendente
resultado de que las pruebas de rangos pierden muy poca eficiencia cuando se compara
con la prueba t bajo el modelo de distribucin normal, y pueden ser mucho ms
eficiente que esta para modelos de distribuciones con colas alargadas .
En la dcada de los 60 Hodges y Lehamann obtuvieron tambin estimaciones puntuales
y por intervalo de parmetros de localizacin, basadas en estadsticas de rangos,
mostrando adems que estos mtodos de estimacin heredan varias propiedades de las
estadsticas de prueba de que los generaron.
Tambin en esta dcada, Hjek desarrollo una poderosa teora para obtener las
distribuciones asintticas de las estadsticas de rango, que permiti la construccin de
estadsticas de prueba ms generales basadas en rangos.
Las pruebas de rangos para el anlisis de diseos de experimentos fueron introducidas
tambin por Hodges y Lehmann a principios de los aos 60 y posteriormente
desarrolladas por Puri y Sen. Las pruebas de rangos y los mtodos de estimacin para
modelos de regresin simple fueron estudiados por Adichie (1967), y para el modelo
lineal general, por Aichie (1978). La mayor parte de la teora de distribuciones
asintticas requerida para el modelo lineal se debe al trabajo de Jureckova (1969). Con
sus resultados es posible desarrollar versiones unificadas basadas en rangos para el
anlisis de conjuntos de datos ms complejos cuya aplicacin, hoy en dia, puede ser
implementada en computador a travs de paquetes especiales para esto es programado
directamente los procedimientos.
Debido a que lo mtodos estadstico no paramtricos son relativamente nuevos, muchos
de ellos son todava desconocidos entre los investigadores de las diferentes reas. Este
curso tiene como objetivo dar a conocer algunos de los mtodos no paramtricos ms
importantes y proporcionar un entrenamiento bsico para las aplicaciones.

DEFINICIN
Una distribucin no paramtrica est basada en un modelo que especifica solo
condiciones muy generales y ninguna a cerca de la forma especfica de la distribucin
de la cual fue obtenida la muestra. Ciertas suposiciones estn asociadas con la mayora
de las distribuciones no paramtricas, a saber: que las observaciones son independientes
5

DISTRIBUCIN NO PARAMTRICA

y quiz que l variable en estudio es continua; pero estas suposiciones son menores y
ms dbiles que aquellas asociadas con la distribucin paramtrica.
La estadstica no paramtrica es una rama de la estadstica que estudia las pruebas y
modelos estadsticos cuya distribucin subyacente no se ajusta a los llamados criterios
paramtricos. Su distribucin no puede ser definida a priori, pues son los datos
observados los que la determinan. La utilizacin de estos mtodos se hace
recomendable cuando no se puede asumir que los datos se ajusten a una distribucin
conocida, cuando el nivel de medida empleado no sea, como mnimo, de intervalo.
La distribucin no paramtrica prueban diferentes hiptesis a cerca de la poblacin, que
la distribucin paramtrica no lo hace. Por ultimo a diferencia de las paramtricas,
existen no paramtricas que puedan aplicarse apropiadamente a datos medidos en una
escala ordinal, y otras pruebas para datos a escala nominal o categrica.

VENTAJAS
1. Si el tamao de la muestra es muy pequeo, puede no haber otra opcin que usar
una distribucin no paramtrica, a menos que la naturaleza de la distribucin de
la poblacin se conozca con exactitud.
2. Tpicamente hacen menos suposiciones a cerca de los datos y pueden ser ms
relevantes a una situacin particular. Adems las hiptesis probadas por una
distribucin no paramtrica pueden ser ms adecuadas para la investigacin.
3. Las distribuciones no paramtricas estn disponibles para tratar datos que son
simplemente clasificatorios, es decir, que son medidos en una escala nominal.
4. Pueden frecuentemente ser aplicados a datos no numricos, tal como el gnero
de los que contestan una encuesta.
5. Existen distribuciones no paramtricas que son adecuadas para tratar muestras
obtenidas de observaciones de diferentes poblaciones.
6. Son ms fciles de aprender y aplicar. Adems, su interpretacin suele ser ms
directa.

DESVENTAJAS
1. Los mtodos no paramtricos tienden a perder informacin porque datos
numricos exactos son frecuentemente reducidos a una forma cualitativa.
2. Una de las objeciones es que no son sistemticas.
3. No tiene una distribucin fija para este tipo de estadstica, por lo que en
ocasiones puede ser un problema el elegir la adecuada.
4. En varios casos se requieren transformar los datos en rangos, perdiendo la
informacin puntual.

ANALISIS DE VARIANZA DE UNA CLASIFICACION POR


RANGOS DE KRUSKAL-WALLIS
El anlisis de varianza de una clasificacin por rangos de kruskal-Wallis es una prueba
extremadamente til para decidir si k muestras independientes son de poblaciones
diferentes. Los valores de las muestras, casi invariablemente, difieren un poco y la
6

DISTRIBUCIN NO PARAMTRICA

cuestin radica en que las diferencias entre las muestras signifiquen diferencias
genuinas de poblacin o simples variaciones aleatorias, semejantes a las esperadas entre
distintas muestras aleatorias de la misma poblacin. La tcnica de kruskal-Wallis
examina la hiptesis de nulidad que supone que las k muestras proceden de la misma
poblacin o de poblaciones idnticas con respecto a los promedios. La prueba supone
que la variable en estudio tiene como base una distribucin continua. Requiere por lo
menos, una medida ordinal de la variable.

FUNDAMENTO Y MTODO
Al calcular la prueba de kruskal-Wallis, cada una de las N observaciones es
reemplazada por rangos. Esto es, todos los puntajes de las k muestras combinadas se
ordenan en una sola serie. El puntaje ms pequeo es reemplazado por el rango 1, el
siguiente en tamao por el rango 2 y el siguiente por el rango N. N es el nmero total de
observaciones independientes en las k muestras.
Cuando se ha hecho esto, se encuentra la suma de los rangos de cada muestra. La
prueba de kruskal-Wallis, determina si la desigualdad entre las sumas de rangos es tan
grande que probablemente no procedan de muestras tomadas de la misma poblacin.
Puede demostrarse que si las k muestras efectivamente proceden de la misma poblacin
o de poblaciones idnticas, es decir, si H 0 es verdadera, H est distribuida como chi
cuadrada

gl=k 1 , siempre que los tamaos de las diferentes k muestras no

con

sean demasiado pequeas. Esto es,


k

12
Rj 2
H=
3( N +1) ..( 1)

N (N +1) j=1 nj
Donde:
k= nmero de muestras

nj =nmero de casos en la muestra de orden j


N=

nj

, el nmero de casos de todas las muestras combinadas

Rj=suma de rangos en la muestra de orden j


1

j=1

Indica sumar las k muestras

Est distribuida aproximadamente como chi cuadrado

gl=k 1 , para tamaos muestrales (

nj ) suficientemente grandes.
Cuando hay ms de 5 casos en los diversos grupos, esto es,
con la ocurrencia conforme, a

H0

nj>5 , la probabilidad asociada

de valores tan grandes como el de una H observada,


7

DISTRIBUCIN NO PARAMTRICA
puede determinarse en la tabla del apndice. Si el valor observado de H es igual o mayor que el
valor de chi cuadrado dado en la tabla O en el nivel de significacin fijado previamente y

para el valor observado de

gl=k 1 ,

H0

puede rechazarse en ese nivel de

significacin.
Cuando k=3 y el nmero de casos en cada una de las 3 muestras es 5 o menos, la
aproximacin de chi cuadrada a la distribucin muestral de H no es suficientemente
cercana. Para tales casos se han tabulado probabilidades exactas a partir de la frmula
(1), que aparecen en la tabla O. La primera columna de esta tabla contiene el nmero de
casos de las 3 muestras, varios valores posibles de n1 , n2 , n3 . La segunda contiene
diferentes valores de H, calculados con la frmula (1). La tercera contiene las
probabilidades asociadas con la ocurrencia conforme a H 0 de valores tan grandes
como el de una H observada. Por ejemplo, si

H 5.8333

cuando las 3 muestras

contienen 4,3 y 1 casos, la tabla O seala que la hiptesis de nulidad puede rechazarse al
nivel de significacin 0.021.

EJEMPLO 1: PARA MUESTRAS PEQUEAS.


Supongamos que un investigador educativo desea probar la hiptesis que supone que los
administradores escolares son caractersticamente ms autoritarios que los maestros de
clase. Sin embargo, sus datos para probar esta hiptesis pueden estar contaminado
debido a que muchos maestros se orientan hacia la administracin en sus aspiraciones
profesionales. Es decir, muchos profesores toman a los administradores como un grupo
de referencia. Para evitar la contaminacin, el investigador decide dividir sus 14 sujetos
en 3 grupos: profesores orientados hacia la enseanza; profesores orientados a la
2
administracin y administradores. Aplica la escala F (una medida de autoritarismo)
a cada uno de los 14 sujetos. Su hiptesis supone que los 3 grupos diferirn con
respecto a los promedios en la escala F.
1. Hiptesis de nulidad.

H 0 : no hay diferencia entre los promedios de puntaje F

de los profesores orientados a la enseanza, los profesores orientados a la


administracin y los administradores. H 1 : los 3 grupos de educadores no
tienen el mismo promedio de puntajes

F2

2. Prueba estadstica: como son 3 los grupos independientes en estudio, se


requiere una prueba para k muestras independientes. Puesto que los puntajes de
la escala F pueden considerarse que representan al menos una medida ordinal del
autoritarismo, se escoge la prueba de Kruskal-Wallis.
3. Nivel de significacin: sean =0.05 ; N=14, el nmero total de educadores
estudiados;

n1=5 , el nmero de profesores orientados a la enseanza;

n2=5 , el nmero de profesores orientados a la administracin, y

n3=4 , el

nmero de administradores.
8

DISTRIBUCIN NO PARAMTRICA

4. Distribucin maestral: para k=3 y valores pequeos de

n j , de la tabla O

seala la probabilidad asociada con la ocurrencia conforme a

H0

de valores

tan grandes como el de una H observada.


5. Regin de rechazo: la regin del rechazo consiste en todos los valores de H tan
grandes que la probabilidad asociada con su ocurrencia conforme a H 0 es
igual a o menor que

=0.05 .

Tabla 1. Puntajes de autoritarismo de tres grupos de educadores (Datos ficticios)


Profesores orientados a la
enseanza
96
128

Profesores orientados a la
administracin
82
124

Administradores

83
61
101

132
135
109

166
147

115
149

1. Decisin: para este estudio ficticio, los puntajes F para los diversos educadores
se muestran en la tabla 1. Si ordenamos estos 14 puntajes F del ms bajo al ms
alto, obtenemos los rangos mostrados en la tabla 2. Estos rangos se han sumado
para los tres grupos, obtenindose R1=22, R2=37, R3=46 , como se muestra
en la tabla 2.
Tabla 2. Rangos de autoritarismo de tres grupos de educadores
(Datos ficticios)
Profesores orientados a la
enseanza
4
9
3
1
5

Profesores orientados a la
administracin
2
8
10
11
6

Administradores

R1=22

R2=37

R3=46

7
13
14
12

Ahora con estos datos podemos calcular el valor de H con la formula (1):
k

H=

12
Rj 2
3( N +1)(1)
N (N +1) j=1 nj

DISTRIBUCIN NO PARAMTRICA

H=

(22) (37) (46)


12
+
+
3 ( 14+1 )=6.4
14(14 +1) 5
5
4

La referencia de la tabla O seala que cuando las n j son 5,5 y 4,


probabilidad de ocurrencia bajo la hiptesis de nulidad de
esta probabilidad es menor que
H0

rechazar

y aceptar

H 6.4

tiene una

p<0.049 . En vista de que

=0.05 , nuestra decisin en este estudio ficticio es

H 1 . Concluimos que los tres grupos de educadores

especificados difieren en grado de autoritarismo.


Observaciones ligadas. Cuando ocurren ligas entre dos o ms puntajes, a cada puntaje
se le da la media de los rangos con los que est ligado.
Ya que el valor de H es influido en cierto grado por las ligas, es deseable corregir al
calcular H. para corregir el efecto de las ligas, H es calculada con la formula (1) y
dividida por
1

T
N 3N

. (2)

Donde:
T =t 3 t

(Cuando t es el nmero de observaciones ligadas en un grupo de puntajes

ligados).
N= Nmero de observaciones en las k muestras juntas, esto es,

N= n j

Indica sumar en todos los grupos de ligas.

As, una expresin general para H, corrigiendo el efecto de las ligas, es:
k

12
Rj2
3 ( N +1 )

N ( N +1 ) j=1 nj
H=
..(3)
T

1 3
N N
La correccin del efecto de las ligas resulta en un incremento del valor e H y de este
modo el resultado es an ms significativo de lo que habra sido sin la correccin. Por
consiguiente, si se puede rechazar H 0 sin la correccin [es decir, con la frmula (1)
al calcular H], se podr rechazar

H0

en un nivel de significacin ms severo por

medio de la correccin.

EL CASO DE k MUESTRAS INDEPENDIENTES


En la mayora de los casos, el efecto de la correccin es insignificante. Si no hay ms de
un 25% de observaciones ligadas, la probabilidad asociada con una H calculada sin la
10

DISTRIBUCIN NO PARAMTRICA

correccin, es decir, mediante la frmula (1), rara vez cambia en ms de 10% cuando se
corrige el efecto de las ligas, esto es, si H es calculada con la formula (3), de acuerdo
con Kruskal-Wallis.
En el siguiente ejemplo, H es calculada en primer lugar con la formula (1) y despus
corregida debido a las ligas. Ntese que aun cuando hay 13 grupos de ligas que implican
a 47 de las 56 observaciones, el cambio de H que resulta al aplicar la correccin es
solamente de H=18.464 a H=18.566.
Como suele suceder, la magnitud del factor de correccin depende de la longitud de las
ligas, es decir, de los valores de t, as como del porcentaje de las observaciones
implicadas.

EJEMPLO 2: PARA MUESTRAS GRANDES


Un investigador anoto los pesos que tenan al nacer los miembros de ocho camadas
diferentes de cerdos, para determinar si el peso al nacer es afectado por el tamao de la
camada.
1. Hiptesis de nulidad. H 0

: no hay diferencia en los pesos de nacimiento

promedio de cerdos de diferentes tamaos de camada.


H 1 : Los pesos de nacimiento promedio de cerdos de diferentes tamaos de
camada no son todos iguales.
2. Prueba estadstica: puesto que las ocho camadas son independientes, es
apropiada una prueba estadstica para k muestras independientes. Aunque la
medida de peso en libras est en una escala de proporcin, escogemos el anlisis
de varianza de una clasificacin no paramtrica en vez de la prueba paramtrica
equivalente a fin de evitar hacer las suposiciones concernientes a la normalidad
y homogeneidad de la varianza asociadas con la prueba paramtrica F e
incrementar la generalidad de nuestros hallazgos.
3. Nivel de significacin: sean =0.05 y N=56 , el nmero total de cerdos
recin nacidos en estudio.
4. Distribucin muestral: calculada con la formula (1), H est distribuida
aproximadamente como chi cuadrada con gl=k 1 . As la probabilidad
asociada con la ocurrencia conforme a

H 0 de valores tan grandes como el de

una H observada puede determinarse consultando la tabla C.


5. Regin de rechazo: esta regin consiste en todo los valores de H tan grandes que
H0
la probabilidad asociada con la ocurrencia conforme a
para
gl=k 1=7

es igual a o menor que =0.05 .

Tabla 3. Pesos en libras al nacer, de ocho camadas de cerdos Poland China,


primavera 1919
Camadas
1

11

DISTRIBUCIN NO PARAMTRICA
2.0
2.8
3.3
3.2
4.4
3.6
1.9
3.3
2.8
1.1

3.5
2.8
3.2
3.5
2.3
2.4
2.0
1.6

3.3
3.6
2.6
3.1
3.2
3.3
2.9
3.4
3.2
3.2

3.2
3.3
3.2
2.9
3.3
2.5
2.6
2.8

2.6
2.6
2.9
2.0
2.0
2.1

3.1
2.9
3.1
2.5

2.6
2.2
2.2
2.5
1.2
1.2

2.5
2.4
3.0
1.5

1. Decisin: los pesos de nacimiento de los 56 cerdos pertenecientes a las 8


camadas se dan en la tabla 3. Si ordenamos estos 56 pesos, obtenemos los rangos
que aparecen en la tabla 4. Ntese que hemos ordenado a los 56 puntajes en una
sola serie lo requiere esta prueba.
Tabla 4. Rangos de pesos de nacimiento de ocho camadas de cerdos
Camadas
1
8.5
27.5
47.5
41.0
56.0
54.5
6.0
47.5
27.5
1.0

2
52.5
27.5
41.0
52.5
14.0
15.5
8.5
5.0

3
47.5
54.5
23.0
36.0
41.0
47.5
31.5
51.0
41.0
41.0

4
41.0
47.5
41.0
31.5
47.5
18.5
23.0
27.5

5
23.0
23.0
31.5
8.5
8.5
11.0

6
36.0
31.5
36.0
18.5

7
23.0
12.5
12.5
18.5
2.5
2.5

8
18.5
15.5
34.0
4.0

R1=

R2=

R3=

R4 =

R5=

R6=

R7=

R8=

317.0

216.5

414.0

277.5

105.5

122.0

71.5

72.0

El ms pequeo de los cerdos, el ltimo miembro de la camada 1, peso 1,1 libras y se


dio el rango de 1. El cerdito ms gordo, tambin de la camada 1, peso 4,4 libras; este
peso obtuvo el rango 56. Tambin en la tabla 4 aparecen las sumas de cada columna de
rangos R j .
Con los datos de la tabla 8.8, podemos calcular el valor de

sin corregir el efecto

de las ligas con la formula (1):


H=

k
Rj
12
3 ( N + 1 ) . (1)

N ( N + 1 ) j =1 n j

H=

( 317 )2 ( 216,5 )2 ( 414 )2 ( 277,5 )2 ( 105,5 )2 ( 122 )2 ( 71,5 )2 ( 72 )2


12
+
+
+
+
+
+
+
3 ( 56+1 )
8
10
8
6
4
6
4
56 ( 56+1 ) 10

12

DISTRIBUCIN NO PARAMTRICA

H=

12
( 10048,9+5859,031+ 17139,6+9625,781+1855,042+ 3721,0+852,042+1296,0 )171
3192
H=18,464

La referencia a la tabla C

indica que una

H 18,464

con

gl=k 1=7
Tiene una probabilidad de ocurrencia conforme a

H 0 de

p<0,02.

Para corregir el efecto de las ligas empezaremos por determinar cuntos grupos ligados
ocurrieron y cuantos puntajes estaban ligados en cada grupo. La primera liga ocurri
entre dos cerdos en la camada 7 (que pesaron 1,2 libras). Ambos se les asigno el rango
de 2,5. Aqu, t el nmero de observaciones ligadas, 2 . Para este suceso,
T =t 3 t=82=6
La siguiente liga ocurri entre cuatro cerdos a los que se asign el rango ligado 8,5.
3
Aqu, t=4 y T =t t=644=60 .
Prosiguiendo de esta manera a travs de los datos de la tabla 4, encontraremos que
ocurrieron 13 grupos ligados. Al contar el nmero de observaciones en cada grupo
ligado, se determinan los diferentes valores de t , y calculamos el valor de
T =t 3 t

en cada caso. Nuestro conteo arrojara los resultados siguientes:

60

60

120

60

60

24

336

210

Obsrvese que para cualquier valor particular de t, el valor de T es una constante.


Ahora, usando la formula (2), podemos computar la correccin total por ligas:
1

T
N 3N

(2)

( 6+60+6+ 6+60+120+ 60+ 60+24+ 336+210+6+6 )


=0,9945
( 56 )356

Este valor viene a ser el denominador de la formula (3), y el valor que ya hemos
calculado con la formula (1) es el numerador.
13

DISTRIBUCIN NO PARAMTRICA

De este modo, necesitamos solamente hacer una operacin adicional para obtener el
valor de H , corregido el efecto de las ligas:
k
Rj
12
3 ( N +1 )

N ( N +1 ) j=1 n j
H=
.(3)
T

1 3
N N
2

H=

18,464
=18,566
0,9945
C

La tabla

valor tan grande como

H=18,566 ,

gl=7 , es

p<0,01 . Ya que esta probabilidad es

menor que el nivel de significacin previamente fijado,


rechazar

H 0 de un

muestra que la probabilidad asociada con la ocurrencia conforme a

H0.

=0,05 , nuestra decisin es

Concluimos que el peso del nacimiento de los cerdos varan

significativamente de acuerdo con el tamao de la camada.


Resumen del procedimiento. Los pasos para usar el anlisis de varianza de una clasificacin
por rangos de Kruskal Wallis son los siguientes:

1. Se ordenan todas las observaciones de los

grupos en una sola serie, asignando

N .

rangos de 1 a

2. Se determina el valor de

(la suma de los rangos) para cada uno de los

grupos de rangos.
3. Si una gran proporcin de las observaciones estn ligadas, se calcula el valor
la formula (3). de otra manera, se usa la formula (1).
4. El mtodo para determinar la significacin del valor observado de
tamao de
a) Si

k =3

k
con

depende del

y del tamao de los grupos:


y si

n1 , n2 , n3 , 5 , la tabla

probabilidad asociada conforme a

H0

puede usarse para determinar la

de una

tan grande como la

observada.
b) En los otros casos, la significacin de un valor tan grande como el valor observado
de

puede determinarse por medio de la tabla

C , con

gl=k 1
5. Si la probabilidad asociada con el valor observado de
nivel de significacin,

, previamente fijado, se rechaza

es igual o menor que el

H 0 y se acepta

H1.
14

DISTRIBUCIN NO PARAMTRICA

POTENCIA EFICIENCIA
Comparada con la prueba paramtrica ms poderosa, la prueba

F ,

En las condiciones donde las suposiciones asociadas con el mtodo estadstico de la prueba

son satisfechas, la prueba de Kruskal Wallis tiene una eficiencia asinttica de

3
=95,5 por ciento.

La prueba de Kruskal Wallis es ms eficiente que la extensin de la prueba de la mediana,


pues utiliza ms la informacin de las observaciones al convertir los puntajes en rangos en lugar
de simplemente dicotomizarlos por encima y por debajo de la mediana.

15

Tamao
Tamao
de
H
p
HH
pp
O . deTabla de H
de muestras
probabilidades Tamao
asociadas
con valores tan grandes como
muestras
muestras

TABLA

nn1

nn2

nn3

nn1

nn2

nn3

1
2
3
1
2
3
DISTRIBUCIN
NO PARAMTRICA
2
1
1
2.700
.500
6.444
4
3
2
.008
5
2
2
6.53
.008
5.63
.050
0
4
33
08
6.300
.011
TABLA O .
Tabla de probabilidades
asociadas
con
valores
tan
grandes
como valores
0
6.13 .013
4.54
.099
3.600
5.444
33
87
2
2
.200
.046
H 1en el anlisis
observados
de
de
varianza de una clasificacin por
0
4 rangos de Kruskal
5.16
.034
4.52
.103
5.400
.051
00
31
0
5.04 .056
4.571
4.511
2
2
2
.067
.098
4
1
00
3.714
.200
4.444
.102
4.37 .090
5
4
4
7.76
.009
3
4
33
04
4.29
.122
7.74
.011
3.200
33
40
3
1
1
0
.300
6.745 .049
5.65
4
3
3
.010
5
71
4.285
6.709
6.40 .012
5.61
.050
35
23
11
.100
.013
7
1
00
76
3.857
5.790
.133
.046
4.96
.058
4.61
.100
1
9
5.727
00
87
.050
3
4.87 .052
4.55
.102
5.357
4.709
3
2
2
.029
.092
11
27
2
1
4.01
.095
4.714
4.700
.101
.048
3
0
78
4.500
.067
3.84 .123
5
5
1
7.30 .009
0
00
91
4.464
6.666
.105
4
4
1
.010
6.83
.011
3
7
64
6.166
.022
7
5
3
2
6.90 .009
5.12
.046
5.142
4.966
91
73
3
3
2
.043
.048
9
7
6.82
.010
4.90
.053
4.571
4.866
.100
.054
18
91
4
7
4.000
4.166 .086
5.25 .049
4.10
.129
.082
0
7
09
91
4.066
.102
5.10 .052
4.03
.105
7
55
64
3
3
2
6.250
.011
4.65
.091
0
5.361
7.036
09
.032
4
4
2
.006
1
4
4.49 .101
5
5
2
7.33
.010
5.138
6.872
.061
.011
45
85
9
7
7.26
.010
4.555
5.454
.100
.046
6
92
5
4.250
5.236 .047
5
3
3
7.07 .009
5.33
.121
.052
0
4
88
85
4.554
.098
6.98 .011
5.24
.051
5
18
62
7.200
4.445
.103
3
3
3
.004
0
5
5.64
.049
4.62
.097
6.488
.011
85
31
9
5.51
.051
4.50
.100
5.688
7.143
.029
4
4
3
.010
52
77
9
9
4.53 .097
5.600
7.136
.050
.011
0
4
33
5.066
5.598 .010
4.41 .109
5
5
3
7.57
.086
.049
7
5
21
80
4.622
5.575
.100
.051
7.54
.010
2
8
29
3.571
4.545 .046
5
4
1
6.95
.008
5.70
4
1
1
.200
.099
16
4
5
45
55
4.477
.102
6.84 .011
5.62
.051
3
00
64
4
1
2
4.821
.057
4.98
.044
4.54 .100
4

DISTRIBUCIN NO PARAMTRICA

LA PRUEBA DE RANGOS SEALADOS Y PARES


IGUALADOS DE WILCOXON
La prueba que acabamos de estudiar, la prueba de los signos, utiliza simplemente
informacin acerca de la direccin de las diferencias de las parejas. Si se considera la
magnitud relativa as como la direccin de las diferencias, puede hacerse una prueba
ms poderosa. La de rangos sealados y pares igualados de Wilcoxon hace precisamente
eso: da mayor peso al par que muestra una diferencia grande entre las dos condiciones
que el par que exhibe una diferencia pequea.
La prueba de Wilcoxon es la mayor utilidad para el cientfico conductual. Con datos
conductuales de esta disciplina, no es raro que el investigador pueda:
a) Saber cul de los dos miembros de un par es mayor, es decir, indicar el signo
de la diferencia en cualquier par.
b) Clasificar las diferencia por orden de tamao absoluto. Es decir, puede hacer el
juicio mayor que entre las ejecuciones de cualquier par, y tambin entre los
puntajes de dos diferencias cualesquiera procedentes de dos pares.
Con tal informacin el investigador puede usar la prueba de Wilcoxon.

FUNDAMENTO Y MTODO
Sea

d i el puntaje de diferencia para cualquier par igualado, representando la diferencia entre

los puntajes del par bajo los dos tratamientos. Cada par tiene una
Wilcoxon, se clasifican todas las
pequea

d i . Para usar la prueba de

d i , sin tener en cuenta el signo; asi: del rango de 1 a la ms

d i , el rango 2 a la siguiente menor, etc. Cuando se clasifican puntajes despreciando

el signo, a una

d i de 1 se le da un rango menor que a una d i de 2 o +2 .

En seguida se aade a cada rango el signo de la diferencia, indicando que rangos procedieron de

d i , negativas y de

d i positivas.

Ahora bien, si los tratamientos A y B son equivalente, esto es, si


esperaramos encontrar algunas de las

di

H0

es verdadera,

mayores favoreciendo el tratamiento de A y otras

favoreciendo el de B. Es decir, algunos de los rangos mayores procederan de las


positivas mientras otras procederan de las

di

di

negativas. Si sumamos los rangos que tienen

signo de ms y tambin los que tienen signo menos, las dos sumas deberan ser iguales
conforme a

H 0 . Pero si la suma de los rangos positivos es muy diferente a la de los rangos

negativos, deduciremos que el tratamiento

difiere del B , y de este modo rechazaremos

17

DISTRIBUCIN NO PARAMTRICA

H 0 . En otras palabras, rechazaremos

H0

negativas como la suma de los rangos para las

si tanto la suma de los rangos de las

di

d i positivas son demasiado pequea.

Ligas. Ocasionalmente, los dos puntajes de algn par son iguales y no se observa diferencia
entre los dos tratamientos para ese par, de manera que

d=0 . Tales pares descartados del


N Es el nmero de

anlisis. Es la misma prctica que se sigue con la prueba de los signos.


pares igualados menos el nmero de pares cuya
Pueden ocurrir otra clase de ligas. Dos o ms

es cero.

d pueden ser del mismo tamao. A semejantes

casos ligados asignamos el mismo rango. El rango asignado es el promedio de los rangos que se
habran asignado si las d

hubieran diferido ligeramente. As, tres pares

pueden tener valores de

iguales a 1 , 1 y +1 . A cada pareja se le

1+2+3
=2 . La siguiente
3

asignara el rango 2, pues

reribiria el rango de 4,

porque los rangos 1, 2 y 3 ya se usaron.


Si dos pares hubieran tenido un valor de d
y la siguiente

igual a 1, ambas recibiran el rango de 1.5

mayor recibira el rango de 3. La costumbre de dar a las

observaciones ligadas el promedio de los rangos en lugar de los que realmente pueden
obtener un efecto despreciable sobre T , la estadstica en la que se basa la prueba de
Wilcoxon.
Para la aplicacin de estos principios en el manejo de ligas, vase ms adelante el
ejemplo para muestras grandes.
Muestras pequeas
Sea T

la suma ms pequea de los rangos sealados. Esto es,

es la suma de los

rangos positivos cuando es menor que la suma de los rangos negativos, o viceversa. En
la tabla G del apndice hay diferentes valores de T y sus niveles asociados de
significacin. Es decir, si una

observada es igual o menor que el valor dado en la

tabla G en un nivel particular de significacin para el valor observado de

N , la

hiptesis de nulidad puede rechazarse entonces a ese nivel de significacin.


La tabla G se adapta, tanto a pruebas de una como de dos colas. Puede usarse una
prueba de una cola cuando, despus de examinar los datos, el experimentador predice el
signo de la suma ms pequea de los rangos. Como en el caso de todas las pruebas de
una cola, se debe predecir la direccin de las diferencias.
Por ejemplo, si
rechazar

H0

T =3
al nivel

es la suma de los rangos negativos cuando


=0.02

al afirmar

H1

N=9 , se puede

que los dos grupos difieren,


18

DISTRIBUCIN NO PARAMTRICA

asimismo se rechaza

H0

en el nivel

=0.01

H1

si

afirma que la suma de los

rangos negativos es la suma ms pequea.

EJEMPLO 1: PARA MUESTRAS PEQUEAS


Supongamos que un psiclogo infantil desea comprobar si la asistencia al jardn de nios tiene
algn efecto o capacidad de percepcin social de los nios. Califica la percepcin mediante una
evaluacin de las respuestas de los nios a un grupo de cuadros que representa una diversidad
de situaciones sociales, hacindoles una serie estndar de preguntas acerca de cada cuadro. Con
este artificio, obtiene un puntaje entre 0 y 100 para cada nio.
Aunque el investigador est seguro de que un puntaje ms alto representa una capacidad de
percepcin social mayor, no lo est con respecto a que los puntajes sean suficientemente
exactos para ser tratados numricamente; no cree que un nio cuyo puntaje es 60, sea
doblemente ms perceptivo socialmente que un nio cuyo puntaje es 30 ni que la diferencia
entre los puntajes de 60 y 40 sea de manera exacta doblemente mayor que la de los puntajes de
40 y 30. Sin embargo, est seguro de que la diferencia entre un puntaje de, digamos 60 y uno de
40 es mayor que la de un puntaje de 40 y uno de 30. Es decir, uno puede asegurar la exactitud
numrica de las diferencias, pero sostiene que son suficientemente significativas para calificarse
apropiadamente en orden de tamao absolutos.
Para probar el efecto de la asistencia al jardn de nios con los puntajes de percepcin social de
los nios, consigue 8 pares de gemelos idnticos como sujetos. Al azar, asigna un gemelo de
cada par al jardn de nios por un tiempo. El otro gemelo permanece fuera de la escuela. Al
final del plazo, se da a los 16 nios la prueba de percepcin social.
1.

Hiptesis de nulidad.

H 0 : la capacidad de percepcin social de los nios de

casa y de jardn de nios no difiere. En trminos de la prueba de wilcoxon, la suma


de los rangos positivos es igual a la suma de los rangos negativos.

H 1 : la

2.

capacidad de3 percepcin social de los dos grupos de nios difiere, es decir, la suma
de los rangos positivos no equivale a la suma de los rangos negativos.
Prueba estadstica. La de rangos sealados y pares igualados de Wilcoxon se
escoge como adecuada en un estudio que emplea dos muestras relacionadas y da
puntajes de diferencia que pueden clasificarse en orden de magnitud absoluta.

3.

Nivel de significacin. Sean


pares cuya

4.

6.

el nmero de pares (8), menos los

resulte cero.

Distribucin muestral. La tabla G incluye los valores crticos a partir


distribucin muestral de

5.

=0.05 y

T , para

de la

N 25 .

Regin de rechazo. Puesto que no se predice direccin de la diferencia, es apropiada


una regin de rechazo de dos colas. La regin de rechazo se compone de todos los
valores de

conforme

H 0 es igual o menor que =0.05

tan pequeos que la probabilidad asociada de su ocurrencia ocurre


para una prueba de dos colas.

Decisin. En este estudio ficticio, a los 8 pares de nios de casa y de jardn de


nios se les da la prueba de percepcin social despus de que los ltimos han
estado en la escuela durante cierto tiempo. Sus puntajes aparecen en la tabla 5.6. La
muestra que solamente dos pares de gemelos,

c y g , mostraron diferencias en la
19

DISTRIBUCIN NO PARAMTRICA
direccin de mayor percepcin social con respecto al gemelo de casa. Y estos
puntajes de diferencia son muy pequeos: sus rangos son 1 y 3.
La menor de las sumas de los rangos sealados es

N=8 , una

1+3=4=T . La tabla G muestra que para

=0.05

de 4 nos permite rechazar hiptesis de nulidad en

prueba de dos colas. Por lo tanto, rechazamos

H0

y aceptamos

H1

para una

en este estudio

ficticio, concluyendo que las experiencias del jardn de los nios afectan la capacidad de
percepcin social de nio.
Vale la pena sealar que los datos de la tabla 5 se pueden tratar con la prueba de los signos,
menos poderosa. Para esa prueba,
de su ocurrencia conforme a

H0

x=2 y N =8 . De la tabla D da la probabilidad asociada


:

p=2 ( 0.145 )=0.290

para una prueba de dos colas.

Por lo tanto, con la prueba de los signos, nuestra decisin es aceptar

H0

en

=0.05 ,

mientras la prueba de Wilcoxon.

TABLA 5. Puntajes de capacidad de percepcin social de los nios en el jardn de nios


y en la casa
(Datos artificiales)
Pareja

Puntaje de la
capacidad de
percepcin
social
del
gemelo
asignado
al
jardn de nios
82

Puntaje de la
capacidad de
percepcin
social
del
gemelo
que
permaneci en
su casa
63

69

c
d

Rango de

19

42

27

73

74

-1

-1

43

37

Rango
de
signo menos
frecuente

20

DISTRIBUCIN NO PARAMTRICA

58

51

56

43

13

76

80

-4

-3

65

82

T =4

H0

Sugiere rechazar

en ese nivel. Esta diferencia no es sorprendente, porque la

prueba de Wilcoxon utiliza ms la informacin de los datos. Ntese que la prueba de


Wilcoxon tiene en consideracin el hechos que los 2 d con signo de menos estn
entre las mas pequeas observadas, mientras la prueba de los signos no es afectada por
la magnitud relativa de los valores d 1 .
Muestras grandes. Cuando

es mayor que 25, la tabla G no puede usarse. Sin

embargo, puede mostrarse que en tales casos la suma de los rangos,

T , est

prcticamente distribuida en forma normal, de este modo:


media : T =

N ( N +1 )
4

desviacion estandar : T =

N ( N + 1)(2 N +1)
24

Por lo tanto,

N (N + 1)
T
T T
4
z=
=
..(5)
T
N ( N +1)(2 N + 1)
24

Esta prximamente distribuida en forma normal con media de cero y varianza de uno.
Asi, en la tabla A del apndice encontramos la probabilidad asociada con la ocurrencia
conforme a H 0 de varios valores tan extremos como cierto valor observado de z ,
calculado con la formula (5).
Para observar la excelencia de esta aproximacin, aun con muestras pequeas
trataremos los datos de la tabla 5.6, donde N=8 y por consiguiente, T =4 .
Sustituyendo los valores en la formula (5.5), tenemos:
(8)(9)
4
z=
=1,96
( 8)(9)(17)
24
4

21

DISTRIBUCIN NO PARAMTRICA

H0

La tabla A seala que la probabilidad asociada con la ocurrencia conforme a


un valor de

tan extremo como

prueba de dos colas, la misma

1.96 , es

de

p=2 ( 0.025 )=0.05 , para una

p calculada a usar la tabla G con los mismos datos.

EJEMPLO 2: PARA MUESTRAS GRANDES


Los presidiaros de una prisin federal fueron sujetos de un estudio sobre la toma de
decisiones. En primer lugar, se midi individualmente la utilidad para los prisioneros
(valor subjetivo) de los cigarrillos, que eran negociables dentro de una prisin.
Empleando la funcin utilidad para cada sujeto, el experimentador trato de predecir las
decisiones del individuo en un juego con dos alternativas continuamente susceptibles de
eleccin, en la que se ganaran o se perdieran cigarrillos.
La primera hiptesis examinada supona que predecan mejor las decisiones de los
sujetos por medio de sus funciones de utilidad que cuando se supona que la utilidad de
los cigarrillos era igual a su valor objetivo. Por consiguiente esta ltima hiptesis
predeca la eleccin razonable en funcin del valor objetivo. Esta hiptesis se
confirm.
Sin embargo, como se esperaba, algunas respuestas no fueron predichas por esta
hiptesis de la mxima utilidad esperada. Anticipando este resultado, el investigador
haba formulado la hiptesis de que tales errores en la prediccin serian debido a las
diferencias de los sujetos ante las dos alternativas ofrecidas. En otras palabras, un
prisionero poda considerar ambas alternativas igualmente atractivas o faltas de inters,
y, por lo tanto, le sera indiferente elegir entre ellas. Elecciones as se predicen
difcilmente. Pero el sujeto poda vacilar considerablemente antes de hacer una decisin:
el tiempo de vacilacin entre las propuestas de la jugada y la declaracin de su decisin
sera alto. La segunda hiptesis supona que los tiempos de vacilacin al hacer las
elecciones que no haban sido predichas al llevar a un mximo la utilidad esperada,
seran ms largos que los tiempos de vacilacin de las elecciones predichas.
1.

Hiptesis de nulidad.

H 0 : no hay diferencia entre los tiempos de


H1

vacilacin de las decisiones predichas y las no predichas.

2.

3.

: los

tiempos de vacilacin de las decisiones no predichas son ms largos que los


tiempos de vacilacin de las decisiones predichas.
Prueba estadstica. se tom la prueba de rangos sealados y pares igualados
de Wilcoxon debido a la presencia de puntajes de diferencia de dos muestra
relacionadas (elecciones cuyas predicciones correctas y elecciones cuya
prediccin no lo es, hechas por los mismos prisioneros), donde cada sujeto es
su propio control.
Nivel de significacin. Sea =0.01 y N , el nmero de prisioneros que
sirvieron como sujetos, 30. (este valor de

N se reduce si la

de algn

prisionero es cero.)

22

DISTRIBUCIN NO PARAMTRICA

4.

Distribucin muestral. Conforme a

H 0 , los valores de

z calculado con

la formula (5) estn distribuidos normalmente con media de cero y varianza


de uno. As, la tabla A contiene probabilidad asociada con la ocurrencia
conforme a H 0 de los valores tan extremos como cierto valor obtenido de
z .
Regin de rechazo. Se ha predicho la direccin de la diferencia, por lo tanto,
la regin de rechazo es de una cola. Si la diferencia es de la direccin
predicha, T , la suma menor de los rangos igualados, ser la suma de los

5.

rangos de los presos cuya

tiene una direccin opuesta a la predicha. La

regin de rechazo est formada por todos los valores de


los datos con

(obtenidos de

T ) tan extremos que la probabilidad asociada con su

ocurrencia conforme a
6.

H 0 es igual a o menor que =0.01 .

Decisin. Para cada sujeto se obtuvo un puntaje de diferencia

(d )

sustrayendo la mediana de su tiempo de decisiones predichas de la mediana


de su tiempo de decisiones no predichas. En la tabla 5 estn los valores de
d para los 30 presos y la dems informacin necesaria para calcular la
prueba de Wilcoxon. Una

menos indica una mediana de tiempo de

decisiones predichas mayor que la mediana de tiempo de decisiones no


predichas.
Para los datos de la tabla 5 , T =53.0 , valor de la menor de la suma de los rangos
igualados. Aplicamos la frmula (5):
N (N +1)
4
z=
(5)
N (N +1)(2 N + 1)
24
T

(26)(27)
4
z=
=3.11
(26)(27)( 53)
24
53

Ntese que tenemos

N=26 . Cuatro prisioneros obtuvieron medianas de tiempos

iguales para las decisiones predichas y no predichas y, as, sus


Asimismo, el valor de

es la suma de los rangos de los presos cuya

fueron cero.
d

estn en
23

DISTRIBUCIN NO PARAMTRICA

direccin opuesta a la predicha; por tanto, se procede con una prueba de una cola. La
tabla A muestra que un valor de z tan extremo como 3.11 tiene una
H 0 , de

Probabilidad de una cola asociada con su ocurrencia, conforme a


p=0.0009 . En vista de que
la regin de rechazo, se rechaza

p es menor que =0.01 y el valor de


H 0 y se acepta

esta en

H 1 . Concluimos que los tiempos

de latencia de los prisioneros antes las decisiones no predichas fueron


significativamente ms largos que los tiempos de latencia antes las decisiones predichas.
Esta conclusin apoya la idea de las decisiones no predichas conciernen a las opuestas
iguales, o aproximadamente iguales, en la utilidad esperada por los sujetos.

RESUMEN DEL PROCEDIMIENTO.


Estos son los pasos de la prueba de rangos sealados y pares igualados de Wilcoxon:
1. Para cada par igualado se determina la diferencia de signo
puntajes.
2. Se ordenan estas

d 1 sin respetar el signo. Con las

(d 1)

entre los dos

ligadas, se asignan el

promedio de los rangos ligados.


Tabla 6. Diferencias de las medianas de los tiempos entre las decisiones de los presos, de
acuerdo y en desacuerdo con las predicciones hechas
Preso

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

-2
0
0
1
0
0
4
4
1
1
5
3
5
3
-1
1
-1
5
8
2
2
2
-3
-2

Rango de
-11.5

Rangos con signos


menos frecuentes
11.5

4.5
20.0
20.0
4.5
4.5
23.0
16.5
23.0
16.5
-4.5
4.5
-4.5
23.0
25.5
11.5
11.5
11.5
-16.5
-11.5

4.5
4.5

16.5
11.5
24

DISTRIBUCIN NO PARAMTRICA
25
26
27
28
29
30

1
4
8
2
3
-1

4.5
20.0
25.5
11.5
16.5
-4.5

4.5

T =53.0
3. Se aade a cada rango el signo (+ o -) de la

que representa.

T , la ms pequea suma de los rangos igualados.


5. Se determina N , el numero total de d con un signo.
4. Se determina

6. El procedimiento para determinar la significacin del valor observado de

depende

del lado de N :
a) Si

es 25 o menor, la tabla G contiene los valores crticos de

diferentes tamaos de

N . Si el valor observado de T

para

es igual o menor que el

dado en la tabla, para un nivel de significacin particular y una

particular,

H 0 puede se rechazada en ese nivel de significacin.


b) Si

es mayor que 25, se calcula el valor de

Se determina su probabilidad asociada conforme a


prueba de dos colas se duplica el valor de

, se rechaza

menor que

definido por la formula (5).

H 0 con la tabla A. Para una

p . Si la

obtenida es igual o

H0 .

POTENCIA EFICIENCIA
Cuando las suposiciones de la prueba paramtrica
asinttica cercana a

H0

comparada con la prueba

en verdad se satisfacen, la eficiencia

de la prueba de rangos sealados y pares igualados de Wilcoxon,

es de

3
=95.5 (Mood, 1954). Esto significa que 3/

es

la proporcin lmite de tamaos de muestras necesarias para que las pruebas de Wilcoxon y

alcancen el mismo poder. Para muestras pequeas, la eficiencia se acerca al

95 .

TABLA G: Tabla de valores crticos de T en la prueba de los rangos sealados de pares


igualados de Wilcoxon

25

DISTRIBUCIN NO PARAMTRICA

Nivel de significacin para


prueba de una cola
.025
N

Nivel de significancia para


prueba de dos colas
.05
0
2
4
0
6
2
8
3

6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

.005

.01

11
5
14
7
17
10
21
13
25
16

.02

.01
-

2
3
5
7
10
13
16
20

30
20
35
23
40
28
46
32
52
38

24

59
43
66
49
73
55
81
61
89
68

49

28
33
38
43

56
62
69
77

26

DISTRIBUCIN NO PARAMTRICA

EL USO DE LAS PRUEBAS ESTADISTICAS EN INVESTIGACIN


En las ciencias de la conduca se efectuan investigaciones para determinar en que
medida son aceptables la hipotesis que derivamos de las teorias de la conducta. Despues
de seleccionar cierta hipotesis que parece importante en una teoria determinada, se
recogen los datos empiricos que dan imformacion directa acerca de la aceptabilidad de
esa hiptesis. La decision cerca del significado de los datos puede conducir la
comfirmacin, revisin o rechazo de la hipotesis y con ella, la teoria que la origino.
Para decidir con objetividad si una hiptesis particular es comfirmada por un conjunto
de datos, nescesitamos un procedimiento que nos lleve a un criterio objetivo para
rechazar o aceptar esa hipotesis. Se insite en la objetividad porque el metodo cientifico
requiere que las conclusiones sean alcanzadas por metodos pblicos susceptibles de ser
repetidos por otros investigadores competentes.
Este procedimiento objetivo debe basarse tanto en la informacion obtenida al investigar
como en el margen de riesgo que estemos dispuestos a aceptar si nuestro criterio de
decisin con rspecto a ala hiptesis respecta incorrecto.
El procedimiento que por lo comn, comprende varios pasos, los cuales enunciamos en
el orden de su ejecucin.
1. Formulacin de la hiptesis de nulidad ( H 0 )
2. Eleccion de una prueba estadstica (con su modelo estadistico asociado) para
probar ( H 0 ) . De las pruebas capaces de usarse con un diseo de investigacion
dado, hay que escoger aquella cuyo modelo se aproxima mas a las condiones de
la investigacin (en terminos de los supuestos que califican el uso de la prueba)
y cuyos requisitos de medicin satisfacen las medidas usadas en la investigacin.
3. Especificacin del nivel de significancia ( ) y del tamao de la muestra

(N)
4. Encuentro (o suposicin) de la distribucin muestral de la prueba estadstica
conform ( H 0 ) .
5. Sobre la base de incisos II,III,IV, definicion de la regin de rechazo
6.

Clculo del valor de la prueba estadistica con los datos obtenidos de la ( s )


muestra

( s ) . S i el valor desciende a la regin de rechazo

( H0)

debe

rechazarse al nivel de significacion escogido.


En la mayoria de los casos, se dan uno o ms ejemplos del uso de la prueba en la
investigacin. Cada ejemplo sigue los seis pasos sealados antes. Comprender a a cada
uno de ellos es primordial para entender el papel de la estadistica al probar una
hiptesis de investigacin.

27

DISTRIBUCIN NO PARAMTRICA

LA HIPTESIS DE NULIDAD
El primer paso en el procesimiento de hacer decisiones es enunciar la hipotesis de
nulidad ( H 0 ) . La hipotesis de nulidad es una hiptesis de diferencias nulas. Es
formuladas por lo comn con la intencin expresa de ser rechazada. Si se rechaza,
puede aceptarse entonces la hiptesis alterna ( H 1 ) . La hipoteis alterna es la
aseveracin operacional de la hipotesis de investigacin del experimentador. La
hiptesis de investigacion es la prediccin que se de rivade la teoria que se est
probando. Al hacer una decisin acerca de diferencias, sometemos a prueba a ( H 0 )
frente a ( H 1 ) . ( H 1 ) constituye la firmacin aceptada cuando ( H 0 ) es rechazada.
Supongamos que cierta teora cientificosocial nos conduce a predecir que dos grupoes
especificos de personas difieren en cuanto al tiempo que pasan leyendo el periodico
(esto constituir nuestra hiptesis de investigacin). Al comfirmarse esta prediccion
recibira apoyo la teoria cientificosocial de la que derivada. Para probar esta hipoteis de
investigacion, la enunciamos en forma operacional como hiptesis de investigacion, la
enunciamos en forma operacional como la hiptesis alterna, ( H 1 ) .

( H 1 ) ser tal que 1 2 , es decir, que la cantidad media de tiempo empleada en la


lectura del periodico por los miembros de las dos pblaciones es desisgual.
ser tal que

( H0)

1=2 , esto es , que la cantidad media de tiempo es empleada en leer el

peridico por los miembros de las dos poblaciones es la misma.Si los datos nos
permitieran rechazar ( H 0 ) , entonces ( H 1 ) , podria ser aceptada, y esto apoyaria la
hipotesis de investigacion y la teoria en la que se basa.
La naturaleza de la hipteis determina cmo debe ser formulada

( H 1 ) . Si la hipotesis

de investigacion simplemente dice que los dos grupos difieren con respecto a las
medias, entonces ( H 1 ) ser 1 2 . Pero si la teora predice la direccin de la
diferencia, es decir, que un grupo especifico tiene una media mayor que el otro,
entonces ( H 1 ) puede ser 1 > 2 o que 1 < 2 (donde significa mayor
que y significa menor que).

LA ELECCION DE LA PRUEBA ESTADSTICA


El campo de la estadstica se ha desarrolado hasta el grado en que actualmente se cuenta, para
casi todo los propsitos de investigacin, con pruebas estadsticas suceptibles de usarse
alternativamente para tomar decisiones acerca de la hipotesis. Al comparar las pruebas,
nescesitamos una base racional para escoger entre ellas.

NIVEL DE SIGNIFICAIN Y EL TAMAO DE LA MUESTRA


Cuando la hipotesis de nulidad y la hipotesis alterna han sido enunciadas y cuando la
prueba estadistica apropiada a la investigacin ha sido seleccionada, el paso siguiente
28

DISTRIBUCIN NO PARAMTRICA

consiste en especificar el nivel de significacicin

( )

y seleccionar un tamao de la

muestra (N).
En forma breve, este es el procedimiento para hacer decisiones: antes de escoger los
datos, se especifica el conjunto de todas las posibles muestras que se encuentran si
( H 0 ) es verdadera. De este conjunto se extrae un subconjunto de muestras de
caracteristicas tan extremas que

( H 0 ) , es verdadera, de que la muestra que de

Reduceb mucho la probabilidad, si

hecho se observa est entre ellas. Por tanto, si en la investigacion se observa una
muestra incluida en ese subconjunto, se rechaza ( H 0 ) .
Dicho de otra manera, nuestro procedimiento es rechazar

( H 0 ) para aceptar dicho

( H 1 ) , si una prueba estadistica produce un valor cuya probabilidad asociada de


ocurrencia bajo

. Esta pequea probabilidad se llama nivel de significacion. Valores comunes

por
de

( H 0 ) es igual o menor que alguna pequea probabilidad simbolizada

son 0.0.5 y 0.0.1. En otras palabras, si la probabilidad asociada con lo que

ocurre en

( H 0 ) , es decir, cuando la hiptesis de nulidad es verdadera, del valor

particular producido por una prueba estadistica es igual o menor que

( H0)

y aceptamos

( H1)

, rechazamos

que es la aseveracin operacional de la hiptesis de

investigacin.
Puede verse que en el nivel

hay la probabilidad de rechazar

equivocamente. Esta interpretacion de

( H0)

falsa o

sera ampliada cuando se estudie el error

tipo I.
Puesto que el valor de

juega un papel al determinar el rechazo de

aceptacion, la objetividad exige que el valor de

( H 0 ) o su

quede indicado

Antes de escoger los datos. El nivel que el investigador escoge para

antes de

recoger los debera determinarse por la estimacion que haga de la importancia o del
posible significado practico de sus descubrimientos. Por ejemplo, al estudiar los
posibles efectos reapeuticos de la cirugia del cerebro, el investigador debe escoger un
nivel de significacion mas bien severo, pues el peligro implicado en un rechazo
incorrecto de la hiptesis de nulidad es muy grande. Al imformar acerca de sus
descubrimientos, el investigador debe indicar el nivel de probabilidad real asociado con
ellos, de manera que el lector pueda juzgar por si mismo si la hipoteisi de nulidad debio
ser efectivamente rechazada. Un investigador puede escoger para su trabajo el nivel
29

DISTRIBUCIN NO PARAMTRICA

0.05, pero algn lector podra rehusarse a aceptar la validez de cualquier descubrimiento
que no sea significativo a los nivles 0.0.1, 0.005 o 0.001, mientras otro lector puede
interesarse en cualquier descubrimiento a niveles 0,08 o 0,10. El investigador debe dar a
sus lectores, cuando ello sea posible, informacion suficiente por medio del nivel de
probabilidad asociado con su estudio.
En la teoria contemporanea de la decision estadistica se han rechazado los
procedimientos que implican una adhesion a nivle de significacion, por ejemplo de 0,05
o 0,01, escogido arbitrariamente, y se favorece el uso de procedimientos en los que las
decisones se hacen con terminos de funciones de perdida, utilizando principios como el
de minimax( minimizar la prdida mxima). El lector interesado en este enfoque puede
consulatr los estudios de BLACKWELL y GIRSHICK (1954), Savage (1954) o Wald
1950. Aunque es evidente la conveniencia de esta tecnica para establecer un criterrio de
decision, las posibilidades de aplicacion practica son dudosas en una buena parte de la
investigacion relativa a las ciencias de las conductas, debido a que crecemos de la
informacion que construiria la base del uso de las funciones de perdida.
Una practica comn, que ilustra esta idea de diferentes investigadores y lectores
manteniendo con diferentes con diferentes puntos de vista acerca de las perdidas o
ganancias involucradas al llevar a cabo un descubrimiento cientificosocial, consiste para
el investigador en reportar simplemente el nivel de probabilidad asociado con su
descubrimiento sealando que la hiptesis de nulidad puede rechazarse a ese nivel.
Hay dos tipos de errores que pueden contenerse al decidir acerca de ( H 0 )

( H 0 ) siendo verdadera. El segundo, el error

El primero, el error de tipo I es rechazar


tipo II, es aceptar

( H 0 ) siendo falsa.

La probabilidad de cometer el error tipo I esta dada por


tanto mas probable es que

Cuando mayor sea

( H 0 ) sea rechazada equivocadamente, es decir, tanto mas

probable es que se comete el error tipo I. El error tipo II se suele representar por

indicaran tanto el tipo de error como la probabilidad de cometerlo. Esto

es:
p(error tipo I )=
p(error tipo II )=
En condiciones ideales, los valores de

deberian ser especificados por el

experimentador antes de iniciar la investigacion. Estos valores determinaran que tamao de


muestra (N) tendra que escoger para calcular la prueba estadstica que haya escogido.
Sin embargo, en la prctica es comn que
vez que

y N queden especificados por adelantado. Una

y N han sido especificados, queda determinada

.En vista de que hay una


30

DISTRIBUCIN NO PARAMTRICA
relacion inversa entre las probabilidades de cometer uno de los dos tipos de errores, al decrecer

se incrementara

para cualquier N dada. Si se desea reducir la posibilidad de ambos

tipos de errores, se debe incrementar N.


Debe quedar claro que en cualquier inferencia estadstica existe el peligro de cometer uno de los
dos tipos de errores, y que el experimentador debe alcanzar un equilibrio ptimo entre las
probabilidades de cometer cualquiera de los dos errores. Las diversas pruebas estadsticas
ofrecen posibilidades de equilibrios diferentes. Para obtener este equilibrio es importante la
nocin de la funcin de potencia de una prueba estadstica.
La potencia de una prueba se define como la probabilidad de rechazar

( H0)

cuando es

realmente falsa. Esto es:

potencia=1 probabilidad del error tipo II=1


Las curvas de la Figura 1 muestran que las probabilidades de cometer un tipo de error II (
) disminuyen a medida que el tamao de la muestra (N) incrementa, de modo que la potencia
aumenta al crecer el tamao de N. La figura 1 ilustra el incremento de la potencia de una
prueba de dos colas de la media que se produce con muestras de tamaos cada vez mayor,
siendo N sucesivamente igual a 4,1O, 20,50 y 100. Estas muestras se tomaron de poblaciones
normales con varianza

.La media bajo la hiptesis de nulidad se simboliza aqu con

0. La figura 1 tambien ilustra la probabilidad de rechazar


es verdadera, es decir, cuando la media verdadera es igual a

N= 100

( H0)

es 0,05 cuando

( H0)

0.
N= 50 N= 20

1
.9
.8
.7

( H0)

.6
Probabilidad de rechazar

= 0.5
.4
.1
.3
.2

.1
0
3

0 0

+2

+3

Fig. 1. Curvas de potencia de una prueba de dos colas en

=0.05

con diferentes

tamaos de muestra.

31

DISTRIBUCIN NO PARAMTRICA

Esto es lo que debera suceder, al ser


rechazar

=0.05

quedan aun probabilidades de

siendo verdadera.

El lector debe comprender los cinco puntos siguientes, que resumen lo dicho acerca del
nivel de significacin y del tamao de la muestra:
1. El nivel de significacin

comprende las probabilidades de obtener en una

prueba estadstica un valor que implica el rechazo de la hiptesis de nulidad,


siendo en realidad verdadera. Esto es, el nivel de significacin indica la
probabilidad de cometer el error tipo I.
2. La probabilidad de que una prueba estadstica produzca un valor conforme al
cual la hiptesis de nulidad ser aceptada cuando en realidad es falso queda
.Esto es, seala la probabilidad de cometer el
comprendida como
error tipo II.
3. La potencia de una prueba, 1-

, mide la probabilidad de rehazar

acertadamente la hipotesis de nulidad (es decir cuando es falsa).


4. La potencia est relacionada con la naturaleza de la prueba estadstica elegida.
5. En trminos generales, la potencia de una prueba estadstica se incrementa al
aumentar N.

LA DISTRIBUCION MUESTRAL
Una vez que un experimentador ha escogido una prueba estadstica para aplicarla a sus
datos, en seguida debe determinar cul es la distribucin muestral de la estadstica de la
prueba.
La potencia esta tambin relacionada con la naturaleza de

H1

. Si

H1

tiene

direccion, se usa una prueba de una cola.Una prueba de una cola es mas poderosa que
una de dos. Esto es claro al considerar la definicion de potencia.
La distribucion muestral es una distribucin terica. La obtendramos al tomar al azar
todas las muestras posibles de un mismo tamao extradas de una misma poblacin.
Expresado de otra manera, la distribucin muestral es la distribucin, conforme a
( H 0 ) , de todos los valores posibles que es una estadstica (por ejemplo, la media
maestral

x ) puede tomar cuando es calculada con muestras de igual tomadas al azar.

La distribucin muestral de una estadstica sealada las probabilidades conforme a


( H 0 ) , que estan asociadas con los diferentes valores numricas posibles de la
estadstica. La probabilidad "asociada con" la ocurrencia de un valor particular de la
estadstica conforme a ( H 0 ) , no es la probabilidad exacta de precisamente ese valor.
La expresion "las probabilidades asociadas con la ocurrencia conforme a

( H 0 ) " se

usa aqui para referirse a la probabilidad de un valor particular mas la probabilidad de


todos los valores mas extremos posibles. Esto es, "la probabilidad asociada" o "la
probabilidad asociada con la ocurrencia conforme a ( H 0 ) " es la probabilidad que la
32

DISTRIBUCIN NO PARAMTRICA

ocurrencia conforme a

( H 0 ) un valor tan extremo o mas que el valor particular de la

prueba estadistica. En este libro usaremos frecuentemete las frases anteriores y en cada
caso tendran el significado ya expresado.
Supongamos que nos interesara la probabilidad, de que caigan tres caras cuando se tiran
tres monedas 'legales' simultneamente. La distribucin muestral del nmero de las
caras podra sacarse de la lista de todos los resultados posibles de esa accin que
aparece en la tabla 7. El nmero total de eventos posibles (combinaciones de caras y
cruces) es ocho, de los cuales solo uno nos interesa: la ocurrencia conforme ha ( H 0 ) ,
de tres caras al tirar tres monedas es 48. Aqu,

( H 0 ) , es la afirmacin de que las

monedas son 'legales', lo que significa que para cada moneda la probabilidad de una
cara es igual a la probabilidad de una cruz.
Tabla 7. Resultados posibles del lanzamiento de tres monedas

RESULTADOS
1

Moneda 1

Cara

Cara

Cara

Cara

Cruz

Cruz

Cruz

Cruz

Moneda 2

Cara

Cara

Cruz

Cruz

Cara

Cara

Cruz

Cruz

Cruz

Cara

Cruz

Cara

Cruz

Cara

Cruz

Moneda

Cara

De manera, la distribucin de todos los eventos posibles nos ha mostrado la


probabilidad de ocurrencia conforme a ( H 0 ) , del evento en que estamos interesados.
Es obvio que sera prcticamente imposible utilizar este mtodo que comprende todos
los resultados posibles al anotar las distribuciones muestrales, aun con muestras
moderadamente grandes y tomadas de poblaciones grandes. En estas circunstancias
podemos confiar en la autoridad de los enunciados provenientes de teoremas
matemticos "demostrados".
Estos teoremas invariablemente parten de hiptesis y al aplicarlos debemos tener en
cuenta dichas hiptesis. Por lo comn, estas hiptesis se refieren a la distribucin de la
poblacin y/o al tamao de la muestra.
Un ejemplo de tales teoremas es el teorema del lmite central.
33

DISTRIBUCIN NO PARAMTRICA

Cuando una variables est distribuida normalmente, su distribucin se caracteriza


completamente por la media y la desviacin estndar. Debido a esto, sabemos, por
ejemplo, que la probabilidad de que un valor observado de las variables difiera de la
media en ms de 1.96 desviaciones estndares es menor que 0.05
Supongamos, pues, que deseamos saber, antes de tomar la muestra, cual es la
probabilidad asociada con la ocurrencia de un valor particular de x (la media

( H 0 ) , de la

aritmetica de la muestra), por ejemplo, la probabilidad conforme a


ocurrencia de un valor por lo menos tan grande como un valor de
muestra se toma al azar de
estndar

alguna poblacin cuya medida

las

, cuando la

y desviaciones

conocemos. Una version del teorema de lmite central establece que:

Si una variable est distribuida con la media igual a


a

y desviaciones estndar igual

, y se recogen muestras aleatorias de tamao N, las medias de estas muestras,


x

, estarn de manera aproximadamente distribuidas normalmente con media de

y desviaciones estndar de

/ N

para una magnitud de N suficientemente

grande.
En otras palabras, si N es suficientemente grande, la distribucin muestral de

x .

a) ser aproximadamente normal.


b) tiene una media igual a la media de la poblacional .
c) tiene una desviacin estndar igual a la desviacin estndar de la poblacin
dividida entre la raz cuadrada del tamao dela muestra, esto es x = / N
Por ejemplo, supongamos que en una poblacin formada por estudiantes, una prueba
determinada ha medido la distribucin de cierto atributo psicolgico de tal modo que
=100
y =16
Deseamos medir la probabilidad de que al recoger una muestra

x , sea igual a 104.

El teorema del lmite central nos dice que la distribucin muestral de las

de todas

las posibles muestras de tamao 64 estar

LA REGION DE RECHAZO
La regin de rechazo es una regin de la distribucin muestral. Esta incluye todos los
valores posibles que una prueba estadstica puede tomar conforme a H0; la regin de
rechazo se compone de un subconjunto de estos posibles valores, de manera que la
probabilidad de ocurrencia de una prueba estadstica conforme a H 0 cuyo valor este en
ese subconjunto, sea .

34

DISTRIBUCIN NO PARAMTRICA

En otras palabras de la regin de rechazo consiste de un conjunto de valores posibles tan


extremos que, cuando H0 es verdadera, es muy pequea la probabilidad ( ) de que la
muestra observada produzca un valor que este entre ellos. La probabilidad asociada con
cualquier valor de la regin de rechazo es igual o menor que .
La localizacin de la regin de rechazo es afectada por la naturaleza H1. Si H1 indica la
direccin predicha de la diferencia, entonces se requiere una prueba de una cola. Si H 1
no indica la direccin de la diferencia predicha, entonces se requiere una prueba de dos
colas.
Las pruebas de una y de dos colas se distinguen en la localizacin (per no en el tamao)
de la regin de rechazo. Esto es, en una prueba de una cola, la regin de rechazo est
totalmente en un extremo (o cola) de la distribucin muestral. En una prueba de dos
colas, la regin de rechazo esta en ambos extremos de la distribucin muestral.
El tamao de la regin de rechazo queda expresado por , que es el nivel de
significacin. Si

= 0.05, entonces el tamao de la regin de rechazo es del cinco

por ciento del rea total comprendida bajo la curva de la distribucin muestral. Las
regiones de rechazo de una y de dos colas en = 0.05 aparecen en la figura 2.
Obsrvese que estas dos regiones de rechazo difieren en su localizacin pero no en su
tamao total

LA DECISION
Si la prueba estadstica de un valor que est en la regin de rechazo, se rechaza H 0. De
dos maneras: suponiendo que la hiptesis de nulidad es falsa o que un evento raro e
improbable he sucedido. En este proceso de decisin, escogemos la primera de las
explicaciones. Ocasionalmente, por supuesto, la segunda puede ser la correcta. De
hecho, la probabilidad de que la segunda explicacin sea correcta est dada por ,
pues el rechazo de H0 cuando es verdadera es el error tipo I.
Cuando la probabilidad asociada con un valor observado de una prueba estadstica es
igual o menor que el valor previamente determinado de , concluimos que H0 es
falsa. El valor observado es llamado significativo. La hiptesis en prueba, H 0, se
rechaza siempre que ocurra un resultado significativo. Por tanto, se llama valor
significativo a aquel cuya probabilidad asociada de ocurrencia de acuerdo con H0 (tal
como la presenta la distribucin muestral) es igual o menor que .

EJEMPLO 1:
Las exposiciones de las diversas pruebas estadsticas no paramtricas van acompaadas
de muchos ejemplos de decisiones estadsticas en este libro. He aqu un ejemplo del
proceso de una decisin estadstica, que ilustra los puntos tratados en este captulo.
Supongamos que tenemos sospechas de que cierta moneda no es legal. Nuestra
sospecha proviene que la moneda tiende a caer de cara. Para probar esta sospecha (que
podemos dignificar llamndola hiptesis de investigacin), decidimos tirar la moneda
12 veces para observar la frecuencia con que ocurre la cara.
35

DISTRIBUCIN NO PARAMTRICA

1. Hiptesis de nulidad. H0: p (caras) = p (cruces) =

1
2 . Esto es, para la moneda

no hay diferencia entre la probabilidad de ocurrencia de una cara y la


probabilidad de ocurrencia de una cruz; la moneda es legal. H 1: p (caras)
p (cruces).
2. Prueba estadstica. La prueba estadstica apropiada para esta hiptesis es la
prueba binomial, que se basa en el desarrollo binomial.
3. Nivel de significacin. Decidimos de antemano usar = 0.01 como nuestro
nivel de significacin. N = 12, es el nmero de lanzamiento por separado.
4. Distribucin muestral. La distribucin muestral que da la probabilidad de
obtener x caras y N x cruces bajo la hiptesis de nulidad (la hiptesis de que la
moneda es legal) est dada por la funcin de distribucin binomial:
N!
x N-x
x ! ( Nx ) ! P Q ; x = 0, 1, 2,, N. El razonamiento en que se apoya este
proceso de decisin es muy simple. Si es muy pequea la probabilista asociada
con la ocurrencia conforme a la hiptesis de nulidad de un valor particular en la
distribucin muestral, podemos explicar la ocurrencia efectiva de ese valor.

TABLA 8. Distribucin muestral de x (nmero de caras) para 2 12 muestras de


tamao N = 12
Numero de caras

12
11
10

Distribucin muestral
(Frecuencia espera de ocurrencia si
se tomara 212 muestras de 12
lanzamientos)
1
12
66
36

DISTRIBUCIN NO PARAMTRICA

9
8
7
6
5
4
3
2
1
0

220
495
792
924
792
495
220
66
12
1
______
Total = 212 = 4096

En la tabla 8, aparece como distribucin muestral de x el nmero de caras. En la


distribucin muestral tenemos que el resultado ms probable de lanzar una moneda 12
veces es un recuento de 6 caras y 6 cruces. La obtencin de 7 caras y 5 cruces es
solamente un poco menos probable. Pero la ocurrencia de 12 caras en 12 lanzamientos
es realmente muy improbable, como lo es la ocurrencia de 0 caras (12 cruces).
5. Regin de rechazo. Puesto que H1 tiene direccin, se usara una prueba de una
cola de modo que la regin de rechazo quede totalmente en un extremo de la
distribucin muestral. La regin de rechazo consiste de todos los valores de x
(nmero de caras) tan grandes que la probabilidad asociada con su ocurrencia
conforme a H0 es igual o menor que = 0.01.
La probabilidad de obtener 12 caras es
0.00024 es menor que

1
=0.00024 . Puesto que p =
4096

= 0.01, la ocurrencia de 12 caras se ubica con

claridad dentro de la regin de rechazo.


La probabilidad de obtener 11 o 12 caras es
1
12
13
+
=
=0.0032
4096 4096 4096
En vista de que p = 0.0032 es menor que

= 0.01, la ocurrencia de 11 caras

tambin est en la regin de rechazo.


La probabilidad de obtener 10 caras (o un valor ms extremo: 11 o 12 caras) es
1
12
66
79
+
+
=
=0.019 . Como p = 0.019. Como p = 0.019 es mayor que
4096 4096 4096 4096
= 0.01, la ocurrencia de 10 caras no est en la regin de rechazo. Por tanto si 10
caras o menos resultan en nuestra muestra de 12 lanzamientos no podemos rechazar H 0
al nivel de significacin = 0.01.

37

DISTRIBUCIN NO PARAMTRICA

CONCLUSIONES
Cuando las suposiciones de la prueba paramtrica

verdad se satisfacen, la eficiencia asinttica cercana a

(vase pgina 39) en


H0

de la prueba de

rangos sealados y pares igualados de Wilcoxon, comparada con la prueba


es de

3
=95.5

(Mood, 1954). Esto significa que

3/

es la proporcin

lmite de tamaos de muestras necesarias para que las pruebas de Wilcoxon y


t alcancen el mismo poder. Para muestras pequeas, la eficiencia se acerca al

95 .
Podemos concluir que las pruebas estadsticas no paramtricas son tpicamente
muchos ms fciles de aplicar que las pruebas paramtricas.
Analizando el estimador de la media muestral se concluye que para las
distribuciones continuas y discretas los dos mtodos de estimacin trabajados
proporcionan las mismas medidas descriptivas con una precisin de tres dgitos
como lo son: la media, la varianza, el error promedio de estimacin
El estimador insesgado de la varianza y el estimador de la media poblacional
que tambin es insesgado para distintos valores de los parmetros poblacionales
en distribuciones continuas y discretas
Aplicar los datos una vez escogida la prueba estadstica.
El anlisis de varianza de una clasificacin por rangos de KRUSKAL-WALLIS
es una prueba extremadamente til para decidir si k muestras independientes son
de poblaciones diferentes.
38

DISTRIBUCIN NO PARAMTRICA
Los pasos para desarrollar el mtodo de KRUSKAL-WALLIS, son muy

importantes.

BIBLIOGRAFIA
DOCUMENTOS DE TESIS PDF (S.F). ESTADISTCA APLICADA, 23 de
junio
del
2016.
Sitio
Web:
http://tesis.uson.mx/digital/tesis/docs/10048/Capitulo4.pdf
GOOGLE BOOKS (S.F). DISTRIBUCION NO PARAMETRICA, 4 de julio del
2016.
Sitio
Web:
https://books.google.com.pe/books?
id=paXp0kwQB8sC&pg=PA11&dq=distribucion+no+parametrica&hl=es&sa=
X&ved=0ahUKEwiTnJvnoLrNAhWCKiYKHUSJAHEQ6AEINjAD#v=onepag
e&q=distribucion%20no%20parametrica&f=false
MODULO EXEL (2005). ESTADISTICA NO PRARAMETRICA, 4 de julio del
2016.
Sitio
Web:
http://datateca.unad.edu.co/contenidos/208041/Modulo_EXE/leccin_11_estadsti
ca_no_paramtrica.html
GEOCIENCIAS UNAM PDF (S.F). ESTADISTICA NO PARAMETRICA, 7 de
julio
del
2016.
Sitio
Web:
http://www.geociencias.unam.mx/~ramon/MCenP2/Clase9.pdf

39

DISTRIBUCIN NO PARAMTRICA

ANEXOS

40

DISTRIBUCIN NO PARAMTRICA

41

Das könnte Ihnen auch gefallen