Estadistica No Parametrica

ESTADSTICA
APLICADA
DISTRIBUCIN NO
PARAMTRICA
Las pruebas paramtricas requieren supuestos acerca de la
naturaleza o forma de las poblaciones involucradas. Las pruebas no
paramtricas no requieren estos supuestos. Consecuentemente, las
pruebas no paramtricas de hiptesis son frecuentemente llamadas
pruebas de libre distribucin.
DISTRIBUCIN NO PARAMTRICA
UNIVERSIDAD NACIONAL JOSE FAUSTINO SANCHEZ CARRION
AO DE LA CONSOLIDACIN DEL MAR GRAU
FACULTAD
: INGENIERA QUMICA Y METALRGICA
ESCUELA
: INGENIERA QUMICA
DOCENTE
: MUOZ VILELA, Julio
CURSO
: ESTADSTICA APLICADA
TRABAJO
: DISTRIBUCIN NO PARAMTRICA
CICLO
:V
SEMESTRE
: 2016-I
ALUMNOS
:
*
*
*
*
*
ANICETO AGUACONDO, Grecia Danae

AYALA HUAYNATTE, Sofa Mercedes
CHERO RAMIREZ, Fiorella Dannet
GARCIA DE LOS SANTOS, Freddy Ermel
GONZALO ASCENCIO, Ruth Vanessy
DEDICATORIA
El trabajo monogrfico est dedicado a

nuestros compaeros de clases para que
conozcan a cerca de la distribucin
paramtrica; y al profesor quien nos estima
buenas enseanzas y aprendizajes.
INTRODUCCIN
Las pruebas paramtricas requieren supuestos acerca de la naturaleza o forma de las

poblaciones involucradas. Las pruebas no paramtricas no requieren estos supuestos.
Consecuentemente, las pruebas no paramtricas de hiptesis son frecuentemente
llamadas pruebas de libre distribucin.
Aunque el trmino no paramtrico sugiere que la prueba no est basada en un
parmetro, hay algunas pruebas no paramtricas que dependen de un parmetro tal
como la media. Las pruebas no paramtricas, sin embargo, no requieren una
distribucin particular, de manera que algunas veces son referidas como pruebas de libre
distribucin. Aunque libre distribucin es una descripcin ms exacta, el trmino no
paramtrico es ms comnmente usado. Las siguientes son las mayores ventajas y
desventajas de los mtodos no paramtricos.
Uno de los problemas ms difciles para el principiante y para el investigador
experimentado, es decidir cul de las pruebas estadsticas es la ms adecuada para
analizar un conjunto de datos. La aplicacin de la estadstica en el anlisis de datos es
muy amplia y las reas en las que se aplica son diversas, desde las ciencias exactas hasta
las ciencias sociales. La seleccin de la prueba estadstica necesaria para el caso,
depende de varios factores, en primer lugar se debe saber cul es la escala con la que se
estn midiendo los datos que se analizarn, pues no se puede aplicar la misma prueba
estadstica para el caso en que la variable de inters sea el peso de un producto que
cuando lo es la profesin del usuario de un producto, es por esto que la primera parte de
este artculo se dedicar a las diferentes escalas con las que se pueden medir los datos
que se manejan.
CONTENIDO
DEDICATORIA.................................................................................................. 2
INTRODUCCIN............................................................................................... 3
UN POCO DE HISTORIA..................................................................................... 5
3
DEFINICIN..................................................................................................... 6
VENTAJAS................................................................................................... 6
DESVENTAJAS............................................................................................. 6
ANALISIS DE VARIANZA DE UNA CLASIFICACION POR RANGOS DE KRUSKALWALLIS........................................................................................................... 7
FUNDAMENTO Y MTODO...........................................................................7
EJEMPLO 1: PARA MUESTRAS PEQUEAS....................................................8
EL CASO DE k MUESTRAS INDEPENDIENTES..............................................10
EJEMPLO 2: PARA MUESTRAS GRANDES....................................................10
POTENCIA EFICIENCIA........................................................................... 13
LA PRUEBA DE RANGOS SEALADOS Y PARES IGUALADOS DE WILCOXON.......16
FUNDAMENTO Y MTODO.........................................................................16
EJEMPLO 1: PARA MUESTRAS PEQUEAS..................................................17
EJEMPLO 2: PARA MUESTRAS GRANDES....................................................20
RESUMEN DEL PROCEDIMIENTO...............................................................21
POTENCIA EFICIENCIA........................................................................... 23
EL USO DE LAS PRUEBAS ESTADISTICAS EN INVESTIGACIN...........................24
LA HIPTESIS DE NULIDAD.......................................................................24
LA ELECCION DE LA PRUEBA ESTADSTICA..............................................25
NIVEL DE SIGNIFICAIN Y EL TAMAO DE LA MUESTRA..........................25
LA DISTRIBUCION MUESTRAL...................................................................28
LA REGION DE RECHAZO..........................................................................30
LA DECISION............................................................................................. 31
EJEMPLO 1:.............................................................................................. 31
CONCLUSIONES............................................................................................. 34
BIBLIOGRAFIA............................................................................................... 34
UN POCO DE HISTORIA
Uno de los trabajos ms antiguos conocidos en estadstica no paramtrica data en el ao
1710 y fue realizado por Arbuthnot. En l se utiliza la prueba del signo para examinar
4
las proporciones de nacimientos de hombres y mujeres como prueba de la sabidura de

la providencia divina.
Sin embargo los primeros desarrollos de los mtodos no paramtricos se produjeron a
partir de los aos 30 con los trabajos de Hottelling y Papst (1936), Friedman (1937(,
Kendall (1938). Un desarrollo sistemtico de la teora se inici con los trabajos de
Wilcoxon (1945) y Mann y Whitney (1947), en los que descubrieron el sorprendente
resultado de que las pruebas de rangos pierden muy poca eficiencia cuando se compara
con la prueba t bajo el modelo de distribucin normal, y pueden ser mucho ms
eficiente que esta para modelos de distribuciones con colas alargadas .
En la dcada de los 60 Hodges y Lehamann obtuvieron tambin estimaciones puntuales
y por intervalo de parmetros de localizacin, basadas en estadsticas de rangos,
mostrando adems que estos mtodos de estimacin heredan varias propiedades de las
estadsticas de prueba de que los generaron.
Tambin en esta dcada, Hjek desarrollo una poderosa teora para obtener las
distribuciones asintticas de las estadsticas de rango, que permiti la construccin de
estadsticas de prueba ms generales basadas en rangos.
Las pruebas de rangos para el anlisis de diseos de experimentos fueron introducidas
tambin por Hodges y Lehmann a principios de los aos 60 y posteriormente
desarrolladas por Puri y Sen. Las pruebas de rangos y los mtodos de estimacin para
modelos de regresin simple fueron estudiados por Adichie (1967), y para el modelo
lineal general, por Aichie (1978). La mayor parte de la teora de distribuciones
asintticas requerida para el modelo lineal se debe al trabajo de Jureckova (1969). Con
sus resultados es posible desarrollar versiones unificadas basadas en rangos para el
anlisis de conjuntos de datos ms complejos cuya aplicacin, hoy en dia, puede ser
implementada en computador a travs de paquetes especiales para esto es programado
directamente los procedimientos.
Debido a que lo mtodos estadstico no paramtricos son relativamente nuevos, muchos
de ellos son todava desconocidos entre los investigadores de las diferentes reas. Este
curso tiene como objetivo dar a conocer algunos de los mtodos no paramtricos ms
importantes y proporcionar un entrenamiento bsico para las aplicaciones.
DEFINICIN
Una distribucin no paramtrica est basada en un modelo que especifica solo
condiciones muy generales y ninguna a cerca de la forma especfica de la distribucin
de la cual fue obtenida la muestra. Ciertas suposiciones estn asociadas con la mayora
de las distribuciones no paramtricas, a saber: que las observaciones son independientes
5
y quiz que l variable en estudio es continua; pero estas suposiciones son menores y
ms dbiles que aquellas asociadas con la distribucin paramtrica.
La estadstica no paramtrica es una rama de la estadstica que estudia las pruebas y
modelos estadsticos cuya distribucin subyacente no se ajusta a los llamados criterios
paramtricos. Su distribucin no puede ser definida a priori, pues son los datos
observados los que la determinan. La utilizacin de estos mtodos se hace
recomendable cuando no se puede asumir que los datos se ajusten a una distribucin
conocida, cuando el nivel de medida empleado no sea, como mnimo, de intervalo.
La distribucin no paramtrica prueban diferentes hiptesis a cerca de la poblacin, que
la distribucin paramtrica no lo hace. Por ultimo a diferencia de las paramtricas,
existen no paramtricas que puedan aplicarse apropiadamente a datos medidos en una
escala ordinal, y otras pruebas para datos a escala nominal o categrica.
VENTAJAS
1. Si el tamao de la muestra es muy pequeo, puede no haber otra opcin que usar
una distribucin no paramtrica, a menos que la naturaleza de la distribucin de
la poblacin se conozca con exactitud.
2. Tpicamente hacen menos suposiciones a cerca de los datos y pueden ser ms
relevantes a una situacin particular. Adems las hiptesis probadas por una
distribucin no paramtrica pueden ser ms adecuadas para la investigacin.
3. Las distribuciones no paramtricas estn disponibles para tratar datos que son
simplemente clasificatorios, es decir, que son medidos en una escala nominal.
4. Pueden frecuentemente ser aplicados a datos no numricos, tal como el gnero
de los que contestan una encuesta.
5. Existen distribuciones no paramtricas que son adecuadas para tratar muestras
obtenidas de observaciones de diferentes poblaciones.
6. Son ms fciles de aprender y aplicar. Adems, su interpretacin suele ser ms
directa.
DESVENTAJAS
1. Los mtodos no paramtricos tienden a perder informacin porque datos
numricos exactos son frecuentemente reducidos a una forma cualitativa.
2. Una de las objeciones es que no son sistemticas.
3. No tiene una distribucin fija para este tipo de estadstica, por lo que en
ocasiones puede ser un problema el elegir la adecuada.
4. En varios casos se requieren transformar los datos en rangos, perdiendo la
informacin puntual.
ANALISIS DE VARIANZA DE UNA CLASIFICACION POR

RANGOS DE KRUSKAL-WALLIS
El anlisis de varianza de una clasificacin por rangos de kruskal-Wallis es una prueba
extremadamente til para decidir si k muestras independientes son de poblaciones
diferentes. Los valores de las muestras, casi invariablemente, difieren un poco y la
6
cuestin radica en que las diferencias entre las muestras signifiquen diferencias
genuinas de poblacin o simples variaciones aleatorias, semejantes a las esperadas entre
distintas muestras aleatorias de la misma poblacin. La tcnica de kruskal-Wallis
examina la hiptesis de nulidad que supone que las k muestras proceden de la misma
poblacin o de poblaciones idnticas con respecto a los promedios. La prueba supone
que la variable en estudio tiene como base una distribucin continua. Requiere por lo
menos, una medida ordinal de la variable.
FUNDAMENTO Y MTODO
Al calcular la prueba de kruskal-Wallis, cada una de las N observaciones es
reemplazada por rangos. Esto es, todos los puntajes de las k muestras combinadas se
ordenan en una sola serie. El puntaje ms pequeo es reemplazado por el rango 1, el
siguiente en tamao por el rango 2 y el siguiente por el rango N. N es el nmero total de
observaciones independientes en las k muestras.
Cuando se ha hecho esto, se encuentra la suma de los rangos de cada muestra. La
prueba de kruskal-Wallis, determina si la desigualdad entre las sumas de rangos es tan
grande que probablemente no procedan de muestras tomadas de la misma poblacin.
Puede demostrarse que si las k muestras efectivamente proceden de la misma poblacin
o de poblaciones idnticas, es decir, si H 0 es verdadera, H est distribuida como chi
cuadrada
gl=k 1 , siempre que los tamaos de las diferentes k muestras no
con
sean demasiado pequeas. Esto es,

k
12
Rj 2
H=
3( N +1) ..( 1)
N (N +1) j=1 nj
Donde:
k= nmero de muestras
nj =nmero de casos en la muestra de orden j

N=
nj
, el nmero de casos de todas las muestras combinadas
Rj=suma de rangos en la muestra de orden j

1
j=1
Indica sumar las k muestras
Est distribuida aproximadamente como chi cuadrado
gl=k 1 , para tamaos muestrales (
nj ) suficientemente grandes.
Cuando hay ms de 5 casos en los diversos grupos, esto es,
con la ocurrencia conforme, a
H0
nj>5 , la probabilidad asociada
de valores tan grandes como el de una H observada,

7
puede determinarse en la tabla del apndice. Si el valor observado de H es igual o mayor que el
valor de chi cuadrado dado en la tabla O en el nivel de significacin fijado previamente y
para el valor observado de
gl=k 1 ,
H0
puede rechazarse en ese nivel de
significacin.
Cuando k=3 y el nmero de casos en cada una de las 3 muestras es 5 o menos, la
aproximacin de chi cuadrada a la distribucin muestral de H no es suficientemente
cercana. Para tales casos se han tabulado probabilidades exactas a partir de la frmula
(1), que aparecen en la tabla O. La primera columna de esta tabla contiene el nmero de
casos de las 3 muestras, varios valores posibles de n1 , n2 , n3 . La segunda contiene
diferentes valores de H, calculados con la frmula (1). La tercera contiene las
probabilidades asociadas con la ocurrencia conforme a H 0 de valores tan grandes
como el de una H observada. Por ejemplo, si
H 5.8333
cuando las 3 muestras
contienen 4,3 y 1 casos, la tabla O seala que la hiptesis de nulidad puede rechazarse al
nivel de significacin 0.021.
EJEMPLO 1: PARA MUESTRAS PEQUEAS.

Supongamos que un investigador educativo desea probar la hiptesis que supone que los
administradores escolares son caractersticamente ms autoritarios que los maestros de
clase. Sin embargo, sus datos para probar esta hiptesis pueden estar contaminado
debido a que muchos maestros se orientan hacia la administracin en sus aspiraciones
profesionales. Es decir, muchos profesores toman a los administradores como un grupo
de referencia. Para evitar la contaminacin, el investigador decide dividir sus 14 sujetos
en 3 grupos: profesores orientados hacia la enseanza; profesores orientados a la
2
administracin y administradores. Aplica la escala F (una medida de autoritarismo)
a cada uno de los 14 sujetos. Su hiptesis supone que los 3 grupos diferirn con
respecto a los promedios en la escala F.
1. Hiptesis de nulidad.
H 0 : no hay diferencia entre los promedios de puntaje F
de los profesores orientados a la enseanza, los profesores orientados a la

administracin y los administradores. H 1 : los 3 grupos de educadores no
tienen el mismo promedio de puntajes
F2
2. Prueba estadstica: como son 3 los grupos independientes en estudio, se

requiere una prueba para k muestras independientes. Puesto que los puntajes de
la escala F pueden considerarse que representan al menos una medida ordinal del
autoritarismo, se escoge la prueba de Kruskal-Wallis.
3. Nivel de significacin: sean =0.05 ; N=14, el nmero total de educadores
estudiados;
n1=5 , el nmero de profesores orientados a la enseanza;
n2=5 , el nmero de profesores orientados a la administracin, y
n3=4 , el
nmero de administradores.
8
4. Distribucin maestral: para k=3 y valores pequeos de
n j , de la tabla O
seala la probabilidad asociada con la ocurrencia conforme a
H0
de valores
tan grandes como el de una H observada.

5. Regin de rechazo: la regin del rechazo consiste en todos los valores de H tan
grandes que la probabilidad asociada con su ocurrencia conforme a H 0 es
igual a o menor que
=0.05 .
Tabla 1. Puntajes de autoritarismo de tres grupos de educadores (Datos ficticios)

Profesores orientados a la
enseanza
96
128
administracin
82
124
Administradores
83
61
101
132
135
109
166
147
115
149
1. Decisin: para este estudio ficticio, los puntajes F para los diversos educadores
se muestran en la tabla 1. Si ordenamos estos 14 puntajes F del ms bajo al ms
alto, obtenemos los rangos mostrados en la tabla 2. Estos rangos se han sumado
para los tres grupos, obtenindose R1=22, R2=37, R3=46 , como se muestra
en la tabla 2.
Tabla 2. Rangos de autoritarismo de tres grupos de educadores
(Datos ficticios)
enseanza
4
9
3
1
5
administracin
2
8
10
11
6
Administradores
R1=22
R2=37
R3=46
7
13
14
12
Ahora con estos datos podemos calcular el valor de H con la formula (1):
k
H=
12
Rj 2
3( N +1)(1)
N (N +1) j=1 nj
H=
(22) (37) (46)

12
+
+
3 ( 14+1 )=6.4
14(14 +1) 5
5
4
La referencia de la tabla O seala que cuando las n j son 5,5 y 4,

probabilidad de ocurrencia bajo la hiptesis de nulidad de
esta probabilidad es menor que
H0
rechazar
y aceptar
H 6.4
tiene una
p<0.049 . En vista de que
=0.05 , nuestra decisin en este estudio ficticio es
H 1 . Concluimos que los tres grupos de educadores
especificados difieren en grado de autoritarismo.

Observaciones ligadas. Cuando ocurren ligas entre dos o ms puntajes, a cada puntaje
se le da la media de los rangos con los que est ligado.
Ya que el valor de H es influido en cierto grado por las ligas, es deseable corregir al
calcular H. para corregir el efecto de las ligas, H es calculada con la formula (1) y
dividida por
1
T
N 3N
. (2)
Donde:
T =t 3 t
(Cuando t es el nmero de observaciones ligadas en un grupo de puntajes
ligados).
N= Nmero de observaciones en las k muestras juntas, esto es,
N= n j
Indica sumar en todos los grupos de ligas.
As, una expresin general para H, corrigiendo el efecto de las ligas, es:
k
12
Rj2
3 ( N +1 )
N ( N +1 ) j=1 nj
H=
..(3)
T
1 3
N N
La correccin del efecto de las ligas resulta en un incremento del valor e H y de este
modo el resultado es an ms significativo de lo que habra sido sin la correccin. Por
consiguiente, si se puede rechazar H 0 sin la correccin [es decir, con la frmula (1)
al calcular H], se podr rechazar
H0
en un nivel de significacin ms severo por
medio de la correccin.
EL CASO DE k MUESTRAS INDEPENDIENTES

En la mayora de los casos, el efecto de la correccin es insignificante. Si no hay ms de
un 25% de observaciones ligadas, la probabilidad asociada con una H calculada sin la
10
correccin, es decir, mediante la frmula (1), rara vez cambia en ms de 10% cuando se
corrige el efecto de las ligas, esto es, si H es calculada con la formula (3), de acuerdo
con Kruskal-Wallis.
En el siguiente ejemplo, H es calculada en primer lugar con la formula (1) y despus
corregida debido a las ligas. Ntese que aun cuando hay 13 grupos de ligas que implican
a 47 de las 56 observaciones, el cambio de H que resulta al aplicar la correccin es
solamente de H=18.464 a H=18.566.
Como suele suceder, la magnitud del factor de correccin depende de la longitud de las
ligas, es decir, de los valores de t, as como del porcentaje de las observaciones
implicadas.
EJEMPLO 2: PARA MUESTRAS GRANDES

Un investigador anoto los pesos que tenan al nacer los miembros de ocho camadas
diferentes de cerdos, para determinar si el peso al nacer es afectado por el tamao de la
camada.
1. Hiptesis de nulidad. H 0
: no hay diferencia en los pesos de nacimiento
promedio de cerdos de diferentes tamaos de camada.

H 1 : Los pesos de nacimiento promedio de cerdos de diferentes tamaos de
camada no son todos iguales.
2. Prueba estadstica: puesto que las ocho camadas son independientes, es
apropiada una prueba estadstica para k muestras independientes. Aunque la
medida de peso en libras est en una escala de proporcin, escogemos el anlisis
de varianza de una clasificacin no paramtrica en vez de la prueba paramtrica
equivalente a fin de evitar hacer las suposiciones concernientes a la normalidad
y homogeneidad de la varianza asociadas con la prueba paramtrica F e
incrementar la generalidad de nuestros hallazgos.
3. Nivel de significacin: sean =0.05 y N=56 , el nmero total de cerdos
recin nacidos en estudio.
4. Distribucin muestral: calculada con la formula (1), H est distribuida
aproximadamente como chi cuadrada con gl=k 1 . As la probabilidad
asociada con la ocurrencia conforme a
H 0 de valores tan grandes como el de
una H observada puede determinarse consultando la tabla C.

5. Regin de rechazo: esta regin consiste en todo los valores de H tan grandes que
H0
la probabilidad asociada con la ocurrencia conforme a
para
gl=k 1=7
es igual a o menor que =0.05 .
Tabla 3. Pesos en libras al nacer, de ocho camadas de cerdos Poland China,

primavera 1919
Camadas
1
11
2.0
2.8
3.3
3.2
4.4
3.6
1.9
3.3
2.8
1.1
3.5
2.8
3.2
3.5
2.3
2.4
2.0
1.6
3.3
3.6
2.6
3.1
3.2
3.3
2.9
3.4
3.2
3.2
3.2
3.3
3.2
2.9
3.3
2.5
2.6
2.8
2.6
2.6
2.9
2.0
2.0
2.1
3.1
2.9
3.1
2.5
2.6
2.2
2.2
2.5
1.2
1.2
2.5
2.4
3.0
1.5
1. Decisin: los pesos de nacimiento de los 56 cerdos pertenecientes a las 8

camadas se dan en la tabla 3. Si ordenamos estos 56 pesos, obtenemos los rangos
que aparecen en la tabla 4. Ntese que hemos ordenado a los 56 puntajes en una
sola serie lo requiere esta prueba.
Tabla 4. Rangos de pesos de nacimiento de ocho camadas de cerdos
Camadas
1
8.5
27.5
47.5
41.0
56.0
54.5
6.0
47.5
27.5
1.0
2
52.5
27.5
41.0
52.5
14.0
15.5
8.5
5.0
3
47.5
54.5
23.0
36.0
41.0
47.5
31.5
51.0
41.0
41.0
4
41.0
47.5
41.0
31.5
47.5
18.5
23.0
27.5
5
23.0
23.0
31.5
8.5
8.5
11.0
6
36.0
31.5
36.0
18.5
7
23.0
12.5
12.5
18.5
2.5
2.5
8
18.5
15.5
34.0
4.0
R1=
R2=
R3=
R4 =
R5=
R6=
R7=
R8=
317.0
216.5
414.0
277.5
105.5
122.0
71.5
72.0
El ms pequeo de los cerdos, el ltimo miembro de la camada 1, peso 1,1 libras y se

dio el rango de 1. El cerdito ms gordo, tambin de la camada 1, peso 4,4 libras; este
peso obtuvo el rango 56. Tambin en la tabla 4 aparecen las sumas de cada columna de
rangos R j .
Con los datos de la tabla 8.8, podemos calcular el valor de
sin corregir el efecto
de las ligas con la formula (1):

H=
k
Rj
12
3 ( N + 1 ) . (1)
N ( N + 1 ) j =1 n j
H=
( 317 )2 ( 216,5 )2 ( 414 )2 ( 277,5 )2 ( 105,5 )2 ( 122 )2 ( 71,5 )2 ( 72 )2

12
+
+
+
+
+
+
+
3 ( 56+1 )
8
10
8
6
4
6
4
56 ( 56+1 ) 10
12
H=
12
( 10048,9+5859,031+ 17139,6+9625,781+1855,042+ 3721,0+852,042+1296,0 )171
3192
H=18,464
La referencia a la tabla C
indica que una
H 18,464
con
gl=k 1=7
Tiene una probabilidad de ocurrencia conforme a
H 0 de
p<0,02.
Para corregir el efecto de las ligas empezaremos por determinar cuntos grupos ligados
ocurrieron y cuantos puntajes estaban ligados en cada grupo. La primera liga ocurri
entre dos cerdos en la camada 7 (que pesaron 1,2 libras). Ambos se les asigno el rango
de 2,5. Aqu, t el nmero de observaciones ligadas, 2 . Para este suceso,
T =t 3 t=82=6
La siguiente liga ocurri entre cuatro cerdos a los que se asign el rango ligado 8,5.
3
Aqu, t=4 y T =t t=644=60 .
Prosiguiendo de esta manera a travs de los datos de la tabla 4, encontraremos que
ocurrieron 13 grupos ligados. Al contar el nmero de observaciones en cada grupo
ligado, se determinan los diferentes valores de t , y calculamos el valor de
T =t 3 t
en cada caso. Nuestro conteo arrojara los resultados siguientes:
60
60
120
60
60
24
336
210
Obsrvese que para cualquier valor particular de t, el valor de T es una constante.

Ahora, usando la formula (2), podemos computar la correccin total por ligas:
1
T
N 3N
(2)
( 6+60+6+ 6+60+120+ 60+ 60+24+ 336+210+6+6 )

=0,9945
( 56 )356
Este valor viene a ser el denominador de la formula (3), y el valor que ya hemos
calculado con la formula (1) es el numerador.
13
De este modo, necesitamos solamente hacer una operacin adicional para obtener el
valor de H , corregido el efecto de las ligas:
k
Rj
12
3 ( N +1 )
N ( N +1 ) j=1 n j
H=
.(3)
T
1 3
N N
2
H=
18,464
=18,566
0,9945
C
La tabla
valor tan grande como
H=18,566 ,
gl=7 , es
p<0,01 . Ya que esta probabilidad es
menor que el nivel de significacin previamente fijado,

rechazar
H 0 de un
muestra que la probabilidad asociada con la ocurrencia conforme a
H0.
=0,05 , nuestra decisin es
Concluimos que el peso del nacimiento de los cerdos varan
significativamente de acuerdo con el tamao de la camada.

Resumen del procedimiento. Los pasos para usar el anlisis de varianza de una clasificacin
por rangos de Kruskal Wallis son los siguientes:
1. Se ordenan todas las observaciones de los
grupos en una sola serie, asignando
N .
rangos de 1 a
2. Se determina el valor de
(la suma de los rangos) para cada uno de los
grupos de rangos.
3. Si una gran proporcin de las observaciones estn ligadas, se calcula el valor
la formula (3). de otra manera, se usa la formula (1).
4. El mtodo para determinar la significacin del valor observado de
tamao de
a) Si
k =3
k
con
depende del
y del tamao de los grupos:

y si
n1 , n2 , n3 , 5 , la tabla
probabilidad asociada conforme a
H0
puede usarse para determinar la
de una
tan grande como la
observada.
b) En los otros casos, la significacin de un valor tan grande como el valor observado
de
puede determinarse por medio de la tabla
C , con
gl=k 1
5. Si la probabilidad asociada con el valor observado de
nivel de significacin,
, previamente fijado, se rechaza
es igual o menor que el
H 0 y se acepta
H1.
14
POTENCIA EFICIENCIA
Comparada con la prueba paramtrica ms poderosa, la prueba
F ,
En las condiciones donde las suposiciones asociadas con el mtodo estadstico de la prueba
son satisfechas, la prueba de Kruskal Wallis tiene una eficiencia asinttica de
3
=95,5 por ciento.
La prueba de Kruskal Wallis es ms eficiente que la extensin de la prueba de la mediana,

pues utiliza ms la informacin de las observaciones al convertir los puntajes en rangos en lugar
de simplemente dicotomizarlos por encima y por debajo de la mediana.
15
Tamao
Tamao
de
H
p
HH
pp
O . deTabla de H
de muestras
probabilidades Tamao
asociadas
con valores tan grandes como
muestras
muestras
TABLA
nn1
nn2
nn3
nn1
nn2
nn3
1
2
3
1
2
3
DISTRIBUCIN
NO PARAMTRICA
2
1
1
2.700
.500
6.444
4
3
2
.008
5
2
2
6.53
.008
5.63
.050
0
4
33
08
6.300
.011
TABLA O .
Tabla de probabilidades
asociadas
con
valores
tan
grandes
como valores
0
6.13 .013
4.54
.099
3.600
5.444
33
87
2
2
.200
.046
H 1en el anlisis
observados
de
de
varianza de una clasificacin por
0
4 rangos de Kruskal
5.16
.034
4.52
.103
5.400
.051
00
31
0
5.04 .056
4.571
4.511
2
2
2
.067
.098
4
1
00
3.714
.200
4.444
.102
4.37 .090
5
4
4
7.76
.009
3
4
33
04
4.29
.122
7.74
.011
3.200
33
40
3
1
1
0
.300
6.745 .049
5.65
4
3
3
.010
5
71
4.285
6.709
6.40 .012
5.61
.050
35
23
11
.100
.013
7
1
00
76
3.857
5.790
.133
.046
4.96
.058
4.61
.100
1
9
5.727
00
87
.050
3
4.87 .052
4.55
.102
5.357
4.709
3
2
2
.029
.092
11
27
2
1
4.01
.095
4.714
4.700
.101
.048
3
0
78
4.500
.067
3.84 .123
5
5
1
7.30 .009
0
00
91
4.464
6.666
.105
4
4
1
.010
6.83
.011
3
7
64
6.166
.022
7
5
3
2
6.90 .009
5.12
.046
5.142
4.966
91
73
3
3
2
.043
.048
9
7
6.82
.010
4.90
.053
4.571
4.866
.100
.054
18
91
4
7
4.000
4.166 .086
5.25 .049
4.10
.129
.082
0
7
09
91
4.066
.102
5.10 .052
4.03
.105
7
55
64
3
3
2
6.250
.011
4.65
.091
0
5.361
7.036
09
.032
4
4
2
.006
1
4
4.49 .101
5
5
2
7.33
.010
5.138
6.872
.061
.011
45
85
9
7
7.26
.010
4.555
5.454
.100
.046
6
92
5
4.250
5.236 .047
5
3
3
7.07 .009
5.33
.121
.052
0
4
88
85
4.554
.098
6.98 .011
5.24
.051
5
18
62
7.200
4.445
.103
3
3
3
.004
0
5
5.64
.049
4.62
.097
6.488
.011
85
31
9
5.51
.051
4.50
.100
5.688
7.143
.029
4
4
3
.010
52
77
9
9
4.53 .097
5.600
7.136
.050
.011
0
4
33
5.066
5.598 .010
4.41 .109
5
5
3
7.57
.086
.049
7
5
21
80
4.622
5.575
.100
.051
7.54
.010
2
8
29
3.571
4.545 .046
5
4
1
6.95
.008
5.70
4
1
1
.200
.099
16
4
5
45
55
4.477
.102
6.84 .011
5.62
.051
3
00
64
4
1
2
4.821
.057
4.98
.044
4.54 .100
4
LA PRUEBA DE RANGOS SEALADOS Y PARES

IGUALADOS DE WILCOXON
La prueba que acabamos de estudiar, la prueba de los signos, utiliza simplemente
informacin acerca de la direccin de las diferencias de las parejas. Si se considera la
magnitud relativa as como la direccin de las diferencias, puede hacerse una prueba
ms poderosa. La de rangos sealados y pares igualados de Wilcoxon hace precisamente
eso: da mayor peso al par que muestra una diferencia grande entre las dos condiciones
que el par que exhibe una diferencia pequea.
La prueba de Wilcoxon es la mayor utilidad para el cientfico conductual. Con datos
conductuales de esta disciplina, no es raro que el investigador pueda:
a) Saber cul de los dos miembros de un par es mayor, es decir, indicar el signo
de la diferencia en cualquier par.
b) Clasificar las diferencia por orden de tamao absoluto. Es decir, puede hacer el
juicio mayor que entre las ejecuciones de cualquier par, y tambin entre los
puntajes de dos diferencias cualesquiera procedentes de dos pares.
Con tal informacin el investigador puede usar la prueba de Wilcoxon.
FUNDAMENTO Y MTODO
Sea
d i el puntaje de diferencia para cualquier par igualado, representando la diferencia entre
los puntajes del par bajo los dos tratamientos. Cada par tiene una
Wilcoxon, se clasifican todas las
pequea
d i . Para usar la prueba de
d i , sin tener en cuenta el signo; asi: del rango de 1 a la ms
d i , el rango 2 a la siguiente menor, etc. Cuando se clasifican puntajes despreciando
el signo, a una
d i de 1 se le da un rango menor que a una d i de 2 o +2 .
En seguida se aade a cada rango el signo de la diferencia, indicando que rangos procedieron de
d i , negativas y de
d i positivas.
Ahora bien, si los tratamientos A y B son equivalente, esto es, si

esperaramos encontrar algunas de las
di
H0
es verdadera,
mayores favoreciendo el tratamiento de A y otras
favoreciendo el de B. Es decir, algunos de los rangos mayores procederan de las

positivas mientras otras procederan de las
di
di
negativas. Si sumamos los rangos que tienen
signo de ms y tambin los que tienen signo menos, las dos sumas deberan ser iguales
conforme a
H 0 . Pero si la suma de los rangos positivos es muy diferente a la de los rangos
negativos, deduciremos que el tratamiento
difiere del B , y de este modo rechazaremos
17
H 0 . En otras palabras, rechazaremos
H0
negativas como la suma de los rangos para las
si tanto la suma de los rangos de las
di
d i positivas son demasiado pequea.
Ligas. Ocasionalmente, los dos puntajes de algn par son iguales y no se observa diferencia
entre los dos tratamientos para ese par, de manera que
d=0 . Tales pares descartados del

N Es el nmero de
anlisis. Es la misma prctica que se sigue con la prueba de los signos.

pares igualados menos el nmero de pares cuya
Pueden ocurrir otra clase de ligas. Dos o ms
es cero.
d pueden ser del mismo tamao. A semejantes
casos ligados asignamos el mismo rango. El rango asignado es el promedio de los rangos que se
habran asignado si las d
hubieran diferido ligeramente. As, tres pares
pueden tener valores de
iguales a 1 , 1 y +1 . A cada pareja se le
1+2+3
=2 . La siguiente
3
asignara el rango 2, pues
reribiria el rango de 4,
porque los rangos 1, 2 y 3 ya se usaron.

Si dos pares hubieran tenido un valor de d
y la siguiente
igual a 1, ambas recibiran el rango de 1.5
mayor recibira el rango de 3. La costumbre de dar a las
observaciones ligadas el promedio de los rangos en lugar de los que realmente pueden
obtener un efecto despreciable sobre T , la estadstica en la que se basa la prueba de
Wilcoxon.
Para la aplicacin de estos principios en el manejo de ligas, vase ms adelante el
ejemplo para muestras grandes.
Muestras pequeas
Sea T
la suma ms pequea de los rangos sealados. Esto es,
es la suma de los
rangos positivos cuando es menor que la suma de los rangos negativos, o viceversa. En
la tabla G del apndice hay diferentes valores de T y sus niveles asociados de
significacin. Es decir, si una
observada es igual o menor que el valor dado en la
tabla G en un nivel particular de significacin para el valor observado de
N , la
hiptesis de nulidad puede rechazarse entonces a ese nivel de significacin.

La tabla G se adapta, tanto a pruebas de una como de dos colas. Puede usarse una
prueba de una cola cuando, despus de examinar los datos, el experimentador predice el
signo de la suma ms pequea de los rangos. Como en el caso de todas las pruebas de
una cola, se debe predecir la direccin de las diferencias.
Por ejemplo, si
rechazar
H0
T =3
al nivel
es la suma de los rangos negativos cuando

=0.02
al afirmar
H1
N=9 , se puede
que los dos grupos difieren,

18
asimismo se rechaza
H0
en el nivel
=0.01
H1
si
afirma que la suma de los
rangos negativos es la suma ms pequea.
EJEMPLO 1: PARA MUESTRAS PEQUEAS

Supongamos que un psiclogo infantil desea comprobar si la asistencia al jardn de nios tiene
algn efecto o capacidad de percepcin social de los nios. Califica la percepcin mediante una
evaluacin de las respuestas de los nios a un grupo de cuadros que representa una diversidad
de situaciones sociales, hacindoles una serie estndar de preguntas acerca de cada cuadro. Con
este artificio, obtiene un puntaje entre 0 y 100 para cada nio.
Aunque el investigador est seguro de que un puntaje ms alto representa una capacidad de
percepcin social mayor, no lo est con respecto a que los puntajes sean suficientemente
exactos para ser tratados numricamente; no cree que un nio cuyo puntaje es 60, sea
doblemente ms perceptivo socialmente que un nio cuyo puntaje es 30 ni que la diferencia
entre los puntajes de 60 y 40 sea de manera exacta doblemente mayor que la de los puntajes de
40 y 30. Sin embargo, est seguro de que la diferencia entre un puntaje de, digamos 60 y uno de
40 es mayor que la de un puntaje de 40 y uno de 30. Es decir, uno puede asegurar la exactitud
numrica de las diferencias, pero sostiene que son suficientemente significativas para calificarse
apropiadamente en orden de tamao absolutos.
Para probar el efecto de la asistencia al jardn de nios con los puntajes de percepcin social de
los nios, consigue 8 pares de gemelos idnticos como sujetos. Al azar, asigna un gemelo de
cada par al jardn de nios por un tiempo. El otro gemelo permanece fuera de la escuela. Al
final del plazo, se da a los 16 nios la prueba de percepcin social.
1.
Hiptesis de nulidad.
H 0 : la capacidad de percepcin social de los nios de
casa y de jardn de nios no difiere. En trminos de la prueba de wilcoxon, la suma

de los rangos positivos es igual a la suma de los rangos negativos.
H 1 : la
2.
capacidad de3 percepcin social de los dos grupos de nios difiere, es decir, la suma
de los rangos positivos no equivale a la suma de los rangos negativos.
Prueba estadstica. La de rangos sealados y pares igualados de Wilcoxon se
escoge como adecuada en un estudio que emplea dos muestras relacionadas y da
puntajes de diferencia que pueden clasificarse en orden de magnitud absoluta.
3.
Nivel de significacin. Sean

pares cuya
4.
6.
el nmero de pares (8), menos los
resulte cero.
Distribucin muestral. La tabla G incluye los valores crticos a partir

distribucin muestral de
5.
=0.05 y
T , para
de la
N 25 .
Regin de rechazo. Puesto que no se predice direccin de la diferencia, es apropiada

una regin de rechazo de dos colas. La regin de rechazo se compone de todos los
valores de
conforme
H 0 es igual o menor que =0.05
tan pequeos que la probabilidad asociada de su ocurrencia ocurre

para una prueba de dos colas.
Decisin. En este estudio ficticio, a los 8 pares de nios de casa y de jardn de

nios se les da la prueba de percepcin social despus de que los ltimos han
estado en la escuela durante cierto tiempo. Sus puntajes aparecen en la tabla 5.6. La
muestra que solamente dos pares de gemelos,
c y g , mostraron diferencias en la
19
direccin de mayor percepcin social con respecto al gemelo de casa. Y estos
puntajes de diferencia son muy pequeos: sus rangos son 1 y 3.
La menor de las sumas de los rangos sealados es
N=8 , una
1+3=4=T . La tabla G muestra que para
=0.05
de 4 nos permite rechazar hiptesis de nulidad en
prueba de dos colas. Por lo tanto, rechazamos
H0
y aceptamos
H1
para una
en este estudio
ficticio, concluyendo que las experiencias del jardn de los nios afectan la capacidad de
percepcin social de nio.
Vale la pena sealar que los datos de la tabla 5 se pueden tratar con la prueba de los signos,
menos poderosa. Para esa prueba,
de su ocurrencia conforme a
H0
x=2 y N =8 . De la tabla D da la probabilidad asociada

:
p=2 ( 0.145 )=0.290
para una prueba de dos colas.
Por lo tanto, con la prueba de los signos, nuestra decisin es aceptar
H0
en
=0.05 ,
mientras la prueba de Wilcoxon.
TABLA 5. Puntajes de capacidad de percepcin social de los nios en el jardn de nios

y en la casa
(Datos artificiales)
Pareja
Puntaje de la
capacidad de
percepcin
social
del
gemelo
asignado
al
jardn de nios
82
Puntaje de la
capacidad de
percepcin
social
del
gemelo
que
permaneci en
su casa
63
69
c
d
Rango de
19
42
27
73
74
-1
-1
43
37
Rango
de
signo menos
frecuente
20
58
51
56
43
13
76
80
-4
-3
65
82
T =4
H0
Sugiere rechazar
en ese nivel. Esta diferencia no es sorprendente, porque la
prueba de Wilcoxon utiliza ms la informacin de los datos. Ntese que la prueba de

Wilcoxon tiene en consideracin el hechos que los 2 d con signo de menos estn
entre las mas pequeas observadas, mientras la prueba de los signos no es afectada por
la magnitud relativa de los valores d 1 .
Muestras grandes. Cuando
es mayor que 25, la tabla G no puede usarse. Sin
embargo, puede mostrarse que en tales casos la suma de los rangos,
T , est
prcticamente distribuida en forma normal, de este modo:

media : T =
N ( N +1 )
4
desviacion estandar : T =
N ( N + 1)(2 N +1)
24
Por lo tanto,
N (N + 1)
T
T T
4
z=
=
..(5)
T
N ( N +1)(2 N + 1)
24
Esta prximamente distribuida en forma normal con media de cero y varianza de uno.
Asi, en la tabla A del apndice encontramos la probabilidad asociada con la ocurrencia
conforme a H 0 de varios valores tan extremos como cierto valor observado de z ,
calculado con la formula (5).
Para observar la excelencia de esta aproximacin, aun con muestras pequeas
trataremos los datos de la tabla 5.6, donde N=8 y por consiguiente, T =4 .
Sustituyendo los valores en la formula (5.5), tenemos:
(8)(9)
4
z=
=1,96
( 8)(9)(17)
24
4
21
H0
La tabla A seala que la probabilidad asociada con la ocurrencia conforme a

un valor de
tan extremo como
prueba de dos colas, la misma
1.96 , es
de
p=2 ( 0.025 )=0.05 , para una
p calculada a usar la tabla G con los mismos datos.
EJEMPLO 2: PARA MUESTRAS GRANDES

Los presidiaros de una prisin federal fueron sujetos de un estudio sobre la toma de
decisiones. En primer lugar, se midi individualmente la utilidad para los prisioneros
(valor subjetivo) de los cigarrillos, que eran negociables dentro de una prisin.
Empleando la funcin utilidad para cada sujeto, el experimentador trato de predecir las
decisiones del individuo en un juego con dos alternativas continuamente susceptibles de
eleccin, en la que se ganaran o se perdieran cigarrillos.
La primera hiptesis examinada supona que predecan mejor las decisiones de los
sujetos por medio de sus funciones de utilidad que cuando se supona que la utilidad de
los cigarrillos era igual a su valor objetivo. Por consiguiente esta ltima hiptesis
predeca la eleccin razonable en funcin del valor objetivo. Esta hiptesis se
confirm.
Sin embargo, como se esperaba, algunas respuestas no fueron predichas por esta
hiptesis de la mxima utilidad esperada. Anticipando este resultado, el investigador
haba formulado la hiptesis de que tales errores en la prediccin serian debido a las
diferencias de los sujetos ante las dos alternativas ofrecidas. En otras palabras, un
prisionero poda considerar ambas alternativas igualmente atractivas o faltas de inters,
y, por lo tanto, le sera indiferente elegir entre ellas. Elecciones as se predicen
difcilmente. Pero el sujeto poda vacilar considerablemente antes de hacer una decisin:
el tiempo de vacilacin entre las propuestas de la jugada y la declaracin de su decisin
sera alto. La segunda hiptesis supona que los tiempos de vacilacin al hacer las
elecciones que no haban sido predichas al llevar a un mximo la utilidad esperada,
seran ms largos que los tiempos de vacilacin de las elecciones predichas.
1.
Hiptesis de nulidad.
H 0 : no hay diferencia entre los tiempos de

H1
vacilacin de las decisiones predichas y las no predichas.
2.
3.
: los
tiempos de vacilacin de las decisiones no predichas son ms largos que los

tiempos de vacilacin de las decisiones predichas.
Prueba estadstica. se tom la prueba de rangos sealados y pares igualados
de Wilcoxon debido a la presencia de puntajes de diferencia de dos muestra
relacionadas (elecciones cuyas predicciones correctas y elecciones cuya
prediccin no lo es, hechas por los mismos prisioneros), donde cada sujeto es
su propio control.
Nivel de significacin. Sea =0.01 y N , el nmero de prisioneros que
sirvieron como sujetos, 30. (este valor de
N se reduce si la
de algn
prisionero es cero.)
22
4.
Distribucin muestral. Conforme a
H 0 , los valores de
z calculado con
la formula (5) estn distribuidos normalmente con media de cero y varianza

de uno. As, la tabla A contiene probabilidad asociada con la ocurrencia
conforme a H 0 de los valores tan extremos como cierto valor obtenido de
z .
Regin de rechazo. Se ha predicho la direccin de la diferencia, por lo tanto,
la regin de rechazo es de una cola. Si la diferencia es de la direccin
predicha, T , la suma menor de los rangos igualados, ser la suma de los
5.
rangos de los presos cuya
tiene una direccin opuesta a la predicha. La
regin de rechazo est formada por todos los valores de

los datos con
(obtenidos de
T ) tan extremos que la probabilidad asociada con su
ocurrencia conforme a
6.
H 0 es igual a o menor que =0.01 .
Decisin. Para cada sujeto se obtuvo un puntaje de diferencia
(d )
sustrayendo la mediana de su tiempo de decisiones predichas de la mediana

de su tiempo de decisiones no predichas. En la tabla 5 estn los valores de
d para los 30 presos y la dems informacin necesaria para calcular la
prueba de Wilcoxon. Una
menos indica una mediana de tiempo de
decisiones predichas mayor que la mediana de tiempo de decisiones no

predichas.
Para los datos de la tabla 5 , T =53.0 , valor de la menor de la suma de los rangos
igualados. Aplicamos la frmula (5):
N (N +1)
4
z=
(5)
N (N +1)(2 N + 1)
24
T
(26)(27)
4
z=
=3.11
(26)(27)( 53)
24
53
Ntese que tenemos
N=26 . Cuatro prisioneros obtuvieron medianas de tiempos
iguales para las decisiones predichas y no predichas y, as, sus

Asimismo, el valor de
es la suma de los rangos de los presos cuya
fueron cero.
d
estn en
23
direccin opuesta a la predicha; por tanto, se procede con una prueba de una cola. La
tabla A muestra que un valor de z tan extremo como 3.11 tiene una
H 0 , de
Probabilidad de una cola asociada con su ocurrencia, conforme a

p=0.0009 . En vista de que
la regin de rechazo, se rechaza
p es menor que =0.01 y el valor de

H 0 y se acepta
esta en
H 1 . Concluimos que los tiempos
de latencia de los prisioneros antes las decisiones no predichas fueron

significativamente ms largos que los tiempos de latencia antes las decisiones predichas.
Esta conclusin apoya la idea de las decisiones no predichas conciernen a las opuestas
iguales, o aproximadamente iguales, en la utilidad esperada por los sujetos.
RESUMEN DEL PROCEDIMIENTO.

Estos son los pasos de la prueba de rangos sealados y pares igualados de Wilcoxon:
1. Para cada par igualado se determina la diferencia de signo
puntajes.
2. Se ordenan estas
d 1 sin respetar el signo. Con las
(d 1)
entre los dos
ligadas, se asignan el
promedio de los rangos ligados.

Tabla 6. Diferencias de las medianas de los tiempos entre las decisiones de los presos, de
acuerdo y en desacuerdo con las predicciones hechas
Preso
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
-2
0
0
1
0
0
4
4
1
1
5
3
5
3
-1
1
-1
5
8
2
2
2
-3
-2
Rango de
-11.5
Rangos con signos

menos frecuentes
11.5
4.5
20.0
20.0
4.5
4.5
23.0
16.5
23.0
16.5
-4.5
4.5
-4.5
23.0
25.5
11.5
11.5
11.5
-16.5
-11.5
4.5
4.5
16.5
11.5
24
25
26
27
28
29
30
1
4
8
2
3
-1
4.5
20.0
25.5
11.5
16.5
-4.5
4.5
T =53.0
3. Se aade a cada rango el signo (+ o -) de la
que representa.
T , la ms pequea suma de los rangos igualados.

5. Se determina N , el numero total de d con un signo.
4. Se determina
6. El procedimiento para determinar la significacin del valor observado de
depende
del lado de N :
a) Si
es 25 o menor, la tabla G contiene los valores crticos de
diferentes tamaos de
N . Si el valor observado de T
para
es igual o menor que el
dado en la tabla, para un nivel de significacin particular y una
particular,
H 0 puede se rechazada en ese nivel de significacin.

b) Si
es mayor que 25, se calcula el valor de
Se determina su probabilidad asociada conforme a

prueba de dos colas se duplica el valor de
, se rechaza
menor que
definido por la formula (5).
H 0 con la tabla A. Para una
p . Si la
obtenida es igual o
H0 .
POTENCIA EFICIENCIA
Cuando las suposiciones de la prueba paramtrica
asinttica cercana a
H0
comparada con la prueba
en verdad se satisfacen, la eficiencia
de la prueba de rangos sealados y pares igualados de Wilcoxon,
es de
3
=95.5 (Mood, 1954). Esto significa que 3/
es
la proporcin lmite de tamaos de muestras necesarias para que las pruebas de Wilcoxon y
alcancen el mismo poder. Para muestras pequeas, la eficiencia se acerca al
95 .
TABLA G: Tabla de valores crticos de T en la prueba de los rangos sealados de pares

igualados de Wilcoxon
25
Nivel de significacin para

prueba de una cola
.025
N
Nivel de significancia para

prueba de dos colas
.05
0
2
4
0
6
2
8
3
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
.005
.01
11
5
14
7
17
10
21
13
25
16
.02
.01
-
2
3
5
7
10
13
16
20
30
20
35
23
40
28
46
32
52
38
24
59
43
66
49
73
55
81
61
89
68
49
28
33
38
43
56
62
69
77
26
EL USO DE LAS PRUEBAS ESTADISTICAS EN INVESTIGACIN

En las ciencias de la conduca se efectuan investigaciones para determinar en que
medida son aceptables la hipotesis que derivamos de las teorias de la conducta. Despues
de seleccionar cierta hipotesis que parece importante en una teoria determinada, se
recogen los datos empiricos que dan imformacion directa acerca de la aceptabilidad de
esa hiptesis. La decision cerca del significado de los datos puede conducir la
comfirmacin, revisin o rechazo de la hipotesis y con ella, la teoria que la origino.
Para decidir con objetividad si una hiptesis particular es comfirmada por un conjunto
de datos, nescesitamos un procedimiento que nos lleve a un criterio objetivo para
rechazar o aceptar esa hipotesis. Se insite en la objetividad porque el metodo cientifico
requiere que las conclusiones sean alcanzadas por metodos pblicos susceptibles de ser
repetidos por otros investigadores competentes.
Este procedimiento objetivo debe basarse tanto en la informacion obtenida al investigar
como en el margen de riesgo que estemos dispuestos a aceptar si nuestro criterio de
decisin con rspecto a ala hiptesis respecta incorrecto.
El procedimiento que por lo comn, comprende varios pasos, los cuales enunciamos en
el orden de su ejecucin.
1. Formulacin de la hiptesis de nulidad ( H 0 )
2. Eleccion de una prueba estadstica (con su modelo estadistico asociado) para
probar ( H 0 ) . De las pruebas capaces de usarse con un diseo de investigacion
dado, hay que escoger aquella cuyo modelo se aproxima mas a las condiones de
la investigacin (en terminos de los supuestos que califican el uso de la prueba)
y cuyos requisitos de medicin satisfacen las medidas usadas en la investigacin.
3. Especificacin del nivel de significancia ( ) y del tamao de la muestra
(N)
4. Encuentro (o suposicin) de la distribucin muestral de la prueba estadstica
conform ( H 0 ) .
5. Sobre la base de incisos II,III,IV, definicion de la regin de rechazo
6.
Clculo del valor de la prueba estadistica con los datos obtenidos de la ( s )

muestra
( s ) . S i el valor desciende a la regin de rechazo
( H0)
debe
rechazarse al nivel de significacion escogido.

En la mayoria de los casos, se dan uno o ms ejemplos del uso de la prueba en la
investigacin. Cada ejemplo sigue los seis pasos sealados antes. Comprender a a cada
uno de ellos es primordial para entender el papel de la estadistica al probar una
hiptesis de investigacin.
27
LA HIPTESIS DE NULIDAD
El primer paso en el procesimiento de hacer decisiones es enunciar la hipotesis de
nulidad ( H 0 ) . La hipotesis de nulidad es una hiptesis de diferencias nulas. Es
formuladas por lo comn con la intencin expresa de ser rechazada. Si se rechaza,
puede aceptarse entonces la hiptesis alterna ( H 1 ) . La hipoteis alterna es la
aseveracin operacional de la hipotesis de investigacin del experimentador. La
hiptesis de investigacion es la prediccin que se de rivade la teoria que se est
probando. Al hacer una decisin acerca de diferencias, sometemos a prueba a ( H 0 )
frente a ( H 1 ) . ( H 1 ) constituye la firmacin aceptada cuando ( H 0 ) es rechazada.
Supongamos que cierta teora cientificosocial nos conduce a predecir que dos grupoes
especificos de personas difieren en cuanto al tiempo que pasan leyendo el periodico
(esto constituir nuestra hiptesis de investigacin). Al comfirmarse esta prediccion
recibira apoyo la teoria cientificosocial de la que derivada. Para probar esta hipoteis de
investigacion, la enunciamos en forma operacional como hiptesis de investigacion, la
enunciamos en forma operacional como la hiptesis alterna, ( H 1 ) .
( H 1 ) ser tal que 1 2 , es decir, que la cantidad media de tiempo empleada en la

lectura del periodico por los miembros de las dos pblaciones es desisgual.
ser tal que
( H0)
1=2 , esto es , que la cantidad media de tiempo es empleada en leer el
peridico por los miembros de las dos poblaciones es la misma.Si los datos nos
permitieran rechazar ( H 0 ) , entonces ( H 1 ) , podria ser aceptada, y esto apoyaria la
hipotesis de investigacion y la teoria en la que se basa.
La naturaleza de la hipteis determina cmo debe ser formulada
( H 1 ) . Si la hipotesis
de investigacion simplemente dice que los dos grupos difieren con respecto a las
medias, entonces ( H 1 ) ser 1 2 . Pero si la teora predice la direccin de la
diferencia, es decir, que un grupo especifico tiene una media mayor que el otro,
entonces ( H 1 ) puede ser 1 > 2 o que 1 < 2 (donde significa mayor
que y significa menor que).
LA ELECCION DE LA PRUEBA ESTADSTICA

El campo de la estadstica se ha desarrolado hasta el grado en que actualmente se cuenta, para
casi todo los propsitos de investigacin, con pruebas estadsticas suceptibles de usarse
alternativamente para tomar decisiones acerca de la hipotesis. Al comparar las pruebas,
nescesitamos una base racional para escoger entre ellas.
NIVEL DE SIGNIFICAIN Y EL TAMAO DE LA MUESTRA

Cuando la hipotesis de nulidad y la hipotesis alterna han sido enunciadas y cuando la
prueba estadistica apropiada a la investigacin ha sido seleccionada, el paso siguiente
28
consiste en especificar el nivel de significacicin
( )
y seleccionar un tamao de la
muestra (N).
En forma breve, este es el procedimiento para hacer decisiones: antes de escoger los
datos, se especifica el conjunto de todas las posibles muestras que se encuentran si
( H 0 ) es verdadera. De este conjunto se extrae un subconjunto de muestras de
caracteristicas tan extremas que
( H 0 ) , es verdadera, de que la muestra que de
Reduceb mucho la probabilidad, si
hecho se observa est entre ellas. Por tanto, si en la investigacion se observa una
muestra incluida en ese subconjunto, se rechaza ( H 0 ) .
Dicho de otra manera, nuestro procedimiento es rechazar
( H 0 ) para aceptar dicho
( H 1 ) , si una prueba estadistica produce un valor cuya probabilidad asociada de

ocurrencia bajo
. Esta pequea probabilidad se llama nivel de significacion. Valores comunes
por
de
( H 0 ) es igual o menor que alguna pequea probabilidad simbolizada
son 0.0.5 y 0.0.1. En otras palabras, si la probabilidad asociada con lo que
ocurre en
( H 0 ) , es decir, cuando la hiptesis de nulidad es verdadera, del valor
particular producido por una prueba estadistica es igual o menor que
( H0)
y aceptamos
( H1)
, rechazamos
que es la aseveracin operacional de la hiptesis de
investigacin.
Puede verse que en el nivel
hay la probabilidad de rechazar
equivocamente. Esta interpretacion de
( H0)
falsa o
sera ampliada cuando se estudie el error
tipo I.
Puesto que el valor de
juega un papel al determinar el rechazo de
aceptacion, la objetividad exige que el valor de
( H 0 ) o su
quede indicado
Antes de escoger los datos. El nivel que el investigador escoge para
antes de
recoger los debera determinarse por la estimacion que haga de la importancia o del
posible significado practico de sus descubrimientos. Por ejemplo, al estudiar los
posibles efectos reapeuticos de la cirugia del cerebro, el investigador debe escoger un
nivel de significacion mas bien severo, pues el peligro implicado en un rechazo
incorrecto de la hiptesis de nulidad es muy grande. Al imformar acerca de sus
descubrimientos, el investigador debe indicar el nivel de probabilidad real asociado con
ellos, de manera que el lector pueda juzgar por si mismo si la hipoteisi de nulidad debio
ser efectivamente rechazada. Un investigador puede escoger para su trabajo el nivel
29
0.05, pero algn lector podra rehusarse a aceptar la validez de cualquier descubrimiento
que no sea significativo a los nivles 0.0.1, 0.005 o 0.001, mientras otro lector puede
interesarse en cualquier descubrimiento a niveles 0,08 o 0,10. El investigador debe dar a
sus lectores, cuando ello sea posible, informacion suficiente por medio del nivel de
probabilidad asociado con su estudio.
En la teoria contemporanea de la decision estadistica se han rechazado los
procedimientos que implican una adhesion a nivle de significacion, por ejemplo de 0,05
o 0,01, escogido arbitrariamente, y se favorece el uso de procedimientos en los que las
decisones se hacen con terminos de funciones de perdida, utilizando principios como el
de minimax( minimizar la prdida mxima). El lector interesado en este enfoque puede
consulatr los estudios de BLACKWELL y GIRSHICK (1954), Savage (1954) o Wald
1950. Aunque es evidente la conveniencia de esta tecnica para establecer un criterrio de
decision, las posibilidades de aplicacion practica son dudosas en una buena parte de la
investigacion relativa a las ciencias de las conductas, debido a que crecemos de la
informacion que construiria la base del uso de las funciones de perdida.
Una practica comn, que ilustra esta idea de diferentes investigadores y lectores
manteniendo con diferentes con diferentes puntos de vista acerca de las perdidas o
ganancias involucradas al llevar a cabo un descubrimiento cientificosocial, consiste para
el investigador en reportar simplemente el nivel de probabilidad asociado con su
descubrimiento sealando que la hiptesis de nulidad puede rechazarse a ese nivel.
Hay dos tipos de errores que pueden contenerse al decidir acerca de ( H 0 )
( H 0 ) siendo verdadera. El segundo, el error
El primero, el error de tipo I es rechazar

tipo II, es aceptar
( H 0 ) siendo falsa.
La probabilidad de cometer el error tipo I esta dada por

tanto mas probable es que
Cuando mayor sea
( H 0 ) sea rechazada equivocadamente, es decir, tanto mas
probable es que se comete el error tipo I. El error tipo II se suele representar por
indicaran tanto el tipo de error como la probabilidad de cometerlo. Esto
es:
p(error tipo I )=
p(error tipo II )=
En condiciones ideales, los valores de
deberian ser especificados por el
experimentador antes de iniciar la investigacion. Estos valores determinaran que tamao de

muestra (N) tendra que escoger para calcular la prueba estadstica que haya escogido.
Sin embargo, en la prctica es comn que
vez que
y N queden especificados por adelantado. Una
y N han sido especificados, queda determinada
.En vista de que hay una

30
relacion inversa entre las probabilidades de cometer uno de los dos tipos de errores, al decrecer
se incrementara
para cualquier N dada. Si se desea reducir la posibilidad de ambos
tipos de errores, se debe incrementar N.

Debe quedar claro que en cualquier inferencia estadstica existe el peligro de cometer uno de los
dos tipos de errores, y que el experimentador debe alcanzar un equilibrio ptimo entre las
probabilidades de cometer cualquiera de los dos errores. Las diversas pruebas estadsticas
ofrecen posibilidades de equilibrios diferentes. Para obtener este equilibrio es importante la
nocin de la funcin de potencia de una prueba estadstica.
La potencia de una prueba se define como la probabilidad de rechazar
( H0)
cuando es
realmente falsa. Esto es:
potencia=1 probabilidad del error tipo II=1

Las curvas de la Figura 1 muestran que las probabilidades de cometer un tipo de error II (
) disminuyen a medida que el tamao de la muestra (N) incrementa, de modo que la potencia
aumenta al crecer el tamao de N. La figura 1 ilustra el incremento de la potencia de una
prueba de dos colas de la media que se produce con muestras de tamaos cada vez mayor,
siendo N sucesivamente igual a 4,1O, 20,50 y 100. Estas muestras se tomaron de poblaciones
normales con varianza
.La media bajo la hiptesis de nulidad se simboliza aqu con
0. La figura 1 tambien ilustra la probabilidad de rechazar

es verdadera, es decir, cuando la media verdadera es igual a
N= 100
( H0)
es 0,05 cuando
( H0)
0.
N= 50 N= 20
1
.9
.8
.7
( H0)
.6
Probabilidad de rechazar
= 0.5
.4
.1
.3
.2
.1
0
3
0 0
+2
+3
Fig. 1. Curvas de potencia de una prueba de dos colas en
=0.05
con diferentes
tamaos de muestra.
31
Esto es lo que debera suceder, al ser

rechazar
=0.05
quedan aun probabilidades de
siendo verdadera.
El lector debe comprender los cinco puntos siguientes, que resumen lo dicho acerca del
nivel de significacin y del tamao de la muestra:
1. El nivel de significacin
comprende las probabilidades de obtener en una
prueba estadstica un valor que implica el rechazo de la hiptesis de nulidad,

siendo en realidad verdadera. Esto es, el nivel de significacin indica la
probabilidad de cometer el error tipo I.
2. La probabilidad de que una prueba estadstica produzca un valor conforme al
cual la hiptesis de nulidad ser aceptada cuando en realidad es falso queda
.Esto es, seala la probabilidad de cometer el
comprendida como
error tipo II.
3. La potencia de una prueba, 1-
, mide la probabilidad de rehazar
acertadamente la hipotesis de nulidad (es decir cuando es falsa).

4. La potencia est relacionada con la naturaleza de la prueba estadstica elegida.
5. En trminos generales, la potencia de una prueba estadstica se incrementa al
aumentar N.
LA DISTRIBUCION MUESTRAL
Una vez que un experimentador ha escogido una prueba estadstica para aplicarla a sus
datos, en seguida debe determinar cul es la distribucin muestral de la estadstica de la
prueba.
La potencia esta tambin relacionada con la naturaleza de
H1
. Si
H1
tiene
direccion, se usa una prueba de una cola.Una prueba de una cola es mas poderosa que
una de dos. Esto es claro al considerar la definicion de potencia.
La distribucion muestral es una distribucin terica. La obtendramos al tomar al azar
todas las muestras posibles de un mismo tamao extradas de una misma poblacin.
Expresado de otra manera, la distribucin muestral es la distribucin, conforme a
( H 0 ) , de todos los valores posibles que es una estadstica (por ejemplo, la media
maestral
x ) puede tomar cuando es calculada con muestras de igual tomadas al azar.
La distribucin muestral de una estadstica sealada las probabilidades conforme a

( H 0 ) , que estan asociadas con los diferentes valores numricas posibles de la
estadstica. La probabilidad "asociada con" la ocurrencia de un valor particular de la
estadstica conforme a ( H 0 ) , no es la probabilidad exacta de precisamente ese valor.
La expresion "las probabilidades asociadas con la ocurrencia conforme a
( H 0 ) " se
usa aqui para referirse a la probabilidad de un valor particular mas la probabilidad de

todos los valores mas extremos posibles. Esto es, "la probabilidad asociada" o "la
probabilidad asociada con la ocurrencia conforme a ( H 0 ) " es la probabilidad que la
32
ocurrencia conforme a
( H 0 ) un valor tan extremo o mas que el valor particular de la
prueba estadistica. En este libro usaremos frecuentemete las frases anteriores y en cada
caso tendran el significado ya expresado.
Supongamos que nos interesara la probabilidad, de que caigan tres caras cuando se tiran
tres monedas 'legales' simultneamente. La distribucin muestral del nmero de las
caras podra sacarse de la lista de todos los resultados posibles de esa accin que
aparece en la tabla 7. El nmero total de eventos posibles (combinaciones de caras y
cruces) es ocho, de los cuales solo uno nos interesa: la ocurrencia conforme ha ( H 0 ) ,
de tres caras al tirar tres monedas es 48. Aqu,
( H 0 ) , es la afirmacin de que las
monedas son 'legales', lo que significa que para cada moneda la probabilidad de una
cara es igual a la probabilidad de una cruz.
Tabla 7. Resultados posibles del lanzamiento de tres monedas
RESULTADOS
1
Moneda 1
Cara
Cara
Cara
Cara
Cruz
Cruz
Cruz
Cruz
Moneda 2
Cara
Cara
Cruz
Cruz
Cara
Cara
Cruz
Cruz
Cruz
Cara
Cruz
Cara
Cruz
Cara
Cruz
Moneda
Cara
De manera, la distribucin de todos los eventos posibles nos ha mostrado la

probabilidad de ocurrencia conforme a ( H 0 ) , del evento en que estamos interesados.
Es obvio que sera prcticamente imposible utilizar este mtodo que comprende todos
los resultados posibles al anotar las distribuciones muestrales, aun con muestras
moderadamente grandes y tomadas de poblaciones grandes. En estas circunstancias
podemos confiar en la autoridad de los enunciados provenientes de teoremas
matemticos "demostrados".
Estos teoremas invariablemente parten de hiptesis y al aplicarlos debemos tener en
cuenta dichas hiptesis. Por lo comn, estas hiptesis se refieren a la distribucin de la
poblacin y/o al tamao de la muestra.
Un ejemplo de tales teoremas es el teorema del lmite central.
33
Cuando una variables est distribuida normalmente, su distribucin se caracteriza

completamente por la media y la desviacin estndar. Debido a esto, sabemos, por
ejemplo, que la probabilidad de que un valor observado de las variables difiera de la
media en ms de 1.96 desviaciones estndares es menor que 0.05
Supongamos, pues, que deseamos saber, antes de tomar la muestra, cual es la
probabilidad asociada con la ocurrencia de un valor particular de x (la media
( H 0 ) , de la
aritmetica de la muestra), por ejemplo, la probabilidad conforme a

ocurrencia de un valor por lo menos tan grande como un valor de
muestra se toma al azar de
estndar
alguna poblacin cuya medida
las
, cuando la
y desviaciones
conocemos. Una version del teorema de lmite central establece que:
Si una variable est distribuida con la media igual a

a
y desviaciones estndar igual
, y se recogen muestras aleatorias de tamao N, las medias de estas muestras,

x
, estarn de manera aproximadamente distribuidas normalmente con media de
y desviaciones estndar de
/ N
para una magnitud de N suficientemente
grande.
En otras palabras, si N es suficientemente grande, la distribucin muestral de
x .
a) ser aproximadamente normal.

b) tiene una media igual a la media de la poblacional .
c) tiene una desviacin estndar igual a la desviacin estndar de la poblacin
dividida entre la raz cuadrada del tamao dela muestra, esto es x = / N
Por ejemplo, supongamos que en una poblacin formada por estudiantes, una prueba
determinada ha medido la distribucin de cierto atributo psicolgico de tal modo que
=100
y =16
Deseamos medir la probabilidad de que al recoger una muestra
x , sea igual a 104.
El teorema del lmite central nos dice que la distribucin muestral de las
de todas
las posibles muestras de tamao 64 estar
LA REGION DE RECHAZO
La regin de rechazo es una regin de la distribucin muestral. Esta incluye todos los
valores posibles que una prueba estadstica puede tomar conforme a H0; la regin de
rechazo se compone de un subconjunto de estos posibles valores, de manera que la
probabilidad de ocurrencia de una prueba estadstica conforme a H 0 cuyo valor este en
ese subconjunto, sea .
34
En otras palabras de la regin de rechazo consiste de un conjunto de valores posibles tan

extremos que, cuando H0 es verdadera, es muy pequea la probabilidad ( ) de que la
muestra observada produzca un valor que este entre ellos. La probabilidad asociada con
cualquier valor de la regin de rechazo es igual o menor que .
La localizacin de la regin de rechazo es afectada por la naturaleza H1. Si H1 indica la
direccin predicha de la diferencia, entonces se requiere una prueba de una cola. Si H 1
no indica la direccin de la diferencia predicha, entonces se requiere una prueba de dos
colas.
Las pruebas de una y de dos colas se distinguen en la localizacin (per no en el tamao)
de la regin de rechazo. Esto es, en una prueba de una cola, la regin de rechazo est
totalmente en un extremo (o cola) de la distribucin muestral. En una prueba de dos
colas, la regin de rechazo esta en ambos extremos de la distribucin muestral.
El tamao de la regin de rechazo queda expresado por , que es el nivel de
significacin. Si
= 0.05, entonces el tamao de la regin de rechazo es del cinco
por ciento del rea total comprendida bajo la curva de la distribucin muestral. Las
regiones de rechazo de una y de dos colas en = 0.05 aparecen en la figura 2.
Obsrvese que estas dos regiones de rechazo difieren en su localizacin pero no en su
tamao total
LA DECISION
Si la prueba estadstica de un valor que est en la regin de rechazo, se rechaza H 0. De
dos maneras: suponiendo que la hiptesis de nulidad es falsa o que un evento raro e
improbable he sucedido. En este proceso de decisin, escogemos la primera de las
explicaciones. Ocasionalmente, por supuesto, la segunda puede ser la correcta. De
hecho, la probabilidad de que la segunda explicacin sea correcta est dada por ,
pues el rechazo de H0 cuando es verdadera es el error tipo I.
Cuando la probabilidad asociada con un valor observado de una prueba estadstica es
igual o menor que el valor previamente determinado de , concluimos que H0 es
falsa. El valor observado es llamado significativo. La hiptesis en prueba, H 0, se
rechaza siempre que ocurra un resultado significativo. Por tanto, se llama valor
significativo a aquel cuya probabilidad asociada de ocurrencia de acuerdo con H0 (tal
como la presenta la distribucin muestral) es igual o menor que .
EJEMPLO 1:
Las exposiciones de las diversas pruebas estadsticas no paramtricas van acompaadas
de muchos ejemplos de decisiones estadsticas en este libro. He aqu un ejemplo del
proceso de una decisin estadstica, que ilustra los puntos tratados en este captulo.
Supongamos que tenemos sospechas de que cierta moneda no es legal. Nuestra
sospecha proviene que la moneda tiende a caer de cara. Para probar esta sospecha (que
podemos dignificar llamndola hiptesis de investigacin), decidimos tirar la moneda
12 veces para observar la frecuencia con que ocurre la cara.
35
1. Hiptesis de nulidad. H0: p (caras) = p (cruces) =
1
2 . Esto es, para la moneda
no hay diferencia entre la probabilidad de ocurrencia de una cara y la

probabilidad de ocurrencia de una cruz; la moneda es legal. H 1: p (caras)
p (cruces).
2. Prueba estadstica. La prueba estadstica apropiada para esta hiptesis es la
prueba binomial, que se basa en el desarrollo binomial.
3. Nivel de significacin. Decidimos de antemano usar = 0.01 como nuestro
nivel de significacin. N = 12, es el nmero de lanzamiento por separado.
4. Distribucin muestral. La distribucin muestral que da la probabilidad de
obtener x caras y N x cruces bajo la hiptesis de nulidad (la hiptesis de que la
moneda es legal) est dada por la funcin de distribucin binomial:
N!
x N-x
x ! ( Nx ) ! P Q ; x = 0, 1, 2,, N. El razonamiento en que se apoya este
proceso de decisin es muy simple. Si es muy pequea la probabilista asociada
con la ocurrencia conforme a la hiptesis de nulidad de un valor particular en la
distribucin muestral, podemos explicar la ocurrencia efectiva de ese valor.
TABLA 8. Distribucin muestral de x (nmero de caras) para 2 12 muestras de

tamao N = 12
Numero de caras
12
11
10
Distribucin muestral
(Frecuencia espera de ocurrencia si
se tomara 212 muestras de 12
lanzamientos)
1
12
66
36
9
8
7
6
5
4
3
2
1
0
220
495
792
924
792
495
220
66
12
1
______
Total = 212 = 4096
En la tabla 8, aparece como distribucin muestral de x el nmero de caras. En la

distribucin muestral tenemos que el resultado ms probable de lanzar una moneda 12
veces es un recuento de 6 caras y 6 cruces. La obtencin de 7 caras y 5 cruces es
solamente un poco menos probable. Pero la ocurrencia de 12 caras en 12 lanzamientos
es realmente muy improbable, como lo es la ocurrencia de 0 caras (12 cruces).
5. Regin de rechazo. Puesto que H1 tiene direccin, se usara una prueba de una
cola de modo que la regin de rechazo quede totalmente en un extremo de la
distribucin muestral. La regin de rechazo consiste de todos los valores de x
(nmero de caras) tan grandes que la probabilidad asociada con su ocurrencia
conforme a H0 es igual o menor que = 0.01.
La probabilidad de obtener 12 caras es
0.00024 es menor que
1
=0.00024 . Puesto que p =
4096
= 0.01, la ocurrencia de 12 caras se ubica con
claridad dentro de la regin de rechazo.

La probabilidad de obtener 11 o 12 caras es
1
12
13
+
=
=0.0032
4096 4096 4096
En vista de que p = 0.0032 es menor que
= 0.01, la ocurrencia de 11 caras
tambin est en la regin de rechazo.

La probabilidad de obtener 10 caras (o un valor ms extremo: 11 o 12 caras) es
1
12
66
79
+
+
=
=0.019 . Como p = 0.019. Como p = 0.019 es mayor que
4096 4096 4096 4096
= 0.01, la ocurrencia de 10 caras no est en la regin de rechazo. Por tanto si 10
caras o menos resultan en nuestra muestra de 12 lanzamientos no podemos rechazar H 0
al nivel de significacin = 0.01.
37
CONCLUSIONES
Cuando las suposiciones de la prueba paramtrica
verdad se satisfacen, la eficiencia asinttica cercana a
(vase pgina 39) en

H0
de la prueba de
rangos sealados y pares igualados de Wilcoxon, comparada con la prueba

es de
3
=95.5
(Mood, 1954). Esto significa que
3/
es la proporcin
lmite de tamaos de muestras necesarias para que las pruebas de Wilcoxon y

t alcancen el mismo poder. Para muestras pequeas, la eficiencia se acerca al
95 .
Podemos concluir que las pruebas estadsticas no paramtricas son tpicamente
muchos ms fciles de aplicar que las pruebas paramtricas.
Analizando el estimador de la media muestral se concluye que para las
distribuciones continuas y discretas los dos mtodos de estimacin trabajados
proporcionan las mismas medidas descriptivas con una precisin de tres dgitos
como lo son: la media, la varianza, el error promedio de estimacin
El estimador insesgado de la varianza y el estimador de la media poblacional
que tambin es insesgado para distintos valores de los parmetros poblacionales
en distribuciones continuas y discretas
Aplicar los datos una vez escogida la prueba estadstica.
El anlisis de varianza de una clasificacin por rangos de KRUSKAL-WALLIS
es una prueba extremadamente til para decidir si k muestras independientes son
de poblaciones diferentes.
38
Los pasos para desarrollar el mtodo de KRUSKAL-WALLIS, son muy
importantes.
BIBLIOGRAFIA
DOCUMENTOS DE TESIS PDF (S.F). ESTADISTCA APLICADA, 23 de
junio
del
2016.
Sitio
Web:
http://tesis.uson.mx/digital/tesis/docs/10048/Capitulo4.pdf
GOOGLE BOOKS (S.F). DISTRIBUCION NO PARAMETRICA, 4 de julio del
2016.
Sitio
Web:
https://books.google.com.pe/books?
id=paXp0kwQB8sC&pg=PA11&dq=distribucion+no+parametrica&hl=es&sa=
X&ved=0ahUKEwiTnJvnoLrNAhWCKiYKHUSJAHEQ6AEINjAD#v=onepag
e&q=distribucion%20no%20parametrica&f=false
MODULO EXEL (2005). ESTADISTICA NO PRARAMETRICA, 4 de julio del
2016.
Sitio
Web:
http://datateca.unad.edu.co/contenidos/208041/Modulo_EXE/leccin_11_estadsti
ca_no_paramtrica.html
GEOCIENCIAS UNAM PDF (S.F). ESTADISTICA NO PARAMETRICA, 7 de
julio
del
2016.
Sitio
Web:
http://www.geociencias.unam.mx/~ramon/MCenP2/Clase9.pdf
39
ANEXOS
40
41

Estadistica No Parametrica

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Estadistica No Parametrica

Hochgeladen von

Copyright:

Verfügbare Formate

ESTADSTICA

UNIVERSIDAD NACIONAL JOSE FAUSTINO SANCHEZ CARRION

AO DE LA CONSOLIDACIN DEL MAR GRAU

: INGENIERA QUMICA Y METALRGICA

: MUOZ VILELA, Julio

ANICETO AGUACONDO, Grecia Danae

El trabajo monogrfico est dedicado a

Las pruebas paramtricas requieren supuestos acerca de la naturaleza o forma de las

las proporciones de nacimientos de hombres y mujeres como prueba de la sabidura de

ANALISIS DE VARIANZA DE UNA CLASIFICACION POR

gl=k 1 , siempre que los tamaos de las diferentes k muestras no

sean demasiado pequeas. Esto es,

nj =nmero de casos en la muestra de orden j

, el nmero de casos de todas las muestras combinadas

Rj=suma de rangos en la muestra de orden j

Indica sumar las k muestras

Est distribuida aproximadamente como chi cuadrado

gl=k 1 , para tamaos muestrales (

nj>5 , la probabilidad asociada

de valores tan grandes como el de una H observada,

para el valor observado de

puede rechazarse en ese nivel de

cuando las 3 muestras

EJEMPLO 1: PARA MUESTRAS PEQUEAS.

H 0 : no hay diferencia entre los promedios de puntaje F

de los profesores orientados a la enseanza, los profesores orientados a la

2. Prueba estadstica: como son 3 los grupos independientes en estudio, se

n1=5 , el nmero de profesores orientados a la enseanza;

n2=5 , el nmero de profesores orientados a la administracin, y

4. Distribucin maestral: para k=3 y valores pequeos de

seala la probabilidad asociada con la ocurrencia conforme a

tan grandes como el de una H observada.

Tabla 1. Puntajes de autoritarismo de tres grupos de educadores (Datos ficticios)

(22) (37) (46)

La referencia de la tabla O seala que cuando las n j son 5,5 y 4,

p<0.049 . En vista de que

=0.05 , nuestra decisin en este estudio ficticio es

H 1 . Concluimos que los tres grupos de educadores

especificados difieren en grado de autoritarismo.

(Cuando t es el nmero de observaciones ligadas en un grupo de puntajes

Indica sumar en todos los grupos de ligas.

en un nivel de significacin ms severo por

EL CASO DE k MUESTRAS INDEPENDIENTES

EJEMPLO 2: PARA MUESTRAS GRANDES

: no hay diferencia en los pesos de nacimiento

promedio de cerdos de diferentes tamaos de camada.

H 0 de valores tan grandes como el de

una H observada puede determinarse consultando la tabla C.

es igual a o menor que =0.05 .

Tabla 3. Pesos en libras al nacer, de ocho camadas de cerdos Poland China,

1. Decisin: los pesos de nacimiento de los 56 cerdos pertenecientes a las 8

El ms pequeo de los cerdos, el ltimo miembro de la camada 1, peso 1,1 libras y se

sin corregir el efecto

de las ligas con la formula (1):

( 317 )2 ( 216,5 )2 ( 414 )2 ( 277,5 )2 ( 105,5 )2 ( 122 )2 ( 71,5 )2 ( 72 )2

indica que una

en cada caso. Nuestro conteo arrojara los resultados siguientes:

Obsrvese que para cualquier valor particular de t, el valor de T es una constante.

( 6+60+6+ 6+60+120+ 60+ 60+24+ 336+210+6+6 )

valor tan grande como

p<0,01 . Ya que esta probabilidad es

menor que el nivel de significacin previamente fijado,

muestra que la probabilidad asociada con la ocurrencia conforme a