Beruflich Dokumente
Kultur Dokumente
Diseos Experimentales
UNIDAD 2
DISEOS CON UN FACTOR Y COMPARACIONES MLTIPLES
Mrida, Yucatn
2016
Especializacin en Estadstica
Diseos Experimentales
Contenido
2.1. Diseo completamente aleatorizado. Modelo, anlisis estadstico (estimacin,
anlisis de varianza, intervalos de confianza y pruebas de hiptesis).
2.2. Caso desbalanceado.
2.3. Verificacin de supuestos del modelo: normalidad, homocedasticidad,
independencia, datos atpicos.
2.4. Comparaciones mltiples.
2.5. Potencia de la prueba F y determinacin del tamao de la muestra.
2.6. Transformacin de datos.
2.7. Prueba de Kruskal-Wallis.
2.8. Comparaciones mltiples no paramtricas.
2.9. Modelo de efectos aleatorios.
Introduccin
Para una mejor comprensin de dichos mtodos estadsticos, a continuacin se presentan los
resultados fundamentales involucrados en el diseo y anlisis de datos por medio del ANDEVA
en situaciones experimentales en las que se apliquen diseos con un factor
Ejemplo 1
Un gerente de mercadotecnia de una cadena de una lnea de productos de cmputo, le interesa
saber si hay diferencias en las ventas de sus productos en tres ciudades. Elige al azar 15 tiendas
similares (5 por ciudad) entre las que integran la cadena. Las variables bajo control directo de
la compaa, como precio y publicidad, se mantuvieron al mismo nivel en los 30 das del
experimento y se registraron las ventas (en miles) para dicho periodo. Utilice un nivel de
significancia de 0.05.
Ventas (en miles)
Ciudad 1 Ciudad 2 Ciudad 3
10 16 15
14 18 12
18 22 8
15 18 10
12 15 13
Resistencia del papel a la tensin (lpc: libra-fuerza por pulgada cuadrada, psi)
5% 10% 15% 20%
7 12 14 19
8 17 18 25
15 13 19 22
11 18 17 23
9 19 16 18
10 15 18 20
Se estudiar el anlisis de varianza, tcnica que nos permite hacer inferencias simultneas sobre
parmetros de tres o ms poblaciones. Especficamente en esta seccin, se tratar el anlisis de
varianza de observacin nica para un diseo completamente aleatorizado. La tcnica se
denomina anlisis de varianza de una va, en virtud de que cada respuesta u observacin se
categoriza de acuerdo con un solo criterio de clasificacin: el tratamiento al cual pertenece.
Notas:
1. Las unidades experimentales a las cuales se aplican los tratamientos deben ser tan
homogneas como sea posible (en lo nico que debe diferir las unidades experimentales es
en los tratamientos que recibirn para compararse). Cualesquiera fuentes de variabilidad
extraas tendern a inflar el error experimental, haciendo ms difcil detectar diferencias entre
los efectos de tratamientos.
1 2 3 a
y11 y21 y31 ya1
y12 y22 y32 ya2
y13 y23 y33 ya3
. . . .
. . . .
. . . .
y1n y2n y3n yan
Prom y 1. y 2. y 3. y a.
i=1, 2,,a
Yij=+i+ij
j=1, 2,,n
En donde yij es la ij-sima observacin (valor de la j-sima rplica bajo el tratamiento i), es un
parmetro comn a todos los tratamientos denominado media general o global, i es un parmetro
asociado con el i-simo tratamiento llamado efecto del i-simo tratamiento y ij es la componente
aleatoria del error.
El modelo dado se denomina modelo del anlisis de varianza de una va porque slo se investiga
un factor. Adems requerimos que el experimento se realice en orden aleatorio, de manera que
las unidades experimentales sean tan uniformes como sea posible. Esto es como ya se seal,
un diseo completamente aleatorizado.
El objetivo ser probar hiptesis apropiadas con respecto a los efectos de tratamiento y hacer
una estimacin de ellos.
Equivalente a:
H0: i=0 i vs. H1: i 0 para al menos una i, i=1,2,...,a.
Para probar las hiptesis, se supone que los errores del modelo son variables aleatorias
independientes con distribucin normal, con media cero y varianza 2. Se supone que 2 es
constante para todos los niveles del factor (tratamientos). Es decir,
El modelo estadstico lineal describe dos situaciones con respecto al efecto de los tratamientos:
2) Los a tratamientos son una muestra aleatoria de una poblacin mayor de tratamientos. Se
conoce como modelo de efectos aleatorios o de componentes de varianza. En esta
situacin, nos gustara ser capaces de extender las conclusiones (basadas en la muestra
de tratamientos), a todos los tratamientos de la poblacin, ya sea que hayan sido
explcitamente considerado en el anlisis o no. Aqu las i son variables aleatorias y el
conocimiento de cada una en particular no tiene utilidad. En lugar de esto, probamos
hiptesis acerca de la variabilidad de las i y tratamos de estimar esta variabilidad. El
modelo estadstico lineal es:
de varianza.
Si =0, todos los tratamientos son idnticos; por otra parte, si >0, existe variabilidad entre
2 2
los tratamientos.
Nota. En Montgomery (2004), el lector puede consultar en detalle el ANOVA cuando el modelo
es de efectos aleatorios o de componentes de varianza.
L ij2 Yij i
a n
i 1 j 1 i j
Entonces
L L
0; 0, i=1, 2,,a
i
N n1 n 2 ... n a Y..
n n1 Y1.
. a+1 ecuaciones
.
n n a Ya.
Nota. Si se suman las ltimas a ecuaciones normales se obtiene la primera de ellas, por lo tanto
las a+1 ecuaciones normales no son independientes, y no hay solucin nica para y i.
a
Se aplica la restriccin
i 1
i 0 (i se define como desviaciones de la media general i=i-) y
se obtienen
Y..
i Yi. Y.. i=1, 2,, a
Estas estimaciones no son nicas y depende de la restriccin que se elige. A pesar de ser
desafortunada esta situacin, no lo es del todo pues ciertas funciones de los parmetros del
modelo se estiman de manera nica, sin tomar en cuenta la restriccin. Por ejemplo i-j se
estimara como
i i Y.. Yi. Y..
i Yi.
Nota. Las funciones que se estiman de manera nica, independiente de la restriccin usada, se
denominan funciones estimables.
ESTADSTICA DE PRUEBA
En esta seccin se tratar la teora necesaria para comprender la estadstica de prueba utilizada
en el ANOVA de una va.
Suma de cuadrados
El nombre de anlisis de varianza se deriva del hecho de dividir la variabilidad total en sus partes
componentes. La suma de cuadrados total corregida es:
a n 2
a n 2 a n 2 a n 2
entonces la primera diferencia en (**) (entre medias de tratamiento y la media global) es una
medida de las diferencias entre los tratamientos, mientras que la segunda (entre las
observaciones dentro de cada tratamiento con su media de tratamiento) puede deberse
solamente al error aleatorio. Por lo tanto
SCTotal=SCTrat + SCE
donde
a
Yi.2 Y..2 Y..2
a n
SCTrat , SCTotal Y 2
ij y SCE=SCTotal - SCTrat
i 1 n N i 1 j 1 N
SCTrat SCE
Las cantidades CMTrat y CME se llaman cuadrados medios.
a 1 Na
Se puede demostrar que los valores esperados de los cuadrados medios son:
a
n i2
E(CMTrat ) 2 i1
a 1
E(CME ) 2
Estas dos expresiones se obtienen directamente aplicando propiedades del valor esperado de
una variable aleatoria, haciendo la suposicin del modelo de efectos fijos Yij=+i+ij donde
E(ij)=0 y Var(ij)= .
2
Nota. Las observaciones Yij estn distribuidas normal independientemente con media +i y
varianza [Yij ~NI(+i , 2)]
2
As, el CME estima (estimador insesgado), y si no hay diferencias entre las medias de los
2
a
n i2
i 1
tratamientos (lo cual implica que i=0 i ), la expresin sera cero y por tanto, el CMTrat
a 1
tambin estimar a . Sin embargo, si las medias de los tratamientos difieren, el valor esperado
2
del CMTrat es mayor que . Entonces para probar la hiptesis de no diferencia en las medias de
2
los tratamientos (H0: 1=2==a o equivalente H0: i=0) se deben comparar el CMTrat y CME.
Entonces si H0 es verdadera, la razn:
CMTrat
F ~ Fa-1, N-a
CME
del estadstico de prueba es mayor que el valor esperado del denominador, y rechazaramos H 0
si el valor del estadstico de prueba es demasiado grande. Esto implica una regin crtica
unilateral de cola superior:
ii) Si Y1 , Y2 ,..., Yn es una m.a. de una distribucin Normal con media y varianza 2 [Yi~NI(,2)]
Y Y
n
2
n 1S 2 i n
entonces
2
i 1
2
~ 2
n1 . Adems, Y y ( Y Y) n 1S
i 1
i
2 2
o bien, Y y S2
son v.a.i.
Nota. Las tres sumas de cuadrados no son independientes, puesto que SCTrat y SCE suman SCT.
(i=1,2,,s). Entonces Q1, Q2,,Qs son variables aleatorias ji-cuadrada independientes con
v1,v2,,vs gl, respectivamente, si y slo si v=v1+v2++vs.
Y Y Y Y n Y
t ni
2 2 2
ij .. ij i. i i. Y.. , con a=t tratamientos y ni rplicas del
i 1 j 1 i j i
tratamiento i. Las distribuciones de las SC bajo H0 son:
Al emplear el teorema de Cochran, note que los gl para SCTrat y SCE suman los gl de SCT, por lo
SCE SC Trat
que y son v.a.i con distribucin ji-cuadrada.
2
2
SCtrat
2 SCtrat SCtrat
( t 1)
2
F t 1 t 1
CMtrat
~ Ft 1, n t
SCE SCE SCE CME i
2
ni t ni t
2
ni t
entonces:
a ni 2
Y..
Yij
2
SCTotal=
i 1 j 1 N
a 2 2
Yi. Y
SCTrat=
i 1 ni
..
N
Nota. Existen dos ventajas para elegir un diseo balanceado. Primero, si las muestras son del
mismo tamao, el estadstico de prueba es relativamente insensible a pequeas desviaciones de
la suposicin de la igualdad de varianzas en los a tratamientos. Esto no sucede en el caso de
tamaos muestrales distintos. Segundo, la potencia de la prueba se maximiza si las muestras
son de igual tamao.
El estimador puntual de i es
i i Yi. , si se supone que los errores estn distribuidos
normalmente, cada Yi. ~NI(i, 2/n). Si 2 fuera conocida se usara la distribucin normal para
definir el I.C. Usando el CME como estimacin de 2, el I.C. se debe basar en la distribucin t de
Student. Por tanto, un I.C. del 100(1-)% para la media del i-simo tratamiento i es:
CME
Y i. t
, N a ni
2
CME
Nota. S Yi. es el error estndar (EE) de cualquier media de tratamiento.
n
El I.C. del 100(1-)% para la diferencia de las medias de dos tratamientos (i - j) est dado por:
1 1
Y i. Y j. t
, N a
CME
n n
2 i j
Una vez repasado la teora bsica sobre el ANOVA de un factor de efectos fijos para un diseo
completamente aleatorio, til para comparar tres o ms tratamientos cuando las muestras son
independientes, retomaremos el ejemplo 1 planteado al inicio de la seccin.
Ejemplo 1
Un gerente de mercadotecnia de una cadena de una lnea de productos de cmputo, le interesa
saber si hay diferencias en las ventas de sus productos en tres ciudades. Elige al azar 15 tiendas
similares (5 por ciudad) entre las que integran la cadena. Las variables bajo control directo de
la compaa, como precio y publicidad, se mantuvieron al mismo nivel en los 30 das del
experimento y se registraron las ventas (en miles) para dicho periodo. Utilice un nivel de
significancia de 0.05.
Ventas (en miles)
Ciudad 1 Ciudad 2 Ciudad 3
10 16 15
14 18 12
18 22 8
15 18 10
12 15 13
Nota. Antes de interpretar la tabla del ANOVA debe verificarse si se satisfacen los supuestos del
modelo.
Para probar las hiptesis, se supone que los errores del modelo son variables aleatorias
independientes con distribucin normal, con media cero y varianza 2. Se supone que 2 es
constante para todos los niveles del factor (tratamientos). Es decir,
ij ~ NI(0, 2)
Por lo tanto, en el ANOVA para el diseo completamente aleatorio de un factor con efectos fijos:
eij y ij y ij y ij ( i ) y ij y ( y i y )
eij y ij y i
99.9
n:15
99 Mediana:0.2
Sigma:2.37037
95
W:0.939387
P:0.3651
80
porcentaje
50
20
5
1
0.1
-3.8 -1.8 0.2 2.2 4.2
RESIDUOS
D de Kolmogorov-Smirnov Modificada
Normal
D 0.130679
Forma Modificada 0.533493
Valor-P >=0.10*
Decisin
i) Del grfico de probabilidad normal se observa que los puntos prcticamente forman
una lnea recta, o bien, estn cercanos a la recta, es decir, los errores se ajustan a
una distribucin normal.
ii) Pruebas de bondad de ajuste: Los errores se ajustan a una distribucin normal
(Shapiro-Wilks: W=0.9394, P=0.3651; Kolmogorov-Smirnov: D=0.5335, P>0.10).
3
residuos
-1
-3
-5
11 13 15 17 19
predichos
3
residuos
-1
-3
-5
1 2 3
Ciudad
Las pruebas para diagnosticar homogeneidad de varianzas (igualdad de varianzas) son respecto
a la hiptesis:
H0 : 12 22 a2
HA : Lo anterior no es cierto al menos para una i2
1 a
1 1 2
(n 1)s
i
2
i
s 1 , sp i 1
(varianza ponderada),
3(a 1) i 1 (ni 1) (N a) Na
y s i2 es la varianza muestral del i-simo tratamiento. El valor de r es grande cuando hay
una gran diferencia entre las varianzas muestrales s i2 y es igual a cero si todas las s i2 son
iguales.
2. Debe rechazarse H0 para valores grandes de X2 ; en otras palabras, se rechaza H0 slo si:
X2 2,a 1
en donde ,a 1 es la puntuacin -porcentual superior de la distribucin ji cuadrada con a
2
1 grados de libertad.
Verificacin de Varianza
Prueba Valor-P
de Bartlett 1.0065 0.965632
Decisin
i) Del grfico ventas predichas contra residuos, observamos que los puntos quedan
comprendidos dentro de dos bandas horizontales, segn su tendencia. Por lo que el
supuesto de igualdad de varianzas se cumple. Es decir, los residuos de cada
tratamiento proceden de una distribucin que tiene la misma varianza 2.
ii) De la prueba inferencial para probar la igualdad de varianzas, se tiene que P>0.05, es
decir, no se rechaza la hiptesis de igualdad de varianzas (los tratamientos tienen
igual varianza).
Gutirrez y De la Vara (2012) sealan que la violacin de este supuesto generalmente indica
deficiencias en la planeacin y ejecucin del experimento; asimismo, puede ser un indicador de
que no se aplic en forma correcta el principio de aleatorizacin, o de que conforme se fueron
realizando las pruebas experimentales aparecieron factores que afectaron la respuesta
observada. Por ello, en caso de tener problemas con este supuesto, las conclusiones que se
obtienen del anlisis son endebles y por ello es mejor revisar lo hecho y tratar de investigar por
qu no se cumpli con ese supuesto de independencia, a fin de reconsiderar la situacin.
3
residuos
-1
-3
-5
0 3 6 9 12 15
nmero de fila
Decisin
Los puntos (t, eij) aparecen en forma azarosa, sin un patrn definido, por lo que se cumple el
supuesto de independencia de los errores aleatorios.
Decisin
Las ventas promedio de los productos de cmputo de las ciudades difieren significativamente
(F2,12=6.25, P=0.0138<0.05). O bien, la ciudad afecta significativamente las ventas de los
productos de cmputo.
Hasta aqu se tiene que los tratamientos difieren significativamente. De manera lgica surge la
pregunta qu tratamientos (ciudades) son los causantes de las diferencias?
En el ANOVA (modelo de efectos fijos) el rechazo de la H0 implica que las medias de tratamiento
difieren, pero la naturaleza exacta de las diferencias no se especifica.
Contrastes
El uso de contrastes para efectuar la comparacin planeada de las medias, se basa precisamente
en la forma en que se escriben las hiptesis nulas, especificadas antes de la obtencin de datos.
a a
Definicin. Un contraste es una combinacin lineal de la forma c
i1
i i donde c
i1
i 0.
H0 : 2 2 3 0 vs H0 : 2 2 3 0
Nota. Para diseos desbalanceados, la frmula de contraste es la misma pero la restriccin que
a
se pide a los coeficientes es: n c
i 1
i i 0 en donde n1, n2 ..., na son los nmeros de repeticiones
SCC
a
i 1
c i yi 2
SCC
a
cy
i 1 i i
2
Estadstico de prueba
a
SCC / 1 CMC
Si H0 : c
i 1
i i 0 es verdadera entonces F
SCE /(N a) CME
~ F1, Na
Notas:
1) Bajo H0 verdadera, otro enfoque es utilizar el estadstico t de Student:
a
c i Yi
T i1
~ t Na
n CME i1 c
a 2
i
RR: t c t / 2, Na
a
2) Con contrastes estimados por medio de las medias de tratamiento, C c y
i1
i i , y bajo
a a
Definicin. Dos contrastes 1 c i i y 2 d i i con coeficientes c i y di son
i1 i1
ortogonales si
a
c d
i1
i i 0 diseos balanceados
a
n c d
i 1
i i i 0 diseos desbalanceados
Notas.
1. Para a tratamientos, el conjunto de a1 contrastes ortogonales particiona la SCTrat , en
a 1 componentes independientes con un solo grado de libertad.
Hiptesis
H0 : 1 21 2 3 0 vs : H1 : 1 21 2 3 0
C1 2y1 y 2 y 3 2(69) 89 58 9
SCC1
a
cy
i1 i i
2
( 9)2
81
2.7
ni1 c i2 5[2 ( 1) ( 1) ] (5)(6)
a 2 2 2
SCC / 1 (2.7) / 1
Fc 0.34
SCE /(N a) 7.9
RR y decisin
Como Fc 0.34 F; 1,Na F0.05; 1,12 4.75 no se rechaza H0 con =0.05, es decir, las ventas
promedio de la ciudad 1 no difieren significativamente de las ventas promedio para las ciudades
2 y 3.
La cantidad
1 1
DSM t CME
, Na n n
2 i j
Ejemplo
Para ilustrar el procedimiento, usemos los datos del ejemplo de las ventas de los productos de
cmputo en a=3 ciudades distintas.
Los valores sealados con asterisco indican los pares de medias que son significativamente
diferentes. Es til dibujar una grfica, como la figura de abajo, subrayando pares de medias que
no difieren significativamente. El nico par de medias que no difiere significativamente, es 1 vs.
3, adems; en la Ciudad 2 la venta promedio result significativamente mayor que en las otras
dos ciudades.
y 3. y 1. y 2.
11.6 13.8 17.8
a a b
Notas.
1) El riesgo puede inflarse considerablemente usando este mtodo. Especficamente,
conforme a crece, la tasa de error tipo I por experimento (la razn del nmero de
experimentos en el cual al menos un error tipo I se comete, al nmero total de
experimentos) se hace grande.
2) Adems de permitir tratamientos repetidos en forma desbalanceada, la DSM puede ser
usada para la estimacin por intervalos. As, un intervalo de confianza del 100(1-)% para
la diferencia de las medias poblacionales, i j es:
( yi y j ) DSM i=1,2,,a; j=1,2,,a; i j
Resultados de Statgraphics
Pruebas de Mltiple Rangos para Ventas por Ciudad
Nota. Dentro de cada columna, los niveles que tienen signo X forman un grupo de medias entre las cuales
no hay diferencias estadsticamente significativas.
Rp=r(p, f) S Y i.
A continuacin, se prueban las diferencias observadas entre las medias, comenzando por el valor
ms alto contra el ms pequeo, comparando esta diferencia con el rango mnimo significativo,
Ra. Despus se calcula la diferencia entre el promedio ms alto y el segundo ms pequeo y se
compara con el rango significativo mnimo Ra-1. Este procedimiento contina hasta que todas las
medias hayan sido comparadas con la media ms grande. A continuacin, la diferencia entre la
segunda media ms grande y la ms pequea se calcula y compara contra el rango significativo
mnimo Ra-1. Este proceso contina hasta que han sido consideradas las diferencias entre los a(a-
1)/2 posibles pares. Si una diferencia observada es mayor que el rango significativo mnimo
correspondiente, se concluye que la pareja de medias en cuestin es significativamente diferente.
Para evitar contradicciones, ninguna diferencia entre una pareja de medias se considera
significativa si las dos medias se encuentran entre otras dos que no difieran significativamente.
Ejemplo
En el experimento de las ventas de los productos de cmputo en a=3 ciudades distintas, se
obtuvieron los siguientes resultados mustrales:
donde n1=n2=n3=n=5 observaciones. Del ANOVA se tiene que CME=7.9 con f=GLE=12.
Organizando los promedios en orden ascendente:
y 3. =11.6
y1. =13.8
y 2. =17.8
7.9
El error estndar de cada promedio es S Y =1.26. Usando la tabla VII del Apndice del
i.
5
Montgomery (2004), para 12 g.l. y =0.05, los rangos significativos son: r0.05 (2, 12)=3.08 y r0.05 (3,
12)=3.23. As los rangos significativos mnimos son:
A partir de este anlisis se observa que existen diferencias significativas entre los pares de
medias (2,3) y (2,1). En la figura de abajo se muestra una grfica en donde se subrayan las
medias que no son significativamente diferentes. Hay que notar que, en este ejemplo, la prueba
de rango mltiple de Duncan y el mtodo MDS producen el mismo resultado.
y 3. y 1. y 2.
11.6 13.8 17.8
Resultados de Statgraphics
Pruebas de Mltiple Rangos para Ventas por Ciudad
Supngase que el tratamiento a (el ltimo) es el control (si no lo es, basta con renumerar para
que sea el a-simo tratamiento). Entonces deseamos probar las hiptesis:
H0: i=a
H1: ia i=1,2,,a-1
Ejemplo
Para ilustrar la prueba de Dunnett, considere los datos del ejemplo de las ventas de los productos
de cmputo en a=3 ciudades distintas. Supongamos que el tratamiento 1 es el control,
renumerremos:
1 1 2CME 2(7.9)
d0.05(2, 12) CME =d0.05(2, 12) =2.50 =4.44 (Paso 5)
n n n 5
As, cualquier media de tratamiento que difiera del control ms de 4.44 se declarara
significativamente diferente. Las diferencias observadas son:
2 vs. 3: y 2. y 3. =|17.8-13.8|=|4|=4
Ninguna diferencia yi. y a. es una diferencia significativa cuando se compara con el control.
Para rescatar que hiptesis no se rechazan en trminos de los datos (subndices) originales,
renumeramos en forma inversa:
Nota. Cuando se comparan tratamientos con un control es una buena idea usar ms
observaciones para el tratamiento control (digamos na) que para los otros tratamientos (digamos
n, suponiendo igual nmero de observaciones para los restantes a-1 tratamientos). La razn na/n
deber escogerse aproximadamente igual a a (la raz cuadrada del nmero total de
tratamientos). Es decir, se elige: na/n= a .
Resultados de SPSS
Oneway
ANOVA
Ventas
Total 193.600 14
Multiple Comparisons
Ventas
Dunnett t (2-sided)a
a. Dunnett t-tests treat one group as a control, and compare all other groups against it.
Una curva de operacin caracterstica es una grfica de la probabilidad del error tipo II de una
prueba estadstica para un tamao de muestra particular, contra el parmetro que refleja que
tanto es falsa la hiptesis nula.
Aqu se considera la probabilidad de error tipo II para el modelo de efectos fijos y el caso de
muestras del mismo tamao en cada tratamiento, es decir,
Para evaluar esta probabilidad, se requiere conocer la distribucin del estadstico F0 si la hiptesis
CMTrat
nula H0 es falsa. Es posible mostrar que si la hiptesis nula es falsa, el estadstico F0
CME
tiene la distribucin F no centrada, con a 1 y N a grados de libertad, y un parmetro de
descentralizacin igual a . Si 0 , se transforma en la distribucin F (centrada) usual.
Las curvas caractersticas operativas que se proporcionan en la tabla V del Apndice del
Montgomery (2004) se usan para evaluar la probabilidad en la ecuacin (*). Estas curvas indican
la probabilidad de error tipo II ( ) contra el parmetro en donde:
a
n i2
2 i1
(**)
a 2
2 est relacionado con el parmetro de descentralizacin . Las curvas se proporcionan para
=0.01 y =0.05, y para diversos grados de libertad (gl) del numerador y el denominador. El
experimentador debe especificar el valor de cuando se usan las curvas caractersticas
operativas. En la prctica, esto resulta difcil. Una forma de determinar es elegir los valores de
las medias de tratamiento por los cuales se desea rechazar la hiptesis nula con una probabilidad
alta. Por tanto, si 1, 2 ,, a son las medias de los tratamientos propuestas, las i de la
ecuacin (**), se determinan como i i , con / a , el promedio de las medias
a
i1 i
puede obtenerse con base a la experiencia pasada, experimentos previos o una estimacin
propuesta como 2 (Rango)2 / 16 . Cuando no hay seguridad del valor de 2 , el tamao de
las muestras puede determinarse para un intervalo de valores posibles de 2 y estudiar el efecto
de este parmetro sobre el tamao de la muestra, antes de tomar una decisin final.
Nota. El problema del enfoque que se acaba de dar, es que usualmente resulta difcil seleccionar
el conjunto de medias de tratamiento sobre el cual se basar la decisin sobre el tamao de la
muestra.
Seleccin del tamao de muestra con el requisito de diferencia mnima detectable entre
medias de tratamiento
Un enfoque alterno es la seleccin del tamao de muestra de manera que la hiptesis nula se
rechace si la diferencia entre cualquier par de medias de tratamiento es al menos D (diferencia
mnima detectable), es posible demostrar que el valor mnimo de 2 es:
nD2
2
2a 2
Como ste es el valor mnimo de 2, el tamao de las muestras correspondientes que se obtienen
con las curvas caractersticas operativas tiene un valor conservador; es decir, proporciona una
potencia, al menos igual a la especificada por el experimentador.
Ejemplo
Supongamos que en el problema de las ventas de productos de cmputo en tres ciudades, el
experimentador desea rechazar la hiptesis nula con una probabilidad de 0.90 (potencia de la
prueba) como mnimo, si la diferencia entre cualquier par de medias de tratamiento es hasta 6
mil. Suponiendo que 8 2.828 miles, el valor mnimo de 2 es:
n(6 2 )
2 0.75n
2(3)( 8 )2
Se utilizar la curva de operacin caracterstica para 1=a1=31=2, 2=Na=a(n1)=3(n1)
grados de libertad del error y =0.05 [tabla V del Apndice de Montgomery (2004)]. Como primera
aproximacin del nmero de rplicas requeridas se prueba n=4: esto da 2=3, o bien, =1.73 y
2=3(41)=9; por tanto en la tabla V (para la grfica con 1 2 ) se determina que 0.40. As,
se concluye que n=4 rplicas no son suficientes porque la potencia de la prueba es
aproximadamente 1=0.40=0.60, la cual es mucho menor que la requerida de 0.90. Procediendo
en forma similar, puede construirse la siguiente tabla:
n 2 1 2 Potencia= (1 )
2 a(n 1)
4 3.00 1.73 9 0.40 0.60
5 3.75 1.94 12 0.30 0.70
6 4.50 2.12 15 0.18 0.82
7 5.25 2.29 18 0.10 0.90
Se concluye que al menos n=7 rplicas son necesarias para obtener una prueba con la potencia
deseada cuando =0.05.
Este enfoque supone que el experimentador desea expresar sus resultados finales en trminos
de intervalos de confianza para la diferencia de dos medias de tratamientos, y se desea
especificar de antemano cuan ancho quiere que sean esos intervalos de confianza.
Una estimacin por intervalo de confianza del 100(1-)% para la diferencia de cualesquiera dos
medias de tratamientos, i j , se determina por medio de:
y y t
i j / 2, Na
2CME
n
Donde
2CME
s yi y j es el error estndar estimado de cada diferencia de medias de los tratamientos.
n
2CME
t / 2, Na es la precisin del anterior intervalo de confianza.
n
As, dado el nivel de confianza (1-), una estimacin para la varianza (CME) y el lmite del error
de estimacin (L), entonces el tamao de muestra se determina de:
2CME
L t / 2, Na
n
El procedimiento es probar valores para n, y el que proporcione la mejor aproximacin para L,
ser el tamao de muestra (nmero de repeticiones) que se utilizar en cada tratamiento. Estos
ensayos se deben a que el factor t / 2, Na t / 2, ana depende de n. Se seleccionar la n que
reduzca la mitad del ancho del intervalo de confianza de modo que, en un nivel de confianza
prescrito, sea menor o igual al lmite especificado del error de estimacin.
Ejemplo
Supngase que en el problema de las ventas de productos de cmputo en tres ciudades, se
quiere estimar un intervalo de confianza del 95% para que la diferencia en las ventas promedio
para cualesquiera dos ciudades, sea 3 mil. Suponga que 8 es una estimacin del CME.
2
Solucin
Para este ejemplo =0.05, CME8 y L=3. As,
2CME 2(8)
L t / 2, Na ( t 0.025,3n3 )
n n
Ensayos:
2(8)
Para n=7, t / 2,ana t 0.025,18 2.101 y L (2.101) 3.18
7
2(8)
Para n=8, t / 2,ana t 0.025,21 2.080 y L (2.080) 2.94
8
Por tanto, n=8 es el tamao de muestra ms pequeo que lleva a la precisin requerida.
Una transformacin es simplemente una reexpresin de los datos en diferente unidad de medida.
Supuestos
Grupos (tratamientos)
1 2 k
Y11 Y21 Yk1
Y12 Y22 Yk2
: : :
Y1n1 Y2n2 Yknk
Hiptesis
Prueba la H0 de que las k muestras provienen de poblaciones idnticas con la misma mediana.
H1: Al menos una de las poblaciones tiende a dar observaciones ms grandes que las otras. O
bien, al menos dos de las distribuciones poblacionales difieren en localizacin.
Estadstico de prueba
12 k
Ri2
3(N 1)
N(N 1) i 1 ni
H (I)
g
1 t 3j t j (N3 N)
j 1
donde
k
N= n
i 1
i (total de observaciones).
es el rango de Yij.
g=nmero de grupos empatados.
tj=tamao del j-simo grupo empatado. Nmero de observaciones empatadas en el grupo
j de valores empatados.
Aqu se considera una observacin no empatada como un grupo empatado de tamao 1. Por lo
tanto si no hay observaciones empatadas g=N, tj=1 y t 3j t j 0 para toda j=1,2,,N y el
denominador de H se reduce a 1, obtenindose:
12 k
Ri2
H 3(N 1) (II)
N(N 1) i 1 ni
Nota. El efecto del ajuste por empates (ecuacin I) es incrementar H, de modo que si la H no
ajustada (ecuacin II) es significativa al nivel de significancia elegido, no es necesario aplicar el
ajuste.
1. Las n1, n2,...,nk observaciones de los k grupos se combinan en una sola serie de tamao
n y se arreglan en orden de magnitud desde el ms pequeo hasta el ms grande.
Entonces las observaciones se reemplazan por rangos desde 1, que es el asignado a la
observacin menor, hasta N, que se asigna a la observacin mayor. Cuando dos o ms
observaciones tienen el mismo valor (empate), a cada observacin se le da la media de
los rangos en los cuales empat.
2. Los rangos asignados a las observaciones en cada uno de los k grupos se suman por
separado para dar k sumas de rangos (Ri).
3. Se calcula H.
Regin de rechazo
Rechace H0 si H>H; n1,...,nk donde la constante H; n1,...,nk satisface P(H>H; n1,...,nk)= y se puede
obtener de la tabla de la distribucin de H (Hollander y Wolfe, 1999; Conover, 1999; Zar, 2010).
Wackerly et al. (2010) sealan que Kruskal y Wallis demostraron que si los ni son grandes (ni5)
y bajo H0 verdadera, la distribucin del estadstico de prueba H es aproximadamente ji-cuadrada
con k-1 g.l., es decir, H ~ k2 1 . Por lo tanto, rechace H0 si H 2,k 1 .
En caso de que la prueba determine diferencias estadsticas significativas entre los tratamientos
con respecto a la variable de estudio o de respuesta, deben efectuarse comparaciones mltiples
para determinar qu pares de tratamientos difieren, inclusive cuando se tiene un tratamiento
control.
Notas:
a) La mayora de los paquetes estadsticos no incluyen comparaciones mltiples entre sus
opciones para la prueba de Kruskal-Wallis.
b) En las siguientes referencias se tienen ms detalle terico del mtodo y de las
comparaciones mltiples: Hollander y Wolfe (1999), Siegel y Castellan (2001), Zar (2010)
y Conover (1999).
Hiptesis
H0 : u v vs. H1 : u v para algunos grupos u y v.
Procedimiento
Se determinan las diferencias Ru Rv para todos los pares de grupos. Cuando el tamao de las
muestras es grande, estas diferencias se distribuyen aproximadamente normal. Sin embargo, ya
que hay una cantidad muy grande de diferencias y que las diferencias no son independientes, el
procedimiento de comparacin debe ajustarse apropiadamente. Por lo tanto,
NN 1 1 1
si Ru Rv ( z k k 1 ) rechace H0 : u v con nivel de significacin y
12 nu nv
decida por H1 : u v .
Nota. El mtodo de comparacin antes descrito no contiene en su expresin una correccin por
empates.
N(N 1) 1 1
Concluya H1 : A B si R A RB Q , k
12 n A nB
RA
donde R A y RB son los rangos promedio para los tratamientos A y B respectivamente.
nA
t
g
donde t 3
j t j y Q, k z k k 1 .
j1
Una vez presentado la teora bsica sobre la prueba de Kruskal-Wallis para comparar tres o ms
tratamientos cuando las muestras son independientes, se aplicar el mtodo con los datos del
ejemplo acerca de las ventas de productos de cmputo en tres ciudades.
Ejemplo
Un gerente de mercadotecnia de una cadena de una lnea de productos de cmputo, le interesa
saber si hay diferencias en las ventas de sus productos en tres ciudades. Elige al azar 15 tiendas
similares (5 por ciudad) entre las que integran la cadena. Las variables bajo control directo de
la compaa, como precio y publicidad, se mantuvieron al mismo nivel en los 30 das del
experimento y se registraron las ventas (en miles) para dicho periodo. Utilice un nivel de
significancia de 0.05.
Ventas (en miles)
Ciudad 1 Ciudad 2 Ciudad 3
10 16 15
14 18 12
18 22 8
15 18 10
12 15 13
Solucin
Rangos asignados, totales y promedios para los datos del ejemplo.
Resultados de SPSS
Pruebas no paramtricas
Prueba de Kruskal-Wallis
Rangos
Rango
Ciudad N promedio
Ventas 1 5 7.20
2 5 12.20
3 5 4.60
Total 15
Estadsticos de contraste(a,b)
Ventas
Chi-cuadrado 7.5956
gl 2
Sig. asintt. .0224
Sig. exacta .0135
Probabilidad en el
.0010
punto
a Prueba de Kruskal-Wallis
b Variable de agrupacin: Ciudad
Decisin. Difiere significativamente las ventas de los productos de cmputo en las ciudades
(H=7.5956, P=0.0135<0.05).
Ejercicio
Para el ejemplo anterior aplicar la comparacin mltiple.
Bibliografa
Bibliografa citada
Conover, W.J. (1999). Practical nonparametric statistics. 3a Ed. John Wiley and Sons. New York,
USA.
Hines, W.W., Montgomery, D.C., Goldsman, D.M. y Borror, C.M. (2005). Probabilidad y estadstica
para ingeniera. 3a Ed. Grupo Editorial Patria. Mxico, D.F.
Hollander, M., Wolfe, D.A. (1999). Nonparametric statistical methods. 2a Ed. John Wiley and Sons.
New York, USA.
Johnson, R.A.; Wichern, D.W. (2002). The multivariate normal distribution. En: Applied
multivariate statistical analysis. 5a Ed. Prentice Hall. New Jersey, USA. pp. 149-209.
Montgomery, D.C. (2004). Diseo y anlisis de experimentos. 2 Ed. Limusa Wiley, Mxico, D.F.
Montgomery, D.C. (2004b). Experimentos con un slo factor: el anlisis de varianza. En: Diseo
y anlisis de experimentos. 2 Ed. Limusa Wiley, Mxico, D.F. pp. 60-125.
Montgomery, D.C. (2004c). Otros tpicos de diseo y anlisis. En: Diseo y anlisis de
experimentos. 2 Ed. Limusa Wiley, Mxico, D.F. pp. 590-629.
Montgomery, D.C.; Peck, E.A.; Vining, G.G. (2002b). Transformaciones y ponderacin para
corregir inadecuaciones del modelo. En: Introduccin al anlisis de regresin lineal. 3 Ed.
CECSA. Mxico, D.F. pp. 155-184.
Siegel, S., Castellan N.J. (2001). Estadstica no paramtrica: aplicada a las ciencias de la
conducta. 4 Ed. Editorial Trillas. Mxico, D.F.
Steel, R.G.D.; Torrie, J.H. (1988). Bioestadstica: principios y procedimientos. 2 Ed. McGraw-
Hill/Interamericana. Mxico, D.F.
Sokal, R.R.; Rohlf, F.J. (2000). Assumptions of analysis of variance. En: Biometry, the principles
and practice of statistics in biological research. 3a Ed. W.H. Freeman and Company. New York,
USA. pp 392-450.
Visauta, V. B. (1997). Anlisis estadstico con SPSS para Windows, estadstica bsica. McGraw-
Hill-Interamericana. Espaa.
Wackerly, D.D., Mendenhall, W., Scheaffer, R.L. (2010). Estadstica Matemtica con
Aplicaciones. 7 Ed. CENGAGE Learning. Mxico, D.F.
Zar, J.H. (2010). Biostatistical Analysis. 5a Ed. Prentice-Hall. New Jersey, USA.
Bibliografa consultada
Daniel, W.W. (2006). Bioestadstica: Base para el Anlisis de las Ciencias de la Salud. 4a Ed.
Limusa Wiley. Mxico, D.F.
Daniel, W.W. (1990). Applied Nonparametrics Statistics. 2a Ed. Duxbury Thomson Learning.
Pacific Grove, CA, USA.
Dickinson, G.J., Chakraborti, S. (1992). Nonparametric statistical inference. 3a Ed. Marcel Dekker.
New York, USA.
Freund, J.E., Miller, I., Miller, M. (2000). Estadstica matemtica con aplicaciones. 6. Ed.
Pearson. Mxico, D.F.
Kuehl, R.O. (2001). Diseo de Experimentos. 2 Ed. Thomson Editores. Mxico, D.F.
Infante, G.S. y Zrate, L.G. (2005). Mtodos Estadsticos. 2 Ed. Editorial Trillas. Mxico, D.F.
Mendenhall, W., Beaver, R.J. y Beaver, B.M. (2002). Introduccin a la Probabilidad y Estadstica,
Thomson, Mxico, D.F.
Scheaffer, R.L., McClave, J.T. (1993). Probabilidad y estadstica para ingeniera. Grupo Editorial
Iberoamrica. Mxico, D.F.