Beruflich Dokumente
Kultur Dokumente
4/d/yyyy
Task 2
(Tarea 2)
29
28
37
24
35
40
40
31
30
25
29
25
Task 3
(Tarea 3)
34
36
34
41
30
44
44
32
32
31
Task 4
(Tarea 4)
34
34
43
44
40
47
34
31
45
28
Task 5
(Tarea 5)
28
28
26
35
31
30
34
34
26
20
41
21
Task 6
(Tarea 6)
28
26
29
25
35
34
37
28
21
28
26
Las n = 68 mediciones finales han sido arregladas en q = 6 columnas, una para cada grupo de
sujetos.
Alternativamente, los datos pudieron ser arreglados en una tabla con las tasas de pulsacin en
una sola columna junto con una columna identificando qu tarea se le dio al sujeto. Una porcin
de tal archivo se muestra abajo:
Pulse Rate
(Tasa de Pulsacin)
27
31
26
32
39
37
38
39
30
28
27
27
34
29
28
37
24
35
40
40
31
30
25
29
25
34
Task
(Tarea)
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
3
Cualquier estructura de datos puede ser analizada por el procedimiento Anlisis Multimuestral.
Si los mismos datos se usarn en otros procedimientos tales como el procedimiento de Modelos
Lineales Generales, estos deben ser estructurados de la segunda manera. Como parte de la
opcin Guardar Resultados en este procedimiento, puede tomar un conjunto de datos que est
estructurado en el formato de mltiples columnas y rearreglarlo como columnas de datos
cifrados.
Datos de Entrada
Cuando el procedimiento Comparacin de Datos Mltiples se selecciona en el men principal, el
primer cuadro de dilogo desplegado le pide especificar el formato en el que los datos sern
ingresados:
Mltiples Columnas de Datos: indica que cada muestra se ha colocado en una columna
separada.
Columnas de Cdigos y Datos: indica que todas las observaciones se han colocado en una
sola columna, con una segunda columna indicando a qu muestra pertenece cada
observacin.
Estadsticos Muestrales: indica que las observaciones originales no estn disponibles. Sin
embargo, los tamaos de muestra, las medias muestrales, y las desviaciones estndar
muestrales se han colocado en 3 columnas de la hoja de datos. En este caso, algunas opciones
no estarn disponibles.
Muestras: dos o ms columnas numricas que contienen las observaciones, una columna
para cada muestra.
2006 por StatPoint, Inc.
Comparacin de Varias Muestras - 3
Estadsticos de Muestra
Si las observaciones originales no estn disponibles, pero se conocen la media y la desviacin
estndar de cada muestra, ingrese los estadsticos muestrales en la hoja de datos en columnas
separadas.
Tarea
1
2
3
4
5
6
Tamao
13
12
10
10
12
11
Media
31.9231
31.0833
35.8000
38.0000
29.5000
28.8182
Desviacin Estndar
4.95751
5.66422
5.30827
6.59966
6.00757
4.75012
Medias muestrales: columna numrica que contiene las medias de cada muestra.
Tamaos de muestra: columna numrica que contiene los tamaos de cada muestra.
Etiquetas de la muestra: columna opcional que contiene etiquetas para cada muestra.
Grfico de Dispersin
El panel Grfico de Dispersin grafica datos de cada grupo.
Dispersin segn Muestra
50
respuesta
45
40
35
30
25
20
Task 1 Task 2 Task 3 Task 4 Task 5 Task 6
Si hay muchos valores comunes, tal vez dese aadir una pequea cantidad despacio horizontal a
la grfica, presionando el botn Separar de la barra de herramientas de anlisis.
Esto fija cada punto al azar en direccin horizontal de tal modo que valores idnticos no se
encimen:
respuesta
45
40
35
30
25
20
Task 1 Task 2 Task 3 Task 4 Task 5 Task 6
La grfica de arriba parece sugerir que las tasas de pulsacin son de alguna manera ms altas en
aquellos que realizaron las tareas 3 y 4. Nota: Agregar espacio a la grfica de dispersin no tiene
efecto en ningn clculo.
Estadsticos de Resumen
El panel Estadsticos de Resumen calcula diferentes estadsticos que son usados comnmente
para resumir una muestra de datos variables:
Resumen Estadstico
Recuento
Tarea 1 13
Tarea 2 12
Tarea 3 10
Tarea 4 10
Tarea 5 12
Tarea 6 11
Total
68
Promedio
31.9231
31.0833
35.8
38.0
29.5
28.8182
32.3088
Desviacin Estndar
4.95751
5.66422
5.30827
6.59966
6.00757
4.75012
6.24203
Coeficiente de Variacin
15.5296%
18.2227%
14.8276%
17.3675%
20.3646%
16.4831%
19.3199%
Mnimo
26.0
24.0
30.0
28.0
20.0
21.0
20.0
Mximo
39.0
40.0
44.0
47.0
41.0
37.0
47.0
Rango
13.0
16.0
14.0
19.0
21.0
16.0
27.0
Panel de Opciones
Task 1
Task 2
Task 3
Task 4
Task 5
Task 6
20
25
30
35
respuesta
40
45
50
Se dibuja una caja que va del cuartil inferior de la muestra hasta el cuartil superior.
Este es el intervalo cubierto por 50% de los datos cuando se ordenan de menor a
mayor.
Se dibujan bigotes desde los bordes de la caja hasta los valores ms pequeo y ms
alto, a menos que haya valores inusualmente lejos de la caja (los que Tukey llama
aberrantes). Los puntos exteriores, que son puntos abajo o arriba de la caja ms de
1.5 veces el rango intercuartil, se indican con smbolos de punto. Cualquier punto que
est abajo o arriba de la caja ms de tres veces el rango intercuartil se llama
aberrante lejano, y se indican por smbolos de punto con signos de suma
superimpuestos encima de ellos. Si hay puntos exteriores, los bigotes se dibujan hacia
los valores ms grande y ms pequeo que no sean puntos exteriores.
En los datos muestrales, la variabilidad parece ser similar en cada muestra, aunque las locaciones
muestran algunas diferencias. No hay puntos exteriores.
Panel de Opciones
respuesta
45
40
35
30
25
20
Task 1
Task 2
Task 3
Task 4
Task 5
Task 6
z 1.25( IQR j )
1
~
xj /2
1 +
2 1.35 n j
2
2006 por StatPoint, Inc.
(1)
Comparacin de Varias Muestras - 10
~
donde x j es la mediana de la j-sima muestra, IQRj es el rango intercuartil de muestra, nj es el
tamao de muestra, y z/2 es el valor crtico superior (/2)% de una distribucin normal estndar.
En aquellos casos en los que el tamao de muestra es pequeo, el corte puede extenderse ms
all de la caja, resultando una apariencia de doblado.
Como las muestras varan en tamao, la regla de traslape no funcionar a la perfeccin. Sin
embargo, los cortes para las tareas 4 y 6 no se traslapan, lo que tpicamente indicara una
diferencia significativa entre esas dos medianas a un nivel de significancia del 5%.
Tabla ANOVA
Para determinar si las medias de los q grupos son significativamente diferentes entre s o no,
puede realizarse un anlisis de varianza de una va. Los resultados se despliegan en la tabla
ANOVA:
Tabla ANOVA
Fuente
Entre grupos
Intra grupos
Total (Corr.)
Suma de Cuadrados
694.439
1916.08
2610.51
Gl
5
62
67
Cuadrado Medio
138.888
30.9045
Razn-F
4.49
Valor-P
0.0015
ANOVA Grfico
El ANOVA Grfico, desarrollado por Hunter (2005), es una tcnica para desplegar grficamente
la importancia de las diferencias entre las muestras. Es una grfica de los efectos escalados,
donde el efecto es igual a la diferencia entre una media muestral y la gran media estimada.
Cada efecto es multiplicado por un factor escalador.
R ni
T n
(2)
donde R es los grados de libertad residuales, T es los grados de libertad entre las diferencias
grupales, ni es igual al nmero de observaciones en el i-simo nivel del grupo, y n es el nmero
promedio de observaciones en todos los grupos. Esto escala los efectos de tal manera que la
varianza natural de los puntos en el diagrama es comparable a la de los residuales, los cuales se
despliegan en la parte baja de la grfica.
La grfica para los datos de muestra se muestra abajo:
ANOVA Grfico para Task 1
Grupos
Task 6
Task 5
Task 2
Task 1
Task 3
Task 4
P = 0.0015
Residuos
-13
-3
17
27
Al lado derecho del display est el P-valor para las diferencias dentro del grupo, tomado de la
tabla ANOVA.
Comparando la variabilidad entre los efectos en la grfica de arriba con la de los residuales, es
fcil ver que las diferencias son de una mayor magnitud que las que podran explicarse
solamente por el error experimental. Dependiendo de la localizacin relativa de los efectos,
podra tambin ser posible en algunos casos identificar visualmente cules muestras son
significativamente diferentes de cules otras, lo cual es hecho formalmente por las Pruebas de
Rangos Mltiples descritas abajo.
Contraste
Tarea 1 - Tarea 2
Tarea 1 - Tarea 3
Tarea 1 - Tarea 4
Tarea 1 - Tarea 5
Tarea 1 - Tarea 6
Tarea 2 - Tarea 3
Tarea 2 - Tarea 4
Tarea 2 - Tarea 5
Tarea 2 - Tarea 6
Tarea 3 - Tarea 4
Tarea 3 - Tarea 5
Tarea 3 - Tarea 6
Tarea 4 - Tarea 5
Tarea 4 - Tarea 6
Tarea 5 - Tarea 6
Sig.
*
*
*
*
Grupos Homogneos
X
X
XX
XX
XX
X
Diferencia
0.839744
-3.87692
-6.07692
2.42308
3.1049
-4.71667
-6.91667
1.58333
2.26515
-2.2
6.3
6.98182
8.5
9.18182
0.681818
+/- Lmites
4.44862
4.67423
4.67423
4.44862
4.55256
4.75816
4.75816
4.53672
4.63869
4.96973
4.75816
4.85547
4.75816
4.85547
4.63869
* indica una
diferencia significativa.
La mitad de arriba de la tabla muestra cada una de las medias muestrales estimadas en un orden
de magnitud creciente. Muestra:
$ j1 j2 = Y j1 Y j2
(3)
1
1
$ j1 j2 M MS within
+
n j1 n j2
(4)
Para los datos de tasa de pulsacin, Tarea 4 tiene una tasa de pulsacin media significativamente
mayor que cualquier tarea excepto Tarea 3. Adems, Tarea 3 es significativamente mayor que
Tareas 5 y 6.
Panel de Opciones
LSD - forma un intervalo de confianza para cada par de medias al nivel de confianza
seleccionado usando:
M = t / 2 ,n q
(5)
Tukey HSD ensancha los intervalos para permitir comparaciones mltiples entre todos
los pares de medias, usando
(6)
M = T/2,q,n-q
Scheffe diseado para permitir la estimacin de todos los posibles contrastes entre las
medias muestrales (no solo en comparaciones por pares). Usa una mltiple relacionada
con la distribucin F.
M =
(q 1)F ,q 1,nq
(7)
En esta instancia, es probable que el procedimiento sea muy conservador, pues slo se
estn estimando pares.
(8)
pues q(q-1)/2 se estn estimando diferencias por pares. Estos lmites son usualmente ms
anchos que los de Tukey cuando se hacen todas las comparaciones por pares.
Tabla de Medias
Esta tabla despliega cada media muestral junto a un intervalo de incertidumbre:
Tabla de Medias con intervalos de confianza del 95.0%
Error Est.
Casos Media
(s agrupada) Lmite Inferior
Tarea 1 13
31.9231
1.54184
29.7437
Tarea
2
12
31.0833
1.6048
28.815
El tipo de intervalo desplegado depende del Panel
Tarea 3 10
35.8
1.75797
33.3151
Tarea 4 10
38.0
1.75797
35.5151
Panel
Tarea 5de Opciones
12
29.5
1.6048
27.2316
Tarea 6 11
28.8182
1.67616
26.449
Total
68
32.3088
Lmite Superior
34.1024
de33.3517
Opciones.
38.2849
40.4849
31.7684
31.1874
Yj
sj2
(10)
nj
Y j t / 2 , n q
(9)
Yj
MS within
nj
MS within
nj
(11)
sj
nj
(12)
Intervalos LSD - diseados para comparar cualquier para de medias con el nivel de
confianza establecido. Los intervalos estn dados por:
Yj
2M
2
MS within
nj
(13)
donde M se define como en las Pruebas de Rango Mltiple. Esta frmula tambin aplica
para las tres selecciones de abajo.
Intervalos Tukey HSD - diseados para comparar todos los pares de medias. El
intervalo de confianza establecido aplica para toda la familia de comparaciones por pares:
Intervalos Scheffe - diseados para comparar todos los contrastes. No son muy
relevantes aqu.
Grfica de Medias
Las medias muestrales pueden ser graficadas junto a los intervalos de incertidumbre:
Medias y 95.0% de Fisher LSD
41
Media
38
35
32
29
26
Task 1 Task 2 Task 3 Task 4 Task 5 Task 6
Los tipos de intervalos que pueden usarse son los mismos que en la Tabla de Medias arriba.
Si todos los tamaos de muestra son los mismos (o cercanos), el analista puede determinar cules
medias son significativamente diferentes de cules otras usando los procedimientos LSD, Tukey,
Scheffe o Bonferroni simplemente viendo si un par de intervalos se traslapan en direccin
vertical o no. Un par de intervalos que no se traslapan indica una diferencia estadsticamente
2006 por StatPoint, Inc.
Comparacin de Varias Muestras - 19
Verificacin de Varianza.
Una de las suposiciones que respaldan el anlisis de varianza es que las varianzas de las
poblaciones de donde se tomaron las muestras son las mismas. El panel Verificacin de Varianza
realiza alguna de varias pruebas para verificar esta suposicin.
Verificacin de Varianza
Prueba
Valor-P
Levene's 0.641611
0.668799
(14)
Grficas de Residuales
Como en todo modelo estadstico, es una buena costumbre examinar los residuales. En un
anlisis de varianza de una va, los residuales se definen por:
eij = y ij y j
(15)
i.e., los residuales son las diferencias entre los valores de datos observados y sus respectivas
medias grupales.
El procedimiento Comparacin de Muestras Mltiple crea 3 grficas de residuales:
1. contra indicador muestral.
2. contra valor predicho.
3. contra nmero de observacin.
Residuales contra Muestras
Esta grfica es de ayuda para visualizar cualquier diferencia en la variabilidad de las muestras.
residuos
8
4
0
-4
-8
-12
Task 1
Task 2
Task 3
Task 4
Task 5
Task 6
muestra
residuos
8
4
0
-4
-8
-12
28
30
32
34
valor predicho
36
38
residuos
8
4
0
-4
-8
-12
0
20
40
observacin
60
80
Si los datos se arreglan en orden cronolgico, cualquier patrn de los datos puede indicar una
influencia exterior. No es evidente ningn patrn as en la grfica de arriba.
Media
39
LDS=36.38
37
LC=32.31
35
LDI=28.24
33
31
29
27
Task 1 Task 2 Task 3 Task 4 Task 5 Task 6
Esta grfica construye una tabla similar a un cuadro de control, donde cada media muestral se
grafica junto a una lnea central y los lmites de decisin superiores e inferiores. La lnea central
se localiza en el promedio de todas las observaciones Y . Los lmites de decisin se localizan en
Y hn q ,1
MS within
nj
q 1
(16)
que
Panel de Opciones
La prueba Friedman es apropiada para un diseo aleatorio de bloques, en el que cada fila de la
hoja de datos representa una condicin o bloque particular. En este ejemplo, esto aplicara si los
mismos 13 sujetos hubiesen realizado cada una de las 6 tareas, en lugar de diferentes sujetos para
cada tarea. El resultado de la prueba Friedman es interpretada de la misma manera que el de la
prueba Kruskal-Wallis.
Tamao de Muestra
13
12
10
10
12
11
n<=
7
8
2
2
8
8
n>
6
4
8
8
4
3
Mediana
31.0
29.5
34.0
37.0
29.0
28.0
LC inferior 95.0%
27.0
25.0
30.3244
28.9733
21.5318
23.8509
LC superior 95.0%
38.6056
39.6809
44.0
46.3511
34.8936
35.5745
Arriba de la tabla se despliega el nmero total de observaciones n y la mediana total. Para cada
muestra la tabla muestra:
1. Tamao de Muestra: El nmero de observaciones en la muestra nj.
2. n<=: de las observaciones en la muestra, cuntas son menores o iguales que la mediana
total.
3. n>: de las observaciones en la muestra, cuntas son mayores o iguales que la mediana
total.
4. Mediana: la mediana muestral.
5. CL: los lmites de confianza superior e inferior para la mediana de la poblacin de donde
vino la muestra.
Abajo de la pantalla se muestra un estadstico de prueba y un P-Valor. Tratando los n<= y las n>
columnas como columnas de una tabla de contingencia de dos vas, se calcula un estadstico de
prueba ji-cuadrada. P-Valores pequeos (menores que 0.05 operando a un nivel de significancia
del 5%) llevan a la conclusin de que no todas las medianas son iguales, como en este ejemplo.
Panel de Opciones
Grfico de Medianas
El Grfico de Medianas despliega los intervalos de confianza para las medianas desplegadas por
el panel Prueba de la Mediana de Mood.
Grfico de Medianas con Intervalos del 95.0% de Confianza
51
respuesta
46
41
36
31
26
21
Task 1 Task 2 Task 3 Task 4 Task 5 Task 6
Panel de Opciones
Guardar Resultados
Los siguientes resultados pueden guardarse en la hoja de datos:
1.
2.
3.
4.
Fuente
Intergrupa
l
Intragrupa
l
Suma de Cuadrados
q
SS between = n j Y j Y
j =1
nj
SS within = Yij Y j
j =1 i = 1
nj
SS total = Yij Y
Total
j =1 i =1
D.F.
Media
cuadrtica
df between = q 1
df within = n j 1
j =1
MSbetween =
SSbetween
df between
MS within =
SS within
df within
F-Radio
F=
MSbetween
MSwithin
n-1
Prueba de Cochran
( )
max s 2j
q
s
j =1
(17)
2
j
1 A
(18)
es comparada con una F distribucin con (n/q - 1) y (n/q - 1)(q - 1) grados de libertad.
Prueba de Bartlett
1
B = ( dfe) ln( MSE ) (n j 1) ln s 2j
C
j =1
( )
(19)
donde
q
n j 1
3( q 1) j =1
MSE =
1 q
n 1 s 2j
dfe j =1 j
dfe
(20)
(21)
dfe = n j 1
j =1
(22)
Prueba de Hartley
H=
( )
min (s )
max s 2j
2
j
(23)
Los lmites desplegados son una interpolacin no lineal de intervalos de confianza a los niveles
de confianza superior e inferior ms cercanos que el nivel requiera. Luego de ordenar las
observaciones, el intervalo que va de la d-sima observacin ms pequea en la muestra a la dsima observacin ms grande forma un intervalo de confianza para la mediana con un nivel de
confianza 1 2 PB(d-1), donde PB representa la distribucin binomial con p = 0.5 y n = nj.