Beruflich Dokumente
Kultur Dokumente
4/25/2007
Test Agent
(Agente de Prueba)
112
106
100
100
100
96
97
98
104
93
96
98
Alternativamente todas las 27 lecturas de presin arterial podran haber sido introducidas dentro
de una sencilla columna de datos y se pudo haber creado una segunda columna para identificar a
qu grupo pertenece cada paciente:
Pressure
(Presin)
113
116
147
114
111
132
125
109
107
114
116
98
123
126
123
112
106
100
100
100
96
97
98
104
93
96
98
112
Group
(Grupo)
Placebo
Placebo
Placebo
Placebo
Placebo
Placebo
Placebo
Placebo
Placebo
Placebo
Placebo
Placebo
Placebo
Placebo
Placebo
Agente de Prueba
Agente de Prueba
Agente de Prueba
Agente de Prueba
Agente de Prueba
Agente de Prueba
Agente de Prueba
Agente de Prueba
Agente de Prueba
Agente de Prueba
Agente de Prueba
Agente de Prueba
Agente de Prueba
Captura de Datos
Los datos que se vana analizar se especifican en el cuadro de dilogo mostrado abajo. Para casos
donde las dos muestras han sido colocadas en columnas separadas se especifican los nombres de
las columnas.
Entrada: se fija en Dos Columnas de Datos para indicar que cada muestra han sido colocada
en una columna separada.
Si los datos de ambas muestras han sido introducidos dentro de una simple columna, entonces
introduzca el nombre de la columna que contiene los identificadores del grupo.
Captura: se fija en Columnas de Cdigos y Datos para indicar que los datos de ambas
muestras han sido colocados dentro de una sola columna.
Estadsticos de Resumen
El cuadro de Resumen de Estadsticos calcula un nmero de diferentes estadsticos que son
comnmente usados para resumir una muestra de los datos de variables:
Resumen Estadstico
Recuento
Promedio
Mediana
Moda
Media Geomtrica
Media Recortada 5%
Media Winsorizada 5%
Varianza
Desviacin Estndar
Coeficiente de Variacin
Error Estndar
Sigma Winsorizada 5%
DAM
Sbi
Mnimo
Mximo
Rango
Cuartil Inferior
Cuartil Superior
Rango Intercuartlico
1/6 sextil
5/6 sextil
Rango Intersextil
Sesgo
Sesgo Estandarizado
Curtosis
Curtosis Estandarizada
Suma
Suma de Cuadrados
Placebo
15
118.267
116.0
117.745
117.796
118.267
136.781
11.6953
9.88896%
3.01972
11.6953
7.0
10.7038
98.0
147.0
49.0
111.0
125.0
14.0
109.0
126.0
17.0
0.82607
1.30613
1.63626
1.29358
1774.0
211720.
Test Agent
12
100.0
99.0
100.0
99.8812
99.7222
100.0
26.7273
5.16984
5.16984%
1.49241
5.16984
2.5
4.52375
93.0
112.0
19.0
96.5
102.0
5.5
96.0
105.0
9.0
1.17953
1.6681
1.55061
1.09645
1200.0
120294.
Placebo
Test Agent
93
103
113
123
133
143
153
Se dibuja una caja que se extiende desde el cuartil inferior de la muestra hasta el
cuartil superior. Este es el intervalo cubierto por la mitad 50% de los valores de los
datos cuando se ordenan del ms pequeo al ms grande.
Los bigotes son dibujados de los puntos extremos de la caja hasta los valores de datos
ms grandes y ms pequeos a menos que haya valores inusualmente ms alejados de
la caja (los cuales Tukey llama puntos extremos). Los puntos extremos, los cuales son
puntos localizados ms de 1.5 veces el rango intercuartlico arriba o debajo de la caja
(la amplitud de la caja) se indican por smbolos de puntos. Cualquier punto ms all
de 3 veces el rango intercuartlico arriba o debajo de la caja es conocido como punto
extremo alejado y se indica como smbolo de punto con un signo de suma encima. Si
los puntos extremos estn presentes los bigotes se dibujan hasta los valores de los
datos ms grandes y ms pequeos los cuales no son puntos extremos.
En los datos de la muestra, la caja para el grupo Placebo es cambiada a la derecha de la caja de la
caja para el grupo Agente de Prueba. En resumen, la caja es ms amplia lo que corresponde a la
mayor variabilidad. Casa una de las grficas tambin muestra un nico punto extremo.
Opciones de Cuadro
Placebo
Test Agent
93
103
113
123
133
143
153
z 1.25( IQR j )
1
~
xj /2
1 +
2 1.35 n j
2
(1)
Histograma de Frecuencias
El cuadro de Histograma de Frecuencias muestra la muestra de datos usando un cuadro de
barras dual:
Placebo
8
frecuencia
8
90
100
110
120
Test Agent
130
140
150
Nmero de clases: el nmero de intervalos dentro de los cuales los datos sern divididos.
Los intervalos son adyacentes entre s e iguales en amplitud.
Trazo de la Densidad
El Trazo de Densidad provee una estimacin no paramtrica de la funcin de densidad de
probabilidad de las poblaciones de las cuales los datos fueron muestreados. Es creado al calcular
el nmero de observaciones que caen dentro de una ventana de amplitud establecida que se
mueven a travs del rango de los datos.
Densidades Suavizadas
0.05
Variables
Placebo
Test Agent
densidad
0.04
0.03
0.02
0.01
0
93
103
113
123
133
143
153
f ( x) =
1
hn
x xi
W
i =1
(2)
Funcin Boxcar
1 if u 1 / 2
W (u ) =
0 otherwise
(3)
Funcin Coseno
1 + cos(2u ) if u < 1 / 2
W (u ) =
otherwise
0
(4)
Mtodo: la funcin de cargas deseada. La funcin encajonar evala todos los valores dentro
de la ventana por igual. La funcin coseno proporciona cargad decrecientes a las
observaciones ms all del centro de la ventana. La seleccin automtica est determinada
por las especificaciones establecidas en la tabulacin EDA del cuadro de dilogo
Preferencias accesible desde el men Edicin.
Ancho del Intervalo: la amplitud de la ventana h dentro de la cual las observaciones afectan
la densidad estimada como un porcentaje del rango cubierto por el eje x. h = 60% no es
razonable para una muestra pequea pero podra no proporcionar tanto detalle como un valor
pequeo en muestras ms grandes.
12
22
(5)
s12
s 22
(6)
Para los datos de la presin arterial, la varianza en la primera muestra est 5 veces arriba
de la varianza en la segunda muestra.
3. Intervalos de Confianza: los intervalos se estiman para cada varianza muestral y para el
radio . Los intervalos para el radio indican que ste en realidad podra encontrarse en
alguna parte aproximadamente entre 1.5 y 15.8, con un 95% de confianza. Note que los
tamaos de muestra pequeos no proporcionan mucha precisin en las estimaciones de la
varianza del radio.
s12 / s 22
(7)
Hiptesis Alternativa: la hiptesis alternativa puede ser de dos colas (No igual a) o de una
cola (tal como > 1 si Mayor Que es especificado).
Comparacin de Medias
La Comparacin de Medias realiza una Prueba t para determinar si o no las medias de las dos
muestras son significativamente diferentes al considerar la diferencia definida:
= 1 2
(8)
La tabla muestra:
1. Intervalos de Confianza: estimaciones de intervalos para cada media muestral y para la
diferencia entre medias . El intervalo para la diferencia indica que la media de la presin
arterial del grupo Placebo podra exceder la del grupo de Agente de Prueba por una
diferencia aproximadamente entre 11.2 y 25.3 con 95% de confianza.
2. Prueba t: Una prueba de hiptesis respecto a la diferencia entre las medias.
Automticamente la hiptesis que se prueba es:
Hiptesis Nula: = 0
Hiptesis Alternativa: 0
Sin embargo esto puede ser cambiado usando Opciones de Cuadro. Para probar la
hiptesis se calcula un t estadstico. Dependiendo de la Opciones de Cuadro una prueba t
puede ejecutarse asumiendo que las muestras provienen de poblaciones con varianzas
iguales, o una prueba t aproximada puede ser ejecutada sin realizar tal supuesto.
Asociados con cada t estadstico se encuentra un P-Value. Pequeos P-values (menores
que 0.05 si se opera con un 5% de nivel de significancia) conducen a rechazar la hiptesis
nula.
Desde que la prueba F describe primero si hubo una diferencia estadstica entre las desviaciones
estndar de las dos muestras, la prueba t fue realizada sin suponer varianzas iguales. P-values
extremadamente pequeos indican que las muestras provienen de poblaciones con medias
significativamente diferentes.
Hiptesis Nula: 0, el valor de la diferencia entre las medias especificada por la hiptesis nula.
Hiptesis Alternativa: la hiptesis alternativa puede ser de dos colas (No Igual) o de una
cola (tal como > 1 si Mayor Que es especificado).
Asumir Sigmas Iguales: si se asume o no que las dos muestras provienen de poblaciones
con varianzas iguales. La prueba t es exacta si se hace el supuesto y es aproximada si no se
hace el supuesto.
Comparacin de Medianas
STATGRAPHICS tambin provve una opcin de tabulacin que compara las medianans de dos
poblacions usando la prueba Mann-Whitney (de Wilcoxon). Esta prueba es til en casos sonde
el supuesto de normalidad es cuestionable y no se encuentra una transformacin adecuada y en
casos donde una o ms observaciones son sospechosas de ser valores atpicos. Para realizar la
prueba las dos muestras se combinan y se les asigna un rango del valor ms pequeo al ms
grande (del rango 1 al rango n1+n2). Si existen observaciones empatadas se asigna un rango
promedio a las valores del grupo que se empata. El producto que aparece se muestra abajo:
Comparacin de Medianas
Mediana de muestra 1: 116.0
Mediana de muestra 2: 99.0
Prueba W de Mann-Whitney (Wilcoxon) para comparar medianas
Hiptesis Nula: mediana1 = mediana2
Hiptesis Alt.: mediana1 <> mediana2
Rango Promedio de muestra 1: 19.3333
Rango Promedio de muestra 2: 7.33333
W = -80.0 valor-P = 0.000101812
Se rechaza la hiptesis nula para alpha = 0.05.
La tabla muestra:
1. Estadsticos Muestrales: las medianas de la s dos muestras.
2. Rango Promedio: el rango promedio de los datos en cada muestra cuando a ambas
muestras se les asigna un rango.
3. Pruebas de W: el estadstico de la prueba de Wilcoxon y su valor P-Value asociado.
Pequeos P-Values (menores de 0.05 si se opera en un nivel de significancia de 5%)
conducen a rechazar la hiptesis nula.
El pequeo P-Value en el ejemplo indica que las muestras provienen de poblaciones con
medianas significativamente diferentes.
Hiptesis Alternativa: las hiptesis alternativa puede ser de dos colas (No Igual) o de una
cola (tal como mediana1 > mediana2 si Mayor Que es especificado).
Alfa: el nivel de significancia de la prueba usualmente establecido en 0.01, 0.05, o 0.10. Esto
es igual a la probabilidad de rechazar la hiptesis nula si es cierta. Esto no afecta el P-Value,
solamente afecta la conclusin declarada inmediatamente abajo del P-Value.
Grfica de Cuantiles
Este cuadro grafica los cuantiles (percentiles) de los datos en cada muestra.
Grfico Cuantil
1
Variables
Placebo
Test Agent
proporcin
0.8
0.6
0.4
0.2
0
93
103
113
123
133
143
153
En esta grfica, los datos son ordenados del ms pequeo al ms grande y se grafican en las
coordenadas
x(i ) , i 0.5
(9)
n j
La compensacin entre las dos lneas corresponde a las diferentes lugares de las dos
distribuciones.
Test Agent
143
133
123
113
103
93
93
103
113
123
Placebo
133
143
153
En la grfica los puntos son dibujados para cada observacin en la muestra ms pequea versus
los percentiles interpolados para la muestra ms grande. Si las dos muestras provienen de la
misma poblacin subyacente los puntos podran yacer aproximadamente a lo largo de la lnea
diagonal. La compensacin de los puntos a la derecha de la lnea corresponde a la media ms
grande del grupo Placebo, mientras que el hecho de que la pendiente aparece ser menos que 1 es
una muestra de que el grupo Placebo tambin tiene una desviacin estndar ms grande.
Prueba de Kolmogorov-Smirnov
La prueba de Kolmogorov-Smirnov Test realiza una prueba formal de la hiptesis nula que las
dos muestras provienen de la misma poblacin. Lo hace al calcular la mxima distancia entre las
distribuciones empricas
Dn = max F1 ( x) F2 ( x)
(10)
La cual equivale a la mxima distancia entre las dos curvas en la Grfica de Cuantiles. El
producto se muestra abajo:
Prueba de Kolmogorov-Smirnov
Estadstico DN estimado = 0.85
Estadstico K-S bilateral para muestras grandes = 2.19469
Valor P aproximado = 0.000131017
n1 n 2
Dn
n1 + n2
(11)
(x1 x2 ) t / 2,n + n 2 s p
1
1
1
+
n1 n 2
(12)
donde
sp =
(13)
(x1 x2 ) t / 2,m
s12 s 22
+
n1 n2
(14)
donde
(1 c )
1
c2
=
+
m n1 1 n2 1
(15)
s12 / n1
c= 2
s1 / n1 + s 22 / n2
(16)
s12
s12
1
,
F / 2,n2 1,n1 1
2
2
s 2 F / 2,n1 1,n2 1 s 2
(17)
Prueba t
(x1 x 2 ) 0
sp
1
1
+
n1 n2
(18)
(x1 x 2 ) 0
(19)
s12 s 22
+
n1 n 2
(20)
Z=
n1 n2
0.5
2
var(W )
si W > 0.0
(21)
n1 n2
+ 0.5
2
var(W )
si W 0.0
(22)
Z=
t j (t 2j 1)
nn
j =1
var(W ) = 1 2 n1 + n2 + 1
12
(n1 + n2 )(n1 + n2 1)
(23)
donde g es el nmero de los grupos empatados y tj es el tamao del grupo empatado j . Un Pvalue es calculado al comparar Z con la distribucin normal estndar.
P-Value Kolmogorov-Smirnov
P = 1 si K < 0.22
2
2
P = 1
exp
2
K
8K
(24)
(25)
(26)
(27)
Comparacin de dos Muestras - 22