Sie sind auf Seite 1von 22

STATGRAPHICS Rev.

4/25/2007

Comparacin de dos Muestras


Resumen
El procedimiento de Comparacin de dos Muestras est diseado para comparar dos muestras
independientes de datos de variables. Las pruebas son corridas para determinar si existe o no
diferencia significativa entre medias, varianzas y/o medianas de las poblaciones de las cuales las
muestras fueron tomadas. En adicin, los datos pueden ser mostrados grficamente de varias
maneras, incluyendo un histograma dual, una grfica de caja y bigotes dual y una grfica de
cuantiles.
En este procedimiento se asume que no existe relacin entre una observacin seleccionada en
una muestra y cualquier observacin especfica en otra muestra. En casos donde observaciones
especficas en cada muestra corresponden a la misma unidad experimental, se usa el
procedimiento Comparacin de Muestras Aparedas.

StatFolio de Muestra: two samples.sgp


Datos de Ejemplo:
El archivo bloodpressure.sf6 contiene datos que describen la presin arterial media de 27
pacientes hipertensos, n1 = 15 de los cuales fueron tratados con un placebo y n2 = 12 les fue
suministrada una droga experimental. Los datos han sido introducidos en 2 columnas como se
muestra abajo:
Placebo
(Placebo)
113
116
147
114
111
132
125
109
107
114
116
98
123
126
123

Test Agent
(Agente de Prueba)
112
106
100
100
100
96
97
98
104
93
96
98

Alternativamente todas las 27 lecturas de presin arterial podran haber sido introducidas dentro
de una sencilla columna de datos y se pudo haber creado una segunda columna para identificar a
qu grupo pertenece cada paciente:

2005 por StatPoint, Inc.

Comparacin de dos Muestras - 1

STATGRAPHICS Rev. 4/25/2007


Patient
(Paciente)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28

2005 por StatPoint, Inc.

Pressure
(Presin)
113
116
147
114
111
132
125
109
107
114
116
98
123
126
123
112
106
100
100
100
96
97
98
104
93
96
98
112

Group
(Grupo)
Placebo
Placebo
Placebo
Placebo
Placebo
Placebo
Placebo
Placebo
Placebo
Placebo
Placebo
Placebo
Placebo
Placebo
Placebo
Agente de Prueba
Agente de Prueba
Agente de Prueba
Agente de Prueba
Agente de Prueba
Agente de Prueba
Agente de Prueba
Agente de Prueba
Agente de Prueba
Agente de Prueba
Agente de Prueba
Agente de Prueba
Agente de Prueba

Comparacin de dos Muestras - 2

STATGRAPHICS Rev. 4/25/2007

Captura de Datos
Los datos que se vana analizar se especifican en el cuadro de dilogo mostrado abajo. Para casos
donde las dos muestras han sido colocadas en columnas separadas se especifican los nombres de
las columnas.

Muestra 1: columna numrica que contiene las observaciones de la primera muestra.

Muestra 2: columna numrica que contiene las observaciones de la segunda muestra.

Seleccin: seleccin del subconjunto.

Entrada: se fija en Dos Columnas de Datos para indicar que cada muestra han sido colocada
en una columna separada.

Si los datos de ambas muestras han sido introducidos dentro de una simple columna, entonces
introduzca el nombre de la columna que contiene los identificadores del grupo.

2005 por StatPoint, Inc.

Comparacin de dos Muestras - 3

STATGRAPHICS Rev. 4/25/2007

Datos: columna numrica que contiene las observaciones de ambas muestras.

Cdigo de Muestra: columna numrica o no numrica que contiene un identificador para la


muestra correspondiente a cada observacin.

Seleccin: selecciona el subconjunto.

Captura: se fija en Columnas de Cdigos y Datos para indicar que los datos de ambas
muestras han sido colocados dentro de una sola columna.

Resumen del Anlisis


El Resumen del Anlisis muestra el nmero de observaciones en cada muestra.
Comparacin de Dos Muestras - Placebo & Test Agent
Muestra 1: Placebo
Muestra 2: Test Agent
Muestra 1: 15 valores en el rango de 98.0 a 147.0
Muestra 2: 12 valores en el rango de 93.0 a 112.0

Tambin se muestran los valores ms grandes y ms pequeos.

2005 por StatPoint, Inc.

Comparacin de dos Muestras - 4

STATGRAPHICS Rev. 4/25/2007

Estadsticos de Resumen
El cuadro de Resumen de Estadsticos calcula un nmero de diferentes estadsticos que son
comnmente usados para resumir una muestra de los datos de variables:
Resumen Estadstico
Recuento
Promedio
Mediana
Moda
Media Geomtrica
Media Recortada 5%
Media Winsorizada 5%
Varianza
Desviacin Estndar
Coeficiente de Variacin
Error Estndar
Sigma Winsorizada 5%
DAM
Sbi
Mnimo
Mximo
Rango
Cuartil Inferior
Cuartil Superior
Rango Intercuartlico
1/6 sextil
5/6 sextil
Rango Intersextil
Sesgo
Sesgo Estandarizado
Curtosis
Curtosis Estandarizada
Suma
Suma de Cuadrados

Placebo
15
118.267
116.0
117.745
117.796
118.267
136.781
11.6953
9.88896%
3.01972
11.6953
7.0
10.7038
98.0
147.0
49.0
111.0
125.0
14.0
109.0
126.0
17.0
0.82607
1.30613
1.63626
1.29358
1774.0
211720.

Test Agent
12
100.0
99.0
100.0
99.8812
99.7222
100.0
26.7273
5.16984
5.16984%
1.49241
5.16984
2.5
4.52375
93.0
112.0
19.0
96.5
102.0
5.5
96.0
105.0
9.0
1.17953
1.6681
1.55061
1.09645
1200.0
120294.

La mayora de los estadsticos caen dentro de alguna de las tres categoras:


A una distribucin normal
1. medidas de tendencia central estadsticos que caracterizan el centro de los datos.
2. medidas de dispersin estadsticos que miden la variacin de los datos.
3. medidas de forma estadsticos que miden la forma de los datos en relacin con una
distribucin normal.
Estos estadsticos incluidos en la tabla de manera automtica son controlados por las
especificaciones en el cuadro Stats del cuadro de dilogo Preferencias. Dentro del procedimiento
la seleccin puede ser cambiada usando Opciones de Cuadro. Para una descripcin detallada de
cada estadstico, ver la documentacin Anlisis de Una Variable.
Para los datos de presin arterial note que las siguientes medias muestrales y desviaciones
estndar:
Placebo: x1 = 118.3 s1 = 11.70
Agente de Prueba: x 2 = 100.0 s2 = 5.17
2005 por StatPoint, Inc.

Comparacin de dos Muestras - 5

STATGRAPHICS Rev. 4/25/2007


Ambas la media y la desviacin estndar parecen ser ms grandes para la muestra donde el
placebo fue suministrado. Note tambin que la estandarizada puntiagudez y la estandarizada
curtosis para ambas muestras est dentro del intervalo 2 a +2, indicando que se podra asumir
razonablemente que ambas muestras podran provenir de distribuciones normales.
Cuadro de Opciones

Seleccione los estadsticos deseados

Grfica de Caja y Bigotes


Este cuadro muestra una grfica de Caja y Bigotes para cada muestra.

Grfico Caja y Bigotes

Placebo

Test Agent

93

103

113

123

133

143

153

Las grficas de Caja y Bigotes son construidas de la siguiente manera:

Se dibuja una caja que se extiende desde el cuartil inferior de la muestra hasta el
cuartil superior. Este es el intervalo cubierto por la mitad 50% de los valores de los
datos cuando se ordenan del ms pequeo al ms grande.

2005 por StatPoint, Inc.

Comparacin de dos Muestras - 6

STATGRAPHICS Rev. 4/25/2007

Se dibuja una lnea vertical en la mediana (el valor de en medio).

Si se requiere un signo de suma es colocado en la localizacin de la media muestral.

Los bigotes son dibujados de los puntos extremos de la caja hasta los valores de datos
ms grandes y ms pequeos a menos que haya valores inusualmente ms alejados de
la caja (los cuales Tukey llama puntos extremos). Los puntos extremos, los cuales son
puntos localizados ms de 1.5 veces el rango intercuartlico arriba o debajo de la caja
(la amplitud de la caja) se indican por smbolos de puntos. Cualquier punto ms all
de 3 veces el rango intercuartlico arriba o debajo de la caja es conocido como punto
extremo alejado y se indica como smbolo de punto con un signo de suma encima. Si
los puntos extremos estn presentes los bigotes se dibujan hasta los valores de los
datos ms grandes y ms pequeos los cuales no son puntos extremos.

En los datos de la muestra, la caja para el grupo Placebo es cambiada a la derecha de la caja de la
caja para el grupo Agente de Prueba. En resumen, la caja es ms amplia lo que corresponde a la
mayor variabilidad. Casa una de las grficas tambin muestra un nico punto extremo.
Opciones de Cuadro

Direccin: la orientacin de la caja que corresponde a la direccin de los bigotes.

Muesca sobre la Mediana: Si es seleccionda un corte ser aadido a la grfica mostrando el


error de estimacin asociado con cada mediana. La escala de los cortees se arregla de tal
manera que si ellos nos enciman las dos medianas son significativamente diferentes al nivel
de confianza predeterminado por el sistema (especificado en la tabulacin General del
cuadro de dilogo Preferencias en el men Edicin.

Mostrar Aberrantes: si se selecciona indica la localizacin de los puntos extremos.

Mostrar Media: si se selecciona muestra la localizacin de la media muestral as como de la


mediana.

Ejemplo Caja con Muesca y Grfica de Caja y Bigotes


La siguiente grfica aade muescas en las medianas en un intervalo de confianza de 95%.
2005 por StatPoint, Inc.

Comparacin de dos Muestras - 7

STATGRAPHICS Rev. 4/25/2007


Grfico Caja y Bigotes

Placebo

Test Agent

93

103

113

123

133

143

153

Cada corte cubre el intervalo

z 1.25( IQR j )
1
~
xj /2
1 +

2 1.35 n j
2

(1)

x j es la mediana de la j-sima muestra, IQRj es el rango intercuartlico de la muestra, nj es


donde ~
el tamao de muetra, y z/2 es el valor crtico superior (/2)% de una distribucin normal
estndar. Dado que los cortees no se sobreponen, las medianas son significativamente diferentes
en un nivel de confianza de 5%.

2005 por StatPoint, Inc.

Comparacin de dos Muestras - 8

STATGRAPHICS Rev. 4/25/2007

Histograma de Frecuencias
El cuadro de Histograma de Frecuencias muestra la muestra de datos usando un cuadro de
barras dual:

Placebo
8

frecuencia

8
90

100

110

120
Test Agent

130

140

150

La altura de cada barra en la grfica de arriba representa el nmero de observaciones en los


intervalos adyacentes, cada uno cubre 5 mm de presin. El histograma que se encuentra arriba de
la lnea es para el grupo al que se le suministr el placebo mientras que el histograma debajo de
la lnea representa el grupo Agente de Prueba.

2005 por StatPoint, Inc.

Comparacin de dos Muestras - 9

STATGRAPHICS Rev. 4/25/2007


Opciones de Cuadro

Nmero de clases: el nmero de intervalos dentro de los cuales los datos sern divididos.
Los intervalos son adyacentes entre s e iguales en amplitud.

Lmite Inferior: lmite inferior del primer intervalo.

Lmite Superior: lmite superior del ltimo intervalo.

Mantener: mantiene el nmero seleccionado de intervalos y lmites incluso si la fuente de


datos cambia. De manera automtica el nmero de clases y lmites son estimados otra vez en
cuanto los datos cambian. Esto es necesario para que todas las observaciones se muestren an
si algunos datos actualizados caen ms all de los lmites originales.

Frecuencias: Si es Relativa, la altura de las barras de las observaciones representa las


observaciones en un solo intervalo. Si es Acumulada la altura representa las observaciones en
el intervalo indicado y todos los intervalos a su izquierda.

2005 por StatPoint, Inc.

Comparacin de dos Muestras - 10

STATGRAPHICS Rev. 4/25/2007

Trazo de la Densidad
El Trazo de Densidad provee una estimacin no paramtrica de la funcin de densidad de
probabilidad de las poblaciones de las cuales los datos fueron muestreados. Es creado al calcular
el nmero de observaciones que caen dentro de una ventana de amplitud establecida que se
mueven a travs del rango de los datos.

Densidades Suavizadas
0.05

Variables
Placebo
Test Agent

densidad

0.04
0.03
0.02
0.01
0
93

103

113

123

133

143

153

La funcin de densidad estimada est dada por:

f ( x) =

1
hn

x xi

W
i =1

(2)

donde h es la amplitud de la ventana en unidades de X y W(u) es la funcin de cargas


determinada en la seleccin del cuadro de dilogo Cuadro de Opciones. Se encuentran
disponibles dos formas de la funcin de cargas.

Funcin Boxcar

1 if u 1 / 2
W (u ) =
0 otherwise

(3)

Funcin Coseno

1 + cos(2u ) if u < 1 / 2
W (u ) =
otherwise
0

(4)

La ltima seleccin usualmente brinda un resultado suavizador con el valor deseable de h


dependiendo del tamao de los datos de la muestra.

2005 por StatPoint, Inc.

Comparacin de dos Muestras - 11

STATGRAPHICS Rev. 4/25/2007


Para cada datos muestrales el trazo de la densidad se parece a las distribuciones normales.
Cuadro de Opciones

Mtodo: la funcin de cargas deseada. La funcin encajonar evala todos los valores dentro
de la ventana por igual. La funcin coseno proporciona cargad decrecientes a las
observaciones ms all del centro de la ventana. La seleccin automtica est determinada
por las especificaciones establecidas en la tabulacin EDA del cuadro de dilogo
Preferencias accesible desde el men Edicin.

Ancho del Intervalo: la amplitud de la ventana h dentro de la cual las observaciones afectan
la densidad estimada como un porcentaje del rango cubierto por el eje x. h = 60% no es
razonable para una muestra pequea pero podra no proporcionar tanto detalle como un valor
pequeo en muestras ms grandes.

Resolucin del Eje X: el nmero de puntos en los cuales la densidad es estimada.

2005 por StatPoint, Inc.

Comparacin de dos Muestras - 12

STATGRAPHICS Rev. 4/25/2007

Comparacin de Desviaciones Estndar


Las grficas mostradas arriba sugieren que existen diferencias entre las dos muestras. Para
determinar si las diferencias aparentes son estadsticamente significativas y no es slo por los
tamaos pequeo de las muestras se pueden realizar pruebas de hiptesis. La Comparacin de las
Desviaciones Estndar realiza una Prueba F para determinar si las desviaciones estndar son
significativamente diferentes al considerar el radio de varianza definido por:

12
22

(5)

El resultado se muestra abajo:


Comparacin de Desviaciones Estndar
Placebo Test Agent
Desviacin Estndar
11.6953
5.16984
Varianza
136.781
26.7273
Gl
14
11
Razn de Varianzas= 5.11765
Intervalos de confianza del 95.0%
Desviacin Estndar de Placebo: [8.56247, 18.4447]
Desviacin Estndar de Test Agent: [3.66229, 8.77776]
Razones de Varianzas: [1.52365, 15.837]
Prueba-F para comparar Desviaciones Estndar
Hiptesis Nula: sigma1 = sigma2
Hiptesis Alt.: sigma1 <> sigma2
F = 5.11765 valor-P = 0.00988302
Se rechaza la hiptesis nula para alfa = 0.05.

La tabla muestra que:


1. Estadsticos Muestrales: las desviaciones estndar muestrales, varianzas y grados de
libertad.
2. Radio de Varianzas: el radio de la varianza de la primera muestra entre el radio de la
varianza de la segunda muestra est dado:

s12
s 22

(6)

Para los datos de la presin arterial, la varianza en la primera muestra est 5 veces arriba
de la varianza en la segunda muestra.
3. Intervalos de Confianza: los intervalos se estiman para cada varianza muestral y para el
radio . Los intervalos para el radio indican que ste en realidad podra encontrarse en
alguna parte aproximadamente entre 1.5 y 15.8, con un 95% de confianza. Note que los
tamaos de muestra pequeos no proporcionan mucha precisin en las estimaciones de la
varianza del radio.

2005 por StatPoint, Inc.

Comparacin de dos Muestras - 13

STATGRAPHICS Rev. 4/25/2007


4. Prueba F: una prueba de hiptesis respecto al radio de la varianza. De manera
automtica, las hiptesis probadas son:
Hiptesis Nula: = 1
Hiptesis Alternativa: 1
Sin embargo, esto puede ser cambiado usando Opciones de Cuadro. Para probar la
hiptesis se calcula el radio F:
F=

s12 / s 22

(7)

Donde 0 es el valor especificado por la hiptesis nula. Pequeos valores P-values


(menos de 0.05 si operan en un 5% de nivel de significancia) conducen a rechazar la
hiptesis nula.
En el ejemplo actual, el pequeo P-Value indica que las muestras provienen de
poblaciones con desviaciones estndar estadsticamente diferentes.
Opciones de Cuadro

Hiptesis Nula: 0, el valor del radio de la varianza especificado en la hiptesis nula.

Hiptesis Alternativa: la hiptesis alternativa puede ser de dos colas (No igual a) o de una
cola (tal como > 1 si Mayor Que es especificado).

Alfa: el nivel de significancia de la prueba, usualmente se establece en 0.01, 0.05, o 0.10.


Esto es igual a la probabilidad de rechazar la hiptesis nula si es verdadera. No afecta el PValue, solamente la conclusin establecida inmediatamente abajo del P-Value.

2005 por StatPoint, Inc.

Comparacin de dos Muestras - 14

STATGRAPHICS Rev. 4/25/2007

Comparacin de Medias
La Comparacin de Medias realiza una Prueba t para determinar si o no las medias de las dos
muestras son significativamente diferentes al considerar la diferencia definida:
= 1 2

(8)

El resultado se muestra abajo:


Comparacin de Medias
Intervalos de confianza del 95.0% para la media de Placebo: 118.267 +/- 6.47668 [111.79, 124.743]
Intervalos de confianza del 95.0% para la media de Test Agent: 100.0 +/- 3.28477 [96.7152, 103.285]
Intervalos de confianza del 95.0% intervalo de confianza para la diferencia de medias
suponiendo varianzas iguales: 18.2667 +/- 7.49787 [10.7688, 25.7645]
Prueba t para comparar medias
Hiptesis nula: media1 = media2
Hiptesis Alt.: media1 <> media2
suponiendo varianzas iguales: t = 5.01756 valor-P = 0.000035616
Se rechaza la hiptesis nula para alfa = 0.05.

La tabla muestra:
1. Intervalos de Confianza: estimaciones de intervalos para cada media muestral y para la
diferencia entre medias . El intervalo para la diferencia indica que la media de la presin
arterial del grupo Placebo podra exceder la del grupo de Agente de Prueba por una
diferencia aproximadamente entre 11.2 y 25.3 con 95% de confianza.
2. Prueba t: Una prueba de hiptesis respecto a la diferencia entre las medias.
Automticamente la hiptesis que se prueba es:
Hiptesis Nula: = 0
Hiptesis Alternativa: 0
Sin embargo esto puede ser cambiado usando Opciones de Cuadro. Para probar la
hiptesis se calcula un t estadstico. Dependiendo de la Opciones de Cuadro una prueba t
puede ejecutarse asumiendo que las muestras provienen de poblaciones con varianzas
iguales, o una prueba t aproximada puede ser ejecutada sin realizar tal supuesto.
Asociados con cada t estadstico se encuentra un P-Value. Pequeos P-values (menores
que 0.05 si se opera con un 5% de nivel de significancia) conducen a rechazar la hiptesis
nula.
Desde que la prueba F describe primero si hubo una diferencia estadstica entre las desviaciones
estndar de las dos muestras, la prueba t fue realizada sin suponer varianzas iguales. P-values
extremadamente pequeos indican que las muestras provienen de poblaciones con medias
significativamente diferentes.

2005 por StatPoint, Inc.

Comparacin de dos Muestras - 15

STATGRAPHICS Rev. 4/25/2007


Opciones de Cuadro

Hiptesis Nula: 0, el valor de la diferencia entre las medias especificada por la hiptesis nula.

Hiptesis Alternativa: la hiptesis alternativa puede ser de dos colas (No Igual) o de una
cola (tal como > 1 si Mayor Que es especificado).

Alfa: el nivel de significancia de la prueba, usualmente establecido en 0.01, 0.05, o 0.10.


Esto es igual a la probabilidad de rechazar la hiptesis nula si es cierta. Esto no afecta el PValue, solamente la conclusin declarada inmediatamente debajo del P-Value.

Asumir Sigmas Iguales: si se asume o no que las dos muestras provienen de poblaciones
con varianzas iguales. La prueba t es exacta si se hace el supuesto y es aproximada si no se
hace el supuesto.

2005 por StatPoint, Inc.

Comparacin de dos Muestras - 16

STATGRAPHICS Rev. 4/25/2007

Comparacin de Medianas
STATGRAPHICS tambin provve una opcin de tabulacin que compara las medianans de dos
poblacions usando la prueba Mann-Whitney (de Wilcoxon). Esta prueba es til en casos sonde
el supuesto de normalidad es cuestionable y no se encuentra una transformacin adecuada y en
casos donde una o ms observaciones son sospechosas de ser valores atpicos. Para realizar la
prueba las dos muestras se combinan y se les asigna un rango del valor ms pequeo al ms
grande (del rango 1 al rango n1+n2). Si existen observaciones empatadas se asigna un rango
promedio a las valores del grupo que se empata. El producto que aparece se muestra abajo:
Comparacin de Medianas
Mediana de muestra 1: 116.0
Mediana de muestra 2: 99.0
Prueba W de Mann-Whitney (Wilcoxon) para comparar medianas
Hiptesis Nula: mediana1 = mediana2
Hiptesis Alt.: mediana1 <> mediana2
Rango Promedio de muestra 1: 19.3333
Rango Promedio de muestra 2: 7.33333
W = -80.0 valor-P = 0.000101812
Se rechaza la hiptesis nula para alpha = 0.05.

La tabla muestra:
1. Estadsticos Muestrales: las medianas de la s dos muestras.
2. Rango Promedio: el rango promedio de los datos en cada muestra cuando a ambas
muestras se les asigna un rango.
3. Pruebas de W: el estadstico de la prueba de Wilcoxon y su valor P-Value asociado.
Pequeos P-Values (menores de 0.05 si se opera en un nivel de significancia de 5%)
conducen a rechazar la hiptesis nula.
El pequeo P-Value en el ejemplo indica que las muestras provienen de poblaciones con
medianas significativamente diferentes.

2005 por StatPoint, Inc.

Comparacin de dos Muestras - 17

STATGRAPHICS Rev. 4/25/2007


Cuadro de Opciones

Hiptesis Alternativa: las hiptesis alternativa puede ser de dos colas (No Igual) o de una
cola (tal como mediana1 > mediana2 si Mayor Que es especificado).

Alfa: el nivel de significancia de la prueba usualmente establecido en 0.01, 0.05, o 0.10. Esto
es igual a la probabilidad de rechazar la hiptesis nula si es cierta. Esto no afecta el P-Value,
solamente afecta la conclusin declarada inmediatamente abajo del P-Value.

Grfica de Cuantiles
Este cuadro grafica los cuantiles (percentiles) de los datos en cada muestra.

Grfico Cuantil
1

Variables
Placebo
Test Agent

proporcin

0.8
0.6
0.4
0.2
0
93

103

113

123

133

143

153

En esta grfica, los datos son ordenados del ms pequeo al ms grande y se grafican en las
coordenadas

x(i ) , i 0.5
(9)

n j

La compensacin entre las dos lneas corresponde a las diferentes lugares de las dos
distribuciones.

2005 por StatPoint, Inc.

Comparacin de dos Muestras - 18

STATGRAPHICS Rev. 4/25/2007

Grfica de Cuantiles- Cuantiles


La grfica de cuantiles-cuantiles (Q-Q) grafica los cuantiles de una muestra versus los cuantiles
de la otra.
Grfico Cuantil-Cuantil
153

Test Agent

143
133
123
113
103
93
93

103

113

123
Placebo

133

143

153

En la grfica los puntos son dibujados para cada observacin en la muestra ms pequea versus
los percentiles interpolados para la muestra ms grande. Si las dos muestras provienen de la
misma poblacin subyacente los puntos podran yacer aproximadamente a lo largo de la lnea
diagonal. La compensacin de los puntos a la derecha de la lnea corresponde a la media ms
grande del grupo Placebo, mientras que el hecho de que la pendiente aparece ser menos que 1 es
una muestra de que el grupo Placebo tambin tiene una desviacin estndar ms grande.

2005 por StatPoint, Inc.

Comparacin de dos Muestras - 19

STATGRAPHICS Rev. 4/25/2007

Prueba de Kolmogorov-Smirnov
La prueba de Kolmogorov-Smirnov Test realiza una prueba formal de la hiptesis nula que las
dos muestras provienen de la misma poblacin. Lo hace al calcular la mxima distancia entre las
distribuciones empricas
Dn = max F1 ( x) F2 ( x)

(10)

La cual equivale a la mxima distancia entre las dos curvas en la Grfica de Cuantiles. El
producto se muestra abajo:
Prueba de Kolmogorov-Smirnov
Estadstico DN estimado = 0.85
Estadstico K-S bilateral para muestras grandes = 2.19469
Valor P aproximado = 0.000131017

En adicin a Dn, la tabla tambin muestra el estadstico K-S definido como


K=

n1 n 2
Dn
n1 + n2

(11)

Y un P-Value asociado. Pequeos P-values (menos que 0.05 si se opera en un nivel de


significancia de 5% ) conducen a rechazar la hiptesis nula de que las dos muestras provienen de
la misma poblacin.

2005 por StatPoint, Inc.

Comparacin de dos Muestras - 20

STATGRAPHICS Rev. 4/25/2007


Clculos
Intervalo de Confianza para la Diferencia entre Medias

Si se asume igualdad de varianzas:

(x1 x2 ) t / 2,n + n 2 s p
1

1
1
+
n1 n 2

(12)

donde
sp =

(n1 1)s12 + (n2 1)s 22


n1 + n 2 2

(13)

Si no sea sume igualdad de varianzas:

(x1 x2 ) t / 2,m

s12 s 22
+
n1 n2

(14)

donde

(1 c )
1
c2
=
+
m n1 1 n2 1

(15)

s12 / n1
c= 2
s1 / n1 + s 22 / n2

(16)

Intervalo de Confianza para el Radio de la Varianza

s12

s12
1
,
F / 2,n2 1,n1 1
2
2
s 2 F / 2,n1 1,n2 1 s 2

(17)

Prueba t

Si se asume igualdad de varianzas


t=

(x1 x 2 ) 0
sp

1
1
+
n1 n2

2005 por StatPoint, Inc.

(18)

Comparacin de dos Muestras - 21

STATGRAPHICS Rev. 4/25/2007


Es comparado con una distribucin t con n1+n2-2 grados de libertad. Si no se asume igualdad de
varianzas,
t=

(x1 x 2 ) 0

(19)

s12 s 22
+
n1 n 2

Es comparado con una distribucin t con m grados de libertad.

Prueba de Mann-Whitney (Wilcoxon)


n (n + 1)
W = n1 n 2 + 1 1
Tx
2

(20)

Donde Tx es la suma de los rangos para la muestra 1. Un estadstico de prueba normalizado es


calculado de

Z=

n1 n2
0.5
2
var(W )

si W > 0.0

(21)

n1 n2
+ 0.5
2
var(W )

si W 0.0

(22)

Z=

La varianza de W de arriba se calcula para las observaciones empatadas as:


g

t j (t 2j 1)

nn
j =1

var(W ) = 1 2 n1 + n2 + 1
12
(n1 + n2 )(n1 + n2 1)

(23)

donde g es el nmero de los grupos empatados y tj es el tamao del grupo empatado j . Un Pvalue es calculado al comparar Z con la distribucin normal estndar.

P-Value Kolmogorov-Smirnov

P = 1 si K < 0.22
2
2
P = 1
exp
2
K
8K

(24)

si 0.22 < K 0.80

P = 2e 2 K + e 8 K e 18 K si 0.80 < K 3.15


P = 0 si K > 3.15
2

2005 por StatPoint, Inc.

(25)
(26)
(27)
Comparacin de dos Muestras - 22

Das könnte Ihnen auch gefallen