Beruflich Dokumente
Kultur Dokumente
0
2
, bajo la hiptesis nula sigue una distribucin chi-cuadrado con n-1 grados de libertad.
Por tanto, para una muestra dada el valor de c es obtenido y se evala la probabilidad de observar
un valor como ste, bajo la hiptesis nula. Si el valor.p es muy pequeo implica que hay evidencia
para rechazar la hiptesis nula. En caso contrario, se puede asumir que la hiptesis nula es vlida.
Se debe tener presente que el valor.p se obtiene de acuerdo a la direccin de la hiptesis
alternativa
Ejemplo Temperatura y conductividad
Se han realizado 5 mediciones respecto a la conductividad de un metal el cual es obtenido en
condiciones controladas. De acuerdo a la calidad del instrumento, la variabilidad debe ser inferior
o igual a =1, existe evidencia que este supuesto no se cumpla?
Datos: 21,18; 23,87; 24,05; 22,59 y 22,78
10
Solucin:
Primeramente se debe definir apropiadamente las hiptesis: H0: = 1 vs. H1: > 1. Se
selecciona la variable e indica apropiadamente hiptesis como se muestra:
Prueba e IC para una desviacin estndar: Conduc
Mt odo
Hi pt esi s nul a Si gma = 1
Hi pt esi s al t er na Si gma > 1
El mt odo est ndar se ut i l i za sl o par a l a di st r i buci n nor mal .
El mt odo aj ust ado se ut i l i za par a cual qui er di st r i buci n cont i nua.
Est ad st i cas
Var i abl e N Desv. Est . Var i anza
Conduc 5 1, 15 1, 33
95%I nt er val os de conf i anza uni l at er al es
L mi t e L mi t e
i nf er i or i nf er i or
par a par a
Var i abl e Mt odo Desv. Est . var i anza
Conduc Est ndar 0, 75 0, 56
Aj ust ado 0, 75 0, 56
Pr uebas
Var i abl e Mt odo Chi cuadr ada GL Val or P
Conduc Est ndar 5, 33 4, 00 0, 255
Aj ust ado 5, 39 4, 05 0, 255
Como nos interesa bajo normalidad, revisar valor.p del mtodo estndar. En este caso, el
valor.o=0,255 > =5%. Es decir, no hay evidencia contra H0.
11
Ejercicio temperatura y conductividad.
Considere las mediciones realizadas en relacin a la conductividad para la temperatura 200. De
acuerdo a las especificaciones del proveedor, la desv.estndar debe ser inferior a 2,5.
EJERCICIOS APLICADOS:
Absorcin - Existen dos mtodos de produccin de ladrillos que influyen en el nivel de absorcin
de stos. Seis ladrillos producidos por cada mtodo son sometidos a pruebas en laboratorio,
obteniendo lo que sigue:
D A T O S Prom desv.est
Mt.A 25,0 19,5 16,6 21,3 24,7 16,8 20,65 3,7
Mt.B 22,2 19,2 15,7 20,4 19,6 15,7 18,80 2,6
La referencia dice que el nivel medio de absorcin no debe ser superior 20 mg/m3, con una
desviacin estndar inferior o igual a 2,5 mg/m3.
Qu mtodo debe ser implementado? Qu propuesta hara usted? (usar =5%)
Densidad del agua 1 Con el objetivo de estimar la incertidumbre en un proceso alternativo para
medir la densidad se lleva a cabo un experimento, en el cual se midi la diferencia entre la
densidad del agua determinada experimentalmente con el patrn nacional de densidad menos la
densidad del agua determinada mediante la frmula de M. Tanaka. Los resultados son (todos
positivos):
0,01523 - 0,01408 - 0,00484 - 0,01292 - 0,00276 - 0,01718 - 0,01624 - 0,00738 - 0,01609
Existe evidencia que permita indicar que hay un error sistemtico por exceso?
Densidad del agua 2 Para los datos almacenados en densidad1.xlsx, Existe evidencia que
permita indicar que en cada uno de los laboratorios hay un error sistemtico por exceso?
DISCUSION
En este ltimo ejercicio hay una pregunta natural son equivalentes/comparables los resultados
obtenidos por cada laboratorio?
12
TEST PARA DOS MUESTRAS
Como se ilustr en el ltimo ejercicio, ms de una vez nos interesa determinar si dos muestras son
comparables. Lo anterior implica, generalmente, comparacin de medias. Sin embargo, para
decidir qu test utilizar es necesario decidir previamente respecto a la igualdad de varianzas.
Adems, parte importante de los test se basan en el cumplimiento de la normalidad para las
distribuciones subyacentes.
Test para comparar dos varianzas (o ms)
Existe ms de un test para comparar varianzas (ej. F de Fisher que permite comparar dos
varianzas, Levene y Bartlett para dos y ms varianzas). En Minitab se encuentra implementado el
test F para comparar dos varianza y el test de Levene para comparar dos o ms varianzas. Esta
ltima prueba es no paramtrica (es decir, no requiere asumir normalidad para las poblaciones) y
se basa en la variabilidad intra-grupos y la variabilidad entre los grupos, obteniendo una prueba
que puede ser contrastada con la distribucin F de Fisher-Snedecor.
En ambos casos la hiptesis nula es de homogeneidad, es decir, todas las varianzas son iguales y la
hiptesis alternativa que una o ms difiere de las otras (es decir, heterogeneidad).
Paramtricamente (ya sea en trminos de las varianzas o desviaciones estndar son equivalentes),
H0:
1
=
2
==
k
vs H1: algn
i
j
Si el valor.p o significancia es inferior a , existe evidencia para rechazar H0.
En el caso de dos muestras, es posible indicar la direccin de la alternativa. Adems, en caso de
rechazar o no la hiptesis respecto a la igualdad de varianza, se dispone de un test T para la
comparacin de medias con varianzas distintas o varianzas iguales.
Test para comparar dos medias
Minitab dispone de los dos test T para comparar medias ya sea con varianzas iguales o varianzas
distintas. En el primer caso, el test t utiliza una varianza conjunta (denominada poleed variance).
Mientras que en el segundo caso usa una combinacin de las dos varianzas. Nuevamente la
decisin de rechazar o no la hiptesis nula en favor de la alternativa se basa en el valor.p de la
prueba.
Ejemplo - Temperatura:
Se han realizado 15 mediciones de la temperatura ambiental, 8 con un instrumento Met1 y 7
con el Met2. Los datos han sido ingresados directamente en SPSS (ver figura)
Met1 26,26 ; 26,25 ; 26,27 ; 26,29 ; 26,31 ; 26,32 ; 26,28 ; 26,27
Mt 2 26,26 ; 26,28 ; 26.29 ; 26,30 ; 26,33 ; 26,35 ; 26,36
13
Interesa determinar si existen diferencias significativas entre los mtodos. Por lo que se lleva a
cabo la prueba Comparacin de medias (y de varianzas).
Se utiliza el procedimiento t de 2 muestras ubicado en el mdulo Estadsticas bsicas, como se
muestra en la siguiente figura:
Una vez dentro del cuadro de dialogo, se deben identificar las variables que contiene las
mediciones e indicar la direccin de la hiptesis alternativa hemos asumido varianzas iguales (se
ha marcado)
Los resultados son los que siguen:
14
Prueba T e IC de dos muestras: Met1. Met2
T de dos muest r as par a Met 1 vs. Met 2
Medi a del
Er r or
N Medi a Desv. Est . est ndar
Met 1 8 26, 2813 0, 0242 0, 0085
Met 2 7 26, 3100 0, 0374 0, 014
Di f er enci a = mu ( Met 1) - mu ( Met 2)
Est i mado de l a di f er enci a: - 0, 0287
I C de 95%par a l a di f er enci a: ( - 0, 0634. 0, 0059)
Pr ueba T de di f er enci a = 0 ( vs. no =) : Val or T = - 1, 79 Val or P = 0, 096 GL = 13
Ambos ut i l i zan Desv. Est . agr upada = 0, 0310
Como se aprecia, el primer recuadro presenta el resumen estadstico: Promedio, desviacin
estndar y media del error estndar de las mediciones de temperaturas obtenidas con cada
instrumento. En el segundo recuadro se entrega
- Intervalos de confianza al 95% para la diferencia. Como se puede apreciar, el intervalo de
confianza captura al valor 0 (es decir,
1
-
2
=0).
- Prueba T para igualdad de medias con varianzas iguales. En este caso el test t=-1,79 con
significancia igual a 0,096 (para la hiptesis alternativa que se indic).
Un aspecto no menor se relaciona con las hiptesis que se analizan y las cuales deben ser
explicitadas antes de llevar a cabo la prueba. En este caso, las hiptesis de inters son:
H0:
1
=
2
vs H1:
1
2
H0:
1
-
2
=0 vs H1:
1
-
2
0
As, que en este caso es correcta la lectura del valor de significancia o valor.p bilateral.
Se ha asumido igualdad de varianza, supuesto que se valida a travs del test correspondiente. En
este caso, el test se implementa como se muestra en las siguientes figuras:
15
Prueba de varianzas iguales: Met1. Met2
I nt er val os de conf i anza de Bonf er r oni de 95%par a desvi aci ones est ndar es
N I nf er i or Desv. Est . Super i or
Met 1 8 0, 0151177 0, 0241646 0, 0553486
Met 2 7 0, 0227398 0, 0374166 0, 0941218
Pr ueba F ( di st r i buci n nor mal )
Est ad st i ca de pr ueba = 0, 42. val or p = 0, 278
Pr ueba de Levene ( cual qui er di st r i buci n cont i nua)
Est ad st i ca de pr ueba = 1, 40. val or p = 0, 258
O salida grfica:
Met2
Met1
0,10 0,08 0,06 0,04 0,02
I ntervalos de confianza de Bonferroni de 95% para Desv.Est.
Met2
Met1
26,375 26,350 26,325 26,300 26,275 26,250
Datos
Estadstica de prueba 0,42
Valor P 0,278
Estadstica de prueba 1,40
Valor P 0,258
Prueba F
Prueba de Levene
Prueba de igualdad de varianzas para Met1. Met2
Ejercicios
Temperatura - se cumple el supuesto de normalidad en el ejercicio anterior?
Densidad del agua - Considere los datos almacenadas en densidad1.xlsx, existe evidencia
estadstica que permita afirmar que los laboratorios entregan resultados distintos?
DISCUSION
16
Validacin de datos
Una de las primeras etapas en el anlisis de datos es la validacin de stos. Bsicamente, los datos
deben ser validos de acuerdo a los criterios propios del experimento. Independiente del anlisis
anterior, existen test que permiten determinar si uno o ms datos son anmalos. A continuacin
se revisan dos pruebas: Contraste de Dixon y contraste de Grubbs.
Contraste de Dixon
El contraste de Dixon a veces llamado contraste Q es muy popular par datos anmalos debido a
que es simple. Este test es aplicable a muestras pequeas (tamaos entre 4 y 7) y evala las
mediciones sospechosas comparando la diferencia entre ella y la medida ms prxima en tamao,
con el intervalo de las medidas.
Hiptesis:
H0: todas las mediciones proceden de la misma poblacin
H1: hay mediciones anmalas
Estadstico Q:
=
| |
()
Criterio:
Si el valor de Q excede al valor crtico de la siguiente tabla, se rechaza H0 y por tanto el dato
considerado como sospechoso es anmalo, para un nivel =5%
Tabla valores crticos contraste de Dixon estadstico Q
Tamao muestra Valor crtico
4
5
6
7
0,831
0,717
0,621
0,570
Ejemplo nitrito
Se han realizado cuatro mediciones para la concentracin de nitrito (mg/l) en una muestra de agua
de ro.
0,403 0,410 0,401 0,380
La ltima observacin es sospechosa, debera ser rechazada?
Se calcula el estadstico Q = |0,380 0,401| / |0,410 0,380| = 0,7
17
Como el tamao muestra es n=4, el valor critico es 0,831. Como Q < Q.crtico, no hay evidencia
contra H0. Es decir, el dato 0,38 no puede ser calificado como dato anmalo.
Ejemplo nitrito continuacin
Se han tomado tres mediciones adicionales referidas al ejemplo anterior, es decir concentracin
de nitrito (mg/l) en una muestra de agua:
0,403 0,410 0,401 0,380 0,400 0,413 0,411
Es anmalo el dato 0,38?
Se calcula el estadstico Q = |0,380 0,400| / |0,413 0,380| = 0,606
El valor crtico para Q cuando n=7 es 0,570. Como Q > Q.crtico, existe evidencia para rechazar H0.
Es decir, el dato 0,380 puede ser considerado como anmalo.
Contraste de Grubbs
Otro contraste muy utilizado para datos anmalos es el test de Grubbs. Este test supone que los
datos provienen de una distribucin normal.
Hiptesis:
H0: todas las mediciones proceden de la misma poblacin
H1: hay mediciones anmalas
Estadstico G:
=
|
2
Donde za/2 y zb son los percentiles de la distribucin normal (cola derecha)
Alternativamente, se puede estimar el nmero de rplicas si se conoce el coeficiente de variacin
%CV y la diferencia se puede expresar como porcentaje de la media global esperada del
experimento.
Ntese que si %CV = 100 /, y %=100(/), entonces la ecuacin anterior se escribe como:
= 2
/2
+
%
%
2
20
Ejemplo Nitrito
Se desea comparar dos mtodos que evaluar la concentracin de nitrito (mg/l), asumiendo que
=0,01 y que la diferencia minina es =0,005 con un 90% de confianza (o =10%) y un 80% de
potencial (o =0,2).
Como z
/2
=1,645 y z
0,010
0,005
2
= 49,4
Es decir, se requieren al menos 50 mediciones en cada tratamiento.
Usando la frmula alternativa, y asumiendo una media =0,4 %CV=2,5% y %=1,25%, se
obtiene el mismo valor para r.
Debe tenerse presente que los valores obtenidos para el nmero de rplicas necesarias son
aproximaciones. Con frecuencia se determinan con base en las estimaciones de la varianza
asociadas a estudios previos y no a las del estudio real que se usar.
La siguiente tabla presenta el nmero de rplicas necesarias para valores predeterminados de los
cuatro parmetros relevantes.
Tabla nmero de rplicas mnimas para , , %CV y % dados.
=5% =1%
%CV 1- % =10 % =20 % =10 %=20
5 80% 4 1 6 2
5 95% 7 2 9 3
10 80% 16 4 24 6
10 95% 26 7 36 9