Sie sind auf Seite 1von 20

1

Herramientas bsicas para los diseos experimentales.


En este apartado se ilustran, inicialmente, tres tcnicas bsicas para implementar las pruebas
estadsticas basadas en una muestra. A saber, prueba de normalidad, prueba sobre una media y
prueba sobre una varianza, todas para el caso de una muestra. Posteriormente, se extiende las
pruebas al caso de dos muestras.
Uno de los supuestos bsicos para llevar a cabo las diferentes pruebas estadsticas corresponde al
supuesto de normalidad.
TEST DE NORMALIDAD
Formalmente, si x1, x2, , xn una muestra aleatoria proveniente de una poblacin, interesa de
sobre manera determinar si estas mediciones provienen de una distribucin normal. Si se cumple
ese supuestos es posible aplicar un conjunto de pruebas sobre la media o varianza.
H0: Los datos provienen de una distribucin normal
H1: los datos no provienen de una distribucin normal
Test 1 Kolmogorov-Smirnov (K-S) - Clsico
Este test se basa en la comparacin de la distribucin emprica Fn(x) versus la distribucin terica
F(x). Se obtiene d(x) = mx|F(xi) Fn(xi)| y esta diferencia se contrasta con valores tericos (tabla
D). Si el valor.p es pequeo la hiptesis nula debe ser rechazada, en caso contrario no se
rechaza (se dice, generalmente, no hay evidencia en contra de la hiptesis nula, por tanto puedo
suponer que es vlida). En test de K-S es aplicable cuando n es grande (ej. n > 30)
Test 2 Shapiro-Wilk (S-W) o Ryan-Joiner (RJ)
Este test se basa en la obtencin de la correlacin entre la distribucin emprica y la distribucin
terica. El valor se contrasta con valores de correlacin tericos. Al igual que en el caso anterior,
se obtienen el valor.p de la prueba. As, si el valor.p es pequeo la hiptesis nula debe ser
rechazada, en caso contrario no se rechaza (se dice, generalmente, no hay evidencia en contra de
la hiptesis nula, por tanto puedo suponer que es vlida). En test RJ es apropiado cuando el
tamao muestral no es tan grande (ej. n < 50)
Test 3 Anderson-Darling (AD)
Este test fue propuesto en la dcada del 80 y se basa en la distribucin conjunta de todos los datos
(ordenados de menor a mayor, obtiene la distribucin emprica del ltimo-primero,
antepenltimo-segundo, etc.), que si es normal AD ser pequeo. Nuevamente, al igual que en el
caso anterior, se obtienen el valor.p de la prueba. As, si el valor.p es pequeo la hiptesis nula
debe ser rechazada, en caso contrario no se rechaza.



2

Ejemplo 1 Normalidad y temperatura.
Sea han realizado 6 mediciones de la temperatura: 23; 25; 27; 26; 23; 25. Puede asumirse que
provienen de una distribucin normal?. Use =5%.
Solucin:
En este caso debemos llevar a cabo una prueba de normalidad y para eso debemos utilizar el
procedimiento Prueba de Normalidad que se encuentra en el mdulo Estadsticas bsicas (como
se aprecia en la figura)

Una vez dentro del cuadro de dialogo se debe indicar la variable (o columna) que contiene los
datos y seleccionar el test de normalidad a utilizar: AD, RJ o KS.



3

29 28 27 26 25 24 23 22 21
99
95
90
80
70
60
50
40
30
20
10
5
1
Temp1
P
o
r
c
e
n
t
a
j
e
Media 24,83
Desv.Est. 1,602
N 6
AD 0,316
Valor P 0,414
Grfica de probabilidad de Temp1
Normal

En este caso, el test de AD es igual a 0,316 y su valor.p=0,414 por tanto no hay evidencia para
rechazar H0: Datos provienen de una distribucin normal.
Obs.
Los otros test (RJ o KS) sern coincidentes. A veces se pueden producir discordancia, en cuyo caso
deber utilizar el test ms apropiado o bien, llevar a cabo un anlisis ms especfico respecto a los
datos que no apoyan la normalidad..
Ejemplo 2 Normalidad y percepcin de temperatura
Seis personas indican la temperatura ambiental de una oficina:
21; 24; 39; 27; 25; 26
Puede asumirse que provienen de una distribucin normal?. Use =5%.
Solucin:
Usando la opcin prueba de normalidad del procedimiento Estadsticas bsicas se obtiene:
Test RJ: Como valor.p = 0,045 para un nivel de significancia del 5% existe
evidencia que permita rechazar la hiptesis nula: H0: los datos provienen de
una distribucin normal. Por tanto, no se puede asumir la normalidad de los
datos.
Test AD: Como valor.p = 0,052 para un nivel de significancia del 5% no existe
evidencia que permita rechazar la hiptesis nula: H0: los datos provienen de una
distribucin normal. Por tanto, se puede asumir la normalidad de los datos




4

Obs.
i. En este caso hay discrepancia entre los dos test, dado que RJ nos llevara al rechazo de
la hiptesis.
ii. Al mirar los datos, es difcil creer que estos datos muestren que provienen de una
distribucin normal. Lo anterior implica que el cumplimiento de normalidad de los
datos, con n pequeo, no es muy exigente!

Ejercicio 3 Pruebas de normalidad
Se han llevado a cabo mediciones respecto a la conductividad de un metal para 4 niveles de
temperaturas.
muestra T-10 T-50 T-200 T-500
1 21,18 66,12 41,15 239,80
2 23,87 69,93 46,78 237,80
3 24,05 62,32 49,00 241,55
4 22,59 62,40 48,12 245,13
5 22,78 66,60 52,31 244,50

Es apropiado asumir que los datos obtenidos para cada nivel de temperatura se comportan como
datos obtenidos de una distribucin normal?
Ejercicio 4 densidad del agua
Los datos almacenados en el archivo densidad1.xlsx contiene dos corridas de 40 y 70 mediciones
realizadas en dos laboratorios, respectivamente. Los datos corresponden a las diferencias
obtenidas entre la densidad del agua determinada experimentalmente con los patrones slidos de
densidad y los valores de referencia calculados con la frmula de CCM en kg/m
3
.
Es posible asumir normalidad de los datos de cada uno de los laboratorios? (use =5%)

DISCUSION:



5

TEST DE MEDIA UNA MUESTRA
Formalmente, si x1, x2, , xn una muestra aleatoria proveniente de una poblacin normal,
interesa definir respecto a una de los siguientes contrastes de hiptesis.
H0: =
0
vs. H1:

0
>
0
<
0


a) Asumiendo varianza conocida e igual a
2
.
Basado en propiedades de promedio muestral y la distribucin normal, el test se basa en el
estadstico =

0
/
. El cual, bajo la hiptesis nula sigue una distribucin normal estndar y por
tanto para una muestra dada el valor de z es obtenido y se evala la probabilidad de observar un
valor como este, bajo la hiptesis nula. Si el valor.p es muy pequeo implica que hay evidencia
para rechazar la hiptesis nula. En caso contrario, se puede asumir que la hiptesis nula es vlida.
El valor.p se obtiene, de acuerdo a la hiptesis alternativa como sigue:
Si H1:
0
valor.p = 2P(Z > | z |)
Si H1: >
0
valor.p = P(Z > z)
Si H1: <
0
valor.p = P(Z < z)
Este test se encuentra implementado en Minitab y se puede obtener como se muestra en el
siguiente ejemplo.
Ejemplo Temperatura y conductividad
Se han realizado 5 mediciones respecto a la conductividad de un metal el cual es obtenido en
condiciones controladas. De acuerdo a la teora el resultado debe ser 22 y es posible asumir que el
instrumento tiene una variabilidad igual a =1, existe evidencia que exista un error sistemtico?
Datos: 21,18; 23,87; 24,05; 22,59; 22,78
Solucin:
Primeramente se debe definir apropiadamente las hiptesis: H0: = 22 vs. H1: 22
En Minitab se indica la columna que contiene los datos, el valor hipottico de y , y finalmente
en opciones la direccin de la hiptesis alternativa, como se muestra en la siguiente figura:


6



Minitab entrega el siguiente resultado:

Z de una muestra: Conduc

Pr ueba de mu = 22 vs. no = 22
La desvi aci n est ndar supuest a = 1

Medi a del
Er r or
Var i abl e N Medi a Desv. Est . est ndar I C de 95% Z P
Conduc 5 22, 894 1, 155 0, 447 ( 22, 017. 23, 771) 2, 00 0, 046

Para un nivel de significancia a=5% existe evidencia contra la hiptesis nula (aun cuando esta
cerca borderline). Es decir, hay un error sistemtico en las mediciones (en este caso se puede
verificar que existe una medicin por exceso).
Observacin: Si la hiptesis alternativa fuese mediciones por exceso, es decir H1: > 22, el test
es el mismo solo cambia la direccin de la hiptesis alternativa. Por tanto, el valor.p cambia. En
este caso, valor.p= 0,0228 y para un nivel de significancia a=5% se rechaza H0 sin lugar a dudas.


7

b) Cuando la varianza no es conocida
Como el encabezado ilustra, es bastante comn la condicin de no conocer la varianza del
proceso, por tanto es natural estimar sta por la varianza muestral. En ese caso el test z es
reemplazado por el test t el cual es equivalente al anterior excepto por utilizar la desviacin
estndar muestral en lugar de la desviacin estndar hipottica.
Suponga que en este caso nos interesa determinar si es posible afirmar que es mayor a 22 (H1)
En este caso, el procedimiento corresponde a t de 1 muestra e indicar el mdulo Prueba T para
una muestra. En opciones se deber seleccionar la direccin de la hiptesis alternativa: mayor
que, como se muestra en la siguiente figura


Los resultados se muestran en la siguiente tabla.



8

T de una muestra: Conduc

Pr ueba de mu = 22 vs. > 22

Medi a del
Er r or 95%L mi t e
Var i abl e N Medi a Desv. Est . est ndar i nf er i or T P
Conduc 5 22, 894 1, 155 0, 516 21, 793 1, 73 0, 079

Como valor.p=0,079, no hay evidencia que permita rechaza H0.
Ejercicio temperatura y conductividad.
Considere las mediciones realizadas en relacin a la conductividad medida para diferentes
temperaturas. Los valores tericos son 64, 50 y 240 para las temperaturas 50, 200 y 500,
respectivamente para cada uno de los casos no hay informacin a priori en relacin a la
variabilidad.

DISCUSIN.



9

TEST DE VARIANZA UNA MUESTRA
Al igual que en el caso anterior en caso del Test de media una muestra, en algunas situaciones
es de inters establecer si la variabilidad est dentro de ciertos parmetros de referencia. As, que
se ilustra cmo se lleva a cabo el test.
Sea x1, x2, , xn una muestra proveniente de una poblacin normal. Si es de inters llevar a cabo
una de las siguientes hiptesis:
H0: =
0
vs. H1:

0
>
0
<
0

El modulo que permite llevar a cabo este test en Minitab se muestra en la siguiente figura:

Este test se basa en propiedades de la distribucin normal, especficamente el estadstico
=
(1)
2

0
2
, bajo la hiptesis nula sigue una distribucin chi-cuadrado con n-1 grados de libertad.
Por tanto, para una muestra dada el valor de c es obtenido y se evala la probabilidad de observar
un valor como ste, bajo la hiptesis nula. Si el valor.p es muy pequeo implica que hay evidencia
para rechazar la hiptesis nula. En caso contrario, se puede asumir que la hiptesis nula es vlida.
Se debe tener presente que el valor.p se obtiene de acuerdo a la direccin de la hiptesis
alternativa
Ejemplo Temperatura y conductividad
Se han realizado 5 mediciones respecto a la conductividad de un metal el cual es obtenido en
condiciones controladas. De acuerdo a la calidad del instrumento, la variabilidad debe ser inferior
o igual a =1, existe evidencia que este supuesto no se cumpla?
Datos: 21,18; 23,87; 24,05; 22,59 y 22,78


10

Solucin:
Primeramente se debe definir apropiadamente las hiptesis: H0: = 1 vs. H1: > 1. Se
selecciona la variable e indica apropiadamente hiptesis como se muestra:

Prueba e IC para una desviacin estndar: Conduc

Mt odo

Hi pt esi s nul a Si gma = 1
Hi pt esi s al t er na Si gma > 1

El mt odo est ndar se ut i l i za sl o par a l a di st r i buci n nor mal .
El mt odo aj ust ado se ut i l i za par a cual qui er di st r i buci n cont i nua.

Est ad st i cas
Var i abl e N Desv. Est . Var i anza
Conduc 5 1, 15 1, 33

95%I nt er val os de conf i anza uni l at er al es
L mi t e L mi t e
i nf er i or i nf er i or
par a par a
Var i abl e Mt odo Desv. Est . var i anza
Conduc Est ndar 0, 75 0, 56
Aj ust ado 0, 75 0, 56

Pr uebas
Var i abl e Mt odo Chi cuadr ada GL Val or P
Conduc Est ndar 5, 33 4, 00 0, 255
Aj ust ado 5, 39 4, 05 0, 255

Como nos interesa bajo normalidad, revisar valor.p del mtodo estndar. En este caso, el
valor.o=0,255 > =5%. Es decir, no hay evidencia contra H0.



11

Ejercicio temperatura y conductividad.
Considere las mediciones realizadas en relacin a la conductividad para la temperatura 200. De
acuerdo a las especificaciones del proveedor, la desv.estndar debe ser inferior a 2,5.

EJERCICIOS APLICADOS:
Absorcin - Existen dos mtodos de produccin de ladrillos que influyen en el nivel de absorcin
de stos. Seis ladrillos producidos por cada mtodo son sometidos a pruebas en laboratorio,
obteniendo lo que sigue:
D A T O S Prom desv.est
Mt.A 25,0 19,5 16,6 21,3 24,7 16,8 20,65 3,7
Mt.B 22,2 19,2 15,7 20,4 19,6 15,7 18,80 2,6
La referencia dice que el nivel medio de absorcin no debe ser superior 20 mg/m3, con una
desviacin estndar inferior o igual a 2,5 mg/m3.
Qu mtodo debe ser implementado? Qu propuesta hara usted? (usar =5%)

Densidad del agua 1 Con el objetivo de estimar la incertidumbre en un proceso alternativo para
medir la densidad se lleva a cabo un experimento, en el cual se midi la diferencia entre la
densidad del agua determinada experimentalmente con el patrn nacional de densidad menos la
densidad del agua determinada mediante la frmula de M. Tanaka. Los resultados son (todos
positivos):
0,01523 - 0,01408 - 0,00484 - 0,01292 - 0,00276 - 0,01718 - 0,01624 - 0,00738 - 0,01609
Existe evidencia que permita indicar que hay un error sistemtico por exceso?

Densidad del agua 2 Para los datos almacenados en densidad1.xlsx, Existe evidencia que
permita indicar que en cada uno de los laboratorios hay un error sistemtico por exceso?

DISCUSION
En este ltimo ejercicio hay una pregunta natural son equivalentes/comparables los resultados
obtenidos por cada laboratorio?



12

TEST PARA DOS MUESTRAS
Como se ilustr en el ltimo ejercicio, ms de una vez nos interesa determinar si dos muestras son
comparables. Lo anterior implica, generalmente, comparacin de medias. Sin embargo, para
decidir qu test utilizar es necesario decidir previamente respecto a la igualdad de varianzas.
Adems, parte importante de los test se basan en el cumplimiento de la normalidad para las
distribuciones subyacentes.
Test para comparar dos varianzas (o ms)
Existe ms de un test para comparar varianzas (ej. F de Fisher que permite comparar dos
varianzas, Levene y Bartlett para dos y ms varianzas). En Minitab se encuentra implementado el
test F para comparar dos varianza y el test de Levene para comparar dos o ms varianzas. Esta
ltima prueba es no paramtrica (es decir, no requiere asumir normalidad para las poblaciones) y
se basa en la variabilidad intra-grupos y la variabilidad entre los grupos, obteniendo una prueba
que puede ser contrastada con la distribucin F de Fisher-Snedecor.
En ambos casos la hiptesis nula es de homogeneidad, es decir, todas las varianzas son iguales y la
hiptesis alternativa que una o ms difiere de las otras (es decir, heterogeneidad).
Paramtricamente (ya sea en trminos de las varianzas o desviaciones estndar son equivalentes),
H0:
1
=
2
==
k
vs H1: algn
i

j

Si el valor.p o significancia es inferior a , existe evidencia para rechazar H0.
En el caso de dos muestras, es posible indicar la direccin de la alternativa. Adems, en caso de
rechazar o no la hiptesis respecto a la igualdad de varianza, se dispone de un test T para la
comparacin de medias con varianzas distintas o varianzas iguales.
Test para comparar dos medias
Minitab dispone de los dos test T para comparar medias ya sea con varianzas iguales o varianzas
distintas. En el primer caso, el test t utiliza una varianza conjunta (denominada poleed variance).
Mientras que en el segundo caso usa una combinacin de las dos varianzas. Nuevamente la
decisin de rechazar o no la hiptesis nula en favor de la alternativa se basa en el valor.p de la
prueba.
Ejemplo - Temperatura:
Se han realizado 15 mediciones de la temperatura ambiental, 8 con un instrumento Met1 y 7
con el Met2. Los datos han sido ingresados directamente en SPSS (ver figura)
Met1 26,26 ; 26,25 ; 26,27 ; 26,29 ; 26,31 ; 26,32 ; 26,28 ; 26,27
Mt 2 26,26 ; 26,28 ; 26.29 ; 26,30 ; 26,33 ; 26,35 ; 26,36


13

Interesa determinar si existen diferencias significativas entre los mtodos. Por lo que se lleva a
cabo la prueba Comparacin de medias (y de varianzas).
Se utiliza el procedimiento t de 2 muestras ubicado en el mdulo Estadsticas bsicas, como se
muestra en la siguiente figura:

Una vez dentro del cuadro de dialogo, se deben identificar las variables que contiene las
mediciones e indicar la direccin de la hiptesis alternativa hemos asumido varianzas iguales (se
ha marcado)

Los resultados son los que siguen:



14

Prueba T e IC de dos muestras: Met1. Met2

T de dos muest r as par a Met 1 vs. Met 2
Medi a del
Er r or
N Medi a Desv. Est . est ndar
Met 1 8 26, 2813 0, 0242 0, 0085
Met 2 7 26, 3100 0, 0374 0, 014

Di f er enci a = mu ( Met 1) - mu ( Met 2)
Est i mado de l a di f er enci a: - 0, 0287
I C de 95%par a l a di f er enci a: ( - 0, 0634. 0, 0059)
Pr ueba T de di f er enci a = 0 ( vs. no =) : Val or T = - 1, 79 Val or P = 0, 096 GL = 13
Ambos ut i l i zan Desv. Est . agr upada = 0, 0310

Como se aprecia, el primer recuadro presenta el resumen estadstico: Promedio, desviacin
estndar y media del error estndar de las mediciones de temperaturas obtenidas con cada
instrumento. En el segundo recuadro se entrega
- Intervalos de confianza al 95% para la diferencia. Como se puede apreciar, el intervalo de
confianza captura al valor 0 (es decir,
1
-
2
=0).
- Prueba T para igualdad de medias con varianzas iguales. En este caso el test t=-1,79 con
significancia igual a 0,096 (para la hiptesis alternativa que se indic).
Un aspecto no menor se relaciona con las hiptesis que se analizan y las cuales deben ser
explicitadas antes de llevar a cabo la prueba. En este caso, las hiptesis de inters son:
H0:
1
=
2
vs H1:
1

2
H0:
1
-
2
=0 vs H1:
1
-
2
0
As, que en este caso es correcta la lectura del valor de significancia o valor.p bilateral.
Se ha asumido igualdad de varianza, supuesto que se valida a travs del test correspondiente. En
este caso, el test se implementa como se muestra en las siguientes figuras:



15

Prueba de varianzas iguales: Met1. Met2

I nt er val os de conf i anza de Bonf er r oni de 95%par a desvi aci ones est ndar es

N I nf er i or Desv. Est . Super i or
Met 1 8 0, 0151177 0, 0241646 0, 0553486
Met 2 7 0, 0227398 0, 0374166 0, 0941218

Pr ueba F ( di st r i buci n nor mal )
Est ad st i ca de pr ueba = 0, 42. val or p = 0, 278

Pr ueba de Levene ( cual qui er di st r i buci n cont i nua)
Est ad st i ca de pr ueba = 1, 40. val or p = 0, 258

O salida grfica:
Met2
Met1
0,10 0,08 0,06 0,04 0,02
I ntervalos de confianza de Bonferroni de 95% para Desv.Est.
Met2
Met1
26,375 26,350 26,325 26,300 26,275 26,250
Datos
Estadstica de prueba 0,42
Valor P 0,278
Estadstica de prueba 1,40
Valor P 0,258
Prueba F
Prueba de Levene
Prueba de igualdad de varianzas para Met1. Met2

Ejercicios
Temperatura - se cumple el supuesto de normalidad en el ejercicio anterior?

Densidad del agua - Considere los datos almacenadas en densidad1.xlsx, existe evidencia
estadstica que permita afirmar que los laboratorios entregan resultados distintos?

DISCUSION



16

Validacin de datos
Una de las primeras etapas en el anlisis de datos es la validacin de stos. Bsicamente, los datos
deben ser validos de acuerdo a los criterios propios del experimento. Independiente del anlisis
anterior, existen test que permiten determinar si uno o ms datos son anmalos. A continuacin
se revisan dos pruebas: Contraste de Dixon y contraste de Grubbs.
Contraste de Dixon
El contraste de Dixon a veces llamado contraste Q es muy popular par datos anmalos debido a
que es simple. Este test es aplicable a muestras pequeas (tamaos entre 4 y 7) y evala las
mediciones sospechosas comparando la diferencia entre ella y la medida ms prxima en tamao,
con el intervalo de las medidas.
Hiptesis:
H0: todas las mediciones proceden de la misma poblacin
H1: hay mediciones anmalas
Estadstico Q:
=
| |
()

Criterio:
Si el valor de Q excede al valor crtico de la siguiente tabla, se rechaza H0 y por tanto el dato
considerado como sospechoso es anmalo, para un nivel =5%
Tabla valores crticos contraste de Dixon estadstico Q
Tamao muestra Valor crtico
4
5
6
7
0,831
0,717
0,621
0,570
Ejemplo nitrito
Se han realizado cuatro mediciones para la concentracin de nitrito (mg/l) en una muestra de agua
de ro.
0,403 0,410 0,401 0,380
La ltima observacin es sospechosa, debera ser rechazada?
Se calcula el estadstico Q = |0,380 0,401| / |0,410 0,380| = 0,7


17

Como el tamao muestra es n=4, el valor critico es 0,831. Como Q < Q.crtico, no hay evidencia
contra H0. Es decir, el dato 0,38 no puede ser calificado como dato anmalo.
Ejemplo nitrito continuacin
Se han tomado tres mediciones adicionales referidas al ejemplo anterior, es decir concentracin
de nitrito (mg/l) en una muestra de agua:
0,403 0,410 0,401 0,380 0,400 0,413 0,411
Es anmalo el dato 0,38?
Se calcula el estadstico Q = |0,380 0,400| / |0,413 0,380| = 0,606
El valor crtico para Q cuando n=7 es 0,570. Como Q > Q.crtico, existe evidencia para rechazar H0.
Es decir, el dato 0,380 puede ser considerado como anmalo.
Contraste de Grubbs
Otro contraste muy utilizado para datos anmalos es el test de Grubbs. Este test supone que los
datos provienen de una distribucin normal.
Hiptesis:
H0: todas las mediciones proceden de la misma poblacin
H1: hay mediciones anmalas
Estadstico G:
=
|

, donde s se ha calculado incluyendo en dato sospechoso.


Criterio:
Si el valor de G excede al valor crtico de la siguiente tabla, se rechaza H0 y por tanto el dato
considerado como sospechoso es anmalo, para un nivel =5%
Tabla valores crticos contraste de Grubbs estadstico G
Tamao muestra Valor crtico
3
4
5
6
7
8
9
10
1,155
1,481
1,715
1,887
2,020
2,126
2,215
2,290
.


18

Ejemplo2 nitrito
Se han tomado siete mediciones de la concentracin de nitrito (mg/l) en una muestra de agua:
0,403 0,410 0,401 0,380 0,400 0,413 0,411
Es anmalo el dato 0,38? (el promedio es 0,4026 y la desviacin estndar es 0,01121)
Se calcula el estadstico G = |0,380 0,4026| / 0,01121 = 2,016
El valor crtico para G cuando n=7 es 2,020. Como Q < Q.crtico, no existe evidencia para rechazar
H0. Es decir, el dato 0,380 no puede ser considerado como anmalo.
Como se puede apreciar existe una contradiccin entre el test Q y G. Sin embargo, es importante
tener en cuenta que para un nivel de significacin del 5% hay todava un 5% de riesgo (1 en 20), de
rechazar incorrectamente el valor sospechoso. Esto puede tener un efecto considerable a la hora
de estimar la precisin de un experimento. Por ejemplo, para los 7 valores de la concentracin de
nitrito dado anteriormente, la desviacin estndar es 0,0112 mg/l, pero cuando rechaza el valor
sospechoso la desviacin estndar se convierte en 0,0056 mg/l, es decir, la precisin parece haber
mejorado en un factor de 2.
El ejemplo anterior aclara la importancia de ser cauto al rechazar datos anmalos. Cuando las
medidas se repiten solo unas pocas veces (lo que tiende a ser normal en la mayora de los anlisis),
el rechazo de un valor origina una gran variacin sobre la media y sobre la desviacin estndar. En
concreto, el hecho de tomar tres medidas y rechazar la que difiere ms de las otras dos debe
evitarse. Se puede demostrar que se obtienen una estimacin ms fiable de la media, en
promedio, utilizando el valor que est en medio de los tres que utilizando la media de los dos que
no fueron rechazados.
Ejemplo - Continuacin nitrito
Las mediciones sobreestiman el valor de referencia que es igual a 0,4 mg/l. Lleve a cabo el anlisis
con/sin el dato 0,380
Solucin
Test de normalidad - Ya sea con el dato 0,38 o sin l, en ambos casos los datos pasan la prueba de
normalidad (con el test Shapiro-WIlk valor.p=0,10 y 0,23 respectivamente).
Test de medias - Al llevar a cabo el test t para los 7 datos, se obtiene un valor.p =0,283, el cual nos
indica que no hay evidencia que permita afirmar que existe una sobre.estimacin del valor de
referencia.
Al llevar a cabo el test t para los 6 datos sin considerar el valor 0,38, se obtiene un valor.p =0,02,
el cual nos indica que hay evidencia que permita afirmar que existe una sobre.estimacin del valor
de referencia.


19

Cuntas rplicas?
El nmero de rplicas en un estudio de investigacin afecta la precisin de las estimaciones de las
medias de los tratamientos y la potencia de las pruebas estadsticas para detectar diferencias
entre las medias de los grupos en tratamiento. Sin embargo, el costo de conducir estudios de
investigacin restringe las rplicas a un nmero razonable Entonces, el nmero de rplicas est
determinado por las restricciones prcticas que se pueden asignar al problema.
El mtodo para determinar el nmero de rplicas con frecuencia se basa en un examen de la
hiptesis sobre las diferencias entre las medias de los grupos en tratamiento. Aqu se utiliza un
mtodo elemental para los experimentos con dos muestras independientes, para ilustrar algunos
atributos del problema del nmero de rplicas.
Este mtodo se basa en una prueba de hiptesis acerca de las diferencias entre las medias de dos
grupos de tratamiento d=m1-m2, con una varianza de error experimental conocida
2
, utilizando
la prueba estadstica de distribucin normal. Este mtodo determina el nmero de rplicas
necesarias para probar la diferencia entre dos medias muestrales con errores especificados tipo I y
tipo II.
El nmero de rplicas necesarias est influido primordialmente por cuatro factores que se
requieren para los clculos:
Varianza
2
.
Tamao de la diferencia que tiene significado fsico entre las dos medias
Nivel de significancia de la prueba , o la probabilidad del error tipo I
Potencia de la prueba 1-, o la probabilidad de detectar , donde es la probabilidad del
error tipo II.
El nmero de rplicas necesarias para cada grupo en tratamiento, r, para alternativas bilaterales se
estima mediante
= 2
/2
+

2

Donde za/2 y zb son los percentiles de la distribucin normal (cola derecha)
Alternativamente, se puede estimar el nmero de rplicas si se conoce el coeficiente de variacin
%CV y la diferencia se puede expresar como porcentaje de la media global esperada del
experimento.
Ntese que si %CV = 100 /, y %=100(/), entonces la ecuacin anterior se escribe como:
= 2
/2
+

%
%

2




20

Ejemplo Nitrito
Se desea comparar dos mtodos que evaluar la concentracin de nitrito (mg/l), asumiendo que
=0,01 y que la diferencia minina es =0,005 con un 90% de confianza (o =10%) y un 80% de
potencial (o =0,2).
Como z
/2
=1,645 y z

=0,8416, reemplazando se obtiene



= 2[1,645 +0,84]
2

0,010
0,005

2
= 49,4
Es decir, se requieren al menos 50 mediciones en cada tratamiento.
Usando la frmula alternativa, y asumiendo una media =0,4 %CV=2,5% y %=1,25%, se
obtiene el mismo valor para r.

Debe tenerse presente que los valores obtenidos para el nmero de rplicas necesarias son
aproximaciones. Con frecuencia se determinan con base en las estimaciones de la varianza
asociadas a estudios previos y no a las del estudio real que se usar.
La siguiente tabla presenta el nmero de rplicas necesarias para valores predeterminados de los
cuatro parmetros relevantes.
Tabla nmero de rplicas mnimas para , , %CV y % dados.

=5% =1%
%CV 1- % =10 % =20 % =10 %=20
5 80% 4 1 6 2
5 95% 7 2 9 3
10 80% 16 4 24 6
10 95% 26 7 36 9

Das könnte Ihnen auch gefallen