Sie sind auf Seite 1von 52

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Instituto Tecnolgico de Durango


Maestra en Sistemas Ambientales

Diseo y
de experimentos

Anlisis

Portafolio

Catedrtico: Dr. Carlo Francisco Cruz Fierro.


Alumna: I.Q. Susana Citlaly Gaucin Gutierrez 07040234

Victoria de Durango, Dgo. A 18 de Junio de 2012

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Contenido
Unidad 1...............................................................................................................................1
Diseo estadstico de experimentos....................................................................................2
Etapas...............................................................................................................................2
Principios Bsicos.............................................................................................................2
1.2. Principales estadsticos descriptivos.............................................................................3
Ejercicio 1.................................................................................................................................6
Pruebas de Hiptesis..........................................................................................................11
Hiptesis Nula H0............................................................................................................11
Hiptesis Alternativa H1...................................................................................................11
Interferencia estadstica para medias poblacionales (Prueba T).......................................12
PRUEBA t DE UNA MUESTRA.............................................................................................13
Estadstico de prueba t0......................................................................................................13
Ejercicio #2.............................................................................................................................16
Problema 3.............................................................................................................................20
Problema 4.............................................................................................................................24
Problema 5.............................................................................................................................27
PRUEBA T DE DOS MUESTRAS......................................................................................30
Hiptesis nula.....................................................................................................................30
Hiptesis alterna.................................................................................................................30
Hiptesis nula.....................................................................................................................30
Hiptesis alterna.................................................................................................................30
Estadstico de prueba.........................................................................................................31
Dos casos dependiendo de 1 y 1........................................................................................31
Caso 1: Si 1 se asume igual que 2..................................................................................31
Caso 2: Si se asume que 1 y 2 son diferentes................................................................31
Prueba t Pareada...................................................................................................................32
Hiptesis.............................................................................................................................32
Estadstico de prueba.........................................................................................................32
Resistencia.............................................................................................................................32
Estrategia para valores extremos.......................................................................................32
Robustez................................................................................................................................33
Unidad 2.................................................................................................................................34
Anlisis de varianza (ANOVA)...............................................................................................34
Herramientas del anlisis de varianza...............................................................................34
Prueba F.........................................................................................................................34
3

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Comparacin entre medias.............................................................................................34


Combinaciones lineales..................................................................................................34
Prueba F (Fisher)...............................................................................................................34
Hiptesis.........................................................................................................................34
Modelo matemtico............................................................................................................34
Modelo de Medias...........................................................................................................34
Modelo de Efectos..........................................................................................................34
Suposiciones de modelo.................................................................................................35
Definicin de sumas y promedios..........................................................................................35
Definicin de residuales.........................................................................................................35
Modelo completo:...............................................................................................................35
Modelo reducido:.............................................................................................................35
Sumas de cuadrados.........................................................................................................35
Modelo completo.............................................................................................................35
Modelo reducido..............................................................................................................36
Particin de la suma de cuadrados.......................................................................................36
Estadstico F.........................................................................................................................36
Tabla ANOVA........................................................................................................................37
Comparaciones Mltiples..................................................................................................37

Unidad 1
Introduccin al diseo estadstico de experimentos.
1.1 Conceptos Bsicos
Estadstica:
4

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Estudia la recoleccin anlisis e interpretacin de datos generalmente se


considera una ciencia matemtica pero no una rama de las matemticas.
Tiene influencia transversal en prcticamente todas las ciencias dese la fsica
hasta la ciencias sociales.
Viene del latn STATISCUM COLLEGIUM que quiere decir consejo del estado.

Estadstica matemtica:
Establece las bases tericas de la estadstica
Estadstica Descriptiva:
Es el resumen y visualizacin de datos as como la abstencin de valores
estadsticos que representan a los fenmenos estudiados
Estadstica Inferencial:
Se encarga de la generacin de modelos deducciones y predicciones de los
fenmenos considerando la naturaleza aleatoria de las observaciones.
Inferencia Estadstica
Es una conclusin justificada por un modelo probabilstico de que los patrones
o tendencias observadas en los datos estn presentes en un contexto ms
amplio.
Poblacin:
Es un conjunto de identidades reales o realizables que poseen ciertas
caractersticas en comn, pero que generalmente es demasiado extenso
como para obtener informacin de todas las entidades. Una poblacin puede
estar formada por personas, objetos o resultados de mediciones o
experimentos.
Muestra
Es el subconjunto de entidades obtenido a partir de una poblacin. Al ser de
tamao reducido se obtiene informacin de todas las entidades en la muestra
y se espera que esta informacin sea representativa de las caractersticas de
la poblacin.

Con estadstica se puede probar cualquier cosa, incluso a veces la verdad


5

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Diseo estadstico de experimentos


Es el proceso que tiene como objeto obtener respuestas claras a las preguntas de inters,
empleando el mnimo de recursos.
Etapas
1. Identificacin del problema
2. Seleccin de la variables de respuesta
3. Seleccin de factores y sus niveles
4. Identificacin de variables que pudieran interferir
5. Eleccin del diseo experimental
6. Realizacin del experimento o estudio
7. Anlisis de resultados
8. Generacin de conclusiones identificando significacin estadstica y practica
Principios Bsicos
1. Muestreo representativo
2. Aleatorizacin.- Es la piedra angular del diseo experimental y consiste en la
asignacin al azar de las unidades experimentales y del orden en que se realizan los
experimentos individuales.
2.1.
Tipos de estudios
a) Estudio Aleatorizado
Hay una asignacin al azar de las unidades experimentales y es el nico en el
que se puede identificar relaciones causa- efecto y hacer inferencia a
poblaciones.
b) Estudio observacional
No hay asignacin aleatoria de las unidades experimentales, se puede
identificar correlaciones pero no causa-efecto.
3. Replicacin
Es la repeticin de experimentos bajo las mismas condiciones. Permite estimar el
error experimental y obtener parmetros ms precisos. Es importante designar la
replicacin de las mediciones repetidas.
4. Formacin de bloques
Consiste en agrupar las unidades experimentales en subconjuntos los ms
homogneos posibles, reduce o elimina la variacin debido a factores perturbantes.
5. Balance
Consiste en tener el mismo nmero de unidades experimentales en cada grupo o
tratamiento
6. Controles
Proporcionan una base para comparacin. Puede haber controles positivos y
negativos en los que se asegura tener una cierta respuesta.
7. Cegamiento
Las personas involucradas desconocen que tratamiento se aplica a las unidades
experimentales y sirve para evitar que las expectativas del investigador influyan en el
resultado.
6

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

1.2. Principales estadsticos descriptivos


Histograma

Distribucin
Discreta (Histograma) y Continua.

Distribucin de probabilidad

f ( x ) dx=1

Probabilidad de estar entre 0 y 1 en donde 0 representa un procesos imposible y 1


representa un procesos certero.

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

f ( x ) dx=P(a x b)

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Poblacin
n

1
= yi
n i=1

Media

1
( y )
n i=1 1

Varianza

Desviacin Estndar

= 2

Muestra
n

1
= yi
n i=1

y 1 2

n
1
2
s=

n1
i=1
s= s2

Grados de Libertad
Es el nmero de valores que en teora podran cambiarse arbitrariamente y aun as
obtener el mismo valor de un parmetro estadstico.

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Ejercicio 1
Para el siguiente conjunto de datos, generar un histograma. Una grfica de caja y bigotes y
obtener los estadsticos descriptivos bsicos (Media, mediana, cuartiles inferior y superior,
varianza y desviacin estndar)
55
43
67
155
147

125
115
179
196
129

51
133
112
20
42

147
176
135
118
27

68
67
156
106
94

91
191
145
54
110

61
1
47
59
76

19
147
193
2
122

141
110
9
180
50

Se introdujeron los datos en el software estadstico Minitab 17 en la columna nombrada


como Datos lo cual se muestra en la Ilustracin 1

Ilustracin 1 Datos ingresados

Con los datos podemos generar un grfico como se muestra en la Ilustracin 2, se puede
seleccionar el tipo de grfico que queremos en este caso el Histograma o grafico de caja y
bigotes.

En los Grficos 1 y 2 nos muestra los grficos generados.

10

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Ilustracin 2 Como generar Histograma

Histograma de Datos
12

10

Frecuencia

40

80

120

160

200

Datos

Grfico 1 Histograma

11

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales


Grfica de caja de Datos

200

Datos

150

100

50

Grfico 2 Grfico de caja y bigotes

Para obtener los datos estadsticos descriptivos bsicos se realiz como se muestra en la
Ilustracin 2

12

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Ilustracin 3 Seleccin de estadsticos descriptivos

Los resultados obtenidos son los siguientes:


Estadsticos descriptivos: Datos
Variable Media Desv.Est. Varianza Q1 Mediana
Q3
Datos 99.36
55.96 3131.10 52.50 110.00 146.00

Percentil
Es un cierto porcentaje de valores menores que el valor dado P 20%

13

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Cuartiles
Q1=

P25% =

Cuartil inferior
Q2 = P50% = Mediana
Q3 = P75% = Cuartil Superior
Coeficiente de asimetra

Muestra
y i 3

n
1

n i=1
1=

Poblacin
y 1 3

n
n
y 1=

(n1)( n2) i=1

Curtosis

14

Instituto Tecnolgico de Durango

Muestra
4
y i

n
1

n i=1
2=

Maestra en Sistemas Ambientales

Poblacin
2

n1

3
y 1 4

s

n
n(n+1)
y 1=

(n1)( n2)(n3) i=1


Variable Aleatoria
Es una caracterstica que al ser medida en diferentes ocasiones es
susceptible de tomar diferentes valores es decir es un valor observable que
tienen cierto grado de variacin.
Parmetro estadstico
Es un valor obtenido del estudio de una variable aleatoria, calculado
aplicando una funciono algoritmo a os valores de un conjunto de datos. Un
estadstico que corresponde a alguna caracterstica de una poblacin se
denomina el estimador de dicha caracterstica
Estimadores
Insesgados y sesgados

Pruebas de Hiptesis
15

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Es el criterio por medio del cual se establece si se rechaza o no la hiptesis nula, basado
en el resultado de una prueba estadstica.

Hiptesis Nula H0
Corresponden al estado natural de las cosas. Corresponde a algn parmetro estadstico
teniendo valor cero.
Hiptesis Alternativa H1
Las hiptesis H0 y H1 no se pueden demostrar, se pueden aceptar o rechazar
Situacin real
H0 es
H0 es falsa
verdadera
Error Tipo
II(Falso
Conclu
Acepta
OK
negativo
sin
r H0
Probabilida
obteni
d )
da de
la
Error tipo
prueba
I (Falso
Rechaz
estads
positivo
OK
ar H1
tica
probabilid
ad
=Probabilidad de cometer un error tipo I nivel de significacin
(1-)x100%= Nivel de confianza
=0.05 es igual al 95% de confianza
=Probabilidad de cometer un error tipo II
(1-)x100= Poder o potencia estadstica
=0.05 Tpico pero puede ser tan alto como =0.4
Se utiliza para obtener el tamao de muestra

16

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Interferencia estadstica para medias poblacionales (Prueba T)

Muestra y1, y2, y3, etc =, s

Estadstico t

media muestramedia poblacion


=

desviacion estandar de poblacion

Con =n-1 (Grados de libertad)


se aproxima con el error estndar de la media
S
error estndar de la media(SE())=
N
t=

O
S
SE( )
N

PRUEBA t DE UNA MUESTRA


Para saber si la media de la poblacin es igual a un valor supuesto 0 (puede ser 0)

17

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

H0: =0
H1: <0
H1: 0
H1: >0

Estadstico de prueba

t0

SE( )
Si t0 es un valor cercano a 0 entonces est cerca del valor supuesto de 0 y se aceptara
H0.
Si t0 es un valor muy grande
entonces est muy lejos
del valor supuesto de 0 y se
rechaza H0.
H0: =0
t 0=

H1: 0
=0.05
Opcin 1.- Prueba de regin
Hiptesis: Aceptacin /rechazo

Cuando t0 se encuentra en la regin de aceptacin se acepta H 0


Cuando t0 se encuentra en la regin de rechazo se acepta H1 y se rechaza H0
Opcin 2.- Prueba de valor p
18

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Valor p: Es la probabilidad de obtener un valor t tan extremo o ms extremo que el


estadstico de prueba t0, en su evidencia contra H0, si H0 fuera correcta.

Si t0 es un valor cercano a 0

Cuando t0 es un valor muy lejano de 0

Valor P

Conclusin

0
a

Hay evidencia convincente de que hay que rechazar H 0

0.01
a

Hay evidencia moderada de que hay que rechazar H 0

0.05
a

Hay evidencia sugestiva pero no concluyente de que hay que rechazar H 0

0.1
a

No hay evidencia de que hay que rechazar H0(Se acepta H0)

19

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Ejercicio #2
El protocolo de control de calidad de un laboratorio indica que entre las muestras se
incluyan aleatoriamente soluciones de control con una concentracin de 50 mg/L de
carbono orgnico total (TOC). Los analistas desconocen cuales muestras son las de
control. Los siguientes datos son una muestra de los resultados de las soluciones.
50.13 51.2 50.5 50.2 49.9 50.2 50.3 50.5 49.3 50.0 50.4 5.01 51.0 49.8 50.7 50.6
Efectuar una prueba t de una muestra para determinar si la medida de estaos datos es 50
mg/L, empleando como prueba de hiptesis (A) la regin de aceptacin/rechazo con
=0.05 y () valor de p.
Se introducen los datos en una columna llamada COT (Ilustracin 1)
Ilustracin 4 Datos

20

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Posteriormente de procede a realizar la prueba t como se muestra en la Ilustracin 2.

Ilustracin 5 Prueba
t

Para realizar la prueba t se define como


H0 =50 mg/L
H1

50 mg/L

A un nivel de confianza de 95% los estos datos se capturan en la pantalla mostrada en la


Ilustracin 3

21

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Ilustracin 6 Pruebas de
Hiptesis

Los resultados de la prueba t son los mostrados en la Ilustracin 4.

Ilustracin 7 Resultado prueba t


Y que el valor obtenido de P=0.016 podemos obtener que Hay evidencia moderada para
rechazar H0. Como definimos en el siguiente esquema.
Valor P

Conclusin

0
a

Hay evidencia convincente de que hay que rechazar H 0

0.01
a

Hay evidencia moderada de que hay que rechazar H 0


22

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

0.05
a

Hay evidencia sugestiva pero no concluyente de que hay que rechazar

H0
0.1
a

No hay evidencia de que hay que rechazar H0 (Se acepta H0)

1
Para hacer el anlisis de la regin de aceptacin y rechazo podemos encontrar las reas
que van a estar definidas con aceptacin y rechazo en la Tabla 1 ya que contamos con
que =0.05 y =15 por lo tanto el rea de aceptacin estar de -2.131 a 2.131 esta se
muestran grficamente en la Grafica 1.

Tabla 1 Distribucin t de

Se realiza el grafico de distribucin de probabilidad, como se muestra en la Ilustracin 5.

23

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Ilustracin 8 Seleccin de grafico de probabilidad

La Grafica 1 es la obtenida, en la cual


se muestran las reas de aceptacin y rechazo y en la cual podemos comprar si el valor de
t0 se encentra en el rea de aceptacin o rechazo.

Grafico 3 Distribucin t
En el cual podemos concluir que como t 0 se encuentra en el rea de rechazo se rechaza H 0
(H0: =50).

24

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Problema 3
El gas producido de una fermentacin biolgica se ofrece a la venta con garanta de que su
contenido promedio de metano es de 75%. Al finalizar una muestra aleatoria de n=7
cilindros de gas se obtuvo las siguientes concentraciones (en porcentaje) de metano 64,
65, 75, 67, 65, 74 y 75 A) Efectuar una prueba de hiptesis (Aceptacin / rechazo) con un
nivel de significancia de 0.05, para determinar si la concentracin promedio de metano es
menor que 75% B) Repetir con un nivel de significancia de 0.01 Cambia la conclusin
obtenida?
Se introdujeron los datos del problema en el software como se muestra en la Ilustracin 1
Ilustracin 9 Datos

Posteriormente se procede a realizar la prueba de Hiptesis con una prueba t para una
muestra (Ilustracin 2)

Ilustracin 10 Seleccin de prueba t


25

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Introducimos la Hiptesis nula H 0: = 75% de la manera que se muestra en la Ilustracin


3.

Ilustracin 11 H0
A) Y seleccionamos el Nivel de confianza para el inciso a es de 95%, y en el mismo
apartado definimos la hiptesis alterna H 1 : < 75% (Ilustracin 4)

Ilustracin 12 H1
Loa resultados de la Prueba de Hiptesis son los de la Ilustracin 5.

Ilustracin 13 Prueba de Hiptesis a)

26

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Como el valor de P es de 0.013 podemos decir que Hay evidencia moderada de que hay
que rechazar H0 Por lo cual podemos hacer el grafico de distribucin t para efectuar la
prueba de aceptacin o rechazo, mostrada en la Grafica 1
Grfica de distribucin
T, df=6
0.4

Densidad

0.3

0.2

0.1

0.05
0.0

-1.943

Grafico 4 rea de aceptacin y rechazo con 95% de confianza


Como el valor de t0 = -2.95 este valor se encuentra dentro del rea de rechazo en la grfica
de distribucin por lo tanto podemos concluir que se Rechaza H 0 la cual nos dice que el
promedio de la concentracin de los tanques es de 75%.
B ) Procedemos a realizar la prueba de hiptesis con un nivel de confianza de 99%
Los pasos son los mismos que se siguieron en la prueba anterior hasta la Ilustracin 3,
Cambiamos el nivel de confianza como se muestra en la Ilustracin 6.

Ilustracin 14 H1 Y nivel de confianza de


99%

Los resultados obtenidos de la prueba de Hiptesis se muestran en la Ilustracin 7.

27

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Ilustracin 15 Resultados prueba de hiptesis a 99% de confianza


Como el valor P no cambio la conclusin es la misma que en el inciso anterior para valor p
Hay evidencia moderada de que hay que rechazar H0.
Realizamos el grafico de rea de aceptacin y rechazo (Grafico 2) con 99% de confianza.
Grfica de distribucin
T, df=6
0.4

Densidad

0.3

0.2

0.1

0.01
0.0

-3.143

Grafico 5 rea de aceptacin y rechazo con 99% de confianza


Como el valor de t0 = -2.95 se encuentra en el rea de aceptacin y podemos aceptar H 0 el
cual nos dice que la concentracin promedio de los tanques es de 75%, as tambin
podemos concluir que dependiendo del nivel de confianza que manejemos puede ser
aceptada o rechazada nuestra Hiptesis.

28

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Problema 4
Bioslidos provenientes de una planta de tratamiento de agua residual se aplicaron a 10
terrenos que fueron seleccionados aleatoriamente de un total de 20 terrenos de prueba, Se
cultivo maz tanto en los terrenos tratados (T) como en los no tratados (NT). Obteniendo los
siguientes rendimientos:
T
NT

9.03
7.90

7.67
7.64

8.47
5.64

7.63
8.47

4.83
5.96

9.35
11.29

7.66
4.26

7.34
6.21

8.22
7.65

9.35
7.09

Hay evidencia estadstica de que el rendimiento de cultivo sea diferente cuando se aplican
los bioslidos? Cul es el intervalo de confianza del 95% para diferencia de medidas?
Los datos se introducen como se muestra en la Ilustracin 1.
Debido a que si se acomodaran en el programa en dos
columnas estaramos diciendo que en cada rengln que hay los
datos tienen algn tipo de relacin entre ellos lo cual no ocurre
en este problema.
Ilustracin 16 Datos

Segn lo que nos dice el problema podemos definir nuestras Hiptesis las cuales son:
H0: 1 =2
H1: 1 2
Mediante el software podemos realizar la prueba T de dos muestras como se muestra en el
Ilustracin 2.

29

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Ilustracin 17 Prueba t de dos muestras


En la Ilustracin 3 se define la prueba de hiptesis y el nivel de confianza el cual ser de
95%

Ilustracin 18 Definir Prueba de Hiptesis

Los resultados obtenidos son los siguientes:


30

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Con los resultados podemos evaluar la prueba en las siguientes maneras para poder llegar
a una conclusin:
Valor p
Como p = 0.327 podemos decir que No hay evidencia de que hay que rechazar H 0 (Se
acepta H0)
Intervalo de confianza
El intervalo de confianza obtenido es (-2.302, 0.814)
La diferencia estimada obtenida es de -0.744 la cual se encuentra dentro del intervalo de
confianza por lo cual se Acepta H0.
rea de aceptacin y rechazo
El valor obtenido de t0 =-1.01 con lo cual podemos observar en la Grafico 1 t 0 se encuentra
dentro de el rea de aceptacin por lo cual podemos concluir que la H 0 se acepta.

Grfica de distribucin
T, df=19
0.4

Densidad

0.3

0.2

0.1

0.025
0.0

0.025
-2.093

2.093

Ilustracin 19 Distribucin t

31

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Mediante el anterior anlisis estadstico podemos concluir que el rendimiento del cultivo no
es diferente cuando se aplica el tratamiento con bioslidos a cuando no se aplican.

Problema 5
Bioslidos provenientes de una planta de tratamiento de agua residual se aplicaron a 10
terrenos que fueron seleccionados aleatoriamente de un total de 20 terrenos de prueba, Se
cultivo maz tanto en los terrenos tratados (T) como en los no tratados (NT). Obteniendo los
siguientes rendimientos:
T
NT

9.03
7.90

7.67
7.64

8.47
5.64

7.63
8.47

4.83
5.96

9.35
11.29

7.66
4.26

7.34
6.21

8.22
7.65

9.35
7.09

Hay evidencia estadstica de que el rendimiento de cultivo sea diferente cuando se


aplicaron los bioslidos? Cul es el intervalo de confianza del 95% para la diferencia de
medias?
Se observ que uno de los terrenos no tratados tuvo un rendimiento inusualmente
elevando. Al checar los registros, se descubri que la temporada anterior se le haba
aplicado una fuerte dosificacin de un fertilizante inorgnico. Con base en esta informacin
se decidi eliminar esa observacin del conjunto de datos. Cambia la
conclusin estadstica obtenida?
Los datos se introducen como se muestra en la Ilustracin 1. Debido a
que si se acomodaran en el programa en dos columnas estaramos
diciendo que en cada rengln que hay los datos tienen algn tipo de
relacin entre ellos lo cual no ocurre en este problema.
Ilustracin 20 Datos

Segn lo que nos dice el problema podemos definir nuestras Hiptesis las cuales son:
H0: 1 =2
H1: 1 2
Mediante el software podemos realizar la prueba T de dos muestras como se muestra en el
Ilustracin 2.
32

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Ilustracin 21 Prueba t de dos muestras


En la Ilustracin 3 se define la prueba de hiptesis y el nivel de confianza el cual ser de
95%

Ilustracin 22 Definir Prueba de Hiptesis


Los resultados obtenidos son los siguientes:
Two-Sample T-Test and CI: Biosolidos, TRATAMIENTOS
Two-sample T for Biosolidos
TRATAMIENTOS N Mean StDev SE Mean
NT
T

9 6.76 1.34

0.45

10 7.96 1.33

0.42

33

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Difference = mu (NT) - mu (T)


Estimate for difference: -1.197
95% CI for difference: (-2.488, 0.094)
T-Test of difference = 0 (vs not =): T-Value = -1.96 P-Value = 0.067 DF = 17
Both use Pooled StDev = 1.3317
Con los resultados podemos evaluar la prueba en las siguientes maneras para poder llegar
a una conclusin:
Valor p
Como p = 0.067 podemos decir que Hay evidencia sugestiva pero no concluyente de que
hay que rechazar H0
Intervalo de confianza
El intervalo de confianza obtenido es (-2.488, 0.094)
La diferencia estimada obtenida es de 1.3317 la cual se encuentra fuera del intervalo de
confianza por lo cual se rechaza H0
Los resultados considerando el valor extremo son los siguientes:
Difference = mu (NT) - mu (T)
Estimate for difference: -0.744
95% CI for difference: (-2.288, 0.800)
T-Test of difference = 0 (vs not =): T-Value = -1.01 P-Value = 0.325 DF = 18
Both use Pooled StDev = 1.6437
El valor p= 0.325 con el que podemos decir No hay evidencia para rechazar H 0
Mediante el anterior anlisis estadstico podemos concluir que el rendimiento del cultivo
es diferente cuando se aplica el tratamiento con bioslidos a cuando no se aplican, y
el valor extremo si cambia la conclusin.

34

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

PRUEBA T DE DOS MUESTRAS


Muestra
Muestra

n1
n2

1, S1

2,

S2
Si

n1=n2 es

balanceada

Hiptesis nula
H0: 1- 2 = (1 2)0 (Diferencia hipottica que creemos que hay)

Hiptesis alterna
H1 : 1- 2 (1 2)0
H1 : 1- 2 < (1 2)0
H1 : 1- 2 > (1 2)0
Si (1 2)0 = 0

Hiptesis nula
H0 : 1= 2

Hiptesis alterna
H1: 12
H1: 1<2
H1: 1>2

Estadstico de prueba
t 0=

( 1 2 ) (1 2)
SE ( 1 2)

35

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Dos casos dependiendo de 1 y 1


Caso 1: Si 1 se asume igual que 2
Calcular varianza colectiva
( n11 ) S 21 + ( n2 1 ) S 22
Sp=
n1 +n 22

SE ( 1 2 ) =SP

1 1
+
n1 n2

= n1+n2-2

Caso 2: Si se asume que 1 y 2 son diferentes.

S21 S22
SE ( 1 2 ) =
+
n1 n2

V=

2 2

2 2

S2
n2

S1 S2
+
n1 n 2

2 2

( ) ( )
S1
n1

+
n11 n 21

Prueba t Pareada
A cada valor de yi1 de una poblacin le corresponde uno y solo uno de los valores y i2 de la
otra poblacin.
Se define la diferencia como:
di y1i y2i
36

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Diferencia de la poblacin:

Hiptesis

Estadstico de prueba

H0: = 0

t 0=

H1: 0

d
0

SE( d)

H1: < 0

Sd
n
SE

H1: > 0

()=

v=n-1 grados de libertad


n= numero de pares
d

= promedio de las diferencias

Resistencia
Un mtodo estadstico es resistente si el resultado obtenido no cambia mucho si una
pequea parte de los datos cambia (tal vez drsticamente). Normalmente es de importancia
si hay valores extremos.
Las pruebas t no son resistentes por que se basan en promedios

Estrategia para valores extremos


1. Realizar el anlisis estadstico con y sin el valor extremo sospechoso.
2. Si las conclusiones estadsticas no cambian significativamente dejar el valor
sospechoso en los datos y reportar los resultados.
3. Si las conclusiones si cambian investigar las observaciones buscando una
explicacin. Si se puede determinar que la observacin no proviene de la poblacin
de inters, se puede remover. En caso de no poder encontrar una causa es posible
que se requiera un estudio ms detallado.

Robustez
Se dice que un mtodo estadstico es robusto si proporciona resultados validos incluso si
hay desviaciones respecto a alguna de las suposiciones del modelo.

37

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Las pruebas t son razonablemente robustas respecto a desviaciones de la normalidad


especialmente cuando la muestra es grande debido al teorema del limite central.
En el caso de la prueba t de dos muestras si ambas poblaciones tienen la misma
desviacin estndar y aproximadamente la misma forma y si las muestras son se igual
tamao, la prueba se ve afectada moderadamente por distribucin con colas largas y muy
poco por la asimetra de la distribucin. Si las muestras no son aproximadamente del
mismo tamao la asimetra afecta mucho ms. Por ltimo si la asimetra es muy diferente
en ambas poblaciones la prueba t de dos muestras puede dar resultados muy equivocados.

La robustez de la prueba t de dos muestras respecto a desviaciones de la suposicin de


varianzas iguales, la prueba es razonablemente robusta si las muestras son de
aproximadamente el mismo tamao. La peor situacin es cuando las varianzas son muy
diferentes y la muestra mas pequea proviene de la poblacin con la mayor varianza.

1 >>

n1 << n2

Problema 6
Dicen que la mejor comida es la del hogar. Cada domingo, Armando Esteban Quito
(estudioso de la estadstica) va a casa de sus padres a comer. A Armando le
preocupa que, como la comida es tan buena, tal vez est comiendo en exceso. As
38

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

que en varios fines de semana, seleccionados aleatoriamente, se pes el domingo en


la maana, y nuevamente el lunes en la maana. Estos pesos, en kilogramos, se
muestran en la tabla. Hay evidencia estadstica de que Armando aumenta de peso
del domingo al lunes? En caso afirmativo, cunto es el aumento promedio?
Los datos se introducen como se muestra en la Ilustracin 1.

Tabla 2
Datos

Ilustracin 23 Datos en Minitab

Las hiptesis a evaluar son las siguientes:


H0 : L -D =0 (no hay diferencia del peso del Domingo al Lunes)
H1: L > D (Hay diferencia de peso del Domingo al Lunes)

Se realizo un anlisis estadstico de prueba t pareada ya que cada lunes corresponde


un peso del domingo. Los resultados obtenidos de la prueba son los siguientes:

39

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Como el valor p es de 0 podemos inferir que Hay evidencia convincente de


que hay que rechazar H0
El valor de t0 se evala en al rea de aceptacin y rechazo con el grafico 1.

Ya que el valor obtenido de t0 es de 4.53 se encuentra en el rea de rechazo se


rechaza H0
Podemos concluir que si hay un aumento de peso del los domingos al lunes y la
diferencia promedio de aumento de peso es de 0.2010 kg.

40

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Unidad 2
Anlisis de varianza (ANOVA)
Se emplea para comparar la media de varios grupos (nmero de grupos a).

Herramientas del anlisis de varianza


Prueba F
Es para saber si alguna media de los grupos es diferente.
Comparacin entre medias
Comparaciones Planeadas
Comparaciones no planeadas
Combinaciones lineales
Permiten agrupar la informacin o los datos de diversas formas.

Prueba F (Fisher)
Hiptesis
H0: 1 = 2 = 3 == a = (todas la medias son iguales)
H1: Al menos una es diferente

Modelo matemtico
Modelo de Medias.
yij = i + ji
Donde:
i = Numero de grupo
j= dato individual.
i = Media de grupo
ji = Error o desviacin de cada dato.
Modelo de Efectos.
yij = + i + ji
Donde:
Ti = efecto del grupo
= Media global
ni= numero de datos del grupo
N = nmero total de datos.
41

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Suposiciones de modelo.
Poblaciones tienen distribucin normal
Todas tienen la misma varianza
El anlisis de varianza es relativamente robusto respecto a la normalidad, aunque no tanto
si no es balanceado y es muy chico.
No es resistente por que se basa en clculo de medias.

Definicin de sumas y promedios


n

y i y ij
j=1

y y ij = y i y =
i=1 j=1

i=1

y i

yi
n

y
N

Definicin de residuales.
Modelo completo:
y ij y i
Representa que tan diferente es cada dato con respecto a la media.

Modelo reducido:

y ij y
Representa que tan diferente es cada dato con respecto a la media global.

Sumas de cuadrados.
Modelo completo.
y 1 j

j=1

S S ERROR =
i=1

42

Instituto Tecnolgico de Durango

Maestra en Sistemas Ambientales

Modelo reducido.
y ij

j=1

S S ERROR =
i=1

Si H0 fuera cierta.
Ho: 1 = 2 = 3
Por lo tanto las sumas de cuadrados deberan ser esencialmente iguales.

Particin de la suma de cuadrados.

SSTOT = SSTRATAMIENTOS + SSerror


Variabilidad total observada en Variabilidad debida a que viene Variabilidad natural de los
los datos

de diferentes poblaciones

datos (error experimental)

43

Normalmente se calcula SStotal. Y SSTratamientos Y SS error se determina por diferencia.


El nmero de grados de libertad tambin se divide entre tratamientos (a-1) y
error (N-a)
N-1=(a-1)+(N+a)

Estadstico F
( Suma de cuadrados extra )
(Grados de libertad extra)
F=
2Completo
Extra : Los obtenidos al agrupar los datos (es decir de los tratamientos)
SStratamiento =Suma de cuadrados extra
(a-1)=grados de libertad extra.
2Completo se estima con la varianza colectiva
S 2p=

( n1 1 ) S 21+( n21 ) S 22 ++(na 1)S 2a


( n11 ) + ( n21 ) ++(n a1)

S 2p=

S S error
Na

Tabla ANOVA
Fuente de
variacin
Tratamiento
(entre grupos)

Suma de
Cuadrados
SSTratamiento

Grados de
libertad
a-1 (v1)

Error (detro de
grupos)
Total (Modelo
reducido)

SSError

N-a (v2)

SSTotal

N-1

Se rechaza H0 si F0 es mayor que F,V1,V2 .


*Alternativamente usar el valor p

Cuadro medio
S STrat
a1
SS
M S Error = Error
N a
MS Trat =

Estadstico F
F0 =

M S Trat
M S Error

Ejercicio 7
Se pide a cuatro analistas de laboratorio que determinen por triplicado la concentracin de
un contaminante en una misma muestra de agua. Los resultados (en partes por milln) se
muestran en la tabla. Hay evidencia estadstica de que los analistas difieran
significativamente?
Analista 1
49.9
40.4
43.8

Analista 2
51.5
51.3
48.8

Analista 3
42.0
41.0
45.5

Analista 4
47.2
44.8
51.6

Se introdujeron los datos al software estadstico Minitab de la siguiente manera:

Ilustracin 24 Datos
Al querer hacer comparacin si existen diferencia ntrelos resultados de cada uno de los
analistas las hiptesis a aceptar o rechazar son las siguientes:
H0: 1 = 2 = 3 = 4
H1: Alguna es diferente
Se realiza el anlisis estadstico de la tabla ANOVA y los resultados obtenidos son los
siguientes:

Podemos observar que l valor obtenido de P = 0.081 con lo cual podemos decir que Hay
evidencia sugestiva pero no concluyente de que hay que rechazar H 0
Al realizar el anlisis con el valor de F0= 3.25 hacemos el grafico de distribucin F
(Grafico 1) para un = 0.05, 1 = 3 y 2=8. (Valores obtenidos de la Columna DF de la
tabla anova)

Grafica 1 Distribucin F

El grafico podemos observar que F0 se encuentra dentro del rea de aceptacin por lo
cual se acepta Ho y podemos concluir que no hay evidencia estadstica de que sean
diferentes las medias de cada analista.

Comparaciones Mltiples.
Comparaciones planeadas
No planeadas
= nivel de significancion de la familia de pruebas
i = Nivel de significancia de una prueba
n = Numero de pruebas
1 1 n
=1
*Si son independientes
Si no se pueden asumir independientes al menos
n 1

Prueba de Fisher
Para balanceados

2
n
2
Sp= desv. Estndar combinada
LSD=t

,N a

Sp

Para no balanceados

1 1
+
,N a
ni n j
2
Las medias de dos grupos se declaran diferentes si se cumple
| y i y j |> LSD
LSD=t

Sp

Prueba de Fisher
Se basa en el rango estudentizado (q).
y
( i)min ( y i)
Max
s
q
Para construir intervalos de confianza para cada par de grupos.
q
1 1
y i y j ,a , N a Sp
+
N
ni n j
Si el Intervalo de Confianza contiene el cero se declara que no hay diferencia.

Prueba de Dunnett
Es utilizado para comparar con un control.

Prueba de HSV
Sirve para comparar cada grupo con el mejor o peor de los otros grupos.

Comparaciones planeadas.
Una prueba t de dos muestras usando Sp como desviacin estndar (prueba con datos
resumidos)

Ejercicio 8
Se efectuaron mediciones de conductividad elctrica (en S/cm) en cuatro puntos de
muestreo en una laguna aireada en una planta de tratamiento de agua. El agua de la

laguna se supone que es completamente homognea debido al mezclado producido por los
aereadores.

(A) Efecte una prueba F del anlisis de varianza para estos datos. Qu conclusin se
obtiene respecto a la homogeneidad del agua de la laguna?
(B) Qu puede comentar respecto al valor de 1209 S/cm del punto de muestreo D?
(C) Si considera necesario, analice de nuevo los datos tomando las acciones pertinentes
respecto al dato mencionado en el inciso anterior. A qu conclusin se llega ahora?
(D)

Cules

puntos

de

muestreo

presentan

(estadsticamente

hablando)

igual

conductividad elctrica?
Hiptesis
H0: 1= 2= 3 = 4
H1: Alguna de las es diferente

A) Los fatos se introducen al Software estadstico MINITAB. Se Hace una prueba F


para poder evaluar si hay diferencia entre los diferentes puntos de los cuales el
resultado del anlisis es el siguiente:

Al obtener el valor de P= 0.753 se puede concluir que No hay evidencia estadstica para
rechazar H0 y podemos decir que la laguna est completamente mezclada .
B) Al observar que hay un dato anormal con respecto a los dems datos se elimina este
para realizar la prueba F de nuevo obteniendo los siguientes resultados:

Donde

obtenemos el

valor

P<0.00005

con lo que podemos concluir que Hay evidencia convincente de que hay que rechazar H 0

y por lo tanto se acepta H1 y podemos decir que al menos una media de medicin de los
puntos es diferente.
C) Como al eliminar el dato la conclusin de nuestro anlisis estadstico cambio el dato
se omitir en el anlisis siguiente y se tomara como conclusin previa la expresada
en el inciso B).
D) Al saber nosotros que al menos una de las medias es diferente haremos una
comparacion de Fisher para saber cuales son diferentes.

El resultado obtenido se muestra a continuacin:

Como podemos observar en las comparaciones los puntos A y D no tienen diferencias


entre ellas pero en al caso de B Y C pero si entre los dos grupos respectivamente.
Al evaluar los resultados obtenemos una intervalo de confianza de entre el punto A y D esta
el 0 el cual es un probable resultado entre la diferencia de la medias de las mediciones en
los puntos, lo mismo para los puntos B y C. y representan igual conductividad elctrica
entre ellos

Das könnte Ihnen auch gefallen