Diapositivas - Estadistica Inferencial - Pruebas de Hipotesis PDF

Diapositivas Estadistica y Diseo Experimental - segunda unidad
- Mg. Mario Pelaez Osorio
ESTIMACION PUNTUAL Y DE
INTERVALO
Una poblacion se describe por su distribucion
de probabilidad y sus parametros.
Para una poblacion cuantitativa, la ubicacion
y forma se describe por y .
Para una poblacion binomial, la ubicacion y
forma esta determinada por P.
Si no se conocen los valores de los parmetros ,
hacemos inferencias sobre ellos utilizando la
2006 Brooks/Cole
informacin de la muestra. Copyright
A division of Thomson Learning, Inc.
Metodos de Inferencia
Ejemplos:
Un consumidor quiere estimar el precio
promedio de viviendas similares en la ciudad
antes de poner su casa en el mercado.
Estimacion: Estimar , el promedio de los precios.
Un fabricante quiere saber si un nuevo tipo de

acero es ms resistente que un tipo de acero
antiguo.
Prueba de Hipotesis: El Nuevo promedio de resistencia,
es igual al antiguo promedio, ? Copyright 2006 Brooks/Cole
Estimacion:
Estimar o predecir el valor del parametro
cual es el valor mas probable de o P?
Prueba de Hipotesis:
Tomar una decision acerca del valor de un
parametro, con base en una idea preconcebida.
La muestra proviene de una poblacion con

= 10 o P = 0.20?
Copyright 2006 Brooks/Cole

Los procedimientos estadisticos son
importantes porque dan dos tipos de
informacion:
Metodos para hacer la inferencia
Una medida numerica de la bondad
o confiabilidad de la inferencia

Definiciones
Un estimador es una regla, que nos dice
como calcular una estimacion con la
informacion de la muestra.
Estimacion Puntual:.Se calcula un
solo numero para estimar el parametro
Estimacion de Intervalo: Dos
numeros se calculan para formar un
intervalo dentro del cual se espera est
el parametro.
El Margen de Error (E)

95% de todas las estimaciones caen dentro
de 1.96 desviaciones estandares del
parametro de interes.
Margen de error: Es el maximo error de estimacion
calculado como:

Estimacion de Medias y Proporciones

Para poblacion cuantitativa

Ejemplo
Un propietario toma una muestra al azar de 64
casas similares a la suya y encuentra que el precio
medio de venta es de $ 252.000 , con una
desviacin estndar de $ 15.000. Estime el precio
de venta promedio para todas las viviendas
similares en la ciudad.
Para poblacion binomial



Estimacion de Intervalo
Ejemplo
Un tcnico de control de calidad quiere estimar
la proporcin de latas de refrescos que estn mal
llenadas .
l toma una muestra al azar de 200 latas de
refresco y se encuentra 10 latas mal llenadas
Calcular dos numeros del intervalo [a, b] en el

cual se confia que contiene el parametro de
interes.
Confianza significa con alta probabilidad,
medida usando un nivel de confianza, 1
.
1- = 0.90; 0.95; 0.98; 0.99
Cuando 1- = 0.95 y el
estimador tiene
distribucion normal.
Estimacion de Intervalo
No conocemos el valor del parametro. 95% de
los intervalos contendran el parametro .
Estimador 1.96 EE
Parametro 1.96 EE

Nivel de confianza
Para cambiar el nivel de confianza, 1-, elija un
valor z que deje un area 1- en el centro de la
distribucion z .
Area de cola
z
/2
Funciona
Funciona
Funciona
Falla
Slo si el estimador cae en las reas de la cola

el intervalo dejar de incluir el parmetro .
Esto sucede slo el 5% de las veces.
.05
.025
.01
1.645
1.96
2.33
.005
2.58
100(1-)% Intervalo de confianza: Estimador z/2EE


Ejemplo
Intervalo de confianza para la media y

la proporcion poblacional
Una muestra aleatoria de n = 50 hombres mostr

una ingesta media diaria de productos lcteos
igual a 756 gramos con una desviacin estndar
de 35 gramos . Encuentre un intervalo de
confianza del 95% para la media de la poblacin
Para poblacion cuantitativa,
Para poblacion binomial
x 1.96
756 1.96
35
50
756 9.70
o 746.30 < < 765.70 gramos.


Ejemplo
Ejemplo
Encuentre un intervalo de confianza del 99%

para la ingesta diaria promedio de la poblacin
de productos lcteos para los hombres.
x 2.58
756 2.58
35
756 12.77
n
50
or 743.23 < < 768.77 grams.
El intervalo debe ser ms ancho para compensar el
aumento de la confianza de encerrar el verdadero valor
de .
De una muestra aleatoria de n = 150 estudiantes

universitarios , 104 dijeron que haban jugado en un
equipo de ftbol juvenil. Estimar la proporcion de
estudiantes universitarios que jugaban al ftbol en su
juventud con un intervalo de confianza del 98 %.
p 2.33
.69(.31)
p q 104
2.33
150
150
n
.69 .09
o 0.60 < P < 0.78


Estimacion de la diferencia entre

dos medias
Estimacion de la diferencia entre

dos medias
A veces estamos interesados en comparar las medias de dos

poblaciones, por ejemplo:
El promedio de crecimiento de plantas alimentadas mediante
dos tipos de nutrientes diferentes .
Las puntuaciones medias de los estudiantes enseados con dos
mtodos de enseanza diferentes.
Comparamos los dos promedios haciendo

inferencias acerca de 1-2, la diferencia de los
dos promedios poblacionales.
Si los dos promedios poblacionales son los
mismos entonces: 1-2 = 0.
La mejor estimacion de 1-2 es la
diferencia de las dos medias muestrales,
Para hacer esta comparacin

Distribucion muestral de:

x1 x2


Estimando 1-
2
Para muestras grandes , las estimaciones
puntuales y su margen de error , as como los
intervalos de confianza se basan en la
distribucin normal estndar .


Ejemplo
Ingesta diaria
Men
Women
Tamao de muestra
50
50
Media muestral
756
762
Desv. Estand. Muest.
35
30
Comparar la ingesta diaria promedio de productos

lcteos de hombres y mujeres usando un intervalo de
confianza del 95 %.
s2 s2
( x1 x2 ) 1.96 1 + 2
n1 n2
352 302 6 12.78
(756 762) 1.96
+
50 50
Ejemplo, continuacion
Podra llegar a la conclusin, sobre la base de este intervalo

de confianza , que hay una diferencia en la ingesta diaria
promedio de los productos lcteos para los hombres y las
mujeres?
Este intervalo contiene el valor 1-
2= 0. Por tanto es posible
que 1 = 2. No se puede llegar a la conclusin de que existe
una diferencia en la ingesta diaria promedio de los productos
lcteos para los hombres y las mujeres .
or - 18.78 < 1 2 < 6.78.


Seleccion del tamao muestral

1).- Escoja B, el limite de error de su estimacin y un
coeficiente de confianza
2).- Despeje el tamao muestral n de:
Z/2 x EE(estimador) B
3).- Para un problema de dos muestras, haga n1 = n2 = n



Ejemplo
Resumen
I. Tipos de Estimadores
1. Estimacion puntual: Un numero calculado para estimar el
parametro poblacional.
2. Intervalo : Dos numeros calculados para formar un
intervalo que contiene el parametro.
II. El Margen de error mide la maxima distancia entre el
estimador y el verdadero valor del parametro.
III. Intervalos de confianza para muestras grande

Pruebas de hipotesis para

muestras grandes
(Modelo normal)
El razonamiento utilizado en una prueba de hiptesis

es similar al proceso en un tribunal. Al tratar a una
persona por un delito, el jurado o Juez tiene que
decidir entre una de dos posibilidades:
La persona es culpable.
La persona es inocente.
Al inicio, la persona se supone inocente.
El fiscal presenta pruebas, tratando de rechazar la
hiptesis original de inocencia, y la conclusin de que
la persona es culpable
Si el proceso no presenta suficiente evidencia de
culpabilidad, se mantiene la suposicin de
inocencia

Procedimiento de una prueba

de Hipotesis
1. La hipotesis nula, H0:
Se asume verdadera hasta que
podamos probar lo contrario.
2. La hipotesis alternativa, Ha:
Sera aceptada como verdadera si
podemos rechazar H0

Procedimiento de una prueba de Hipotesis
3. La estadistica de prueba: valor calculado o

experimental y su Valor P:
Una estadstica calculada a partir de la muestra
que nos permite rechazar o no rechazar H0, y
Una probabilidad, obtenida con el valor
experimental que mide si el valor experimental
es probable o improbable, suponiendo H0 es
verdad.
4. La region de rechazo:
Una regla que nos dice para qu valores de la
estadstica de prueba, la hiptesis nula debe ser
rechazada.
Procedimiento de una prueba de Hipotesis
5. Conclusion:
Rechazar H0 o No rechazar H0, junto
con una declaracin sobre la fiabilidad de
su conclusin.
Cmo decidir cundo rechazar H0?
Depende del nivel de significancia , el
riesgo mximo tolerable que desea tener
de cometer un error, si decide rechazar
H0.
Frecuentemente, el nivel de significancia
es = .01 o = .05.
Ejemplo 1
Ejemplo 1
El alcalde de una pequea ciudad afirma que el

ingreso promedio en su ciudad es $ 35.000, con
una desviacin estndar de $ 5,000. Tomamos una
muestra de 64 familias, y encontramos que su
ingreso promedio es de $ 30.000. Es correcta su
afirmacin?
1-2. Queremos poner a prueba la hiptesis :
3. La mejor estimacin de la media poblacional es la media

muestral, $30,000:
Por el Teorema del Limite Central la media muestral tiene

distribucion normal con media = 35,000 error estandar
EE = 5000/8 = 625.
La media muestral, $30,000 tiene

z = (30,000 35,000)/625 = -8 desviaciones estandares
debajo de la media.
La probabilidad de observar una media muestral

30000 de una poblacion con = 35,000 (asumiendo H0 )
es cerca de cero.
H0: = 35,000 (el alcalde esta en lo correcto) versus

Ha: 35,000 (el alcalde esta equivocado)
Al inicio se asume que H0 es verdadera y = 35,000.


Prueba de hipotesis de una

muestra 30 para
Ejemplo 1
4. De la regla emprica, valores de ms de tres desviaciones
estndar de distancia de la media se consideran
extremadamente improbable. Un valor Z < -3 sera muy poco
probable que ocurra si H0 es verdadera, y dara razn para
rechazar H0.
5. Puesto que la media de la muestra , $30,000 es poco probable;
decidimos rechazar H0: = 35,000 y concluimos que la
afirmacion del alcalde es incorrecta.
6. La probabilidad que = 35,000 y que se tenga una media
muestral tan pequea (30000) por casualidad es casi cero.
Tomamos una muestra aleatoria con n 30 de

una poblacion con media y desviacion
estandar .
Asumimos:
1. es conocida o
2. s ya que n es grande
La hipotesis de prueba es
H0:
= 0 versus Ha: 0

Estadistica de Prueba
Inicialmente suponemos que H0 es verdadera. La
media muestral es nuestra mejor estimacion de
, y usamos la forma estandarizada como
Estadistica de Prueba:

Prueba estadistica
Si H0 es verdadera el valor de x debe estar cerca
a 0, y z cerca a 0. Si H0 es falso, x estara muy
lejos de 0, y z estara muy lejos de 0, indicado
que debemos rechazar H0.
x tiene distribucion normal con media 0 y
desviacion estandar:
/ n


Probable o improbable?
Luego de calcular el valor experimental de la
estadistica de prueba, calculamos su Valor P:
Valor-P: La probabilidad de observar, por

casualidad, un valor experimental extremo o
incluso ms extremo de lo que hemos
calculado. Si H0 es rechazada esta es la
probabilidad de tomar una decisin incorrecta.
Ejemplo 02
El rendimiento diario de una planta qumica
tiene un promedio de 880 Kg. durante varios aos.
El gerente de control de calidad quiere saber si este
promedio ha cambiado. El selecciona al azar 50
das y registra un rendimiento promedio de 871 Kg.
con una desviacin estndar de 21 Kg.
Si esta probabilidad es muy pequea, menos de un

nivel de significancia , H0 es rechazada.

Ejemplo 02
Cual es la probabilidad que ocurra este valor de
z=-3.03 o mas extremo por casualidad? (si H0 es
verdadera)

Ejemplo 02
Para tomar una decisin clara, al inicio del estudio
escogemos un nivel de significacin = 0.01.
Si el Valor-P es menor que , H0 es rechazada como
falsa. Usted informa de que los resultados son
estadisticamente significativos al nivel .
Si el Valor-P es mayor que , H0 no se rechaza. Usted
informa de que los resultados no son significativos al
nivel .
Esta es una ocurrencia poco

probable, que pasa alrededor de
2 veces en 1000, cuando
Copyright
Brooks/Cole
suponemos
2006
= 880!
Ya que nuestro valor-P =.0024 es menor que 0.01,

rechazamos H0 y concluimos que el rendimiento
medio a cambiado significativamente
al nivel 0.01.

Ejemplo
La Region de rechazo
Si = .01, Cual seria el valor valor critico tabular
Z/2 que marca la linea divisoria entre no
rechazo y rechazo H0?
Cual sera el valor critico Z/2 que corta el

area
/2 = 0.01/2 = .005 en la cola
de la distribucion z normal?
Para el ejemplo 02,
z = -3.03 cae en la
region de rechazo
de H0 al nivel 1%.
Si P < , H0 es rechazada.
Si P > , H0 No es rechazada.
El valor critico ocurre cuando el valor-P = . Este

valor se llama valor tabular o valor critico.
Zc > Z/2
implica P < ,
H0
se rechaza.
Zc < Z/2
implica P > ,
2006se
Brooks/Cole
HCopyright
NO
rechaza.
0
PRUEBAS UNILATERALES
(una cola)
A veces estamos interesados en una detectar

una diferencia direccional especfica para .
La hipotesis ALTERNATIVA a probar es de
una cola:
Ha:
> 0 o
Ha: < 0
La region de rechazo y el valor-P se obtienen
solamente para un lado de la distribucion

Region de rechazo: Rechazar H0 si z > 2.58 o z < -2.58.

Si el valor calculado (ZC) cae en la region de rechazo, su
valor-P sera menor que = 0.01.
Ejemplo 03
El propietario de una casa toma al azar una muestra
de 64 casas similares a la suya y encuentra que el
precio medio de venta es de $ 252.000, con una
desviacin estndar de $ 15.000. Es esta evidencia
suficiente para concluir que el precio medio de
venta es mayor de $ 250,000? Use = .01.


Calculo del valor P
Valor critico tabular

Cual es el valor tabular de Z que deja a la
derecha un area de = 0.01?
En nuestro ejemplo,
La probabilidad que los resultados de la muestra

(o mas extremos) ocurran por casualidad, cuando
= 250,000.
z = 1.07 no cae en la
region de rechazo de
H0 entonces NO se
rechaza. No hay
suficiente evidencia
para afrimar que
Como el Valor-P es mayor

que = .01,
H0 NO se rechaza.
> $250,000.
No hay suficiente evidencia

que
2006 Brooks/Cole
> Copyright
$250,000.
Region de Rechazo H0 : Rechazar si ZC >Copyright

2.33.2006 Brooks/Cole
Significancia estadistica
La regla de la Region critica y la regla del

Valor-P siempre producen resultados identicos.
El metodo del Valor-P es preferible porque:

La computadora reporta siempre los
Valores-P
Se puede evaluar el resultado de la prueba
para cualquier nivel de significancia.
Qu debe hacer si usted es el experimentador
y nadie le da un nivel de significacin?
Si el Valor-P es menor que 0.01, Rechazar H0.

El resultado es MUY significativo.
Si el Valor-P esta entre 0.01 y 0.05, Rechazar
H0. El resultado es Significativo.
Si el valor-P esta entre 0.05 y 0.10, No
rechazar H0. Pero el resultado tiende hacia la
significancia.
Si el Valor-P es mayor que 0.10, No rechazar
H0. El resultado no es estadisticamente
significativo

Dos tipos de error
Dos tipos de error
Hay dos tipos de error que pueden

ocurrir en una prueba de hipotesis.
Realidad Culpable
Inocente
Poblacion H0 verdad
(Acept H0)
Decision
H0 falsa
(Rechaza H0)
H0 Verdad
(Acept H0)
Error tipo II
Decision
Culpable
Correct
Error
Inocente
Error
Correct
Correcto
H0 falsa
Error tipo I
(Rechaza H0)
Correcto
Definicion:
= P(Error Tipo I) = P(rechazar H0 cuando H0 es verdadera)
=P(Error Tipo II) = P(aceptar H0 cuando H0 es falsa)

OTRAS PRUEBAS PARA

n30
La proporcion muestral y la diferencia de dos
medias muestrales tambien siguen la
distribucion normal cuando el tamao de
muestra es grande.
De manera general la formula para encontrar
el valor Zc sera:

Queremos mantener las probabilidades de

error tan pequeas como sea posible.
El valor es el nivel de significancia, y esta
controlado por el experimentador.
El valor de es muy dificil de controlar.
Mas bien que interpretar aceptamos H0 como
verdadero sin proporcionar una medida de la
fiabilidad, interpretamos como No rechazar
H0. y se debe recolectar mas informacion
Interpretacion: No hay suficiente evidencia
para Rechazar H .
A division of Thomson Learning,0Inc.
Prueba para la diferencia de dos

medias poblacionales
La hiptesis de inters implica la diferencia,
12, en la siguiente forma:
H0: 12 = D0 versus
Ha: una de las tres: 12 D0
12 < D0
12 > D0
donde D0 es alguna diferencia de interes,
usualmente 0.

Distribucion muestral de:

x1 x2

Ejemplo 04
Promedio de consumo diario

medias poblacionales

Calculo del valor-P
Hombres Mujeres
Tamao de muestra
50
50
Media muestral
756
762
Desviacion estandar muestral
35
30
La probabilidad de observar valores de z

tan lejos de z = 0 cuando, 12 = 0.
Hay alguna diferencia en la ingesta diaria promedio de

productos lcteos para los hombres frente a las mujeres? Use
= .05.
H0 : 1 2 = 0
Prueba estadistica :
x x2 0
ZC 1
s12 s 22
+
n1 n 2
Ha : 1 2 0
=
756 762 0
352 30 2
+
50
50
= .92

Dado que el Valor-P > = 0.05,

No se rechaza H0. No hay
suficiente evidencia para concluir
que los hombres y mujeres tienen
diferente consumo promedio
Copyright 2006
Brooks/Cole
diario de productos
lacteos.

Ejemplo 05
Prueba para una proporcion

poblacional P
Independientemente de la edad, aproximadamente el 20%

de adultos en USA participan en actividades de ejercicios
fsicos al menos dos veces por semana. Una muestra
aleatoria de 100 adultos mayores de 40 aos encontr que
solo 15 se ejercitan al menos dos veces por semana. Esta
es evidencia de una disminucin en la participacin
despus de los 40? Use = 0.05.


Region de rechazo
Resumen
Cual es el valor tabular z que divide en dos

regiones con = 0.05 de area en la cola
izquierda?
El valor calculado es
,
zc = -1.25 no cae en la
region de rechazo de H0.
No hay suficiente
evidencia que P < 0.20
para mayores de 40 aos.
I. Partes de una Prueba de Hipotesis

1. Hipotesis nula: Lo contrario a la hipotesis alernativa
2.
Hipotesis alternativa: La hipotesis que el investigador

quiere probar.
3.
Valor experimental o Valor calculado y su Valor-P:

Evidencia muestral calculada con los datos de la muestra.
4.
Region de rechazo, valor tabular, nivel de significancia:

Valores que dividen el area de rechazo y no rechazo de H0
5.
Conclusion: Rechazar o no rechazar la hiptesis nula

interpretando en trminos del contexto del problema.
Region de rechazo: Rechazar H0 si Zc < -1.645,

es decir si el valor-P < = 0.05.



Resumen
II.Tipos de Error en la Prueba y Significancia Estadistica
Resumen
1.
El nivel de significancia es la probabilidad de rechazar

H0
cuando en realidad esta es verdadera. Es el riesgo
de comenter error en la decision de rechazar H0
2.
El Valor-P Se obtiene con el valor calculado Zc, es la

probabilidad de observar un valor calculado ms extremo:
Cuando el Valor P es muy pequeo (P<0.05), el resultado de la
prueba es mas significativo
3.
Cuando el valor P < nivel de significancia ,

Rechazamos H0. Esto sucede cuando la estadistica de
prueba excede al valor critico o valor tabular.
4.
El Error tipo II, es la probabilidad de aceptar H 0

cuando en realidad es falsa.

Introduccion
Hay pruebas de hipotesis y estimaciones
de muestras pequeas para:
PRUEBAS PARA
MUESTRAS PEQUEAS


, la media de una poblacion normal

12, la diferencia de dos medias
poblacionales

2, La varianza de una poblacion
normal
La razn de dos varianzas
poblacionales.


Propiedades de la distribucion t
Distribucin t de Student
Cuando una muestra de tamao nes

pequea utilizamos la distribucion t de
Student , con parametro: n-1 grados de
libertad.
Forma de campana
y simetrica.
Mas variable que z
Podemos usar esta distribucion para la prueba

de hipotesis y estimacion intervalica de la
media poblacional .
La forma depende de los grados de

libertad, n-1.
Cuando n aumenta la distribucion de t y z se
aproximan.
Uso de la Tabla t
La tabla 4 da los valores de t con el valor

critico en la cola de la distribucion t.
Con el indice r = df y el valor de alfa para
hallar t, el valor que deja un area a la
derecha.
Para una muestra de tamao n =
10, encuentre el valor de t que
deja un area 0.025 en la cola
derecha.
Fila = gl = r = n 1 = 9
Indice de columna= = .025
t.025 = 2.262


Inferencia de muestras
pequeas para la media
Los procedimientos bsicos son los mismos

que los utilizados para muestras grandes.
Inferencia de muestras
pequeas para la media
Un intervalo confidencial del

100(1)% para la media :

Ejemplo

Ejemplo
Un sistema de riego est diseado para que el tiempo

promedio de riego de los aspersores no sea mayor de
15 segundos. Una prueba de 6 sistemas dio los
tiempos siguientes: 17, 31, 12, 17, 13, 25
Este Sistema esta funcionando segun las especificaciones? Use = .05.

Datos: 17, 31, 12, 17, 13, 25

Primero, calculamos la media y desviacion
estandar muestral, usando la calculadora
cientifica o con las formulas:


Ejemplo
Datos: 17, 31, 12, 17, 13, 25
Calculamos el valor experimental y region de
rechazo unilateral con =.05.
Conclusion
Datos: 17, 31, 12, 17, 13, 25
Comparamos el valor experimental con la region
de rechazo y concluimos:
Region de rechazo:
Rechazar H0 si t > 2.015.
Conclusion: tc = 1.38 No cae en la region de rechazo. No

hay suficiente evidencia que indique que el tiempo
promedio de activacion de los aspersores es mayor que 15.

Aproximacion del Valor - P

Usando la Tabla 4.

El Valor-P exacto
Usando una computadora
Valor -P = 0.113 > 0.10
como se determino con la
aproximacion.
One-Sample T: Times
Test of mu = 15 vs > 15
Como el valor observado tc = 1.38

esta entre 1.156 y 1.476,
0.10 < Valor-P
< 0.15
Variable
Times
N
6
Mean
StDev
19.1667 7.3869
SE Mean
3.0157
95%
Lower
Bound
13.0899
T
1.38
P
0.113


Prueba para la diferencia

de dos medias

de dos medias
La formula para muestras grandes:
Para probar:
H0: 12 = D0 versus
Ha: una de tres
donde D0 es una diferencia hipotetica, usualmente
= 0.
Prueba para la diferencia de dos medias

En lugar de estimar cada varianza poblacional por
separado, se estima la varianza comn, llamada tambin
varianza mancomunada o conjunta.
No tiene distribucion z o t , y no puede usarse

para inferencia de muestras pequeas.
Tenemos que hacer una suposicin ms:
que las varianzas poblacionales, aunque
desconocidas, son iguales.
Intervalo de confianza para la

diferencia de dos medias
Recuerde los supuestos:
Y obtenemos la estadistica de prueba:
1. Muestras aleatorias e
independientes
2. Poblaciones normales
Que tiene distribucion t con

r = n1+n2-2 grados de
libertad
3. Varianzas poblacionales
iguales.


Ejemplo
Ejemplo Usar el metodo del Valor P
Dos Metodos de Instruccion se comparan para

medir el tiempo que les toma a los alumnos
ensamblar eficientemente un dispositivo. A cada
grupo diferente se les instruye mediante un mtodo
distinto. Hay diferencia entre los dos metodos?
Use = .01.
Tiempo de
ensamblado
Metodo 1
Metodo 2
Tamao de
muestra
10
12
Media
35
31
Desv. Estand.
Muestral
4.9
4.5
H0 : 1 2 = 0
Ha : 1 2 0
tc =
x1 x 2 0
1
1
s c2
+
n1 n 2
Ejemplo
Metodo 1 Metodo 2
Tamao de
muestra
10
12
Media
35
31
Desv. Estand.
Muestral
4.9
4.5
Varianza comun :
s2 =

gl= n1 + n2 2 = 10 + 12 2 = 20
Tiempo de
ensamblado
(n1 1)s12 + (n 2 1)s 22

n1 + n 2 2
tc =
9( 4.9 2 ) + 11( 4.52 )

=
= 21.942
20
= 1.99
35 31
1 1
21.942 +
10 12


de dos medias
.025 < ( Valor P) < .05
Cmo se puede saber si el supuesto de igualdad

de varianzas poblacionales es razonable?
0.05 < Valor P < 0.10

P > = 0.01,
H0 no se rechaza.
No hay suficiente evidencia
para probar la diferencia de
metodos de instruccion



Ejemplo
Prueba de diferencia pareada

(2 muestras dependientes)
A veces, el supuesto de muestras independientes
se viola intencionalmente, lo que resulta en una
prueba de 2 muestras relacionadas o prueba de
datos emparejados.
Al disear el experimento de esta manera,
podemos eliminar una variabilidad no deseada
mediante el anlisis de las diferencias,
di = x1i x2i
para ver si hay una diferencia en las dos medias
de la poblacin, 12.
Tipo A
Auto
10.6
9.8
12.3
9.7
8.8
Tipo B
10.2
9.4
11.8
9.1
8.3
Para comparar el desgaste de dos marcas de llantas A y B

se asignaron al azar en cada uno de 5 autos. Luego de un
recorrido especificado se registro la cantidad de desgaste
de cada llanta. Hay evidencia para indicar una diferencia
en el promedio de desgaste para los dos tipos de llantas?
Pero las muestras no son independientes.
Los pares de respuestas estn
relacionados porque las mediciones se
realizan en el mismo auto.

medias (muestras relacionadas)

Auto
Tipo A
10.6
9.8
12.3
9.7
8.8
Tipo B
10.2
9.4
11.8
9.1
8.3
Diferencia
0.4
0.4
0.5
0.6
0.5


Auto
Tipo A
10.6
9.8
12.3
9.7
8.8
Tipo B
10.2
9.4
11.8
9.1
8.3
Diferencia
0.4
0.4
0.5
0.6
0.5
Region rechazo: Rechazar H0

si t > 2.776 o t < -2.776.
Conclusion: como tc = 12.8,
rechazamos H0 . Hay
diferencia significativa en el
promedio de desgaste de los
neumticos para las dos
marcas de neumticos.
Inferencia para una varianza

poblacional
A veces, el parmetro principal de inters no
es la media poblacional sino ms bien la
varianza poblacional 2. Escogemos una
muestra aleatoria de una poblacion normal.
La varianza muestral s2 puede usarse en la
forma:
que tiene una distribucion Ji-cuadrado con

r = n - 1 grados de libertad.
Nota adicional
Se puede construir un intervalo confidencial para este
experimento usando:
Una vez que haya diseado el experimento de pares,

debe analizar como un experimento emparejado. Si el
experimento no est diseado como un experimento
emparejado con antelacin, no utilice este
procedimiento.
Inferencia para una varianza poblacional

La tabla 5 nos da los valores criticos para la
distribucion Ji-cuadrado con r grados de libertad.
Por ejemplo, el valor

critico Ji-cuadrado con
0.05 en la cola derecha
con r = 5 es 2 =11.07.


Inferencia para una

varianza poblacional
Ejemplo
Un fabricante de cemento afirma que su cemento
tiene una resistencia a la compresin con una
desviacin estndar de 10 kg / cm2 o menos. Una
muestra de n = 10 mediciones produjo una media
y desviacin estndar de 312 y 13.96
respectivamente.
H0: 2 102 (afirmacion
correcta)
Ha: 2 > 102 (afirmacion
incorrecta)

c2 =
(n 1)s 2 9(13.96 2 )
=
= 17.5
100
10 2
Aproximacion del Valor-P
Ejemplo
Estos datos dan suficiente evidencia para rechazar la
afirmacion del fabricante? Use = .05.
0.025 < Valor-P < 0.05

Como P < = .05, Se
rechaza H0 .
Se rechaza la afirmacion
del fabricante
Region rechazo: Rechazar H0

si 2 > 16.919 ( = .05).
Conclusion: Como 2= 17.5,
H0 es rechazada. La desviacion
estandar Copyright
de la resistencia
es
2006 Brooks/Cole
division of Thomson Learning, Inc.
mayor deA 10


Inferencia para dos varianzas poblacionales

Podemos hacer inferencias acerca de la razn de dos
varianzas poblacionales. Elegimos dos muestras
aleatorias independientes de tamao n1 y n2 de
distribuciones normales.
Si las dos varianzas poblacionales son iguales
Inferencia para dos varianzas

poblacionales
La Tabla 6 da los valores criticos para la
estadistica F
Por ejemplo, el valor

critico F con area 0.05
en la cola derecha de la
distribucion con r1 = 5 y
r2 = 8 es F =3.69.
Tiene distribucion F con r1 = n1 - 1 y

r2 = n2 - 1 grados de libertad (degrees of freedom).

Inferencia para dos varianzas

poblacionales

Ejemplo
Un experimentador ha realizado un experimento de
laboratorio utilizando dos grupos de ratas. El quiere
probar H0: 1 = 2, pero primero quiere asegurarse
de que las varianzas poblacionales son iguales.
Standard (2)

Experimental (1)
10
11
Media
13.64
12.42
Desviacion
estandar
2.3
5.8


Ejemplo
Ejemplo
Standard (2) Experimental (1)
Tamao de
muestra n =
10
11
Desviacion
2.3
estandar muestral
5.8
La region de rechazo es de dos colas con = .05, pero

solamente necesitamos hallar el valor critico de la cola
derecha, que tiene /2 = .025 de area a la derecha.
De la tabla 6 , con r1=10 y r2 = 9, rechazamos H0 si F > 3.96.
La desviacion estandar mas grande la denominamos

de la muestra 1, para forzar que la prueba tome
valores en la cola derecha de la distribucion
F.
CONCLUSION: Rechazamos H0. las varianzas poblacionales

son distintas. No podemos asumir varianzas homogeneas para
la prueba t !
Analisis de datos categoricos



El Experimento Multinomial
Introduccion
Muchos experimentos resultan en medidas que
son cualitativas o categricas en vez de
cuantitativas.
Personas mayores de 18 clasificados segun
nivel educativo
Autos clasificados segun procedencia
Condicion de actividad (ocupado, desocupado,
no PEA)
Estos datos tiene las caracteristicas de un

experimento multinomial. Copyright 2006 Brooks/Cole
El Experimento Binomial
Es un caso especifico del experimento

multinomial con k = 2 categorias
Categorias 1 y 2: exito y fracaso
p1 y p2:
pyq
O1 y O2:
x y n-x
Hacemos inferencias acerca de p
(y q = 1 - p)
En el experimento multinomial hacemos inferencias sobre

2006 Brooks/Cole
todas la proporciones, p1, p2, p3 pCopyright
k.division of Thomson Learning, Inc.
A
1. Consiste de n pruebas o ensayos identicos.

2. Cada prueba resulta en una de k categorias.
3. La probabilidad de que el resultado cae en una
categora particular i para un simple ensayo es
pi y permanece constante de ensayo en
ensayo. La suma de todas las k probabilidades,
p1+p2 ++ pk = 1.
4. Los ensayos son independientes.
5.
Estamos interesados en el nmero de resultados

en cada categora, O1, O2 , Ok con O1 + O2 +
+ Ok = n.

Estadistica Ji-Cuadrada de Pearson

Suponga que n=100 pelotas se lanzan en 7 cajas y
sabemos que la probabilidad que una pelota caiga en la
primera caja es p1=0.15 cuantas pelotas esperariamos
que caiga en la primera caja?
Tenemos un valor anticipado para pi y queremos usar la
informacion muestral para probar nuestro supuesto.
El numero esperado de veces que los resultados

ocurriran es Ei = npi. Si las cantidades observadas,
Oi, estn demasiado lejos de lo que afirma la
hiptesis nula H0, lo mas probable es que H0 sea
rechazada.

Prueba de bondad del ajuste
Estadistica Ji-Cuadrada de Pearson
Cuando H0 es verdad, las diferencias O-E seran

pequeas, pero grandes cuando H0 es falsa.
Buscar valores altos de basado en la distribucin Jicuadrado con un nmero determinado de grados de
libertad.
El investigador usa la hiptesis nula para

especificar el modelo que cree es verdadero.
Se mide una sola variable cualitativa, y se
especifican los k valores exactos para cada uno de
las pi.
Los valores esperados de cada celda se obtienen:
Ei = npi
Los grados de libertad r=df = k-1

Ejemplo
Ejemplo
Se lanza un dado 300 veces con los resultados

siguientes:
Resultado
1
Numero de veces 50

2
39
3
45
4
62
5
61
6
43
El dado esta construido correctamente o esta sesgado?
Calculamos los valores esperados de celda:

Ei = npi = 300(1/6) = 50
Resultado
Oi
50
39
45
62
61
43
Ei
50
50
50
50
50
50
Estadistica de prueba y region de rechazo:
Este es un experimento multinomial con k = 6 y O1 O6

dados en la tabla.
H0: p1= 1/6; p2 = 1/6;p6 = 1/6 (dado correcto)
Ha: al menos una pi es diferente de 1/6 (dado sesgado)

No rechazar H0. No hay suficiente

evidencia para indicar que el dado
este sesgado

Notas
Tablas de Contingencia
m m m
m
m m
Para que la aproximacion Ji cuadrado sea exacta

se recomienda que los Ei 5 para todas las
celdas.
Esta prueba de bondad de ajuste es diferente a
las vistas anteriormente ya que el investigador
usa H0 para el modelo que cree verdadero.
H0: modelo correcto
Ha: modelo incorrecto
La prueba Ji-cuadrado siempre es unilateral a la

derecha
(tablas cruzadas)
Relacion entre dos variables categoricas

El experimenador mide dos variables cualitativas
Tipo de defecto y el turno de produccion de un mueble

Categoria de edad y condicion de actividad de una
persona.
Categoria de Ingreso economico y sector economico
(servicios, construccion, manufactura, comercio, otros) de un trabajador
Resume los datos encontrando las frecuencias

bidimensionales observadas en cada interseccion de
niveles de categoria en una Tabla de contingencia.
Tabla de Contingencia f x c
Esta tabla tiene f filas y c columnasfc celdas en total.
1
O11
O12
O1c
O21
O22
O2c
Or1
Or2
Orc
Estudiamos la asociacion entre las dos variables cualitativas.

Un metodo de clasificacion es dependiente del otro?
La distribucin de las mediciones en las distintas categoras
de la variable 1 depende de las categoras de la variable 2?
Si no, las variables son independientes.
Prueba de independencia Ji-cuadrado

H0: los dos metodos de clasificacion son independientes
Ha: los dos metodos de clasificacion son Dependientes
Oij Es la frecuencia observada para la fila i y columna j.

Eij = npij Es la frecuencia esperada
Si H0 es verdadera y las clasificaciones son independientes,
pij = pipj = P(cae en fila i)P(cae en fila j)

Prueba de independencia Ji-cuadrado
Ejemplo
Los defectos de muebles se clasifican segn el tipo de
defecto y el turno en el que se fabrico.
Turno
Esta estadistica de prueba tiene aproximadamente

una distribucion teorica Ji-cuadrado con:
r = (filas-1)(columnas-1) grados
de libertad.
Calculamos las frecuencias esperadas. Por ejemplo:
Chi-Square Test: 1, 2, 3
Expected counts are printed below observed counts
Chi-Square contributions are printed below expected counts
1
2
3 Total
1
15
26
33
74
Chi-Sq = 19.178, DF = 6, P-Value
22.51 22.99 28.50
= 0.004
2.506 0.394 0.711
2
21
20.99
0.000
31
21.44
4.266
17
26.57
3.449
69
45
38.94
0.944
34
39.77
0.836
49
49.29
0.002
128
13
11.56
0.179
5
11.81
3.923
20
14.63
1.967
38
Total
94
96
119
309
Tipo
Total
15
26
33
74
21
31
17
69
45
34
49
128
13
20
38
Total
94
96
119
309
Los datos presentan evidencia que indique que el tipo de

defecto en el mueble varia con el turno en el cual el mueble fue
fabricado? Pruebe al nivel 1% .
H0 : El tipo de defecto es independiente del turno
2006 Brooks/Cole
Ha : El tipo de defecto dependeCopyright
del turno
EJEMPLO 02:
Los trabajadores en Lima Metropolitana con
mayor nivel educativo tienen un mayor nivel de ingreso econmico?
H0: El nivel de ingreso es independiente del nivel educativo alcanzado
Ha: El nivel de ingreso depende del nivel educativo alcanzado
Rechazar H0 si X2c>16.812 con r=2*3 = 6 g.l.

Rechazar H0. El tipo de defecto en el mueble

depende
del turno.
A division
of Thomson
Learning, Inc.
Fuente: Bases de datos EPE INEI Copyright

junio 2006
2015Brooks/Cole


Comparacion de poblaciones Multinomiales

A veces los investigadores disean un experimento para el que
el nmero de unidades experimentales que caen en un conjunto
de categoras se fija de antemano.
Ejemplo: Un experimentador selecciona 900 pacientes tratados
para prevenir la gripe. Selecciona 300 de cada uno de los tres
tipos: Sin vacuna, una vacuna y dos vacunas
SinVacuna
Una
Vacuna
Dos
vacunas
Gripe
Total
300
300
300
Comparacion de poblaciones Multinomiales

Cada una de las c columnas cuyos totales se han fijado de
antemano, es en realidad un solo experimento multinomial.
La prueba Ji-cuadrado de independencia con (r-1)(c-1) grados
de libertad equivale a una prueba de homogeneidad de c
poblaciones multinomiales
Sin vacuna
Total
Una
vacuna
Dos
vacunas
Gripe
r1
r2
Sin gripe

r1
Sin gripe
Total
Total
r2
300
300
300
n = 900
n = 900
El total de columna ha sidoCopyright

fijado
de Brooks/Cole
antemano!
2006
Hay tres experimentos binomiales

Copyright
Brooks/Cole
La probabilidad de tener gripe es independiente del
tipo2006
de prevencion?

Ejemplo
Muestras aleatorias de 200 votantes en cada uno de los cuatro
distritos fueron encuestados y se les pregunto si votara por el
candidato A en una eleccin municipal.
Un problema de votantes
Primero calcular las frecuencias esperadas:
Distrito
1
Total
Vota por A
76
53
59
48
236
No vota por A
124
147
141
152
564
Total
200
200
200
200
800
Existe evidencia que indique que la fraccion de votantes que favorecen

a A es distinta en los 4 distritos?
H0: la proporcion a favor de A es independiente del distrito

Ha: la proporcion a favor de A depende del distrito
H0: p1 = p2 = p3 = p4
Brooks/Cole
donde pi = fraccion que vota A en cadaCopyright
uno 2006
de los
distritos
Ya sabemos que hay diferencias entre los cuatro distritos,

cules son la naturaleza de estas diferencias? Veamos las
proporciones a favor del candidato A en las cuatro
distritos
3
59/200 =
0.30(a,b)
1
76
59.00
4.898
2
53
59.00
0.610
3
59
59.00
0.000
4
48
59.00
2.051
Total
236
124
141.00
2.050
147
141.00
0.255
141
141.00
0.000
152
141.00
0.858
564
Rechazar H0. hay suficiente evidencia para demostrar que la

Total
200
200
200 de 200
800
Copyright
2006 Brooks/Cole
fraccion
de votantes
a favor
A varia
por distrito
Otras aplicaciones
Un problema de votacion
Distrito
1
2
Vota 76/200= 53/200 =
A
0.38(a)
0.27(b)
Chi-Square Test: 1, 2, 3, 4
Chi-Sq = 10.722, DF = 3, P-Value = 0.013
Expected counts are printed below observed counts
Chi-Square contributions are printed below expected counts
4
48/200 =
0.24(b)
El candidato A solamente esta regular en el primer distrito, y bajo

en los demas distritos. Debera mejorar su campaa.
Prueba de bondad de ajuste

Sirve para demostrar si los datos son consistentes
con alguna distribucion teorica de probabilidad
como: Normal, Poisson, Exponencial, etc. Es decir si
una muestra proviene de una poblacion normal o de
otra forma
H0: Los datos se ajustan al modelo teorico
Ha: Los datos no se ajustan al modelo teorico

Durante la segunda guerra mundial cayeron sobre Londres 535
bombas El rea afectada fue dividida en 576 sectores iguales
Bombas/rea (k)
Frecuencia (Ok)
0
229
1
211
2
93
3
35
4
7
5
1
Total
576
El nmero promedio de bombas por sector es 535/576= 0.929.

La probabilidad que caigan k bombas en un sector, segn la
distribucion Poisson Px k
Bombas/area
Probabilidad Poisson
E = Prob x 576
0
1
0.395 0.367
228
211

!
2
0.17
98
3
4
5
0.053 0.012 0.003
31
7
2

Para la Ji-cuadrado de Pearson:

1. Los valores observados O1, O2, ,Ok deben
satisfacer las condiciones de un experimento
multinomial o de una comparacion de
poblaciones multinomiales.
2. Las frecuencias esperadas E1, E2, , Ek
deberian ser igual o mayor a 5.
El Diseo de un Experimento
Supuestos
Supuestos
Cuando no se cumple la condicion #2 se tienen

las siguientes opciones:
1. Elegir un tamao de muestra mas grande. Cuanto

mayor sea el tamao de la muestra, ms cerca la
distribucin de Ji-cuadrado se aproximar a la
distribucin de su estadstica de prueba X2.
2. Si es posible combine una o mas de las categorias
que tienen frecuencias esperadas pequeas.

El plan de muestreo o diseo experimental

determina la forma en que la muestra es
seleccionada.
En un estudio observacional, el experimentador
registra datos que ya existen. Ejemplo: las encuestas.
Experimentacion, el experimentador controla una o
mas condiciones en las unidades experimentales y
registra las respuestas a esos cambios.


Ejemplo 1
Definiciones
Una unidad experimental es el objeto en el que
se toma una medicion (o mediciones).
Un factor es una variable independiente cuyos
valores son controlados por el experimentador.
Un nivel es el grado de intensidad de un factor.
Un tratamiento es una combinacion especifica
de niveles de factor.
La respuesta es la variable que es medida por el
experimentador.
Un grupo de personas se divide aleatoriamente en

un grupo experimental y un grupo control. Al grupo
de control se le aplica una prueba de aptitud despus
de haber tomado un desayuno completo. Al grupo
experimental se le aplica la misma prueba sin haber
tomado ningn desayuno.
Unidad Experimental = persona
Factor = comida
Puntaje en la
Desayuno o
Respuesta =
Niveles =
prueba
no desayuno
Tratamientos:Desayuno o no desayuno

Ejemplo 2
En un partido de futbol son muchos los factores que influyen en el
nmero de goles anotados, el entrenamiento, el entrenador, el jugador,
etc. Diseamos el siguiente experimento: Se elijen dos factores que se
pueden controlar: la distancia y ngulo de tiro al arco. Se definen 3
niveles para cada factor. Para la distancia a 4, 8 y 12 metros del arco y
ngulo de tiro: 45, 90 y 135. Se toma una muestra representativa de
jugadores. Cada jugador lanza 5 tiros y registra el nmero de goles. Para
cada posicin se utiliza 4 jugadores. Se sortean las posiciones a los
jugadores
Unidad Experimental = jugador Factor1 = Distancia
Respuesta = #Goles (0-5)
Niveles1 = 4m; 8m ;12m
Factor2 = Angulo tiro
Tratamientos:
Niveles2 = a45 ; a90; a135
T1= 4m a45; T2= 4m a90; T3= 4m a135;
T4= 8m a45; T5= 8m a90; T6= 8m a135;
T7= 12m a45; T8= 12m a90; T9= 12m
a135
A division
of Thomson Learning, Inc.

El Analisis de Varianza (ANVA)

La variable respuesta tiene una variabilidad total
Esta varianza se divide en partes que pueden
atribuirse a varios factores.
Estas partes pueden usarse para determinar los
efectos de los factores en la variable respuesta.
Factor 1
Variacion Total
Factor 2
Variacion aleatoria

Supuestos para el ANVA

1. Las observaciones dentro de cada grupo estan
normalmente distribuidas con una varianza
comun 2.
2. Las suposiciones respecto al procedimiento de
muestreo son especificadas para cada diseo.
Diseo Completamente Aleatorizado

Una clasificacion en una direccion
En el DCA un factor tiene k niveles diferentes.
Los k niveles corresponden a k poblaciones normales,
los que corresponden con los tratamientos.
Estas k poblaciones tienen la misma media, o al
menos una media es diferente de la otras?
El ANVA es un procedimiento robusto cuando los

tamaos muestrales son iguales y cuando los datos
tienen forma de campana
Ejemplo
En un experimento para determinar el efecto de la
nutricion en la capacidad de concentracion de
estudiantes de escuelas elementales. Doce nios fueron
divididos aleatoriamente en tres grupos y asignados a
un plan de alimentacin diferente. La respuesta fue la
capacidad de concentracin en minutos durante la
lectura de la maana.
No Desayuno
Desayuno
ligero
Desayuno
completo
8
7
9
14
16
12
10
12
16
13
17
15
a = 3 tratamientos.
los promedios de
concentracion son
diferentes?

Muestras aleatorias de tamao n1, n2, ,nk se

toman de k poblaciones con medias 1, 2,,
k y con varianza comun 2.
Sea yij la j-esima medida en la i-esima muestra.
La variacion total de la variable respuesta se
mide con la Suma de Cuadrados Total


Formulas ANVA

La Suma de Cuadrados Total (SCT) se
descompone en dos partes:
SCR (Suma de Cuadrados Tratamientos):
mide la variacion entre las k muestras.
SCE (Suma de Cuadrados del Error):
mide la variacion dentro de las k muestras

El Problema del Desayuno

No Desayuno
Desayuno
ligero
Desayuno
completo
14
10
16
12
12
16
13
17
15
T1 = 37
T2 = 59
T3 = 53

La tabla ANVA para el DCA
Fuente de Variacin
Tratamientos
T = 149

Suma de Grados de Cuadrado Medio

Cuadrados Libertad
SCR
SCR
a-1
CMR =
a 1
Error
SCE
N-a
Total
SCT
N-1
CME =
Fc
Fc =
CMR
CME
SCE
N a


Prueba de igualdad de medias

H 0 : 1 = 2 = 3 = ... = k
H a : al menos una media es diferente
Fuente
Tratamientos
gl
2
SC
64.6667
CM
32.3333
Error
Total
9
11
58.25
122.9167
6.4722
Fc
5.00

2 es la varianza comun de las k poblaciones.

CME = SCE/(N a) es la estimacion de 2
La prueba F de Fisher
Rechazamos H 0 usando siempre una prueba de
cola derecha.
Cuando H 0 es verdad, F tiene distribucion
r1 = (a 1) y r2 = (N a) grados de libertad.
H 0 : 1 = 2 = 3 = ... = a
CMR
CME
Rechazar H 0 si F > F con a 1 y N-a g.l.
Prueba : F =



Metodo Tukey para

comparacion de medias
Metodo de Tukey
Basado en el rango estudentizado, la diferencia

entre la mayor y menor media de las k medias
muestrales ( k = a = numero de tratamientos).
El mtodo asume que los tamaos de las
muestras son iguales y calcula una "regla" que
mide la distancia requerida entre cualquier par
de medias para declarar una diferencia
significativa

cual de las tres medias poblacionales son diferentes?
Medias
No
Desayuno
T1 = 37
Desayuno
ligero
T2 = 59
Desayuno
completo
T3 = 53
37/4 = 9.25
59/4 = 14.75
53/4 = 13.25


Las medias muestrales ordenadas de menor a mayor:
La diferencia entre 9.25 y 13.25 es

menor que T = 5.02, no hay diferencia Podemos declarar una
diferencia significativa
significativa.
Como 14.75-9.25 = 5.50 > 5.02

entre "sin desayuno" y

"desayuno ligero",
pero no entre los otros
pares
si hay diferencia significativa entre las

medias problacionales 1 y 2.

Ejemplo
Diseo en Bloques Completo al Azar - DBCA
Es un diseo con a tratamientos y con b

bloques, entonces el total de observaciones es
N = ab.
El propsito de bloqueo es eliminar o aislar la
variabilidad de bloque a bloque que podra ocultar el
efecto de los tratamientos
Este diseo usa bloques de k unidades
experimentales homogeneas o similares, con una
unidad dentro de cada bloque asignados
aleatoriamente a cada tratamiento Copyright 2006 Brooks/Cole
Una empresa ensambladora de computadoras

desea presentar 3 modelos de computadora.
Efecta un sondeo en 4 lugares (bloques)
registrando el nmero de posibles compras del
pblico que frecuenta los lugares de venta. Se
obtiene los siguientes resultados:
Lugares
.Tratamiento = modelo de
computadora (a = 3)
Modelo
11
13
16
10
15
17
20
12
Bloque = lugar (b = 4)
Las ventas promedio son diferentes
para los tres modelos?
El Analisis de Varianza
La SCT se divide en 3 partes:
SCR (Suma de cuadrados de los tratamientos)
SCB (Suma de cuadrados de bloques)
SCE (Suma de cuadrados del Error): mide la
variacion aleatoria o error experimental

10
15
13
10
Formulas para DBCA

C=
T2
N
donde T = Yij
SCT = Yij2 C
2
SCR =
SCB =
Ti
C donde : Ti = total_tratamiento i
b
B j2
C donde B j = total_bloq ue j
a
SCE = SCT - SCR - SCB


El problema de los modelos de computadoras
La Tabla ANVA - DBCA
Lugares
Modelo
Ti
11
13
16
10
50
Cuadrados Medios
15
17
20
12
64
CMR = SCR/(a-1)
10
15
13
10
48
CMB = SCB/(b-1)
Bj
36
45
49
32
162
Grados de libertad
Total = ab 1 = N -1
Tratamiento = a 1
b 1
Bloque =
Error = ab (a 1) (b-1) =
(a-1)(b-1)
CME = SCE/(a-1)(b-1)
Fuente
gl
SC
CM
Fc
Tratamientos
a -1
SCR
SCR/(a-1)
CMR/CME
CMB/CME
Bloques
b -1
SCB
SCB/(b-1)
Error
(b-1)(a-1)
SCE
SCE/(b-1)(a-1)
Total
N -1
SCT


Prueba para las medias de

bloques y tratamientos
H 0 : 1 = 2 = 3 = ...
versus
H a : al menos una media es diferente
Para probar H 0 : los tratamientos o bloques son iguales

Fuente
gl
SC
CM
Tratamientos
38
19
10.06
Bloques
61.6667
20.5556
10.88
Error
11.3333
1.8889
Total
11
111

CMR
CMB
(o F =
)
CME
CME
RchazarH0 si F > F cona - 1 (o b 1) y (b 1)(k 1) .
Prueba: F =


Metodo Tukey
Fuente
gl
SC
CM
Modelos
38
19
10.06
Lugares
(Bloques)
61.6667
20.5556
10.88
Error
11.3333
1.8889
Total
11
122.9167
Aunque no es de importancia
primordial, observe que los
bloques (locales) tambin
fueron significativamente
diferentes
(F = 10.88)
Use el metodo de Tukey para determinar cuales de los

tres modelos difieren de los demas.
A
Medias

Ordenar las medias de menor a mayor
T1 = 50
T2 = 64
T3 = 48
50/4 = 12.5
64/4 = 16
48/4 = 12
Como la diferencia entre 12 y 12.5 es menor que

T = 2.98,no hay diferencia significativa.
Hay diferencia entre las medias poblacionales C y B.
Asimismo hay diferencia entre las medias A y B

Una diferencia significativa en las ventas solamente ocurre con el

modelo B.

Probabilidad Normal de residuos
Herramientas de diagnostico
Muchos programas de computo tienen
opciones para verificar los supuestos de
poblacion normal y el supuesto de igualdad
de varianzas
Si la hiptesis de normalidad es vlida, el grafico debe

parecerse a una lnea recta, inclinada hacia arriba en la
derecha.
La normalidad tambien se demuestra con la prueba
Kolmogorov - Smirnov.
1. Grafico de Probabilidad Normal

2. Grafico de Residuos versus estimados

Residuos versus pronostico

Si la hiptesis de igualdad de varianzas es vlida, el grafico
debe aparecer como una dispersin aleatoria alrededor de la
lnea central de cero sin ningn patron. Asimismo la prueba
Levene demuestra la homogeneidad de varianzas
(02) Una empresa opera 4 maquinas tres turnos al dia.

De los registros de produccin, se obtienen los datos
siguientes sobre el nmero de fallas. Pruebe la
hiptesis de que el nmero de fallas es independiente
del turno. Encuentre el valor P de esta prueba?
MAQUINAS
TURNO
1
2
3

A
41
31
15
B
20
11
17
C
12
9
16
D
16
14
10

(03) Se realizo una encuesta para determinar si las

horas de sueo por noche son independientes de la
edad. La tabla siguiente son las horas de sueo entre
semana de una muestra de personas de 49 aos o
menos y en otra muestra de personas de 50 aos o
mas. Determine si las horas de sueo son
independientes de la edad. Cul es el valor P y su
conclusin?
(04) Un comerciante de autos realiza una prueba para

determinar si la cantidad de tiempo en minutos que
necesita para una afinacin de motor depende de si se
emplea el mtodo de un analizador computarizado o
un analizador electrnico. El tamao del auto es un
factor de variabilidad del tiempo de afinacin. Los
datos obtenidos son los siguientes. Pruebe si existe
diferencia significativa entre los mtodos.
Horas de sueo
Edad
Tamao
menos 6 6 a 6.9
7 a 7.9
8 a mas
Total
49 o menos
38
60
77
65
240
50 o mas
36
57
75
92
260
74
117
152
157
500
Total
(05) Un factor importante en la eleccin de un sistema

para la administracin de datos es el tiempo necesario
para aprender el sistema. Para evaluar tres sistemas de
administracin de archivos (A, B, C) una empresa disea
una prueba con cinco operadores. Como se considera
que la variabilidad entre los operadores es un factor
significativo, se capacita a cada uno de los cinco
operadores en cada uno de los tres sistemas. Realice una
prueba para determinar si existe diferencia significativa
entre los tiempos (horas) necesarios para aprender a
usar cada uno de los tres sistemas.
Operador
1
2
3
4
5
A
16
19
14
13
18
Sistema
B
16
17
13
12
17
C
24
22
19
18
22
Compacto
Mediano
Grande
Analizador
Computarizado Electronico
50
42
55
44
63
46

(01) Se realiz un estudio para comparar el rendimiento
(millas/galon) de gasolina en automviles para tres frmulas de
gasolina. A era una frmula sin plomo y 87 octanos, B era una
frmula sin plomo y 91 octanos y C era una frmula sin plomo de
87 octanos con 15% de etanol. Se utilizaron cuatro automviles,
todos ellos de la misma marca y modelo, y cada frmula se prob en
cada uno de los autos. El uso de cada frmula en el mismo auto
tiene el efecto de eliminar la variabilidad de un auto a otro.
a.Los datos presentan suficiente evidencia para indicar diferencias
en distancia media en millas por galn para las tres frmulas de
gasolina?
b.Hay suficiente evidencia de una diferencia en distancia media
para los cuatro automviles?
(02)Se realiz un experimento para comparar los efectos de

cuatro productos qumicos diferentes, A, B, C y D, para
producir textiles resistentes al agua. Se selecciono un rollo de
tela, se cort en cuatro partes y todas stas se asignaron al
azar para recibir uno de los cuatro productos qumicos, A, B, C
y D. Este proceso se repiti tres veces, produciendo as un
diseo de bloque aleatorizado. Este diseo, con mediciones de
resistencia a la humedad, se muestra en el cuadro siguiente
(bajas lecturas indican baja penetracin de humedad.
Identifique los bloques y tratamientos e investigue
cualesquiera diferencias en medias de tratamiento. Hay
diferencias entre los productos qumicos? El bloqueo ha sido
eficaz en este experimento?
Automvil
Frmula
25.7
27.0
27.3
26.1
27.2
28.1
27.9
27.7
26.1
27.5
26.8
27.8
(03) Se tomaron muestras de agua de un ro en cuatro lugares

diferentes para determinar si la cantidad de oxgeno disuelto,
una medida de la contaminacin del agua, variaba de un lugar
a otro. Los lugares 1 y 2 se seleccionaron arriba de una planta
industrial, un lugar cerca de la orilla y otro a mitad del ro; el
lugar 3 estaba adyacente a la descarga del agua industrial de
la planta; y el lugar 4 estaba ligeramente aguas abajo a mitad
del ro. Cinco especmenes del agua se seleccionaron al azar en
cada lugar, pero un espcimen, correspondiente al lugar 4, se
perdi en el laboratorio. Los datos y un anlisis de varianza
con SPSS se dan a continuacin (a mayor contaminacin,
lecturas ms bajas de oxgeno disuelto).
C
9.9
A
10.1
B
11.4
D
12.1
D
13.4
B
12.9
A
12.2
C
12.3
B
12.7
D
12.9
C
11.4
A
11.9
(04) Un psiclogo clnico deseaba comparar tres mtodos para

reducir niveles de hostilidad en estudiantes universitarios, con el uso
de cierto examen psicolgico. Se tomaron las calificaciones altas de
este examen como indicio de gran hostilidad. Once estudiantes que
obtuvieron calificaciones altas y casi iguales se emplearon en el
experimento. Cinco fueron seleccionados al azar de entre los 11
casos problema y tratados con el mtodo A, tres fueron tomados al
azar de los seis estudiantes restantes y tratados con el mtodo B y
los otros tres estudiantes fueron tratados con el mtodo C. Todos los
tratamientos continuaron durante todo un semestre, al final del
semestre el examen psicolgico se aplic de nuevo. b. Los datos dan
suficiente evidencia para indicar una diferencia en respuesta media
de estudiantes a los tres mtodos despus del tratamiento? .
A
B
C
73
54
79
83
74
95
76
71
87
68
80

(05) Prueba para accidentes industriales que se distribuyen

de manera uniforme Se realiz un estudio de 147 accidentes
industriales que requirieron atencin mdica. De tales
accidentes, 31 ocurrieron en lunes, 42 en martes, 18 en
mircoles, 25 en jueves y 31 en viernes. Pruebe la
aseveracin de que los accidentes ocurren con proporciones
iguales en los cinco das de trabajo. Si las proporciones no
son las mismas, qu factores explicaran las diferencias? .
(07) Prueba de bondad de ajuste con

binomial.
La distribucin de una frecuencia que se
sigue:
Nmero de xitos
0
1
2
Frecuencia
89
133
52
una distribucin
observa es como
3
26
a).- Suponiendo que una distribucin binomial tiene n = 3

y p = 1/3, utilice la frmula de la probabilidad binomial
para calcular la probabilidad que corresponde a cada
categora de la tabla.
b).- Utilizando las probabilidades que se calcularon en el
inciso a, determine la frecuencia que se espera para cada
categora.
c).- Utilice un nivel de significancia de 0.05 para probar la
aseveracin de que las frecuencias que se observan
ajustan con una distribucin binomial para la que n = 3 y p
= 1/3 .
(06) Riesgos de trabajo en Estados Unidos. Utilice los datos en la

tabla para probar la aseveracin de que la ocupacin es
independiente de que la causa de muerte sea un homicidio. La
tabla se basa en datos del Departamento del Trabajo de Estados
Unidos. Parece que alguna ocupacin en particular sea ms
propensa a los homicidios? Si as fuera, cul es? .
Causa
muerte
Polica
Cajero
Taxista Vigilante
Homicidio
Otra
82
92
107
9
70
29
59
42
Total
174
116
99
101
Total
318
172
490
(08) Una encuesta encontr que 28% de los administradores de

sistemas de informacin (SI) estaban muy satisfechos con su
trabajo, 46% estaban moderadamente satisfechos con su
trabajo, 12% no estaban ni satisfechos ni insatisfechos, 10%
estaba
ligeramente
insatisfechos
y
4%
estaban
muy
insatisfechos. Suponga que en una muestra de programadores se
encontraron los resultados siguientes.
Use = 0.05 y realice una prueba para determinar si la
satisfaccin con el trabajo en programadores de computadoras es
diferente de la satisfaccin con el trabajo de los administradores
de SI .
Categoria
Nro
Muy satisfechos
105
Moderadamente satisfechos
235
Ni satisfechos ni insatisfechos
55
Ligeramente insatisfechos
90
Muy insatisfechos
15

Diapositivas - Estadistica Inferencial - Pruebas de Hipotesis PDF

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Diapositivas - Estadistica Inferencial - Pruebas de Hipotesis PDF

Hochgeladen von

Copyright:

Verfügbare Formate

Diapositivas Estadistica y Diseo Experimental - segunda unidad

- Mg. Mario Pelaez Osorio

Un fabricante quiere saber si un nuevo tipo de

A division of Thomson Learning, Inc.

La muestra proviene de una poblacion con

Copyright 2006 Brooks/Cole

Diapositivas Estadistica y Diseo Experimental - segunda unidad

El Margen de Error (E)

Copyright 2006 Brooks/Cole

Estimacion de Medias y Proporciones

Copyright 2006 Brooks/Cole

Para poblacion binomial

Copyright 2006 Brooks/Cole

Copyright 2006 Brooks/Cole

Diapositivas Estadistica y Diseo Experimental - segunda unidad

Calcular dos numeros del intervalo [a, b] en el

Copyright 2006 Brooks/Cole

Slo si el estimador cae en las reas de la cola

100(1-)% Intervalo de confianza: Estimador z/2EE

Diapositivas Estadistica y Diseo Experimental - segunda unidad

Intervalo de confianza para la media y

Una muestra aleatoria de n = 50 hombres mostr

Para poblacion cuantitativa,

Para poblacion binomial

o 746.30 < < 765.70 gramos.

Copyright 2006 Brooks/Cole

Encuentre un intervalo de confianza del 99%

A division of Thomson Learning, Inc.

De una muestra aleatoria de n = 150 estudiantes

o 0.60 < P < 0.78

Diapositivas Estadistica y Diseo Experimental - segunda unidad

Estimacion de la diferencia entre

Estimacion de la diferencia entre

A veces estamos interesados en comparar las medias de dos

Comparamos los dos promedios haciendo

Para hacer esta comparacin

Copyright 2006 Brooks/Cole

Distribucion muestral de:

Copyright 2006 Brooks/Cole

Copyright 2006 Brooks/Cole

Copyright 2006 Brooks/Cole

Diapositivas Estadistica y Diseo Experimental - segunda unidad

Desv. Estand. Muest.

Comparar la ingesta diaria promedio de productos

Podra llegar a la conclusin, sobre la base de este intervalo

or - 18.78 < 1 2 < 6.78.

Copyright 2006 Brooks/Cole

Seleccion del tamao muestral

Copyright 2006 Brooks/Cole

Copyright 2006 Brooks/Cole

Diapositivas Estadistica y Diseo Experimental - segunda unidad

Copyright 2006 Brooks/Cole

Pruebas de hipotesis para

El razonamiento utilizado en una prueba de hiptesis

Copyright 2006 Brooks/Cole

Procedimiento de una prueba

Diapositivas Estadistica y Diseo Experimental - segunda unidad

3. La estadistica de prueba: valor calculado o

Procedimiento de una prueba de Hipotesis

El alcalde de una pequea ciudad afirma que el

3. La mejor estimacin de la media poblacional es la media

Por el Teorema del Limite Central la media muestral tiene

La media muestral, $30,000 tiene