Beruflich Dokumente
Kultur Dokumente
ESTIMACION PUNTUAL Y DE
INTERVALO
Una poblacion se describe por su distribucion
de probabilidad y sus parametros.
Para una poblacion cuantitativa, la ubicacion
y forma se describe por y .
Para una poblacion binomial, la ubicacion y
forma esta determinada por P.
Si no se conocen los valores de los parmetros ,
hacemos inferencias sobre ellos utilizando la
2006 Brooks/Cole
informacin de la muestra. Copyright
A division of Thomson Learning, Inc.
Metodos de Inferencia
Ejemplos:
Un consumidor quiere estimar el precio
promedio de viviendas similares en la ciudad
antes de poner su casa en el mercado.
Estimacion: Estimar , el promedio de los precios.
Metodos de Inferencia
Estimacion:
Estimar o predecir el valor del parametro
cual es el valor mas probable de o P?
Prueba de Hipotesis:
Tomar una decision acerca del valor de un
parametro, con base en una idea preconcebida.
Metodos de Inferencia
Los procedimientos estadisticos son
importantes porque dan dos tipos de
informacion:
Metodos para hacer la inferencia
Una medida numerica de la bondad
o confiabilidad de la inferencia
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.
Definiciones
Un estimador es una regla, que nos dice
como calcular una estimacion con la
informacion de la muestra.
Estimacion Puntual:.Se calcula un
solo numero para estimar el parametro
Estimacion de Intervalo: Dos
numeros se calculan para formar un
intervalo dentro del cual se espera est
el parametro.
Ejemplo
Un propietario toma una muestra al azar de 64
casas similares a la suya y encuentra que el precio
medio de venta es de $ 252.000 , con una
desviacin estndar de $ 15.000. Estime el precio
de venta promedio para todas las viviendas
similares en la ciudad.
Estimacion de Intervalo
Ejemplo
Un tcnico de control de calidad quiere estimar
la proporcin de latas de refrescos que estn mal
llenadas .
l toma una muestra al azar de 200 latas de
refresco y se encuentra 10 latas mal llenadas
Cuando 1- = 0.95 y el
estimador tiene
distribucion normal.
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.
Estimacion de Intervalo
No conocemos el valor del parametro. 95% de
los intervalos contendran el parametro .
Estimador 1.96 EE
Parametro 1.96 EE
Nivel de confianza
Para cambiar el nivel de confianza, 1-, elija un
valor z que deje un area 1- en el centro de la
distribucion z .
Area de cola
z
/2
Funciona
Funciona
Funciona
Falla
.05
.025
.01
1.645
1.96
2.33
.005
2.58
Ejemplo
x 1.96
756 1.96
35
50
756 9.70
Ejemplo
Ejemplo
756 2.58
35
756 12.77
n
50
or 743.23 < < 768.77 grams.
El intervalo debe ser ms ancho para compensar el
aumento de la confianza de encerrar el verdadero valor
Copyright 2006 Brooks/Cole
de .
p 2.33
.69(.31)
p q 104
2.33
150
150
n
.69 .09
Estimando 1-
2
Para muestras grandes , las estimaciones
puntuales y su margen de error , as como los
intervalos de confianza se basan en la
distribucin normal estndar .
Ejemplo
Ingesta diaria
Men
Women
Tamao de muestra
50
50
Media muestral
756
762
35
30
Ejemplo, continuacion
Ejemplo
Resumen
I. Tipos de Estimadores
1. Estimacion puntual: Un numero calculado para estimar el
parametro poblacional.
2. Intervalo : Dos numeros calculados para formar un
intervalo que contiene el parametro.
II. El Margen de error mide la maxima distancia entre el
estimador y el verdadero valor del parametro.
III. Intervalos de confianza para muestras grande
5. Conclusion:
Rechazar H0 o No rechazar H0, junto
con una declaracin sobre la fiabilidad de
su conclusin.
Cmo decidir cundo rechazar H0?
Depende del nivel de significancia , el
riesgo mximo tolerable que desea tener
de cometer un error, si decide rechazar
H0.
Frecuentemente, el nivel de significancia
es = .01 o = .05.
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.
Ejemplo 1
Ejemplo 1
Ejemplo 1
4. De la regla emprica, valores de ms de tres desviaciones
estndar de distancia de la media se consideran
extremadamente improbable. Un valor Z < -3 sera muy poco
probable que ocurra si H0 es verdadera, y dara razn para
rechazar H0.
5. Puesto que la media de la muestra , $30,000 es poco probable;
decidimos rechazar H0: = 35,000 y concluimos que la
afirmacion del alcalde es incorrecta.
6. La probabilidad que = 35,000 y que se tenga una media
muestral tan pequea (30000) por casualidad es casi cero.
Estadistica de Prueba
Inicialmente suponemos que H0 es verdadera. La
media muestral es nuestra mejor estimacion de
, y usamos la forma estandarizada como
Estadistica de Prueba:
Prueba estadistica
Si H0 es verdadera el valor de x debe estar cerca
a 0, y z cerca a 0. Si H0 es falso, x estara muy
lejos de 0, y z estara muy lejos de 0, indicado
que debemos rechazar H0.
desviacion estandar:
/ n
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.
Probable o improbable?
Luego de calcular el valor experimental de la
estadistica de prueba, calculamos su Valor P:
Ejemplo 02
El rendimiento diario de una planta qumica
tiene un promedio de 880 Kg. durante varios aos.
El gerente de control de calidad quiere saber si este
promedio ha cambiado. El selecciona al azar 50
das y registra un rendimiento promedio de 871 Kg.
con una desviacin estndar de 21 Kg.
Ejemplo 02
Cual es la probabilidad que ocurra este valor de
z=-3.03 o mas extremo por casualidad? (si H0 es
verdadera)
Ejemplo 02
Para tomar una decisin clara, al inicio del estudio
escogemos un nivel de significacin = 0.01.
Si el Valor-P es menor que , H0 es rechazada como
falsa. Usted informa de que los resultados son
estadisticamente significativos al nivel .
Si el Valor-P es mayor que , H0 no se rechaza. Usted
informa de que los resultados no son significativos al
nivel .
Ejemplo
La Region de rechazo
Si = .01, Cual seria el valor valor critico tabular
Z/2 que marca la linea divisoria entre no
rechazo y rechazo H0?
Si P < , H0 es rechazada.
Si P > , H0 No es rechazada.
implica P < ,
H0
se rechaza.
Zc < Z/2
implica P > ,
2006se
Brooks/Cole
HCopyright
NO
rechaza.
0
PRUEBAS UNILATERALES
(una cola)
Ejemplo 03
El propietario de una casa toma al azar una muestra
de 64 casas similares a la suya y encuentra que el
precio medio de venta es de $ 252.000, con una
desviacin estndar de $ 15.000. Es esta evidencia
suficiente para concluir que el precio medio de
venta es mayor de $ 250,000? Use = .01.
z = 1.07 no cae en la
region de rechazo de
H0 entonces NO se
rechaza. No hay
suficiente evidencia
para afrimar que
> $250,000.
Significancia estadistica
Inocente
Poblacion H0 verdad
(Acept H0)
Decision
H0 falsa
(Rechaza H0)
H0 Verdad
(Acept H0)
Error tipo II
Decision
Culpable
Correct
Error
Inocente
Error
Correct
Correcto
H0 falsa
Error tipo I
(Rechaza H0)
Correcto
Definicion:
= P(Error Tipo I) = P(rechazar H0 cuando H0 es verdadera)
=P(Error Tipo II) = P(aceptar H0 cuando H0 es falsa)
Ejemplo 04
Promedio de consumo diario
Hombres Mujeres
Tamao de muestra
50
50
Media muestral
756
762
35
30
Ha : 1 2 0
=
756 762 0
352 30 2
+
50
50
= .92
Ejemplo 05
Region de rechazo
Resumen
3.
4.
5.
Resumen
II.Tipos de Error en la Prueba y Significancia Estadistica
Resumen
1.
2.
4.
Introduccion
Hay pruebas de hipotesis y estimaciones
de muestras pequeas para:
PRUEBAS PARA
MUESTRAS PEQUEAS
, la media de una poblacion normal
12, la diferencia de dos medias
poblacionales
2, La varianza de una poblacion
normal
La razn de dos varianzas
poblacionales.
Propiedades de la distribucion t
Distribucin t de Student
Forma de campana
y simetrica.
Mas variable que z
Uso de la Tabla t
Inferencia de muestras
pequeas para la media
Inferencia de muestras
pequeas para la media
Ejemplo
Ejemplo
Ejemplo
Datos: 17, 31, 12, 17, 13, 25
Calculamos el valor experimental y region de
rechazo unilateral con =.05.
Conclusion
Datos: 17, 31, 12, 17, 13, 25
Comparamos el valor experimental con la region
de rechazo y concluimos:
Region de rechazo:
Rechazar H0 si t > 2.015.
El Valor-P exacto
Usando una computadora
Valor -P = 0.113 > 0.10
como se determino con la
aproximacion.
One-Sample T: Times
Test of mu = 15 vs > 15
Variable
Times
N
6
Mean
StDev
19.1667 7.3869
SE Mean
3.0157
95%
Lower
Bound
13.0899
T
1.38
P
0.113
Para probar:
H0: 12 = D0 versus
Ha: una de tres
donde D0 es una diferencia hipotetica, usualmente
Copyright 2006 Brooks/Cole
= 0.
A division of Thomson Learning, Inc.
1. Muestras aleatorias e
independientes
2. Poblaciones normales
3. Varianzas poblacionales
iguales.
Ejemplo
Metodo 1
Metodo 2
Tamao de
muestra
10
12
Media
35
31
Desv. Estand.
Muestral
4.9
4.5
H0 : 1 2 = 0
Ha : 1 2 0
tc =
x1 x 2 0
1
1
s c2
+
n1 n 2
Ejemplo
Metodo 1 Metodo 2
Tamao de
muestra
10
12
Media
35
31
Desv. Estand.
Muestral
4.9
4.5
Varianza comun :
s2 =
gl= n1 + n2 2 = 10 + 12 2 = 20
Tiempo de
ensamblado
tc =
35 31
1 1
21.942 +
10 12
Ejemplo
Tipo A
Auto
10.6
9.8
12.3
9.7
8.8
Tipo B
10.2
9.4
11.8
9.1
8.3
Auto
Tipo A
10.6
9.8
12.3
9.7
8.8
Tipo B
10.2
9.4
11.8
9.1
8.3
Diferencia
0.4
0.4
0.5
0.6
0.5
Auto
Tipo A
10.6
9.8
12.3
9.7
8.8
Tipo B
10.2
9.4
11.8
9.1
8.3
Diferencia
0.4
0.4
0.5
0.6
0.5
Nota adicional
Se puede construir un intervalo confidencial para este
experimento usando:
Ejemplo
Un fabricante de cemento afirma que su cemento
tiene una resistencia a la compresin con una
desviacin estndar de 10 kg / cm2 o menos. Una
muestra de n = 10 mediciones produjo una media
y desviacin estndar de 312 y 13.96
respectivamente.
H0: 2 102 (afirmacion
correcta)
Ha: 2 > 102 (afirmacion
incorrecta)
c2 =
(n 1)s 2 9(13.96 2 )
=
= 17.5
100
10 2
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.
Ejemplo
Estos datos dan suficiente evidencia para rechazar la
afirmacion del fabricante? Use = .05.
Ejemplo
Un experimentador ha realizado un experimento de
laboratorio utilizando dos grupos de ratas. El quiere
probar H0: 1 = 2, pero primero quiere asegurarse
de que las varianzas poblacionales son iguales.
Standard (2)
Experimental (1)
10
11
Media
13.64
12.42
Desviacion
estandar
2.3
5.8
Ejemplo
Ejemplo
Standard (2) Experimental (1)
Tamao de
muestra n =
10
11
Desviacion
2.3
estandar muestral
5.8
El Experimento Multinomial
Introduccion
Muchos experimentos resultan en medidas que
son cualitativas o categricas en vez de
cuantitativas.
Personas mayores de 18 clasificados segun
nivel educativo
Autos clasificados segun procedencia
Condicion de actividad (ocupado, desocupado,
no PEA)
El Experimento Binomial
+ Ok = n.
Ejemplo
Ejemplo
2
39
3
45
4
62
5
61
6
43
Oi
50
39
45
62
61
43
Ei
50
50
50
50
50
50
Notas
Tablas de Contingencia
m m m
m
m m
(tablas cruzadas)
Tabla de Contingencia f x c
Esta tabla tiene f filas y c columnasfc celdas en total.
1
O11
O12
O1c
O21
O22
O2c
Or1
Or2
Orc
Ejemplo
Los defectos de muebles se clasifican segn el tipo de
defecto y el turno en el que se fabrico.
Turno
Chi-Square Test: 1, 2, 3
Expected counts are printed below observed counts
Chi-Square contributions are printed below expected counts
1
2
3 Total
1
15
26
33
74
Chi-Sq = 19.178, DF = 6, P-Value
22.51 22.99 28.50
= 0.004
2.506 0.394 0.711
2
21
20.99
0.000
31
21.44
4.266
17
26.57
3.449
69
45
38.94
0.944
34
39.77
0.836
49
49.29
0.002
128
13
11.56
0.179
5
11.81
3.923
20
14.63
1.967
38
Total
94
96
119
309
Tipo
Total
15
26
33
74
21
31
17
69
45
34
49
128
13
20
38
Total
94
96
119
309
EJEMPLO 02:
Los trabajadores en Lima Metropolitana con
mayor nivel educativo tienen un mayor nivel de ingreso econmico?
H0: El nivel de ingreso es independiente del nivel educativo alcanzado
Ha: El nivel de ingreso depende del nivel educativo alcanzado
Una
Vacuna
Dos
vacunas
Gripe
Total
300
300
300
Total
Una
vacuna
Dos
vacunas
Gripe
r1
r2
Sin gripe
r1
Sin gripe
Total
Total
r2
300
300
300
n = 900
n = 900
Un problema de votantes
Primero calcular las frecuencias esperadas:
Distrito
1
Total
Vota por A
76
53
59
48
236
No vota por A
124
147
141
152
564
Total
200
200
200
200
800
H0: p1 = p2 = p3 = p4
Brooks/Cole
donde pi = fraccion que vota A en cadaCopyright
uno 2006
de los
distritos
A division of Thomson Learning, Inc.
1
76
59.00
4.898
2
53
59.00
0.610
3
59
59.00
0.000
4
48
59.00
2.051
Total
236
124
141.00
2.050
147
141.00
0.255
141
141.00
0.000
152
141.00
0.858
564
Otras aplicaciones
Un problema de votacion
Distrito
1
2
Vota 76/200= 53/200 =
A
0.38(a)
0.27(b)
Chi-Square Test: 1, 2, 3, 4
Chi-Sq = 10.722, DF = 3, P-Value = 0.013
Expected counts are printed below observed counts
Chi-Square contributions are printed below expected counts
4
48/200 =
0.24(b)
0
229
1
211
2
93
3
35
4
7
5
1
Total
576
0
1
0.395 0.367
228
211
!
2
0.17
98
3
4
5
0.053 0.012 0.003
31
7
2
El Diseo de un Experimento
Supuestos
Supuestos
Ejemplo 1
Definiciones
Una unidad experimental es el objeto en el que
se toma una medicion (o mediciones).
Un factor es una variable independiente cuyos
valores son controlados por el experimentador.
Un nivel es el grado de intensidad de un factor.
Un tratamiento es una combinacion especifica
de niveles de factor.
La respuesta es la variable que es medida por el
experimentador.
Tratamientos:Desayuno o no desayuno
Ejemplo 2
En un partido de futbol son muchos los factores que influyen en el
nmero de goles anotados, el entrenamiento, el entrenador, el jugador,
etc. Diseamos el siguiente experimento: Se elijen dos factores que se
pueden controlar: la distancia y ngulo de tiro al arco. Se definen 3
niveles para cada factor. Para la distancia a 4, 8 y 12 metros del arco y
ngulo de tiro: 45, 90 y 135. Se toma una muestra representativa de
jugadores. Cada jugador lanza 5 tiros y registra el nmero de goles. Para
cada posicin se utiliza 4 jugadores. Se sortean las posiciones a los
jugadores
Unidad Experimental = jugador Factor1 = Distancia
Respuesta = #Goles (0-5)
Niveles1 = 4m; 8m ;12m
Factor2 = Angulo tiro
Tratamientos:
Niveles2 = a45 ; a90; a135
T1= 4m a45; T2= 4m a90; T3= 4m a135;
T4= 8m a45; T5= 8m a90; T6= 8m a135;
Copyright 2006 Brooks/Cole
T7= 12m a45; T8= 12m a90; T9= 12m
a135
A division
of Thomson Learning, Inc.
Factor 2
Variacion aleatoria
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.
Ejemplo
En un experimento para determinar el efecto de la
nutricion en la capacidad de concentracion de
estudiantes de escuelas elementales. Doce nios fueron
divididos aleatoriamente en tres grupos y asignados a
un plan de alimentacin diferente. La respuesta fue la
capacidad de concentracin en minutos durante la
lectura de la maana.
No Desayuno
Desayuno
ligero
Desayuno
completo
8
7
9
14
16
12
10
12
16
13
17
15
a = 3 tratamientos.
los promedios de
concentracion son
diferentes?
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.
Formulas ANVA
Desayuno
ligero
Desayuno
completo
14
10
16
12
12
16
13
17
15
T1 = 37
T2 = 59
T3 = 53
Fuente de Variacin
Tratamientos
T = 149
Error
SCE
N-a
Total
SCT
N-1
CME =
Fc
Fc =
CMR
CME
SCE
N a
Fuente
Tratamientos
gl
2
SC
64.6667
CM
32.3333
Error
Total
9
11
58.25
122.9167
6.4722
Fc
5.00
La prueba F de Fisher
Rechazamos H 0 usando siempre una prueba de
cola derecha.
Cuando H 0 es verdad, F tiene distribucion
r1 = (a 1) y r2 = (N a) grados de libertad.
H 0 : 1 = 2 = 3 = ... = a
CMR
CME
Rechazar H 0 si F > F con a 1 y N-a g.l.
Prueba : F =
Metodo de Tukey
Medias
No
Desayuno
T1 = 37
Desayuno
ligero
T2 = 59
Desayuno
completo
T3 = 53
37/4 = 9.25
59/4 = 14.75
53/4 = 13.25
Ejemplo
Diseo en Bloques Completo al Azar - DBCA
Modelo
11
13
16
10
15
17
20
12
Bloque = lugar (b = 4)
Las ventas promedio son diferentes
para los tres modelos?
El Analisis de Varianza
La SCT se divide en 3 partes:
SCR (Suma de cuadrados de los tratamientos)
SCB (Suma de cuadrados de bloques)
SCE (Suma de cuadrados del Error): mide la
variacion aleatoria o error experimental
10
15
13
10
T2
N
donde T = Yij
SCT = Yij2 C
2
SCR =
SCB =
Ti
C donde : Ti = total_tratamiento i
b
B j2
C donde B j = total_bloq ue j
a
SCE = SCT - SCR - SCB
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.
Lugares
Modelo
Ti
11
13
16
10
50
Cuadrados Medios
15
17
20
12
64
CMR = SCR/(a-1)
10
15
13
10
48
CMB = SCB/(b-1)
Bj
36
45
49
32
162
Grados de libertad
Total = ab 1 = N -1
Tratamiento = a 1
b 1
Bloque =
Error = ab (a 1) (b-1) =
(a-1)(b-1)
CME = SCE/(a-1)(b-1)
Fuente
gl
SC
CM
Fc
Tratamientos
a -1
SCR
SCR/(a-1)
CMR/CME
CMB/CME
Bloques
b -1
SCB
SCB/(b-1)
Error
(b-1)(a-1)
SCE
SCE/(b-1)(a-1)
Total
N -1
SCT
versus
gl
SC
CM
Tratamientos
38
19
10.06
Bloques
61.6667
20.5556
10.88
Error
11.3333
1.8889
Total
11
111
CMR
CMB
(o F =
)
CME
CME
RchazarH0 si F > F cona - 1 (o b 1) y (b 1)(k 1) .
Prueba: F =
Metodo Tukey
Fuente
gl
SC
CM
Modelos
38
19
10.06
Lugares
(Bloques)
61.6667
20.5556
10.88
Error
11.3333
1.8889
Total
11
122.9167
Aunque no es de importancia
primordial, observe que los
bloques (locales) tambin
fueron significativamente
diferentes
(F = 10.88)
Copyright 2006 Brooks/Cole
A division of Thomson Learning, Inc.
T1 = 50
T2 = 64
T3 = 48
50/4 = 12.5
64/4 = 16
48/4 = 12
Herramientas de diagnostico
Muchos programas de computo tienen
opciones para verificar los supuestos de
poblacion normal y el supuesto de igualdad
de varianzas
A
41
31
15
B
20
11
17
C
12
9
16
D
16
14
10
Horas de sueo
Edad
Tamao
menos 6 6 a 6.9
7 a 7.9
8 a mas
Total
49 o menos
38
60
77
65
240
50 o mas
36
57
75
92
260
74
117
152
157
500
Total
A
16
19
14
13
18
Sistema
B
16
17
13
12
17
C
24
22
19
18
22
Compacto
Mediano
Grande
Analizador
Computarizado Electronico
50
42
55
44
63
46
Automvil
Frmula
25.7
27.0
27.3
26.1
27.2
28.1
27.9
27.7
26.1
27.5
26.8
27.8
C
9.9
A
10.1
B
11.4
D
12.1
D
13.4
B
12.9
A
12.2
C
12.3
B
12.7
D
12.9
C
11.4
A
11.9
A
B
C
73
54
79
83
74
95
76
71
87
68
80
una distribucin
observa es como
3
26
Causa
muerte
Polica
Cajero
Taxista Vigilante
Homicidio
Otra
82
92
107
9
70
29
59
42
Total
174
116
99
101
Total
318
172
490
Nro
Muy satisfechos
105
Moderadamente satisfechos
235
Ni satisfechos ni insatisfechos
55
Ligeramente insatisfechos
90
Muy insatisfechos
15