Beruflich Dokumente
Kultur Dokumente
10
10
11
10
11
12
n=3
0.200
0.150
0.100
0.050
17
15
13
11
0.000
17
15
13
11
17
0.250
0.000
n=2
0.000
15
0.050
13
0.050
11
0.100
0.100
0.150
0.150
0.200
0.200
n=1
0.250
Ejemplos:
Veamos algunas animaciones
http://www.ms.uky.edu/~mai/java/stat/Galto
nMachine.html
np 5 y n(1 - p) 5
IND3100 - Prof. Jorge Vera A. 2013
25
20
15
10
25
0.05
0.00
0.00
25
0.10
0.05
20
0.10
20
0.20
0.15
15
0.20
0.15
n = 25
0.25
0.25
15
25
0.35
0.30
n = 20
0.30
10
0.00
5
0.05
0.00
0.10
0.05
20
0.15
0.10
15
0.20
0.15
10
0.25
0.20
0.25
0.30
0.35
n = 15
0.35
0.30
10
n = 10
0.35
X = np = 6, 0; X = np(1 p) = 2, 448
Estamos en los rangos vlidos de la aproximacin y X
puede aproximarse por una v.a. normal, Y, con esos
parmetros.
Y 6 10 6
P
=
2, 448 2, 448
P( Z 1, 63) 0, 0516
IND3100 - Prof. Jorge Vera A. 2013
IND 3100
Magster en Ingeniera Industrial
Departamento de Ingeniera Industrial y de Sistemas
Pontificia Universidad Catlica de Chile
Un Ejemplo
NEXNet es una empresa pequea pero agresiva en el mercado
de telecomunicaciones de la costa Este de EEUU, y est
considerando moverse hacia el Norte, al rea de Boston.
Qu estudiaremos
Muestras aleatorias.
Indicadores de la muestra: media y desviacin
estndar muestral.
Distribucin de la media muestral.
Intervalos de confianza para estimar.
Diseo del tamao muestral.
Comparaciones de poblaciones sobre la base
de muestras.
Muestra Aleatoria
Poblacin: conjunto de todos los elementos de inters
Volvamos al Ejemplo
Sigamos con NEXNet
Sobre la base de las respuestas a la encuesta, podemos
preguntar, por ejemplo:
Respondent October
Number
Phone Bill
1
$95.67
2
$82.69
3
$75.27
4
$145.20
5
$155.20
6
$80.53
7
$80.81
8
$60.93
9
$86.67
10
$56.31
11
$151.27
12
$96.93
13
$65.60
14
$53.43
15
$63.03
16
$139.45
17
$58.51
18
$81.22
19
$98.14
20
$79.75
21
$72.74
22
$75.99
IND3100 - Prof.
2013
23 Jorge Vera A. $80.35
24
$49.42
Frecuencia(%)
Histograma
Histograma
Es esto la distribucin de
probabilidad del valor de la
cuenta telefnica?
10.0
8.0
4.0
0
40
60
80
100
120
140
El Problema (formal)
Discutiremos ms adelante cmo
determinar n, el tamao de la muestra.
Nuestro problema actual es:
Basado en slo n valores muestrales
X1, X2, . . . , Xn , queremos hacer
inferencias acerca de la poblacin
entera.
Ms
X=
X 1 + X 2 + ... + X n
n
Frecuencia(%)
Histograma
10.0
8.0
4.0
0
40
60
80
100
120
140
Ms
S=
(X
i =1
X )2
n 1
Volvamos al Ejemplo
NEXNet se organiza para tener 70 hogares bien encuestados
y seleccionados aleatoriamente. Encuentran que la media
muestral observada de la cuenta telefnica mensual es
$79,40, y que la desviacin estndar muestral observada es
$28,79.
Cul es su estimador de la media poblacional ?
x = $79,40
$79,40
Cul es su estimador de la desviacin estndar poblacional ?
28,79
s = $$28,79
X=
(X
S=
i =1
X )2
n 1
x=
x1 + x2 + ... + xn
n
s=
(x x )
i =1
n 1
X + X 2 + ... + X n = 1 E X + X + ... + X
( 1 2
E( X ) = E 1
n)
n
n
1
n
= ( E ( X 1 ) + ... + E ( X n ) ) =
=
n
n
En promedio, estamos estimando lo que queremos!
Tambin:
n
n
1
2
2
= 2 (n ) =
n
n
y:
SD( X ) =
L
X
L
P ( L X L) = P
/ n / n / n
L
X
L
= P
s/ n s/ n s/ n
IND3100 - Prof. Jorge Vera A. 2013
La distribucin t-student
k
k 2
X
s/ n
Distribuye aproximadamente Normal(0,1)
Esto nos permite usar la distribucin normal al calcular
probabilidades de la media muestral normalizada, pero
slo cuando la muestra es grande.
Volvamos al Ejemplo
NEXNet determina que la media muestral observada de la
cuenta telefnica mensual es $79,40, y que la desviacin
estndar muestral observada es $28,79.
X N ( , sn )
2
L
X
L
P ( L X L) = P
/ n / n / n
L
X
L
= P
s/ n s/ n s/ n
L
L
P
Z
s/ n
s/ n
Donde Z es Normal(0,1)
Volvamos al Ejemplo
Qu tan tan confiados podemos estar de que $79,40 est
dentro de +/- 1 de la verdadera media poblacional ?
L
s/ n
1
= 0, 2906
28, 79 / 70
Luego:
Ejemplo (cont.)
Hay que calcular L tal que:
L
L
Z
0,95 = P( L X L) = P
s/ n
s/ n
L
= 1,96 L = 1,96 28,79/ 70 = 6,74.
s/ n
Por lo tanto, tenemos un 95% de confianza que la media
muestral $79,40 se encuentra a lo ms a L = $6,74 dlares
de la media poblacional
Al intervalo [79,40 6,74, 79,40 + 6,74] se le llama
intervalo de confianza al 95% para la media poblacional.
Ejemplo (cont.)
Que tal si queremos estar 99% seguros?
El intervalo es ms ancho o ms angosto?
Haciendo el clculo nuevamente tenemos:
L
= 2,58 L = 2,58 28,79/ 70 = 8,86.
s/ n
Un IC al 99% para sera [79,40 8,86, 79,40 + 8,86].
s
s
c
,
x
+
c
n
n
P(c Z c) = % , Z N (0,1)
Para = 90,
Para = 95,
Para = 99,
c = 1,65
c = 1,96
c = 2,58
Comentarios
Idealmente, queremos un intervalo angosto (L pequeo)
con un alto nivel de confianza (alto ). Objetivos
contrapuestos.
Para un tamao muestral fijo (n es fijo), si queremos
afirmar algo con un nivel de confianza ms alto,
necesitamos un intervalo ms ancho (L ms grande).
trade-off entre ancho del intervalo y el nivel de confianza
Comentarios
Para un tamao muestral fijo y un nivel de confianza
fijo, podemos obtener un intervalo ms angosto, cuando
la poblacin es menos variable ( y s pequeos).
Es ms fcil inferir sobre una poblacin con baja
dispersin
Diseo Experimental
Una empresa de investigacin de mercado quiere llevar a cabo una
encuesta para estimar el monto promedio gastado por cada persona
que visita un resort popular. A esta empresa le gustara estimar el
monto promedio en un rango de +/- $120, con un nivel de confianza
de un 95%. Asumamos que la SD poblacional del gasto en el resort
es de $500.
Cul es el tamao muestral n que se requerir para esto?
500
1,96 500
120 = L = c
= 1,96
n=
67
n
n
120
c s
n=
P (c Z c) = % , Z N (0,1)
Para = 90,
Para = 95,
Para = 99,
c = 1.65
c = 1.96
c = 2.58
Comparando tratamientos
Ejemplo:
Empresa de retail quiere estimar la efectividad de una
campaa de marketing con envo de anuncios por
correo. Para esto selecciona dos grupos de 600
personas: al primer grupo se le enva la campaa y al
segundo (el control) no se le enva. Luego, se
investiga la demanda en cada grupo.
El problema: Hay diferencia significativa entre los que
se les envi la publicidad y a los que no?
Lo que habra que hacer: muestrear en cada grupo,
estimar las medias de demanda y ver si son
diferentes.
Comparando tratamientos
El primer grupo tiene una media 1 y desv. est. 1,
mientras que el segundo grupo tiene media 2 y
desv.est. 2
Supongamos se muestrean n1 personas en el primer
grupo y n2 en el segundo.
Sean x1,x2,,xn1 las observaciones de demanda para el
primer grupo.
Sean y1,y2,,yn2 las observaciones de demanda para el
segundo grupo.
Las dos medias muestrales son:
x1 =
x1 + ... + xn1
n1
y1 =
y1 + ... + yn2
n2
Comparando tratamientos
Tenemos que (por independencia):
Var ( X ) =
12
DS ( X Y ) =
n1
, Var (Y ) =
12
n1
22
n2
22
n2
Y la variable aleatoria:
( X Y ) ( 1 2 )
Z=
12 22
+
n1 n2
Es aproximadamente normal (0,1), si n1 y n2 son
grandes.
IND3100 - Prof. Jorge Vera A. 2013
Comparando tratamientos
Lo anterior permite construir un intervalo de confianza
para la diferencia de medias:
12 22
12 22
(
x
y
)
c
+
,
(
x
y
)
+
c
+
n1 n2
n1 n2
Para = 90,
Para = 95,
Para = 99,
c = 1,65
c = 1,96
c = 2,58
Comparando tratamientos
Volviendo al ejemplo:
Supongamos n1=500, n2=400.
La media muestral en el grupo 1 es $387 y en el grupo 2
es de $365. Las desv.est. son $223 y $274
respectivamente en grupo 1 y grupo 2.
La estimacin de la diferencia es 387-365=22.
La desv.est de la diferencia es:
12
22
2232 2742
+
=
+
= 16,95
n1 n2
500 400
[ 17.43 , 61.43]
Hay diferencias entre los tratamientos?
IND3100 - Prof. Jorge Vera A. 2013