Sie sind auf Seite 1von 75

Estadstica

Muestreo estadstico
Ing. Heriberto Ramrez Cario
Clase No. 31

Introduccin
Se introduce el concepto de muestreo sobre una
distribucin poblacional. Se estudian la media y
la varianza muestrales, y se obtienen sus
esperanzas y varianzas. Se presenta el teorema
central del lmite y se aplica para demostrar que
la distribucin de la media muestral es
aproximadamente normal

Introduccin
Uno de los puntos clave de la estadstica
consiste en extraer conclusiones a partir de un
conjunto de datos observados. Por lo general,
estos datos proceden de una muestra de
individuos de una poblacin, y el objetivo ser
utilizar esta muestra para sacar conclusiones
sobre la poblacin total.
Supongamos que cada miembro de una poblacin
tiene asociado un valor numrico.

Introduccin
Para que la muestra nos permita hacer
inferencias sobre determinados parmetros de
la poblacin total, ser necesario asumir ciertas
hiptesis sobre los valores de la poblacin y
sobre la relacin existente entre la muestra y la
poblacin.

Introduccin
Los datos de la muestra son variables aleatorias
independientes que tienen una misma distribucin
comn. De esta forma, si observamos los datos de la
muestra, seremos capaces de sacar conclusiones
acerca de esta distribucin poblacin subyacente.
Muestra
t(5)

Si X1,.... Xn son variables aleatorias independientes


siguiendo una misma distribucin de probabilidad, se
dice que constituyen una muestra procedente de
dicha distribucin.

Introduccin
En la mayor parte de las aplicaciones, la
distribucin poblacional no ser completamente
conocida, y se intentar utilizar la muestra para
hacer inferencias sobre ella. Por ejemplo un
productor puede estar fabricando un nuevo tipo de
bateras para carros con motores elctricos. Estas
bateras durarn un nmero aleatoria de
kilmetros, siguiendo una distribucin de
probabilidad desconocida.

Introduccin
Para averiguar cul es la distribucin de
probabilidad subyacente, el productor puede
probar en carretera un determinado conjunto de
bateras . Los datos resultantes referente a los
kilmetros recorridos con cada batera, constituirn
una muestra extrada de dicha distribucin.
Por ello es importante obtener las distribuciones de
probabilidad de ciertos estadsticos que aparecen
en el proceso de muestreo. Un estadstico es una
magnitud numrica cuyo valor viene determinado
por la muestra; por ejemplo la media y la varianza
muestral

Distribuciones de estadsticos
asociados al muestreo
Media Muestral
Consideremos una poblacin en la que cada uno
de sus elementos tiene asignado un valor. Por
ejemplo los adultos mayores de una determinada
comunidad, y el valor asignado a cada adulto
podra ser su edad, su altura, sus ingresos, etc.
Por lo general se supondr que el valor asociado a
cada miembro de la poblacin se puede considerar
como el valor de una variable aleatoria con
2

esperanza y varianza

Distribuciones de estadsticos
asociados al muestreo
Los valores de y 2 se denominarn media
poblacional
y
varianza
poblacional
respectivamente.
Sean X1, X2,..... Xn los valores de una muestra
extrada de esa poblacin. La media muestral se
define como
X 1..... X n
=
X
n

Distribuciones de estadsticos
asociados al muestreo

Puesto que el valor de la media muestral X


viene determinado por los valores de las
variables aleatorias de la muestra, se tendr que
tambin ser una variable aleatoria. Se puede
X
demostrar que su esperanza es
]=
E[X

Es decir, el valor esperado de la media muestral


es igual a la media poblacional .
X

Distribuciones de estadsticos
asociados al muestreo
Tambin se puede demostrar que la varianza de
2
la media muestral es

Var [ X ]=
n
tiene el mismo
Se ve que la media muestral X
valor esperado que cualquier valor de dato
individual, mientras que su varianza es menor
que la de un valor de dato individual, al venir
multiplicada por el factor 1/n, siendo n el
tamao de la muestra.

Distribuciones de estadsticos
asociados al muestreo
Cuando se muestrea una poblacin finita sin
reemplazo, se utiliza un factor de correccin
N n

N 1

Se le llama factor de correccin por finitud de la


poblacin.
Y la varianza de X si se muestrea sin reemplazo se
obtiene mediante,
2
X

N n
=

N 1 n
2

Distribuciones de estadsticos
asociados al muestreo
La desviacin tipica o estndar de una variable
aleatoria, que coincide con la raz cuadrada de
su varianza, es un indicador directo de la
dispersin de su distribuicin.
La desviacin tpica de la media muestral
viene dada por

)= =
SD( X
n n

Distribuciones de estadsticos
asociados al muestreo
est centrada sobre la media poblacional ,
X
pero su dispersin disminuye ms y ms a
medida que el tamao muestral aumenta

Densidades de las medias muestrales procedentes de


una poblacin normal estndar.

Distribuciones de estadsticos
asociados al muestreo
Ejemplo
Comprobemos las frmulas de la esperanza y la
varianza de la media muestral si se consideran
muestras de tamao 2 procedentes de una
poblacin cuyos valores tienen la misma
probabilidad de ser 1 o 2. Es decir, si X es el
valor de un miembro
de la poblacin, se tendr
1
P ( X =1)=
que
2
1
P ( X =2)=
2

Distribuciones de estadsticos
asociados al muestreo
La media y la varianza de la poblacin se
n
obtienen as:
1
1
=E [ X ]=1 2 =1.5
2
2

xi P {X =x }

E [ X ]=

i=1

Var ( X )= E [( X )2 ]=
2
=i ( x i ) f ( x i )

y
2

=Var ( X )=E [( X ) ]
1
2 1
2 1
=(11.5) ( )+(21.5) ( )=
2
2
4

Distribuciones de estadsticos
asociados al muestreo
Para obtener la distribucin de probabilidad de la
media muestral (X1 + X2)/2, observe que el par X1, X2
puede tomar cualquiera de los cuatro pares de
1, 1 ,1,2 ,2,1 ,2,2
valores posibles
donde, por ejemplo, el par (2,1) significa que X1=2 y
X2=1. De la independencia de X1 y X2 , se desprende
que la probabilidad de cualesquiera de los cuatro
pares de datos es 1/4. As pues, se ve que los
posibles valores de X
= X 1 X 2 /2 junto con sus
probabilidades asociadas son las siguientes:

Distribuciones de estadsticos
asociados al muestreo
1

P X =1=P [1,1]=
4

2 1

P X =1.5=P [1,2o2,1]= =
4 2
1

P X =2=P [2,2]=
4
Por consiguiente
1
1
1 6

E [ X ]=1 1.5 2 = =1.5


4
2
4 4

Distribuciones de estadsticos
asociados al muestreo
y

Var X =E [ X 1.5 ]
2 1
2 1
2 1
=11.5 1.51.5 21.5
4
2
4
1
1 1
0 =
16
16 8

Con lo cual dado que =1.5 y 2=1/ 4 queda


2
comprobado que E [ X ]= y que Var X = /2

Distribuciones de estadsticos
asociados al muestreo

Representa grficamente la distribucin de probabilidad


poblacional junto con la distribucin de probabilidad de
la media muestral de la muestra de tamao 2

Distribuciones de estadsticos
asociados al muestreo
Ejemplo 2
Considere la distribucin de una variable aleatoria
definida sobre un espacio muestral y la distribucin
de la media muestral obtenida por muestreo
aleatorio simple con reposicin para muestras de
tamao 2. Suponga una poblacin finita de cuatro
plantas de zapallos (N = 4) donde la caracterstica
de inters es el nmero de frutos por planta. Si se
toma una planta al azar y se observa el nmero de
frutos, se puede homologar el resultado de este
experimento a una variable aleatoria discreta (X).

Distribuciones de estadsticos
asociados al muestreo
Valores de la variable X en la poblacin y su funcin
de densidad.
Planta

X= No. De
frutos

f(x)

P1

1/4

P2

1/4

P3

1/4

P4

1/4

Distribuciones de estadsticos
asociados al muestreo
Para obtener el valor esperado y la varianza
se tiene:
1
1
1
1 10

E [ X ]=1 2 3 4 = =2.5
4
4
4
4
4
21
21
21
21

Var X =12.5 22.5 32.5 42.5 =1.5


4
4
4
4

Distribuciones de estadsticos
asociados al muestreo
Tomando muestras de dos plantas con reposicin,
2
hay N muestras posibles para extraer, esto es
42=16 muestras. Este es un espacio muestral finito
que tiene 16 resultados posibles, todos con igual
probabilidad. Si a cada resultado posible del
muestreo se le asocia un valor correspondiente al
promedio del nmero de frutos de las plantas
obtenidas en la muestra, se obtiene una variable
aleatoria llamada media muestral basada en
muestras de tamao n = 2.

Distribuciones de estadsticos
asociados al muestreo
Muestra

Plantas

No. de
frutos

1
2
3
4
5
6
7
8

P1P1
P1P2
P1P3
P1P4
P2P1
P2P2
P2P3
P2P4

3;3
3;2
3;1
3;4
2;3
2;2
2;1
2;4

Media Muestra
muestral

3.0
2.5
2.0
3.5
2.5
2.0
1.5
3.0

9
10
11
12
13
14
15
16

Plantas

P3P1
P3P2
P3P3
P3P4
P4P1
P4P2
P4P3
P4P4

No. de Media
frutos muestral

1;3
1;2
1;1
1;4
4;3
4;2
4;1
4;4

2.0
1.5
1.0
2.5
3.5
3.0
2.5
4.0

Espacio muestral generado por muestreo aleatorio con muestras de


tamao n=2 con reposicin, de una poblacin de 4 plantas de zapallo.

Distribuciones de estadsticos
asociados al muestreo
Media muestral
1
1.5
2
2.5
3
3.5
4

= x
PX

1.
2.
3.
4.
3.
2.
1.

1/16=
1/16=
1/16=
1/16=
1/16=
1/16=
1/16=

0.0625
0.125
0.1875
0.25
0.1875
0.125
0.0625

Valores que asume la variable aleatoria media


muestral del nmero de frutos en muestras de tamao
n=2 y sus densidades

Distribuciones de estadsticos
asociados al muestreo
Por ejemplo X =3
corresponde al evento
A={P1P1, P2P4, P4P2}, esto es
1

P X =3=P A= P P1P1P P2P4P P4P2=3


16

Distribuciones de estadsticos
asociados al muestreo
Puede observarse que el valor esperado de la
distribucin de las medias muestrales es igual al
valor esperado de la distribucin de la variable
aleatoria original (nmero de frutos)
X =2.5=
La varianza de la distribucin de las medias
muestrales es igual a la varianza de la distribucin
de la variable, dividida por el tamao muestral
usado (n=2).
1.25
2

X = =
=0.625
2
2

Distribuciones de estadsticos
asociados al muestreo
Se usa la notacin X y 2X para representar a
la esperanza y a la varianza de X ,
respectivamente.
Error estndar
La desviacin estndar de las medias de
muestras de tamao n, recibe el nombre de
error estndar y es definida como

EE= X =
=
n n

Distribuciones de estadsticos
asociados al muestreo
Para una muestra de tamao n, la esperanza de
la media muestral es igual a la media
poblacional y que la varianza de la media
muestral es igual a la varianza de la poblacin
multiplicada por el factor reductor 1/n.

Distribuciones de estadsticos
asociados al muestreo
Ejercicio 1
Un productor de tabaco mantiene que el
contenido medio de nicotina de sus cigarrillos es
de 2.4 miligramos, con una desviacin tpica de
0.2 miligramos. Si se acepta que estas cifras son
correctas, calcule el valor esperado y la varianza
del contenido medio muestral en nicotina de
a) 36 b) 64c) 100 d)900
Cigarrillo seleccionados aleatoriamente

Distribuciones de estadsticos
asociados al muestreo
Ejemplo
Un extensionista agrcola desea investigar el
nmero de veces por ao que los agricultores de
una cierta comunidad acuden a la oficina de
extensin
a
solicitar
asesora
tcnica.
Supongamos que en la localidad hay 20 000
agricultores. La variable X la definimos como el
nmero de veces que un agricultor acude a
solicitar asesora.

Distribuciones de estadsticos
asociados al muestreo
Supongamos que la distribucin terica es la
siguiente:

x
fX(x)

0
0.1

1
0.6

2
0.2

3
0.1

De acuerdo a la dicha distribucin terica de x,


determinar la media muestral y la varianza,
considerando que se toma una muestra aleatoria de
tamao 2 (n=2), es decir, se tienen variables
aleatorias X1, X2.

Distribuciones de estadsticos
asociados al muestreo

Teorema central del lmite

El teorema dentral de lmite establece que la suma


(por consiguiente, tambin la media) de un gran
nmero de variables aleatorias independientes sigue
aproximadamente una distribucin normal.
Sea

X 1,

X 2,

......

Xn

una

muestra

aleatoria

procedente de una poblacin con media y


desviacin tpica . Si n es suficientemente grande,
la suma X1 + X2 + ... + Xn
Sigue aproximadamente una distribucin normal con
media y desviacin tpica n.

Distribuciones de estadsticos
asociados al muestreo
El teorema central del lmite no nos proporciona
nicamente un mtodo para calcular la
distribucin de una suma de variables aleatorias,
sino que adems nos ayuda a explicar el hecho
observable de que las frecuencias empricas de
un gran nmero de poblaciones existentes en la
naturaleza exhiban una forma acampanada
(normal)

Distribuciones de estadsticos
asociados al muestreo
El teorema central del lmite est muy
relacionado con el concepto de distribucin
muestral, ya que la primera se refiere a la
distribucin de la media muestral. El teorma
central de lmite contesta importantes
preguntas: primera, si X es una variable
aleatoria normal, Cul es el patrn de
distribucin de la media muestral X ? Segunda, si

X
no es normal, Cul es el patron de
distribucin de la media muestral X ?

Distribuciones de estadsticos
asociados al muestreo
Cada una de las distribuciones probabilsticas
normal
y
binomial,
proporciona
tres
caractersticas importantes, 1) la media, 2) la
desviacin tpica y 3) el patrn de la
distribucin. El teorema central del lmite
proporciona informacin relativa a las tres
caractersticas de la distribucin muestral de la
media muestral.

Distribuciones de estadsticos
asociados al muestreo
Si se extraen todas las posibles muestras de igual
tamao a partir de una poblacin dada,
entonces:
]=
1. La media X es igual a la media de X E [ X
2. El error tpico de X es igual a la desviacin
tpica de la poblacin dividida entre la raz
x
cuadrada de n =

3. La distribucin muestral de la media muestral


es casi normal, independientemente del patrn
de la distribucin de la poblacin.

Distribuciones de estadsticos
asociados al muestreo
Teorema central del lmite
Si X es cualquier variable aleatoria con media y
desviacin tpica , la distribucin muestral de
la media muestral X ser aproximadamente

normal con media y desviacin tpica n sin

importar la forma de la distribucin de X,


siempre y cuando el tamao de la muestra sea
suficientemente grande.

Distribuciones de estadsticos
asociados al muestreo
Al determinar las probabilidades relativas a X, el
valor normal estndar Z se expresa de la siguiente
forma:

X
Z=
n
Esto es, la puntuacin Z se expresa como la
diferencia entre las medias muestral y de la
poblacin, en trminos del error tpico.
La
distribucin Z se aproxima a la distribucin normal
estndar cuando n se aproxima al infinito.

Distribuciones de estadsticos
asociados al muestreo
2

Dada una variable X con media X y varianza se

puede derivar de manera aproximada o exacta la


distribucin de X haciendo uso del teorema
central del lmite. Se puede calcular
< x )o P ( x1 < X
< x2 )
P( X
2

Si X N ( , )entonces para muestras de tamao


n

) (

x
X
x

P ( X < x )=P
< =P Z <
n
n
n

Donde
Z N (0,1)

Distribuciones de estadsticos
asociados al muestreo
Ejemplo 1
Suponga que las puntuaciones de prueba en
cierto
examen
estndar
se
distribuyen
normalmente con media 60 y varianza 256. se
selecciona una muestra aleatoria de 16
puntuaciones y se calcula la media muestral.
Cul es la probabilidad de que X sea mayor de
70?

Distribuciones de estadsticos
asociados al muestreo
Solucin. La probabilidad deseada es P ( X >70)
con una desviacin tpica de = 256=16 y un

tamao de muestra de n= 16,


puede
X
convertirse a una puntuacin Z empleando
7060
10

P ( X >70)=P ( Z >
)=P (Z > )=P (Z >2.5)
4
16/ 16
=1P (Z <2.5)
=10.9938=0.0062

Distribuciones de estadsticos
asociados al muestreo
Ejercicio 1
Los niveles de colesterol en la sangre de una
poblacin de trabajadores tiene una media 202 y
desviacin tpica 14.
a) si se selecciona una muestra de 36
trabajadores, aproxime la probabilidad de que la
media muestral de sus niveles de colesterol est
comprendida entre 198 y 206.
b) repita el apartado para un tamao muestral
de 64.

Distribuciones de estadsticos
asociados al muestreo
Ejercicio 2
Sea X la variable correspondiente a los salarios
semanales obtenidos por cualquier vendedor. El
patrn de distribucin de los salarios se
desconoce pero se sospecha que no es normal.
Se selecciona aleatoriamente una muestra de 36
vendedores y se determinan sus salarios
mensuales. Suponga que los salarios mensuales
de los vendedores tiene una media de la
2

poblacin = $300 y una varianza = 14 400.

Distribuciones de estadsticos
asociados al muestreo
Cual es la probabilidad de que la media
muestral X sea menor de $270?

Distribuciones de estadsticos
asociados al muestreo
Muestreo de proporciones en poblaciones
finitas
Consideremos una poblacin de tamao N en la
que determinados elementos presentan cierta
caracterstica de inters. Denotemos por p a la
proorcin de individuos de la poblacin que
muestran la caracterstica. As pues Np
elementos de la poblacin presentan la
caracterstica y N(1-p) elementos no la
presentan.

Distribuciones de estadsticos
asociados al muestreo
Por ejemplo supongamos que 60 de un total de
900 alumnos de una determinada escuela, son
zurdos. Si el zurdo es la caracterstica de
inters, N=900 y p =1/15.

Distribuciones de estadsticos
asociados al muestreo
Una muestra de tamao n se dice que es una
muestra aleatoria si se selecciona de forma que
todos los posibles subcojuntos de la poblacin de
tamao n tengan la misma probabilidad de ser la
muestra. Por ejemplo, si la poblacin consta de
tres elementos a,b,c, una muestra aleatoria de
tamao 2 es aquella en la que cualquier
subconjunto {a,b}, {a,c} y {b,c} tiene la misma
probabilidad de ser seleccionados.

Distribuciones de estadsticos
asociados al muestreo
Definicin. Una muestra de tamao n, estrada
de una poblacin de N elementos, se dice que es
una muestra aleatoria si se selecciona de tal
forma que cualquier subconjunto de n elementos
de la poblacin tiene la misma probabilidad de
coincidir con la muestra.
Supongamos que se ha seleccionado una muestra
aleatoria de tamao n. Para i=1,.....,n. Se
1 si el isimo elemento de la
define:
X i=
muestra presenta la caracterstica
0 en otro caso

Distribuciones de estadsticos
asociados al muestreo
Consideremos la suma de las Xi; esto es,

X = X i + X 2 +.....+ X n
Puesto que el trmino Xi contribuye a la suma con 1
unidad si el i-simo miembro de la muestra presenta
la caracterstica y contribuye con 0 en otro caso, se
tiene que la suma anterior es igual al nmero de
elementos muestrales que poseen la caracterstica.
Por ejemplo, supongamos que n= 3, X1 = 1, X2 = 0 y X3
= 1. En este caso, los miembros 1 y 3 de la muestra,
poseen la caracterstica, mientras que el miembro 2
no la presenta.

Distribuciones de estadsticos
asociados al muestreo
As pues, 2 de los miembros muestrales
presentan la caracterstica, tal como se indica
en la suma X1 + X2 + X3 = 2. La media muestral
n

Xi

X
i=1

X= =
n
n

ser igual a la proporcin de elementos


muestrales que presentan la caracterstica.

Distribuciones de estadsticos
asociados al muestreo
Dado que los N elementos de la poblacin tienen la
misma probabilidad de ser el i-simo miembro de la
muestra y que existen Np individuos de la poblacin
que presentan la caracterstica, se tiene que
Adems,

Np
P X i =1= = p
N
P X i =0=1P X i =1=1 p

cada Xi puede tomar los valores 1 o 0 con unas


probabilidades respectivas p y 1-p.

Distribuciones de estadsticos
asociados al muestreo
Las

variables

aleatorias

X1,......Xn,

no

son

independientes. Por ejemplo, si se tiene en cuenta


que el segundo miembro de la muestra puede ser
uno cualquiera de la poblacin, todos con la misma
probabilidad, y que existen Np elementos
poblacionales que presentan la caracterstica, se
tiene que la probabilidad de que el segundo
elemento muestral presente la caracaterstica es
Np/N = p. Esto es, sin saber nada sobre el resultado
de la primera seleccin muestral, se tiene que
P X 2=1= p

Distribuciones de estadsticos
asociados al muestreo
Por el contrario, la posibilidad de que X2= 1
condicionada a que el primer elemento muestral
presente la caracterstica es
Np1
P X 2=1 X i =1=
N 1
sin ms que tener en cuenta que, si el primer
elemento de la muestra presenta la caracterstica,
cualquiera de los N-1 elementos restantes de la
poblacin puede, con la misma probabilidad, ser el
segundo miembro de la muestra, y Np-1 de stos
tienen la caracterstica.

Distribuciones de estadsticos
asociados al muestreo
De igual manera, la probabilidad de que el
segundo elemento de la muestra presente la
caracterstica, dado que el primero no la
presente, es
Np
P X 2=1 X i =0=
N 1

En consecuencia, conocer que el primer


elemento muestral presenta la caracterstica
modifica las probabilidades de seleccin del
segundo elemento.

Distribuciones de estadsticos
asociados al muestreo
Pese a ello si el tamao de la poblacin N es
grande en relacin con el tamao muestral n, la
modificacin resulta ser irrelevante. Por
ejemplo si N=1000 y p = 0.4, se tiene
399
P X 2=1 X i =1=
=0.3994
999

que es un valor muy cercano a la probabilidad


incondicional de que X2=1, dada por
P X 2=1=0.4

Distribuciones de estadsticos
asociados al muestreo
De la misma manera, la probabilidad del que el
segundo elemento de la muestra presente la
caracterstica, supuesto que el primero no la
presente, viene dada por
400
P X 2=1 X i =0=
=0.4004
999
que tambin es muy prximo a 0.4
Se puede demostrar que, cuando el tamao de la
poblacin N es grande con respecto al tamao
muestral n, X1,... Xn son aproximadamente
independientes.

Distribuciones de estadsticos
asociados al muestreo
En resumen, si X denota el nmero de elementos
de la muestra que presenta la caracterstica, se
desprende de lo anterior que si el tamao
poblacional es grande en relacin con el tamao
muestral,
la
distribucin
de
X
sigue
aproximadamente una binomial de parmetros n
yp

Distribuciones de estadsticos
asociados al muestreo
Con los valores de la media y la desviacin tpica de
las variables aleatorias binomiales obtenidas, se ve
que
E [ X ]=np y SD X = np1 p
Dado que X , la proporcin de elementos muestrales
que presentan la caracterstica es igual a X/n se ve
que
E[X ]
]=
E[X
=p
n
=
SD X

SD X
p1 p
=
n
n

Distribuciones de estadsticos
asociados al muestreo

Ejemplo

Supongamos que el 50% de los elementos de una


poblacin piensa votar al candidato A en unas
prximas elecciones. Si se extrae una muestra de
tamao 100. La proporcin de miembros de a
muestra que se declara a favor de dicho candidato
tendr una media E [ X
]=0.50
y una deviacin tpica

0.5010.50
=
SD X
=0.05
100

Distribuciones de estadsticos
asociados al muestreo
Probabilidades asociadas a las proporciones
muestrales: la aproximacin normal a la
distribucin binomial.
Denotemos como X a la proporcin de elementos
de una muestra aleatoria de tamao n que
presentan una determinada caracterstica. Para
obtener las probabilidades asociadas a la
variable se har uso del hecho de que X =n X
sigue una binomial de parmetros n y p.

Distribuciones de estadsticos
asociados al muestreo
Ahora bien, las probabilidades de las binomiales
se pueden calcular mediante el teorema central
del lmite.
Denotemos
por X a una variable aleatoria
binomial de parmetros n y p. Dado que X se
puede identificar con el nmero de xitos
obtenidos en n pruebas independientes con
probabilidad p de xito, se puede escribir
X = X 1 X 2.... X n

Distribuciones de estadsticos
asociados al muestreo
Donde
X 1=

1 si en la prueba i resulta xito


0 si en la prueba i resulta un fracaso

sabemos que E [ X i ]= p

y Var X i = p1 p

Se ve que X/n puede ser considerada como la


media muestral de una muestra de tamao n
procedente de una poblacin con media p y
desviacin tpica p1 p

Distribuciones de estadsticos
asociados al muestreo
Se desprende del teorema central del lmite que,
para valores grandes de n
X / n p
X np
=
p1 p/n np1 p

Seguir aproximadamente una distribucin normal


estndar. Desde el punto de vista prctico, la
aproximacin normal a la binomial es bastante
buena siempre que n sea lo suficientemente grande
como para que tanto np como (n(1-p) sean mayores
que 5.

Distribuciones de estadsticos
asociados al muestreo
Ejemplo 2
Supongamos que exactamente un 46% de la
poblacin est a favor de un determinado
candidato. Si se extrae una muestra aleatoria de
tamao 200. Cul es la probabilidad de que al
menos 100 de ellos estn a favor del candidato?
Solucin. Si X es el nmero de elementos
muestrales a favor del candidato, X ser una
variable aleatoria binomial con parmetros n=
200 y p= 0.46

Distribuciones de estadsticos
asociados al muestreo
La probabilidad pedida es P X 100 Para utilizar la
aproximacin normal, puesto que la binomial es
discreta mientras que la normal es una variable
continua, es mejor computar P(X=i) como
P i0.5 X i0.5 cuando se aplica la aproximacin
normal (esto se denomina correccin por
continuidad). Para obtener P X 100 se debera
utilizar la aproximacin normal sobre la
probabilidad equivalente P X 99.5 Si se considera
la variable estandarizada

Distribuciones de estadsticos
asociados al muestreo
X 20046
X 92
=
2000.460.54 7.048

Se obtiene la siguiente aproximacin normal a la


probabilidad pedida
P X 100=P X 99.5

X 92 99.592
=P

7.0484
7.0484

P Z 1.0641=0.144 con base a tablas

Distribuciones de estadsticos
asociados al muestreo
Ejercicio
Supongamos que el 60% de los residentes de una
ciudad estn a favor de un cambio en el sistema
de educacin secundaria. Calcular la media y la
desviacin tpica de la proporcin de elementos
de una muestra de tamao n que estar a favor
del cambio, cuando:
a) n= 10
d) n= 10 000

b) n= 100

c) n= 1000

Distribuciones de estadsticos
asociados al muestreo
Ejercicio
La tabla muestra la lista de reas de estudio y los
porcentajes de alumnos que eligen cada una de ellas en
una determinada universidad. Suponga que se
selecciona una muestra aleatoria de 200 alumnos.
a) Cual es la probabilidad de que 22 o ms estudiantes
de la muestra estudien Artes y Humanidades?
b) Cual es la probabilidad de que 60 o ms estudien
Economa?
c) Cual es la probabilidad de que menos de 15 los
estudiantes de la muestra estudien Ingeniera?

Distribuciones de estadsticos
asociados al muestreo
Distribucin de la varianza muestral en una
poblacin normal.
Antes de determinar la distribucin de la
varianza muestral cuando se muestra sobre una
poblacin normal es necesario introducir la
distribucin chi-cuadrado, que se define como la
distribucin de la suma de los cuadrados de
varias variables aleatorias normales estndar e
independientes.

Distribuciones de estadsticos
asociados al muestreo
Si Z1,..... Zn son variables aleatorias normales
estndar e independientes, la variable aleatoria
n

2
Z
i
i=1

se dice que es una variable aleatoria chicuadrado con n grados de libertad.


Para obtener la esperanza de una variable
aleatoria chi-cuadrado, observe que, para una
variable aleatoria, Z, normal estndar

Distribuciones de estadsticos
asociados al muestreo
1=Var (Z )
2
2
=E [ Z ]( E [ Z ])
2
=E [Z ]
puesto que E [Z ]=0

De aqu se desprende que


consecuencia

[ ]
n

E [Z ]=1

y, en

2
i

Z =

i=1

i=1

2
i

E [ Z ]=n

El valor esperado de una variable aleatoria chicuadrado es igual a su nmero de grados de


libertad

Distribuciones de estadsticos
asociados al muestreo
Supongamos ahora que se tiene una muestra
X1,...Xn procedente de una poblacin normal con
media y varianza 2. Consideremos la varianza
muestral S 2 definida por
n

(
X

X
)
i

S 2= i=1

n1

Distribuciones de estadsticos
asociados al muestreo
Se puede demostrar el siguiente teorema
n

( X i X )

(n1)S
i=1
=
2

sigue una distribucin chi-cuadrado con n-1


grados de libertad

Das könnte Ihnen auch gefallen