Sie sind auf Seite 1von 37

Unidad III

Muestras Aleatorias
Distribucin de Muestreo

Muestreo
En muchas oportunidades uno desea conocer determinadas
caractersticas de la poblacin y en muchos casos resulta
imposible o poco prctico estudiarla en su totalidad. Por
diversos motivos:
Econmicos de la experimentacin.
De tiempo.
Por desconocer su tamao.
El hecho de que muchos de los mtodos de medida son
destructivos.
Por no disponer de tecnologa suficiente para acceder a ciertas
poblaciones.

Por ello, es necesario utilizar una muestra de observaciones


tomadas de la poblacin de inters con objeto de obtener
conclusiones sobre ella.

Muestreo
Ejemplo
Si se intenta determinar la duracin promedio de una cierta marca de
focos sera imposible probarlos todos si no se quiere dejar de vender
ninguno y adems, requerira mucho tiempo.
Si un bilogo desea evaluar algunas caractersticas de una determinada

especie de pez del mar Argentino resultara imposible medir a toda la


poblacin, no slo por una cuestin econmica, sino tambin, por que
difcilmente se conozca el tamao de la poblacin, se posean los medios
suficientes para lograr acceder a toda la poblacin, etc.

Inferencia estadstica
La Inferencia Estadstica es aquella rama de la Estadstica
mediante la cual se trata de sacar conclusiones de una poblacin
en estudio, a partir de la informacin que proporciona una muestra
representativa de la misma.

Con frecuencia se est tentado a elegir una muestra seleccionando a los


miembros ms convenientes de la poblacin. Tal procedimiento puede conducir
a inferencias errneas respecto de la misma, es decir, inferencias que
sobreestiman o subestiman alguna caracterstica de la poblacin, en este
caso el procedimiento se dice que esta sesgado.

Para eliminar cualquier posibilidad de sesgo la muestra a seleccionar


debe ser:
Aleatoria: las observaciones se seleccionen al azar,
Las observaciones independientes entre si.
Representativa de la poblacin: en el sentido de que debe tener una
composicin similar en cuanto la proporcin de distintas caractersticas de la
poblacin. Nunca se podr estar totalmente seguro de que el resultado sea una
muestra representativa, pero s se puede actuar de manera que esta condicin se
alcance con una probabilidad alta. Esta garantizada la representatividad con la
eleccin correcta del mtodo de muestreo.

Por ejemplo, una muestra para un estudio de estaturas no incluir


solamente individuos bajos o solamente altos, sino individuos de ambas
clases en proporciones similares a las de la poblacin.

Tipos de muestreo
Muestreo aleatorio simple:

En una muestra aleatoria simple de tamao n,


cada elemento de la poblacin tiene la misma
probabilidad de ser elegido para formar parte de la
Misma y cada muestra del mismo tamao tiene la
misma probabilidad de ser seleccionada.
El procedimiento empleado es el siguiente:
1) se asigna un nmero a cada individuo de la poblacin

2) a travs de algn medio mecnico (bolillero, tablas de nmeros aleatorios,


nmeros aleatorios generados con una calculadora o una computadora, etc.) se
eligen tantos sujetos como sea necesario para completar el tamao de muestra
requerido.

3) Los elementos de la muestra se eligen en forma independiente unos de otros.


Este procedimiento, atractivo por su simpleza, por la representatividad de la
muestra obtenida y produce estimadores de los parmetros desconocidos
prximos a los valores reales de los mismos. Sin embargo, no tiene utilidad
prctica cuando la poblacin que estamos manejando es muy grande.

Tipos de muestreo
Muestreo Estratificado: Se divide la poblacin en grupos homogneos
(estratos) de acuerdo con las caractersticas a
estudiar. Por ejemplo, en un estudio de las
caractersticas socioeconmicas de una
ciudad los estratos pueden ser los barrios de
la misma, ya que los barrios suelen presentar
caractersticas diferenciales.
Se selecciona una muestra aleatoria de cada estrato tratando de que todos los
estratos de la poblacin queden representados.
Diferentes opciones de seleccin del tamao de la muestra en los estratos:
- El mismo nmero en cada estrato.
- Proporcional. (La ms comn)
- Optima.

Las estimaciones de la poblacin, basadas en la muestra estratificada,


usualmente tienen mayor precisin (o menor error muestral) que si la
poblacin entera se muestreara mediante muestreo aleatorio simple.

Tipos de muestreo
Muestreo Sistemtico:
El procedimiento empleado es el siguiente:
1)
2)
3)

Numerar todos los elementos de la poblacin.


Se parte de un nmero aleatorio i, que es un nmero elegido al azar entre 1 y
k, siendo k = N/n, el resultado de dividir el tamao de la poblacin entre el
tamao de la muestra.
Los elementos que integran la muestra son los que ocupa los lugares i, i+k,
i+2k, i+3k, ... , i+(n-1)k, es decir, se toman los individuos de k en k.

Este muestreo es ms sencillo y ms barato que el muestreo aleatorio


simple. El riesgo este tipo de muestreo est en los casos en que se dan
periodicidades en la poblacin ya que al elegir a los miembros de la
muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la poblacin. Por ejemplo,
Si seleccionamos una muestra sobre listas de 10 individuos en los que los 5
primeros son varones y los 5 ltimos mujeres, si empleamos un muestreo aleatorio
sistemtico con k=10 siempre seleccionaramos o slo hombres o slo mujeres, no
podra haber una representacin de los dos sexos.

Este tipo de muestreo puede utilizarse, por ejemplo, en encuestas


telefnicas programadas mediante computadora.

Poblaciones finitas
El muestreo aleatorio simple se realiza con reemplazo, es decir: Se
selecciona un elemento de la poblacin al azar, se observa el valor de la
variable aleatoria X, se devuelve a la poblacin y se vuelve a seleccionar
otro elemento. As hasta obtener los n elementos. Este procedimiento
garantiza la independencia de las observaciones.

Poblaciones infinitas
El muestreo aleatorio simple se realiza sin reemplazo, es decir: Se
selecciona un elemento de la poblacin al azar, se observa el valor de la
variable aleatoria X, no se devuelve a la poblacin y se vuelve a
seleccionar otro elemento. As hasta obtener los n elementos. En este
caso, la independencia de las observaciones est garantizada por la
dimensin de la poblacin.

Trabajaremos:
con poblaciones infinitas, es decir, tamaos
desconocidos.

con muestreo aleatorio simple, que garantiza una


muestra representativa de la poblacin y la obtencin
de observaciones independientes.

Las observaciones de una muestra se obtienen al observar la


caracterstica medible X de manera independiente bajo las mismas
condiciones, n veces. La muestra se denota:

X1, X2, . . . , Xn.


donde

Xi la v.a. que representa la i-sima observacin de la v.a. X,


Los valores numricos obtenidos son x1, x2, . . ., xn de una muestra
particular .

Definicin
Las v.a. X1, X2, . . ., Xn constituyen una muestra aleatoria
de tamao n de la v.a. X, si:

las Xi son v.a. independientes.


Todas las Xi tienen la misma distribucin de probabilidad
que la v.a. X.

El propsito principal de una muestra aleatoria es obtener


informacin sobre los parmetros no conocidos de la poblacin.

Ejemplos
1. Supongamos que deseamos conocer el gasto promedio semanal en fotocopias
de un alumno de la UNS. Resulta poco prctico interrogar a cada uno de los
alumnos de la universidad para determinar el valor de . Para hacer una
inferencia con respecto al verdadero gasto promedio semanal por alumno, , un
procedimiento ms razonable consiste en seleccionar una muestra aleatoria de
un tamao apropiado y utilizar la media de las observaciones obtenidas, es decir,
X X2 Xn
X 1
n

La media muestral es una funcin de los valores


observados en la muestra aleatoria. Por lo tanto
es una v.a.

Sea X = gasto semanal en fotocopias de un alumno de la UNS (en pesos), y f(x)


su funcin de densidad de probabilidad.

Muestra 1:

x1= 50$

x2= 56$

x3= 23,1

x4 = 80$

y x5 = 33,24$

El gasto promedio semanal de un alumno de la UNS, entonces: x 50,26$


Los valores obtenidos de otra muestra particular seran:
Muestra 2: x1= 34$

x2= 29,4$

x3= 30,7$

x4 = 28,8$

y x5 = 31,1$

El gasto promedio semanal de un alumno de la UTN, entonces:

x 30,8$

2. Si deseamos conocer la variabilidad del gasto semanal en fotocopias de un


alumno de la UNS. Resulta poco prctico interrogar a cada uno de los alumnos
de la universidad para determinar el valor de 2. Para hacer una inferencia con
respecto a la verdadera varianza del gasto semanal por alumno, 2, un
procedimiento ms razonable consiste en seleccionar una muestra aleatoria de
un tamao apropiado y utilizar la varianza de las observaciones obtenidas, es
decir,
n
S2

(X
i 1

X)2

n 1

La varianza muestral es una funcin de los


valores observados en la muestra aleatoria. Por
lo tanto es una v.a.

Sea X = gasto semanal en fotocopias de un alumno de la UNS (en pesos)


Muestra 1:

x1= 50$

x2= 56$

x3= 23,1

x4 = 80$

y x5 = 33,24$

La varianza del gasto semanal de un alumno de la UNS, entonces:


s2 = 532,63$2
Los valores obtenidos de otra muestra particular seran:
Muestra 2: x1= 34$

x2= 29,4$

x3= 30,7$

x4 = 28,8$

y x5 = 31,1$

La varianza del gasto semanal de un alumno de la UNS, entonces:


s2 = 4,0804$2

Estadstico
Definicin:
Cualquier funcin de las variables aleatorias que
componen una muestra aleatoria se llama estadstico.

f ( X 1 ,, X n )
donde , X1, X2, . . ., Xn constituyen una muestra aleatoria de tamao n

Observacin Importante!!!!
Un estadstico es una v.a. por ser funcin de variables
aleatorias. Es decir, los valores de un estadstico varan de
muestra a muestra.

Ejemplos de estadsticos Importantes:


1. Si X1, X2, ..., Xn representa una muestra aleatoria de tamao n de una v.a.
X se define media muestral, y se denota: X
X

X1 X 2 X n
n

2. Si X1, X2, ..., Xn representa una muestra aleatoria de tamao n de una


v.a. X, se define varianza muestral y se denota: S2, al estadstico:
n

S2

(X

X) 2

i 1

n 1

Ejemplo:
Considrese la v.a.: X = gasto semanal de un alumno de la UNS en fotocopias
Muestra
I
II

Gasto Medio
Muestral

Varianza
muestral

x 50,26$

s2 = 532,63$2

s2 = 4,0804$2

x 30,8$

Distribucin de muestreo
Puesto que un estadstico es una v.a. tiene una
distribucin de probabilidad, que se conoce como
distribucin de muestreo.
La distribucin de muestreo de un estadstico depende:
de la distribucin de probabilidad de la v.a. X ( de la poblacin),

del tamao de la muestra ,y


del Tipo de Muestreo utilizado para seleccionar la muestra.

En la mayor parte de los casos supondremos que


nuestra poblacin, X, tiene distribucin Normal. El
muestreo siempre ser considerado aleatorio simple.

Distribucin de muestreo
Estadstico: Media muestral
Sea X1, X2, ..., Xn una muestra aleatoria de una v.a. X con media finita
y varianza finita 2. Por lo tanto, las n variables aleatorias son
independientes y poseen la misma distribucin que la v.a. X, es decir,
E(Xi) = y V(Xi) = 2
X

X1 X 2 X n
n

El valor esperado y la varianza del estadstico media muestral, X son


X ... X n
1
1

E(X
E( X) E 1
E
X
...
X

1
n
n
n
n

1 ) ... E(X

1
1
X ... X n
V( X) V 1
V( X 1 ... X n ) 2 V(X
n
n
n

)
n

n
n

1
2
2
1 ) ... V(X n ) 2 n
n
n

Distribucin de muestreo

E( X )

2
V( X )
n

Importante!!!! Este resultado es vlido sin importar la


distribucin de probabilidad de la v.a. X de inters,
siempre que la varianza tenga un valor finito.
De la definicin de V (X) se deduce que el desvo estndar es

V( X)

n
n
Recibe el nombre de error estndar de la media.
Conforme el tamao de la muestra crece, el desvo estndar, y
por lo tanto la varianza, de X decrece.

Distribucin de muestreo

Proposicin
Sea X1, X2, ..., Xn una muestra aleatoria de la v.a. X,
que consiste en n variables aleatorias independientes
normalmente distribuidas, con E(Xi) = y V(Xi) = 2
finita, i = 1,2, ..., n. Entonces la distribucin de la
media muestral, X es Normal con media y varianza
2/n.

En resumen:

Si X N( , 2 )

entonces

X N( , 2 /n ).

Distribucin de la poblacin, X

Distribucin de la media muestral, n = 4

/2

Ejemplo
La Cmara de Comercio de Buenos Aires ha registrado de aos
anteriores que la cantidad promedio de dinero que gasta la
gente que asiste a convenciones en comidas, alojamiento y
entretenimiento por da es de 189 pesos, con un desvo de 25
pesos. Suponiendo que la cantidad de dinero gastada en un da
es una v.a. distribuida normalmente, si de las distintas
convenciones que se llevan a cabo en la ciudad, se
seleccionaron 16 personas al azar, cul es la probabilidad de
que el gasto promedio sea:
a) menor que 174 pesos?
b) entre 180 y 192 pesos?
c) Supere los 200 pesos?

Distribucin de muestreo
a) menor que 174 pesos?
Sea X = cantidad de dinero gastada en un da en comidas, alojamiento y
entretenimiento por persona . La v.a., X N( = 189, 2 = 252).

X = cantidad de dinero promedio gastado en un da en comidas,


alojamiento y entretenimiento por 16 personas seleccionadas al azar.

Por la proposicin anterior,


como X N ( = 189, 2 = 252) entonces

X N ( = 189, 2 = 252/16)

X - 189 174 189


) P( Z 2.4) 0.0082
P( X 174) P(

25
25
16
16
En el 0.82% de las muestras de tamao 16 el dinero promedio gastado por
da en comidas, alojamiento y entretenimiento es inferior a 174$.

b) entre 180 y 192 pesos?

180 189 X 189 192 189


P(180 X 192) P(

)
25
25
25 / 16
16
16
P(1.44 Z 0.48) 0.6879 0.0749 0.613
En el 61.3% de las muestras de tamao 16 el dinero promedio gastado por
da en comidas, alojamiento y entretenimiento oscila entre 180$ y 192$.
c) Supere los 200 pesos?

P( X 200) P(

X 189
25 / 16

200 189
) P( Z 1,76) 1 0.9608 0.0392
25
16

En el 3.92% de las muestras de tamao 16 el dinero promedio gastado por


da en comidas, alojamiento y entretenimiento supere los 200$.

2. La temperatura, X, en cierta regin sigue una distribucin normal


con media 20 C y desvo 4 C. Si se eligen al azar n das.
a) Determinar la distribucin con sus parmetros de la temperatura media
muestral, si
i) n = 4

ii) n = 20

iii) n = 500

b) Para n = 4, cul es la probabilidad de que la temperatura media


muestral, no exceda los 18.6 C?
3. En un servicio de atencin al cliente, el tiempo de espera hasta recibir
atencin es una v.a. normal de media 10 minutos y desviacin tpica 2
minutos. Se toman muestras aleatorias del tiempo de espera de los clientes
que llegan un da concreto. Se pide:
a) Cul es la probabilidad de que el tiempo medio de espera de una
muestra de 25 clientes no supere los 9 minutos?
b) Cul es la distribucin de la media muestral, si se toman muestras
aleatorias de 64 clientes? Especificar sus parmetros.

4. La duracin de las bateras de un determinado modelo de telfono

mvil tiene una distribucin normal de media 34,5 horas y desviacin


estndar 6,9 horas. Se toma una muestra aleatoria simple de 36
telfonos mviles.
a) Cul es la probabilidad de que la duracin media de las bateras de la
muestra est comprendida entre 32 y 33,5 horas.
b) Y de que sea mayor de 38 horas?

5. Una fbrica de autos lanza al mercado el modelo Mathe del que se

sabe que su peso medio es de 3100 kilos con una desviacin de 130 kilos.

b) Qu distribucin seguir su peso medio de las muestras aleatorias de


100 autos Mathe?
c) Cul ser la probabilidad de que al comprar 100 coches el peso
promedio de ellos sea de ms de 2900 kilos y menos de 3500?

Distribucin de muestreo
Si se muestrea una poblacin que tiene una distribucin de probabilidad
desconocida la distribucin de la media muestral seguir siendo
aproximadamente normal, con media y varianza 2/n, si el tamao de la
muestra, n, es grande. Este es uno de los teoremas ms tiles en
estadstica, se le conoce como Teorema Central del Lmite, y se enuncia
de la siguiente manera:

Teorema Central del Lmite


Si X1, X2, . . ., Xn es una muestra aleatoria de tamao n de una v.a. X, con
media y varianza finita 2, y si X es la media muestral, entonces
Z

cuando n , Z N(0,1).

X -

2 /n

La esencia de Teorema Central del Lmite recae en que para n grande, la

distribucin de X es, aproximadamente normal con media y varianza 2


/n, sin importar cual sea el modelo de probabilidad a partir del cual se obtuvo
la muestra.

30

Ejemplo
Un contratista piensa comprar una gran cantidad de lmparas de alta
intensidad a cierto fabricante. ste asegura al contratista que la duracin
promedio de la lmparas es de 1000 hs. con un desvo estndar igual a 80hs.
El contratista decide comprar las lmparas slo si una muestra aleatoria de 64
de stas da como resultado una vida til promedio de por lo menos 1010 hs.
Cul es la probabilidad de que el contratista adquiera las lmparas?
Sea la v.a. X = vida til de una lmpara, con media = 1000 hs. y varianza
2 = 802 hs2.
X

=vida til promedio de las 64 lmparas seleccionadas al azar.

Por el Teorema Central del Lmite: Z

X - 1000
N(0,1).
80
64

La probabilidad de que el contratista adquiera las lmparas equivale a


calcular:
P(X 1010) P(Z

1010 1000
) P(Z 1) 1 P(Z 1) 1 0.8413 0.1587.
80
64

Estadstico: Varianza muestral


n

S
2

(X

X) 2

i 1

n 1

Como es una v.a. es natural preguntarse:

1. Cul es su valor esperado? E S 2 2


2. Cul ser su distribucin?
Sea X1, X2, ..., Xn una muestra aleatoria de tamao n de la v.a. X N(, 2),
entonces la v.a.

n 1 S 2
2

es una v.a. Chicuadrado con = n - 1 grados de libertad.

Esta distribucin interviene de manera especial al hacer inferencias respecto a


la varianza de una distribucin.

Distribuciones Continuas usadas en Inferencia Estadstica

Distribucin Chi- cuadrado


La v.a. X se dice que tiene una distribucin chi-cuadrado de parmetro , y
se denota X ~ 2, si su funcin de densidad de probabilidad est dada por:
1 -x
1

2
2
x
e
si x 0

f(x) 2 2 ( )
2

en el resto
0

Caractersticas de la funcin de densidad:


Esta caracterizada por un slo parmetro , que recibe el nombre de grados de
libertad.
Definida slo para valores positivos y cero de la va X.
Es una curva asimtrica a derecha.
Conforme la distribucin Chi-cuadrado se aproxima a la distribucin Normal.

Ejemplo

Variables chi-cuadrado con valores de


progresivamente crecientes.

2
La tabla proporciona probabilidades de la forma:

P(2 12 , ) 1 - , 0 1.
Las probabilidades de la forma que no tienen la forma :

P(2 12 , )
se obtienen con el empleo de las reglas bsicas de probabilidad.

Manejo de tabla
I)

Hallar:

(a) P (230 < 18.49)

(b) P (280 96.58) (c) P (23 > 9.35)

II) Para la distribucin Ji Cuadrado hallar el valor de 2, 1- de tal


forma que:
(a) P (26 < 26, 1 - ) = 0.95
(b)

P (221 > 2 21, 1- ) = 0.01

(c)

P (210, < 210 < 23.21) = 0.95.

Ejemplo:
La autoridad sanitaria de un pas decide llevar a cabo una investigacin
sobre los residuos que producen las empresas de un determinado
sector. Seleccionada una muestra aleatoria simple de 9 empresas y
suponiendo que los residuos se distribuyen normalmente con media 23
Tm y desviacin estndar de 6 Tm., calcular la probabilidad de que la
varianza de la cantidad de residuos que producen las empresas
muestreadas sea superior a 60,12Tm2.
X = cantidad de residuos que produce una empresa , X N(= 23, 2 = 62), se
tom una muestra aleatoria de 9 empresas

n 1 S 2

P(S2 > 60,12) = ???

P( S 60.12) P(
2

1 P( 8

82 62

n1

60.12) P( 8

9 1
13.36) 1 0.90 0.1

60,12 8
2

) P( 8 13.36)
36

Distribucin t de Student
Sea X una v.a. Normal con media y varianza 2. Si se toma
una muestra de tamao n de la va. X , X1 X2, Xn , la v.a. media
muestral X tiene distribucin Normal, ie, X N(, 2/n), y
Z

X -

2 /n

Si la varianza 2 es desconocida qu sucede con la


distribucin del estadstico si se reemplaza por S??

Sea X1 , . . ., Xn una muestra aleatoria de tamao n de una v.a. X ~ N , 2


2

es desconocida entonces, la variable

X
T
S

tn 1

n
tiene una distribucin t de student con n -1 grados de libertad.

Distribucin t de Student
Si la v.a. T tiene una distribucin t de Student de parmetro , se denota
T t y una funcin de densidad est dada por:
( ( 1) )
1
2
f(t)
1
1
2
2
2

( ) t
( )
2 1

si t .

Caractersticas de la funcin de densidad


Esta caracterizada por un slo parmetro , que recibe el nombre de grados
de libertad.
Es simtrica respecto del eje de ordenadas (recta T = 0).
El valor mximo de la funcin se alcanza en = 0.
Est definida para toda la recta real.
Conforme aumenta el valor de la distribucin se aproxima a la distribucin
normal estndar.
Es ms dispersa que la normal

Distribucin t de Student

La tabla proporciona probabilidades de la forma

P (t t , )

, 0 1.

Las probabilidades que no tienen la forma

P (t t , )
se obtienen con el empleo de las reglas bsicas de probabilidad y de la
simetra de la distribucin t de Student.

Manejo de la Tabla t - student


I) Hallar:

(a) P (t30 > 2.042)

(b) P (t23 3.485) (c) P (t60 < 1.671)

II) Para la distribucin t-student hallar el valor de t, 1 - de tal forma que:

(a) P (t14 > t 14, 1- ) = 0.01


(b) P (t8 < t8, 1- ) = 0.975
(c) P (t40, 1- < t40 < 0.529) = 0.95.

Das könnte Ihnen auch gefallen