Sie sind auf Seite 1von 33

ESTADÍSTICA APLICADA I

DISTRIBUCIONES MUESTRALES

domingo, 17 de Noviembre de 2019


MUESTRA ALEATORIA
Sea X una variable aleatoria (población), que tiene función de
probabilidad f(x) con media  y varianza 2
Se dice que X1, X2,…., Xn es una muestra aleatoria de tamaño n,
tomada de la población X, si se cumple que:
i) Cada Xi es una v.a. con función de probabilidad f(x)
ii) X1, X2,…., Xn es una sucesión de v.a. independientes
iii) El valor esperado de cada uno de los elementos de la muestra
tiene un promedio igual al de la población de la cual fue
elegida
E( X i )    Xi
iv) La varianza de cada uno de los elementos de la muestra
aleatoria es igual a la varianza de la población de la cual fue
elegida
V (Xi )   2 X i

domingo, 17 de Noviembre
de 2019
Distribuciones Muestrales
Definición: Una estadística T es una función t(x1, ..., xn ) de los valores de las observaciones de una
muestra de tamaño n; es decir:
T= t(x1, ..., xn )
Para una población de N elementos, se puede obtener: Nn ó P(N, n) muestras posibles de tamaño n,
dependiendo de la selección de la muestra (con reemplazo o sin reemplazo respectivamente).
En este sentido, la Distribución Muestral o de Muestreo es la distribución de probabilidad de la
estadística muestral T, que tiene tantos valores diferentes como muestras posibles de tamaño n se
pueden obtener.
Para determinar la distribución muestral de una estadística, es necesario conocer:
– La población y el parámetro,
– Todas la muestras posibles y
– Todos los valores posibles.

domingo, 17 de Noviembre de 2019 3


Distribuciones Muestrales
Cuando la población es infinita, la distribución muestral se debe considerar como una distribución
muestral teórica, dado que no es posible conocer todas las muestras posibles.
Cuando la población es finita y de un tamaño moderado, se puede construir la distribución muestral,
que se debe considerar como una distribución muestral experimental.
En este último caso, se puede obtener todas las muestras posibles de tamaño n, calculando sus
respectivas estadísticas, así como sus probabilidades de ocurrencia.
Cuando estudiamos una distribución muestral es necesario conocer:
– Su forma funcional,
– Su valor esperado y
– Su varianza.

domingo, 17 de Noviembre de 2019 4


Teorema del Limite Central
Al aumentar el tamaño de la muestra, la distribución de las estadísticas muestrales se
aproxima a una distribución normal, sin importar la forma de la distribución de la
población de donde proviene la muestra.
Como vimos, una estadística muestral T, es una función t(x1, ..., xn) de los valores observados de la
muestra. Por ejemplo:
n

x i
La Media Muestral : x  i 1

n
n

 xi2  n ( x ) 2
La Varianza Muestral : s 2 i 1

n 1
n

x i
1 caso favorable
La proporción muestral : p  i 1
; xi  
n 0 caso contrario
domingo, 17 de Noviembre de 2019 5
Distribución de la Media Muestral
Sea X una población que tiene distribución normal con media  y varianza 2 y sea x1, ..., xn
una muestra aleatoria extraída de esta población.

Luego la estadística media muestral, que esta dada por:


1 n
x
n
 x
i 1
i

Tiene un valor esperado y una varianza que están dados por:


2
E( x )   V( x ) 
n

domingo, 17 de Noviembre de 2019 6


Ejemplo
Suponga que se tiene una población, cuyos elementos son: { 1, 2, 3, 4 }
En este caso, el tamaño de la población es N = 4.
En cuanto a los parámetros poblacionales, sus valores son:
1 
La Media de la población:   X i  2,5
 i 1
 2 2
La Varianza de la Población: 2  i 1 X i   
   1,25

Si se extrae una muestra de tamaño n = 2, es posible obtener:
N n  4 2  16 Muestras con reemplazo
N! 4!
C ( N , n)   6 Muestras sin reemplazo
( N  n)! n 2! 2!

Intentaremos probar, a partir de información 2


muestral, que: E( x )   V( x ) 
n
domingo, 17 de Noviembre de 2019 7
Ejemplo: Caso de muestreo con reemplazo (k = 42 = 16 muestras)
Muestra Media Muestra Media Muestra Media Muestra Media
{ 1, 1 } 1 { 1, 2 } 1.5 { 1, 3 } 2 { 1, 4 } 2.5
{ 2, 1 } 1.5 { 2, 2 } 2 { 2, 3 } 2.5 { 2, 4 } 3
{ 3, 1 } 2 { 3, 2 } 2.5 { 3, 3 } 3 { 3, 4 } 3.5
{ 4, 1 } 2.5 { 4, 2 } 3 { 4, 3 } 3.5 { 4, 4 } 4
Luego, la media muestral tiene los siguientes valores posibles:
1 1.5 2 2.5 3 3.5 4 1 / 16 ; x 1ó x  4

2 / 16 ; x  1.5 x  3.5
1/16 2/16 3/16 4/16 3/16 2/16 1/16 p ( x)  
3 / 16 ; x2ó x3

4 / 16 ; x  2.5
Población Muestra
p(x) 0.3

0.3 0.25

0.2
0.2
0.15
0.1 0.1

0 0.05
1 2 3 4
0
1 1.5 2 2.5 3 3.5 4
domingo, 17 de Noviembre de 2019 8
Ejemplo
El valor esperado de la media muestral, esta dado por:
n 1 2 3 4 3 2 1
E( x )   x i p ( x i )  (1)  (1 .5 )  ( 2 .0 )  ( 2 .5 )  ( 3 .0 )  ( 3 .5 )  ( 4 )  2.5
i 1 16 16 16 16 16 16 16
La varianza de la media muestral, esta dada por:
2 n 2 2
V( x )  E ( x )  [ E ( x )]   x i 2 p ( x i )  ( 2.5)
i 1
2 1 2 2 2 2 2 1
V( x )  1 *  1,5 *  .....  3.5 *  4 *  6.25
16 16 16 16
V( x )  6.875  6.25  0.625
E(x )  μ  2.5
De este modo, y tal como esperábamos:
σ 2 1.25
V( x )    0.625
n 2
Luego, la distribución muestral de la media muestral, esta dada por:
 1, 25  x  2 ,5
x~ N  2 , 5;   z ~ N(0,1)
 2  1,118 2
domingo, 17 de Noviembre de 2019 9
Distribución Muestral de la Media
a) Caso de varianza 2 conocida
Si X tiene una distribución con varianza conocida 2, se puede afirmar que la Distribución Muestral de la Media
esta dada por:

 2  x -
x  N   ,   z=
  N(0,1)
 n  / n
Error Estándar de la media
muestral
Si el tamaño de la población  es conocido, se puede afirmar que la Distribución Muestral de la Media estaría
dada por:

 2   n  x -
x  N   ,   z =  N(0,1)
 n  1   n
2

Error Estándar de la media n  1


muestral

domingo, 17 de Noviembre de 2019 10


Distribución Muestral de la Media
b) Caso de varianza 2 desconocida
Si la varianza 2 es desconocida y el tamaño de muestra es moderado, se puede afirmar que la Distribución
Muestral de la Media esta dada por:

x -
t=  t (n - 1)
s/ n Error Estándar Estimado de la media
muestral
Si el tamaño de la población  es conocido, se puede afirmar que la Distribución Muestral de la Media estaría
dada por:

x -
t=  t (n - 1)
s n
2

Error Estándar Estimado de la media


n  1 muestral

domingo, 17 de Noviembre de 2019 11


Ejemplo 1.-
De acuerdo a los registros de calificaciones de la universidad, los resultados de los exámenes del curso de marketing,
siguen una distribución normal con una media de 78 y una varianza de 36.
a) Qué calificación mínima debe obtener un alumno, para ser considerado dentro del quinto superior del curso?
b) Si se selecciona al azar una muestra de 30 exámenes correspondientes al parcial de Marketing en este ciclo ¿Cuál
debe ser la calificación promedio mínima en dicha muestra, para que sea considerada dentro del quinto superior
de los promedios de todas las muestras posibles del mismo tamaño?

Solución .-
a) La población o variable aleatoria X, está formada por los resultados o calificaciones de los exámenes de marketing,
de modo que: X ~ N(78, 36).

Y, la calificación mínima A, del 20% P ( x  A )  0 , 20


superior del curso, se obtiene de:
Esto es :
P( x  A)  0.80
 A  83.0497

domingo, 17 de Noviembre de 2019


b) En este caso, la muestra es de tamaño: n=30, y
X = { Resultados o calificaciones promedio de las muestras de tamaño 30},
de modo que:
x ~ N 78 , 1 . 2 

Y, La calificación promedio minina A, del 20% superior de los promedios de todas las muestras de tamaño 30, se
obtiene de:

P( x  A )  0 ,2 0

Esto es :
P ( x  A)  0,80
 A  78,9219

domingo, 17 de Noviembre de 2019


13
13
Ejemplo 2.-
El gerente de producción de una fábrica de productos marinos envasados asegura que el producto presentado en el
nuevo envase tiene un peso promedio de 100 gramos. La gerencia antes de lanzar el producto al mercado, exige al
jefe del área de control de calidad que someta a una prueba de pesos y medidas a dicho producto.
El jefe del Area de CC, selecciona al azar 10 envases y obtienen los siguientes resultados: 97; 102; 103; 92; 103; 96; 98;
97; 99; y 95.
¿Cuál será la probabilidad de que el peso promedio de la muestra supere los 102 gramos?

Solución .-
De los datos se obtiene que:  = 100; n = 10; s = 3,6148

En este caso no se conoce la varianza de la población y la muestra es pequeña ya que n  30. Además se tiene que:
t~t(9).
Por tanto, se tiene que calcular:  102  100 
P ( x  102 )  P  t    P (t  1,751954 ) 
 3,61 10 
 1  P (t  1,751954 )  1  0,943153 
 0,056847

domingo, 17 de Noviembre de 2019 14


Distribución de la Proporción Muestral
Sea X una población donde una parte de sus elementos satisfacen cierta característica. Esto quiere decir que:

1 Si satisface la característica
X 
 0 No satisface la característica
La proporción  de la proporción de la población que satisface cierta característica está dada por:



K Xi K es número de observaciones que satisfacen la característica y  es el tamaño de la
  i 1
población
 

Si se tiene una muestra aleatoria extraída de esta población, x1, ..., xn, la proporción de la muestra está definida por:


n
k xi k es número de observaciones que satisfacen la característica, y n es el tamaño de la
p  i 1
muestra
n n

domingo, 17 de Noviembre de 2019 15


Distrib. Muestral de la Proporción Muestral
Cuando n >30, la distribución muestral de proporción de la muestra está dada por:

( 1   ) p  p
p ~ N(  p ,  2p )  p   p   z ~ N(0,1)
n p
Error Estándar de la proporción muestral

Cuando el tamaño de la Población  es conocido se tiene que:

( 1   )  N  n  p  p
p~ N(  p ,  2p ) p   p     z ~ N(0,1)
n  N1 p
Error Estándar de la proporción
muestral

domingo, 17 de Noviembre de 2019 16


Ejemplo
El fabricante de maquinas despachadoras de café indica que de cada 1000 vasos servidos, sólo 15 vasos tienen una
cantidad de café por debajo de las 8 onzas (medida estándar establecida). Una empresa que va comprar este tipo de
máquina quiere evaluar si esto es verdad. Esto es, desea estimar la proporción de vasos servidos con cantidad de café
por debajo de las 8 onzas, en base a los datos de una muestra aleatoria de 100 vasos de café que ha servido esta
máquina. ¿Cuál es la probabilidad que esta proporción en la muestra se encuentre entre 1,2% y 2,0%?

Solución.-
X: Vasos que tienen un contenido de café por debajo de las 8 onzas.
 = 0,015 prop. de vasos con un contenido menor que 8 onzas.
n = 100 muestra de vasos observados

domingo, 17 de Noviembre de 2019 17


Ejemplo
 0,015 (0,985) 
p ~ N  0,015; 
 100 
μ p  0,015

0,015 (0,985)
σp   0,012155
100

P ( 0,012  pˆ  0,020 )  P ( z  0, 20 )  P ( z  0,012 )


 0,659593  0,402527 
 0,257066

domingo, 17 de Noviembre de 2019 18


Distribución de la Varianza Muestral
Sea X una población que tiene una distribución normal; si se toma una muestra aleatoria x1, ..., xn se puede calcular
la estadística varianza muestral, que esta dada por:


n 2
(x i  x )
s2  i 1
n1

de donde se puede deducir:

 
n 2
2
(x i  x ) (n  1)s2
i 1

2 2
Así se puede afirmar que:
 2   2n - 1

domingo, 17 de Noviembre de 2019 19


Ejemplo
Un investigador afirma que la varianza de una determinada población, que sigue una distribución normal, es igual a
21.3. Sin embargo, podría rechazar tal afirmación si la varianza de una muestra aleatoria de tamaño 15 excede a 39,74.
¿Cuál es la probabilidad de que dicha afirmación sea rechazad?

Solución.- La probabilidad de rechazar la afirmación está dada por:

 ( n  1)s 2 ( 15  1)( 39,74) 


2
P( s  39,74)  P  2  
  21, 3 
 
 P 2  26,12  1  P  2  26,12  
2  142
P( s 2  39,74)  1  P  2

 26,12  1  0 ,975  0 ,025

domingo, 17 de Noviembre de 2019 20


Ejemplo:
Se sabe que la duración de paneles luminosos fabricados por una compañía tiene una media de 2000 horas y una
desviación típica de 60 horas. Si se seleccionan al azar 10 paneles, ¿Cuál será la probabilidad que la desviación
estándar muestral:
a) No supere las 50 horas?
b) Se encuentre entre 50 y 70 horas?

Ejemplo:
Las bolsas de plástico empleadas para empaquetar productos se fabrican de forma que la resistencia a la rotura
tenga una distribución normal con  = 5 kg/cm2 . Si se toma una muestra al azar de 16 bolsas. ¿Qué valor
máximo tendrá la desviación estándar de la muestra con probabilidad 0.95?

domingo, 17 de Noviembre
21
de 2019
Distribución de la Diferencia Proporciones
Sean dos poblaciones independientes, X e Y, cuyas proporciones poblacionales son 1 y 2, respectivamente. Si se
toma muestras independientes en cada una de estas poblaciones de tamaños n1 y n2, respectivamente, se podría
obtener las dos proporciones muestrales siguientes:

k1 k2
p1 = y p2 =
n1 n2
Si los tamaños de muestras son grandes, esto es n1 + n2 >30, se puede decir que la Distribución Muestral de la
Diferencia de las Proporciones Muestrales esta dada de la siguiente forma:


p 1  p 2  N  p 1  p 2 ,  2p 1  p 2 
 1 (1   1 )  2 (1   2 )
 p1  p2   1   2  p1  p2  
n1 n2

domingo, 17 de Noviembre de 2019 22


Ejemplo
Un analista de mercado considera que el 85% de los consumidores potenciales en Piura y el 95% de la ciudad de Tacna
prefieren beber cerveza rubia. Para validar su opinión, levanto una encuesta de opinión independiente en cada ciudad.
Comprobó que 240, de 300 personas entrevistadas en Piura y 340 de las 400 personas entrevistadas en Tacna prefiere
beber cerveza rubia. ¿Cuál es probabilidad de observar una diferencia mayor que 5% entre ambas proporciones
muestrales?

Solución.-
En ambas poblaciones se observa la proporción de preferencia para beber cerveza rubia.

Piura   1  0 , 85 n 1  300 p 1  0 , 80
Tacna   2  0 , 95 n 2  400 p 2  0 , 85

domingo, 17 de Noviembre de 2019 23


Ejemplo
Se tiene que la distribución muestral está dada por :

p 1  p 2  N  p1  p2 ,  2p1  p2 
 p1  p2  0 ,10
0,85(0,15) 0,95(0,05)
 p1  p2    0,0233
300 400

P  p 1  p 2  0 ,05  1  P  p 1  p 2  0 ,05 
 1  P( 0 ,05  p 1  p 2  0 ,05) 
 1  P( p 1  p 2  0 ,05)  P( p 1  p 2  0 ,05) 
 1  ( 1,000000 0,98406)
 0,98406

domingo, 17 de Noviembre de 2019 24


Distribución de la Razón de Varianzas
Sean X e Y poblaciones independientes que tienen distribuciones normales. Si se toman muestras independientes de
tamaños n1 y n2, respectivamente, entonces la variable F tendrá una distribución F con n1 -1 y n2 -1 grados de
libertad, si está definida de la siguiente forma:

 (n 1  1)s12 
  (n 1  1)
σ 2
s12 σ12 σ 22 s12
F  1   2 2  2 2  F(n1 -1, n2 -1)
 (n 2  1)s 22  s 2 σ 2 σ1 s 2
  (n 2  1)
 σ 2
2 
En el caso que las varianzas poblacionales sean iguales: σ12 = σ12 , se tiene que:

s12
F  2  F(n1 -1, n2 -1)
s2
domingo, 17 de Noviembre de 2019 25
Ejemplo
Se desea saber si se puede comparar dos procesos en relación con la variabilidad de la resistencia que tiene un
producto respecto a la tracción. Se considera que los procesos producirán plásticos con igual resistencia a la
tracción, si la razón entre la varianzas muestrales no es demasiado grande. Ésta será demasiado grande si la
probabilidad, de obtener un valor mayor o igual que el cociente de las varianzas muestrales, es menor que 0,04. De
dos muestras aleatorias independientes de 25 especimenes cada una, se observó que las varianzas muestrales fueron
540 y 256. Asumiendo que ambos procesos de producción se ajustan a una distribución normal con igual
variabilidad, ¿a qué conclusión debería llegar el gerente en este caso?.
Solución.- De los datos se tiene lo siguiente:
Máquina A  n 1  25 s 12  540 A demás del problema se tiene : σ 2x  σ 2y
Máquina B  n 2  25 s 22  256

s 2x
Luego : F  2  F( 24, 24 )
sy
 s 2x 540 
P 2    P( F  2 ,11)  1  P( F  2 ,11)  1  0,9633  0 ,0367
 s y 256 
 
domingo, 17 de Noviembre de 2019 26
Ejemplo:
Dadas dos muestras aleatorias de poblaciones normales con varianzas iguales, de tamaño 10 cada una, ¿cuál es la
probabilidad de observar que la varianza de la primera muestra sea por lo menos cuatro veces la varianza de la
segunda muestra?

Ejemplo:
Según estudios realizados anteriormente, la varianza en el llenado de las botellas de Pilsen y Cristal son de 2.8
y 3.4 ml², si se toman muestras de 12 y 15 botellas, de Pilsen y Cristal,
¿Cuál es la probabilidad de que la varianza en la muestra de Pilsen sean inferiores a las de Cristal?

domingo,17deNoviembrede2019 27
Distribución de la Diferencia de Medias
Sean X1 y X2 , dos poblaciones independientes que tienen distribuciones normales. Si se toman muestras
independientes de tamaños n1 y n2, respectivamente, se puede obtener las medias muestrales mediante:

x1 =
 x 1i
y x2 =
 x 2i

n1 n2

a) Caso de varianzas σ12 y σ22 , conocidas


Si X1 y X2 tienen distribuciones con varianzas (poblacionales) conocidas, se puede afirmar que la Distribución
Muestral de la Diferencia de Medias Muestrales de Poblaciones Independientes esta dada por:


x 1  x 2  N  x 1  x 2 ;  2x 1  x 2 
 12  22
 x1 x2   1   2  x1 x2  
n1 n2

domingo, 17 de Noviembre de 2019 28


Dist. Muestral de la Diferencia de Medias
b) Caso de varianzas σ12 y σ22 , desconocidas

 Cuando n1 + n2 ≤ 30 y además se sabe que las varianzas son desconocidas pero iguales se puede decir
que la Distribución Muestral de la Diferencia de Medias Muestrales de Poblaciones Independientes esta
dada por la distribución de la variable t. Esto es:

t
 x1  x2    1  2   t donde : s 2p 
(n 1  1)s12  (n 2  1)s22
(n 1  n 2  2)
 1 1  n1  n2  2
s 2p   
 n1 n2 

domingo, 17 de Noviembre de 2019 29


Dist. Muestral de la Diferencia de Medias
 Cuando n1 + n2 ≤ 30 y además se sabe que las varianzas son desconocidas pero diferentes se puede decir
que la Distribución Muestral de la Diferencia de Medias Muestrales de Poblaciones Independientes esta
dada por la distribución de la variable t. Esto es:

2
 
s12 s 22
  
( x 1  x 2 )  ( 1   2 ) n 
donde : G   2 
n
t  t (G )
1 2
2
s12 s 22  s12   s 22 
    
n1 n2 n   
 1    n2 
n1  1 n 2  1

domingo, 17 de Noviembre de 2019 30


Ejemplo 1.-
Tradicionalmente, se puede afirmar que las calificaciones de los exámenes finales de los estudiantes de ingeniería
tienen una puntación promedio d de 12 con una desviación estándar de 1,2 puntos. Mientras que la de los estudiantes
de negocios, tienen una calificación promedio de 15 con una desviación estándar de 1,6. Si se asume que las
calificaciones de los estudiantes se ajustan a una normal, y si en el ciclo pasado se eligen al azar los exámenes de 40
estudiantes de ingeniería y 30 de negocios. ¿Cuál será la probabilidad de observar una diferencia de a lo más 2,0
puntos entre las calificaciones promedio entre ambas escuelas?

Solución.-Estamos en un caso de varianzas conocidas


Ingeniería : n1  40  1  12  1  1, 2
Negocios : n 2  30  2  15  2  1,6


x 1  x 2  N  x1  x 2 ; ˆ 2
x1  x 2   x 1  x 2   3 ˆ x1  x 2 
1, 2 2 1,6 2
40 30
  0,3483

P  x 1  x 2  2   P  2  x 1  x 2  2   P x 1  x 2  2   P  x 1  x 2   2  
 1 - 0.997955  0,002145
domingo, 17 de Noviembre de 2019 31
Ejemplo 2.-
El gerente ventas quiere implementar una de las dos nuevas técnicas de ventas para la próxima campaña. Considera que
primero debería probarlas. La primera técnica la prueba con 12 vendedores y la segunda técnica con 15 vendedores. Al
finalizar la semana de prueba, comprobó que con la primera técnica, las ventas promedio fueron de 68 con una
desviación estándar de 7,071. Mientras que con la segunda técnica, las ventas promedio fueron de 72 con una
desviación estándar de 8,68. Asumiendo que las ventas obtenidas se aproximan a una distribución normal con el mismo
promedio y la misma variabilidad, en ambas técnicas. ¿Cree usted que es probable que la segunda técnica sea mejor
que la primera en más de 4 ventas?
Solución.- Según los datos se debe asumir que: 1 - 2 = 0 y 12 = 22. Estamos en un caso de varianzas
desconocidas muestras pequeñas, pero varianzas iguales.
Técnica 1  n1  12 x1  68 s1  7,071
Técnica 2  n2  15 x 2  72 s2  8,68

(n1  1) s12  (n2  1) s22


donde : s 
2
 64,19
n1  n2  2
p

domingo, 17 de Noviembre de 2019 32


Ejemplo 2.-
De modo que:

  
P x 2  x1  4  P x1  x 2  4 
 
 
 40 
 P t  
  1 1 
 64,19   
  12 15  
 P (t  1.2891); t  25 g .l.
 0,104582

domingo, 17 de Noviembre de 2019 33

Das könnte Ihnen auch gefallen