Sie sind auf Seite 1von 31

UNIVERSIDAD CATÓLICA DE LA SANTÍSIMA CONCEPCIÓN

FACULTAD DE INGENIERÍA
DEPARTAMENTO DE MATEMÁTICA Y FÍSICA APLICADAS

DISTRIBUCIONES MUESTRALES DE
ESTADÍSTICOS

UNA GUÍA CONCEPTUAL PRÁCTICA PARA


INGENIERÍA CIVILES

Lidia Retamal Pérez


Rosamel Sáez Espinoza
Hugo Alvarado Martínez

Concepción, 2019

1
ÍNDICE GENERAL
INTRODUCCIÓN …………………… 3

4. Distribuciones Muestrales de Estadísticos …………………… 4


4.1 Actividades Guiadas (Cátedra) …………………… 4
4.1.1 Actividad guiada 1 …………………… 4
4.1.2 Actividad guiada 2 …………………… 6
4.1.3 Actividad guiada 3 …………………… 7
4.1.4 Actividad guiada 4 …………………… 9
4.1.5 Actividad guiada 5 ……………………10
4.1.6 Actividad guiada 6 ……………………10

4.2 Conceptos (Compromiso de estudio) ……………………11


4.2.1 Distribución de Probabilidad de la Media Muestral ……………………11
4.2.2 Distribución de Probabilidad de la Varianza Muestral …………………...14
4.2.3 Distribución de Probabilidad de la Media Muestral
Con varianza desconocida ……………………15
4.2.4 Estimación Puntual de Parámetros …………………... 16

4.3 Actividades Propuestas (Ayudantía) ……………………18

4.4 Actividades Propuestas (Laboratorio de computación) ……………………20

2
01. INTRODUCCIÓN
En muchos trabajos prácticos se requiere trabajar con medidas estadísticas obtenidas de
objetos que han sido seleccionados mediante algún procedimiento de muestreo, por ejemplo
que tan probable resulta encontrar que la media de una muestra cualquiera en un proceso
productivo se encuentre entre dos valores de especificación a y b o que, la probabilidad de
que la proporción de elementos tenga una medida superior a la especificada, cuando se basa
en una muestra aleatoria seleccionada en determinado momento.

Cuando obtenemos una medida estadística para todas las muestras posibles, observamos un
patrón de su comportamiento, patrón que puede ser modelado mediante una función de
probabilidad teórica que denominamos Distribución Muestral.
El objeto de muestrear una población es tener estimaciones de los parámetros poblacionales
mediante las observaciones obtenidas en una muestra aleatoria.

Conceptos previos

Una muestra aleatoria (m.a.) de una población X es un conjunto de variables aleatorias


X 1 , X 2 ,......., X n independientes e idénticamente distribuidas cada una con la distribución de X.

Un parámetro es una medida estadística obtenido con todos los datos de la población, esto
indica que para conocer el valor de un parámetro se debe estudiar la población en su totalidad,
es decir, realizar un censo, sin embargo, realizar un censo es poco práctico ya sea por el alto
costo que ello involucra y por el tiempo asociado a los procesos, de aquí la importancia de
esta unidad. No conocer el valor del o los parámetros implica no poder determinar
probabilidades de ocurrencia de eventos. Debemos por lo tanto buscar alguna solución que
nos permita obtener dichas probabilidades.
En estadística, la solución nace de estudiar una pequeña parte de la población, que llamamos
muestra y a partir de esta inferir hacia la población.

Las medidas obtenidas con datos de una muestra reciben el nombre de estadístico.
Básicamente un estadístico es lo mismo que un parámetro, sólo que el parámetro es obtenido
con todos los datos de la población y un estadístico con los datos de la muestra, es por esto
que también serán denotados de distinta forma. El valor del estadístico puede cambiar de una
muestra a otra.
Es importante conceptualizar a los estadísticos como variables aleatorias que pueden asumir
diferentes valores en muestras diferentes, que será su distribución de probabilidad asociada
y cuáles son sus propiedades.

La distribución de probabilidad de un estadístico se denomina Distribución Muestral

Comprender las distribuciones muestrales nos proporciona fundamentos para comprender los
procedimientos que permiten inferir sobre un parámetro que no conocemos a partir del valor
de un estadístico obtenido en un estudio realizado por muestreo probabilístico.

3
4. DISTRIBUCIONES MUESTRALES DE ESTADÍSTICOS

4.1 Actividades Guiadas (Cátedra)


4.1.1 Actividad guiada 1
Con el fin de estimar el tiempo del trayecto desde la casa a la universidad, se realiza un
estudio para analizar el número de detenciones que hace un conductor en los semáforos, ya
sea en un viaje de ida o vuelta, encontrando, mediante la elaboración de distribuciones de
probabilidades para variables aleatorias discretas acotadas lo siguiente:

X 0 1 2
f(x) = P(X = x) 0.2 0.5 0.3

Asumiendo la variable aleatoria X como el número de detenciones que hace el conductor ya


sea en un viaje de ida o de vuelta
a) Observe que la distribución de probabilidad tanto para la variable aleatoria X1: número de
semáforos en los que el conductor se detiene en un viaje de ida como para la variable aleatoria
X2 número de semáforos en los que el conductor se detiene en un viaje de vuelta, es dada por.
0, 2 x  0

P( X i  x)   0,5 x  1 i = 1, 2
0,3 x  2

Cuya representación gráfica es:
Distribución del número de detenciones en semáforos en un viaje
entre la casa y la Universidad

0.6
0.5
0.4
0.3
0.2
0.1
0
0 1 2

Además su valor esperado  y desviación estándar  es.


 = E(X) = 0×0.2 + 1×0.5 + 2×0.3 = 1.1
E(X2) = 02×0.2 + 12×0.5 + 22×0.3 = 1.7
 2 = V(X) = E(X2) - (E(X))2 = 1.7 – 1.12 = 0.49 y  = 0.7

b) Las variables aleatorias X1 y X2 son variables aleatorias independientes y además al tener


la misma distribución de probabilidad,  X 1 , X 2  forman una muestra aleatoria de tamaño 2.
Enumere todas las muestras aleatorias de tamaño 2 con reemplazo que pueden obtenerse
por detención de los semáforos.

Se obtienen 9 muestras (3x3) de tamaño dos:


(0,0) (0,1) (0,2) (1,0) (1,1) (1,2) (2,0) (2,1) (2,2)

4
c) Defina la variable aleatoria T = X1 + X2. Obtenga la distribución de probabilidad de T.
Distribución de Probabilidad de T
Muestras Probabilidad Suma T P(T = t)
(0,0) p(0,0) = p(0) p(0) 0 0.04
(1,0) (0,1) 2p(0)p(1) 1 0.2
(0,2) (2,0) (1,1) 2p(0)p(2) +p(1)p(1) 2 0.37
(1,2) (2,1) 2 p(1) p(2) 3 0.3
(2,2) p(2)p(2) 4 0.09
1

d) Dibuje un gráfico adecuado para representar la distribución de T y compárela con (b).

e) Calcule la media de T. ¿De qué manera se relaciona con la media de la población?

De la distribución de muestreo de la media se obtiene


E(T) = = 0×0.04 + 1×0.2 + 2×0.37 + 3×0.3 + 4×0.09 = 2.2
Usando propiedades de la esperanza:
E(T) = E( X1 + X2) = E( X1) + E( X2) = 1.1 +1.1 = 2.2

Para la varianza de T
E(T2) = 02×0.04 + 12×0.2 + 22×0.37 + 32×0.3 + 42×0.09 = 5.82
V(T) = E(T2) - (E(T))2 = 5.82 – 2.22 = 0.98

Usando propiedades de la varianza:


V(T) = V( X1 + X2) = V( X1) + V( X2) = 0.49 + 0.49 = 0.98

f) Calcule la probabilidad de encontrar, de ida y regreso de la universidad, más de dos


semáforos en los que debo detenerme.
P(T > 2 ) = P(T = 3) + P(T=4) = 0.3 + 0.09 = 0.39

g) Del apartado (d) obtener la distribución de muestreo de las medias muestrales


( X1  X 2 ) / 2
Sea 𝑋 = ( X 1  X 2 ) / 2 , la distribución de muestreo del promedio es
Muestras Probabilidad 𝑋 P(𝑋 = 𝑥)
(0,0) p(0,0) = p(0) p(0) 0 0.04
(1,0) (0,1) 2p(0)p(1) 0.5 0.2
(0,2) (2,0) (1,1) 2p(0)p(2) +p(1)p(1) 1 0.37
(1,2) (2,1) 2 p(1) p(2) 1.5 0.3
(2,2) p(2)p(2) 2 0.09

h) Dibuje un gráfico adecuado para representar la distribución de T y compárela con (b).

5
Distribución de probabilidad del número medio de detenciones

0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
0 0.5 1 1.5 2

Ahora calcule la media y desviación estándar de las medias muestrales. Compárela con (c).
E(𝑋) = 0×0.04 + 0.5×0.2 + 1×0.37 + 1.5×0.3 + 2×0.09 = 1.1
Usando propiedades: E(𝑋) = E( ( X 1  X 2 ) / 2 ) = (1.1 +1.1)/2 = 1.1. Coincide E(𝑋) = µ

E(𝑋2) = 02×0.04 + 0.52×0.2 + 12×0.37 + 1.52×0.3 + 22×0.09 = 1.455


V(𝑋) = E(𝑋2) – (E(𝑋))2 = 1.455 – 1.12 = 0.2455

i) Usando propiedades: V(𝑋) = V( ( X 1  X 2 ) / 2 ) = (0.49 + 0.49) / 4 = 0.245


Por otro lado, V(𝑋) = = 0.49 / 2 = 0.245
Indique tres hechos importantes obtenidos en la resolución del problema.
1. E(X) = E(𝑋) = µ
( )
2. V(𝑋) = =
3. La distribución de la media muestral 𝑋 tiene forma aproximadamente simétrica.

j) Del apartado (d) obtener la distribución de muestreo de las varianzas muestrales S 2


Muestras Probabilidad S2 Probabilidad
(0,0) (1,1) (2,2) p(0,0) + p(1,1) + p(2,2) 0 0.38
(1,0) (0,1) (1,2) (2,1) 2 p(1,0) + 2 p(1,2) 0.5 0.50
(2,0) (0,2) 2p(2,0) 2 0.12

Observe que:
E( S2 ) =0× 0.38 + 0.5× 0.50 + 2× 0.12 = 0.49 = 𝜎
E(S4 ) = 02× 0.38 + 0.52× 0.50 + 22× 0.12 = 0.605. Así V(S2 ) = 0.605 – 0.492 = 0.3649

Comente si hay relación de la media y la varianza poblacionales de S 2 con la media y varianza


de la distribución de muestreo de S2

4.1.2 Actividad guiada 2


Un sistema está formado por 100 componentes cada una de las cuales tiene una confiabilidad
igual a 0,95. (Es decir, la probabilidad de que la componente funcione correctamente durante
un tiempo específico es igual a 0,95). Si esas componentes funcionan independientemente
una de otra, y si el sistema completo funciona correctamente cuando al menos funcionan 80
componentes, ¿Cuál es la confiabilidad del sistema?
¿Qué elementos destacarían en esta actividad y cómo la desarrollarías?

6
En primer lugar podemos definir la variable aleatoria “número de componentes que
funcionan correctamente en el sistema” con distribución binomial de parámetros n=100
ensayos y probabilidad de que funcione una componente cualquiera p = 0,95. Luego,
escribimos en lenguaje simbólico P80  S n  100 e intentamos de calcular la probabilidad.
Hacemos notar que el valor es demasiado grande para las tablas que tenemos. De esta manera
estamos introduciendo la idea de aproximación mediante las preguntas: ¿Son muchos
términos en la suma?, ¿Los términos son difíciles de calcular?, ¿Podríamos usar otra
distribución de probabilidades para aproximar el cálculo de la probabilidad pedida?
Solución aproximada: Para calcular P (80  Sn  100) primero obtenemos la esperanza y
varianza de la variable de interés.

E(Sn)=E(∑Xi)= ∑E(Xi) = n×p = 100×0,95 = 95 ;


Var(Sn)=Var(∑Xi)= ∑Var(Xi) = n×p×(1-p) = 100×0,95×0,05 = 4,75.

La desviación estándar de esta variable es  S n  4,75  2,18 . Como el tamaño de la muestra


n=100 es grande, aplicamos el teorema central del límite, obteniendo: S n ~ N np, npq  Luego
procedería al cálculo, usando la corrección de continuidad:
 79,5  95 S n  95 100,5  95 
P (80  S n  100)  P 79,5  S n  100,5  P      (2,52)   ( 7,1)  0,994
 2,18 2,18 2,18 
Por tanto, el sistema funcionaría el 99,4% de las veces.

Nota: Al aumentar el valor de n en la distribución binomial B  n, p  cuya expresión


n
matemática es P( X  x )    p x 1  p 
n x
para valores x = 0, 1, 2, 3,…,n, los términos
 x
crecen muy rápidamente, por lo que el cálculo de las probabilidades de los valores de la
variable en las distribuciones exactas es demasiado laborioso.

Cabe señalar, que esta problemática es un caso particular de un resultado general; el teorema
central del límite, y que nuestro interés en los temas siguientes es conducirlos a su
generalización y formalización. La interrogante general que lleva a analizar los teoremas de
límite es la siguiente: ¿En qué condiciones y mediante qué funciones o distribuciones de
probabilidad pueden aproximarse la suma de otras distribuciones por la distribución
normal, cuando aumentamos progresivamente el número de sumandos? Destacamos la
importancia práctica en ingeniería, en estudios de la masa forestal, producción, cargas en
estructuras, etc., y que permite usar la distribución normal tabulada para calcular
probabilidades que provienen de la suma de diferentes distribuciones.

4.1.3 Actividad guiada 3


La prueba WAIS (wechsler adult intelligence scale) es una prueba de inteligencia para adultos.
La distribución de los resultados de la prueba WAIS para personas mayores de 16 años tiene
distribución normal con media 100 y desviación estándar 15.

Nota: (algo acerca de la prueba WAIS). Puntajes de más de 115 se considera inteligencia
brillante. Más de 130 comienza la clasificación de superdotación intelectual con sus grados
7
de moderada a profunda para los que alcanzan más de 175. Personas con puntajes bajo 60 se
consideran con inteligencia muy baja.

a) ¿Cuál es la probabilidad de que un individuo escogido aleatoriamente tenga un resultado


de 105 o superior?
b) ¿Cuáles son la media y la desviación estándar del promedio X de los resultados en la
prueba WAIS de una muestra aleatoria de 60 personas?
c) ¿Cuál es la probabilidad de que el promedio de los resultados en la prueba WAIS de una
muestra aleatoria de 60 personas sea de 105 o superior?
d) Entre que valores debe encontrarse la media de la muestra aleatoria de tamaño 60
para que se encuentre a dos desviaciones estándar de la verdadera media.
e) Entre que valores debe encontrarse la media de la muestra aleatoria de tamaño 60
para que se encuentre a 1.96 desviaciones estándar de la verdadera media.

Lo primero que definimos es la variable aleatoria a considerar como también su


distribución.
Sea X v.a. puntaje de la prueba de inteligencia WAIS para personas mayores de 16 años.
X ~ N 100; 225
105  100
a) P( X  105) = 1  P ( Z  ) = 1- Fz (0,33) = 0.3707
15
 
b) E X =100 y V X = 3,75  
c) Esta pregunta nos obliga a definir una nueva variable aleatoria

X Variable aleatoria puntaje medio de la prueba de inteligencia WAIS para personas


mayores de 16 años en muestra de tamaño 60.
X ~ N 100; 3.75 Donde 3.75  225  
2
  X2
60 n
105  100
P( X  105)  1  P( Z  ) = 1- Fz (2,58) = 0.00494
1.9365
d) Sabemos por regla empírica que aproximadamente un 95,4% de todos los datos deben
estar a dos desviaciones estándar de la verdadera media, usando la tabla normal
estándar es de 0.9545, es decir P  2  Z  2   0.9545 , o
 X  100 
P  2 
1.9365
 
 2   0.9545 con esto P 96.13  X  103.87  0.9545 .
 
Esto nos indica que valores de medias muestrales mayores o iguales a 96.13 y menores
o iguales a 103.87 se encontraran a dos desviaciones estándar de la media verdadera.
Otra forma de ver esto, la verdadera media puede encontrarse entre 96.13 y 103.87 con
una probabilidad de 0.9545

e) Siguiendo la misma resolución de la letra (d) vemos de la tabla normal que


P  1.96  Z  1.96   0.950004  0.95
 X  100 
P  1.96 
1.9365
 
 1.96   0.95 Así P 96.20  X  103.92  0.95
 
8
Entendiendo que valores de medias muestrales mayores o iguales a 96.20 y menores o iguales
a 103.92 se encontraran a 1.96 desviaciones estándar de la media verdadera o que la
verdadera media, puede encontrarse entre 96.20 y 103.92 con una probabilidad de 0.95.

Observe lo relevante de esta conclusión, al no conocer la media real, podemos tomar una
muestra aleatoria de dicha población, entonces calcular su media y a partir de esta y de que
tan confiable queramos mostrar dicho resultado, podemos proporcionar un rango de valores
donde se puede encontrar la media verdadera. La probabilidad que nos damos recibe el
nombre de nivel de confianza, y lo denotamos por 1-  , y el rango de valores define lo que
llamamos intervalo de confianza.
La conclusión que hemos obtenido nos lleva a dar una definición de intervalo de confianza
para  media de una población distribuida normal, que será analizada en la próxima
Unidad.

4.1.4 Actividad guiada 4


Suponga que el contenido de nicotina (en miligramos) en los cigarros con filtro sigue una
distribución normal con media 0,88 miligramos y desviación estándar de 0,35 miligramos.
Si seleccionamos una muestra aleatoria de 16 cigarros con filtro:
a) ¿Cuál es la probabilidad que el contenido total de nicotina supere los 14,88 miligramos?
b) ¿Cuál es la probabilidad que la media de la muestra difiera del verdadero contenido en no
más de 0,07 miligramos?
c) Un 99% de probabilidad hay de que la razón entre la varianza muestral y poblacional
supera un determinado contenido de milígramo de nicotina. Detemine el valor de la nicotina.

Sea X: contenido de nicotina (en miligramos) en los cigarros con filtro.


𝑋 ~ 𝑁(𝜇 = 0,88; 𝜎 = 0,35 )

Sea 𝑋 , … , 𝑋 una muestra de tamaño 16


∑ 𝑋 ∶ Contenido total de nicotina en los cigarros con filtro
∑ 𝑋 ~ 𝑁(𝑛𝜇 = 14,08; 𝑛𝜎 = 1,96)
14,88 − 14,08
𝑃 𝑋 > 14,88 = 1 − 𝑃(𝑧 ≤ )
1,96)
= 1 − 𝑃(𝑍 ≤ 0,57)
= 1 − 0,715661 = 0,284339

Hay 28,43% de probabilidad que el contenido total de nicotina supere los 14,88 miligramos.

b) Sea 𝑋: Contenido promedio de nicotina en los cigarros con filtro


,
𝑋~ 𝑁(𝜇 = 0,88; = = 0,00765625)
,
𝑃 𝑋− 𝜇 ≤ 0,07 = 𝑃( |𝑧| ≤ ) = 𝑃(−0,8 ≤ 𝑧 ≤ 0,8 )
,
=0,788145-0,211855=0,57629

Existe una probabilidad de 57,63% de que la media de la muestra difiera del verdadero
contenido en no más de 0,07 miligramos.

9
4.1.5 Actividad guiada 5
Consideramos una señal de intensidad que puede ser representada por una variable aleatoria
X, cuya distribución de valores se puede modelizar por una Normal con media µ y desviación
estándar σ (ambos desconocidos), pero se sabe que:
P(X < 9) = 0,97725 y P(X > 3) = 0,8665
a) Determinar los parámetros de la distribución de la variable aleatoria X.
P(X < 9) = 0,97725 → 𝑃(𝑍 < ) = 0,97725 → =2
P(X > 3) = 0,8665 → 𝑃 𝑍 < = 0,1335 → = −1,11
Resolviendo el sistema de ecuaciones se tiene 𝜇 = 5,142 y 𝜎 = 1,929
Por tanto, 𝑋 ~ 𝑁(𝜇 = 5,14; 𝜎 = 1,93 )

b) Si, al realizar una emisión, la señal tiene una intensidad menor de 3, se considera de
intensidad baja, mientras que, si tiene una intensidad mayor de 9, se considera de intensidad
alta. Si la intensidad está incluida entre 3 y 9, se considera de intensidad media.
b.1) Determinar la proporción de emisiones con señal de intensidad media.

𝑃(3 ≤ 𝑋 ≤ 9) = 𝑃(−1,11 ≤ 𝑍 ≤ 2) = 0,97725 – 0,1335 = 0,84375


La proporción de emisiones con señal de intensidad media es 0,84375.

b.2) Si en una sesión, se emiten 10 veces la señal en forma independiente, ¿cuál es la


probabilidad de que se observe menos de dos veces una señal de intensidad baja?
Sea la variable aleatoria Y, el número de veces que se emite la señal de intensidad baja.

𝑌 ~ 𝐵𝑖𝑛(𝑛 = 10, 𝑝 = 𝑃(𝑋 < 3 ) = 0,1335)


𝑓(𝑦) = 0,1335 ∙ 0,8665 ; y = 0,1,…,10

𝑃(𝑌 < 2) = 𝑃(𝑌 = 0) + 𝑃(𝑌 = 1)


= 0,1335 ∙ 0,8665 + 0,1335 ∙ 0,8665 = 0,60623
Existe un 60,6% de probabilidad de que se observe menos de dos veces una señal de
intensidad baja.
c) Si se toma una muestra aleatoria de 25 emisiones de señales, determine la probabilidad de
que el promedio de intensidad de señal sea menor a 6.
Sea la muestra aleatoria 𝑋 , … , 𝑋 de tamaño 25 y 𝑋 el promedio de intensidad de señal
,
𝑋 ~ 𝑁( 𝜇 = 5,14; = = 0,148996)
,
𝑃 𝑋<6 =𝑃 𝑍< = 𝑃(𝑍 < 2,23) = 0,987126
√ ,
Existe una probabilidad de 98,7% de que el promedio de intensidad de señal sea menor a 6.

4.1.6 Actividad guiada 6


Sea X una población distribuida Poisson de parámetro 𝜆. Determinar el EMV de 𝜆 sacado de
una muestra aleatoria X 1 , X 2 ,...., X n extraída de la población.

10
 x e 
i

X i  P ( )  p ( X i )  con x = 0, 1, 2,....
xi !
 xi
e  n
La función de verosimilitud es L ( X , ) 
 xi!
n
Aplicando logaritmo natural ln L( X ,  ) =  n   xi ln   ln  xi !
i 1

Derivando con respecto 𝜆, se tiene el EMV:


∑ 𝑋
𝜆= = 𝑋
𝑛
Nota: Obtenga la esperanza y varianza del estimador obtenido.

4.2 Conceptos (Compromiso de estudio)


4.2.1 Distribución de Probabilidad de la Media Muestral (𝑿)
Error de muestreo: Es poco probable que una media muestral sea idéntica a la media
poblacional. De igual forma la desviación estándar calculada a partir de la muestra
probablemente no sería exactamente igual al valor correspondiente de la población.
La diferencia entre el parámetro poblacional y el valor del estadístico muestral se denomina
el error de muestreo.

Supóngase que una población de cinco empleados de producción tiene índices de eficiencia
de 97, 103, 96, 99 y 105. Considere además que se selecciona una muestra de dos índices de
la población. La media de todos los índices (la media de la población) es igual a 100. Cada
diferencia x - µ es el error que habría al evaluar la media poblacional con base en la media
muestral, y estos errores de muestreo se deben al azar. La cantidad de estos errores será
diferente de una muestra a la siguiente.
Muestra Media Error de muestreo
97, 105 101 1.0
103, 96 99.5 -0.5

Ahora que se ha descubierto la posibilidad de un error de muestreo cuando se usan los


resultados de la muestra para determinar un parámetro de la población, surgen las
interrogantes:
¿Cómo se puede realizar un pronóstico exacto sobre el éxito posible de un producto
recientemente elaborado, únicamente con base en resultados muestrales?
¿Cómo puede el departamento de control de calidad enviar un cargamento de circuitos
integrado basado únicamente en una muestra de 10 circuitos integrados?
¿Cómo pueden las empresas de sondeos realizar una predicción acertada respecto a una
campaña electoral con base en una muestra de 2000 electores registrados de una población
de casi 90 millones?
Para responder a estas preguntas primero debemos estudiar la distribución de muestreo de
medias muestrales y otros estadísticos.

La distribución de medias muestrales es una distribución de probabilidad que señala todas

11
las medias muestrales posibles de un tamaño de muestra dado y sus probabilidades de
ocurrencia. Además, se establece que:

a. Para un tamaño de muestra dado, el valor medio de todas las medias muestrales posibles
seleccionadas de la población, es exactamente igual a la media poblacional.
b. Existe menos variación en la distribución muestral de medias que en la distribución de la
población.
c. El error estándar de la media mide la variación en la distribución muestral de la media
muestral.
c1) Si se conoce la desviación estándar poblacional, el error estándar es  X   n
c2) Si no se conoce la desviación estándar poblacional, el error estándar es estimado
mediante  X  S n.

Aunque en la práctica se puede ver sólo una muestra aleatoria en particular, en teoría puede
surgir cualquiera de las muestras. El uso de la distribución de muestreo de la media muestral
es importante porque la mayoría de las decisiones en las empresas y negocios se toman
basándose en los resultados de una muestra. Damos dos ejemplos. En cada una de estas
situaciones se tiene una población de la que se tiene alguna información. Se toma una muestra
de la población y se desea determinar si el error muestral –la diferencia entre el parámetro
poblacional y el estadístico muestral- se debe a la casualidad. Luego, se puede calcular la
probabilidad de que una media muestral se encuentre dentro de cierto intervalo.
Al calcular la probabilidad de que una media muestral se encuentre dentro de cierto intervalo,
surge la interrogante: ¿Bajo qué condiciones la distribución de la media muestral sigue una
distribución normal? La condición que analizaremos en esta sección será cuando no se
conoce la forma de la distribución de probabilidad de la población, o si se sabe que no es
normal, pero el tamaño de la muestra es suficientemente grande. Consideraremos las
aplicaciones del Teorema Central del Límite (TCL) en aquellas distribuciones de
probabilidades clásicas que se utilizan en la inferencia estadística.
El teorema señala que, si se seleccionan de cualquier población todas las muestras de un
tamaño determinado, la distribución de las medias muestrales se acercará a una del tipo
normal. Esta aproximación aumenta en el caso de muestras más grandes. Esta proposición
general estudia la convergencia hacia la distribución normal independientemente de la forma
de la distribución de la poblacional.

Teorema Central del Límite


n
Sea S n   X i donde X 1 , , X n es un conjunto de n variables aleatorias independientes
i 1

con la misma distribución de probabilidad, así E  X i    y  2  X i    2 para todo


i, i  1, , n entonces S n converge a la distribución normal con media  Sn  n y varianza
n

S X i
 2
 n cuando n es grande. Además, también la variable aleatoria X n  n 
2 i 1
Sn
n n

12
2
converge a la distribución normal con media  X   y varianza  X2  cuando n es
n
grande, con esto:
𝑖) 𝑆 ≈ 𝑁(𝑛𝜇 ; 𝑛𝜎 ) y 𝑍= ≈ 𝑁(0; 1)

i) 𝑋 ≈ 𝑁(𝜇 ; ) y 𝑍= ≈ 𝑁(0; 1),


esta aproximación se utiliza cuando la población de donde se extrae la muestra es infinita o


el muestreo es con reemplazo.
Observe que si la población es finita de tamaño N y el muestreo es sin reemplazo la media
 N  n 
2
es 𝜇 y la varianza es  X2    .
 N 1  n

Ahora, analizaremos la situación siguiente: Si la población sigue la distribución normal, la


distribución muestral de la media muestral también seguirá la distribución normal. En este
caso el tamaño de la muestra no tiene importancia. Si se conoce la desviación estándar
poblacional, se usa la siguiente estandarización para determinar la probabilidad de que una
X 
media muestral caiga en una determinada región Z .
 n

Teorema 1 Distribución de la Media Muestral (𝑿).

Sean X 1 , X 2 ,......., X n una muestra aleatoria extraída de una población normal con media
 y varianza  2 . Entonces, la variable aleatoria X tiene distribución normal con media
2
 y varianza , es decir, 𝑋 ~ 𝑁(𝜇, )
n

Demostración: Se realizará mediante la función generadora de momentos:


t t t
x1 x2 xn t t t
M x (t )  E ( e x t ) = E ( e n
)  E (e n
)      E ( e n
) = M x1 ( )  M x 2 ( )      M x n ( )
n n n
n
n  t  2 t2   2 t2
    t 
 t  2 n
=  M xi ( )  =  e n 2 n2 
 
= e
 n   
 
La función generadora de momentos desarrollada corresponde a la distribución normal,
donde x ~ N (,
2
n
). Por la tanto, E x   y V (X ) 
2
n
. 

Observe que 𝑋 = = . Entonces, 𝑆 ~ 𝑁( 𝑛𝜇, 𝑛𝜎 )

13
4.2.2 Distribución de Probabilidad de la Varianza Muestral (S2)
k 2
Una variable aleatoria independientes Z i con distribución normal N(0,1), la v.a.  Zi
i 1
tiene distribución Chi-Cuadrado con k grados de libertad.
Anotamos X ~ X k2 Además, E  X   k y V  X   2k .

Por ejemplo, Para X ~ X 152 se tiene E  X   15 ; V  X   30 y P  X  25   0.05 . La


siguiente figura muestra la distribución Chi-Cuadrado para k = 2, 4 y 6 grados de libertad.

La importancia de estos resultados se muestra en lo siguiente:

Considere X 1 , X 2 ,......., X n una muestra aleatoria extraída de una población normal con media
Xi  
 y varianza  2 . La variable aleatoria Z i  tiene distribución normal N(0,1), y

entonces
n

xi   2 ~ X n2
i 1 2

Teorema 2. Sea X 1 , X 2 ,......., X n una muestra aleatoria extraída de una población normal
X ~ N (, 2 ) y denotemos Y 
n  1S 2 . Entonces, la variable aleatoria Y tiene
2

distribución Chi-cuadrado con (n-1) grados de libertad. Las variables aleatorias de la


media x y la varianza s 2 son independientes.

n n
Demostración. Escribamos la descomposición: (Xi   )2  (Xi  X ) 2  n ( X   ) 2 Dividamos
i 1 i 1
n n
(Xi   )2 (Xi  X )2
n( X   ) 2 n( X   )2
cada término de la igualdad por  , 2 i 1
 i 1
 La expresión
2 2 2 2
corresponde al cuadrado de una variable normal estándar con una distribución 12 . Por otra parte,
n
(Xi   )2
W= i 1
sigue una distribución  n2 . Así, W =
n  1S 2  n ( X   ) 2
2
 2 2

14
Si multiplicamos por un parámetro real t, aplicamos la función exponencial a ambos
miembros, y tomamos esperanzas, teniendo en cuenta la independencia de la media y la
varianza muestral, tenemos:

  n12S t 
2

E e  = E  e 
tw
e tz  donde W y Z tienen distribuciones chi-cuadrado con n y 1 grados de
 
 
 n 1S 2 
 t 1 1
libertad, por lo que podemos escribir: E e 

2

 1  2t n 1 / 2
;t  es la función generadora
2
 
 
de momentos de una  n21 y en consecuencia:

Y
n  1S 2 ~  n21
2

Observación: La demostración que las variables aleatorias de la media x y la varianza s 2


son independientes no la presentaremos en este curso. Por otro lado, el número de grados de
libertad del estadístico resultante disminuye en una unidad por cada parámetro que se ha
estimado.

4.2.3 Distribución de Probabilidad de la Media Muestral (𝑿) con varianza


poblacional desconocida
Distribución t- Student. Sea W una variable aleatoria distribuida normal estándar y V otra
variable aleatoria distribuida Chi- cuadrado con n grados de libertad, formemos el cociente
W
T , donde T es una variable aleatoria con distribución t- Student, además, W y V son
V n

independientes. Entonces, consideremos el caso particular, para una muestra con distribución
normal, es posible demostrar que x es independiente de S 2 , y por tanto podemos formar una

variable aleatoria con distribución t-Student de la siguiente forma: W  x   ~ N (0,1) y


/ n
x

V 
n  1S 2 ~ X n21 variables aleatorias independientes, entonces T 
/ n
=
x
~ t-
2 n  1S 2 S/ n
 2 (n  1)

Student con (n-1) grados de libertad


La función de densidad de probabilidad de la variable t-Student es:
 n 1  n 1 
   
 2  2 
 2  1  t 
f (t ) 

, t 
n n 
  n  
2

15
Propiedades:
1. f(t) es simétrica con respecto al eje de la ordenada, E(t)=0, pero su varianza es mayor
que 1 lo que resulta ser más achatada y de colas más altas que la normal.
2. Existe una curva para cada (n-1) grados de libertad.
3. P(t  t 0 )  FT t 0  se encuentra tabulada para los distintos grados de libertad.

La muestra aleatoria es sacada de una población normal, pero los parámetros  y  2 son
desconocidos. La estandarización de la variable aleatoria está dada en el siguiente teorema:

Teorema 3. Sea X 1 , X 2 ,......., X n una muestra aleatoria extraída de una población normal
X ~ N (, 2 ) . Entonces, la variable aleatoria 𝑡 = tiene distribución t de Student con
/√
𝑛 − 1 grados de libertad.

4.2.4 Estimación Puntual de Parámetros


Un Estimador Puntual es un estadístico cuyos valores son utilizados como valores estimados
de un parámetro. El valor de un estimador puntual recibe el nombre de estimación. Si en una
distribución se conoce su distribución, pero se ignora los valores que toma el parámetro, el
problema estadístico consiste en estimar dicho valor a través de la información entregada por
una muestra.
Llamaremos Estimador de un parámetro  a cualquier estadístico o función de la muestra
aleatoria que nos permite hacer conjeturas acerca del verdadero valor  que es desconocido.
Por ejemplo, a menudo es necesario estimar: La media  de una población; la varianza  2
de una población, la proporción p de objetos de una población que pertenecen a cierta clase
de interés;

Observe que un estimador  de un parámetro  es una variable aleatoria porque depende de
los datos muestrales: x, S 2 , ...., etc. Así un estimador tiene una esperanza y una varianza E  

 

y V   .

 
Insesgamiento Un estimador es insesgado si el valor medio de todas sus estimaciones

obtenidas en una muestra de tamaño n, es igual al parámetro que estima. Entonces  es un
estimador insesgado si E     . De lo contrario se dice que es sesgado. El sesgo B de un

 

estimador puntual  es B(θ) = E   


 

 
Observación

Sea p el estimador de la proporción p de elementos de una población con cierto atributo. Se
n
  Xi 1 si el elemento posee el atributo de interés
define p  i 1 donde X i  
n 0 si el elemento no posee el atributo de interés

16
  p (1  p )
Verifique que: i) p es estimador insesgado de p. ii) la varianza de p es
n

Error Cuadrático Medio. El ECM es el valor esperado de la desviación cuadrática entre el



estimador y el parámetro que estima ECM = E (   ) 2 , desarrollando la expresión, se obtiene:

2
   

  
  
 
E (   ) = E   E ( )    E ( )    = V ( ) + B 2 ( )
2
   
  


Esto es, el error cuadrático medio de  es igual a la varianza del estimador más el cuadrado
 
del sesgo. Si  es un estimador insesgado de  , el error cuadrático medio de  es igual a

la varianza de  . El error cuadrático medio es un criterio importante para comparar dos
estimadores. Según los valores del parámetro, es posible que un estimador sesgado sea mejor
que uno insesgado.

Métodos de estimación. Existen métodos para obtener unos estimadores puntuales de los
parámetros poblacionales; como por ejemplo el método de máxima verosimilitud.

Método de Máxima Verosimilitud (EMV). Consideremos una variable aleatoria X con


distribución de forma conocida f que depende de un parámetro  desconocido. Si una m. a.
de n observaciones X 1 , X 2 ,......., X n es tomada, se define la función de verosimilitud de dicha
muestra:
L( X1, X 2 ,...., X n ; ) = ∏ 𝑓(𝑥 ; 𝜃)

A la función de probabilidad conjunta, si X es discreta o función de densidad conjunta si X


es continua que resulta para un determinado valor de  . Para cada valor de  , la función de

Verosimilitud de la muestra sería distinta. El EMV de  , denotado por  , basado en una
muestra aleatoria ( X 1 , X 2 ,......., X n ) es aquel que hace máxima a la función de verosimilitud.

Observación:
1. Para simplificar el cálculo del máximo de la función de verosimilitud aplicamos logaritmo
natural a la función L( X ;  ) , lo que es posible dado que la función logaritmo es una función
creciente y por tanto, el máximo valor de L( X ;  ) se obtiene para el mismo valor que la
función logaritmo natural.
d
2. Si la distribución depende de un parámetro  entonces ln l ( X ,  ) = 0 llamada
d
Ecuación de Verosimilitud. Si la distribución depende de dos parámetros  =  ,   entonces
se forma un sistema de ecuaciones de verosimilitud.
Observe que los EMV pueden ser sesgados, pero al incrementar el tamaño de la muestra n se
hace asintóticamente insesgados. Por ejemplo: El estimador de la varianza obtenida en una
muestra n de una población normal es  
2 n  1 S2 .
n

17
Se muestra en la Tabla siguiente algunos Estimadores Máximo verosímiles de acuerdo a la
distribución de probabilidad

Distribución Probabilidad Parámetro EMV


Bernoulli 𝑝 ∑ 𝑋
𝑝̂ =
𝑛
Binomial (k,p) 𝑋 ∑
𝑝̂ =
𝑝 𝑛𝑘
Poisson 𝜆 ∑ 𝑋
𝜆=
𝑛
Exponencial 1 ∑ 𝑋
𝜃= 𝜃=
𝜆 𝑛
Normal 𝜇 ∑ 𝑋
𝜇=
𝑛
( )
𝜎 𝜎 =

Gamma (𝛼 = 2 𝑦 𝜃) 𝜃 ∑ 𝑋
𝜃=
2𝑛

4.3 Actividades Propuestas (Ayudantía)


Actividad 4.3.1
Una empresa de equipos computacionales, ha determinado que el precio de costo de cada
equipo es una variable aleatoria que se distribuye normal con media $500 y desviación
estándar de $50
a) Si se toma una muestra aleatoria de 5 equipos, ¿cuál es la probabilidad de que el costo
promedio esté entre $521 y $540.
b) Considerando una muestra aleatoria de tamaño 10 del precio de costo, ¿cuál es la
probabilidad que la desviación estándar muestral sea inferior a $68,56?

a) X: Precio de costo de equipos computacionales X ~ N (500,2500 )


Se pide P 521  x  540 =   521  500
P
 50 / 5

Z
540  500 
50 / 5 
=  (1,79)   (0,94) = 0,1369

b) P(
n  1S 2 
9  68,56 2
) = P X 2  16,92  = 0.95
2 50 2  9 

Actividad 4.3.2
Se desea comparar los tiempos promedios de ejecución utilizados en una empresa cuando un
mismo trabajo se realiza permanentemente por dos métodos diferentes. Se sabe que los
tiempos de ejecución, en minutos, por los dos métodos sigue una distribución normal con 𝜇
= 100 y 𝜇 = 80. Se sabe además, que las varianzas de los tiempos de ejecución son
desconocidas pero iguales.Si seleccionamos dos muestras aleatorias independientes de
tamaños 𝑛 = 10 del método 1 y 𝑛 = 20 del método 2, obteniendo 𝑆 = 4 y 𝑆 = 12
respectivamente.

18
a) ¿Cuál es la probabilidad que la media de la muestra de los tiempos de ejecución del trabajo
por el método 1 sea superior a 99,56 minutos?
b) ¿Cuál es la probabilidad que en la muestra del método 2, la razón de la varianza de la
muestra entre la varianza verdadera sea inferior a 0,53247?

Sean
𝑋 : Tiempo de aplicación de un trabajo por el método 1 𝑋 ~ 𝑁(𝜇 = 100; 𝜎 )
𝑋 : Tiempo de aplicación de un trabajo por el método 2 𝑋 ~ 𝑁(𝜇 = 80; 𝜎 )

Además, 𝑛 = 10 𝑆 = 4 𝑛 = 20 𝑆 = 12
a) La varianza de la población es desconocida, por tanto: ~𝑡

,
𝑃(𝑋1 > 99,56) = 1 − 𝑃(𝑡 ≤ ) = 1 - 𝑃(𝑡 ≤ −0,6957) = 0,75

Hay una probabilidad del 75% de que la media de la muestra de los tiempos de ejecución del
trabajo por el método 1 sea superior a 99,56 minutos

( )
b) ~ 𝑋 𝐴𝑠í, 𝑃 < 0,53247 = 𝑃(𝑋 < 10,11693) = 0,05

Hay un 5% de probabilidad de que la razón de la varianza de la muestra entre la varianza


verdadera sea inferior a 0,53247.

Actividad 4.3.3
Los pesos de los ladrillos para techos producidos en la planta R de cierta empresa presentan
distribución normal con peso medio 930 kg. y desviación estándar 0,06 kg. Se seleccionó al
azar 40 ladrillos para techo producidos en la planta R.
a) ¿De los 40 ladrillos para techo producidos por la máquina R, ¿cuál es la probabilidad de
que la desviación estándar muestral del peso sea a los más de 0,076 kg.?
b) ¿Cuántos ladrillos se deben seleccionar para que el peso medio de la muestra no difiera de
la verdadera media en a lo más de 0,02 kg. con un 98% de confianza?

a) Sea la variable aleatoria X: peso de los ladrillos producidos por la planta R


𝑋 ~ 𝑁(𝜇 = 930 , 𝜎 = 0,06 )
(( )
𝑋 , 𝑋 ,…,𝑋 una muestra aleatoria de tamaño 40, por teorema 2: ~𝑋
∙ ,
𝑃(𝑆 < 0,076) = 𝑃 𝑋 < = 𝑃(𝑋 < 62,57) = 0,99
,
Hay una probabilidad de 0,99 de que la desviación estándar muestral del peso sea a lo más
de 0,078 kg.

b) Con un nivel de confianza del 98% → Z(0,99) = 2,33


2,33 ∙ 0,06
𝑛= = 48,8
0,02
Se requiere seleccionar 49 ladrillos.

19
Actividad 4.3.4
En una empresa que se dedica a la producción de motos se estableció lo siguiente en relación
con sus operarios encargados del ensamble de los motores de alta cilindrada: el tiempo de
ensamble se distribuye normalmente con una media de 16 minutos y una varianza de 0,36
minutos2. Si se elige aleatoriamente 25 motores para ser ensamblados.
a) ¿Cuál es la probabilidad de que la media muestral del tiempo de ensamblaje sea a lo más
de 15,75 minutos?
b) ¿Cuál es la probabilidad de que la desviación estándar de la muestra del tiempo de
ensamblaje sea mayor que 0,7057 minutos?
c) ¿Cuántos motores deberían de seleccionarse tal que se tenga una probabilidad de 0,045 de
que la media muestral del tiempo de ensamblaje sea de por lo menos 16,15 minutos?

a) Sea la variable aleatoria X: Tiempo de ensamble de los motores de alta cilindrada


𝑋 ~ 𝑁(𝜇 = 16; 𝜎 = 0,36)
,
m.a. 𝑋 , 𝑋 , . .. , 𝑋 Por Teorema 1 se tiene que 𝑋 ~ 𝑁(𝜇 = 16; = = 0,0144)
,
𝑃(𝑋 ≤ 15,75) = 𝑃(𝑍 ≤ ) = 𝑃(𝑍 ≤ −2,08) = 0,018763
√ ,
Hay una probabilidad de 0,018763 de que la media muestral del tiempo de ensamblaje sea a
lo más de 15,75 minutos.

∙ ,
b) 𝑃(𝑆 > 0,7057) = 𝑃 𝑋 > = 1 − 𝑃(𝑋 ≤ 33,2) = 1 − 0,9 = 0,1
,
Hay una probabilidad de 0,1 de que la desviación estándar de la muestra del tiempo de
ensamblaje sea mayor que 0,7057 minutos. (5 puntos)

, , √
c) 𝑃(𝑋 ≥ 16,15) = 1 − 𝑃 𝑍 ≤ = 0,045 → 𝑃 𝑍 ≤ = 0,955
, ,

→ 0,25√𝑛 = 1,70 → 𝑛 = 47
Se requieren 47 motores.

4.4 Actividades Propuestas (Laboratorio de Computación)


Actividad 4.4.1
Un agricultor dedicado al cultivo de olivos para producción de aceite, se ha fijado como
objetivo conseguir un sistema productivo que le permita el máximo beneficio en el mínimo
plazo de recuperación del capital.
El agricultor tiene 730 ha plantadas de olivos a una densidad de 312 árboles por ha. Se sabe
que cada árbol puede llegar a producir entre 20 y 50 kg de fruta aproximadamente y que para
obtener un litro de aceite hacen falta entre 4 a 6 kg de aceitunas.
Al agricultor, cada año le interesa estimar la producción media de kg de aceituna que
cosechará para de esta forma poder estimar su producción de aceite.

20
Si observamos el agricultor tiene 227.760 árboles y para estimar la cosecha se aplican ciertas
fórmulas que implican medir cada árbol, sin embargo medir cada olivo tiene un costo no
muy bajo ya que se requiere de expertos en la materia pero, ¿Es realmente importante medir
la totalidad de los olivos para estimar su producción?
Como mencionamos anteriormente, la estadística ofrece métodos alternativos para realizar
dichas estimaciones, con un ahorro significativo en los costos del estudio y con un alto grado
de confianza. A fin de comprender dicha teoría vamos a considerar una población teórica de
sólo ocho olivos y realizaremos un muestreo aleatorio simple de sólo 4 árboles.
Cuando seleccionamos una muestra mediante un muestreo aleatorio simple, sin reemplazo
8
dicha muestra es una de entre las    70 muestras posibles, ya que si la realizamos con
 4
4
reemplazo tenemos 8 = 4.096 muestras posibles.
Suponga que nuestra población censada de 8 árboles arrojo los siguientes valores en
kilogramos de aceituna:
árbol 1: 36 árbol 2: 30 árbol 3: 39 árbol 4: 46
árbol 5: 41 árbol 6: 48 árbol 7: 25 árbol 8: 37
A partir de los datos tenemos que la cantidad total de kg de aceitunas es de 302 kg,
  37.75 kg,  2  51.375   7.17199414.

Hacer un censo implica conocer los valores reales de los parámetros. Supongamos ahora que
no es posible estudiar la población total y que para representar los parámetros trabajaremos
con una muestra de tamaño 4.
A continuación se muestran las 70 muestras posibles, sin reemplazo, de tamaño 4
seleccionada aleatoriamente de la población de tamaño 8 junto al promedio de cada muestra.

x1 x2 x3 x4 promedio x1 x2 x3 x4 promedio
36 30 39 46 37.75 36 30 41 25 33
36 30 39 41 36.5 36 30 41 37 36
36 30 39 48 38.25 36 30 48 25 34.75
36 30 39 25 32.5 36 30 48 37 37.75
36 30 39 37 35.5 36 30 25 37 32
36 30 46 41 38.25 36 39 46 41 40.5
36 30 46 48 40 36 39 46 48 42.25
36 30 46 25 34.25 36 39 46 25 36.5
36 30 46 37 37.25 36 39 46 37 39.5
36 30 41 48 38.75 36 39 41 48 41

36 39 41 25 35.25 36 46 25 37 36
36 39 41 37 38.25 36 41 48 25 37.5
36 39 48 25 37 36 41 48 37 40.5
36 39 48 37 40 36 41 25 37 34.75
36 39 25 37 34.25 36 48 25 37 36.5
36 46 41 48 42.75 30 39 46 41 39
36 46 41 25 37 30 39 46 48 40.75

21
36 46 41 37 40 30 39 46 25 35
36 46 48 25 38.75 30 39 46 37 38
36 46 48 37 41.75 30 39 41 48 39.5

x1 x2 x3 x4 promedio x1 x2 x3 x4 promedio
30 39 41 25 33.75 30 46 25 37 34.5
30 39 41 37 36.75 30 41 48 25 36
30 39 48 25 35.5 30 41 48 37 39
30 39 48 37 38.5 30 41 25 37 33.25
30 39 25 37 32.75 30 48 25 37 35
30 46 41 48 41.25 39 46 41 48 43.5
30 46 41 25 35.5 39 46 41 25 37.75
30 46 41 37 38.5 39 46 41 37 40.75
30 46 48 25 37.25 39 46 48 25 39.5
30 46 48 37 40.25 39 46 48 37 42.5
39 46 25 37 36.75 46 41 48 25 40
39 41 48 25 38.25 46 41 48 37 43
39 41 48 37 41.25 46 41 25 37 37.25
39 41 25 37 35.5 46 48 25 37 39
39 48 25 37 37.25 41 48 25 37 37.75

Si observamos, en muestras distintas algunos promedios muestrales resultan distintos y frente


a un estudio, sola una de estas muestras será seleccionada, y por tanto el promedio muestral
correspondiente será usado para representar el verdadero valor de la media. Tenga en cuenta
1 4
que la variable promedio muestral X   xi es una variable aleatoria y por tanto podemos
4 i 1
obtener su distribución de frecuencia y su histograma.

Distribución de frecuencias de
la variable promedio muestral, Distribución del promedio muestral
muestras sin reemplazo. 0.27
Clase LI LS ni fi
1 32.00 33.64 5 0.07 0.20
frecuencia relativa

2 33.64 35.29 9 0.13


3 35.29 36.93 12 0.17 0.13

4 36.93 38.57 18 0.26


5 38.57 40.21 12 0.17 0.07

6 40.21 41.86 9 0.13


0.00
7 41.86 43.50 5 0.07 30.36 32.00 33.64 35.29 36.93 38.57 40.21 41.86 43.50 45.14
promedio

Algunas medidas estadísticas para la variable promedio muestral basada en muestras sin
reemplazo son:

22
variable promedio muestral
Media 37.75
Mediana 37.75
Moda 37.75
Desviación estándar 2.710758987
Varianza de las medias 7.348214286
Mínimo 32
Máximo 43.5
N 70

Recordemos que las medidas estadísticas de la población de ocho árboles son:


  37.75 kg,   7.17199414  2  51.375
Observando la media de las medias muestrales, que denotaremos por  X , es igual a la media
de la población de los ocho árboles y la varianza de las media muestrales que denotaremos
por  X2 , es 7.348214286, la cual en relación a la varianza de la población de ocho árboles es

 N  n 
2
 N n  1 84 1
      0.142857 veces más pequeña, es decir  2
   .
 N 1  n  8 1  4  N 1  n
X

Observemos ahora la distribución de frecuencias y su histograma para las medias muestrales


basadas en muestras de tamaño 4 seleccionadas con reemplazo.

Distribución de frecuencias de la Variable promedio muestral, muestras


Con reemplazo

Clase LI LS FA FR
1 25.00 26.77 5 1.2E-03 Distribución del promedio muestral
2 26.77 28.54 18 4.4E-03 0.20
3 28.54 30.31 73 0.02
4 30.31 32.08 186 0.05 0.15
frecuencia relativa

5 32.08 33.85 318 0.08


6 33.85 35.62 546 0.13 0.10
7 35.62 37.38 722 0.18
8 37.38 39.15 761 0.19
0.05
9 39.15 40.92 674 0.16
10 40.92 42.69 443 0.11
0.00
11 42.69 44.46 236 0.06 25.88 29.42 32.96 36.50 40.04 43.58 47.12
24.12 27.65 31.19 34.73 38.27 41.81 45.35 48.88
12 44.46 46.23 95 0.02
Promedio
13 46.23 48.00 19 4.6E-03

Algunas medidas estadísticas para la variable promedio muestral basada en muestras con
reemplazo son:

23
Variable Promedio muestral
Media 37.75
Mediana 37.75
Moda 37.25
Desviación estándar 3.58599707
Varianza de las medias 12.859375
Mínimo 25
Máximo 48
N 4096

Observemos nuevamente la media de las medias muestrales es igual a la media de la


población de los ocho árboles y la varianza de las media muestrales es 12.859375, la cual en
1 1
relación a la varianza de la población de ocho árboles es   0.25 más pequeña, es decir
n 4
2
 X2  .
n

Actividad 4.4.2 Ahora simularemos la selección de muestras obtenidas desde una


Distribución Normal con media 120 y desviación estándar 50, considerando muestras de
tamaño 10, 20, 30 y 40. Para cada una de ellas obtendremos 1000 muestras a fin de estudiar
la distribución muestral del estadístico muestral X .

Caso 1: Distribución del promedio muestral basado en 1000 muestras de tamaño 10.
Distribución de frecuencias de las medias muestrales basadas en 1000 muestras de tamaño 10

Dsitribución del promedio muestral


Clase LI LS ni fi
0.31
1 64.11 75.88 2 2.0E-03
2 75.88 87.65 14 0.01 0.23
frecuencia relativa

3 87.65 99.42 68 0.07


4 99.42 111.19 195 0.20 0.15
5 111.19 122.96 291 0.29
6 122.96 134.73 243 0.24 0.08

7 134.73 146.49 143 0.14


0.00
8 146.49 158.26 40 0.04 52.3 65.3 78.2 91.2 104.1 117.1 130.0 143.0 155.9 168.9 181.8
9 158.26 170.03 4 4.0E-03 medias n=10

Estadística de la variable promedio muestral en 1000 muestras de tamaño 10


n Media D.E. Var(n) Mín Máx Mediana
1000 120.41 15.53 240.93 64.11 170.03 120.37

Nota: La media de la muestra debería ser 120, la no coincidencia se basa en que estamos
tomando sólo 1000 muestras en una población infinita.

24
Caso 2: Distribución del promedio muestral basado en 1000 muestras de tamaño 20.
Distribución de frecuencias de las medias muestrales
basadas en 1000 muestras de tamaño 20

Clase LI LS ni fi . Distribución del promedio muestral


1 80.45 88.46 5 0.01 0.28
2 88.46 96.47 18 0.02
3 96.47 104.48 82 0.08 0.21

frecuencia relativa
4 104.48 112.48 150 0.15
5 112.48 120.49 270 0.27 0.14

6 120.49 128.50 259 0.26


0.07
7 128.50 136.50 146 0.15
8 136.50 144.51 60 0.06 0.00
9 144.51 152.52 10 0.01 72.4 81.3 90.1 98.9 107.7 116.5 125.3 134.1 142.9 151.7 160.5
medias n=20

Estadística de la variable promedio muestral basado en 1000 muestras de tamaño 20

n Media D.E. Var(n) Mín Máx Mediana


1000 119.60 11.52 132.63 80.45 152.52 119.93

Nota: La media de la muestra debería ser 120, la no coincidencia se basa en que estamos
tomando sólo 1000 muestras en una población infinita.

Caso 3: Distribución del promedio muestral basado en 1000 muestras de tamaño 30.

Distribución de frecuencias de las medias muestrales


basadas en 1000 muestras de tamaño 30

Clase LI LS ni fi
Distribuciòn del promedio muestral
1 86.46 93.74 2 2.0E-03
0.36
2 93.74 101.02 15 0.02
3 101.02 108.29 77 0.08 0.27
frecuencia relativa

4 108.29 115.57 204 0.20


5 115.57 122.85 339 0.34 0.18

6 122.85 130.13 227 0.23


7 130.13 137.41 107 0.11 0.09

8 137.41 144.69 27 0.03


0.00
9 144.69 151.97 2 2.0E-03 79.2 87.2 95.2 103.2 111.2 119.2 127.2 135.2 143.2 151.2 159.2
n=30

Estadística de la variable promedio muestral basado en 1000 muestras de tamaño 30

n Media D.E. Var(n) Mín Máx Mediana


1000 120.12 9.02 81.32 86.46 151.97 119.91
Nota: La media de la muestra debería ser 120, la no coincidencia se basa en que estamos
tomando sólo 1000 muestras en una población infinita.

Caso 4: Distribución del promedio muestral basado en 1000 muestras de tamaño 40


Distribución de frecuencias de las medias muestrales basadas en 1000 muestras de tamaño 40

25
Clase LI LS ni fi
1 94.48 100.21 5 0.01 Distribución del promedio muestral
0.30
2 100.21 105.95 33 0.03
3 105.95 111.68 98 0.10 0.23

frecuencia relativa
4 111.68 117.42 248 0.25
5 117.42 123.15 288 0.29 0.15

6 123.15 128.89 217 0.22


7 128.89 134.62 88 0.09 0.08

8 134.62 140.36 19 0.02


0.00
9 140.36 146.10 4 4.0E-03 91.6 97.3 103.1 108.8 114.6 120.3 126.0 131.8 137.5 143.2 149.0
n=40

Estadística de la variable promedio muestral basado en 1000 muestras de tamaño 40


n Media D.E. Var(n) Mín Máx Mediana
1000 119.80 7.60 57.75 94.48 146.10 119.58

Nota: La media de la muestra debería ser 120, la no coincidencia se basa en que estamos
tomando sólo 1000 muestras en una población infinita.

Si observamos los histogramas para cada caso, estos se ven bastante simétricos, la media y
mediana son muy similares. Además, es poco frecuente encontrar valores de medias
muestrales muy alejadas del valor central, la mayor concentración de dichas medidas está en
tres o cuatro intervalos centrales.

Actividad 4.4.3
Por último, simularemos la selección de muestras obtenidas desde una Distribución
Binomial con parámetros m = 25 y p = 0.3. Consideraremos cuatro casos de 1000 muestras
de tamaño 10, 20, 30 y 40 cada una. Para cada una de las 1000 muestras obtendremos su
media a fin de estudiar la distribución muestral de este estadístico.

Caso 1: Distribución del promedio muestral basado en 1000 muestras de tamaño 10.
Distribución de frecuencias de las medias muestrales basadas en 1000 muestras de tamaño 10
Distribución del promedio muestral

0.25
Clase LI LS FA FR
1 5.30 5.77 10 0.01 0.19
frecuencia relativa

2 5.77 6.23 42 0.04


3 6.23 6.70 131 0.13 0.12
4 6.70 7.17 167 0.17
5 7.17 7.63 236 0.24
0.06
6 7.63 8.10 227 0.23
7 8.10 8.57 116 0.12
0.00
8 8.57 9.03 49 0.05 4.8 5.3 5.9 6.4 6.9 7.4 7.9 8.4 8.9 9.5 10.0
9 9.03 9.50 22 0.02 n = 10

Estadística de la variable promedio muestral basado en 1000 muestras de tamaño 10


n Media D.E. Var(n) Mín Máx Mediana Asimetria
1000 7.46 0.75 0.56 5.30 9.50 7.50 0.03

26
Caso 2: Distribución del promedio muestral basado en 1000 muestras de tamaño 20.
Distribución de frecuencias de las medias muestrales basadas en 1000 muestras de tamaño 20
Clase LI LS ni fi
1 6.00 6.33 11 0.01 Distribución del promedio muestral

2 6.33 6.66 36 0.04 0.25


3 6.66 6.98 97 0.10
4 6.98 7.31 226 0.23 0.19

frecuencia relativa
5 7.31 7.64 235 0.24
6 7.64 7.97 225 0.23 0.12

7 7.97 8.29 106 0.11


8 8.29 8.62 47 0.05 0.06
9 8.62 8.95 17 0.02
0.00
5.7 6.0 6.4 6.8 7.1 7.5 7.8 8.2 8.6 8.9 9.3
n = 20

Estadística de la variable promedio muestral basado en 1000 muestras de tamaño 20


n Media D.E. Var(n) Mín Máx Mediana Asimetria
1000 7.50 0.50 0.25 6.00 8.95 7.50 0.05

Caso 3: Distribución del promedio muestral basado en 1000 muestras de tamaño 30.
Distribución de frecuencias de las medias Distribución del promedio muestral
muestrales basadas en 1000 muestras de tamaño 30 0.33
Clase LI LS ni fi
1 6.20 6.51 7 0.01 0.25
frecuencia relativa

2 6.51 6.81 50 0.05


3 6.81 7.12 107 0.11 0.16
4 7.12 7.43 248 0.25
5 7.43 7.74 314 0.3 1 0.08
6 7.74 8.04 169 0.17
7 8.04 8.35 78 0.08 0.00
5.9 6.2 6.6 6.9 7.2 7.6 7.9 8.3 8.6 8.9 9.3
8 8.35 8.66 23 0.02 n = 30
9 8.66 8.97 4 4.0E-03
Estadística de la variable promedio muestral basado en 1000 muestras de tamaño 30

n Media D.E. Var(n) Mín Máx Mediana Asimetria


1000 7.51 0.42 0.18 6.20 8.97 7.50 0.04

Caso 4: Distribución del promedio muestral basado en 1000 muestras de tamaño 40.
Distribución de frecuencias de las medias
muestrales basadas en 1000 muestras de tamaño 40
Distribución del promedio muestral
Clase LI LS ni fi
1 6.33 6.58 5 0.01 0.30

2 6.58 6.84 32 0.03


3 6.84 7.10 102 0.10 0.23
frecuencia relativa

4 7.10 7.36 207 0.21


5 7.36 7.62 287 0.29 0.15

6 7.62 7.88 227 0.23


7 7.88 8.13 101 0.10 0.08

8 8.13 8.39 30 0.03


9 8.39 8.65 9 0.01 0.00
6.1 6.4 6.6 6.9 7.2 7.5 7.8 8.1 8.3 8.6 8.9
n = 40

27
Estadística de la variable promedio muestral basado en 1000 muestras de tamaño 40

n Media D.E. Var(n) Mín Máx Mediana Asimetria


1000 7.50 0.36 0.13 6.33 8.65 7.50 -0.03

Observando los histogramas, su forma pareciera no diferir mucho de la simetría. Aquí hay
que considerar los valores de los parámetros, por lo que será un buen desafío para Ud.
verificar lo comentado.

Actividad 4.4.4
Generación de muestras aleatorias y determinación aproximada de la distribución muestral
para 𝑥 y 𝑆 , ya que no se puede trabajar con todas las muestras posibles, usando R. Para ello
seguir los siguientes pasos:

1) Abrir el programa R, para ello hacemos clic en el icono, hecho esto aparece la consola de
R:

2) Cargar la aplicación Rcmdr, que nos permitirá trabajar en R usando una plataforma de
menú. Para ello siga la siguiente secuencia:

Hacer clic sobre la opción Paquete → Cargar → Buscar Rcmdr → ok y esperar que aparezca
la siguiente pantalla.

28
3) Generar 1000 muestras de tamaño 100 de una población distribuida normal con media 120
y desviación estándar 20, para ello seguimos la siguiente secuencia:

Luego en la siguiente pantalla dar los valores para lo que se quiere:

El nombre del archivo con las 1000 será NormalSamples, el cual se puede ver en el icono
Visualizar conjunto de datos en la pantalla de Rcmdr.

4) En las últimas columnas del archivo NormalSample, se puede visualizar que esta contiene
1000 medias muéstrales y 1000 sumas muéstrales cada una basada en 100 observaciones.

29
En el proceso de estimación puntual para el parámetro 𝜇, media de la población, sólo una de
las medias muéstrales será usada en este proceso ¿qué tan alejado estará del verdadero valor?
Las probabilidades nos dan la respuesta.

5) Realizar un histograma con cualquiera de las observaciones, para la media y la suma,


considerar por ejemplo la observación 25 y además el histograma para la variable media.
Se harán los dos gráficos en la misma hoja. Antes de hacer el histograma, en la hoja R
Script de Rcmdr escribir la siguiente instrucción:

par(mfrow = c(1,2))

Esta prepara la hoja para recibir dos gráficos, (una fila dos columnas). Para ejecutar la
instrucción marcar el rango y luego haga clic sobre ejecutar, luego seguir los siguientes
comandos:

Gráfico → Histograma ⟶ en datos marque obs25 → Opciones → Densidad y ACEPTAR.

Ahora sobreponer la curva normal en ambos histogramas, para ello en el R Script de R


escribir lo siguiente y luego ejecutar:

curve(dnorm(x,mean=mean(NormalSamples$obs25),sd=sd(NormalSamples$obs25)),
xlim= c(60,190),add=TRUE, col="red", lwd=2)

Realizar ahora el histograma con la variable mean.

Ahora sobreponer la curva normal en ambos histogramas, para ello en el R Script de R


escribir lo siguiente y luego ejecutar:

curve(dnorm(x,mean=mean(NormalSamples$mean),sd=sd(NormalSamples$mean)),
xlim =c(110,130),add=TRUE, col="red", lwd=2)

30
De la gráfica ¿Podemos observar que ambas variables siguen una distribución Normal?

Actividad 4.4.5
Repetir el procedimiento desarrollado en la actividad 4.4.4, pero con la generación de 1000
muestras de tamaño 100 de una población distribuida binomial con parámetros 𝑛 = 50, 𝑝 =
0,3 ¿Qué se puede observar de la distribución de la media y alguna observación?

Actividad 4.4.6
Repetir el procedimiento desarrollado en la actividad 4.4.4, pero con la generación de 500
muestras de tamaño 80 de una población distribuida exponencial con 𝜆 = 1⁄15 ¿Qué se
puede observar de la distribución de la media y alguna observación?

31

Das könnte Ihnen auch gefallen