Sie sind auf Seite 1von 38

Universidad Católica de la Santísima Concepción

Facultad de Ingeniería
Departamento de Matemática y Física Aplicadas IN1062C 2018
UNIDAD 5.1 DISTRIBUCIONES MUESTRALES, INTERVALOS DE CONFIANZA Y
PRUEBAS DE HIPÓTESIS EN UNA POBLACIÓN

Conceptos previos
En unidades anteriores estudiamos el concepto de variables aleatorias, que son, cuál es su
clasificación, cuál es su distribución de probabilidad teórica o empírica y si la distribución
de probabilidad depende de uno o más parámetros.
Conocida la distribución de probabilidad y conocido el valor del o los parámetros podemos
determinar probabilidades de ocurrencia de algún suceso de interés.
Un parámetro es una medida estadística obtenido con todos los datos de la población, esto
indica que para conocer el valor de un parámetro se debe estudiar la población en su totalidad,
es decir realizar un censo, sin embargo, realizar un censo es poco práctico ya sea por el alto
costo que ello involucra y por el tiempo asociado a los procesos, de aquí la importancia de
esta unidad. No conocer el valor del o los parámetros implica no poder determinar
probabilidades de ocurrencia de eventos. Debemos por lo tanto buscar alguna solución que
nos permita obtener dichas probabilidades.
En estadística, la solución nace de estudiar una pequeña parte de la población, que llamamos
muestra y a partir de esta inferir hacia la población.
Las medidas obtenidas con datos de una muestra reciben el nombre de estadístico.
Básicamente un estadístico es lo mismo que un parámetro, sólo que el parámetro es obtenido
con todos los datos de la población y un estadístico con los datos de la muestra, es por esto
que también serán denotados de distinta forma.
Rápidamente podemos intuir que el valor del estadístico puede cambiar de una muestra a
otra.
Es importante conceptualizar a los estadísticos como variables aleatorias que pueden asumir
diferentes valores en muestras diferentes, que será su distribución de probabilidad asociada
y cuáles son sus propiedades.
Comprender las distribuciones muestrales nos proporciona fundamentos para comprender
los procedimientos que permiten inferir sobre un parámetro que no conocemos a partir del
valor de un estadístico obtenido en un estudio realizado por muestreo probabilístico. Veamos
la siguiente situación práctica:

ACTIVIDAD 1. Un agricultor dedicado al cultivo de olivos para producción de aceite, se ha


fijado como objetivo conseguir un sistema productivo que le permita el máximo beneficio en
el mínimo plazo de recuperación del capital.
El agricultor tiene 730 ha plantadas de olivos a una densidad de 312 árboles por ha. Se sabe
que cada árbol puede llegar a producir entre 20 y 50 kg de fruta aproximadamente y que para
obtener un litro de aceite hacen falta entre 4 a 6 kg de aceitunas.
Al agricultor, cada año le interesa estimar la producción media de kg de aceituna que
cosechará para de esta forma poder estimar su producción de aceite.
Si observamos el agricultor tiene 227.760 árboles y para estimar la cosecha se aplican ciertas
fórmulas que implican medir cada árbol, sin embargo medir cada olivo tiene un costo no
muy bajo ya que se requiere de expertos en la materia pero, ¿Es realmente importante medir
la totalidad de los olivos para estimar su producción?
1
Como mencionamos anteriormente, la estadística ofrece métodos alternativos para realizar
dichas estimaciones, con un ahorro significativo en los costos del estudio y con un alto
grado de confianza. A fin de comprender dicha teoría vamos a considerar una población
teórica de sólo ocho olivos y realizaremos un muestreo aleatorio simple de sólo 4 árboles.
Cuando seleccionamos una muestra mediante un muestreo aleatorio simple, sin reemplazo
8
dicha muestra es una de entre las    70 muestras posibles, ya que si la realizamos con
 4
4
reemplazo tenemos 8 = 4.096 muestras posibles.
Suponga que nuestra población censada de 8 árboles arrojo los siguientes valores en
kilogramos de aceituna:
árbol 1: 36 árbol 2: 30 árbol 3: 39 árbol 4: 46
árbol 5: 41 árbol 6: 48 árbol 7: 25 árbol 8: 37
A partir de los datos tenemos que la cantidad total de kg de aceitunas es de 302 kg,
  37.75 kg,  2  51.375   7.17199414.

Hacer un censo implica conocer los valores reales de los parámetros. Supongamos ahora que
no es posible estudiar la población total y que para representar los parámetros trabajaremos
con una muestra de tamaño 4.
A continuación se muestran las 70 muestras posibles, sin reemplazo, de tamaño 4
seleccionada aleatoriamente de la población de tamaño 8 junto al promedio de cada muestra.

x1 x2 x3 x4 promedio x1 x2 x3 x4 promedio
36 30 39 46 37.75 36 30 41 25 33
36 30 39 41 36.5 36 30 41 37 36
36 30 39 48 38.25 36 30 48 25 34.75
36 30 39 25 32.5 36 30 48 37 37.75
36 30 39 37 35.5 36 30 25 37 32
36 30 46 41 38.25 36 39 46 41 40.5
36 30 46 48 40 36 39 46 48 42.25
36 30 46 25 34.25 36 39 46 25 36.5
36 30 46 37 37.25 36 39 46 37 39.5
36 30 41 48 38.75 36 39 41 48 41

36 39 41 25 35.25 36 46 25 37 36
36 39 41 37 38.25 36 41 48 25 37.5
36 39 48 25 37 36 41 48 37 40.5
36 39 48 37 40 36 41 25 37 34.75
36 39 25 37 34.25 36 48 25 37 36.5
36 46 41 48 42.75 30 39 46 41 39
36 46 41 25 37 30 39 46 48 40.75
36 46 41 37 40 30 39 46 25 35
36 46 48 25 38.75 30 39 46 37 38
36 46 48 37 41.75 30 39 41 48 39.5

2
x1 x2 x3 x4 promedio x1 x2 x3 x4 promedio
30 39 41 25 33.75 30 46 25 37 34.5
30 39 41 37 36.75 30 41 48 25 36
30 39 48 25 35.5 30 41 48 37 39
30 39 48 37 38.5 30 41 25 37 33.25
30 39 25 37 32.75 30 48 25 37 35
30 46 41 48 41.25 39 46 41 48 43.5
30 46 41 25 35.5 39 46 41 25 37.75
30 46 41 37 38.5 39 46 41 37 40.75
30 46 48 25 37.25 39 46 48 25 39.5
30 46 48 37 40.25 39 46 48 37 42.5
39 46 25 37 36.75 46 41 48 25 40
39 41 48 25 38.25 46 41 48 37 43
39 41 48 37 41.25 46 41 25 37 37.25
39 41 25 37 35.5 46 48 25 37 39
39 48 25 37 37.25 41 48 25 37 37.75

Si observamos, en muestras distintas algunos promedios muestrales resultan distintos y frente


a un estudio, sola una de estas muestras será seleccionada, y por tanto el promedio muestral
correspondiente será usado para representar el verdadero valor de la media. Tenga en cuenta
1 4
que la variable promedio muestral X   xi es una variable aleatoria y por tanto podemos
4 i 1
obtener su distribución de frecuencia y su histograma.
Distribución de frecuencias de
la variable promedio muestral, Distribución del promedio muestral
muestras sin reemplazo. 0.27
Clase LI LS ni fi
1 32.00 33.64 5 0.07 0.20
frecuencia relativa

2 33.64 35.29 9 0.13


3 35.29 36.93 12 0.17 0.13

4 36.93 38.57 18 0.26


5 38.57 40.21 12 0.17 0.07

6 40.21 41.86 9 0.13


0.00
7 41.86 43.50 5 0.07 30.36 32.00 33.64 35.29 36.93 38.57 40.21 41.86 43.50 45.14
promedio

Algunas medidas estadísticas para la variable promedio muestral basada en muestras sin
reemplazo son:
variable promedio muestral
Media 37.75
Mediana 37.75
Moda 37.75
Desviación estándar 2.710758987
Varianza de las medias 7.348214286
Mínimo 32
Máximo 43.5
N 70

3
Recordemos que las medidas estadísticas de la población de ocho árboles son:
  37.75 kg,   7.17199414  2  51.375
Observando la media de las medias muestrales, que denotaremos por  X , es igual a la media
de la población de los ocho árboles y la varianza de las media muestrales que denotaremos
por  X2 , es 7.348214286, la cual en relación a la varianza de la población de ocho árboles es
 N  n 
2
 N n  1 84 1
    0.142857 veces más pequeña, es decir  X  
2
  .
 N 1  n  8 1  4  N 1  n
Observemos ahora la distribución de frecuencias y su histograma para las medias muestrales
basadas en muestras de tamaño 4 seleccionadas con reemplazo.

Distribución de frecuencias de la Variable promedio muestral, muestras


Con reemplazo

Clase LI LS FA FR
1 25.00 26.77 5 1.2E-03 Distribución del promedio muestral
2 26.77 28.54 18 4.4E-03 0.20
3 28.54 30.31 73 0.02
4 30.31 32.08 186 0.05 0.15
frecuencia relativa

5 32.08 33.85 318 0.08


6 33.85 35.62 546 0.13 0.10
7 35.62 37.38 722 0.18
8 37.38 39.15 761 0.19
0.05
9 39.15 40.92 674 0.16
10 40.92 42.69 443 0.11
0.00
11 42.69 44.46 236 0.06 25.88 29.42 32.96 36.50 40.04 43.58 47.12
24.12 27.65 31.19 34.73 38.27 41.81 45.35 48.88
12 44.46 46.23 95 0.02
Promedio
13 46.23 48.00 19 4.6E-03

Algunas medidas estadísticas para la variable promedio muestral basada en muestras con
reemplazo son:
Variable Promedio muestral
Media 37.75
Mediana 37.75
Moda 37.25
Desviación estándar 3.58599707
Varianza de las medias 12.859375
Mínimo 25
Máximo 48
N 4096
Observemos nuevamente la media de las medias muestrales es igual a la media de la
población de los ocho árboles y la varianza de las media muestrales es 12.859375, la cual en
1 1
relación a la varianza de la población de ocho árboles es   0.25 más pequeña, es decir
n 4
2
 X2  .
n

4
ACTIVIDAD 2. Ahora simularemos la selección de muestras obtenidas desde una
Distribución Normal con media 120 y desviación estándar 50, considerando muestras de
tamaño 10, 20, 30 y 40. Para cada una de ellas obtendremos 1000 muestras a fin de estudiar
la distribución muestral del estadístico muestral X .

Caso 1: Distribución del promedio muestral basado en 1000 muestras de tamaño 10.
Distribución de frecuencias de las medias
muestrales basadas en 1000 muestras de tamaño 10
Dsitribución del promedio muestral
Clase LI LS ni fi
0.31
1 64.11 75.88 2 2.0E-03
2 75.88 87.65 14 0.01 0.23

frecuencia relativa
3 87.65 99.42 68 0.07
4 99.42 111.19 195 0.20 0.15
5 111.19 122.96 291 0.29
6 122.96 134.73 243 0.24 0.08

7 134.73 146.49 143 0.14


0.00
8 146.49 158.26 40 0.04 52.3 65.3 78.2 91.2 104.1 117.1 130.0 143.0 155.9 168.9 181.8
9 158.26 170.03 4 4.0E-03 medias n=10

Estadística de la variable promedio muestral en 1000 muestras de tamaño 10


n Media D.E. Var(n) Mín Máx Mediana
1000 120.41 15.53 240.93 64.11 170.03 120.37

Nota: La media de la muestra debería ser 120, la no coincidencia se basa en que estamos
tomando sólo 1000 muestras en una población infinita.

Caso 2: Distribución del promedio muestral basado en 1000 muestras de tamaño 20.
Distribución de frecuencias de las medias muestrales
basadas en 1000 muestras de tamaño 20

Clase LI LS ni fi . Distribución del promedio muestral


1 80.45 88.46 5 0.01 0.28
2 88.46 96.47 18 0.02
3 96.47 104.48 82 0.08 0.21
frecuencia relativa

4 104.48 112.48 150 0.15


5 112.48 120.49 270 0.27 0.14

6 120.49 128.50 259 0.26


0.07
7 128.50 136.50 146 0.15
8 136.50 144.51 60 0.06 0.00
9 144.51 152.52 10 0.01 72.4 81.3 90.1 98.9 107.7 116.5 125.3 134.1 142.9 151.7 160.5
medias n=20

Estadística de la variable promedio muestral basado en 1000 muestras de tamaño 20

n Media D.E. Var(n) Mín Máx Mediana


1000 119.60 11.52 132.63 80.45 152.52 119.93

Nota: La media de la muestra debería ser 120, la no coincidencia se basa en que estamos
tomando sólo 1000 muestras en una población infinita.

5
Caso 3: Distribución del promedio muestral basado en 1000 muestras de tamaño 30.

Distribución de frecuencias de las medias muestrales


basadas en 1000 muestras de tamaño 30

Clase LI LS ni fi
Distribuciòn del promedio muestral
1 86.46 93.74 2 2.0E-03
0.36
2 93.74 101.02 15 0.02
3 101.02 108.29 77 0.08 0.27

frecuencia relativa
4 108.29 115.57 204 0.20
5 115.57 122.85 339 0.34 0.18

6 122.85 130.13 227 0.23


7 130.13 137.41 107 0.11 0.09

8 137.41 144.69 27 0.03


0.00
9 144.69 151.97 2 2.0E-03 79.2 87.2 95.2 103.2 111.2 119.2 127.2 135.2 143.2 151.2 159.2
n=30

Estadística de la variable promedio muestral basado en 1000 muestras de tamaño 30

n Media D.E. Var(n) Mín Máx Mediana


1000 120.12 9.02 81.32 86.46 151.97 119.91
Nota: La media de la muestra debería ser 120, la no coincidencia se basa en que estamos
tomando sólo 1000 muestras en una población infinita.

Caso 4: Distribución del promedio muestral basado en 1000 muestras de tamaño 40


Distribución de frecuencias de las medias muestrales
basadas en 1000 muestras de tamaño 40

Clase LI LS ni fi
1 94.48 100.21 5 0.01 Distribución del promedio muestral
0.30
2 100.21 105.95 33 0.03
3 105.95 111.68 98 0.10 0.23
frecuencia relativa

4 111.68 117.42 248 0.25


5 117.42 123.15 288 0.29 0.15

6 123.15 128.89 217 0.22


7 128.89 134.62 88 0.09 0.08

8 134.62 140.36 19 0.02


0.00
9 140.36 146.10 4 4.0E-03 91.6 97.3 103.1 108.8 114.6 120.3 126.0 131.8 137.5 143.2 149.0
n=40

Estadística de la variable promedio muestral basado en 1000 muestras de tamaño 40


n Media D.E. Var(n) Mín Máx Mediana
1000 119.80 7.60 57.75 94.48 146.10 119.58

Nota: La media de la muestra debería ser 120, la no coincidencia se basa en que estamos
tomando sólo 1000 muestras en una población infinita.

Si observamos los histogramas para cada caso, estos se ven bastante simétricos, la media y
mediana son muy similares. Además, es poco frecuente encontrar valores de medias
muestrales muy alejadas del valor central, la mayor concentración de dichas medidas está en
tres o cuatro intervalos centrales.

6
ACTIVIDAD 3. Por último, simularemos la selección de muestras obtenidas desde una
Distribución Binomial con parámetros m = 25 y p = 0.3. Consideraremos cuatro casos de
1000 muestras de tamaño 10, 20, 30 y 40 cada una. Para cada una de las 1000 muestras
obtendremos su media a fin de estudiar la distribución muestral de este estadístico.

Caso 1: Distribución del promedio muestral basado en 1000 muestras de tamaño 10.
Distribución de frecuencias de las medias
muestrales basadas en 1000 muestras de tamaño 10 Distribución del promedio muestral
Clase LI LS FA FR 0.25
1 5.30 5.77 10 0.01
2 5.77 6.23 42 0.04
0.19

frecuencia relativa
3 6.23 6.70 131 0.13
4 6.70 7.17 167 0.17
0.12
5 7.17 7.63 236 0.24
6 7.63 8.10 227 0.23
0.06
7 8.10 8.57 116 0.12
8 8.57 9.03 49 0.05
0.00
9 9.03 9.50 22 0.02 4.8 5.3 5.9 6.4 6.9 7.4 7.9 8.4 8.9 9.5 10.0
n = 10
Estadística de la variable promedio muestral basado en 1000 muestras de tamaño 10
n Media D.E. Var(n) Mín Máx Mediana Asimetria
1000 7.46 0.75 0.56 5.30 9.50 7.50 0.03

Caso 2: Distribución del promedio muestral basado en 1000 muestras de tamaño 20.
Distribución de frecuencias de las medias muestrales basadas en 1000 muestras de tamaño 20
Clase LI LS ni fi
1 6.00 6.33 11 0.01 Distribución del promedio muestral

2 6.33 6.66 36 0.04 0.25


3 6.66 6.98 97 0.10
4 6.98 7.31 226 0.23 0.19
frecuencia relativa

5 7.31 7.64 235 0.24


6 7.64 7.97 225 0.23 0.12
7 7.97 8.29 106 0.11
8 8.29 8.62 47 0.05 0.06
9 8.62 8.95 17 0.02
0.00
5.7 6.0 6.4 6.8 7.1 7.5 7.8 8.2 8.6 8.9 9.3
n = 20
Estadística de la variable promedio muestral basado en 1000 muestras de tamaño 20
n Media D.E. Var(n) Mín Máx Mediana Asimetria
1000 7.50 0.50 0.25 6.00 8.95 7.50 0.05

Caso 3: Distribución del promedio muestral basado en 1000 muestras de tamaño 30.
Distribución de frecuencias de las medias Distribución del promedio muestral
muestrales basadas en 1000 muestras de tamaño 30 0.33
Clase LI LS ni fi
1 6.20 6.51 7 0.01 0.25
frecuencia relativa

2 6.51 6.81 50 0.05


3 6.81 7.12 107 0.11 0.16
4 7.12 7.43 248 0.25
5 7.43 7.74 314 0.3 1 0.08
6 7.74 8.04 169 0.17
7 8.04 8.35 78 0.08 0.00
5.9 6.2 6.6 6.9 7.2 7.6 7.9 8.3 8.6 8.9 9.3
8 8.35 8.66 23 0.02 n = 30
9 8.66 8.97 4 4.0E-03

7
Estadística de la variable promedio muestral basado en 1000 muestras de tamaño 30

n Media D.E. Var(n) Mín Máx Mediana Asimetria


1000 7.51 0.42 0.18 6.20 8.97 7.50 0.04

Caso 4: Distribución del promedio muestral basado en 1000 muestras de tamaño 40.
Distribución de frecuencias de las medias
muestrales basadas en 1000 muestras de tamaño 40
Distribución del promedio muestral
Clase LI LS ni fi
1 6.33 6.58 5 0.01 0.30

2 6.58 6.84 32 0.03


3 6.84 7.10 102 0.10 0.23

frecuencia relativa
4 7.10 7.36 207 0.21
5 7.36 7.62 287 0.29 0.15

6 7.62 7.88 227 0.23


7 7.88 8.13 101 0.10 0.08

8 8.13 8.39 30 0.03


9 8.39 8.65 9 0.01 0.00
6.1 6.4 6.6 6.9 7.2 7.5 7.8 8.1 8.3 8.6 8.9
n = 40
Estadística de la variable promedio muestral basado en 1000 muestras de tamaño 40

n Media D.E. Var(n) Mín Máx Mediana Asimetria


1000 7.50 0.36 0.13 6.33 8.65 7.50 -0.03

Observando los histogramas, su forma pareciera no diferir mucho de la simetría. Aquí hay
que considerar los valores de los parámetros, por lo que será un buen desafío para Ud.
verificar lo comentado.

ACTIVIDAD 4. Con el fin de estimar el tiempo del trayecto desde la casa a la universidad,
se realiza un estudio para analizar el número de detenciones que hace un conductor en los
semáforos, ya sea en un viaje de ida o vuelta, encontrando, mediante la elaboración de
distribuciones de probabilidades para variables aleatorias discretas acotadas lo siguiente:

X 0 1 2
f(x) = P(X = x) 0.2 0.5 0.3

Asumiendo la variable aleatoria X como el número de detenciones que hace el conductor ya


sea en un viaje de ida o de vuelta
a. Observe que la distribución de probabilidad tanto para la variable aleatoria X1: número de
semáforos en los que el conductor se detiene en un viaje de ida como para la variable aleatoria
X2 número de semáforos en los que el conductor se detiene en un viaje de vuelta, es dada por.
0, 2 x  0

P( X i  x)   0,5 x  1 i = 1, 2
0,3 x  2

Cuya representación gráfica es:
Distribución del número de detenciones en semáforos en un viaje
entre la casa y la Universidad

0.6
0.5
0.4
0.3
0.2
0.1 8
0
0 1 2
Además su valor esperado  y desviación estándar  es.
 = E(X) = 0×0.2 + 1×0.5 + 2×0.3 = 1.1
E(X2) = 02×0.2 + 12×0.5 + 22×0.3 = 1.7
 2 = V(X) = E(X2) - (E(X))2 = 1.7 – 1.12 = 0.49 y  = 0.7

b. Las variables aleatorias X1 y X2 son variables aleatorias independientes y además al


tener la misma distribución de probabilidad,  X 1 , X 2  forman una muestra aleatoria de
tamaño 2. Enumere todas las muestras aleatorias de tamaño 2 con reemplazo que pueden
obtenerse por detención de los semáforos.

Se obtienen 9 muestras (3x3) de tamaño dos:


(0,0) (0,1) (0,2) (1,0) (1,1) (1,2) (2,0) (2,1) (2,2)

c. Defina la variable aleatoria T = X1 + X2. Obtenga la distribución de probabilidad de T.


Distribución de Probabilidad de T
Muestras Probabilidad Suma T P(T = t)
(0,0) p(0,0) = p(0) p(0) 0 0.04
(1,0) (0,1) 2p(0)p(1) 1 0.2
(0,2) (2,0) (1,1) 2p(0)p(2) +p(1)p(1) 2 0.37
(1,2) (2,1) 2 p(1) p(2) 3 0.3
(2,2) p(2)p(2) 4 0.09
1

d. Dibuje un gráfico adecuado para representar la distribución de T y compárela con (b).

e. Calcule la media de T. ¿De qué manera se relaciona con la media de la población?

De la distribución de muestreo de la media se obtiene


E(T) = = 0×0.04 + 1×0.2 + 2×0.37 + 3×0.3 + 4×0.09 = 2.2
Usando propiedades de la esperanza:
E(T) = E( X1 + X2) = E( X1) + E( X2) = 1.1 +1.1 = 2.2

Para la varianza de T
E(T2) = 02×0.04 + 12×0.2 + 22×0.37 + 32×0.3 + 42×0.09 = 5.82
V(T) = E(T2) - (E(T))2 = 5.82 – 2.22 = 0.98

Usando propiedades de la varianza:


V(T) = V( X1 + X2) = V( X1) + V( X2) = 0.49 + 0.49 = 0.98

f. Calcule la probabilidad de encontrar, de ida y regreso de la universidad, más de dos


semáforos en los que debo detenerme.
P(T > 2 ) = P(T = 3) + P(T=4) = 0.3 + 0.09 = 0.39

g. Del apartado (d) obtener la distribución de muestreo de las medias muestrales


( X1  X 2 ) / 2

9
Sea 𝑋 = ( X 1  X 2 ) / 2 , la distribución de muestreo del promedio es
Muestras Probabilidad 𝑋 P(𝑋 = 𝑥)
(0,0) p(0,0) = p(0) p(0) 0 0.04
(1,0) (0,1) 2p(0)p(1) 0.5 0.2
(0,2) (2,0) (1,1) 2p(0)p(2) +p(1)p(1) 1 0.37
(1,2) (2,1) 2 p(1) p(2) 1.5 0.3
(2,2) p(2)p(2) 2 0.09

h. Dibuje un gráfico adecuado para representar la distribución de T y compárela con (b).


Distribución de probabilidad del número medio de detenciones

0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
0 0.5 1 1.5 2

Ahora calcule la media y desviación estándar de las medias muestrales. Compárela con (c).
E(𝑋) = 0×0.04 + 0.5×0.2 + 1×0.37 + 1.5×0.3 + 2×0.09 = 1.1
Usando propiedades: E(𝑋) = E( ( X 1  X 2 ) / 2 ) = (1.1 +1.1)/2 = 1.1. Coincide E(𝑋) = µ

E(𝑋2) = 02×0.04 + 0.52×0.2 + 12×0.37 + 1.52×0.3 + 22×0.09 = 1.455


V(𝑋) = E(𝑋2) – (E(𝑋))2 = 1.455 – 1.12 = 0.2455

i. Usando propiedades: V(𝑋) = V( ( X 1  X 2 ) / 2 ) = (0.49 + 0.49) / 4 = 0.245


Por otro lado, V(𝑋) = = 0.49 / 2 = 0.245
Indique tres hechos importantes obtenidos en la resolución del problema.
1. E(X) = E(𝑋) = µ
( )
2. V(𝑋) = =
3. La distribución de la media muestral 𝑋 tiene forma aproximadamente simétrica.

j. Del apartado (d) obtener la distribución de muestreo de las varianzas muestrales S 2


Muestras Probabilidad S2 Probabilidad
(0,0) (1,1) (2,2) p(0,0) + p(1,1) + p(2,2) 0 0.38
(1,0) (0,1) (1,2) (2,1) 2 p(1,0) + 2 p(1,2) 0.5 0.50
(2,0) (0,2) 2p(2,0) 2 0.12

Observe que:
E( S2 ) =0× 0.38 + 0.5× 0.50 + 2× 0.12 = 0.49 = 𝜎
E(S4 ) = 02× 0.38 + 0.52× 0.50 + 22× 0.12 = 0.605. Así V(S2 ) = 0.605 – 0.492 = 0.3649

Comente si hay relación de la media y la varianza poblacionales de S 2 con la media y varianza


de la distribución de muestreo de S
10
DISTRIBUCIÓN DE PROBABILIDAD DE LA MEDIA MUESTRA (𝑿).

Error de muestreo: Es poco probable que una media muestral sea idéntica a la media
poblacional. De igual forma la desviación estándar calculada a partir de la muestra
probablemente no sería exactamente igual al valor correspondiente de la población.
La diferencia entre el parámetro poblacional y el valor del estadístico muestral se denomina
el error de muestreo.

Supóngase que una población de cinco empleados de producción tiene índices de eficiencia
de 97, 103, 96, 99 y 105. Considere además que se selecciona una muestra de dos índices de
la población. La media de todos los índices (la media de la población) es igual a 100. Cada
diferencia x - µ es el error que habría al evaluar la media poblacional con base en la media
muestral, y estos errores de muestreo se deben al azar. La cantidad de estos errores será
diferente de una muestra a la siguiente.
Muestra Media Error de muestreo
97, 105 101 1.0
103, 96 99.5 -0.5

Ahora que se ha descubierto la posibilidad de un error de muestreo cuando se usan los


resultados de la muestra para determinar un parámetro de la población, surgen las
interrogantes:
¿Cómo se puede realizar un pronóstico exacto sobre el éxito posible de un producto
recientemente elaborado, únicamente con base en resultados muestrales?
¿Cómo puede el departamento de control de calidad enviar un cargamento de circuitos
integrado basado únicamente en una muestra de 10 circuitos integrados?
¿Cómo pueden las empresas de sondeos realizar una predicción acertada respecto a una
campaña electoral con base en una muestra de 2000 electores registrados de una población
de casi 90 millones?
Para responder a estas preguntas primero debemos estudiar la distribución de muestreo de
medias muestrales y otros estadísticos.

La distribución de medias muestrales es una distribución de probabilidad que señala todas


las medias muestrales posibles de un tamaño de muestra dado y sus probabilidades de
ocurrencia. Además, se establece que:

a. Para un tamaño de muestra dado, el valor medio de todas las medias muestrales posibles
seleccionadas de la población, es exactamente igual a la media poblacional.
b. Existe menos variación en la distribución muestral de medias que en la distribución de la
población.
c. El error estándar de la media mide la variación en la distribución muestral de la media
muestral.
c1) Si se conoce la desviación estándar poblacional, el error estándar es  X   n
c2) Si no se conoce la desviación estándar poblacional, el error estándar es estimado
mediante  X  S n.

11
Aunque en la práctica se puede ver sólo una muestra aleatoria en particular, en teoría puede
surgir cualquiera de las muestras. El uso de la distribución de muestreo de la media muestral
es importante porque la mayoría de las decisiones en las empresas y negocios se toman
basándose en los resultados de una muestra. Damos dos ejemplos. En cada una de estas
situaciones se tiene una población de la que se tiene alguna información. Se toma una muestra
de la población y se desea determinar si el error muestral –la diferencia entre el parámetro
poblacional y el estadístico muestral- se debe a la casualidad. Luego, se puede calcular la
probabilidad de que una media muestral se encuentre dentro de cierto intervalo.
Al calcular la probabilidad de que una media muestral se encuentre dentro de cierto intervalo,
surge la interrogante: ¿Bajo qué condiciones la distribución de la media muestral sigue una
distribución normal? La condición que analizaremos en esta sección será cuando no se
conoce la forma de la distribución de probabilidad de la población, o si se sabe que no es
normal, pero el tamaño de la muestra es suficientemente grande. Consideraremos las
aplicaciones del Teorema Central del Límite (TCL) en aquellas distribuciones de
probabilidades clásicas que se utilizan en la inferencia estadística.
El teorema señala que si se seleccionan de cualquier población todas las muestras de un
tamaño determinado, la distribución de las medias muestrales se acercará a una del tipo
normal. Esta aproximación aumenta en el caso de muestras más grandes. Esta proposición
general estudia la convergencia hacia la distribución normal independientemente de la forma
distribución de la poblacional.

Teorema central del límite. Obtenga una muestra aleatoria simple de tamaño n de
cualquier población de media µ y desviación típica finita σ. Cuando n es grande, la
2
distribución de la media muestral X se aproxima mucho a la distribución normal N (  , )
n
con media µ y desviación estándar  n para poblaciones finitas cuando el muestreo se ha
realizado con reemplazo.

Observe que si la población es finita de tamaño N y el muestreo es sin reemplazo la media


 N  n 
2
es 𝜇 y la varianza es  X2    .
 N 1  n

ACTIVIDAD 5. Un sistema está formado por 100 componentes cada una de las cuales tiene
una confiabilidad igual a 0,95. (Es decir, la probabilidad de que la componente funcione
correctamente durante un tiempo específico es igual a 0,95). Si esas componentes funcionan
independientemente una de otra, y si el sistema completo funciona correctamente cuando al
menos funcionan 80 componentes, ¿Cuál es la confiabilidad del sistema?
¿Qué elementos destacarían en esta actividad y cómo la desarrollarías?
En primer lugar podemos definir la variable aleatoria “número de componentes que
funcionan correctamente en el sistema” con distribución binomial de parámetros n=100
ensayos y probabilidad de que funcione una componente cualquiera p=0,95. Luego,
escribimos en lenguaje simbólico P80  S n  100 e intentamos de calcular la probabilidad.
Hacemos notar que el valor es demasiado grande para las tablas que tenemos. De esta manera
estamos introduciendo la idea de aproximación mediante las preguntas: ¿Son muchos
términos en la suma?, ¿Los términos son difíciles de calcular?, ¿Podríamos usar otra
distribución de probabilidades para aproximar el cálculo de la probabilidad pedida?

12
Solución aproximada: Para calcular P (80  Sn  100) primero obtenemos la esperanza y
varianza de la variable de interés.
E(Sn)=E(∑Xi)= ∑E(Xi) = n×p = 100×0,95 = 95 ;
Var(Sn)=Var(∑Xi)= ∑Var(Xi) = n×p×(1-p) = 100×0,95×0,05 = 4,75.

La desviación estándar de esta variable es  S n  4,75  2,18 . Como el tamaño de la muestra


n=100 es grande, aplicamos el teorema central del límite, obteniendo: S n ~N np, npq  Luego
procedería al cálculo, usando la corrección de continuidad:
 79,5  95 S n  95 100,5  95 
P (80  S n  100)  P 79,5  S n  100,5  P      (2,52)   ( 7,1)  0,994
 2,18 2,18 2,18 
Por tanto, el sistema funcionaría el 99,4% de las veces.

Nota: Al aumentar el valor de n en la distribución binomial B  n, p  cuya expresión


n
matemática es P( X  x )    p x 1  p 
n x
para valores x = 0, 1, 2, 3,…,n, los términos
x
 
crecen muy rápidamente, por lo que el cálculo de las probabilidades de los valores de la
variable en las distribuciones exactas es demasiado laborioso.

Cabe señalar, que esta problemática es un caso particular de un resultado general; el teorema
central del límite, y que nuestro interés en los temas siguientes es conducirlos a su
generalización y formalización. La interrogante general que lleva a analizar los teoremas de
límite es la siguiente: ¿En qué condiciones y mediante qué funciones o distribuciones de
probabilidad pueden aproximarse la suma de otras distribuciones por la distribución
normal, cuando aumentamos progresivamente el número de sumandos? Destacamos la
importancia práctica en ingeniería, en estudios de la masa forestal, producción, cargas en
estructuras, etc., y que permite usar la distribución normal tabulada para calcular
probabilidades que provienen de la suma de diferentes distribuciones.

Ahora, analizaremos la situación siguiente: Si la población sigue la distribución normal,


la distribución muestral de la media muestral también seguirá la distribución normal.
En este caso el tamaño de la muestra no tiene importancia. Si se conoce la desviación
estándar poblacional, se usa la siguiente estandarización para determinar la
probabilidad de que una media muestral caiga en una determinada región Z  X   .
 n

Teorema 1 Distribución de la Media Muestral (𝑿).

Sean X 1 , X 2 ,......., X n una muestra aleatoria extraída de una población normal con media
 y varianza  2 . Entonces, la variable aleatoria X tiene distribución normal con media
2
 y varianza .
n

Demostración: Se realizará mediante la función generadora de momentos:

13
t t t
x1 x2 xn t t t
M x (t )  E ( e ) = E ( e
xt n
)  E (e n
)      E ( e n
) = M x1 ( )  M x 2 ( )      M x n ( )
n n n
n
n  t  2 t2   2 t2
    t 
 t  2 n
=  M xi ( )  =  e n 2 n2 
 
= e
 n   
 
La función generadora de momentos desarrollada corresponde a la distribución normal,
donde x ~ N (,
2
n
). Por la tanto, E x   y V (X ) 
2
n
. 

Observe que 𝑋 = = . Entonces, 𝑆 ~ 𝑁( 𝑛𝜇, 𝑛𝜎 )

ACTIVIDAD 6. La prueba WAIS (wechsler adult intelligence scale) es una prueba de


inteligencia para adultos. La distribución de los resultados de la prueba WAIS para personas
mayores de 16 años tiene distribución normal con media 100 y desviación estándar 15.
Nota: (algo acerca de la prueba WAIS). Puntajes de más de 115 se considera inteligencia
brillante. Más de 130 comienza la clasificación de superdotación intelectual con sus grados
de moderada a profunda para los que alcanzan más de 175. Personas con puntajes bajo 60 se
consideran con inteligencia muy baja.

a) ¿Cuál es la probabilidad de que un individuo escogido aleatoriamente tenga un resultado


de 105 o superior?
b) ¿Cuáles son la media y la desviación estándar del promedio X de los resultados en la
prueba WAIS de una muestra aleatoria de 60 personas?
c) ¿Cuál es la probabilidad de que el promedio de los resultados en la prueba WAIS de una
muestra aleatoria de 60 personas sea de 105 o superior?
d) Entre que valores debe encontrarse la media de la muestra aleatoria de tamaño 60
para que se encuentre a dos desviaciones estándar de la verdadera media.
e) Entre que valores debe encontrarse la media de la muestra aleatoria de tamaño 60
para que se encuentre a 1.96 desviaciones estándar de la verdadera media.
Solución:
Lo primero que definimos es la variable aleatoria a considerar como también su
distribución.
Sea X v.a. puntaje de la prueba de inteligencia WAIS para personas mayores de 16
años. X ~ N 100; 225
105  100
a) P( X  105) = 1  P ( Z  ) = 1- Fz (0,33) = 0.3707
15
 
b) E X =100 y V X = 3,75  
c) Esta pregunta nos obliga a definir una nueva variable aleatoria

X variable aleatoria puntaje medio de la prueba de inteligencia WAIS para personas


mayores de 16 años en muestra de tamaño 60.
X ~ N 100; 3.75 Donde 3.75  225  
2
  X2
60 n

14
105  100
P( X  105)  1  P( Z  ) = 1- Fz (2,58) = 0.00494
1.9365
d) Sabemos por regla empírica que aproximadamente un 95,4% de todos los datos deben
estar a dos desviaciones estándar de la verdadera media, usando la tabla normal
estándar es de 0.9545, es decir P  2  Z  2   0.9545 , o
 X  100 
P  2 
1.9365
 
 2   0.9545 con esto P 96.13  X  103.87  0.9545 .
 
Esto nos indica que valores de medias muestrales mayores o iguales a 96.13 y
menores o iguales a 103.87 se encontraran a dos desviaciones estándar de la
media verdadera. Otra forma de ver esto, la verdadera media puede encontrarse
entre 96.13 y 103.87 con una probabilidad de 0.9545

e) Siguiendo la misma resolución de la letra (d) vemos de la tabla normal que


P  1.96  Z  1.96   0.950004  0.95
 X  100 
P  1.96 
1.9365
 
 1.96   0.95 Así P 96.20  X  103.92  0.95
 
Entendiendo que valores de medias muestrales mayores o iguales a 96.20 y menores o
iguales a 103.92 se encontraran a 1.96 desviaciones estándar de la media verdadera o
que la verdadera media, puede encontrarse entre 96.20 y 103.92 con una probabilidad
de 0.95.

Observe lo relevante de esta conclusión, al no conocer la media real, podemos tomar una
muestra aleatoria de dicha población, entonces calcular su media y a partir de esta y de que
tan confiable queramos mostrar dicho resultado, podemos proporcionar un rango de valores
donde se puede encontrar la media verdadera. La probabilidad que nos damos recibe el
nombre de nivel de confianza, y lo denotamos por 1-  , y el rango de valores define lo que
llamamos intervalo de confianza.
La conclusión que hemos obtenido nos lleva a dar la siguiente definición:

Definición de intervalo de confianza para  media de una población distribuida normal.


Dada una variable aleatoria tal que X ~ N   ;  2  , asumiendo que  2 conocida y dada una
muestra aleatoria de tamaño n de esta población. Para un nivel de confianza del 100(1-  )%,
la verdadera media deberá encontrarse dentro del intervalo:

 : X  z0 X 
Donde  X es el error estándar de estimación de la media, 𝜎 =

z0 es un valor tal que P   z0  Z  z0   1   , esquemáticamente

15
Nota: El intervalo definido nos muestra que 𝑃 𝑋 − 𝑧 ≤ 𝜇 ≤𝑋+ 𝑧 = 1− 𝛼 o
√ √
que 𝑃 −𝑧 ≤ 𝑋− 𝜇 ≤ 𝑧 = 1 − 𝛼, es decir, la media de la muestra difiere de la
√ √
verdadera media en a lo más 𝑧 unidades con una confianza del 100(1   )% . 𝑧
√ √
define el error máximo que admitimos en que X difiere de  con una confianza de
100(1 − 𝛼)%.
Si llamamos d a este error máximo, observe que 𝑧 = 𝑑 define una ecuación que nos

indica que conocido tres de sus valores podemos determinar el cuarto, así
2
 z  
n  0  Para determinar tamaño de la muestra
 d 

z0   d d n 
z 0    Para determinar nivel de confianza
n   

d n 
    Para determinar la desviación estándar
 z0 

Si simulamos la construcción de 100 intervalos de confianzas para el ejemplo de la prueba


de inteligencia WAIS, en que X ~ N 100; 225 encontramos,
100 intervalos de confianzas del 95% para la media
110

108

106

104

102

100

98

96

94

92

90
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63 65 67 69 71 73 75 77 79 81 83 85 87 89 91 93 95 97 99

Media real L inf. L sup.

Media 100.5 104.6 98.7 100.5 100.2 98.5 102.7 97.5 102.1 100.8 100.2 99.1 102.1 99.2 100.8 103.5 100.4 99.4 104.1 101.7
L inf. 96.7 100.8 94.9 96.7 96.4 94.7 98.9 93.7 98.3 97 96.4 95.3 98.3 95.4 97 99.7 96.6 95.6 100.3 97.9
L sup. 104.3 108.4 102.5 104.3 104 102.3 106.5 101.3 105.9 104.6 104 102.9 105.9 103 104.6 107.3 104.2 103.2 107.9 105.5
Contiene 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1

Media 97.6 100 100.9 98.9 99 101.1 99.9 99.4 101.8 97.9 100.5 99.5 95.6 101.4 100.6 97.5 102.3 99.6 99.5 100.2
L inf. 93.8 96.2 97.1 95.1 95.2 97.3 96.1 95.6 98 94.1 96.7 95.7 91.8 97.6 96.8 93.7 98.5 95.8 95.7 96.4
L sup. 101.4 103.8 104.7 102.7 102.8 104.9 103.7 103.2 105.6 101.7 104.3 103.3 99.4 105.2 104.4 101.3 106.1 103.4 103.3 104
Contiene 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1

Media 98.4 98.4 99.9 100.7 99.1 101.7 101.1 102 98.1 100.4 98.6 99.4 98.7 98.3 97.5 99.7 97.8 98.9 98.7 97.5
L inf. 94.6 94.6 96.1 96.9 95.3 97.9 97.3 98.2 94.3 96.6 94.8 95.6 94.9 94.5 93.7 95.9 94 95.1 94.9 93.7
L sup. 102.2 102.2 103.7 104.5 102.9 105.5 104.9 105.8 101.9 104.2 102.4 103.2 102.5 102.1 101.3 103.5 101.6 102.7 102.5 101.3
Contiene 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

Media 100.1 99.7 100.2 101 99.4 97.1 95.9 99.7 97.9 103.3 97.5 100.3 99.8 96.8 101.3 102.1 102 97.8 99.1 98.6
L inf. 96.3 95.9 96.4 97.2 95.6 93.3 92.1 95.9 94.1 99.5 93.7 96.5 96 93 97.5 98.3 98.2 94 95.3 94.8
L sup. 103.9 103.5 104 104.8 103.2 100.9 99.7 103.5 101.7 107.1 101.3 104.1 103.6 100.6 105.1 105.9 105.8 101.6 102.9 102.4
Contiene 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1

Media 96.7 99.3 97.5 103.6 100.1 99.3 99.2 97.1 102.6 103.9 97.9 101.5 102.8 99.2 101.4 99.7 100.8 101.1 96.5 102.5
L inf. 92.9 95.5 93.7 99.8 96.3 95.5 95.4 93.3 98.8 100.1 94.1 97.7 99 95.4 97.6 95.9 97 97.3 92.7 98.7
L sup. 100.5 103.1 101.3 107.4 103.9 103.1 103 100.9 106.4 107.7 101.7 105.3 106.6 103 105.2 103.5 104.6 104.9 100.3 106.3
Contiene 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1

16
Para esta simulación encontramos que el 95% de los intervalos contienen a la verdadera
media, indicado como 1 en la fila Contiene de las tablas.
Como ejercicio, compruebe Ud. algunos resultados dados en la tabla

Una pregunta interesante que pudiéramos hacernos es si personas con estudios superiores
alcanzan mayores puntuaciones en la prueba WAIS que personas que no los tienen. De ser
afirmativa esta respuesta podemos distinguir dos poblaciones; los puntajes obtenidos por
personas sin estudios superiores y los que alcanzan estudios superiores. Luego, si elegimos
una persona al azar, que tan probable es que podamos clasificarla adecuadamente observando
sólo su puntaje, o si seleccionamos una muestra aleatoria de tamaño n, podamos tener certeza
que esta ha sido obtenida de una población y no de la otra. Gráficamente esto podríamos
verlo de la siguiente forma:
Gráfico de distribución Normal para distintos valores de la media
0.027

0.020
Densidad
Densidad

0.013

0.007

0.000

70 80 90 100 110 120 130

En este gráfico podemos ver en forma clara como se traslapan poblaciones con distintas
medias, para una misma varianza, lo que nos indica que tenemos un riesgo de clasificar a un
individuo en una población equivocada.

Supongamos que definimos el siguiente criterio:


Dada una muestra aleatoria de tamaño 60 puntajes de la prueba WAIS seleccionada de la
población con media 100, si X > 105 el adulto debería pertenecer a la población con puntaje
medio mayor a 100 en caso contrario a la población con puntaje medio 100 ¿Qué tan probable
es que esto ocurra?. Responder esta pregunta, es calculando:

 105  100 

P X  105 /   100  P  Z 

 1,9365 
 P  Z  2.58   0.00494

Esto nos indica que es poco probable que una muestra aleatoria de tamaño con media mayor
a 105 pueda ser clasificada en una población con media 100, es decir la muestra debería venir
de una población con media mayor a 100.
Si observamos la tabla de los 100 intervalos simulados, la muestra que contiene el valor
promedio más alejado de 100 es 104.6 y

 104.6  100 

P X  104.6 /   100  P  Z 


1, 9365 
 P  Z  2.38   0.008656 es decir la muestra

debería venir de una población con media mayor a 100.


Bueno, ¿qué probabilidad será aceptable para considerar que la muestra ha sido seleccionada
de una población con media mayor que 100?
La literatura habla de valores no más de 0.1, en muchos casos no más de 0.05 indicarán que
la muestra viene de poblaciones con media distinta de la que fue extraída, es decir

17
probabilidades más de 0.05 o más de 0.1, dependiendo del valor considerado por Ud. para
estos análisis, indicarán que la muestra ha sido seleccionada de la población con media
correcta. Esta probabilidad establecida se llama nivel de significación y se denota con  y
la región establecida por el criterio, región critica o región de rechazo, denotada por RC.
Observe, que en el análisis que hemos estado desarrollando estamos probando o contrastando
una suposición respecto de la muestra ha sido seleccionada de una población con  =100 o
con  >100, esta prueba o contraste se recibe el nombre de prueba de hipótesis y la
suposición respecto del valor del parámetro hipótesis estadística, y que se denotan por H 0 y
H1, llamadas hipótesis nula y alternativa respectivamente.

ACTIVIDAD 7. Frente a la hipótesis H0 :  = 100 v/s H1 :  > 100 y dado un nivel de


significación  =0.05, ¿cuál debe ser la región de rechazo?
 x  100 
 
Para  = 0.05, P X  x0 /   100  P  Z  0
 1,9365 
 0.05 , de la tabla Normal

x0  100
1,9365
 
 1.64  x0  103.2 , luego, RC   x1 , L x60  // X  103.2

Es decir, si Ud. selecciona una muestra aleatoria de tamaño 60 y arroja una media muestral
mayor a 103.2 podrá concluir que la muestra ha sido seleccionada de una población con
media mayor a 100.
Repita el ejercicio para la hipótesis H0 :  = 100 v/s H1 :  < 100

ACTIVIDAD 8. Un promotor inmobiliario quien intenta construir un centro comercial desea


estimar en el área el ingreso promedio por familia como indicador de las ventas esperadas.
Una muestra de n = 100 familias da una media X = US$35.500. Se asume que la desviación
estándar poblacional es  = US$7.200. Un intervalo del 95% de confianza para estimar el
ingreso medio poblacional por familia está dada por
µ: (34.088 , 36.911)

Interpretación 1: El promotor establece que tiene un “95% de confianza en que la media


poblacional real desconocida esté entre US$34.088 y US$36.911”. Aunque el valor real para
la media poblacional sigue siendo desconocido, el promotor tiene un 95% de confianza en
que esté entre estos dos valores.
Interpretación 2: Reconoce que se pueden desarrollar muchos intervalos de confianza
diferentes. Otra muestra probablemente produciría una media muestral diferente debido al
error de muestreo. Con una X diferente, el intervalo tendría límite superior e inferior
distintos. Por tanto, la segunda interpretación establece que si se construyen todas las
N
combinaciones C n de intervalos de confianza, el 95% de ellos contendrá la media
poblacional desconocida.
Si una segunda muestra da una media muestral de US$35.600 en lugar de US$35.500, el
intervalo es µ: (34.188 , 37.011). El promotor puede estar un 95% seguro de que la media
poblacional está comprendida entre US$34.188 y US$37.011. Si todos los intervalos posibles
se construyeran con base en todas las medias muestrales diferentes, el 95% de ellas
contendría la media poblacional desconocida.

18
En otras palabras, significa que el 5% de todos los intervalos estaría errado; no contendría la
media poblacional. Este 5%, denominado valor alfa, hallado como α, representa la
probabilidad de error o la probabilidad de que un intervalo dado no contenga la media
poblacional desconocida.

Caso 2: No obstante lo anterior, si el tamaño de la muestra es grande (n  30) una aplicación


del teorema central del límite permite establecer ≈ 𝑁(0,1).
/√
Luego, un Intervalo de Confianza de (1 − 𝛼)100% para  es:
S
 : x  Z (1   2) 
n

ACTIVIDAD 9. Carlos Daniel acaba de registrar las declaraciones de impuestos de sus


clientes. Desea estimar la cantidad promedio que deben al Servicio de Renta Interna. De los
50 clientes que seleccionó en su muestra, la cantidad promedio que se adecuaba era de
US$652.68. Ya que la desviación estándar de todos sus clientes es desconocida, Carlos debe
estimar σ con la desviación estándar de la muestra de S = US$217.43.
Verifique que Carlos puede tener un 99% de confianza en que la cantidad promedio que
deben todos sus clientes al SRI está entre US$573.35 y US$732.01.
¿Qué pasaría a este intervalo si Carlos estuviera dispuesto a aceptar un nivel de confianza del
95%?
Se obtendría un resultado entre US$592.41 y US$712.96.
Los resultados son tanto buenos como malos:
Las buenas noticias son que el intervalo del 95% es más estrecho y ofrece mayor precisión.
Un intervalo amplio no es tan útil. Entre más estrecho sea un intervalo, más significativo es.
Las malas noticias son que Carlos ahora está el 95% seguro de que el intervalo contiene en
realidad µ. Aunque el intervalo es más preciso (más estrecho), la probabilidad de que
contenga µ se ha reducido del 99 al 95%. Carlos tuvo que abandonar algo de confianza y
ganar más precisión.

ACTIVIDAD 10. Se construyen intervalos de confianza para la media µ en una distribución


Normal. Se muestra una gráfica de simular 27 muestras de tamaño 8 cada una con la
distribución N(50, 36).

60 Intervalos de Confianza de 0,90 para µ


55
50
45
40
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
Número de Muestras

La línea horizontal indica el valor del parámetro y las líneas verticales son intervalos de
confianza de 0,90 se puede observar que hay 25 de 27 intervalos que contienen el parámetro
𝜇 = 50.

19
DISTRIBUCIÓN DE PROBABILIDAD DE LA VARIANZA MUESTRAl (S 2)
Recordemos que para variable aleatoria independientes Z i con distribución normal
k 2
N(0,1), la v.a.  Zi tiene distribución Chi-Cuadrado con k grados de libertad.
i 1

Anotamos X ~ X k2 Además, EX   k y V  X   2k .

Por ejemplo, Para X ~ X 152 se tiene E  X   15 ; V  X   30 y P  X  25   0.05 . La


siguiente figura muestra la distribución Chi-Cuadrado para k = 2, 4 y 6 grados de libertad.

La importancia de estos resultados se muestra en lo siguiente:

Considere X 1 , X 2 ,......., X n una muestra aleatoria extraída de una población normal con media
Xi  
 y varianza  2 . La variable aleatoria Z i  tiene distribución normal N(0,1), y

entonces
n

xi   2 ~ X n2
i 1 2

Teorema 2. Sea X 1 , X 2 ,......., X n una muestra aleatoria extraída de una población normal
X ~ N (, 2 ) y denotemos Y 
n  1S 2 . Entonces, la variable aleatoria Y tiene
2

distribución Chi-cuadrado con (n-1) grados de libertad. Las variables aleatorias de la


media x y la varianza s 2 son independientes.

n n
Demostración. Escribamos la descomposición: (Xi   )2  (Xi  X ) 2  n ( X   ) 2 Dividamos
i 1 i 1
n n
(Xi   )2 (Xi  X )2
n( X   ) 2 n( X   )2
cada término de la igualdad por  , 2 i 1
2
 i 1
2
 2
La expresión
   2
corresponde al cuadrado de una variable normal estándar con una distribución 12 . Por otra parte,
n
(Xi   )2
W= i 1
sigue una distribución  n2 . Así, W =
n  1S 2  n ( X   ) 2
2
 2 2

20
Si multiplicamos por un parámetro real t, aplicamos la función exponencial a ambos
miembros, y tomamos esperanzas, teniendo en cuenta la independencia de la media y la
varianza muestral, tenemos:

  n12S t 
2

E e  = E  e 
tw
e tz  donde W y Z tienen distribuciones chi-cuadrado con n y 1 grados de
 
 
 n 1S 2 
 t 1 1
libertad, por lo que podemos escribir: E e 

2

 1  2t n 1 / 2
;t  es la función generadora
2
 
 
de momentos de una  n21 y en consecuencia:

Y
n  1S 2 ~  n21
2

Observación: La demostración que las variables aleatorias de la media x y la varianza s 2


son independientes no la presentaremos en este curso. Por otro lado, el número de grados de
libertad del estadístico resultante disminuye en una unidad por cada parámetro que se ha
estimado.

ACTIVIDAD 11. Una empresa de equipos computacionales, ha determinado que el precio


de costo de cada equipo es una variable aleatoria que se distribuye normal con media $500
y desviación estándar de $50
a) Si se toma una muestra aleatoria de 5 equipos, ¿cuál es la probabilidad de que el costo
promedio esté entre $521 y $540.
b) Considerando una muestra aleatoria de tamaño 10 del precio de costo, ¿cuál es la
probabilidad que la desviación estándar muestral sea inferior a $68,56?

Solución: a) X: Precio de costo de equipos computacionales X ~ N (500,2500 )


Se pide P 521  x  540 =   521  500
P
 50 / 5

Z
540  500 
50 / 5 
=  (1,79)   (0,94) = 0,1369

b) P(
n  1S 2 
9  68,56 2
) = P X 2  16,92  = 0.95
2 50 2  9 

Así la variable aleatoria Y 


n  1S 2 ~  n21 permite calcular probabilidades de la forma P
2

(a ≤
n  1S 2 ≤ b) = 1- α para valores determinados de a y b. Este resultado permite a su vez
2

construir un intervalo de confianza 1- α para σ 2.

(𝑛 − 1)𝑆 (𝑛 − 1)𝑆
𝑃 𝛼 ≤ 𝜎 ≤ 𝛼 = 1− 𝛼
𝑋 1− 𝑋
2 2

21
( )
Un intervalo que con probabilidad 1-  contenga a ~𝑋 tiene por extremos
𝑋 (1− ) y𝑋 ( ) entonces despejando σ2:

Así un intervalo de confianza de (1 − 𝛼) ∙ 100% para σ2 es de la forma:

(𝑛 − 1)𝑆 (𝑛 − 1)𝑆
𝛼 , 𝛼
𝑋 1− 𝑋
2 2

Observación: Un intervalo de confianza para la desviación estándar  se obtiene tomando


la raíz cuadrada en cada una de las dos desigualdades anteriores.

Distribución t- Student. Sea W una variable aleatoria distribuida normal estándar y V otra
variable aleatoria distribuida Chi- cuadrado con n grados de libertad, formemos el cociente
W
T , donde T es una variable aleatoria con distribución t- Student, además, W y V son
V n

independientes. Entonces, consideremos el caso particular, para una muestra con distribución
normal, es posible demostrar que x es independiente de S 2 , y por tanto podemos formar una

variable aleatoria con distribución t-Student de la siguiente forma: W  x   ~ N (0,1) y


/ n
x

V 
n  1S 2 ~ X n21 variables aleatorias independientes, entonces T 
/ n
=
x
~ t-
2
 n  1S 2 S/ n
 2 (n  1)

Student con (n-1) grados de libertad


La función de densidad de probabilidad de la variable t-Student es:
 n 1  n 1 
   
 2
f (t ) 
 2  1  t   2  , t 
n  n 
  n  
2
Propiedades:
1. f(t) es simétrica con respecto al eje de la ordenada, E(t)=0, pero su varianza es mayor
que 1 lo que resulta ser más achatada y de colas más altas que la normal.
2. Existe una curva para cada (n-1) grados de libertad.
3. P(t  t 0 )  FT t 0  se encuentra tabulada para los distintos grados de libertad.

La muestra aleatoria es sacada de una población normal, pero los parámetros  y  2 son
desconocidos. La estandarización de la variable aleatoria está dada en el siguiente teorema:

22
Teorema 3. Sea X 1 , X 2 ,......., X n una muestra aleatoria extraída de una población normal
X ~ N (, 2 ) . Entonces, la variable aleatoria 𝑡 = tiene distribución t de Student con
/√
𝑛 − 1 grados de libertad.

ACTIVIDAD 12. Se desea comparar los tiempos promedios de ejecución utilizados en una
empresa cuando un mismo trabajo se realiza permanentemente por dos métodos diferentes.
Se sabe que los tiempos de ejecución, en minutos, por los dos métodos sigue una distribución
normal con 𝜇 = 100 y 𝜇 = 80. Se sabe además, que las varianzas de los tiempos de ejecución
son desconocidas pero iguales.Si seleccionamos dos muestras aleatorias independientes de
tamaños 𝑛 = 10 del método 1 y 𝑛 = 20 del método 2, obteniendo 𝑆 = 4 y 𝑆 = 12
respectivamente.
a) ¿Cuál es la probabilidad que la media de la muestra de los tiempos de ejecución del trabajo
por el método 1 sea superior a 99,56 minutos?
b) ¿Cuál es la probabilidad que en la muestra del método 2, la razón de la varianza de la
muestra entre la varianza verdadera sea inferior a 0,53247?

Solución: Sean
𝑋 : Tiempo de aplicación de un trabajo por el método 1 𝑋 ~ 𝑁(𝜇 = 100; 𝜎 )
𝑋 : Tiempo de aplicación de un trabajo por el método 2 𝑋 ~ 𝑁(𝜇 = 80; 𝜎 )

Además, 𝑛 = 10 𝑆 = 4 𝑛 = 20 𝑆 = 12
a) La varianza de la población es desconocida, por tanto: ~𝑡

,
𝑃(𝑋1 > 99,56) = 1 − 𝑃(𝑡 ≤ ) = 1 - 𝑃(𝑡 ≤ −0,6957) = 0,75

Hay una probabilidad del 75% de que la media de la muestra de los tiempos de ejecución del
trabajo por el método 1 sea superior a 99,56 minutos

( )
b) ~ 𝑋 𝐴𝑠í, 𝑃 < 0,53247 = 𝑃(𝑋 < 10,11693) = 0,05

Hay un 5% de probabilidad de que la razón de la varianza de la muestra entre la varianza


verdadera sea inferior a 0,53247.

X 
Caso 3: De la expresión ~ t ( n  1) podemos obtener un intervalo de confianza para el
S n
parámetro µ cuando σ2 es desconocido. La única diferencia con la expresión obtenida antes
es que ahora se utiliza S2 en lugar de σ2 y la distribución correspondiente es la t(n-1) en
lugar de la distribución normal estándar Z(0,1).

Un Intervalo de confianza del 100(1 -  )% para la media poblacional  es:

S
 : x  t n 1 (1   / 2) 
n
23
Hay por lo menos dos tipos de estimadores que se utilizan más comúnmente para los
parámetros poblacionales clásicos de la media, la proporción y la varianza.

a) Un Estimador Puntual es un estadístico cuyos valores son utilizados como valores


estimados de un parámetro. El valor de un estimador puntual recibe el nombre de estimación.
Si en una distribución se conoce su distribución, pero se ignora los valores que toma el
parámetro, el problema estadístico consiste en estimar dicho valor a través de la información
entregada por una muestra.
Llamaremos Estimador de un parámetro  a cualquier estadístico o función de la muestra
aleatoria que nos permite hacer conjeturas acerca del verdadero valor  que es desconocido.
Por ejemplo, a menudo es necesario estimar: La media  de una población; la varianza  2
de una población, la proporción p de objetos de una población que pertenecen a cierta clase
de interés;

Observe que un estimador  de un parámetro  es una variable aleatoria porque depende de
los datos muestrales: x, S 2 , ...., etc. Así un estimador tiene una esperanza y una varianza E  

 

y V   .

 
Insesgamiento Un estimador es insesgado si el valor medio de todas sus estimaciones

obtenidas en una muestra de tamaño n, es igual al parámetro que estima. Entonces  es un
estimador insesgado si E     . De lo contrario se dice que es sesgado. El sesgo B de un

 

estimador puntual  es B(θ) = E   


 

 

ACTIVIDAD 13. Sea p el estimador de la proporción p de elementos de una población
n
  Xi 1 si el elemento posee el atributo de interés
con cierto atributo. Se define p  i 1
donde X i  
n  0 si el elemento no posee el atributo de interés
  p (1  p )
Verifique que: i) p es estimador insesgado de p. ii) la varianza de p es
n

Error Cuadrático Medio. El ECM es el valor esperado de la desviación cuadrática entre el



estimador y el parámetro que estima ECM = E (   ) 2 , desarrollando la expresión, se obtiene:
2
   

  
  
 
E (   ) = E   E ( )    E ( )    = V ( ) + B 2 ( )
2
   
  


Esto es, el error cuadrático medio de  es igual a la varianza del estimador más el cuadrado
 
del sesgo. Si  es un estimador insesgado de  , el error cuadrático medio de  es igual a

la varianza de  . El error cuadrático medio es un criterio importante para comparar dos
estimadores. Según los valores del parámetro, es posible que un estimador sesgado sea mejor
que uno insesgado.

24
Métodos de estimación. Existen métodos para obtener unos estimadores puntuales de los
parámetros poblacionales; como por ejemplo el método de máxima verosimilitud.

Método de Máxima Verosimilitud (EMV). Consideremos una variable aleatoria X con


distribución de forma conocida f que depende de un parámetro  desconocido. Si una m. a.
de n observaciones X 1 , X 2 ,......., X n es tomada, se define la función de verosimilitud de dicha
muestra:
L( X1, X 2 ,...., X n ; ) = ∏ 𝑓(𝑥 ; 𝜃)

A la función de probabilidad conjunta, si X es discreta o función de densidad conjunta si X


es continua que resulta para un determinado valor de  . Para cada valor de  , la función de

Verosimilitud de la muestra sería distinta. El EMV de  , denotado por  , basado en una
muestra aleatoria ( X 1 , X 2 ,......., X n ) es aquel que hace máxima a la función de verosimilitud.

Observación:
1. Para simplificar el cálculo del máximo de la función de verosimilitud aplicamos logaritmo
natural a la función L( X ;  ) , lo que es posible dado que la función logaritmo es una función
creciente y por tanto, el máximo valor de L( X ;  ) se obtiene para el mismo valor que la
función logaritmo natural.
d
2. Si la distribución depende de un parámetro  entonces ln l ( X ,  ) = 0 llamada
d
Ecuación de Verosimilitud. Si la distribución depende de dos parámetros  =  ,   entonces
se forma un sistema de ecuaciones de verosimilitud.

ACTIVIDAD 14. Sea X una población distribuida Poisson de parámetro 𝜆. Determinar el


EMV de 𝜆 sacado de una muestra aleatoria X 1 , X 2 ,...., X n extraída de la población.
 x e 
i

Solución: X i  P ( )  p( X i )  con x = 0, 1, 2,....


xi !
 xi
e  n
La función de verosimilitud es L ( X , ) 
 xi!
n
Aplicando logaritmo natural ln L( X ,  ) =  n   xi ln   ln  xi !
i 1

Derivando con respecto 𝜆, se tiene el EMV:


∑ 𝑋
𝜆= = 𝑋
𝑛
.
Observe que los EMV pueden ser sesgados, pero al incrementar el tamaño de la muestra n se
hace asintóticamente insesgados. Por ejemplo: El estimador de la varianza obtenida en una
muestra n de una población normal es  
2 n  1 S2 .
n

25
Se muestra en la Tabla siguiente algunos Estimadores Máximo verosímiles de acuerdo a la
distribución de probabilidad

Distribución Probabilidad Parámetro EMV


Bernoulli 𝑝 ∑ 𝑋
𝑝̂ =
𝑛
Binomial (k,p) 𝑋 ∑
𝑝̂ =
𝑝 𝑛𝑘
Poisson 𝜆 ∑ 𝑋
𝜆=
𝑛
Exponencial 1 ∑ 𝑋
𝜃= 𝜃=
𝜆 𝑛
Normal 𝜇 ∑ 𝑋
𝜇=
𝑛
( )
𝜎 𝜎 =

Gamma (𝛼 = 2 𝑦 𝜃) 𝜃 ∑ 𝑋
𝜃=
2𝑛

b) Un intervalo de confianza denota un rango dentro del cual puede encontrarse el parámetro,
y el nivel de confianza que el intervalo contiene del parámetro.

A continuación, mostraremos dos aplicaciones del teorema central del límite:


a. Estimación por intervalos de confianza del parámetro de la proporción p de la distribución
binomial Determinación del tamaño adecuado de muestra aleatoria para estimar el parámetro
p.
b. Partimos señalando que para los percentiles z1 y z2 fijos cuando n es grande, la
aproximación 𝑆 ≈ 𝑁(𝑛𝑝, 𝑛𝑝𝑞) permite calcular la probabilidad aproximada que la suma de
variable aleatoria se encuentre en un cierto intervalo,
 
P np  z1 npq  S n  np  z2 npq  FZ z 2   FZ z1 

A continuación, relacionaremos la suma con la proporción en la estandarización normal,


obteniendo el mismo intervalo anterior ahora como promedio.

Observación: Sea p la proporción de elementos de una población que poseen un atributo


determinado. Si p̂ es el estimador puntual máximo verosímil EMV y consistente del
parámetro en una muestra grande de tamaño n, por el teorema central del límite,
establecemos que, si pˆ  S n / n entonces 𝑝̂ ≈ 𝑁(𝑝, ). Luego,
Sn  np pˆ  p
Zn   .
np (1  p ) pˆ qˆ
n
De igual forma podemos calcular la probabilidad que la proporción de elementos concierto
atributo se encuentre entre dos valores límites, es decir,

26
 
P p  z1 pq / n  pˆ  p  z 2 pq / n  FZ z 2   FZ z1 

En resumen, un Intervalo de Confianza aproximado al 1001   % para la proporción


poblacional p estimando la varianza es:
pˆ qˆ
p : pˆ  Z (1   2) 
n

ACTIVIDAD 15. Seguidamente se presenta una muestra de estaturas obtenidas por


estudiantes de Ingeniería Civil de la UCSC, en el curso de Probabilidades y Estadística II
semestre del 2017:
1,75 1,72 1,76 1,60 1,75 1,80 1,85 1,75 1,70 1,75 1,70 1,70
1,80 1,70 1,85 1,50 1,75 1,80 1,60 1,75 1,70 1,70 1,60 1,78
Suponga que las estaturas en metros sigue una distribución normal.
Desarrollo
a) Encuentre un intervalo de confianza del 90% para la estatura promedio del curso.

Sea X: Estaturas en metros de estudiantes de Ingeniería Civil de la UCSC

𝑋 ~ 𝑁(𝜇; 𝜎 ) (𝜎 𝑒𝑠 𝑑𝑒𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑜)
𝑛 = 24 𝑥 = 1,723 S = 0,0827 y 𝑡 (0,95) =1,7139

Un intervalo de confianza del 90% para µ:

0,0827 0,0827
1,723 − 1,7139 ∙ ; 1,723 + 1,7139 ∙
√24 √24
Así, µ: (1,6941; 1,7519)
Un intervalo de confianza del 95% para la verdadera estatura promedio se encuentra entre
1,69 y 1,75 metros.

b) Encuentre un Intervalo de confianza del 98% para la proporción de estudiantes del curso
que tienen estatura mayor a 1,75.

Sea p: Proporción de estudiantes con estatura mayores 1,75 metros.


𝑝̂ el estimador puntual de p, dado por 𝑝̂ =

Así, un intervalo de confianza aproximado del 98% para p es


7 7 17 7 7 17
− 2,33 ∙ ( ∙ )/24 ; + 2,33 ∙ ( ∙ )/24
24 24 24 24 24 24

Luego, p: (0,1529; 0,4304)

Un Intervalo de confianza del 98% para la proporción de estudiantes del curso que tienen
estatura mayor a 1,75 se encuentra entre 0,1529 y 0,4304.

27
Obtención de tamaños de muestras aleatorias
Una segunda aplicación del teorema central del límite consiste en determinar el tamaño
adecuado de muestra aleatoria para estimar el parámetro de una población binomial con
una precisión dada, en el contexto de estimar la proporción de fumadores. Pretendemos
descubrir que el número de unidades en la muestra depende de la precisión con la cual se
quiere estimar el parámetro de interés p, de la varianza de la población y del valor del
coeficiente de confianza utilizado para efectuar la estimación mediante un intervalo. La
variable a considerar es cualitativa y se estima la proporción de elementos que tienen la
característica indicada por dicha variable mediante el estimador p̂ . El error absoluto de
estimación es e  pˆ  p .
p (1  p )
Como el intervalo de confianza 1-α es pˆ  p  Z (1   / 2)  se obtiene una fórmula de
n
2
 Z (1   / 2) 
cálculo de tamaño adecuado mínimo, n   p(1  p) .
 e 

ACTIVIDAD 16. Muestreo. Una fracción desconocida p de una población está compuesta
por fumadores, y vamos a utilizar el muestreo aleatorio con reemplazo para determinar p. Se
quiere encontrar p con un error no mayor de 0,005.
a. ¿Cuán grande debe ser el tamaño n de la muestra?
b. ¿Cuán grande debe ser el tamaño n de la muestra si se quiere un error a lo más 0,01?

Queremos conducirte a descubrir que la determinación del tamaño muestral está


condicionada al error muestral. Para ello discutamos la siguiente secuencia de algoritmo de
solución:
Sea p̂ la fracción de fumadores de la muestra. Es claro que ningún tamaño de muestra puede
garantizar de manera absoluta que pˆ  p  0,005 . A lo más podemos considerar muy
improbable un error que exceda de la cota asignada de 0,005. Con este propósito, se
establecería un nivel de confianza arbitraria 1-α digamos 0,95, y elegiría una n tan grande
que el evento pˆ  p  0,005 tenga probabilidad mayor 1-α.

Dado que Sn= nˆp puede interpretarse como el número de éxitos en n ensayos, tenemos que
P( pˆ  p  0,005)  P( S n  np  0,005n)  1   . Con apoyo de la aproximación normal y
observando sus valores en la tabla, sería necesario elegir una n tan grande que
0,005 n
 Z (1   / 2) ó n  40000  p  q  Z 2 (1   / 2) .
pq

En esto interviene la probabilidad desconocida p pero, en cualquier circunstancia, tenemos


que pq  1 / 4 y, en consecuencia, será suficiente un tamaño de muestra n  10000  Z 2 (1   / 2)
En el nivel de confianza 1-α = 0,95, encontramos que Z (1   / 2)  1,96 , por lo que un tamaño
muestral de n = 40000 es, desde luego, suficiente.
En la parte b) Si solamente se requiere una precisión 0,01 sería suficiente un tamaño muestral
de 10000 (con el mismo nivel de confianza).
28
Observación:
a. Es preferible un intervalo más estrecho debido a la precisión adicional que proporciona, y
se controla el ancho del intervalo reduciendo el nivel de confianza e incrementando el tamaño
de la muestra. El tamaño de la muestra juega un papel importante al determinar la
probabilidad del error así como en la precisión de la estimación.
2
Z (1   / 2) 
b. Si en el tamaño de muestra n     p (1  p ) ; p no es conocido se puede sustituir
 e 
con una estimación p̂ / obtenida en un estudio piloto con una muestra n / . En caso contrario,
se sustituye p por el valor que hace máxima la varianza p = 1/2
c. En la obtención del tamaño de la muestra para estimar µ, si se considera el error absoluto
X 
de estimación o precisión e  X   y la variable normal estándar Z  , se puede
 n
reescribir algebraicamente, el tamaño muestral para intervalos de la media poblacional con
2
 Z (1   / 2)   
distribución normal y varianza conocida n  . Note que Si  es
 e 
desconocida se estima por S de una muestra piloto y se reemplaza en la expresión anterior.

Decidir cuánta confianza debemos poner en las estimaciones estadísticas que hacemos es
más difícil que hacerlas. Si la muestra es amplia, aumentará nuestra confianza en que sus
características se acerquen a las del conjunto de la población. Si la población no es muy
variada ni hay mucha dispersión en su distribución, también aumentará nuestra confianza en
que sean representativas las características de la muestra.
Pueden establecerse intervalos numéricos que indiquen la probabilidad de que una
característica de la muestra refleje el conjunto de la población. Podemos decir así que un
intervalo de confianza del 95% para el porcentaje de votantes a favor de la propuesta X es el
45% más o de menos un 6%. Esto quiere decir que podemos tener al 95% la certeza de que
el porcentaje de la población está comprendida en el 6% del porcentaje de la muestra, en este
caso que entre el 39 y el 51 por ciento de la población apoya la propuesta X. O bien podríamos
decir que un intervalo de confianza del 90% para el porcentaje de consumidores que prefieren
el servicio informático Y es el 13% más o menos un 8%, para dar a entender que podemos
tener al 90% la certeza* de que el porcentaje de población está dentro del 8% del porcentaje
de la muestra, en este caso que entre el 5 el 21 por ciento de consumidores prefieren el
servicio. Si aumentamos el tamaño de la muestra, podemos reducir el intervalo y aumentar
nuestra confianza de que contiene el porcentaje de población (o características o el parámetro
que sea), aunque cuesta dinero aumentar los tamaños muestrales.
Los resultados de las encuestas que no incluyen intervalos de confianza o márgenes de error
suelen ser falsos. Estos intervalos de confianza, aunque las encuestas los incluyan, no siempre
son eficaces en los medios de comunicación. Las salvedades e incertidumbres son noticia
muy pocas veces. Si un titular dice que el paro ha descendido del 7,3% al 7,2% y no aclara
que el intervalo de confianza es del 0,5% en más o en menos, podríamos tener la equivocada
impresión de que las cosas han mejorado. Dado el error de muestreo, sin embargo es posible
que no haya habido “descenso”, incluso ha podido haber un aumento. Si no se dan márgenes
de error, una buena norma empírica es que los muestreos aleatorios ** de mil sujetos o más

29
dan un intervalo con estrechez suficiente para casi todos los objetivos, mientras que los
muestreos aleatorios de cien sujetos o menos dan un intervalo demasiado ancho para casi
todos los fines.
En pocas palabras: un Intervalo de Confianza nos proporciona una franja en cuyo interior se
encontrará con alguna probabilidad el valor verdadero de la característica en cuestión.

Nota:
* Puesto que la certeza no admite grados, “tener certeza al 95%” es una incorrección de
menor cuantía, aunque corriente. Es lógico pensar que tener certeza al 95% supone tener
incertidumbre al 5%, idea que parece sospechosamente embarazosa.

** Incluso una “muestra” no aleatoria de 250 millones e sujetos puede tener problemas. La
oficina del Censo de Estados Unidos está empeñada en contarnos absolutamente a todos y se
niega a complementar la cuenta con técnicas normales de muestreo. EL resultado es una
subestimación notable, en particular de los pobres de las ciudades.

Generalmente, uno se refiere al azar inherente a toda situación probabilística. Por ejemplo,
formulo la hipótesis de que por lo menos el 20% de las personas de cierta región tiene el
pelo rubio, pero al observar a mil personas en partes representativas de la región, advierto
que sólo hay ochenta rubias en total. Sirviéndonos de la teoría de la probabilidad, calculo
que, partiendo de mi suposición, la probabilidad de este resultado es muy inferior al 5%, un
“nivel de significación” que se emplea corrientemente. En consecuencia, desecho la hipótesis
de que el 20% de la población de la zona tiene el pelo rubio.
Hay dos clases de errores que pueden cometerse al hacer esta comprobación estadística y
cualquiera otra; la denominaremos, con toda la poesía que caracteriza a los estadísticos,
errores de tipo I y de tipo II. Se produce un error de tipo I cuando se desecha una hipótesis
acertada y se produce un error de tipo II cuando se acepta una hipótesis equivocada. Así, si
no advertimos que casi todos los rubios de la zona se quedan en casa los días soleados, al
desechar la acertada suposición de que constituyen por lo menos el 20% de la población
cometeríamos un error de tipo I. Y al contrario, si nos cruzamos con un batallón de turistas
suecos y aceptamos la suposición equivocada sobre la parte proporcional que representan los
rubios, cometeríamos un error de tipo II. La posibilidad de cometer las dos clases de error
existe siempre, incluso cuando tomamos muchas precauciones en el muestreo aleatorio.
Por ejemplo, la Dirección General de Alimentación y Consumo debe contrarrestar el riesgo
de cometer un error de tipo I (no dando el visto bueno a un medicamento eficaz) con el riesgo
de cometer un error de tipo II (autorizando un medicamento inútil o pernicioso). Es
comprensible que grupos distintos opinen de distinta manera sobre las dos orientaciones y
que se quejen de orientaciones distintas.

En pocas palabras: toda comprobación estadística da pie a dos clases de errores, desechar una
hipótesis acertada y aceptar otra equivocada. Según la situación, evaluaremos las
probabilidades de estas dos clases de error y obraremos en consecuencia.

30
PRUEBAS DE HIPÓTESIS DE PARÁMETROS

En esta sección vamos a plantear una afirmación acerca de un parámetro desconocido


asociado con una distribución de probabilidades, apoyándose en una muestra aleatoria. En
vez de encontrar un estimador para el parámetro será conveniente formular una hipótesis
sobre un valor para éste y luego en base a una muestra poder confirmar o rechazar el valor
de la hipótesis. Los siguientes ejemplos tienen en común que la hipótesis se formula sobre la
población y las conclusiones sobre la validez de esta hipótesis se establecen en la información
muestral.
1. Un fabricante que produce cereales de desayuno afirma que, en promedio, el contenido de
cada caja pesa menos de 200 gramos. Para verificar esta afirmación, se pesa el contenido de
una muestra aleatoria y se infiere el resultado a partir del resultado muestral.
2. Un investigador quiere saber si una propuesta de reforma fiscal es acogida de igual forma
por hombres y mujeres. Para analizar si es así, recoge las opiniones de una muestra aleatoria
de hombres y mujeres.

A continuación se describen los elementos que componen una prueba de hipótesis:


a) Una hipótesis estadística es una afirmación o conjetura acerca de los parámetros de la
distribución de probabilidades de una población. Si la hipótesis estadística especifica
completamente la distribución, entonces será llamada Hipótesis simple, de otra manera la
llamaremos Hipótesis Compuesta.
En adelante, denotaremos H 0 a una hipótesis nula representará la idea estándar,
conocida o clásica respecto del parámetro (corresponde a la idea que debiera presuponerse)
y se contrapone a una segunda hipótesis llamada alternativa H 1 , que representa una idea
nueva o no clásica respecto del parámetro. También es llamada hipótesis de trabajo porque
corresponde a la hipótesis con la cual el investigador trabaja.

b) Un test de una hipótesis estadística es una regla o procedimiento que permite decidir el
rechazo de la hipótesis H 0 .
c) El estadígrafo o estadístico de prueba es una función de la muestra. Interesa que contenga
el máximo de información sobre la H 0 planteada ya que, en base a la información contenida
en esta función se tomará la decisión respecto de la aceptación o rechazo de la hipótesis, H 0
, planteada.
d) La región de rechazo, especifica los valores del estadístico de la prueba para los cuales
se rechaza H 0 .Entonces, la hipótesis nula será rechazada si y sólo si el valor observado o
calculado del estadístico de prueba se ubica en la región de rechazo.
e) Errores en pruebas de hipótesis. La selección de una región de rechazo en particular se
basa en la comprensión de dos tipos de errores que enfrentaríamos al sacar una conclusión.
Al realizar una prueba de hipótesis un error tipo I se comete cuando se rechaza una
hipótesis nula verdadera; es decir, cuando la hipótesis nula es verdadera, pero se decide en
contra de ella. Un error tipo II se comete cuando se decide a favor de una hipótesis nula que
realmente es falsa.
La cuantificación de los errores es dada a continuación:

 ( )  rechazarH 0 / H 0   ( )  aceptarH 0 / H1 

31
¿Cómo es posible reducir  y  al mismo tiempo? La respuesta es obtener mayor
información acerca de la naturaleza real de la población incrementando el tamaño de la
muestra. Así, casi todas las pruebas estadísticas  y  decrecerán ambos al aumentar el
tamaño de la muestra.
Naturalmente, deseamos disminuir ambos errores y es considerado más grave el error
tipo I, en el cual el investigador encuentra evidencia para rechazar H 0 cuando no la hay; esto
significa considerar un nivel de significación  pequeño. Típicamente se fijan en 5%,
también son usados al 1% y 10%.
Esquema de Probabilidades en un test de hipótesis
H 0 es V H 1 es V
aceptar H 0 1 
rechazar H 0  1 

¿Cómo es posible reducir  y  al mismo tiempo? La respuesta lógica, obtener mayor


información acerca de la naturaleza real de la población incrementando el tamaño de la
muestra. Así, casi todas las pruebas estadísticas  y  decrecerán ambos al aumentar el
tamaño de la muestra.

Definición. Se llama función potencia a     rechazarH 0 


Claramente se cumple   / H 0      ,   / H 1   1    

ACTIVIDAD 17. Sea X ~ N(175;400). Para contrastar la hipótesis H0: µ = 175, se toma una
muestra aleatoria de tamaño 20. La regla de decisión es “Rechazar H 0 si x  185 .
a) ¿Cuál es la probabilidad de cometer error tipo I?, ¿Cuál es la probabilidad de cometer
error tipo II, si la verdadera media es 176?
b) Determine la función potencia para la media: 170,173, 175, 175.5, 176, 179, 182, 185,
187 y 190.
c) Grafique la función potencia y el error tipo II para los valores de la media dados en b).

En la Tabla y Gráfico siguiente se muestran los valores solicitados en la actividad 13.

media µ Función Potencia Probabilidad Error tipo II


170 0,000398115 0,9996019
173 0,003645179 0,9963548
175 0,01267366 0,9873263
175,5 0,016824014 0,983176
176 0,022085674 0,9779143
179 0,08985625 0,9101438
182 0,251167479 0,7488325
185 0,5 0,5
187 0,672639575 0,3273604
190 0,868223759 0,1317762

32
En la prueba de hipótesis la metodología a seguir es:
1. En la prueba de hipótesis se definen las hipótesis a contrastar o probar:
Si  es el parámetro entonces las hipótesis pueden ser
i.1) H0:    0 donde  0 es algún valor conocido respecto del parámetro
H1:    0
i.2) H0:    0
H1:    0
i.3) H0:    0
H1:    0

En los tres casos la hipótesis H0 define una hipótesis simple respecto del valor del parámetro.
Las hipótesis (i.1) y (i.2) se conocen como hipótesis unilaterales o de una cola, en cambio la
hipótesis (i.3) recibe el nombre de hipótesis bilateral o de dos colas.

2. Definir un estadístico de prueba o una medida de discrepancia entre la muestra y la


hipótesis nula del tipo: d  d ( 0 ; ˆ ) la que debe tener una distribución conocida cuando la
hipótesis H0 es cierta.

3. Tomar una muestra aleatoria de tamaño n de la población especificada por el parámetro, y


calcular el valor del estadístico de prueba d.

4, Calcular el valor de la prueba, denotado como valor-p,

Definición. Para un test de hipótesis se llama valor-p al nivel de significancia mínimo que
es necesario para rechazar H 0 . En otras palabras, el valor-p se define como el menor nivel
de significación para el cual un experimentador, utilizando el estadístico, rechazaría H 0 sobre
la base del resultado observado. Así,
a. valor-p = P(d > dc) si hipótesis H1 está dada por (i.1)
b. valor-p = P(d < dc) si hipótesis H1 está dada por (i.2)
c. valor-p = P(d > db v d < da) si hipótesis H1 está dada por (i.3)

33
Donde da, db y dc son valores de la medida de discrepancia o estadístico de prueba d evaluada
por los datos.

5. Fijar el nivel de significación  , comparar con el valor p y tomar la decisión estadística,


mediante la siguiente regla de decisión:
No rechazar H 0 si valor p  
Rechazar H 0 si valor p  

Observación: Una vez calculado la probabilidad de significación podemos utilizar el criterio


empírico, gráficamente el valor-p define cuatro regiones respecto del valor α:

Evidencia
altamente Evidencia Zona de no
significativa significativa Evidencia
débil en contra rechazo de la
en contra de en contra de
de H0 hipótesis H0
H0 H0

0 0.01 0.05 0.1 1


6. Conclusión: Depende de cada problema.

Test de Parámetros en Distribuciones Normales

A. Prueba de hipótesis para medias

Sea X 1 , X 2 ,.... X n una muestra de una distribución normal con media  desconocida y
varianza  2 conocida.
1) Hipótesis: a) H 0 :    0 vs H 1 :    0
b) H 0 :    0 vs H 1 :    0
c) H 0 :    0 vs H 1 :    0
2) Estadístico de prueba: En los tres casos (a), (b) y (c): Z
x  0


n x  0 
/ n 
3) Test: Regla de decisión o de rechazo de H 0
a) Z > C1 b) Z < C1 c) Z < - C1 o Z > C1 ;
donde C1 es:
alpha 0.10 0,05 0,01
(a) 1.28 1.645 2.33
(b) -1,28 -1,65 -2,33
(c) 1.645 1.96 2.58

Si el estadístico de prueba cae dentro de la región crítica se rechaza H 0 . En caso contrario


no se rechaza H 0 .

4) Conclusión: Se escribe una conclusión sobre la hipótesis de trabajo.

34
Observación: Una vez seleccionada la muestra aleatoria y evaluada la medida de discrepancia
estamos en condiciones de calcular el valor-p, donde
a) valor-p = P(Z > Zc) si hipótesis H1 está dada por (i)
b) valor-p = P(Z < Zc) si hipótesis H1 está dada por (ii)
c) valor-p = 2P(Z > |Zc|) si hipótesis H1 está dada por (iii)

Con Zc valor de la medida de discrepancia o estadístico de prueba evaluada en la muestra.

zc -zc -z c zc

a) b) c)

Observación: Si la desviación poblacional  es desconocida se utiliza el estadístico de


prueba t-student: T
x  0


n x  0  ~ tn – 1
S/ n S

ACTIVIDAD 18. Supongamos que la variable X: “precio del kilo de pan” sigue una
distribución Normal y de una muestra aleatoria de tamaño 15 locales se obtiene x  $1120
y S = $11.5
x  0
Como  es desconocida se usa el estadístico : T   t (14) .
S/ n
El intervalo de 95% de confianza para el precio medio  del kilógramo de pan en la ciudad
es:
 S S 
 x  2.145  15 , x  2.145  15   1113.6 , 1126.4
 
Tenemos un 95% de confianza de que el precio medio del kilógramo de pan en la ciudad está
entre $1113.6 y $1126.4.

Consideremos la pregunta: ¿Hay evidencia para afirmar, con una prueba de hipótesis de
nivel de significación 0.05, que el precio medio del pan en la ciudad es superior a $1100?

Hipótesis: H 0 :   1100 vs H1 :  1100


1120  1100
Estadístico de prueba: T  3.37
11.5 15
Regla de decisión: Se rechaza H 0 si T > C1 = 1.7613
Como 3.37 es mayor que 1.7613 concluimos que hay suficiente evidencia en la muestra
para afirmar que el precio del pan ha subido.

Valor p = P(T14 > 3.37) = 1 – P(T14 ≤ 3.37) = 1 – 0.99771 = 0.0022891 < 0.01
Existe evidencia altamente significativa en contra de H 0
35
ACTIVIDAD 18. Los salarios diarios en una industria en particular presentan una
distribución normal con una media de 132 dólares y una deviación estándar de 25 dólares. Si
en esta industria una compañía que emplea a 40 trabajadores les paga en promedio 122
dólares.
a) ¿Puede acusarse a esta compañía de pagar salarios inferiores? Utilice un α = 0,01.
Justifique mediante la forma clásica o valor p de una prueba de hipótesis.
b) Dada la región de aceptación {𝑥 / 𝑥 > 128}, ddetermine la probabilidad de error tipo II
si el verdadero salario promedio es 131 dólares.
Desarrollo
Sea X: Salarios diarios de los trabajadores de una industria en particular.
𝑋 ~ 𝑁(𝜇 = 132, 𝜎 = 625)
𝑋 , 𝑋 , … , 𝑋 con n = 40 y 𝑥 = 122

a) 𝐻 : 𝜇 = 132 y 𝐻 : 𝜇 < 132


b) Nivel de significación α = 0,01
Estadístico de Prueba bajo la hipótesis nula es
𝑍 = = −2,529
/√
Región Crítica: 𝑧(0,01) = −2,33 → 𝑍 < 𝑧(0,01)
Criterio de Decisión: Rechazar 𝐻 en favor de 𝐻
Conclusión: Con un nivel de significación del 1%, existe evidencia en la muestra para
afirmar que el salario promedio diario es inferior a 132 dólares.

Efectivamente se puede acusar a la compañía de pagar salarios inferiores.


Valor p = 𝑃(𝑍 < −2,529) = 0,0057 < 0,01

c) 𝛽 = 𝑃(𝑥 > 128 / μ = 131) = 1 − 𝑃(𝑧 ≤ )



= 1 − 𝑃(𝑍 ≤ −0, 758 ) = 1 − 0,2236 = 0,7764

En resumen, el procedimiento para realizar una dócima de hipótesis es: Dadas las hipótesis
nula y alternativa se propone un estadístico de prueba adecuado y una región crítica en la
cual H 0 es rechazada. La solución clásica define un nivel de significación  que es el error
tipo I máximo que se está dispuesto a cometer. En base a  se determina la región de
rechazo específica. Por último se decide entre rechazar la hipótesis nula o no rechazarla. La
solución alternativa considera calcular el valor de probabilidad, Valor p.

B. Prueba de hipótesis para varianzas

Suponemos que la media  es desconocida de una población normal aunque los


resultados se pueden extender en forma natural al caso en que  es conocido.
Suponga las hipótesis H 0 :  2   02 H 1 :  2   02
(n  1)  S 2
Bajo H 0 se tiene el estadístico X C2   X (2n 1)
 2
0

36
Así, si este estadístico toma valores cercano a (n-1), que corresponde a la media de la
distribución, se acepta H 0 .
Si la hipótesis nula es de la forma H 0 :  2   02 entonces sólo se rechaza H 0 para
valores grandes de C2 . Mientras que si la hipótesis nula es de la forma H 0 :  2   02 sólo se
rechaza H 0 para valores pequeños de X C2 . Los valores críticos son obtenidos de tablas de
la distribución X (2n 1) en base al nivel de significación  dado.

El valor-p es en este caso:


a) Valor-p = P(  2   c2 ) si hipótesis está dada por (i)
b) Valor-p = P(  2   c2 ) si hipótesis está dada por (ii)
c) Valor-p = P(  2   a2   2   b2 ) si hipótesis está dada por (iii)

a)  c2
b)  c2
c)  a2  b2

Con  a2 ,  b2 o  c2 valor de la medida de discrepancia evaluada en la muestra.

ACTIVIDAD 19. Una máquina produce las varillas de metal utilizadas en el sistema de
suspensión de un automóvil. Se toma de una muestra aleatoria de 16 varillas y se mide el
diámetro (en milímetros), obteniéndose los datos siguientes:
8.24. 8.21. 8.23. 8.25. 8.26. 8.20. 8.23. 8.26
8.19 8.23 8.20 8.28 8.24 8.25 8.24 8.24
Suponiendo que los diámetros de las varillas tienen distribución normal ¿Los datos apoyan
la afirmación que la desviación estándar del diámetro de las varillas es mayor de 0.04
milímetros? Argumente su respuesta, use α = 0.05.
DESARROLLO
X: Diámetro de la varilla (milímetros).
𝑋~𝑛(𝜇, 𝜎 )
𝑛 = 16 → 𝑠 = 0,024
Prueba de Hipótesis para 𝜎 , con 𝛼 = 0,05
𝐻 : 𝜎 ≤ 0,04 y 𝐻 : 𝜎 > 0,04
( ) ,
Estadístico de prueba 𝜒 = = 5,40
,

Región critica 𝜒( , , ) = 𝜒( , , ) = 24,9958

Regla de decisión 𝜒 = 5,40 < 𝜒( , , ) = 24,9958 , no se rechaza H0

Conclusión. Con significancia del 5%, no existe evidencia para rechazar la hipótesis nula
H0, por lo tanto los datos no apoyan la afirmación de que la desviación estándar del
diámetro de las varillas es mayor de 0.04.

37
C. Test para parámetros en otras distribuciones

Para desarrollar test de hipótesis que se refieren a parámetros de distribuciones no normales


se puede utilizar el teorema central del límite. En particular, en una muestra aleatoria de
X 
tamaño n grande se considera el estadístico de prueba:  N (0,1)
 n
El procedimiento aplicado para las reglas de decisión en estas situaciones es exactamente
igual al aplicado en el caso de la distribución normal. Si la varianza poblacional es
desconocida puede ser reemplazada por su estimador consistente S 2 sin alterar la
distribución límite.
La forma usual de hacer un test de hipótesis considera la distribución de probabilidades de
algún estadístico bajo H 0 . Cuando la varianza del estimador depende del parámetro
considerados en las hipótesis el estadístico Z C se puede evaluar reemplazando  por  0 en
la expresión de la varianza (que es lo que ocurre en los test de hipótesis para proporciones).

ACTIVIDAD 20. El ruido en las líneas de transmisión eléctrica, variaciones de voltaje y


cortes de energía (apagones) pueden efectuar el funcionamiento de las computadoras.
Cuando entra ruido en un televisor, el resultado consiste en estática y nieve; si entra en una
computadora, son posibles los errores y daño de circuitos. Se piensa que más de 80% de las
alteraciones de las líneas de transmisión eléctrica en un sitio de cómputo específico
corresponde a ruido. De 150 alteraciones en las líneas de transmisión ocurridas durante el
tiempo de estudio, 133 se deben a ruido. ¿Puede rechazarse H 0 con el nivel de significación
α = 0.01? Resuelva por los dos métodos: clásico y mediante el valor-p. No olvide concluir
en el contexto del problema.
Desarrollo
Sea 𝑝 el porcentaje de las alteraciones de las líneas de transmisión eléctrica en un sitio de
cómputo específico corresponde a ruido.
Las hipótesis son 𝐻 : 𝑝 ≤ 0,80 y 𝐻 : 𝑝 > 0,80
Nivel de significación 𝛼 = 0,01
En este caso, mediante el teorema central del límite para n grande, el estadístico a utilizar es
𝑍 = ≈ 𝑁(0,1)

, ,
Así, 𝑍 = , ∙ ,
= 2,65

Región de Rechazo Z(0,99) = 2,33


Regla de Decisión: Como 𝑍 > 2,33. Rechazar H0 en favor de H1

Conclusión, Con un nivel de significación del 1%, existe evidencia en la muestra para afirmar
que más del 80% de las alteraciones de las líneas de transmisión eléctrica en un sitio de
cómputo específico corresponde a ruido.

Valor p = 𝑃(𝑍 > 2,65) = 1 − 𝑃(𝑍 ≤ 2,65) = 1 − 0,995975 = 0,004 > 0,01
Existe evidencia en la muestra que más del 80% de las alteraciones de las líneas de
transmisión eléctrica en un sitio de cómputo específico corresponde a ruido.
38

Das könnte Ihnen auch gefallen