Sie sind auf Seite 1von 11

PROBABILIDAD E INFERENCIA ESTADÍSTICA

SEGUNDO AÑO

Capítulo 10

Métodos de Estimación
Octubre 2010

Objetivos del Capítulo

- Definir una estimación puntual.


- Interpretar el nivel de confianza
- Construir un intervalo de confianza para la media poblacional cuando se conoce la desviación
estándar poblacional
- Construir un intervalo de confianza para la media poblacional cuando no se conoce la desviación
estándar poblacional.
- Construir un intervalo de confianza para una proporción poblacional
- Determinar el tamaño de la muestra apropiado para el muestreo por atributos y variables

Bibliografía del Capítulo 11

- Lind, pp. 297 - 333


- Anderson, 291 - 326
- Webster, 168 - 195
- Levin, pp. 362 – 417

Estimaciones puntuales

Una estimación puntual es un valor único obtenido de una muestra representativa que se utiliza para estimar
un valor poblacional. Por ejemplo, si seleccionamos una muestra de 50 estudiantes de la UMA y le
preguntamos a cada uno por el número de horas que estudió la semana pasada. La media de esta muestra se
utiliza como una estimación puntual del número promedio de horas que la totalidad de la población de
estudiantes de la UMA estudió la semana pasada. Así la media muestral, x es un estimador puntual del
parámetro, media poblacional, μ.

De forma análoga la proporción muestral, p es una estimación puntual del parámetro, proporción poblacional,
π y la desviación estándar de la muestra, s estima puntualmente a las desviación estándar poblacional, σ.

Recordamos que el Teorema del Límite Central nos da ciertas garantías sobre la capacidad predictiva de los
estadísticos o estimadores calculados a partir de muestras representativas y probabilísticas de la población en
estudio.

Estimaciones de parámetros poblacionales mediante intervalos de confianza

Generalmente en lugar de realizar estimaciones puntuales de parámetros poblacionales realizamos


estimaciones mediante intervalos de confianza o rango de valores dentro de los cuales se espera esté incluido
el verdadero valor del parámetro poblacional.

1
Intervalos de confianza, definiciones:

- Conjunto de valores obtenidos a partir de los datos muestrales, en la que hay una determinada
probabilidad de que se encuentre el parámetro poblacional a ser estimado. A esta probabilidad se le
conoce como el nivel de confianza. Los niveles de confianza del 95% y del 99% son los más
utilizados.
- El intervalo de confianza nos da una medición de la precisión de la estimación. El intervalo de
confianza establece un rango de valores, por encima y por debajo de la estimación puntual, que se
espera incluya entre sus límites al verdadero valor del parámetro poblacional con una alta
probabilidad de que así sea. El intervalo de confianza se expresa en las mismas unidades de la
estimación puntual. Intervalos más amplios sugieren menor precisión, intervalos de menor amplitud
denotan mayor precisión.
- Medición de la precisión o estabilidad de la estimación determinada por la variabilidad de la data.
- Es necesario señalar que por ejemplo un nivel de confianza del 95% no significa que hay un 95% de
probabilidad de que el intervalo de confianza incluye entre sus límites al verdadero valor de la media
poblacional. Lo que significa es que de la totalidad de muestras que se pueden obtener de tamaño n,
un 95% de ellas generarán intervalos de confianza que incluyen al verdadero valor del parámetro.

Intervalo de Confianza para la media poblacional cuando n ≥ 30 y la desviación estándar poblacional, σ


es desconocida y la estimamos con la desviación estándar muestral, s

Para la obtención de los intervalos de confianza nos basamos en el Teorema del Límite Central y en la
distribución normal estándar ya estudiada

Fórmula del intervalo de confianza:

s
x +/- (z ) ( )
n

s
Límite inferior del intervalo de confianza: x - (z ) ( )
n

s
Límite superior: x + (z ) ( )
n

Donde:

x es el valor de la media muestral (estadístico)

z, es valor de la distribución normal estándar N (0,1) correspondiente al nivel de nivel de confianza escogido

s, es la desviación estándar (estadístico) obtenido de la muestra seleccionada.

n, el tamaño de la muestra.

s
es la desviación estándar de la distribución de medias muestrales (Teorema del Límite Central). A esta
n
desviación estándar se le denomina, “error estándar”

2
Por el Teorema del Límite Central sabemos que si el tamaño de la muestra es grande, las posibles medias
muestrales de tamaño n que se pueden tomar de esa población siguen una distribución normal con media igual
σ s
a la media poblacional, µ y con desviación estándar igual a en caso de conocer a σ, o si no se
n n
conoce y utilizamos su estimador, s.

El nivel de confianza seleccionado determina la probabilidad de que intervalos como los generados pudieran
incluir al verdadero valor del parámetro. El nivel de confianza seleccionado incide directamente en la
amplitud del intervalo obtenido.

Así, si el nivel de confianza escogido es del 95% determinamos los valores de Z que se ubican en ambos
extremos de la curva y que acumulan un 95% de probabilidad o lo que es lo mismo, excluyen valores
extremos en cada cola de la curva de 2,5%

En la tabla de la distribución normal estándar podemos apreciar que el valor correspondiente de z para el 95%
es 1,96. …. (0,50 – 0,475) = 0,0025 … … 2.5% en ambos lados de la curva.

Para el 99% tenemos en consecuencia un valor de z = 2,58. …. (0,50 – 0,495) = 0,005 … … 0,5% en
ambos lados de la curva.

¿Como influyen los diferentes valores en la amplitud del intervalo?

- Mientras mayor sea el nivel de confianza mayor será la amplitud del intervalo (2,58 (99%) mayor
que 1,96 (95%)
- A mayor variabilidad de los datos, más amplios serán los intervalos. Efecto del valor de la
desviación estándar s en la fórmula. Relación directa.
- En la medida que el tamaño de la muestra sea mayor, menor será el intervalo. Efecto de n en la
fórmula. Relación inversa.

Ejemplo

Una asociación laboral desea conocer el ingreso promedio mensual de los profesionales de nivel medio. En
una muestra aleatoria de 256 profesionales la media resultó en 3.178,43 bolívares de sueldo mensual con una
desviación estándar de 143,46 bolívares. La asociación quiere obtener respuesta a las siguientes preguntas:

- ¿Cual es la estimación de la media poblacional?


- ¿Cual es un intervalo de confianza razonable para la media poblacional?
- Explique los resultados obtenidos

Estimamos la media poblacional a través del estimador puntual (estadístico) media muestral igual a Bs.
3.178,50

Intervalo de confianza del 95%

s 143 ,46 143 ,46


x +/- (z ) ( ) 3.178,50 +/- (1,96) ( ) 3.178,50 +/- (1,96) ( )
n 256 16

3.178,50 +/- (1,96) (8,97 ) 3.178,50 +/- 17,57

Intervalo de Confianza del 95% para estimar a la media poblacional es igual a: (3.160,93 ≤ μ ≤ 3.196,07)

3
Un 95% de la infinidad de muestras posibles de tamaño 256 que se pueden tomar de esa población, dará lugar
a intervalos de confianza que incluirán entre sus límites al verdadero valor del parámetro. Esta muestra es una
de ellas.

Intervalo de Confianza para la media poblacional cuando n < 30 y la desviación estándar poblacional σ
es desconocida y la estimamos con la desviación estándar muestral, s

Esta situación no está contemplada en el Teorema del Límite Central pero se presenta muy a menudo.

En este caso sustituimos la distribución normal estándar por la distribución t (t de Student desarrollada por
William Gosset) siempre que la población de origen sea o se asuma normal.

Características de la Distribución t

- Al igual que la distribución normal, la distribución t es continua y simétrica en forma de campana


- La media de la distribución t es cero al igual que la distribución N(0,1) pero su desviación estándar
va variando en la medida que cambia el tamaño de la muestra. Mientras menor sea el tamaño de la
muestra, mayor será la desviación estándar.
- Para un mismo nivel de confianza la distribución t es más extendida, más plana que la distribución z
- Cuando el tamaño de la muestra es mayor de 30 no hay mucha diferencia entre el valor de t y de z

Intervalo de confianza para la media poblacional cuando no se conoce σ y la muestra es pequeña, n < 30

s
x +/- (t ) ( )
n

Resumen del proceso de toma de decisión para la creación de un intervalo de confianza para la estimación de
la media poblacional

¿Es normal la población de Si Utilice la distribución


origen? ¿Se conoce la desviación z
Si estándar poblacional?
No Utilice la distribución
t
¿Es normal la población de Si Utilice la distribución
origen? No ó ¿Es n ≥ 30? z
No
sabemos No Utilice una prueba no
paramétrica

Ejercicio

4
Un fabricante de neumáticos para automóviles quiere investigar cual es el tiempo de vida de la lona de
recubrimiento. En una muestra de sólo 10 cauchos que recorrieron 50.000 Km. con cada uno se determinó que
el espesor promedio de la lona de recubrimiento era de 0,32 cm. Con una desviación estándar muestral de
0,09 cm. Determine un intervalo de confianza del 95 % para estimar la media poblacional. ¿Sería razonable
que el fabricante concluyera que después de un recorrido de 50.000 Km. la media poblacional del espesor de
la lona de recubrimiento es de 0,3 cm.?

Decisión en cuanto al modelo a utilizar para determinar el intervalo de confianza

- Asumimos que la distribución de de los espesores de los cauchos después de haber recorrido 50.000
km. es normal
- El tamaño de la muestra es menor que 30
- No conocemos la desviación estándar poblacional

Utilizamos la distribución t

Para utilizar la distribución t para obtener intervalos de confianza debemos entrar en la tabla con el nivel de
confianza escogido y los grados de libertad correspondientes, n – 1 en este caso, 9

s 0,09
x +/- (t ) ( ) 0,32 +/- (2,262) ( ) 0,32 +/- 0,064 ( 0,256 ≤ μ ≤ 0,384 )
n 10

Es razonable entonces pensar que el espesor de la lona de recubrimiento sea efectivamente, 0,3 cm. ya que
está incluido dentro de los límites del intervalo de confianza.

Intervalo de Confianza para la proporción poblacional cuando n ≥ 30 y la desviación estándar


poblacional σ es desconocida

Hasta ahora hemos utilizado variables de escala de medición de tipo razón matemática o intervalo. Para
situaciones cuando utilicemos escalas nominales o de orden podemos utilizar proporciones en lugar de
medias.

Proporción (Definiciones):

- Fracción, razón o porcentaje que indica la parte de la muestra o población que tiene una
característica determinada.
- Un valor adimensional entre 0 y 1 ( en caso de probabilidades) o entre 0% y 100% en caso de utilizar
porcentajes resultado del cociente de un conteo en el numerador dividido por el conteo del total de
elementos en el denominador.
- Tipo de cociente en el cual el numerador se incluye en el denominador. Es el cociente entre una parte
y el total. Se puede expresar con números decimales (0,2), un cociente (1/5) o un porcentaje (20%).
- La razón entre el número de casos que tienen una característica (numerador) entre el total de casos
observados (denominador). Ejemplo, la proporción de mujeres que participaron en un seminario fue
de 5 de 20, igual a 0,25 o 25%.

x
Proporción Muestral: p = … x, elementos de la muestra n que poseen determinada característica
n

X
Proporción Poblacional: π = X, elementos de la población N que poseen determinada característica.
N

5
Intervalo de Confianza para la proporción

p +/- z σ p donde σ p es el error estándar de la proporción y se calcula

p (1 − p )
σ p=
n

Ejemplo:

El sindicato de una empresa está considerando una propuesta de fusionarse con otro sindicato. De acuerdo con
los estatutos del sindicato de la empresa, es necesario que por lo menos tres cuartas partes de los miembros
del sindicato aprueben la fusión. En una muestra aleatoria de 2.000 miembros del sindicato resultó que 1.600
miembros están a favor de la fusión. ¿Cual es el valor estimado de la proporción poblacional? Determine un
intervalo de confianza del 95% para la proporción poblacional. Interprete los resultados. Basándose en los
resultados de la muestra, ¿se puede concluir que se tiene la proporción necesaria de los miembros a favor de
la fusión?

Estimación puntual de la proporción poblacional

x 1.600
p= p= p = 0,80 … en consecuencia se estima que el 80% de la población favorece
n 2.000
la

fusión (más que el 75%)

Intervalo de confianza para la proporción poblacional

p (1 − p ) 0,8(0,2)
p +/- z σ p σ p= 0,8 +/- 1,96 = 0,8 +/- 0,018
n 2.000

(0,782 ≤ π ≤ 0,818)

Se puede concluir que se va a lograr la proporción requerida con un nivel de confianza del 95%

Factor de Corrección para poblaciones finitas (Este punto lo estudiamos en el capítulo anterior)

Si la muestra es grande en relación al tamaño de la población (mayor del 5%) debemos hacer un ajuste en el
cálculo del error estándar ya sea de la media o de la proporción muestral.

Utilizamos el siguiente factor de corrección:

6
N −n
N −1

Ejemplo:

En una determinada localidad hay 250 familias. Una encuesta realizada a 40 de esas familias indica que en
promedio estas familias tenían viviendas de 450 MBs con una desviación estándar de 75 MBs. Determine un
intervalo de confianza del 90% para la media poblacional de costo promedio de las viviendas.

¿Se debe utilizar el factor de corrección para las poblaciones finitas?

40
= 0,16 … 16% mayor que 5% … debemos utilizarlo
250

Intervalo de confianza para la media

s N −n 75 250 − 40
x +/- (z ) ( ) 450 +/- (1,65) ( )
n N −1 40 250 −1

450 +/- 19,57 0,8434 450 +/- 17,97

El intervalo de confianza del 90% para la media poblacional es (432 ≤ μ ≤ 468)


(432, 468)

Obtención del tamaño de muestra apropiado

El tamaño necesario de la muestra para que cumpla los objetivos del estudio o investigación depende de los
siguientes factores:

1) El nivel de confianza deseado. Mientras mayor sea el nivel de confianza seleccionado por el
investigador, mayor será el tamaño de la muestra resultante. Para un nivel de confianza del 95% el
valor de z es de 1,96 y para el 99%, 2,58
2) El margen de error que el investigador está dispuesto a tolerar o error máximo admisible y se designa
por E. Es la cantidad que se le resta y suma al estadístico muestral (media o proporción) para
determinar los límites del intervalo de confianza. Mientras menor sea el error tolerado mayor será el
tamaño de la muestra resultante.
3) La variabilidad de la población que se estudia. Si la población es muy dispersa se requerirá una
muestra de mayor tamaño.

En caso de que no se disponga el valor poblacional de la desviación estándar, σ será necesario obtener una
estimación de ese parámetro. Existen varias posibilidades para lograr esa estimación:

1) Usar la desviación estándar de una población comparable o de un estudio similar que se haya
realizado.
2) Método de un sexto del rango: Si la distribución de origen es normal sabemos que casi la totalidad de
los datos deben ubicarse entre más, menos tres desviaciones estándar de la media. Recordemos que
el valor de z para el 99% es 2,58 (2,58 desviaciones estándar de la media) … aproximándolo a 3
tenemos que más del 99% de los valores de una distribución normal se encuentra a +/- 3

7
desviaciones estándar de la media. Es decir que si consideramos la diferencia entre el mayor y el
menor valor de la distribución pudiera ser equivalente a 6σ por lo que el rango entre 6 es una buena
estimación de la desviación estándar poblacional si la distribución de origen se asume normal.

Ejemplo:

El director de operaciones de un banco quiere estimar el número de cheques que mensualmente firma un
cliente. El director considera que la distribución de cheques firmados por mes es normal y que el número
mínimo de cheques firmados es 2 y el máximo 50. Es decir que el rango es 50-2 = 48 y un sexto del rango, 48
/ 6 = 8 cheques por pudiera ser una buena estimación de la desviación estándar poblacional, σ

Partiendo de la fórmula de tipificación de la distribución de medias muestrales

X-µ
Z=
s/ n

X- µes el error de muestreo y lo hacemos igual al error máximo admisible, E

E
Z=
s/ n

… operando esta fórmula para despejar n tenemos Z / E = √ n / s ... √ n = Z s / E

n =

donde:

n es el tamaño de la muestra, Z valor de la N (0,1) correspondiente al nivel de confianza escogido, s la


estimación de la desviación estándar poblacional y E el error máximo admisible.

Ejemplo:

Se estima que la desviación estándar de una población es 10. Se quiere estimar la media poblacional con un
error máximo admisible de 2 y con un nivel de confianza del 95%. ¿De que tamaño debe ser la muestra?

n = n = = 96,04

... redondeando hacia arriba escogemos n = 97

Tamaño de muestra requerido para estimar a la proporción poblacional, π

La distribución probabilística de todas las posibles proporciones muestrales, p es una distribución discreta de
tipo binomial, sin embargo si el tamaño de la muestra es suficientemente grande tal que n p ≥ 5 y n (1-p) ≥ 5
entonces al igual que en el caso de la distribución de medias muestrales, la distribución normal es una buena
aproximación a la distribución binomial.

8
Es así como si se dan estas condiciones, la media de las proporciones muestrales será igual a la proporción
poblacional y el error estándar de esta distribución de proporciones muestrales será igual a σ p = √ [ p (1-p) / n
]

La fórmula para la determinación del tamaño de la muestra necesario para estimar a la proporción
poblacional, π es

n = p ( 1 – p) ( Z / E ) 2

donde p es la proporción muestral, Z es el valor correspondiente al nivel de confianza seleccionado y E es el


error máximo admisible.

Es de hacer notar que el término que explica la variabilidad de la población p (1 – p) se pudiera asumir como
p = 0,5 ... es decir p (1 – p) = 0,25. El máximo valor que este factor puede tomar es precisamente 0,25.
Cualquier otro valor de p dará lugar a un menor valor del factor. Por ejemplo si p = 0,6 el factor es 0,24. Si p
es igual a 0,1, el factor es 0,09. Tomando p = 0,5 estamos asumiendo máxima variabilidad.

Ejemplo:

Suponga que el presidente de una empresa desea estimar mediante una muestra aleatoria, la proporción de sus
empleados que apoyaría su propuesta sobre la mudanza de la oficina principal a otra sede. El presidente
quiere que su estimación esté errada no más del 4% del verdadero valor de π. Utilice un nivel de confianza del
95%. El asesor del presidente estima que el porcentaje de apoyo a su propuesta debe estar alrededor del 60%.

a) ¿De que tamaño debe ser la muestra?


b) ¿Cual debería ser el tamaño de la muestra en caso de que no se contara con ninguna
estimación de π?

n = p ( 1 – p) ( Z / E ) 2 n = 0,60 ( 0,40) ( 1,96 / 0,04 ) 2

n = (0,24) (2401) = 576,24 ≈ 577 empleados.

Si no se contara con ninguna estimación de la proporción poblacional asumimos p = 0,5 así:

n = (0,25) (2401) = 600,25 ≈ 601 empleados.

¿Qué hacemos si la empresa tiene solo 500 empleados?

Ejercicios

Problema 1 (Autoexamen 9.3, pag. 315 Lind)

Se realizó una investigación de mercado para estimar la proporción de constructores de casas que reconocen
el nombre comercial de un purificador con solo ver la forma y el color del empaque. En una muestra de 1.400
constructores de casas, 420 reconocieron el nombre comercial.

a) Estime el valor de la proporción poblacional.

p = 420 / 1400 = 0,3 … 30%

b) Calcule el error estándar de la proporción

9
σ p = √ [ p (1-p) / n ] σ p = √ [ 0.3 (0.7) / 1400 ] = 0.0122

c) Determine un intervalo de confianza de 99% para la proporción poblacional

p +/- z σ p 0.3 +/- (2.58) (0.0122) = 0.27 ≤ π ≤ 0.33

d) Interprete los resultados


El intervalo va de 0.27 a 0.33. Aproximadamente 99% de los intervalos obtenidos de manera similar
contendrán a la proporción poblacional.

Problema 2 (Ejemplo, pag. 319 Lind)

Un estudiante de Comunicación Social quiere determinar el ingreso medio anual de los recién graduados de
su profesión. El error al estimar la media debe ser inferior a Bs. 100.000 con un nivel de confianza del 95%.
El estudiante encontró un informe anterior donde se estimaba que la desviación estándar era de Bs. 1.000.000.

a) ¿De que tamaño debe ser la muestra?

n = (Z s / E) 2 n = [ (1.96) ( 1.000.000) / (100.000) ] 2 = 384.16 … 385 es el tamaño de muestra mínimo


que satisface la condiciones.

b) Si el nivel de confianza se eleva al 99%, ¿Cuál debería ser el tamaño de la muestra?

n = (Z s / E) 2 n = [ (2.58) ( 1.000.000) / (100.000) ] 2 = 665.64 … 666 es el tamaño de muestra mínimo


que satisface la nueva condición.

Problema 3 (Ejercicio 51, pag. 325 Lind)

Se estimaba que en el sur este de Caracas el 60% de los hogares tienen televisión por cable o por satélite. Un
estudiante de este curso desea confirmar este dato para su clase de comunicación de masas. Si quiere que su
estimación tenga un error máximo admisible del 5% con un nivel de confianza del 95%.

a) ¿De que tamaño debe ser la muestra?

n = p ( 1 – p) ( Z / E ) 2 n = 0.6 ( 0.4) ( 1.96 / 0.05 ) 2 n = 368.79 n = 369

b) Si el estudiante dudara de la estimación que el 60% de los hogares tuviera televisión por cable. ¿Cuál
sería el valor de p que le garantiza el tamaño de muestra adecuado en el peor de los casos? ¿Cuál
debería ser el tamaño de la muestra entonces?

n = p ( 1 – p) ( Z / E ) 2 n = 0.5 ( 0.5) ( 1.96 / 0.05 ) 2 n = 384.16 n = 385

c) ¿Vale la pena utilizar la información del estudio anterior?

Depende de los costos, pero pareciera que un incremento de 16 elementos en la muestra justifica la opción
más conservadora de 0,5 0,5

Problema 4

10
En una muestra aleatoria de tamaño n (el alumno debe escoger el tamaño de muestra arbitrariamente) tomada
de la población de sueldos anuales de los trabajadores de una empresa dio como resultado que el ingreso
promedio anual de los trabajadores es igual a xx.xxx.xxx bolívares (sustituir por el número de su cédula de
identidad). La desviación estándar de la muestra resultó igual a xxx.xxx bolívares (Igual a su número de
cédula dividido entre 50) .

a) Realice una estimación puntual del ingreso promedio anual de los trabajadores. Comente sobre el
resultado obtenido en términos del problema.
b) Determine un intervalo de confianza razonable para estimar el ingreso anual promedio de los
trabajadores. Justifique la escogencia de la fórmula aplicada y del nivel de confianza seleccionado.
c) ¿Qué podemos decir en cuanto a la probabilidad de que el intervalo de confianza obtenido incluya
dentro de sus límites el verdadero valor del parámetro estimado?

Problema 5

Una empresa tiene 5.500 trabajadores. Se desea estimar el ingreso promedio anual de estos empleados. Se
estima que la desviación estándar de la población es igual a xxx.xxx bolívares (Igual a su número de cédula
dividido entre 50). Determine el tamaño de muestra adecuado para estimar el ingreso promedio anual de estos
trabajadores.

a) Seleccione el error máximo admisible adecuado para su estimación. Justifique su escogencia en


términos del problema. ¿Cuál es el significado del error máximo admisible seleccionado en términos
del problema?
b) Escoja el nivel de confianza apropiado. ¿Cuál es el significado de este nivel de confianza en términos
del problema?. Explique su respuesta.
c) Calcule el tamaño de muestra correspondiente. ¿Qué garantiza el tamaño de muestra obtenido en
términos del problema?
d) ¿Es necesario utilizar el factor de corrección para poblaciones finitas para realizar la estimación por
intervalos del sueldo promedio anual de estos trabajadores? Justifique su respuesta.

Pregunta 3 (5 puntos)

Se extrae una muestra aleatoria de 9 bombillos de un gran cargamento de bombillos. La empresa fabricante de
los bombillos argumenta que la vida útil de estos bombillos sigue una distribución normal con media igual a
300 horas y desviación estándar de 45 horas.

a) Obtenga un intervalo de confianza del 90% para la media desconocida de vida útil de los bombillos
de todo el cargamento. Justifique la escogencia de la fórmula correspondiente. Explique el resultado
en términos del problema.
b) Dibuje un gráfico de los resultados del apartado a). Sea tan claro como sea posible indicando
probabilidades y los ejes correspondientes.
c) Si en lugar de un nivel de confianza del 90% escoge 99%, ¿cual sería el impacto en el intervalo de
confianza de este cambio? Justifique su respuesta en términos del problema.

11

Das könnte Ihnen auch gefallen