Sie sind auf Seite 1von 21

Unidad 2 / Escenario 3

Lectura fundamental

Estimación de parámetros

Contenido

1 Tipos de estimadores

2 Intervalos de confianza

3 Elección del tamaño de la muestra

Palabras clave: estimador, intervalo, confianza, estimador puntual.


Introducción
En los Escenarios 1 y 2 trabajamos los diseños de muestreo y las distribuciones muestrales como
elementos fundamentales de la estadística inferencial. En este Escenario, comenzamos a aplicar los
métodos que permiten generalizar o inferir resultados de una muestra a una población.

La inferencia acerca de los parámetros poblacionales se puede hacer de dos maneras: estimando los
valores de los parámetros poblacionales o tomando decisiones con respecto a ellos. El procedimiento
que se utilice depende muchas veces de las circunstancias que motivan la realización de la inferencia.
Consideremos, por Ejemplo: en una línea de producción es imposible analizar todos los productos
terminados. En este caso, se extraen algunos productos seleccionados al azar hasta conformar una
muestra representativa y se analizan las características, los resultados obtenidos se generalizan a toda
la producción.

Suponga que una fábrica tiene dos incentivos de trabajo para que los empleados incrementen la
producción. Se hace un muestreo de los empleados y, con base en los resultados del mismo, se
escoge el incentivo que generará una mayor producción. Así es que se desea tomar una decisión
acerca de la diferencia en la producción, pero es necesario medir el riesgo de tomar una decisión
incorrecta, para lo cual se hace que la probabilidad de que esto ocurra sea relativamente pequeña.

La inferencia estadística se fundamenta en la teoría de la probabilidad para tomar decisiones bajo


condiciones de incertidumbre. La estimación de parámetros es una de las formas de hacer inferencia
y es el tema que trataremos en este Escenario.

1. Tipos de estimadores
Se utilizan dos procedimientos para hacer estimación de parámetros: la estimación puntual y la
estimación por intervalo.

Suponga que el gerente en una empresa de productos alimenticios quiere estimar el tiempo promedio que
gastan los operarios en la elaboración del producto. Se podría establecer la estimación mediante un solo
número por ejemplo 30 minutos o se podría afirmar el tiempo medio que esté entre 25 y 35 minutos.

POLITÉCNICO GRANCOLOMBIANO 2
La primera forma se llama estimación puntual, ya que se tiene un único número que representa la
estimación. El segundo tipo se llama estimación por intervalo.

La estimación puntual utiliza la información de una muestra para llegar a un solo valor numérico, que estima
el parámetro de interés; esta estimación se realiza mediante un estimador, regla que calcula la estimación
basándose en la información de la muestra y que se enuncia mediante una fórmula (Newbold, 2013).

Los estimadores puntuales más utilizados son:

La media muestral:

Es un estimador puntual de la media poblacional µ y dice cómo puede obtenerse el valor numérico de
la estimación.

Así, entonces, X̅ = μ̂ en donde el símbolo ∧ indica que es un estimador puntual.

La varianza muestral:

Es un estimador puntual de la varianza poblacional σ2. Así, entonces, S2 = σ̂ ²

La proporción muestral

Un estimador puntual de la proporción poblacional es π. Así p = π̂

La estimación puntual es a menudo insuficiente, ya que no permite medir la confiabilidad de los


resultados; de otro lado, la estimación por intervalo tiene dos valores uno llamado límite inferior y
el otro límite superior; el superior está asociado el nivel de confianza, es por esto que este tipo de
estimación es el más utilizado.

POLITÉCNICO GRANCOLOMBIANO 3
Propiedades de los estimadores:

• Insesgado: un estimador es insesgado si la media de la distribución del estimador es igual al


parámetro. La media y la varianza son estimadores insesgados.

• Consistencia: un estimador es consistente si al aumentar el tamaño de la muestra se aproxima al


párametro. La media y la varianza son estimadores consistentes.

• Eficiencia: en el caso de tener dos estimadores, es más eficiente cuando la varianza de la


distribución muestral del estimador es menor.

2. Intervalos de confianza
Una estimación por intervalo describe un conjunto o rango de valores dentro del cual se encuentra
el parámetro de la población; este rango de valores tiene asociada una probabilidad de ocurrencia
llamada nivel de confianza ubicada en el centro de la distribución, que se representa como (1 – α) tal
como se muestra en la figura 1.

Nivel de
confiabilidad

1–α
α α
2 2
-3 -2 -1 0 1 2 3

Figura 1. Área de la curva normal para (1 – α)


Fuente: elaboración propia

Como el nivel de confianza mide la probabilidad de que el parámetro poblacional caiga dentro del
rango de valores, entonces, debe ser un valor alto que generalmente se expresa en porcentaje. Los
niveles de confianza más usados son 90%, 95% y 99%.

POLITÉCNICO GRANCOLOMBIANO 4
2.1. Intervalo de confianza para la media poblacional

Aquí se tendrán en cuenta los métodos que se utilizan para construir intervalos de confianza para la
media poblacional, considerando tres situaciones diferentes:

• Cuando la población es normal y la varianza de la población es conocida.

• Cuando la población es normal y la varianza de la población es desconocida.

• Cuando la población no es normal.

2.1.1. Intervalo para la media de una población normal y la varianza de la población conocida

En el escenario 2 se trató el tema de las distribuciones muestrales y se definió que la distribución


muestral de X̅ es normal con media μ y varianza . Así, entonces, el intervalo está dado por:

Que se escribe en forma resumida como:

Donde:

Z es el valor de la tabla normal estándar que corresponde al nivel de confianza (1-α) y es el


error estándar.

Recuerde que el error estándar se obtiene como:

Para población infinita o desconocida

Para población finita o conocida

POLITÉCNICO GRANCOLOMBIANO 5
Ejemplo:

El gerente de una fábrica preocupado por la demora en la producción quiere estimar el tiempo
promedio que gastan los operarios en ensamblar una pieza determinada. Por experiencia se sabe que
el tiempo gastado tiene distribución normal con desviación estándar de 3,83 minutos.
Se toma una muestra de seis obreros y se registra el tiempo en minutos que gastan ensamblando la pieza:

18,5 20,6 12,9 14,6 19,8 15,0

Encontrar una estimación por intervalo con un nivel de confianza del 90%

Solución:

Con los datos de la muestra se obtiene X̅ :

El tiempo promedio que gastan los operarios en ensamblar la pieza se estima en 16,9 minutos. Esta es
una estimación puntual

Para una confiabilidad del 90% encontramos el valor Z en la tabla de la distribución normal obteniendo:

0,90

0,05 0,05

1,65 1,65

Figura 2. Área de la curva normal para (1 – α) = 90%


Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 6
El intervalo queda entonces:

Se estima que el tiempo promedio de ensamblado poblacional está entre 14,32 y 19,48 minutos, con
una confiabilidad del 90%.

2.1.2. Intervalo para la media de una población normal, la varianza de la población desconocida
y muestra pequeña (n<30)

Como se vio en las distribuciones muestrales, utilizamos la desviación estándar de la muestra S como
una estimación de σ desviación estándar poblacional y se trabaja con la distribución t student con
(n-1) grados de libertad.

El intervalo queda:

Donde t es la distribución t student con (n-1) grados de libertad y es el error estándar.

Ejemplo

Un supermercado vende café cuya etiqueta dice "40 onzas". Ante los reclamos hechos, el gerente
toma una muestra de 14 paquetes y encuentra un peso promedio de 34,86 y una desviación estándar
de 4,23. Con una confiabilidad del 95% estimar el peso promedio de todos los paquetes.

Solución

n=14 X̅ =34,86 S = 4,23 gl = 14 – 1 = 13

Con una confianza del 95% y 13 grados de libertad el valor de la distribución t es 2,1604.

POLITÉCNICO GRANCOLOMBIANO 7
gl = 13

0,95

0,025 0,025

t = 2,1604

Figura 3. Área de la distribución t para (1 – α) = 95% y 13 gl


Fuente: elaboración propia

Entonces el intervalo queda así:

34,86 – 2,44 = 32,41

34,86 + 2,44 = 37,30

Con un nivel de confianza del 95% se puede decir que el peso promedio de la población se encuentra
entre 32,41 y 37,30 onzas.

2.1.3. Intervalo para la media de una población no normal

En el Escenario 2, de acuerdo con el teorema del límite central, se dijo que, para poblaciones
no normales, cuando n es grande, entonces, el valor de se distribuye en forma
aproximadamente normal; también se dijo que una muestra se considera grande si n > 30.
Entonces, el intervalo queda en la siguiente forma:

Si se desconoce σ2 se estima con la varianza muestral S2

POLITÉCNICO GRANCOLOMBIANO 8
Ejemplo

Un gran distribuidor de partes para automóviles quiere hacer una estimación de la vida media que
se espera para los limpiabrisas cuando se tienen condiciones normales de manejo. La gerencia ya ha
determinado que la desviación estándar de la vida de la población es seis meses. Se selecciona una
muestra aleatoria simple de 100 limpiabrisas obteniéndose una vida media de 21 meses. Como el
distribuidor utiliza miles de estas piezas al año, quiere encontrar una estimación por intervalo para la
vida media, con un nivel de confianza del 95%.

Solución

Dado que el tamaño de la muestra es mayor que 30, se puede utilizar la distribución normal como la
distribución de muestreo, por lo tanto:

Como el grado de confiabilidad (1 – α) = 95%, entonces, en la distribución normal el valor de Z = 1,96

gl = 13

0,95

0,025 0,025

z = 1,96

Figura 4. Área de la curva normal para (1 – α) = 95%


Fuente: elaboración propia

Donde el valor Z correspondiente es 1,96. Entonces, remplazando en el intervalo:

21 – 1,18 = 19,82

21 + 1,18 = 22,18

POLITÉCNICO GRANCOLOMBIANO 9
Ahora, se puede decir que la vida media de los limpiabrisas de la población se estima entre 19,82 y
22,18 meses con una confiabilidad del 95%.

2.2. Intervalo de confianza para proporciones de una población


(tamaño de muestra grande)

En la sección anterior, encontramos intervalos para la media, ahora vamos a encontrar intervalos
para la proporción.

La fórmula para estimar el error estándar de una proporción para una población infinita es la siguiente:

Recuerde que para poblaciones finitas se utiliza el factor de corrección por finitud:

Y para encontrar el intervalo de confianza utilizamos la siguiente fórmula (población infinita):

En forma resumida, el intervalo se expresa:

POLITÉCNICO GRANCOLOMBIANO 10
Y el margen de error de este intervalo es:

Ejemplo

En un estudio realizado con una muestra aleatoria de 95 empresas industriales, se encuentra que 67
de ellas han indicado que su empresa ha obtenido la certificación ISO en los últimos años. Se desea
estimar, con un intervalo de confianza del 99%, la proporción poblacional de empresas que han
recibido esta certificación en los últimos años.

Solución

Organicemos los datos dados:

= 0,71 n=95

Calculemos el valor de

(1 – α) = 0,99

α = 0,01 y = 0,005

POLITÉCNICO GRANCOLOMBIANO 11
Determinamos el factor de fiabilidad en la tabla normal:

Tabla 1. Distribución normal estándar

Fuente: Anderson, Sweeney y Williams (2010)

Luego y finalmente, hallamos el intervalo de confianza:

POLITÉCNICO GRANCOLOMBIANO 12
0,5898 ≤ π ≤ 0,8301

Se puede decir con un nivel de confianza del 99%, que la proporción de empresas con certificación
ISO de la población se encuentra entre el 58% y 83%, aproximadamente.

En conclusión, una estimación de intervalo describe un conjunto o rango de valores entre los cuales
está el parámetro de la población.

2.3. Intervalo de confianza para la varianza de una población


con distribución normal

Si se tiene una muestra aleatoria de tamaño n cuyas observaciones son extraídas de una población que
se distribuye normal, con varianza σ2 desconocida y la varianza muestral es S2 entonces, un intervalo
de confianza para la varianza poblacional con un nivel de confianza (1 – α) está dado por:

En donde (n - 1) corresponde al valor de la distribución chi-cuadrado con (n-1) grados de libertad.

La distribución chi- cuadrado no es una distribución simétrica y siempre toma valores positivos. La forma
de la distribución y la tabla tienen la siguiente presentación:

POLITÉCNICO GRANCOLOMBIANO 13
Tabla 2. Distribución chi-cuadrado

Fuente: Anderson, Sweeney y Williams (2010)

Ejemplo:

Para llevar a cabo un control de calidad, una empresa ha extraído una muestra aleatoria de
veinte talegos de abono de 100 kilos, para estimar la variación de los kilos de impurezas. La
muestra da una varianza de 6.62 kilos. Construir un intervalo de confianza del 95% de la
verdadera varianza poblacional.

Solución:

Dado que S² = 6.62 y n=20, vamos a establecer los valores y cuando = 0.025.

POLITÉCNICO GRANCOLOMBIANO 14
0,95

0,025 0,025

8,91 32,85

Figura 5. Distribución chi-cuadrado (1 – α) = 95% y g.l. = 19


Fuente: elaboración propia

De acuerdo a los valores de la tabla =32.85 por otra parte,

De acuerdo a los valores de la tabla = = 8.91

Luego el intervalo de confianza es

Con un nivel de confianza del 95%, se puede decir que la varianza poblacional se encuentra entre
3.83 y 14.12 kilos.

3. Elección del tamaño de la muestra


Siempre que tomamos una muestra perdemos algo de información útil de una población, si queremos
tener un alto nivel de precisión debemos muestrear la población lo suficiente para asegurarnos de que
obtuvimos la información requerida. En general, cuanta más precisión se requiera más grande debe
ser el tamaño de la muestra, pero ¿cómo determinar ese tamaño de muestra adecuado? Veamos las
siguientes situaciones:

POLITÉCNICO GRANCOLOMBIANO 15
3.1. Tamaño de la muestra para estimar la media poblacional con distribución
normal y varianza conocida

Cuando se calcula el intervalo de confianza para la media, el error de estimación para población infinita es:

De esta expresión vamos a despejar el valor de n obteniendo:

Esta expresión permite tener un tamaño de muestra par en una población infinita.

Si la población es finita se utiliza el factor de corrección, así:

Al despejar el valor de n encontramos:

3.2. Tamaño de la muestra para estimar la proporción poblacional


con distribución normal

En forma similar al caso anterior, el error de estimación en la proporción para población infinita es:

POLITÉCNICO GRANCOLOMBIANO 16
La expresión que permite encontrar el tamaño de muestra en función de la proporción es:

Y para poblaciones finitas:

Ejemplo

Se desea estimar el contenido medio de un refresco con un nivel de confianza del 93% y con un
error máximo de estimación de 5 ml. Una muestra previa de cinco refrescos indica que la desviación
estándar del contenido es de 12 ml. ¿Cuál debe ser el tamaño de la muestra?

Los valores que tenemos son:

(1 – α) = 93%

Z: valor de la tabla normal = 1,81

σ= 12 ml

e = 5 ml

^^

Ejemplo propuesto por Newbold (2013): la política de gobierno en asuntos internos ha recibido un
índice de aprobación del 65% en una encuesta reciente. Se ha dicho que el margen de error era de
0.035. ¿De qué tamaño era la muestra utilizada para hacer esta encuesta si suponemos que el nivel de
confianza era del 95%?

POLITÉCNICO GRANCOLOMBIANO 17
Solución:

Organicemos la información dada:

P = 0,65

e = 0,035

Determinamos el valor de alfa:

100 (1 - α)% = 95%

1 - α = 0.95%

α = 1 - 0.95

α = 0.05

= 0.025

Ahora sí, hallamos

gl = 13

0,95

0,025 0,025

z = 1,96

Figura 6. Área de la curva normal para (1 – α) = 95%


Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 18
Luego es 1.96 y el valor de n es aproximadamente 714 porque

En conclusión, para determinar el tamaño de muestra se debe determinar si el interés se centra en la


estimación de la media o de la proporción. Para cualquiera de los dos casos se fija el nivel de confianza
y el error de estimación.

En este Escenario hemos visto la forma puntual y por intervalo de estimar la media, la proporción y la
varianza poblacional en una muestra. A partir del intervalo de la media y de la proporción, con el error
de estimación encontramos una expresión que permite determinar un tamaño de muestra confiable.
En el siguiente Escenario se presentarán los intervalos de confianza que involucran a dos parámetros:
diferencias de medias, diferencias de proporciones y cociente de varianzas. Estos intervalos nos van
a dar información sobre la igualdad estadística de los parámetros correspondientes a las dos
poblaciones bajo estudio.

POLITÉCNICO GRANCOLOMBIANO 19
Referencias
Anderson, D., Sweeney, D. & Williams, T. (2010). Estadística para administración y economía.
México: Ed Thomson

Newbold, P. (2013). Estadística para los Negocios y la Economía. Ed. Prentice Hall. Madrid, España.

POLITÉCNICO GRANCOLOMBIANO 20
INFORMACIÓN TÉCNICA

Módulo: Estadística Inferencial


Unidad 2: Muestreo y distribuciones muestrales
Escenario 3: Estimación de parámetros

Autor: Patricia Castillo Garzón

Asesor Pedagógico: Amparo Sastoque Romero


Diseñador Gráfico: Julieth Rodríguez
Asistente: Eveling peñaranda

Este material pertenece al Politécnico Grancolombiano.


Prohibida su reproducción total o parcial.

POLITÉCNICO GRANCOLOMBIANO 21

Das könnte Ihnen auch gefallen