You are on page 1of 16

Estimacin de parmetros

1. Qu es estimacin?
Se llama estimacin al conjunto de tcnicas que permiten dar un valor aproximado
de un parmetro de una poblacin a partir de los datos proporcionados por una
muestra.
2. Qu es estimacin de parmetros?
Es el procedimiento utilizado para conocer las caractersticas de un parmetro
poblacional, a partir del conocimiento de la muestra.
La teora clsica de la Inferencia Estadstica trata de los mtodos por los cuales se
selecciona una muestra de una poblacin y, basndose en las pruebas de las
muestras, se trata de:
* Estimar el valor de un parmetro desconocido, por ejemplo 0.
* Verificar si q es o no igual a cierto valor predeterminado, por ejemplo 0.
El primero de estos dos procedimientos, de inferir de una muestra a una
poblacin, se llama estimacin de un parmetro; el segundo, prueba de una
hiptesis acerca de un parmetro.
Dentro del primer procedimiento, la estimacin de un parmetro puede tener por
resultado un solo punto (estimacin puntual), o un intervalo dentro del cual exista
cierta probabilidad de encontrarlo (estimacin por intervalos).
Un estimador puntual es un nico punto o valor, el cual se considera va a estimar
a un parmetro. La expresin E( ) = m sugiere que el nico valor de es un
estimador puntual insesgado o no viciado de m .
Un estimador por intervalo se construye sobre el concepto de un estimador
puntual, pero adems, proporciona algn grado de exactitud del estimador. Como
el trmino lo sugiere, un estimador por intervalo es un rango o banda dentro de la
cual el parmetro se supone va a caer.
3. Propiedades de un buen estimador.
Insesgabilidad: estimador de es una variable aleatoria y por lo tanto tiene una
distribucin de probabilidad con una cierta media y variancia. Se puede definir
estimador insesgado diciendo: Si se utiliza un estadstico muestral para estimar
el parmetro de la poblacin , se dice que es un estimador inesgado de , si la
esperanza matemtica de coincide con el parmetro que desea estimar.

En smbolos:

es insesgado

O sea que es de esperar que si se toman muchas muestras de igual tamao


partiendo de la misma distribucin y si de cada una se obtiene un valor , la media
de todos los valores de ha de estar muy cerca de .
Por ejemplo:
* La media muestral es un estimador insesgado de la media poblacional, o sea
que E( ) = m
* La variancia muestral, es un estimador insesgado de la variancia poblacional?
La respuesta depende de cmo se defina la variancia muestral.

Si

, entonces S es un estimador sesgado de s pues

Ms an,
de variancia muestral.

En efecto, si

. Pero el sesgo se puede corregir alterando la definicin

es la variancia muestral corregida, entonces (

y S es un estimador insesgado de s .
Eficiencia: si se utilizan dos estadsticos como estimadores del mismo parmetro,
entonces aquel cuya distribucin muestral tenga menor variancia, es un estimador
ms eficiente o ms eficaz que el otro. Es decir:

es eficiente

mnima.

Luego, si tenemos dos estimadores y


de un mismo parmetro , procedemos
como sigue para hallar el ms eficiente entre ellos.

Se halla la razn
Si K > 1,

es ms eficiente que

y usaremos .

Si K < 1,

es ms eficiente que

y usaremos .

Si K = 1, y
son igualmente eficientes y se puede utilizar cualquiera de los dos
indistintamente.
Supongamos que una variable aleatoria X tiene una distribucin simtrica. Por lo
tanto la media aritmtica y la mediana son iguales. Si se toma una muestra de
esta distribucin, qu estadstico muestral,
o , debera utilizarse para
estimar la media de la poblacin m ?
La respuesta depende de cul es el estimador ms eficaz. Ambos son insesgados,
pero la variancia de
es menor que la de , es decir que
. Por lo tanto
la media muestral es un estimador ms eficaz que la mediana muestral.
Consistencia: Si es un estimador muestral calculado a partir de una muestra
de tamao n y si
es el parmetro de poblacin que se va a estimar, entonces
es un estimador consistente de si la probabilidad de que el valor absoluto de la
diferencia entre y su esperanza
iguale o supere a e(error admitido que
tiende a cero, o sea que es tan pequeo como se quiera), tienda a cero cuando el
nmero de elementos de la muestra tienda a infinito. En smbolos:
si n
O equivalentemente:

si n

Es decir, para que el estimador sea consistente, es necesario que la probabilidad


de que est a menos de cierta distancia "e" del parmetro q , tienda a 1 al
tender n a infinito.
Por ejemplo, se sabe que la media muestral y la variancia son estimadores
consistentes ya que tienden a acercarse a los correspondientes valores de la
poblacin a medida que aumenta el tamao de la muestra, pero un estadstico
muestral puede ser un estimador sin consistencia. Por ejemplo, si el valor de la
primera observacin o la media entre la primera y ltima observacin de una
muestra se utilizaran para estimar la esperanza de la poblacin, tal estimador no
sera consistente pues no tiende a acercarse ms y ms al valor de la poblacin
cuando se aumenta el tamao de la muestra.
Suficiencia: Un estimador suficiente del parmetro q es aquel que agota toda la
informacin pertinente sobre q que se puede disponer en la muestra.

Por ejemplo, si se toma una muestra de n = 30 valores con el fin de estimar m ,


pueden utilizarse como estimadores la primera, la dcimo quinta o la ltima
observacin, o el promedio entre la primera y la quinta observacin. Pero estos
estimadores no son suficientes pues no contienen toda la informacin disponible
de la muestra. La media aritmtica calculada con las 30 observaciones s lo es
pues tiene en cuenta todas las observaciones.
En definitiva, por ejemplo la media aritmtica muestral y la forma corregida de la
variancia muestral, son estadsticas que satisfacen los criterios o propiedades de
"buenos" estimadores.
4. Estimacin por intervalos de confianza (dar ejemplos de cada uno)
Lo dicho hasta ahora se refiere a una estimacin puntual, es decir, estimar un
parmetro a travs de un nico valor. Esta estimacin no es muy conveniente
pues con ella no se puede determinar el error de muestreo, ni la precisin de la
estimacin, ni la confianza que merece tal estimacin.
Existen otros mtodos para estimar parmetros poblacionales que son mucho ms
precisos. Por ejemplo:
* Mtodo de los mnimos cuadrados: se ver en Teora de la Regresin.
* Mtodo de los momentos: no se desarrollar.
* Mtodo de la mxima verosimilitud: que se basa en el principio de que
generalmente ocurre lo ms probable (no se desarrollar)
* Mtodo de estimacin por intervalos de confianza: que se desarrolla a
continuacin.
El procedimiento de determinar un intervalo (a, b) que comprenda un parmetro de
poblacin q con cierta probabilidad 1-A , se llama estimacin por intervalos. Se
vern los casos paramtricos, es decir aquellos en los que se tiene conocimiento
del tipo de distribucin de la poblacin (Binomial, Poisson, Normal,etc.)
En general, para cualquier parmetro q y su correspondiente estimador
intervalo de confianza ser:

Donde:
es el lmite inferior del intervalo de confianza.
es el lmite superior del intervalo de confianza.

1, el

k es una constante no negativa. Es el llamado multiplicador correspondiente a 1-A


es la probabilidad de que el intervalo no incluya al verdadero valor del parmetro.
1-A es el nivel de confianza, es una medida de la fiabilidad de la estimacin.
Por ejemplo, si se toma a = 10%, entonces 1-A = 90% y se dice que se tiene un
intervalo de confianza del 90% y que la probabilidad de que el intervalo contenga
al verdadero valor del parmetro es del 90%. Es decir, que si repetidamente se
muestra y se construye tal intervalo una y otra vez, 90 de cada 100 de estos
intervalos, contendr al parmetro y 10 de ellos no.
Se puede pensar que 1 significa certeza, seguridad y a significa riesgo. La
seguridad menos el riesgo, es decir 1-A da, por lo tanto, el coeficiente de
confianza de nuestras afirmaciones.
En el caso anterior, se tiene una confianza de que 90 de cada 100 intervalos que
se extraigan como muestra, contendrn el verdadero valor del parmetro. Pero
una vez determinado el intervalo, es decir, una vez calculados numricamente los
extremos, ya no debe hablarse en trminos de confiabilidad ni en trminos
probabilsticos, pues la situacin pasa a ser completamente determinstica. De tal
manera, asociado a un intervalo de confianza ya calculado, se tiene una
probabilidad 0 1 de que contenga al parmetro a estimar y no hay otra opcin,
ya que lo contiene o no lo contiene.
Resumiendo, los extremos del intervalo son variables aleatorias, mientras que el
parmetro a determinar es constante.
En general, los pasos a seguir para estimar un parmetro por el mtodo de los
intervalos de confianza, son:
* Fijar el coeficiente de confianza que se desea en la estimacin.
* Extraer la muestra y calcular el o los estadsticos necesarios.
* Determinar la distribucin en el muestreo que tiene el estadstico empleado.

Intervalos de confianza para la media poblacional.


(CASO 1) Con s conocido:
Sea

donde m es desconocido y s conocido.

Sea x1, x2, ... , xn una muestra aleatoria de la variable aleatoria X y sea
muestral.

Se sabe que
central del lmite.

la media

independientemente del valor de n, por el teorema

Luego, tipificando:

Se plantea:

entonces:

Observaciones:
- Si las muestras se toman sin reposicin de una poblacin finita de tamao N,
debe emplearse el factor de correccin por finitud y el intervalo ser:

- Si la poblacin es slo aproximadamente normal, la igualdad sigue siendo vlida


en forma aproximada.
Ejemplo 1: Un grupo de investigadores en Medicina desea estimar el cambio
medio de presin sangunea por paciente en un sanatorio. Se ha seleccionado una
muestra al azar de 30 pacientes y se hall que
puls/seg. Los investigadores
saben que la desviacin estndar de los cambios de presin sangunea para todos
los pacientes es s = 3 puls/seg segn estudios anteriores. Ellos desean estimar el
cambio medio de la presin sangunea por paciente con un intervalo del 95% de
confianza, suponiendo que la variable aleatoria "cambios de presin sangunea"
tiene asociada una distribucin normal de probabilidad.
Respuesta:
X = cambio en la presin sangunea por paciente del sanatorio (en pulsaciones por
segundo)
n = 30

s = 3 1 - a = 0.95

Por tabla:

Entonces:

Lmite inferior (LI) =

Lmite superior (LS) =


Por lo tanto resulta el Intervalo del 95% de confianza para la media:
ICM0,95 = (3,9 ; 6,1)
Luego, puede decirse que el cambio medio en la presin sangunea por paciente,
pertenece al intervalo (3,9 ; 6,1) pulsaciones, con un nivel de confianza del 95%.
Observacin: Ntese que se cae en un abuso de lenguaje pues se debera decir
que el intervalo (3,9 ; 6,1) pulsaciones pertenece a la sucesin que ofrece un nivel
de confianza del 95% para estimar el cambio medio de presin sangunea, pero se
simplifica la expresin para hacerla menos engorrosa o extensa.

En cuanto al tamao ptimo de muestra,


= e determina el error mximo
admitido de muestreo e indica la precisin de la estimacin. Lgicamente se
pretende que sea lo ms pequeo posible. Por otra parte, (1 - a ) es el coeficiente
de confianza y se pretende que sea lo ms grande posible. Pero

depende del

valor de a y al hacer mayor el coeficiente de confianza (1 - a ), el valor


ser
mayor y por lo tanto el error aumentar. Esto se puede regular aumentando el
tamao de la muestra con lo que el error disminuir.

Para el ejemplo 1,
95%.

con un nivel de confianza del

Si se desea elevar el nivel de confianza a 99%, pero sin aumentar el error e de


estimacin, el tamao de la muestra debera ser:

O sea que debe tomarse una muestra de aproximadamente 52 pacientes en lugar


de 30.
Por el contrario, si el investigador deseara un error de estimacin menor, por
ejemplo 1 puls/seg, manteniendo el nivel de confianza en 95%, el tamao de la
muestra requerido ser:

Pacientes.
CASO 2) Con s desconocido
Para estimar s se debe utilizar el desvo estndar muestral corregido.

, ya que segn se ha visto, es un estimador insesgado del


correspondiente parmetro poblacional s . Reemplazando en la variable
tipificada

por

resulta:

Por lo tanto:

= 1-a
Ejemplo 2: Una muestra de 15 aves tomadas al azar en un establecimiento con
5000 aves, (que elabora alimentos balanceados), permiti establecer un aumento
de peso promedio de 90 g por semana y por ave, y un desvo tpico de 10 g. Se
busca estimar el incremento de peso promedio para las 5000 aves del
establecimiento con un intervalo de confianza del 90%.
Respuesta:
X = aumento de peso por ave
n = 15

= 90 g S = 10 g ICM0,90?

Por tabla:
y el intervalo resulta:

Interpretando este resultado, se dice que el aumento de peso por ave por semana
en el establecimiento est entre 85,5 y 94,6 gramos, con un 90% de confianza.

Intervalos de confianza para la diferencia de medias.


CASO
1:
conocidos.

Poblaciones

normales

con

Se fija el nivel de confianza (1 - a ), se extraen dos muestras independientes de


X1 y X2 de tamao n. Ya se ha visto que:

y el estadstico tipificado tiene la siguiente

distribucin:

Adems,

(1)

(2)

Reemplazando en (2), a Z por la expresin (1), se obtiene:

Donde:

Ejemplo 3: Al determinar la superficie en miles de hectreas de las explotaciones


agrcolo-ganaderas de cierta zona, una muestra de 40 explotaciones dio una
superficie media de 900 ha, con una desviacin tpica de 300 ha. En otra zona, al
muestrear tambin 40 explotaciones, la superficie media fue de 600 ha con una
desviacin tpica de 150 ha. Suponiendo que en ambas zonas la variable
"superficie en ha por explotacin" se distribuye normalmente, estimar por un
intervalo de confianza del 90%, la diferencia entre las superficies medias de las
explotaciones de ambas zonas.
Respuesta:
X1 = superficie de cada explotacin agrop. de la primera zona
X2 = superficie de cada explotacin agrop. de la segunda zona
,

Por tabla:

n = 40 ICDM0,90?

Luego:

=
= 300 87,24 = (212,76 ; 387,24) = (212,8 ; 387,2)
Interpretando este resultado, se dice que la diferencia entre las superficies medias
de las explotaciones agrcolo-ganaderas de ambas zonas, se encuentra entre
212,8 y 387,2 ha, con un 90% de confianza.
Observacin: En la frmula tambin puede utilizarse
considerarse

y en ese caso debe

en lugar de

CASO
2:
Poblaciones
desconocidos

normales

con

Se extraen dos muestras independientes (una de cada poblacin) de tamaos n1 y


n2 respectivamente, se fija (1 - a ), se calculan

su diferencia.

a)

Si s 1 y s 2 son

desconocidos

pero

estadsticamente

pueden

considerares iguales (s 1 = s 2), se estiman por


y se procede
como en el caso 1. (Sa es la variancia amalgamada o mancomunada)
b)
Si s 1 y s 2 son
desconocidos
considerarse iguales (s 1 s 2),

pero

estadsticamente no pueden

Se fija (1 - ), se extraen dos muestras independientes, se calcula


distribucin en el muestreo del estadstico de prueba, ya tipificado, es:

y la

~ td
donde el nmero de grados de libertad de la distribucin t de Student viene dado
por la frmula:

De manera anloga al primer caso, se deduce que:

Ejemplo 4: Las variables aleatorias X 1 y X2 distribuidas normalmente, representan


las edades al morir de tuberculosis de los individuos en dos ciudades. Una
muestra de 10 individuos que murieron por tal enfermedad en la primera ciudad
dio una edad media de 48 aos y una desviacin tpica de 5 aos. En la segunda
ciudad, una muestra de 12 individuos dio una edad media de 41 aos y una
desviacin tpica de 3 aos. Se desea estimar por intervalos con un 95% de
confianza, la diferencia entre las edades medias de los muertos por tuberculosis

en ambas ciudades, sabiendo que investigaciones anteriores no permiten tomar


las desviaciones tpicas de ambas variables como iguales.
X1 = edad al morir de tuberculosis en la ciudad A.
X2 = edad al morir de tuberculosis en la ciudad B.

n1 = 10,

, S1 = 5

n2 = 12,

, S2 = 3, s 1 s 2 ICDM0,95?

Respuesta:(corresponde al item b) del caso 2)


Con estos datos, reemplazamos en la frmula para calcular los grados de libertad:

grados de libertad.
Luego, por tabla, t0,05; 15 = 2,1315 y finalmente el intervalo resulta:

ICDM0,95 =
= 7 3,843 = (3,157 ; 10,843) @ (3 ; 11)
Interpretando el resultado se puede decir que la diferencia entre las edades
medias de las personas que murieron de tuberculosis en ambas ciudades, se
encuentra entre 3 y 11 aos, con una confianza del 95%.
5. Estimacin puntual (dar ejemplos)
Una estimacin puntual del valor de un parmetro poblacional desconocido (como
puede ser la media , o la desviacin estndar ), es un nmero que se utiliza
para aproximar el verdadero valor de dicho parmetro poblacional. A fin de realizar
tal estimacin, tomaremos una muestra de la poblacin y calcularemos el
parmetro muestral asociado (x para la media, s para la desviacin estndar, etc.).

El valor de este parmetro muestral ser la estimacin puntual del parmetro


poblacional.
1. Ejemplo, supongamos que la compaa Sonytron desea estimar la edad
media de los compradores de equipos de alta fidelidad. Seleccionan una
muestra de 100 compradores y calculan la media de esta muestra, este
valor ser un estimador puntual de la media de la poblacin. Qu
propiedades debe cumplir todo buen estimador? Estimacin puntual y
estimacin por intervalos de confianza Proyecto e-Math 3 Financiado por la
Secretara de Estado de Educacin y Universidades (MECD) Insesgado:
Un estimador es insesgado cuando la media de su distribucin muestral
asociada coincide con la media de la poblacin. Esto ocurre, por ejemplo,
con el estimador x , ya que x = y con estimador p ya que p p = De
varianza mnima: La variabilidad de un estimador viene determinada por el
cuadrado de su desviacin estndar. En el caso del estimador x , su
desviacin estndar es n x = , tambin llamada error estndar de . En
el caso del error estndar de p, n p p p *(1 ) = Observar que cuanto
mayor sea el tamao de la muestra n , menor ser la variabilidad del
estimador x y de p, por tanto, mejor sern nuestras estimaciones.
2. Ejemplo: Sea X N(, ), con desconocido. Seleccionada una m.a.s. X1,
..., Xn, con realizacin x1, ..., xn, estimamos el parmetro por ambos
mtodos. Segn el mtodo de los momentos: E(X) = Xn i=1 Xi n = X, y al
ser = E(X) se obtiene que = x. Por el mtodo de mxima
verosimilitud: L(x1, ..., xn) = Yn i=1 f(xi ) = = Yn i=1 1 2 e (xi) 2
2

PROPIEDADES DEL ESTIMADOR Sesgo. Se dice que un estimador es insesgado


si la Media de la distribucin del estimador es igual al parmetro. Estimadores
insesgados son la Media muestral (estimador de la Media de la poblacin) y la
Varianza (estimador de la Varianza de la poblacin)
Ejemplo En una poblacin de 500 puntuaciones cuya Media (m) es igual a 5.09
han hecho un muestreo aleatorio (nmero de muestras= 10000, tamao de las
muestras= 100) y hallan que la Media de las Medias muestrales es igual a 5.09, (la
media poblacional y la media de las medias muestrales coinciden). En cambio, la
Mediana de la poblacin es igual a 5 y la Media de las Medianas es igual a 5.1
esto es, hay diferencia ya que la Mediana es un estimador sesgado.

La Varianza es un estimador sesgado. Ejemplo: La Media de las Varianzas


obtenidas con la Varianza en un muestreo de 1000 muestras (n=25) en que la
Varianza de la poblacin es igual a 9.56 ha resultado igual a 9.12, esto es, no
coinciden. En cambio, al utilizar la Cuasivarianza la Media de las Varianzas
muestrales es igual a 9.5, esto es, coincide con la Varianza de la poblacin ya que
la Cuasivarianza es un estimador insesgado.
Estimador de la varianza A la hora de elegir un estimador de comenzar con el
estimador ms natural: podemos Podemos comprobar que cuando el carcter que
se estudia sobre la poblacin es gaussiano, en realidad este es el estimador
mximo verosmil para la varianza. Sin embargo se comprueba tambin su falta de
sesgo, lo que hace mas adecuado que se utilice como estimador de la varianza al
siguiente concepto: cuasi varianza muestral.
Ejemplo 7.1: Sea X N(, ), con desconocido. Seleccionada una m.a.s.
X1, ..., Xn, con realizacin x1, ..., xn, estimamos el parmetro por ambos
mtodos. Segn el mtodo de los momentos: E(X) = Xn i=1 Xi n = X, y al ser =
E(X) se obtiene que = x. Por el mtodo de mxima verosimilitud: L(x1, ...,
xn) = Yn i=1 f(xi ) = = Yn i=1 1 2 e (xi) 2 2

Repblica Bolivariana de Venezuela


Ministerio del Poder Popular para la Educacin Universitaria
Universidad Nacional Experimental
Rafal Mara Baralt
Programa: Administracin
Especialidad: Tributacin
Estadstica II

ESTIMACIN DE PARAMETROS

Integrantes:
Paola Ramos C.I.:21.045.149
Loreangel Perozo C.I.:23.881.772
Seccin: 111