Sie sind auf Seite 1von 7

1.

INTRODUCCIN A LA INFERENCIA ESTADSTICA

El objetivo bsico de la inferencia estadstica es hacer inferencias o sacar conclusiones sobre la poblacin a partir de la informacin contenida en una muestra aleatoria de la poblacin. Ms especficamente, podemos decir que la inferencia estadstica consiste en el proceso de seleccin y utilizacin de un estadstico muestral, mediante el cual, utilizando la informacin que nos proporciona una muestra aleatoria, nos permite sacar conclusiones sobre caractersticas poblacionales. Cualquier inferencia o conclusin obtenida de la poblacin, necesariamente, estar basada en un estadstico muestral, es decir, en la informacin proporcionada por la muestra (formalmente definimos un estadstico como una funcin de las observaciones muestrales). La eleccin del estadstico apropiado depender de cul sea el parmetro poblacional que nos interese. El valor verdadero del parmetro ser desconocido y un objetivo sera estimar su valor, por lo que tal estadstico se denomina estimador. Las inferencias sobre el valor de un parmetro poblacional se pueden obtener bsicamente de dos maneras: a partir de estimacin o bien a partir del contraste de hiptesis. En la estimacin, basta seleccionar un estadstico muestral cuyo valor se utilizar como estimador del valor del parmetro poblacional. En el contraste de hiptesis, se hace una hiptesis sobre el valor del parmetro y se utiliza la informacin proporcionada por la muestra para decidir si la hiptesis se acepta o no. Ambos mtodos de inferencia estadstica utilizan las mismas relaciones tericas entre resultados muestrales y valores poblacionales. As pues, una muestra es sacada de la poblacin y un estadstico muestral es utilizado para hacer inferencias sobre el parmetro poblacional. En estimacin, la informacin muestral es utilizada para estimar el valor del parmetro . En el contraste de hiptesis, primero se formula la hiptesis sobre el valor de y la informacin muestral se utiliza para decidir si la hiptesis formulada debera ser o no rechazada. Pero cuando se utiliza la inferencia para estimar un parmetro poblacional debemos decir cmo de buena es esa inferencia, o sea debemos dar una medida de su bondad. Para ello ser necesario conocer la diferencia existente entre la estimacin del parmetro poblacional, calculada a partir de una muestra especfica de tamao n, y el valor verdadero del parmetro poblacional.
2. EL PROBLEMA DE LA ESTIMACIN: ESTIMACIN PUNTUAL

La estimacin estadstica se divide en dos grandes grupos: la estimacin puntual y la estimacin por intervalos. La estimacin puntual consiste en obtener un nico nmero calculado a partir de las observaciones muestrales, y que es utilizado como estimacin del valor del parmetro . Se le llama estimacin puntual porque a ese nmero, que se utiliza como estimacin del parmetro , se le puede asignar un punto sobre la recta real. En la estimacin por intervalos se obtienen dos puntos ( un extremo inferior y un extremo superior) que definen un intervalo sobre la recta real, el cual contendr con cierta seguridad el valor del parmetro . El estimador del parmetro poblacional es una funcin de las variables aleatorias u observaciones muestrales y se representa por 1

$ =g ( X 1 , X 2 ,..., X n ) Para una realizacin particular de la muestra ( x1 , x2 ,..., xn ) se obtiene un valor especfico del estimador que recibe el nombre de estimacin del parmetro poblacional y lo notaremos por $ = g ( x1 , x2 ,..., xn ) Vemos pues que existe diferencia entre estimador y estimacin. El estimador es un estadstico y, por tanto, una variable aleatoria y el valor de esta variable para una muestra concreta ( x1 , x2 ,..., xn ) ser la estimacin puntual. El estimador tendr su distribucin muestral. En la tabla 2.1 expresamos diferentes parmetros poblacionales, sus estimadores y sus estimaciones. Parmetro poblacion al Media Varianza 2 Proporci n p

Estimador

Estimacin

n 1 n 2 = S2 = ( X i X )2 n 1 i =1 X nmeroxitos p= = n nmeropruebas

=X =

X
i =1

n 1 n s2 = xi x n 1 i =1 x p= n

x=

x
i =1

TABLA 2.1 Parmetros poblacionales, estimadores y estimaciones. Para la eleccin de estos estimadores puntuales nos hemos basado, principalmente en la intuicin y en la posible analoga de los parmetros poblacionales con sus correspondientes valores muestrales, pero ste no ser el mtodo ms adecuado para la obtencin de estimadores puntuales, aunque en este caso se obtienen estimadores satisfactorios para los parmetros poblacionales. En general, el problema de obtener estimadores puntuales no ser tan sencillo, por ello tenemos que dar propiedades que seran deseables que se cumplieran por los diferentes estimadores puntuales obtenidos, aunque no existe un mecanismo o mtodo nico que nos permita obtener el mejor estimador puntual en todas las circunstancias. Nuestro objetivo ahora ser dar algunas propiedades deseables de los estimadores puntuales, con el fin de poder conocer la bondad de los mismos, pues cuantas ms propiedades verifiquen los estimadores puntuales mejores sern.

* PROPIEDADES DESEABLES DE LOS ESTIMADORES PUNTUALES a) Estimador insesgado Si tenemos un gran nmero de muestras de tamao n y obtenemos el valor del estimador en cada una 2

de ellas, sera deseable que la media de todas estas estimaciones coincidiera con el valor de . Se dice que un estimador es insesgado si su esperanza matemtica coincide con el valor del parmetro a estimar. b) Estimador eficiente Se dice que los estimadores son eficientes cuando generan una distribucin muestral con el mnimo error estndar ,es decir, entre dos estimadores insesgados de un parmetro dado es ms eficiente el de menor varianza. c) Estimador consistente Un estimador se dice consistente cuando su valor tiende hacia el verdadero valor del parmetro a medida que aumenta el tamao de la muestra . Es decir, la probabilidad de que la estimacin sea el verdadero valor del parmetro tiende a 1. d) Estimador suficiente Se dice de un estimador que es suficiente cuando es capaz de extraer de los datos toda la informacin importante sobre el parmetro. 3. ESTIMACIN POR INTERVALOS La estimacin puntual es poco til, pues solo obtenemos un valor como aproximacin al que tratamos de estimar. Es mucho ms interesante obtener un intervalo dentro del cual se tiene una cierta confianza de que se encuentre el parmetro que tratamos de estimar. El objetivo que se pretende con los intervalos de confianza es obtener un intervalo de poca amplitud y con una alta probabilidad de que el parmetro se encuentre en su interior. As pues, elegiremos probabilidades cercanas a la unidad, que se representan por 1- y cuyos valores ms frecuentes suelen ser 0'90, 0'95 y 0'99. Luego si deseamos obtener una estimacin por intervalo del parmetro poblacional desconocido, tendremos que obtener dos estadsticos ( X 1 , X 2 ,..., X n ) y

( X 1 , X 2 ,..., X n ) que nos darn los valores extremos del intervalo, tales que
P ( X 1 , X 2 ,..., X n ) ( X1 , X 2 ,..., X n ) = 1

Al valor 1- se le llama coeficiente de confianza, y Al valor 100(1-) % se le llama nivel de confianza. a) Intervalo de confianza para la proporcin poblacional. 3

Si p representa la proporcin de xitos en una muestra aleatoria de tamao n suficientemente grande y q=1-p, entonces un intervalo de confianza aproximado para la proporcin poblacional p al nivel de confianza del 100(1-)% viene dado por: pq pq , p + z p z n n 2 2 en donde z / 2 es tal que

2 y la variable aleatoria Z sigue una distribucin N(0,1).


P[Z> z / 2 ]=

b) Intervalo de confianza para la media de una poblacin normal, siendo conocida Supongamos que tenemos una muestra aleatoria de n observaciones de una distribucin N(, ). Si es conocida, y la media muestral observada es x , entonces el intervalo de confianza para la media poblacional , al nivel de confianza del 100(1)% viene dado por:

, x + z / 2 x z / 2 n n
donde z / 2 es tal que P ( Z > z / 2 ) = y la variable aleatoria ZN(0,1).

c) Intervalo de confianza para la media de una poblacin normal, siendo desconocida y n<30. Supongamos que tenemos una muestra aleatoria de n<30 observaciones de una distribucin N(,). Si es desconocida, y la media y la desviacin tpica muestral observadas son x y s, respectivamente, entonces el intervalo de confianza para la media poblacional , al nivel de confianza del 100(1-)% viene dado por: $ $ s s , x + t / 2 x t / 2 n n donde t / 2 es tal que P [ tn 1 > t / 2 ] = 2 y la variable tn 1 sigue una distribucin t-Student con n-1 grados de libertad. d) Intervalo de confianza para la varianza de una poblacin normal.

Supongamos una muestra aleatoria de n observaciones de una distribucin N(,). 2 $ Si es desconocida y la varianza muestral observada es s entonces el intervalo de confianza para la varianza poblacional 2 al nivel de confianza del 100(1-)% viene dado por: (n 1) s (n 1) s , 2 2 n 1, / 2 n 1,1 / 2
2 donde n 1,1 / 2 es tal que: 2 2 P n 1 n 1,1 / 2 = 2 y n 1, / 2 es tal que: 2 2 P n 1 n 1, / 2 = 1

2 2

2 y la variable aleatoria n 1 sigue una distribucin 2 de Pearson con n-1 grados de libertad.

e) Intervalo de confianza para la diferencia de medias en poblaciones normales independientes Supongamos dos muestras independientes de tamao nx y n y procedentes de poblaciones normales. N ( x , x ) y N ( y , y ) , respectivamente. Si las medias para las muestras observadas son x e y , entonces un intervalo de confianza, al nivel de confianza del 100(1-)%, para las diferencias de medias poblacionales x y viene dado por:
2 2 2 2 x y x y ( x y ) z / 2 + , ( x y ) + z / 2 + nx n y nx n y

en donde z / 2 es el nmero tal que: P [ Z > z / 2 ] = N(0, 1). 4. ESTIMACIN DEL TAMAO MUESTRAL

y la variable aleatoria Z sigue una 2

Sabemos que si tomamos una muestra aleatoria simple de tamao n procedente de una poblacin N(,), siendo conocida, el intervalo de confianza al nivel del 100(1)% para la media poblacional vena dado por: I = x z / 2 , x + z / 2 n n Siendo la amplitud del intervalo 5

L = ( x + z / 2

) ( x z / 2 ) = 2 z / 2 n n n

(*)

Si, previamente, se fija la longitud del intervalo L y deseamos conocer el tamao de la muestra para obtener ese intervalo al nivel de confianza del 100(1-)%, bastar despejar n de la expresin (*), pues L, z / 2 y son conocidos, y tendremos que el tamao de la muestra ser: n = 4z
2 /2

2 L2

el cual nos permitir construir un intervalo al nivel de confianza del 100(1-)% y de amplitud L para la media de una poblacin normal con conocida. Tambin podramos hacer el siguiente razonamiento cuando sea conocido, si la media fuera el valor central del intervalo, entonces x estimara puntualmente a sin error alguno, x |---------------------------|----------------|---------------------------| error x z / 2 x + z / 2 n n Pero generalmente x no ser exactamente igual a y entonces se comete un error, E=| x -|, que como mximo ser: E= z / 2 n entonces si queremos determinar el tamao de muestra necesario para obtener un intervalo de confianza para la media poblacional , admitiendo un error E, tendremos que despejando de la expresin anterior:
2 n = z / 2

2 E2

2 2 z / 2 pq z / 2 pq Igualmente se tendra para una proporcin : n=4 = 2 2 L E

Das könnte Ihnen auch gefallen