Sie sind auf Seite 1von 6

UNIDAD 5 ESTADISTICA APLICADA

5.1 Inferencia estadstica: Concepto, Estimacin, Prueba de hiptesis La Inferencia Estadstica es la parte de la estadstica matemtica que se encarga del estudio de los mtodos para la obtencin del modelo de probabilidad (forma funcional y parmetros que determinan la funcin de distribucin) que sigue una variable aleatoria de una determinada poblacin, a travs de una muestra (parte de la poblacin) obtenida de la misma.

Los dos problemas fundamentales que estudia la inferencia estadstica son el "Problema de la estimacin" y el "Problema del contraste de hiptesis"

Cuando se conoce la forma funcional de la funcin de distribucin que sigue la variable aleatoria objeto de estudio y slo tenemos que estimar los parametros que la determinan, estamos en un problema de inferencia estadstica paramtrica ; por el contrario cuando no se conoce la forma funcional de la distribucin que sigue la variable aleatoria objeto de estudio, estamos ante un problema de inferencia estadstica no paramtrica.

En lo que sigue nos vamos a limitar a problemas de inferencia estadstica paramtrica, donde la variable aleatoria objeto de estudio sigue una distribucin normal, y slo tendremos que tratar de estimar los parmetros que la determinan, la media y la desviacin tpica.

Esta situacin se presenta con frecuencia debido a que es posible a menudo conocer la forma funcional de la distribucin de probabilidad, por consideraciones tericas, quedando nicamente indeterminados los parmetros que determinan la funcin de distribucin.

Como las poblaciones en las que se pretende estudiar una determinada variable aleatoria, son grandes, es muy caro o imposible, estudiar a todos sus individuos; lo que se hace, es estudiar una muestra ( una parte) de la poblacin

En todos estos problemas que estudia la inferencia estadstica juega un papel fundamental la "Teora de la Probabilidad" (distintas formas funcionales de las distribuciones de probabilidad) y la "Teora de Muestras" (procedimientos para tomar muestras de manera apropiada).

ESTIMACIN. El material sobre teora de la probabilidad constituye la base de la inferencia estadstica, rama de la estadstica que tiene que ver con el uso de los conceptos de la probabilidad para tratar con la toma de decisiones en condiciones de incertidumbre. La inferencia estadstica est basada en la estimacin y en la prueba de hiptesis. Tipos de estimacin. Podemos hacer dos tipos de estimaciones concernientes a una poblacin:

Una estimacin puntual: es slo u nmero que se utiliza para estimar un parmetro de poblacin desconocido. Una estimacin puntual a menudo resulta insuficiente, debido a que slo tiene dos opciones: es correcta o est equivocada. Una estimacin puntual es mucho ms til si viene acompaada por una estimacin del error que podra estar implicado. Una estimacin de intervalo: es un intervalo de valores que se utiliza para estimar un parmetro de poblacin. Esta estimacin indica el error de dos maneras: por la extensin del intervalo y por la probabilidad de obtener el verdadero parmetro de la poblacin que se encuentra dentro del intervalo.

Estimador y estimaciones. Un estimador es una estadstica de muestra utilizada para estimar un parmetro de poblacin. La media de la muestra puede ser un estimador de la media de la poblacin, y la porcin de la muestra se puede utilizar como estimador de la porcin de la poblacin. Tambin podemos utilizar el alcance de la muestra como un estimador del alcance de la poblacin. Cuando hemos observado un valor numrico especfico de nuestro estimador, nos referimos a ese valor como una estimacin. Una estimacin es un valor especfico observado de una estadstica. Hacemos una estimacin si tomamos una muestra y calculamos el valor que toma nuestro estimador en esa muestra. PRUEBAS DE HIPTESIS. Una hiptesis es una afirmacin acerca de algo. En estadstica, puede ser una suposicin acerca del valor de un parmetro desconocido. Pasos en la prueba de hiptesis: 1. 2. Definir la hiptesis nula: suponer una hiptesis acerca de una poblacin. 3. Formular una hiptesis alternativa: es una contra-hiptesis.

4. Definir un criterio de decisin para rechazar o no la hiptesis nula. 5. Recabar datos de la muestra. 6. Calcular una estadstica de muestra. 7. Utilizar la estadstica de muestra para evaluar la hiptesis. Generalmente, se habla de "no rechazar" una hiptesis en lugar de "aceptar", ya que las pruebas no son concluyentes. Introduccin. La prueba de hiptesis comienza con una suposicin, llamada hiptesis, que hacemos con respecto a un parmetro de poblacin. Despus recolectamos datos de muestra, producimos estadsticas de muestra y usamos esta informacin para decidir qu tan probable es que sea correcto nuestro parmetro de poblacin acerca del cual hicimos la hiptesis. Debemos establecer el valor supuesto o hipotetizado del parmetro de poblacin antes de comenzar a tomar la muestra. La suposicin que deseamos probar se conoce como hiptesis nula, y se simboliza H0. Siempre que rechazamos la hiptesis, la conclusin que s aceptamos se llama hiptesis alternativa y se simboliza H1. Interpretacin del nivel de significancia. El propsito de la prueba de hiptesis no es cuestionar el valor calculado de la estadstica de muestra, sino hacer un juicio respecto a la diferencia entre esa estadstica de muestra y un parmetro de poblacin hipotetizado. El siguiente paso despus de establecer la hiptesis nula alternativa consiste en decidir qu criterio utilizar para decidir si aceptar o rechazar la hiptesis nula. Si suponemos que la hiptesis es correcta, entonces el nivel de significancia indicar el porcentaje de medias de muestra que est fuera de ciertos lmites. Siempre que afirmemos que aceptamos la hiptesis nula, en realidad lo que queremos decir es que no hay suficiente evidencia estadstica para rechazarla. El empleo del trmino aceptar, en lugar de rechazar, se ha vuelto de uso comn. Significa simplemente que cuando los datos de la muestra n hacen que rechacemos una hiptesis nula, nos comportamos como si fuera cierta. Seleccin del nivel de significancia. Nuestra eleccin del estndar mnimo para una probabilidad aceptable, o el nivel de significancia, es tambin el riesgo que asumimos al rechazar una hiptesis nula cuando es cierta. Mientras ms alto sea el nivel de significancia que utilizamos para probar una hiptesis, mayor ser la probabilidad de rechazar una hiptesis nula cuando es cierta.

5.2-ESTIMACIONES PUNTUALES Y POR INTERVALOS DE CONFIANZA ESTIMACIN PUNTUAL Consiste en la estimacin del valor del parmetro mediante un slo valor, obtenido de una frmula determinada. Por ejemplo, si se pretende estimar la talla media de un determinado grupo de individuos, puede extraerse una muestra y ofrecer como estimacin puntual la talla media de los individuos. Lo ms importante de un estimador, es que sea un estimador eficiente. Es decir, que sea insesgado(ausencia de sesgos) y estable en el muestreo o eficiente (varianza mnima)

ESTIMACIN POR INTERVALOS DE CONFIANZA En estadstica, se llama intervalo de confianza a un par de nmeros entre los cuales se estima que estar cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos nmeros determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parmetro poblacional. La probabilidad de xito en la estimacin se representa con 1 - y se denomina nivel de confianza. En estas circunstancias, es el llamado error aleatorio o nivel de significacin, esto es, una medida de las posibilidades de fallar en la estimacin mediante tal intervalo. El nivel de confianza y la amplitud del intervalo varan conjuntamente, de forma que un intervalo ms amplio tendr ms posibilidades de acierto (mayor nivel de confianza), mientras que para un intervalo ms pequeo, que ofrece una estimacin ms precisa, aumentan sus posibilidades de error. Para la construccin de un determinado intervalo de confianza es necesario conocer la distribucin terica que sigue el parmetro a estimar, . Es habitual que el parmetro presente una distribucin normal. Tambin pueden construirse intervalos de confianza con ladesigualdad de Chebyshov. En definitiva, un intervalo de confianza al 1 - por ciento para la estimacin de un parmetro poblacional que sigue una determinada distribucin de probabilidad, es una expresin del tipo [1,2] tal que P[1 2] = 1 - , donde P es la funcin de distribucin de probabilidad de . Intervalo de confianza para la media de una poblacin De una poblacin de media y desviacin tpica se pueden tomar muestras de elementos. Cada una de estas muestras tiene a su vez una media ( ). Se puede demostrar que la media de todas las medias muestrales coincide con la media poblacional: Pero adems, si el tamao de las muestras es lo suficientemente grande, la distribucin de medias muestrales es, prcticamente, una distribucin normal (o gaussiana) con media

y una desviacin tpica dada por la siguiente expresin: como sigue: . Si estandarizamos,

. Esto se representa se sigue

que: En una distribucin Z ~ N(0, 1) puede calcularse fcilmente un intervalo dentro del cual caigan un determinado porcentaje de las observaciones, esto es, es sencillo hallar z1 y z2 tales que P[z1 z z2] = 1 - , donde (1 - )100 es el porcentaje deseado. Se desea obtener una expresin tal que En esta distribucin normal de medias se puede calcular el intervalo de confianza donde se encontrar la media poblacional si slo se conoce una media muestral ( ), con una confianza determinada. Habitualmente se manejan valores de confianza del 95 y del 99 por ciento. A este valor se le llamar (debido a que es el error que se cometer, un trmino opuesto). Para ello se necesita calcular el punto o, mejor dicho, su versin

estandarizada o valor crtico junto con su "opuesto en la distribucin" . Estos puntos delimitan la probabilidad para el intervalo, como se muestra en la siguiente imagen:

Dicho punto es el nmero tal que:

Y en la versin estandarizada se cumple que:

As:

Haciendo operaciones es posible despejar

para obtener el intervalo:

De lo cual se obtendr el intervalo de confianza:

Obsrvese que el intervalo de confianza viene dado por la media muestral producto del valor crtico Si no se conoce por el error estndar .

el

y n es grande (habitualmente se toma n 30):

, donde s es la desviacin tpica de una muestra. Aproximaciones para el valor para y 2,576 para para los niveles de confianza estndar son 1,96 .