Sie sind auf Seite 1von 27

DISTRIBUCIONES MUESTRALES

El estudio de determinadas caractersticas de una poblacin se efecta a travs de diversas muestras que pueden extraerse de ella.

El muestreo puede hacerse con o sin reposicin, y la poblacin de partida puede ser infinita o finita. Una poblacin finita en la que se efecta muestreo con reposicin puede considerarse infinita tericamente. Tambin, a efectos prcticos, una poblacin muy grande puede considerarse como infinita. En todo nuestro estudio vamos a limitarnos a una poblacin de partida infinita o a muestreo con reposicin. Consideremos todas las posibles muestras de tamao n en una poblacin. Para cada muestra podemos calcular un estadstico (media, desviacin tpica, proporcin,...) que variar de una a otra. As obtenemos una distribucin del estadstico que se llama distribucin muestral. Las dos medidas fundamentales de esta distribucin son la media y la desviacin tpica, tambin denominada error tpico. Hay que hacer notar que si el tamao de la muestra es lo suficientemente grande las distribuciones muestrales son normales y en esto se basarn todos los resultados que alcancemos.

DISTRIBUCIN MUESTRAL DE MEDIAS


Cada muestra de tamao n que podemos extraer de una poblacin proporciona una media. Si consideramos cada una de estas medias como valores de una variable aleatoria podemos estudiar su distribucin que llamaremos distribucin muestral de medias. Si tenemos una poblacin normal N(,) y extraemos de ella muestras de tamao n, la distribucin muestral de medias sigue tambin una distribucin normal. (, ) Si la poblacin no sigue una distribucin normal pero n>30, aplicando el llamado Teorema central del lmite la distribucin muestral de medias se aproxima tambin a la normal anterior.

APLICACIN
Las notas de cierto examen se distribuyen segn una normal de media 5,8 y desviacin tpica 2,4. Hallar la probabilidad de que la media de una muestra tomada al azar de 16 estudiantes est comprendida entre 5 y 7.

Respuesta: 0.88549073

DISTRIBUCIN MUESTRAL DE PROPORCIONES


En numerosas ocasiones se plantea estimar una proporcin o porcentaje. En estos casos la variable aleatoria toma solamente dos valores diferentes (xito o fracaso), es decir sigue una distribucin binomial y cuando la extensin de la poblacin es grande la distribucin binomial B(n,p) se aproxima a la normal (, ) . Para muestras de tamao n>30, la distribucin muestral de proporciones sigue una distribucin normal: (, ) donde p es la proporcin de uno de los valores que presenta la variable estadstica en la poblacin y q=1-p.

APLICACIN
Si tiramos una moneda no trucada 100 veces, cul es la probabilidad de que obtengamos ms de 55 caras?
0.50.5 ) 100

N(0.5,

=N(0.5,0.05)
0.550.5 ) 0.05

P(p>0.55)=P(z>

P(z>1)=1-P(z1)=0.158655254

ESTIMACIN DE PARMETROS
En una poblacin cuya distribucin es conocida pero desconocemos algn parmetro, podemos estimar dicho parmetro a partir de una muestra representativa.

Un estimador es un valor que puede calcularse a partir de los datos muestrales y que proporciona informacin sobre el valor del parmetro. Por ejemplo la media muestral es un estimador de la media poblacional, la proporcin observada en la muestra es un estimador de la proporcin en la poblacin. Una estimacin es puntual cuando se obtiene un slo valor para el parmetro. Los estimadores ms probables en este caso son los estadsticos obtenidos en la muestra, aunque es necesario cuantificar el riesgo que se asume al considerarlos. Recordemos que la distribucin muestral indica la distribucin de los valores que tomar el estimador al seleccionar distintas muestras de la poblacin. Las dos medidas fundamentales de esta distribucin son la media que indica el valor promedio del estimador y la desviacin tpica, tambin denominada error tpico de estimacin, que indica la desviacin promedio que podemos esperar entre el estimador y el valor del parmetro.

Ms til es la estimacin por intervalos en la que calculamos dos valores entre los que se encontrar el parmetro, con un nivel de confianza fijado de antemano. Llamamos Intervalo de confianza al intervalo que con un cierto nivel de confianza, contiene al parmetro que se est estimando. Nivel de confianza es la "probabilidad" de que el intervalo calculado contenga al verdadero valor del parmetro. Se indica por 1-a y habitualmente se da en porcentaje (1-)100%. Hablamos de nivel de confianza y no de probabilidad ya que una vez extrada la muestra, el intervalo de confianza contendr al verdadero valor del parmetro o no, lo que sabemos es que si repitisemos el proceso con muchas muestras podramos afirmar que el (1- )% de los intervalos as construidos contendra al verdadero valor del parmetro.

INTERVALO DE CONFIANZA PARA LA MEDIA


De una poblacin desconocemos la media y deseamos estimarla a partir de la media obtenida en una muestra de tamao n. Sabemos que si la poblacin es normal N(,) y extraemos de ella muestras de tamao n, o sin ser la poblacin normal es n>30, la distribucin muestral de medias es , (, )

Por lo tanto si fijamos una probabilidad 1-, sabemos que la 1 < < + 1 = 1 2 2 Es decir el 1 % esta a una distancia de inferior a .
2

Entonces para un nivel de confianza 1 , pertenece al intervalo ( 1 ; + 1 ) donde es el llamado valor critico, valor tal que < z < = 1 y la media de la muestra.
2 2 2

Si la desviacin tpica de la poblacin es desconocida, lo que suele ocurrir en la prctica, la aproximaremos por la de la muestra siempre que n>100

APLICACIN
Para una muestra de 81 habitantes de cierta poblacin se obtuvo una estatura media de 167 cm. Por estudios anteriores se sabe que la desviacin tpica de la altura de la poblacin es de 8 cm. Construye un intervalo de confianza para la estatura media de la poblacin al 95%. 167 8 81 8 ; 167 + 8 8 81

0.05 1 2

0.05 1 2

167 1.96

81 81 167 1.7422; 167 + 1.7422

; 167 + 1.96

SI LA VARIANZA DE LA POBLACIN ES
DESCONOCIDA En este caso tenemos

1 1 .

Por el mismo razonamiento anterior, si llamamos 1,1 , al percentil de la distribucin t de Student tal
2

que 1 = 1 el intervalo de confianza al nivel de significacin (o equivalentemente, al nivel de confianza 1-) ser: 1,
2

, 1

+ 1,
2

APLICACIN:
Extraemos una muestra aleatoria simple de 61 estudiantes universitarios. Responden a una prueba de inteligencia espacial, en la que alcanzan una media de 80 y una varianza de 100. Entre qu lmites se hallar la verdadera inteligencia espacial media de los estudiantes, a un nivel de confianza del 99%? Respuesta: [76.57, 83.43] con un nivel de confianza del 99%

INTERVALO DE CONFIANZA PARA LA PROPORCIN


Si deseamos estimar la proporcin p con que una determinada caracterstica se da en una poblacin, a partir de la proporcin p' observada en una muestra de tamao n, sabemos que

la distribucin muestral de proporciones sigue una


distribucin normal (,
)

con q=1-p.

Como la proporcin p de la poblacin es desconocida, se aproxima por la de la muestra siempre que n>100. Entonces para un nivel de confianza 1 , p pertenece al intervalo ( 1
2

+ 1
2

APLICACIN
Una mquina fabrica piezas de precisin y en una caja de 200 piezas, recibida por un cliente han aparecido 7 piezas defectuosas, a un nivel de confianza del 99% entre qu valores se puede esperar que est la verdadera proporcin de piezas defectuosas fabricadas por la mquina? p'=0,035 q'=0,965 n=200 N(p ; 0,013) (0.002;0.068)

APLICACIN Uno de los lderes de un colectivo laboral desea plantear una cuestin a todos los miembros del grupo. Si ms de la mitad respondieran NO entonces preferira no plantearla para no minar su prestigio. Para salir de dudas, elige aleatoriamente a 100 trabajadores a los que hace la pregunta y slo 30 responden NO. Entre qu lmites se hallar la verdadera proporcin al nivel del 95%?

Respuesta:[0.2102;0.3898]

INTERVALO DE CONFIANZA PARA LA VARIANZA


Si tenemos una poblacin (, 2 ) con 2
2 desconocida entonces 1 El intervalo de confianza para la varianza poblacional al nivel de confianza 1 lo podemos obtener como sigue: 2 ( 1) 1 2 2 1, = 1 2 1,1 2 2
2 (1)1 2

Despejando 2 tenemos:
2 (1)1 2 1,1 2

2 (1)1 2 1, 2

= 1

Es decir

2 2 (1)1 (1)1 2 2 ; 2 1,1 2 1, 2

APLICACIN
De acuerdo con las tablas de altura, los varones tienen una altura superior a las mujeres en la poblacin espaola. Segn las ltimas tablas en el servicio militar, los varones entre 18 y 20 aos presentan una varianza de 0'0529. de las mujeres no tenemos informacin, por ello tomamos una muestra de 101 mujeres entre 2 18 y 20 aos y obtenemos 1 =0.18 Entre qu valores se encontrar la verdadera varianza a un nivel de 0'95 de confianza? Respuesta: [0.025;0.0436]

INTERVALO DE CONFIANZA PARA LA RELACIN DE VARIANZAS


La distribucin muestral del cociente de varianzas muestrales, cuando tenamos dos poblaciones normales e independientes era: 2 1 2 1 1,1 2 1 2 2 A partir de aqu deducimos el intervalo de confianza para el cociente de varianzas poblacionales al nivel de 1- y obtenemos.
2 2 2 1 1 1 1 1 ; 2 2 2 2 1 1,1,1 1 1,1, 2 2

APLICACIN
En un estudio, de la cantidad de Kcal que ingiere una persona en una comida, se obtiene los siguientes resultados: Personas que viven en Cancn: 1200, 1000, 950, 1100, 1050, 1050, 1200, 1250 Personas que viven en Mrida: 1000, 1100, 800, 1180, 950, 1000, 900, 980, 1010, 980 Calcular el intervalo de confianza para el cociente de varianzas al nivel de confianza 0.95. Podramos aceptar la suposicin de que las varianzas poblacionales son iguales? Respuesta: [0.329509476736747, 3.98915880535932]

INTERVALO DE CONFIANZA Y TAMAO DE LA MUESTRA


La amplitud del intervalo de confianza depende del valor de E =
2

Con un nivel de confianza del (1-)100% admitimos que la diferencia entre la estimacin para la media a partir de la muestra y su valor real es menor que E, que llamaremos error mximo admisible. El tamao de la muestra depende del nivel de confianza que se desee para los resultados y de la amplitud del intervalo de confianza, es decir del error mximo que se est dispuesto a admitir. Fijados estos, 1- y E, podemos calcular el tamao mnimo de la muestra que emplearemos. 2 n = 2 En caso de estimar proporciones =

con lo que n =

2
2

APLICACIN
La desviacin tpica de la altura de los habitantes de un pas es de 8 cm. Calcular el tamao mnimo que ha de tener una muestra de habitantes de dicho pas para que el error cometido al estimar la altura media sea inferior a 1 cm con un nivel de confianza del 90%. Respuesta: 173

APLICACIN
Queremos estimar la media de una poblacin normal con varianza poblacional igual a 4. qu tamao muestral debemos tomar para que E=0.02 al nivel de confianza 0.95?

Respuesta: N=38416

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES


Sean 1 e 2 dos poblaciones independientes con 1 y 2 desconocidos. Extraemos muestras de tamao 1 y 2 respectivamente. Como 1 1 2 2 1 2 (1 2 , + ) 1 2 y desconocemos los valores de 1 2 , aproximaremos las proporciones poblacionales por las proporciones muestrales correspondientes. Por tanto, el intervalo de confianza ser: 1 2 1 2 1
2

1 1 2 2 + ; 1 2 + 1 1 2 2

1 1 2 2 + 1 2

Caso particular: si tenemos 1 = 2 = p entonces 1 1 1 2 = 0 y 1 2 = + y lo que haremos ser sustituir p por


2 11 +2 2
1 +2

APLICACIN:
En dos grandes empresas se lleva a cabo un estudio sobre la proporcin de mujeres entre sus empleados diplomados y licenciados. De cada empresa se toma una m.a.s. de 40 empleados entre los diplomados y licenciados, obtenindose que en la empresa A haba 16 mujeres y en la empresa B, 22 mujeres. Obtener el intervalo de confianza para la diferencia de proporciones poblacionales al nivel de confianza 0.96 Podemos pensar que la proporcin es la misma? 16 24 22 18 16 22 16 22 40 40 40 40 2.05 + ; + 2.05 40 40 40 40 40 40 16 24 22 18 40 40 40 40 = + 40 40 [-0.3765; 0.0765]

Das könnte Ihnen auch gefallen