Sie sind auf Seite 1von 35

UNIDAD 2 DISTRIBUCIONES MUESTRALES

1





ESTADISTICA 1

RESUMEN SEGUNDA UNIDAD

PROFESORA: ING. MARIA DEL CARMEN COLOM

ALUMNO: GOMEZ CAMELA CARLOS ALFREDO

INGENIERIA INDUSTRIAL

LUNES 10 DE OCTUBRE 2011

UNIDAD 2 DISTRIBUCIONES MUESTRALES


2
INDICE
DISTRIBUCIONES MUESTRALES

2.1 INTRODUCCION 3


2.2 TEOREMA DE COMBINACION LINEAL DE VARIABLES
ALEATORIAS Y TEOREMA DEL LIMITE CENTRAL.8

2.3 INTRODUCCION AL MUESTREO Y TIPOS DE MUESTREO ..16

2.4 TEOREMA DEL LIMITE CENTRAL ...21

2.5 DISTRIBUCION MUESTRAL DE LA MEDIA 24

2.6 DISTRIBUCION MUESTRAL DE LA DIFERENCIA DE MEDIAS .26

2.7 DISTRIBUCION MUESTRAL DE LA PROPORCION 28

2.8 DISTRIBUCION MUESTRAL DE LA DIFERENCIA DE PROPORCIONES 30

2.9 DISTRIBUCION MUESTRAL DE LA VARIANZA 33

BIBLIOGRAFIA 35
UNIDAD 2
UNIDAD 2 DISTRIBUCIONES MUESTRALES


3
DISTRIBUCIONES MUESTRALES
2.1 INTRODUCCION

Distribuciones Muestrales
Las muestras aleatorias obtenidas de una poblacin son, por naturaleza propia,
impredecibles. No se esperara que dos muestras aleatorias del mismo tamao y tomadas
de la misma poblacin tenga la misma media muestral o que sean completamente
parecidas; puede esperarse que cualquier estadstico, como la media muestral, calculado
a partir de las medias en una muestra aleatoria, cambie su valor de una muestra a otra,
por ello, se quiere estudiar la distribucin de todos los valores posibles de un estadstico.
Tales distribuciones sern muy importantes en el estudio de la estadstica inferencial,
porque las inferencias sobre las poblaciones se harn usando estadsticas muestrales.
Como el anlisis de las distribuciones asociadas con los estadsticos muestrales,
podremos juzgar la confiabilidad de un estadstico muestral como un instrumento para
hacer inferencias sobre un parmetro poblacional desconocido.
Como los valores de un estadstico, tal como x, varan de una muestra aleatoria a otra, se
le puede considerar como una variable aleatoria con su correspondiente distribucin de
frecuencias.
La distribucin de frecuencia de un estadstico muestral se denomina distribucin
muestral. En general, la distribucin muestral de un estadstico es la de todos sus
valores posibles calculados a partir de muestras del mismo tamao.
Suponga que se han seleccionado muestras aleatorias de tamao 20 en una poblacin
grande. Se calcula la madia muestral x para cada muestra; la coleccin de todas estas
medias muestrales recibe el nombre de distribucin muestral de medias, lo que se
puede ilustrar en la siguiente figura:
UNIDAD 2 DISTRIBUCIONES MUESTRALES


4

Suponga que se eligen muestras aleatorias de tamao 20, de una poblacin grande, y se
calcula la deviacin estndar de cada una. La coleccin de todas estas desviaciones
estndar muestrales se llama distribucin muestral de la desviacin estndar, y lo
podemos ver en la siguiente figura:

Ejemplo 1.6
Se eligen muestras ordenadas de tamao 2, con reemplazo, de la poblacin de valores 0,
2, 4 y 6. Encuentre:

, la media poblaciona.
, la desviacin estndar poblacional.
x,
la media de la distribucin muestral de medias.
UNIDAD 2 DISTRIBUCIONES MUESTRALES


5
x
, la desviacin estndar de la distribucin muestral de medias.
Adems, grafique las frecuencias para la poblacin y para la distribucin muestral de
medias.
Solucin:
a. La media poblacional es:


b. La desviacin estndar de la poblacin es:

c. A continuacin se listan los elementos de la distribucin muestral de la media y la
correspondiente distribucin de frecuencias.
UNIDAD 2 DISTRIBUCIONES MUESTRALES


6

La media de la distribucin muestral de medias es:

d) La desviacin estndar de la distribucin muestral de medias es:

De aqu que podamos deducir que:
Como para cualquier variable aleatoria, la dsitribucin muestral de medias tiene una
media o valor esperado, una varianza y una desviacin estndar, se puede demostrar que
la distribucin muestral de medias tiene una media igual a la media poblacional. Esto es:


Distribuciones muestrales
UNIDAD 2 DISTRIBUCIONES MUESTRALES


7
Despus de haber realizado el ejercicio anterior se puede ver que una distribucin
muestral se genera extrayendo todas las posibles muestras del mismo tamao de la
poblacin y calculndoles a stas su estadstico.
Si la poblacin de la que se extraen las muestras es normal, la distribucin muestral de
medias ser normal sin importar el tamao de la muestra.

Si la poblacin de donde se extraen las muestras no es normal, entonces el tamao de la
muestra debe ser mayor o igual a 30, para que la distribucin muestral tenga una forma
acampanada. Mientras mayor sea el tamao de la muestra, ms cerca estar la
distribucin muestral de ser normal.
Para muchos propsitos, la aproximacin normal se considera buena si se cumple n=30.
La forma de la disitribucin muestral de medias sea aproximadamente normal, an en
casos donde la poblacin original es bimodal, es realmente notable.





UNIDAD 2 DISTRIBUCIONES MUESTRALES


8
2.2
TEOREMA DE COMBINACIN LINEAL DE VARIABLES
ALEATORIAS Y TEOREMA DEL LMITE CENTRAL

Terorema de Chebshev, este teorema da una estimacin conservadora de la
probabilidad de que una variable aleatoria tome un valor dentro de k dentro de k
desviaciones estndar de su media para cualquier nmero real k. Proporcionaremos
solo la demostracin para caso continuo.
La probabilidad de que cualquier variable aleatoria X tome un valor dentro de k
desviaciones estndar de la media es al menos 1- . Es decir
.
- Distribuciones muestrales
En esta seccin estudiaremos las distribuciones ms importantes de variables aleatorias
continuas unidimensionales. El soporte de una variable aleatoria continua se define como
aquella regin de donde su densidad es no nula, . Para las distribuciones que
enunciaremos, podr ser bien todo , o bien un segmento de la forma .
- Distribuciones normales
La distribucin gaussiana, recibe tambin el nombre de distribucin normal, ya que una
gran mayora de las variables aleatorias continuas de lanaturaleza siguen esta
distribucin. Se dice que una variable aleatoria X sigue una distribucin normal de
parmetros y 2, lo que representamos del modo:

Si su funcin de densidad es:

- Observacin
Estos dos parmetros y 2coinciden adems con la media (esperanza) y la varianza
respectivamente de la distribucin como se demostrar ms adelante:
UNIDAD 2 DISTRIBUCIONES MUESTRALES


9

La forma de la funcin de densidad es la llamada campana de Gauss.
Figura: Campana de Gauss o funcin de densidad de una variable aleatoria de
distribucin normal. El rea contenida entre la grfica y el eje de abcisas vale 1.

Para el lector es un ejercicio interesante comprobar que sta alcanza un nico mximo
(moda) en , que es simtrica con respecto al mismo, y por tanto:

Con lo cual en coinciden la media, la mediana y la moda, y por ltimo, calcular sus
puntos de inflexin.
El soporte de la distribucin es todo , de modo que la mayor parte de la masa de
probabilidad (rea comprendida entre la curva y el eje de abcisas) se encuentra
concentrado alrededor de la media, y las ramas de la curva se extienden asintticamente
a los ejes, de modo que cualquier valor ``muy alejado" de la media es posible (aunque
poco probable).
La forma de la campana de Gauss depende de los parmetros y :
-
- indica la posicin de la campana (parmetro de centralizacin);
UNIDAD 2 DISTRIBUCIONES MUESTRALES


10
Figura: Distribuciones gaussianas con diferentes medias e igual dispersin.

-
- 2 (o equivalentemente, ) ser el parmetro de dispersin. Cuanto menor sea, mayor
cantidad de masa de probabilidad habr concentrada alrededor de la media (grafo de f
muy apuntado cerca de ) y cuanto mayor sea ``ms aplastado" ser.
Figura: Distribuciones gaussianas con igual media pero varianza diferente.
UNIDAD 2 DISTRIBUCIONES MUESTRALES


11

La funcin caracterstica de la distribucin normal, se comprueba ms adelante que es:

Como consecuencia, la distribucin normal es reproductiva con respecto a los parmetros
, y 2, ya que:

- Observacin
Como se ha mencionado anteriormente, la ley de probabilidad gaussiana la encontramos
en la mayora de los fenmenos que observamos en la naturaleza, por ello gran parte de
lo que resta del curso lo vamos a dedicar a su estudio y a el de las distribuciones
UNIDAD 2 DISTRIBUCIONES MUESTRALES


12
asociadas a ella. Sin embargo, a pesar de su utilidad, hay que apuntar un hecho negativo
para esta ley de probabilidad:
La funcin no posee primitiva conocida.
Las consecuencias desde el punto de vista prctico son importantes, ya que eso impide el
que podamos escribir de modo sencillo la funcin de distribucin de la normal, y nos
tenemos que limitar a decir que:

Sin poder hacer uso de ninguna expresin que la simplifique. Afortunadamente esto no
impide que para un valor de x fijo, F(x) pueda ser calculado. De hecho puede ser
calculado con tanta precisin (decimales) como se quiera, pero para esto se necesita usar
tcnicas de clculo numrico y ordenadores. Para la utilizacin en problemas prcticos de
la funcin de distribucin F, existen ciertas tablas donde se ofrecen (con varios decimales
de precisin) los valores F(x) para una serie limitada de valores xi dados. Normalmente F
se encuentra tabulada para una distribucin Z, normal de media 0 y varianza 1 que se
denomina distribucin normal tipificada:

En el caso de que tengamos una distribucin diferente , se obtiene Z
haciendo el siguiente cambio:

De manera general se tiene:
- Proposicin (Cambio de origen y escala)
Sean . Entonces:

Este resultado puede ser utilizado del siguiente modo: Si , y nos interesa
calcular ,
1. Hacemos el cambio y calculamos ;
UNIDAD 2 DISTRIBUCIONES MUESTRALES


13
2. Usamos la tabla, relativa a la distribucin para obtener (de modo
aproximado) ;
3. Como tenemos que el valor
obtenido en la tabla, FZ(z) es la probabilidad buscada.
1. Ejemplo
Supongamos que cierto fenmeno pueda ser representado mediante una variable
aleatoria , y queremos calcular la probabilidad de que X tome un valor
entre 39 y 48, es decir,

Comenzamos haciendo el cambio de variable

De modo que:

Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que hemos
mencionado anteriormente.
- Proposicin
Sea . Entonces

UNIDAD 2 DISTRIBUCIONES MUESTRALES


14
Demostracin
Por ser la normal una ley de probabilidad se tiene que


Es decir, esa integral es constante. Con lo cual, derivando la expresin anterior con
respecto a se obtiene el valor 0:

Luego .
Para demostrar la igualdad entre la var[X] y 2, basta con aplicar la misma tcnica, pero
esta vez derivando con respecto a 2:


Luego

Para demostrar el resultado relativo a la funcin caracterstica, consideramos en primer
lugar la variable aleatoria tipificada de X,

Y calculamos

UNIDAD 2 DISTRIBUCIONES MUESTRALES


15

Como , deducimos que


TEOREMA CENTRAL DEL LMITE


El Teorema Central de Lmite no es un nico teorema, sino que consiste en un conjunto
de resultados acerca del comportamiento de la distribucin de la suma (o promedio) de
variables aleatorias.

Con Teorema Central del Lmite nos referiremos a todo teorema en el que se a_rma, bajo
ciertas hiptesis, que la distribucin de la suma de un nmero muy grande de variables
aleatorias se aproxima a una distribucin normal.
El trmino Central, debido a Poly (1920), significa fundamental, o de importancia
central_, este describe el rol que cumple este teorema en la teora de probabilidades. Su
importancia radica en que este conjunto de teoremas desvelan las razones por las cuales,
en muchos campos de aplicacin, se encuentran en todo momento distribuciones
normales, o casi normales.

Un ejemplo tpico de este hecho es el caso de los errores de medida. Con respecto a este
tema, Laplace propuso una hiptesis que parece ser plausible.
Considera el error total como una suma de numerosos errores elementales muy pequeos
debidos a causas independientes.

Es casi indudable que varias causas independientes o casi independientes contribuyen al
error total. As por ejemplo, en las observaciones astronmicas,
pequeas variaciones de temperatura, corrientes irregulares de aire, vibraciones de
edificios y hasta el estado de los rganos de los sentidos de un observador, pueden
considerarse como algunas pocas de dichas causas numerosas.
El Teorema Central del Lmite es obra de muchos grandes matemticos.
Dentro de la historia del Teorema Central del Lmite Laplace ocupa un lugar fundamental:
a pesar de que nunca enunci formalmente este resultado, ni lo demostr rigurosamente,
a l le debemos este importante descubrimiento.










UNIDAD 2 DISTRIBUCIONES MUESTRALES


16
2.3 INTRODUCCION AL MUESTREO Y TIPOS DE
MUESTREO
. Introduccin al muestreo.
a. Concepto e importancia
Es la actividad por la cual se toman ciertas muestras de una poblacin de elementos de
los cuales vamos a tomar ciertos criterios de decisin, el muestreo es importante porque a
travs de l podemos hacer anlisis de situaciones de una empresa o de algn campo de
la sociedad.
b. Terminologa bsica para el muestreo
Los nuevos trminos, los cuales son frecuentemente usados en inferencia estadstica son:
Estadstico:
Un estadstico es una medida usada para describir alguna caracterstica de una muestra ,
tal como una media aritmtica, una mediana o una desviacin estndar de una muestra.
Parmetro:
Una parmetro es una medida usada para describir alguna caracterstica de una
poblacin, tal como una media aritmtica, una mediana o una desviacin estndar de una
poblacin.
Cuando los dos nuevos trminos de arriba son usados, por ejemplo, el proceso de
estimacin en inferencia estadstica puede ser descrito como le proceso de estimar un
parmetro a partir del estadstico correspondiente, tal como usar una media muestral ( un
estadstico para estimar la media de la poblacin (un parmetro).

Distribucin en el muestreo:
Cuando el tamao de la muestra (n) es ms pequeo que el tamao de la poblacin (N),
dos o ms muestras pueden ser extradas de la misma poblacin. Un cierto estadstico
puede ser calculado para cada una de las muestras posibles extradas de la poblacin.
Una distribucin del estadstico obtenida de las muestras es llamada la distribucin en el
muestreo del estadstico.

Error Estndar:
La desviacin estndar de una distribucin, en el muestreo de un estadstico, es
frecuentemente llamada el error estndar del estadstico. Por ejemplo, la desviacin
estndar de las medias de todas la muestras posibles del mismo tamao, extradas de
una poblacin, es llamada el error estndar de la media. De la misma manera, la
UNIDAD 2 DISTRIBUCIONES MUESTRALES


17
desviacin estndar de las proporciones de todas las muestras posibles del mismo
tamao, extradas de una poblacin, es llamada el error estndar de la proporcin. La
diferencia entre los trminos "desviacin estndar" y "error de estndar" es que la primera
se refiere a los valores originales, mientras que la ltima est relacionada
con valores calculados. Un estadstico es un valor calculado, obtenido con los elementos
incluidos en una muestra.
Error muestral o error de muestreo
La diferencia entre el resultado obtenido de una muestra (un estadstico) y el resultado el
cual deberamos haber obtenido de la poblacin (el parmetro correspondiente) se llama
el error muestral o error de muestreo. Un error de muestreo usualmente ocurre cuando no
se lleva a cabo la encuestacompleta de la poblacin, sino que se toma una muestra para
estimar las caractersticas de la poblacin. El error muestral es medido por el error
estadstico, en trminos de probabilidad, bajo la curva normal. El resultado de la media
indica la precisin de la estimacin de la poblacin basada en elestudio de la muestra.
Mientras ms pequeo el error muestras, mayor es la precisin de la estimacin. Deber
hacerse notar que los errores cometidos en una encuesta por muestreo, tales como
respuestas inconsistentes, incompletas o no determinadas, no son considerados como
errores mustrales. Los errores no mustrales pueden tambin ocurrir en una encuesta
completa de la poblacin.
2. Mtodos de seleccin de muestras.
Una muestra debe ser representativa si va a ser usada para estimar las caractersticas de
la poblacin. Los mtodos para seleccionar una muestra representativa son numerosos,
dependiendo del tiempo, dinero y habilidad disponibles para tomar una muestra y
la naturaleza de los elementos individuales de la poblacin. Por lo tanto, se requiere una
gran volumen para incluir todos los tipos de mtodos de muestreo.
Los mtodos de seleccin de muestras pueden ser clasificados de acuerdo a:
1. El nmero de muestras tomadas de una poblacin dada para un estudio y
1. La manera usada en seleccionar los elementos incluidos en la muestra. Los
mtodos de muestreo basados en los dos tipos de clasificaciones son expuestos en
seguida.
Mtodos de muestreo clasificados de acuerdo con el nmero de muestras tomadas de
una poblacin.Bajo esta clasificacin, hay tres tipos comunes de mtodos de muestreo.
Estos son, muestreo simple, doble y mltiple.
Muestreo simple

Este tipo de muestreo toma solamente una muestra de una poblacin dada para el
propsito de inferencia estadstica. Puesto que solamente una muestra es tomada, el
UNIDAD 2 DISTRIBUCIONES MUESTRALES


18
tamao de muestra debe ser los suficientemente grande para extraer una conclusin. Una
muestra grande muchas veces cuesta demasiado dinero y tiempo.
Muestreo doble

Bajo este tipo de muestreo, cuando el resultado dele estudio de la primera muestra no es
decisivo, una segunda muestra es extrada de la misma poblacin. Las dos muestras son
combinadas para analizar los resultados. Este mtodo permite a una persona principiar
con una muestra relativamente pequea para ahorrar costos y tiempo. Si la primera
muestra arroja una resultado definitivo, la segunda muestra puede no necesitarse.
Por ejemplo, al probar la calidad de un lote de productos manufacturados, si la primera
muestra arroja una calidad muy alta, el lote es aceptado; si arroja una calidad muy pobre,
el lote es rechazado. Solamente si la primera muestra arroja una calidad intermedia, ser
requerir la segunda muestra. Un plan tpico de muestreo doble puede ser obtenido de la
Military Standard Sampling Procedures and Tables for Inspection by Attributes, publicada
por el Departamento de Defensa y tambin usado por muchas industrias privadas. Al
probar la calidad de un lote consistente de 3,000 unidades manufacturadas, cuando el
nmero de defectos encontrados en la primera muestra de 80 unidades es de 5 o menos,
el lote es considerado bueno y es aceptado; si el nmero de defectos es 9 o ms, el lote
es considerado pobre y es rechazado; si el nmero est entre 5 y 9, no puede llegarse a
una decisin y una segunda muestra de 80 unidades es extrada del lote. Si el nmero de
defectos en las dos muestras combinadas (incluyendo 80 + 80 = 160 unidades) es 12 o
menos, el lote es aceptado si el nmero combinado es 13 o ms, el lote es rechazado.
Muestreo mltiple
El procedimiento bajo este mtodo es similar al expuesto en el muestreo doble, excepto
que el nmero de muestras sucesivas requerido para llegar a una decisin es ms de dos
muestras.
Mtodos de muestreo clasificados de acuerdo con las maneras usadas en seleccionar los
elementos de una muestra.
Los elementos de una muestra pueden ser seleccionados de dos maneras diferentes:
a. Basados en el juicio de una persona.
b. Seleccin aleatoria (al azar)
Muestreo de juicio
Una muestra es llamada muestra de juicio cuando sus elementos son seleccionados
mediante juicio personal. La persona que selecciona los elementos de la muestra,
usualmente es un experto en la medida dada. Una muestra de juicio es llamada una
muestra probabilstica, puesto que este mtodo est basado en los puntos de vista
subjetivos de una persona y la teora de la probabilidad no puede ser empleada para
medir el error de muestreo, Las principales ventajas de una muestra de juicio son la
facilidad de obtenerla y que el costo usualmente es bajo.
UNIDAD 2 DISTRIBUCIONES MUESTRALES


19

Muestreo Aleatorio

Una muestra se dice que es extrada al azar cuando la manera de seleccin es tal, que
cada elemento de la poblacin tiene igual oportunidad de ser seleccionado. Una muestra
aleatoria es tambin llamada una muestra probabilstica son generalmente preferidas por
los estadsticos porque la seleccin de las muestras es objetiva y el error muestral puede
ser medido en trminos de probabilidad bajo la curva normal. Los tipos comunes de
muestreo aleatorio son el muestreo aleatorio simple, muestreo sistemtico, muestreo
estratificado y muestreo de conglomerados.
A. Muestreo aleatorio simple

Una muestra aleatoria simple es seleccionada de tal manera que cada muestra posible
del mismo tamao tiene igual probabilidad de ser seleccionada de la poblacin. Para
obtener una muestra aleatoria simple, cada elemento en la poblacin tenga la misma
probabilidad de ser seleccionado, el plan de muestreo puede no conducir a una muestra
aleatoria simple. Por conveniencia, este mtodo pude ser reemplazado por una tabla de
nmeros aleatorios. Cuando una poblacin es infinita, es obvio que la tarea de numerar
cada elemento de la poblacin es infinita, es obvio que la tarea de numerar cada elemento
de la poblacin es imposible. Por lo tanto, ciertas modificaciones del muestreo aleatorio
simple son necesarias. Los tipos ms comunes de muestreo aleatorio modificado son
sistemtico, estratificado y de conglomerados.

B. Muestreo sistemtico.
Una muestra sistemtica es obtenida cuando los elementos son seleccionados en una
manera ordenada. La manera de la seleccin depende del nmero de elementos incluidos
en la poblacin y el tamao de la muestra. El nmero de elementos en la poblacin es,
primero, dividido por el nmero deseado en la muestra. El cociente indicar si cada
dcimo, cada onceavo, o cada centsimo elemento en la poblacin va a ser seleccionado.
El primer elemento de la muestra es seleccionado al azar. Por lo tanto, una muestra
sistemtica puede dar la misma precisin de estimacin acerca de la poblacin, que una
muestra aleatoria simple cuando los elementos en la poblacin estn ordenados al azar.
C. Muestreo Estratificado
Para obtener una muestra aleatoria estratificada, primero se divide la poblacin
en grupos, llamados estratos, que son ms homogneos que la poblacin como un todo.
Los elementos de la muestra son entonces seleccionados al azar o por un mtodo
sistemtico de cada estrato. Las estimaciones de la poblacin, basadas en la muestra
estratificada, usualmente tienen mayor precisin (o menor error muestral) que si la
UNIDAD 2 DISTRIBUCIONES MUESTRALES


20
poblacin entera muestreada mediante muestreo aleatorio simple. El nmero de
elementos seleccionado de cada estrato puede ser proporcional o desproporcional al
tamao del estrato en relacin con la poblacin.
D. Muestreo de conglomerados.

Para obtener una muestra de conglomerados, primero dividir la poblacin en grupos que
son convenientes para el muestreo. En seguida, seleccionar una porcin de los grupos al
azar o por un mtodo sistemtico. Finalmente, tomar todos los elementos o parte de ellos
al azar o por un mtodo sistemtico de los grupos seleccionados para obtener una
muestra. Bajo este mtodo, aunque no todos los grupos son muestreados,
cada grupo tiene una igual probabilidad de ser seleccionado. Por lo tanto la muestra es
aleatoria.
Una muestra de conglomerados, usualmente produce un mayor error muestral (por lo
tanto, da menor precisin de las estimaciones acerca de la poblacin) que una muestra
aleatoria simple del mismo tamao. Los elementos individuales dentro de cada
"conglomerado" tienden usualmente a ser iguales. Por ejemplo la gente rica puede vivir en
el mismo barrio, mientras que la gente pobre puede vivir en otra rea. No todas las reas
son muestreadas en un muestreo de reas. La variacin entre los elementos obtenidos de
las reas seleccionadas es, por lo tanto, frecuentemente mayor que la obtenida si la
poblacin entera es muestreada mediante muestreo aleatorio simple. Esta debilidad
puede reducida cuando se incrementa el tamao de la muestra de rea.
El incremento del tamao de la muestra puede fcilmente ser hecho en muestra muestra
de rea. Los entrevistadores no tienen que caminar demasiado lejos en una pequea rea
para entrevistar ms familias. Por lo tanto, una muestra grande de rea puede ser
obtenida dentro de un corto perodo de tiempo y a bajo costo.
Por otra parte, una muestra de conglomerados puede producir la misma precisin en la
estimacin que una muestra aleatoria simple, si la variacin de los elementos individuales
dentro de cada conglomerado es tan grande como la de la poblacin.








UNIDAD 2 DISTRIBUCIONES MUESTRALES


21
2.4 TEOREMA DEL LIMITE CENTRAL
El Teorema del Lmite Central o Teorema Central del Lmite indica que, bajo condiciones
muy generales, la distribucin de la suma de variables aleatorias tiende a una distribucin
gaussiana cuando la cantidad de variables es muy grande.
Existen diferentes versiones del teorema, en funcin de las condiciones utilizadas para
asegurar la convergencia. Una de las ms simples establece que es suficiente que las
variables que se suman sean independientes, idnticamente distribuidas, con valor
esperado y varianza finitas.
La aproximacin entre las dos distribuciones es en general mayor en el centro de las
mismas que en sus extremos o colas, motivo por el cual se prefiere el nombre Teorema
del Lmite Central (central califica al lmite, ms que al teorema).
Esta relacin entre la forma de la distribucin de la poblacin y la forma de la distribucin
de muestreo se denomina teorema del lmite central, que es tal vez el ms importante de
toda la inferencia estadstica. Nos asegura que la distribucin de muestreo de la media se
aproxima a la normal al incrementarse el tamao de la muestra. Hay situaciones tericas
en las que el teorema del lmite central no se cumple, pero casi nunca se encuentran en la
toma de decisiones prctica. Una muestra no tiene que ser muy grande para que la
distribucin de muestreo de la media se acerque a la normal. Los estadsticos utilizan la
distribucin normal como una aproximacin a la distribucin de muestreo siempre que el
tamao de la muestra sea al menos de 30, pero la distribucin de muestreo de la media
puede ser casi normal con muestras incluso de la mitad de ese tamao. La importancia
del teorema del lmite central es que nos permite usar estadsticas de muestra para hacer
inferencias con respecto a los parmetros de poblacin sin saber nada sobre la forma de
la distribucin de frecuencias de esa poblacin ms que lo que podamos obtener de la
muestra


Si una pobl aci n ti ene medi a y desvi aci n t pi ca , y tomamos muestras de
tamao n (n>30, cual qui er tamao si l a pobl aci n es "normal "), l as medi as
de estas muestras siguen aproxi madamente l a di stri buci n:

UNIDAD 2 DISTRIBUCIONES MUESTRALES


22
Consecuenci as:
1.Permi te averi guar l a probabi l i dad de que l a medi a de una
muestra concreta est en un ci erto i nterval o.
2.Permi te cal cul ar l a probabi l i dad de que l a suma de l os
el ementos de una muestra est, a pri ori , en un ci erto i nterval o.

3.Inf eri r l a medi a de la pobl aci n a parti r de una muestra.
EJEMPLO
Las bol sas de sal envasadas por una mqui na ti enen = 500 g y
= 35 g. Las bol sas se empaquetaron en caj as de 100 uni dades.
1.Cal cul ar l a probabi l i dad de que l a medi a de l os pesos de l as
bol sas de un paquete sea menor que 495 g.





UNIDAD 2 DISTRIBUCIONES MUESTRALES


23
2.Cal cul ar l a probabi l i dad de que una caj a 100 de bol sas pese
ms de 51 kg.





















UNIDAD 2 DISTRIBUCIONES MUESTRALES


24
2.5 DISTRIBUCION MUESTRAL DE LA MEDIA
Si tenemos una muestra aleatoria de una poblacin N(m,s ), se sabe (Teorema del lmite
central) que la fdp de la media muestral es tambin normal con media m y varianza s
2
/n.
Esto es exacto para poblaciones normales y aproximado (buena aproximacin con n>30)
para poblaciones cualesquiera. Es decir es el error tpico, o error estndar de la
media.
Cmo usamos esto en nuestro problema de estimacin?
1 problema: No hay tablas para cualquier normal, slo para la normal m=0 y s=1 (la
llamada z); pero haciendo la transformacin (llamadatipificacin)

una normal de media m y desviacin s se transforma en una z.

Llamando z
a
al valor de una
variable normal tipificada que deja a
su derecha un rea bajo la curva
de a, es decir, que la probabilidad
que la variable sea mayor que ese
valor es a(estos son los valores que
ofrece la tabla de la normal)
podremos construir intervalos de la
forma

para los que la probabilidad es 1 -
a.

Teniendo en cuenta la simetra de la normal y manipulando algebracamente

UNIDAD 2 DISTRIBUCIONES MUESTRALES


25
que tambin se puede escribir

o, haciendo nfasis en que es el error estndar de la media,

Recurdese que la probabilidad de que m est en este intervalo es 1 - a. A un intervalo de
este tipo se le denomina intervalo de confianza con unnivel de confianza del 100(1 - a)%,
o nivel de significacin de 100a%. El nivel de confianza habitual es el 95%, en cuyo
caso a=0,05 y z
a

/2
=1,96. Al valor se le denomina estimacin puntual y se dice que
es un estimador de m.
Ejemplo: Si de una poblacin normal con varianza 4 se extrae una muestra aleatoria de
tamao 20 en la que se calcula se puede decir que mtiene una probabilidad de
0,95 de estar comprendida en el intervalo

que sera el intervalo de confianza al 95% para m
En general esto es poco til, en los casos en que no se conoce m tampoco suele
conocerse s
2
; en el caso ms realista de s
2
desconocida los intervalos de confianza se
construyen con la t de Student (otra fdpcontinua para la que hay tablas) en lugar de la z.

o, haciendo nfasis en que es el error estndar estimado de la media,

Este manera de construir los intervalos de confianza slo es vlido si la variable es
normal. Cuando n es grande (>30) se puede sustituir t por zsin mucho error.



UNIDAD 2 DISTRIBUCIONES MUESTRALES


26
2.6 DISTRIBUCION MUESTRAL DE LA DIFERENCIA DE MEDIAS
DISTRIBUCIN DE LA DIFERENCIA ENTRE DOS MEDIAS
Sean X1 y X2 dos variables aleatorias con valores esperados m1 y m2 y varianzas y ,
respectivamente. Por ejemplo, X1 puede ser la duracin de una batera para carro de una
marca, y X2 la duracin de una batera de otra marca diferente. Si los medias m1 y m2
son desconocidas, podramos estar interesados en conocer si ambas bateras tienen la
misma duracin media. En forma similar, si las varianzas son desconocidas, podramos
estar interesados en saber si son iguales o no. Para realizar estas inferencias, se pueden
someter a pruebas idnticas diferentes bateras, controlando los factores externos, de tal
forma que las diferencias se deban exclusivamente a la clase de marca probada
Inicialmente estaremos interesados en verificar si ambas distribuciones tienen la misma
media poblacional, es decir si m1 = m2 equivalentemente m1 - m2 = 0.
Suponga que es una muestra aleatoria de tamao n1 tomada de una poblacin con media
m1 y varianza , es otra muestra aleatoria de tamao n2 tomada de una poblacin con
media m2 y varianza . Si deseamos realizar alguna inferencia sobre m1 - m2, nos
podemos basar en la distribucin de la diferencia de las medias muestrales. Por el TCL
sabemos que tanto como se distribuyen normalmente con los siguientes parmetros: ,
Ahora bien, para la diferencia de las medias muestrales se tiene:
Para conocer la distribucin muestral de las diferencias entre las medias se debe saber si
las varianzas poblacionales son conocidas o desconocidas, y en caso de que sean
desconocidas, se debe saber si son iguales o diferentes. Cada uno de estos tres casos se
analizar por separado.
a) Distribucin de la diferencia entre dos medias cuando las varianzas son conocidas. Si
las varianzas y son conocidas, tanto como se distribuyen normalmente. Por lo tanto la
distribucin de la diferencia entre las medias muestrales es normal con el valor esperado
y la varianza dados anteriormente, es decir,
De acuerdo con lo anterior la siguiente variable aleatoria tiene una distribucin normal
estndar:
UNIDAD 2 DISTRIBUCIONES MUESTRALES


27
Por lo tanto, con base en la expresin anterior se pueden realizar inferencias con respecto
a la diferencia de medias poblacionales, bajo el supuesto de que las varianzas sean
conocidas. Si adems, son iguales, la expresin anterior se puede expresar como:
b) Distribucin de la diferencia entre dos medias cuando las varianzas son desconocidas
pero iguales ( = = )
Cuando las varianzas son desconocidas, se debe realizar previamente una prueba
estadstica para verificar si stas son iguales o diferentes. Para realizar esta prueba
debemos hacer uso de la distribucin F para verificar si la relacin de varianzas es igual a
uno o diferente de uno.
Para cada una de las dos muestras se definen sus respectivas varianzas como:
,
Adems tienen distribuciones chi cuadrado con n11 y n21 grados de libertad
respectivamente. Por lo tanto su suma tambin sigue otra distribucin chi cuadrado con
n1+n22 grados de libertad. Es decir:
Ahora bien, si Z es una variable normal (0,1) y Y tiene una distribucin chi cuadrado con n
grados de libertad, entonces la variable tiene una distribucin t con n grados de libertad.
Para nuestro caso la variable Z corresponde a la distribucin de la diferencia de las dos
medias, con varianzas conocidas, y la variable chi cuadrado corresponde a la variable Y
acabada de definir.









UNIDAD 2 DISTRIBUCIONES MUESTRALES


28
2.7 DISTRIBUCION MUESTRAL DE LA PROPORCION
Vamos a obtener experimentalmente la distribucin de las proporciones muestrales. Para
ello consideremos el conjunto de figuras:

La proporcin poblacional de tringulos es 1/4.
Consideremos todas las muestras de tamao 2 posibles, mediante muestreo aleatorio
simple (con reemplazamiento). Hallamos la distribucin de probabilidad de la proporcin
muestral (nombrada por ):

Calculamos su esperanza matemtica y la varianza:




UNIDAD 2 DISTRIBUCIONES MUESTRALES


29
El nmero de xitos x de una muestra de tamao n, se distribuye de forma binomial B(n,
p); si la aproximamos a una normal ser . Como ,
dividiendo x por n se tiene que:

Si la poblacin es finita y la extraccin simultnea o sin reposicin, la desviacin tpica va
multiplicada por la siguiente expresin:

Donde N = tamao de la poblacin y n = tamao de la muestra














UNIDAD 2 DISTRIBUCIONES MUESTRALES


30
2.8 DISTRIBUCION MUESTRAL DE LA DIFERENCIA DE
PROPORCIONES

Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse
utilizando proporciones o porcentajes. A continuacin se citan algunos ejemplos:
- Educacin.- Es mayor la proporcin de los estudiantes que aprueban
matemticas que las de los que aprueban ingls?
- Medicina.- Es menor el porcentaje de los usuarios del medicamento A que
presentan una reaccin adversa que el de los usuarios del frmaco B que tambin
presentan una reaccin de ese tipo?
- Administracin.- Hay diferencia entre los porcentajes de hombres y mujeres en
posiciones gerenciales.
- Ingeniera.- Existe diferencia entre la proporcin de artculos defectuosos que
genera la mquina A a los que genera la mquina B?
Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos
proporciones muestrales, la distribucin muestral de diferencia de proporciones es
aproximadamente normal para tamaos de muestra grande (n
1
p
1
5, n
1
q
1
5,n
2
p
2
5 y
n
2
q
2
5). Entonces p
1
y p
2
tienen distribuciones muestrales aproximadamente normales,
as que su diferencia p
1
-p
2
tambin tiene una distribucin muestral aproximadamente
normal.

Cuando se estudi a la distribucin muestral de proporciones se comprob que y
que , por lo que no es difcil deducir que y
que .
UNIDAD 2 DISTRIBUCIONES MUESTRALES


31
La frmula que se utilizar para el calculo de probabilidad del estadstico de diferencia de
proporciones es:

Ejemplo:
Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus
opiniones sobre la promulgacin de la pena de muerte para personas culpables de
asesinato. Se cree que el 12% de los hombres adultos estn a favor de la pena de
muerte, mientras que slo 10% de las mujeres adultas lo estn. Si se pregunta a dos
muestras aleatorias de 100 hombres y 100 mujeres su opinin sobre la promulgacin de
la pena de muerte, determine la probabilidad de que el porcentaje de hombres a favor sea
al menos 3% mayor que el de las mujeres.
Solucin:
Datos:
P
H
= 0.12
P
M
= 0.10
n
H
= 100
n
M
= 100
p(p
H
-p
M
0.03) = ?

Se recuerda que se est incluyendo el factor de correccin de 0.5 por ser una distribucin
binomial y se est utilizando la distribucin normal.

UNIDAD 2 DISTRIBUCIONES MUESTRALES


32

Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de
muerte, al menos 3% mayor que el de mujeres es de 0.4562.
Ejemplo:
Una encuesta del Boston College const de 320 trabajadores de Michigan que fueron
despedidos entre 1979 y 1984, encontr que 20% haban estado sin trabajo durante por lo
menos dos aos. Supngase que tuviera que seleccionar otra muestra aleatoria de 320
trabajadores de entre todos los empleados despedidos entre 1979 y 1984. Cul sera la
probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo
menos dos aos, difiera del porcentaje obtenido en la encuesta de Boston College, en 5%
o ms?
Solucin:
En este ejercicio se cuenta nicamente con una poblacin, de la cual se estn extrayendo
dos muestras y se quiere saber la probabilidad de la diferencia de los porcentajes en esas
dos muestras, por lo que se debe de utilizar la distribucin muestral de proporciones con
P
1
= P
2
, ya que es una misma poblacin.
Otra de las situaciones con la cual nos topamos es que desconocemos la proporcin de
trabajadores despedidos entre 1979 y 1984 que estuvieron desempleados por un perodo
de por lo menos dos aos, slo se conoce la
p
1
= 0.20 ya que al tomar una muestra de 320 trabajadores se observ esa proporcin.
En la frmula de la distribucin muestral de proporciones para el clculo de probabilidad
se necesita saber las proporciones de las poblaciones, las cuales en este ejercicio las
desconocemos, por lo que se utilizar el valor de 0.20 como una estimacin puntual de P.
En el siguiente tema se abordar el tema de estimacin estadstica y se comprender el
porque estamos utilizando de esa manera el dato.
Tambin debe de comprenderse la pregunta que nos hace este problema, cul sera la
probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo
menos dos aos, difiera del porcentaje obtenido en la encuesta de Boston College, en 5%
o ms?, la palabra difiera quiere decir que puede existir una diferencia a favor de la
muestra uno, o a favor de la muestra dos, por lo que se tendrn que calcular dos reas en
la distribucin y al final sumarlas.
Datos:
UNIDAD 2 DISTRIBUCIONES MUESTRALES


33
p
1
= 0.20
n
1
= 320 trabajadores
n
2
= 320 trabajadores
P
1
= P
2





La probabilidad de que su proporcion muestral de trabajadores sin empleo durante por lo
menos dos aos, difiera del porcentaje obtenido en la encuesta de Boston College, en
0.05 o ms es de 0.1260.







UNIDAD 2 DISTRIBUCIONES MUESTRALES


34
2.9 DISTRIBUCION MUESTRAL DE LA VARIANZA
A veces lo que nos interesa es estudiar la variabilidad de las medidas. La variabilidad se
suele medir con la varianza o con la desviacin tpica y el estadstico empleado es la
varianza muestral:

=
n
i
i
n
x x
S
1
2
2
1
) (


Para poder trabajar con ella necesitamos conocer la funcin de distribucin asociada,
para esto estudiaremos la distribucin chi cuadrado.

Se dice que una variable aleatoria X sigue una distribucin ji cuadrado con k grados de
libertad, cuando su funcin de densidad est dada por la frmula:






Dado lo complicado de la expresin utilizaremos una tabla para conocer los valores que
nos interesen.

Propiedades de esta distribucin:
1. Si X es una variable con distribucin ji cuadrado con k grados de libertad, su media
es k y su varianza 2k.
2. Una variable ji cuadrado no toma valores negativos.
3. Su grfica es de las de tipo de curvas sesgadas a la derecha.
4. A medida que aumentan los grados de libertad la curva se va haciendo ms
simtrica y su cola derecha se va extendiendo.
5. Por cada valor de k hay una distribucin distinta.
6. k es el nico parmetro asociado a la distribucin.


>
I
=

caso otro cualquier en
six e x
k
x f
x k
x
0
0 ) 2 / 1 (
) 2 / (
1
) (
) 2 / 1 ( 1 2 /
UNIDAD 2 DISTRIBUCIONES MUESTRALES


35

BIBLIOGRAFIA

- J.M. Casas, C. Garc__a, L.F. Rivera, A.I. Zamora: Problemas de
Estadstica. Descriptiva, probabilidad e inferencia. Ed. Piramide, Madrid,
- 1998.

- http://www.monografias.com/trabajos15/estadistica/estadistica.shtml

- http://www.mitecnologico.com/iem/Main/ProbabilidadYEstadistica

- C.M. Cuadras: Problemas de Probabilidades y Estadstica. Vol 1:
Probabilidades.
- Ed. PPU, Barcelona, 1985.

- F.J. Mart__n Pliego, J.M. Montero, L. Ru__z Maya: Problemas de
- Probabilidad. Ed. AC, Madrid, 1998.

- J. Montero, L. Pardo, D. Morales, V. Quesada: Ejercicios y Problemas
- de Calculo de Probabilidades. Ed. Daz de Santos, Madrid, 1988.

Das könnte Ihnen auch gefallen