Sie sind auf Seite 1von 7

LA MEDIA DE LAS MEDIAS

(o la desviacin estndar de las desviaciones estndar)


El objetivo de la actividad es doble, por un lado queremos mostrar que la distribucin de las medias y de las
desviaciones estndar de muestras provenientes de la poblacin de una variable aleatoria que se distribuye como
una Gamma, es una Normal cuando el tamao de la muestra es suficientemente grande y por otro, se pretende que
te introduzcas en el mundo de la simulacin de los modelos probabilsticos.
La simulacin te servir para obtener datos sobre las distribuciones muestrales de las medias y desviaciones
estndar y despus podrs comparar con los resultados tericos. Debers interpretar en un sentido emprico los
datos (es decir, cuando analices los datos, todo lo que tengas que obtener: media, varianza, probabilidades,
intervalos, etc, lo hars partiendo de los datos sin utilizar ningn supuesto terico) que podrs comparar con las
distribuciones muestrales tericas que supuestamente debern seguir tus datos.
Para mayor facilidad la herramienta de simulacin y anlisis ser Excel, sin embargo si conoces algn otro
paquete con el que sea ms sencillo realizar la simulacin, lo puedes emplear. Aqu supondremos que usars
Excel, as que todas las instrucciones sern para este paquete.
El proyecto se dividir en 6 partes:
1. Caracterizar la variable aleatoria Gamma
2. Obtener una muestra aleatoria de tamao 35 a partir de la Gamma. Encontrar su media y su
desviacin estndar.
3. Obtener 300 muestras aleatorias de tamao 35 y calcular 300 medias y 300 desviaciones estndar a
partir de esas medias.
4. Caracterizar la distribucin de las medias de las 300 muestras de tamao 35.
5. Caracterizar la distribucin terica de las medias de las muestras de las muestras.
6. Caracterizar la distribucin de las desviaciones estndar de las 300 muestras de tamao 35.

Observa que:
los puntos 2, 3, 4 y 6 son empricos (obtn todas tus conclusiones a partir de los datos).
Los puntos 1, 5 y 6 son tericos (tendrs necesidad de recurrir a los modelos tericos de las
distribuciones).
El objetivo del proyecto es ir comparando y vinculando lo que vayas obteniendo en cada parte.
Compara constantemente la diferencia entre hacer un anlisis de la distribucin de la poblacin,
de la muestra y de una muestra grande de las medidas (en este caso de la media y desviacin
estndar) muestrales.

-1-

1.

La variable aleatoria Gamma: distribucin de la poblacin


Partimos de una variable aleatoria X, que se distribuye como una Gamma, con parmetros =2 y =100.
Esta es una distribucin terica:
~
; 2,100
Organiza un archivo de Excel en el que realices los siguientes pasos:
2
Calcula la media (), la varianza ( ) y la desviacin estndar () de la variable X.
Grafica la funcin de densidad de la variable X:
o Considera que: 0
2000 (en realidad X podra ir a infinito, pero infinito es demasiado).
Los valores de X pueden ir de 5 en 5 (no olvides que X es continua, de modo que en realidad
puede tomar valores decimales, pero para facilidad, usaremos slo mltiplos de 5).
o Usa la funcin de la distribucin Gamma: =GAMMADIST(x, , , FALSE) para calcular los
valores de f(x) correspondientes a cada valor de x del punto anterior.
o Grafica x vs. f(x) usando el tipo de grfico de dispersin con lneas. Esta sera la grfica de la
funcin de densidad de X (refleja el comportamiento de la poblacin).
Grafica la funcin de distribucin acumulada de la variable X:
o Considera los mismos valores que arriba: 0
2000 de 5 en 5.
o Usa la funcin de la distribucin Gamma: =GAMMADIST(x, , , TRUE) para calcular los
valores de F(x) correspondientes a cada valor de x.
o Grafica x vs. F(x) usando el tipo de grfico de dispersin con lneas. Esta sera la grfica de la
funcin de distribucin acumulada de X (refleja la probabilidad acumulada hasta x).
Calcula la probabilidad de que un valor de X est:
o una desviacin estndar alrededor de la media
o una desviacin estndar y media alrededor de la media
o dos desviaciones estndar alrededor de la media
o 1.645 desviaciones estndar alrededor de la media
o 1.96 desviaciones estndar alrededor de la media
Obtn la media, la mediana y la moda de la distribucin de X.
De acuerdo a lo obtenido puedes suponer que la distribucin de la muestra es simtrica?Los
intervalos del punto anterior te sirven para evaluar simetra?

Observa que en este apartado ests trabajando en la distribucin terica de X (que es una Gamma)

2.

Una muestra de tamao 35. Distribucin de una muestra


En el mismo archivo de Excel, pero en otra hoja, obtendrs 300 muestras aleatorias de tamao 35 a partir de
la variable X trabajada en el apartado anterior. Primero nos concentraremos en obtener una muestra de
tamao 35, de ah todo ser repetir el mismo procedimiento 300 veces.
Analicemos las dos funciones que ocuparemos para obtener una muestra:
o La funcin =GAMMAINV(p, , ) sirve para calcular el valor de x, correspondiente a la
probabilidad acumulada p sabiendo que ~
; , . Es decir, si se desea calcular el

-2-

valor de x que acumula el 95% de la poblacin de una variable X, que ~


; 2,100
usaremos esa funcin. En notacin de probabilidad, queremos conocer la x que cumpla con:
P(X x)=0.95
Usa la funcin: =GAMMAINV(0.95, 2, 100) y d el valor de x que acumula el 95% de la
poblacin. Es 474.39. Es decir, P(X 474.39)=0.95, si se saca un valor al azar de la poblacin
de X, la probabilidad de que ese valor sea menor o igual a 474.39 es 0.95.
o La funcin RAND() de Excel, da nmeros aleatorios entre 0 y 1. Se puede suponer que cada
vez que accionamos la funcin RAND(), dar un valor aleatorio de probabilidad, puesto que la
probabilidad tambin toma valores entre 0 y 1.
Si conjuntamos las dos funciones anteriores: =GAMMAINV(RAND(), 2, 100) se obtendr un valor
aleatorio x, que proviene de la poblacin de la variable aleatoria ~
; 2,100 .
Repite (en una columna) 35 veces esa instruccin. Habrs obtenido una muestra de tamao 35, que
proviene de la distribucin Gamma deseada y que adems es aleatoria.
Compara los valores que obtuviste en la muestra con los valores que adopta la variable aleatoria X
(apartado 1), son parecidos? por qu? los valores de la muestra sean coherentes con los de la
poblacin?crees que realmente los valores provengan de la poblacin?
Obtn la distribucin de esa muestra de tamao 351: haz una tabla de frecuencias con intervalos de
clase de tamao 75, con valor inicial de 0 y valor final 2000 (que es el mismo rango de valores que
usaste para obtener la grfica terica de X del apartado 1). Calcula la frecuencia relativa y la relativa
acumulada. Grafica su histograma y su polgono de frecuencias (en una misma grfica).
Compara los grficos que obtuviste aqu con la grfica de la distribucin terica de X (apartado 1),
son parecidos? en qu consisten sus semejanzas y sus diferencias? La distribucin de la muestra
es reflejo de la distribucin de poblacin de la que proviene la muestra?por qu?
Calcula la media ( ) y la desviacin estndar (s) de esa muestra.
Compara la media, la varianza y la desviacin estndar de la poblacin (apartado 1) con los
obtenidos en la muestra. Son parecidos? por qu?
Calcula la probabilidad de que un valor de x est:
o una desviacin estndar alrededor de la media de la muestra
o una desviacin estndar y media alrededor de la media de la muestra
o dos desviaciones estndar alrededor de la media de la muestra
o 1.645 desviaciones estndar alrededor de la media de la muestra
o 1.96 desviaciones estndar alrededor de la media de la muestra
Se parecen las probabilidades alrededor de la media a las obtenidas en la poblacin (apartado 1)?

se parecen los intervalos de x que se forman alrededor de la media de la muestra y de la poblacin?


Obtn la media, la mediana y la moda de la distribucin de la muestra de x. De acuerdo a lo obtenido
puedes suponer que la distribucin de la muestra es simtrica?

Observa que en este apartado ests trabajando en la distribucin emprica de una muestra de
X de tamao 35

Tus clculos (media, varianza, intervalos, probabilidades, etc.) deben ser enteramente sobre la muestra de
tamao 35. Tu anlisis est enfocado a comparar lo obtenido en el apartado 1 con el apartado 2
1

Recuerda que la funcin RAND() es voltil y que cada vez que des un enter los valores te cambiarn. Es conveniente que copies y
pegues (pegado especial), los valores de una muestra en otra hoja. No pierdas tus frmulas porque las volvers a ocupar.

-3-

3.

300 muestras de tamao 35: 300 medias y 300 desviaciones estndar de las
muestras

4.

En otra hoja de Excel, siguiendo el procedimiento anterior, obtn 300 muestras aleatorias de tamao
35. Ordnalas en hileras o en renglones para que te sea ms fcil el manejo.
Obtn la media de cada muestra (asigna un rengln o columna a las medias de las muestras).
Obtn la desviacin estndar de cada muestra (asigna otro rengln o columna a las desviaciones
estndar de las muestras).
Esta hoja ser la generadora de los datos (medias y desviaciones estndar de las muestras) que
utilizars para analizar la distribucin de las medias y la distribucin de las desviaciones estndar de
las muestras en las siguientes secciones.

Distribucin emprica de las medias de las muestras


En este apartado nos concentraremos en el anlisis de las medias de las muestras: Con pegado especial,
copia y pega los valores de las medias de las 300 muestras en otra hoja de Excel (esto es con la finalidad de
fijar los valores que analices, si no lo haces cada vez que des enter, los valores de las medias cambiarn).
Compara los valores que tienen las medias muestrales con los valores que adopta la variable
aleatoria X (apartado 1) y con los valores que toma la muestra (apartado 2), son parecidos?

Calcula la media ( ), la varianza ( ) y la desviacin estndar ( ) de las medias de las muestras2.


Compara la media, la varianza y la desviacin estndar de la poblacin (apartado 1) con las de las
medias de las muestras. Son parecidos? por qu?
Si seleccionas una muestra al azar, calcula la probabilidad de que su valor de est:
o una desviacin estndar alrededor de la media de las medias
o una desviacin estndar y media alrededor de la media de las medias
o dos desviaciones estndar alrededor de la media de las medias
o 1.645 desviaciones estndar alrededor de la media de las medias
o 1.96 desviaciones estndar alrededor de la media de las medias
Se parecen las probabilidades de los intervalos alrededor de la media a las obtenidas en el apartado
2?

se parecen los intervalos que se forman alrededor de la media?

Obtn la distribucin de las medias de las muestras. Haz una tabla de frecuencias, con intervalos de
clase de tamao 12. Calcula la frecuencia relativa y la relativa acumulada. Grafica su histograma y su
polgono de frecuencias (en una misma grfica).
Compara con los grficos que obtuviste en la muestra con la grfica de la distribucin terica de X
(apartado 1), son parecidos? por qu? La distribucin de las medias de las muestras es reflejo de
la distribucin de poblacin?por qu?
Obtn la media, la mediana y la moda de la distribucin de las medias de las muestras. De acuerdo a
lo obtenido puedes suponer que la distribucin es simtrica?

Observa que la media obtenida es la medida de centralizacin de las medias de las muestras, lo mismo que la varianza y la
desviacin estndar es la medida de variacin de las medias de las muestras.

-4-

En este apartado debers trabajar con la distribucin emprica de las medias de las
muestras. Es emprica porque trabajas con una muestra de medias de tamao 300

Las medidas (media, varianza, intervalos, probabilidades, etc) deben ser obtenidas a partir de la tabla de
frecuencias de las 300 medias. Recuerda que ests trabajando con una muestra de tamao 300.
Tu anlisis, se enfocar a comparar lo obtenido en los apartados 1 y 2 con el apartado 4

5.

Distribucin terica de las medias de las muestras


En este apartado deduciremos cules son los resultados tericos esperados en una distribucin de la media
de las muestras. Compararemos los resultados obtenidos en la distribucin terica de la variable aleatoria X
con de la distribucin emprica de la media de las muestras desde distintos ngulos: su media y desviacin
estndar, su distribucin y de los intervalos formados alrededor de la media.
Primero se buscar comparar la media y desviacin estndar de la distribucin de la variable aleatoria
X con la media y la desviacin estndar de la distribucin muestral de las medias.
o Compara la media de la poblacin (apartado 1) con la media de las medias, , (apartado
4),

cmo se relacionan estos dos valores? Indica cul es la relacin entre la media de la

poblacin y la media de las medias de las muestras.


Compara la varianza de la poblacin, 2 (apartado 1) con la varianza de las medias,

(apartado 4), cmo se relacionan estos valores? Indica cul sera la relacin entre la

varianza de la poblacin y la varianza de la media de las medias.


Muchas personas afirman que la distribucin de las medias muestrales tiene que ser Normal. Prueba
esta suposicin a travs del mtodo de linealidad entre el valor de y su z correspondiente3:
o Obtn el percentil de cada valor de con la funcin: =PERCENTRANK.EXC(rango de
datos, ,4). Tienes que obtener un percentil por cada valor de , de modo que obtendrs 300
percentiles.
o Para cada percentil, obtn el valor de z, a travs de la funcin: =NORMSINV(p). Los valores
obtenidos sern las z correspondientes a cada valor de .
o Grafica vs. z en un grfico de dispersin de puntos (X vs Y). Si esta grfica es una lnea
recta, entonces, la distribucin de la media de las medias ser normal. Prubalo calculando el
coeficiente de correlacin. El coeficiente de correlacin corrobora lo que dicen muchas
personas? qu ventaja tendra que esto fuera cierto?
o Obtn la ecuacin de la lnea recta que obtuviste, hay alguna relacin entre los parmetros
de la lnea recta y los de la distribucin de la poblacin o los de la distribucin de la media
de las muestras?
Ahora compararemos lo que se obtuvo en el apartado 4 con lo que se debi haber obtenido
tericamente. Supn la existencia de una variable aleatoria Y, donde ~
;
,
.
Es decir, Y es una variable aleatoria normal, cuya media y varianza son las obtenidas en el apartado 4
para las medias muestrales.

A esta prueba se le llama prueba de Ryan-Joiner. Aqu no la haremos completa, slo utilizaremos algunos principios intuitivos basados en
la regresin lineal y la relacin entre una variable aleatoria con distribucin N(0,1) y una variable aleatoria con distribucin N(,2).

-5-

Calcula (tericamente) cual sera la probabilidad de que si seleccionas al azar un valor de Y


est:
una desviacin estndar alrededor de la media de Y
una desviacin estndar y media alrededor de la media de Y
dos desviaciones estndar alrededor de la media de Y
1.645 desviaciones estndar alrededor de la media de Y
1.96 desviaciones estndar alrededor de la media de Y
Compara estos intervalos y sus probabilidades con los obtenidos en el apartado 4, es significativa
o

su diferencia? por qu?


Busca en tu libro de texto (Seccin 5.4, pp 223-228), en las diapositivas de la clase o en cualquier
libro de estadstica, los temas: Distribuciones de las medias muestrales y Teorema Central del Lmite.
Encuentra la relacin terica existente entre la media y la varianza de la poblacin con la media y la
varianza de la media de las muestras. Compara estos resultados tericos con tus resultados empricos
obtenidos en la simulacin.
Observa que este apartado contempla el anlisis terico de la distribucin de las medias
muestrales y su comparacin con lo obtenido empricamente

Tu anlisis debe comparar lo obtenido en los apartados 1 y 5, analizar normalidad de la distribucin al


comparar lo obtenido en el apartado 4 con el apartado Error! Reference source not found.

6.

Distribucin emprica de las desviaciones estndar de las muestras


En este apartado nos concentraremos en el anlisis de las desviaciones estndar de las muestras: Con
pegado especial, copia y pega los valores de las desviaciones estndar de las 300 muestras en otra hoja de
Excel (recuerda que si no lo haces cada vez que des enter, los valores de las desviaciones estndar
cambiarn).
Realiza los mismos pasos que realizaste en el apartado 4 con las medias de las muestras, slo que
ahora usars como datos los valores de las desviaciones estndar para analizar la distribucin emprica
de las desviaciones estndar de las muestras y las comparars con los valores obtenidos en los
apartados 1 y 2. Toma en cuenta que:
o Ahora la media obtenida ( ) ser la medida de centralizacin de las desviaciones estndar de
las muestras, lo mismo que la varianza ( ) y la desviacin estndar ( ) es la medida de
variacin de las desviaciones estndar de las muestras.
o La probabilidad de los intervalos alrededor de la media sern ser la probabilidad de que si
seleccionas una muestra al azar, el valor de la desviacin estndar de la media de la muestra
(s) est en ese intervalo alrededor de la media.
o La distribucin de las desviaciones estndar muestrales (tabla y grficas) tendrn como
variable aleatoria a la desviacin estndar de las muestras.
Crees que la distribucin de las desviaciones estndar de las muestras se comporte como una
distribucin normal? Realiza prueba de Ryan-Joiner simplificada que realizaste en el apartado 5
para probar tu conjetura sobre la normalidad de la distribucin de las desviaciones estndar
muestrales. Decide si la distribucin es normal o no. Si lo es, indica cules son sus parmetros. Si no
lo es, usa argumentos estadsticos para defender tu posicin.
-6-

PUNTO FINAL
En un archivo de Word, elabora un reporte sobre lo que obtuviste en cada uno de los apartados que
realizaste (del 1 al 6). Incluye en l, un resumen de tus procedimientos y expresa una conclusin y
reflexiones sobre cada apartado basndote en las preguntas que se fueron haciendo a lo largo del proyecto
(las preguntas slo son una gua para tu reflexin, no las contestes tal cual). Incluye valores, grficos o
tablas que creas necesarios para argumentar de manera satisfactoria tus reflexiones y para dar un resumen
de lo encontrado en cada apartado. Al final, incluye una conclusin tomando como base el objetivo del
proyecto expresado en la primera parte de este archivo.
De acuerdo con el objetivo de aprendizaje del proyecto autoevala tu trabajo guindote con el modelo PER
(se anexa una diapositiva con el desglose de este modelo que ya usaste en el proyecto anterior). Inclyelo al
final del reporte de tu trabajo.
El proyecto se entregar en dos archivos:
1. El archivo de Word es el reporte de tu trabajo completo, las reflexiones sobre cada apartado una
conclusin final sobre el proyecto y la autoevaluacin de acuerdo al modelo PER.
2. El archivo de Excel de tus procedimientos y frmulas que empleaste.
IMPORTANTE: La evaluacin del proyecto se basar nicamente en el archivo de Word. El archivo
de Excel es tu archivo de trabajo, slo se revisar si hay dudas sobre la forma en que se realizaron los
procedimientos y los clculos. Lo que no se encuentre en el archivo de Word en forma ordenada y
siguiendo una lnea argumentativa, no se evaluar aunque s se incluya en el archivo de Excel.
Nombra tus archivos con tu nmero de matrcula (A00) y tu primer nombre (no es necesario que pongas
tu apellido, basta con tu primer nombre) y envalo a tu profesora a travs del espacio de Blackboard que se
abrir para esta actividad.

-7-

Das könnte Ihnen auch gefallen