Beruflich Dokumente
Kultur Dokumente
Objetivos:
Actividad 1.26. Una muestra sin reemplazo es cualquier subconjunto de una poblacin
(un ejemplo tpico es una mano de cartas de una baraja). Una muestra con reemplazo se
obtiene escogiendo sucesivamente un determinado nmero de elementos de la poblacin
sin quitarlos de la misma, de forma que pueden repetirse (un ejemplo tpico es el
resultado de tiradas sucesivas de un dado). Llamaremos estadstico a cualquier
parmetro poblacional restringido a una muestra. Para distinguirlo del correspondiente
parmetro sobre la poblacin, utilizaremos una nomenclatura diferente; as,
designaremos la media de una variable aleatoria X en una muestra por , y su
desviacin tpica por s(X).
Trabajaremos con distribuciones en 3 mbitos: en la poblacin, en una muestra y en el
conjunto de todas las muestras. Naturalmente, para poder hacer estimaciones sobre una
poblacin a partir de una muestra necesitaremos saber cmo se distribuyen los valores
del estadstico correspondiente en el conjunto de todas las muestras de la poblacin de
un determinado tipo (con o sin reemplazo) y de un determinado tamao; a esta
distribucin la llamaremos distribucin muestral. Las principales propiedades de sta se
resumen en la siguiente tabla, dnde indicamos por n(U) el tamao de la poblacin y
por n el tamao de la muestra:
Matemticas II
Rafael Pla Lpez. Curso 2008-2009
grande que el tamao n de la muestra. Si no decimos lo contrario, supondremos que ste
es el caso.
Problema 1.12: Obtener la varianza de la distribucin muestral de medias y la media de
la distribucin muestral de varianzas con muestras formadas por la repeticin 3 veces
del lanzamiento de 5 dados anotando en cada lanzamiento el nmero de ases obtenidos
(suponiendo que los dados no estn cargados). Dividir la clase en grupos de 3 de modo
que cada miembro haga un lanzamiento de 5 dados, calculando en cada grupo la media
y la varianza de la muestra obtenida. Calcular la varianza de las medias y la media de
las varianzas obtenidas por toda la clase y compararlas con los previos resultados
tericos.
Matemticas II
Rafael Pla Lpez. Curso 2008-2009
Ejercicio 1.7: si las muestras son
grandes (n30) y el parmetro poblacional es la media poblacional, entonces tomando la
normalizacin de la media de la muestra,
z = f( ,) = ( -)/( ), se distribuir aproximadamente de acuerdo con la distribucin
normal tipificada. Para obtener el intervalo de confianza habremos de calcular primero
la media y la desviacin tpica de la muestra, , s; a continuacin calcular la desviacin
tpica corregida , utilizarla como estimador insesgado de la desviacin tpica
poblacional , y a partir del valor estimado de sta obtener la desviacin tpica de las
medias en la distribucin muestral, ( ). Utilizando la tabla de la distribucin normal
tipificada (inversa) para obtener el coeficiente crtico z tal que la probabilidad de |z|z
sea (recordemos que la distribucin normal tipificada es simtrica) podremos
averiguar el intervalo de confianza para . Obtener las frmulas correspondientes.
Problema 1.13: aplicarlo a la obtencin de un intervalo de confianza del 80% para el
nmero mediano de ases resultantes de lanzar 30 veces un dado a partir de los
resultados experimentales obtenidos por todos los alumnos de la clase (en un nmero no
inferior a 30).
Matemticas II
Rafael Pla Lpez. Curso 2008-2009
Teniendo en cuenta que e = lim u (1+1/u), demostrar el
Teorema 1.30: lim Y(t) = PN(0,1)(t) (es decir, la distribucin t de "Student" se
aproxima a la distribucin normal tipificada cuando el nmero de grados de libertad se
hace muy grande); cuanto valdr Y(0)?
Actividad 1.33.
Problema 1.16: formando grupos de 3 a 5 estudiantes, cada estudiante en cada grupo
deber lanzar 30 veces un dado y anotar el nmero de ases obtenidos; hacer
estimaciones alrededor de cada dado a partir de la muestra dada por los resultados
obtenidos por cada grupo.
Matemticas II
Rafael Pla Lpez. Curso 2008-2009
media obtenida en el Teorema 1.16. Si en una muestra de estas n ocasiones las
frecuencias observadas son respectivamente oi, siendo n30 y cumplindose ei5 para
todos los sucesos, entonces el estadstico 2 = i=1 k (oi-ei)2/ei se distribuir
aproximadamente de acuerdo con la distribucin Ji-cuadrado con =k-1 grados de
libertad. Si para algn suceso fuera ei<5 habramos de agregar sucesos hasta conseguir
que se cumpla la condicin.
Podemos utilizar este estadstico
para estimar la concordancia entre
la hiptesis probabilstica y los
resultados experimentales
obtenidos en la muestra.
Naturalmente, cuanto menor sea
2 habr una mayor concordancia:
diremos que hay buena concordancia entre la muestra y la hiptesis probabilstica (y
por lo tanto aceptamos sta) con un nivel de significacin de si 2<2(); por el
contrario, si 21-()<2 podremos rechazar la hiptesis probabilstica con un nivel de
significacin de (que ser de nuevo la probabilidad de equivocarnos al rechazarla, es
decir la probabilidad de que la hiptesis sea correcta pero hayamos encontrado una
muestra entre el 100% de las muestras ms desviadas de las frecuencias medias
esperadas); finalmente si 2()221-() diremos que los resultados experimentales no
son decisivos con este nivel de significacin para aceptar o rechazar la hiptesis
probabilstica. Observamos que una hiptesis probabilstica puede ser aceptada (o
rechazada) con un nivel de significacin "dbil" y los resultados no ser decisivos con un
nivel de significacin ms fuerte. Lo que no puede pasar es que con un nivel de
significacin aceptemos una hiptesis y con otro nivel de significacin la rechacemos.
Naturalmente, el nivel de significacin ms dbil que podemos utilizar es el de =0'5: si
2<20'5() tendremos tendencia a aceptar la hiptesis con un nivel de significacin
mayor o menor, y si 2>20'5() tendremos tendencia a rechazarla.
Problema 1.18: contrastar la hiptesis de que un dado no est cargado (que todas las
caras tienen la misma probabilidad de salir) lanzndolo 30 veces y anotando el nmero
de veces que sale cada cara.
Matemticas II
Rafael Pla Lpez. Curso 2008-2009