Beruflich Dokumente
Kultur Dokumente
La inferencia estadística trata de cómo obtener información (inferir) sobre los parámetros a
partir de subconjuntos de valores (muestras) de la variable.
Estadístico: variable aleatoria que sólo depende de la muestra aleatoria elegida para
calcularla.
Estimación: Proceso por el que se trata de averiguar un parámetro de la población
representado, en general, por a partir del valor de un estadístico llamado estimador y
representado por
¿Qué es esto? Concretemos, p.e. en la media (. Si para cada muestra posible calculamos la
media muestral ( ) obtenemos un valor distinto ( es un estadístico: es una variable
aleatoria y sólo depende de la muestra), habrá por tanto una fpd para , llamada
distribución muestral de medias. La desviación típica de esta distribución se denomina error
típico de la media. Evidentemente, habrá una distribución muestral para cada estadístico, no
sólo para la media, y en consecuencia un error típico para cada estadístico.
Si tenemos una muestra aleatoria de una población N(, ), se sabe (Teorema del límite
central) que la fdp de la media muestral es también normal con media y varianza 2/n.
Esto es exacto para poblaciones normales y aproximado (buena aproximación con n>30)
para poblaciones cualesquiera. Es decir es el error típico, o error estándar de la
media.
1º problema: No hay tablas para cualquier normal, sólo para la normal =0 y =1 (la
llamada z); pero haciendo la transformación (llamada tipificación)
1
Llamando z al valor de una variable normal tipificada que deja a su derecha un área bajo la
curva de , es decir, que la probabilidad que la variable sea mayor que ese valor es (estos
son los valores que ofrece la tabla de la normal)
2
o, haciendo énfasis en que es el error estándar de la media,
Ejemplo: Si de una población normal con varianza 4 se extrae una muestra aleatoria de
tamaño 20 en la que se calcula se puede decir que tiene una probabilidad de 0,95
de estar comprendida en el intervalo
En general esto es poco útil, en los casos en que no se conoce tampoco suele conocerse
2; en el caso más realista de 2 desconocida los intervalos de confianza se construyen con la
t de Student (otra fdp continua para la que hay tablas) en lugar de la z.
Este manera de construir los intervalos de confianza sólo es válido si la variable es normal.
Cuando n es grande (>30) se puede sustituir t por z sin mucho error.
Estimación de proporciones
3
Si n es grande y p no está próximo a 0 ó 1 (np 5) X es aproximadamente normal con
muestral), que es también aproximadamente normal, con error típico dado por
Obsérvese que para construirlo, ¡se necesita conocer p!. Si n es grande (>30) se pueden
substituir p y q por sus estimadores sin mucho error, en cualquier caso como pq 0,25 si se
substituye pq por 0,25 se obtiene un intervalo más conservador (más grande).
Solución
4
podemos, o bien mirar a las tablas de la t (o en un programa de ordenador) el valor de t0,025
que para 89 grados de libertad (los grados de libertad son n - 1) es 1,99, o bien como n >
30 aproximar a la z y usar el valor 1,96.
Para poder usar esta fórmula es necesario que la variable sea normal. ¿es abusiva esta
asunción? Ver, por ejemplo The normal distribution. Altman & Bland. BMJ 1995; 310:298.
2º Para evaluar una vacuna para la gripe se selecciona un grupo de 200 individuos de
riesgo. Se eligen aleatoriamente a 100 de ellos y se les suministra la vacuna; de ellos 10
pasan la gripe. Construir un IC al 95% para la probabilidad de pasar la gripe si se está
vacunado. En los otros 100 pacientes sin vacunar la pasan 20. ¿Hay evidencia de que la
vacuna es eficaz?
Solución
es decir, hay una probabilidad del 95% de que la probabilidad de pasar la gripe si se está
vacunado esté comprendida entre el 4% y el 16%. Para los no vacunados
Existe solapamiento, aunque pequeño, entre ambos intervalos; por tanto no podemos
asegurar que la vacuna sea eficaz.