Beruflich Dokumente
Kultur Dokumente
Inferencia estadı́stica
Tema 5. Introducción
1 Introducción
2 Población y Muestra
4 Estadı́sticos
5 Inferencia Paramétrica
Contenidos
1 Introducción
2 Población y Muestra
4 Estadı́sticos
5 Inferencia Paramétrica
Introducción
Contenidos
1 Introducción
2 Población y Muestra
4 Estadı́sticos
5 Inferencia Paramétrica
Población y Muestra
Población
Se llama población a un conjunto de elementos, de los que estamos interesados en
estudiar una caracterı́stica dada.
Muestra
Una muestra es un subconjunto finito de una población.
El número de individuos que forman la muestra se denomina tamaño muestral.
En la práctica no suele ser habitual estudiar todos los elementos de una población ya que:
los elementos pueden existir conceptualmente, pero no en la realidad (población de piezas
defectuosas que producirá una máquina en su vida útil).
puede ser inviable económicamente estudiar a toda la población.
el estudio llevarı́a tanto tiempo que se´rı́a impracticable e incluso las propiedades de la
población podrı́an variar con el tiempo (encuestas electorales).
el estudio puede implicar la destrucción del elemento (estudio de la vida media de una
partida de bombillas, estudio de la tensión de rotura de unos cables,. . . ).
Población y Muestra
Muestra representativa
El Cálculo de Probabilidades juega a favor de que los individuos más frecuentes en
la población, aparezcan más representados en la muestra y los más infrecuentes,
menos representados.
Para ello es fundamental que la muestra esté seleccionada con criterios objetivos,
seleccionando sus componentes aleatoriamente.
En 1936, los teléfonos sólo estaban al alcance de las clases más acomodadas, que
tendı́an a votar más a los republicanos.
Contenidos
1 Introducción
2 Población y Muestra
4 Estadı́sticos
5 Inferencia Paramétrica
Contenidos
1 Introducción
2 Población y Muestra
4 Estadı́sticos
5 Inferencia Paramétrica
Estadı́sticos
n
1X
Media muestral: X̄ = Xi
n
i =1
n n
1X 1X 2
Varianza muestral: V = (Xi − X̄ )2 = Xi − X̄ 2
n n
i =1 i =1
n
" n #
21 X 2 1 X 2 2
Cuasivarianza muestral: S = (Xi − X̄ ) = X − nX̄
n−1 i =1
n − 1 i =1 i
Estadı́sticos
Propiedades:
Sea (X1 , . . . , Xn ) es una muestra aleatoria de una población X con esperanza µ y
varianza σ 2 . Entonces
n−1 2
E (X̄ ) = µ E (V ) = σ E (S 2 ) = σ 2
n
σ2
Var (X̄ ) =
n
Nota: X 6= x.
Como se verá más adelante, X es un buen estimador de E [X ]
Ejemplo (cont.)
Ejemplo
Supongamos que queremos estudiar el nivel de pH de una solución reguladora y
conocer el valor medio, que es desconocido.
Podemos suponer que el nivel de pH se puede aproximar mediante una variable
aleatoria.
Una opción razonable para estimarlo es escoger una muestra de la solución, medir
sus niveles de pH, y estimar µ mediante el promedio de esa muestra:
µ̂ = X̄
Ejemplo (cont.)
La media poblacional es E [X ] = 4.
DATOS POBLACIÓN
15,00
11,25
7,50
3,75
Muestreo 0
!
Parámetros población, !
DATOS MUESTRA
9,5
10,0
7,5 !
4,5
5,0 3,8
Inferencia
2,5 1,6 1,5
0,8
0,2
0
Parámetros muestra, l
4,6 4,6
4,4 4,2 4,4 4,4 4,3 4,3
4,5 4,0 4,1 4,1 4,0 4,2 4,0
3,9
3,6
3,1 3,3
3,0
1,5
0
7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Tamaño muestral
5,1 1,0 0,9 3,8 10,2 2,1 9,5. Media muestral x = 4,65
Histograma con todos los posibles valores de la media muestral para muestras de tamaño
7 DISTRIBUCION DE MEDIAS MUESTRALES TAMAÑO 7
25000
20000
15000
10000
5000
0
1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8
La siguientes grafı́as corresponden a los histogramas con todos los posibles valores
de la media muestral para muestras de tamaño 7 y 17:
DISTRIBUCION DE MEDIAS MUESTRALES TAMAÑO 7 DISTRIBUCION DE MEDIAS MUESTRALES TAMAÑO 17
25000 60000
20000
45000
15000
30000
10000
15000
5000
0 0
1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8 1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8
Conclusiones
Una muestra aleatoria simple de tamaño n de una v.a. X es un conjunto de
v.a. independientes, todas con la misma distribución que X :
n
Xi i =1 v.a.i.i.d.
Contenidos
1 Introducción
2 Población y Muestra
4 Estadı́sticos
5 Inferencia Paramétrica
Inferencia Paramétrica
Problema paramétrico
Se tiene una v.a. X cuya distribución se supone perteneciente a una cierta familia
paramétrica {fθ } donde θ ∈ Θ.
Problemas Estadı́sticos
Según el tipo de información que interese obtener acerca del parámetro θ, se
distinguen 3 tipos básicos de problemas estadı́sticos:
1 Estimación puntual
2 Estimación por intervalos de confianza
3 Contrastes de hipótesis
X1 , X2 , . . . , Xn ∼ F x1 , x2 , . . . , xn
X ∼F ⇒ Muestra ⇒ Muestra observada
⇓ ⇓ ⇓
Estimador de µX Estimación de µX
(variable aleatoria) (un número)
µX = E[X ] ⇐ X̄ ⇐ x̄
Valor esperado de X Media muestral Media muestral
Contenidos
1 Introducción
2 Población y Muestra
4 Estadı́sticos
5 Inferencia Paramétrica
El Teorema Central del Lı́mite establece que, si X1 , X2 , ..., Xn son v.a.i.i.d. con
media µ y varianza σ 2 < ∞, entonces, para n suficientemente grande se verifica
σ2
X̄ ≈ N µ,
n
Este resultado es válido tanto para variables discretas como continuas, sean
simétricas o asimétricas, unimodales o multimodales...
Teorema Central del Lı́mite en Inferencia
El TCL asegura que con muestras suficientemente grandes se pueden utilizar
estimaciones basadas en la distribución normal independientemente del tipo de
distribución que siga la variable que nos interesa.