Sie sind auf Seite 1von 35

Bloque III.

Inferencia estadı́stica
Tema 5. Introducción

Asignatura: MATEMÁTICAS III

Bloque III/Tema 5) Matematicas III 1 / 35


Contenidos

1 Introducción

2 Población y Muestra

3 Muestrea Aleatoria Simple

4 Estadı́sticos

5 Inferencia Paramétrica

6 Teorema Central del Lı́mite

Bloque III/Tema 5) Matematicas III 2 / 35


Introducción

Contenidos

1 Introducción

2 Población y Muestra

3 Muestrea Aleatoria Simple

4 Estadı́sticos

5 Inferencia Paramétrica

6 Teorema Central del Lı́mite

Bloque III/Tema 5) Matematicas III 3 / 35


Introducción

La inferencia estadı́stica es la parte de la estadı́stica dedicada a proporcionar


herramientas para obtener información de una población, a partir de una pequeña
parte de la misma.

Es habitual tratar de obtener información sobre:


Proporción de votantes a un determinado partido, de defectuosos en una partida de
productos, de paquetes que llegan tarde, etc.
Salario medio, altura media, concentración media de un componente, duración
media, espera media, etc.

Bloque III/Tema 5) Matematicas III 4 / 35


Introducción

La Inferencia Estadı́stica clásica parte de un modelo muy sencillo:


1 se obtienen datos,
2 con técnicas estadı́sticas se extrae información de los mismos (estimaciones),
3 se toman decisiones.
La Inferencia Bayesiana incorpora al modelo información subjetiva
(probabilidad subjetiva) sobre la población a estudiar:
Valoración experta de posibilidades.
Cada cantidad desconocida es considerada como una variable aleatoria y
requiere una distribución de probabilidad
La probabilidad es una medida del grado de creencia sobre los posibles valores
de esa cantidad desconocida
La Inferencia Bayesiana tiene como soporte fundamental el Teorema de Bayes.

Bloque III/Tema 5) Matematicas III 5 / 35


Introducción

Introducción

Bloque III/Tema 5) Matematicas III 6 / 35


Población y Muestra

Contenidos

1 Introducción

2 Población y Muestra

3 Muestrea Aleatoria Simple

4 Estadı́sticos

5 Inferencia Paramétrica

6 Teorema Central del Lı́mite

Bloque III/Tema 5) Matematicas III 7 / 35


Población y Muestra

Población y Muestra

Población
Se llama población a un conjunto de elementos, de los que estamos interesados en
estudiar una caracterı́stica dada.

Muestra
Una muestra es un subconjunto finito de una población.
El número de individuos que forman la muestra se denomina tamaño muestral.
En la práctica no suele ser habitual estudiar todos los elementos de una población ya que:
los elementos pueden existir conceptualmente, pero no en la realidad (población de piezas
defectuosas que producirá una máquina en su vida útil).
puede ser inviable económicamente estudiar a toda la población.
el estudio llevarı́a tanto tiempo que se´rı́a impracticable e incluso las propiedades de la
población podrı́an variar con el tiempo (encuestas electorales).
el estudio puede implicar la destrucción del elemento (estudio de la vida media de una
partida de bombillas, estudio de la tensión de rotura de unos cables,. . . ).

Bloque III/Tema 5) Matematicas III 8 / 35


Población y Muestra

Población y Muestra

Muestra representativa
El Cálculo de Probabilidades juega a favor de que los individuos más frecuentes en
la población, aparezcan más representados en la muestra y los más infrecuentes,
menos representados.

Para ello es fundamental que la muestra esté seleccionada con criterios objetivos,
seleccionando sus componentes aleatoriamente.

Bloque III/Tema 5) Matematicas III 9 / 35


Población y Muestra

Representatividad de una muestra

Ejemplo: Sondeo electoral de 1936


En las elecciones presidenciales de Estados Unidos de 1936, se presentaban
Landon por el P. Republicano y Roosevelt por el Demócrata.
El Literary Digest llevó a cabo el mayor sondeo electoral de la historia:
Envió por correo millones de cuestionarios, tomando las direcciones de las
guı́as telefónicas.
Se recibieron 2.300.000 respuestas y de ellas se dedujo que ganarı́a Landon.
La realidad, sin embargo, es que venció Roosevelt:
Candidato Predicción del sondeo Resultado electoral
Roosevelt 41 % 61 %
Landon 55 % 37 %
Otros 4% 2%

Bloque III/Tema 5) Matematicas III 10 / 35


Población y Muestra

Representatividad de una muestra

Ejemplo: Sondeo electoral de 1936


El error se produjo porque la muestra a partir de la cual se habı́an estimado los
resultados no era representativa de los votantes en genera.

En 1936, los teléfonos sólo estaban al alcance de las clases más acomodadas, que
tendı́an a votar más a los republicanos.

Esto habı́a introducido un importante sesgo en la encuesta (la muestra estaba


sesgada).

Bloque III/Tema 5) Matematicas III 11 / 35


Muestrea Aleatoria Simple

Contenidos

1 Introducción

2 Población y Muestra

3 Muestrea Aleatoria Simple

4 Estadı́sticos

5 Inferencia Paramétrica

6 Teorema Central del Lı́mite

Bloque III/Tema 5) Matematicas III 12 / 35


Muestrea Aleatoria Simple

Muestra Aleatoria Simple

Muestreo aleatorio simple


Un muestreo aleatorio simple consiste en seleccionar aleatoriamente miembros de
una población de tal manera que:
cada elemento de la población tenga la misma probabilidad de ser escogido,
asegurando, de esta manera, la representatividad de la muestra de cara a la
población; y
las selecciones se realizan con reposición, de tal manera que la población es
idéntica en todas las extracciones.
Nota: si el tamaño de la población (N) es grande con respecto al tamaño muestral
(n) es indiferente hacer el muestreo con o sin reposición.

Bloque III/Tema 5) Matematicas III 13 / 35


Muestrea Aleatoria Simple

Muestra Aleatoria Simple

El objetivo es estudiar una caracterı́stica definida por una variable aleatoria X


de una población.
Esta variable aleatoria tiene asociada una función de distribución F .

Muestra Aleatoria Simple


Una muestra aleatoria simple (m.a.s.) de tamaño n es un conjunto de variables
aleatorias X1 , . . . , Xn tal que:
1 Todas tienen la misma función de distribución F que X : Xi ≈ F , para
i = 1, . . . , n.
2 X1 , . . . , Xn son independientes entre sı́.
De forma abreviada suele escribirse que las variables X1 , X2 , . . . , Xn , son i.i.d. (independientes e
idénticamente distribuidas) con distribución común F

Bloque III/Tema 5) Matematicas III 14 / 35


Muestrea Aleatoria Simple

Muestra Aleatoria Simple

Cuando se disponga de una realización concreta de una m.a.s., es decir, de


una colección de n datos u observaciones, ésta se denotará con letras
minúsculas:
x1 , x2 , . . . , xn .
Un estadı́stico es una función real de la m.a.s. X1 , . . . , Xn . Por tanto, un
estadı́stico es una variable aleatoria (a diferencia de un parámetro que es un
número fijo, inherente a la población)

Bloque III/Tema 5) Matematicas III 15 / 35


Estadı́sticos

Contenidos

1 Introducción

2 Población y Muestra

3 Muestrea Aleatoria Simple

4 Estadı́sticos

5 Inferencia Paramétrica

6 Teorema Central del Lı́mite

Bloque III/Tema 5) Matematicas III 16 / 35


Estadı́sticos

Estadı́sticos

Una vez obtenida una muestra, es necesario resumir y simplificar la información


obtenida. Se define ası́ el concepto de estadı́stico.
Estadı́stico
Un estadı́stico T ≡ T (X1 , . . . , Xn ) es una función real de la muestra aleatoria
(X1 , ..., Xn ).

n
1X
Media muestral: X̄ = Xi
n
i =1
n n
1X 1X 2
Varianza muestral: V = (Xi − X̄ )2 = Xi − X̄ 2
n n
i =1 i =1
n
" n #
21 X 2 1 X 2 2
Cuasivarianza muestral: S = (Xi − X̄ ) = X − nX̄
n−1 i =1
n − 1 i =1 i

Bloque III/Tema 5) Matematicas III 17 / 35


Estadı́sticos

Estadı́sticos

Un estadı́stico es una variable aleatoria T (X1 , . . . , Xn ), y por lo tanto, tiene


asociada una distribución.
Distribución Muestral
La distribución de probabilidad correspondiente a un estadı́stico se denomina
distribución muestral o distribución en el muestreo.

Propiedades:
Sea (X1 , . . . , Xn ) es una muestra aleatoria de una población X con esperanza µ y
varianza σ 2 . Entonces
n−1 2
E (X̄ ) = µ E (V ) = σ E (S 2 ) = σ 2
n
σ2
Var (X̄ ) =
n

Bloque III/Tema 5) Matematicas III 18 / 35


Estadı́sticos

Uso de la muestra aleatoria simple

Supongamos una v.a. para la que desconocemos el valor de E [X ].


Para estimar el valor de E [X ], es habitual utilizar una m.a.s. para obtener el
estadı́stico media muestral:
n
1X
X = Xi
n
i =q

Nota: X es una variable aleatoria.


Ahora, para una muestra particular x1 , . . . , xn se obtiene un valor numérico
particular:
n
1X
x= xi
n
i =1

Nota: X 6= x.
Como se verá más adelante, X es un buen estimador de E [X ]

Bloque III/Tema 5) Matematicas III 19 / 35


Estadı́sticos

Ejemplo (cont.)

Observación: parámetros poblacionales y muestrales


Es importante distinguir entre parámetros
poblacionales (que son fijos y por lo general desconocidos) y
muestrales (que varı́an según la muestra seleccionada).

Ejemplo
Supongamos que queremos estudiar el nivel de pH de una solución reguladora y
conocer el valor medio, que es desconocido.
Podemos suponer que el nivel de pH se puede aproximar mediante una variable
aleatoria.
Una opción razonable para estimarlo es escoger una muestra de la solución, medir
sus niveles de pH, y estimar µ mediante el promedio de esa muestra:

µ̂ = X̄

Bloque III/Tema 5) Matematicas III 20 / 35


Estadı́sticos

Ejemplo (cont.)

Se toma una muestra de 7 mediciones de pH de dicha solución reguladora:

5,12 5,26 5,13 5,06 5,08 5,15 5,16

El promedio de estos datos es x̄ = 5,137.


Este valor estima o aproxima el verdadero valor desconocido del parámetro µ.
Con otra muestra, se obtienen otros niveles de pH, por ejemplo:

5,22 5,14 5,13 5,16 5,14 5,13 5,18

La media de esta otra muestra, x̄ = 5,157 es otra estimación del desconocido


valor del parámetro µ.

Bloque III/Tema 5) Matematicas III 21 / 35


Estadı́sticos

Ejemplo de muestreo e inferencia

Consideremos una una población compuesta de N = 24 individuos (población


finita).

La variable de interés es X = ”Tiempo para completar una consulta médica”.

Los valores poblacionales (en minutos) son:

5,1 1,0 0,9 3,8 10,2 2,1 9,5 4,5


1,0 2,2 1,5 4,8 1,6 8,8 4,3 1,0
9,0 5,1 0,2 2,3 0,8 7,8 7,7 1,5

La media poblacional es E [X ] = 4.

Bloque III/Tema 5) Matematicas III 22 / 35


Estadı́sticos

Ejemplo de muestreo e inferencia


Seleccionamos una m.a.s. de tamaño 7 dada por:

3,8 9,5 4,8 1,6 0,2 0,8 1,5

DATOS POBLACIÓN
15,00

11,25

7,50

3,75
Muestreo 0
!
Parámetros población, !

DATOS MUESTRA
9,5
10,0

7,5 !
4,5
5,0 3,8
Inferencia
2,5 1,6 1,5
0,8
0,2
0

Parámetros muestra, l

Bloque III/Tema 5) Matematicas III 23 / 35


Estadı́sticos

Ejemplo de muestreo e inferencia

La media muestral es x = 3, 171 y el error (sesgo) relativo es


(4 − 3,171)/4 = 0,207.

Si a la m.a.s. anterior le añadimos nuevos elementos, la media muestral cambia.


De hecho, el aumento reiterado de elementos hace que la media muestral converja
a la media poblacional.
CAMBIO EN EL PROMEDIO CON EL TAMAÑO MUESTRAL
6,0

4,6 4,6
4,4 4,2 4,4 4,4 4,3 4,3
4,5 4,0 4,1 4,1 4,0 4,2 4,0
3,9
3,6
3,1 3,3
3,0

1,5

0
7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Tamaño muestral

Bloque III/Tema 5) Matematicas III 24 / 35


Estadı́sticos

Ejemplo de muestreo e inferencia

Por otro lado, si seleccionamos otra m.a.s. de tamaño 7 obtenemos:

5,1 1,0 0,9 3,8 10,2 2,1 9,5. Media muestral x = 4,65
Histograma con todos los posibles valores de la media muestral para muestras de tamaño
7 DISTRIBUCION DE MEDIAS MUESTRALES TAMAÑO 7
25000

20000

15000

10000

5000

0
1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8

Bloque III/Tema 5) Matematicas III 25 / 35


Estadı́sticos

Ejemplo de muestreo e inferencia

La siguientes grafı́as corresponden a los histogramas con todos los posibles valores
de la media muestral para muestras de tamaño 7 y 17:
DISTRIBUCION DE MEDIAS MUESTRALES TAMAÑO 7 DISTRIBUCION DE MEDIAS MUESTRALES TAMAÑO 17
25000 60000

20000

45000

15000

30000

10000

15000

5000

0 0
1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8 1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8

Bloque III/Tema 5) Matematicas III 26 / 35


Estadı́sticos

Muestra Aleatoria Simple

Conclusiones
Una muestra aleatoria simple de tamaño n de una v.a. X es un conjunto de
v.a. independientes, todas con la misma distribución que X :
 n
Xi i =1 v.a.i.i.d.

La media muestral, X , es una variable aleatoria. En general, los estadı́sticos


son variables aleatorias que dependen de la selección aleatoria de los
individuos de la muestra.

Bloque III/Tema 5) Matematicas III 27 / 35


Inferencia Paramétrica

Contenidos

1 Introducción

2 Población y Muestra

3 Muestrea Aleatoria Simple

4 Estadı́sticos

5 Inferencia Paramétrica

6 Teorema Central del Lı́mite

Bloque III/Tema 5) Matematicas III 28 / 35


Inferencia Paramétrica

Inferencia Paramétrica

El objeto general de la Inferencia es obtener información acerca de la distribución


de X mediante la observación de una muestra (X1 , . . . , Xn ).

Problema paramétrico
Se tiene una v.a. X cuya distribución se supone perteneciente a una cierta familia
paramétrica {fθ } donde θ ∈ Θ.

La distribución de X es conocida excepto por el valor del parámetro θ, del cual lo


único que se conoce es su rango de posibles valores, Θ, denominado espacio
paramétrico.

El objeto de los métodos paramétricos es pues, obtener información sobre el


parámetro θ mediante la obtención de muestras de la v.a. X .

Bloque III/Tema 5) Matematicas III 29 / 35


Inferencia Paramétrica

Ejemplos de familias paramétricas


X ∼ N(µ, σ 2 ) −→ θ = (µ, σ 2 )
X ∼ Bernoulli(p) −→ θ = p
X ∼ Exp(λ) −→ θ = λ
etc.

Problemas Estadı́sticos
Según el tipo de información que interese obtener acerca del parámetro θ, se
distinguen 3 tipos básicos de problemas estadı́sticos:
1 Estimación puntual
2 Estimación por intervalos de confianza
3 Contrastes de hipótesis

Bloque III/Tema 5) Matematicas III 30 / 35


Inferencia Paramétrica

Inferencia Estadı́stica: palabras clave (i)

Población: el conjunto de toda la información numérica relativa a una


cantidad de interés.
Identificaremos el concepto de población con el de una variable aleatoria X .
La ley o distribución de la población es la distribución de X , FX .
Muestra: un subconjunto observado (por ejemplo, de tamaño n) de valores de
la población.
Representada como una colección de n variables aleatorias X1 , X2 , . . . , Xn ,
tı́picamente iid (independientes e idénticamente distribuidas) .
Parámetro: una constante que caracteriza a X o FX .

Bloque III/Tema 5) Matematicas III 31 / 35


Inferencia Paramétrica

Inferencia Estadı́stica: palabras clave (ii)

Inferencia estadı́stica: el proceso mediante el que se llega a conclusiones sobre


una población a partir de las medidas o las observaciones realizadas sobre una
muestra de individuos de la población.
Estadı́stico: una variable aleatoria definida como una función de una muestra
aleatoria, Y = f (X1 , X2 , . . . , Xn )
Estimador de un parámetro: una variable aleatoria, por ejemplo T , función de
una muestra aleatoria, T = T (X1 , X2 , . . . , Xn ), que se emplea para aproximar
(estimar) el valor de un parámetro de la población desconocido.
Estimación: una realización concreta del estimador, por ejemplo T ,
correspondiente a una muestra observada, x1 , x2 , . . . , xn , y que proporciona
una aproximación al valor del parámetro de interés.

Bloque III/Tema 5) Matematicas III 32 / 35


Inferencia Paramétrica

Inferencia estadı́stica: ejemplo

Queremos conocer Tenemos n copias Tenemos n


µX = E[X ] de X valores observados de
X1 , X2 , . . . , Xn

X1 , X2 , . . . , Xn ∼ F x1 , x2 , . . . , xn
X ∼F ⇒ Muestra ⇒ Muestra observada

⇓ ⇓ ⇓
Estimador de µX Estimación de µX
(variable aleatoria) (un número)
µX = E[X ] ⇐ X̄ ⇐ x̄
Valor esperado de X Media muestral Media muestral

Bloque III/Tema 5) Matematicas III 33 / 35


Teorema Central del Lı́mite

Contenidos

1 Introducción

2 Población y Muestra

3 Muestrea Aleatoria Simple

4 Estadı́sticos

5 Inferencia Paramétrica

6 Teorema Central del Lı́mite

Bloque III/Tema 5) Matematicas III 34 / 35


Teorema Central del Lı́mite

Teorema Central del Lı́mite

El Teorema Central del Lı́mite establece que, si X1 , X2 , ..., Xn son v.a.i.i.d. con
media µ y varianza σ 2 < ∞, entonces, para n suficientemente grande se verifica

σ2
 
X̄ ≈ N µ,
n

Este resultado es válido tanto para variables discretas como continuas, sean
simétricas o asimétricas, unimodales o multimodales...
Teorema Central del Lı́mite en Inferencia
El TCL asegura que con muestras suficientemente grandes se pueden utilizar
estimaciones basadas en la distribución normal independientemente del tipo de
distribución que siga la variable que nos interesa.

Bloque III/Tema 5) Matematicas III 35 / 35

Das könnte Ihnen auch gefallen