Sie sind auf Seite 1von 14

13/04/2018

ESTADÍSTICA II
UAH

Clase 05: Inferencia Estadística 1.


Estimación puntual e Intervalos de Confianza.

~Marcela Moraga Cubillos~


memoraga@uc.cl

6. Distribuciones de probabilidad

Distribuciones de probabilidad (teóricas) conocidas

-Distribución Normal
- Distribución Normal Estándar
Nos incumben en el
-Distribución T de Student corto plazo.

-Distribución Binomial (Bernoulli)

-Distribución Chi cuadrado de Pearson


Nos incumbirán
-Distribución F después.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 2

~Marcela Moraga Cubillos~ 1


13/04/2018

8. Distribuciones de probabilidad: Distribución Student

z vs t.

x x
z ( )  t( gl , ) 
x sx
n n

El puntaje t corrige el error de estimación producido por usar muestras pequeñas (error
por tamaño de la muestra) y la desviación estándar de la muestra (estimador) en vez
de la de la población (error de estimación).

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 9

9. Distribuciones de probabilidad: Distribución binomial

Binomial / Bernoulli

Sea X una variable aleatoria con solo dos resultados mutuamente excluyentes
(ensayos de Bernoulli), como por ejemplo:

- Religiosidad  “creyente” o “no creyente”.


- Nivel socioeconómico  “alto + medio-alto” o “medio + medio-bajo + bajo”.
- Resultado de un examen final  “aprueba” o “reprueba”.
- Edad de un individuo  “mayor de edad” o “menor de edad”.

A uno de los resultados se le denomina “éxito” y al otro “fracaso”, de modo que:


- p = Probabilidad de que ocurra el ensayo denominado “éxito”.
- (1 – p) = q = Probabilidad de que ocurra el ensayo denominado “fracaso”.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 10

~Marcela Moraga Cubillos~ 2


13/04/2018

9. Distribuciones de probabilidad: Distribución binomial

La distribución binomial se aproxima a la normal gracias al


teorema del límite central sólo si se cumple que:

n > 20 (30)
n*p>5
n*q>5

Media      P

P Q
Error estándar   
n

Y en esa situación se puede usar la tabla z.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 11

9. Distribuciones de probabilidad: Distribución binomial

Entonces, el estadístico de prueba será…

Z = Estadístico muestral – Parámetro poblacional


Error estándar

p 
z* 
P Q
EE
n

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 12

~Marcela Moraga Cubillos~ 3


13/04/2018

9. Distribuciones de probabilidad: Distribución binomial

Ejemplo 7: Se sabe que el 60% de los adultos de cierta zona asisten


regularmente a servicios religiosos. Se escoge una muestra aleatoria de 150
adultos de dicha área. ¿Cuál es la probabilidad de que la proporción de
asistentes de la muestra esté entre 0,50 y 0,70? (Daniel, W. W. 1981: 126-127).

n  20
P  0,60
Se puede usar
n  P  150  0,60  90 la tabla z
Q  0,40
n  Q  150  0,40  60

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 13

9. Distribuciones de probabilidad: Distribución binomial

P  0,60
0,6  0,4 0,24
    0,04
Q  0,40 150 150

0,50  0,60  0,10


z1    2,5
0,04 0,04

0,70  0,60 0,10


z2    2,5
0,04 0,04 La probabilidad de que una muestra de 150 adultos
de esa zona muestre un porcentaje de asistencia a
servicios religiosos entre 50% y 70% es de
(0,4938+0,4938)=0,9876.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 14

~Marcela Moraga Cubillos~ 4


13/04/2018

9. Distribuciones de probabilidad: Distribución binomial

Ejemplo 8: Según los resultados del último Censo (!!!), el 11,4% de la población
tiene 65+, lo que es evidencia del envejecimiento de la población.
Dato de la causa: en el Censo 1992 el grupo correspondía al 6,6%.

Suponga que usted trabaja en una ONG y para realizar cierto estudio obtienen
una muestra aleatoria de 150 individuos. ¿Cuál es la probabilidad de que la
proporción de personas de 65+ años sea menor o igual al 15%?

n  20
P  0,114
Se puede usar
n  P  150  0,114  17,1 la tabla z
Q  0,886
n  Q  150  0,886  132,9

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 16

9. Distribuciones de probabilidad: Distribución binomial

P  0,114
Q  0,886

0,114  0,886 0,1010


    0,026
150 150

La probabilidad de que una muestra de 150


personas se obtenga que el porcentaje de
0,15  0,114 0,036 individuos de 65+ años es de 15% o inferior es
z   1,39 (0,50+0,4177)=0,9177  91,77%
0,026 0,026

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 17

~Marcela Moraga Cubillos~ 5


13/04/2018

9. Distribuciones de probabilidad: Resumen

Normal Student Binomial


n>20
Cuándo se comporta
Es normal Cuando n>120 n*p>5
como normal
n*q>5

Parámetro (media,
proporción)
x x ,P

x sx P Q
Error estándar
n n n

Estadístico de prueba
x x p 
(estandarización) E.E.( gl ) E .E .
E.E.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 22

Y ahora… ¿qué pasa con la inferencia?

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 23

~Marcela Moraga Cubillos~ 6


13/04/2018

1. Intro

Estadística
Procedimientos (matemáticos) para resumir y analizar información cuantitativa

Estadística Descriptiva Estadística Inferencial


Muestra  Muestra Muestra  Población

Univariada Bivariada
Bivariada
Univariada Intervalos de Test de hipótesis (para dos
Confianza, Test de muestras), chi cuadrado,
MTC, MD, MF Tablas de
hipótesis (para una correlaciones.
contingencia.
muestra) Regresiones

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 24

1. Intro
La vida está llena de datos (distintos niveles de seriedad). Por ejemplo:

- 39% de los doctorandos de EEUU tienen depresión moderada o severa, frente al 6% de la


población general (Evans et al, 2018).

- 95% de los chilenos piensa que los chilenos son machistas. 26% de los hombres y 34% de las
mujeres se consideran machistas siempre o en algunos casos. (Adimark, 2018)

- Los humanos identificamos con 63% de éxito el significado del gruñido de un perro. Las mujeres
hablan mejor el lenguaje perruno (Faragó et al, 2017).

- 52% de los ingleses creen en los fantasmas y 38% en los extraterrestres (YouGob, 2013).

- 33% de las personas está de acuerdo con la afirmación “en el trabajo, la autoridad de un hombre
da más seguridad y estabilidad que la autoridad de una mujer”. (40% hombres, 27% mujeres)
(Encuesta Bicentenario, 2017)

- La probabilidad de que un control remoto perdido esté entre los cojines de un sofá es de un 49%,
8% en el baño, 4% en el refrigerador (Logitech, 2011) .

- El 43% dijo que un aliento fresco es importante antes de una cita (Match.com)

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 25

~Marcela Moraga Cubillos~ 7


13/04/2018

1. Intro

Para sacar conclusiones sobre una población a partir de una muestra…

1. Estimación puntual del parámetro.

2. Intervalos de confianza.

3. Test de hipótesis.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 26

2. Estimación puntual del parámetro

Estimación puntual del parámetro

- Usa el valor del estadístico muestral como indicador del valor del parámetro.
- Lo más reportado en los medios de comunicación.
- No incorpora el error muestral.
- “El 79% de los chilenos está a favor de prohibir los asados en días de altos niveles de
contaminación” (Encuesta Nacional del Medio Ambiente / Desuc, 2018).

̂  X ̂  p ˆ x  s x ˆ x  s
n
¿Qué problema ve en esto?

Nota  ^ = Estimador

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 27

~Marcela Moraga Cubillos~ 8


13/04/2018

2. Estimación puntual del parámetro

Encuesta Nacional del


Medio Ambiente /
Desuc, 2018

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 28

2. Estimación puntual del parámetro


Estimación puntual del parámetro

Problemas:

- Los estadísticos son sólo estimaciones de los parámetros.

- No se incorpora la variabilidad del estadístico en distintas muestras.

- Si hago la prueba con una segunda, tercera o cuarta muestra, obtendríamos estadísticos
(medias, proporciones, etc.) ligeramente diferentes unos de otros.
- La probabilidad de que lo que sucede en mi muestra no sea lo que ocurre en la población.

- Para poder estimar lo que pasa en la población, debo incorporar la variabilidad de los
estadísticos (xbarra, p).

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 29

~Marcela Moraga Cubillos~ 9


13/04/2018

3. Estimación por intervalos de confianza


Estimación por Intervalos de Confianza

La estimación por Intervalo de Confianza identifica un rango de valores (intervalo A-B)


entre los que puede situarse el parámetro poblacional con cierta certeza.

- Incorpora el error muestral y la


variabilidad propia de trabajar con
muestras.

- Da una indicación acerca de la precisión


con que se realizó la estimación puntual.

- Depende de los valores de la muestra


(tamaño, desviación estándar y media) y
del nivel de confianza con que se quiera
inferir.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 30

4. Niveles de confianza y de significancia

Niveles de confianza (1-α)

Para determinar el rango de valores entre los


cuales está el parámetro debemos determinar
cuán confiados deseamos estar de que el
parámetro esté en el rango.

Confianza  Probabilidad / certeza de que


algo pase.

¿Más o menos qué edad


estiman que tiene el eminente
David Hackenherrr? David Hackenherrr: eminente científico, poeta,
visionario, geólogo, striper, explorador, profeta,
esposo dedicado, animador de eventos, puntaje
nacional, abogado. Austro-húngaro.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 31

~Marcela Moraga Cubillos~ 10


13/04/2018

4. Niveles de confianza y de significancia

Niveles de confianza (1-α)

- Probabilidad de que la muestra elegida produzca un


intervalo que incluya el parámetro.

- En una distribución normal se asocian a un puntaje Z.


- Si calculo un estadístico (xbarra) en 100 muestras, y
luego calculo sus respectivos IC, veré que 95 de ellas
contendrán el parámetro.

90% de confianza  z=1,645


95% de confianza  z= 1,96 Ejemplo: 50 muestras
99% de confianza  z= 2,575 para estimar el
parámetro μ (dibujo
extraído de Wikipedia)
~Marcela Moraga Cubillos~ memoraga@uc.cl~ 32

4. Niveles de confianza y de significancia

Nivel de Significancia (α)

- Contracara del nivel de


confianza.

- Es la probabilidad de
equivocarme y de que la
muestra seleccionada no
contenga a μ.

- Si α = 0,05 = 5%  Al
seleccionar 100 muestras y
calcular los respectivos IC, veo
que 5 de ellas no contienen al
parámetro.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 33

~Marcela Moraga Cubillos~ 11


13/04/2018

4. Niveles de confianza y de significancia

Considerar que…

a. A mayor nivel de confianza, el intervalo será más ancho y por lo tanto


habrá mayor probabilidad de contener al parámetro.

b. Al aumentar el nivel de confianza aumenta la certeza de que el


intervalo contenga al parámetro, pero con el costo de tener estimaciones
menos precisas.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 34

4. Niveles de confianza y de significancia

Ejemplo

- Entre A y B está el 95% de los datos (y no se incluye al parámetro).

- Entre C y D está el 99% de los datos (y sí se incluye al parámetro)

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 35

~Marcela Moraga Cubillos~ 12


13/04/2018

5. Intervalos de confianza

Luego de saber cuán confiado quiero estar (nivel de confianza) necesito saber
qué forma tiene la distribución muestral (normal o t de student).

a. Normal  Aparece cuando conocemos σ.

b. T de student
− Cuando no conozco σ poblacional y por ende debo trabajar con la
desviación estándar de la muestra (s).
− Cuando tengo muestras pequeñas, ya que recién sobre los 120 casos
la distribución t de student se comporta como normal.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 36

5. Intervalos de confianza

¿Cómo calcular el Intervalo de Confianza?

Coef. de confianza
Error estándar
(supone dos colas)


X  z  
2 n
Error máximo de estimación

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 37

~Marcela Moraga Cubillos~ 13


13/04/2018

5. Intervalos de confianza

¿Cómo calcular el Intervalo de Confianza?


Error
Coef. de confianza estándar
(supone dos colas)

pq
X  z  
2 n
Error máximo de estimación

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 38

7. Cálculo de Intervalo de Confianza


¿Cómo calcular el Intervalo de Confianza?

Estimación puntual ± Error máximo de estimación

Coef. De
Estimación puntual ± * Error estándar
confianza

Normal  Xbarra ± Z (α/2) * σ/√n

T de student  Xbarra ± t [(α/2), gl] * s/√n

Binomial  p ± Z (α/2) * √(p*q)/√n

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 44

~Marcela Moraga Cubillos~ 14

Das könnte Ihnen auch gefallen