Beruflich Dokumente
Kultur Dokumente
Numérica
MSc. Evelyn Gutierrez
egutierreza@pucp.edu.pe
Programa del Curso
• CAP 1: ANÁLISIS DESCRIPTIVO (4h)
• CAP. 2: PRUEBA DE HIPÓTESIS (6h)
• CAP. 3: ANÁLISIS DE VARIANZA (ANOVA) (6h)
• CAP. 4: EXPERIMENTACIÓN (12)
CAP. 2: PRUEBA DE HIPÓTESIS
2.1. Introducción: Conceptos, Nivel de confianza y nivel de
significación, Estadística de prueba y p-valor.
2.2. Prueba de bondad de ajuste.
2.2.1. Chi-sq test, KS test y otros.
2.2.2. Gráficas de normalidad.
2.3. Pruebas de hipótesis de un parámetro.
2.4. Pruebas de hipótesis para diferencia de medias.
2.3.1. Prueba de hipótesis para muestras independientes.
2.3.2. Pruebas de hipótesis para muestras pareadas
2.5. Prueba de razón de varianzas.
2.6. Pruebas de hipótesis no paramétricas.
Introducción
Pruebas de Hipótesis
Consideremos una variable aleatoria 𝑿 cuya función de distribución 𝑭𝑿 depende de un
parámetro (o vector de parámetros) 𝜽. Denotado por: 𝑿~𝜽.
Una hipótesis (estadística) es cualquier enunciado,
afirmación o conjetura que podamos hacer con respecto a la
v.a. 𝑋~𝜃
VOTACIÓN
𝑯𝟎 : El porcentaje de personas que votará por un candidato es de al menos 50%.
𝑯1 : El porcentaje de personas que votará por un candidato es menor al 50%.
Notación:
𝑯𝟎 : 𝑝 ≥ 0.5
𝑯1 : 𝑝 < 0.5
Prueba de hipótesis
Una hipótesis (estadística) es cualquier enunciado, afirmación o conjetura que podamos
hacer con respecto a la v.a. 𝑋~𝜃
• Hipótesis Nula: 𝑯𝟎
• Es una conjetura. No podemos probar esta afirmacion.
• La afirmación que mantenemos por defecto.
• Solo puede ser rechazada por los datos.
• Hipótesis Alternativa: 𝑯𝟏
• Es la conjetura que quieres probar.
• Es una afirmación que vamos a aceptar si rechazamos 𝑯0
• Hipotesis de investigación.
Prueba de hipótesis
• Nivel de confianza: C = 1- 𝜶
¿Cuan seguros estamos de nuestra decisión?
Usualmente 90%, 95%, 99%.
• Nivel de significancia: 𝜶
A una cola
0.05
Prueba de hipótesis
𝑯𝒐 : 𝝁𝒙 ≤ 𝟎
p-valor 𝑯𝟏 : 𝝁𝒙 > 𝟎
Error Decisión
H0 cierta
tipo I correcta
Decisión Error
H0 falsa
correcta tipo II
Tipos de errores Decisión basada en la muestra
La realidad
Rechazar H0 No rechazar H0
Error Decisión
H0 cierta
tipo I correcta
Error tipo 1
Decisión Error
H0 falsa
correcta tipo II
𝛼 = 𝑃(𝑹𝒆𝒄𝒉𝒂𝒛𝒂𝒓 𝑯𝟎 / 𝐻0 𝑒𝑠 𝑐𝑖𝑒𝑟𝑡𝑎)
Hipótesis: Clase 1 𝑂1 𝐸1
𝑯𝟎 : 𝑭𝑿 = 𝑭𝟎
𝑯𝟏 : 𝑭𝑿 ≠ 𝑭𝟎 Clase 2 𝑂2 𝐸2
Clase 3 𝑂3 𝐸3
Estadístico de prueba:
… … …
Clase k 𝑂𝑘 𝐸𝑘
Región de Rechazo
Estadístico de 2
prueba calculado
𝑈0 > 𝜒𝛼,𝑔𝑙 Valor crítico
𝑯𝟎 : 𝑭 𝑿 = 𝑭 𝟎
𝑯𝟏 : 𝑭 𝑿 ≠ 𝑭 𝟎
Chi-squared test for given probabilities with simulated p-value (based on 2000
replicates)
data: freq.observada
X-squared = 34.583, df = NA, p-value = 0.0004998
Ejemplo
Utilizando los datos del experimento sobre escritura en un teclado Galaxy y un teclado
iPhone, veremos si es posible asumir una distribución normal para la variable PPM
(Palabras por minuto). Usaremos un nivel de significación: 𝛼 = 0.05
En R (Prueba KS):
data: misdatos$PPM
D = 1, p-value = 4.441e-16
alternative hypothesis: two-sided
Uno de los argumentos es pnorm ya que estamos comparando la distribución con una normal.
Para otras distribuciones, buscar la función que devuelve la fx. distribución que se quiere probar.
Por ejemplo: pchisq (chi cuadrado), pt (t-student), plnorm (log normal).
Ejemplo
Utilizando los datos del experimento sobre escritura en un teclado Galaxy y un teclado
iPhone, veremos si es posible asumir una distribución normal para la variable PPM
(Palabras por minuto). Usaremos un nivel de significación: 𝛼 = 0.05
En R (Otras pruebas):
data: misdatos$PPM
W = 0.85077, p-value = 5.303e-07
Uno de los argumentos es pnorm ya que estamos comparando la distribución con una normal.
Para otras distribuciones, buscar la función que devuelve la fx. distribución que se quiere probar.
Por ejemplo: pchisq (chi cuadrado), pt (t-student), plnorm (log normal).
Ejercicio
Utilizando los datos del experimento sobre escritura en un teclado Galaxy y un teclado iPhone,
uutilice una prueba de bondad de ajuste para probar si la variable TasaError (La tasa de error al
escribir con los teclados de Samsung y iphone) tiene distribución normal. Usaremos un nivel de
significación: 𝛼 = 0.05
1. ¿Cuál es la conclusion despues de llevar a cabo una prueba de bondad de ajuste para la variable
TasaError?
2. Ahora pruebe la normalidad para la variable TasaError en los teclados “iPhone”. En este caso
¿cuál sería la conclusión?.
Lo que hemos visto hasta ahora…
Pruebas de bondad Test KS o Test de Shapiro
Chi cuadrado
de ajuste Kolgomorov-Smirnov Wilks
t-test
var.equal=T U-Mann Withney
Muestras Z-test
Var.equal=T
t-test
independientes
Pruebas sobre dos var.equal=F
parámetros
Muestras d-test U-Mann Withney
dependientes Var.equal=F