Sie sind auf Seite 1von 30

Experimentación

Numérica
MSc. Evelyn Gutierrez
egutierreza@pucp.edu.pe
Programa del Curso
• CAP 1: ANÁLISIS DESCRIPTIVO (4h)
• CAP. 2: PRUEBA DE HIPÓTESIS (6h)
• CAP. 3: ANÁLISIS DE VARIANZA (ANOVA) (6h)
• CAP. 4: EXPERIMENTACIÓN (12)
CAP. 2: PRUEBA DE HIPÓTESIS
2.1. Introducción: Conceptos, Nivel de confianza y nivel de
significación, Estadística de prueba y p-valor.
2.2. Prueba de bondad de ajuste.
2.2.1. Chi-sq test, KS test y otros.
2.2.2. Gráficas de normalidad.
2.3. Pruebas de hipótesis de un parámetro.
2.4. Pruebas de hipótesis para diferencia de medias.
2.3.1. Prueba de hipótesis para muestras independientes.
2.3.2. Pruebas de hipótesis para muestras pareadas
2.5. Prueba de razón de varianzas.
2.6. Pruebas de hipótesis no paramétricas.
Introducción
Pruebas de Hipótesis
Consideremos una variable aleatoria 𝑿 cuya función de distribución 𝑭𝑿 depende de un
parámetro (o vector de parámetros) 𝜽. Denotado por: 𝑿~𝜽.
Una hipótesis (estadística) es cualquier enunciado,
afirmación o conjetura que podamos hacer con respecto a la
v.a. 𝑋~𝜃

En general, estos enunciados pueden ser en relación a:


 La forma de 𝑭𝑿 (pruebas de bondad de ajuste)
 𝜽 (hipótesis paramétricas),
 otras relaciones basadas en la interrelación de 𝑿 con otras v.a's.
Ejemplo
ATENCION AL CLIENTE
𝑯𝟎 : El tiempo medio de atención a un cliente en el módulo de información es de 2,8 minutos.
𝑯1 : El tiempo medio de atención a un cliente en el módulo de información es de más de 2,8 minutos.
Notación:
𝑯𝟎 : 𝜇 = 2.8 minutos
𝑯1 : 𝜇 > 2.8 minutos

VOTACIÓN
𝑯𝟎 : El porcentaje de personas que votará por un candidato es de al menos 50%.
𝑯1 : El porcentaje de personas que votará por un candidato es menor al 50%.
Notación:
𝑯𝟎 : 𝑝 ≥ 0.5
𝑯1 : 𝑝 < 0.5
Prueba de hipótesis
Una hipótesis (estadística) es cualquier enunciado, afirmación o conjetura que podamos
hacer con respecto a la v.a. 𝑋~𝜃

• Hipótesis Nula: 𝑯𝟎
• Es una conjetura. No podemos probar esta afirmacion.
• La afirmación que mantenemos por defecto.
• Solo puede ser rechazada por los datos.
• Hipótesis Alternativa: 𝑯𝟏
• Es la conjetura que quieres probar.
• Es una afirmación que vamos a aceptar si rechazamos 𝑯0
• Hipotesis de investigación.
Prueba de hipótesis
• Nivel de confianza: C = 1- 𝜶
¿Cuan seguros estamos de nuestra decisión?
Usualmente 90%, 95%, 99%.

• Nivel de significancia: 𝜶

𝜶 = 𝟏 − 𝑪 = 𝑷𝒓𝒐𝒃(𝑹𝒆𝒄𝒉𝒂𝒛𝒂𝒓 𝑯𝟎 /𝑯𝟎 𝒆𝒔 verdadero)

Usualmente 1%, 5%, 10%


Esperamos tener baja probabilidadad de rechazar 𝑯𝟎 si 𝑯𝟎 fuera
verdadero.
Prueba de hipótesis • Estadístico de prueba:
Ejemplo: Atención a un cliente en el módulo de • Calculado a partir de la muestra.
información.
𝑯𝟎 : 𝜇 = 2.8 minutos
• Asumiendo 𝑯𝟎 .
𝑯1 : 𝜇 > 2.8 minutos • Se utiliza para decidir.
• Valor Critico
• Separa la región de rechazo.
𝑋 = 2.85
n=100 • Se escoge según el nivel de
𝑋=3 significancia escogido.
• Estadísticamente significativo
𝑋=6
• Si el resultado esta en la región
¿Cómo decidimos de manera objetiva a de rechazo.
partir de dónde rechazar 𝑯𝟎 ?

Utilizando un estadístico de prueba, y fijar un


valor crítico para la región de rechazo.
Prueba de hipótesis
Asumiendo 𝑯𝟎 , el estadístico de prueba
Estadístico de prueba sigue una distribución conocida.
• Estadístico calculado a partir de la A dos colas
muestra. (Asumiendo 𝑯𝟎 )
• Su distribución se conoce a priori.
Valor crítico 0.025 0.025
• Define la región de rechazo.
• Según el nivel de significancia(𝜶), se
define este punto de corte. La region de rechazo está definida
segun el nivel de significancia
elegido. Ejemplo=0.05

A una cola

0.05
Prueba de hipótesis
𝑯𝒐 : 𝝁𝒙 ≤ 𝟎
p-valor 𝑯𝟏 : 𝝁𝒙 > 𝟎

Es la probabilidad de que el estadístico de


prueba, bajo 𝐻0 , sea mayor que el valor
obtenido por el estadístico de prueba
evaluado en la muestra.
p-valor

𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 𝑃(𝑍 > 𝑍0 / 𝐻0) 𝒁𝟎


Estadístico de
prueba calculado
Probabilidad de obtener un resultado igual o
peor al que se obtuvo. 𝑷𝑽𝒂𝒍𝒐𝒓 𝒁𝒐 = 𝑷𝒓𝒐𝒃 𝒁 ≥ 𝒁𝒐
Prueba de hipótesis
Decisión: 2 opciones
1. Usando el estadístico de prueba calculado y el valor crítico
Depende de la prueba.
A dos colas: |𝒁𝟎 | > 𝒁𝑪𝒓𝒊𝒕
A una cola: 𝒁𝟎 > 𝒁𝑪𝒓𝒊𝒕 ó
𝒁𝟎 > 𝒁𝑪𝒓𝒊𝒕
2. Usando el p-valor
p-valor < 0.05 Se rechaza 𝑯𝒐
¿Qué tipos de errores podemos encontrar?

Decisión basada en la prueba


La realidad
Rechazar H0 No rechazar H0

Error Decisión
H0 cierta
tipo I correcta

Decisión Error
H0 falsa
correcta tipo II
Tipos de errores Decisión basada en la muestra
La realidad
Rechazar H0 No rechazar H0
Error Decisión
H0 cierta
tipo I correcta
Error tipo 1
Decisión Error
H0 falsa
correcta tipo II

La probabilidad de cometer el error tipo I se denota por 𝜶 se denomina nivel de


significación de la prueba y se define como:

𝛼 = 𝑃(𝑹𝒆𝒄𝒉𝒂𝒛𝒂𝒓 𝑯𝟎 / 𝐻0 𝑒𝑠 𝑐𝑖𝑒𝑟𝑡𝑎)

El valor de 𝜶 es fijado por la persona que realiza la investigación, por lo general, en


0.01; 0.05 o 0.10.
Nivel de confianza: C = 1- 𝜶
Tipos de errores Decisión basada en la muestra
La realidad
Rechazar H0 No rechazar H0
Error Decisión
H0 cierta
tipo I correcta
Error tipo 2
Decisión Error
H0 falsa
correcta tipo II

La probabilidad de cometer el error tipo II se denota 𝜷 y se define como:

𝛽 = 𝑃(𝐍𝐨 𝐑𝐞𝐜𝐡𝐚𝐳𝐚𝐫 𝐇𝟎 / 𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎)

Si se reduce la probabilidad de cometer uno de los errores, la probabilidad de


cometer el otro error crece (manteniendo todo lo demás constante).

Potencia de una prueba: C = 1- 𝜷


Potencia de la prueba
Potencia de una prueba

La potencia de la prueba es la probabilidad de tomar la decisión acertada de


rechazar 𝑯𝟎 cuando 𝑯𝟎 es falsa (o aceptar 𝑯𝟏 cuando 𝑯𝟏 es verdadera).
La potencia de una prueba es:

(1 − ) = 𝑃(𝐑𝐞𝐜𝐡𝐚𝐳𝐚𝐫 𝐇𝟎/𝐇𝟎 𝐞𝐬 𝐟𝐚𝐥𝐬𝐚)


Ejemplo
Una persona es juzgada por cierto delito y podría ser condenada a ir a la cárcel,
plantee este problema como una prueba de hipótesis e indique cuál de los dos
errores tendría peor consecuencia si se comete.
𝐻0: La persona es inocente
𝐻1: La persona es culpable

𝛼 = 𝑃 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 /𝐻0 𝑒𝑠 𝑐𝑖𝑒𝑟𝑡𝑎 = P(Culpar a la persona cuando es inocente)

𝛽 = 𝑃(𝑁𝑜 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 / 𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎) = P(Absolver a la persona cuando es culpable)

1−𝛽 = 𝑃(𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 / 𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎) = 𝑃(Culpar a la persona cuando es culpable)


CAP. 2: PRUEBA DE HIPÓTESIS
2.1. Introducción: Conceptos, Nivel de confianza y nivel de significación,
Estadística de prueba y p-valor.
2.2. Pruebas de bondad de ajuste.
2.2.1. Chi-sq test, KS test y otros.
2.2.2. Gráficas de normalidad.
2.3. Pruebas de hipótesis de un parámetro.
2.4. Pruebas de hipótesis para diferencia de medias.
2.3.1. Prueba de hipótesis para muestras independientes.
2.3.2. Pruebas de hipótesis para muestras pareadas
2.5. Prueba de razón de varianzas.
2.6. Pruebas de hipótesis no paramétricas.
Prueba de hipótesis para
Bondad de Ajuste

¿Cuan bueno es el ajuste de mis datos a una distribución teórica?


P. de hipótesis para bondad de Ajuste
• Una prueba para determinar si la variable que
¿Para que nos sirve?
observamos se ajusta o no a una distribución
teórica.
• Formulamos la siguiente hipótesis:
𝑯𝟎 : 𝑭𝑿 = 𝑭𝟎 vs Verificar supuestos
𝑯𝟏 : 𝑭𝑿 ≠ 𝑭𝟎 de un modelo
estadístico.
𝐹0 es una función de distribución conocida.
Ejemplo: Distribución Normal.
P. de hipótesis para bondad de Ajuste
2
Chi-Cuadrado (𝜒 ) Frecuencia Frecuencia
Intervalo Observada Esperada

Hipótesis: Clase 1 𝑂1 𝐸1
𝑯𝟎 : 𝑭𝑿 = 𝑭𝟎
𝑯𝟏 : 𝑭𝑿 ≠ 𝑭𝟎 Clase 2 𝑂2 𝐸2

Clase 3 𝑂3 𝐸3
Estadístico de prueba:
… … …

Clase k 𝑂𝑘 𝐸𝑘

𝐸𝑖0 ∶ es la frecuencia esperada bajo 𝐻0


en la clase i

Región de Rechazo
Estadístico de 2
prueba calculado
𝑈0 > 𝜒𝛼,𝑔𝑙 Valor crítico

Nota: Para variables aleatorias discretas y se puede utilizar


con v.a. continuas si se categorizan. 2
𝜒0.95,3 = 11.1
P. de hipótesis para bondad de Ajuste
Kolmogorov Smirnov (KS test)
Hipótesis: 𝑯𝟎 : 𝑭𝑿 = 𝑭𝟎 • Solo para distribuciones continuas
𝑯𝟏 : 𝑭𝑿 ≠ 𝑭𝟎 • Los parámetros de las distribución son
estimados con la muestra.
Estadístico de prueba:

El estadístico es la distancia máxima entre la


distribución acumulada de la muestra y de la
distribución que se compara.

Nota: Solo para variables aleatorias continuas.


2
𝜒0.95,3 = 11.1
Gráficos de normalidad
• Gráfica de probabilidad Normal - utilizada para
contrastar la normalidad de un conjunto de
datos.
• Es un diagrama de dispersión de los datos
observados contra los datos que se obtendrían Z-score de
los datos
en una distribución normal teórica.
• Compara gráficamente si la distribución
empírica de una muestra de datos es
aproximada a una distribución normal.
Quantiles de la distribución normal(0,1)
• Si la distribución de la variable es normal, los
puntos quedarán cerca de una línea recta. Es
frecuente observar una mayor variabilidad
(separación) en los extremos.
Graficos de normalidad
Para construir el gráfico de probabilidad normal
para un conjunto de datos 𝑥1 , 𝑥2 , … , 𝑥𝑛 , se
representan:
• Eje vertical: valores ordenados de los datos
𝑥 1 ,𝑥 2 ,…,𝑥 𝑛 .
Z-score de
• Eje horizontal: valor esperado del 𝑖 -ésimo los datos

estadístico de orden de una distribución


normal.
• Los puntos son dados por:
𝑖 Quantiles de la distribución normal(0,1)
𝑥𝑖 , Φ−1
𝑛+1
Ejemplo
Utilizando los datos del experimento sobre el escritura en un Samsun o en un
iPhone, veremos si es posible asumir una distribución normal para la variable
PPM (Palabras por minuto). Usaremos un nivel de significación: 𝛼 = 0.05
Exploración gráfica:

hist(misdatos$PPM,xlab="PPM: Palabras por minuto", main= "Histograma de PPM")


> qqnorm(misdatos$PPM)
Ejemplo
Utilizando los datos del experimento sobre escritura en un teclado Galaxy y un teclado
iPhone, veremos si es posible asumir una distribución normal para la variable PPM
(Palabras por minuto). Usaremos un nivel de significación: 𝛼 = 0.05
1. Definir las hipótesis:
3. Valor crítico
𝑯𝟎 : La distribución de la variable PPM sigue
una distribución normal
𝑯𝟏 : La distribución de la variable PPM no sigue
una distribución normal

𝑯𝟎 : 𝑭 𝑿 = 𝑭 𝟎
𝑯𝟏 : 𝑭 𝑿 ≠ 𝑭 𝟎

2. Calculo del estadístico 2


𝜒0.95,8 = 15.5
4. Decisión: 2 opciones:
𝑼𝟎 : 34.58
* Estadístico de prueba vs. Valor crítico
* P-valor
Ejemplo
Utilizando los datos del experimento sobre escritura en un teclado Galaxy y un teclado
iPhone, veremos si es posible asumir una distribución normal para la variable PPM
(Palabras por minuto). Usaremos un nivel de significación: 𝛼 = 0.05
En R (Prueba Chi-cuadrado para bondad de ajuste):

> chicuadrado_test <- chisq.test(freq.observada, p=prop.esperada, rescale.p=TRUE, simulate.p.value = T)


> chicuadrado_test

Chi-squared test for given probabilities with simulated p-value (based on 2000
replicates)

data: freq.observada
X-squared = 34.583, df = NA, p-value = 0.0004998
Ejemplo
Utilizando los datos del experimento sobre escritura en un teclado Galaxy y un teclado
iPhone, veremos si es posible asumir una distribución normal para la variable PPM
(Palabras por minuto). Usaremos un nivel de significación: 𝛼 = 0.05
En R (Prueba KS):

 kstest <- ks.test(misdatos$PPM, pnorm)


 kstest

One-sample Kolmogorov-Smirnov test

data: misdatos$PPM
D = 1, p-value = 4.441e-16
alternative hypothesis: two-sided

Uno de los argumentos es pnorm ya que estamos comparando la distribución con una normal.
Para otras distribuciones, buscar la función que devuelve la fx. distribución que se quiere probar.
Por ejemplo: pchisq (chi cuadrado), pt (t-student), plnorm (log normal).
Ejemplo
Utilizando los datos del experimento sobre escritura en un teclado Galaxy y un teclado
iPhone, veremos si es posible asumir una distribución normal para la variable PPM
(Palabras por minuto). Usaremos un nivel de significación: 𝛼 = 0.05
En R (Otras pruebas):

 Shapirotest <- shapiro.test (misdatos$PPM)


 Shapirotest

Shapiro-Wilk normality test

data: misdatos$PPM
W = 0.85077, p-value = 5.303e-07

Uno de los argumentos es pnorm ya que estamos comparando la distribución con una normal.
Para otras distribuciones, buscar la función que devuelve la fx. distribución que se quiere probar.
Por ejemplo: pchisq (chi cuadrado), pt (t-student), plnorm (log normal).
Ejercicio
Utilizando los datos del experimento sobre escritura en un teclado Galaxy y un teclado iPhone,
uutilice una prueba de bondad de ajuste para probar si la variable TasaError (La tasa de error al
escribir con los teclados de Samsung y iphone) tiene distribución normal. Usaremos un nivel de
significación: 𝛼 = 0.05

1. ¿Cuál es la conclusion despues de llevar a cabo una prueba de bondad de ajuste para la variable
TasaError?

2. Ahora pruebe la normalidad para la variable TasaError en los teclados “iPhone”. En este caso
¿cuál sería la conclusión?.
Lo que hemos visto hasta ahora…
Pruebas de bondad Test KS o Test de Shapiro
Chi cuadrado
de ajuste Kolgomorov-Smirnov Wilks

Pruebas sobre un prop-test


Z-test t-test Wilcoxon
parámetro

t-test
var.equal=T U-Mann Withney
Muestras Z-test
Var.equal=T
t-test
independientes
Pruebas sobre dos var.equal=F
parámetros
Muestras d-test U-Mann Withney
dependientes Var.equal=F

Muestras ANOVA Kruskall-Wallis


Pruebas sobre más independientes
de dos parámetros
Muestras
ANOVA Friedman
dependientes
Bloques aleatorios

Das könnte Ihnen auch gefallen