Beruflich Dokumente
Kultur Dokumente
Jimmy Corzo
(Dr.rer.nat)
Profesor Asociado
Departamento de Estadı́stica
Facultad de Ciencias
Universidad Nacional de Colombia
23 de febrero de 2018
Se mide por
la potencia de la prueba que es la probabilidad de rechazar
la hipótesis cuando es falsa. Tomar una decisión correcta.
Coloquialmente: ”la probabilidad de rechazar mentiras”
1 − P(rechazar H0 cuando es falsa)
el nivel de significancia que es la probabilidad de aceptar la
hipótesis cuando es falsa. Tomar una decisión incorrecta. Error
tipo I:
Coloquialmente ”la probabilidad de aceptar mentiras”
Se mide por
la potencia de la prueba que es la probabilidad de rechazar
la hipótesis cuando es falsa. Tomar una decisión correcta.
Coloquialmente: ”la probabilidad de rechazar mentiras”
1 − P(rechazar H0 cuando es falsa)
el nivel de significancia que es la probabilidad de aceptar la
hipótesis cuando es falsa. Tomar una decisión incorrecta. Error
tipo I:
Coloquialmente ”la probabilidad de aceptar mentiras”
H0 Cierta Falsa
Acepta OK Error tipo II
Rechaza Error tipo I Potencia de la prueba
Por ejemplo,
• rachas de buena (mala) suerte refiriéndose a situaciones
repetidas en las que las cosas funcionan bien (mal) durante algún
perı́odo de tiempo.
• racha exitosa de un equipo cuando gana varios partidos seguidos.
• los periodistas suelen decir que el dollar “subió” o “bajó” en el
dı́a
0000000000011111111110000011111000011000111010
00000000000
| {z } 1111111111
| {z } 00000
| {z } 11111
| {z } 0000 11 |{z}
|{z} |{z} 000 |{z}
111 |{z}
0 |{z}
1 |{z}
0 .
racha1 racha1 racha2 racha11
H0 : η1 , . . . , ηn son independientes
m−1 n−1
2 r /2−1 r /2−1
cuando r es par
m+n
m
P(R = r ) =
m−1 n−1 m−1 n−1
(r −1)/2 (r −3)/2 + (r −3)/2 (r −1)/2
m+n
cuando r es impar
m
2mn 2mn(2mn − m − n)
E (R) = 1 + y V (R) = . (1)
m+n (m + n)2 (m + n − 1)
Ejemplo
En un conocido noticiero se reportó la siguiente sucesión de alzas
(1) y bajas (0) de la TRM durante el mes de enero de de 2010:
0 0 0 1 1 1 1 1 0 0 0 1 0 0 1
0 0 0 1 0 0 0 0 0 1 0 0 0 1 0
13 − E (R)
z= p = −0,5599228
V (R)
Calculos en R:
runs.test(x, ”left.sided”, plot = T, threshold = 0.5) de R se obtiene
Información requerida:
Muestra aleatoria X1 , . . . , Xn de una distribución continua F con
mediana cero. Hipótesis de interés:
Calculos en R:
symmetry.test(xN, boot = F)
que produce los siguientes resultados
Symmetry test by Miao, Gel, and Gastwirth (2006)
data: xN¿
Test statistic = 0.25862, p-value = 0.7959
alternative hypothesis: the distribution is asymmetric.
Por o tanto No se rechaza la hipótesis de simetrı́a como era de
esperar dado que las observaciones provienen de una distribución
normal.
Calculos en R:
symmetry.test(xL, boot = F)
que produce los siguientes resultados:
Información requerida:
Observaciones independientes X1 , . . . , Xn de una distribución
continua F
EL interés es averiguar si F tiene la forma de alguna F0 conocida:
0 x < X(1)
k
Fn (x) = X(k) ≤ x < X(k+1) para k = 1, 2, . . . , n − 1 (2)
n
x ≥ X(n)
1
donde X(1) < X(2) < · · · < X(n) son las observaciones ordenadas en
forma ascendente.
Estadı́sticas de prueba:
Dn = máx|F0 (x) − Fn (x)| para la alternativa K1
x∈<
Dn es la mayor distancia vertical entre F0 (x) y Fn (x).
Ejemplo
Para un estudio del consumo de gasolina de vehı́culos particulares,
se dispone de una muestra de 10 vehı́culos a los que se hicieron
mediciones del consumo en litros por cada 100 km. Se quiere saber
si los datos se ajustan a una distribución Normal de media 12 y
varianza 1.
0 para v ≤ 0
1 R
1/2n+v R 3/2n+v R 2n−1/2n+v
P(Dn < + v) = 1/2n−v 3/2n−v · · · 2n−1/2n−v f (u)du para 0 <
2n
1 para v ≥ 2n−1
2n
Xi − X̄
Zi = , i = 1, . . . n
S
donde X̄ y S son la media y la desviación estándar de las
observaciones originales. Los valores crı́ticos se encuentran en la
tabla O del libro de Gibbons.
H0 : θ = 0 (3)
K1 : θ > 0, o K2 : θ < 0, o K3 : θ 6= 0.
N
X
S = # {Xi > 0} = s(Xi )
i=1
Ejemplo
Sea θ la mediana poblacional del ángulo de error. Cuando las
palomas no regresan a la casa este ángulo es θ = 90o . Una
hipótesis de interés consiste en suponer que las aves navegan
usando el sol y que esto implica que θ < 90o . Entonces se
construye una prueba para la hipótesis H : θ = 90o contra la
alternativa K1 : θ < 90o . Si se rechaza la hipótesis nula, se podrá
concluir que las palomas regresarán a la casa.
Ejemplo: (Cont)
Los datos son los siguientes:
Calculos en R:
Construir un vector con los datos
x.palomas=c(6, 7, 9, 17, 18, 18, 22, 28, 32, 35, 36, 42, 42, 42, 48,
48, 51, 52, 53, 55, 56, 57, 58, 63, 72, 83, 91, 97)
Calcular el número de éxitos
for (i in 1:28) {
if (x.palomas[i]> 90) s[i]=1 else s[i]=0
}
S=sum(s)
Calculos en R:
binom.test(S,28,0.5, ”less”)
que produce el siguiente resultado
Exact binomial test
data: S and 28
number of successes = 2, number of trials = 28, p-value =
1.516e-06
alternative hypothesis: true probability of success is less than 0.5
95 percent confidence interval:
0.0000000 0.2082047
sample estimates:
probability of success
Comentario final
Modelo de muestreo
Muestra aleatoria: X1 , · · · , XN , cada v.a. con función de
distribución F (x − θ), simétrica. Entonces θ es la única mediana (y
la media, cuando existe) y se encuentra en el centro de la
distribución.
H0 : θ = 0 (4)
frente a alguna de las siguientes alternativas
K1 : θ > 0, o K2 : θ < 0, o K3 : θ 6= 0.
La estadistica de Wilcoxon es la suma de los rangos de las
observaciones positivas T que se calcula como sigue:
|Xi | = |X |(R + )
i
|XDi | = |X |(j) .
donde
1 Xi > 0
s(Xi ) =
0 Xi ≤ 0
Ejemplo
Rosenzweig et al. (1972) reportan experimentos realizados para
determinar la influencia del medio ambiente en la anatomı́a del
cerebroa . En experimentos recientes se han asignado aleatoriamente
tres ratones de cada una de doce camadas para permanecer en
jaulas estándar de laboratorio: una enriquecida con varios juguetes
y otra empobrecida, donde los ratones permanecen aislados.
a
Tomado de Hettmansperger (1984).
Ejemplo, Cont.
Se hacen observaciones de medidas, como el peso del cerebro, la
actividad enzimática y el peso de la corteza cerebral. Para este
caso se utilizará la medida de la ganancia en peso de la corteza
durante un perı́odo especı́fico para 12 ratones de cada jaula. Si se
comparan los ratones de un entorno empobrecido con los de un
entorno enriquecido se tiene un experimento pareado, donde los
pares se arman de manera natural con ratones que pertenecen a la
misma camada y tienen la misma configuración genética.
Ejemplo, Cont.
Sean X y Y las medidas del peso de la corteza cerebral en el
entorno empobrecido y en el entorno enriquecido, respectivamente.
Entonces la variable aleatoria de interés es la diferencia
D = Y − X . Los investigadores justifican que D tiene distribución
simétrica alrededor de 0 (en caso de duda, se puede verificar el
supuesto de simetrı́a con alguna prueba no paramétrica adecuada).
Denotando por θ el la mediana de la distribución de D, el
experimento produce 12 observaciones D1 , · · · , D12 , para la prueba
de la hipótesis H0 : θ = 0 versus K1 : θ > 0.
Pares
No de ratón Enriquecido (Y ) Empobrecido (X ) Diferencia
1 689 657 32
2 663 646 17
3 653 642 11
4 740 650 90
5 699 698 1
6 690 621 69
7 685 647 38
8 718 689 29
9 742 652 90
Pares
No de ratón Enriquecido (Y ) Empobrecido (X ) Diferencia
10 651 661 −10
|{z}
11 687 612 75
12 679 678 1
Calculos en R:
library(MASS) # load the MASS package
setwd(”C:/Users/JACS/Google Drive/NPar 2018/CodigoR”)
library(openxlsx)
CoCe< −read.xlsx(”CortezaCerebral.xlsx”, sheet = 1)
Calculos en R:
wilcox.test(CoCeEnrriquecido, CoCeEmpobrecido, paired = T,
exact = F)
que produce el resultado:
Wilcoxon signed rank test with continuity correction
data: CoCe$Enrriquecido and CoCe$Empobrecido
V = 75, p-value = 0.00532
alternative hypothesis: true location shift is not equal to 0
Ejemplo
Considérese el conjunto de datos: −2,1; −1,2; −0,5; 1,2; 2,2, en
el cual el valor 1.2 está positivo y negativo, es decir está empatada
una observación positiva con una negativa.
Los valores absolutos ordenados son: 0,5; 1,2; 1,2; 2,1; 2,2, donde
los datos subrayados distinguen las observaciones negativas.