Beruflich Dokumente
Kultur Dokumente
PROBABILIDAD Y ESTADÍSTICA
CONTENIDOS
1
Pruebas de Hipótesis
INFERENCIA ESTADÍSTICA
Parámetros de la distribución
Forma de la distribución
Asociadas a una o más poblaciones
Ejemplos:
La edad media de los alumnos del curso es de 22 años.
El consumo anual de combustible por habitante que en la década del 90 era de 150
Ktep ha sufrido un incremento significativo en los últimos años.
2
Hipótesis acerca de los parámetros de una población:
Caso 1
H0: θ = θ1 Hipótesis nula
Hipótesis puntuales o simples
H1: θ = θ2 Hipótesis alternativa
Caso 5 Caso 6
H0: θ θ0 H0: θ θ0
Hipótesis compuestas
H1: θ < θ0 H1: θ > θ0
Consideraciones importantes:
3
Prueba de hipótesis:
Población X1
Ho: μ = 15
X2
H1: μ ≠ 15 .
.
.
Xi
. X1
. .
. . Muestra
.
XN Xn
Bilaterales
Pruebas
7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
Variable Unilaterales
10 11 12 13 14 15 16 17 18 19 20
x
x obs x obs x obs
RECHAZO NO RECHAZO RECHAZO
4
Tipos de error:
Ho es Verdadera Ho es Falsa
DECISIÓN
Rechazo H0 ErrorError
de Tipo I Decisión correcta
Ho: μ = μ1
H1: μ = μ2
1 x crit 2
5
JUICIO
PRESUNCION
= VEREDICTO =
DECISION 2 DECISION 1
H0 H1
Plantear H0 y H1
6
Pruebas de Hipótesis
I) Paramétricas
A) relacionadas a una única población
II) No paramétricas
C) ajuste de modelos de distribución de probabilidades
D) independencia
7
A. Pruebas sobre una sola muestra
8
f. Regiones de rechazo:
h. Conclusión:
Comentarios:
* P-value de un estadístico de prueba observado es la probabilidad de que la
VA estadístico de prueba tome un valor al menos tan extremo como el
observado dado que la hipótesis nula es verdadera.
9
A2. Pruebas de hipótesis acerca de la media de una distribución
normal con variancia desconocida
x 0
t0 Con t0 ~ t(n-1)
s
n
Se conoce que los errores de medición de este método tienen distribución normal
b. Información:
VA distribución normal n=7 x obs 11,429 s 2 1 ,8 6 9
c. Planteo H0 y H1
H0: = 10
H1: ≠ 10
10
f. Regiones de rechazo:
-3 -2 -1 0 1 2 3
tobs = 2,765
h. Conclusión:
( n 1) s 2 Con 0 ~ 2 (n-1)
2
02
02
11
Problema: Sobre el mismo método de detección de plaguicida se quiere
comprobar si cumple con las especificaciones de precisión (ya vimos que no
era exacto). Se tolera hasta un desvío estándar de 1,25 mg/kg. Mayor
variabilidad indicaría una pérdida de precisión incompatible con las las
normativas internacionales.
12,6
h - p0
H0: p = p0 Z0
p0 .(1-p0 ) Con Z0 ~ N(0;1)
H1: p ≠ po
n
x n . p0
Z0
n . p 0 . (1 p 0 )
12
B. Pruebas sobre dos muestras
H 0 : 12 22 12
H0 : 1
H 1 : 12 22 22
13
1,6
de Distribución F-Snedecor:
1,2
1,0
2
s1
0,8
s 22 0,4
0,2
F(5,5)
F(12,12)
0,0 F(50,50)
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0
6 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46 5.37 5.27 5.17 5.12 5.07 5.01 4.96 4.90 4.85
7 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76 4.67 4.57 4.47 4.42 4.36 4.31 4.25 4.20 4.14
8 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30 4.20 4.10 4.00 3.95 3.89 3.84 3.78 3.73 3.67
9 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96 3.87 3.77 3.67 3.61 3.56 3.51 3.45 3.39 3.33
10 6.94 5,46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72 3.62 3.52 3.42 3.37 3.31 3.26 3.20 3.14 3.08
11 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53 3.43 3.33 3.23 3.17 3.12 3.06 3.00 2.94 2.88
12 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37 3.28 3.18 3.07 3.02 2.96 2.91 2.85 2.79 2.72
13 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31 3.25 3.15 3.05 2.95 2.89 2.84 2.78 2.72 2.66 2.60
14 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15 3.05 2.95 2.84 2.79 2.73 2.67 2.61 2.55 2.49
15 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06 2.96 2.86 2.76 2.70 2.64 2.59 2.52 2.46 2.40
16 6.12 4,69 4.08 3.73 3.50 3.34 3.22 3.12 3.05 2.94 2.89 2.79 2.68 2.63 2.57 2.51 2.45 2.38 2.32
17 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06 2.98 2.92 2.82 2.72 2.62 2.56 2.50 2.44 2.38 2.32 2.25
18 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93 2.87 2.77 2.67 2.56 2.50 2.44 2.38 2.32 2.26 2.19
19 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96 2.88 2.82 2.72 2.62 2.51 2.45 2.39 2.33 2.27 2.20 2.13
20 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2-77 2.68 2.57 2.46 2.41 2.35 2.29 2.22 2.16 2.09
21 5.83 4.42 3.82 3.48 3.25 3.09 2.97 2.87 2.80 2.73 2.64 2.53 2.42 2.37 2.31 2.25 2.18 2.11 2.04
22 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84 2.76 2.70 2.60 2.50 2.39 2.33 2.27 2.21 2.14 2.08 2.00
23 5.75 4.35 3.75 3.41 3.18 3.02 2.90 2.81 2.73 2.67 2.57 2.47 2.36 2.30 2.24 2.18 2.11 2.04 1.97
24 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64 2.54 2.44 2.33 2.27 2.21 2.15 2.08 2.01 1.94
14
B2. Pruebas de hipótesis sobre las medias de dos distribuciones
normales con variancias conocidas (muestras independientes)
Ho: μ1 = μ2 Ho: μ1 - μ2 = 0
H1: μ1 ≠ μ2 H1: μ1 - μ2 ≠ 0
X1 X2
μ1 ? μ2 ?
12 22
n1 n2
x1 x2
22
2 ; 1
2
X 1 X 2 ~ N 2
n1 n 2
Bajo H0:
X1 X 2
Z0
12 22 Con Z0 ~ N(0;1)
n1 n2
Se rechazará H0 si:
15
B3. Pruebas de hipótesis sobre las medias de dos distribuciones
normales con variancias desconocidas
Este caso, al igual que el visto sobre hipótesis para una media con varianza
desconocida, es el que usualmente debemos resolver.
Situación 1: 12 22 2
Dado que las varianzas se estiman de las muestras, antes de calcular el
estadístico de prueba para las medias, debemos verificar mediante una
Prueba F la igualdad de las varianzas poblacionales
x1 x2
t0 Con t0 ~ t(n1+n2-2)
1 1
sp
n1 n2
Ho: μ1 = μ2
H1: μ1 ≠ μ2
Se rechazará H0 si:
16
Situación 2: 12 22
Si la homocedasticidad no es sustentable, no hay un estadístico de prueba
exacto disponible para Ho: μ1 = μ2 , sin embargo el estadístico:
x1 x 2
t 0*
s12 s22
n1 n2
Se distribuye aproximadamente como t con grados de libertad, donde :
2
s 12 s2
1
n1 n2
2
2 2
(s1 / n1 ) ( s 22 / n 2 ) 2
n1 1 n2 1
17
Sorteo técnica A y B
H0: μd = 0
H1: μd ≠ 0
d
t0 Con t0 ~ t(n-1)
sd
n
La comparación de medias dependientes surge de un muestreo que se realizó
con restricciones en la aleatorización, esto constituye el paso elemental en un
diseño experimental en el que las unidades experimentales no son
homogéneas (DBCA)
18
Ejemplo 2: considere ahora que la comparación de las dos técnicas la queremos
hacer sobre residuos en manzanas. Para ello deberíamos extraer en forma
aleatoria dos muestras de n manzanas y en cada una de ellas aplicar el método
y determinar el contenido de pesticida. Ahora bien no contamos con un lote
homogéneo de 2n manzanas ya que las manzanas pueden tener un valor de
depósito de plaguicida muy heterogéneo. Como podríamos evitar que este efecto
‘depósito inicial’ se pueda confundir con el efecto ‘método’ ?
H0: p1 = p2 H0: p1 - p2 = 0
H1: p1 ≠ p2 H1: p1 - p2 ≠ 0
h1 h2
Z0
1 1
h.(1 h).
n1 n2
x1 x 2
h
n1 n 2
19
Relación entre Prueba de Hipótesis e intervalo de confianza:
X1
Ejemplo: Ho: μ = 15 Población
X2
H1: μ ≠ 15 .
.
.
Xi
. X1
. .
. .
. Muestra
XN
Xn
Otro Ejemplo:
H1: pM ≠ pP
Si li(pM - pP) = [-0,027;-0,018] Rechazo Ho
Si li(pM - pP) = [-0,014;0,021] No Rechazo Ho
20
También la igualdad de dos medias, variancias o proporciones poblacionales se
puede comprobar realizando intervalos de confianza a partir de las estimaciones
muestrales de los mismos.
H1: pM ≠ pP
Si li(pM ) = [0,24;0,27] y li(pP) = [0,26;0,30]
No Rechazo Ho !!!!!!!!!!
No hay evidencia suficiente para decir que la proporción de
daño es diferente en manzana y pera
| | | | | | | | | | | |
0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30 0,31 0,32 0,33 0,34
| | | | | | | | | | | |
0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30 0,31 0,32 0,33 0,34
21
II. Pruebas de hipótesis no-paramétricas
i fobservado fesperado
2
f i ˆf i o i ei
2
k k
1 f1 f1
2 2
2 f2 f2 ˆf i 1 ei
i 1 i
3 f3 f3
. . .
. . .
o i2 k
. . . Fórmula de cálculo
2
n
. .
. i 1 e i
k fk fk
1 97 100 1 36 100 1 8 10
4 99 100 4 94 100 4 9 10
o i ei
2
k
2
Mide discrepancia entre columna fiobs y fiesp
i 1 ei
22
Pearson estudió la distribución teórica bajo Ho verdadera, algunas características
son:
o ei 0 , 5
2
k
2 i
i 1 ei
Ejemplos de hipótesis:
Ho: ‘un dado determinado no está cargado’
23
Ejemplo ajuste distribución discreta
Ho: X Possion
X fob pesp fesp
x1 f1 p1 f1
x2 f2 p2
f2 pesp = P(X=xi / X Possion)
x3 f3 p3 f3
. . . .
f̂i = pesp . N
. . . .
. . . .
. . . .
2Pearson 2(k-1-p)
xk fk pk fk
X fi Fi hi Hi
Ho: X Normal
24
33%
30%
28,57%
29%
25%
24%
21,43% 21,43%
20%
19,05%
19%
hi
15%
14%
10%
10%
5% 4,76%
5%
2,38% 2,38%
0%
0%
30 35 40 45 50 55 60 65 70
X
X fi hi pi / xN fiesp
x 49, 72
-x<35 1 0,0238
40<x<45 8 0,1905
n = 42
45<x<50 9 0,2143
60<x<+ 1 0,0238
50 49,72 55 49,72
P(50<X <55) P Z
7 7
25
X fi hi pi / xN fiesp
fobs i2
k
2
n 44,98 – 42 = 2,98 Valor Crítico 2(3;0,95)=7,81
i 1 fesp i
o
Vacunados No vacunados
Muertos 8 12
Vivos 20 18
26
Secuencia de análisis
Frecuencias observadas en
Factor A cada celda por combinación
de dos niveles de factores
A1 A2 ... Aa
B1 f11 f12 ... f1a f1.
B2 f21 f22 ... f2a f2.
Factor B Marginales fila
... ... ... fij ... ...
Bb fb1 fb1 ... fba fb.
f.1 f.2 ... f.a f.. Total fila
Total columna
Marginales columna
Total General
27
A1 A2 ... Aa
B1 f11 No se
puede
mostra
r la
imagen
.
f12 ... f1a f1.
f11
=
f12
=
f1a
=…=
f1. ˆf11 f.1 f1. 2Pearson 2[(a-1).(b-1)]
f.1 f.2 f.a f.. f..
SEXO
TOTAL
Hombres Mujeres
B 25 37 62
AB 10 23 33
28
Pruebas de homogeneidad de muestras
29