Beruflich Dokumente
Kultur Dokumente
Mario A. Guevara
Departamento de Metalurgia
Universidad de Atacama
Enero 2000
Introducción
Objetivos:
Distribución de frecuencias.
--------------------------------------------------------------------------------
Lower Upper Relative Cumulative Cum. Rel.
Class Limit Limit Midpoint Frequency Frequency Frequency Frequency
--------------------------------------------------------------------------------
at or below 0.0 0 0.0000 0 0.0000
1 0.0 20.0 10.0 0 0.0000 0 0.0000
2 20.0 40.0 30.0 0 0.0000 0 0.0000
3 40.0 60.0 50.0 9 0.0596 9 0.0596
4 60.0 80.0 70.0 55 0.3642 64 0.4238
5 80.0 100.0 90.0 48 0.3179 112 0.7417
6 100.0 120.0 110.0 21 0.1391 133 0.8808
7 120.0 140.0 130.0 13 0.0861 146 0.9669
8 140.0 160.0 150.0 4 0.0265 150 0.9934
9 160.0 180.0 170.0 1 0.0066 151 1.0000
above 180.0 0 0.0000 151 1.0000
--------------------------------------------------------------------------------
Mean = 89.0 Standard deviation = 24.424
Histograma
Es un tipo especial de gráfica de barras con las
siguientes características:
En el eje horizontal se representan los posibles valores de la
variable de interés y en el eje vertical se presentan las
frecuencias.
Cada clase o intervalo de la distribución de frecuencias está
representado por una barra (rectángulo) del histograma.
Todas las barras tienen una amplitud o ancho, equivalente a
la amplitud de la clase que representan; sus extremos son los
límites reales de clase.
La altura de las barras corresponde a la frecuencia de la clase
que representan.
HISTOGRAMAS
percentage
frequency
30
40
30 20
20
10
10
0 0
0 30 60 90 120 150 180 0 30 60 90 120 150 180
horsepower horsepower
Frequency cumulative Frequency relative cumulative
160 100
80
percentage
frequency
120
60
80
40
40
20
0 0
0 30 60 90 120 150 180 0 30 60 90 120 150 180
horsepower horsepower
Polígono
percentage
frequency
30
40
30 20
20
10
10
0 0
0 30 60 90 120 150 180 0 30 60 90 120 150 180
horsepower horsepower
80
percentage
frequency
120
60
80
40
40
20
0 0
0 30 60 90 120 150 180 0 30 60 90 120 150 180
horsepower horsepower
Medidas descriptivas
x i
X i 1
(media muestreal)
n
N
x i
μ i 1
(media poblaciona l)
N
xi = mediciones
n = número de datos de la muestra
N = número de datos de la población.
La mediana
i
(x x ) 2
S2 i 1
(varianza muestreal)
n -1
N
i
(x μ) 2
σ2 i 1
(varianza poblaciona l)
N
La desviación estándar
m f
j1
j j m f
j1
j j
X k
fj
n
j1
mj = marca de clase
fj = frecuencia
Varianza (datos agrupados)
j fj
(m -
j1
x) 2
S2
n 1
mj = marca de clase
fj = frecuencia
Conteo de puntos muestrales
Ejemplo 1
¿Cuántos puntos muestrales hay en un espacio
muestral cuando se lanza un par de dados una sola
vez?.
Ejemplo 2
Se dispone de dos colectores y tres espumantes para
cierto experimento de flotación, ¿de cuántas maneras
diferentes se pueden combinar entre ellos si la mezcla
final debe contener un colector y un espumante?
Conteo de puntos muestrales
Ejemplo 3
Indique todas las permutaciones posibles entre las letras
a, b y c.
Conteo de puntos muestrales
El número de permutaciones de n objetos distintos,
tomando r a la vez, es:
n!
n Pr
(n r )!
Ejemplo 4
Indique todas las permutaciones posibles entre las letras
a, b y c, pero tomadas dos a la vez.
Ejemplo 5
Se sacan dos boletos de la lotería, entre 20 posibles, para
el primero y segundo premios. Encuentre el número de
puntos muestrales en el espacio S.
Conteo de puntos muestrales
El número de combinaciones (sin importar el orden), de
n objetos distintos, tomando r a la vez, es:
n n!
r r!(n r )!
Ejemplo 6
Indique todas las permutaciones posibles entre las letras
a, b y c, pero tomadas dos a la vez en cualquier orden.
Definiciones
1. f(x) 0.
2. f(x)
x
1.
3. P(X x) f(x) .
Definiciones (cont...)
b
3. P(a X b) f(x) dx.
a
Definiciones (cont...)
μ E(X) x f(x)
x
si X es discreta, y
μ x f(x) dx
si X es continua.
Definiciones (cont...)
si X es discreta, y
σ 2 E[(X -μ ) 2 ] (x -μ ) 2 f(x) dx
si X es continua.
Distribución Normal
x2
P(x 1 X x 2 ) n(x; μ,σ ) dx
x1
1 x2
(1/2)[(xμ )/σ ]2
e dx
2π σ x1
Distribución Normal Estándar
1 (1/ 2) x 2
n(x;0 ,1) e ; x ,
2π
Normal Distribution
0.4 Mean,Std. dev.
0,1
0.3
density
0.2
0.1
0
-5 -3 -1 1 3 5
x
Distribución Normal Estándar (Excel)
área=0.95
Z=1.645
Distribución Normal Estándar (Excel)
área=0.05
Z=-1.645
Teorema del Límite Central
X μ
Z
σ/ n
21 2 2
X1 X 2 X1 X 2 1 2 y 2
X1 X 2
n1 n2
de aquí que ,
Z
X 1
X 2 1 2
(12 / n 1 ) ( 22 / n 2 )
es aproximada mente una normal estándar
Distribución t de Student
Sea Z una variable aleatoria normal estándar y V un variable
aleatoria ji cuadrada con grados de libertad. Si Z y V son
independientes, entonces la distribución de la variable aleatoria T,
donde:
Z
T ,
V/ ν
está dada por :
(ν 1)/2
Γ [(ν 1)/2] t2
h(t) 1 , t
Γ (ν /2) πν ν
0.2
0.1
0
-7 -4 -1 2 5 8
x
Distribución t de Student (Excel)
t = DISTR.T(x,grados de libertad,colas)
(probabilidad/área).
Ej.: DISTR.T(2.821,9,2) = 0.02
x = DISTR.T.INV(probabilidad,grados de libertad)
(dos colas/punto).
Ej.: DISTR.T.INV(0.02,9) = 2.821
Inferencia estadística
Intervalo de confianza.
Pregunta: para una probabilidad dada, cuáles son los límites
inferior y superior de un parámetro estadístico de modo que el
valor verdadero de la población se encuentre dentro de estos
límites?.
Estimación de la media
σ σ
x zα /2 μ x zα /2 ,
n n
z / 2
2
n
e
Estimación de la media
alfa 0.050
z / 2
2 alfa/2 0.025
n
error
sigma
0.050
0.300
e
z (alfa/2) -1.960
n 138.292
Estimación de la media
σ 12 σ 22 σ 12 σ 22
(x 1 x 2 ) zα/2 μ 1 μ 2 (x 1 x 2 ) zα/2
n1 n 2 n1 n 2
1 1 1 1
(x 1 x 2 ) t α /2s p μ 1 μ 2 (x 1 x 2 ) t α /2s p
n1 n 2 n1 n 2
s12 s 22 s12 s 22
(x 1 x 2 ) t α /2 μ 1 μ 2 (x 1 x 2 ) t α /2
n1 n 2 n1 n 2
donde t α /2 es el valor t con,
(s12 / n 1 s 22 / n 2 ) 2
2
[(s1 / n 1 ) 2 /( n 1 1) (s 22 / n 2 ) 2 /( n 2 1)]
16.33 16.33
Observaciones pareadas
sd sp
d t α /2 μ D d t α /2 ,
n n
H0 es verdadera H0 es falsa
Se acepta H0 Decisión correcta Error tipo II
Se rechaza H0 Error tipo I Decisión correcta
Ejemplo
Se sabe que un tipo de vacuna fría es sólo 25% eficaz después de un
período de 2 años. Para probar una vacuna nueva, se seleccionan 20
personas al azar y se les inyecta esta nueva vacuna. Si más de 8 de los que
recibieron la vacuna supera el período de dos años sin contraer el virus, se
considerará un éxito la nueva vacuna. Analice las probabilidades de cometer
error tipos I y II.
Solución (i)
Solución (ii)
H0 : p=1/4
H1 : p>1/4
Solución:
H0 : u = 68
H1 : u <> 68
media 68.5
z1 -3.333
z2 1.111
beta 0.8663 P(67 X69 cuando u=68.5)
Test de hipótesis
Ejemplo anterior
p = 1 - = 1 - 0.8661 = 0.1339,
significa que en forma acertada rechaza H0 sólo el 13.39% del
tiempo.
Poder de una prueba
Procedimiento:
Establecer la hipótesis nula H0 de que = 0
Seleccionar una hipótesis alternativa apropiada H1 de una de las
alternativas < 0, > 0 ó 0
Seleccionar un nivel de significancia de tamaño
Seleccionar el estadístico de prueba apropiado y establecer la región
crítica. (Si la decisión se basará en un valor de P no es necesario
establecer la región crítica).
Calcular el valor del estadístico de prueba de los datos muestrales.
Decidir: rechazar H0 si el estadístico de prueba tiene un valor en la región
crítica (o si el valor calculado de P es menor o igual que el nivel de
significancia deseado ); de otra forma, no rechazar H0.
Ejemplo:
Una muestra aleatoria de 100 muertes registradas durante el año
pasado mostró una vida promedia de 71.8 años. Suponiendo una
desviación estándar poblacional de 8.9 años, ¿parecería esto indicar
que la vida promedio hoy en día es mayor que 70 años?. Utilice un
nivel de significancia del 0.05.
1. - H 0 :μ 70 años
2. - H 1 :μ 70 años
3. - α 0.05
4. - z 0.95 1.645
Región crítica : z 1.645, donde :
x -μ
z
σ/ n
5. Cálculos : x 71.8 años, σ 8.9 años, y
71.8 - 70
z 2.02
8.9/ 100
6. Decisión : Se rechaza H 0 y se concluye que la vida promedio hoy en día es mayor que 70 años.
P P(Z 2.02) 0.0217
Test de hipótesis
H 0 :μ μ
H 1 :μ μ
x -μ
t
s/ n
Para la hipótesis bilateral en un nivel de significancia , se aplican
regiones críticas de doble cola
Para H1: u > u0, el rechazo resulta cuando t > t,n-1.
Para H1: u < u0, el rechazo resulta cuando t < t,n-1.
Ejemplo:
Una empresa eléctrica afirma que una aspiradora consume un
promedio de 46 kwh. Si en una muestra aleatoria en 12 hogares indica
que el consumo es de 42 kwh con una desviación estándar de 11.9
kwh, ¿sugiere esto con un nivel de significancia de 0.05 que las
aspiradoras consumen en promedio menos de 46 kwh?.
1. - H 0 :μ 46 kwh
2. - H1 :μ 46 kwh
3. - α 0.05
4. - t 0.025,11 - 1.796
x -μ 0
Región crítica : t - 1.796, donde : t
s/ n
5. Cálculos : x 42 kwh; s 11.9 kwh; n 12
42 - 46
t - 1.16 P P(T -1.16) 0.135
11.9/ 12
6. Decisión : Se acepta H 0 y se concluye que la cantidad promedio de kwh consumidos
por las aspiradora s no es significat ivamente menor que 46.
Test de hipótesis
1. - H 0 :μ 1 - μ 2 2
2. - H 1 :μ 1 - μ 2 2
3. - α 0.05
4. - t 0.025,20 1.725
(x 1 - x 2 ) - d 0
Región crítica : t 1.725, donde : t
s p / 1/n 1 1/n 2
5. Cálculos : x 1 85; s1 4; n 1 12; x 2 81; s 2 5; n 2 10
s p 4.478; t 1.04; P P(T 1.04) 0.16
6. Decisión : Se acepta H 0 . No se está en condicione s de concluir que el deterioro
abrasivo del material 1 excede al del material 2 por más de dos unidades.
Test de hipótesis
Observaciones pareadas
H 0 : μ 1 μ 2 o u D μ 1 -μ 2 0
H1 : μ 1 μ 2 o u D μ 1 - μ 2 0
d - d0
t
sd n
Andrógeno (ng/ml)
Al momento de la 30 minutos después de
Ciervo inyección la inyección
1 2.76 7.02
2 5.18 3.10
3 2.68 5.44
4 3.05 3.99
5 4.10 5.21
6 7.05 10.26
7 6.60 13.91
8 4.79 18.53
9 7.39 7.91
10 7.30 4.85
11 11.78 11.10
12 3.90 3.74
13 26.00 94.03
14 67.48 94.03
15 17.04 41.70
Solución:
Sean 1 y 2 la concentración promedio de andrógeno en el momento de
la inyección y 30 minutos después, respectivamente. Se procede como
sigue:
1. - H 0 : μ 1 μ 2 o μ D μ 1 μ 2 0
2. - H 1 : μ 1 μ 2 o μ D μ 1 μ 2 0
3. - α 0.05
4. - t 0.025,14 - 2.145
d - d0
Región crítica : t -2.145 y t 2.145, donde : t
sd / n
5. Cálculos : d 9.848; s d 18.474
t 2.06; P P(T 2.06) 0.06
6. Decisión : No obstante que eñ estadístic o t no es significat ivo en el nivel 0.05,
P 0.6 indica que existe alguna evidencia de que hay una diferencia en los niveles
promedio de circulació n de andrógeno.