Sie sind auf Seite 1von 49

Ejercicios de Estadı́stica

JAD
Febrero 11, 2011

1
Ejercicios del primer parcial
Ejercicio 1

De dos ejemplos de estimadores que sean


• insesgados y eficientes,
• insesgados y no eficientes,

• sesgados y no eficientes.
Solución.

• Se tiene que X (la media muestral) es un estimador insesgado de µ, y la


n
varianza modificada Ŝ 2 = n−1 Ŝ son insesgados y eficientes.

• X (la media muestral) y el estadı́stico muestral 12 (Q1 + Q2 ), donde Q1 y


Q2 son cuartiles muestrales inferior y superior. Ambos son estimadores
insesgados de la media de la población, ya que se puede demostrar que la
media de sus distribuciones muestrales es la media de la población. Sin
embargo, ambos son ineficientes comparados con X.
• Para estimar la desviación estándar de la población, σ, se puede utlizar la
desviación muestral estándar S, la desviación estándar modificada Ŝ, la
desviación media y el rango semintercuartı́lico.

Ejercicio 2

Suponga que las estaturas promedio es de 67.45 pulgadas y desviación estándar


2.93, de 100 estudiantes de la UTM representan una muestra aleatoria de las
estaturas de los 1546 estudiantes de la universidad. Hallar los intervalos de
confianza del a) 95% y b) 99% para estimar la estatura media de los estudiantes
de la universidad.

Solución.

Datos.
n = 100, N = 1546, X = 67.45, σ = 2.93, α = 0.05.
a) Hallar el intervalo de confianza del 95% para este caso esta dado por la
fórmula
r r
σ N −n σ N −n
X ± Zα √ = X ± Z0.025 √
n N −1 n N −1
r
2.93 1546 − 100
= 67.45 ± 1.96 √
100 1546 − 1
= 67.45 ± 1.96(0.293)(0.97) = 67.45 ± 0.57

Por lo tanto el intervalo de confianza del 95% esta dado por (66.88, 68.02).

2
b) Hallar el intervalo de confianza de 99%, se toma α = 0.001, aplicando la
formula anterior
r r
σ N −n σ N −n
X ± Zα √ = X ± Z0.025 √
n N −1 n N −1
= 67.45 ± 2.57(0.293)(0.97) = 67.45 ± 0.76

Por lo tanto el intervalo de confianza del 95% esta dado por (66.69, 68.21).

Ejercicio 3

Las medidas de los diámetros de una muestra de 200 cojinetes de bolas hechos
por una determinada máquina durante una semana dieron una media de 0.824
pulgadas y una desviación estándar de 0.042 pulgadas. Hallar los lı́mites de
confianza de a) 95 % y b) 99% para el diámetro medio de todos los cojinetes.

Solución.

a) Como n es grande, podemos suponer que X tiene una distribución casi


normal.
Datos.
α = 0.05, Z α2 = 1.96, σ = 0.042, X = 0.824.
Para este caso utilicemos la siguiente ecuación
σ 0.042
X ± 1.96 √ = 0.824 ± 1.96 = 0.824 ± 0.0058.
n 200
Por lo que el intervalo de confianza está dado por: (0.8182, 0.8298).
b) Como n es grande, podemos suponer que X tiene una distribución casi nor-
mal. Datos.
α = 0.01, Z α2 = 2.58, σ = 0.042, X = 0.824.
Para este caso utilicemos la siguiente ecuación
σ 0.042
x ± 2.58 √ = 0.824 ± 2.58 = 0.824 ± 0.0077
n 200
Por lo que el intervalo de confianza está dado por: (0.8163, 0.8317).

Ejercicio 4

Al medir el tiempo de reacción, un psicologo estima que la desviación tı́pica del


mismo es de 0.05 segundos. Cuál es el número de medidas que deber hacer para
que sea del a) 95% y b) 99% la confianza de que el error de su estima no exceda
de 0.01 segundos?.

Solución.

a) Datos.
σ = 0.05,α = 0.05. Los lı́mites de confianza del 95% son X ± 1.96 √σn , siendo el

3
error del estimado 1.96 √σn . Vemos que este error será igual a 0.01 segundos si
(1.96)(0.05)

n
= 0.01, esto es,

(1.96)(0.05) √
= n
0.01 √
n = 9.8
n = 96.04 ≈ 96.

Por consiguiente podemos tener el 95% de confianza de que el error en el


estimador sea menor que 0.01 si n = 97 o más grande.
b) Datos.
σ = 0.05 , E = 0.01, α = 0.01, Z α2 = 2.58.
El número de medidas para el 99% está dada por la ecuación

Z α2 σ 2
   2
(2.58)(0.05)
n= = = 166.4 ≈ 166
E 0.01
Por lo que el error de la estima será menor que 0.01 solo si n = 167 o mayor.

Ejercicio 5

Una muestra aleatoria de 50 calificaciones de matemáticas de un total de 200,


arrojó una media de 75 y una desviación de 10. a) Cuáles son los lı́mites de
confianza del 95% para la estima de la media de 200 calificaciones? b) Con qué
grado de confianza podrá decirse que la media de las 200 calificaciones es de
75 ± 1?

Solución.
a) Datos.
N = 200, X = 75, σ = 10, n = 50.
El intervalo de confianza está dado por la ecuación

r r
σ N −n 10 200 − 50
X ± Zα √ = 75 ± 1.96 √
n N −1 50 200 − 1
170.166
= 75 ± = 75 ± 2.4
7.07
Ası́, el intervalo de confianza es (72.6, 77.4).

b) Para responder a este inciso necesitamos que 75±Z α2 √σn = 75±1, despejando
Zα , tenemos que

50
Z2 =
α = 0.81.
(10)(0.8681)
El área bajo la curva normal desde Z = 0 hasta 0.81 es de 0.2910, de aquı́ que
el grado de confianza requarido es de 2(0.2910) = 0.582 ó 58.2%.

Ejercicio 6

4
Una muestra de 100 votantes elegidos aleatoriamente entre todos los de un dis-
trito dado, indicó que el 55% de ellos estaban a favor de un determinado can-
didato. Hallar los lı́mites de confianza del a)95%, b)99% y c)99.73% para pro-
porción de todos los votantes que estaban a favor de este candidato.

Solución.

a) Datos.
n = 100, p̂ = 0.55, α = 0.05, Z α2 = 1.96.
Para obtener los lı́mites de confianza usaremos la siguiente fórmula
r r
p̂(1 − p̂) (0.55)(0.45)
p̂ ± Z α2 = 0.55 ± 1.96 = 0.55 ± 0.1,
n 100
de donde el intervalo de confianza está dado por (0.4553, 0.6474).
b) Datos.
n = 100, p̂ = 0.55, α = 0.01, Z α2 = 2.58.
Para obtener los lı́mites de confianza para este caso sustituiremos en la escuación
r r
p̂(1 − p̂) (0.55)(0.45)
p̂ ± Z 2
α = 0.55 ± 2.58 = 0.55 ± 0.13,
n 100
de donde el intervalo de confianza es (0.42, 0.68).
c) Datos.
n = 100, p̂ = 0.55, α = 0.0027, Z α2 = 3.
Para obtener los lı́mites de confianza usaremos la siguiente fórmula
r r
p̂(1 − p̂) (0.55)(0.45)
p̂ ± Z 2
α = 0.55 ± 3 = 0.55 ± 0.15,
n 100
ası́ el intervalo de confianza es (0.40, 0.70).

Ejercicio 7
Qué tamaño de muestra debe tomarse en el problema 6, para que la confianza
de que el candidato elegido sea de 95%?.

Solución.

Para esto veamos que P (p > 0.5) = 0.95 ya que qP −p es normal, luego
p(1−p)
n

 
β
P −p
Z
1 u2
P q < β = √ e− 2 du
p(1−p) 2π −∞
n
r
β
p(1 − p)
Z
1 u2
P (p > P − β )= √ e− 2 du
n 2π −∞
q
Luego P − β p(1−p)n = 0.5, de donde β = 1.645. Utilizando P = 0.55 y la
estimación p = 0.55, tenemos que

5
r
(0.55)(0.45)
0.55 − 1.645 = 0.5
n
n = 271.

Ejercicio 8
En 40 lanzamientos de una moneda, se obtuvieron 24 caras. Hallar los lı́mites de
confianza del a) 95% y b) 99.73% para la proporción de caras que se obtendrı́an
en un ilimitado número de lanzamiento de la moneda.

Solución.

a) Datos.
24
n = 24, N = 40, p̂ = = 0.6, α = 0.05, q̂ = 1 − p̂ = 0.4 .
40 q
El intervalo de confianza está dado por p̂ ± Z α2 p̂q̂
N , sustittuyendo los valores
tenemos que

r r
p̂q̂ (0.4)(0.6)
p̂ ± Z α2 = 0.6 ± 1.96 = 0.6 ± 1.96(0.0775) = 0.6 ± 0.152
N 40
Por lo que los limites de confianza del 95 % es (0.448, 0.752)
b) Datos.
24
n = 24, N = 40, p̂ = 40 = 0.6, α = 0.0027, q̂ = 1 − p̂ = 0.4 .
q
El intervalo de confianza está dado por p̂ ± Z α2 p̂q̂
N , sustittuyendo los valores
tenemos que

r r
pq (0.4)(0.6)
p̂ ± Z α = 0.6 ± 3 = 0.6 ± 3(0.0775) = 0.6 ± 0.2325
2
N 40

Por lo que los limites de confianza del 95% es (0.3675, 0.8325).

Ejercicio 9

Una muestra de 150 bombillas del fabricante A dieron una vida media de
1400 horas y una desviación estándar de 120 horas. Una muestra de 100 bom-
billas del fabricante B dieron una vida media de 1200 horas y una desviación
estándar de 80 horas. Hallar los intervalos de confianza del a) 95% y b) 99%
para la diferencia de las vidas medias de las poblaciones A y B.

Solución.
Los lı́mites de confianza paraq
la diferencia en medias de las marcas A y B está
σ2 σB2
dado por (X A − X B ) ± Zα/2 nA A
+ n B
.
a) Datos.

6
nA = 150, nB = 100, X A = 1400, X B = 1200, σA = 120, σB = 80, α = 0.05.
Sustituyendo en la ecuación anterior tenemos que

s r
2 σ2
σA (120)2 (80)2
(X A − X B ) ± Zα/2 + B = (1400 − 1200) ± Z0.025 +
nA nB 150 100
r
14400 6400
= (200) ± 1.96 +
150 100
= (200) ± 24.8.

Por consiguiente, podemos tener confianza del 99% de que la diferencia de me-
dias de las poblaciones enten en el intervalo (175.2, 224.8).
b) Datos.
nA = 150, nB = 100, X A = 1400, X B = 1200, σA = 120, σB = 80, α = 0.01.
Sustituyendo en la ecuación anterior tenemos que

s r
2 σ2
σA (120)2 (80)2
(X A − X B ) ± Zα/2 + B = (1400 − 1200) ± Z0.025 +
nA nB 150 100
r
14400 6400
= (200) ± 2.58 +
150 100
= (200) ± 32.6.

Por lo tanto el intervalo de confianza para diferencia de medias esta dado


por (167.3, 232.6).

Ejercicio 10

En una muestra aleatoria de 400 adultos y 600 adolescentes que veı́an un cierto
programa de televisión, 100 adultos y 300 adolescentes dijeron que les gustaba.
Hallar el inetrvalo de confianza de a) 95% y b) 99% para la diferencia de pro-
porciones de todos los adultos y adolescentes que ven el programa y les gusta.

Solución.
El intervalo de confianza para la diferencia de proporciones está dado por:

q
P̂1 (1−P̂1 ) P̂2 (1−P̂2 )
Pˆ1 − Pˆ2 ± Zα n1 + n2

Entonces tenemos

a) Datos.
α = 0.05, n1 = 400, n2 = 600, P̂1 = 0.25, P̂2 = 0.5, Z0.025 = 1.96.
Sustituyendo tenemos que

s r
P̂1 (1 − P̂1 ) P̂2 (1 − P̂2 ) (0.25)(0.75)
Pˆ1 −Pˆ2 ±Zα + = (0.5−0.25)±1.96 f rac(0.5)(0.5)600 + = 0.25±0.06.
n1 n2 400

7
Por lo que el lı́mite de confianza del 95% es (0.19, 0.31.

b) Datos.
α = 0.01, n1 = 400, n2 = 600, P̂1 = 0.25, P̂2 = 0.5, Z0.005 = 2.58.

Sustituyendo tenemos que

s r
P̂1 (1 − P̂1 ) P̂2 (1 − P̂2 ) (0.5)(0.5) (0.25)(0.75)
Pˆ1 − Pˆ2 ± Zα + = (0.5 − 0.25) ± 2.58 +
n1 n2 600 400
= 0.25 ± 0.08.

Por lo que el lı́mite de confianza del 99% es (0.17, 0.33.

Ejercicio 11

Dos muestras de tamaño 16 y 10 respectivamente se extraen aleatoriamente de


dos poblaciones normales. Si se encuentra que sus varianzas son 24 y 18 re-
spectivamente, hallar los intervalos de confianza para a)98% y b)90% para la
relación de varianzas.

Solución.
a) Datos.
n = 16, S12 = 24,m = 10, S22 = 18, F0.99(15)(9) = 4.96, F0.01(9)(15) = 3.89.
Además
m
Ŝ12 = S 2 = 25.2
m−1 1
m
Ŝ22 = S 2 = 20.
m−1 2
Con estos datos encontremos el intervalo de confianza del 98%, esto es
! !
Ŝ12 σ12 Ŝ12
≤ 2 ≤ ,
F0.99 Ŝ22 σ2 F0.01 Ŝ22

σ2
   
25.2 25.2
≤ 12 ≤ ,
20(4.96) σ2 20(3.89)

σ12
0.283 ≤ ≤ 4.9,
σ22
Con lo que el intervalo de confianza es (0.283, 4.9).
b) Datos.
n = 16, S12 = 24,m = 10, S22 = 18, F0.95(15)(9) = 3.01, F0.05(9)(15) = 0.386.
Además
m
Ŝ12 = S 2 = 25.2
m−1 1
m
Ŝ22 = S 2 = 20.
m−1 2

8
Con estos datos encontremos el intervalo de confianza del 98%, esto es

S12 σ12 S12


   
≤ ≤ ,
F0.95 S22 σ22 F0.05 S22
σ2
   
25.2 25.2
≤ 12 ≤ ,
20F0.95 σ2 20F0.05
σ2
   
1.33 1.33
≤ 12 ≤ ,
3.001 σ2 0.386
σ12
0.4186 ≤ ≤ 3.263,
σ22
Por lo que el intervalo de confianza es(0.4186, 3.263).
Ejercicio 12
Suponga que obtenemos una sola observación X de una distribución exponen-
cial con media θ. Use X para construir un intervalo de confianza para θ con un
coeficiente de confianza de 0.90.

Solución.
1 −x

θe
θ , x ≥ 0;
La función de densidad para X esta dada por f (x) =
0, en otro caso.
x
Tomando U = θ por el método de transformación se tiene
f (U ) = e−U
Buscando
P (a ≤ U ≤ b) = 0.90
Entonces buscando el valor de a y b, P (a ≤ U ) = 0.05 y P (U > b) = 0.05
Luego entonces
Z a
P (a < U ) = e−U du = 0.05
0

Z ∞
P (U > b) = e−U du = 0.05
b
−e−U |∞
b = e −b
= 0.05
−b = ln(0.05)
b = 2.996
Luego entonces
x
P (0.51 ≤ U ≤ 2.996) = P (0.51 ≤ ≤ 2.996)
θ
Como se desea hallar un intervalo de confianza para θ entonces
 
0.51 1 2.996  x x 
P ≤ ≤ =P ≥θ≥
x θ x 0.51 2.996
Por lo tanto  x x 
,
2.996 0.51

9
Ejercicio 13
Suponga que tomamos una muestra de tamaño n = 1 de una distribución uni-
forme definida en el intervalo [0, θ], donde θ es desconocida. Encuentre un
lı́mite de confianza inferior de 95 % para θ.

Solución.
Como X es uniforme en [0, θ], hagamos U = X θ está uniformemente distribuida
en [0, 1]. Esto es
(
1, 0 ≤ u ≤ 1
fU (u) =
0, otro caso
como buscamos un limite de confianza unferior de 95% para θ, determinamos
el valor para a de modo que P (U ≤ a) = 0.95, esto es,

Z a
(1)dU = 0.95
0
a = 0.95
Por lo tanto
   
X X
P (U ≤ 0.95) = P ≤ 0.95 = P ≤ θ = 0.95
θ 0.95
X
Veamos que 0.95 es un limite de confianza inferior para θ, con coeficiente de
confianza 0.95
Ejercicio 14
Suponga que la variable aleatoria X es una observación de una distribución
normal con media µ desconocida y varianza 1. Encuentre un a) intervalo de
confianza de 95% para µ..

Solución.
Datos.
µ desconocida, σ 2 , α = 0.05, Z α2 = 1.96.

Por hipótesis tenemos que la variable aleatoria tiene una distribución normal,
es decir, X ∼ N (µ, 1), luego
P (θL ≤ µ ≤ θS ) = 0.95
X −µ
√ ≤ 1.96) = 0.95
P (−1.96 ≤
σ/ n
σ σ
P (−1.96 √ ≤ X − µ ≤ 1.96 √ ) = 0.95
n n
σ σ
P (−1.96 √ + X ≤ µ ≤ X + 1.96 √ ) = 0.95.
n n
Como σ = 1, entonces se tiene
1 1
P (−1.96 √ + X ≤ µ ≤ X + 1.96 √ ) = 0.95.
n n

10
Por lo tanto el intervalo de confianza para µ esta dado por
−1.96 1.96
( √ + X, X + √ ).
n n
Ejercicio 15

Suponga que X está distribuida normalmente con media 0 y varianza σ 2 de-


2
sconocida, entonces X 2
σ 2 tiene una distribución χ con grado de libertad 1. Use
2
la cantidad privote X 2
σ 2 para hallar un intervalo de confianza del 95% para σ .

Solución.

Datos.
X ∼ N (0, σ 2 ), σ 2 desconocida, f racX 2 σ 2 ∼ χ2 (1), α = 0.05.
Luego
X2
P (θL ≤ ≤ θS ) = 0.95
σ2
2
X
P (−1.96 ≤ 2 ≤ 1.96) = 0.95
σ
1.96 1 1.96
P (− 2 ≤ 2 ≤ ) = 0.95
X σ X2
X2 X2
P (− ≤ σ2 ≤ ) = 0.95.
1.96 1.96
2 2
X X
Por lo tanto el intervalo de confianza para σ 2 esta dado por (− 1.96 , 1.96 ).

Ejercicios del segundo parcial


Ejercicio 18

El doctor Yue Chen, en un articulo publicado en la revista American Jour-


nal, presenta información de algunos factores asociados con las prácticas de
alimentación de niños pequeños por parte de madres de la cuidad de Shangai.
Encontró que entre 1706 niños varones, 35.9 por ciento recibı́an alimentación
con biberones. Entre 1579 niñas, 32.9 por ciento tambien recibı́an alimentación
con biberones. Esta proporción de infantes que reciben alimentación mediante
biberones. Es significativamente mas alta entre los varones que entre las niñas?

Solución

• Datos. n = 1706 m = 1579 X = 612.45 Y = 519.49 p = 0.34 p1 =


0.35 p2 = 0.32.
• Supuestos. Se supone que los niños estudiados forman una muestra aleato-
ria independiente extraı́da de poblaciones con y sin biberon, que siguen
una distribución aproximadamente normal.
• Hipótesis. P1 : proporción de niños con biberon.
P2 : proporción de niñas con biberon.
H0 : P1 = P2 Ha : P1 > P2 .

11
P1 −P2
• Estadı́stico de prueba. Z0 = √ 1 1
.
P (1−P )( n +m )

• Distribución del estadı́stico. Si la Hipotesis nula es verdadera, el estadis-


tico de prueba sigue aproximadamente una distribucion normal estandar.
• Regla de decisión. Rechazar H0 si Z0 > Zα
0.35−0.32
• Cálculo del estadı́stico de prueba. Z0 = √ 1 1
= 1.81
(0.34)(1−0.34)( 1706 + 1579 )

• Decisión estadı́stica. Se tiene que Z0 = 1.81 y Z0.10 = 1.28 pero 1.81 no


es mayor que 1.28, por lo que H0 se rechaza.
• Conclusiones. Se concluye que la proporción de infantes que reciben ali-
mentación mediante biberon es mas alta en varones que en niñas.

Ejercicio 20

Darko et al. evaluaron la utilidad de ensayos para la proliferación de linfocitos


inducida por mitosis, en una investigación clı́nica de psicoinmunologı́a. Los su-
jetos del estudio eran pacientes con diagnóstico de transtorno depresivo grave,
quienes satisfacı́an también otros criterios de estudio, ası́ como individuos sanos
desde el punto de vista médico y psiquiátrico. Entre los datos recolectados están
las calificaciones, con base en la Escala breve de clasificación psiquiátrica, para
ambos grupos de individuos. Los pacientes del grupo A se ajustaron a la hipótesis
de que al deprimirse, la respuesta de inmunidad disminuye y el grupo de pa-
cientes B tuvo mejor respuesta en comparación con el otro. Las calificaciones
de subescala de depresión incluida en la Escala breve de clasificación psiquiátrica
para los individuos de ambos grupos es la siguiente:

Grupo A Grupo B
12 17
13 14
12 19
12 15
9 8
7 19
8 12
5 20
10 9
13 10
15 12
11
7

en general, es posible concluir, con base en estos daros, que los pacientes del
grupo B, en promedio tienen mayor calificación en la subescala de depresión de
la escala?. Sea α = 0.05.

Solución.
2
• Datos. n = 13, m = 11, X = 10.30, Y = 14.09, SX = 8.56, SY2 = 16.45,
2 (12)(8.56)+(10)(16.45)
SP = 13+11−2 = 12.15, α = 0.05.

12
• Supuestos. Se supone que las muestras provienen de una población cuya
distribución es binomial.

• Hipótesis. H0 : δ = δ0 vs Ha : δ < δ 0 , donde δ = µX − µY y


δ0 = 0.

• Estadı́stico de prueba. t0 = qX−Y −δ0 .


Sp2 ( n
1 1
+m )
• Distribución del estadı́stico. t0 ∼ t(n+m−2) .
• Regla de decisión. Rechazar H0 si t0 ≤ −tα(n+m−2) = −1.717.

• Cálculo del estadı́stico. t0 = q10.3−14.09−0 = − √3.79 = −2.65.


12.15( 13
1 1
+ 11 ) 2.039

• Desición estadı́stica. Como t0 = −2.65 < −1.717, entonces se rechaza H0 .

• Conclusiones. Con un nivel de significancia α = 0.05 y los datos propor-


cionados, se puede concluir que los pacientes del grupo B en promedio
tienen mayor calificación que el grupo A.

Ejercicio 21

Nace et al. condujeron un estudio para evaluar las complejas relaciones entre la
dicción y los trastornos de personalidad. Los autores determinaron la frecuen-
cia de los desórdenes de personalidad en un grupo de individuos adictos de clase
media, y los comparó con trastornos de personalidad de individuos no adictos.
entre los datos reportados estaban las siguientes estadı́sticas sobre el componente
de depresión según el Inventario de personalidad multifacética de Minnesota.

Con desórdenes de personalidad


n x̄ S
57 70.63 16.27
Sin desórdenes de personalidad
n x̄ S
43 64.33 12.99

En general, con base en estos datos, es posible concluir que los individuos adic-
tos con y sin trastornos de personalidad difieren con respecto a las calificaciones
medias sobre el componente de depresión del Inventario de personalidad múltiple
de Minnesota?. Sea α = 0.05.

Solución.

2
• Datos.α = 0.05, n = 57, m = 43, X̄ = 70.63, SX = 16.27, SX = 246.41,
2
Ȳ = 64.33, SY = 12.99, SY = 168.74.
• Supuestos. Se supone que las muestras provienen de una población que
tiene distribución normal.
• Hipótesis. H0 : δ = δ0 vs Ha : δ 6= δ0 , donde δ0 = 0.

13
X̄ − Ȳ
• Estadı́stico de prueba. Z0 = r
2
SX S2
+ Y
n m
• Distribución del estadı́stico. Z0 ∼ Z α2 .
• Regla de decisión. Rechazar H0 si |z0 | ≥ z α2 .
70.63 − 64.33 6.3 6.3
• Cálculo estadı́stico. Z0 = r =√ = = 2.19.
246.41 168.74 8.24 2.87
+
57 43
• Decisión estadı́stica. Como |2.19| ≥ 1.96 se rechaza H0 .
• Conclusiones. Podemos concluir que con un nivel de significancia de
α = 0.05 los individuos adictos con y sin trastornos de personalidad di-
fieren con respecto a las calificaciones medias sobre el componente de
depresión del Inventario de personalidad multifacética de Minnesota.

Ejercicio 22

Un grupo de investigadores desea saber si las personas adultas que viven en


ciudades urbanas y en comunidades rurales de paises en desarrollo difieren con
respecto a la cantidad de personas ciegas. Una encuesta revelo la siguiente
información
Grupo Tamaño de la muestra Cantidad de ciegos
Rural 300 24
Urbano 500 15
Ofrecen estos datos suficiente evidencia para indicar una diferencia en la
prevalencia de casos de ceguera en las dos poblaciones? Sea α = 0.05. Deter-
mine el valor de p.

Solución.

X Y X+Y
• Datos. n = 300, m = 500, p1 = n = 0.08, p2 = m = 0.03, p = n+m =
0.048, q = 1 − p = 0.952
• Supuestos. Se supone que la muestra provienen de una población que tiene
distribución binomial.
• Hipotesis. H0 : p1 = p2 vs. p1 6= p2
p1 −p2
• Estadistica de prueba. Z0 = √ 1 1
p(1−p)( n +m )

• Distribución del estadistico. Z0 ∼ N (0, 1)


• Regla de decisión. Rechazar h0 si | Z0 |> Z α2
• Calculo del estadı́stico. Z0 = 3.33
• Decisión estadı́stica. Como 3.33 > −0.67, por lo que H0 se acepta.

14
• Concluciones. Con un nivel de significancia de α = 0.05 se acepta H0 .
Ası́, se concluye que estos datos no ofrecen suficiente evidencia.

• Calculo de p. p = P (| z |> −0.67) = 0.5028

Ejercicio 23

En un experimento con animales de laboratorio se recolectaron los siguientes


datos respecto al flujo sanguı́neo de la corteza renal, durante condiciones de
control y durante la administración de cierto anestésico:

Flujo sanguineo de la corteza renal


Numero de animal control Durante la administracion del anestesico
1 2.35 2.00
2 2.55 1.71
3 1.95 2.22
4 2.79 2.71
5 3.21 1.83
6 2.97 2.14
7 3.44 3.72
8 2.58 2.10
9 2.66 2.58
10 2.31 1.32
11 3.43 3.70
12 2.37 1.59
13 1.82 2.07
14 2.98 2.15
15 2.53 2.05

Es posible concluir, con basa en estos datos que el anestésico retarda el flujo
sanguı́neo de la corteza renal? Sea α = 0.05. Determine el valor de p.

Solución.

• Datos. X = 2.66 Y = 2.25 Sx2 = 0.48 Sy2 = 0.68 Sp2 = 34.24 n=


15 m = 15 α = 0.05
• Supuestos. Se supoe que la muestra se toma de una población normal.
• Hipótesis. H0 :3x <3y vs. Ha :3x >3y
−δ0
• Estadı́stica de prueba. t0 = √X−Y
2 1 1
Sp ( n + m )

• Distribución del estadı́stico. t0 ∼ t(28)


• Regla de decisión. Rechazar H0 si t0 >= t0.05(28)

• Calculo del estadı́stico. t0 = √2.66−2.25


2
= 0.41
2.13 = 0.19
34.25( 15 )

• Decisión estadı́stica. Como t0 es menor que t0.05(28) entonces de acepta


H0 .

15
• Concluciones. Con un nivel de significancia de α = 0.05 H0 se acepta. Ası́
se concluye que es posible que el anestésico no retarde el flujo sanguı́neo
de la corteza renal.

Ejercicio 25

Un estudio en 90 mujeres que habı́an dado a luz recientemente, elegidas al azar


entre los registros de un departamento de bienestar social, reveló que 27 de ellas
tuvieron un problema de infección intraparto o posparto. Pruebe la hipótesis
nula que dice que la proporción de la población con un problema de infección
intraparto o posparto es menor o igual que 0.25. Sea α = 0.05. Determine el
valor p.

Solución.

• Datos. n = 90, X = 27, P0 = 0.25, q0 = 0.75, α = 0.05, Zα = 1.65.


• Suposiciones. Se supone que la muestra proviene de una población cuya
distribución es binomial.
• Hipótesis. H0 : P = 0.25 vs Ha : P ≤ 0.25.
• Estadı́stico de prueba.Z0 = √ X−nP0
nP0 (1−P0 )

• Distribución del estadı́stico.Z0 ∼ B(n, P ).


• Regla de decisión. Rechazar H0 si Z0 < −1.65.

• Cálculo de la estadı́stico de prueba. Z0 = √ X−nP0 = − √ 27−90(0.25) =


nP0 (1−P0 ) (90)(0.25)(0.75)
−4.5
4.10 = −1.09.
• Desición estadı́stica. Como Z0 = −1.09 < −1.65 entonces, se acepta H0 .
• Conclusiones. Con un nivel de significancia α = 0.05, se acepta H0 . Ası́,
podemos concluir que la proporción de la población es mayor que 0.25.
• Cálculo de p. p = P (Z ≥ Z0 ) = P (Z ≥ 1.09) = 1−φ(1.09) = 1−0.8621 =
0.1379.

Ejercicio 26

En una muestra de 150 pacientes internados en un hospital de urgencias con


cierto diagnostico, 128 de ellos presentaron vómito. Proporcionan estos datos
evidencia suficiente para indicar, en el nivel 0.01 de significación, que la pro-
porción de la población es menor que 0.92?. Determine el valor de p.

Solución.

• Datos. n = 150 X = 128 p0 = 0.92 q0 = 0.08 Z0.01 = 2.33 α = 0.01


• Suposiciones. Se supone que la muestra proviene de una población cuya
distribución es binomial.
• Hipótesis. H0 : p = 0.92 vs Ha : p < 0.92

16
• Estadı́stica de prueba. Z0 = √ X−np0
np0 (1−p0 )

• Distribución del estadı́stico. Z0 ∼ B(n, p)


• Regla de decisión. Rechazar H0 si Z0 < −2.33

• Cálculo del estadı́stico. Z0 = √128−150(0.92) 10


= − √11.04 10
= − 3.32 =
(150)(0.92)(0.08)
−3.01
• Decisión estadı́stica. como Z0 es menor que −2.33 entonces se rechaza H0
• Conclusiones. Con un nivel de significancia de α = 0.01 se rechaza H0 .
Ası́, se concluye que la proporción de la población es menor que 0.92
• Calculo de p. P (z < −2.33) = 0.0099

Ejercicio 27

Un grupo de investigadores midió el volumen de ventilación pulmonar en 15


animales de laboratorio. La media y la desviación estándar son 45 y 5 cc, re-
spectivamente.Proporcionan estos datos evidencia suficiente para indicar que la
media de la población es mayor que 40 cc? Sea α = 0.05

Soluciı́on.

• Datos. n = 15, X = 45, σ 2 = 5, µ = 40, α = 0.05, Z0.05 = 1.64..


• Suposiciones. La muestra proviene de una población que sigue una dis-
tribución aproximadamente normal.
• Hipótesis. H0 : µ ≤ 40 vs Ha : µ > 40.
X−µ
• Estadı́stica de prueba. Z = √ .
σ/ n

X−µ
• Distribución del estadı́stico. √
σ/ n
∼ N (0, 1).

• Regla de decisión. Rechazar H0 si Zα > Z0 , el valor de Zα .


X−µ √45−40 5
• Cálculo del estadı́stico. Z = √
σ/ n
= √
5/ 15
= 0.57 = 8.66.

• Decisión del estadı́stico. Como 8.66 > 1.64, se concluye que se rechaza
H0 .
• Conclusiones. Con un nivel de significancia de α = 0.05 se concluye que
la media de la población es mayor que 40.

Ejercicio 28

Una muestra de ocho pacientes internados en un hospital con diagnostico de


cirrosis biliar presento una concentración media de IgM de 160.55 unidades por
mililitro. La desviación estándar de la muestra fue de 50. Proporcionan estos
datos evidencia suficiente para indicar que la media de la población es mayor
que 150? Sea α = 0.05. Determina el valor de p.

Solución.

17
• Datos. n = 8 X = 160.55 S = 50 α = 0.05 ν0 = 150
• Supuestos. Se supone que la muestra proviene de una población cuya
distribucion es normal.
• Hipotesis. H0 : ν = 150 vs. ν > 150
X−ν0
• Estadistica de prueba. t0 = S

n

• Distribución del estadistico. t0 ∼ t(n−1)


• Regla de decision. Rechazar H0 si t0 > t0.05(7) = 1.895
160.55−150 10.55
• Calculo del estadistico. t0 = 50

= 17.67 = 0.59
8

• Decision estadistica. como t0 es mas pequeño que t0.05(7) entonces se


acepta H0

• Concluciones. Con un nivel de significancia de α = 0.05 se acepta H0 . Ası́


se concluye que no hay suficiente evidencia.

Ejercicio 30

Se midieron los niveles de estrona circulante en una muestra de 25 mujeres


posmenopáusicas que siguieron un tratamiento de estrógeno. La media de la
muestra y la desviación estándar son 73 y 16, respectivamente. Con un nivel de
significancia de 0.05 y con base en estos datos, es posible concluir que la media
poblacional es mayor que 70 ?.

Solución.
• Datos. n = 25, X = 73, S = 16, α = 0.05, µ0 = 70, t0.05(24) = 1.711.
• Suposiciones. Se supone que la muestra proviene de una población cuya
distribución es normal.
• Hipótesis. H0 : µ = 70 vs Ha : µ > 70.
X−µ
• Estadı́stico de prueba. t = √0.
S/ n

• Distribución del estadı́stico.t ∼ tα(n−1) .


• Regla de decisión. Rechazar H0 si t > tα(n−1) .
73−70 3
• Cálculo del estadı́stico. t = √
16/ 25
= 16/5 = 0.94.

• Desición estadı́stica. Como 0.94 < t0.025(24) = 1.711, se acepta H0 .


• Conclusiones. Con un nivel de significancia α = 0.05 y los datos otorgados,
no se puede concluir que la media poblacional es mayor que 70.

Ejercicio 32

18
Catorce niños recien nacidos midieron en promedio 53 cm con una desviacion
estandar de 9 cm. con base en esos resultados, es posible concluir que la media
es diferente de 50cm? Sea 0.10 la probabilidad de cometer el error tipo I.

Solución.
• Datos. n = 14 X = 53 S = 9 ν0 = 50 α = 0.1 t0.05(13) = 1.771
• Suposiciones. Se supone que la muestra proviene de una población cuya
distribución es normal.
• Hipótesis. H0 : ν = 50 vs ν 6= 50
X−ν0
• Estadı́stica de prueba. t0 = S

n

• Distribución de la estadı́stica. t0 ∼ tα(n−1)


• Regla de decision. Rechazar H0 si | t0 |> t α2
53−50 3
• Calculo de la estadı́stica. t0 = √9
= 2.41 = 1.24
14

• Decision estadı́stica. Como t0 es menor que t α2 , se acepta H0


• Conclusiones. Con un nivel de significancia de α = 0.10 no se puede
concluir que ν 6= 50
Para cada uno de los estudios descritos en los ejercicios 33 al 38, responda
todas las preguntas posibles que se formulan a continuación
• Cuál es la variable de interés?
• Qué parámetro es el de interés: la media, la diferencia entre las medias
(de muestras independientes), la diferencia entre las medias (de datos
por parejas), una proporción, o la diferencia entre dos proporciones (de
muestras independientes)?
• Cual es la población muestreada?
• Cual es la población objetivo?
• Cuales son las hipótesis nula y alternativa?
• Es una alternativa unilateral por la cola izquierda o por la cola derecha,
o es bilateral?
• Que errores de tipo I y II pueden suceder?
• Fue rechazada la hipótesis?, explique las causas de porque fue o no rec-
hazada.
Ejercicio 33
Jara et al. condujeron un estudio en el que encontraron concentraciones de
potacio en la saliva de pacientes son sindrome de Down en niveles bastante in-
feriores a los encontrados en individuos de control.

Solución.

19
• Concentraciones de potasio.
• La diferencia de medias entre dos muestras independientes.

• Niños con y sin sindrome de Dowm.


• Niños.
• H0 : La concentración de potasio fue menos o igual en los individuos de
control que en los niños con sindrome de Dowm.
Ha : La concentración de potasio fue mayor en individuos de control que
en los niños con sindrome de Dowm.
• Se tiene una distribución de dos colas.
• Error tipo I: Decir que los niveles son elevados, dado que son inferiores
para los niños con sı́ndrome de Dowm.
Error tipo II: Decir que los niveles son inferiores dada que son superiores.
• No se tienen datos suficientes para poder aceptar o rechazar la hipótesis.

Ejercicio 34

Hemming et al. (A-36) estudiaron por espacio de tres años a 50 pacientes con-
secutivos que se sometieron a resección de un segmento hep·tico. Se utilizaron
pruebas t de Student para analizar los datos. Entre los hallazgos est· el hecho
de que los pacientes cirróticos mostraron incrementos significativos en los re-
querimientos de transfusión que pasaron de 0.7 ± 1.3U a 2.0 ± 1.3U.

Solución.

• El requerimiento de transfusión (X).

• La diferencia entre las medias.


• n = 50
• Los pacientes cirróticos.
• H0 : δ = δ0 vsHa : δ 6= δ0 .

• Es una alternativa bilateral.


• Error tipo I Dado que H0 es verdadero se puede concluir que es falsa. El
tratamiento no funciona.
Error tipo II Dado que H0 es falsa se puede concluir que es verdadero.

• No se puede saber ya que no se cuenta con los datos suficientes.

Ejercicio 35

Sokas et al. reportaron un estudio en el que los estudiantes d medicina de se-


gundo año participaron en un programa de capacitación que se concentró princi-
palmente en los riesgos a la exposición a enfermedades de transmisión sanguı́nea
y en las técnicas de flebotomı́a e inyección intravenosa que utilizan medidas de

20
precaución universales. Los estudiantes respondieron antes y después del entre-
namiento preguntas de conocimientos y calificaron su preparación en una escala
de cinco puntos. Los investigadores encontraron que los conocimientos del es-
tudiante y la calificación sobre preparación aumentaron según la autoevaluación.

Solución.

• El conocimiento que los alumnos tienen antes y después de la capacitación.


• La diferencia de medias entre las calificaciones antes y después del pro-
grama de capacitación.

• Los estudiantes de medicina de segundo año.


• Estudiantes de medicina.
• H0 : µ1 − µ2 = 0 vs Ha : µ1 < µ2 ,
donde µ1 y µ2 , representan la media antes y después del programa de
capacitación, respectivamente.

• De cola izquierda.
• El error tipo I.
• Se rechazó, puesto que se dice que los investigadores encontarron que los
conocimientos sobre preparación aumentaron según la autoevaluación.

Ejercicio 36

Wu et al. condujeron un estudio para determinar los efectos de la zidovudina en


el estado funcional y de bienestar de pacientes que se encontraban en la primera
etapa sintomática producida por la infección del virus de inmunodeficiencia hu-
mana (VIH). Se les aplicó placebo aleatoriamente a 34 individuos, y a 36 más
se les aplicó zidovudina. Después, se compararon los cambios medios de la lı́nea
de base para aquellos que recibieron zidovudina y los que recibieron placebo. En
todas las áreas de bienestar , incluyendo salud general, energı́a, salud mental,
relajamiento, dolor y calidad de vida, los individuos que recibieron placebo re-
portaron mejor calidad de vida en comparación con las cifras de lı́nea de base
que los individuos que recibieron zidovudina durante 24 semanas.

Solución.

• La comparación de los cambios medios de la lı́nea de base para aquellos


que recibieron zidovudina y los que recibieron placebo.
• La diferencia entre las medias.
• Se tienen dos muestras, una de ellas de 34 individuos a los cuales se les
aplicó un placebo y otra muestra de 36 personas a las que se les aplicó
zidovudina, todos ellos se encontraban en la primera etapa sintomática
producida por la infección del virus de inmunodeficiencia humana (VIH).
• Los pacientes que se encuentran en la primera etapa sintomática producida
por el VIH.

21
• Debemos probar que las medias en calidad de vida entre los individuos que
recibieron un placebo y los que recibieron zidovudina tienen una relación
de tipo mayor o menor, esto es, la media de la calidad de vida en los
individuos que recibieron placebo es mayor que la de los individuos que
recibieron zidovudina.
H0 : δ ≤ δ0 vs Ha : δ > δ0 , δ0 = µ1 − µ2 .
• Es una alternativa unilateral.

• Error tipo I: Puede suceder que se tenga que la media de los cambios de la
lı́nea de base sea mayor en los pacientes que recibieron un placebo cuando
en realidad esto es falso.
Error tipo II: Podemos aceptar que los cambios medios de la lı́nea de base
de los pacientes a los que se les aplicó un placebo son menores que de los
pacientes a los que se les aplicó zidovudina y esto sea falso.

• Podemos deducir que la hipótesis nula fue rechazada pues no hay evidencia
que indique que los pacientes que recibieron zidovudina obtuvieron mejores
resultados en algún aspecto que los pacientes que recibieron el placebo.

Ejercicio 37

Stockwall et al. ( A-34 ) clasificaron a 15 establecimientos con licencia para


vender alcohol en la ciudad de Perh en Australia Occidental, como de alto riesgo
( siete establecimientos ) o de bajo riesgo ( ocho establecimientos ), con base en
la incidencia de los consumidores involucrados en accidentes automovilśticos en
la carretera y delitos por conducir en estado de ebriedad. Estudiaron a 414 indi-
viduos que salieron de los establecimientos seleccionados, entre las 8 p.m. y las
12 a.m. durante los dı́as viernes y sábado. Encontraron que los establecimien-
tos de alto riesgo tenı́an el triple de consumidores con aliento alcoholico que
excedı́a de 0.15 mg/ml (p < .01). También, encontraron que significativamente
m·s dueños de establecimientos de alto riesgo son calificados como moderada
o severamente intoxicados en comparación con los dueños de establecimientos
de bajo riesgo. Ambos tipos de dueños se negaron a practicarse la prueba de
aliento alcoholico.

Solución.

• La media de los individuos que salen de un establecimiento de alto riesgo


y tiene aliento alcoholico que excede 0.15mg/ml con la media de los que
salen del establecimiento de bajo riesgo.
• La media,la diferencia entre las medias ( de muestras independientes ),la
diferencia entre las medias (de datos por pareja), una proporción, o la
diferencia entre dos proporciones (de muestras independientes)? La difer-
encia de medias entre las dos muestras.
• Los 414 individuos que salen de los establecimientos.
• Los individuos que salen de los establecimientos.

• H0 : δ = δ0 = 0.15 vs Ha : δ 6= δ0 = 0.15

22
• Es una alternativa bilateral.
• El error tipo I.

• Se rechaza H0 por que los establecimientos de alto riesgo tenı́an el triple


de consumidores con aliento alcoholico que excedı́a a 0.15mg/ml.

Ejercicio 38

Sera mayor la frecuencia de deficiencia de biotinidasa en niños con retardo inex-


plicable del desarrollo o con anormalidades neurologicas que en la población en
general? Esta pregunta fue estudiada por Sutherland et al. Los investigadores
examinaron durante un periodo de cuatro años 247 casos de niños atendidos
en una clı́nica para pacientes externos, quienes presentaban una o mas de estas
anormalidades neurologicas y para quienes no era posible encontrar la causa es-
pecifica de sus anormalidades. Ninguno de los pacientes con hallazgos atı́picos
de deficiencia de biotinidasa tenia deficiencia de la actividad de la misma.

Solución.
• La frecuencia de deficiencia de biotinidasa en niños.

• La proporción de la población.
• La población de niños es de 274 casos de niños con una o mas anormali-
dades neurológicas.
• La frecuencia de deficiencia de biotinidasa en niños.

• H0 : Sea menor la deficiencia de biotinidasa.


Ha : Sea mayor la deficiencia de biotinidasa.
• Es una alternativa unilateral por cola derecha.
• Error tipo I.

Ejercicio 39

Para cada una de las siguientes situaciones, identifique los errores de tipo I y
II y las acciones correctas a seguir.

Solución.

• H0 : Un nuevo tratamiento no es m·s eficiente que el tradicional.

– Adoptar el nuevo tratamiento cuando éste es más efectivo. Error tipo


I.
– Continuar con el tratamiento tradicional cuando el nuevo es más
efectivo. Acción correcta .
– Continuar con el tratamiento tradicional cuando el nuevo no es más
efectivo. Acción correcta.
– Adoptar el nuevo tratamiento cuando éste no es más efectivo. Error
tipo II.

23
• H0 : El nuevo procedimiento de terapia fı́sica es satisfactorio.
– Emplear el nuevo procedimiento cuando éste no es satisfactorio. Er-
ror tipo II.
– No utilizar el nuevo procedimiento cuando éste no es satisfactorio.
Acción correcta.
– No utilizar el nuevo procedimiento cuando éste es satisfactorio. Error
tipo I.
– Emplear el nuevo procedimiento cuando éste es satisfactorio. Acción
correcta.
• H0 : La producciÓn de un lote de un fármaco es de calidad satisfactoria.
– Rechazar el lote de calidad satisfactoria. Error tipo I.
– Aceptar el lote de calidad satisfactoria. Acción correcta.
– Rechazar el lote de calidad no satisfactoria. Acción correcta.
– Aceptar el lote de calidad no satisfactoria. Error tipo II.

Ejercicio 40

Un estudio realizado por Bell para investigar la hipótesis r especto a que la


alteración del sistema endocrino relacionado con la vitamina D en personas de
piel oscura se produce por la reducción de 25- hidroxivitamina D en el suero,
y que la alteración es revertida con el tratamiento oral de 25- hidroxivitamina,
D3 . Estudiaron a 8 individuos (tres hombres y cinco mujeres), primero sin
aplicarles el tratamiento (para las mediciones de control) y, posteriormente,
después de aplicarles el tratamiento de 25- hidroxivitamina D3 durante siete
dı́as (25 − OHD3 ). Las siguientes mediciones corresponden al calcio urinario
(mg/dı́a) de los ocho individuos expuestos a las dos condiciones.

Individuo Control 25 − OHD3


A 66 98
B 115 142
C 54 78
D 88 101
E 82 134
F 115 158
G 176 219
H 46 60

Solución.
2
• Datos. n = 8, m = 8, X = 92.75, Y = 123.75, SX = 1780.21, SX =
2 2 7(42.19)+7(50.74)
42.19, SY = 2574.5, SX = 50.74, Sp = 14 = 46.47, α = 0.1.
• Suposiciones.Se supone que la muestra proviene de una población cuya
distribución es normal.
• Hipótesis.H0 : δ = δ0 vs Ha : δ 6= δ0 .

• Estadı́stico de prueba. t0 = qX−Y −δ0 .


Sp2 ( n
1 1
+m )

24
• Distribución del estadı́stico.t0 ∼ tα/2(n+m−2) .
• Regla de decisión. Rechazar H0 si |t0 | ≥ t0.05(14) = 1.761.
92.75−123.75 −31
• Cálculo del estadı́stico. t0 = √ = 3.41 = −9.09.
46.47(0.25)

• Desición estadı́stica. Como |t0 | = 9.09 ≥ 1.761, se rechaza H0 .

• Conclusiones.Con un nivel de significancia α = 0.10, se puede concluir que


existe unadiferencia entre las medias, o bien, que una de las dos medias
supera a la otra.
• Cálculo de p. p = 2P (t0 ≥ 1.761) = 0.10.

Ejercicio 41

Montner condujeron estudios para probar los efectos de la hiperhidratacion mejo-


rada con glicerol (HMG) en la resistencia durante el desempeño ciclista. Los 11
individuos con edades entre 22 y 40 años, recorrı́an regularmente al menos 75
millas por semana. Los siguientes resultados corresponden al volumen de orina
(ml) excretado después de ingerir agua y glicerol antes del ejercicio

Individuo Experimental Control


ml (glicerol) ml (placebo)

1 1410 2375
2 610 1610
3 1170 1608
4 1140 1490
5 515 1475
6 580 1445
7 430 885
8 1140 1187
9 720 1445
10 275 890
11 875 1785

Solución.

• Datos. n = 11 m = 11 X = 805.9 Y = 1472.27 Sx2 = 354.7 Sy2 =


414.39 Sp2 = 389.5

• Supuestos. Se supone que la muestra ha sido tomada de una población


con distribución normal.
• Hipótesis. H0 : νx = νy vs Ha : νx 6= νy
−δ0
• Estadı́stica de prueba. t0 = √X−Y
2 1 1
Sp ( n + m )

• Distribución del estadı́stico de prueba. t0 ∼ t0.025(20)


• Regla de decisión. Rechazar H0 si t0 < −t0.025(20) = −2.086

25
805.9−1472.29
• Calculo del estadı́stico. t0 = √ 1 1
= − 666.37
8.4 = −79.3
389.5( 11 + 11 )

• Decisión estadı́stico. Como t0 es memor que −t0.025(20) entonces se rechaza


H0

• Conclusión. Con un nivel de significancia α = 0.05 se rechaza H0 . Ası́, se


concluye que las medias muestrales son distintas.

Ejercicio 42

D’ Allessandro el al. querı́an saber si la preexistencia de la hiperreactividad


(HR) de las vias respiratorias predisponia a los individos a un resultado mas
severo después de estar expuestos al cloro. Los individuos eran voluntarios sanos
con edades entre 18 y 30 años que fueron clasificados como individuos con y sin
hiperrreactividad. Las siguientes mediciones corresponden al VEF,(volumen es-
piratorio forzado) y a la resistencia especifica de las vı́as respiratorias (REVR
tomadas en individuos antes y después de estar expuestos al gas cloro adecuada-
mente diluido:
Sujetos hiperreactivos
Pre-exposición Post-exposición
Individuo VEF REVR VEF REVR
1 3.0 5.8 1.8 21.4
2 4.1 9.56 3.7 12.5
3 3.4 7.84 3.0 14.3
4 3.3 6.41 3.0 10.9
5 3.3 9.12 3.0 17.1

Sujetos hiperreactivos
Pre-exposición Post-exposición
Individuo VEF REVR VEF REVR
1 4.3 5.52 4.2 8.70
2 3.9 6.43 3.7 6.94
3 3.6 5.67 3.3 10.00
4 3.6 3.77 3.3 4.54
5 5.1 5.53 4.9 7.37

como se quiere conocer si la preexistencia de la hiperrelatividad de las vı́as


respiratorias predisponia a los individuos a un resultado mas severo después de
estar expuestos al cloro, entonces se puede preguntar, La media VEF es mayor
antes de estar expuestos al cloro que después?

Solución.
0.668
• Datos. n = 5 m = 5 X = 3.42 Y = 4.1 Sx2 = 4 = 0.167 Sy2 =
1.58 2
4 = 0.395 Sp = 0.281

• Supuestos. Se supone que las muestras provienen de una población que


sigue una distribución normal.
• Hipótesis. H0 : δ < δ0 vs. Ha : δ > δ0

26
−δ0
• Estadı́stico de prueba. t0 = √X−Y
2 1 1
Sp ( n + m )

• Distribución del estadı́stico. t0 ∼ t α2 (n+m−2) = t0.05(8)


• Regla de decision. Rechazar H0 si t0 > tα(n+m−2) = t0.01(8)

• Cálculo del estadı́stico. t0 = −2.02


• Decisición estadı́stica. Se tiene que t0 = −2.02 y t0.01(8) = 2.896, pero
−2.02 no es mayor que 2.896 por lo que H0 se acepta
• Conclusiones. Se concluye que la media de VEF es menor antes de estar
expuestos al cloro que después.
• Calculo de p.

Ejercicio 43

Al darse cuenta de la escazes de información respecto a los efectos del estrogeno


en la composición de acido graso de la membrana de las plaqueta. Ranganath
efectuaron un estudio para examinar la posibilidad de que los cambios puedan
presentarse en mujeres posmenopausicas y que estos puedan ser reversibles con
tratamiento a base de estrogenos. Las 31 mujeres reclutasas para el estudio no
habian menstruado desde hacia al menos tres meses o presentaban sintomas de
menopausia o ambas cosas. Ninguna de ellas habia recibido de forma alguna
tratamiento a base terapia de sustitución de hormonas al momento de reclutar-
las. Los siguientes valores corresponden a las mediciones de acido linoleico de
la membrana plaquetaria antes y después de la terapia de sustitución hormonal.

Ind Antes Despues Ind Antes Despues Ind Antes Despues


1 6.06 5.34 12 7.65 5.55 23 5.04 4.74
2 6.68 6.11 13 4.57 4.25 24 7.89 7.48
3 5.22 5.79 14 5.97 5.66 25 7.98 6.24
4 5.79 5.97 15 6.07 5.66 26 6.35 5.66
5 6.26 5.93 16 6.32 5.97 27 4.85 4.26
6 6.41 6.73 17 6.12 6.52 28 6.94 5.15
7 4.23 4.39 18 6.05 5.70 29 6.54 5.30
8 4.61 4.20 19 6.31 3.58 30 4.83 5.58
9 6.79 5.97 20 4.44 4.52 31 4.71 4.1
10 6.16 6.00 21 5.51 4.93
11 6.41 5.35 22 8.48 8.80

Solución.

• Datos. n = 31 X = 6.04 Y = 5.53 σx2 = 1.16 σy2 01.11 α = 0.05.


• Supuestos. Se supone que la muestra proviene de una población que tiene
distribución normal.

• Hipótesis. H0 : ν = ν0 vs ν 6= ν0 .
X−Y
• Estadı́stica de prueba. Z0 = 2
σx 2
σy
.
n + n

27
• Distribución del estadı́stico. Z0 ∼ N (0, 1).
• Regla de decisión. Rechazar H0 si | Z0 |> Z α2 = 1.96.

• Cálculo del estadı́stico. Z0 = √6.04−5.53


1.16 1.11
= √ 0.51
0.03+0.03
= 0.51
0.24 = 2.12.
31 + 31

• Decisión estadı́stica. Como Z0 es mas grande que Z α2 entonces se rechaza


H0 .
• Concluciones. Con un nivel de significancia de α = 0.05 se rechaza H0 .

Ejercicio 48

Diamond querı́a saber si la distribución cognitiva podria ser util para apoyar la
selección adecuada de candidatos para rehabilitación integral hospitalaria. Es-
tudiaron una muestra de pacientes de rehabilitacion geriatrica mediante el uso
de estrategias de medicion estandarizadas, entre los datos recolectados están las
siguientes calificaciones registradas en el examen de minimental de los individ-
uos al ingresas y ser dados de alta.

Admitidos Dados de alta Admitidos Dados de alta


9 10 24 26
11 11 24 30
14 19 24 28
15 15 25 26
16 17 25 22
16 15 26 26
16 17 26 28
16 17 26 26
17 14 27 28
17 18 27 28
17 21 27 27
18 21 27 27
18 21 27 27
19 21 28 28
19 25 28 29
19 21 28 29
19 22 28 29
19 19 29 28
20 22 29 28
21 23 29 30
22 22 29 30
22 19 29 30
22 26 29 30
23 21 29 30
24 21 30 30
24 20

Solución.

• Datos. n = 51 m = 51 X Y Sx2 = 28.96 Sy2 = 29.1 α = 0.05

28
• Supuestos. Se supone que las muestras provienen de una población nor-
mal.
• Hipótesis. H0 : S >>0 Ha : S < S0
X−Y −S0
• Estadı́stica de prueba. Z0 = Sx2 2
Sy
n + m

• Distribución del estadistico. Z0 ∼ N (0, 1)


• Cálculo del estadistico. Z0 = √22.6−23.45
28.96 29.1
= − √0.85
1.13
0.85
= − 1.06 = −0.80
51 + 51

• Regla de decisión. Rechazar H0 si Z0 < Zα = −1.65


• Decisión estadı́stica. Como Z0 es mas grande que Zα entonces se acepta
H0
• Concluciones. Con un nivel de significancia de α = 0.05 se acepta H0 . Ası́
se concluye que la calificación de los pacientes dados de alta es menor que
el de los admitidos.
• Calculo de p. P (z < −0.79) = 0.2148

Ejercicio 52

El objetivo de un estudio de Baker es determinar si la deformación medida altera


los efectos in vitro del plasma de pacientes con preeclampsia en la función celu-
lar endotelial para producir un paradigma similar al estado de la enfermedad in
vivo. Los individuos estudiados eran 24 mujeres embarazadas, primerizas antes
del trabajo de parto 12 de ellas tenı́an preeclampsia y las otras doce eran pa-
cientes con embarazo normal. Entre los datos recolectados están los siguientes
valores que corresponden a las edades gestionales al momento del parto.

Preeclampsia Embarazo normal


38 40
32 41
42 38
30 40
38 40
35 39
32 39
38 41
39 41
29 40
29 40
32 40

Solución.

• Datos. n = 12 m = 12 X = 34.5 Y = 39.91 Sx2 = 19.36 Sy2 =


0.81 α = 0.05
• Supuestos. Se supone que la muestra proviene de una población que tiene
una distribución normal.

29
• Hipótesis. H0 : ν = ν0 vs. ν 6= ν0
X−Y
• Estadı́stica de prueba. t0 = Sx2 2
Sy
n + m

• Distribución del estadı́stico. t0 ∼ t α2 (n+m−2)

• Regla de decisión. Rechazar H0 si | t0 |> t α2 (22) = 2.074

• Cálculo del estadı́stico. t0 = √34.5−39.91


19.36 0.81
= − 5.41
1.29 = −4.19
12 + 12

• Decisión estadı́stica. Como t0 es mas frande que t α2 (22) entonces se rechaza


H0

• Concluciones. Con un nivel de significancia de α = 0.05 podemos concluir


que la deformación media afecta los efectos in vitro del plasma del paciente
con preeclampsia.

Ejercicio 53

Zisselman et al. condujeron un estudio para evaluar el uso de la benzodiazepina


y el tratamiento de la depresion antes del ingreso a una unidad de psiquiatria
geriatrica hospitalaria, en una muestra de pacientes de la tercera edad. Entre
los datos recolectados están las siguientes calificaciones de los trastornos de
conducta de 27 pacientes tratados con benzodiazepina (C) y 28 pacientes que no
recibieron el tratamiento (S).

C S
.00 1.00 .00 .00
.00 1.00 .00 10.00
.00 .00 .00 .00
.00 .00 .00 18.00
.00 10.00 .00 .00
.00 2.00 .00 2.00
.00 .00 5.00
.00 .00
.00 4.00
.00 1.00
4.00 2.00
3.00 .00
2.00 6.00
.00 .00
10.00 .00
2.00 1.00
.00 2.00
9.00 1.00
.00 22.00
1.00 .00
16.00 .00

Solución.

30
• Datos. n = 27 m = 28 X = 2.26 Y = 2.64 Sx2 = 16.9 Sy2 =
29.8 Sp2 = 23.5 α = 0.01

• Suposiciones. Se supone que la muestra proviene de una población cuya


distribución es normal.
• Hipótesis. H0 : δ = δ0 vs Ha : δ 6= δ0
X−Y −δ0
• Estadı́stica de prueba. t0 = 1
Sp2 ( n 1
+m

• Distribución de la estadı́stica. t0 ∼ t α2 (n+m−2) = 2.66


• Regla de decisión. Rechazar H0 si | t0 |> t0.005(60) = 2.66

• Cálculo del estadı́stico. t0 = √ 2.26−2.64


1 1
= − 0.38
1.31 = −.29
23.5( 27 + 28 )

• Decisión estadı́stica. Como t0 es menor que t0.005(60) entonces se acepta


H0
• Conclusiones. Con un nivel de significancia de α = 0.01 se acepta H0 .
Ası́ se concluye que existe una diferencia en la conducta respecto a los
pacientes tratados con benzodiazepina y el tratamiento de la depresión.

Ejercicios del tercer parcial


Ejercicio 11.3

Ajuste una recta a los cincos puntos de la tabla siguiente. De las estimaciones de
β0 y β1 . Localice los puntos y trace la recta ajustada como prueba de los cálculos.

y 3.0 2.0 1.0 1.0 0.5


x -2.0 -1.0 0.0 1.0 2.0
Solución.
Datos.
5 5 5 5
x2i = 10
P P P P
n = 5,x = 0,y = 1.5, xi = 0, yi = 7.5, xi yi = 6,
i=1 i=1 i=1 i=1
Obtengamos el ajuste de la recta por el método de mı́nimos cuadrados ŷ =
βˆ0 + βˆ1 x. Calculemos ahora β1 , esto es

5 5 5
1
P P P
xi yi − xi yi
i=1
n
i=1 i=1 6 − 51 (0)(7.5) 6
βˆ1 = 5 5
= 1 2
= = −0.6
1 10 − 5 (10) 10
x2i −
P P
n( xi )2
i=1 i=1

Ahora obtengamos βˆ0 ,, esto es βˆ0 = y − βˆ1 x = 1.5. Sustituyendo el valor de


β0 y de βˆ1 tenemos que el ajuste esta dado por:
ˆ

ŷ = 1.5 − 0.6x.

Ası́ obtenemos los siguientes datos

31
x ŷ
-2 2.7
-1 2.1
0 1.5
1 0.9
2 0.3
Entonces la gráfica del ajuste esta dado por:

Figure 1: Gráfica de linea ajustada del ejercicio 11.3

Ejercicio 11.4

Es frecuente que a los auditores se es exija comparar el valor auditado (o de lista)


de un articulo de inventario contra el valor en libros. Si una empresa esta lle-
vando su inventario y libros actualizados, deberı́a haber una fuerte relación lineal
entre los valores auditados y en libros. Una empresa muestreo diez artı́culos de
inventario y obtuvo los valores auditado y en libros que se dan en la tabla sigu-
iente, Ajuste el modelo Y = β0 + β1 +  a estos datos.

Articulo Valor auditado (yi ) Valor en libros (xi )


1 9 10
2 14 12
3 7 9
4 29 27
5 45 47
6 109 112
7 40 36
8 238 241
9 60 59
10 170 167

• Cual es su estimación para el cambio esperado en valor auditado para un


cambio de una unidad en el valor en libros?
• Si el valor en libros es x = 100, que usarı́a para estimar el valor auditado?

Solución.

32
Datos.
10 10 10 10
x2i = 106554,
P P P P
n = 10, y = 72.1, x = 72, xi = 720, yi = 721, xi yi =
i=1 i=1 i=1 i=1
106155.
Obtengamos el ajuste de la recta por el método de mı́nimos cuadrados ŷ =
βˆ0 + βˆ1 x. Calculemos ahora β̂1
P P
xi yi − yin xi 106155 − (720)(721)
P
10 54243
β1 = P P
( xi )2 = (720)2
= = 0.9913.
2
xi − n 106554 − 10 54714

Luego β̂0 = y − β̂1 x = 72.1 − 0.9913(72) = 72.1 − 71.3736 = 0.7264. Por lo


que el ajuste esta dado por

ŷ = 0.7264 + 0.9913x.
Ası́ obtenemos los siguientes datos
x ŷ
10 10.6394
12 12.6220
9 9.6481
27 27.4915
47 47.3175
112 111.752
36 36.4132
241 239.6297
59 59.2131
167 166.2735
Entonces la gráfica del ajuste esta dado por:

Figure 2: Gráfica de linea ajustada del ejercicio 11.4

Para resolver el siguiente inciso sustituimos x = 100 en el ajuste encontrado


en el inciso anterior, luego

ŷ = 0.7264 + 0.9913x = 0.7264 + 0.9913(100) = 99.8564


Luego para estimar el valor auditado tomemos el valor de 99.8564.

33
Ejercicio 11.5

Qué aspecto tenı́an los precios de vivienda en los ”buenos y viejos tiempos”? La
mediana de los precios de venta para casas nuevas unifamiliares se dan en la
tabla siguiente, para los años 1972 a 1979. Si con y denotamos la mediana de
los precios de venta y con x el año (usando enteros 1, 2, . . . , 8), ajuste el modelo
Y = β̂0 + β̂1 x + . Qué se puede concluir de los resultados?

Año Mediana de los precios


de los años(x 1000)
1972 (1) $27.6
1973 (2) $32.5
1974 (3) $35.9
1975 (4) $39.3
1976 (5) $44.2
1977 (6) $48.8
1978 (7) $55.7
1979 (8) $62.9
Solución.
Para resolver este ejercicio observemos que el modelo ŷ = β0 + β1 x +  se ajusta
por le método de matrices, luego
Datos.
   
1 1 27.6
 1 2   32.5 
   
 1 3   35.9 
   
 1 4   39.3 
x=   y=  
 1 5   44.2 
 
 1 6   48.8 
   
 1 7   55.7 
1 8 62.9
Teniendo en cuenta estos datos, se prosigue a realizar las operaciones nece-
sarias para encontrar β̂0 y β̂1 luego  
27.6
 32.5 
 
  35.9  
 
 
1 1 1 1 1 1 1 1  39.3   346.9
xt y = =
1 2 3 4 5 6 7 8   44.2 
 1764.4
 48.8 
 
 55.7 
62.9
 
1 1
 1 2 
 
 1 3  
 
 
t 1 1 1 1 1 1 1 1  1 4   8 36
xx=  = 36 204

1 2 3 4 5 6 7 8   1 5 
 1 6 
 
 1 7 
1 8
La matriz inversa esta dada por:

34
 
t −1 17/28 −3/28
(x x) =
−3/28 1/42
      
0 −1 0 17/28 −3/28 346.9 21.57 β̂0
Luego (x x) (x y) = = =
−3/28 1/42 1764.4 4.84 β̂1
De donde β̂0 = 21.57 y β̂1 = 4.84, por lo que el ajuste esta dado por:
ŷ = 21.57 + 4.84x.
Obteniendo ası́ los siguientes datos
x ŷ
1 26.41
2 31.25
3 36.09
4 40.93
5 45.17
6 50.61
7 55.45
8 60.29
Luego la gráfica queda de la siguiente forma

Figure 3: Gráfica del ejercicio 11.5

Ası́ podemos concluir que conforme pasan los años va en aumento el precio
de las viviendas.

Ejercicio 11.9

En la siguiente tabla aparece información acerca de ocho automóviles de cuatro


cilindros considerados entre los más eficientes en consumo de combustible en
2006. Los tamaños de los motores se dan en volumen total de cilindros, medido
en litros (L).

Automóvil V olumen de cilimdros(x) Caballos de potencia(y)


Honda civic 1.8 51
Toyota prius 1.5 51
VW Golf 2.0 115
VW Beetle 2.5 150
Toyota Corolla 1.8 126
VW Jetta 2.5 150
Mini Cooper 1.6 118
Toyota Yaris 1.5 106

35
a) Localice los puntos en papel milimétrico.
b) Encuentre la recta de mı́nimos cuadrados para los datos.
c) Grafique la recta de mı́nimos cuadrados para ver lo bien que se ajusta a los
datos.
d) Use la recta de mı́nimos cuadrados para estimar la clasificación media de po-
tencia para un automóvil eficiente en uso de combustible con volumen de cilin-
dros de 1.9 L.

Solución.
Datos.
8 8
x2i = 30.04.
P P
n = 8, X = 1.9, Y = 108.37, xi yi = 1722.9,
i=1 i=1

Obtengamos el ajuste de la recta por el método de mı́nimos cuadrados.


Calculemos β̂1 ,

1722.9 − 8(1.9)(108.37) 1722.9 − (1.9)(867) 75.6


βˆ1 = 2
= = = 65.17 (1)
30.04 − 8(1.9) 30.04 − 28.88 1.16

Luego β̂0 = Y − βb1 X = 108.37 − 65.17(1.9) = 108.37 − 123.82 = −15.45. Por


lo que el ajuste esta dado por

ŷ = −15.45 + 65.17x.

La gráfica de los datos anteriores es la siguiente:

Figure 4: Grafica de la recta de mı́nimos cuadrados del ejercicio 11.9

Para x = 1.9 se tiene que ŷ = 108.37. Por lo tanto se estima una potencia
de 108.37 caballos.

Ejercicio 11.10

Suponga que hemos postulado el modelo Yi = β1 xi + i i = 1, 2, ...n donde


las i son variables aleatorias independientes y distribuidas identicamente con
E(i ) = P
0. Entonces yi = β1 xi es el valor pronosticado de y cuando x = xi y
n
SSE = i=1 [yi − β1 xi ]2 . Encuentre el estimador de minimos cuadrados de β1 .
(Observe que la ecuación y = βx describe una recta que pasa por el origen. A
menudo el modelo que acabamos de describir se denomina modelo sin puntos de
cruce.)

36
Solución.
Para esto seguiremos el mismo procedimiento con el que se utiliza para
encontrar β0 y β1 de y = β0 + β1 x, luego

y = β1
X X
y = β1 x
P
y
β1 = P
x
P
Por lo que el estimador de minimos cuadrados de β1 es Py
x

Ejercicio 11.11

Algunos datos obtenidos por C. E. Marcellari sobre la altura x y diámetro y de


caparazones de tortuga aparecen en la tabla siguiente. Si consideramos el modelo
E(Y ) = β1 x, entonces la pendiente β1 es la razon entre el diámetro medio y la
altura. Use el resultado del Ejercicio 11.10 y los datos siguientes para obtener
la estimación de mı́nimos cuadrados de la relación entre el diámetro medio y la
altura.
Especimen Diametro(y) Altura(x)
OSU 36651 185 78
OSU 36652 194 65
OSU 36653 173 77
OSU 36654 200 76
OSU 36655 179 72
OSU 36656 213 76
OSU 36657 134 75
OSU 36658 191 77
OSU 36659 177 69
OSU 36660 199 65

Solución. Para resolver este ejercicio consideremos el modelo E(y) = β1 x.


10
P P10
Datos. n = 10, yi = 1845, xi = 730.
i=1 i=1
Ahora, sustituyendo estos valores en el estimador de mı́nimos cuadrados de β1 ,
luego
10
P
yi
i=1 1845
β̂1 = 10
= = 2.5273
P 730
xi
i=1

Por lo que el ajuste esta dada de la siguiente forma

ŷ = β̂1 x = 2.5273x
Ası́ obtenemos los siguientes valores

37
x y
78 197.1294
65 164.2745
77 194.6021
76 192.0748
72 181.9656
76 192.0748
75 189.5475
77 194.6021
69 174.3837
65 164.2745

Ejercicio 11.12

Por lo general las procesadores de alimentos preservan los pepinos fermentándolos


en una salmuera bajo en sales (6% a %9 de cloruro de sodio) y luego alma-
cenándolos en una salmuera de alto contenido de sales hasta que son utilizados
para producir varios tipos de pepinillos en vinagre. La salmuera alta en sales es
necesaria para retardar el suavizamiento de los pepinillos y evitar que se con-
gelen cuando se almacenan en el exterior en climas del norte. Los datos que
muestran la reducción de la consistencia de los pepinillos almacenados en una
salmuera baja en sales (2% a 3%) se dan en la tabla siguiente.

Semanas(x) Firmeza(y)
0 19.8
4 16.5
14 12.8
32 8.1
52 7.5

• Ajuste una recta de mı́nimos cuadrados a los datos.


• Para verificar sus cálculos, grafique los cinco puntos que representan los
datos y trace la recta. Le parece que la recta da un buen ajuste de los
puntos?
• Use la recta de mı́nimos cuadrados para estimar la consistencia media de
los pepinillos almacenados durante 20 semanas.

Solución.
a) Obtengamos el ajuste por el método de mı́nimos cuadrados.
Datos.
5 5 5 5
x2i = 3940.
P P P P
n = 5, xi = 102, yi = 64.7, xi yi = 894.4,
n=1 n=1 n=1 n=1

Ahora, sustituyendo estos valores en el estimador de mı́nimos cuadrados de


β1 , tenemos

5 5 5
1
P P P
xi yi − xi yi
n=1
n
n=1 n=1 894.4 − 15 (102)(64.7) −425.28
βˆ1 = = = = −0.2287.
5
1
5 3940 − 51 (102)2 1859.2.6
x2i −
P P
n( xi )2
n=1 n=1

38
Ahora obtenemos el valor de β0

βˆ0 = y − β
c1 x = 12.94 − (−0.2287)(20.4) = 17.60.

Por lo que el modelo ajustado es ŷ = β0 + β1 x = 17.6 − 0.2287x.


b) Ahora grafiquemos los datos de acuerdo al ajuste que se obtuvo en el inciso
anterior. Obtengamos los valores
x ŷ

0 17.6
4 16.68
14 14.39
32 10.28
52 5.7
Entonces la gráfica de este ajuste es el siguiente

Figure 5: Gráfica del ejercicio 11.12

c) Si x = 20 entonces tenemos que la consistencia media de los pepinillos du-


rante 20 semanas es de ŷ = 17.6 − 0.2287x = ŷ = 17.6 − 0.2287(20) = 13.02.
Ejercicio 11.14
J.H. Matis y T.E. Wehrly publicaron la siguiente tabla de datos sobre la pro-
porción de peces de agua dulce que resisten un nivel fijo de contaminación
térmica durante lapsos variables.
P roporción de sobrevivientes(y) tiempo a escala(x)
1.00 .10
.95 .15
.95 .20
.90 .25
.85 .30
.70 .35
.65 .40
.60 .45
.55 .50
.40 .55
a) Ajuste el modelo lineal Y = β0 + β1 x + . De su interpretación.

39
b) Localice los puntos y grafique el resultado del inciso a. La recta pasa por
los puntos?.

Solución.
Datos. P P 2
n = 10,X = 0.325, Y = 0.755, xi yi = 2.18, xi = 1.26.

Ajustemos el modelo lineal, para esto calculemos β̂0 , β̂1 . Luego

2.18 − 10(0.755)(0.325) 2.18 − (7.55)(0.325) −0.27


β̂1 = = = = −1.32
1.26 − 10(0.1056) 1.26 − 1.056 0.204

Luego β̂0 = Y − βb1 X = 0.755 − 1.28(0.325) = 0.755 + 0.5324 = 1.28


Por lo que el ajuste está dado por , ŷ = 1.28 − 1.32x. Podemos concluir
que la proporción de peces de agua dulce que sobreviven es cada vez menor, con-
forme pasa el tiempo que permanecen expuestos a un nivel fijo de contaminación
térmica, pues la pendiente es negativa.
La gráfica obtenida con el ajuste es la siguiente:

Figure 6: Gráfica del ajuste lineal del Ejercicio 11.12

Podemos observar que la recta no toca los puntos.

Ejercicio 11.16

Se realizó un experimento para observar el efecto de un aumento en temperatura


en la potencia de un antibiótico. Tres porciones de 1 onza del antibiótico se al-
macenaron durante tiempos iguales a cada una de las siguientes temperaturas
Fahrenheit: 30%, 50%, 70%, y 90%. Las lecturas de potencia observadas al final
del periodo experimental fueron como se muestra en la tabla siguiente.

Lectura de potencia (y) 38,43,29 32,26,33 19,27,23 14,19,21


Temperatura (x) 30% 50% 70% 90%

• Encuentre la recta de mńimos cuadrados apropiada para estos datos.

• Localice los puntos y grafique la recta como comprobación de los cálculos.


• Calcule S 2 .

40
Solución.
Obtengamos la media de los valores de y

Lectura de potencia (w) 36.66 30.33 23 18


Temperatura (x) 30% 50% 70% 90%
a) Obtengamos el ajuste de la recta por el método de mı́nimos cuadrados
ŷ = βˆ0 + βˆ1 x.
Datos.
4 4 4 4
x2i = 16400, x = 60,
P P P P
n = 4, xi = 240, wi = 107.99, xi wi = 5846.3,
i=1 i=1 i=1 i=1
w = 26.99.

Sustituyendo estos valores en el estimador de mı́nimos cuadrados de β1 ,


tenemos

5 5 5
1
P P P
xi wi − xi wi
n=1
n
n=1 n=1 5846.3 − 14 (240)(107.99) −633.1
βˆ1 = = = = −0.3165
5
1
5 16400 − 14 (240)2 2000
x2i −
P P
n( xi )2
n=1 n=1

Luego
βˆ0 = w − βˆ1 x = 26.99 − (−0.3165)(60) = 45.98.
. Por lo que el ajuste esta dado por:

ŷ = 45.98 − 0.1365x.

Obtengamos la tabla de los valores


x ŵ
30 36.48
50 30.15
70 23.82
90 17.49
b)Entonces la gráfica del ajuste esta dado por:

Figure 7: Gráfica del ejercicio 11.16

c) Calculemos S 2

41
4
(wi − w)2 − β̂1
P P
(xi − x)(wi − w)
SEE i=1
S2 = =
n−2 n−2
201.4 − (−0.3165)(−543.2)
= = 14.73
2
Ejercicio 11.19
Se realizó un estudio para determinar los efectos de la privación de sueño en
la capacidad de las personas para resolver problemas sencillos. La cantidad de
privación de sueño vario en 8, 12, 16, 20 y 24 horas sin dormir. Un total de
diez individuos participaron en el estudio, dos por cada nivel de privación de
sueño. Después de su periodo de privación de sueño, a cada individuo se le
presento un conjunto de problemas sencillos de sumas para que lo resolvieran,
registrandose el numero de errores, se obtuvieron los resultados mostrados en
la tabla siguiente.
Numero de errores (y) 8, 6 6, 10 8, 14 14, 12 16, 12
Numero de horas sin dormir (x) 8 12 16 20 24
• Encuentre la recta de mı́nimos cuadrados apropiada para estos datos.
• Localice los puntos y grafique la recta de minimos cuadrados en sus cálculos.
• Calcule S 2 .
Solución.
Datos.
5 5 5 5
(yi − y)2 = 37.2,
P P P P
n = 5, x = 80, y = 53, (xi − x)(yi − y) = 76,
i=1 i=1 i=1 i=1
x = 16, y = 10.6
Calculemos β̂1 , luego
5
P 5
P
5
P xi yi
i=1 i=1
xi yi − n (53)(80)
i=1 924 − 5 76
β̂1 = = 2 = = 0.475
− (80)
5
5 (
P
xi )2 1440 160
5
x2i −
P i=1
n
i=1

Ahora calculemos el valor de β̂0 , esto es

β̂0 = y − β1 x = 10.6 − 0.475(16) = 3


Por lo que el ajuste esta dado por ŷ = 3 + 0.475x, con este ajuste obtenemos
los siguientes datos

x y

8 6.8
12 8.7
16 10.6
20 12.5
24 14.4

42
Luego la gráfica obtenida con este ajuste es la siguiente

Figure 8: Gráfica del ejercicio 11.19

Ahora calculemos S 2 , esto es

5 5
(yi − y)2 − βi
P P
(xi − x)(yi − y)
i=1 i=1 37.2 − 0.475(76) 1.1
S2 = = = = 0.3666
n−2 3 3
Ejercicio 11.67
Use el método de matrices para ajustar una recta a los datos de la siguiente tabla,
grafique los puntos y luego trace la recta ajustada como prueba de los cálculos.
Los datos son los mismos del Ejercicio 11.3 excepto que están recorridos 1 unidad
en la dirección positiva a lo largo del eje x. Que efecto tiene la separación
simétrica en los valores x alrededor de x = 0 sobre la forma de la matriz (X t X)
y los cálculos resultantes?
y x
3 −1
2 0
1 1
1 2
0.5 3
Solución.    
3 1 −1
2 1 0 
   
Datos. y =  1
 
 , x = 1 1 ,
 
1 1 2 
0.5 1 3
Teniendo en cuenta estos valores, a continuacion se realizan las siguientes
operaciones para obtener β̂0 y β̂1 , luego
 
1 −1
  1 0   
1 1 1 1 1  1 1  = 5 5
xt x =

−1 0 1 2 3  
1 2  5 15
1 3

43
 
3
  2   
t 1 1 1 1 1   1  = 7.5

yy=
−1 0 1 2 3  1
 1.5
0.5
 3 1

− 10
(xt x)−1 = 10
1 1
− 10 10
Luego
3 1
      
− 10 7.5 2.1 β̂
β̂ = (xt x)−1 (xt x) = 10
1 1 = = 0
− 10 10 1.5 −0.6 β̂1
Por lo que el ajuste lineal esta dada por y = 2.1 − 0.6x, por lo que los datos
que se obtienen de esto se presentan a continuación

x y

−1 2.7
0 2.1
1 1.5
2 0.9
3 0.3
A continuación se presenta la gráfica de los datos anteriores

Figure 9: Gráfica del ejercicio 11.67

Ejercicio 11.68

Ajuste el modelo cuadrático Y = β0 + β1 x + β2 x2 +  a los datos de la tabla


siguiente. Localice los puntos y trace la par·bola ajustada como prueba de los
cálculos.

44
y x
1 -3
0 -2
0 -1
-1 0
-1 1
0 2
0 3
Solución.
Datos.
   
1 1 −3 9
 0   1 −2 4 
   
 0   1 −1 1 
   
y=  −1  x =  1 0 0 
  
 −1   1 1 1 
   
 0   1 2 4 
0 1 3 9
Teniendo estos valores, obtengamos los estimadores
  β̂0 y β̂1 , luego
1
 0 
     
1 1 1 1 1 1 1  0 
  −1
xt y =  −3 −2 −1 0 1 2 3  y =   −1  = −4
  
9 4 1 0 1 4 9  −1  8
 
 0 
0
 
1 −3 9
 
 1 −2 4 
  
1 1 1 1 1 1 1  1 −1 1  7 0 28
(xt x) =  −3
 
−2 −1 0 1 2 3  
 1 0 0 
 =  0 28 0 
9 4 1 0 1 4 9   1 1 1 
 28 0 196
 1 2 4 
1 3 9

Obtengamos  la inversa de la ultima matriz.



1/3 0 −1/21
(xt x)−1 =  0 1/28 0 
−1/21 0 1/84
    
1/3 0 −1/21 −1 −5/7
luego β̂ = (xt x)−1 (xty) =  0 1/28 0   −4  =  −1/7 
−1/21 0 1/84 8 1/7
Por lo que el ajuste esta dado por:

ŷ = −0.7142 − 0.1428x + 0.1428x2 .

Luego los datos que se obtienen se presentan a continuación

45
x ŷ
-3 2.42
-2 1.57
-1 0.9998
0 0.7142
1 0.7142
2 0.9998
3 1.57
Luego entonces la gráfica del ajuste es:

Figure 10: Gráfica del Ejericio 11.68

Ejercicio 11.69

El fabricante de autos Lexus ha aumentado continuamente sus ventas desde el


lanzamiento de esa marca en 1989 en Estados Unidos. No obstante, el porcentaje
de aumento cambió en 1996 cuando el Lexus introdujo una lı́nea de camiones.
Las ventas de vehı́culos Lexus de 1996 a 2003 se muestran en la siguiente tabla.

x y
1996 18.5
1997 22.6
1998 27.2
1999 31.2
2000 33.0
2001 44.9
2002 49.4
2003 35.0

a) Denotando con Y las ventas y con x el año cifrado (−7 para 1996, −5 para
1997, hasta 7 para 2003 ), ajuste el modelo Y = β0 + β1 x + .
b) Para los mismos datos, ajuste el modelo Y = β0 + β1 x + β2 x2 + .

Solución.
Datos.
8 8
x2i = 168,
P P
n = 8,x = 0, xi yi = 304.4,y = 32.72.
i=1 i=1
Para un mejor manejo de tabla tomaremos en cuenta las sustituciones que
nos hace el inciso, esto es

46
x y
-7 18.5
-5 22.6
-3 27.2
-1 31.2
1 33.0
3 44.9
5 49.4
7 35.0

Teniendo en cuenta estos datos, obtengamos los estimadores β̂0 y β̂1 , luego
8
P
xi yi − nxy
i=1 304.4
β̂1 = 8
= = 1.81
168
x2i − nx2
P
i=1

Luego β̂0 = y − βb1 x = 32.72. Por lo que el ajuste esta dado por ŷ =
32.72 + 1.81x.

Ahora ajustemos por el método de matrices el modelo y = β0 +β1 x+β2 x2 +.


Datos.
 
18.5
 22.6 
 
 27.2 
 
 31.2 
y=  
 33.0 

 44.9 
 
 49.4 
35.0
 
1 −7 49
 1 −5 25 
 
 1 −3 9 
 
 1 −1 1 
x=  1 1

 1  
 1 3 9 
 
 1 5 25 
1 7 49

Teniendo en cuenta estos datos, encontremos los estimadores β̂0 y β̂1 , luego
 
8 0 168
xt x =  0 168 0 
168 0 6216
 
37/128 0 −1/128
(xt x)−1 =  0 1/168 0 
−1/128 0 1/2688

47
 
261.8
xt y =  304.4 
5134.6
De donde,
 
35.61
β̂ =  1.79 
−.5016
Luego

ŷ = 35.61 + 1.79x − .5016x2


La gráfica obtenida es la siguiente:

Figure 11: Gráfica de la recta de ajuste lineal del ejercicio 11.69

Figure 12: Gráfica de la recta de ajuste cuadrático del ejercicio 11.69

Ejercicio 11.70

Calcule SSE y S 2 para el Ejercicio 11.4. Use el metodo de matrices.

Solución. Del ejercicio 11.4 tenemos los siguientes datos. n = 10, β0 = 0.7198,
β1 = 0.9913, luego calculemos SSE, esto es

SSE = y t y − β t xt y.

48
Ahora calculemos cada uno de los datos que nos pide la fórmula, por un lado
tenemos que
 
  721
yt y =
P 2
yi = 105817 y β t xt y = 0.7198 0.9913 = 105750.4273.
106155
Por lo que SSE = 105817 − 105750.4273 = 66.5727, teniendo ya este valor,
proseguimos a sustituir en el S 2 ,
SSE 66.5727
S2 = = = 8.32158
n−2 8
Ası́ S = 2.8847

49