Sie sind auf Seite 1von 14

Estadstica II

Ejercicios Tema 3
Soluciones

1. Se quiere evaluar el efecto del ruido sobre la habilidad de las personas para realizar una determinada
tarea. Para ello, se seleccionan 32 personas que son capaces de realizar la misma tarea en el mismo
tiempo para realizar dicha tarea en un medio controlado y bajo 2 niveles distintos de ruido de fondo.
De entre esas 32, se seleccionan aleatoriamente 16 para llevar a cabo la tarea sometidas a un ruido
de fondo de nivel 2. Las restantes 16 las realizaran con poco ruido de fondo (nivel 1). Los tiempos
(en minutos) que se registran son:
nivel 1
nivel 2

14
20

12
22

15
18

15
18

11
19

16
15

17
18

12
15

14
22

13
18

18
19

13
15

18
21

15
22

16
18

11
16

(a) Plantea el contraste oportuno, especificando claramente la hipotesis nula y alternativa que
consideras.
(b) Calcula el p-valor del contraste, suponiendo normalidad y la misma varianza.
Soluci
on.
a) Lo que queremos saber es si el aumentar el nivel de ruido influye negativamente en la capacidad
para llevar a cabo la tarea en cuestion y, por tanto, optamos por plantear un contraste unilateral.
H0 : 1 2
H1 : 1 < 2
donde 1 y 2 representan los tiempos medios de realizacion de la tarea bajo los niveles de ruido
1 y 2, respectivamente. La hip
otesis alternativa implica que al aumentar el nivel de ruido del
nivel 1 al 2 el tiempo medio de realizacion de la tarea aumenta estrictamente.
b) En este caso, para tomar una decision asumimos que X N (1 , 2 ), Y N (2 , 2 ), siendo
X1 . . . , X16 , Y1 , . . . , Y16 dos m.a.s. de X e Y , respectivamente, independientes entre s.
La asignaci
on de personasnivel de ruido se hizo aleatoriamente para evitar sesgos.
1 , y la region de rechazo:
El estadstico del contraste es T = XY
sP

R = {T t30, } = {T t30, }
Para los datos obtenidos:
x = 14.375
s2X

y = 18.5
s2Y

= 5.18333

sX = 2.27669

sY = 2.44949

Como n1 = n2 s2P es la media de s2X y s2Y , s2P =


t=

= 6.0

5.18333+6
2

= 5.59166. Luego,

14.375 18.5
-4.125
q 2
= -4.9339
=
0.8360
sP
8

El p-valor del contraste vendr


a dado por la probabilidad de obtener un valor tan peque
no como
el obtenido cuando la hip
otesis nula es cierta:
p valor = P {T30 -4.9339} < 5 104
Para =0.0005 se tiene que el valor crtico correspondiente es t30;0.0005 =3.646. Como t =
-4.9339 < -3.646 se rechaza H0 a un nivel de significacion de = 5 104 . Luego, p-valor<
0.0005. Si calculamos la probabilidad anterior con ayuda de un ordenador se obtiene p-valor=
1.18 105 .
1

2. Se quiere determinar si el paro en dos grandes areas urbanas del pas, como son Madrid y Barcelona,
es diferente. Para ello se toman muestras aleatorias en ambas ciudades, cada una de 500 personas,
obteniendose que en Madrid 35 estaban desempleadas y en Barcelona 25. Existe alguna razon para
creer que las frecuencias de paro en Madrid y Barcelona son diferentes?
(a) Plantea el contraste oportuno con un nivel de significacion del 5 %, especificando claramente la
hip
otesis nula y alternativa que consideras, as como las hipotesis de trabajo.
(b) Calcula el p-valor del contraste.
Soluci
on.
(a) Las dos poblaciones que se est
an comparando son las respectivas poblaciones activas de las
ciudades de Madrid y Barcelona. Las dos variables aleatorias de trabajo son:
X Ber(pM )
Y Ber(pB )
donde pM = probabilidad de estar en paro en Madrid, y pB = probabilidad de estar en paro
en Barcelona.
Queremos comparar la proporci
on de desempleados en ambas ciudades, para lo que planteamos
el contraste de hip
otesis:
H0 : pM = pB = p0
H1 : pM 6= pB
Como n1 = n2 = 500 son grandes, podemos construir el contraste a partir del estadstico:
T (X1 , . . . , X500 ; Y1 , . . . , Y500 ) = p

pM pB
p0 (1 p0 )/250

vH0 N (0, 1)

+500pB
es la mejor estimacion de la frecuencia de paro com
un bajo H0 , y pM ,
donde p0 = 500pM1000
pB son las proporciones muestrales correspondientes a Madrid y Barcelona, respectivamente.
La regi
on de rechazo del contraste, para = 0,05, es:




n
o
pM pB


R = (x1 , . . . , x500 ; y1 , . . . , y500 ) / p
z 2 = 1.96
p0 (1 p0 )/250

En nuestro caso, pM =

35
500

=0.07, pB =
p0 =

Luego,

25
500

=0.05, y

pM + pB
0,07 + 0,05
=
= 0,06
2
2

0,07 0,05
T (x1 , . . . , x500 ; y1 , . . . , y500 ) = q
w 1,33 < 1,96
0,060,94
250

A un nivel de significaci
on del 5 % no hay evidencia estadstica de que las frecuencias de paro
sean diferentes.
Para aplicar el resultado anterior tenemos que asumir que las dos muestras tomadas son independientes entre s y son cada una de ellas m.a.s. La aleatorizacion, ademas del resultado teorico,
trata de evitar que las diferencias detectadas puedan ser debidas a otros factores distintos de
la ciudad, como pudiera ser el sector (falso positivo).
(b) El p-valor del contraste, al ser bilateral, se calcula como


p = mn 2P r{Z 1,33}, 2P r{Z 1,33} = 2 0,0918 = 0,1836,
siendo Z N (0, 1). Ten en cuenta que p te debe salir mayor que 0,05.

3. Construye un intervalo de confianza de nivel 1 para la diferencia de medias de dos poblaciones


normales cuando podemos asumir que tienen la misma varianza, X N (X , 2 ), Y N (Y , 2 ),
y disponemos de dos muestras aleatorias simples X1 , . . . , Xn1 , Y1 , . . . , Yn2 independientes entre si.
Que amplitud tiene el intervalo?
Nota: emplea como estimador de X Y la diferencia de las medias muestrales X Y , y usa los
resultados b
asicos vistos en clase para definir un estadstico que relacione X Y con X Y cuya
distribuci
on sea conocida.
Soluci
on.
Sabemos que en estas condiciones:
(n1 1)s2X
2n1 1 ,
2

(n2 1)s2Y
2n2 1 independientes
2
(n1 1)s2X + (n2 1)s2Y

2n1 +n2 2
2

Adem
as,
1

(X Y ) (X Y )
1 
r 
=
+
N (0, 1)
X Y N X Y , 2

n1
n2
1
1
2
n1 + n2
Luego, el estadstico:
(XY )(X Y )
q

n1 + n1
(X Y ) (X Y )
1
2
q
=q
tn1 +n2 2
(n1 1)s2X +(n2 1)s2Y
1
1
sP n1 + n2
2 (n +n 2)
1

relaciona X Y con X Y y tiene una distribucion conocida. Para obtener el intervalo de


confianza de nivel (1 ) % para la diferencia de medias, tenemos en cuenta que:

(X Y ) (X Y )
q
P tn1 +n2 2; 2
tn1 +n2 2; 2 = 1

sP n11 + n12
De donde, despejando convenientemente, se obtiene
r
r

1
1
1
1
I.C.1 (X Y ) = (X Y ) tn1 +n2 2; 2 sP
+
, (X Y ) + tn1 +n2 2; 2 sP
+
n1
n2
n1
n2
La amplitud del intervalo es:
r
2 tn1 +n2 2; 2 sP

1
1
+
n1
n2

4. El metodo MATWES1 fue dise


nado para medir las actitudes hacia las mujeres ejecutivas. Una
puntuaci
on alta indica actitudes negativas hacia las mujeres ejecutivas por parte de la persona que
la otorga, puntuaciones bajas son indicativas de actitudes positivas. Se conjetura que la actitud
hacia las mujeres ejecutivas cambia en funcion del sexo.
Para contrastar esta hip
otesis se tomaron muestras aleatorias independientes de 151 hombres y de
108 mujeres estudiantes de M.B.A. En el grupo de los hombres se obtuvo una puntuacion media de
85.8 con una desviaci
on tpica de 19.3. En el de mujeres se obtuvo una puntuacion media de 71.5
con una desviaci
on tpica de 12.2.
(a) A que conclusi
on llegas para un nivel de significacion de =0.01? Plantea el contraste oportuno
especificando claramente la hip
otesis nula y alternativa que consideras, as como las hipotesis
de trabajo.
(b) A la vista de los resultados obtenidos, si construyeras un intervalo de confianza al 99 % para la
diferencia de puntuaciones medias, contendra al 0?
1 P. Dubno,Attitudes toward woman executives: A longitudinal approach, Academy of Management Journal, 28 (1985),
135-39, ver Newbold

Soluci
on.
(a) Como la conjetura no especifica que la actitud de hombres o mujeres sea mejor o peor, solo que
haya diferencias, planteamos un contraste bilateral:
H0 : 1 = 2
H1 : 1 6= 2
donde 1 y 2 representan los puntuaciones medias que otorgan los hombres y mujeres, respectivamente. La hip
otesis alternativa implica que, efectivamente, tal y como se ha conjeturado,
existen diferencias en cuanto a la actitud hacia las mujeres ejecutivas entre los hombres y las
mujeres.
Para definir la regi
on de rechazo del test no hacemos hipotesis alguna sobre la distribucion de
X e Y . Como estamos trabajando con muestras grandes podemos emplear el Teorema Central
del Lmite para definir la siguiente region de rechazo:
R = {|T | z 2 },
donde el estadstico del contraste es
T =q
En este caso:
t= q

X Y
s2X
151

85.8 71.5
372.49
151

148.84
108

s2Y
108

14.3
= 7.2926
1.9609

y el valor crtico de la normal est


andar z0.005 = 2.575 <7.2926, por lo que se rechaza la hipotesis
nula. Se aprecian evidencias estadsticas de que, efectivamente, la actitud cambia en ambos
sexos.
(b) Hemos rechazado la hip
otesis nula a un nivel del 1 %, por lo que, el intervalo de confianza al
99 % no contendr
a al 0.
5. Para comparar la velocidad de dos ordenadores, A y B, se mide el tiempo que invierten en realizar
operaciones de una cierta clase definida. Se tomo una muestra de 5 operaciones de esta clase y
cada operaci
on fue realizada por ambos ordenadores. Se obtuvieron los siguientes tiempos (en
milisegundos):
A
B

110
102

125
120

141
135

113
114

182
175

Analizar si hay diferencias:


(a) Teniendo en cuenta que los datos estan apareados (la misma operacion es realizada por los 2
ordenadores). Obten el p-valor del contraste.
(b) Considerando muestras independientes.
(c) En el segundo caso, al considerar muestras independientes, que crees que puede estar pasando?
el siguiente gr
afico, en el que se representan simultaneamente los tiempos obtenidos en las dos
muestras, te puede servir de ayuda:

Scatterplot by Level Code


200

tiempo

180
160
140
120
100
A

ordenador

Soluci
on.
(a) Para trabajar con muestras dependientes apareadas tenemos que evaluar las diferencias X Y ,
siendo X e Y los tiempos de procesamiento en los ordenadores A y B, respectivamente. Los
on
valores obtenidos son 8, 5, 6, 1, 7, lo que supone una diferencia media de d = 5 y una desviaci
tpica de sD =3.53. Entonces,
5
t = 3.53 = 3.164

La regi
on de rechazo para el contraste bilateral:
H0 : X Y = 0
H1 : X Y 6= 0
es R = {|T | t4; 2 }. Para un nivel de significacion del 5 %, se tiene que el valor crtico
correspondiente es t4;0.025 = 2.776 < 3.164 y, por tanto, se rechaza H0 . Se han detectado,
entonces, diferencias significativas en los tiempos de procesamiento de ambos ordenadores para
= 0.05. El p-valor del contraste es entonces menor que 0.05. Podemos acotarlo entre 0.02 <
p valor < 0.05, ya que:
p valor = 2P {t4 3.164} > 2P {t4 3.747} = 2 102
(b) Si se obvia el hecho de que los datos estan apareados y se trabaja como si de dos muestras
independientes se tratara se tiene que:
x = 134,2, sX = 29,37,

y = 129,2, sY = 27,3

Entonces, asumiendo varianzas iguales y poblaciones normales,


s2P =
y

29.372 + 27.32
s2X + s2Y
=
= 803.9434
2
2
xy
t= q 2 =
2sP
5

5
= 0.2788
17.9326

Ahora la regi
on de rechazo es: R = {|T | t8; 2 } y el p-valor:
p valor = 2P {t8 0.2788} > 2 0.25
que nos lleva a concluir todo lo contrario.
(c) Lo que est
a ocurriendo es que la variabilidad experimental es muy grande. La variabilidad dentro de cada grupo es muy grande. Una de las operaciones, la quinta concretamente, supone un
tiempo de ejecuci
on considerablemente mayor que el resto en ambos casos, lo que hace disminuir ostensiblemente la potencia del contraste (no se detectan las diferencias). Al trabajar con
muestras apareadas las diferencias debidas a la naturaleza de las operaciones quedan eliminadas
(explicadas convenientemente).
6. Se conjetura que las acciones de una compa
na sufriran mas variacion en una industria con competencia en precios que en una en la que existiera un duopolio y colusion tacita. En un estudio sobre
la industria de generadores mediante turbinas de vapor2 , se hallo que en 4 a
nos de competencia en
precios la variaci
on de las acciones de la General Electric fue de 114.09. En los siguientes 7 a
nos,
en los cuales hubo un duopolio y colusion tacita, esta varianza fue de 16.08. Asumir que los datos
pueden considerarse muestras aleatorias independientes de dos poblaciones normales y contrastar
al 5 % la conjetura anterior.
Soluci
on.
Sea X = valor de las acciones de GE en una industria con competencia en precios, e Y = valor de
las acciones de GE en un duopolio con colusion tacita.
2 B.T.Allen, Tacit collusion and market sharing: The case of steam turbine generators, Industrial Organization Review
4 (1976), 48-57. Ver Newbold.

2
La conjetura que se quiere contrastar establece que X
> Y2 , por lo que optamos por el contraste
unilateral:
2
H0 : X
Y2
2
H1 : X > Y2

Bajo las hip


otesis de normalidad y (X1 , . . . , X4 ) e (Y1 , . . . , Y7 ) m.a.s. independientes, tenemos que
T =

s2X
H0 F(3,6)
s2Y

R = {T > F(3,6); }

En este caso t = 114,09


16,08 = 7,095 y F(3,6);0,05 = 4,757, F(3,6);0,01 = 9,780. Por tanto, se rechaza H0 al
5 % y no se rechaza al 1 %. El p-valor del contraste estara entre estos dos valores.
7. Un usuario de grandes cantidades de componentes electricos adquiere estos principalmente a dos
proveedores, A y B. Debido a una mejor estructura en precios, el usuario hara negocios u
nicamente
con el proveedor B siempre que la proporcion de artculos defectuosos para B no exceda la del
proveedor A (sea menos fiable). De 2 grandes lotes, el usuario selecciona al azar 125 unidades de
A y 100 de B; inspecciona las unidades y encuentra 7 unidades defectuosas en cada una de las
muestras (7 en la primera muestra y otras 7 en la segunda). Bajo las hipotesis adecuadas y con base
a esta informaci
on, existe alguna razon para no adquirir todas las componentes al proveedor B?
Soluci
on.
Para decidir si se queda exclusivamente con el proveedor B el usuario esta interesado en saber si la
proporci
on de artculos defectuosos de B es menor que la del proveedor A. Esto nos lleva a plantear
el contraste unilateral:
H0 : pA pB
H1 : pA < pB
donde pA y pB representan, respectivamente, las proporciones de artculos defectuosos de los proveedores A y B. Si rechazamos H0 , entonces hay evidencia de que el proveedor B es menos fiable que
el A y, en consecuencia, a pesar de la mejor estructura en precios, el usuario seguira manteniendo
a los 2 proveedores.
Como n1 = 125, n2 = 100 son grandes, podemos construir el contraste a partir del estadstico:
T (X1 , . . . , X125 ; Y1 , . . . , Y100 ) = p

pA pB
p0 (1 p0 )(1/125 + 1/100

vH0 N (0, 1)

14
=0.06222 es la mejor estimacion de la frecuencia de fallo com
un bajo H0 , y
donde p0 = 225
7
7
pA = 125 =0.056 , pB = 100
= 0.07 son las proporciones de unidades defectuosas en los dos lotes.
La regi
on de rechazo del contraste, para , es:

n
o
pA pB
R = (x1 , . . . , x125 ; y1 , . . . , y100 ) / p
z
p0 (1 p0 )/225
En nuestro caso,

0.056 0.07
t= q
1
0.0622 0.9378( 125
+

1
100 )

w -0.432

El p-valor del contraste se obtiene como:


p valor = P {Z -0.432} = P {Z 0.432} w 0.3336
El p-valor es bastante alto, lo que nos lleva a no rechazar la hipotesis nula y, en consecuencia, el
usuario optara por quedarse con el proveedor B en exclusiva.
8. Una profesora de Ciencias Polticas cree que el interes de los alumnos por la asignatura que imparte
puede estar relacionado con su grado de participacion en los procesos electorales del pas. Con el
fin de corroborar su hip
otesis quiere comparar las notas medias de los alumnos que votaron en
las u
ltimas elecciones con la de aquellos alumnos que no lo hicieron. Para ello toma dos muestras
aleatorias simples independientes de 114 alumnos que afirman haber votado y de 123 alumnos que
manifiestan no haberlo hecho. En el primer grupo se obtuvo una calificacion media de 2.71, con una
desviaci
on tpica de 0.64. En el segundo grupo la nota media fue de 2.79, con una desviacion tpica
6

de 0.56. Plantea el contraste oportuno especificando claramente la hipotesis nula y alternativa que
consideras, as como las hip
otesis de trabajo. Define la region de rechazo del contraste para un nivel
de significaci
on y obten el p-valor del contraste.
Soluci
on.
Como no se dice nada sobre que la profesora este conjeturando que los alumnos que ejercen su derecho al voto esten m
as o menos interesados que aquellos que no lo ejercen, solo que hay diferencias,
podemos optar por plantear un contraste bilateral:
H0 : X Y = 0
H1 : X Y 6= 0
donde X es la nota media de los alumnos que ejercen su derecho al voto, mientras que Y es la nota
media de los alumnos que no votan. No obstante, podemos interpretar que en lo que esta pensando
la profesora es en que el interes de los alumnos que se preocupan de votar sea mayor, y que esto se
traduzca en mejores notas. En ese caso, podemos plantear el contraste unilateral:
H0 : X Y
H1 : X > Y
En ambos casos, para definir la region de rechazo del test no hacemos hipotesis alguna sobre
la distribuci
on de X e Y . Como estamos trabajando con muestras grandes podemos emplear el
Teorema Central del Lmite para definir la siguiente region de rechazo:
R = {|T | z 2 },
para el contraste bilateral. Y
R = {T z },
para el contraste unilateral. En ambos casos, el estadstico del contraste es
T =q
En este caso:

X Y
s2X
114

s2Y
123

2.71 2.79
-0.08
t= q
= -1.02
=
2
2
0.0784
0.64
0.56
+
114
123

Para el contraste bilateral:


p valor = 2P {Z -1.02} = 2P {Z 1.02} = 2 0.1539 = 0.3078
Para el contraste unilateral:
p valor = P {Z -1.02} = 1 0.1539 = 0.8461
Se trata en ambos casos de p-valores bastante altos, los datos no corroboran la conjetura de la
profesora.
9. Se quiere analizar si la asistencia a clase tiene alg
un efecto sobre la calificacion final que se obtiene en
Estadstica I. Para ello se tomaron muestras aleatorias independientes de 8 alumnos que asistieron
regularmente a clase y de otros 8 que, por el contrario, rara vez haban asistido a clase. Se obtuvieron
los siguientes resultados:
Regularmente (1)
Ocasionalmente (0)

2.5
0.75

1.5
1.5

7
3

4
1

8.2
4

6.8
4.5

9.5
6.5

8
5

(a) Plantea un contraste bilateral para ver si hay diferencias significativas en las calificaciones
medias de los alumnos debidas a la asistencia a clase. A que conclusion llegas para un nivel
de significaci
on de =0.05? Da una cota para el p-valor.
(b) A la vista de los resultados obtenidos en el apartado anterior, cambiara la conclusion a la que
llegas si te replanteas el contraste y optas por uno unilateral?, como cambiara el p-valor?
7

notas

10

(c) En el siguiente gr
afico se representan los datos obtenidos teniendo ademas en cuenta las horas
que cada alumno dedica al estudio de la asignatura fuera de las horas de clase (triangulos: m
as
de 1 horas semanal de estudio, crculos: menos de 1 hora).

0.0

0.2

0.4

0.6

0.8

1.0

clase

A la vista del gr
afico, crees que aumentara la potencia del contraste si se replantea el estudio para trabajar con muestras apareadas. En caso de que la respuesta sea afirmativa, con
que criterio estableceras las parejas?
Soluci
on.
(a) Sea X = calificaci
on de los alumnos que asisten a clase, e Y = calificacion de los alumnos que
rara vez asisten a clase.
Queremos analizar si hay diferencias significativas en las calificaciones que obtiene un alumno
por el hecho de asistir o no a clase. Planteamos un contraste bilateral:
H0 : X = Y
H1 : X 6= Y
Asumiendo normalidad, varianzas iguales y muestras independientes, el estadstico del contraste
es:
X Y
T =
H0 t14
sP /2
Para los valores obtenidos:

x = 5.9375
s2X

y = 3.28125
s2Y

= 8.457

sX = 2.908086

sY = 2.076387

Como n1 = n2 s2P es la media de s2X y s2Y , s2P =


t=

= 4.311

8.457+4.311
2

5.9375 3.28125
sP
2

=6.384. Luego,

= 2.103

La regi
on de rechazo al 5 % es
R0,05 = {|T | t14;0.025 }
t14;0.025 = 2.145 no rechazamos H0 al nivel fijado. El p-valor del contraste sera mayor que
0.05.
t14;0.05 = 1.761 rechazamos H0 al 10 %. El p-valor del contraste sera menor que 0.1.
8

(b) S cambiara. Para un contraste unilateral con H1 : X > Y ,


R0.05 = {T t14;0.05 }
y t14;0.05 = 1.761 < 2.103, por lo que en este caso s se rechazara H0 . El p-valor del contraste
valdra exactamente la mitad.
(c) Incluir la informaci
on sobre el tiempo de estudio en el modelo: analisis de la varianza con 2
factores, asistencia a clase y tiempo de estudio. O lo que es equivalente en este caso, trabajar con
muestras pareadas independientes en que el criterio para establecer las parejas fuera emparejar
a estudiantes que dedicaran el mismo tiempo a estudiar la asignatura.
El An
alisis de la Varianza nos permitira considerar mas niveles para cada factor. Por ejemplo,
que el tiempo de estudio tomara los valores: 0 horas, 1 hora, 2 horas, mas de 2 horas por semana.
Lo mismo se podra aplicar a la asistencia a clase: siempre, casi siempre, pocas veces o nunca.
Tambien nos permitira responder a las preguntas, cunde lo mismo 1 hora de estudio cuando
se va clase que 1 hora de estudio cuando no se va a clase?, se aprovecha igual una hora de
clase cuando se ha estudiado que cuando no se ha estudiado?
Otra opci
on, que reducira el
ambito de aplicacion de las conclusiones del estudio, sera limitarlo
a estudiantes con los mismos h
abitos de estudio.
10. Estamos interesados en saber si los salarios medios en dos grandes ciudades de un pas son homogeneos o si, por el contrario, se puede evidenciar que hay diferencias significativas en los salarios
que perciben los trabajadores de estas 2 ciudades. Para ello se tomaron muestras aleatorias independientes de trabajadores (de actividades similares y niveles similares) en las 2 ciudades y se
obtuvieron los siguientes datos:
Ciudad 1
Ciudad 2

5.9
6.4

6.1
6.3

6.3
6.5

6.1
6.1

6
5

6.2
5.5

5.7
4.7

6.3
5.1

6.6
2.8

1.8

1.5

(a) Plantea un contraste bilateral para ver si hay diferencias significativas en los salarios que perciben los trabajadores de estas 2 ciudades. A que conclusion llegas para un nivel de significaci
on
de =0.1? Da una cota para el p-valor.

h
m

salario

(b) En el siguiente gr
afico se representan los datos obtenidos teniendo ademas en cuenta el sexo de
los trabajadores (los tri
angulos corresponden a mujeres)

1.0

1.2

1.4

1.6
ciudad

A la vista del gr
afico, te replantearas el estudio?
Soluci
on.

1.8

2.0

(a) Sea X = salario de los trabajadores de la ciudad 1, e Y = salario de los trabajadores de la


ciudad 2. Nos piden que planteemos un contraste bilateral:
H0 : X = Y
H1 : X 6= Y
Asumiendo normalidad, varianzas iguales y muestras independientes, el estadstico del contraste
es:
X Y
q
H0 t18
T =
1
sP 19 + 11
Para los valores obtenidos:
x = 6.13
s2X

y = 4.7
s2Y

= 0.0675

sX = 0.2598
y
s2P =

= 3.3801

sY = 1.8385

8 0.0675 + 10 3.3801
6.13 4.7
= 1.9078 t = q
18
1.9078 19 +

1
11

 = 2.30

Para = 0.1, el valor crtico correspondiente es t18;0.05 = 1.734 < 2.30. Rechazamos H0 . Para un
nivel del 5 % nos ocurre lo mismo, t18;0.025 = 2.101 < 2.30. Sin embargo, t18;0.005 = 2.878 > 2.30,
luego no rechazamos H0 a un nivel de significacion del 1 %. El p-valor del contraste tiene que
estar entre estos 2 u
ltimos valores p valor (0.025, 0.05). Con el ordenador se obtiene:
p valor = 2P {t18 2.30} = 0.033
Es un p-valor bajo, nos llevara a rechazar H0 .
(b) Se puede tratar de un falso positivo. Todo apunta a que la diferencia que hemos detectado se
debe a que en la muestra de la ciudad 2 hay 3 salarios atpicos. Muy bajos con respecto al resto
de los salarios observados. Al estudiar si estos 3 datos tenan algo en com
un se comprobo que
los 3 correspondan a mujeres.
A partir de aqu, se tienen 2 opciones:
Incluir la informaci
on sobre el sexo en el modelo: analisis de la varianza con 2 factores, sexo y
ciudad. O lo que es equivalente en este caso, trabajar con muestras pareadas independientes
en que el criterio para establecer las parejas fuera emparejar a trabajadores del mismo sexo.
Todo ello manteniendo la premisa de que todos los trabajadores de ambas muestras tenan
niveles similares y desempe
naban actividades tambien similares.
Restringir el estudio s
olo a hombres, o solo a mujeres.
11. Para juzgar si la introducci
on de un nuevo plan de estudios ha mejorado la formacion de los
estudiantes se toma una muestra de 30 estudiantes del plan antiguo y 30 del nuevo. Los estudiantes
se eligen de manera que tengan una nota similar de entrada en la universidad y la misma edad,
para que las comparaciones sean homogeneas. Los 60 estudiantes realizan una misma prueba de
conocimientos, obteniendo los estudiantes del plan antiguo una media de 7.2 y una cuasidesviaci
on
tpica de 2,1. Para los estudiantes del nuevo plan la media es 7.4 con cuasidesviacion tpica 1.9.
Para un nivel de significaci
on del 1 % se pide contrastar si esta introduccion de un nuevo plan ha
mejorado la formaci
on de los estudiantes.
La respuesta debe incluir:
(a) Las hip
otesis nula y alternativa para este contraste.
(b) La expresi
on del estadstico de contraste y la region crtica del contraste.
(c) Los c
alculos necesarios para evaluar si los datos pertenecen a la region crtica, o para obtener
el p-valor. Tu conclusi
on sobre el contraste.
(d) Especificar los supuestos en los que se basa el analisis en los apartados anteriores.
Soluci
on.
10

a) Las hip
otesis del test son:
H0
H1

: a n
: a < n

b) El estadstico del contraste y la region crtica son:


T

x
a x
(a n )
pn
tna +nn 2
sP 1/na + 1/nn
{T < tna +nn 2;/2 }

c) Los valores que necesitamos son t58;0.01 = 2.3924 y


r
(30 1) 2,12 + (30 1) 1,92
= 2,0
sP =
30 + 30 2
El valor del estadstico es

7.2 7.4
T = p
= -0.38
2 (1/30 + 1/30)

Como -0.38 > - 2.3924, no rechazamos la hipotesis nula a un nivel de significacion del 1 %, y
no podemos concluir que la formacion haya mejorado.
d ) Los supuestos son: cada muestra esta compuesta de observaciones independientes que siguen
una distribuci
on normal, y ambas muestras son independientes.
12. Disponemos del n
umero de das que cada paciente permanece ingresado en un hospital para dos
muestras independientes de 39 hombres y 35 mujeres.

1
1
1
1
1
1
2
2

Hombres (1)
2 5 9
2 6 10
3 6 10
3 6 11
3 7 12
3 7 12
4 8 13
4 9 13

x
1 = 7.90,

14
15
17
18
19
23
24

s1 = 6.41,

1
1
1
1
2
2
3
3

Mujeres (2)
3 5 9 15
4 6 9 18
4 6 10 21
4 7 12
4 7 12
5 7 14
5 7 14
5 7 15

x
2 = 7.11,

s2 = 5.16

a) Calcula un intervalo de confianza al 95 % para el n


umero medio de das que un hombre permanece ingresado en el hospital. Interpreta dicho intervalo. Necesitamos asumir normalidad?
Por que?
b) Especificando claramente la hipotesis nula y la alternativa, podemos afirmar que el n
umero
medio de das que una mujer permanece ingresada es significativamente diferente que el n
umero
medio de das que un hombre permanece ingresado? Calcula el p-valor.
c) Tambien estamos interesados en estudiar cuantos pacientes permanecen ingresados mas de
una semana (8 das o m
as). Con un nivel de significacion del 10 %, y especificando claramente la hip
otesis nula y la alternativa, podemos afirmar que la proporcion de pacientes que
permanecen ingresados m
as de una semana es mayor para los hombres que para las mujeres?
Soluci
on.
a) Intervalo de confianza aproximado para la media de una poblacion, muestras grandes:
s1
6,41
IC = x
1 z/2 = 7,90 1,96 5,98 1 9,91
n1
39
Con un nivel de confianza del 95 % podemos afirmar que el n
umero medio de das que un
hombre permanece ingresado esta entre 5,98 das y 9,91 das.
Claramente los datos no siguen una distribucion normal, pero no necesitamos asumir normalidad ya que, para muestras de tama
no 39, el Teorema Central del Lmite nos dice que la
distribuci
on de la media muestral es aproximadamente normal.
11

b) Comparaci
on de medias de dos poblaciones, muestras grandes. Definicion del contraste:
H1 : 1 6= 2

H0 : 1 = 2 ,
Valor del estadstico y p-valor:
t= r

7,90 7,11
5,162
6,412
+
39
35

= 0,59,

p-valor = 2P(Z > 0,59) = 0,555

No rechazamos H0 ya que el p-valor es muy grande. Concluimos que no hay diferencia significativa entre el n
umero medio de das que un hombre permanece ingresado y el n
umero medio
de das que una mujer permanece ingresada.
c) Comparaci
on de proporciones, muestras grandes. Definicion del contraste:
H0 : p1 p2 ,

H1 : p1 > p2

Valor del estadstico y p-valor:


t= s

17/39 11/35


 = 1,08,
17 + 11
28
1
1
1
+
39 + 35
74
39 35

p-valor = 0,1401 > = 0,1

No rechazamos H0 ya que el p-valor es mayor que 10 %. Concluimos que la proporcion de


pacientes que permanecen ingresados mas de una semana no es mayor para los hombres que
para las mujeres.
13. Un fabricante asegura que la utilizaci
on de un aditivo en la gasolina hace que disminuya el consumo
de los coches en al menos 2 litros por cada 100 Kilometros. Para contrastar esta afirmacion se ha
evaluado la variable aleatoria n
umero de litros consumidos en 100 Kilometros para dos muestras.
La primera la formaban los nueve coches en los que se haba utilizado el aditivo, y la segunda
aquellos trece coches en los que no se haba utilizado. Los datos de la primera y segunda muestra
verifican:
9
9
13
13
X
X
X
X
xi = 74,
x2i = 645,
yi = 130,
yi2 = 1370
i=1

i=1

i=1

i=1

a) Realiza un contraste de igualdad de varianzas para un nivel de significacion del 10 %.


b) Supongamos varianzas desconocidas e iguales y muestreos independientes. Podemos creer lo
que afirma el fabricante?
Especifica las hip
otesis empleadas para llevar a cabo cada contraste, as como el estadstico del
contraste, la regi
on de rechazo y la conclusion a la que llegas.
Soluci
on.
a) Queremos contrastar si las varianzas son iguales. Nuestras hipotesis seran:
H0
H1

: x2 = y2
: x2 =
6 y2

Se rechazar
a la hip
otesis nula de igualdad de varianzas cuando el valor del estadstico del
contraste, en nuestro caso el cociente entre las cuasivarianzas muestrales, pertenezca a la cola
de una distribuci
on F. Calculamos el estadstico del contraste a partir de las cuasivarianzas
muestrales obteniendo:
s2
t = x2 = 0.783
sy
Este valor no pertenece a la region de rechazo para el contraste de varianzas de dos muestras
independientes,
R = {t < Fnx 1,ny 1;1/2 } {t > Fnx 1,ny 1;/2 }
ya que en nuestro caso tenemos que F8,12;0.95 = 0.3045 y F8,12;0.05 = 2.8486. En consecuencia, la informaci
on de que disponemos no nos permite concluir que las varianzas puedan ser
diferentes.
12

b) Como hemos comentado, suponemos varianzas desconocidas e iguales y muestreos independientes. Se tiene que contrastar las hipotesis
H0
H1

: y x 2
: y x < 2

El estadstico para el contraste relativo a la diferencia de medias toma el valor


D=

Y 2)
(X
p
= -0.222
sP 1/nx + 1/ny

donde sP =2.308, y la regi


on de rechazo viene dada por
R = {D < tnx +ny 2; }
Dado que t20;0.1 = 1.325, el valor del estadstico para esta muestra no esta en la region crtica, y
llegamos a la conclusi
on que los datos obtenidos son compatibles con lo que afirma el fabricante.
14. De acuerdo a la u
ltima encuesta de pernoctaciones en establecimientos hoteleros (Encuesta de
ocupaci
on hotelera 2009) disponemos de datos que nos indican que el grado de ocupacion del 2008
fue del 59,75 % mientras que en 2009 fue del 58,28 %. Si suponemos que los tama
nos muestrales sobre
los que se ha hecho la encuesta para conocer el grado de ocupacion eran de 2400 establecimientos
en el a
no 2008 y 2500 en 2009:
a) Calcula un intervalo de confianza al 95 % para la diferencia de la ocupacion en 2009 frente a
la del 2008.
b) Valora a traves de un contraste y con un nivel de significacion del 5 % si el porcentaje del
grado de pernoctaci
on ha disminuido en el 2009 en relacion al 2008.
c) Razona si el hecho que el intervalo contenga el cero esta relacionado con el hecho que en
el segundo apartado no hayamos rechazado la hipotesis nula de igualdad, pese a que es un
contraste unilateral.
d ) Cambiara la respuesta a este razonamiento en los dos apartados si la confianza fuese del 99 %
(nivel de significaci
on del 1 %) en lugar del 95 % (nivel de significacion del 5 %)?
Soluci
on.
a) El intervalo sobre la diferencia de proporciones al 95 % de confianza viene dado por la expresion:
s


1
1
+
p09 p08 z0,025 p(1 p)
n09
n08
donde la proporci
on com
un de los dos a
nos es p = (0,5975 2400 + 0,5828 2500)/(2400 +
2500) = 0,59. Si sustituimos las proporciones y las medidas muestrales indicadas en el enunciado y tenemos presente que z0,025 = 1,96, obtenemos el siguiente intervalo de confianza:
s


1
1
+
= 0,0147 0,0275 = [0,0422; 0,0128].
0,5828 0,5975 1,96 0,59 0,41
2500 2400
b) Tenemos que realizar un contraste sobre la diferencia de proporciones. Las hipotesis del mismo
ser
an: H0 : p09 p08 vs. H1 : p09 < p08 .
El estadstico de contraste, T , se distribuira seg
un una normal estandar y tendra la siguiente
expresi
on:
p09 p08
T =r

 N (0, 1).
p(1 p) n109 + n108
As pues, para los datos muestrales tenemos:
T =q

0,5828 0,5975
0,59 0,41
13

1
2500

1
2400

 = 1,046

Por otro lado, como estamos trabajando a un nivel del 5 % de significacion y hemos planteado
un contraste unilateral, el valor crtico sera z0,95 = 1,645.
Como T > z0,95 , no rechazaremos la hipotesis nula y no podremos afirmar que el nivel de
pernoctaciones del 2009 tenga diferencias significativas con el del 2008.
c) Que el intervalo contenga el cero quiere decir que con alta probabilidad la diferencia de proporciones de pernoctaciones del 2009 en relacion al 2008 es igual a cero, es decir que la proporci
on
del 2009 es equivalente a la proporcion del 2008. Y esta es la conclusion del segundo apartado.
d ) En cuanto al aumento de confianza, aumentandola al 99 % el nuevo intervalo sera mas ancho, y
continuara incluyendo el cero. En cuanto al contraste, el p-valor continuara siendo el mismo y
si ya hemos aceptado la H0 , la continuaramos aceptando para un menor nivel de significacion,
puesto que el valor crtico sera mas peque
no todava, mientras que el valor de T sera el mismo.

14

Das könnte Ihnen auch gefallen