Sie sind auf Seite 1von 14

Estad

stica II
Ejercicios Tema 3
Curso 2013/14 Soluciones Respuestas
1. Se quiere evaluar el efecto del ruido sobre la habilidad de las personas para realizar una determinada
tarea. Para ello, se seleccionan 32 personas que son capaces de realizar la misma tarea en el mismo
tiempo para realizar dicha tarea en un medio controlado y bajo 2 niveles distintos de ruido de fondo.
De entre esas 32, se seleccionan aleatoriamente 16 para llevar a cabo la tarea sometidas a un ruido
de fondo de nivel 2. Las restantes 16 las realizaran con poco ruido de fondo (nivel 1). Los tiempos
(en minutos) que se registran son:
nivel 1 14 12 15 15 11 16 17 12 14 13 18 13 18 15 16 11
nivel 2 20 22 18 18 19 15 18 15 22 18 19 15 21 22 18 16
(a) Plantea el contraste oportuno, especicando claramente la hipotesis nula y alternativa que
consideras.
(b) Calcula el p-valor del contraste, suponiendo normalidad y la misma varianza.
Solucion.
a) Lo que queremos saber es si el aumentar el nivel de ruido inuye negativamente en la capacidad
para llevar a cabo la tarea en cuestion y, por tanto, optamos por plantear un contraste unilateral.
H
0
:
1

2
H
1
:
1
<
2
donde
1
y
2
representan los tiempos medios de realizacion de la tarea bajo los niveles de ruido
1 y 2, respectivamente. La hipotesis alternativa implica que al aumentar el nivel de ruido del
nivel 1 al 2 el tiempo medio de realizacion de la tarea aumenta estrictamente.
b) En este caso, para tomar una decision asumimos que X N(
1
,
2
), Y N(
2
,
2
), siendo
X
1
. . . , X
16
, Y
1
, . . . , Y
16
dos m.a.s. de X e Y , respectivamente, independientes entre s.
La asignacion de personasnivel de ruido se hizo aleatoriamente para evitar sesgos.
El estadstico del contraste es T =
XY
s
P

1
8
, y la region de rechazo:
R

= {T t
30,
} = {T t
30,
}
Para los datos obtenidos:
x = 14.375 y = 18.5
s
2
X
= 5.18333 s
2
Y
= 6.0
s
X
= 2.27669 s
Y
= 2.44949
Como n
1
= n
2
s
2
P
es la media de s
2
X
y s
2
Y
, s
2
P
=
5.18333+6
2
= 5.59166. Luego,
t =
14.375 18.5
_
s
2
P
8
=
-4.125
0.8360
= -4.9339
El p-valor del contraste vendra dado por la probabilidad de obtener un valor tan peque no como
el obtenido cuando la hipotesis nula es cierta:
p valor = P{T
30
-4.9339} < 5 10
4
Para =0.0005 se tiene que el valor crtico correspondiente es t
30;0.0005
=3.646. Como t =
-4.9339 < -3.646 se rechaza H
0
a un nivel de signicacion de = 5 10
4
. Luego, p-valor<
0.0005. Si calculamos la probabilidad anterior con ayuda de un ordenador se obtiene p-valor=
1.18 10
5
.
1
2. Se quiere determinar si el paro en dos grandes areas urbanas del pas, como son Madrid y Barcelona,
es diferente. Para ello se toman muestras aleatorias en ambas ciudades, cada una de 500 personas,
obteniendose que en Madrid 35 estaban desempleadas y en Barcelona 25. Existe alguna razon para
creer que las frecuencias de paro en Madrid y Barcelona son diferentes?
(a) Plantea el contraste oportuno con un nivel de signicacion del 5 %, especicando claramente la
hipotesis nula y alternativa que consideras, as como las hipotesis de trabajo.
(b) Calcula el p-valor del contraste.
Solucion.
(a) Las dos poblaciones que se estan comparando son las respectivas poblaciones activas de las
ciudades de Madrid y Barcelona. Las dos variables aleatorias de trabajo son:
X Ber(p
M
)
Y Ber(p
B
)
donde p
M
= probabilidad de estar en paro en Madrid, y p
B
= probabilidad de estar en paro
en Barcelona.
Queremos comparar la proporcion de desempleados en ambas ciudades, para lo que planteamos
el contraste de hipotesis:
H
0
: p
M
= p
B
= p
0
H
1
: p
M
= p
B
Como n
1
= n
2
= 500 son grandes, podemos construir el contraste a partir del estadstico:
T(X
1
, . . . , X
500
; Y
1
, . . . , Y
500
) =
p
M
p
B
_
p
0
(1 p
0
)/250

H
0
N(0, 1)
donde p
0
=
500 p
M
+500 p
B
1000
es la mejor estimacion de la frecuencia de paro com un bajo H
0
, y p
M
,
p
B
son las proporciones muestrales correspondientes a Madrid y Barcelona, respectivamente.
La region de rechazo del contraste, para = 0,05, es:
R =
_
(x
1
, . . . , x
500
; y
1
, . . . , y
500
) /

p
M
p
B
_
p
0
(1 p
0
)/250

2
= 1.96
_
En nuestro caso, p
M
=
35
500
=0.07, p
B
=
25
500
=0.05, y
p
0
=
p
M
+ p
B
2
=
0,07 + 0,05
2
= 0,06
Luego,
T(x
1
, . . . , x
500
; y
1
, . . . , y
500
) =
0,07 0,05
_
0,060,94
250
1,33 < 1,96
A un nivel de signicacion del 5 % no hay evidencia estadstica de que las frecuencias de paro
sean diferentes.
Para aplicar el resultado anterior tenemos que asumir que las dos muestras tomadas son inde-
pendientes entre s y son cada una de ellas m.a.s. La aleatorizacion, ademas del resultado teorico,
trata de evitar que las diferencias detectadas puedan ser debidas a otros factores distintos de
la ciudad, como pudiera ser el sector (falso positivo).
(b) El p-valor del contraste, al ser bilateral, se calcula como
p = mn
_
2Pr{Z 1,33}, 2Pr{Z 1,33}
_
= 2 0,0918 = 0,1836,
siendo Z N(0, 1). Ten en cuenta que p te debe salir mayor que 0,05.
2
3. Construye un intervalo de conanza de nivel 1 para la diferencia de medias de dos poblaciones
normales cuando podemos asumir que tienen la misma varianza, X N(
X
,
2
), Y N(
Y
,
2
),
y disponemos de dos muestras aleatorias simples X
1
, . . . , X
n
1
, Y
1
, . . . , Y
n
2
independientes entre si.
Que amplitud tiene el intervalo?
Nota: emplea como estimador de
X

Y
la diferencia de las medias muestrales X Y , y usa los
resultados basicos vistos en clase para denir un estadstico que relacione
X

Y
con XY cuya
distribucion sea conocida.
Solucion.
Sabemos que en estas condiciones:
(n
1
1)s
2
X

2

2
n
1
1
,
(n
2
1)s
2
Y

2

2
n
2
1
independientes

(n
1
1)s
2
X
+ (n
2
1)s
2
Y

2

2
n
1
+n
2
2
Ademas,
X Y N
_

X

Y
,
2
_
1
n
1
+
1
n
2
__
=
(X Y ) (
X

Y
)
_

2
_
1
n
1
+
1
n
2
_
N(0, 1)
Luego, el estadstico:
(X Y ) (
X

Y
)
s
P
_
1
n
1
+
1
n
2
=
(XY )(
X

Y
)

q
1
n
1
+
1
n
2
_
(n
1
1)s
2
X
+(n
2
1)s
2
Y

2
(n
1
+n
2
2)
t
n
1
+n
2
2
relaciona
X

Y
con X Y y tiene una distribucion conocida. Para obtener el intervalo de
conanza de nivel (1 ) % para la diferencia de medias, tenemos en cuenta que:
P
_
_
_
t
n
1
+n
2
2;

2

(X Y ) (
X

Y
)
s
P
_
1
n
1
+
1
n
2
t
n
1
+n
2
2;

2
_
_
_
= 1
De donde, despejando convenientemente, se obtiene
I.C.
1
(
X

Y
) =
_
(X Y ) t
n
1
+n
2
2;

2
s
P
_
1
n
1
+
1
n
2
, (X Y ) +t
n
1
+n
2
2;

2
s
P
_
1
n
1
+
1
n
2
_
La amplitud del intervalo es:
2 t
n
1
+n
2
2;

2
s
P
_
1
n
1
+
1
n
2
4. El metodo MATWES
1
fue dise nado para medir las actitudes hacia las mujeres ejecutivas. Una
puntuacion alta indica actitudes negativas hacia las mujeres ejecutivas por parte de la persona que
la otorga, puntuaciones bajas son indicativas de actitudes positivas. Se conjetura que la actitud
hacia las mujeres ejecutivas cambia en funcion del sexo.
Para contrastar esta hipotesis se tomaron muestras aleatorias independientes de 151 hombres y de
108 mujeres estudiantes de M.B.A. En el grupo de los hombres se obtuvo una puntuacion media de
85.8 con una desviacion tpica de 19.3. En el de mujeres se obtuvo una puntuacion media de 71.5
con una desviacion tpica de 12.2.
(a) A que conclusion llegas para un nivel de signicacion de =0.01? Plantea el contraste oportuno
especicando claramente la hipotesis nula y alternativa que consideras, as como las hipotesis
de trabajo.
(b) A la vista de los resultados obtenidos, si construyeras un intervalo de conanza al 99 % para la
diferencia de puntuaciones medias, contendra al 0?
1
P. Dubno,Attitudes toward woman executives: A longitudinal approach, Academy of Management Journal, 28 (1985),
135-39, ver Newbold
3
Solucion.
(a) Como la conjetura no especica que la actitud de hombres o mujeres sea mejor o peor, solo que
haya diferencias, planteamos un contraste bilateral:
H
0
:
1
=
2
H
1
:
1
=
2
donde
1
y
2
representan los puntuaciones medias que otorgan los hombres y mujeres, respec-
tivamente. La hipotesis alternativa implica que, efectivamente, tal y como se ha conjeturado,
existen diferencias en cuanto a la actitud hacia las mujeres ejecutivas entre los hombres y las
mujeres.
Para denir la region de rechazo del test no hacemos hipotesis alguna sobre la distribucion de
X e Y . Como estamos trabajando con muestras grandes podemos emplear el Teorema Central
del Lmite para denir la siguiente region de rechazo:
R

= {|T| z

2
},
donde el estadstico del contraste es
T =
X Y
_
s
2
X
151
+
s
2
Y
108
En este caso:
t =
85.8 71.5
_
372.49
151
+
148.84
108
=
14.3
1.9609
= 7.2926
y el valor crtico de la normal estandar z
0.005
= 2.575 <7.2926, por lo que se rechaza la hipotesis
nula. Se aprecian evidencias estadsticas de que, efectivamente, la actitud cambia en ambos
sexos.
(b) Hemos rechazado la hipotesis nula a un nivel del 1 %, por lo que, el intervalo de conanza al
99 % no contendra al 0.
5. Para comparar la velocidad de dos ordenadores, A y B, se mide el tiempo que invierten en realizar
operaciones de una cierta clase denida. Se tomo una muestra de 5 operaciones de esta clase y
cada operacion fue realizada por ambos ordenadores. Se obtuvieron los siguientes tiempos (en
milisegundos):
A 110 125 141 113 182
B 102 120 135 114 175
Analizar si hay diferencias:
(a) Teniendo en cuenta que los datos estan apareados (la misma operacion es realizada por los 2
ordenadores). Obten el p-valor del contraste.
(b) Considerando muestras independientes.
(c) En el segundo caso, al considerar muestras independientes, que crees que puede estar pasando?
el siguiente graco, en el que se representan simultaneamente los tiempos obtenidos en las dos
muestras, te puede servir de ayuda:
A B
Scatterplot by Level Code
100
120
140
160
180
200
t
i
e
m
p
o
ordenador

4
Solucion.
(a) Para trabajar con muestras dependientes apareadas tenemos que evaluar las diferencias XY ,
siendo X e Y los tiempos de procesamiento en los ordenadores A y B, respectivamente. Los
valores obtenidos son 8, 5, 6, 1, 7, lo que supone una diferencia media de d = 5 y una desviacion
tpica de s
D
=3.53. Entonces,
t =
5
3.53

5
= 3.164
La region de rechazo para el contraste bilateral:
H
0
:
X

Y
= 0
H
1
:
X

Y
= 0
es R

= {|T| t
4;

2
}. Para un nivel de signicacion del 5 %, se tiene que el valor crtico
correspondiente es t
4;0.025
= 2.776 < 3.164 y, por tanto, se rechaza H
0
. Se han detectado,
entonces, diferencias signicativas en los tiempos de procesamiento de ambos ordenadores para
= 0.05. El p-valor del contraste es entonces menor que 0.05. Podemos acotarlo entre 0.02 <
p valor < 0.05, ya que:
p valor = 2P{t
4
3.164} > 2P{t
4
3.747} = 2 10
2
(b) Si se obvia el hecho de que los datos estan apareados y se trabaja como si de dos muestras
independientes se tratara se tiene que:
x = 134,2, s
X
= 29,37, y = 129,2, s
Y
= 27,3
Entonces, asumiendo varianzas iguales y poblaciones normales,
s
2
P
=
s
2
X
+s
2
Y
2
=
29.37
2
+ 27.3
2
2
= 803.9434
y
t =
x y
_
2s
2
P
5
=
5
17.9326
= 0.2788
Ahora la region de rechazo es: R

= {|T| t
8;

2
} y el p-valor:
p valor = 2P{t
8
0.2788} > 2 0.25
que nos lleva a concluir todo lo contrario.
(c) Lo que esta ocurriendo es que la variabilidad experimental es muy grande. La variabilidad den-
tro de cada grupo es muy grande. Una de las operaciones, la quinta concretamente, supone un
tiempo de ejecucion considerablemente mayor que el resto en ambos casos, lo que hace dismi-
nuir ostensiblemente la potencia del contraste (no se detectan las diferencias). Al trabajar con
muestras apareadas las diferencias debidas a la naturaleza de las operaciones quedan eliminadas
(explicadas convenientemente).
6. Se conjetura que las acciones de una compa na sufriran mas variacion en una industria con compe-
tencia en precios que en una en la que existiera un duopolio y colusion tacita. En un estudio sobre
la industria de generadores mediante turbinas de vapor
2
, se hallo que en 4 a nos de competencia en
precios la variacion de las acciones de la General Electric fue de 114.09. En los siguientes 7 a nos,
en los cuales hubo un duopolio y colusion tacita, esta varianza fue de 16.08. Asumir que los datos
pueden considerarse muestras aleatorias independientes de dos poblaciones normales y contrastar
al 5 % la conjetura anterior.
Solucion.
Sea X = valor de las acciones de GE en una industria con competencia en precios, e Y = valor de
las acciones de GE en un duopolio con colusion tacita.
2
B.T.Allen, Tacit collusion and market sharing: The case of steam turbine generators, Industrial Organization Review
4 (1976), 48-57. Ver Newbold.
5
La conjetura que se quiere contrastar establece que
2
X
>
2
Y
, por lo que optamos por el contraste
unilateral:
H
0
:
2
X

2
Y
H
1
:
2
X
>
2
Y
Bajo las hipotesis de normalidad y (X
1
, . . . , X
4
) e (Y
1
, . . . , Y
7
) m.a.s. independientes, tenemos que
T =
s
2
X
s
2
Y

H
0
F
(3,6)
y R

= {T > F
(3,6);
}
En este caso t =
114,09
16,08
= 7,095 y F
(3,6);0,05
= 4,757, F
(3,6);0,01
= 9,780. Por tanto, se rechaza H
0
al
5 % y no se rechaza al 1 %. El p-valor del contraste estara entre estos dos valores.
7. Un usuario de grandes cantidades de componentes electricos adquiere estos principalmente a dos
proveedores, A y B. Debido a una mejor estructura en precios, el usuario hara negocios unicamente
con el proveedor B siempre que la proporcion de artculos defectuosos para B no exceda la del
proveedor A (sea menos able). De 2 grandes lotes, el usuario selecciona al azar 125 unidades de
A y 100 de B; inspecciona las unidades y encuentra 7 unidades defectuosas en cada una de las
muestras (7 en la primera muestra y otras 7 en la segunda). Bajo las hipotesis adecuadas y con base
a esta informacion, existe alguna razon para no adquirir todas las componentes al proveedor B?
Solucion.
Para decidir si se queda exclusivamente con el proveedor B el usuario esta interesado en saber si la
proporcion de artculos defectuosos de B es menor que la del proveedor A. Esto nos lleva a plantear
el contraste unilateral:
H
0
: p
A
p
B
H
1
: p
A
< p
B
donde p
A
y p
B
representan, respectivamente, las proporciones de artculos defectuosos de los pro-
veedores A y B. Si rechazamos H
0
, entonces hay evidencia de que el proveedor B es menos able que
el A y, en consecuencia, a pesar de la mejor estructura en precios, el usuario seguira manteniendo
a los 2 proveedores.
Como n
1
= 125, n
2
= 100 son grandes, podemos construir el contraste a partir del estadstico:
T(X
1
, . . . , X
125
; Y
1
, . . . , Y
100
) =
p
A
p
B
_
p
0
(1 p
0
)(1/125 + 1/100

H
0
N(0, 1)
donde p
0
=
14
225
=0.06222 es la mejor estimacion de la frecuencia de fallo com un bajo H
0
, y
p
A
=
7
125
=0.056 , p
B
=
7
100
= 0.07 son las proporciones de unidades defectuosas en los dos lotes.
La region de rechazo del contraste, para , es:
R =
_
(x
1
, . . . , x
125
; y
1
, . . . , y
100
) /
p
A
p
B
_
p
0
(1 p
0
)/225
z

_
En nuestro caso,
t =
0.056 0.07
_
0.0622 0.9378(
1
125
+
1
100
)
-0.432
El p-valor del contraste se obtiene como:
p valor = P{Z -0.432} = P{Z 0.432} 0.3336
El p-valor es bastante alto, lo que nos lleva a no rechazar la hipotesis nula y, en consecuencia, el
usuario optara por quedarse con el proveedor B en exclusiva.
8. Una profesora de Ciencias Polticas cree que el interes de los alumnos por la asignatura que imparte
puede estar relacionado con su grado de participacion en los procesos electorales del pas. Con el
n de corroborar su hipotesis quiere comparar las notas medias de los alumnos que votaron en
las ultimas elecciones con la de aquellos alumnos que no lo hicieron. Para ello toma dos muestras
aleatorias simples independientes de 114 alumnos que arman haber votado y de 123 alumnos que
maniestan no haberlo hecho. En el primer grupo se obtuvo una calicacion media de 2.71, con una
desviacion tpica de 0.64. En el segundo grupo la nota media fue de 2.79, con una desviacion tpica
6
de 0.56. Plantea el contraste oportuno especicando claramente la hipotesis nula y alternativa que
consideras, as como las hipotesis de trabajo. Dene la region de rechazo del contraste para un nivel
de signicacion y obten el p-valor del contraste.
Solucion.
Como no se dice nada sobre que la profesora este conjeturando que los alumnos que ejercen su dere-
cho al voto esten mas o menos interesados que aquellos que no lo ejercen, solo que hay diferencias,
podemos optar por plantear un contraste bilateral:
H
0
:
X

Y
= 0
H
1
:
X

Y
= 0
donde
X
es la nota media de los alumnos que ejercen su derecho al voto, mientras que
Y
es la nota
media de los alumnos que no votan. No obstante, podemos interpretar que en lo que esta pensando
la profesora es en que el interes de los alumnos que se preocupan de votar sea mayor, y que esto se
traduzca en mejores notas. En ese caso, podemos plantear el contraste unilateral:
H
0
:
X

Y
H
1
:
X
>
Y
En ambos casos, para denir la region de rechazo del test no hacemos hipotesis alguna sobre
la distribucion de X e Y . Como estamos trabajando con muestras grandes podemos emplear el
Teorema Central del Lmite para denir la siguiente region de rechazo:
R

= {|T| z

2
},
para el contraste bilateral. Y
R

= {T z

},
para el contraste unilateral. En ambos casos, el estadstico del contraste es
T =
X Y
_
s
2
X
114
+
s
2
Y
123
En este caso:
t =
2.71 2.79
_
0.64
2
114
+
0.56
2
123
=
-0.08
0.0784
= -1.02
Para el contraste bilateral:
p valor = 2P{Z -1.02} = 2P{Z 1.02} = 2 0.1539 = 0.3078
Para el contraste unilateral:
p valor = P{Z -1.02} = 1 0.1539 = 0.8461
Se trata en ambos casos de p-valores bastante altos, los datos no corroboran la conjetura de la
profesora.
9. Se quiere analizar si la asistencia a clase tiene alg un efecto sobre la calicacion nal que se obtiene en
Estadstica I. Para ello se tomaron muestras aleatorias independientes de 8 alumnos que asistieron
regularmente a clase y de otros 8 que, por el contrario, rara vez haban asistido a clase. Se obtuvieron
los siguientes resultados:
Regularmente (1) 2.5 1.5 7 4 8.2 6.8 9.5 8
Ocasionalmente (0) 0.75 1.5 3 1 4 4.5 6.5 5
(a) Plantea un contraste bilateral para ver si hay diferencias signicativas en las calicaciones
medias de los alumnos debidas a la asistencia a clase. A que conclusion llegas para un nivel
de signicacion de =0.05? Da una cota para el p-valor.
(b) A la vista de los resultados obtenidos en el apartado anterior, cambiara la conclusion a la que
llegas si te replanteas el contraste y optas por uno unilateral?, como cambiara el p-valor?
7
(c) En el siguiente graco se representan los datos obtenidos teniendo ademas en cuenta las horas
que cada alumno dedica al estudio de la asignatura fuera de las horas de clase (triangulos: mas
de 1 horas semanal de estudio, crculos: menos de 1 hora).
0.0 0.2 0.4 0.6 0.8 1.0
2
4
6
8
1
0
clase
n
o
t
a
s
A la vista del graco, crees que aumentara la potencia del contraste si se replantea el estu-
dio para trabajar con muestras apareadas. En caso de que la respuesta sea armativa, con
que criterio estableceras las parejas?
Solucion.
(a) Sea X = calicacion de los alumnos que asisten a clase, e Y = calicacion de los alumnos que
rara vez asisten a clase.
Queremos analizar si hay diferencias signicativas en las calicaciones que obtiene un alumno
por el hecho de asistir o no a clase. Planteamos un contraste bilateral:
H
0
:
X
=
Y
H
1
:
X
=
Y
Asumiendo normalidad, varianzas iguales y muestras independientes, el estadstico del contraste
es:
T =
X Y
s
P
/2

H
0
t
14
Para los valores obtenidos:
x = 5.9375 y = 3.28125
s
2
X
= 8.457 s
2
Y
= 4.311
s
X
= 2.908086 s
Y
= 2.076387
Como n
1
= n
2
s
2
P
es la media de s
2
X
y s
2
Y
, s
2
P
=
8.457+4.311
2
=6.384. Luego,
t =
5.9375 3.28125
s
P
2
= 2.103
La region de rechazo al 5 % es
R
0,05
= {|T| t
14;0.025
}
t
14;0.025
= 2.145 no rechazamos H
0
al nivel jado. El p-valor del contraste sera mayor que
0.05.
t
14;0.05
= 1.761 rechazamos H
0
al 10 %. El p-valor del contraste sera menor que 0.1.
8
(b) S cambiara. Para un contraste unilateral con H
1
:
X
>
Y
,
R
0.05
= {T t
14;0.05
}
y t
14;0.05
= 1.761 < 2.103, por lo que en este caso s se rechazara H
0
. El p-valor del contraste
valdra exactamente la mitad.
(c) Incluir la informacion sobre el tiempo de estudio en el modelo: analisis de la varianza con 2
factores, asistencia a clase y tiempo de estudio. O lo que es equivalente en este caso, trabajar con
muestras pareadas independientes en que el criterio para establecer las parejas fuera emparejar
a estudiantes que dedicaran el mismo tiempo a estudiar la asignatura.
El Analisis de la Varianza nos permitira considerar mas niveles para cada factor. Por ejemplo,
que el tiempo de estudio tomara los valores: 0 horas, 1 hora, 2 horas, mas de 2 horas por semana.
Lo mismo se podra aplicar a la asistencia a clase: siempre, casi siempre, pocas veces o nunca.
Tambien nos permitira responder a las preguntas, cunde lo mismo 1 hora de estudio cuando
se va clase que 1 hora de estudio cuando no se va a clase?, se aprovecha igual una hora de
clase cuando se ha estudiado que cuando no se ha estudiado?
Otra opcion, que reducira el ambito de aplicacion de las conclusiones del estudio, sera limitarlo
a estudiantes con los mismos habitos de estudio.
10. Estamos interesados en saber si los salarios medios en dos grandes ciudades de un pas son ho-
mogeneos o si, por el contrario, se puede evidenciar que hay diferencias signicativas en los salarios
que perciben los trabajadores de estas 2 ciudades. Para ello se tomaron muestras aleatorias in-
dependientes de trabajadores (de actividades similares y niveles similares) en las 2 ciudades y se
obtuvieron los siguientes datos:
Ciudad 1 5.9 6.1 6.3 6.1 6 6.2 5.7 6.3 6.6
Ciudad 2 6.4 6.3 6.5 6.1 5 5.5 4.7 5.1 2.8 1.8 1.5
(a) Plantea un contraste bilateral para ver si hay diferencias signicativas en los salarios que perci-
ben los trabajadores de estas 2 ciudades. A que conclusion llegas para un nivel de signicacion
de =0.1? Da una cota para el p-valor.
(b) En el siguiente graco se representan los datos obtenidos teniendo ademas en cuenta el sexo de
los trabajadores (los triangulos corresponden a mujeres)
1.0 1.2 1.4 1.6 1.8 2.0
2
3
4
5
6
ciudad
s
a
l
a
r
i
o
h
m
A la vista del graco, te replantearas el estudio?
Solucion.
9
(a) Sea X = salario de los trabajadores de la ciudad 1, e Y = salario de los trabajadores de la
ciudad 2. Nos piden que planteemos un contraste bilateral:
H
0
:
X
=
Y
H
1
:
X
=
Y
Asumiendo normalidad, varianzas iguales y muestras independientes, el estadstico del contraste
es:
T =
X Y
s
P
_
1
9
+
1
11

H
0
t
18
Para los valores obtenidos:
x = 6.13 y = 4.7
s
2
X
= 0.0675 s
2
Y
= 3.3801
s
X
= 0.2598 s
Y
= 1.8385
y
s
2
P
=
8 0.0675 + 10 3.3801
18
= 1.9078 t =
6.13 4.7
_
1.9078
_
1
9
+
1
11
_
= 2.30
Para = 0.1, el valor crtico correspondiente es t
18;0.05
= 1.734 < 2.30. Rechazamos H
0
. Para un
nivel del 5 % nos ocurre lo mismo, t
18;0.025
= 2.101 < 2.30. Sin embargo, t
18;0.005
= 2.878 > 2.30,
luego no rechazamos H
0
a un nivel de signicacion del 1 %. El p-valor del contraste tiene que
estar entre estos 2 ultimos valores p valor (0.025, 0.05). Con el ordenador se obtiene:
p valor = 2P{t
18
2.30} = 0.033
Es un p-valor bajo, nos llevara a rechazar H
0
.
(b) Se puede tratar de un falso positivo. Todo apunta a que la diferencia que hemos detectado se
debe a que en la muestra de la ciudad 2 hay 3 salarios atpicos. Muy bajos con respecto al resto
de los salarios observados. Al estudiar si estos 3 datos tenan algo en com un se comprobo que
los 3 correspondan a mujeres.
A partir de aqu, se tienen 2 opciones:
Incluir la informacion sobre el sexo en el modelo: analisis de la varianza con 2 factores, sexo y
ciudad. O lo que es equivalente en este caso, trabajar con muestras pareadas independientes
en que el criterio para establecer las parejas fuera emparejar a trabajadores del mismo sexo.
Todo ello manteniendo la premisa de que todos los trabajadores de ambas muestras tenan
niveles similares y desempe naban actividades tambien similares.
Restringir el estudio solo a hombres, o solo a mujeres.
11. Para juzgar si la introduccion de un nuevo plan de estudios ha mejorado la formacion de los
estudiantes se toma una muestra de 30 estudiantes del plan antiguo y 30 del nuevo. Los estudiantes
se eligen de manera que tengan una nota similar de entrada en la universidad y la misma edad,
para que las comparaciones sean homogeneas. Los 60 estudiantes realizan una misma prueba de
conocimientos, obteniendo los estudiantes del plan antiguo una media de 7.2 y una cuasidesviacion
tpica de 2,1. Para los estudiantes del nuevo plan la media es 7.4 con cuasidesviacion tpica 1.9.
Para un nivel de signicacion del 1 % se pide contrastar si esta introduccion de un nuevo plan ha
mejorado la formacion de los estudiantes.
La respuesta debe incluir:
(a) Las hipotesis nula y alternativa para este contraste.
(b) La expresion del estadstico de contraste y la region crtica del contraste.
(c) Los calculos necesarios para evaluar si los datos pertenecen a la region crtica, o para obtener
el p-valor. Tu conclusion sobre el contraste.
(d) Especicar los supuestos en los que se basa el analisis en los apartados anteriores.
Solucion.
10
a) Las hipotesis del test son:
H
0
:
a

n
H
1
:
a
<
n
b) El estadstico del contraste y la region crtica son:
T =
x
a
x
n
(
a

n
)
s
P
_
1/n
a
+ 1/n
n
t
n
a
+n
n
2
R = {T < t
n
a
+n
n
2;/2
}
c) Los valores que necesitamos son t
58;0.01
= 2.3924 y
s
P
=
_
(30 1) 2,1
2
+ (30 1) 1,9
2
30 + 30 2
= 2,0
El valor del estadstico es
T =
7.2 7.4
2
_
(1/30 + 1/30)
= -0.38
Como -0.38 > - 2.3924, no rechazamos la hipotesis nula a un nivel de signicacion del 1 %, y
no podemos concluir que la formacion haya mejorado.
d) Los supuestos son: cada muestra esta compuesta de observaciones independientes que siguen
una distribucion normal, y ambas muestras son independientes.
12. Disponemos del n umero de das que cada paciente permanece ingresado en un hospital para dos
muestras independientes de 39 hombres y 35 mujeres.
Hombres (1) Mujeres (2)
1 2 5 9 14 1 3 5 9 15
1 2 6 10 15 1 4 6 9 18
1 3 6 10 17 1 4 6 10 21
1 3 6 11 18 1 4 7 12
1 3 7 12 19 2 4 7 12
1 3 7 12 23 2 5 7 14
2 4 8 13 24 3 5 7 14
2 4 9 13 3 5 7 15
x
1
= 7.90, s
1
= 6.41, x
2
= 7.11, s
2
= 5.16
a) Calcula un intervalo de conanza al 95 % para el n umero medio de das que un hombre per-
manece ingresado en el hospital. Interpreta dicho intervalo. Necesitamos asumir normalidad?
Por que?
b) Especicando claramente la hipotesis nula y la alternativa, podemos armar que el n umero
medio de das que una mujer permanece ingresada es signicativamente diferente que el n umero
medio de das que un hombre permanece ingresado? Calcula el p-valor.
c) Tambien estamos interesados en estudiar cuantos pacientes permanecen ingresados mas de
una semana (8 das o mas). Con un nivel de signicacion del 10 %, y especicando claramen-
te la hipotesis nula y la alternativa, podemos armar que la proporcion de pacientes que
permanecen ingresados mas de una semana es mayor para los hombres que para las mujeres?
Solucion.
a) Intervalo de conanza aproximado para la media de una poblacion, muestras grandes:
IC = x
1
z
/2
s
1

n
1
= 7,90 1,96
6,41

39
5,98
1
9,91
Con un nivel de conanza del 95 % podemos armar que el n umero medio de das que un
hombre permanece ingresado esta entre 5,98 das y 9,91 das.
Claramente los datos no siguen una distribucion normal, pero no necesitamos asumir norma-
lidad ya que, para muestras de tama no 39, el Teorema Central del Lmite nos dice que la
distribucion de la media muestral es aproximadamente normal.
11
b) Comparacion de medias de dos poblaciones, muestras grandes. Denicion del contraste:
H
0
:
1
=
2
, H
1
:
1
=
2
Valor del estadstico y p-valor:
t =
7,90 7,11
_
6,41
2
39
+
5,16
2
35
= 0,59, p-valor = 2P(Z > 0,59) = 0,555
No rechazamos H
0
ya que el p-valor es muy grande. Concluimos que no hay diferencia signi-
cativa entre el n umero medio de das que un hombre permanece ingresado y el n umero medio
de das que una mujer permanece ingresada.
c) Comparacion de proporciones, muestras grandes. Denicion del contraste:
H
0
: p
1
p
2
, H
1
: p
1
> p
2
Valor del estadstico y p-valor:
t =
17/39 11/35

17 + 11
39 + 35
_
1
28
74
__
1
39
+
1
35
_
= 1,08, p-valor = 0,1401 > = 0,1
No rechazamos H
0
ya que el p-valor es mayor que 10 %. Concluimos que la proporcion de
pacientes que permanecen ingresados mas de una semana no es mayor para los hombres que
para las mujeres.
13. Un fabricante asegura que la utilizacion de un aditivo en la gasolina hace que disminuya el consumo
de los coches en al menos 2 litros por cada 100 Kilometros. Para contrastar esta armacion se ha
evaluado la variable aleatoria n umero de litros consumidos en 100 Kilometros para dos muestras.
La primera la formaban los nueve coches en los que se haba utilizado el aditivo, y la segunda
aquellos trece coches en los que no se haba utilizado. Los datos de la primera y segunda muestra
verican:
9

i=1
x
i
= 74,
9

i=1
x
2
i
= 645,
13

i=1
y
i
= 130,
13

i=1
y
2
i
= 1370
a) Realiza un contraste de igualdad de varianzas para un nivel de signicacion del 10 %.
b) Supongamos varianzas desconocidas e iguales y muestreos independientes. Podemos creer lo
que arma el fabricante?
Especica las hipotesis empleadas para llevar a cabo cada contraste, as como el estadstico del
contraste, la region de rechazo y la conclusion a la que llegas.
Solucion.
a) Queremos contrastar si las varianzas son iguales. Nuestras hipotesis seran:
H
0
:
2
x
=
2
y
H
1
:
2
x
=
2
y
Se rechazara la hipotesis nula de igualdad de varianzas cuando el valor del estadstico del
contraste, en nuestro caso el cociente entre las cuasivarianzas muestrales, pertenezca a la cola
de una distribucion F. Calculamos el estadstico del contraste a partir de las cuasivarianzas
muestrales obteniendo:
t =
s
2
x
s
2
y
= 0.783
Este valor no pertenece a la region de rechazo para el contraste de varianzas de dos muestras
independientes,
R = {t < F
n
x
1,n
y
1;1/2
} {t > F
n
x
1,n
y
1;/2
}
ya que en nuestro caso tenemos que F
8,12;0.95
= 0.3045 y F
8,12;0.05
= 2.8486. En consecuen-
cia, la informacion de que disponemos no nos permite concluir que las varianzas puedan ser
diferentes.
12
b) Como hemos comentado, suponemos varianzas desconocidas e iguales y muestreos indepen-
dientes. Se tiene que contrastar las hipotesis
H
0
:
y

x
2
H
1
:
y

x
< 2
El estadstico para el contraste relativo a la diferencia de medias toma el valor
D =
(

X

Y 2)
s
P
_
1/n
x
+ 1/n
y
= -0.222
donde s
P
=2.308, y la region de rechazo viene dada por
R = {D < t
n
x
+n
y
2;
}
Dado que t
20;0.1
= 1.325, el valor del estadstico para esta muestra no esta en la region crtica, y
llegamos a la conclusion que los datos obtenidos son compatibles con lo que arma el fabricante.
14. De acuerdo a la ultima encuesta de pernoctaciones en establecimientos hoteleros (Encuesta de
ocupacion hotelera 2009) disponemos de datos que nos indican que el grado de ocupacion del 2008
fue del 59,75 % mientras que en 2009 fue del 58,28 %. Si suponemos que los tama nos muestrales sobre
los que se ha hecho la encuesta para conocer el grado de ocupacion eran de 2400 establecimientos
en el a no 2008 y 2500 en 2009:
a) Calcula un intervalo de conanza al 95 % para la diferencia de la ocupacion en 2009 frente a
la del 2008.
b) Valora a traves de un contraste y con un nivel de signicacion del 5 % si el porcentaje del
grado de pernoctacion ha disminuido en el 2009 en relacion al 2008.
c) Razona si el hecho que el intervalo contenga el cero esta relacionado con el hecho que en
el segundo apartado no hayamos rechazado la hipotesis nula de igualdad, pese a que es un
contraste unilateral.
d) Cambiara la respuesta a este razonamiento en los dos apartados si la conanza fuese del 99 %
(nivel de signicacion del 1 %) en lugar del 95 % (nivel de signicacion del 5 %)?
Solucion.
a) El intervalo sobre la diferencia de proporciones al 95 % de conanza viene dado por la expresion:
p
09
p
08
z
0,025

p(1 p)
_
1
n
09
+
1
n
08
_
donde la proporcion com un de los dos a nos es p = (0,5975 2400 + 0,5828 2500)/(2400 +
2500) = 0,59. Si sustituimos las proporciones y las medidas muestrales indicadas en el enun-
ciado y tenemos presente que z
0,025
= 1,96, obtenemos el siguiente intervalo de conanza:
0,5828 0,5975 1,96

0,59 0,41
_
1
2500
+
1
2400
_
= 0,0147 0,0275 = [0,0422; 0,0128].
b) Tenemos que realizar un contraste sobre la diferencia de proporciones. Las hipotesis del mismo
seran: H
0
: p
09
p
08
vs. H
1
: p
09
< p
08
.
El estadstico de contraste, T, se distribuira seg un una normal estandar y tendra la siguiente
expresion:
T =
p
09
p
08
_
p(1 p)
_
1
n
09
+
1
n
08
_
N(0, 1).
As pues, para los datos muestrales tenemos:
T =
0,5828 0,5975
_
0,59 0,41
_
1
2500
+
1
2400
_
= 1,046
13
Por otro lado, como estamos trabajando a un nivel del 5 % de signicacion y hemos planteado
un contraste unilateral, el valor crtico sera z
0,95
= 1,645.
Como T > z
0,95
, no rechazaremos la hipotesis nula y no podremos armar que el nivel de
pernoctaciones del 2009 tenga diferencias signicativas con el del 2008.
c) Que el intervalo contenga el cero quiere decir que con alta probabilidad la diferencia de propor-
ciones de pernoctaciones del 2009 en relacion al 2008 es igual a cero, es decir que la proporcion
del 2009 es equivalente a la proporcion del 2008. Y esta es la conclusion del segundo apartado.
d) En cuanto al aumento de conanza, aumentandola al 99 % el nuevo intervalo sera mas ancho, y
continuara incluyendo el cero. En cuanto al contraste, el p-valor continuara siendo el mismo y
si ya hemos aceptado la H
0
, la continuaramos aceptando para un menor nivel de signicacion,
puesto que el valor crtico sera mas peque no todava, mientras que el valor de T sera el mismo.
14

Das könnte Ihnen auch gefallen