Beruflich Dokumente
Kultur Dokumente
Ejercicios Tema 3
Soluciones
1. Se quiere evaluar el efecto del ruido sobre la habilidad de las personas para realizar una determinada
tarea. Para ello, se seleccionan 32 personas que son capaces de realizar la misma tarea en el mismo
tiempo para realizar dicha tarea en un medio controlado y bajo 2 niveles distintos de ruido de fondo.
De entre esas 32, se seleccionan aleatoriamente 16 para llevar a cabo la tarea sometidas a un ruido
de fondo de nivel 2. Las restantes 16 las realizaran con poco ruido de fondo (nivel 1). Los tiempos
(en minutos) que se registran son:
nivel 1
nivel 2
14
20
12
22
15
18
15
18
11
19
16
15
17
18
12
15
14
22
13
18
18
19
13
15
18
21
15
22
16
18
11
16
(a) Plantea el contraste oportuno, especificando claramente la hipotesis nula y alternativa que
consideras.
(b) Calcula el p-valor del contraste, suponiendo normalidad y la misma varianza.
Soluci
on.
a) Lo que queremos saber es si el aumentar el nivel de ruido influye negativamente en la capacidad
para llevar a cabo la tarea en cuestion y, por tanto, optamos por plantear un contraste unilateral.
H0 : 1 2
H1 : 1 < 2
donde 1 y 2 representan los tiempos medios de realizacion de la tarea bajo los niveles de ruido
1 y 2, respectivamente. La hip
otesis alternativa implica que al aumentar el nivel de ruido del
nivel 1 al 2 el tiempo medio de realizacion de la tarea aumenta estrictamente.
b) En este caso, para tomar una decision asumimos que X N (1 , 2 ), Y N (2 , 2 ), siendo
X1 . . . , X16 , Y1 , . . . , Y16 dos m.a.s. de X e Y , respectivamente, independientes entre s.
La asignaci
on de personasnivel de ruido se hizo aleatoriamente para evitar sesgos.
1 , y la region de rechazo:
El estadstico del contraste es T = XY
sP
R = {T t30, } = {T t30, }
Para los datos obtenidos:
x = 14.375
s2X
y = 18.5
s2Y
= 5.18333
sX = 2.27669
sY = 2.44949
= 6.0
5.18333+6
2
= 5.59166. Luego,
14.375 18.5
-4.125
q 2
= -4.9339
=
0.8360
sP
8
2. Se quiere determinar si el paro en dos grandes areas urbanas del pas, como son Madrid y Barcelona,
es diferente. Para ello se toman muestras aleatorias en ambas ciudades, cada una de 500 personas,
obteniendose que en Madrid 35 estaban desempleadas y en Barcelona 25. Existe alguna razon para
creer que las frecuencias de paro en Madrid y Barcelona son diferentes?
(a) Plantea el contraste oportuno con un nivel de significacion del 5 %, especificando claramente la
hip
otesis nula y alternativa que consideras, as como las hipotesis de trabajo.
(b) Calcula el p-valor del contraste.
Soluci
on.
(a) Las dos poblaciones que se est
an comparando son las respectivas poblaciones activas de las
ciudades de Madrid y Barcelona. Las dos variables aleatorias de trabajo son:
X Ber(pM )
Y Ber(pB )
donde pM = probabilidad de estar en paro en Madrid, y pB = probabilidad de estar en paro
en Barcelona.
Queremos comparar la proporci
on de desempleados en ambas ciudades, para lo que planteamos
el contraste de hip
otesis:
H0 : pM = pB = p0
H1 : pM 6= pB
Como n1 = n2 = 500 son grandes, podemos construir el contraste a partir del estadstico:
T (X1 , . . . , X500 ; Y1 , . . . , Y500 ) = p
pM pB
p0 (1 p0 )/250
vH0 N (0, 1)
+500pB
es la mejor estimacion de la frecuencia de paro com
un bajo H0 , y pM ,
donde p0 = 500pM1000
pB son las proporciones muestrales correspondientes a Madrid y Barcelona, respectivamente.
La regi
on de rechazo del contraste, para = 0,05, es:
n
o
pM pB
R = (x1 , . . . , x500 ; y1 , . . . , y500 ) / p
z 2 = 1.96
p0 (1 p0 )/250
En nuestro caso, pM =
35
500
=0.07, pB =
p0 =
Luego,
25
500
=0.05, y
pM + pB
0,07 + 0,05
=
= 0,06
2
2
0,07 0,05
T (x1 , . . . , x500 ; y1 , . . . , y500 ) = q
w 1,33 < 1,96
0,060,94
250
A un nivel de significaci
on del 5 % no hay evidencia estadstica de que las frecuencias de paro
sean diferentes.
Para aplicar el resultado anterior tenemos que asumir que las dos muestras tomadas son independientes entre s y son cada una de ellas m.a.s. La aleatorizacion, ademas del resultado teorico,
trata de evitar que las diferencias detectadas puedan ser debidas a otros factores distintos de
la ciudad, como pudiera ser el sector (falso positivo).
(b) El p-valor del contraste, al ser bilateral, se calcula como
p = mn 2P r{Z 1,33}, 2P r{Z 1,33} = 2 0,0918 = 0,1836,
siendo Z N (0, 1). Ten en cuenta que p te debe salir mayor que 0,05.
(n2 1)s2Y
2n2 1 independientes
2
(n1 1)s2X + (n2 1)s2Y
2n1 +n2 2
2
Adem
as,
1
(X Y ) (X Y )
1
r
=
+
N (0, 1)
X Y N X Y , 2
n1
n2
1
1
2
n1 + n2
Luego, el estadstico:
(XY )(X Y )
q
n1 + n1
(X Y ) (X Y )
1
2
q
=q
tn1 +n2 2
(n1 1)s2X +(n2 1)s2Y
1
1
sP n1 + n2
2 (n +n 2)
1
(X Y ) (X Y )
q
P tn1 +n2 2; 2
tn1 +n2 2; 2 = 1
sP n11 + n12
De donde, despejando convenientemente, se obtiene
r
r
1
1
1
1
I.C.1 (X Y ) = (X Y ) tn1 +n2 2; 2 sP
+
, (X Y ) + tn1 +n2 2; 2 sP
+
n1
n2
n1
n2
La amplitud del intervalo es:
r
2 tn1 +n2 2; 2 sP
1
1
+
n1
n2
Soluci
on.
(a) Como la conjetura no especifica que la actitud de hombres o mujeres sea mejor o peor, solo que
haya diferencias, planteamos un contraste bilateral:
H0 : 1 = 2
H1 : 1 6= 2
donde 1 y 2 representan los puntuaciones medias que otorgan los hombres y mujeres, respectivamente. La hip
otesis alternativa implica que, efectivamente, tal y como se ha conjeturado,
existen diferencias en cuanto a la actitud hacia las mujeres ejecutivas entre los hombres y las
mujeres.
Para definir la regi
on de rechazo del test no hacemos hipotesis alguna sobre la distribucion de
X e Y . Como estamos trabajando con muestras grandes podemos emplear el Teorema Central
del Lmite para definir la siguiente region de rechazo:
R = {|T | z 2 },
donde el estadstico del contraste es
T =q
En este caso:
t= q
X Y
s2X
151
85.8 71.5
372.49
151
148.84
108
s2Y
108
14.3
= 7.2926
1.9609
110
102
125
120
141
135
113
114
182
175
tiempo
180
160
140
120
100
A
ordenador
Soluci
on.
(a) Para trabajar con muestras dependientes apareadas tenemos que evaluar las diferencias X Y ,
siendo X e Y los tiempos de procesamiento en los ordenadores A y B, respectivamente. Los
on
valores obtenidos son 8, 5, 6, 1, 7, lo que supone una diferencia media de d = 5 y una desviaci
tpica de sD =3.53. Entonces,
5
t = 3.53 = 3.164
La regi
on de rechazo para el contraste bilateral:
H0 : X Y = 0
H1 : X Y 6= 0
es R = {|T | t4; 2 }. Para un nivel de significacion del 5 %, se tiene que el valor crtico
correspondiente es t4;0.025 = 2.776 < 3.164 y, por tanto, se rechaza H0 . Se han detectado,
entonces, diferencias significativas en los tiempos de procesamiento de ambos ordenadores para
= 0.05. El p-valor del contraste es entonces menor que 0.05. Podemos acotarlo entre 0.02 <
p valor < 0.05, ya que:
p valor = 2P {t4 3.164} > 2P {t4 3.747} = 2 102
(b) Si se obvia el hecho de que los datos estan apareados y se trabaja como si de dos muestras
independientes se tratara se tiene que:
x = 134,2, sX = 29,37,
y = 129,2, sY = 27,3
29.372 + 27.32
s2X + s2Y
=
= 803.9434
2
2
xy
t= q 2 =
2sP
5
5
= 0.2788
17.9326
Ahora la regi
on de rechazo es: R = {|T | t8; 2 } y el p-valor:
p valor = 2P {t8 0.2788} > 2 0.25
que nos lleva a concluir todo lo contrario.
(c) Lo que est
a ocurriendo es que la variabilidad experimental es muy grande. La variabilidad dentro de cada grupo es muy grande. Una de las operaciones, la quinta concretamente, supone un
tiempo de ejecuci
on considerablemente mayor que el resto en ambos casos, lo que hace disminuir ostensiblemente la potencia del contraste (no se detectan las diferencias). Al trabajar con
muestras apareadas las diferencias debidas a la naturaleza de las operaciones quedan eliminadas
(explicadas convenientemente).
6. Se conjetura que las acciones de una compa
na sufriran mas variacion en una industria con competencia en precios que en una en la que existiera un duopolio y colusion tacita. En un estudio sobre
la industria de generadores mediante turbinas de vapor2 , se hallo que en 4 a
nos de competencia en
precios la variaci
on de las acciones de la General Electric fue de 114.09. En los siguientes 7 a
nos,
en los cuales hubo un duopolio y colusion tacita, esta varianza fue de 16.08. Asumir que los datos
pueden considerarse muestras aleatorias independientes de dos poblaciones normales y contrastar
al 5 % la conjetura anterior.
Soluci
on.
Sea X = valor de las acciones de GE en una industria con competencia en precios, e Y = valor de
las acciones de GE en un duopolio con colusion tacita.
2 B.T.Allen, Tacit collusion and market sharing: The case of steam turbine generators, Industrial Organization Review
4 (1976), 48-57. Ver Newbold.
2
La conjetura que se quiere contrastar establece que X
> Y2 , por lo que optamos por el contraste
unilateral:
2
H0 : X
Y2
2
H1 : X > Y2
s2X
H0 F(3,6)
s2Y
R = {T > F(3,6); }
pA pB
p0 (1 p0 )(1/125 + 1/100
vH0 N (0, 1)
14
=0.06222 es la mejor estimacion de la frecuencia de fallo com
un bajo H0 , y
donde p0 = 225
7
7
pA = 125 =0.056 , pB = 100
= 0.07 son las proporciones de unidades defectuosas en los dos lotes.
La regi
on de rechazo del contraste, para , es:
n
o
pA pB
R = (x1 , . . . , x125 ; y1 , . . . , y100 ) / p
z
p0 (1 p0 )/225
En nuestro caso,
0.056 0.07
t= q
1
0.0622 0.9378( 125
+
1
100 )
w -0.432
de 0.56. Plantea el contraste oportuno especificando claramente la hipotesis nula y alternativa que
consideras, as como las hip
otesis de trabajo. Define la region de rechazo del contraste para un nivel
de significaci
on y obten el p-valor del contraste.
Soluci
on.
Como no se dice nada sobre que la profesora este conjeturando que los alumnos que ejercen su derecho al voto esten m
as o menos interesados que aquellos que no lo ejercen, solo que hay diferencias,
podemos optar por plantear un contraste bilateral:
H0 : X Y = 0
H1 : X Y 6= 0
donde X es la nota media de los alumnos que ejercen su derecho al voto, mientras que Y es la nota
media de los alumnos que no votan. No obstante, podemos interpretar que en lo que esta pensando
la profesora es en que el interes de los alumnos que se preocupan de votar sea mayor, y que esto se
traduzca en mejores notas. En ese caso, podemos plantear el contraste unilateral:
H0 : X Y
H1 : X > Y
En ambos casos, para definir la region de rechazo del test no hacemos hipotesis alguna sobre
la distribuci
on de X e Y . Como estamos trabajando con muestras grandes podemos emplear el
Teorema Central del Lmite para definir la siguiente region de rechazo:
R = {|T | z 2 },
para el contraste bilateral. Y
R = {T z },
para el contraste unilateral. En ambos casos, el estadstico del contraste es
T =q
En este caso:
X Y
s2X
114
s2Y
123
2.71 2.79
-0.08
t= q
= -1.02
=
2
2
0.0784
0.64
0.56
+
114
123
2.5
0.75
1.5
1.5
7
3
4
1
8.2
4
6.8
4.5
9.5
6.5
8
5
(a) Plantea un contraste bilateral para ver si hay diferencias significativas en las calificaciones
medias de los alumnos debidas a la asistencia a clase. A que conclusion llegas para un nivel
de significaci
on de =0.05? Da una cota para el p-valor.
(b) A la vista de los resultados obtenidos en el apartado anterior, cambiara la conclusion a la que
llegas si te replanteas el contraste y optas por uno unilateral?, como cambiara el p-valor?
7
notas
10
(c) En el siguiente gr
afico se representan los datos obtenidos teniendo ademas en cuenta las horas
que cada alumno dedica al estudio de la asignatura fuera de las horas de clase (triangulos: m
as
de 1 horas semanal de estudio, crculos: menos de 1 hora).
0.0
0.2
0.4
0.6
0.8
1.0
clase
A la vista del gr
afico, crees que aumentara la potencia del contraste si se replantea el estudio para trabajar con muestras apareadas. En caso de que la respuesta sea afirmativa, con
que criterio estableceras las parejas?
Soluci
on.
(a) Sea X = calificaci
on de los alumnos que asisten a clase, e Y = calificacion de los alumnos que
rara vez asisten a clase.
Queremos analizar si hay diferencias significativas en las calificaciones que obtiene un alumno
por el hecho de asistir o no a clase. Planteamos un contraste bilateral:
H0 : X = Y
H1 : X 6= Y
Asumiendo normalidad, varianzas iguales y muestras independientes, el estadstico del contraste
es:
X Y
T =
H0 t14
sP /2
Para los valores obtenidos:
x = 5.9375
s2X
y = 3.28125
s2Y
= 8.457
sX = 2.908086
sY = 2.076387
= 4.311
8.457+4.311
2
5.9375 3.28125
sP
2
=6.384. Luego,
= 2.103
La regi
on de rechazo al 5 % es
R0,05 = {|T | t14;0.025 }
t14;0.025 = 2.145 no rechazamos H0 al nivel fijado. El p-valor del contraste sera mayor que
0.05.
t14;0.05 = 1.761 rechazamos H0 al 10 %. El p-valor del contraste sera menor que 0.1.
8
5.9
6.4
6.1
6.3
6.3
6.5
6.1
6.1
6
5
6.2
5.5
5.7
4.7
6.3
5.1
6.6
2.8
1.8
1.5
(a) Plantea un contraste bilateral para ver si hay diferencias significativas en los salarios que perciben los trabajadores de estas 2 ciudades. A que conclusion llegas para un nivel de significaci
on
de =0.1? Da una cota para el p-valor.
h
m
salario
(b) En el siguiente gr
afico se representan los datos obtenidos teniendo ademas en cuenta el sexo de
los trabajadores (los tri
angulos corresponden a mujeres)
1.0
1.2
1.4
1.6
ciudad
A la vista del gr
afico, te replantearas el estudio?
Soluci
on.
1.8
2.0
y = 4.7
s2Y
= 0.0675
sX = 0.2598
y
s2P =
= 3.3801
sY = 1.8385
8 0.0675 + 10 3.3801
6.13 4.7
= 1.9078 t = q
18
1.9078 19 +
1
11
= 2.30
Para = 0.1, el valor crtico correspondiente es t18;0.05 = 1.734 < 2.30. Rechazamos H0 . Para un
nivel del 5 % nos ocurre lo mismo, t18;0.025 = 2.101 < 2.30. Sin embargo, t18;0.005 = 2.878 > 2.30,
luego no rechazamos H0 a un nivel de significacion del 1 %. El p-valor del contraste tiene que
estar entre estos 2 u
ltimos valores p valor (0.025, 0.05). Con el ordenador se obtiene:
p valor = 2P {t18 2.30} = 0.033
Es un p-valor bajo, nos llevara a rechazar H0 .
(b) Se puede tratar de un falso positivo. Todo apunta a que la diferencia que hemos detectado se
debe a que en la muestra de la ciudad 2 hay 3 salarios atpicos. Muy bajos con respecto al resto
de los salarios observados. Al estudiar si estos 3 datos tenan algo en com
un se comprobo que
los 3 correspondan a mujeres.
A partir de aqu, se tienen 2 opciones:
Incluir la informaci
on sobre el sexo en el modelo: analisis de la varianza con 2 factores, sexo y
ciudad. O lo que es equivalente en este caso, trabajar con muestras pareadas independientes
en que el criterio para establecer las parejas fuera emparejar a trabajadores del mismo sexo.
Todo ello manteniendo la premisa de que todos los trabajadores de ambas muestras tenan
niveles similares y desempe
naban actividades tambien similares.
Restringir el estudio s
olo a hombres, o solo a mujeres.
11. Para juzgar si la introducci
on de un nuevo plan de estudios ha mejorado la formacion de los
estudiantes se toma una muestra de 30 estudiantes del plan antiguo y 30 del nuevo. Los estudiantes
se eligen de manera que tengan una nota similar de entrada en la universidad y la misma edad,
para que las comparaciones sean homogeneas. Los 60 estudiantes realizan una misma prueba de
conocimientos, obteniendo los estudiantes del plan antiguo una media de 7.2 y una cuasidesviaci
on
tpica de 2,1. Para los estudiantes del nuevo plan la media es 7.4 con cuasidesviacion tpica 1.9.
Para un nivel de significaci
on del 1 % se pide contrastar si esta introduccion de un nuevo plan ha
mejorado la formaci
on de los estudiantes.
La respuesta debe incluir:
(a) Las hip
otesis nula y alternativa para este contraste.
(b) La expresi
on del estadstico de contraste y la region crtica del contraste.
(c) Los c
alculos necesarios para evaluar si los datos pertenecen a la region crtica, o para obtener
el p-valor. Tu conclusi
on sobre el contraste.
(d) Especificar los supuestos en los que se basa el analisis en los apartados anteriores.
Soluci
on.
10
a) Las hip
otesis del test son:
H0
H1
: a n
: a < n
x
a x
(a n )
pn
tna +nn 2
sP 1/na + 1/nn
{T < tna +nn 2;/2 }
7.2 7.4
T = p
= -0.38
2 (1/30 + 1/30)
Como -0.38 > - 2.3924, no rechazamos la hipotesis nula a un nivel de significacion del 1 %, y
no podemos concluir que la formacion haya mejorado.
d ) Los supuestos son: cada muestra esta compuesta de observaciones independientes que siguen
una distribuci
on normal, y ambas muestras son independientes.
12. Disponemos del n
umero de das que cada paciente permanece ingresado en un hospital para dos
muestras independientes de 39 hombres y 35 mujeres.
1
1
1
1
1
1
2
2
Hombres (1)
2 5 9
2 6 10
3 6 10
3 6 11
3 7 12
3 7 12
4 8 13
4 9 13
x
1 = 7.90,
14
15
17
18
19
23
24
s1 = 6.41,
1
1
1
1
2
2
3
3
Mujeres (2)
3 5 9 15
4 6 9 18
4 6 10 21
4 7 12
4 7 12
5 7 14
5 7 14
5 7 15
x
2 = 7.11,
s2 = 5.16
b) Comparaci
on de medias de dos poblaciones, muestras grandes. Definicion del contraste:
H1 : 1 6= 2
H0 : 1 = 2 ,
Valor del estadstico y p-valor:
t= r
7,90 7,11
5,162
6,412
+
39
35
= 0,59,
No rechazamos H0 ya que el p-valor es muy grande. Concluimos que no hay diferencia significativa entre el n
umero medio de das que un hombre permanece ingresado y el n
umero medio
de das que una mujer permanece ingresada.
c) Comparaci
on de proporciones, muestras grandes. Definicion del contraste:
H0 : p1 p2 ,
H1 : p1 > p2
17/39 11/35
= 1,08,
17 + 11
28
1
1
1
+
39 + 35
74
39 35
i=1
i=1
i=1
: x2 = y2
: x2 =
6 y2
Se rechazar
a la hip
otesis nula de igualdad de varianzas cuando el valor del estadstico del
contraste, en nuestro caso el cociente entre las cuasivarianzas muestrales, pertenezca a la cola
de una distribuci
on F. Calculamos el estadstico del contraste a partir de las cuasivarianzas
muestrales obteniendo:
s2
t = x2 = 0.783
sy
Este valor no pertenece a la region de rechazo para el contraste de varianzas de dos muestras
independientes,
R = {t < Fnx 1,ny 1;1/2 } {t > Fnx 1,ny 1;/2 }
ya que en nuestro caso tenemos que F8,12;0.95 = 0.3045 y F8,12;0.05 = 2.8486. En consecuencia, la informaci
on de que disponemos no nos permite concluir que las varianzas puedan ser
diferentes.
12
b) Como hemos comentado, suponemos varianzas desconocidas e iguales y muestreos independientes. Se tiene que contrastar las hipotesis
H0
H1
: y x 2
: y x < 2
Y 2)
(X
p
= -0.222
sP 1/nx + 1/ny
0,5828 0,5975
0,59 0,41
13
1
2500
1
2400
= 1,046
Por otro lado, como estamos trabajando a un nivel del 5 % de significacion y hemos planteado
un contraste unilateral, el valor crtico sera z0,95 = 1,645.
Como T > z0,95 , no rechazaremos la hipotesis nula y no podremos afirmar que el nivel de
pernoctaciones del 2009 tenga diferencias significativas con el del 2008.
c) Que el intervalo contenga el cero quiere decir que con alta probabilidad la diferencia de proporciones de pernoctaciones del 2009 en relacion al 2008 es igual a cero, es decir que la proporci
on
del 2009 es equivalente a la proporcion del 2008. Y esta es la conclusion del segundo apartado.
d ) En cuanto al aumento de confianza, aumentandola al 99 % el nuevo intervalo sera mas ancho, y
continuara incluyendo el cero. En cuanto al contraste, el p-valor continuara siendo el mismo y
si ya hemos aceptado la H0 , la continuaramos aceptando para un menor nivel de significacion,
puesto que el valor crtico sera mas peque
no todava, mientras que el valor de T sera el mismo.
14