Sie sind auf Seite 1von 8

Univ. de Alcala. Fac.

de Biologa Grados en Biologa y Biologa Sanitaria


Dpto. de Matematicas Estadstica, 2013-2014
Hoja de Ejercicios 6.
Otros intervalos de conanza. Contrastes de hip otesis.
1. Intervalos de conanza para proporciones (una poblaci on)
1. En una poblacion se desea conocer la probabilidad de que un individuo sea alergico al polen de
las acacias. En 100 individuos tomados al azar se observaron 10 alergicos. Hallar el intervalo de
conanza al 95 % para la probabilidad pedida. Cuantos individuos se deberan observar para que,
con probabilidad 0.95, el error maximo en la estimacion de la proporcion de alergicos sea del 0.01?
2. Una noticia en el periodico dice que, de 1000 personas encuestadas sobre una cuestion, 556 se
muestran a favor y 444 en contra, y concluye armando que el 55.6 % de la poblacion se muestra a
favor con un margen de error de 3 %. Cual es el nivel de conanza de esta armacion?
3. Una encuesta electoral en la que se ha preguntado a 100 votantes elegidos al azar dentro de un
distrito electoral ha concluido que el 55 % de los entrevistados va a votar a cierta candidata. En-
contrar intervalos de conanza al (a) 95 %, (b) 99 %, y (c) 99.73 % para la proporcion de votantes
favorables a esa candidata. Que tama no de muestra deberamos utilizar para estar seguros al 95 %
de que la candidata resultara elegida?
2. Intervalos de conanza con dos poblaciones
4. Dos grupos de pacientes, A y B, formados por 50 y 100 personas, respectivamente, fueron tratados
cada uno un tratamiento distinto contra el insomnio. El grupo A recibio un nuevo medicamento,
mientras que el grupo B fue tratado con un medicamento convencional. Con el tratamiento, los
pacientes del grupo A durmieron en promedio 7.82 horas, con una cuasidesviacion muestral de 0.24
horas. Para los pacientes del grupo B el n umero medio de horas de sue no fue 6.75, con cuasides-
viacion muestral igual a 0.30 horas. Encontrar un intervalo de conanza al 95 % para la diferencia
entre los promedios de horas de sue no en ambos grupos.
5. Queremos compararar la diferencia entres las esperanzas de vida de mujeres y hombres en Espa na.
Hemos estudiado dos muestras aleatorias independientes de 300 hombres y 400 mujeres. El chero
adjunto contiene las edades a las que murieron esas personas. Calcula
un intervalo de conanza al 90 % para la diferencia de las esperanzas de vida entre ambos generos.
6. Se intenta estudiar la inuencia de la hipertension en los padres sobre la presion sangunea de los
hijos. Para ello se seleccionan dos grupos de ni nos, unos con padres de presion sangunea normal
(grupo 1) y otro con uno de sus padres hipertenso (grupo 2), obteniendose las siguientes presiones
sistolicas:
Grupo 1 : 104 88 100 98 102 92 96 100 96 96
Grupo 2 : 100 102 96 106 110 110 120 112 112 90
Hallar un intervalo de conanza para la diferencia de medias, suponiendo que las varianzas en las
dos poblaciones de ni nos son iguales.
7. El chero adjunto contiene los datos de dos muestras aleatorias
independientes, procedentes de dos poblaciones A y B, en las que se han medido los valores de una
misma variable X, de la que sabemos que tiene una distribucion normal. Calcular un intervalo de
conanza al 95 % para la diferencia del valor medio de X en ambas poblaciones.
8. En un estudio sobre el tiempo de desarrollo de una especie de insectos, se obtuvieron los siguientes
datos de dos poblaciones, A
1
y A
2
, aisladas entre s:
n
1
= 13, x
1
= 4, s
1
= 3
n
2
= 11, x
2
= 5, s
2
= 2.2
Suponiendo que el tiempo de desarrollo en la poblacion A
i
sigue una distribucion N(
i
,
i
), para
i = 1, 2, se pide:
1
Hoja06-EsperanzaVida.csv
Hoja06-PoblacionesNormales.csv
a) Hallar un intervalo de conanza para el cociente de varianzas al nivel 0.80.
b) Obtener un intervalo de conanza para
1

2
, con nivel de conanza 0.95 (suponiendo
igualdad de varianzas).
c) Cuantos individuos habra que observar para estimar
1
con un error maximo de 0.2 y un
nivel de conanza de 0.95?
3. Contrastes
9. Se considera la variable que representa la temperatura corporal en los lagartos del desierto. El nivel
letal de esta variable es de 45
o
C. Se ha observado que la mayor parte de estos animales se oculta del
calor en verano para evitar aproximarse a este nivel letal. Se realiza un experimento para estudiar
la variable X, que es el tiempo en minutos que se requiere para que la temperatura del cuerpo de
un lagarto del desierto alcance los 45
o
C, partiendo de la temperatura normal de su cuerpo mientras
esta a la sombra. Se obtuvieron estos datos:
10.1, 12.5, 12.2, 10.2, 12.8, 12.1, 11.2, 11.4, 10.7, 14.9, 13.9, 13.3
Puede concluirse que la desviacion tpica de X es menor de un minuto y medio?
10. El nivel maximo aceptable de exposicion a radiacion de microondas en Estados Unidos se ha esta-
blecido en una media de 10 microvatios por centmetro cuadrado. Se teme que un gran transmisor
de television pueda contaminar el aire del entorno inmediato, elevando el nivel de radiacion de
microondas por encima del lmite de seguridad. Para estudiar esta situacion, se tomo una muestra
de 9 observaciones de la variable X=n umero de microvatios por centmetro cuadrado, medidas
en lugares proximos al transmisor:
9, 11, 14, 14, 10, 12, 13, 8, 12
Considerando un nivel de signicacion del 5 %, avalan los datos la hipotesis de que la radiacion
media, en las proximidades del transmisor, es efectivamente de 10?
11. Un fabricante garantiza a un laboratorio farmaceutico que sus maquinas producen comprimidos con
un diametro medio de 13 mm y una desviacion tpica de 0.6 mm. Una muestra de 100 unidades dio
como media de los diametros 13.12 mm. Cabe esperar, a partir de este dato, que el fabricante dice
la verdad, a un nivel de signicacion del 5 %?
12. Un cierto medicamento alivia cierta dolencia en el 60 % de los casos. Se toma una muestra de 144
personas que sufren esa dolencia y se les hace tomar un nuevo medicamento encontrando alivio
100 de ellas. Se puede armar al nivel del 5 % que el nuevo medicamento es mas efectivo que el
antiguo?
13. El chero del primer captulo del curso contiene datos de los alumnos de
una clase. Queremos saber si esos datos permiten armar que la altura media de los hombres es
superior a la de las mujeres. Contrasta esa armacion al 95 %.
14. Se realizo un estudio para comparar las velocidades de difusion del dioxido de carbono a traves de
suelos de porosidades diferentes. Para ello, se recogieron datos sobre esta velocidad en 13 muestras
de suelo no, y 10 de suelo poroso. En las primeras se registro una velocidad media de 23.15, y
una desviacion tpica de 2.82. En las segundas, se obtuvo una media de 26.3 y una desviacion
tpica de 7.09. Asumiendo normalidad en ambos tipos de suelo, indquese si las velocidades pueden
considerarse diferentes al nivel de signicacion del 5 %.
15. Se efect ua un estudio sobre el color de los escarabajos tigre para conseguir pruebas que apoyen el
argumento de que la proporcion de escarabajos negros puede variar de un lugar a otro. En una
muestra de 500 escarabajos capturados en una extension proxima a Providence, Rhode Island, 95
eran negros. Una captura de 112 escarabajos en Aqueduct, Nueva York, contena 17 individuos
negros. Se puede concluir, a partir de estos datos, que hay diferencia entre las dos proporciones, a
un nivel de conanza del 99 %?
16. Un microbiologo quiere obtener placas para preparaciones microscopicas de espesor uniforme. Un
proveedor arma que sus placas tienen una varianza menor de 0.0158 micron2. Utilizando un
micr ometro sensible, el laboratorio toma al azar una muestra de 30 placas con una varianza mues-
tral resultante de 0.0213 micron2. Es compatible con dicho resultado la pretension del proveedor
a un nivel de signicacion del 10 %?
2
cap01-DatosAlumnos.csv
17. El contenido medio en protenas del tejido muscular estriado en un analisis de 25 animales de cierta
raza de ganado vacuno es de 14 g. por cada 100 g. de tejido, con una desviacion tpica de 2 g,
mientras que para el mismo n umero de animales de otra raza es de 14.5 g. con una desviacion
tpica de 3g. Comprobar si las varianzas son iguales con una conanza del 95 %, suponiendo que la
distribucion del contenido en protenas es aproximadamente normal en ambos casos.
18. Los datos de temperatura recogidos en 1000 estaciones meteorologicas terrestres y martimas de
todo el mundo dieron una temperatura media de 57
o
F en 1950. En 1988, la temperatura media en
esas mismas estaciones fue de 57.6
o
F. Emparejando las lecturas de 1988 y 1950 en cada estacion
meteorologica se estima que la desviacion tpica de la diferencia de las lecturas es de 4.1
o
F. Sos-
tienen estos datos, con un nivel de conanza del 95 %, el argumento de que la temperatura media
en 1988 fue superior que en 1950?
19. La concentracion media de dioxido de carbono en el aire es de 0.035 (en porcentaje). Se piensa que
inmediatamente por encima del suelo, dicha concentracion es mayor. Para contrastar esta suposicion,
se analizaron 144 muestras de aire seleccionadas aleatoriamente y tomadas a la distancia de un pie
del suelo. Resulto una media muestral de 0.09 y una desviacion tpica muestral de 0.25. Avalan
estos datos, con un nivel de conanza del 99 %, la suposicion anterior?
20. Una muestra de 200 bombillas de la marca A dio una vida media de funcionamiento de 2280 horas,
con desviacion tpica de 80 horas. Otra muestra de 180 bombillas de la marca B dio de vida media
2320 horas, con desviacion tpica de 100 horas. Se puede armar, al 10 % de signicacion, que es
mayor la duracion de las bombillas de la marca B?
21. La grave sequa de 1987 afecto tanto a la tasa de mortalidad de las plantas de vivero como a la
tasa de crecimiento de los arboles ya establecidos. Se piensa que la mayor parte de los arboles
de las zonas afectadas tienen un anillo de crecimiento de 1987 menor a la mitad de los anillos de
crecimiento de los demas. Una muestra de 250 arboles ha dado 150 con esta caracterstica. Apoyan
los datos esta idea, a un nivel de signicacion del 5 %?
22. Se hizo un muestreo en dos municipios para averiguar su opinion sobre la uoracion del agua antes
de iniciar la campa na. Los resultados de estas encuestas fueron:
En el municipio 1, se realizo un muestreo sobre un total de 110 personas; el 52 % de ellas se
mostraron favorables a la campa na.
En el municipio 2, el tama no de la muestra considerada fue de 75; el 55 % de ellas se mostraron
favorables a la campa na.
Puede aceptarse, al 95 % de conanza, que el porcentaje de partidarios de la uoracion era el
mismo en ambos municipios?
23. En las aguas en las que se practica la recogida de la almeja, el n umero maximo aceptable de
bacterias por cm3 es 70. Un valor medio superior a 70 puede ser peligroso (hay riesgo de contraer
hepatitis). Un grupo de cientcos mide el n umero de bacterias en una muestra aleatoria de tama no
9, obteniendo una media de 71.67 y una desviacion tpica de 2.35. Se puede armar, con una
conanza del 95 %, que las aguas son realmente peligrosas?
24. Una empresa propone al director de una fabrica un nuevo metodo que, supuestamente, reduce el
tiempo empleado en el montaje de uno de sus productos. Con el proposito de comparar tal metodo
con el empleado habitualmente, selecciono aleatoriamente a cinco empleados para que llevasen a
cabo el montaje con los dos sistemas, y anoto los tiempos empleados en el montaje, obteniendo los
siguientes resultados:
Metodo habitual 38 32 41 35 32
Metodo nuevo 30 32 34 37 26
Se puede armar, con una conanza del 95 %, que el nuevo metodo reduce signicativamente el
tiempo de montaje?
3
Respuestas
1. Tenemos n = 100, p = 1/10 y q = 9/10, por lo que se cumplen las condiciones n > 30, n p > 5 y
n q > 5. As que nuestro intervalo de conanza vendra dado por

1/10 1.96
3
100
, 1/10 + 1.96
3
100

= (0.0412, 0.1588).
Para la segunda parte, hay que tener en cuenta que el error maximo vendra dado por la distancia
entre un extremo del intervalo y su centro, p. Esta cantidad es
1.96

p q
n
= 1.96

0.9 0.1
n
0.01.
Despejando n se tiene que n 3457.44, por lo que son necesarias n = 3458 personas.
2. Las condiciones n > 30, n p > 5 y n q > 5 se cumplen claramente con n = 1000, p = 556/1000 y
q = 444/1000. Un error del 3 % vendra determinado cuando
z
/2

p q
n
<
3
100
.
De aqu que z
/2
= 1.90928, de donde concluimos que = 0.9719.
3. El intervalo vendra dado por

55
100
1.96

55
100
45
100
100
, (
55
100
+ 1.96

55
100
45
100
100

= (0.4524, 0.6475)
para 95 % de nivel de conanza.

55
100
2.575

55
100
45
100
100
, (
55
100
+ 2.5751.64

55
100
45
100
100

= (0.4219, 0.6781)
para 99 % de nivel de conanza.
Para un nivel del 99.73 % tenemos que = 1 97.73/100, de donde /2 = 0.0135, y por tanto
z
/2
= 32.2784. Repitiendo los calculos concluimos que

55
100
32.278

55
100
45
100
100
, (
55
100
+ 3

55
100
45
100
100

= (0.4, 0.7)
para 99.73 % de nivel de conanza.
El tamano de muestra buscado se considera seguro cuando tenemos un nivel superior al 99.73 %.
En este caso, sera. . . .
4. Tenemos muestras grandes, con varianzas desconocidas, por lo que el intervalo buscado viene dado
por

2
= (7.82 6.75) 1.96

0.24
2
50
+
0.30
2
100
= ()1.07 0.08879.
5. Solucion con R:
> setwd("C:/Documents and Settings/Propietario/Escritorio")
> muestra1=scan(file="Hoja06-EsperanzaVidaHombres.csv",sep=",")
Read 300 items
> muestra2=scan(file="Hoja06-EsperanzaVidaMujeres.csv",sep=",")
Read 400 items
> alpha=1-0.90
> alphamedios=alpha/2
> zalphamedios=qnorm(1-alphamedios)
> zalphamedios
[1] 1.644854
4
> xbar1=mean(muestra1)
> xbar2=mean(muestra2)
> sd1=sd(muestra1)
> sd2=sd(muestra2)
> leftci=xbar1-xbar2-zalphamedios*(((sd1^2)/300+(sd2^2)/400)^0.5)
> rightci=xbar1-xbar2+zalphamedios*(((sd1^2)/300+(sd2^2)/400)^0.5)
> leftci
[1] -6.347685
> rightci
[1] -5.367315
6. El intervalo es aproximadamente (47.77, 30.57).
7. El intervalo es aproximadamente (5.542, 2.191).
8. (a) El intervalo de conanza para el cociente de varianzas es es aproximadamente (0.7817, 4.116).
Puesto que el valor 1 pertenece a ese intervalo, puede ser
s
2
1
s
2
2
= 1, as que asumimos igualdad de
varianzas al 80 %.
(b) El intervalo para
1

2
es aproximadamente (7.040, 5.040).
9. Contraste sobre varianza. Usamos
0
= 1.5. La hipotesis alternativa es H
a
= { <
0
}. Con el
chero
Tut07-Contraste-Varianza-DatosEnBruto.R
del Tutorial07 ( ) obtenemos un p-valor, aproximadamente
igual a 0.5303. Rechazamos la alternativa.
10. Contraste sobre la media, muestra peque na. Usamos
0
= 10. Una posible hipotesis alternativa
es H
a
= { >
0
}. Como en otros casos que hemos visto, depende de cual sea la pregunta. (La
empresa instaladora de las antenas puede estar interesada en el contraste de H
a
= { =
0
}.). Para
el nivel de signicacion, recuerda ademas que algunos autores (como es el caso en el libro del que
procede este ejercicio) usan 5 % para referirse a lo que nosotros llamamos 95 %. En cualquier caso,
recuerda el signicado: queremos estar seguros al 95 % (no al 5 %!).
Con el chero
Tut07-Contraste-Media-UsandoT-DatosEnBruto.R
del Tutorial07 ( ) obtenemos un p-valor, aproximadamente
igual a 0.03804 < 0.05. Rechazamos aunque por un margen ajustado la hipotesis nula, y conclui-
mos que las emisiones superan el lmite legal.
11. Contraste sobre la media, muestra grande. Usamos
0
= 13, n = 100,

X = 13.2 y s = 0.6. Vamos a
contrastar la hipotesis alternativa H
a
= { =
0
}. (Tambien puede ser interesante el contraste de
H
a
= { >
0
}. Por contra, el contraste de H
a
= { >
0
} carece de interes en este ejemplo).
Con el chero
Tut07-Contraste-Media-UsandoZ-DatosEnBruto.R
del Tutorial07 ( ) obtenemos un p-valor, aproximadamente
igual a 0.04550 < 0.05. Un p-valor tan ajustado a ajustado al lmite de 0.05 nso permite formalmente
rechazar la hipotesis nula. Pero el margen es tan escaso que, en una situacion real, lo razonable
sera tratar de obtener una muestra mas grande y mas concluyente.
12. Es un contraste de proporciones, con p
0
= 0.6 (la proporcion de personas aliviadas por el medica-
mento antiguo). El tama no de la muestra es n = 144 y la proporcion muestral es p =
144
100
. Vamos
a contrastar la hipotesis alternativa H
a
= {p > p
0
}.
En este caso usamos la funcion prop.test de R (ver Tutorial07, pag. 10) as:
> prop.test(x=100,n=144,p=0.6,alternative="greater",conf.level=0.95,correct=FALSE)
1-sample proportions test without continuity correction
data: 100 out of 144, null probability 0.6
X-squared = 5.3519, df = 1, p-value = 0.01035
alternative hypothesis: true p is greater than 0.6
95 percent confidence interval:
5
adjunto aqu con los datos del problema
adjunto aqu con los datos del problema
adjunto aqu con los datos del problema
0.6282 1.0000
sample estimates:
p
0.6944444
Como puede verse, el p-valor es aproximadamente 0.01035 y nos permite rechazar la hipotesis nula.
13. La armacion es cierta al 95 %.
14. Varianzas diferentes y medias iguales al 95 %.
15. No hay diferencia entre las proporciones al 99 %.
16. La varianza es mayor de la que arma el fabricante al 90 %.
17. Usando el chero Tut09-Contraste-2Pob-CocienteVarianzas con tipo de contraste = 3
Estadstico F = 0.4444. El p-valor es 0.05237
18. Usando el chero: Tut09-Contraste-2Pob-DifMedias-UsandoZ.
Estadistico 3.272295. El p-Valor es 0.0005334
Es, en realidad, un contraste de diferencias emparejadas. Pero como no lo hemos visto este a no, lo
hacemos como si fueran poblaciones independientes.
19. Usando la plantilla Tut07-Contraste-Media-UsandoZ, tipo contraste: 1
Estadistico =
0.09 0.035
0.25

144
2.64
p-valor=0.004145301
20. Usando el chero: Tut09-Contraste-2Pob-DifMedias-UsandoZ, tipo contrraste 2
Estadistico 4.274823. El p-Valor es 9.564 10
06
21. Es un contraste de proporciones, con p
0
= 0.5 (la mayor parte se reere a la mayora, mas de la
mitad. Se podra jar un valor mas alto si se desea una mayoria cualicada, como tres cuartas
partes, pero en cualquier caso, debe ser al menos el 50 %). El tama no de la muestra es n = 250 y la
proporcion muestral es p =
150
250
. Vamos a contrastar la hipotesis alternativa H
a
= {p > p
0
}.
Usamos Wolfram Alpha, escribiendo test for binomial parameter , y cuando se abre el cua-
dro de dialogo en el que hay que introducir los datos, seleccionamos Use number of successes
instead (aunque se puede usar el primero poniendo como proporcion
150
250
). Luego tecleamos los
datos, como se ve en la gura, y obtenemos un p-valor igual a 6.065 10
4
, con el que rechazamos
la hipotesis nula.
6
22. Es un contraste de igualdad de proporciones, en el que contrastamos la hipotesis nula:
H
0
= {p
1
= p
2
}.
Vamos a usar tambien Wolfram Alpha, escribiendo: two proportion hypothesis test, e intro-
duciendo los datos de este problema como se muestra en la gura:
Aseg urate de marcar la opcion two-tailed test tras terminar de introducir los datos, por defecto
se calcula un contraste unilateral. El p-valor resultante es 0.6877, as que rechazamos H
a
.
23. Contraste sobre la media, muestra peque na. Usamos
0
= 70. Contrastamos la hipotesis alternativa
es H
a
= { >
0
}.
Con el chero
Tut07-Contraste-Media-UsandoT.R
del Tutorial07 ( ) obtenemos un p-valor, aproximadamente
igual a 0.03280 < 0.05. Rechazamos la hipotesis nula, y concluimos que las aguas son peligrosas.
Fjate en que, en un problema como este, la hipotesis conservadora H
0
supone no dar la alarma
ante unas aguas potencialmente peligrosas. En este caso nos preocupa mas cometer un error de tipo
7
adjunto aqu con los datos del problema
II (falso negativo: no pasa nada, las aguas son seguras), que un error de tipo I (falso positivo,
falsa alarma). As que a diferencia de lo que hemos recomendado en otros ejercicios, aqu haramos
saltar la alarma con un p-valor solo ligeramente inferior a 0.05.
24. Vamos a hacer este ejercicio suponiendo, incialmente, que los cinco empleados que usan el metodo
antigup, y los cinco que usan el metodo nuevo, se han elegido en muestras independientes. En
realidad, se trata de un ejercicio de contrastes emparejados, que no hemos visto en clase, de los
que puedes ver otro ejemplo en el examen de Enero del curso 2012-2013 del Grado en Biologa
(disponible en www2.uah.es/fsegundo)
Es un contraste de diferencia de medias, con muestras peque nas. Como no sabemos nada sobre
la posible igualdad de las varianzas, tenemos necesariamente que hacer un contraste de varianzas.
Vamos a resolverlo usando las funciones var.test y t.test que se describen en el Tutorial09. El
codigo que usamos para el contraste de la hipotesis nula
H
0
= {
2
1
=
2
2
}
(sobre la igualdad de las varianzas) es este:
> muestra1 = c(38, 32, 41, 35, 32)
> muestra2 = c(30, 32, 34, 37, 26)
> var.test(muestra1,muestra2,alternative="two.sided",conf.level=0.95)
F test to compare two variances
data: muestra1 and muestra2 F = 0.8895, num df = 4, denom df = 4, p-value = 0.9124 alternative
hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval:
0.09261618 8.54356437
sample estimates:
ratio of variances
0.8895349
y como el p-valor es muy alto, no rechazamos la hipotesis nula. Eso signica que asumimos que las
varianzas son iguales.
Ahora vamos a hacer el contraste de medias, con hipotesis alternativa
H
a
= {
1
>
2
}
porque suponemos que
1
, el tiempo medio usando el metodo antiguo, es menor que
2
el tiempo
medio por el metodo nuevo. Podemos usar t.test as:
> t.test(muestra1,muestra2,alternative="greater",conf.level=0.95,var.equal=TRUE)
Two Sample t-test
data: muestra1 and muestra2 t = 1.4905, df = 8, p-value = 0.08722 alternative hypothesis: true
difference in means is greater than 0 95 percent confidence interval:
-0.9409359 Inf sample estimates: mean of x mean of y
35.6 31.8
Fjate en la opcion alternative="greater", que se corresponde con el smbolo > de H
a
, y tambien
en la opcion var.equal=TRUE, donde hemos indicado el resultado del contraste de varianzas.
Tambien puedes usar los cheros Tut09-Contraste-2Pob-CocienteVarianzas.R
Tut09-Contraste-2Pob-CocienteVarianzas.R
calculando previamente los valores que necesitas con:
muestra1 = c(38, 32, 41, 35, 32)
muestra2 = c(30, 32, 34, 37, 26)
n1=length(muestra1)
xbar1=mean(muestra1)
s1=sd(muestra1)
n2=length(muestra2)
xbar2=mean(muestra2)
s2=sd(muestra2)
8

Das könnte Ihnen auch gefallen