Beruflich Dokumente
Kultur Dokumente
1.1 Notacin.
Parte 1
Distribucin muestral
1.1 Notacin
POBLACIN
Parmetros: , , , ...
Muestreo aleatorio
MUESTRA 1
{x1, x2, ..., xn}
Estadsticos: 1 , 1 , 1 , ...
Estimaciones puntuales: x1 , s1, p1,
MUESTRA 2
{x1, x2, ..., xn}
Estadsticos: 2 , 2 , 2 , ...
Estimaciones puntuales: x2 , s2, p2,
Las estimaciones puntuales son las calculadas utilizando la muestra disponible y aplicando
las formulas usuales
Los parmetros son valores ideales que no conocemos exactamente en la gran mayora de los
casos
Los estadsticos son aproximaciones a los parmetros calculados a partir de las estimaciones
puntuales ms los intervalos en los que puede razonablemente estar el parmetro
Poblacin y muestra
15.7
19.8
21.8
23.8
25.8
27.8
29.8
31.8
33.8
35.8
37.8
17.7
15.7
17.7
19.8
21.8
23.8
25.8
27.8
29.8
31.8
33.8
35.8
37.8
a) Poblacin
b) Muestra
c) Distribucin muestral
Conclusiones
La distribucin muestral tiene forma normal cuando se cogen muchas muestras y son
grandes
La distribucin muestral es aproximadamente normal independientemente de la forma
que tenga la distribucin original.
La forma de la distribucin muestral de la media es importante porque nos permite calcular intervalos de confianza alrededor de la media.
Gosset demostr que cuando las muestras son pequeas, la distribucin muestral de la media sigue la distribucin t de Student con n-1 grados de libertad
Gosset se dedicaba al control de calidad de Guiness y probar muestras muy grandes no
estara bien visto
( n)
sn 1 ( n )
Normal
Con todo lo anterior podemos pasar al siguiente paso: Hacer intervalos de confianza y pruebas de hiptesis para las medias
Parte 2
Intervalos de confianza
2.1 Calculando intervalos de confianza
estara la
Tenemos una confianza del 95% que la media de la poblacin est entre
x 1.96 ErrorTipico
Tenemos una confianza del 99% que la media de la poblacin est entre
x 2.575 ErrorTipico
x z 2 ET ( x )
No obstante, hay que tener en cuenta que si la muestra es pequea no se utiliza la distribucin
normal z sino la distribucin muestral t . Si usamos t , en este caso, la frmula es:
x t n 1 , 2 ET ( x )
Qu valores tienen
z con un nivel de confianza del 95% y prueba de dos colas tiene un valor 1.96. Este
valor es interesante aprenderlo de memoria.
t con un nivel de confianza del 95% y muestras mayores de 40 es tambin
prcticamente 1.96.
t con un nivel de confianza del 95% y muestras menores de 40 es mayor de 1.96 (es
conveniente mirar el valor en las tablas).
Ejercicio 2.1.1 En el informe PISA, Espaa tuvo una media de 484 y un Error tpico de 2.4. Calcular el intervalo de confianza entre los que estar la verdadera media.
Solucin 2.1.1 Este ejercicio tiene trampa. Cul es?
Ejercicio 2.1.2 El ejercicio de antes no se puede hacer. Falta la confianza con la que queremos
trabajar. Normalmente utilizaremos un nivel de confianza del 95%. Cul es la z para 95%?
Solucin 2.1.2 Hay que aprenderselo de memoria. Es 1.96.
Ejercicio 2.1.3 Ahora, cul es el intervalo de confianza para Espaa?
484 1.96 2.4 = ( 479.3, 488.7 )
Solucin 2.1.3
Esto se lee del siguiente
modo: Con una confianza del 95% la media de Espaa estara entre 479 y 489 aprox.
Ejercicio 2.1.4 Supongamos que para hacer el intervalo anterior utilizamos la distribucin t en
lugar de z. Qu valor deberamos buscar?
Solucin 2.1.4 Deberamos buscar
n = 23
y
s = 4.25
. Utilizando un intervalo del 95%, Entre qu valores estara
la velocidad de los vehculos que pasan por esa calle?
Solucin 2.1.9 En este ejercicio no se indica la solucin a propsito
x = 31
Cada estadstico (media, varianza, proporcin, correlacin, etc.) tiene su propia distribucin muestral.
La forma de la distribucin de esos estadsticos suele ser la distribucin normal o la t de Student pero no siempre.
La varianza por ejemplo no sigue la distribucin normal ni la distribucin t.
Parte 2 Intervalos de confianza-Pedro M. Valero Mora 2008
10
np 10
nq 10
np 10
nq 10
p z 2 ET ( p )
Ecuacin (2)
pq
q = 1p
pq
-----n 2008
Parte 2 Intervalos de confianza-Pedro M. Valero Mora
ET ( p ) =
11
0.53 0.46
0.53 1.96 --------------------------- ( 0.57, 0.49 )
537
Ejercicio 2.3.2 En el informe PISA, en la pgina 4, se indica el porcentaje de uso de lenguas propias en las diferentes comunidades. Cul es el intervalo de confianza para el Pas Vasco? Nota:
El tamao de la muestra para el Pas Vasco est tambin en el informe.
Solucin 2.3.2 En este ejercicio no se indica la solucin a propsito
Ejercicio 2.3.3 Se puede calcular el mismo intervalo para Galicia?
Solucin 2.3.3 En este ejercicio no se indica la solucin a propsito
Ejercicio 2.3.4 En la pgina web http://www.whichsideareyouon.com/ aparece una campaa de
un vendedor de ordenadores para que los que quieran voten para elegir el color de los ordenadores
que fabrica esa marca. Hay dos colores, negro o titanio. En Europa, en el momento que escribo
esto hay 26186 votos a favor de color titanio y 24876 a favor de color negro. Cul sera el intervalo de confianza del porcentaje de los que votan a favor de titanio? Podramos decir que los de
titanio ganan claramente la votacin?
Solucin 2.3.4 En este ejercicio no se indica la solucin a propsito
Ejercicio 2.3.5 En Francia hay 2006 a favor de titanio y 1876 a favor de negro. Gana el titanio?
Solucin 2.3.5 En este ejercicio no se indica la solucin a propsito
Ejercicio 2.3.6 En Espaa hay 1378 a favor de titanio y 773 a favor de negro. Gana el titanio o el
negro?
Solucin 2.3.6 En este ejercicio no se indica la solucin a propsito
Parte 2 Intervalos de confianza-Pedro M. Valero Mora 2008
12
430
739
370
317
464
525
289
491
196
268
372
342
222
219
513
295
285
408
543
298
494
317
407
13
24
Media
384.29
Desviacin
tp.
126.412
Error tp. de
la media
25.804
Tiempo WISC
t
14.893
gl
23
Sig. (bilateral)
.000
Diferencia
de medias
384.292
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
330.91
437.67
14
N
1517
Media
.42
Desviacin
tp.
.494
Error tp. de
la media
.013
t
33.082
gl
1516
Sig. (bilateral)
.000
Diferencia
de medias
.419
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
.39
.44
Ejercicio 2.5.1 A un grupo de nios le pasamos el Test de las figuras Integradas (TFI), y obtenemos los siguientes datos.
Table 3: Resultados hipotticos de un estudio. Cada casilla es el resultado para un sujeto
59
33
49
69
65
26
29
62
31
139
74
31
48
23
128
44
49
87
43
55
58
113
El SPSS nos proporciona el siguiente output. El intervalo de confianza para la media incluye el
valor 75?
15
24
Desviacin
tp.
33.932
Media
55.46
Error tp. de
la media
6.926
t
8.007
gl
Sig. (bilateral)
.000
23
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
41.13
69.79
Diferencia
de medias
55.458
Solucin 2.5.1 No
Ejercicio 2.5.2 Tenemos un grupo de sujetos a los que se les mide la cantidad de dopamina en
sangre.
Table 4: Resultados hipotticos de un estudio. Cada casilla es el resultado para un sujeto
10.5
20.0
11.2
13.0
18.0
15.6
14.5
10.4
12.3
14.6
9.8
11.2
8.4
13.9
10.1
8.9
16.9
12.4
11.1
14.2
20
Media
12.850
Desviacin
tp.
3.1048
Error tp. de
la media
.6942
Dopamina
t
18.509
gl
19
Sig. (bilateral)
.000
Diferencia
de medias
12.8500
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
11.397
14.303
Solucin 2.5.2 Si
Ejercicio 2.5.3 A un grupo de trabajadores se les pregunta si han tenido problemas con el jefe en
los ltimos 6 meses. En el archivo de datos 1 indica que s que han tenido problems y 0 que no
han tenido problemas. Diras que la proporcin de gente con problemas es muy alta?
16
N
1471
Media
.03
Desviacin
tp.
.167
Error tp. de
la media
.004
t
6.573
gl
1470
Sig. (bilateral)
.000
Diferencia
de medias
.029
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
.02
.04
Solucin 2.5.3 En este caso es facil ver que no sin hacer clculos.
Comment
We found that left handed women are more than twice as l
to develop premenopausal breast cancer as non-left han
women. This risk is compatible with left handedness bei
marker of constitutional risk rather than of environmental ri
with postmenopausal breast cancer.
Our findings among premenopausal women may
compatible with a stronger association in women with a no
body mass index, as high body mass index is a particular
Cases
Estimated
person years*
Hazard ratio
(95% confidence interval)
Crude
Adjusted
17
anded
on-left
-53 1)
45
11 332
1.59 (1.15 t
144
57 458
1.00
Left handed
20
7787
1.00
1.04 (0.65 t
18
Parte 3
Pruebas de hiptesis
3.1 Introduccin a las pruebas de hiptesis
Un paso ms
Cuando recogemos unos datos y tenemos una idea del resultado que esperamos
o queremos que ocurra, decimos que tenemos una hiptesis:
En el informe PISA podemos tener la hiptesis de que Espaa tiene unos resultados
diferentes a la media (superiores o inferiores).
En el informe PISA podemos tener la hiptesis de que Espaa tiene unos resultados
superiores a la media.
En el informe PISA podemos tener la hiptesis de que Espaa tiene unos resultados
inferiores a la media.
Suponiendo que sabemos1 que la media en matemticas de la OCDE es 500 y que Espaa
tiene una media de 485 con error tpico de 2.4. Tendramos que:
Con la primera hiptesis nos planteamos si Espaa tiene unos resultados diferentes a
500.
H 0 Espana = 500
H e Espana 500
Con la segunda hiptesis nos plantemos si Espaa tiene unos resultados superiores a
500.
H 0 Espana 500
H e Espana > 500
Con la tercera hiptesis nos planteamos si Espaa tiene unos resultados inferiores a 500
H 0 Espana 500
H e Espana < 500
Suponiendo que sabemos? Qu quiere decir eso? Bien, en el informe PISA indica que la media de la OCDE
es de 500 pero con un error tpico de 0.6, lo cual quiere decir que ese valor de 500 est calculado con una
muestra y que por tanto no sabemso con exactitud cul es el valor en la poblacin. Ahora bien, como el
procedimiento que estamos viendo necesita una hiptesis nula concreta tenemos que partir del supuesto de
que 500 es el valor verdadero.
19
Ejercicio 3.1.1 Un investigador est interesado en averiguar si las personas son capaces de identificar con el mismo nivel de precisin las emociones de personas de otras culturas que las que son
de la propia cultura. Se sabe que utilizando determinado mtodo de medicin, los adultos norteamericanos en general estn distribuidos normalmente con una media de 82 (de un total de 100) y
una varianza de 20 (esa distribucin se basa en las posiciones obtenidas al identificar las emociones expresadas por miembros de su propia cultura). En un estudio se pidi a 50 norteamericanos
adultos que intentaran reconocer las emociones de sujetos de Indonesia. La media en este caso fue
de 78. Plantea la hipotesis nula y la hipotesis del estudio para este ejemplo (Aron y Aron, p. 231).
Solucin 3.1.1 La hiptesis del estudio sera que hay diferencias entre reconocer emociones con
sujetos de culturas diferentes y sujetos de cultura propia. Es decir que
hiptesis nula sera que no hay diferencias, es decir
H 0 = 82
H e 82
. La
Solucin 3.1.1 Fijaros en que el procedimiento consiste en comparar lo que nos ha salido en
nuestro estudio concreto con un valor establecido por investigaciones previas, o un supuesto justificado por medio de una teora o de cualquier otra manera.
Ejercicio 3.1.2 Un psiclogo est interesado en las condiciones que afectan la cantidad de sueos
que las personas recuerdan por mes y en los cuales se encuentran solos. Supondremos que, basndonos en previas investigaciones extensivas, se sabe que en la poblacin general la cantidad de
tales sueos por mes sigue una distribucin normal, con = 5 y = 4 . El investigador
desea probar la prediccin que establece que la cantidad de sueos como los descritos ser
mayor entre aquellas personas que recientemente hayan experimentado un hecho traumtico. Por
lo tanto, el psiclogo analiza 36 individuos que han experimentado recientemente un hecho traumtico, hacindoles llevar un registro de sus sueos durante un mes. La media de sueos en los
que se encuentran solos es 8. Plantea la hiptesis nula y la hiptesis del estudio para este caso
(Aron y Aron, p. 231).
Solucin 3.1.2 La hipotesis del estudio sera que nuestros sujetos tienen una media mayor de la
media de los sujetos normales, luego
H0 5
He > 5
Ejercicio 3.1.3 En una encuesta preelectoral, el partido que ms apoyos recibe una intencin de
voto del 52% con 1000 encuestas. Cul diras que sera una hipotesis del estudio adecuada para
este caso?
Solucin 3.1.3 Este ejercicio no tiene la solucin a propsito
20
( 489.74, 480.29 )
Como 500 no est en el intervalo
entonces podemos
decir que la media para Espaa es diferente de 500 (con una confianza del 95%).
ET = ( 20 ) ( 50 ) 0.63
78 1.96 0.63 = ( 79.23, 76.76 )
H 0 = 82
. El intervalo de confianza es
. En este caso la hiptesis nula era
nula (los norteamericanos interpretan las emociones de modo diferente con los indonesios que
con otros norteamericanos).
21
24
198 1.96 ------------- = ( 202.7, 193.296 )
100
Ejercicio 3.2.3 Si el tamao muestral fuera n=1600. Cul sera el intervalo de confianza obtenido?
Solucin 3.2.3
24
198 1.96 ---------------- = ( 199.176, 196.824 )
1600
Ejercicio 3.2.4 Los datos obtenidos en la muestra de 100 estudiantes apoyan la opinin del psiclogo con riesgo de error = 0.05?.
Solucin 3.2.4 S. El intervalo no incluye el valor de 190 as que los estudiantes con orientacin
vocacional son diferentes de los estudiantes en general.
Estadstico de Contraste =
H 0 Espana = 500
H e Espana 500
22
3.4 Una nota sobre el clculo de la desviacin tpica para pruebas de hiptesis.
Ejercicio 3.3.1 Usando el enunciado del Ejercicio 3.1.2 Llegara usted a la conclusin de que
las personas que han sufrido recientemente una experiencia traumtica tienen una cantidad significativamente diferente de sueos en los que se encuentran solas? (utiliza el nivel 0,05 y plantea
una hiptesis de dos colas)
Solucin 3.3.1 La estimacin puntual en ese estudio fue de 8. El valor terico es
error tpico es
8 5- = 4.5
-----------0.667
4
---------- = 0.667
36
= 5
. El
(es decir, la gente que ha tenido recientemente una experiencia traumtica difiere de la poblacin
general).
Ejercicio 3.3.2 En el estudio del Ejercicio 3.1.1, el investigador organiza a 50 adultos norteamericanos para que identifiquen las emociones de individuos de Indonesia. La precisin media de
estos 50 individuos fue 78. Utilizando un nivel de 0,05, haz los clculos para la prueba de hiptesis planteada en el propio Ejercicio 3.1.1.
Solucin 3.3.2 En el ejercicio se plante que
H e 80
y que
H 0 = 80
. En
78 80
z = ------------------ 3.17
0.63
y que
. La conclusin de esto es
que efectivamente los sujetos eran menos capaces de reconocer las expresiones de los indonesios.
3.4 Una nota sobre el clculo de la desviacin tpica para pruebas de hiptesis
Por qu -1?
sx =
(x x )
23
Ahora bien, para hacer contrastes de hiptesis es necesario hacer esta estimacin. En ese caso, la frmula que se utiliza es un poco diferente de la habitual:
x =
( x x )
n 1
Fijaros que en este caso dividimos por n-1 y que usamos el smbolo
x ya que
estamos estimando la desviacin tpica (de ah el capuchn)
Es muy importante este detalle sobre el clculo de la desviacin tpica?
Si la muestra es muy pequea s que puede tener algo de efecto dividir por n-1 en lugar
de slo por n
En los exmenes de anlisis de datos no distinguir entre una u otra puede ser terrible!!!
24
ET ( p 0 ) =
p0 q0
---------n
Fijaros que usamos el smbolo p 0 para hacer ver que estamos tomando ese valor de
la hiptesis nula (por cierto, en este caso no deberamos llamar al resultado error tpico
sino simplemente desviacin tpica).
Con nuestros datos
ET ( p 0 ) =
0.20
0.8- = 0.02
----------------------400
estadstico de contraste si
H0
Esta probabilidad es
p < 0.0000001
. Por tanto, rechazamos la hiptesis
nula ya que es muy poco probable.
Tener en cuenta que la distribucin de referencia en el ordenador es generalmente t
ya que stos calculan este valor exacto.
Veamos el siguiente ejemplo
A un grupo de sujetos se les pregunta por su nivel de felicidad con posibles contestaciones
1=Muy feliz, 2=Bastante feliz y 3= No demasiado feliz. El investigador quiere comprobar
si la media de felicidad en el grupo es de 1. Los resultados se muestran a continuacin.Rechazamos la H0?
25
Nivel de felicidad
N
1504
Media
1.80
Desviacin
tp.
.617
Error tp. de
la media
.016
Nivel de felicidad
t
50.270
H0
gl
1503
Valor de prueba = 1
Sig. (bilateral)
.000
Diferencia
de medias
.799
Este es el numerador
de la Ecuacin 3
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
.77
.83
Este es el intervalo
de confianza para el
numerador de la
Ecuacin 3
26
Ejercicio 3.6.1 A un grupo de sujetos se les pregunta por lo Emocionante que es su vida con
posibles contestaciones de 1 a 5, en donde 1=Muy emocionante y 5 Muy aburrida. Se quiere saber
si como media la gente piensa o no que su vida es Normal(=3) en emocin. Los resultados se
muestran a continuacin. Rechazamos la H0?
Estadsticos para una muestra
Nivel de felicidad
N
1504
Desviacin
tp.
.617
Media
1.80
Error tp. de
la media
.016
Nivel de felicidad
t
-75.530
gl
1503
Sig. (bilateral)
.000
H0 = 3
Diferencia
de medias
-1.201
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-1.23
-1.17
.000 lo que indica que es poco probable. Por tanto, rechazaramos esa hiptesis y nos quedaramos con que la gente en su mayora no piensa que tenga una vida normal. En realidad, como la
media que aparece es 1.8 la gente parece tener una vida emocionante.
Ejercicio 3.6.2 En una encuesta, se pregunta a los sujetos si piensan que el nivel de impuestos que
se paga en su pas es demasiado alto (1), justo (2), o demasiado bajo (3). Se quiere sabe si la
media de las contestaciones es de 1.5 (entre alto y justo) o no.
Estadsticos para una muestra
N
Opinin sobre el
nivel de impuestos
Desviacin
tp.
Media
932
1.43
.519
Error tp. de
la media
.017
t
Opinin sobre el
nivel de impuestos
-4.041
gl
Sig. (bilateral)
931
.000
Diferencia
de medias
-.069
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-.10
-.04
Solucin 3.6.2 La hiptesis nula es de nuevo el valor medio. En el output se indica este valor y
como vemos la prueba de hiptesis viene a indicar que rechazamos esta hiptesis y que la media
no es 1.5 (vemos que la media est un poco por debajo as que la tendencia es a que la gente
opine que el nivel de impuestos es muy alto).
Parte 3 Pruebas de hiptesis-Pedro M. Valero Mora 2008
27
Solucin 3.6.4 El resultado se puede ver en varios sitios. En el apartado de Significance test
vemos que el valor de p<.0001, que es menor que el de .05 que usamos habitualmente. Tambin,
el intervalo de confianza no incluye el verdadero valor. En conclusin, este primer experimento
produjo un valor para la velocidad de la luz diferente al que se da por bueno hoy en da.
28
= 0.05
1 = 0.95
-1.64
1 = 0.95
2 = 0.025
2 = 0.025
=
1 = 0.95
-1.96
1.96
1.64
El valor de z que deja por debajo de s el 95% de la curva normal es 1.64. El que deja
el 95% por encima es -1.64.
29
la
Ecuacin (7)
H 0 Espana 500
H e Espana < 500
El valor con el que tendramos que comparar es -1.64. Como -6.25 es menor que -1.64
rechazamos la hiptesis nula de que Espaa tiene una puntuacin en Matemticas igual
o superior a 500 (es decir que Espaa est por debajo).
Ejercicio 3.7.1 En el informe PISA, podemos decir que Finlandia est por encima del valor de
500 en Matemticas? Utiliza la prueba de hiptesis unilateral apropiada para este caso.
Solucin 3.7.1 En este ejercicio no se indica la solucin a propsito
Ejercicio 3.7.2 En el informe PISA, podemos decir que el Pas Vasco est por encima del valor
de 500 en Matemticas? Utiliza la prueba de hiptesis unilateral apropiada para este caso.
Solucin 3.7.2 En este ejercicio no se indica la solucin a propsito
Ejercicio 3.7.3 En el informe PISA, a partir de qu pas los resultados han estado por encima de
la media de 500?
Solucin 3.7.3 En este ejercicio no se indica la solucin a propsito
Ejercicio 3.7.4 En el informe PISA, a partir de qu pas los resultados han estado por debajo de
la media de 500?
Solucin 3.7.4 En este ejercicio no se indica la solucin a propsito
30
Veamos el siguiente ejemplo: A un grupo de sujetos se les da una charla sobre como reducir
el colesterol y se les mide el colesterol. Tres aos despus se les mide de nuevo el colesterol
y se hace:
Ecuacin (8)
C pasado C actual = PerdidaColesterol
9.767
DF
t-Value
P-Value
95% Upper
42
2.318
.0127
16.854
31
43
Media
9.77
Desviacin
tp.
27.627
Error tp. de
la media
4.213
Cholesterol Loss
t
2.318
gl
42
Sig. (bilateral)
.025
Diferencia
de medias
9.767
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
1.26
18.27
Esta es la significacin
Se quiere comprobar si las charlas a los sujetos fueron positivas para reducir
el peso de stos. Para ello se calcul la variable Perdida de peso= Peso Anterior - Peso Actual. En la Figura 1 se dan los resultados de las tres posibles
32
On e Sam p le t-te s t
Hyp o th e s iz e d M e an = 0
Mean
DF
t-V alue
P-V alue
-1.907
42
-1.558
.1267
On e Sam p le A n alys is
Hyp o th e s iz e d M e an <= 0
Mean
Perdida de pes o
DF
t-V alue
P-V alue
95% Upper
-1.907
42
-1.558
.9366
.152
On e Sam p le A n alys is
Hyp o th e s iz e d M e an >= 0
Mean
DF
t-V alue
P-V alue
95% Low er
42
-1.558
.0634
-3.966
Perdida de pes o
Perdida de pes o
-1.907
Solucin 3.8.1 En primer lugar, hay que plantear la hiptesis. Nosotros queremos demostrar que
ha habido reduccin de peso, luego nuestra hiptesis nula es lo contrario
Solucin 3.8.1
H 0 PerdidaPeso 0 ;H e PerdidaPeso > 0
Solucin 3.8.1 Mirando en el listado anterior, vemos que la hiptesis nula es muy probable y no
podemos rechazarla. Seguramente la perdida de peso ha sido cero o menos que cero.
Ejercicio 3.8.2 En el estudio anterior pensamos que la perdida de HDL ha sido tambin importante gracias a las charlas (Figura 2).
33
t-Value
P-Value
95% Low er
95% Upper
42
3.282
.0021
1.961
8.225
Perdida HDL
5.093
t-Value
P-Value
95% Upper
42
3.282
.0010
7.703
t-Value
P-Value
95% Low er
3.282
.9990
2.483
Perdida HDL
Perdida HDL
5.093
5.093
42
DF
t-Value
P-Value
95% Low er
95% Upper
3.419
42
.386
.7015
-14.457
21.295
Perdida Trigliceridos
DF
t-Value
P-Value
95% Upper
3.419
42
.386
.3507
18.317
DF
t-Value
P-Value
95% Low er
42
.386
.6493
-11.480
Perdida Trigliceridos
Perdida Trigliceridos
3.419
34
Parte 4
Evaluacin de supuestos
4.1 Supuestos de las pruebas de hiptesis de medias
Evaluando la normalidad
Una duda que puede surgir es si lo anterior depende de la distribucin que siga
la poblacin normal o no
Para que las pruebas de hiptesis y los intervalos de confianza descritos funcionen bien se tiene que dar:
Tener una muestra grande
Que la poblacin de origen sea aproximadamente normal si la muestra es pequea
35
14
12
10
Count
8
6
4
2
0
-80
-60
-40
-20
0
20
Cholesterol Loss
40
60
80
Frecuencia
20
15
10
0
50
1 00
1 50
2 00
M e an = 5 3,2 9
Std . D e v . = 4 5,0 82
N = 45
2 50
M i n u t o s d e tr a b a jo n e c e s a r i o s p a ra c o m p r a r
u n a B i g m a c c o n p a t a ta s
36
20
Frecuencia
15
10
M e an = 4 9,1 6
S td . D e v . = 3 5,9 76
N = 44
0
0
50
1 00
15 0
M i n u t o s d e tr a b a jo n e c e s a r i o s p a r a c o m p r a r
u n a B i g m a c c o n p a t a ta s
Figura 6: Histograma de minutos de trabajo para comprar una hamburguesa con patatas fritas en ciudades del mundo
37
20
20
40
40
60
60
-0.6
4.4
9.4
14.4
19.4
24.4
8.5
20.2
SepalWidth
31.9
43.6
55.3
67.0
10
20
20
40
30
40
60
SepalLength
20.423.326.229.132.034.937.840.743.646.5
38
Histogram
60
50
Count
40
30
20
10
0
17.5
20
22.5 25
27.5
30 32.5
Age
35
37.5
40
42.5
Histogram
20
18
16
Count
14
12
10
8
6
4
2
0
100
120
140
160
180
Weight
200
220
240
Solucin 4.1.2 En este caso el histograma no es muy normal pero no hay asimetra exagerada, ni
se ven claramente modas. Estos datos son aceptables.
Ejercicio 4.1.3 Y el colesterol original?
39
Histogram
22.5
20
17.5
Count
15
12.5
10
7.5
5
2.5
0
100 120 140 160 180 200 220 240 260 280 300
Cholesterol
Figura 10: Colesterol del grupo de sujetos sometidos al experimento sobre colesterol
Solucin 4.1.3 El histograma de estos datos indica que los datos se comportan de manera aceptable.
Ejercicio 4.1.4 Y la altura?
Histogram
22.5
20
17.5
Count
15
12.5
10
7.5
5
2.5
0
57.5
60
62.5 65
67.5
70 72.5
Height
75
77.5
80
82.5
Figura 11: Altura del grupo de sujetos sometidos al experimento sobre colesterol
Solucin 4.1.4 Hay una ligera asimetra pero los datos son aceptables tambin.
Ejercicio 4.1.5 Y la tensin? (tener en cuenta que estn las dos medidas de la tensin).
40
Histogram
Histogram
30
40
25
35
30
25
Count
Count
20
15
20
15
10
10
5
5
0
0
95
100
105
110
130
135
140
50
60
70
80
Figura 12: Altura del grupo de sujetos sometidos al experimento sobre colesterol
Solucin 4.1.5 En ambos casos hay valores extremos pero en la diastlica es muy exagerado.
Habra que revisar ese valor.
41