Beruflich Dokumente
Kultur Dokumente
Autores:
Ana Mara Lara Porras Javier Esquivel Snchez Nuria Rico Castro M Dolores Huete Ruiz Ismael R. Snchez Borrego Ismael R. Snchez Borrego Diego Torrecillas de Amo Silvia Valenzuela Ruiz
Profesores de la asignatura:
ndice
pg. CONTRASTES DE HIPTESIS PARAMTRICOS Y NO PARAMTRICOS
Ejercicio 1 Ejercicio 2 Ejercicio 3 Ejercicio 4 Ejercicio 5 3 5 6 7 9
ANLISIS DE REGRESIN
Ejercicio 1 Ejercicio 2 Ejercicio 3 Ejercicio 4 Ejercicio 5 10 14 17 19 22
10
DISEO DE EXPERIMENTOS
Ejercicio 1 Ejercicio 2 Ejercicio 3 Ejercicio 4 Ejercicio 5 Ejercicio 6 25 27 28 29 31 33
25
ANLISIS DE LA COVARIANZA
Ejercicio 1 Ejercicio 2 Ejercicio 3 Ejercicio 4 35 37 39 41
35
ANLISIS CLUSTER
Ejercicio 1 Ejercicio 2 Ejercicio 1 Ejercicio 2 Ejercicio 3 43 50
43 54
Bibliografa
62
X: tiempo de recuperacin de las ratas tratadas con placebo N(1, 1) Y: tiempo de recuperacin de las ratas tratadas con FL113 N(2, 2) Primer contraste Segundo contraste H0: 1= 2 H1: 1 2 H0: 12= 22 H1: 12 22
Universidad de Granada
Tiempo de recuperacin
N 9 9
Universidad de Granada
Ejercicio 2:
Se ha realizado un estudio para investigar el efecto del ejercicio fsico en el nivel de colesterol en plasma, en el que participaron 11 sujetos. Antes del ejercicio, se tomaron muestras de sangre para determinar el nivel del colesterol de cada participante. Despus, los individuos fueron sometidos a un programa de ejercicios que se centraba en carreras y marchas diarias. Al final del periodo de ejercicios, se tomaron nuevamente muestras de sangre y se obtuvo una segunda lectura del nivel de colesterol en plasma de los sujetos. Se quiere estimar la diferencia entre el nivel medio de colesterol antes y despus del ejercicio. Se recogieron los siguientes datos Nivel previo mg/dl 182 232 191 200 148 249 276 213 241 480 262 Nivel posterior mg/dl 198 210 194 220 138 220 219 161 210 313 226
Decidir si existen diferencias significativas entre estos niveles antes y despus del ejercicio fsico.
Prueba de muestras relacionadas Diferencias relacionadas 95% Intervalo de confianza para la diferencia DesviacinError tp. de Media la media Inferior Superior tp. Par 1 Colesterol antes d ejercicio - Coleste 33,18 despues del ejerc 51,066 15,397 -1,12 67,49
t 2,155
gl 10
Universidad de Granada
Ejercicio 3:
En unos laboratorios clnicos se toman muestras de 650 anlisis de sangre y se anota el nmero de eritrocitos por milmetro cbico de sangre. Se puede admitir que el nmero de eritrocitos se distribuye normalmente? Los resultados agrupados en 7 clases son los que figuran en la tabla adjunta N de eritrocitos en millones 0-2,5 2.5-3.5 3.5-4.5 4.5-5.5 5.5-6.5 6.5-7.5 7.5-8.5 N de muestras 8 52 140 210 160 70 10
Prueba de Kolmogorov-Smirnov para una muestra Eritrocitos N Media Parmetros normales(a,b) Diferencias ms extremas Desviacin tpica Absoluta Positiva Negativa Z de Kolmogorov-Smirnov Sig. asintt. (bilateral) a La distribucin de contraste es la Normal. b Se han calculado a partir de los datos. 650 5,0862 1,23238 ,164 ,159 -,164 4,192 ,000
Universidad de Granada
Ejercicio 4:
Se realiza una investigacin para determinar si el hecho de contraer hepatitis es independiente de haber sido vacunado contra la enfermedad. Para ello se utilizan 1083 voluntarios varones. De ellos, se eligen aleatoriamente 549 y son vacunados con un nuevo frmaco. Los restantes, 534, no son vacunados. Despus de un cierto tiempo, se observ que 70 de los 534 voluntarios no vacunados contrajeron la hepatitis, mientras que solamente 11 de los 549 vacunados no la contrajeron. Los datos se muestran en la tabla adjunta Vacunacin Hepatitis SI NO SI 11 538 NO 70 464
Tabla de contingencia HEPATITI * VACUNACI Recuento VACUNACI no HEPATITI Total no si 464 70 534 si 538 11 549 1002 81 1083 Total
Universidad de Granada
Chi-cuadrado de Pearson Correccin por continuidad(a) Razn de verosimilitud Estadstico exacto de Fisher Asociacin lineal por lineal N de casos vlidos
gl 1 1 1
,000
1083 a Calculado slo para una tabla de 2x2. b 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 39,94.
Universidad de Granada
Ejercicio 5:
Se realiza un estudio para investigar la asociacin entre el color de las flores y la fragancia de las azaleas silvestres. Se observan 200 plantas floridas seleccionadas aleatoriamente. Cada una de ellas se clasifica segn el color y la presencia o ausencia de fragancia. Los datos se muestran en la tabla adjunta Color Rosa 60 10
Fragancia SI NO
Blanca 12 50
Naranja 58 10
Chi-cuadrado de Pearson Razn de verosimilitud Asociacin lineal por lineal N de casos vlidos
gl 2 2 1
a 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 21,70.
Universidad de Granada
10
Longitud en cm. el primer ao 15.3 14.8 12.6 18.4 17.9 15.6 18.4 14.1 20.2 21.7 20.4 16.5 15.9 17.9 16.7 Se pide: a) b) c) d)
Longitud en cm. en edad adulta 30.7 32.5 26.3 35.9 34.3 28.5 37.4 29.7 38.8 40.4 40.9 33.3 30.1 35.7 31.4
Representar el diagrama de dispersin Estimar los parmetros del modelo Coeficientes de correlacin lineal y de determinacin. Interpretacin Plantear y contrastar el test para conocer la significacin de la variable independiente a un nivel de significacin del 5 %
Universidad de Granada
11
a) Diagrama de dispersin
Universidad de Granada
12
LONG_ADU
LONG_1
Modelo 1
(Constante) LONG_1
t 1,965 10,657
Universidad de Granada
13
Modelo 1
R ,947a
R cuadrado ,897
Modelo 1
gl 1 13 14
F 113,577
Sig. ,000a
Universidad de Granada
14
Ejercicio 2:
Se realiza un estudio para establecer una ecuacin mediante la cual se pueda utilizar la concentracin de estrona en la saliva para predecir la concentracin de dicho esteroide en plasma libre. Se tomaron los siguientes datos de 13 varones sanos:
Concentracin de estrona en plasma libre en pg./mL. 30 25 31.5 27.5 39.5 38 43 49 55 48.5 51 64.5 63
a) Representar el diagrama de dispersin b) Plantear el modelo de regresin y estimar los parmetros del modelo. Interprtalos c) Obtener el coeficiente de correlacin lineal de Pearson y el coeficiente de determinacin d) Obtener un intervalo de confianza al 95 % para la pendiente de la recta de regresin e) Contrastar la significacin del coeficiente de regresin a) Diagrama de dispersin
70,0
60,0
50,0
estrona
40,0 30,0 20,0 7,5 10,0 12,5 15,0 17,5 20,0
saliva
Universidad de Granada
15
Modelo 1
(Constante) saliva
t 1,737 9,705
Resumen del modelo Modelo 1 R R cuadrado ,946a ,895 R cuadrado corregida ,886 Error tp. de la estimacin 4,3997
Coeficientesa Coeficientes no estandarizados Modelo 1 B 6,887 2,886 Error tp. 3,965 ,297 Coeficientes estandarizad os Beta ,946 t 1,737 9,705 Sig. ,110 ,000 Intervalo de confianza para B al 95% Lmite Lmite inferior superior -1,841 15,614 2,232 3,541
(Constante) saliva
Universidad de Granada
16
ANOVAb Modelo 1 Suma de cuadrados 1823,070 212,930 2036,000 gl 1 11 12 Media cuadrtica 1823,070 19,357 F 94,180 Sig. ,000a
Universidad de Granada
17
Ejercicio 3:
Un aficionado a las apuestas en las carreras de caballos desea estudiar la descendencia de una conocida raza de caballos que tiene mucho xito en dichas carreras. Para ello estudia la relacin existente entre el peso en gramos de embriones de caballos y el nmero de das transcurridos de vida de los mismos. Los datos aparecen en la siguiente tabla: Das Peso 7 51.3 8 79.1 9 127.4 10 183.5 11 271.3 12 431.5 13 743.7 14 1143.2 15 1893.8 16 3102.4 17 4702.7 Se pide: a) Representar la nube de puntos b) Plantear el modelo de regresin y obtener la ecuacin del modelo ajustado c) Bondad del ajuste
3000
2000
1000
PESO
-1000 6 8 10 12 14 16 18
DIAS
MODEL: MOD_1.
Universidad de Granada
18
Lineal
ANOVA Suma de cuadrados 16841317 5932167,3 22773485 gl 1 9 10 Media cuadrtica 16841317 659129,695 F 25,551 Sig. ,001
Resumen del modelo R ,860 R cuadrado ,740 R cuadrado corregida ,711 Error tpico de la estimacin 811,868
Exponencial
ANOVA Suma de cuadrados 22,756 ,032 22,789 gl 1 9 10 Media cuadrtica 22,756 ,004 F 6384,193 Sig. ,000
Resumen del modelo R ,999 R cuadrado ,999 R cuadrado corregida ,998 Error tpico de la estimacin ,060
Universidad de Granada
19
Ejercicio 4:
Una empresa fabricante de cereales para el desayuno desea conocer la ecuacin que permita predecir las ventas (en miles de euros) en funcin de los gastos en publicidad infantil en televisin (en miles de euros), el tiempo diario de aparicin en televisin (en minutos) y los gastos en publicidad en los peridicos (en miles de euros). Se realiza un estudio en el que se renen los datos mensuales correspondientes a los ltimos 20 meses. Estos datos aparecen en la siguiente tabla:
Pub. en tv. 1 1.2 1.3 1.4 1.5 1.7 1.75 1.3 1.45 0.9 0.8 0.9 0.8 1 1.7 1.8 1.85 1.9 2 2
Pub. en per. 0.4 0.4 0.42 0.5 0.4 0.44 0.4 0.44 0.46 0.46 0.45 1.1 0.3 0.5 0.45 0.4 0.8 0.9 0.9 1.1
a) Ajustar un modelo de regresin lineal mltiple. Obtener una estimacin de los parmetros del modelo y su interpretacin b) Obtener e interpretar el valor de la suma de cuadrados residual c) Contrastar la significacin del modelo propuesto
Universidad de Granada
20
a) Ajustar un modelo de regresin lineal mltiple. Obtener una estimacin de los parmetros del modelo y su interpretacin
Modelo 1
Coeficientes no estandarizados B Error tp. 2,108 2,055 3,432 1,121 1,477E-03 ,030 11,347 1,802
Modelo 1
gl 3 16 19
F 26,440
Sig. ,000a
Universidad de Granada
FBA I Cuaderno de Prcticas de Estadstica con SPSS c) Contrastar la significacin del modelo propuesto
ANOVAb Suma de cuadrados 247,677 49,960 297,638 Media cuadrtica 82,559 3,123
21
Modelo 1
gl 3 16 19
F 26,440
Sig. ,000a
Universidad de Granada
22
Ejercicio 5:
Se desea estudiar la relacin entre la intensidad de regado (medida en litros por metro cuadrado) y la productividad (medida en Kg/Ha) de una huerta de tomates. Se han obtenido los siguientes datos:
Productividad de un cultivo 2500.9 2000.8 3300.4 2500.6 1995.8 3312.3 3409 Se pide:
a) Podemos afirmar la existencia de relacin lineal entre las variables? b) Coeficiente de correlacin y coeficiente de determinacin. Interpretacin Adems del regado se cree que el empleo de un abono ha influido de forma lineal en la productividad del cultivo. Por tanto se introduce en el modelo de regresin la variable que mide el nmero de Kg. de abono por hectrea. Abono 200.6 160.6 407.6 212.7 145 387.8 355
c) Ajustar un modelo de regresin lineal mltiple d) Interpretacin de los coeficientes del modelo de regresin. Qu variable tiene mayor influencia en la variacin de la productividad? e) Valor de la suma de cuadrados de la regresin. Interpretacin f) Contrastar la significacin del modelo propuesto g) Coeficiente de determinacin mltiple y coeficiente de determinacin mltiple corregido. Interpretacin h) Ha sido til la adicin de la variable abono?
Universidad de Granada
FBA I Cuaderno de Prcticas de Estadstica con SPSS a) Muestran los datos una relacin lineal?
3600 3400 3200 3000 2800 2600 2400
23
PRODUCT
REGADIO
ANOVAb Suma de cuadrados 1557184,3 743017,305 2300201,6 Media cuadrtica 1557184,3 148603,461
Modelo 1
gl 1 5 6
F 10,479
Sig. ,023a
Resumen del modelo R cuadrado corregida ,612 Error tp. de la estimacin 385,491
Modelo 1
Universidad de Granada
FBA I Cuaderno de Prcticas de Estadstica con SPSS c) Ajustar un modelo de regresin lineal mltiple
Coeficientesa Coeficient es estandari zados Beta ,073 ,911
24
Modelo 1
Coeficientes no estandarizados B Error tp. 942,755 988,031 ,674 1,897 5,021 1,141
Modelo 1
gl 2 4 6
F 34,179
Sig. ,003a
Modelo 1
Universidad de Granada
25
DISEO DE EXPERIMENTOS
Ejercicio 1:
Se sabe que el dixido de carbono tiene un efecto crtico en el crecimiento microbiolgico. Cantidades pequeas de CO2 estimulan el crecimiento de muchos microorganismos, mientras que altas concentraciones inhiben el crecimiento de la mayor parte de ellos. Este ltimo efecto se utiliza comercialmente cuando se almacenan productos alimenticios perecederos. Se realiz un estudio para investigar el efecto del CO2 sobre la tasa de crecimiento de Pseudomonas fragi, un corruptor de alimentos. Se administr dixido de carbono a cinco presiones atmosfricas diferentes. La respuesta anotada fue el cambio porcentual en la masa celular despus de un tiempo de crecimiento de una hora. Se utilizaron diez cultivos en cada nivel. Se obtuvieron los siguientes datos:
Nivel del factor (presin de CO2 en atmsferas) 0.0 0.083 0.29 0.5 0.86 62.6 50.9 45.5 29.5 24.9 59.6 44.3 41.1 22.8 17.2 64.5 47.5 29.8 19.2 7.8 59.3 49.5 38.3 20.6 10.5 58.6 48.5 40.2 29.2 17.8 64.6 50.4 38.5 24.1 22.1 50.9 35.2 30.2 22.6 22.6 56.2 49.9 27 32.7 16.8 52.3 42.6 40 24.4 15.9 62.8 41.6 33.9 19.6 8.8 a) Se suponen efectos fijos: qu implica esto respecto de los niveles atmosfricos elegidos? b) Plantear la hiptesis nula a contrastar c) Evaluar el estadstico F utilizado para contrastar H0 d) Puede rechazarse H0? Explicarlo basndose en el p-valor del contraste
Universidad de Granada
26
ANOVA CRECIMIE Suma de cuadrados 11274,319 1248,038 12522,357 gl 4 45 49 Media cuadrtica 2818,580 27,734 F 101,628 Sig. ,000
Universidad de Granada
27
Ejercicio 2:
Una compaa textil utiliza diversos telares para la produccin de telas. Aunque se desea que los telares sean homogneos con el objeto de producir tela de resistencia uniforme se supone que puede existir una variacin significativa en la resistencia de la tela debida a la utilizacin de distintos telares. A su disposicin tiene 5 tipos de telares con los que realiza determinaciones de la resistencia de la tela. Este experimento se realiza en orden aleatorio y los resultados se muestran en la tabla adjunta. Analizar los datos y obtener las conclusiones apropiadas. Telares 1 2 3 4 5 51 56 48 47 43 49 60 50 48 43 Resistencia 50 49 56 56 53 44 49 44 46 47 51 57 45 45 50
46
a) Plantear la hiptesis nula a contrastar b) Puede rechazarse H 0 ? Explicarlo basndose en el p-valor del contraste c) Comprobar la hiptesis de homocedasticidad
ANOVA RESIST Suma de cuadrados 439,885 98,000 537,885 gl 4 21 25 Media cuadrtica 109,971 4,667 F 23,565 Sig. ,000
Prueba de homogeneidad de varianzas RESIST Estadstico de Levene 2,367 gl1 4 gl2 21 Sig. ,086
Universidad de Granada
28
Ejercicio 3:
En una determinada fbrica de galletas se desea saber si las harinas de sus cuatro proveedores producen la misma viscosidad en la masa. Para ello, produce durante un da 16 masas, 4 de cada tipo de harina y mide su viscosidad. Los resultados obtenidos se muestran en la siguiente tabla:
Proveedor A 98 91 96 95
Proveedor B 97 90 95 96
Proveedor C 99 93 97 99
Proveedor D 96 92 95 98
a) Plantear la hiptesis nula a contrastar b) Puede rechazarse H 0 ? Explicarlo basndose en el p-valor del contraste c) Comprobar la hiptesis de normalidad
ANOVA VISCOSID Suma de cuadrados 14,188 97,750 111,938 gl 3 12 15 Media cuadrtica 4,729 8,146 F ,581 Sig. ,639
-2
-4
-6 -6 -4 -2 0 2 4 6
Valor observado
Universidad de Granada
29
Ejercicio 4:
Los cientficos comprometidos en el tratamiento del agua residual de arenas asflticas estudiaron tres mtodos de tratamientos para la eliminacin del carbono orgnico (basado en W.R. Pirie, Statistical Planning and Analysis for Treatments of Tar Sand Waste-water, Centro de Informacin Tcnica, Oficina de Informacin Tecnolgica y Cientfica, Departamento de Energa de Estados Unidos). Los tres mtodos de tratamiento utilizados fueron: flotacin de aire (FA), separacin de espuma (SF) y coagulacin ferroclrica (CFC). Las mediciones del material de carbono orgnico para los tres tratamientos arrojaron los siguientes datos: FA 34.6 35.1 35.6 35.8 36.1 36.5 36.8 37.2 37.4 37.7 SE 38.8 39.0 40.1 40.9 41.0 43.2 44.9 46.9 51.6 53.6 CFC 26.7 26.7 27.0 27.1 27.5 28.1 28.1 28.7 30.7 31.2
a) Contrastar H 0 : 1 = 2 = 3 al nivel =0.10 b) Si se rechaza H 0 utilizar los contrastes de Tukey para precisar qu mtodos difieren estadsticamente entre s
ANOVA CARBONO Suma de cuadrados 1251,603 278,172 1529,775 gl 2 27 29 Media cuadrtica 625,801 10,303 F 60,742 Sig. ,000
Universidad de Granada
30
Comparaciones mltiples Variable dependiente: carbono HSD de Tukey Intervalo de confianza al 90% Lmite superior Lmite inferior -10,7960 -4,6440 5,0240 11,1760 4,6440 10,7960 12,7440 18,8960 -11,1760 -5,0240 -18,8960 -12,7440
(I) metodo 1 2 3
(J) metodo 2 3 1 3 1 2
Diferencia de medias (I-J) Error tpico -7,72000* 1,43546 8,10000* 1,43546 7,72000* 1,43546 15,82000* 1,43546 -8,10000* 1,43546 -15,82000* 1,43546
Universidad de Granada
31
Ejercicio 5:
Se ha realizado un estudio sobre el efecto de las temporadas de caza del ciervo en los hbitos de stos. Se seleccionan cuatro sendas que se sabe utilizan los ciervos. Antes de comenzar la temporada de caza, durante la temporada y al terminar la temporada se determin el promedio de huellas halladas por semana en un rea especfica de cada senda. Las sendas se trataron como bloques y se obtuvieron los siguientes datos:
Senda 1 2 3 4
Despus 49 50 37 50
a) Contrastar la hiptesis nula de igualdad de medias en los tratamientos al nivel =0.05 b) Contrastar la hiptesis nula de igualdad de medias en los bloques al nivel =0.05
Universidad de Granada
32
Pruebas de los efectos inter-sujetos Variable dependiente: HUELLAS Suma de cuadrados tipo III 700,631a 27008,541 98,482 602,149 611,198 28320,370 1311,829 Media cuadrtica 140,126 27008,541 49,241 200,716 101,866
Fuente Modelo corregido Interseccin TEMPORAD SENDA Error Total Total corregida
gl 5 1 2 3 6 12 11
Universidad de Granada
33
Ejercicio 6:
Una industria desea comprobar el efecto que tienen cinco productos qumicos sobre la resistencia de un tipo particular de fibra. Como tambin puede influir la mquina empleada en la fabricacin, decide utilizar un diseo en bloques aleatorizados, considerando las distintas mquinas como bloques. La industria dispone de cuatro mquinas a las que asigna los cinco productos qumicos en orden aleatorio. Los resultados obtenidos se muestran en la tabla adjunta.
Producto qumico 1 2 3 4 5
A 87 85 90 89 99
Tipos de mquinas B C 86 88 87 95 92 95 97 98 96 91
D 83 85 90 88 90
a) Contrastar la hiptesis nula de igualdad de medias en los tratamientos al nivel =0.05 b) Contrastar la hiptesis nula de igualdad de medias en los bloques al nivel =0.05 c) Si se rechaza H 0 en los apartados a) o b), utilizar los contrastes LSD y Tukey, respectivamente, para precisar qu medias difieren estadsticamente entre s
Universidad de Granada
34
Comparaciones mltiples Variable dependiente: RESIST DMS Intervalo de confianza al 95%. Lmite Lmite inferior superior -7,09 3,09 -10,84 -,66 -12,09 -1,91 -13,09 -2,91 -3,09 7,09 -8,84 1,34 -10,09 ,09 -11,09 -,91 ,66 10,84 -1,34 8,84 -6,34 3,84 -7,34 2,84 1,91 12,09 -,09 10,09 -3,84 6,34 -6,09 4,09 2,91 13,09 ,91 11,09 -2,84 7,34 -4,09 6,09
(I) PRODUCT 1
(J) PRODUCT 2 3 4 5 1 3 4 5 1 2 4 5 1 2 3 5 1 2 3 4
Diferencia entre medias (I-J) -2,00 -5,75* -7,00* -8,00* 2,00 -3,75 -5,00 -6,00* 5,75* 3,75 -1,25 -2,25 7,00* 5,00 1,25 -1,00 8,00* 6,00* 2,25 1,00
Error tp. 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336
Significacin ,409 ,030 ,011 ,005 ,409 ,134 ,054 ,025 ,030 ,134 ,602 ,355 ,011 ,054 ,602 ,676 ,005 ,025 ,355 ,676
Basado en las medias observadas. *. La diferencia de medias es significativa al nivel ,05. *. Se ha detectado el smbolo ,05 donde se esperaba un parntesis de cierre en el subcomando TEST.
Universidad de Granada
35
ANLISIS DE LA COVARIANZA
Ejercicio 1:
Un distribuidor de bebidas est estudiando la efectividad de los mtodos de descarga, para lo cual se mide el tiempo de descarga de unas cajas en minutos. Las bebidas se distribuyen en tres tipos distintos de furgonetas (atendiendo a su diferente capacidad de carga y antigedad). Se conoce que el tiempo de descarga guarda una estrecha relacin con el volumen de cajas descargadas. Se obtuvieron los siguientes datos:
1 y 12 19 15 21 11 19 x 20 23 22 30 15 22
Furgoneta 2 y x 70 64 64 62 55 47 77 66 66 50 44 42
3 y 31 28 25 22 29 28 x 27 25 22 26 28 29
a) Planteamiento del modelo b) Contrastar los efectos del factor y de la covariable sobre la variable respuesta c) Indicar el porcentaje de variabilidad explicada por el modelo propuesto SOLUCIN: b) Contrastar los efectos del factor y de la covariable sobre la variable respuesta
Universidad de Granada
36
Pruebas de los efectos inter-sujetos Variable dependiente: TIEMPO Suma de cuadrados tipo III 7679,373a 3,758 174,246 592,373 222,627 30374,000 7902,000 Media cuadrtica 2559,791 3,758 87,123 592,373 15,902
Fuente Modelo corregido Interseccin FURGONET VOLUMEN Error Total Total corregida
gl 3 1 2 1 14 18 17
Universidad de Granada
37
Ejercicio 2:
Se quiere analizar el efecto que tienen tres tipos distintos de terreno en el rendimiento de una determinada plantacin de almendros. Se sospecha que el rendimiento del cultivo (medido en kg.) est relacionado con la cantidad de kg. de abono recibidos. Los datos observados se muestran en la tabla adjunta:
A Y 130,5 144,6 133,9 128,4 119,2 133,8 122,8 119,4 122,7 130,8 Se pide x 20,3 44,9 33,8 20,8 18,2 32,8 33,9 18,3 22,7 29,7
Terreno B y 110,3 100,8 109,6 122,7 97,4 x 15,9 22 16,9 20,2 16,9 y 155,9 149,1 188,9 199,4 185,7
a) Indicar el valor de la suma de cuadrados entre tratamientos ajustada. Interpretacin b) Contrastar los efectos del factor y de la covariable sobre la variable respuesta
Universidad de Granada
38
Pruebas de los efectos inter-sujetos Variable dependiente: PRODUCC Suma de cuadrados tipo III 14135,521a 10205,154 404,959 1804,347 1080,639 381321,724 15216,159 Media cuadrtica 4711,840 10205,154 202,479 1804,347 67,540
Fuente Modelo corregido Interseccin TERRENO ABONO Error Total Total corregida
gl 3 1 2 1 16 20 19
Universidad de Granada
39
Ejercicio 3:
Una empresa pretende estudiar la resistencia a la ruptura de la fibra de la que est compuesta una cuerda. Se realiza un estudio para determinar si existe diferencia significativa en la resistencia de los tres tipos de cuerdas disponibles (atendiendo al tipo de fibra disponible). Se cree que la temperatura a la que se realiza el experimento puede influir en la resistencia, por lo que se utiliza un diseo en bloques aleatorizados considerando la temperatura como bloque, con 4 niveles. La resistencia de la cuerda a la ruptura (medida en libras) se ve afectada por su grosor (medido en 103 pulgadas). Los datos se presentan en la siguiente tabla:
1 Temperatura 1 2 3 4 Se pide y 33 41 35 42 x 20 25 24 25
Cuerda 2 y 44 23 44 37
3 x 28 22 33 27 y 41 39 37 26 x 23 22 23 21
a) Formular el diseo empleado b) Analizar estos datos y extraer las conclusiones apropiadas
Universidad de Granada
40
Pruebas de los efectos inter-sujetos Variable dependiente: Y Suma de cuadrados tipo III 423,966a 55,091 170,503 91,799 358,133 71,701 16776,000 495,667 Media cuadrtica 70,661 55,091 85,251 30,600 358,133 14,340
Fuente Modelo corregido Interseccin CUERDA TEMP X Error Total Total corregida
gl 6 1 2 3 1 5 12 11
Universidad de Granada
41
Ejercicio 4:
Se pretende comparar la presin arterial sistlica de un grupo de fumadores segn su nivel de estudios. Para ello se realiza un estudio en el que se controla el nmero de cigarrillos consumidos al da por cada una de estas personas. El nivel de estudios se clasifica en tres niveles: estudios bsicos, estudios de Secundaria y estudios universitarios, codificados por 1, 2 y 3 respectivamente. Adems se cree que la presin arterial que sufren estos individuos podra relacionarse en forma lineal con la edad de los fumadores. Los datos se muestran en la tabla adjunta:
z 46 55 49 44 64
Nivel de estudios 2 y x z 141,3 18,3 22 133,9 28 51 128,7 12,1 36 144,2 27,4 51 137,4 33,5 35
z 35 17 40 39 29
a) Formular el diseo empleado b) Variacin de la presin arterial sistlica que queda sin explicar y suma total de cuadrados de la respuesta ajustada por la covariable c) Contrastar la igualdad de los efectos del factor, as como la significacin de cada covariable d) Proporcin de variacin explicada por el modelo propuesto e) Comprobar que se cumple la hiptesis de homocedasticidad
Universidad de Granada
42
Pruebas de los efectos inter-sujetos Variable dependiente: PRESIN Suma de cuadrados tipo III 1294,773a 11452,003 410,072 203,031 24,663 336,176 302361,030 1630,949 Media cuadrtica 323,693 11452,003 205,036 203,031 24,663 33,618
Fuente Modelo corregido Intercept ESTUDIOS N_CIGAR EDAD Error Total Total corregida
gl 4 1 2 1 1 10 15 14
Contraste de Levene sobre la igualdad de las varianzas error Variable dependiente: PRESIN F ,973 gl1 2 gl2 12 Significacin ,406
Contrasta la hiptesis nula de que la varianza error de la variable dependiente es igual a lo largo de todos los grupos.
Universidad de Granada
43
ANLISIS CLUSTER
Ejercicio 1:
Se analiza la leche de las hembras de 20 mamferos, obtenindose los porcentajes en agua, protenas, grasa y lactosa siguientes: Mamfero CABALLO BURRO CEBRA HAMSTER RATA OVEJA RENO MULA CERDO CAMELLO BFALO ZORRO CONEJO LLAMA CIERVO BISONTE GATO PERRO FOCA DELFN Agua 90.1 90.3 86.2 81.9 72.5 82.0 64.8 90.0 82.8 87.7 82.1 81.6 71.3 86.5 65.9 86.9 81.6 76.3 46.4 44.9 Protenas 2.6 1.7 3.0 7.4 9.2 5.6 10.7 2.0 7.1 3.5 5.9 6.6 12.3 3.9 10.4 4.8 10.1 9.3 9.7 10.6 Grasa 1.0 1.4 4.8 7.2 12.6 6.4 20.3 1.8 5.1 3.4 7.9 5.9 13.1 3.2 19.7 1.7 6.3 9.5 42.0 34.9 Lactosa 6.9 6.2 5.3 2.7 3.3 4.7 2.5 5.5 3.7 4.8 4.7 4.9 1.9 5.6 2.6 5.7 4.4 3.0 0.0 0.9
Clasificar estos mamferos de forma jerrquica atendiendo a dichas variables realizando el estudio de acuerdo a las siguientes opciones de medidas de asociacin y mtodos de amalgamamiento: a) Distancia eucldea y linkage simple b) Distancia bloque y linkage simple c) Distancia eucldea y mtodo del centroide d) Distancia bloque y mtodo del centroide Para cada uno de las anteriores opciones se pide la matriz de distancias, el dendrograma y la clasificacin resultante si se toman 2, 3, 4 o 5 grupos diferentes.
Universidad de Granada
44
Universidad de Granada
45
Universidad de Granada
46
Historial de conglomeracin Etapa en la que el conglomerado aparece por primera vez Conglom Conglom erado 1 erado 2 0 0 0 0 0 1 0 0 0 0 2 0 5 0 0 7 6 0 0 9 3 8 10 0 0 0 13 0 11 12 15 14 0 0 16 4 18 17
Etapa 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Coeficientes ,911 1,204 1,225 1,292 1,510 1,533 1,797 1,884 1,942 2,512 3,254 3,329 3,969 4,389 5,227 6,352 7,367 8,765 24,733
Prxima etapa 3 6 11 18 7 9 8 11 10 12 15 15 14 16 16 18 19 19 0
Universidad de Granada
47
Conglomerado de pertenencia 5 conglome rados 1 1 1 1 2 1 3 1 1 1 1 1 2 1 3 1 1 2 4 5 4 conglome rados 1 1 1 1 1 1 2 1 1 1 1 1 1 1 2 1 1 1 3 4 3 conglome rados 1 1 1 1 1 1 2 1 1 1 1 1 1 1 2 1 1 1 3 3 2 conglome rados 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2
Caso 1:caballo 2:burro 3:cebra 4:hamster 5:rata 6:oveja 7:reno 8:mula 9:cerdo 10:camello 11:bfalo 12:zorro 13:conejo 14:llama 15:ciervo 16:bisonte 17:gato 18:perro 19:foca 20:delfn
Universidad de Granada
48
A N A L Y S I S *
Dendrogram using Single Linkage Rescaled Distance Cluster Combine C A S E Label burro mula caballo camello llama bisonte cebra oveja zorro bfalo cerdo hamster gato rata perro conejo reno ciervo foca delfn 0 5 10 15 20 25 +---------+---------+---------+---------+---------+
Num 2 8 1 10 14 16 3 6 12 11 9 4 17 5 18 13 7 15 19 20
2 grupos
Universidad de Granada
49
Universidad de Granada
50
Ejercicio 2:
Se pretende clasificar un conjunto de 26 animales mamferos en 4 grupos homogneos atendiendo a su configuracin dental. La informacin de la que se dispone es la del nmero de piezas dentales. Los datos de los que se dispone son los siguientes:
Mamfero
Incisivos Sup. Incisivos Inf. Caninos Sup. Caninos Inf. Premolares Inf. Premolares Sup. Molares Sup. Molares Inf.
ALCE ANTLOPE ARDILLA BISONTE BUEY CABRA CASTOR CIERVO COMADREJA HURN JAGUAR LEN LINCE LOBO MARTA MOFETA MURCILAGO NUTRIA OCELOTE OSO OVEJA RATN RENO TEJN VISN ZORRO
0 0 1 0 0 0 1 0 3 3 3 3 3 3 3 3 2 3 3 3 0 1 0 3 3 3
4 4 1 4 4 4 1 4 3 3 3 3 3 3 3 3 3 2 3 3 4 1 4 3 3 3
1 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1
0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 1
3 3 1 3 3 3 2 3 3 3 3 3 2 4 4 3 1 1 3 4 3 0 3 3 3 4
3 3 1 3 3 3 1 3 3 3 2 2 2 4 4 3 2 2 2 4 3 0 3 3 3 4
3 3 3 3 3 3 3 3 1 1 1 1 1 2 1 1 3 3 1 2 3 3 3 1 1 2
3 3 3 3 3 3 3 3 2 2 1 1 1 3 2 2 3 3 1 3 3 3 3 2 2 3
Clasificar estos mamferos utilizando el mtodo de las k-medias para agrupar a los mamferos en 4 grupos.
Universidad de Granada
51
Universidad de Granada
52
Historial de iteraciones(a) Cambio en los centros de los conglomerados Iteracin 1 2 1 1,150 ,000 2 ,250 ,000 3 1,202 ,000 4 ,354 ,000
a Se ha logrado la convergencia debido a que los centros de los conglomerados no presentan ningn cambio o ste es pequeo. El cambio mximo de coordenadas absolutas para cualquier centro es de ,000. La iteracin actual es 2. La distancia mnima entre los centros iniciales es de 3,606. Pertenencia a los conglomerados Nmero de caso 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 MAMIFERO alce antlope ardilla bisonte buey cabra castor ciervo comadrej hurn jaguar len lince lobo marta mofeta murcila nutria ocelote oso oveja ratn reno tejn visn zorro Conglome rado 2 2 3 2 2 2 3 2 1 1 1 1 1 4 4 1 1 1 1 4 2 3 2 1 1 4 Distancia ,750 ,250 ,333 ,250 ,250 ,250 1,054 ,250 ,828 ,828 1,110 1,110 1,150 ,354 1,061 ,828 2,739 2,739 1,110 ,354 ,250 1,202 ,750 ,828 ,828 ,354
Universidad de Granada
53
Centros de los conglomerados finales Conglomerado 1 Incisivos Superiores Incisivos Inferiores Caninos Superiores Caninos Inferiores Premolares Inferiores Premolares Superiores Molares Superiores Molares Inferiores 3 3 1 1 3 2 1 2 2 0 4 0 0 3 3 3 3 3 1 1 0 0 1 1 3 3 4 3 3 1 1 4 4 2 3
Distancias entre los centros de los conglomerados finales Conglomerado 1 2 3 4 1 3,974 4,353 2,353 4,417 3,897 5,633 2 3,974 3 4,353 4,417 4 2,353 3,897 5,633
Nmero de casos en cada conglomerado Conglomerado 1 2 3 4 Vlidos Perdidos 11,000 8,000 3,000 4,000 26,000 ,000
Universidad de Granada
54
Universidad de Granada
55
Procedencia
Pblico No Gubernamental
Total
Universidad de Granada
56
Pruebas de chi-cuadrado Valor 33,078a 35,395 32,401 260 gl 2 2 1 Sig. asinttica (bilateral) ,000 ,000 ,000
Chi-cuadrado de Pearson Razn de verosimilitudes Asociacin lineal por lineal N de casos vlidos
a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 30,99.
N de casos vlidos a A i
Lambda
Universidad de Granada
57
Ejercicio 2:
Se est llevando a cabo un estudio sobre la raza canina Boxer para investigar el grado de agresividad que presentan los perros de dicha raza. Se supone en principio, que los sntomas de agresividad dependen fundamentalmente del nivel de adiestramiento que han tenido estos perros durante los dos primeros aos de su vida. Por este motivo, se han investigado a 208 perros Boxer ofreciendo los siguientes resultados: Nivel de adiestramiento Grado de agresividad Bajo Medio Alto Bajo Medio Alto 12 28 42 13 34 31 28 15 5
a) Qu tipo de variables son? b) Obtener la distribucin condicionada del grado de agresividad al nivel de adiestramiento. c) Son independientes?.
Universidad de Granada
58
Tabla de contingencia Grado de Agresividad * Grado de Adiestramiento Grado de Adiestramiento Bajo Medio Alto 12 13 28 14,6% 28 34,1% 42 51,2% 82 100,0% 16,7% 34 43,6% 31 39,7% 78 100,0% 58,3% 15 31,3% 5 10,4% 48 100,0%
Grado de Agresividad
Bajo
Medio
Alto
Total
Recuento % de Grado de Adiestramiento Recuento % de Grado de Adiestramiento Recuento % de Grado de Adiestramiento Recuento % de Grado de Adiestramiento
Universidad de Granada
59
Pruebas de chi-cuadrado Valor 41,629a 40,522 31,093 208 gl 4 4 1 Sig. asinttica (bilateral) ,000 ,000 ,000
Chi-cuadrado de Pearson Razn de verosimilitudes Asociacin lineal por lineal N de casos vlidos
a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 12,23.
Medidas direccionales Valor -,336 -,338 -,334 Error tp. a asint. ,058 ,058 ,058 T aproximada -5,668 -5,668 -5,668
b
d de Somers
a. Asumiendo la hiptesis alternativa. b. Empleando el error tpico asinttico basado en la hiptesis nula.
Medidas simtricas Valor -,336 -,330 -,492 208 Error tp. a asint. ,058 ,058 ,078 T aproximada -5,668 -5,668 -5,668
b
Universidad de Granada
60
Ejercicio 3:
En la siguiente tabla se muestra la informacin de la Unidad de Paritorio de un hospital granadino, donde aparecen las frecuencias observadas de utilizacin de analgesia epidural y realizacin de episiotoma a las mujeres cuyo parto es asistido en dicho centro. Los responsables de esta Unidad creen que la utilizacin de analgesia epidural en el proceso del parto influye en la realizacin de episiotoma. Analgesia Epidural No Episitoma No S S
Se pide la realizacin de un estudio de asociacin que de respuesta a los responsables de la Unidad de Paritorio.
Tabla de contingencia Realizacin de Episiotoma * Utilizacin de analgesia epidural Utilizacin de analgesia epidural No S 405 243 62,9% 50,8% 239 235 37,1% 49,2% 644 478 100,0% 100,0%
Realizacin de Episiotoma
NO Si
Total
Universidad de Granada
61
Pruebas de chi-cuadrado Valor 16,332b 15,841 16,316 gl 1 1 1 Sig. asinttica (bilateral) ,000 ,000 ,000 ,000 1122 ,000 Sig. exacta (bilateral) Sig. exacta (unilateral)
Chi-cuadrado de Pearson Correccin por a continuidad Razn de verosimilitudes Estadstico exacto de Fisher N de casos vlidos
a. Calculado slo para una tabla de 2x2. b. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 201,94.
Medidas simtricas Valor ,121 ,121 ,120 1122 Sig. aproximada ,000 ,000 ,000
Medidas direccionales Valor ,000 ,000 ,000 Error tp. a asint. ,000 ,000 ,000 T aproximada .c . .
c b
Sig. aproximada .c . .
c
Lambda
Tau de Goodman
Universidad de Granada
62
Bibliografa Recomendada:
Aguilera del Pino, A. M. (2001). Tablas de Contingencia Bidimensionales. Ed La Muralla, S.A. Garca Leal, J., Lara Porras, A.M., Navarrete lvarez, E., Rico Castro, N., Romn Montoya, Y., Ruiz Castro, E. y Snchez Borrego, I.R. (2007). Tcnicas Estadsticas aplicadas en Biologa con SPSS. Editorial Proyecto Sur. Gutirrez Jimez, R., Gonzlez Carmona, A., Torres Ruiz, F y Gallardo Sansalvador, J.A. (1994). Tcnicas de Anlisis de datos Multivariable. Tratamiento computacional. Universidad de Granada. Lara Porras, A.M. (2001) Diseo Estadstico de Experimentos, Anlisis de la Varianza y Temas relacionados. Tratamiento Informtico mediante SPSS. Ed. Proyecto Sur. Lara Porras, A.M., Snchez Borrego, I.R., Ramos balos, E.M.Raya Miranda, R., Tarifa Blanco, J.A. y Alfonso Ux, A. (2008) Gua Interactiva de Autoaprendizaje de SPSS. versin 2.1 Ed. Proyecto Sur. Visauta Vinacua, B. (1998) Anlisis Estadstico con SPSS para Windows. Volumen II: Estadstica multivariante. McGraw-Hill. Visauta Vinacua, B. (2007) Anlisis Estadstico con SPSS 14. Estadstica Bsica. McGraw-Hill.
Bibliografa General:
Box, G.E.P., Hunter W.G. & Hunter J.S. (1988). Estadstica para Investigadores. Ed. Revert. Canavos, G.C. (1990). Probabilidad y Estadstica. Aplicaciones y Mtodos. Ed. McGraw-Hill. Ferrn Aranaz, M. (1996). SPSS para Windows. Programacin y Anlisis Estadstico. Serie McGraw-Hill de informtica. Garca Leal, J. y Lara Porras, A.M. (1998). Diseo Estadstico de Experimentos. Anlisis de la Varianza. Grupo Editorial Universitario. Lara Porras, A.M. (2010) Estadstica para Biologa y Ciencias Ambientales: Tratamiento Informtico mediante SPSS. Ed. Proyecto Sur. Lara Porras, A.M. y Romn Montoya, Yolanda (2010) Aprender Estadstica analizando datos: Mtodos multimedia. Ed. Proyecto Sur. Lizasoain, L. y Joaristi, L. (1998) SPSS para Windows. Ed Paraninfo. Ludwig, J.A. y Reynolds, J.F. (1988) Statistical Ecology. J. Willey & Sons. Martin Andrs, A., Luna del Castillo, J.D. (2004). Bioestadstica para las Ciencias de la Salud. Ed. Capitel. Mason, R.L., Gunst, R.F. y Hess, J.L. (1989), Statistical Design and Analysis of Experiments. J. Willey & Sons. Milton, J.S. (2007) Estadstica para Biologa y Ciencias de la Salud. Ed. McGraw-Hill. Ollero Hinojosa, J., Garca Leal, J., Lara Porras. A.M., Martnez Andrs, A., Rodrguez, C., Ramos, H. (1997) Diseo y Anlisis Estadstico de Experimentos. Grupo Editorial Universitario. Sharma, S. (1996) Applied Multivariate Techniques. Ed. J. Wiley & Sons.
Universidad de Granada