Sie sind auf Seite 1von 7

EJERCICIOS REGRESION Y CORRELACION LINEAL 1.

El nmero de espaoles (en millones) ocupados en la agricultura, para los aos que se indican, era: Ao 1980 1982 1984 1986 1988 1990 1992 1994 2,04 1,96 1,74 1,69 1,49 1,25 1,16 Ocupados 2,1

a) Explicar su evolucin mediante una recta de regresin?

b) Cul es el porcentaje de correlacin? El porcentaje de correlacin es -0.986


Anlisis de regresin: OCUPADOS vs. AO
La ecuacin de regresin es OCUPADOS = 143 - 0.0714 AO Predictor Constante AO Coef 143.489 -0.071369 SE Coef 9.650 0.004856 T 14.87 -14.70 P 0.000 0.000

S = 0.0629452

R-cuad. = 97.3%

R-cuad.(ajustado) = 96.8%

Anlisis de varianza Fuente Regresin Error residual Total GL 1 6 7 SC 0.85571 0.02377 0.87949 CM 0.85571 0.00396 F 215.97 P 0.000

Correlaciones: AO, OCUPADOS


Correlacin de Pearson de AO y OCUPADOS = -0.986 Valor P = 0.000

2. Asocia las rectas de regresin y = x +16, y = 2x 12, y = 0,5x + 5 a las nubes de puntos siguientes:

y = x +16 --- = - 8 + 16 = 8 y = -16 + 16 = 0 Esta recta en la nube c y = 2x 12 --- = 16 12 = 4 y = 32 12 = 20 Esta recta en la nube b y = 0,5x + 5 --- = 4 + 5 = 9 y 8 + 5 = 13 Esta recta en la nube a 3. Asigna los coeficientes de correlacin lineal r = 0,4, r = 0,85 y r = 0,7, a las nubes del problema anterior. 4. a) Calcula la recta de regresin de Y sobre X en la distribucin: X Y 10 7 2 4 5 6 3 8 0 10

b) Cul es el valor que correspondera segn dicha recta a X = 7? Y=4.304

Anlisis de regresin: y vs. x


La ecuacin de regresin es y = 10.1 - 0.828 x Predictor Constante x Coef 10.1379 -0.82759 SE Coef 0.2409 0.03982 T 42.09 -20.78 P 0.000 0.000

S = 0.303239

R-cuad. = 99.3%

R-cuad.(ajustado) = 99.1%

Anlisis de varianza Fuente Regresin Error residual Total GL 1 3 4 SC 39.724 0.276 40.000 CM 39.724 0.092 F 432.00 P 0.000

5. El nmero de bacterias por unidad de volumen, presentes en un cultivo despus de un cierto nmero de horas, viene expresado en la siguiente tabla: X: N de horas Y: N de bacterias 0 1 2 3 4 5

12 19 23 34 56 62

Calcula: a) Las medias y desviaciones tpicas de las variables, nmero de horas y nmero de bacterias. La media de las horas es de 2.5 y la desviacin tpica es de 1.7 La media de las bacterias es de 34.3 y la desviacin tpica es de 18.69 b) La covarianza de la variable bidimensional. Es de 31 c) El coeficiente de correlacin e interpretacin. Es de 0,97 d) La recta de regresin de Y sobre X. La ecuacin es Y= 7.762 + 10.63 X

Anlisis de regresin: bacterias vs. horas


La ecuacin de regresin es bacterias = 7.762 + 10.63 horas S = 5.48678 R-cuad. = 94.3% R-cuad.(ajustado) = 92.8%

Anlisis de varianza Fuente Regresin Error Total GL 1 4 5 SC 1976.91 120.42 2097.33 CM 1976.91 30.10 F 65.67 P 0.001

6. La tabla siguiente muestra las notas obtenidas por 8 alumnos en un examen, las horas de estudio dedicadas a su preparacin y las horas que vieron la televisin los das previos al examen. Nota (Y) Horas de estudio (X1) Horas de TV (X2) 5 7 7 6 6 7 2 3 4 5 8 8 3 4 9 9 14 5 10 9 10 5

11 9

a) Representa grficamente las ecuaciones de regresin correspondientes a notaestudio y nota-TV Nota Estudio Nota TV

Anlisis de regresin: notay vs. estudiox1


La ecuacin de regresin es notay = 0.7961 + 0.6064 estudiox1 S = 0.727679 R-cuad. = 89.0% R-cuad.(ajustado) = 87.2%

Anlisis de varianza Fuente Regresin Error Total GL 1 6 7 SC 25.6979 3.1771 28.8750 CM 25.6979 0.5295 F 48.53 P 0.000

Anlisis de regresin: notay vs. tvX2


La ecuacin de regresin es notay = 9.460 - 0.5515 tvX2 S = 1.16868 R-cuad. = 71.6% R-cuad.(ajustado) = 66.9%

Anlisis de varianza Fuente Regresin Error Total GL 1 6 7 SC 20.6801 8.1949 28.8750 CM 20.6801 1.3658 F 15.14 P 0.008

b) En qu caso la correlacin es ms fuerte? En el de notas - estudio

7. Con los mismos datos, estima para un alumno que sac un 2 en el examen:
Anlisis de regresin: tvX2 vs. notay
La ecuacin de regresin es tvX2 = 14.13 - 1.299 notay S = 1.79345 R-cuad. = 71.6% R-cuad.(ajustado) = 66.9%

Anlisis de varianza Fuente Regresin Error Total GL 1 6 7 SC 48.7013 19.2987 68.0000 CM 48.7013 3.2165 F 15.14 P 0.008

a) Las horas que estudi. 2.689 hrs b) Las horas que vio la TV. 11.532 hrs

EJERCICIOS DE ANOVA 8. Realizar el Anlisis de Varianza (ANOVA) de las siguientes 3 tablas por separado: a) Calcular Fo vs F tablas y realizar el contraste de las Hiptesis. b) Describe una conclusin.
alumnos Carlos Carlos Carlos Carlos Lucas Lucas Lucas Lucas Manuel Manuel Manuel Manuel Luis Luis Luis Luis Pablo Pablo Pablo Pablo respuesta 3.1 7.5 2.5 5.1 3.4 7.8 2.7 5.5 3.3 6.9 2.5 5.4 3.6 7.8 2.4 4.8 3.8 8.1 2.8 5.3 materia Estadstica Estadstica Matemticas Matemticas Estadstica Estadstica Matemticas Matemticas Estadstica Estadstica Matemticas Matemticas Estadstica Estadstica Matemticas Matemticas Estadstica Estadstica Matemticas Matemticas respuesta 3.1 7.5 2.5 5.1 3.4 7.8 2.7 5.5 3.3 6.9 2.5 5.4 3.6 7.8 2.4 4.8 3.8 8.1 2.8 5.3 Modelo Nuevo Anterior Nuevo Anterior Nuevo Anterior Nuevo Anterior Nuevo Anterior Nuevo Anterior Nuevo Anterior Nuevo Anterior Nuevo Anterior Nuevo Anterior respuesta 3.1 7.5 2.5 5.1 3.4 7.8 2.7 5.5 3.3 6.9 2.5 5.4 3.6 7.8 2.4 4.8 3.8 8.1 2.8 5.3

En la tabla de alumnos respuesta Se acepta F0 = 0.03 porque es menor que F = 3.056 de tablas Se aceptan porque no estn siendo afectadas las respuestas por los factores Si el valor P valua es mayor que el nivel de significancia se acepta H0 en este caso es mayor por lo cual se acepta pues P valua = 0.998 En la tabla de materia respuesta Se acepta F0 = 3.82 porque es menor que F = 4.414 de tablas Se aceptan porque no estn siendo muy afectadas las respuestas por los factores solo un poco el de matemticas Si el valor P valua es mayor que el nivel de significancia se acepta H0 en este caso es mayor por lo cual se acepta pues P valua = 0.066 En la tabla de modelo respuesta Se rechaza F0 = 58.84 porque es mayor que F = 4.414 de tablas Se rechaza porque estn siendo muy afectadas las respuestas por el factor nuevo Si el valor P valua es mayor que el nivel de significancia se acepta H0 en este caso es mayor por lo cual se rechaza pues P valua = 0.000

ANOVA unidireccional: respuesta vs. alumnos


Fuente alumnos Error Total GL 4 15 19 SC 0.67 75.26 75.93 CM 0.17 5.02 F 0.03 P 0.998

S = 2.240

R-cuad. = 0.88%

R-cuad.(ajustado) = 0.00% ICs de 95% individuales para la media basados en Desv.Est. agrupada ------+---------+---------+---------+--(---------------*---------------) (---------------*---------------) (---------------*---------------) (---------------*---------------) (---------------*---------------) ------+---------+---------+---------+--3.0 4.5 6.0 7.5

Nivel Carlos Lucas Luis Manuel Pablo

N 4 4 4 4 4

Media 4.550 4.850 4.650 4.525 5.000

Desv.Est. 2.259 2.299 2.317 2.001 2.308

Desv.Est. agrupada = 2.240

ANOVA unidireccional: respuesta vs. materia


Fuente materia Error Total GL 1 18 19 SC 13.28 62.64 75.93 CM 13.28 3.48 F 3.82 P 0.066

S = 1.865

R-cuad. = 17.50%

R-cuad.(ajustado) = 12.91% ICs de 95% individuales para la media basados en Desv.Est. agrupada --------+---------+---------+---------+(---------*---------) (----------*---------) --------+---------+---------+---------+3.6 4.8 6.0 7.2

Nivel Estadstica Matemticas

N 10 10

Media 5.530 3.900

Desv.Est. 2.231 1.408

Desv.Est. agrupada = 1.865

ANOVA unidireccional: respuesta vs. modelo


Fuente modelo Error Total GL 1 18 19 SC 58.140 17.785 75.925 CM 58.140 0.988 F 58.84 P 0.000

S = 0.9940

R-cuad. = 76.58%

R-cuad.(ajustado) = 75.27% ICs de 95% individuales para la media basados en Desv.Est. agrupada +---------+---------+---------+--------(----*-----) (----*-----) +---------+---------+---------+--------2.4 3.6 4.8 6.0

Nivel Anterior Nuevo

N 10 10

Media 6.4200 3.0100

Desv.Est. 1.3139 0.4999

Desv.Est. agrupada = 0.9940

Das könnte Ihnen auch gefallen