Sie sind auf Seite 1von 25

EJERCICIOS DE REGRESIN LINEAL SIMPLE Y REGRESIN MLTIPLE.

REGRESION LINEAL SIMPLE


1.- En un estudio de ingeniera del agua relacionado con las educciones de
los slidos suspendidos, en funcin de la demanda qumica de oxgeno
(DQO), se sac una muestra aleatoria, cuyos datos se dan en la tabla de
abajo.

(a) Graficar los datos e identificar la variable dependiente y la


independiente-
(b) Establecer el modelo de regresin ms apropiado para este problema.
(c) Validar el modelo de regresin seleccionado, objetivistamente, usando
los siguientes criterios o diagnsticos:
(1) Calcular el anlisis de varianza y clculo del coeficiente de
determinacin R2
(2) Clculo del coeficiente de determinacin ajustado, R 2ajustado
(3) El coeficiente de correlacin r.
(4) La estadstica PRESS
(5) El error estndar de lo estimado, s(b i) (Util para medir la utilidad del
modelo. Se selecciona el modelo que tenga el valor de s(b i) ms pequeo).

2.- Los datos de abajo muestran las emisiones de xidos de nitrgeno


(NOx) provenientes de calderas de plantas elctricas.
Tabla mostrando los datos para el problema

(a) Graficar los datos e identificar la variable dependiente y la


independiente-
(b) Establecer el modelo de regresin ms apropiado para este problema.
(c) Validar el modelo de regresin seleccionado, objetivistamente, usando
los siguientes criterios o diagnsticos:
(1) Calcular el anlisis de varianza y clculo del coeficiente de
determinacin R2
(2) Clculo del coeficiente de determinacin ajustado, R 2ajustado
(3) El coeficiente de correlacin r.
(4) La estadstica PRESS
(5) El error estndar de lo estimado, s(b i) (Util para medir la utilidad del
modelo. Se selecciona el modelo que tenga el valor de s(b i) ms pequeo).

3.- Este es un ejemplo del libro de Introduccin al Analisis de Regresin


Lineal de Mongomery et al. (2001), donde habla de un ejemplo relacionado
con las concentraciones de ozono de debido al calor. As, Davidson
(Update on Ozone Trenes in Californias South COSAT Basin, Air and
Waste, 43, 226, 1993) estudio las concentraciones de ozono en la cuenca
area de la costa sur de California, durante los aos 1976 a 1991. Se cree
que la cantidad de das en que las concentraciones de ozono fueron
mayores que 0.20 ppm depende del ndice meteorolgico estacional, que
es el promedio estacional de la temperatura con 850 milibares. La
siguiente informacin muestra los datos.
(a) Graficar los datos e identificar la variable dependiente y la
independiente-
(b) Establecer el modelo de regresin ms apropiado para este problema.
(c) Validar el modelo de regresin seleccionado, objetivistamente, usando
los siguientes criterios o diagnsticos:
(1) Calcular el anlisis de varianza y clculo del coeficiente de
determinacin R2
(2) Clculo del coeficiente de determinacin ajustado, R 2ajustado
(3) El coeficiente de correlacin r.
(4) La estadstica PRESS
(5) El error estndar de lo estimado, s(b i) (Util para medir la utilidad del
modelo. Se selecciona el modelo que tenga el valor de s(b i) ms pequeo).

4.- En un estudio agrcola, para ver los efectos de los cambios climticos
globales relacionado, con los patrones pluviales alterados debido al
calentamiento global, por las emisiones de CO 2, se estudi la precipitacin
pluvial anual y el rendimiento de la cosecha de gramneas. La tabla de
abajo da los datos.

(a) Graficar los datos e identificar la variable dependiente y la


independiente-
(b) Establecer el modelo de regresin ms apropiado para este problema.
(c) Validar el modelo de regresin seleccionado, objetivistamente, usando
los siguientes criterios o diagnsticos:
(1) Calcular el anlisis de varianza y clculo del coeficiente de
determinacin R2
(2) Clculo del coeficiente de determinacin ajustado, R 2ajustado
(3) El coeficiente de correlacin r.
(4) La estadstica PRESS
(5) El error estndar de lo estimado, s(b i) (Util para medir la utilidad del
modelo. Se selecciona el modelo que tenga el valor de s(b i) ms pequeo).

5.- El aluminio es el tercer elemento ms abundante que ocurre en


minerales, rocas y barros. El aluminio se puede analizar con el mtodo de
absorcin atmica espectromtrica (mtodo A), el cual est exento de
interferencias como fluoruros y fosfatos. El aluminio tambin se puede
analizar por medio del mtodo de calorimetra de cianuro de Eriocromo R
(mtodo B), el cual es ms simple que el anterior. La tabla de abajo
muestra los resultados de los anlisis (en mg/L) de los dos mtodos
usados.

(a) Graficar los datos e identificar la variable dependiente y la


independiente-
(b) Establecer el modelo de regresin ms apropiado para este problema.
(c) Validar el modelo de regresin seleccionado, objetivistamente, usando
los siguientes criterios o diagnsticos:
(1) Calcular el anlisis de varianza y clculo del coeficiente de
determinacin R2
(2) Clculo del coeficiente de determinacin ajustado, R 2ajustado
(3) El coeficiente de correlacin r.
(4) La estadstica PRESS
(5) El error estndar de lo estimado, s(b i) (Util para medir la utilidad del
modelo. Se selecciona el modelo que tenga el valor de s(b i) ms pequeo).

6.- El berilio (Be) y sus compuestos son extremadamente venenosos y


capaces de causar la muerte en concentraciones altas. La inhalacin del
Be causa una seria afeccin llamada beriliosis. El berilio tambin puede
causar dermatitis, conjuntivitis, neumona aguda y beriliosis pulmonar
crnica. Este elemento qumico se usa en los reactores atmicos, aviones,
cohetes y en combustibles para msiles. Hay dos mtodos para el anlisis
(en g/L) del berilio, es decir, el mtodo espectromtrico de absorcin
atmica (mtodo 1) y el mtodo aluminon (mtodo 2). Los resultados de
los anlisis de los dos mtodos se dan en la tabla de abajo.

(a) Graficar los datos e identificar la variable dependiente y la


independiente-
(b) Establecer el modelo de regresin ms apropiado para este problema.
(c) Validar el modelo de regresin seleccionado, objetivistamente, usando
los siguientes criterios o diagnsticos:
(1) Calcular el anlisis de varianza y clculo del coeficiente de
determinacin R2
(2) Clculo del coeficiente de determinacin ajustado, R 2ajustado
(3) El coeficiente de correlacin r.
(4) La estadstica PRESS
(5) El error estndar de lo estimado, s(b i) (Util para medir la utilidad del
modelo. Se selecciona el modelo que tenga el valor de s(b i) ms pequeo).

7.- En un estudio de meteorologa entre la cantidad de lluvia y la remocin


de contaminantes atmosfricos, se dio la siguiente informacin:

(a) Graficar los datos e identificar la variable dependiente y la


independiente-
(b) Establecer el modelo de regresin ms apropiado para este problema.
(c) Validar el modelo de regresin seleccionado, objetivistamente, usando
los siguientes criterios o diagnsticos:
(1) Calcular el anlisis de varianza y clculo del coeficiente de
determinacin R2
(2) Clculo del coeficiente de determinacin ajustado, R 2ajustado
(3) El coeficiente de correlacin r.
(4) La estadstica PRESS
(5) El error estndar de lo estimado, s(b i) (Util para medir la utilidad del
modelo. Se selecciona el modelo que tenga el valor de s(b i) ms pequeo).
8.- En un estudio para evaluar la capacidad de los sistemas de flujo
fretico (wetlands), usados para la degradacin de la materia orgnica de
las aguas residuales se us el parmetro de la demanda bioqumica de
oxgeno (DBO) y varios otros componentes qumicos. Este estudio dio
como resultado los siguientes datos. Estos resultados estn relacionados
con la carga de masa de DBO (en Kg./hectrea/da), la cual se us como
la variable independiente (X) y, la degradacin de la concentracin de
masa carbonosa de DBO5 (en Kg./ha/da), la cual se us como la variable
dependiente (Y). (Fuente de informacin es Surface Floor Wetlands: A
Performance Evaluation. Water Environ. Res., 1995, pp.244-247).

(a) Graficar los datos


(b) Establecer el modelo de regresin ms apropiado para este problema.
(c) Validar el modelo de regresin seleccionado, objetivistamente, usando
los siguientes criterios o diagnsticos:
(1) Calcular el anlisis de varianza y clculo del coeficiente de
determinacin R2
(2) Clculo del coeficiente de determinacin ajustado, R 2ajustado
(3) El coeficiente de correlacin r.
(4) La estadstica PRESS
(5) El error estndar de lo estimado, s(b i) (Util para medir la utilidad del
modelo. Se selecciona el modelo que tenga el valor de s(b i) ms pequeo).
(d) Una vez que se haya seleccionado el modelo ms apropiado, calcular
la remocin del DBO despus de que el agua residual se degrad en el
wetland cuando la carga fue de 50 Kg./ha/da.

9.- Se coleccion una muestra de 33 casos de una descarga de aguas


residuales municipales. Esta muestra se analiz para la demanda
bioqumica de oxgeno de 5 das (DBO 5), en libras por da, y la demanda
qumica de oxgeno, DQO (en libras por da). La tabla de abajo muestra la
informacin requerida.
Tabla mostrando las mediciones de DBO 5 y DQO.

(a) Ver s existe una correlacin significante usando los valores R del DBO 5
y el DQO.
Nota. La demanda bioqumica de oxgeno de 5 das (DBO 5) mide la
concentracin, en mg/L o en libras por da de la materia carbonosa del
agua residual. De hecho el DBO mide la fraccin biodegradable del
drenaje, o del agua residual industrial o domstica, en trminos del
carbono. Usualmente, las unidades son en mg/L. Sin embargo, esto se
debe a que, anteriormente, se usaba indiscriminadamente las unidades de
ppm y mg/L. Despus, se vio que, con los residuos txicos, la gravedad
especfica era diferente a la de los residuos carbonosos. Por esta razn es
mejor usar las unidades de mg/L. Por otra parte, la prueba del DBO es de
5 das, para evitar la nitrificacin. En cambio, la prueba de la demanda
qumica de oxgeno mide los compuestos orgnicos biodegradables y los
compuestos orgnicos txicos. Esto quiere decir que, la demanda qumica
de oxgeno (DQO) oxida la cantidad de materiales totales oxidables
presentes en el agua residual y vara con la composicin del agua, la
temperatura, el periodo de contacto y otros factores ms.
(a) Graficar los datos e identificar la variable dependiente y la
independiente-
(b) Establecer el modelo de regresin ms apropiado para este problema.
(c) Validar el modelo de regresin seleccionado, objetivistamente, usando
los siguientes criterios o diagnsticos:
(1) Calcular el anlisis de varianza y clculo del coeficiente de
determinacin R2
(2) Clculo del coeficiente de determinacin ajustado, R 2ajustado
(3) El coeficiente de correlacin r.
(4) La estadstica PRESS
(5) El error estndar de lo estimado, s(b i) (Util para medir la utilidad del
modelo. Se selecciona el modelo que tenga el valor de s(b i) ms pequeo).

10.- Los metales pesados como el Hg, Cr, Pb, etc., pueden interferir con el
tratamiento biolgico en las plantas municipales de aguas residuales
domsticas. En este estudio se hicieron mediciones mensuales en una
planta modelo de tratamiento de las concentraciones de cromo, Cr, en
mg/L, tanto en el efluente como en la entrada. Los resultados de las
concentraciones de Cr se dan en la tabla de abajo.
Tabla mostrando los datos.

(a) Graficar los datos e identificar la variable dependiente y la


independiente-
(b) Establecer el modelo de regresin ms apropiado para este problema.
(c) Validar el modelo de regresin seleccionado, objetivistamente, usando
los siguientes criterios o diagnsticos:
(1) Calcular el anlisis de varianza y clculo del coeficiente de
determinacin R2
(2) Clculo del coeficiente de determinacin ajustado, R 2ajustado
(3) El coeficiente de correlacin r.
(4) La estadstica PRESS
(5) El error estndar de lo estimado, s(b i) (Util para medir la utilidad del
modelo. Se selecciona el modelo que tenga el valor de s(b i) ms pequeo).
11.- En un estudio de microbiologa ambiental relacionado con el cultivo de
una muestra de agua se dan los siguientes datos.

Hacer los siguientes clculos:


(a) Trazar una curva Ln Yi versus Xi para ver qu tan bien se puede ajustar
una curva exponencial a los datos.
(b) Trazar una curva Yi versus Xi para ver que tambin se puede ajustar
una lnea recta a los datos.
(c) Por interpolacin, usando ambas grficas estimar el nmero de
bacterias despus de 20 das. Cuantificar las diferencias en ambos casos.

12.- En el libro de J. L Devore, Probabilidad y Estadstica para Ingeniera y


Ciencias se da una investigacin relacionada con la temperatura ( C) y la
o

profundidad de la nieve acumulada en el suelo. Para esto se la tabla de


abajo:
Tabla mostrando los datos del problema.

(a) Identificar la variable dependiente (Y) y la variable independiente (X).


(b) Estimar un modelo de regresin lineal. (Y = 5.71 0.202(X), R2 = 0.741,
s = 3.759, PRESS = 409.02, F = 17.8, p = 0.006)
(c) Estimar un modelo cuadrtico. (Y = 3.3 0.0943(X) + 0.0029(X 2), s =
0.019, R2 = 0.996, PRESS = 0.0038, F = 14.98, p = .008)
(d) Estimar un modelo cbico. (Y = 9.96 0.139(X) + 0.0189(X 2) +
0.00022(X 3), R = 0.914, s = 2.656, PRESS = 8007.75, F = 14.14, p = 0.14)
2

(e) De acuerdo a los resultados estadsticos, Cul de los tres modelos es


superior?
13.- La tasa de flujo en m /min en un muestreador de alto volumen para
3

medir la calidad del aire, es decir, para partculas atmosfricas, depende


de la cada de presin, en pulgadas de agua, a travs del filtro del
muestreador. Siendo as, supngase que se coleccion una muestra de 15
valores de cada de presin y la tasa de flujo del aire a travs del filtro del
sensor. Los datos se dan en la tabla de abajo.

(a) Calcular el modelo de regresin muestral que estime a la verdadera


lnea poblacional. Para esto, identificar, primeramente, la variable
dependiente y la variable regresora. (Y = 1.95 0.0364 (X))
(b) Validar el modelo de regresin estimado en (a) usando enfoques
subjetivos, es decir, a travs de grficas con residuos estandarizados
versus valores de cada de presin. Tambin hacer otra grfica de residuos
estandarizados versus los renglones.
Hacer otra grfica ms con los valores residuales versus los valores de z
para la prueba de normalidad.
(c) Complementar la validacin del modelo de regresin usando mtodos
estadsticos objetivistas. Para esto, estimar el coeficiente de determinacin
R2, el error estndar de lo estimado. Usar el programa SAS para estos
clculos. (R2 = 76.0%, s = 0.1869, PRESS = 0.7405)
14.- En un estudio de laboratorio para ver la relacin entre los slidos
suspendidos y las concentraciones de DBO se sac una muestra con los
datos que se muestran en la tabla de abajo.

(a) Hacer una grfica que vaya en funcin de la variable dependiente y de


la variable independiente.
(b) Obtener el modelo de la ecuacin de regresin y trazarla en la grfica.
(Slidos suspendidos Y = 0.32 + 0.352 (X)
(c) Validar el modelo de regresin objetivamente, calculando el coeficiente
de determinaron R , s y PRESS. (R = 0.962, s = 0.957, s = 1.85, PRESS =
2 2

42.38)
(d) Hacer una tabla de ANOVA que incluya el valor de F y p.

15.- Treinta casos del efluente de una planta de tratamiento se analizaron


para el DBO y el DQO. Los datos se muestran en la tabla de abajo.

(a) Determinar R y R. (R = 0.9350, R = 0.967)


2 2

(b) Graficar los datos en papel de probabilidad y determinar lo siguiente:


(1) Determinar los valores de DBO y el DQO que excedern el 50% y el
90% de las veces. (195 lbs/Da y 440 lbs/Da)
(2) Determinar los valores de DBO y del DQO que se lograrn el 90% de
las veces.
(3) Determinar los valores de DBO y del DQO que puedan ser excedidos el
10% de las veces. (260 lbs/Da y 580 lbs/Da)
(4) Calcular el promedio y la desviacin estndar del DBO y del DQO.
REGRESION POLINOMIAL
16.- En un artculo del J. Agricultural Eng. Research, 1975 (p. 353-361) se
reportan los datos con el nmero de das despus de la floracin (x), el
rendimiento de la cosecha, en Kg./ha (y). (Devore, 2001). La tabla de abajo
muestra los datos.

Hacer los siguientes clculos:


(a) Hacer una grfica que vaya en funcin de (y) y de los das de floracin
(x).
(b) Ajustar el modelo de regresin ms apropiado.
(c) Hacer una relacin de los clculos de los coeficientes de la desviacin
estndar y de una tabla de anlisis de varianza.
(d) Estimar el valor del coeficiente de determinacin mltiple R .
2

(e) Hacer una prueba de hiptesis H o:2 = 0 versus H1:2 0. Hacer otra
prueba ms con Ho:1 = 0 versus H1:1 0.

17.- El libro Statistics for Management and Economics de Keller et al.


(1990) da un ejemplo, para determinar el modelo de regresin ms
apropiado. Para esto, se saca una muestra de 25 reas (casos). Cada
rea consiste en, aproximadamente, 5,000 viviendas. Se registra la
ganancia anual total de las ventas, el ingreso promedio anual de las
viviendas y la edad promedio de los nios de este problema.
Hacer los siguientes clculos:
(a) Probar un modelo de regresin cuadrtico, con interaccin. En este
caso, lo llamaremos modelo superior o modelo completo.
(b) Despus, probar un modelo de regresin cuadrtico, sin interaccin. El
este caso, lo llamaremos modelo abreviado.
(c) Finalmente, probar un modelo de regresin lineal mltiple, sin
interaccin. Este modelo, lo llamaremos modelo lineal simple.
(d) Describir las ecuaciones de los modelos de regresin poblacionales de
los incisos (a), (b) y (c).
(e) Para decidir cual modelo es mejor, hacer una tabla con los resultados
de los tres modelos, basndose en los diagnsticos objetivistas como las
estadsticas R , R2ajustada, s, PRESS, ANOVA.
2

(f) Hacer una prueba de hiptesis para ver si el efecto de interaccin es


viable. Adems seleccionar el modelo de regresin ms apropiado.
(a) Primero, se prueba el modelo de regresin polinomial cuadrtico, con
interaccin, es decir, el modelo completo.
(y) = -1135 + 173(X1) + 23.6(X2) 3.73(X21) 3.8(X22) + 1.97(X1X2)
(b) Enseguida se prueba el modelo de regresin cuadrtico, sin
interaccin, es decir, el modelo abreviado. (y) = -1558 + 198(X1) + 70.8(X2) 3.98(X21)
4.12(X22)
(c) Finalmente, se prueba el modelo de regresin lineal sin interaccin, es
decir, el modelo simple. (y) = 668 + 11.4(X1) + 16.8(X2)
(d) La descripcin de los tres modelos poblacionales, a estimarse, por los
modelos de regresin estadstica son:
1. El modelo cuadrtico con interaccin o completo es:
y = o + 1x1 + 2 x2 + 3 x21 + 4 x22 + 5 x1x2 +
2. El modelo cuadrtico sin interaccin o abreviado es:
y = o + 1x1 + 2 x2 + 3 x21 + 4 x22 +
3. El modelo de regresin lineal mltiple es:
y = o + 1x1 + 2 x2 +
(e) El resumen de los resultados de los tres modelos se da en la tabla de
abajo.

18.- En un estudio de seguridad para los motoristas en las carreteras


estatales, se sabe que el nmero de accidentes automovilsticos, en cierta
parte de de una carretera, est relacionado con el nmero de vehculos y
la velocidad de stos. Para esto, al encargado de este estudio se le piden
los promedios de las estadsticas de los ltimos 10 aos, con el objeto de
establecer un modelo de regresin para predecir el nmero de accidentes.
Siendo as, se decide poner como variable dependiente el nmero de
accidentes (Y). Adems, como variables independientes se ponen el
nmero de vehculos que pasan por el trecho (x 1) y, la velocidad promedio
a que viajan (millas por hora), como (x 2). Se decide probar cuatro modelos
de regresin, es decir, uno lineal mltiple sin interaccin y otro con
interaccin. Para el otro modelo probado se decide por uno cuadrtico, con
y sin interaccin. Todo esto se hace para ver cul de los modelos encaja
mejor en los datos. Hacer los siguientes clculos:
(a) Calcular los valores de R , R2ajustada, s, PRESS, F y el valor de p para
2

cada uno de los modelos probados.


(b) Hacer un resumen de los resultados de los 4 modelos de regresin
probados y decidir cul sistema es superior. Tabla mostrando los
promedios anuales del nmero de accidentes, en funcin del nmero de
vehculos y la velocidad (millas por hora) en que viajan.
a) Efectuar el Modelo lineal sin interaccin, Modelo lineal con
interaccin, Modelo cuadrtico sin interaccin, Modelo cuadrtico con
interaccin.

19.- En una investigacin cientfica agrcola, se estudi, en 10 pruebas, los


efectos de la humedad de la tierra (x i en pulgadas) y la temperatura (x 2 en
C) en funcin del rendimiento (en fanegas), de cierta variedad de plantas
o

gramneas (Y). Los datos se dan abajo.

El ingeniero agrnomo investigador espera un modelo de la forma:


yi = o + 1xi1 + 2xi2 + 11x2i1 + 22x2i2 + 12xi1xi2 +
(a) Graficar los valores de yi contra los valores ajustados.
(b) Calcular R .
2

(c) Calcular el valor de F y p.


(d) Estimar el rendimiento promedio (en fanegas), cuando la humedad es
igual a 8 y cuando la temperatura es igual 22 grados Celsius.
(e) Se pudiera eliminar el trmino de interaccin, sin menoscabar la
eficiencia del modelo de regresin, que espera el ingeniero agrnomo?

20.- Este problema est relacionado con una informacin de datos de un


experimento relacionado entre el pH (X) y la conductividad elctrica (Y).
Los datos se dan en la tabla de abajo, decidir si el modelo de regresin
ms apropiado es un modelo de cuadrtico o un modelo de regresin
cbico.

21.- Se da la tabla de abajo con datos relacionados con las


concentraciones de monxido de carbono (CO) emitidas por motores de
combustin interna. Sin embargo, se argumenta que, el aparato analizador
que muestreaba el CO, pudo haber tenido fallas durante el muestreo de
CO debido a que se notaron valores fuera de lo normal. Para verificar si en
verdad hubo valores atpicos en las concentraciones de CO, se requiere
saber, cules fueron los valores extremos. Para tales fines usar diagramas
de caja que identifiquen valores atpicos extremos. Para esto se da la tabla
de abajo.

Correr un modelo de regresin, es decir, asumiendo un modelo de


regresin cuadrtico, con los valores originales y, otro ms, con los valores
extremos eliminados. Hay un mejoramiento significante en el modelo
corregido, es decir, de acuerdo a los valores de R , R2ajustada, s y PRESS,
2
de cada uno de los dos modelos de regresin cuadrticos, esto es,
incluyendo y excluyendo los valores atpicos extremos? (Tal parece que si
hay un mejoramiento significante con el modelo de regresin cuadrtico,
que no incluye los valores extremos. Bajo estas condiciones, los valores de
los diagnsticos estadsticos, para el modelo de regresin, sin los valores
atpicos extremos son: R = 98,4%, R2ajustada = 98.2%, s = 2.51, PRESS =
2

135.74. En contraste, para el modelo de regresin cuadrtico, que incluye


todos los valores atpicos extremos, los valores de los diagnsticos
estadsticos son: R = 93.6, R2ajustada = 92.8%, s = 6.26 y PRESS = 949.77)
2

REGRESION LINEAL MLTIPLE.


22.- En la adsorcin de tierra y sedimento, la magnitud de la acumulacin
en forma condensada de los productos qumicos en la superficie es una
caracterstica importante que influye en la eficiencia de insecticidas y
varios otros productos qumicos. El artculo Adsorption of Phosphate,
Arsenate, Methanearsonate and Cacodylate by Lake and Stream
Sediments: Comparison with Soils (J. of Environ. Qual., 1984, pp. 499-
504) presenta los siguientes datos en la tabla de abajo. Aqu se toma Y
como la variable dependiente, la cual denota el ndice de adsorcin de
fosfato, X1 es una de las variables independientes denotando la cantidad
de hierro extrable y, X2 es otra de las variables independientes denotando
la cantidad de aluminio extrable. (Devore, 2000)
Y = -7.351 + (0.11273)(X1) + (0.34900)(X2)
a) Comprobar el modelo precedente con cualquier software estadstico.
b) Calcular el ANOVA, Coeficiente de determinacin
c) Interprete los resultados del modelo.

23.- Este es un ejemplo del libro Applied Statistics: Anlisis of Variance


and Regresion de los autores Dunn y Clark. Esta es una investigacin
relacionada con la temperatura, tomada como la variable de respuesta, en
funcin de variables regresoras como la altitud, longitud y latitud. La tabla
de abajo muestra los resultados.
(a) Encontrar el modelo de regresin ms apropiado
(b) Validar el modelo usando metodos estadsticos, es decir, estimando el
coeficiente de determinacin mltiple R , R2 ajustada, s, PRESS, tabla de
2

ANOVA, y grficas subjetivistas, como residuos versus rdenes, residuos


versus valores ajustados y pruebas de normalidad.
(c) Hacer comentarios acerca de los resultados.
Tabla mostrando los valores de la temperatura en oF (Y), Altitud en pies
(X1), Longitud en grados (X2) y Latitud en grados (X3).
24.- Se hace un estudio sobre la concentracin de cadmio atmosfrico, en
ppm, yi y su relacin con Xi = la altura de los muestreadores y X2 =
distancia de la fuente emisora. La tabla de abajo muestra los datos. Hacer
los siguientes clculos:
(a) Ajustar el modelo de regresin que pueda ajustar a los datos del
problema de la concentracin de Cd. (Y = 350.99 1.27X1 0.154X2)
(b) Validar el modelo usando enfoques de diagnstico de estadstica de
inferencia.
(c) Usar el modelo de regresin lineal mltiple para predecir el la
concentracin de cadmio, cuando la altura del muestreador es de X1 = 25
metros y la distancia de la fuente emisora, es X2 = 851 metros. (188.2 ppm
de Cd)
La tabla de abajo muestra los datos requeridos por este problema.

25.- El libro de Jay L. Devore intitulado Probabilidad y Estadstica para


Ingeniera y Ciencias discute el diseo eficiente de ciertos incineradores de
desperdicios municipales, los cuales requieren de informacin acerca del
contenido energtico de los desperdicios. Acordemente, los autores del
artculo Modelling the Energy Content of Municipal Solid Waste Using
Multiple Regression Techniques (J. of the Air and Waste Mgmt. Assoc.,
1996, pp. 650-656) proporcionaron los siguientes datos acerca de Y =
contenido energtico (Kcal/Kg.), en funcin de regresores % de plsticos
en peso, % de papel en peso, % de basura en peso y % de humedad de
peso. Tabla mostrando los datos de este problema.

(a) Obtener el modelo de regresin y validarlo el modelo.


(b) Calcular ANOVA, coeficiente de determinacin e interpretar los
resultados.

26.- Treinta muestras del efluente de una planta de tratamiento se


analizaron para la medicin del DBO5 y la demanda bioqumica de oxgeno
(DQO). Los datos se muestran en la tabla de abajo. Hacer lo siguiente:
(a) Calcular el promedio, s y el error estndar del DBO y del DQO. ( X DBO =
440.6, s = 93.18, error estndar = 17.01; X DQO = 194.4, s = 45.3, error
estndar = 8.27)
(b) Graficar los datos en papel de probabilidad.
(c) Determinar el DBO5 y el DQO que se exceder el 50% de las veces. (El
DBO5 exceder 195 lbs/da el 50% de las veces. El DQO exceder 440
lbs/da el 50% del tiempo).
(d) Determinar el DBO5 y el DQO que se exceder el 90% del tiempo.

27.- El director de la oficina de personal de una firma constructora desea


saber si la destreza, en determinado tipo de trabajo, dentro de la empresa,
puede ser pronosticada usando como pronosticadores las variables edad y
experiencia de los empleados. La tabla de abajo da la informacin de una
muestra aleatoria de 15 empleados. (Adaptacin del libro Business
Statistics de Daniel et al. 1989, p. 577).

Hacer los siguientes clculos:


(a) Encontrar la ecuacin de regresin de los cuadrados mnimos.
(b) Computar R2y.12.
(c) Probar Ho:1 = 0 y Ho:2 = 0. Dejar que = 0.05 y calcular el valor de p
para cada prueba.
(d) Computar el 95% de intervalo de confianza para 2.
(e) Dejar que x1 = 2 y x2 = 25 y calcular y.
(f) Encontrar el intervalo de 95% para y.

28.- Este es un problema adaptado del libro Introduccin al Anlisis de


Regresin Lineal de los autores Montgomery, Peck y Vining (2001). Este
proyecto est relacionado con un estudio de energa solar en el
Tecnolgico de Georgia, Estados Unidos. El proyecto involucra datos de
pruebas de energa trmica con una variable dependiente (y), que
relaciona al flujo total de calor (Kwatts) y cinco variables independientes
que estn relacionadas con la insolacin (watts/m 2), la posicin del foco en
direccin del este (en pulgadas), la posicin del foco en direccin del sur
(en pulgadas), la posicin del foco en direccin norte (en pulgadas) y la
hora del da. Para esto, estimar los siguientes enunciados:
(a) Probar el modelo de regresin que mejor ajuste a los datos.
(b) Evaluar el modelo de regresin seleccionado, es decir, a travs de
criterios estadsticos y complementar la decisin usando grficos
subjetivistas.
La tabla de abajo muestra la informacin requerida para solucin todos los
enunciados requeridos por este problema.
29.- En una investigacin relacionada con la contaminacin del aire por el
ozono, a nivel del suelo, se sac una muestra de 5 aos (1999-2003)
procedente de una estacin muestreadora localizada en el Parque
Chamizal en El Paso, Texas. El mantenimiento y calibracin de los
aparatos de esta estacin muestreadora fue hecha por la E. P. A. de Los
Estados Unidos. El estudio consisti en el procesamiento estadstico de
variables, como el ozono (O3), el monxido de nitrgeno (NO), el bixido
de nitrgeno (NO2) y la temperatura en grados Fahrenheit ( oF). Esto se
hizo con el objeto de obtener un modelo de regresin estadstico para fines
de prediccin. El procedimiento consisti en sacar los promedios (de los
valores espacio-temporales de una hora), de cada una de las 4 variables
independientes de cada una de las 24 horas del da de cada mes de cada
uno de los 5 aos. Aproximadamente, se procesaron 178,560 datos (24
horas x 31 das x 12 meses x 5 aos x 4 variables). Los promedios de los
promedios, en partes por billn (ppb) se dan abajo. Hacer los siguientes
clculos:
(a) Graficar los datos para ver el tipo de la funcin grfica que se pueda
esperar.
Sugerencia: Usar el paquete de computadora Excel.
(b) Para obtener el mejor candidato del modelo de regresin usar un
software estadstico (SAS, MINITAB, R, otro) Stepwise Regresin
(regresin por pasos). Evaluar la utilidad del modelo usando los criterios
R , s, Cp y PRESS y los criterios subjetivos (grficas de residuales y
2

prueba de normalidad).
(c) Usando el modelo de regresin seleccionado, para el mes de julio,
predecir la concentracin de ozono, si la concentracin de NO es igual a
4.0 ppb, NO2 igual a 11.8 ppb, y la temperatura es de 23.5 oC.

Das könnte Ihnen auch gefallen