Sie sind auf Seite 1von 26

Nombre: Camila Andrea Moreno Mora

Código: 20191375047

Nombre: Carlos Eduardo Restrepo Londoño


Código: 20191375011

EJERCICIOS EN R

1. Se están considerando seis máquinas diferentes para la fabricación de


sellos de goma y se están comparando con respecto a la resistencia a la
tensión del producto. Se utiliza una muestra aleatoria de cuatro sellos
hechos con cada máquina para determinar si la resistencia media a la
tensión varía de una máquina a otra. A continuación, se presentan las
medidas de la resistencia a la tensión en kilogramos por centímetro
cuadrado × 10-1:

Máquinas
1 2 3 4 5 6
17.5 16.4 20.3 14.6 17.5 18.3
16.9 19.2 15.7 16.7 19.2 16.2
15.8 17.7 17.8 20.8 16.5 17.5
18.6 15.4 19.8 18.9 20.5 20.1

Realice el análisis de varianza a un nivel de significancia de 0.05 e indique si la


resistencia promedio a la tensión de las seis máquinas difiere o no de manera
significativa.

CÓDIGO EN R

resistencia<-
c(17.5,16.9,15.8,18.6,16.4,19.2,17.7,15.4,20.3,15.7,17.8,18.9,14.6,16.7,20.8,18.9,
17.5,19.2,16.5,20.5,18.3,16.2,17.5,20.1)
máquinas<- as.factor(c(rep(c("1", "2", "3", "4","5","6"), each =4)))
boxplot(resistencia ~ máquinas, col = c("yellow", "blue",
"white","green","purple","red"), ylab = "Resistencia a la tensión del producto")
21
20
Resistencia a la tensión del producto

19
18
17
16
15

1 2 3 4 5 6

máquinas

tapply(resistencia,máquinas, mean)

fm=aov(lm(resistencia~máquinas))
fm
resu<-summary(fm)
resu

names(fm)
fm

intervals=TukeyHSD(fm)
intervals
plot(intervals)

95% family-wise confidence level

2-1
4-1
6-1
4-2
6-2
5-3
5-4
6-5

-4 -2 0 2 4

Differences in mean levels of máquinas

plot(fm$residuals)
3
2
1
fm$residuals

0
-1
-2
-3

5 10 15 20

Index
summary(fm$residuals)

boxplot(fm$residuals)

3
2
1
0
-1
-2
-3

hist(fm$residuals)

Histogram of fm$residuals
5
4
3
Frequency

2
1
0

-4 -2 0 2 4

fm$residuals
qqnorm(fm$residuals)
Normal Q-Q Plot

3
2
1
Sample Quantiles

0
-1
-2
-3

-2 -1 0 1 2

Theoretical Quantiles

qqline(fm$residuals)

Normal Q-Q Plot


3
2
1
Sample Quantiles

0
-1
-2
-3

-2 -1 0 1 2

Theoretical Quantiles
shapiro.test(fm$residuals)

boxplot(fm$residuals~máquinas,col=c("yellow", "blue",
"white","green","purple","red"))
3
2
1
fm$residuals

0
-1
-2
-3

1 2 3 4 5 6

máquinas

desviaciones<-tapply(fm$residuals,máquinas, sd)
desviaciones
2. Los datos que se presentan en la siguiente tabla representan el número de
horas de alivio proporcionadas por cinco marcas diferentes de tabletas para
el dolor de cabeza administradas a 25 sujetos que tenían fiebre de 38ºC o
más. Realice el análisis de varianza y, a un nivel de significancia de 0.05,
pruebe la hipótesis de que las cinco marcas proporcionan el mismo número
medio de horas de alivio. Analice los resultados.

Tabletas
A B C D E
5.2 9.1 3.2 2.4 7.1
4.7 7.1 5.8 3.4 6.6
8.1 8.2 2.2 4.1 9.3
6.2 6.0 3.1 1.0 4.2
3.0 9.1 7.2 4.0 7.6

CÓDIGO EN R
horasdealivio<-
c(5.2,4.7,8.1,6.2,3.0,9.1,7.1,8.2,6.0,9.1,3.2,5.8,2.2,3.1,7.2,2.4,3.4,4.1,1.0,4.
0,7.1,6.6,9.3,4.2,7.6)
tabletas<- as.factor(c(rep(c("A", "B", "C", "D","E"), each =5)))
boxplot(horasdealivio ~ tabletas, col = c("yellow", "blue",
"white","green","purple"), ylab = "Horas de alivio del dólor de cabeza")

tapply(horasdealivio,tabletas, mean)
8
Horas de alivio del dólor de cabeza

6
4
2

A B C D E

tabletas fm=aov(lm(horasdealivio~tabletas))
fm

resu<-summary(fm)
resu

names(fm)
fm

intervals=TukeyHSD(fm)
intervals
plot(intervals)

95% family-wise confidence level


B-A
C-A
D-A
E-A
C-B
D-B
E-B
D-C
E-C
E-D

-5 0 5

Differences in mean levels of tabletas


plot(fm$residuals)

3
2
1
fm$residuals

0
-1
-2

5 10 15 20 25

Index

summary(fm$residuals)

boxplot(fm$residuals)
3
2
1
0
-1
-2
hist(fm$residuals)

Histogram of fm$residuals

5
4
3
Frequency

2
1
0

-3 -2 -1 0 1 2 3

fm$residuals

qqnorm(fm$residuals)

Normal Q-Q Plot


3
2
1
Sample Quantiles

0
-1
-2

-2 -1 0 1 2

Theoretical Quantiles
qqline(fm$residuals)
Normal Q-Q Plot

3
2
1
Sample Quantiles

0
-1
-2

-2 -1 0 1 2

Theoretical Quantiles

shapiro.test(fm$residuals)

boxplot(fm$residuals~tabletas,col=c("yellow", "blue",
"white","green","purple","red"))
3
2
1
fm$residuals

0
-1
-2

A B C D E

tabletas
desviaciones<-tapply(fm$residuals,tabletas, sd)
desviaciones

EJERCICIOS DE REGRESIÓN LINEAL

3. Se llevó a cabo un conjunto de ensayos experimentales con un horno para


determinar una forma de predecir el tiempo de cocción, y, a diferentes
niveles de ancho del horno, x 1, y a diferentes temperaturas, x 2,. Se
registraron los siguientes datos:

y x1 x2
6.40 1.32 1.15
15.05 2.69 3.40
18.75 3.56 4.10
30.25 4.41 8.75
44.85 5.35 14.82
48.94 6.2 15.15
51.55 7.12 15.32
61.5 8.87 18.18
100.44 9.8 35.19
111.42 10.65 40.40

Estime la ecuación de regresión lineal múltiple


tiempo de cocción vs ancho del horno

10
8
ancho del horno

6
4
2

20 40 60 80 100

tiempo de cocción

tiempo de cocción vs temperatura


40
30
temperaturas

20
10
0

20 40 60 80 100

tiempo de cocción
Del gráfico se identifica que existe una relación lineal entre el tiempo de
cocción y el ancho del horno, pero no entre el tiempo de cocción y la
temperatura, sin embargo, se realiza el ajuste del modelo lineal

Se determina la recta de regresión lineal múltiple al considerar el tiempo de


cocción como variable dependiente y la temperatura y ancho del horno
como variables independientes

Por lo tanto, la ecuación de regresión lineal múltiple será:

Tiempo de cocción=0.580+2.712 x 1+2.050 x 2

Para establecer si los parámetros anteriores son significativos e interpretar


el ajuste usamos la función summary
Comparamos las hipótesis:

Ho=los datos se distribuyen normalmente con los datos de tiempo de cocción


H 1=Los datos no se distribuyen normalmente con los datos de tiempo de coción

Podemos establecer:
 Para este ejercicio se encontró que con una significancia de α=0.05
el p-valor correspondiente es de 3.482∗10−23 siendo un valor mucho
menor que 0.05 se rechaza la hipótesis nula implicando que al
menos una de las variables independientes contribuye de forma
significativa a la explicación de la variable respuesta
 El p-valor para las variables de ancho del horno y la temperatura
siguen siendo menores por lo cual se sigue rechazando la hipótesis
e implica que son válidas para predecir el tiempo de cocción

Un aspecto importante es la combinación de las hipótesis que deben cumplirse por


lo cual se deben analizar si se cumplen los supuestos teóricos:
 Normalidad de residuos
 Independencia de los residuales
 Igualdad de varianza
 Linealidad de los residuos

R también permite identificar la validez de los modelos a través de los siguientes


gráficos:

 Valores predichos frente a residuos


 Q_Qplot (normalidad)
 Valores predichos frente a raíz cuadrada de residuos estandarizados
 Residuos estandarizados frente a leverages
Para verificar si hay normalidad, se aplica a los residuos el test de
normalidad de Kolmogorov-Smirnov y Durbin-watson

Prueba de Kolmogorov-Smirnov:

De la prueba se obtiene que el p-value es 0.6873 por lo tanto a una


significancia de 0.05 los residuos siguen una distribución normal puesto que
el valor es mayor.

Prueba durbin-watson:
Asumiendo una significancia del 0.05, vemos que para la prueba los valores de p-
value son menores, por lo tanto, se rechaza la hipótesis nula y podemos concluir
que los residuos NO son independientes.

Código en R:
tiempodecoccion<-c(6.4,15.05,18.75,30.25,44.85,48.94,51.55,61.5,100.44,111.42)
anchodelhorno<-c(1.32,2.69,3.56,4.41,5.35,6.2,7.12,8.87,9.8,10.65)
temperaturas<-c(1.15,3.40,4.10,8.75,14.82,15.15,15.32,18.18,35.19,40.40)
datos<-data.frame(tiempodecoccion,anchodelhorno,temperaturas)
datos
reg_lin_mul<-lm(tiempodecoccion~anchodelhorno+temperaturas)
reg_lin_mul
plot(tiempodecoccion,anchodelhorno,main="tiempo de cocción vs ancho del horno",xlab="tiempo
de cocción",ylab="ancho del horno")
plot(densidadoptica,espesordepelicula,main="tiempo de cocción vs temperatura
pelicula",xlab="tiempo de cocción",ylab="temperaturas")
plot(reg_lin_mul)
summary(reg_lin_mul)
ks.test(reg_lin_mul$residuals,pnorm)
library(lmtest)
dwtest(tiempodecoccion~anchodelhorno)
dwtest(tiempodecoccion~temperatura)
4. En Applied Spectroscopy se estudiaron las propiedades de reflectancia
infrarroja de un líquido viscoso que se utiliza como lubricante en la industria
electrónica. El experimento que se diseñó consistió en medir el efecto de
frecuencia de banda, x1, y el espesor de película, x2, sobre la densidad
óptica, y, usando un espectrómetro infrarrojo Perkin-Elmer Modelo 621.
(Fuente: Pacansky, J., England, C. D. y Wattman, R., 1986).

y x1 x2
0.231 740 1.10
0.107 740 0.62
0.053 740 0.31
0.129 805 1.10
0.069 805 0.62
0.030 805 0.31
1.005 980 1.10
0.559 980 0.62
0.321 980 0.31
2.948 1235 1.10
1.633 1235 0.62
0.934 1235 0.31

Estime la ecuación de regresión lineal múltiple

Solución:
dispersión densidad optica vs frecuencia de banda

1200
1100
frecuencia optica

1000
900
800

0.0 0.5 1.0 1.5 2.0 2.5 3.0

densidad optica

dispersión densidad optica vs espesor de pelicula


1.0
frecuencia optica

0.8
0.6
0.4

0.0 0.5 1.0 1.5 2.0 2.5 3.0

densidad optica
De los gráficos se identifica que no existe una relación lineal, sin embargo,
se realizará el ajuste del modelo lineal

Se determina la recta de regresión lineal al considerar la densidad óptica


como variable dependiente y el espesor de película y frecuencia de banda
como variables independientes por medio del siguiente código:

Densidad óptica=−3.372673+ 0.003617 x 1+0.947599 x 2

Para establecer si los parámetros anteriores son significativos e interpretar


el ajuste usamos la función summary
Comparamos las hipótesis:

Ho=los datos se distribuyen normalmente con los datos de tiempo de cocción


H 1=Los datos no se distribuyen normalmente con los datos de tiempo de coción

Podemos establecer:
 Para este ejercicio se encontró que con una significancia de α=0.05
el p-valor correspondiente es de 0.0004146 siendo un valor menor
que 0.05 se rechaza la hipótesis nula implicando que al menos una
de las variables independientes contribuye de forma significativa a la
explicación de la variable respuesta
 El p-valor para las variables frecuencia de banda y espesor de
película siguen siendo menores por lo cual se sigue rechazando la
hipótesis e implica que son válidas para predecir el tiempo de
cocción

Un aspecto importante es la combinación de las hipótesis que deben cumplirse por


lo cual se deben analizar si se cumplen los supuestos teóricos:
 Normalidad de residuos
 Independencia de los residuales
 Igualdad de varianza
 Linealidad de los residuos

R también permite identificar la validez de los modelos a través de los siguientes


gráficos:

 Valores predichos frente a residuos


 Q_Qplot (normalidad)
 Valores predichos frente a raíz cuadrada de residuos estandarizados
 Residuos estandarizados frente a leverages
Para verificar si hay normalidad, se aplica a los residuos el test de
normalidad de Kolmogorov-Smirnov y Durbin-watson

Prueba de Kolmogorov-Smirnov:
De la prueba se obtiene que el p-value es 0.1253 por lo tanto a una
significancia de 0.05 los residuos siguen una distribución normal puesto que
el valor es mayor

Prueba Durbin-watson:

Asumiendo una significancia del 0.05, vemos que para la prueba los valores
de p-value son menores, por lo tanto, se rechaza la hipótesis nula y
podemos concluir que los residuos NO son independientes

Código en R:
densidadoptica<c(0.231,0.107,0.053,0.129,0.069,0.03,1.005,0.559,0.321,2.948,1.633,0.934)
frecuenciadebanda<-c(740,740,740,805,805,805,980,980,980,1235,1235,1235)
espesordepelicula<-c(1.10,0.62,0.31,1.10,0.62,0.31,1.10,0.62,0.31,1.10,0.62,0.31)
datos<-data.frame(densidadoptica,frecuenciadebanda,espesordepelicula)
datos
reg_lin_mul<-lm(densidadoptica~frecuenciadebanda+espesordepelicula)
reg_lin_mul
plot(densidadoptica,espesordepelicula,main="densidad optica vs
espesordepelicula",xlab="densidad optica",ylab="espesordepelicula")
plot(densidadoptica,frecuencadebanda ,main="dispersión densidad optica vs frecuencia de
banda",xlab="densidad optica",ylab="frecuencia de pelicula")
plot(reg_lin_mul)
summary(reg_lin_mul)
ks.test(reg_lin_mul$residuals,pnorm)
library(lmtest)
dwtest(densidadoptica~frecuenciadebanda)
dwtest(densidadoptica~espesordepelicula)

Das könnte Ihnen auch gefallen