Sie sind auf Seite 1von 10

Grfico de Correlaciones

Para poder elegir la variable respuesta o dependiente inicialmente se


realiza preliminarmente un grfico de correlaciones:

De donde se observa que las variables que parecen asociarse de manera


lineal son ancho de los ptalos con las longitudes, tanto de los spalos
como de los ptalos. Las longitudes tambin parecen mostrar una buena
relacin lineal. En las dems pares de variables no es muy clara la
tendencia.

La matriz de correlaciones
Para determinar las mejores relaciones, se calcula la matriz de
correlaciones, basados en el coeficiente de Pearson

Sepal.Length Sepal.Width Petal.Length Petal.Width


Sepal.Length
1.000
-0.118
0.872
0.818
Sepal.Width
-0.118
1.000
-0.428
-0.366

Petal.Length
Petal.Width

0.872
0.818

-0.428
-0.366

1.000
0.963

0.963
1.000

Podemos confirmar lo que el grfico anterior nos mostraba. Existe una


alta correlacin entre ancho y la longitud de los ptalos (0.963). Tambin
se destacan la buena asociacin entre las longitudes (0.872) y la
existente entre ancho de los ptalos y la longitud de los spalos (0.818).
Como la variable ancho de los ptalos es la que mejor muestra
asociacin, se tomar como variable dependiente, mientras que las
restantes como independientes, en ese sentido se ajusta el siguiente
modelo lineal.

Ajuste del modelo lineal


Queremos ajustar un modelo de la forma
^
A . Ptalosi = ^ 0+ ^1 L. Spalosi + ^ 2 A . Spalosi+ ^3 L. Ptalosi
Donde tenemos lo siguiente:
Call:
lm(formula = Petal.Width ~ Sepal.Length + Sepal.Width + Petal.Length)
Residuals:
Min
1Q Median
3Q
Max
-0.60959 -0.10134 -0.01089 0.09825 0.60685
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.24031 0.17837 -1.347
0.18
Sepal.Length -0.20727 0.04751 -4.363 2.41e-05 ***
Sepal.Width 0.22283 0.04894 4.553 1.10e-05 ***
Petal.Length 0.52408 0.02449 21.399 < 2e-16 ***
--Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.192 on 146 degrees of freedom
Multiple R-squared: 0.9379, Adjusted R-squared: 0.9366
F-statistic: 734.4 on 3 and 146 DF, p-value: < 2.2e-16

El modelo con los respectivos parmetros estimados es el siguiente:


^
A . Ptalosi =0.240310.20727 L. Spalosi+ 0.22283 A . Spalosi +0.52408 L . Ptalosi

El modelo explica aproximadamente el 93.79% de la variabilidad del


ancho de los ptalos.

Intervalo de confianza
2.5 %
97.5 %
(Intercept) -0.5928277 0.1122129
Sepal.Length -0.3011547 -0.1133775
Sepal.Width 0.1261101 0.3195470
Petal.Length 0.4756798 0.5724865

En base a los intervalos de confianza, podemos reconfirmar que el nico


parmetro estimado que no resulta ser significativo es el intercepto
( 0 ) , puesto que con un 95% de confianza, el cero est incluido en el
intervalo.

Diagnstico
Grfico de los residuos

Al mirar el grfico de residuos, podemos observar que estos no


muestran ningn comportamiento aparente, es decir, no hay una
tendencia en su dispersin. Solo pocos datos estn por fuera del rango
de dos desviaciones estndar (0.384), por lo que se pueden considerar
atpicas. Se puede decir que existe homogeneidad en los errores.

Normalidad

Grficamente tenemos:
Se puede observar que pocas son las observaciones que no se ajustan a
la lnea recta, especficamente las que se encuentran en los extremos;
sin embargo la mayora de los errores parece que s parece hacerlo, por
lo que se puede decir que los errores tienen una distribucin normal.
Formalmente:
H0:

Los errores del modelo distribuyen normalmente

Vs
H1:

Los errores del modelo no distribuyen normalmente

Shapiro-Wilk normality test


data: resi
W = 0.98438, p-value = 0.08771

El p valor

( p >0.05 ) de la prueba de Shapiro Wilk, no est indicando la

existencia de normalidad en la distribucin de los errores.


Como se cumplen tanto los supuestos de Homogeneidad como de
Normalidad, el modelo es adecuado, por lo que es til para hacer
inferencias.

REGRESIONES SIMPLES
Modelo simple: Ancho de Ptalos frente
Longitud de Ptalos
Call:
lm(formula = Petal.Width ~ Petal.Length, data = datos)
Residuals:
Min
1Q Median
3Q
Max
-0.56515 -0.12358 -0.01898 0.13288 0.64272
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.363076 0.039762 -9.131 4.7e-16 ***
Petal.Length 0.415755 0.009582 43.387 < 2e-16 ***
--Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.2065 on 148 degrees of freedom
Multiple R-squared: 0.9271, Adjusted R-squared: 0.9266
F-statistic: 1882 on 1 and 148 DF, p-value: < 2.2e-16

El modelo ajustado para explicar el comportamiento del ancho de ptalo e funcin


de la longitud del ptalo es
A . Petalo=0.363+ 0.415 L . Petalo

El cual tiene parmetros altamente significativos y explica el 92.71% de la


variabilidad total de la variable longitud de ptalo.

Grfico de regresin lineal

En el grafico anterior notamos que evidentemente se observa un comportamiento


lineal entre las variables ancho del ptalo y longitud del ptalo.

Intervalo de confianza para la regresin


2.5 %
97.5 %
(Intercept) -0.4416501 -0.2845010
Petal.Length 0.3968193 0.4346915

Con un nivel de significancia del 5% tenemos que por cada unidad que aumenta la
longitud de ptalo el ancho aumenta entre 0.396 y 0.434 unidades.

Diagnstico
Residual

Notamos que no existe tendencia entre los valores ajustados y los residuales por
lo que se sospecha que existe homogeneidad de varianza entre los errores del
modelo.

En el grafico QQ-Plot notamos que la mayora de puntos se ajustan a la lnea de


normalidad por lo que se sospecha que los errores del modelo se ajustan a una
distribucin normal. Para verificar este supuesto realizamos la prueba de ShapiroWilk
Shapiro-Wilk normality test
data: residuos
W = 0.98379, p-value = 0.07524

A un nivel de significancia del 5% no existe evidencia estadstica para concluir que


los errores no siguen una distribucin normal ya que el p-valor asociado a la
prueba de normalidad es superior a 0.05

Trabajo de Estadistica II

Regresin lineal simple

Presentado por.
Camilo Andrs Vargas Prez
Ignacio Villalobos Velzquez
Juan Carlos Oquendo Daz

Presentado a.
Luis Ramn barrios roqueme

Universidad de crdoba
Facultad de ingenieras
Departamento de ingeniera industrial

Montera crdoba
2016

Trabajo de Estadstica II

Regresin lineal simple

Presentado por.
Flor Mara Garca Flrez
Jorge Prez Garca
Yessica cuadrado pea

Presentado a.
Luis Ramn barrios roqueme

Universidad de crdoba
Facultad de ingenieras
Departamento de ingeniera industrial

Montera crdoba
2016

Das könnte Ihnen auch gefallen