Beruflich Dokumente
Kultur Dokumente
Trabajo Prctico 2
Gestin de la calidad
Alumnos:
Gigena, Fernando Jos
Ogalde, Franco
Bertola, Martn Augusto
Persa, Francisco Daniel
-Correlacin lineal:
De los dems grficos podemos decir que puede existir un modelo no lineal tanto
cuando x crece y decrece o viceversa o no existir regresin lineal, es decir, los pares
de puntos representados en el grafico no pueden ser representados por ninguna
funcin.
El coeficiente de correlacin:
Este coeficiente se obtiene dividiendo la covarianza que se calcula de la siguiente
manera: en cada par de valores (x, y) se multiplica la "x" menos su media, por la "y"
menos su media. Se suma el resultado obtenido de todos los pares de valores y este
resultado se divide por el tamao de la muestra, dicha covarianza se eleva al cuadrado
y se divide por el producto de las varianzas de "x" y de "y", y a este producto se le
calcula la raz cuadrada.
Si "R" > 0, la correlacin lineal es positiva (si sube el valor de una variable sube el de
la otra). La correlacin es tanto ms fuerte cuanto ms se aproxime a 1.
Si "R" < 0, la correlacin lineal es negativa (si sube el valor de una variable disminuye
el de la otra). La correlacin negativa es tanto ms fuerte cuanto ms se aproxime a
-1.
Si "R" = 0, no existe correlacin lineal entre las variables. Aunque podra existir otro
tipo de correlacin (parablica, exponencial, etc.).
Otra herramienta usada para saber si realizamos un buen ajuste de regresin lineal
existe el coeficiente de regresin el cual indica el grado de bondad del ajuste
Otro concepto a tener muy en cuenta es la regresin lineal, esta es una tcnica
estadstica para investigar la relacin funcional entre dos o ms variables, ajustando
algn modelo matemtico.
La regresin lineal simple utiliza una sola variable de regresin y el caso ms sencillo
es el modelo de lnea recta. Supngase que se tiene un conjunto de n pares de
observaciones (xi,yi), se busca encontrar una recta que describa de la mejor manera
cada uno de esos pares observados.
Un ejemplo puede ser el siguiente:
El analisis de regresion lineal busca aproximar esta nube de puntos que tienen una
tendencia lineal por medio de una recta como, por ejemplo:
Para poder realizar dicho ajuste por medio de una recta se aplican las expresiones
antes mencionadas como el coeficiente de correlacin, y dems.
b=
Y l a es:
a=
Donde xi e yi son las muestras; x(raya) e y(raya) son las medias y b es el valor
calculado anteriormente.
El p-valor:
En el caso que el p-valor sea menor igual al nivel de significacin que se establece por
lo general entre 0.05 y 0.01, la hiptesis nula se rechaza. Y si tenemos valores altos
del p-valor que oscilan entre 0 y 1 no se rechaza dicha hiptesis.
Los grficos de residuos sirven para ver si verifican las hiptesis en el modelo de
regresin. Cuando tenemos un valor amplio indica que la observacin est lejos del
modelo estimado, por ende, es mala la prediccin de esta observacin.
En este grafico se observa que hay un dato atpico ya que hay un residuo muy alto.
En un modelo de regresin lineal que sea adecuado los residuos deben seguir una
distribucin normal con media 0 y varianza constante, por lo que un posible
diagnstico puede ser comprobar esa situacin. Se puede efectuar de manera formal o
mediante una grfica en la que se representa el valor de los residuos frente al valor
estimado.
Auto correlacin
El mtodo de Durbin Watson busca rechazar la hiptesis nula de inexistencia de
auto correlacin mediante el estadstico h para pruebas de muestras grandes. Si el
estadstico de la regresin efectuada est distribuido en forma asintticamente normal
con media cero y varianza unitaria y adems se encuentra entre (-1,96, +1,96), con un
95% de confianza se puede rechazar la hiptesis nula de que no hay correlacin de
primer orden (positiva o negativa). El valor de h para nuestro modelo es de -0,0206,
por lo que podemos aceptar la hiptesis nula de ausencia de auto correlacin con un
95%. La inclusin del AR(1) corrige el problema de auto correlacin propio de este
modelo, adems de contribuir en la explicacin del comportamiento de la variable
dependiente.
Coeficientes
Anlisis de Varianza
Residuos:
Uno de los supuestos del modelo generalmente aceptado es que los errores o
residuos, se distribuyen alrededor de la recta de regresin, en forma normal,
con una media de cero. Por supuesto no reproduce exactamente la curva
normal, pero podemos atribuir esas desviaciones, con razonabilidad, al nmero
no demasiado grande de residuos. Si la muestra fuera mayor, tendramos
derecho a esperar mejor ajuste.
En este ultimo grfico, los residuos parecen aleatorios. Es una buena
indicacin que el modelo de regresin se ajusta bien.
Residuos Atpicos
Predicciones Residuos
Fila X Y Y Residuos Studentizados
6 1140.0 12.6 11.5161 1.08395 2.92
http://www.renault.com.ar/
http://www.ford.com.ar/
http://www.citroen.com.ar/
http://www.volkswagen.com.ar/
http://www.cars.com.ar/
http://www.uoc.edu/in3/emath/docs/RegresionLineal.pdf
http://es.wikipedia.org/wiki/Coeficiente_de_determinaci
%C3%B3n_corregido
http://es.wikipedia.org/wiki/Coeficiente_de_determinaci%C3%B3n
http://es.wikipedia.org/wiki/Regresi%C3%B3n_lineal
http://halweb.uc3m.es/esp/Personal/personas/mwiper/docencia/Spanish/
Introduction_to_Statistics/intro_regress2.pdf
http://es.wikipedia.org/wiki/Error_est%C3%A1ndar