Sie sind auf Seite 1von 15

Universidad Mariano Glvez de Guatemala

Sede Universitaria Chiquimula


Maestra Direccin y Gestin del Recurso Humano
Ingeniera Claudia Esmeralda Villela
Mtodos Cuantitativos

Anlisis de Correlacin

Erick Rigoberto Medina Cordn


3228- 09-1280

Chiquimula, 23 de julio del 2,016

ndice
Contenido
Introduccin.........................................................................................................................i
I.

Anlisis de Correlacin................................................................................................1

A. Teora de regresin y correlacin................................................................................1


B. Anlisis de correlacin.................................................................................................2
C. Diagrama de dispersin...............................................................................................2
D. Coeficiente de determinacin......................................................................................3
E. Coeficiente de correlacin de Pearson.......................................................................8
F. Modelos aditivos y sumativos para expresar una serie de tiempo.............................8
II.

Conclusiones.............................................................................................................10

Bibliografa........................................................................................................................11

Introduccin
Se llama Series de Tiempo son mediciones estadsticas a un conjunto de
mediciones de cierto fenmeno o experimento registrado secuencialmente en el
tiempo. El primer paso para analizar una serie de tiempo es graficarla, esto
permite: identificar la tendencia, la estacionalidad, las variaciones irregulares
(componente aleatoria).
Un modelo clsico para una serie de tiempo, puede ser expresada como suma o
producto de tres componentes: tendencia, estacional y un trmino de error
aleatorio. En adelante se estudiar cmo construir un modelo para explicar la
estructura y prever la evolucin de una variable que observamos a lo largo del
tiempo.
En ocasiones nos puede interesar estudiar si existe o no algn tipo de relacin
entre dos variables aleatorias. As, por ejemplo, podemos preguntarnos si hay
alguna relacin entre las notas de la asignatura Estadstica I y las de Matemticas
I. Una primera aproximacin al problema consistira en dibujar en el plano R2un
punto por cada alumno: la primera coordenada de cada punto sera su nota en
estadstica, mientras que la segunda sera su nota en matemticas. As,
obtendramos una nube de puntos la cual podra indicarnos visualmente la
existencia o no de algn tipo de relacin (lineal, parablica, exponencial, etc.)
entre ambas notas. Otro ejemplo, consistira en analizar la facturacin de una
empresa en un periodo de tiempo dado y de cmo influyen los gastos de
promocin y publicidad en dicha facturacin. Si consideramos un periodo de
tiempo de 10 aos, una posible representacin sera situar un punto por cada ao
de forma que la primera coordenada de cada punto sera la cantidad en euros
invertidos en publicidad, mientras que la segunda sera la cantidad en euros
obtenidos de su facturacin. De esta manera, obtendramos una nube de puntos
que nos indicara el tipo de relacin existente entre ambas variable.

I.

Anlisis de Correlacin

En probabilidad y estadstica, la correlacin indica la fuerza y la direccin de una


relacin lineal y proporcionalidad entre dos variables estadsticas. Se considera que dos
variables cuantitativas estn correlacionadas cuando los valores de una de ellas varan
sistemticamente con respecto a los valores homnimos de la otra.

A. Teora de regresin y correlacin


Segn el autor (Berenson, 2006) el trmino correlacin se utiliza generalmente para
indicar la correspondencia o la relacin recproca que se da entre dos o ms cosas,
ideas, personas, entre otras. En tanto, en probabilidad y estadstica, la correlacin es
aquello que indicar la fuerza y la direccin lineal que se establece entre dos variables
aleatorias.
Grafica No.1 Anlisis de Correlacin

Anlisis de Correlacin Recuperada de


http://www.ditutor.com/estadistica_2/correlacion_estadistica.html de marzo del 2015

Se considera que dos variables de tipo cuantitativo presentan correlacin la una


respecto de la otra cuando los valores de una ellas varen sistemticamente con
respecto a los valores homnimos de la otra. Por ejemplo, si tenemos dos variables que
se llaman A y B, existir el mencionado fenmeno de correlacin si al aumentar los
valores de A lo hacen tambin los valores correspondientes a B y viceversa.

B. Anlisis de correlacin
Segn el autor (Govinden, 2005) el anlisis de correlacin emplea mtodos para
medir la significacin del grado o intensidad de asociacin entre dos o ms variables.
Normalmente, el primer paso es mostrar los datos en un diagrama de dispersin. El
concepto de correlacin est estrechamente vinculado al concepto de regresin, pues,
para que una ecuacin de regresin sea razonable los puntos mustrales deben estar
ceidos a la ecuacin de regresin; adems el coeficiente de correlacin debe ser:
1. Grande cuando el grado de asociacin es alto (cerca de +1 o -1, y pequeo
cuando
2. Es bajo, cerca de cero.
3. Independiente de las unidades en que se miden las variables.

C. Diagrama de dispersin
Segn el autor (Lind Marchal, 2004) un diagrama de dispersin se emplea cuando
existe una variable que est bajo el control del experimentador. Si existe un parmetro
que se incrementa o disminuye de forma sistemtica por el experimentador, se le
denomina parmetro de control o variable independiente = eje de x y habitualmente se
representa a lo largo del eje horizontal. La variable medida o dependiente = eje de y
usualmente se representa a lo largo del eje vertical. Si no existe una variable

dependiente, cualquier variable se puede representar en cada eje y el diagrama de


dispersin mostrar el grado de correlacin (no causalidad) entre las dos variables.
Segn el autor (Webster, 2005) Un diagrama de dispersin puede sugerir varios tipos
de correlaciones entre las variables con un intervalo de confianza determinado. La
correlacin puede ser positiva (aumento), negativa (descenso), o nula (las variables no
estn correlacionadas). Se puede dibujar una lnea de ajuste (llamada tambin "lnea de
tendencia") con el fin de estudiar la correlacin entre las variables. Una ecuacin para la
correlacin entre las variables puede ser determinada por procedimientos de ajuste.
Para una correlacin lineal, el procedimiento de ajuste es conocido como regresin
lineal y garantiza una solucin correcta en un tiempo finito.
Uno de los aspectos ms poderosos de un grfico de dispersin, sin embargo, es su
capacidad para mostrar las relaciones no lineales entre las variables. Adems, si los
datos son representados por un modelo de mezcla de relaciones simples, estas
relaciones son visualmente evidentes como patrones superpuestos.
El diagrama de dispersin es una de las herramientas bsicas de control de calidad,
que incluyen adems el histograma, el diagrama de Pareto, la hoja de verificacin, los
grficos de control, el diagrama de Ishikawa y el diagrama de flujo.

D. Coeficiente de determinacin
Segn el autor (Santander Montes & Ruiz Vaquero, 2007) En un modelo de
regresin lineal el coeficiente de determinacin se interpreta como el porcentaje de
variacin de la variable dependiente

El coeficiente de determinacin, r2 - la proporcin de la variacin total en la variable


dependiente Y que est explicada por o se debe a la variacin en la variable
independiente X. El coeficiente de determinacin es el cuadrado del coeficiente de
correlacin, y toma valores de 0 a 1.
Ejemplo:
Dan Ireland, presidente de la sociedad de alumnos de la Universidad de Toledo, est
preocupado por el costo de los libros. Para tener un panorama del problema elige una
muestra de 8 libros de venta en la librera. Decide estudiar la relacin entre el nmero
de pginas del libro y el costo. Calcule el coeficiente de correlacin.

r =.614 (verifique)
Pruebe la hiptesis de que no existe correlacin en la poblacin. Use .02 de nivel de
significancia. Paso 1: H0 la correlacin en la poblacin es cero. H1 la correlacin en la
poblacin es distinta de cero. Paso 2: H0 se rechaza si t>3.143 o si t 2 es

Dnde:

1. El coeficiente a representa el grado de disminucin de peso, un factor de


suavizado constante entre 0 y 1. Un descuentos a mayor edad observaciones
ms rpido. Por otra parte, a se puede expresar en trminos de perodos de
tiempo N, donde a = 2 / (N +1). Por ejemplo, N = 19 es equivalente a a = 0.1. La
vida media de los pesos (el intervalo en el que la disminucin de peso por un
factor de dos) es de aproximadamente N / 2,8854 (a menos de 1% si N> 5).
2. Y t es la observacin en un perodo de tiempo t.
3. S t es el valor de la EMA, en cualquier perodo de tiempo t.
S 1 es indefinido. S 2 puede ser inicializado en un nmero de maneras diferentes,
por lo general mediante el establecimiento de S 2 Y 1, aunque existen otras tcnicas,
tales como el establecimiento de S 2 a un promedio de los primeros 4 o 5
observaciones. La importancia de S 2 de inicializacin de efecto sobre la media mvil
resultante depende de a, a valores menores que la eleccin de los valores de S 2
relativamente ms importante a ms grande que, desde un a descuentos superiores
mayores observaciones ms rpido.

Esta es una suma infinita de trminos disminuyendo.


Los perodos de N en un N-da EMA slo especificar el factor a. N no es un punto de
parada para el clculo en la forma en que se encuentra en un SMA o WMA. Para N
suficientemente grande, la primera de datos N puntos en un EMA representan alrededor
del 86% del peso total en el clculo:

En estadstica, el coeficiente de determinacin, denominado R y pronunciado R


cuadrado, es un estadstico usado en el contexto de un modelo estadstico cuyo
principal propsito es predecir futuros resultados o probar una hiptesis. El coeficiente
determina la calidad del modelo para replicar los resultados, y la proporcin de
variacin de los resultados que puede explicarse por el modelo.
Hay varias definiciones diferentes para R que son algunas veces equivalentes. Las
ms comunes se refieren a la regresin lineal. En este caso, el R es simplemente el
cuadrado del coeficiente de correlacin de Pearson, lo cual es slo cierto para la
regresin lineal simple. Si existen varios resultados para una nica variable, es decir,
para una X existe una Y, Z... el coeficiente de determinacin resulta del cuadrado del
coeficiente de determinacin mltiple. En ambos casos el R adquiere valores entre 0 y
1. Existen casos dentro de la definicin computacional de R donde este valor puede
tomar valores negativos.
La frmula de energa por encima de da un valor de partida para un da
determinado, despus de lo cual los primeros das se muestra la frmula puede ser
aplicada a los sucesivos. La cuestin de hasta qu punto volver a ir para un valor inicial
depende, en el peor de los casos, en los datos. Si hay grandes valores de los precios p
en los datos de edad, entonces van a tener un efecto sobre el total, aunque su
ponderacin es muy pequea. Si uno asume los precios no varan demasiado
violentamente a continuacin, slo la ponderacin puede ser considerada. El peso se
omite por detener despus de los trminos k es:

E. Coeficiente de correlacin de Pearson


El coeficiente de correlacin de Pearson es un ndice que mide la relacin lineal
entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlacin
de Pearson es independiente de la escala de medida de las variables
El coeficiente de correlacin entre dos variables aleatorias X e Y es el cociente
8

El valor del ndice de correlacin vara en el intervalo [-1, +1]:


1. Si r = 1, existe una correlacin positiva perfecta. El ndice indica una
dependencia total entre las dos variables denominada relacin directa: cuando
una de ellas aumenta, la otra tambin lo hace en proporcin constante.
2. Si 0 < r < 1, existe una correlacin positiva.
3. Si r = 0, no existe relacin lineal. Pero esto no necesariamente implica que las
variables son independientes: pueden existir todava relaciones no lineales entre
las dos variables.
4. Si -1 < r < 0, existe una correlacin negativa.
5. Si r = -1, existe una correlacin negativa perfecta. El ndice indica una
dependencia total entre las dos variables llamada relacin inversa: cuando una
de ellas aumenta, la otra disminuye en proporcin constante.

F. Modelos aditivos y sumativos para expresar una serie de tiempo


Segn el autor (Siegel, 2006) los mtodos descritos en esta seccin representan una
generalizacin de la regresin mltiple (que es un caso especial de modelos lineales
generales). En concreto, en la regresin lineal, un ajuste lineal por mnimos cuadrados
se calcula para un conjunto de variables explicativas o X, para predecir una variable
dependiente Y. La ecuacin de regresin lineal conocido con predictores m, para
predecir una variable dependiente Y, se puede plantear como:
Y = b 0 + b 1 X * 1 +... M + a * b * X m

Donde Y representa el (los valores pronosticados de la) variable dependiente, X 1 a


m X representan los valores de m para las variables de prediccin, y b 0 y b 1 a m b son
los coeficientes de regresin estimados por regresin mltiple. Una generalizacin del
modelo de regresin mltiple sera la de mantener el carcter aditivo de la modelo, pero
para sustituir los trminos simples de la ecuacin lineal b * i X i con f i (X i) donde f i es
una funcin no paramtrica del predictor X i. En otras palabras, en lugar de un
coeficiente nico para cada variable (trmino aditivo) en el modelo, en los modelos de
un aditivo sin especificar (no paramtrica) la funcin se estima para cada predictor, para
lograr la mejor prediccin de los valores de las variables dependientes.

II.

Conclusiones

1. La serie de tiempo en estadstica es un procesamiento de seales, y econometra,


una serie temporal es una secuencia de puntos de datos, medidos tpicamente a
intervalos de tiempo sucesivos, y espaciados (con frecuencia) de forma uniforme.
2. El anlisis de series temporales comprende mtodos que ayudan a interpretar este
tipo de datos, extrayendo informacin representativa, tanto referente a los orgenes

10

o relaciones subyacentes como a la posibilidad de extrapolar y predecir su


comportamiento futuro.
3. De hecho uno de los usos ms habituales de las series de datos temporales es su
anlisis para prediccin y pronstico. Por ejemplo de los datos climticos, o de las
acciones de bolsa, o las series pluviomtricas.
4. Un modelo clsico para una serie de tiempo, puede ser expresada como suma o
producto de tres componentes: tendencia, estacional y un trmino de error aleatorio.
En adelante se estudiar cmo construir un modelo para explicar la estructura y
prever la evolucin de una variable que observamos a lo largo del tiempo.
5. El diagrama de dispersin es una de las herramientas bsicas de control de calidad,
que incluyen adems el histograma, el diagrama de Pareto, la hoja de verificacin,
los grficos de control, el diagrama de Ishikawa y el diagrama de flujo.

Bibliografa

Berenson, D. (2006). Estadstica para la administracin y economa. Conceptos y


aplicaciones. Mexico: MC. Graw- Hill. Interamericana.

11

Govinden, L. (2005). Introduccin a la Estadstica. Bogota Colombia: McGraw Hill.


Interamericana.
Lind Marchal, M. (2004). Estadstica para Administracin y Economa . Mexico: Alfa
omega ISBN.
Santander Montes , A., & Ruiz Vaquero, R. (2007). Relacin entre variables
cuantitativas. CUBA: ECIMED.
Siegel, S. (2006). Diseo Experimental No Paramtrico. Las medidas de correlacin y
sus pruebas de significacin. El coeficiente de correlacin de rangos de
Spearman. Cuba: Revolucionaria.
Webster, A. (2005). Estadstica Aplicada a los Negocios y a la Economa. Bogota,
Colombia: McGraw Hill.

12

Das könnte Ihnen auch gefallen