Sie sind auf Seite 1von 15

Probabilidad y

Estadística Inferencial

Regresión lineal y correlación


simple

Jesús Antonio Torres Becerra


Análisis de correlación

 Cuando se estudia la relación entre dos variables en escala de


intervalo (o de razón), es usual comenzar con un diagrama de
dispersión. Este procedimiento proporciona una representación
visual de la relación entre las variables. El siguiente paso suele ser
calcular el coeficiente de correlación, que brinda una medida
cuantitativa de la fuerza de la relación entre dos variables.

ANÁLISIS DE CORRELACIÓN Grupo de técnicas para medir la asociación entre dos variables.
Diagrama de Dispersión
El diagrama de dispersión permite analizar
si existe algún tipo de relación entre dos
variables. Por ejemplo, puede ocurrir que
dos variables estén relacionadas de
manera que al aumentar el valor de una,
se incremente el de la otra.
En este caso hablaríamos de la existencia
de una correlación positiva. También
podría ocurrir que al producirse una en un
sentido, la otra derive en el sentido
contrario; por ejemplo, al aumentar el
valor de la variable x, se reduzca el de la
variable y. Entonces, se estaría ante una
correlación negativa. Si los valores de
ambas variable se revelan independientes
entre sí, se afirmaría que no existe
Diagrama de Dispersión

La variable independiente proporciona la base para la estimación. Es la variable


predictora. Por ejemplo, digamos que se desea predecir el número esperado de
copiadoras que se venderán si un representante realiza 20 llamadas de ventas.
Observe que elegimos este valor. La variable independiente no es un número
aleatorio.
La variable dependiente es la variable que se desea predecir o estimar. También
puede ser descrita como el resultado de un valor conocido de la variable
independiente. La variable dependiente es aleatoria, esto es, por cada valor dado a
la variable independiente, existen muchos posibles resultados para la variable
dependiente.
Es práctica común situar la variable dependiente en el eje vertical o Y y la variable
independiente en el eje horizontal o X.
Diagrama de Dispersión

Ejemplo: Los siguientes datos


representan los años de práctica
profesional y el ingreso anual para un
grupo de ingenieros:
Coeficiente de correlación

El coeficiente de correlación, creado por Karl Pearson, describe la fuerza de la relación entre dos
conjuntos de variables en escala de intervalo o de razón. Se designa con la letra r, y con frecuencia se
le conoce como r de Pearson y coeficiente de correlación producto-momento. Puede adoptar
cualquier valor de +1.00 a -1.00, inclusive. Un coeficiente de correlación de +1.00 o bien de -1.00
indica una correlación perfecta.
Coeficiente de correlación

Si no hay ninguna relación entre los dos conjuntos de variables, la r de Pearson es cero. Un
coeficiente de correlación r cercano a 0 (sea 0.08) indica que la relación lineal es muy débil. Se
llega a la misma conclusión si r=-0.08. Los coeficientes de -0.91 y +0.91 tienen una fuerza igual;
los dos indican una correlación muy fuerte entre las dos variables. Por lo tanto, la fuerza de la
correlación no depende de la dirección (ya sea - o bien +).
Coeficiente de correlación

COEFICIENTE DE CORRELACIÓN Medida de la fuerza de la relación lineal entre dos variables.

CARACTERÍSTICAS DEL COEFICIENTE DE CORRELACIÓN


1. El coeficiente de correlación de la muestra se identifica con la letra minúscula r.
2. Muestra la dirección y fuerza de la relación lineal (recta) entre dos variables en escala de intervalo o en
escala de razón.
3. Varía de -1 hasta +1, inclusive.
4. Un valor cercano a 0 indica que hay poca asociación entre las variables.
5. Un valor cercano a 1 indica una asociación directa o positiva entre las variables.
6. Un valor cercano a -1 indica una asociación inversa o negativa entre las variables.
Coeficiente de correlación

COEFICIENTE
  DE CORRELACIÓN

 Donde:
X = Valores de la variable independiente
= Media de la variable independiente
Y = Valores de la variable dependiente
= Media de la variable dependiente
n = Tamaño muestral
Sx = Desviación estándar de la variable independiente
Sy = Desviación estándar de la variable dependiente
Coeficiente de correlación

Calculo del coeficiente de correlación del ejemplo anterior:


Realice la siguiente tabla:

 Después sustituir:

Es una correlación positiva fuerte, indica que si hay


relación entre las variables.
Análisis de regresión

 En el tema anterior se desarrollaron medidas para expresar la fuerza y la dirección


de la relación lineal entre dos variables. Ahora se elabora una ecuación para
expresar la relación lineal entre dos variables. Además, se desea estimar el valor de
la variable dependiente Y con base en un valor seleccionado de la variable
independiente X. La técnica para desarrollar la ecuación y proporcionar las
estimaciones se denomina análisis de regresión.

ECUACIÓN DE REGRESIÓN Ecuación que expresa la relación lineal entre


dos variables.
Análisis de regresión

PRINCIPIO DE LOS MÍNIMOS CUADRADOS Determina una ecuación de regresión al minimizar


la suma de los cuadrados de las distancias verticales entre los valores reales de Y y los valores
pronosticados de Y.
Análisis de regresión


Forma
  general de la Ecuación de Regresión Lineal
 Donde:
, que se lee Y prima, es el valor de la estimación de la variable Y para un valor X seleccionado.

a es la intersección Y. Es el valor estimado de Y cuando X = 0. En otras palabras, a es el valor


estimado de Y donde la recta de regresión cruza el eje Y cuando X es cero.

b es la pendiente de la recta, o el cambio promedio en por cada cambio de una unidad (ya sea
aumento o reducción) de la variable independiente X.

X es cualquier valor de la variable independiente que se seleccione.


Análisis de regresión

La forma general de la ecuación de la regresión lineal es exactamente la misma que la ecuación de


cualquier línea. a es la intersección con Y y b es la pendiente. El propósito de un análisis de regresión es
calcular los valores de a y b para desarrollar una ecuación lineal que se ajuste mejor a los datos.
Las fórmulas de a y b son:

 Pendiente de la recta de regresión


 Intersección con el eje Y

donde:  donde:
r es el coeficiente de correlación. es la media de Y (la variable dependiente).
Sy es la desviación estándar de Y (la variable es la media de X (la variable independiente).
dependiente).
Sx es la desviación estándar de X (la variable
independiente).
Análisis de regresión


En el
  ejemplo de los años de práctica profesional y el ingreso anual para un grupo de ingenieros Con el
método de los mínimos cuadrados, determine una ecuación lineal que exprese la relación entre ambas
variables. ¿Cuál es el ingreso esperado para un ingeniero con 20 años de practica?

Así la ecuación de la recta queda:

Siendo el ingreso estimado = 5.2386

Das könnte Ihnen auch gefallen