Beruflich Dokumente
Kultur Dokumente
Introducción. - En el análisis conjunto para dos o más variables es básica la búsqueda del tipo y
grado de la relación que pueda existir entre ellas, o si por el contrario, las variables sean
independientes entre sí y la relación que puedan mostrar se debe únicamente al azar, o a
través de terceras variables.
Para fortalecer el indicio de correlación inicial, se grafica cada uno de los pares ordenados de
las variables (xi, yj) en un plano cartesiano, para observar la “nube de puntos” o diagrama de
dispersión, donde se advierte la tendencia o no, de la información representada.
Diagrama de dispersión.
Definición. - Se denomina diagrama de dispersión o nube de puntos, a la gráfica de los valores
(xi, yi) de las variables X e Y en el sistema cartesiano.
Es frecuentemente posible visualizar el tipo de relación existente entre dos variables a partir
del diagrama de dispersión.
Por ejemplo, a pesar de la ilustración visual que ofrecen las gráficas, solo podemos percibir la
tendencia, mas no el grado o fortaleza de la relación, entre la variable independiente “X” y la
variable dependiente “Y”.
Para cuantificar la calidad de la dependencia, entre las dos variables, el indicador más
acostumbrado es el Coeficiente de correlación de Pearson.
Donde:
El coeficiente de correlación, es un indicador del grado de la relación entre las dos variables, el
cual oscila en el intervalo cerrado, es decir: −1 ≤ 𝑟 ≤ 1.
Interpretación:
Experienci 0 1 2 3 4 5 6 7 8 9 10
a /Años
Soles /día 56 58 60 62 64 66 68 70 72 74 76
Determine el coeficiente de correlación.
Solución.
𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑝𝑒𝑟𝑓𝑒𝑐𝑡𝑎 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎, Sin embargo, no todas las relaciones son tan ideales.
REGRESIÓN LINEAL.
DEFINICION. - Dados los n pares (x 1, y1 ),(x2 ,y2 ),..., (xn ,yn) de la variable estadística
bidimensional ( X , Y). La regresión lineal simple de Y con respecto a X, consiste en determinar
la ecuación de la recta:
y = a + mx
MÉTODO DE LOS MÍNIMOS CUADRADOS.
Con:
X : Variable independiente
Y : Variable dependiente
Debemos determinar los parámetros “b” y “m” de la ecuación para poder expresar los valores
de la variable Y en función de los valores de la variable X.
El método de mínimos cuadrados nos proporciona un criterio con el cual podremos obtener la
mejor recta que representa a los puntos dados.
Se desearía tener yi = mxi + b para todos los puntos (xi , yi) de i = 1, ..., n.
Sin embargo, como en general y i ≠ mxi + b, se pide que la suma de los cuadrados de las
diferencias (las desviaciones) yi − (mxi + b) sea la menor posible.
Se requiere
sea lo más pequeña posible. Los valores de m y b que cumplan con esta propiedad, determinan
la recta y = mx + b que mejor representa el comportamiento lineal de los puntos (x i , yi).
n n
n
Multiplicando por n a la ecuación (1) y por ∑ xi a la ecuación 2, se tiene:
i=1
n n n
n ∑ xiyi=n m ∑ xi 2 +nb ∑ xi … ..1
i=1 i=1 i=1
n n n n
2
∑ xi ∑ yi=m(∑ xi) + nb ∑ xi ….2
i=1 i=1 i =1 i=1
n n n n n 2
n ∑ xiyi−∑ xi ∑ yi=m(n ∑ xi2−
i=1 i=1 i=1 i=1
( )
∑ xi )
i=1
Despejando m, se tiene:
n n n
n ∑ xiyi−∑ xi ∑ yi
i=1 i=1 i=1
m= n n 2
n ∑ xi −
i=1
2
(∑ ) i =1
xi
b= ý−m x́
Para datos agrupados, se tiene:
n n n
n ∑ fixiyi−∑ fixi ∑ fiyi
i=1 i=1 i=1
m= n n 2
n ∑ fi xi 2−
i=1
( ∑ fixi
i=1
)
EJEMPLO. - En un estudio de la relación entre la publicidad por radio y las ventas de un
producto, durante 10 semanas se han recopilado los tiempos de duración en minutos de la
publicidad por semana (x), y el número de artículos vendidos (y), resultando:
b) Calcular la recta de regresión de mínimos cuadrados con el fin de predecir las ventas.
SOLUCION.
a) Al trazar el diagrama de dispersión se observa que hay una relación lineal positiva
entre el número de artículos vendidos y el tiempo de publicidad semanal por radio.
b) Para determinar la recta de regresión se dispone del siguiente cuadro:
n n n
n ∑ xiyi−∑ xi ∑ yi
i=1 i=1 i=1 10 ( 61800 )−(500)( 1100) 68000
m= = = =2
n n 2
10 ( 28400 )−(500)2 34000
n ∑ xi 2−
i=1
(∑ )i =1
xi
Luego:
y=2x+10.