Beruflich Dokumente
Kultur Dokumente
FACULTAD DE CIENCIAS
ECONOMICAS Y ADMINISTRATIVAS
INTEGRANTES
ANA ENCARNACIÓN
MARINA GUANUCHI
STEFANNY JIMÉNEZ
CESAR OTORONGO
DAVID SINCHI
KARLA YANZA
IRENE ZHININ
CURSO
DOCENTE
MATERIA
ESTADISTICA IV
TEMA
CORRELACIÓN Y REGRESIÓN MÚLTIPLE
1. INTRODUCCIÓN
En el capítulo anterior se aplicó los conceptos del modelo de regresión lineal simple,
donde analizó la relación que tenían dos variables, la una dependiente, Y, y la otra
independiente, X, es decir, se buscaba analizar la influencia que ejercía la variable
independiente para que se den cambios en la dependiente.
Ahora en este capítulo se analizará la correlación y regresión lineal múltiple, en donde
se incluyen más de una variable independiente, pues se sabe que cuando se analiza la
correlación existente entre dos variables el resultado puede ser muy poco confiable, por
lo que en la regresión múltiple se realizará el análisis con una variable dependiente, Y, y
dos o más variables independientes, X1, X2, X3, Xn, con el objetivo de aportar más
información al modelo, pudiendo así realizar estimaciones más confiables y precisas.
Además se podrá analizar cuál de ellas específicamente es la que más información
significativa aporta y cuál de ellas no, esto gracias a la evaluación de los coeficientes de
regresión individuales, con ello podremos tomar decisiones, según sea el caso, de
eliminar o de incorporar una variable independiente para lograr un modelo más
significativo y confiable.
A continuación se realizara la aplicación de ejercicios de regresión múltiple con lo
aprendido en clases, para lo que se inicia con la realización de encuestas a los
estudiantes de la carrera de Administración de Empresas determinando el tamaño de la
muestra mediante la fórmula aprendida en ciclos anteriores.
2. OBJETIVOS
Objetivo General.
Analizar si los gastos totales mensuales de las familias de una muestra de 80 alumnos de
la carrera de Administración de Empresas están relacionados con diferentes factores
como: número de integrantes, ingresos, arriendos, transporte, alimentación y servicios
básicos, en caso de que una o más variables no aporten con información, realizar la
prueba global e individual para saber cuál es la mejor alternativa para el modelo.
Objetivos Específicos.
Describir la relación entre dos o más variables independientes frente a una variable
dependiente, mediante el análisis de regresión múltiple.
Realizar una prueba global e individual para verificar si cada una de las variables
aportan o no con información al estudio.
3. MARCO TEÓRICO
Procedimiento que nos permite introducir más de una variable independiente para
aumentar la exactitud del estudio en relación a la variable dependiente.
Según los autores Levin, Richard I. y Rubin, David S. en el libro de Estadística para
Administración y Economía, Séptima Edicion; indica que debemos seguir los siguientes
pasos:
Método Determinante
Método Gauss Jordán
Método Sistemas de Ecuaciones
Tabla ANOVA
La aplicación de la tabla ANOVA con los conocimientos ya aprendidos anteriormente,
con la diferencia de que al momento de calcular los grado de libertad se calcularan de
diferente manera, donde:
K: Son los grados de liberta de la regresión y a su vez son las variables independientes
del modelo.
n-(k+1): Son los grados de libertad del error, con la adición de una unidad más por la
constante encontrada en la ecuación de regresión y las variables independientes.
n-1: Son los grados de libertad del total.
Es aquel que mide la separación de los datos del modelo, con respecto a la recta de
regresión.
∑ (Y −Y^ )2 =
S y .123 … k =
√ n−(k +1) √ SSE
n−(k +1)
Coeficiente de Determinación Múltiple
El valor que este más próximo a cero indica una relación débil entre las
variables.
El valor más próximo a uno identifica una relación fuerte entre estas variables.
SSR
R 2=
SStotal
Involucra más variables, se utiliza el estadístico Fisher (F); nos permite conocer si las
variables aportan o no aportan con información al modelo.
1. Planteamiento de Hipótesis
H 0 : β1 =β2 =β3 =β k =0
H 1: β1 ≠ β2 ≠ β3 ≠ βk ≠ 0
2. Nivel de Significancia
∝:
3. Estadístico de Prueba
SSR
MSR GL
F= =
MSE SSE
GL
4. Regla de Decisión
∝
{
VC = GLnumerador
GL denominador
5. Toma de Decisión
Si se acepta H 0, esto nos indica que ninguna variable aporta con la información
al modelo.
Si se rechaza H 0, esto nos indica que al menos una variable aporta con la
información al modelo.
Prueba Individual
Se utiliza el estadístico de prueba t, nos permite identificar las variables que aportan
información al modelo y teniendo así la potestad de eliminar aquellas variables que no
aporten información al modelo, es decir las variables que estén dentro de la región H 0.
1. Planteamiento de Hipótesis
H 0 : β1 =0 ; β2 =0 ; β3 =0 ; β k =0
H 1 : β 1 ≠ 0; β 2 ≠0 ; β 3 ≠0 ; β k ≠ 0
2. Nivel de Significancia
∝:
3. Estadístico de Prueba
b1−0 b −0 b −0 b −0
t 1= t2 = 2 t 3= 1 t k= k
Sb1 Sb 2 Sb 1 Sb k
4. Regla de Decisión
∝
{
VC= GL=n−(k +1)
dos colas
5. Toma de Decisión
Matriz de Correlación.
Análisis de la correlación existente entre las variables independientes, indicando la
relación en cada una de estas, en un rango de -0.7 y 0.70.
VIF.
Análisis de correlación de variables independientes, la variable independiente a analizar
será la variable dependiente y el resto de variables independientes seguirán como
independientes.
N x Z2 x p x q
n= 2 2
e x ( N−1 )+ Z x p x q
N= Dato poblacional
Z= Nivel de confianza
p= Probabilidad de éxito, cuando no se tiene este valor se utiliza un valor de 0.5
q= Probabilidad de Fracaso, este valor se obtiene de la diferencia de 1 – p
e= Error máximo admisible, cuando no se tiene este valor se utiliza un valor entre 0.01
y 0.09
Tabla ANOVA
Grados de Suma de Promedio de
libertad cuadrados los cuadrados F
Regresión 6 3208996,72 534832,787 263,699378
Residuos 73 148057,966 2028,19131
Total 79 3357054,69
PRUEBA GLOBAL 1
1) Planteamiento de Hipótesis
H 0 : β k =0
H1: βk ≠ 0
∝=0,05
3) Estadístico de Prueba
F=263,70
4) Regla de Decisión
5) Toma de Decisión
PRUEBAS INDIVIDUALES 1
1. Planteamiento de Hipótesis.
H 0 : β1 =0 H 0 : β2 =0 H 0 : β3 =0 H 0 : β 4=0 H 0 : β5 =0 H 0 : β6 =0
H1: β1 ≠ 0 H 1: β2 ≠ 0 H1: β3 ≠ 0 H1: β 4≠ 0 H1: β5 ≠ 0 H 1: β6 ≠ 0
2. Nivel de Significancia.
X1 : X2 : X3 : X 4: X5 : X6 :
∝=0.05 ∝=0.05 ∝=0.05 ∝=0.05 ∝=0.05 ∝=0.05
3. Estadístico de Prueba.
b−0
t=
Sb
X1 : X2 : X3 : X 4: X5 : X6 :
4. Regla de Decisión.
∝=0.05
Valor
GL = n-(k+1) = 80 – (6+1) = 73 ±1,993
Crítico
2 colas
1
VIF= =2,17
1−0,54
Es menor que su límite de 10, indica que la variable independiente, integrantes, no está
muy correlacionada con las demás variables independientes.
VIF 2
Estadísticas de la regresión
Coeficiente de correlación 0,91412373
múltiple 2
Coeficiente de determinación 0,83562219
R^2 8
R^2 ajustado 0,82451559
86,7827835
Error típico 9
Observaciones 80
1
VIF= =5,88
1−0,83
Es menor que su límite de 10, indica que la variable independiente, ingresos, no está
muy correlacionada con las demás variables independientes.
VIF 3
Estadísticas de la regresión
Coeficiente de correlación 0,62201487
múltiple 8
0,38690250
Coeficiente de determinación R^2 8
0,34547700
R^2 ajustado 2
86,9288854
Error típico 6
Observaciones 80
1
VIF= =1,64
1−0,39
Es menor que su límite de 10, indica que la variable independiente, arriendo, no está
muy correlacionada con las demás variables independientes.
VIF 4
Estadísticas de la regresión
Coeficiente de correlación 0,81489748
múltiple 2
0,66405790
Coeficiente de determinación R^2 7
0,64135911
R^2 ajustado 6
17,5503635
Error típico 7
Observaciones 80
1
VIF= =2,94
1−0,66
Es menor que su límite de 10, indica que la variable independiente, transporte, no está
muy correlacionada con las demás variables independientes.
VIF 5
Estadísticas de la regresión
Coeficiente de correlación
múltiple 0,76025138
0,57798216
Coeficiente de determinación R^2 1
0,54946744
R^2 ajustado 2
73,0022457
Error típico 4
Observaciones 80
1
VIF= =2,38
1−0,58
VIF 6
Estadísticas de la regresión
Coeficiente de correlación 0,90009338
múltiple 7
0,81016810
Coeficiente de determinación R^2 6
0,79734162
R^2 ajustado 7
12,2127451
Error típico 3
Observaciones 80
1
VIF= =5,27
1−0,81
Es menor que su límite de 10, indica que la variable independiente, servicios básicos, no
está muy correlacionada con las demás variables independientes.
Coeficiente de correlación:
Estadísticas de la regresión
Coeficiente de correlación 0,9771934
múltiple 6 Tabla ANOVA
Coeficiente de Grados Promedio
0,9549070
determinación R^2de Suma de de7 los
libertad cuadrados cuadrados
0,9518602 F
R^2 ajustado 3205675,2 641135,04
5 313,41107
Regresión 5 4
45,229063 9 1
Error típico 151379,44 2045,6681
2
Residuos
Observaciones 74 4 80 6
3357054,6
Total 79 9
PRUEBA GLOBAL 2
1) Planteamiento de Hipótesis
H 0 : β k =0
H1: βk ≠ 0
2) Establecer el nivel de significancia
∝=0,05
3) Estadístico de Prueba
F=313,41
4) Regla de Decisión
5) Toma de Decisión
PRUEBAS INDIVIDUALES 2
1. Planteamiento de Hipótesis.
H 0 : β1 =0 H 0 : β2 =0 H 0 : β3 =0 H 0 : β 4=0 H 0 : β5 =0
H1: β1 ≠ 0 H 1: β2 ≠ 0 H1: β3 ≠ 0 H1: β 4≠ 0 H1: β5 ≠ 0
2. Nivel de Significancia.
X1 : X2 : X3 : X 4: X5 :
∝=0.05 ∝=0.05 ∝=0.05 ∝=0.05 ∝=0.05
3. Estadístico de Prueba.
b−0
t=
Sb
X1 : X2 : X3 : X 4: X5 :
4. Regla de Decisión.
∝=0.05
Valor
GL = n-(k+1) = 80 – (5+1) = 74 ±1,993
Crítico
2 colas
5. Toma de Decisión.
En conclusión, con un nivel de significancia de 0.05 y obteniendo un valor crítico de
±1,993 las variables independientes que aportan información necesaria en nuestro
modelo son: el número de integrantes (X1), ingresos (X2), arriendo (x3), transporte (x4)
y alimentación (x5), es decir, todas las variables aportan información; por lo que se
rechaza la hipótesis nula.
SERVICI
N° OS
INTEGRA INGRES ARRIEN TRANSP ALIMENTA BASICO
NTES OS DO ORTE CION S
N°
INTEGRAN
TES 1
0,637855
INGRESOS 079 1
0,173949 0,41836
ARRIENDO 656 9227 1
TRANSPO 0,465499 0,70678 0,00071
RTE 03 9861 7803 1
ALIMENTA 0,590749 0,69093 0,20291 0,422597
CION 8 7257 2629 348 1
SERVICIO
S 0,719818 0,83809 0,20319 0,719851 0,7028645
BASICOS 994 5679 7436 431 44 1
6. ANEXOS
Tabulación
Resumen
Estadísticas de la regresión
Coeficiente de correlación
múltiple 0,97769958
Coeficiente de determinación R^2 0,955896469
R^2 ajustado 0,952271521
Error típico 45,03544503
Observaciones 80
ANÁLISIS DE VARIANZA
Grados Promedio
de Suma de de los
libertad cuadrados cuadrados F
Regresión 6 3208996,72 534832,79 263,6993781
Residuos 73 148057,966 2028,1913
Total 79 3357054,69
Pronóstico
Observación GASTOS Residuos
1 560,50092 -10,50092
2 543,8445342 36,1554658
3 692,7201317 -2,7201317
4 797,9999057 162,000094
5 391,1334902 38,8665098
6 925,3859856 64,6140144
7 857,244175 -77,244175
8 519,7398467 70,2601533
9 731,7750581 18,2249419
10 469,3793916 80,6206084
11 1221,906099 -46,906099
12 1489,094114 -29,094114
13 862,2727118 -12,272712
14 314,8100961 -14,810096
15 721,2456291 -21,245629
16 701,2837238 18,7162762
17 620,7740161 29,2259839
18 653,023198 26,976802
19 541,3788996 -41,3789
20 1244,475455 -44,475455
21 773,4699807 26,5300193
22 640,7179786 -0,7179786
23 499,2418919 0,75810812
24 1175,269892 74,7301077
25 381,3630387 -6,3630387
26 921,3391977 -21,339198
27 958,2951987 -8,2951987
28 752,6137025 47,3862975
29 593,7762715 6,22372851
30 686,4719383 3,52806169
31 679,2311266 40,7688734
32 619,9303214 -19,930321
33 458,1901349 -33,190135
34 595,8042204 4,19577961
35 669,5961331 -49,596133
36 461,1207171 -11,120717
37 614,7557265 85,2442735
38 547,3588618 2,64113822
39 783,1614723 -33,161472
40 644,6286237 105,371376
41 636,9280972 -136,9281
42 502,3751872 -2,3751872
43 485,6406018 14,3593982
44 801,7963981 -1,7963981
45 626,4912973 -26,491297
46 516,4003605 -16,40036
47 699,7666719 -49,766672
48 328,6129535 -28,612953
49 463,7503823 -13,750382
50 783,1899685 66,8100315
51 611,9745026 -11,974503
52 629,7702027 -29,770203
53 495,3068369 54,6931631
54 435,1681492 14,8318508
55 601,9854927 -1,9854927
56 652,9316666 -52,931667
57 663,4531124 -13,453112
58 449,0603595 0,93964049
59 530,1067509 19,8932491
60 522,334434 -22,334434
61 625,1785692 24,8214308
62 455,0058598 -5,0058598
63 553,7000023 -3,7000023
64 569,6862042 -19,686204
65 759,48967 -9,48967
66 645,3034286 -45,303429
67 509,2276028 -9,2276028
68 856,8770322 -6,8770322
69 673,4828345 -23,482835
70 575,610741 -25,610741
71 577,8358976 -27,835898
72 669,4213216 30,5786784
73 502,3396287 -2,3396287
74 623,0363665 26,9636335
75 731,2044159 18,7955841
76 446,0647446 3,93525538
77 407,6985698 -57,69857
78 528,2634749 -78,263475
79 566,5420552 -16,542055
80 645,6643457 4,33565434
0
0 1 2 3 4 5 6 7 8 9
-100
-200
N° INTEGRANTES
0
200 400 600 800 1000 1200 1400 1600
-100
-200
INGRESOS
0
0 50 100 150 200 250 300 350 400 450 500
-100
-200
ARRIENDO
TRANSPORTE Gráfico de los residuales
200
100
Residuos
0
0 20 40 60 80 100 120 140 160 180 200
-100
-200
TRANSPORTE
0
0 100 200 300 400 500 600 700 800
-100
-200
ALIMENTACION
Encuesta
UNIVERSIDAD DE CUENCA
FACULTAD DE CIENCIAS ECONOMICAS Y ADMINISTRATIVAS
ADMINISTRACIÓN DE EMPRESAS
*Conteste las siguientes preguntas, tomando en cuenta que se trata de gastos mensuales
de toda la familia.
3. Su vivienda es:
Propia ________
Arrendada ________ Pago mensual ________ $
4. ¿Cuánto gastan mensualmente en transporte?
________ $
GRACIAS.
Tabla t
Tabla F