Sie sind auf Seite 1von 49

UNIVERSIDAD NACIONAL ABIERTA

VICERRECTORADO ACADEMICO
AREA DE MATEMATICA

TRABAJO PRCTICO
ESTADISTICA APLICADA (746)

JOSE GREGORIO SANCHEZ CASANOVA


C.I. V-9223081
CARRERA: 610
SECCION N 1

SAN CRISTOBAL, JULIO DE 2011


.

UNIVERSIDAD NACIONAL ABIERTA


VICERRECTORADO ACADMICO
COORDINACIN DE EVALUACIN ACADMICA

TAREA:

TRABAJO PRCTICO

ASIGNATURA:

ESTADISTICA APLICADA

CDIGO:

746

FECHA DE ENTREGA :

26 DE JULIO DE 2011.

NOMBRE DEL ESTUDIANTE: JOSE GREGORIO SANCHEZ CCDULA DE IDENTIDAD:

V- 9.223.081

CENTRO LOCAL:

TACHIRA

CARRERA:

CONTADURA PBLICA.

NUMERO DE ORIGINALES:

01

FIRMA DEL ESTUDIANTE:

INTRODUCCION

Dentro del proceso administrativo, normalmente se encuentran situaciones en las cuales la


toma de decisiones es imprescindible y necesaria para apoyar o cambiar ciertas estrategias y
actividades comunes en la lnea de trabajo de una organizacin.
Cada gerente debe contar con las herramientas adecuadas para el estudio y comprensin
del manejo de las variables. La estadstica, es una de las ms prcticas y esquemticas con las
que se puede conseguir las proyecciones ms adecuadas para determinar el comportamiento de
la linera de produccin y sus elementos.
Dentro de las mltiples aplicaciones del estudio administrativo cabe destacar la presencia
del anlisis estadstico en el campo de la Educacin, herramienta bsica e importante para poder
realizar proyecciones del comportamiento de las calificaciones y promedios de cada estudiante
para su respectivo seguimiento dentro del perodo acadmico en curso. Del mismo modo como la
Estadstica Inferencial nos permite trabajar con una variable a nivel de intervalo o razn, as
tambin se puede comprender la relacin de dos o ms variables y nos permitir relacionar
mediante ecuaciones, una variable en relacin de la otra variable llamndose Regresin Lineal y
una variable en relacin a otras variables llamndose Regresin mltiple.
En el informe que se presenta a continuacin, se puede conseguir una muestra de lo que
representa un trabajo de la descripcin de conjuntos de datos y la inferencia a partir de la
informacin recolectada de un fenmeno de inters. En este caso, la funcin principal de la
estadstica. abarca: Resumir, Simplificar, Comparar, Relacionar, y Proyectar un estudio de
factores o variables sobre una de las actividades importantes de una organizacin, en el caso de
estudio especfico relacin de variables independientes con el Promedio de Calificaciones de los
alumnos para un Lapso Acadmico.
Dicho informe, se encuentra estructurado en 2 partes, la primera en la cual se trata de
establecer la relacin del promedio de calificaciones de un estudiante con un grupo de variables
personales, a saber ( edad, peso y estatura), y la segunda parte se relaciona el promedio de
calificaciones del estudiante con un grupo de variables denominadas de ajuste a saber (conducta,
mritos e inasistencias), a cada uno de los grupos de variables se les aplico el anlisis de
regresin lineal, estructurado de la siguiente forma: cuadro resumen, anlisis de varianza,
intervalos de confianza, anlisis de residuales, grficos de los residuales, curva de regresin
ajustada y grafico de probabilidad normal.
Finalmente se realizan las conclusiones definitivas del estudio de ambos casos y se
establece la correlacin o no de las variables personales y de ajuste con respecto al promedio de
calificaciones de un estudiante en un lapso.

TABLA DE CONTENIDOS

1.- Bases Tericas.


2.- Desarrollo del Caso.
3.- CASO N 1.- Relacin del Promedio del estudiante con Edad, Peso y Estatura
3.1.- Anlisis de Regresin: (Promedio, con Edad, Peso y Estatura )
3.2.- Anlisis de Regresin: (Promedio con Edad y Peso )
3.3.- Anlisis de Regresin: (Promedio con Peso y Estatura)
4.- CASO N 2.- Relacin del Promedio del Estudiante con Conducta, Mritos e Inasistencias)
4.1.- Anlisis de Regresin: (Promedio con Conducta, Mritos e Inasistencias )
4.2.- Anlisis de Regresin: (Promedio con Conducta y Mritos )
4.3.- Anlisis de Regresin: (Promedio con Mritos e Inasistencias)
5.- Conclusiones.
6.- Bibliografa.

BASES TEORICAS

REGRESION MULTIPLE

Se define como un procedimiento mediante el cual se trata de determinar si existe o no


relacin de dependencia entre dos o ms variables. Es decir, conociendo los valores de una
variable independiente, se trata de estimar los valores, de una o ms variables dependientes.
Este tipo se presenta cuando dos o ms variables independientes influyen sobre una variable
dependiente. Ejemplo: Y = f(x, w, z). La regresin en forma grafica, trata de lograr que una
dispersin de las frecuencias sea ajustada a una lnea recta o curva.
CLASES DE REGRESIN
La regresin puede ser Lineal y Curvilnea o no lineal, ambos tipos de regresin pueden
ser a su vez:
Esta regresin se utiliza con mayor frecuencia en las ciencias econmicas, y sus
disciplinas tecnolgicas. Cualquier funcin no lineal, es linealizada para su estudio y efectos
prcticos en las ciencias econmicas, modelos no lineales y lineales multiecuacionales.
Se utiliza la regresin lineal simple para:
1.- Determinar la relacin de dependencia que tiene una variable respecto a otra.
2.- Ajustar la distribucin de frecuencias de una lnea, es decir, determinar la forma de la
lnea de regresin.
3.- Predecir un dato desconocido de una variable partiendo de los datos conocidos de otra
variable.

Anlisis de Regresin Mltiple


Dispone de una ecuacin con dos variables independientes adicionales: Se puede ampliar
para cualquier nmero "m" de variables independientes: Para poder resolver y obtener y en una
ecuacin de regresin mltiple el clculo se presenta muy tediosa porque se tiene atender 3
ecuaciones que se generan por el mtodo de mnimo de cuadrados:

Anlisis de regresin.Es la tcnica empleada para desarrollar la ecuacin y dar las estimaciones.

Anlisis de regresin y Correlacin Mltiple.Consiste en estimar una variable dependiente, utilizando dos o ms variables
independientes

Ecuacin de Regresin.- es una ecuacin que define la relacin entre dos variables.
Ecuacin de regresin Lineal: Y = a + Bx
Ecuacin de regresin Lineal Mltiple: Y = a + b1X1 + b2X2 + b3X3...

Coeficiente de RegresinDescribe la intensidad de la relacin entre dos conjuntos de variables de nivel de intervalo.
Es la medida de la intensidad de la relacin lineal entre dos variables. El valor del coeficiente de
correlacin puede tomar valores desde menos uno hasta uno, indicando que mientras ms
cercano a uno sea el valor del coeficiente de correlacin, en cualquier direccin, ms fuerte ser
la asociacin entre las variables. Mientras ms cercano a cero sea el coeficiente de correlacin
indicar que ms dbil es la asociacin entre las variables. Si es igual a cero se concluir que no
existe relacin lineal alguna entre ambas variables. En otras palabras dicho coeficiente Indica el
nmero de unidades en que se modifica la variable dependiente "Y" por efecto del cambio de la
variable independiente "X" o viceversa en una unidad de medida.
Clases de coeficiente de Regresin:
El coeficiente de regresin puede ser: Positivo, Negativo y Nulo.
Es positivo cuando las variaciones de la variable independiente X son directamente
proporcionales a las variaciones de la variable dependiente "Y"
Es negativo, cuando las variaciones de la variable independiente "X" son inversamente
proporcionales a las variaciones de las variables dependientes "Y"
Es nulo o cero, cuando entre las variables dependientes "Y" e independientes "X" no
existen relacin alguna.

DESARROLLO DEL CASO

Considerando la importancia que tiene el estudio y seguimiento de los promedios


estudiantiles para el logro del cumplimiento de metas y desarrollo de las competencias
acadmicas en el ao escolar, la U.E. Colegio Los pirineos Don Bosco desea saber la relacin
que existe entre el promedio de calificaciones de un estudiante del 5to ao de Educacin Bsica
en un lapso acadmico, con dos grupos de variables, a saber, un grupo de aspectos personales
al estudiante como son (Edad, Peso y Estatura) y el segundo grupo con variables inherentes al
ajuste acadmico al final de cada lapso acadmico, (Conducta, Mritos e inasistencias).
La Data, se tom en funcin del total de estudiantes del 5to ao de Bachillerato, el cual
comprende un nmero de 131, con:
Zc2 = 95% (Confianza),
P = 5% (Proporcin Esperada),
Q = (1-P = 1-0.05 = 0.95),
d = 3% (Previsin),
Se aplico la siguiente ecuacin:

N * Zc2 * p * q
n = __________________

= 79.82 80 estudiantes y promedios.

d2 * (N-1) + Zc2 *p * q

Luego del total de 131 estudiantes se seleccionaron al azar y se tomaron los 80 registros
de su promedio de calificaciones, y de las dems variables tanto del grupo personal como del
grupo de ajuste, ya que son valores que se encuentran registrados en las planillas de trabajo de
la Coordinacin del mismo grado.

CASO NUMERO 1:
RELACION DEL PROMEDIO CON EDAD PESO Y ESTATURA DEL
ESTUDIANTE
TABLA DE DATOS ANALISIS 1
PROMEDIO Vs EDAD, PESO Y ESTATURA
ASPECTOS PERSONALES DEL ESTUDIANTE

NUMERO

Y = PROMEDIO

X1 =EDAD

X2 = PESO

X3 = ESTATURA

16

15

54

1,65

15,9

15

65

1,7

14,6

16

70

1,74

15

17

72

1,65

19,2

15

78

1,63

18,1

16

56

1,55

14,2

16

55

1,59

16,4

17

54

1,61

12,6

18

50

1,63

10

19,9

15

60

1,68

11

11,3

15

78

1,8

12

16,6

16

71

1,77

13

15,8

16

68

1,66

14

19

16

69

1,64

15

18,6

17

58

1,69

16

12,7

18

56

1,58

17

17,3

16

54

1,57

18

11,7

16

52

1,63

19

16,2

15

60

1,55

20

11,7

16

65

1,54

21

11,6

16

68

1,68

22

16,1

17

78

1,77

23

12,7

16

80

1,83

24

19,6

18

54

1,5

25

14,8

15

65

1,56

26

12,2

15

63

1,66

27

11,27

15

54

1,59

28

15

57

1,61

29

12,9

15

50

1,63

30

19,9

16

48

1,54

31

15,7

17

49

1,59

32

15,8

17

47

1,57

33

15,9

16

56

1,63

34

14,6

16

64

1,67

35

17,8

17

67

1,68

36

13,7

17

50

1,57

37

19,2

18

51

1,59

38

18

15

48

1,6

39

20

15

52

1,6

40

10,55

16

57

1,63

41

8,5

17

49

1,63

42

14,1

16

62

1,6

43

16

61

1,62

44

15,8

16

80

1,77

45

12,4

17

56

1,6

46

15,1

16

64

1,71

47

20

16

75

1,75

48

15,8

17

66

1,71

49

15

17

68

1,7

50

14,6

17

71

1,73

51

13,5

17

72

1,67

52

14,5

18

49

1,56

53

18

16

48

1,56

54

12,8

16

50

1,57

55

13,5

16

49

1,58

56

14

17

49

1,62

57

13,3

17

61

1,65

58

18

16

52

1,62

59

12,1

17

53

1,66

60

16,4

16

50

1,56

61

12,8

17

47

1,6

62

16,6

16

46

1,57

63

12,1

16

48

1,55

64

18,2

17

49

1,59

65

12,7

17

50

1,61

66

9,2

16

49

1,64

67

15,3

18

48

1,66

68

15,4

17

51

1,7

69

14,6

16

53

1,68

70

19,2

17

60

1,71

71

13,2

16

83

1,77

72

10,8

18

71

1,76

73

18,8

18

73

1,74

74

17,5

17

60

1,68

75

13,5

16

72

1,7

76

12,9

16

79

1,71

77

11,64

16

49

1,64

78

10,36

16

62

1,67

79

9,2

16

63

1,66

80

12,7

16

54

1,6

Fuente: Documentos pertenecientes a la Coordinacin de 5to ao del Plantel

ANALISIS DEL MODELO DE REGRESION MULTIPLE 1.


(PROMEDIO Vs EDAD, PESO Y ESTATURA)

CUADRO RESUMEN:

Estadsticas de la regresin
Coeficiente de correlacin
mltiple
0,13331223
Coeficiente de determinacin
R^2
0,01777215
R^2 ajustado
Error tpico
Observaciones

-0,021
3,03518381
80

La tabla anterior muestra un resumen, de los indicadores presentes del promedio de 80


estudiantes seleccionados al azar de una poblacin de 131, el coeficiente de correlacin mltiple
permite observar un relacin entre las variables X1 ( Edad ), X2 ( Peso ), X3

( Estatura )

asociadas a la variable dependiente Y ( Promedio ), las que se encuentran asociadas en forma


directa de una manera muy dbil con la variable dependiente, en un porcentaje del 13.33%, en un
rango 0.1333 < 0.40, observndose que se encuentra muy alejado de los valores de relacin
directa (-1, 1), y a su vez se encuentran muy cercanos a cero.

Segn el Coeficiente de Determinacin, se seala que un 1,77% de los promedios pueden


ser explicadas por la relacin de la edad, el peso y la estatura.

Del mismo modo, este resultado es de esperarse tal cual se evidencia que el R^2 ajustado
es inferior al R^2 normal.

Tomando en cuenta el error tpico, se observa que la desviacin de los residuos existente
entre los valores de Y = promedio y los que se determinan por la recta de regresin es de 3 .035
puntos.

Utilizando las formulas de las ecuaciones normales a los datos obtendremos los
coeficientes de regresin o utilizando Regresin de Anlisis de datos, en la Hoja de Clculo de
Excel podemos calcular tambin los coeficientes de regresin

ANALISIS DE VARIANZA:

Regresin
Residuos
Total

Grados de
libertad
3
76
79

Suma de
cuadrados
12,6680958
700,137899
712,805995

Promedio de los
cuadrados
4,222698594
9,212340779

F
0,45837412

Valor crtico de
F
0,712173693

Prueba Global: Verificacin de la validez del modelo de Regresin Mltiple.

Formulacin de Hiptesis:
Hp: B1 = B2 = 0
En el cuadro del anlisis de la varianza se puede determinar que el valor del F critico para
3 grados de libertad es de 0.7121 y el F calculado es de 0.4588, por lo que es menor que el F
critico, y de esta manera se acepta la hiptesis lo que significa que ninguno de los factores (X1,
X2, X3) son relevantes para explicar los cambios en Y.

Coeficientes

Error tpico

Estadstico t

Intercepcin

19,91466651 11,33475816 1,756955571

EDAD X1

0,279355699 0,401477967 0,695818257

PESO X2

0,04700495 0,051555881 0,911728181


-7,64661444 7,424712975 1,029886874

ESTATURA X3

Probabilidad

Inferior
95%

0,08295291 2,66046051
0,48866503 0,52025696
0,364794755 0,05567749
0,306329608 22,4342117

Superior
95%

Inferior
95,0%

Superior
95,0%

42,4897935

-2,6604605 42,48979352

1,07896836

-0,520257 1,078968358

0,14968738

-0,0556775 0,149687385

7,1409828

-22,434212 7,140982796

Para el anlisis realizado anteriormente del resumen, Se observa un nivel muy bajo de
confiabilidad de los resultados, por lo tanto, se determina que no se requiere construir una
ecuacin de regresin, debido a que el modelo no representa al fenmeno estudiado.
INTERVALOS DE CONFIANZA:

Los intervalos de confianza son los siguientes:


-2.66046051

<

19.91466651

<

42.48979352

-0.52025696

<

0.279355699

<

1.078968358

-0.05567749

<

0.04700495

<

0.149687385

-22.452117

<

-7.64661444

<

7.140982796

ANALISIS DE RESIDUALES

Observacin
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29

Pronstico
PROMEDIO
14,026355
14,161079
14,369595
15,431156
15,307407
15,164383
14,811513
14,890931
14,829335
14,078987
14,007482
14,187202
14,887314
15,087252
14,467222
15,493695
14,91744
14,364634
15,073047
15,663893
14,734382
14,795592
14,151449
16,011415
15,231605
14,372934
14,485152
14,473235
13,991268

Residuos
1,9736445
1,7389208
0,2304049
-0,431156
3,8925935
2,9356175
-0,611513
1,5090686
-2,2293351
5,8210133
-2,7074821
2,4127984
0,9126857
3,9127484
4,1327779
-2,7936955
2,3825597
-2,6646336
1,1269534
-3,9638932
-3,134382
1,3044081
-1,4514493
3,5885853
-0,4316052
-2,1729339
-3,2151523
-5,4732349
-1,091268

Residuos
estndares
0,66296513
0,5841193
0,07739511
-0,1448292
1,30755751
0,98610059
-0,2054128
0,50690984
-0,7488539
1,95533125
-0,9094678
0,81048091
0,30657941
1,31432776
1,38823766
-0,9384277
0,80032345
-0,8950746
0,37855389
-1,3315077
-1,0528674
0,43816253
-0,487555
1,2054384
-0,1449801
-0,7299082
-1,0799989
-1,8385093
-0,3665668

30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80

14,864809
14,808839
14,867761
14,552653
14,622828
14,966733
15,008776
15,182205
14,126656
14,314676
14,599658
14,502974
15,064081
14,864144
14,610246
15,061407
14,316964
14,528154
14,690329
14,860805
14,772422
15,278224
15,317593
14,711877
14,729421
14,605949
14,579441
14,914102
14,4411
14,461596
14,805887
14,638363
14,541401
14,788343
14,808839
14,702912
14,147153
14,505927
14,061721
14,029308
14,4083
14,751261
14,822379
15,069321
14,637698
14,76947
15,022038
14,147153
14,528818
14,65229
14,688042

5,0351909
0,891161
0,9322386
1,3473466
-0,0228284
2,8332672
-1,3087762
4,0177954
3,8733435
5,6853237
-4,0496583
-6,0029744
-0,9640815
-6,8641442
1,1897539
-2,6614075
0,7830362
5,4718463
1,1096706
0,1391946
-0,1724219
-1,7782237
-0,8175931
3,2881232
-1,9294205
-1,1059494
-0,5794405
-1,6141015
3,5589003
-2,3615958
1,5941133
-1,8383629
2,0585993
-2,6883429
3,391161
-2,0029116
-4,9471526
0,7940733
1,3382787
0,5706922
4,7917003
-1,551261
-4,0223791
3,7306787
2,8623019
-1,2694695
-2,122038
-2,5071526
-4,1688185
-5,4522896
-1,9880419

1,69136639
0,29934908
0,31314743
0,45258598
-0,0076683
0,95172021
-0,4396298
1,34961399
1,30109128
1,9097519
-1,360317
-2,0164536
-0,3238437
-2,3057284
0,39964914
-0,893991
0,26302898
1,8380429
0,37274844
0,04675672
-0,0579181
-0,5973215
-0,274637
1,10451047
-0,6481099
-0,3714985
-0,1946393
-0,5421914
1,19546695
-0,7932815
0,53547716
-0,6175228
0,6915022
-0,9030388
1,1391218
-0,6727962
-1,6617935
0,26673643
0,44953998
0,1917007
1,60957567
-0,5210827
-1,3511537
1,25316887
0,96147321
-0,4264264
-0,7128119
-0,8421753
-1,400344
-1,8314736
-0,6678013

GRAFICOS DE LOS RESIDUALES:

Con respecto al analisis de los residuales a travs de las grficas se observa que siguen
un comportamiento ajustado a los valores que conforman la data, en el sentido que la estatura se
concentra en un intervalo de 1.50 a 1.80m aproximadamente, el peso entre los 45 y 82 kilogramos
y la edad se encuentra bien estratificada en los 4 valores principales 15, 16, 17 y 18 aos, dando
mayor densidad poblacional a la edad de 16 aos
Destaca que los 3 grficos marcan una anchura de banda de residuos constante entre 5 y
-5, en el eje de las ordenadas de las respectivas curvas

CURVA DE REGRESION AJUSTADA

Para las 3 curvas de regresin ajustada se observa que no se registra la marca de una
linea que comprenda a todos los puntos a lo largo de los estudios,en cada uno de los intervalos
de las 3 variables independientes con respecto a la variable Y, por el contrario, los puntos
quedan fuera de la curva, por lo que las variables independientes ( eje horizontal ) no se
relacionan linealmente con la variable dependiente Y ( promedio)

GRAFICO DE PROBABILIDAD NORMAL

El grfico de probabilidad normal evidencia que los errores tienen una distribucin
aproximadamente Normal.

ANALISIS DEL MODELO DE REGRESION MULTIPLE 2.


(PROMEDIO Vs EDAD Y PESO)

CUADRO RESUMEN:

Estadsticas de la regresin
Coeficiente de correlacin
mltiple
0,0637498
Coeficiente de determinacin
R^2
0,00406404
R^2 ajustado
0,02180443
Error tpico
3,03637926
Observaciones
80

La tabla anterior muestra un resumen, de los indicadores presentes del promedio de 80


estudiantes seleccionados al azar de una poblacin de 131, el coeficiente de correlacin mltiple
permite observar un relacin entre las variables X1 ( Edad ), X2 ( Peso ), asociadas a la variable
dependiente Y ( Promedio ), las que se encuentran asociadas en forma directa de una manera
muy dbil con la variable dependiente, en un porcentaje del 6.37%, en un rango 0.0637 < 0.40,
observndose que se encuentra muy alejado de los valores de relacin directa (-1, 1), y a su vez
muy cercanos a cero.

Segn el Coeficiente de determinacin, se seala que un 0.4% de los promedios pueden


ser explicadas por la relacin de la edad y el peso.

Segn este resultado es de esperarse tal cual se evidencia que el R^2 ajustado es inferior
al R^2 normal.

Tomando en cuenta el error tpico, se observa que la desviacin de los residuos existente
entre los valores de Y = promedio y los que se determinan por la recta de regresin es de 3 .036
puntos.

Utilizando las formulas de las ecuaciones normales a los datos obtendremos los
coeficientes de regresin o utilizando Regresin de Anlisis de datos, en la Hoja de Clculo de
Excel podemos calcular tambin los coeficientes de regresin

ANALISIS DE VARIANZA:

Regresin
Residuos
Total

Grados de
libertad
2
77
79

Promedio
Suma de
de los
Valor crtico
cuadrados cuadrados
F
de F
2,89687016 1,44843508 0,15710391 0,85488849
709,909125 9,21959902
712,805995

Prueba Global: Verificacin de la validez del modelo de Regresin Mltiple.

Formulacin de Hiptesis:
Hp: B1 = B2 = 0
En el cuadro del anlisis de la varianza se puede determinar que el valor del F critico para
2 grados de libertad es de 0.8548 y el F calculado es de 0.1571, por lo que es menor que el F
critico, y de esta manera se acepta la hiptesis lo que significa que ninguno de los factores (X1,
X2,) son relevantes para explicar los cambios en Y.

Coeficientes

Error tpico

Estadstico t

Intercepcin

10,76321036

7,039659634 1,528939028

EDAD

0,214929607

0,396730585 0,541752048

PESO

0,007248182

0,034186752 0,212017272

Probabilidad

Inferior 95%

Superior
95%

Inferior
95,0%

Superior
95,0%

-3,2545426 24,78096332 3,254542605 24,78096332


0,589553578 -0,5750619 1,004921115 0,575061901 1,004921115
0,832653775 -0,06082634 0,075322701 0,060826337 0,075322701
0,130377444

Segn el anlisis realizado anteriormente del resumen, con el nivel tan bajo de
confiabilidad de los resultados, se determina que no se requiere construir una ecuacin de
regresin.

INTERVALOS DE CONFIANZA:

Los intervalos de confianza son los siguientes:


-3.2545426

<

10.76321036

<

24.78096332

-0.5750619

<

0.214929607

<

1.004921115

-0.06082634

<

0.007248182

<

0.075322701

ANALISIS DE RESIDUALES
Observacin
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

Pronstico
PROMEDIO
14,3785563
14,4582863
14,7094568
14,9388828
14,5525126
14,6079823
14,6007341
14,8084155
14,9943524
14,4220454
14,5525126
14,716705
14,6949604
14,7022086
14,8374082
15,0378415
14,5934859
14,5789895
14,4220454
14,6732159
14,6949604
14,9823719
14,7819386
15,0233451
14,4582863
14,4437899
14,3785563
14,4003008
14,3495636
14,5499968
14,7721746

Residuos Residuos estndares


1,62144372
0,5408963
1,44171372
0,4809403
-0,1094568
-0,036514
0,06111723
0,0203881
4,64748735
1,5503522
3,49201775
1,1648999
-0,4007341
-0,133681
1,5915845
0,5309356
-2,3943524
-0,79873
5,47795463
1,8273873
-3,2525126
-1,085004
1,88329502
0,6282471
1,10503956
0,3686294
4,29779138
1,4336974
3,76259178
1,2551605
-2,3378415
-0,779879
2,70651411
0,9028643
-2,8789895
-0,9604
1,77795463
0,5931067
-2,9732159
-0,991833
-3,0949604
-1,032446
1,11762814
0,3728288
-2,0819386
-0,694513
4,5766549
1,5267233
0,34171372
0,1139921
-2,2437899
-0,748504
-3,1085563
-1,036981
-5,4003008
-1,801483
-1,4495636
-0,483559
5,3500032
1,784704
0,92782541
0,3095127

32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80

14,7576782
14,6079823
14,6659677
14,9026419
14,7794228
15,0016006
14,3350672
14,3640599
14,6152304
14,7721746
14,6514713
14,6442232
14,7819386
14,8229119
14,6659677
14,7456977
14,8953937
14,90989
14,9316346
14,9388828
14,9871042
14,5499968
14,5644932
14,557245
14,7721746
14,8591528
14,5789895
14,8011673
14,5644932
14,7576782
14,5355004
14,5499968
14,7721746
14,7794228
14,557245
14,979856
14,7866709
14,5862377
14,8519046
14,8036832
15,1465642
15,1610606
14,8519046
14,7239532
14,7746904
14,557245
14,6514713
14,6587195
14,5934859

1,04232178
1,29201775
-0,0659677
2,89735814
-1,0794228
4,19839944
3,66493281
5,63594008
-4,0652304
-6,2721746
-0,5514713
-6,6442232
1,01806138
-2,4229119
0,43403229
5,25430229
0,90460632
0,09010996
-0,3316346
-1,4388828
-0,4871042
3,4500032
-1,7644932
-1,057245
-0,7721746
-1,5591528
3,42101048
-2,7011673
1,83550684
-1,9576782
2,06449957
-2,4499968
3,42782541
-2,0794228
-5,357245
0,32014399
0,61332905
0,01376229
4,34809541
-1,6036832
-4,3465642
3,63893944
2,64809541
-1,2239532
-1,8746904
-2,917245
-4,2914713
-5,4587195
-1,8934859

0,3477074
0,4310033
-0,022006
0,9665278
-0,360084
1,4005413
1,2225825
1,8800895
-1,356118
-2,092331
-0,183965
-2,216442
0,3396144
-0,808258
0,1447885
1,7527792
0,301767
0,0300597
-0,11063
-0,479996
-0,162493
1,1508843
-0,588616
-0,352686
-0,257589
-0,520117
1,1412126
-0,901081
0,6123055
-0,653061
0,6886951
-0,817293
1,143486
-0,693673
-1,78712
0,1067966
0,2046
0,004591
1,4504783
-0,534972
-1,449967
1,2139114
0,8833764
-0,408298
-0,625377
-0,973162
-1,431589
-1,820971
-0,631647

GRAFICOS DE LOS RESIDUALES:

Con respecto al analisis de los residuales a travs de las grficas se observa que siguen
un comportamiento ajustado a los valores que conforman la data, en el sentido que:
El peso entre los 45 y 82 kilogramos y
La edad se encuentra bien estratificada en los 4 valores principales 15, 16, 17 y 18
aos, dando mayor densidad poblacional a la edad de 16 aos
Se destaca que los 2 grficos marcan una anchura de banda de residuos constante entre
5 y -5, en el eje de las ordenadas de las respectivas curvas

CURVA DE REGRESION AJUSTADA

Para las 2 curvas de regresin ajustada se observa que no se registra la marca de una
linea que comprenda a todos los puntos a lo largo de los estudios,en cada uno de los intervalos
de las 2 variables independientes con respecto a la variable Y, por el contrario, los puntos
quedan fuera de la curva, por lo que las variables independientes ( eje horizontal ) no se
relacionan linealmente con la variable dependiente Y ( promedio)

GRAFICO DE PROBABILIDAD NORMAL

El grfico de probabilidad normal evidencia que los errores tienen una distribucin
aproximadamente Normal.

ANALISIS DEL MODELO DE REGRESION MULTIPLE 3.


(PROMEDIO Vs PESO Y ESTATURA)

CUADRO RESUMEN:

Estadsticas de la regresin
Coeficiente de correlacin
mltiple
0,10730705
Coeficiente de determinacin
R^2
0,0115148
R^2 ajustado
0,01416014
Error tpico
3,02500011
Observaciones
80

La tabla anterior muestra un resumen, de los indicadores presentes del promedio de 80


estudiantes seleccionados al azar de una poblacin de 131, el coeficiente de correlacin mltiple
permite observar un relacin entre las variables, X2 ( Peso ), X3 ( Estatura ) asociadas a la
variable dependiente Y ( Promedio ), las que se encuentran asociadas en forma directa de una
manera muy dbil con la variable dependiente, en un porcentaje del 10.73%, en un rango 0.1073
< 0.40, observndose que se encuentra muy alejado de los valores de relacin directa (-1, 1), y a
su vez muy cercanos a cero.

Segn el Coeficiente de determinacin, se seala que un 1,15% de los promedios pueden


ser explicadas por la relacin de la edad, el peso y la estatura.

Segn este resultado es de esperarse tal cual se evidencia que el R^2 ajustado es inferior
al R^2 normal.

Tomando en cuenta el error tpico, se observa que la desviacin de los residuos existente
entre los valores de Y = promedio y los que se determinan por la recta de regresin es de 3 .025
puntos.

Utilizando las formulas de las ecuaciones normales a los datos obtendremos los
coeficientes de regresin o utilizando Regresin de Anlisis de datos, en la Hoja de Clculo de
Excel podemos calcular tambin los coeficientes de regresin

ANALISIS DE VARIANZA:

Regresin
Residuos
Total

Promedio
Grados de
Suma de
de los
Valor crtico
libertad
cuadrados cuadrados
F
de F
2 8,2078208 4,1039104 0,44848413 0,64025288
77 704,598174 9,15062564
79 712,805995

Prueba Global: Verificacin de la validez del modelo de Regresin Mltiple.

Formulacin de Hiptesis:
Hp: B1 = B2 = 0
En el cuadro del anlisis de la varianza se puede determinar que el valor del F critico para
2 grados de libertad es de 0.6403 y el F calculado es de 0.4484, por lo que es menor que el F
critico, y de esta manera se acepta la hiptesis lo que significa que ninguno de los factores (, X2,
X3) son relevantes para explicar los cambios en Y.

Coeficientes

Error tpico

Intercepcin

23,57955787 10,00301749

PESO

0,039815945 0,050340569

ESTATURA

Estadstico t

Inferior
95%

Probabilidad

Superior
95%

Inferior
95,0%

Superior
95,0%

2,35724449 0,020952511 3,6610056 43,4981101 3,661005642 43,49811009

0,79093156 0,431413392
-6,84163267 7,309421607 0,936001922 0,352198564

-0,060425 0,14005682 -0,06042493

0,140056823

-21,39655 7,71328499 -21,3965503

7,713284995

Segn el anlisis realizado anteriormente del resumen, con el nivel tan bajo de
confiabilidad de los resultados, se determina que no se requiere construir una ecuacin de
regresin.

INTERVALOS DE CONFIANZA:

Los intervalos de confianza son los siguientes:


3.6610056

<

23.57955787

<

43.49811009

-0.060425

<

0.039815945

<

0.140056823

-21.39655

<

-6.84163267

<

7.713284995

ANALISIS DE RESIDUALES
Observacin
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47

Pronstico
PROMEDIO
14,440925
14,536819
14,462233
15,157612
15,53334
15,20472
14,891239
14,71459
14,418494
14,474572
14,370263
14,2968
14,929932
15,10658
14,326523
14,999471
14,988256
14,498126
15,363984
15,63148
14,793099
14,575512
14,244646
15,46717
15,494647
14,730852
14,851423
14,834038
14,418494
14,954609
14,652343
14,709544
14,65739
14,702252
14,753283
14,828992
14,731975
14,544111
14,703375
14,697205
14,378678
15,101534
14,924886
14,655144
14,862639
14,428586
14,592897

Residuos
1,55907502
1,36318126
0,13776684
-0,157612
3,66665968
2,89527986
-0,6912389
1,68540971
-1,8184939
5,42542833
-3,0702628
2,30319987
0,87006811
3,89341952
4,27347654
-2,2994712
2,3117444
-2,7981257
0,83601608
-3,93148
-3,1930992
1,52448826
-1,5446457
4,13283012
-0,6946473
-2,5308522
-3,5814229
-5,8340381
-1,5184939
4,94539109
1,04765678
1,09045602
1,24261047
-0,1022518
3,04671671
-1,1289918
4,46802489
3,45588905
5,29662527
-4,1472055
-5,8786779
-1,0015342
-6,9248856
1,14485637
-2,4626385
0,67141353
5,40710344

Residuos
estndares
0,52204724
0,45645335
0,04613043
-0,0527755
1,22775975
0,96946769
-0,2314573
0,56434968
-0,6089121
1,81667324
-1,0280597
0,77121313
0,29133727
1,30368897
1,43094886
-0,7699646
0,77407422
-0,9369362
0,27993514
-1,3164333
-1,0691908
0,51046606
-0,5172157
1,38385422
-0,2325986
-0,8474412
-1,1992187
-1,9534939
-0,5084589
1,65593556
0,3508018
0,36513288
0,41608092
-0,0342384
1,02017544
-0,3780364
1,49609225
1,15718443
1,77354429
-1,3886677
-1,9684412
-0,3353579
-2,3187578
0,38334852
-0,8246002
0,22481893
1,81053726

48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80

14,508218
14,656267
14,570465
15,020779
14,857592
14,817776
14,828992
14,72076
14,447094
14,719637
14,566542
14,332693
14,897408
14,504295
14,669728
14,886193
14,652343
14,555327
14,310262
14,133613
13,979396
14,19586
14,269323
14,774591
14,365216
14,581681
14,474572
14,81553
15,025826
14,310262
14,62262
14,730852
14,783007

GRAFICOS DE LOS RESIDUALES:

1,29178164
0,34373342
0,02953457
-1,5207793
-0,3575922
3,18222375
-2,0289918
-1,2207595
-0,4470942
-1,4196366
3,43345793
-2,2326927
1,50259186
-1,704295
1,93027196
-2,7861926
3,54765678
-1,8553265
-5,1102616
1,16638701
1,42060449
0,40413994
4,93067731
-1,5745915
-3,5652165
4,218319
3,02542833
-1,3155304
-2,1258256
-2,6702616
-4,2626199
-5,5308522
-2,0830066

0,4325456
0,11509714
0,00988948
-0,5092242
-0,1197377
1,06554918
-0,6793962
-0,4087643
-0,1497069
-0,4753571
1,14967349
-0,7476042
0,50313418
-0,5706733
0,64634038
-0,9329404
1,18791232
-0,6212453
-1,7111415
0,39055793
0,47568118
0,13532392
1,65100873
-0,5272428
-1,1937921
1,41247968
1,01304715
-0,4404977
-0,7118204
-0,8941216
-1,4273136
-1,8519738
-0,6974827

Con respecto al analisis de los residuales a travs de las grficas se observa que siguen
un comportamiento ajustado a los valores que conforman la data, en el sentido que la estatura se
concentra en un intervalo de 1.50 a 1.80m aproximadamente, y el peso entre los 45 y 82
kilogramos
Destaca que los 2 grficos marcan una anchura de banda de residuos constante entre 5 y
-5, en el eje de las ordenadas de las respectivas curvas

CURVA DE REGRESION AJUSTADA

Para las 2 curvas de regresin ajustada se observa que no se registra la marca de una
linea que comprenda a todos los puntos a lo largo de los estudios,en cada uno de los intervalos
de las 2 variables independientes con respecto a la variable Y, por el contrario, los puntos
quedan fuera de la curva, por lo que las variables independientes ( eje horizontal ) no se
relacionan linealmente con la variable dependiente Y ( promedio)

GRAFICO DE PROBABILIDAD NORMAL

El grfico de probabilidad normal evidencia que los errores tienen una distribucin
aproximadamente Normal.

CASO NUMERO 2:
RELACION

PROMEDIO

CON

CONDUCTA,

MERITOS

INASISTENCIAS DEL ESTUDIANTE


TABLA DE DATOS ANALISIS 1
PROMEDIO VS CONDUCTA, MERITOS E INASISTENCIAS

ASPECTOS DE AJUSTE ACADEMICO


NUMERO
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34

PROMEDIO
16
15,9
14,6
15
19,2
18,1
14,2
16,4
12,6
19,9
11,3
16,6
15,8
19
18,6
12,7
17,3
11,7
16,2
11,7
11,6
16,1
12,7
19,6
14,8
12,2
11,27
9
12,9
19,9
15,7
15,8
15,9
14,6

CONDUCTA
20
19
18
19
20
14
16
18
17
19
19
20
20
20
20
19
18
17
19
16
15
16
18
19
20
20
20
8
16
20
18
19
17
14

MERITOS
98
85
71
77
76
64
66
67
80
88
90
79
84
79
78
84
67
60
84
67
70
75
88
90
74
69
71
34
40
67
71
73
68
66

INASIST.
7
10
4
2
1
3
2
8
7
1
4
0
0
0
6
1
0
0
0
0
4
2
1
0
2
7
9
14
8
1
2
1
1
0

35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80

17,8
13,7
19,2
18
20
10,55
8,5
14,1
8
15,8
12,4
15,1
20
15,8
15
14,6
13,5
14,5
18
12,8
13,5
14
13,3
18
12,1
16,4
12,8
16,6
12,1
18,2
12,7
9,2
15,3
15,4
14,6
19,2
13,2
10,8
18,8
17,5
13,5
12,9
11,64
10,36
9,2
12,7

19
17
18
20
20
16
10
16
9
17
18
18
20
20
16
14
14
15
18
18
17
17
16
17
15
16
17
18
20
10
18
10
16
17
18
20
18
11
19
18
17
16
14
16
11
17

69
68
67
80
77
74
26
45
32
49
59
60
64
81
70
64
66
53
60
56
64
63
81
94
61
62
63
63
71
50
74
76
49
64
65
72
70
50
91
71
80
64
66
56
66
60

0
0
0
4
1
5
11
8
16
7
4
3
0
0
0
1
3
2
0
0
0
1
1
3
2
5
1
0
0
0
0
8
3
1
4
2
2
3
0
0
0
1
0
0
7
1

ANALISIS DEL MODELO DE REGRESION MULTIPLE 1.


(PROMEDIO Vs CONDUCTA MERITOS E INASISTENCIAS)

CUADRO RESUMEN:

Estadsticas de la regresin
Coeficiente de correlacin
mltiple
0,61727208
Coeficiente de determinacin
R^2
0,38102482
R^2 ajustado
0,35659159
Error tpico
2,40943655
Observaciones
80

La tabla anterior muestra un resumen, de los indicadores presentes del promedio de 80


estudiantes seleccionados al azar de una poblacin de 131, el coeficiente de correlacin mltiple
permite observar un relacin entre las variables X1 ( Conducta ), X2 ( Mritos ), X3 ( Inasistencia)
asociadas a la variable dependiente Y ( Promedio ), las que se encuentran asociadas en forma
directa de una manera media con la variable dependiente, en un porcentaje del 61.72%, en un
rango 0,40 < 0.6172 < 0.70, observndose que se encuentra alejado de los valores de relacin
directa (-1, 1).

Segn el Coeficiente de determinacin, se seala que un 38,10% de los promedios


pueden ser explicados por la relacin de la conducta, los mritos y las inasistencias

Segn este resultado es de esperarse tal cual se evidencia que el R^2 ajustado es inferior
al R^2 normal.

Tomando en cuenta el error tpico, se observa que la desviacin de los residuos existente
entre los valores de Y = promedio y los que se determinan por la recta de regresin es de 2.494
puntos.

Utilizando las formulas de las ecuaciones normales a los datos obtendremos los
coeficientes de regresin o utilizando Regresin de Anlisis de datos, en la Hoja de Clculo de
Excel podemos calcular tambin los coeficientes de regresin

ANALISIS DE VARIANZA:
Promedio de
Suma de
los
Valor crtico
cuadrados
cuadrados
F
de F
3 271,596774 90,5322579 15,5945326 5,3634E-08
76 441,209221 5,80538449
79 712,805995

Grados de
libertad
Regresin
Residuos
Total

Probabilidad

Superior
95%

Inferior 95%

Inferior
95,0%

Superior
95,0%

Coeficientes

Error tpico

Estadstico t

Intercepcin

6,580705232

2,027613803

3,245541741

0,001744433

CONDUCTA

0,485300226

0,127940889

3,793159706

0,000296616

0,230483865 0,74011659 0,23048386 0,74011659

MERITOS

0,006335225

0,02597401

0,243906312

0,807960599

-0,0453965 0,05806695 -0,0453965 0,05806695

INASIST.

-0,20583975

0,087781069

-2,344921876

0,021643268

-0,3806709

2,54236242

10,619048 2,54236242

-0,0310086 -0,3806709

10,619048

-0,0310086

Prueba Global: Verificacin de la validez del modelo de Regresin Mltiple.

Formulacin de Hiptesis:
Hp: B1 = B2 = 0
En el cuadro del anlisis de la varianza se puede determinar que el valor del F critico para
3 grados de libertad es de 5.364E-08 y el F calculado es de 0.4588 , por lo que es mayor que el F
critico, y de esta manera se rechaza la hiptesis Hp, y se acepta la hiptesis alternativa, lo que
significa que los factores (X1,X2, X3) son de alguna manera relevantes para explicar los cambios

en Y, dentro de la caracterizacin de un nivel medio, para estas variables ya que se requiere de


otras variables u otros estudios para verificar esa confiabilidad.
Segn el anlisis realizado anteriormente del resumen, se muestra un nivel bajo de
confiabilidad de los resultados, se determina que la ecuacin de regresin, no representa un
comportamiento 100 por ciento confiable, solo.

NOTA: De ser necesaria la representacin de la ecuacin de regresin aunque no es


completamente confiable, quedara de la siguiente manera:
Por lo tanto podemos construir la ecuacin de regresin que buscamos:

Y = 6.580705232 + 0.485300226X1 + 0.006335225X2 - 0.210583975X3

INTERVALOS DE CONFIANZA:

Los intervalos de confianza son los siguientes:


2.54236242

<

6.580705232

<

10.619048

0.230483865

<

0.485300226

<

0.7411659

-0.04553965

<

0.006335225

<

0.0586695

- 0-3806709

<

-0.20583975

<

-0.0310086

ANALISIS DE RESIDUALES
Observacin
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34

Pronstico
PROMEDIO
15,4666835
14,2815061
14,9425513
15,8775423
16,5623471
13,1628435
14,3519542
14,0938514
13,8967488
16,1530696
15,5482208
16,7871925
16,8188686
16,7871925
15,5458188
16,1277287
15,7405694
15,2109226
16,3335684
14,7699689
13,4803154
14,4089712
15,6677693
16,3715798
16,3438369
15,282962
14,883953
7,79674819
12,9521998
16,5053301
15,3542308
16,0580412
15,0557646
13,7930332

Residuos
0,53331645
1,61849385
-0,34255127
-0,87754235
2,6376529
4,93715646
-0,15195419
2,30614863
-1,29674882
3,74693043
-4,24822077
-0,18719252
-1,01886865
2,21280748
3,0541812
-3,42772867
1,55943063
-3,51092257
-0,13356842
-3,06996892
-1,88031537
1,69102878
-2,96776935
3,22842023
-1,5438369
-3,08296202
-3,61395297
1,20325181
-0,05219985
3,39466993
0,34576923
-0,2580412
0,84423538
0,80696676

Residuos
estndares
0,22567125
0,6848608
-0,14494954
-0,3713294
1,11611488
2,08914289
-0,06429896
0,97583985
-0,54871536
1,58550233
-1,79762183
-0,07920995
-0,4311312
0,93634282
1,29236758
-1,45043307
0,65986838
-1,48563632
-0,05651908
-1,29904811
-0,79564979
0,71555374
-1,25580266
1,3660963
-0,65326994
-1,3045461
-1,52923332
0,50915238
-0,02208821
1,43644436
0,14631121
-0,10918936
0,35723566
0,34146555

35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80

16,23854
15,2616044
15,7405694
15,9701687
16,5686823
13,7851167
9,33418609
12,983876
7,85769847
13,7003568
14,8665286
15,0787035
16,6921641
16,799863
14,7889746
13,574523
13,175514
13,784296
15,6962228
15,6708819
15,2362635
15,0240885
14,6528223
14,808801
13,8349778
13,709094
15,0240885
15,7152285
16,7365107
11,7504687
15,7849159
10,2684666
14,0384156
15,0304237
14,9045399
16,3311664
15,3478955
11,6182497
16,377915
15,7659103
15,3376271
14,5451235
13,7930332
14,7002814
10,8962543
15,0050828

1,56145995
-1,56160437
3,45943063
2,02983125
3,43131768
-3,23511675
-0,83418609
1,11612403
0,14230153
2,09964315
-2,46652857
0,02129645
3,30783585
-0,99986297
0,21102541
1,02547696
0,32448601
0,71570396
2,3037772
-2,8708819
-1,73626347
-1,0240885
-1,35282232
3,19119903
-1,73497784
2,69090595
-2,2240885
0,88477153
-4,63651072
6,44953126
-3,08491595
-1,06846659
1,26158438
0,36957628
-0,30453992
2,86883355
-2,14789555
-0,81824972
2,422085
1,73408973
-1,83762707
-1,64512349
-2,15303324
-4,34028144
-1,69625432
-2,30508282

0,66072708
-0,66078819
1,46384766
0,85891698
1,45195175
-1,36892991
-0,35298333
0,47228452
0,06021447
0,88845768
-1,04370414
0,00901153
1,39970078
-0,42308901
0,08929477
0,43392749
0,13730528
0,30284797
0,97483639
-1,21480503
-0,73469466
-0,43333996
-0,57244269
1,35034626
-0,73415065
1,13864875
-0,94111635
0,37438841
-1,96192555
2,72909974
-1,3053729
-0,45211842
0,53383563
0,15638509
-0,12886515
1,21393828
-0,90887553
-0,3462399
1,02489798
0,73377485
-0,77758636
-0,69612905
-0,91104953
-1,83657703
-0,71776491
-0,97538886

GRAFICOS DE LOS RESIDUALES:

Con respecto al analisis de los residuales a travs de las grficas se observa que siguen
un comportamiento ajustado a los valores que conforman la data, en el sentido que la conducta
se concentra en un intervalo de 08 a 20 puntos aproximadamente, los meritos entre los 20 y 100
y la inasistencia se encuentra en un intervalo definido de 0 a 18 dias aprox, , destaca que los 3
grficos marcan una anchura de banda de residuos constante entre 5 y -5, en el eje de las
ordenadas de las respectivas curvas

CURVA DE REGRESION AJUSTADA

Para las 3 curvas de regresin ajustada se observa que no se registra la marca de una
linea que comprenda a todos los puntos a lo largo de los estudios,en cada uno de los intervalos
de las 3 variables independientes con respecto a la variable Y, por el contrario, los puntos
quedan fuera de la curva, por lo que las variables independientes ( eje horizontal ) no se
relacionan linealmente con la variable dependiente Y ( promedio)

GRAFICO DE PROBABILIDAD NORMAL

El grfico de probabilidad normal evidencia que los errores tienen una distribucin
aproximadamente Normal.

ANALISIS DEL MODELO DE REGRESION MULTIPLE 2.


(PROMEDIO Vs CONDUCTA Y MERITOS)

CUADRO RESUMEN:

Estadsticas de la regresin
Coeficiente de correlacin
mltiple
0,57986333
Coeficiente de determinacin
R^2
0,33624149
R^2 ajustado
0,319001
Error tpico
2,47882211
Observaciones
80

La tabla anterior muestra un resumen, de los indicadores presentes del promedio de 80


estudiantes seleccionados al azar de una poblacin de 131, el coeficiente de correlacin mltiple
permite observar un relacin entre las variables X1 ( Conducta ), X2 ( Mritos ), asociadas a la
variable dependiente Y ( Promedio ), las que se encuentran asociadas en forma directa de una
manera media con la variable dependiente, en un porcentaje del 57.98%, en un rango 0.14 <
0.5798 < 0.70, observndose que se encuentra muy alejado de los valores de relacin directa
(-1, 1), y a su vez muy cercanos a cero.

Segn el Coeficiente de determinacin, se seala que un 33.62% de los promedios


pueden ser explicadas por la relacin de la conducta y los mritos.

Segn este resultado es de esperarse tal cual se evidencia que el R^2 ajustado es inferior
al R^2 normal.

Tomando en cuenta el error tpico, se observa que la desviacin de los residuos existente
entre los valores de Y = promedio y los que se determinan por la recta de regresin es de 2.478
puntos.

Utilizando las formulas de las ecuaciones normales a los datos obtendremos los
coeficientes de regresin o utilizando Regresin de Anlisis de datos, en la Hoja de Clculo de
Excel podemos calcular tambin los coeficientes de regresin

ANALISIS DE VARIANZA:

Regresin
Residuos
Total

Grados de
libertad
2
77
79

Promedio
Suma de
de los
Valor crtico
cuadrados cuadrados
F
de F
239,674946 119,837473 19,5030224 1,4041E-07
473,131049 6,14455907
712,805995

Prueba Global: Verificacin de la validez del modelo de Regresin Mltiple.

Formulacin de Hiptesis:
Hp: B1 = B2 = 0
En el cuadro del anlisis de la varianza se puede determinar que el valor del F critico para
2 grados de libertad es de 1.4041E-07 y el F calculado es de 19.50 , por lo que es mayor que el F
critico, y de esta manera se rechaza la hiptesis Hp, y se acepta la hiptesis alternativa, lo que
significa que los factores (X1,X2,) son relevantes para explicar los cambios en Y, dentro de la

caracterizacin de un nivel medio, para estas variables ya que se requiere de otras variables u
otros estudios para verificar esa confiabilidad.

Coeficientes

Error tpico

Estadstico t

Probabilidad

Inferior
95%

Superior
95%

Inferior
95,0%

Superior
95,0%

Intercepcin

4,01479804

1,756159513

2,286123789

0,024997161 0,5178377

7,5117583 0,51783775

7,51175833

CONDUCTA

0,564762994

0,126924297

4,449605058

2,86081E-05 0,3120244

0,8175016 0,31202443

0,81750155

0,01590898

0,026389812

0,602845516

0,548382941

0,0684578 -0,0366398

0,06845781

MERITOS

-0,03664

Segn el anlisis realizado anteriormente del resumen, con el nivel tan bajo de
confiabilidad de los resultados, se determina que no se requiere construir una ecuacin de
regresin.

NOTA: De ser necesaria la representacin de la ecuacin de regresin aunque no es confiable,


quedara de la siguiente manera:
Por lo tanto podemos construir la ecuacin de regresin que buscamos:
Y = 4.01479804 + 0.564762994X1 + 0.01590898X2
INTERVALOS DE CONFIANZA:

Los intervalos de confianza son los siguientes:


0.5178377

<

4.01479804

<

7.51175833

0.3120244

<

0.564762994

<

0.81750155

-0.03664

<

0.01590898

<

0.06845781

ANALISIS DE RESIDUALES
Observacin
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

Pronstico
PROMEDIO
16,869138
16,0975582
15,3100695
15,9702864
16,5191404
12,9396547
14,1009986
15,2464336
14,8884873
16,1452852
16,1771031
16,5668673
16,6464122
16,5668673
16,5509584
16,0816493
15,2464336
14,5703077
16,0816493
14,1169076
13,5998716
14,2441794
15,5805222
16,1771031
16,4873224
16,4077775
16,4395955
9,07380731
13,6873651
16,3759596
15,3100695

Residuos
-0,86913797
-0,19755823
-0,71006952
-0,97028639
2,6808596
5,16034532
0,09900137
1,1535664
-2,28848734
3,75471483
-4,87710313
0,03313266
-0,84641224
2,43313266
2,04904164
-3,38164925
2,0535664
-2,87030774
0,11835075
-2,41690761
-1,99987155
1,85582055
-2,88052218
3,42289687
-1,68732244
-4,20777754
-5,1695955
-0,07380731
-0,78736515
3,52404042
0,38993048

Residuos
estndares
-0,35514977
-0,08072684
-0,29015074
-0,39648135
1,09546092
2,10863585
0,04045424
0,47137378
-0,93512859
1,53426288
-1,99289657
0,01353877
-0,34586352
0,994234
0,83728557
-1,3818197
0,83913449
-1,1728738
0,04836084
-0,98760407
-0,81719354
0,75833098
-1,17704765
1,39867443
-0,68947878
-1,71939474
-2,11241569
-0,03015937
-0,32173552
1,44000401
0,15933457

32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80

15,9066505
14,6975796
12,9714726
15,8430145
14,6975796
15,2464336
16,5827763
16,5350494
14,2282705
10,0760615
13,76691
9,60675235
14,395309
15,1191618
15,1350707
16,3282326
16,5986853
14,1646345
12,9396547
12,9714726
13,3294189
15,1350707
15,0714348
14,6339437
14,6180347
14,3396333
15,1112131
13,4566907
14,0373627
14,6180347
15,1827977
16,4395955
10,457877
15,3577965
10,8715105
13,830546
14,6339437
15,2146156
16,4555045
15,2941605
11,02264
16,1930121
15,3100695
14,8884873
14,0691807
12,9714726
13,9419088
11,2771837
14,5703077

-0,10665047
1,20242042
1,62852736
1,95698545
-0,99757958
3,9535664
1,41722368
3,46495062
-3,67827047
-1,57606146
0,33308995
-1,60675235
1,40469104
-2,71916175
-0,03507073
3,67176736
-0,7986853
0,83536545
1,66034532
0,52852736
1,17058111
2,86492927
-2,27143481
-1,13394366
-0,61803468
-1,03963333
2,88878694
-1,35669073
2,36263729
-1,81803468
1,41720233
-4,3395955
7,74212302
-2,65779646
-1,67151047
1,46945403
0,76605634
-0,61461564
2,74449552
-2,09416054
-0,22263998
2,60698789
2,18993048
-1,38848734
-1,16918067
-1,33147264
-3,58190883
-2,07718366
-1,87030774

-0,04357984
0,49133665
0,66545376
0,79966929
-0,40763397
1,61551821
0,57911021
1,41585856
-1,50302596
-0,64401498
0,13610822
-0,65655598
0,57398908
-1,11111207
-0,01433071
1,50036864
-0,32636119
0,34134955
0,67845531
0,21596844
0,47832638
1,17067603
-0,92816054
-0,46335547
-0,25254319
-0,4248181
1,18042482
-0,55437505
0,96542797
-0,74289081
0,57910148
-1,77325859
3,16360963
-1,08603679
-0,68301764
0,60045273
0,31302825
-0,25114609
1,12146403
-0,85572219
-0,09097582
1,06527524
0,89485599
-0,56736788
-0,47775413
-0,54407036
-1,46365037
-0,84878504
-0,76425078

GRAFICOS DE LOS RESIDUALES:

Con respecto al analisis de los residuales a travs de las grficas se observa que siguen
un comportamiento ajustado a los valores que conforman la data, en el sentido que la conducta
se concentra en un intervalo de 08 a 20 puntos aproximadamente, los meritos entre los 20 y 100
, destaca que los 2 grficos marcan una anchura de banda de residuos constante entre 5 y -5, en
el eje de las ordenadas de las respectivas curvas

CURVA DE REGRESION AJUSTADA

Para las 2 curvas de regresin ajustada se observa que no se registra la marca de una
linea que comprenda a todos los puntos a lo largo de los estudios,en cada uno de los intervalos
de las 2 variables independientes con respecto a la variable Y, por el contrario, los puntos
quedan fuera de la curva, por lo que las variables independientes ( eje horizontal ) no se
relacionan linealmente con la variable dependiente Y ( promedio)

GRAFICO DE PROBABILIDAD NORMAL

El grfico de probabilidad normal evidencia que los errores tienen una distribucin
aproximadamente Normal.

ANALISIS DEL MODELO DE REGRESION MULTIPLE 2.


(PROMEDIO Vs MERITOS E INASISTENCIAS)

CUADRO RESUMEN:

Estadsticas de la regresin
Coeficiente de correlacin
mltiple
0,51365606
Coeficiente de determinacin
R^2
0,26384255
R^2 ajustado
0,24472158
Error tpico
2,61051183
Observaciones
80

La tabla anterior muestra un resumen, de los indicadores presentes del promedio de 80


estudiantes seleccionados al azar de una poblacin de 131, el coeficiente de correlacin mltiple
permite observar un relacin entre las variables, X2 ( Mritos ), X3 ( Inasistencias ) asociadas a
la variable dependiente Y ( Promedio ), las que se encuentran asociadas en forma directa de una
manera media con la variable dependiente, en un porcentaje del 51.36%, en un rango 0.4 <
0.5136 < 0.70, observndose que se encuentra muy alejado de los valores de relacin directa
(-1, 1),.

Segn el Coeficiente de determinacin, se seala que un 26.38% de los promedios


pueden ser explicadas por la relacin de la edad, el peso y la estatura.

Segn este resultado es de esperarse tal cual se evidencia que el R^2 ajustado es inferior
al R^2 normal.

Tomando en cuenta el error tpico, se observa que la desviacin de los residuos existente
entre los valores de Y = promedio y los que se determinan por la recta de regresin es de 2.610
puntos.

Utilizando las formulas de las ecuaciones normales a los datos obtendremos los
coeficientes de regresin o utilizando Regresin de Anlisis de datos, en la Hoja de Clculo de
Excel podemos calcular tambin los coeficientes de regresin

ANALISIS DE VARIANZA:

Regresin
Residuos
Total

Promedio
Grados de
Suma de
de los
Valor crtico
libertad
cuadrados cuadrados
F
de F
2 188,06855 94,0342751 13,7985944 7,5574E-06
77 524,737445 6,81477201
79 712,805995

Prueba Global: Verificacin de la validez del modelo de Regresin Mltiple.

Formulacin de Hiptesis:
Hp: B1 = B2 = 0
En el cuadro del anlisis de la varianza se puede determinar que el valor del F critico para
2 grados de libertad es de 7.5574E-06 y el F calculado es de 13.79 , por lo que es mayor que el F
critico, y de esta manera se rechaza la hiptesis Hp, y se acepta la hiptesis alternativa, lo que
significa que los factores (X2, X3) son relevantes para explicar los cambios en Y, dentro de la

caracterizacin de un nivel medio, para estas variables ya que se requiere de otras variables u
otros estudios para verificar esa confiabilidad.

Probabilidad

Inferior
95%

Superior
95%

Inferior
95,0%

Superior
95,0%

Coeficientes

Error tpico

Estadstico t

Intercepcin

11,31485249

1,731332131

6,535344825

6,21496E-09 7,86732982 14,7623751 7,86732982 14,7623751

MERITOS

0,061311867

0,023352979

2,625440972

INASIST.

-0,294031496

0,091709974

-3,206101604

0,010434012 0,01481015 0,10781359 0,01481015 0,10781359


0,00195989 -0,4766494 -0,1114136 0,47664938 0,11141361

Segn el anlisis realizado anteriormente del resumen, con el nivel tan bajo de
confiabilidad de los resultados, se determina que no se requiere construir una ecuacin de
regresin.
NOTA: De ser necesaria la representacin de la ecuacin de regresin aunque no es confiable,
quedara de la siguiente manera:
Por lo tanto podemos construir la ecuacin de regresin que buscamos:
Y = 11.31485249 + 0.061311867X2 0.294031496 X3

INTERVALOS DE CONFIANZA:

Los intervalos de confianza son los siguientes:


7.86732982

<

11.31485249

<

14.7623751

0.01481015

<

0.061311867

<

0.10781359

-0.4766494

<

-0.294031496

<

-0.1114136

ANALISIS DE RESIDUALES
Observacin
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47

Pronstico
PROMEDIO
15,265195
13,5860463
14,4918691
15,4478033
15,6805229
14,3567175
14,7733727
13,0704956
14,1615814
16,4162653
15,6567946
16,15849
16,4650493
16,15849
14,3329892
16,1710179
15,4227476
14,9935645
16,4650493
15,4227476
14,4305572
15,3251795
16,4162653
16,8329206
15,2638677
13,4871509
13,0217116
9,28301503
11,4150752
15,1287161
15,0799321
15,4965873
15,190028
15,3614357
15,5453713
15,4840595
15,4227476
15,0436759
15,7418348
14,3817732
9,67461458
11,7216345
8,5723283
12,2609135
13,7561267
14,11147
15,238812

Residuos
0,73480498
2,31395375
0,10813091
-0,44780328
3,51947709
3,74328249
-0,57337274
3,32950437
-1,56158141
3,48373468
-4,35679457
0,44150999
-0,66504935
2,84150999
4,26701083
-3,47101785
1,8772524
-3,29356453
-0,26504935
-3,7227476
-2,83055722
0,77482045
-3,71626532
2,76707945
-0,46386768
-1,28715086
-1,75171161
-0,28301503
1,48492479
4,77128389
0,62006792
0,30341269
0,70997203
-0,76143574
2,25462866
-1,78405947
3,7772524
2,95632411
4,25816522
-3,83177319
-1,17461458
2,37836545
-0,5723283
3,53908648
-1,35612668
0,98852996
4,761188

Residuos
estndares
0,28511142
0,89783636
0,04195584
-0,17375199
1,36559104
1,4524297
-0,22247415
1,2918798
-0,60590864
1,35172264
-1,6904783
0,17131013
-0,25804556
1,10253327
1,65564134
-1,34678839
0,72839203
-1,27793479
-0,1028417
-1,44446196
-1,09828349
0,30063781
-1,44194678
1,0736535
-0,17998513
-0,49942695
-0,67968099
-0,10981256
0,57616513
1,85130415
0,24059233
0,11772705
0,27547599
-0,29544441
0,87481766
-0,69223228
1,46561035
1,14708226
1,65220916
-1,48676494
-0,45576178
0,92282873
-0,2220689
1,37319968
-0,52619023
0,38355915
1,84738685

48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80

GRAFICOS DE LOS RESIDUALES:

16,2811137
15,6066832
14,9447805
14,4793412
13,9763185
14,9935645
14,7483171
15,238812
14,8834686
15,9870823
16,1960735
14,4668134
13,6460308
14,8834686
15,1775001
15,6679951
14,3804459
15,8519307
13,6223024
13,4370395
14,9447805
14,1239979
15,1412439
15,0186202
13,4983514
16,8942324
15,6679951
16,2198019
14,9447805
15,3614357
14,7483171
13,3032153
14,699533

-0,48111375
-0,60668321
-0,3447805
-0,97934125
0,52368153
3,00643547
-1,94831706
-1,738812
-0,88346864
-2,68708225
1,80392647
-2,36681341
2,75396922
-2,08346864
1,42249987
-3,56799507
3,81955414
-3,15193068
-4,42230244
1,8629605
0,4552195
0,47600212
4,05875605
-1,81862021
-2,69835137
1,90576758
1,83200493
-2,71980188
-2,0447805
-3,72143574
-4,38831706
-4,10321526
-1,99953303

-0,18667677
-0,23539893
-0,13377816
-0,37999385
0,20319348
1,16652595
-0,7559658
-0,67467582
-0,34279435
-1,04261382
0,69994086
-0,91834642
1,06856661
-0,80840592
0,55194366
-1,38441649
1,48202383
-1,22297949
-1,71589599
0,72284664
0,17662955
0,18469341
1,57483648
-0,70564218
-1,04698635
0,7394562
0,71083558
-1,05530935
-0,79339455
-1,44395295
-1,70270933
-1,59208708
-0,7758381

Respecto al analisis de los residuales a travs de las grficas se observa que siguen un
comportamiento ajustado a los valores que conforman la data, en el sentido que los meritos se
concentra en un intervalo de 20 a 100 aproximadamente, los meritos entre los 20 y 10 y la
inasistencia se encuentra en un intervalo definido de 0 a 18 dias aprox, , destaca que los 2
grficos marcan una anchura de banda de residuos constante entre 5 y -5, en el eje de las
ordenadas de las respectivas curvas

CURVA DE REGRESION AJUSTADA

Para las 2 curvas de regresin ajustada se observa que no se registra la marca de una
linea que comprenda a todos los puntos a lo largo de los estudios,en cada uno de los intervalos
de las 2 variables independientes con respecto a la variable Y, por el contrario, los puntos
quedan fuera de la curva, por lo que las variables independientes ( eje horizontal ) no se
relacionan linealmente con la variable dependiente Y ( promedio)

GRAFICO DE PROBABILIDAD NORMAL

El grfico de probabilidad normal evidencia que los errores tienen una distribucin
aproximadamente Normal.
PRUEBA DEL MODELO

Realizando una comparacin de los 3 modelos obtenidos, aunque son bajos sus
coeficientes de correlacin y determinacin, se tomo como ejemplo y muestra el primer modelo
que relaciona las 3 variables Y, Conducta, Mritos e Inasistencias respectivamente, y se
verificaron resultados con la hoja de calculo Excel, a lo cual se obtuvo como resultado:

MODELO: Y= 6,5880705232 + 0,485300226 X1 +0,006335225 X2-0,2105583975 X3


P.T.

Conducta

Mritos

Inasistencia

P. Modelo

Diferencia

16
19
9
10,55

20
20
8
16

98
79
34
74,5

7
0
14
0

15,433653
16,7871925
7,73068713
14,8174831

0,56634698
2,21280747
1,26931288
-4,26748311

P.T.: Puntaje terico de la data.

P.Modelo: Puntaje que arroja la ecuacin.

La diferencia entre los resultados registrados en la data y los obtenidos con la ecuacin,
son evidentes del hecho que no es confiable para estudiar las variables designadas y
relacionarlas.

CONCLUSIONES

Una de las caractersticas de la Estadstica es precisamente analizar la validez de los


resultados, y para el estudio propuesto por la U.E. Colegio Los Pirineos Don Bosco, respecto a
determinar la relacin de una variable dependiente ( Promedio de calificaciones de los alumnos
de 5to ao en un lapso) con respecto a dos grupos de variables independientes, el primero
variables de orden personal e inherentes a los datos de cada alumno, como son edad, peso y
estatura, y el segundo grupo de variables independientes se conforma por aspectos que para la
administracin de la coordinacin de 5to ao se denomina Ajuste, el cual incluye evaluacin de la
conducta, la acumulacin de mritos y el numero de inasistencias por lapso.
.
De acuerdo a los cuadros y grficas obtenidas podemos decir:

El grupo de variables personales no tiene ninguna relacin con el comportamiento de la


variable promedio, por lo que las 3 variables no son representativas en grado alguno para indicar
la formulacin de un modelo matemtico ajustado y confiable a la realidad, ya que los valores de
los coeficientes de correlacin mltiple estn muy alejados de los valores -1 y 1, por el contrario
se acercan a 0, y el coeficiente de determinacin es muy pequeo para poder indicar alguna
representatividad.
El grupo de variables de ajuste, manifestaron una correlacin un poco ms aceptable con
la variable dependiente Promedio, puesto que su coeficiente de correlacin mltiple indica un
valor de 61.72% y un coeficiente de determinacin de 38.10 %, y dentro de este anlisis se
observ que la variable independiente que presenta el valor ms bajo de probabilidad es la
conducta con 0,000296616, sin embargo, este valor nos dice que este porcentaje representa la
variacin de la variable Y, pero la diferencia restante que viene siendo 61.9 % estara explicada
por otros mecanismos u otras variables, en este sentido se debe aclarar que la representatividad
del modelo no es confiable, aun cuando se presentan valores mas claros que en el primer grupo.

BIBLIOGRAFIA

1.- ALLEN L. WEBSTER. Estadstica aplicada a los negocios y a la economa. Tercera Edicin.
Editorial Mc Graw Hill.
2.- Pginas Virtuales:
2.1.-http://www.monografias.com/trabajos30/regresioncorrelacion/regresion-correlacion.shtmlhttp://www.monografias.com/trabajos30/regresioncorrelacion/regresion-correlacion.shtml
2.2. http://html.rincondelvago.com/regresion-lineal-multiple.html
2.3.- http://html.rincondelvago.com/analisis-de-relacion-y-correlacion.html
2.4.- http://www.hrc.es/bioest/Reglin_16.html

3.- Videos de YOUTUBE.COM:


3.1.- http://www.youtube.com/watch?v=wLNlfOf1P-0
3.2.- http://www.youtube.com/watch?v=9ExzpxEpnqU&feature=relmfu

Das könnte Ihnen auch gefallen