Sie sind auf Seite 1von 16

SEDE BOGOTA

FACULTAD DE CIENCIAS
DEPARTAMENTO DE ESTADISITCA
ESTADISTICA DESCRIPTIVA Y EXPLORATORIA
MARTHA PATRICIA BOHORQUEZ
NOMBRES:
DENNIS PETER RODRIGUEZ CANTOR Cod: 201312
NICOLAS CASTAEDA OLARTE Cod: 97060413006

1. =
=

=
=
=
=

1( ) 2 ( )
2

1 ( ) 2( )
12 ( )( )

12 ( )2 22 ( )2
12 ( )( )

12 ( )2 22 ( )2
12 ( )( )

1( )2 2( )2
( )( )

( )2 ( )2

A travs del ejercicio vemos que el coeficiente de correlacin, sin importar las constantes que
se tomen para modificar cada variable no afectara el coeficiente de correlacin, este ser el
mismo que el de las variables sin modificar.

2. Los resultados obtenidos para cada conjunto de datos son


a. 1ra muestra de datos.

# Individuos

3,2
4,1
5,3
3,6
8,2
5,3

Z n1 n2 Promedio(x1) Promedio(x2)
-1
1
-1
1
1
-1

5,3

4,6

2n1n2(x1x2)/n^2

0,35

Pearson Covarianza

0,21

0,35

Tabla 1: verificacin de Pearson a travs de una nueva frmula.

b. 2da Muestra de datos


# Individuos

Z n1 n2 Promedio(x1) Promedio(x2)

4,4
3,5
7,2
10,33
11,2
5,4

-1
1
-1
1
1
-1

8,34

5,67

2n1n2(x1x2)/n^2

1,34

Pearson Covarianza

0,46

1,34

Tabla 2: verificacin de Pearson a travs de una nueva frmula.

c. 3ra Muestra de datos.


# Individuos

Z n1 n2 Promedio(x1) Promedio(x2)

100,1
72,5
83,6
74,5
74,8
11,3

-1
1
-1
1
1
-1

73,93

65

2n1n2(x1x2)/n^2

4,47

Pearson Covarianza

0,16

4,47

Tabla 3: verificacin de Pearson a travs de una nueva frmula.

Como se puede observar en los conjuntos de datos tomados, el coeficiente de


correlacin de Pearson no es obtenido a travs de la formula dada, sin embargo
como vemos, el valor obtenido para los tres casos dados es el mismo al de la
covarianza.
3. Conjuntos de Datos:
a. =

() ()
2

() ()

=1

( ) ( ) = ( ) ( )

( ) ( ) = ( ) ( )

( )2 = ( )

( )2 = ( )2

Por tanto para que el coeficiente de correlacin de Pearson sea 1 tenemos que
tener dos conjuntos de datos con los mismos valores Como ejemplo podemos
mostrar:
x 5,2 3,5 6,8 4,2 6,7
y 5,2 3,5 6,8 4,2 6,7

PEARSON

Tabla 4 : coeficiente de correlacin igual a 1

b. =

() ()
2

() ()

=1
2

( ) ( ) = ( ) ( )

=
2

( ) ( + ) = ( ) ( + )
2

( ) ( ) = ( ) ( )
2

( )2 = ( ) ( )
( )2 = ( )

( )2 = ( )2

Por tanto para obtener un coeficiente de correlacin igual a -1 se debe tener dos
conjuntos de datos iguales pero de signo opuesto. Como ejemplo se muestra:

x 5,2 3,5 6,8 4,2 6,7


y -5,2 -3,5 -6,8 -4,2 -6,7
1

PEARSON

-1

Tabla 5 : coeficiente de correlacin igual a -1

Para el clculo se realizo la deduccin matemtica.

c. Como ejemplo de correlacin de Pearson igual a 0 se obtiene.


x
y

-2
2

-1
1

0
0

1
1

2
2

PEARSON

2
Tabla 6 : coeficiente de correlacin igual a 0

d. Los valores obtenidos para Pearson 0 < rxy < 0.5 son:
x
y

1
2
3,6 4,2

3
4
5
3,3 4,8 3,5
2

PEARSON

0,10300524

Tabla 7 : coeficiente de correlacin 0 < rxy < 0.5

e. Los valores obtenidos para Pearson 0.5 < rxy < 0.9 son:
x
y
f.

1
1

2
1

3
1

4
1

5
2

PEARSON

0,70710678

Tabla 82: coeficiente de correlacin 0.5 < rxy < 0.9

Los valores obtenidos para Pearson -0.5 < rxy < 0 son:
x
1
2
3
4
5
y -0,4 -1,3 -4,2 4,2 -5,1

PEARSON

0,16799736

Tabla 92: coeficiente de correlacin -0.5 < rxy < 0

g. Los valores obtenidos para Pearson -0.9 < rxy <-0.5 son:
x 5,2 3,5 6,8 4,2 6,7
y -4,5 -2,7 -5,1 1,4 -6,4

PEARSON

0,74018775

Tabla 102: coeficiente de correlacin -0.9 < rxy < -0.5

4. Con las medidas dadas se obtuvo la siguiente informacin.


a. Matriz de Correlacin.

Imagen 1: Matriz de Correlacin fig 1.

Para el calculo no se realizo la deduccin matemtica ya que es un poco ms compleja, sin embargo se uso el concepto de correlacin y lo que representa
sus valores.

b. Matriz de diagramas de dispersion

Imagen 2: Matriz de diagramas de dispersin fig 1.

Las parejas de datos presentes en la matriz presentan, en su mayora, relaciones


lineales positivas, que difieren notablemente de las aconsejadas transformaciones
para los mismos datos que ha proporcionado el software. Se presentan parejas de
datos que tienen relaciones lineales negativas y aquellas que poseen una
representacin de su relacin con una lnea horizontal; pero estas dos ltimas se
presentan en menor nmero de parejas. Por lo tanto, la gran parte de los datos
presentan relacin lineal, positiva en su mayora.

c. Grficos de Chernoff

Imagen 3: Caras de Chernoff fig 1.


"Height of face"
"ID"
"Height of mouth "BRAZO"
"Height of eyes "MUSLO"
"Width of hair" "BRACH"
"Width of nose" "EST"

"width of face" "EST"


"width of mouth" "ANTEB"
"width of eyes" "PIERNA"
"style of hair" "TIBIO"
"width of ear" "ESTSEN"

"structure of face" "ESTSEN"


"smiling"
"MANO"
"height of hair " "PIE"
"height of nose" "ID"
"height of ear " "BRAZO"

Las caras parece que estn ordenadas ascendentemente; primero las caras con
rasgos pequeos, despus aquellas que tiene los rasgos ms grandes y
pronunciados. Una alteracin de este orden se ve en las caras 17,18, 19 y 20;
donde los rasgos son menores y sus tamaos tambin. Una cara representativa de
todos los datos es la nmero 21, cuyas facciones son equilibradas y representan a
la gran parte de todo el conjunto. Por lo tanto, el conjunto de datos es muy
variado, pero se encuentra una clase de proporcin y semejanza, lo que permite
un crecimiento gradual interrumpido por aquellas caras ya mencionadas.

d. Graficos de Estrellas.

Imagen 4: Grafico de estrellas fig 1.

El conjunto de datos graficado presenta un aumento progresivo en los valores de las


observaciones hasta cierto punto y luego decrece tambin de forma gradual. Tambin, se
presenta una variacin considerable por la presencia de observaciones tan grandes como
las de las estrellas 14 y 25, y tan pequeas como las estrellas 17 y 18. Podra presentarse
una agrupacin de aquellas observaciones de valores grandes, y otra de aquellos valores
menores.

e. Grficos en R3.

Imagen 4-1: Perspectiva 1 Grafico en R3 de ANTEBR, BRAZO Y MANO.

Imagen 4-2: Perspectiva 2 Grafico en R3 de ANTEBR, BRAZO Y MANO.

f.

EST

Para el clculo de la varianza total se tomaron todos los valores de las varianzas
individuales y se sumaron.
ESTSEN BRAZO ANTEB MANO MUSLO PIERNA PIE

BRACH

TIBIO

165,8

88,7

31,8

28,1

18,7

40,3

38,9

6,7

88,36

96,53

169,8

90

32,4

29,1

18,3

43,3

42,7

6,4

89,81

98,61

170,7

87,7

33,6

29,5

20,7

43,7

41,1

7,2

87,8

94,05

170,9

87,1

31

28,2

18,6

43,7

40,6

6,7

90,97

92,91

157,5

81,3

32,1

27,3

17,5

38,1

39,6

6,6

85,05

103,94

165,9

88,2

31,8

29

18,6

42

40,6

6,5

91,19

96,67

158,7

86,1

30,6

27,8

18,4

40

37

5,9

90,85

92,5

166

88,7

30,2

26,9

17,5

41,6

39

5,9

89,07

93,75

158,7

83,7

31,1

27,1

18,3

38,9

37,5

6,1

87,14

96,4

161,5

81,2

32,3

27,8

19,1

42,8

40,1

6,2

86,07

93,69

167,3

88,6

34,8

27,3

18,3

43,1

41,8

7,3

78,45

96,98

167,4

83,2

34,3

30,1

19,2

43,4

42,2

6,8

87,76

97,24

159,2

81,5

31

27,3

17,5

39,8

39,6

4,9

88,06

99,5

170

87,9

34,2

30,9

19,4

43,1

43,7

6,3

90,35

101,39

166,3

88,3

30,6

28,8

18,3

41,8

41

5,9

94,12

98,09

169

85,6

32,6

28,8

19,1

42,7

42

88,34

98,36

156,2

81,6

31

25,6

17

44,2

39

5,1

82,58

88,24

159,6

86,6

32,7

25,4

17,7

42

37,5

77,68

89,29

155

82

30,3

26,6

17,3

37,9

36,1

5,2

87,79

95,25

161,1

84,1

29,5

26,6

17,8

38,6

38,2

5,9

90,17

98,96

170,3

88,1

34

29,3

18,2

43,2

41,4

5,9

86,18

95,83

167,8

83,9

32,5

28,6

20,2

43,3

42,9

7,2

88

99,08

163,1

88,1

31,7

26,9

18,1

40,1

39

5,9

84,86

97,26

165,8

87

33,2

26,3

19,5

43,2

40,7

5,9

79,22

94,21

175,4

89,6

35,2

30,1

19,1

45,1

44,5

6,3

85,51

98,67

159,8

85,6

31,5

27,1

19,2

42,3

39

5,7

86,03

92,2

166

84,9

30,5

28,1

17,8

41,2

43

6,1

92,13

104,37

161,2

84,1

32,8

29,2

18,4

42,6

41,1

5,9

89,02

96,48

160,4

84,3

30,5

27,8

16,8

41

39,8

91,15

97,07

164,3

85

35

27,8

19

47,2

42,4

79,43

89,83

165,5

82,6

36,2

28,6

20,2

45

42,3

5,6

79,01

94

167,2

85

33,6

27,1

19,8

46

41,6

5,6

80,65

90,43

167,2

83,4

33,5

29,7

19,4

45,2

44

5,2

88,66

97,35

23,94

6,95

2,82

1,74

0,90

5,06

4,39

0,41

18,82

14,29

TOTAL

79,30

Tabla 11: varianza total fig 1.

g. El conjunto de datos presenta atpicos, los cuales se han presentado en las


diferentes dimensiones de las estrellas y las caras. En estos grficos, se ha
presentado una gran diferencia de tamaos y dimensiones que ha sido muy

notoria; lo cual, sin importar si el crecimiento o decrecimiento fue gradual,


perfectamente puede notarse la variacin en las observaciones. En el grfico de
R3 se nota perfectamente aquellos dos datos que influyeron en las dimensiones
de estrellas y caras, uno por encima del plano y el otro debajo del mismo, los que
pueden considerarse como los atpicos de la base usada. Estos dos datos
mencionados son los que han influido mayormente en la formacin del diagrama
de dispersin, generando el plano visto de acuerdo a sus valores alejados a la
relacin lineal de los datos.
5. Valores de las variables restadas de su media aritmtica.
EST
ESTSEN BRAZO ANTEB MANO MUSLO PIERNA PIE
BRACH TIBIO
1,24
3,13
-0,57
0,08
0,12
-2,02
-1,70 0,67
1,65
0,50
5,24
4,43
0,03
1,08
-0,28
0,98
2,10 0,37
3,10
2,58
6,14
2,13
1,23
1,48
2,12
1,38
0,50 1,17
1,09 -1,98
6,34
1,53
-1,37
0,18
0,02
1,38
0,00 0,67
4,26 -3,12
-7,06
1,34
-5,86
1,44
-5,86
-3,06
2,74
2,84
-5,36
5,44
1,74
4,44

-4,27
2,63
0,53
3,13
-1,87
-4,37
3,03
-2,37
-4,07
2,33
2,73
0,03

-0,27
-0,57
-1,77
-2,17
-1,27
-0,07
2,43
1,93
-1,37
1,83
-1,77
0,23

-0,72
0,98
-0,22
-1,12
-0,92
-0,22
-0,72
2,08
-0,72
2,88
0,78
0,78

-1,08
0,02
-0,18
-1,08
-0,28
0,52
-0,28
0,62
-1,08
0,82
-0,28
0,52

-4,22
-0,32
-2,32
-0,72
-3,42
0,48
0,78
1,08
-2,52
0,78
-0,52
0,38

-1,00
0,00
-3,60
-1,60
-3,10
-0,50
1,20
1,60
-1,00
3,10
0,40
1,40

0,57
0,47
-0,13
-0,13
0,07
0,17
1,27
0,77
-1,13
0,27
-0,13
-0,03

-1,66
4,48
4,14
2,36
0,43
-0,64
-8,26
1,05
1,35
3,64
7,41
1,63

7,91
0,64
-3,53
-2,28
0,37
-2,34
0,95
1,21
3,47
5,36
2,06
2,33

-8,36
-4,96
-9,56
-3,46
5,74
3,24
-1,46
1,24
10,84
-4,76
1,44
-3,36

-3,97
1,03
-3,57
-1,47
2,53
-1,67
2,53
1,43
4,03
0,03
-0,67
-1,47

-1,37
0,33
-2,07
-2,87
1,63
0,13
-0,67
0,83
2,83
-0,87
-1,87
0,43

-2,42
-2,62
-1,42
-1,42
1,28
0,58
-1,12
-1,72
2,08
-0,92
0,08
1,18

-1,58
-0,88
-1,28
-0,78
-0,38
1,62
-0,48
0,92
0,52
0,62
-0,78
-0,18

1,88
-0,32
-4,42
-3,72
0,88
0,98
-2,22
0,88
2,78
-0,02
-1,12
0,28

-1,60
-3,10
-4,50
-2,40
0,80
2,30
-1,60
0,10
3,90
-1,60
2,40
0,50

-0,93
-1,03
-0,83
-0,13
-0,13
1,17
-0,13
-0,13
0,27
-0,33
0,07
-0,13

-4,13
-9,03
1,08
3,46
-0,53
1,29
-1,85
-7,49
-1,20
-0,68
5,42
2,31

-7,79
-6,74
-0,78
2,93
-0,20
3,05
1,23
-1,82
2,64
-3,83
8,34
0,45

-4,16
-0,26
0,94
2,64

-1,27
-0,57
-2,97
-0,57

-1,87
2,63
3,83
1,23

-0,22
-0,22
0,58
-0,92

-1,78
0,42
1,62
1,22

-1,32
4,88
2,68
3,68

-0,80
1,80
1,70
1,00

-0,03
-1,03
-0,43
-0,43

4,44
-7,28
-7,70
-6,06

1,04
-6,20
-2,03
-5,60

Tabla 12: valores de las variables restadas de su media aritmtica de la fig 1.

a. Matriz de Covarianza

Imagen 5: matriz de Covarianza de los nuevos datos.

b. Matriz de Correlacin

Imagen 6: matriz de Correlacin de los nuevos datos.

Restando la media de los valores vemos respecto a la matriz de covarianza vemos que en general
las caractersticas no tienen gran variacin una respecto a otra como ejemplo vemos Muslo
Antebrazo Muslo Pie, con excepcin de algunas que si tienen una variacin mayor como la Pierna
Est y Tibia Brach. Tambin podemos observar a travs de la matriz de correlacin que en
general las variables no tienen tendencia lineal una respecto a la otra esto quiere decir que los
comportamientos en cuanto a los tamaos no tienen parecido entre si, no tienen una relacin
fuerte entre ellos.

6. Valores de las variables restadas de su media aritmtica y dividida su desviacin estndar.


EST

ESTSEN BRAZO

ANTEB

MANO MUSLO PIERNA PIE

BRACH

TIBIO

0,25

1,19

-0,34

0,06

0,13

-0,90

-0,81

1,06

0,38

0,13

1,07

1,68

0,02

0,82

-0,29

0,44

1,00

0,59

0,71

0,68

1,25

0,81

0,73

1,12

2,24

0,62

0,24

1,84

0,25

-0,52

1,30

0,58

-0,81

0,13

0,03

0,62

0,00

1,06

0,98

-0,83

-1,44

-1,62

-0,16

-0,55

-1,14

-1,87

-0,48

0,90

-0,38

2,09

0,27

1,00

-0,34

0,74

0,03

-0,14

0,00

0,74

1,03

0,17

-1,20

0,20

-1,05

-0,17

-0,19

-1,03

-1,72

-0,20

0,95

-0,93

0,29

1,19

-1,29

-0,85

-1,14

-0,32

-0,77

-0,20

0,54

-0,60

-1,20

-0,71

-0,75

-0,70

-0,29

-1,52

-1,48

0,11

0,10

0,10

-0,63

-1,66

-0,04

-0,17

0,55

0,22

-0,24

0,27

-0,15

-0,62

0,56

1,15

1,45

-0,55

-0,29

0,35

0,57

2,00

-1,90

0,25

0,58

-0,90

1,15

1,58

0,66

0,48

0,76

1,21

0,24

0,32

-1,10

-1,54

-0,81

-0,55

-1,14

-1,12

-0,48

-1,77

0,31

0,92

1,11

0,89

1,09

2,18

0,87

0,35

1,48

0,43

0,84

1,42

0,35

1,04

-1,05

0,59

-0,29

-0,23

0,19

-0,20

1,71

0,54

0,91

0,01

0,14

0,59

0,55

0,17

0,67

-0,04

0,38

0,62

-1,71

-1,50

-0,81

-1,84

-1,66

0,84

-0,77

-1,46

-0,95

-2,06

-1,01

0,39

0,20

-1,99

-0,92

-0,14

-1,48

-1,61

-2,08

-1,78

-1,95

-1,35

-1,23

-1,08

-1,35

-1,96

-2,15

-1,30

0,25

-0,21

-0,71

-0,56

-1,71

-1,08

-0,82

-1,65

-1,15

-0,20

0,80

0,77

1,17

0,96

0,97

0,97

-0,40

0,39

0,38

-0,20

-0,12

-0,05

0,66

-0,63

0,08

0,44

1,71

0,44

1,10

1,84

0,30

0,81

-0,30

0,96

-0,40

-0,85

-0,50

-0,99

-0,77

-0,20

-0,43

0,32

0,25

0,54

0,50

-1,31

0,98

0,39

0,05

-0,20

-1,73

-0,48

2,21

1,53

1,69

1,58

0,55

1,24

1,86

0,43

-0,28

0,70

-0,97

0,01

-0,52

-0,70

0,66

-0,01

-0,77

-0,51

-0,16

-1,01
2,21

0,29

-0,25

-1,11

0,06

-0,82

-0,50

1,14

0,11

1,25

-0,69

-0,56

0,26

0,89

-0,19

0,13

0,24

-0,20

0,53

0,12

-0,85

-0,48

-1,11

-0,17

-1,87

-0,58

-0,38

-0,04

1,02

0,27

-0,05

-0,21

1,57

-0,17

0,45

2,17

0,86

-1,61

-1,68

-1,64

0,19

-1,13

2,28

0,44

1,71

1,19

0,81

-0,67

-1,78

-0,54

0,54

-0,21

0,73

-0,70

1,29

1,64

0,48

-0,67

-1,40

-1,48

Tabla 13: valores de las variables restadas de su media aritmtica y dividida su desviacin estndar de la fig 1

a. Matriz de Covarianza

Imagen 7: matriz de Covarianza de los nuevos datos

b. Matriz de Correlacin

Imagen 8: matriz de Covarianza de los nuevos datos

Al aplicar la resta y la divisin por la desviacin estndar vemos que se genera una especie
de transformacin haciendo que de igual manera los valores de covarianza y correlacin
respecto a los valores mximos (cada variable con ella misma), los valores son altos en la
mayora de las variables, podramos llegar a la conclusin que los comportamientos aun
estando transformados tienden a comportarse de igual manera que en el punto anterior.

7. En Bogot se recolecta la informacin de los contaminantes de origen antropogenico y


natural y como se comportan las variables meteorolgicas que determinan el
comportamiento de estos compuestos en la atmosfera de Bogot, se cuenta con 13
estaciones que recolectan informacin y datos que se analizan y se validan en una
estacin central para en caso de ser necesario tomar medidas de control.
Dichas estaciones siendo mviles realizan monitoreo continuo de material particulado,
gases contaminantes, variables meteorolgicas de precipitacin entre otras caractersticas
relacionadas con la calidad de aire en Bogot, la metodologa se rige por la EPA
estadounidense.
8.

Como vemos en cada grafico la medida inicial 0 en todas las variables tiende a llegar hasta
uno, teniendo sentido ya que estamos relacionando la variable con ella misma en el
tiempo 0 que sera ella misma (la correlacin de una variable con ella misma es 1) y vemos
que a travs del tiempo en general tienden a tener un comportamiento decadente, lo que
implica que cada variable en el tiempo no tiende a parecerse a ella misma inicialmente en
cada medida de 1 - 7, en algunos casos se observa que llega a ser negativa representado
una relacin inversa con ella misma en el tiempo.

PUNTO 11 TALLER NUMERO 2


1.
REZAGO

VARIANZA

1
2
3
4
5
6
7
8

VARIANZA
1,457571429
3,073230769
3,402156863
4,319347826
7,078285714
6,940434783
9,362727273
16,555

1
2
3
4
5
6
7
8
9
10
11

VARIANZA
1,295529412
1,578873239
1,428970588
1,104745763
1,0274
1,882195122
2,097575758
1,6
0,902222222
1,4475
1,77

VARIANZA

20
15
10
VARIANZA

5
0
1

REZAGO

2.
REZAGO

VARIANZA
2,5

VARIANZA

2
1,5
1

VARIANZA

0,5
0
1

REZAGO

10 11

3.
REZAGO

VARIANZA

1
2
3
4
5
6
7
8

VARIANZA
1,564782609
3,363478261
3,62
4,687462687
6,941219512
7,176153846
7,86
15,128

1
2
3
4
5
6
7
8
9
10
11

VARIANZA
1,46105802
2,783505976
2,83902439
3,36005814
4,632539683
4,704222222
4,759464286
5,971388889
0,902222222
1,4475
1,77

16
14

VARIANZA

12
10
8
6

VARIANZA

4
2
0
1

REZAGO

4.

VARIANZA
7

REZAGO

VARIANZA

6
5
4
3

VARIANZA

2
1
0
1

REZAGO

ANALISIS.

10 11

Solamente los variogramas 1 y 3 tienen comportamientos muy similares. Los variogramas 2 y 4


presentan cierta similitud, pero es mucho menor a comparacin de la pareja mencionada
anteriormente.
3

UNIVERSIDAD NACIONAL DE COLOMBIA 2015

Das könnte Ihnen auch gefallen