Sie sind auf Seite 1von 9

ANÁLISIS MULTIVARIADO

Esta parte del informe comprende en realizar una síntesis de algunas de las variables estudiadas en factores o

componentes principales, donde cada factor esta compuesto de variables intercorrelacionadas.

El Análisis de Factores es una técnica creada por psicólogos a principios del siglo XX, y que debido a su utilidad.

Ha sido incorporado en los últimos años en estudios geográficos, sociales, ambientales, entre otros.

La importancia del Análisis de Factores se fundamenta en los siguientes puntos (Molo, 1995):

; Reduce el número inicial de las variables, con la pérdida mínima de información.

; Ayuda a definir o descubrir las estructuras ocultas o básicas que sustentan las intercorrelaciones entre las

variables originales.

; Ayuda a conseguir cierto grado de objetividad, difícilmente alcanzable a través de otras técnicas.

; En el análisis geográfico espacial, esta técnica ofrece una manera formal y rigurosa para llegar a una verdadera

síntesis de las actividades que se dan en dicho espacio geográfico.

La selección de variables se realizó por medio de un análisis exploratorio en conjunto con otras variables, donde se

busca expresar una mayor intercorrelación y eliminar la multicolinealidad. Por otra parte se busco obtener un

número de variables que fuesen importantes para el análisis, y que a su vez el número de variables sea menor que el

número de casos estudiados (Gorsuch, 1974).

Con respecto a las variables de cobertura boscosa, uso de suelo y las de condiciones de la vivienda; hay que señalar

que se utilizó la proporción con relación a la unidad de estudio (microcuenca), debido a que la extensión superficial

de las microcuencas es muy heterogénea. Puesto la proporción nos permite establecer cual es la variable más

predominante dentro de cada microcuenca.

Al tener estructurada la matriz de información espacial - ambiental se procede a normalizar todas las variables. Este

procedimiento es importante, ya que anula la ponderación entre la variables, puesto asume que todas las variables

poseen una misma distribución estadística.

Las unidades de estudio para el análisis de factores son las 33 microcuencas ubicadas en las cuencas de los ríos

Gatún, Gatuncillo, Aguas Claras, Agua Sucia, Palenque, Limón y Quebrada del Medio, donde se realizaron las
muestras de calidad de agua. Estos sitios se encuentran en la parte Norte del Corredor Transístmico en la Provincia

de Colón.

En el Análisis de Factores con el método de componentes principales se escogieron las variables que tengan la

relación con la condición ambiental de las viviendas, situación de los Recursos Naturales y con la Presión que se

ejerce sobre los mismos, estas variables son: 1-porcentaje de Bosques, 2-porcentaje de Herbazales, 3-porcentaje de

Pastos, 4- número de industrias, 5- número de comercios, 6- número de basureros, 7- número de puercos, 8- número

de pollos, 9- número de descargas de aguas servidas, 10- Oxígeno Disuelto, 11- Coliformes Totales, 12- Coliformes

Fecales, 13- Densidad de habitantes por superficie poblada, 14- porcentaje de viviendas sin agua potable, 15-

porcentaje de viviendas sin servicio sanitario 16- porcentaje de viviendas sin electricidad, 17- porcentaje de

viviendas que cocinan con leña y 18-Fosfatos.

Resultados

Matriz de Correlación

Como primer punto se presentará el nivel de correlación existente entre las variables, mediante el coeficiente de

Pearson. Al examinar la matriz de correlación, encontramos que las variables que muestran los valores significativos

(mayores a +0.60 ó menores a –0.60) son: las industrias, comercios y basureros, esta relación se debe a que los

basureros se encuentran en los sitios más poblados, que a su vez están próximos a los centros comerciales e

industriales. Otras variables que se presentan vinculadas entre sí son los comercios con las porquerizas y descargas.

Por otra parte, las porquerizas y las descargas se muestran correlacionadas con los Coliformes Fecales. A su vez, las

variables que nos indican sobre la condición de las viviendas se encuentran estrechamente vinculadas entre sí Por

último, la densidad de la población posee una relación directa con la proporción de pastos. Esta correlación de tipo

espacial se debe a que la actividad predominante en la zona de estudio es la ganadería. Históricamente la ganadería

se desarrollaba con mayor auge en las zonas próximas a la Transístmica, sobre todo en las subcuencas de Agua

Sucia y Gatuncillo, y estas zonas a su vez, por su ubicación a la Transístmica se han convertido en puntos de

atracción y concentración de la Población. Como podemos visualizar de manera general en el cuadro nos muestra

que aparentemente no existiese una buena correlación entre las variables.


Cuadro 1. Matriz de Correlación.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
1 % BOSQUE 1
2 % HERB -0.51 1
3 % PASTOS -0.52 0.53 1
4 No INDUST -0.35 0.41 0.26 1
5 No COMER -0.21 0.18 -0.01 0.73 1
6 No BASUR -0.19 0.25 0.05 0.80 0.71 1
7 No -0.23 0.20 0.30 0.31 0.00 -0.01 1
PUERCO
8 No POLLOS -0.15 0.28 0.14 0.34 0.19 -0.08 0.02 1
9 DESCARGA -0.34 0.36 0.32 0.82 0.67 0.49 0.64 0.35 1
10 OD 0.35 -0.22 -0.11 -0.30 -0.17 -0.32 0.06 0.03 -0.14 1
11 COLI -0.07 0.14 0.17 0.23 0.23 0.29 0.03 -0.01 0.04 0.12 1
TOTAL
12 COLI -0.11 0.10 0.22 0.46 0.28 0.22 0.61 -0.08 0.55 0.05 0.47 1
FECAL
13 DENSIDAD -0.20 0.42 0.65 0.00 -0.07 -0.04 -0.05 -0.06 -0.07 -0.08 0.17 -0.02 1
14 % S/ AGUA 0.24 -0.09 -0.34 -0.23 -0.06 -0.02 -0.18 -0.23 -0.24 0.08 0.06 -0.01 -0.16 1
P
15 % S/ SANIT 0.08 -0.16 -0.08 -0.14 -0.15 -0.04 -0.07 -0.11 -0.12 0.28 0.10 0.09 -0.10 0.64 1
16 % S/ ELECT 0.01 0.19 0.06 -0.05 -0.12 0.02 -0.01 -0.06 -0.05 -0.02 0.04 0.07 0.02 0.79 0.72 1
17 % COCINA 0.09 0.10 -0.03 -0.10 -0.16 0.00 -0.02 -0.07 -0.09 0.07 0.03 0.05 -0.10 0.81 0.76 0.97 1
LEÑA
18 FOSFATO -0.39 0.22 0.32 -0.01 0.01 -0.14 0.05 0.02 0.01 -0.02 0.18 0.08 0.25 -0.20 -0.16 -0.14 -0.18 1

Valores Característicos

La importancia de los valores característicos se fundamente en el porcentaje de la varianza acumulada. Esto se debe

a que la varianza acumulada nos indica el número de factores o componentes principales que se pueden retener y su

poder explicativo. Cabe destacar, que algunos autores recomiendan que debe trabajarse con un número de factores

que puedan explicar el 80% de los datos. Por ello, al estudiar el cuadro de valores característicos, encontramos que

trabajando con 6 factores o componentes principales obtenemos la explicación del 80% de los datos.

Comunalidades

Ahora procederemos al análisis de las comunalidades. Las comunalidades nos permite conocer la calidad/

consistencia de la información en relación con el número de factores con que se está trabajando. Para ello, se debe

calcular un parámetro llamado PSI (ψ), que es el indicativo del manejo de los datos. En el Análisis de Factores se

recomienda que el valor PSI (ψ) en general debe ser menor a 0.30 para ser aceptable. Para conocer la consistencia de

la matriz de información se trabaja con el promedio del valor PSI (ψ), que para nuestra matriz de información es de
0.20, por lo que existen evidencias de un buen manejo de los datos para minimizar los errores al trabajar con los 6

componentes principales.

Cargas Factoriales

Las cargas factoriales nos permite discernir las variables intercorrelacionadas y su peso predominante sobre los

componentes principales. En esta etapa se define que variables predominan en cada factor o componente principal.

Para la asignación de una variable a un factor, se busca en cual de los 6 factores tiene mayor peso. Para unos autores

la carga factorial de las variables debe ser mayor a |0.55| para ser considerada en un factor o componente principal.

En esta etapa existe un paso importante en el Análisis de Factores, que se conoce como la rotación de los factores,

esto significa que los 6 ejes de los factores son movidos mediante métodos matemáticos. Esta rotación permite un

reagrupamiento de las variables buscando una mejor correlación entre las mismas.

Existen muchos métodos de rotación, y el más popular y utilizado es el de VARIMAX Normalizado (Dillon y

Goldstein, 1984). Una de las ventajas de este proceso es que mantiene los factores no correlacionados entre sí

(Molo, 1995).

La conformación de estos componentes principales o factores es la siguiente:

Componente Principal 1: a este factor le llamamos “Número de Industrias, Agroindustrias, Comercios y Basureros”,

el cual representa el número de Industrias, Comercios y Basureros.

Componente Principal 2: a este factor le nombramos “Condición de la Vivienda”, que contiene las variables de la

proporción de viviendas sin agua potable, servicio sanitario, electricidad y que cocinan con leña.

Componente Principal 3: a este factor le denominamos “Cobertura Vegetal, Densidad de la Población y Fosfatos”,

donde se encuentran la proporción de bosques, herbazales, pasto, la densidad de la población y los fosfatos.

Componente Principal 4: a este factor le designamos “Fuente de Contaminación y Coliformes Fecales”, donde se

ubican el número de puercos, descargas y los Coliformes Fecales.


Componente Principal 5: a este factor le titulamos “Oxígeno Disuelto y Coliformes Totales”, que representa al

Oxígeno Disuelto y los Coliformes Totales.

Componente Principal 6: a este factor le llamamos “Polleras”, que sólo contiene el número de pollos.

Antes de proseguir con los puntajes factoriales de cada componente principal, cabe señalar que, en el Análisis de

Factores nos permitió aclarecer variables que tienen correlación y que anteriormente no lo mostraban. Estas

variables que en el Análisis de Factores muestran correlación se encuentran en el Componente 2. Y otras variables

se ubican en el Componente 5. De esta forma, obtenemos las 18 variables se pudieron resumir en 6 componentes

principales. De los cuales encontramos que los Componentes 2,3 y 5 nos explican la situación ambiental de los

recursos naturales y de las viviendas, mientras los Componentes 1,4 y 6 hace mayor énfasis a las variables

vinculadas con la presión que se realiza sobre el ambiente.

Puntajes Factoriales

Los puntajes de los Componentes Principales son indicadores del nivel de concentración – dispersión espacial por

microcuencas de las variables que conformen dichos Componentes.

Componente Principal 1: Los puntajes para este factor han sido estructurados de la siguiente forma:

¾ Sin Registro (-1.0320): son zonas donde no se tiene registradas Industrias, Comercios, Agroindustrias, ni

Basureros. Por lo general son microcuencas con poca o ninguna población.

¾ Muy Disperso (-0.669 a 0): Son sitios donde el número de establecimientos por microcuencas es pequeño. Por

lo general estas zonas se ubican alejadas de los polos de concentración, con excepción de 2 casos (Limón 2 y 3).

La explicación de esta última situación se fundamenta en su posición geográfica. Puesto ambos casos se van

distanciando de la Transístmica y de los polos de mayor desarrollo que se encuentran en Limón 4 que posee un

mayor puntaje.

¾ Disperso (0.1 a 2.0) Estas son áreas que se encuentran influenciadas indirectamente por la Transístmica. Estas

microcuencas son: Aguas Claras 4, Gatuncillo 6 y Limón 4.


¾ Concentrados (2.0 a 5.0): Son las microcuencas de Agua Sucia 3 y Gatuncillo 5, que se caracterizan por

ubicarse sobre la Transístmica, donde también existen áreas de desarrollo.

¾ Muy Concentrados (mayor a 12.0): En este caso, sólo se encuentran la microcuenca de Agua Sucia 2. Este sitio

presenta la mayor concentración de Industrias, Comercios y Basureros, lo cual nos indica que existe una mayor

presión sobre los Recursos Naturales. La razón que explica este puntaje tan alto (12.25), se debe a que en esta

zona se encuentra la zona de Buena Vista – El Giral, que históricamente han sido polo de concentración de

Industrias, Comercios y de Población, que no cuenta con un servicio de recolección de desechos sólidos.

Componente Principal 2: Este puntaje nos permite conocer el nivel de concentración de viviendas con mayor

interrelación con el ambiente, es decir, que nos permite conocer el nivel de urbanización o rural de cada

microcuenca, por medio de la condición de las viviendas. Los puntajes se sistematizaron de la siguiente manera:

¾ Sin dato (-2.8699): son sitios donde el porcentaje de viviendas intercorrelacionadas con el ambiente es

nulo(áreas semiurbanas de la Transístmica), o áreas sin población (alejadas de la Transístmica).

¾ Zonas con viviendas que registran poca dependencia del ambiente (-2.7 a 0): Estas son microcuencas que se

encuentran próximas a la transístmica, donde se observa en los moradores una mezcla de trabajos agrarios

asalariados.

¾ Zonas con moderada dependencia del ambiente (0.1 a 2.0): Estas microcuencas se ubican más alejadas de la

Transístmica o de los centros de mayor desarrollo. Se diferencian del grupo anterior, por una mayor

predominancia de los trabajos agrícolas que los trabajos asalariados.

¾ Zonas con alta dependencia del ambiente (2.1 a 7.6): Estas zonas se encuentran alejadas de la Transístmica, y

en general poseen poca accesibilidad. En estas zonas predominan los trabajadores agrícolas, que por lo general

se dedican a la agricultura de subsistencia.

Componente Principal 3: Este puntaje nos permite evaluar la situación ambiental, por medio de la cobertura boscosa,

herbazales, pastos, densidad de la población y los fosfatos. Teniendo valores negativos para las microcuencas con

mayor cobertura boscosa y positivos para aquellas más presionadas sobre sus recursos naturales, es decir da una

valoración sobre el nivel de intervención sobre la cobertura vegetal. De esta manera se estructuraron los puntajes:
¾ Cobertura boscosa muy poco intervenidas (menor a –1.0): Estas microcuencas se ubican alejadas de la

Transístmica. Son sitios relativamente poco alterados, que todavía conservan parches de bosques. Se ubican

hacia el nacimiento del río Gatún, Sierra Llorona, desembocadura del río Gatún, Agua Sucia y en la subcuenca

del río Palenque.

¾ Cobertura boscosa parcialmente intervenida (-1.0 a 0) son zonas que poseen una accesibilidad deficiente, que

por lo general son zonas rurales o poco urbanizadas.

¾ Cobertura boscosa moderadamente intervenida (0.1 a 1.0): son sitios alejados de la Transístmica, que se

diferencian del grupo anterior por tener una mejor accesibilidad. Se caracterizan por microcuencas

agropecuarias.

¾ Cobertura boscosa altamente intervenida (1.1 a 3.5): son zonas aledañas a la Transístmica, donde predominan

los pastos, herbazales (paja blanca) y una alta densidad de la población. Estas microcuencas se encuentran en

las subcuencas de Agua Sucia (punto 1 y 2), Gatuncillo (3,5,6, y 7) y Limón (1,2 y 4).

¾ Cobertura boscosa muy altamente intervenida (mayores a 10.0): lo conforma la microcuenca de Limón 3, donde

la presencia de bosques es insignificante, los usos predominantes son los pastizales y el residencial. Donde

existe una alta densidad de población.

Componente Principal 4: Este puntaje nos permite cuantificar el nivel de contaminación microbiológica del agua el

grado de presión que se hace sobre este recurso. La estructura de los puntajes para este factor es la siguiente:

¾ Microcuencas poco contaminadas (menor a –1.0): son sitios que se encuentran alejadas de la Transístmica, con

poca población y una accesibilidad deficiente. Por lo general son áreas con poco nivel de intervención.

¾ Microcuencas moderadamente contaminadas (-1.0 a 1.0): son zonas que se ubican cercanas a la Transístmica,

donde el uso predominante son los pastizales y el residencial.

¾ Microcuencas con alta contaminación (1.1 a 4.0): son las microcuencas de Agua Sucia 2, Gatuncillo 3 y 7. La

microcuenca de Agua Sucia 2 se caracteriza por estar sobre la Transístmica y poseer varias descargas de aguas

servidas provenientes de diversas actividades. Por otra parte los puntos de Gatuncillo se caracterizan por la

presencia de porquerizas, en su mayoría muy próximas a los cauces de los ríos.


¾ Microcuencas con alto grado de contaminación (mayor a 9.0): esta es la microcuenca de Gatuncillo 6, la cual se

encuentra muy próxima a la Transístmica. Además esta microcuenca cuenta con varias porquerizas, las cuales

se encuentran cercanas al río principal.

Componente Principal 5: Este puntaje mide simultáneamente el Oxígeno Disuelto y los Coliformes Totales, lo cual

dificulta poder establecer algún tipo de patrón sobre este factor.

Componente Principal 6: Este puntaje cuantifica el grado de producción de las fincas avícolas. Por lo que se

estructuraron de la siguiente forma:

¾ Sin actividad avícola (-0.3371): Son las microcuencas que no poseen fincas avícolas.

¾ Con actividad avícola (0 – 1.10): Son las microcuencas de Gatuncillo (puntos 2 y 3), Limón 4 y Palenque 3 y 4.

La mayoría de estas fincas son satélites, con excepción de las ubicadas en Palenque que son fincas de Toledano.

¾ Con una alta actividad avícola (mayor a 4.5): Esta es la microcuenca de Gatuncillo 5, donde se registra la mayor

tasa de producción de gallinas. Esta zona se encuentra en la Transístmica, donde están ubicadas las fincas de

Melo.
Matriz de Correlación de Residuos

Esta matriz nos permite evaluar la adecuación del modelo de Análisis de Factores empleado. Para ello, se cuenta en

la matriz de correlación de los residuos el número de celdas que sobrepasen el valor de significancia (α=0.05).

Luego se procede a calcular esta probabilidad, dividiendo el número de casos que sobrepasen a 0.05 (84) sobre el

número total de celdas (324). De esta forma obtenemos una probabilidad de 0.26. Que se compara con el límite

máximo permitido, donde algunos autores señalan que para considerar adecuado un modelo, la probabilidad debe

mantenerse por debajo de 0.30. Por lo que podemos concluir, que el método empleado de Análisis de Factores, por

medio de Componentes Principales es adecuado.

Cuadro 6. Matriz de Correlación de los Residuos.

Extracción: Componentes Principales


Rotación: (VARIMAX normalizada)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

1 % BOSQUE 0.40 0.09 0.08 0.04 -0.04 0.03 0.03 0.01 0.05 -0.05 -0.05 0.02 0.20 -0.01 -0.12 0.05 0.03 -0.11
2 % HERB 0.09 0.30 -0.10 -0.02 -0.04 0.02 0.04 -0.06 -0.03 0.07 0.03 0.01 -0.02 0.03 -0.12 -0.01 -0.01 -0.08
3 % PASTOS 0.08 -0.10 0.21 0.01 -0.01 0.05 -0.04 -0.02 0.03 0.04 -0.04 -0.02 0.05 -0.07 0.03 0.00 0.01 -0.16
4 No INDUST 0.04 -0.02 0.01 0.07 -0.07 0.05 -0.01 0.01 -0.01 0.01 -0.03 0.00 0.03 -0.03 0.02 0.00 0.00 0.00
5 No COMER -0.04 -0.04 -0.01 -0.07 0.19 -0.07 -0.01 -0.05 0.07 0.06 -0.10 -0.01 0.04 0.06 0.00 0.00 -0.01 0.09
6 No BASUR 0.03 0.02 0.05 0.05 -0.07 0.12 0.02 -0.05 -0.01 0.11 -0.04 -0.08 0.01 -0.06 0.03 -0.01 0.01 -0.04
7 No PUERCO 0.03 0.04 -0.04 -0.01 -0.01 0.02 0.09 0.00 0.00 0.00 0.05 -0.07 0.03 0.03 -0.04 0.00 0.00 -0.02
8 No POLLOS 0.01 -0.06 -0.02 0.01 -0.05 -0.05 0.00 0.11 -0.03 -0.15 0.09 0.07 -0.01 0.01 -0.02 0.01 0.00 0.00
9 DESCARGA 0.05 -0.03 0.03 -0.01 0.07 -0.01 0.00 -0.03 0.06 0.03 -0.06 -0.03 0.06 0.02 0.02 0.00 0.00 0.03
10 OD -0.05 0.07 0.04 0.01 0.06 0.11 0.00 -0.15 0.03 0.26 -0.15 -0.10 0.04 -0.01 0.02 -0.02 -0.01 -0.04
11 COLI TOTAL -0.05 0.03 -0.04 -0.03 -0.10 -0.04 0.05 0.09 -0.06 -0.15 0.21 0.01 -0.11 -0.01 -0.05 0.00 0.01 -0.07
12 COLI FECAL 0.02 0.01 -0.02 0.00 -0.01 -0.08 -0.07 0.07 -0.03 -0.10 0.01 0.15 0.00 0.01 -0.03 0.01 0.00 -0.01
13 DENSIDAD 0.20 -0.02 0.05 0.03 0.04 0.01 0.03 -0.01 0.06 0.04 -0.11 0.00 0.34 0.01 0.00 0.00 -0.03 -0.23
14 % S/ AGUA P -0.01 0.03 -0.07 -0.03 0.06 -0.06 0.03 0.01 0.02 -0.01 -0.01 0.01 0.01 0.16 -0.10 -0.01 -0.02 0.08
15 % S/ SANIT -0.12 -0.12 0.03 0.02 0.00 0.03 -0.04 -0.02 0.02 0.02 -0.05 -0.03 0.00 -0.10 0.25 -0.06 -0.04 0.02
16 % S/ ELECT 0.05 -0.01 0.00 0.00 0.00 -0.01 0.00 0.01 0.00 -0.02 0.00 0.01 0.00 -0.01 -0.06 0.04 0.02 0.02
17 % COC LEÑA 0.03 -0.01 0.01 0.00 -0.01 0.01 0.00 0.00 0.00 -0.01 0.01 0.00 -0.03 -0.02 -0.04 0.02 0.04 0.04
18 FOSFATO -0.11 -0.08 -0.16 0.00 0.09 -0.04 -0.02 0.00 0.03 -0.04 -0.07 -0.01 -0.23 0.08 0.02 0.02 0.04 0.59

Número de Errores 84
Número de Celdas 324
Probabilidad 0.26

Das könnte Ihnen auch gefallen