Sie sind auf Seite 1von 9

La informacin mutua como medida de asociacin de la variable

macroclimtica ONI con los caudales medios en el departamento de Antioquia.


Uber Camilo Agudelo Atehorta
ucagudeloa@unal.edu.co
Profesor: German Poveda Jaramillo

RESUMEN
El presente estudio tuvo como objetivo analizar la informacin mutua como una medida de asociacin
entre el ndice ONI que caracteriza el ciclo ENSO (El Nio Oscilacin del Sur), y los caudales medios
mensuales en el departamento de Antioquia, se estima la informacin mutua y se escala para as
compararla con los resultados obtenidos calculando la correlacin de Pearson y su significancia estadstica.
Los clculos se efectuaron con una muestra de 15 series de caudales de resolucin diaria, con un
porcentaje de datos faltantes inferior al 15% y longitud efectiva de registros mnima de 30 aos, las cuales
se obtuvieron de la red de estaciones limnigrficas y limnimtricas del Instituto de Hidrologa,
Meteorologa y Estudios Ambientales de Colombia (IDEAM). En general se observa dependencia
estadstica significativa de correlacin (-0.5 y -0.6) de los caudales con el ndice del ENSO estudiado. La
estimacin de la informacin mutua se acerca al estudio del comportamiento no lineal de los fenmenos
fsicos. Sin embargo no es posible asociarla con fenmenos fsicos con mayor claridad segn la
metodologa empleada.
Para dar solucin a la iniciativa planteada, fue necesario implementar un programa de computador,
lenguaje Python. Igualmente, se elaboraron cdigos en lenguaje Visual Basic para la lectura, clasificacin
y seleccin de la informacin facilitada por el IDEAM.
1. INTRODUCCIN
El fenmeno El Nio-Oscilacin del Sur (ENSO) es el conjunto ms poderoso de variaciones atmosfricas y
ocenicas en la regin del ocano Pacfico ecuatorial. Se manifiesta con variaciones anmalas de la presin
atmosfrica (Oscilacin del Sur) y de la temperatura en la superficie del mar (El Nio - fase clida o La Niafase fra) en el ocano Pacfico [1]. En sus fases extremas provoca alteraciones en la circulacin ocenica y
atmosfrica a escala global [2], en los cinturones tropicales y subtropicales de la tierra que favorecen e
intensifican el desarrollo de precipitaciones torrenciales, lo cual produce crecidas, inundaciones,
avalanchas, tormentas, as como sequas, con efectos catastrficos en ms de la mitad de la circunferencia
terrestre[3].
Sin embargo, el entendimiento de los caudales en los ros sobre el departamento de Antioquia es un poco
complejo debido a que son menos intermitentes por lo que renen todo lo que la cuenca les aporta. A lo
que se suma el efecto de fenmenos de gran escala, como el mencionado anteriormente, El NioOscilacin del Sur [4]. En este sentido, se evalu la asociacin de las series de caudales en 15 estaciones
limnigrficas y limnimtricas del IDEAM ubicadas en el departamento de Antioquia y la variabilidad del

ndice ONI de gran escala asociado al ciclo ENSO utilizado como predictor. Dada la gran diversidad de
ndices utilizados para realizar estudios sobre el efecto en el clima derivada de los fenmenos del ciclo
ENSO en Colombia, se hace nfasis en el ndice ONI ya que es el ms utilizado por la comunidad cientfica,
a nivel mundial. Cabe recordar que la medida de asociacin se realiza a travs del uso de la metodologa
de la informacin mutua descrita por Poveda [5].
2. METODOLOGA
Si bien es del conocimiento de todos de la influencia del ENSO sobre las componentes meteorolgicas en
una regin. Dicha influencia no se comporta de manera lineal ni homognea en todas partes, razn por la
cual se hace particularmente complicado hacer predicciones climticas a partir de un ndice de prediccin
ENSO en particular. En este sentido, se evalu la informacin mutua y el coeficiente de correlacin de
Pearson, las cuales cuantifican la dependencia no lineal y lineal, respectivamente entre dos variables.
2.1 Informacin mutua
La informacin mutua (IM) es un parmetro estadstico que cuantifica la dependencia global entre dos
variables aleatorias, es una medida de dependencia no lineal que cuantifica la reduccin en la
incertidumbre de una variable aleatoria por el conocimiento de otra [5]. En teora de la informacin la
incertidumbre o entropa (H) de una variable aleatoria se cuantifica con base en su funcin de densidad
de probabilidad, esta se estima como (Shannon, 1948) con el siguiente estimador [6]

() = ( )

(1)

=1

Donde 1 , 2 , , representa la funcin de densidad de probabilidades, que satisface =1 = 1, y


0, para una variable aleatoria. La base b en la que se evala el logaritmo define las unidades de la
entropa; siendo el bit la unidad asociada a la base 2. El valor de (IM) entre las dos variables aleatorias
en funcin del tiempo de rezago .

() =
2 (

(2)

En donde,

= ( = , + = ), = =

Cuando = , la ecuacin anterior (2) define la funcin de auto informacin de la serie (ChapeauBlondeau, 2007; [5].
El valor de (IM) es una medida general de asociacin entre variables que detecta tanto relaciones lineales
como no lineales, por lo que se considera un estadstico ms robusto frente a los coeficientes de
correlacin de Pearson o Spearman los cuales solo encuentran dependencias lineales.
Para el caso general en el que , es posible definir la funcin de informacin mutua normalizada (IMN)
mediante el siguiente estimador,

() =

()

(3)

El valor de (IMN) es siempre positivo y toma valores entre [0,1], se hace nulo nicamente cuando las
variables aleatorias son independientes y 1 cuando existe asociacin, el conocimiento de una de las
variables en esta caso el ndice ONI nos aporta informacin para la otra.
Ahora bien, para cuantificar la memoria del proceso no lineal se hace necesario estimar la escala de
informacin normalizada descrita por Poveda [5] mediante la siguiente ecuacin,

= 1 + 2 ()

(4)

=1

2.2 Coeficiente de correlacin


El coeficiente de correlacin () proporciona una medida de dependencia lineal entre dos variables
aleatorias, que puede ser de tres tipos: directa, cuando los incrementos en una de las variables se
encuentran asociados con incrementos en la otra; inversa, cuando los decrementos en una de las variables
se encuentran asociados con incrementos en la otra; y nula, cuando los cambios en una de las variables
no se asocian con los cambios en la otra. El valor de () flucta en el intervalo [-1,1] y sus ptimos de
dependencia directa e inversa se relacionan, respectivamente, con el extremo inferior y el extremo
superior de este ltimo. Cuando existe dependencia nula entre las variables aleatorias, el valor de es igual
a cero. El valor de entre las series de tiempo del ndice ONI y las series de caudales es estimado como [5].
() =

=1 ( )(+ + )

2
[
=1 ( ) =1 (+ + ) ]

(5)

Donde, , , + , + son la serie del parmetro predictor , su valor promedio, la serie de tiempo
rezagada un valor en la estacin y su promedio respectivamente.
3. DATOS Y MTODOS
Sobre el territorio antioqueo se ubican un total de 75 estaciones limnigrficas y limnimtricas
administradas por el Instituto de Hidrologa, Meteorologa y Estudios Ambientales de Colombia (IDEAM),
las cuales se han representado con tringulos color marrn en la Figura 1. Estas cuentan con registros de
caudal total diario entre los aos 1966 y 2013, se conformaron las bases de datos climticas a escala
temporal mensual, donde se efectu la identificacin de datos faltantes, para esto se tuvo como
parmetro un porcentaje de datos faltantes menor al 15% y un registro efectivo de datos de mnimo 30
aos, del total de datos por estacin climtica; como resultado correspondieron a 15 (11.25%) del total de
las estaciones. El grupo de 15 estaciones, representadas con crculos color marrn en la Figura 1, fueron
utilizadas en este trabajo.
El ndice ocenico del Nio (ONI), es calculado como la media mvil de tres puntos de la serie mensual de
anomalas de la temperatura de la superficie del ocano en la Regin Nio 3-4. Los valores fueron tomados
de la pgina web: http://www.cpc.ncep.noaa.gov/data/indices/ Cabe recordar que los valores positivos

del ONI, mayores o iguales a 0,5 por 5 meses consecutivos o ms indican la ocurrencia de un evento El
NIO. Valores negativos del ONI, inferiores o iguales a -0,5 por 5 meses consecutivos o ms indican la
ocurrencia de un evento La NIA [5] tomado de pal trabajo.
3.1 Correlacin, y la informacin mutua
Para efectos del clculo de la informacin mutua es necesario determinar la funcin de densidad de
probabilidad de los caudales, la cual se estima con su histograma de frecuencias relativas. El procedimiento
para la construccin de histogramas de frecuencias relativas requiere la agrupacin de los registros de
tiempo en clases; para propsitos de clculo, en este trabajo, se utilizaron 10 clases de igual ancho,
distribuidas entre el valor mnimo y el valor mximo de los datos. Con ello se procedi al clculo de la
entropa, usando la Ecuacin (1), para cada estacin limnigrfica y limnimtrica.
El comportamiento estadstico de dependencia de e IMN con respecto al vector de desplazamiento fue
cuantificado usando rezagos temporales = 1, 2, 3, 4, 5, 6, 7, 8, 9 y 10 meses.
Tabla 1. Estaciones limnigrficas Y limnimtricas utilizadas para el anlisis de datos.
ID
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14

Estacin
(Cdigo IDEAM)
PTE REAL
[23087150]
EL REMOLINO
[26197030]
PUEBLO NUEVO
[12027050]
LA GALERA
[26217010]
LA BODEGA
[23107020]
VEGACHI
[23107040]
CAMPAMENTO
[26197010]
PTE IGLESIAS
[26207030]
APAVI
[26247030]
BRISAS DEL
NECHI
[27027060]
PAILANIA
[23087200]
LA MASCOTA
[23107030]
BARRANQUILLIT
A [12017020]
SONSON
[26187030]
DABEIBA 2
[11117050]

Cota
(msnm)

Variable
climtica

*R

Ao
inicial

Ao
final

*AR

*%F

*%D

*Ae

2083

Caudal

480

1974

2013

40

9.12

90.88

36.35

678

Caudal

504

1972

2013

42

10.04

89.96

37.78

78

Caudal

432

1978

2013

36

11.09

88.91

32.01

662

Caudal

444

1977

2013

37

15.00

85.00

31.39

120

Caudal

444

1976

2012

37

11.92

88.08

32.59

929

Caudal

468

1975

2013

39

12.05

87.95

34.30

1080

Caudal

504

1972

2013

42

12.24

87.76

36.86

583

Caudal

408

1979

2012

34

12.54

87.46

29.74

106

Caudal

504

1972

2013

42

12.57

87.43

36.72

1880

Caudal

468

1975

2013

39

12.59

87.41

34.09

980

Caudal

492

1973

2013

41

12.79

87.21

35.76

970

Caudal

468

1975

2013

39

13.02

86.98

33.92

33

Caudal

444

1977

2013

37

14.80

85.20

31.52

2282

Caudal

528

1970

2013

44

14.82

85.18

37.48

650

Caudal

456

1976

2013

38

14.86

85.14

32.35

donde, *R= Registro de datos; *AR= Aos de registro; *%F= Porcentaje de datos faltantes; %D= Porcentaje
de datos disponibles; Ae= Aos efectivos de registros.

Figura 1. Localizacin de la zona de estudio y de la red de estaciones limnigrficas y limnimtricas


administradas por el IDEAM, utilizadas en el presente trabajo.
4. Resultados
A continuacin se presentas los resultados obtenidos para los parmetros estadsticos de informacin
mutua normalizada (IMN), correlacin de Pearson () y escala de informacin normalizada , los cuales
son representados por las figuras 2, 3 y 4 respectivamente. Es necesario resaltar que el eje Y de las grficas
fue modificado de tal manera que se pudiese observar algn patrn, de tal manera que en el eje Y no se
representar los valores mximos y mnimos entre los cuales se mueven los parmetros estadsticos
trabajados.
La Figura 2 muestra la asociacin entre los caudales en Antioquia y el ndice ONI en trminos de la
informacin mutua normalizada, como una funcin del vector de desplazamiento, para los rezagos
temporales = 1, 2, 3, 4, 5, 6, 7, 8, 9, y 10 meses. De acuerdo al valor de comparacin definido anteriormente
para IMN se puede inferir que las magnitudes encontradas son bajas. Es decir existe una asociacin baja
entre el ndice ocenico del Nio (ONI), y los caudales medios en el departamento de Antioquia, lo cual
contrasta con el estudio realizado por Poveda et, al 2002 [8]. Por lo cual se intuira que la informacin
mutua, no permite definir tan claramente una direccin de mxima continuidad, como en el caso de
aquella puesta en trminos de la correlacin; lo que se concluye al comparar la Figura 2 con la Figura 3.
A medida que crece el intervalo de agregacin, el estadstico de informacin mutua, comienza a capturar
relaciones no lineales, que no aparecen tan claras en los campos de correlacin. Sin embargo surge una
inquietud al ver que por ejemplo para los primeros tiempos de rezago el coeficiente de Pearson () el cual
captura una dependencia lineal significativa [-0.5 y -0.6] para las estaciones Apavi (ID=8) y Puente Iglesias

N ()

(ID=7). Los valores de IMN a pesar de que captura tanto relaciones lineales como no lineales no indican
una buena asociacin entre las variables de las series analizadas.

INFORMACIN MUTUA ( IMN) ENTRE REGISTROS DE CAUDALES E


NDICE ONI

0.40
0.39
0.38
0.37
0.36
0.35
0.34
0.33
0.32
0.31
0.30
0.29
0.28
0.27
0.26
0.25
0.24
0.23
0.22
0.21
0.20
0

10

(MES)
ID ESTACIONES
8

12

14

10

13

11

Figura 2. Informacin mutua normalizada entre las series de caudal y las series del ndice ONI para un
rezago
Por su parte la Figura 3 muestra la relacin entre los caudales en Antioquia y el ndice ONI, en trminos
del coeficiente de correlacin, como una funcin del vector de desplazamiento, para los rezagos
temporales = 1, 2, 3, 4, 5, 6, 7, 8, 9, y 10 meses. Los valores presentan una correlacin negativa significativa
para los primeros 3 meses de rezago, lo que indica que el aumento o disminucin en el ndice evaluado
est estrechamente relacionado a disminuciones o aumentos en los caudales. Lo cual se podra dar un
indicio de una especie de periodo de reaccin o de afectacin en el caudal despus de presentarse la
anomala en el ocano pacifico representada por el ndice ONI.

CORRELACIN DE PEARSON ( ) ENTRE SERIES DE CAUDALES E


NDICE ONI

0.30
0.20
0.10
0.00
-0.10

()

-0.20
-0.30
-0.40
-0.50
-0.60
-0.70
-0.80
-0.90
-1.00
0

10

(MES)
ID ESTACIONES
8

12

14

10

13

11

Figura 3. Correlacin lineal de Pearson () entre las series de caudal y las series del ndice ONI para un
rezago
La Figura 4 representa la escala de informacin normalizada () con 10 intervalos de clase usados para
la estimacin de la distribucin de probabilidades de las variables estudiadas. De forma general la toma
valores entre 1.5 y 1.6 meses para los rezagos temporales = 1, 2, 3, 4, 5, 6, 7, 8, 9, y 10 meses; lo cual es
posible observar que cada uno de dichos intervalos miden aproximadamente los mismo. Se puede
interpretar esta escala caracterstica como la longitud necesaria del ndice ONI para desarrollar un efecto
sobre los caudales en el departamento de Antioquia. En este sentido los valores de escala de informacin
normalizada dan cuenta de la existencia de la relacin entre el ndice ONI y los caudales debido a que la
escala de informacin normalizada permanece de manera aproximada invariable en el tiempo.

()

ESCALA DE INFORMACIN NORMALIZADA ENTRE REGISTROS DE


CAUDALES E NDICE ONI

1.80
1.75
1.70
1.65
1.60
1.55
1.50
1.45
1.40
1.35
1.30
1.25
1.20
1.15
1.10
1.05
1.00
1

10

(MES)
8

12

14

10

13

11

Figura 4. Escala de informacin normalizada entre los registros de caudales e ndice ONI para un rezago

5. Conclusiones
Los resultado de la informacin mutua no slo encuentra asociaciones no lineales no detectadas por
Pearson (), pero surge un interrogante grande y es que no capte todas las asociaciones lineales captadas
por (), debido a los valores bajos observados de IMN, lo cual no dara validez al mtodo presentado, sin
embargo esto se pude atribuir un error de clculo a la hora de realizar los clculos respectivos con la
formula empleada.
En trminos de la informacin mutua, no permite definir tan claramente una direccin, como en el caso
de aquella puesta en trminos de la correlacin; lo que se concluye al comparar las figuras 2 y 3 mostradas
anteriormente.
Los resultados de las correlaciones, dan pie para mejorar el ajuste y la prediccin del caudal mensual en
los ros del departamento de Antioquia, ya que los valores presentados en rezagos diferentes a cero
pueden ser usados como variables predictores, lo cual podra ser una herramienta de gran importancia
para la planificacin del recurso hdrico de la regin.
La investigacin sobre la existencia o no, de relaciones claras que permitan caracterizar la dependencia
temporal y su posible uso con propsitos de estimacin y pronstico, mediante el uso de teoras no lineales
(informacin mutua) a las escalas temporales adecuadas, constituye una posible lnea de trabajo futuro.

Agradecimiento
Al profesor German Poveda por despertar el inters por las ciencias de la estadstica y ocurrencia de
fenmenos climticos, por el apoyo durante el semestre 2015-2 y por sus clases magistrales que dieron pie
a entender fenmenos que eran ajenos al conocimiento de quien realiza este trabajo acadmico.

6. Referencias bibliogrficas
[1] S.R. Kovatz, El Nio and human health. Bulletin of the World Health Organization, 2000, vol. 78, 9, 11271135.
[2] C. Wang, Atmospheric circulation cells associated with the El Nio-Southern Oscillation, J. Climate,
2002, vol. 15, 399419.
[3] OPS- Oganizacin panamericana de la salud. Crnicas de Desastres Fenmeno el Nio, 1997-1998.
Programa de preparativos para situaciones de emergencias y coordinacin del socorro en casos de
desastre. Serie: Crnicas de Desastres, 2000, vol. 8, pp. 294.
[4] G. Poveda, J. Vlez, O. Mesa, A. Cuartas, J. Barco, R. Mantilla, J. Meja, C. Hoyos, J. Ramrez, L. Ceballos,
M. Zuluaga, P. Arias, B. Botero, M. Montoya, J. Giraldo y D. Quevedo, Linking Long-Term Water Balances
and Statistical Scaling to Estimate River Flows along the Drainage Networks of Colombia, J. Hydrol. Eng.,
vol. 12, n 1, pp. 4-13, 2007.
[5] G. Poveda, Escala de informacin, escala de fluctuacin y entropa de las lluvias en el valle de aburr,
Colombia, Revista de la academia Colombiana de ciencias exactas, fsicas y naturales, vol. XXXIII, pp. 4-7,
2009.
[6] C. Shannon, A mathematical theory of communication, Bell Syst. Tech. J., vol. 27, pp. 379-423, 1948.
[7] G. Guarn and A. Ochoa, Impacto de la Variabilidad Climtica en la Produccin de Banano en el Urab
Antioqueo. Numeral 10: ndices macroclimticos, precipitacin y produccin en Urab. M.S. thesis,
Ingeniera de Recursos Hdricos, Universidad Nacional de Colombia, 2011.
[8] Poveda et, al, 2002. Influencia De Fenmenos Macroclimticos Sobre El Ciclo Anual De La Hidrologa
Colombiana: Cuantificacin Lineal, No Lineal Y Percentiles Probabilsticos.

Das könnte Ihnen auch gefallen