Beruflich Dokumente
Kultur Dokumente
TESIS DOCTORAL
Presentado por:
Dedicatoria
Agradecimientos
Como autor de esta tesis quiero agradecer:
A EMIVASA-Aguas de Valencia por el financiamiento e informacin faci-
litada para desarrollar este trabajo.
Al Consejo Nacional de Ciencia y Tecnologa de Mxico por el financia-
miento brindado.
A mi director de tesis, Juan Bautista Marco Segura, por ver en un es-
tudiante annimo a un colaborador, por depositar en m su confianza, por
brindarme la oportunidad de colaborar en un proyecto tan interesante, por
su orientacin y sus siempre adecuados comentarios y nimos.
Imprescindible agradecer al personal del Departamento de Ingeniera
Hidrulica y medio ambiente, profesores y personal administrativo, todos fue-
ron un apoyo para m.
A mis compaeros estudiantes del departamento, fueron siempre una
fuente de consejos y ejemplos. Sin su compaa y apoyo estos aos habran
sido muy duros, en cambio han sido una grata experiencia, por tantos cafs,
almuerzos y tertulias llenas de risas. No particularizo, todos han sido importan-
tes.
A la colonia de compatriotas mexicanos en Valencia, han sido mi familia
todo este tiempo.
Al Club Deportivo Runnersworld Valencia por trascender a lo acadmico
y darme la oportunidad de disfrutar de grandes momentos y experiencias
durante varios aos.
A mi padre por su ejemplo, alma de minero. A mi madre por estar siem-
pre al pendiente a pesar de la distancia.
A Mabel, mi mujer, por su apoyo en los buenos y malos ratos, por su
paciencia y amor.
A la pequea Andrea, por alegrar cada da.
IV
Resumen
Ante un escenario donde el recurso agua es limitado y con una socie-
dad que la demanda cada vez con ms garantas, la ingeniera es exigida
a desarrollar tcnicas y metodologas eficientes para asegurar que el vital l-
quido sea entregado en ptimas condiciones de calidad y cantidad a los
usuarios domsticos, comerciales e industriales que conforman el conjunto
de abonados de una ciudad. Cada tipo de usuario demanda el agua en
diferentes escalas temporales y de cantidad, pero el conjunto de ellos con-
sumiendo agua a la vez generan la demanda global de una ciudad.
Los operadores de los sistemas de abastecimiento y distribucin de agua
potable estn obligados a gestionar sus operaciones de tal manera que el
conjunto de abonados cuente con el servicio en el momento que lo deman-
den. La experiencia que acumula el personal de operacin se vuelve funda-
mental para que este objetivo se cumpla ya que son capaces de predecir
con gran precisin las demandas futuras.
En las bsqueda de predicciones con un fundamento matemtico y es-
tadstico slido, hemos desarrollado este trabajo en el cual se han revisado
las metodologas ms destacadas que se han utilizando a lo largo de las l-
timas dcadas para modelar y predecir la demanda de agua urbana en
reas densamente pobladas, encontrando que los modelos estocsticos del
tipo ARIMA son la base de las principales metodologas. Sin embargo, encon-
tramos tambin que los modelos existentes estn desarrollados y pensados
para ciudades en las cuales la demanda presenta un patrn con poca va-
riabilidad a lo largo del ciclo anual y que solo es alterado principalmente por
componentes climticas y meteorolgicas. Este no es el caso de muchas de
las ciudades europeas, espaolas y mediterrneas, que presentan una gran
variabilidad derivada de patrones sociolgicos y donde las componentes cli-
mticas son poco relevantes. Esta variabilidad es generada por eventos pun-
tuales que perturban el proceso de demanda y que cuando ocurren alteran
los patrones repetitivos esperados. La ignorancia de este tipo de eventos en
un escenario de prediccin a corto plazo de la demanda mediante mode-
los estocsticos, resulta primero, en predicciones erradas para el momento
de la ocurrencia de un evento perturbador puntual, y segundo, en predic-
ciones distorsionadas hasta un determinado orden despus de la ocurrencia
del evento. Es esperable pues, que la ignorancia de este tipo de eventos
disminuya la eficiencia de los modelos estocsticos.
A lo largo de este trabajo, se aplic tambin la metodologa de las redes
neuronales para evaluar su eficiencia para modelar y predecir la demanda
de agua. Su desempeo es comparado con los modelos antes menciona-
V
dos, encontrando que es posible obtener resultados muy similares con am-
bas metodologas, an y cuando sus postulados parten desde puntos muy
diferentes.
En este trabajo de tesis se propone una metodologa para incorporar im-
plcitamente en un modelo estocstico de prediccin, el conjunto de even-
tos sociolgicos perturbadores del proceso de demanda. La metodologa es
probada en un caso real para la ciudad de Valencia, Espaa, encontrando
que se consigue mejorar los resultados de las predicciones que obtienen tan-
to los modelos ARIMA como las redes neuronales. Se obtienen unos errores
que estn muy cercanos a un ruido blanco con una menor varianza residual,
lo cual nos indica que la metodologa propuesta capta tanto la variabilidad
sistemtica de la serie, as como la variabilidad irregular generada por los
patrones sociolgicos.
El esquema de prediccin propuesto ha mostrado ser una buena he-
rramienta para realizar predicciones de la demanda de agua a corto plazo
para el caso analizado y que podra ser fcilmente implementable en un
sistema que opere en tiempo real.
VI
Abstract
Resum
Davant d0 un escenari on el recurs aigua es limitat i en una societat que
la sollicita cada vegada amb ms garanties, l0 enginyeria s exigida a desen-
volupar tcniques i metodologies eficients per assegurar que el vital lquid
s0 entregui en ptimes condicions de qualitat i quantitat als usuaris domstics,
industrials i comercials que conformen el conjunt d0 abonats d0 una ciutat. Ca-
da tipus d0 usuari sollicita l0 aigua en diferents escales temporals i de quantitat,
per tots aquests consumint aigua conjuntament genera la demanda global
d0 una ciutat.
Els operadors dels sistemes d0 abastiment i distribuci d0 aigua potable
estan obligats a gestionar les seves operacions de tal forma que el conjunt
d0 abonats pugui contar amb el servei en el moment que el solliciten. L0 experincia
que acumula el personal d0 operaci es fonamental per a que aquest ob-
jectiu es compleixi ja que son capaos de preveure amb gran precisi les
demandes futures.
En la recerca de prediccions amb un fonament matemtic i estadstic
slid, hem desenvolupat el segent treball en el qual s0 han revisat les me-
todologies ms destacades que s0 han vingut utilitzant al llarg de les ltimes
dcades per a modelar i preveure la demanda d0 aigua urbana en rees
densament poblades, trobant que els models estocstics del tipus ARIMA son
la base de les principals metodologies. No obstant, trobem tamb que els
models existents estan desenvolupats i pensats per a ciutats en les quals la
demanda presenta un patr amb poca variabilitat al llarg del cicle anual
i que solament s alterat principalment per components climtiques i me-
teorolgiques. Aquest no s el cas de moltes ciutats europees, espanyoles i
mediterrnies, que presenten una gran variabilitat derivada de patrons so-
ciolgics i on les components climtiques son poc rellevants. Aquesta varia-
bilitat es generada per esdeveniments puntuals que pertorben el procs de
demanda i que quan ocorren alteren els patrons repetitius esperats. La igno-
rncia d0 aquests tipus d0 esdeveniments en un escenari de predicci a curt
termini de la demanda per mitj de models estocstics, resulta primer, en
prediccions errnies per al moment de l0 ocurrncia d0 un esdeveniments per-
torbador puntual, i segon, en prediccions distorsionades fins a un determinat
ordre desprs de l0 ocurrncia del esdeveniment. Es d0 esperar per tant, que
la ignorncia d0 aquest tipus d0 esdeveniments redueixi l0 eficincia dels models
estocstics.
Al llarg del segent treball, s0 ha aplicat tamb la metodologia de les
xarxes neuronals per a avaluar la seva eficincia per a modelar i preveure la
demanda d0 aigua. El seu acompliment s comparat amb els models abans
IX
mencionats, trobant que s possible obtenir resultats molt similars amb amb-
dues metodologies, fins i tot quan els seus postulats parteixen des de punts
molt diferents.
En aquest treball de tesis es proposa una metodologia per a incorporar
implcitament en un model estocstic de predicci, el conjunt d0 esdeveniments
sociolgics pertorbadors del procs de demanda. La metodologia s com-
provada en un cas real per a la ciutat de Valencia, Espanya, concloent que
s0 aconsegueix millorar els resultats de les prediccions que s0 obtenen tant amb
els models ARIMA com en les xarxes neuronals. S0 obtenen uns errors que estan
molt propers a un soroll blanc amb una menor varincia residual, el qual ens
indica que la metodologia proposta capta tant la variabilitat sistemtica de
la srie com la variabilitat irregular generada pels patrons sociolgics.
L0 esquema de predicci proposat ha mostrat ser un bona eina per a
realitzar prediccions de la demanda d0 aigua a curt termini per al cas analitzat
i que podria ser fcilment implementat en un sistema que opera en temps
real.
X
ndice general
I Introduccin 1
1. Introduccin 3
1.1. Motivacin de la investigacin . . . . . . . . . . . . . . . . . . . . . 3
1.2. Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3. Contenido y estructura . . . . . . . . . . . . . . . . . . . . . . . . . 5
II Marco Terico 7
2. Marco Terico 9
2.1. Introduccin a las series temporales . . . . . . . . . . . . . . . . . 9
2.1.1. Descripcin y anlisis preliminar . . . . . . . . . . . . . . . . 9
2.1.2. Modelacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1.3. Prediccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.1.4. Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2. Definicin y conceptos bsicos de Series Temporales . . . . . . . 15
2.2.1. Modelos ARIMA . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2.2. Modelos de Series Temporales ms comunes . . . . . . . . 18
2.2.3. Procesos ARMA . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.3. Modelos de regresin dinmica . . . . . . . . . . . . . . . . . . . . 28
2.3.1. Funciones de transferencia con retardos distribuidos lineales 28
XI
XII NDICE GENERAL
IV Metodologa 123
4. Antecedentes 125
XVII
XVIII NDICE DE FIGURAS
7.37.ACF de los residuos del modelo (B) ARIMA (0,1,1)x(0,1,1)7 + Tmax 194
7.38.PACF de los residuos del modelo (B) ARIMA (0,1,1)x(0,1,1)7 + Tmax 194
9.5. Prediccin vs. Observacin, mes de Enero del 2004. Modelo E sin
intervenciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286
NDICE DE FIGURAS XXV
9.11. Prediccin vs. Observacin, mes de Abril del 2004. Modelo E sin
intervenciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
9.17. Prediccin vs. Observacin, mes de Julio del 2004. Modelo E sin
intervenciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292
XXVII
XXVIII NDICE DE CUADROS
Introduccin
1
Captulo 1
Introduccin
3
4 CAPTULO 1. INTRODUCCIN
1.2. Objetivo
Marco Terico
7
Captulo 2
Marco Terico
9
10 CAPTULO 2. MARCO TERICO
decidir si los datos necesitan ser transformados antes del anlisis. Por ejemplo,
si se observa una tendencia ascendente en el grfico de los datos y la varian-
za aumenta conforme lo hace el valor medio. Entonces una transformacin
puede ser recomendable para estabilizar la varianza. La transformacin de
los datos tambin se recomienda en el caso de que las observaciones pre-
senten algn sesgo. En este caso se recomienda una normalizacin de los
datos. Finalmente, si los efectos estacionales se observan multiplicativos, en-
tonces sera deseable transformar los datos para convertir en aditivo el efecto
estacional. Una transformacin tambin es recomendable cuando los datos
presentan asimetra y/ cuando los cambios en la varianza son severos.
2.1.2. Modelacin
2.1.3. Prediccin
Subjetivos
Univariados
Multivariados
2.1.4. Control
(t) = E[X(t)]
Proceso Estacionario
(t) =
lo que significa que es constante y no depende del valor de t.
2 (t) = E[(x(t) )2 ] = 2
( ) = E{[X(t) ][X(t + ) ]}
= Cov[X(t), X(t + )]
se denomina coeficiente de autocovarianza al retardo .
El valor de la autocovarianza depende de las unidades en las cuales X(t) sea
2.2. DEFINICIN Y CONCEPTOS BSICOS DE SERIES TEMPORALES 17
( )
( ) =
(0)
Esta cantidad mide la correlacin entre X(t) y X(t + ). Se aclara que el ar-
gumento de ( ) y ( ) es discreto si el tiempo es discreto, pero continuo si
el tiempo es continuo. Normalmente se utiliza (k) y (k) para denotar estas
funciones cuando son discretas en el tiempo.
E[X(t)] =
y
Cov[X(t), X(t + )] = ( )
De esta ltima condicin se desprende que si un fenmeno es estacionario,
sus variables pueden estar relacionadas linealmente entre s, pero de forma
que la relacin entre dos variables solo depende de la distancia temporal k
transcurrida entre ellas.
Dejando = 0, notamos que la forma de una acv.f. estacionaria implica que
la varianza junto con la media sean constantes. La definicin tambin implica
que la varianza y la media sean finitas. Esta definicin de proceso estaciona-
rio dbil ser la utilizada en adelante, ya que muchas de las propiedades de
un proceso estacionario dependen solamente de la estructura del proceso
definido por su primer y segundo momento. Una clase importante de proce-
sos donde esto es particularmente cierto son los procesos normales donde
la distribucin conjunta de X(t1 ), ..., X(tk ) es multivariada normal para todo
t1 , ..., tk . La distribucin multivariada normal se caracteriza completamente
por su primer y segundo momento y por lo tanto por (t) y (t1 , t2 ). Se cumple
que la estacionareidad de segundo orden implica estacionareidad estricta
para procesos normales. No obstante, y ( ) podran no describir adecua-
damente procesos estacionarios que sean muy distintos del normal.
Una vez introducido el concepto de proceso estocstico puede decirse que
una serie temporal cualquiera es en realidad una muestra, una realizacin
concreta con unos valores concretos de un proceso estocstico terico, real.
18 CAPTULO 2. MARCO TERICO
El anlisis de series que vamos a estudiar tratar, a partir de los datos de una
serie temporal, inferir las caractersticas de la estructura probabilstica subya-
cente del verdadero proceso estocstico.
(
Z2 k=0
(k) = Cov(Zt , Zt+k ) =
0 k = 1, 2, ...
esto significa que los diferentes valores no estn correlacionados. La ac.f. es:
(
1 k=0
(k) =
0 k = 1, 2, ...
Ya que la media y la acv.f. no dependen del tiempo, el proceso es estacio-
nario de segundo orden. De hecho, ya que se asume independencia de los
datos, esto implica que el proceso es tambin estacionario de primer orden
o estacionario en sentido estricto.
Los procesos aleatorios son de gran utilidad en muchas situaciones, particu-
larmente como piedra angular para procesos ms complicados tales como
los de media mvil que ms adelante describiremos.
Paseo Aleatorio
y
t
X
Xt = Zi
i=1
(B)Xt = Zt (2.3)
donde
(B) = 1 1 B 2 B 2 p B p
es un polinomio en B de orden p.
El ejemplo ms simple de un proceso AR es el de primer orden, AR(1)
Xt = Xt1 + Zt (2.4)
Xt = (Xt2 + Zt1 ) + Zt
= 2 (Xt3 + Zt2 ) + Zt1 + Zt
Xt = Zt + Zt1 + 2 Zt2 +
(1 B)Xt = Zt (2.5)
y entonces:
Xt = Zt /(1 B)
= (1 + B + 2 B 2 + )Zt
= Zt + Zt1 + 2 Zt2 +
E(Xt ) = 0
V ar(Xt ) = Z2 (1 + 2 + 4 + )
2.2. DEFINICIN Y CONCEPTOS BSICOS DE SERIES TEMPORALES 21
2
V ar(Xt ) = X = Z2 /(1 2 )
(k) = k k = 0, 1, 2...
Xt = (B)Zt (2.7)
donde
(B) = 1 + 1 B + + q B q
es un polinomio en B de orden q.
E(Xt ) = 0
q
X
2
V ar(Xt ) = Z i2
i=0
ya que (
Z2 s=t
Cov(Zs , Zt ) =
0 s 6= t
(B) = 1 1 B . . . p B p
(B) = 1 1 B . . . q B q
E(xt ) = E(xt+s )
donde
P (B s ) = (1 1 B s . . . P B sP )
p (B) = (1 1 B . . . p B p )
(1 B)d
(1 B s )D
Q (B s ) = (1 1 B s . . . Q B sQ )
q (B) = (1 1 B . . . q B q )
donde
Wt = d D
s Xt
Funciones de transferencia
Yt = f (Xt ) (2.14)
Yt = C + f (Xt ) + Nt (2.15)
Yt = f (Xt )
= v0 Xt + v1 Xt1 + v2 Xt2 + (2.16)
v(B) = v0 + v1 B + v2 B 2 + v3 B 3 (2.17)
30 CAPTULO 2. MARCO TERICO
Yt = v(B)Xt (2.18)
X
vj = g (2.19)
j=0
v1 = 1 v0
v2 = 1 v1
v3 = 1 v2
..
.
vk = 1 vk1 k = 1, 2, 3, . . . (2.20)
v2 = 1 v1 = 12 v0
v3 = 1 v2 = 13 v0
v4 = 1 v3 = 14 v0
..
.
vk = 1k v0 , k0 (2.21)
Yt = v0 Xt + 1 Yt1 (2.25)
(1 1 B)Yt = v0 Xt (2.26)
v0
Yt = Xt (2.27)
1 1 B
(B)B b
v(B) = (2.28)
(B)
donde1
(B) = 0 + 1 B + 2 B 2 + + s B s (2.29)
(B) = 1 1 B 2 B 2 r B r (2.30)
2. El factor (B) captura los picos (que no son parte de ningn patrn)
Yt = v1 (B)X1,t + v2 (B)X2,t
1 (B)B b1 2 (B)B b2
= 1 (B)
X1,t + 2 (B)
X2,t (2.31)
donde:
bi
vi (B) = vi,0 + vi,1 B + v1,2 B 2 + = i (B)(B)
i (B)
, i = 1, 2
bi =tiempo muerto para el input Xi,t i = 1, 2
si
i (B) = i,0 + i,1 B + + i,si B , i = 1, 2
i (B) = 1 i,1 i,2 B 2 i,ri B ri , i = 1, 2
hi = orden de i (B), i = 1, 2
Y extendiendo esta formulacin para M inputs, i = 1, 2, . . . , M , el resulta-
do en forma compacta se escribira:
M
X
Yt = vi (B)Xi,t
i=1
M
X i (B)B bi
Yt = Xi,t (2.32)
i=1
i (B)
0.8
0.6
0.4
0.2
1.0
0.8
0.6
0.4
0.2
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
2
(3, 0, 2) (B)xt = ( 0 1 B 2 B )xt3 -0.4
2 4 6 8 10 12 14
r=1
0.8
0.6
0.4
0.2
0
(3, 1, 0) (B)xt = x
(11 B) t3
0.0
2 4 6 8 10 12 14
0.6
0.5
0.4
0.3
0.2
(0 1 B)
(3, 1, 0) (B)xt = x
(11 B) t3
0.1
0.0
2 4 6 8 10 12 14
0.6
0.5
0.4
0.3
B2)
0.2
( 0 1 B 2
(3, 1, 2) (B)xt = (11 B)
xt3 0.1
0.0
2 4 6 8 10 12 14
r=2
0.6
0.4
0.2
0 0.0
(3, 2, 0) (B)xt = x
(11 B2 B 2 ) t3 -0.2
5 10 15 20 25 30 35
0.6
0.4
0.2
(0 1 B)
(3, 2, 1) (B)xt = x
0.0
0.6
0.4
0.2
( 0 1 B 2 B 2 ) 0.0
M
X i (B)B bi
Yt = C + Xi,t + Nt (2.33)
i=1
i (B)
M
X i (B)B bi (B)
Yt = C + Xi,t + Zt (2.34)
i=1
i (B) (B)(1 B)d
M
X i (B)B bi q (B)Q (B s )
Yt = C + Xi,t + Zt (2.35)
i=1
i (B) p (B)P (B s )(1 B)d (1 B s )D
das para representar sucesos cualitativos que afectan a la serie son de dos
tipos: variables impulso y variables escaln. Las variables impulso representan
sucesos que ocurren nicamente en un instante, por ejemplo, un accidente,
un error de medida o una huelga. Las variables escaln representan aconte-
cimientos que comienzan en un instante conocido y se mantienen a partir de
ese instante, por ejemplo, una subida de precios, un cambio legal, la cons-
truccin de una presa que modifica el caudal de un ro, el establecimiento
de programas de deteccin de fugas en una red hidrulica que se refleja
como una disminucin de la demanda de un sector hidrulico, etc.
El esquema que se usa para evaluar el efecto de una variable de inter-
vencin nica es la forma racional del modelo de regresin dinmica que se
present en el apartado (2.3.1), pgina (28):
(B)B b
Yt = C + Xt + Nt (2.36)
(B)
(
0, t 6= i
Xt =
1, t=i
El caso (d) del grfico (2.4) muestra el caso de una serie estacionaria
intervenida por un impulso que provoca un aumento brusco en el valor de
Yt , pero que con el paso del tiempo vuelve a su nivel original con un agota-
miento del tipo presentado en el modelo de Koyck (ver apartado 2.3.1). El
caso (e) es muy similar al caso (b) por el hecho de que ambas series no son
estacionarias, con la diferencia de que Yt reacciona de una forma dinmica
al impulso de intervencin despus del periodo t = i, con una disminucin de
2.3. MODELOS DE REGRESIN DINMICA 39
(
0, t<i
Xt =
1, ti
La naturaleza permanente de una intervencin tipo escaln queda reflejado
en el hecho que Xt tenga valor on continuamente, iniciando en el periodo
i. Por lo que, Xt tiene valor 1 cuando t = i, conservando ese valor en ade-
lante. El grfico (2.5a) muestra un proceso de este tipo y el caso (b) es el de
un proceso tipo escaln que se mantiene por varios instantes de t para luego
volver a su valor original. En cambio el caso (c) presenta una intervencin
tipo escaln para una serie con media no estacionaria.
1. Si sus efectos son grandes, pueden sesgar las estimacin de los parme-
tros del modelo, lo que producir malas predicciones futuras.
(
yt t 6= h
zt =
yt + A t=h
yt = (B)at
(h)
zt = A It + (B)at (2.37)
(h)
donde Ith = 0, t 6= h; Ih = 1. Es fcil observar que el modelo es de la
misma forma al de intervencin con un impulso presentado en la seccin
(h)
anterior. Sin embargo en ese caso la variable Ih se supone conocida y en
cambio en este caso el instante h es desconocido.
2.4. VALORES ATPICOS 45
Los (AO) dejan una huella en la serie de residuos debido a las altera-
ciones que producen en un punto. Si construimos un modelo ARIMA desco-
nociendo su presencia, es posible identificarlos estudiando los residuos del
modelo et , que sern iguales a las innovaciones verdaderas ah hasta antes
del instante del evento atpico en t = h. En los instantes posteriores a h la
relacin entre ambas variables para un AR(1) es:
eh = A + ah (2.38)
eh+1 = + ah+1
eh+j = ah+j , j 2 (2.39)
La relacin entre los residuos calculados con los datos observados, que con-
tienen el efecto de los atpicos y las innovaciones, puede entonces escribirse
como:
et = A xt + at
donde xt es cero en todo momento salvo para xh = 1, xh+1 = , . . . , xh+p =
p . Por lo tanto, los p residuos posteriores a h estarn afectados por la rela-
cin
eh+j = ah+j j A , j 0
eh+j = j A + ah+j j0
por lo que en el caso que todos los j fueran no nulos, todos los residuos
posteriores al instante de ocurrencia del atpico estarn afectados. En todo
lo anteriormente presentado hemos supuesto que existe un nico AO en la
serie, por lo que si existieran ms de uno sus efectos se podran superponer y
modificaran la estructura de la serie.
2.4.2. Innovacionales(IO)
apreciar si comparamos la ecuacin (2.37) con la del modelo para una se-
rie que sufre un atpico innovativo de magnitud I en el instante h que se
presenta a continuacin:
(h)
zt = (B)(I IT + at ) (2.41)
(h)
zt = yt + (B)I It (2.42)
(
yt t<h
zt = (2.43)
yt + I j t = h + j, j0
(
yt t<h
zt =
yt + L th
et = L xt + at
(h)
donde xt = (B)Stes una variable que toma el valor cero Pj antes de la inter-
vencin, el valor uno en el instante t = h y los valores 1 i=1 i posteriormen-
te. Por lo que:
(
at t<h
et =
at + L (1 ji=1 i )
P
t=h+j
T C (h)
zt = I + (B)at (2.45)
1 B t
2. Las seales son transmitidas entre los nodos a travs de enlaces de co-
nexin.
Las entradas a un nodo (ver figura 2.8) perteneciente a una capa, se-
rn las variables de entrada a una red o, sern las salidas de los nodos de
otra capa dependiendo del sitio que ocupe la capa dentro de la red. Las
entradas forman un vector de entradas X = (x1 , x2 , ..., xi , ..., xn ) y de la misma
forma la secuencia de pesos asignada a cada entrada forman un vector de
form determines the response of a node to the total input signal
it receives. The most commonly used form of f () in (1) is the
sigmoid function, given as
1
f (t) = (2)
1 et
FIG. 1. Configuration of Feedforward Three-Layer ANN The sigmoid function is a bounded, monotonic, nondecreasing
function that provides a graded, nonlinear response. This func-
ing for feedback. Sometimes, lateral connections are used tion enables a network to map any nonlinear process. The pop-
where nodes within a layer are also connected. This paper will ularity of the sigmoid function is partially attributed to the
focus on feedforward and recurrent networks, since they are simplicity of its derivative that will be used during the training
commonly used in hydrologic problems. process. Some researchers also employ the bipolar sigmoid
and hyperbolic tangent as activation functionsboth of which
2.5. LAS REDES NEURONALES ARTIFICIALES (ANN)
In most networks, the input (first) layer receives the input
variables for the problem at hand. This consists of all quan-
53
are transformed from the sigmoid function. A number of such
tities that can influence the output. The input layer is thus nodes are organized to form an artificial neural network.
transparent and is a means of providing information to the
network. The last or output layer consists of values predicted NETWORK
of function f TRAINING
with respect to the inner product of vector X and
by the network and thus represents model output. The number Wj minus bj, where bj is the threshold value, also called the
of hidden layers and the number of nodes in each hidden layer In order
bias, for anwith
associated ANN thistonode.
generate
In ANNan output vector
parlance, theYbias
= ( yb1,j
are usually determined by a trial-and-error procedure. The y2, the
of . . . node
, yp) that
mustisbeasexceeded
close as possible
before it to canthebetarget vector
activated. The T
nodes within neighboring layers of the network are fully con- = (t1, t2, . equation
following . . , tp), adefines
trainingtheprocess,
operation: also called learning, is
nected by links. A synaptic weight is assigned to each link to employed to find optimal weight matrices W and bias vectors
represent the relative connection strength of two nodes at both V, that minimize a predetermined yj = f (X Wj error
bj) function that usually (1)
ends in predicting the input-output relationship. Fig. 1 shows has the form:
the configuration of a feedforward three-layer ANN. These
kinds of ANNs can be used in a wide variety of problems,
such as storing and recalling data, classifying patterns, per-
form determines the response
it receives. The most commonly
E=
P
The function f is called an activation function. Its functional
p
i tito
of a( ynode )2 the total input signal
used form of f () in (1) is the
(3)
forming general mapping from input pattern (space) to output sigmoid function, given as
Here, ti is a component of the desired output T; yi = corre-
pattern (space), grouping similar patterns, or finding solutions
sponding ANN output; p = number 1 of output nodes; and P =
to constrained optimization problems. In this figure, X is a f (t) = Training (2)
number of training patterns. 1 et
is a process by which
system input vector composed of a number of causal variables
the connection weights of an ANN are adapted through a con-
that influence system behavior, and Y is the system output
tinuous
The process
sigmoid of stimulation
function is a bounded, by the environment
monotonic, in which
nondecreasing
vectorFIG.composed of a number
1. Configuration of resultingThree-Layer
of Feedforward variables that
ANNrep-
the network
function is embedded.
that provides a graded,There are primarily
nonlinear response.twoThistypes
func-of
resent the system behavior.
trainingsupervised
enables a networkand unsupervised. A supervised training
Figura 2.7: Configuracin de una red neuronal feedforwad de 3 capas, ASCE
ing for feedback. Sometimes, lateral connections are used tion
algorithm requires an
to map
external
any nonlinear
teacher to
ularity of the sigmoid function is partially attributed to the
process. The
guide the
pop-
training
where nodes within ASPECTS
MATHEMATICAL a layer are also connected. This paper will process. This typically impliesthat that
willabe large
usednumber
duringof theexamples
(2000a) focus on feedforward and recurrent networks, since they are
A schematic
simplicity
(or patterns)
process.
of its
Some
derivative
of researchers
inputs and also outputsemployare required
training
for training.
the bipolar sigmoid
commonly useddiagram
in hydrologic of a typical
problems. jth node is displayed in
The hyperbolic
inputs are cause variables of a system and the outputs are
Fig.In 2. Thenetworks,
most inputs tothe such input a node
(first) may
layercome fromthesystem
receives inputand tangent as activation functionsboth of which
the transformed
are effect variables. fromThis
the training
sigmoid procedure
function. Ainvolves
number the iter-
of such
causal
variables variables
for the or outputsatofhand.
problem otherThisnodes, depending
consists of all on the
quan- ative adjustment
nodes are organized andtooptimization
form an artificialof connection weights and
neural network.
layer
tities that
that the
can node is located
influence in. These
the output. Theinputs
input form
layeranis input
thus
threshold values for each of nodes. The primary goal of train-
pesos Wj = (w1j , ..., wij , ..., w ), donde w representa el peso de la conexin
vector
transparent
leading nj
X =
toThe
(x , . . . ,
and1 is a means
the last
nodeorform
x i, . . . ,
a weight
x n). The
of providing sequence
ijvector W
of weights
information to the
= (w1j,predicted
ing is to minimize the error function by searching for a set of
. . . , wij,
network. output layer consists of j values NETWORK
connection strengthsTRAINING and threshold values that cause the ANN
proveniente del nodo ith de la capa precedente hacia el nodo actual.
. . . the
by , wnjnetwork
ith hidden
), whereand
node inlayers
wij thus
the preceding
represents
represents the connection
layer toofthis
model output.
node.
weight
Thefrom
number the
to produce outputs that are equal or close to targets. After
In order for an ANN to generate
of and the number nodes in each hidden layer training has been accomplished, it isanhoped
outputthevector
ANNYis= then ( y 1,
areThe outputdetermined
usually of node j, yby j, is aobtained by computing
trial-and-error the value
procedure. They2, . . . , of
capable yp) generating
that is as close as possible
reasonable resultstogiven
the target vector In
new inputs. T
nodes within neighboring layers of the network are fully con- = (t1, t2, an
contrast, . . .unsupervised
, tp), a training process,
training also called
algorithm does notlearning,
involve is
nected by links. A synaptic weight is assigned to each link to employed
a teacher. to find optimal
During training,weightonly an matrices W and
input data set bias vectors
is provided
represent the relative connection strength of two nodes at both V, that minimize a predetermined error
to the ANN that automatically adapts its connection weights function that usually
ends in predicting the input-output relationship. Fig. 1 shows has the form:
to cluster those input patterns into classes with similar prop-
the configuration of a feedforward three-layer ANN. These erties. There are occasions when a combination of these two
E= ( yi ti)2
kinds of ANNs can be used in a wide variety of problems, training strategies leads toP reinforcement
p
learning. A score (3) or
such as storing and recalling data, classifying patterns, per- grade is used to rate the network performance over a series of
forming general mapping from input pattern (space) to output training patterns. Most hydrologic applications have utilized
Here, ti is a component of the desired output T; yi = corre-
pattern (space), grouping similar patterns, or finding solutions supervised training. The
sponding ANN output; p =manner
numberinofwhich outputthe nodes
nodes; andofPan =
to constrained optimization problems. In this figure, X is a ANN areofstructured is closelyTraining
related toisthe algorithm
number training patterns. a process byusedwhichto
system input vector composed of a number of causal variables train it. The rest of this
the connection weights of section
an ANNincludes
are adapted several commonly
through a con-
that influence system
FIG. behavior, Diagram
2. Schematic and Y is the system
of Node j output used training algorithms.
tinuous process of stimulation by the environment in which
vector composed of a number of resulting variables that rep-
the network is embedded. There are primarily two types of
resent
116 the system
/ JOURNAL behavior.
OF HYDROLOGIC ENGINEERING / APRIL 2000
Figura 2.8: Diagrama esquemtico de un nodo j, ASCE (2000a) trainingsupervised and unsupervised. A supervised training
algorithm requires an external teacher to guide the training
Downloaded 05 May 2009 to 158.42.64.133. Redistribution subject to ASCE license or copyright; see http://pubs.asce.org/copyright
MATHEMATICAL ASPECTS process. This typically implies that a large number of examples
(or patterns) of inputs and outputs are required for training.
A schematic diagram of a typical jth node is displayed in
The inputs are cause variables of a system and the outputs are
La salida del nodo j, y , se obtiene computando el valor de la funcin f
Fig. 2. The inputs to such a node may come from system
j
causal variables or outputs of other nodes, depending on the
the effect variables. This training procedure involves the iter-
ative adjustment and optimization of connection weights and
con respecto al producto de los vectores X y W menos b , siendo b el umbral
layer that the node is located in. These inputs form an input
vector X = (x1, . . . , xi, . . . , xn). The sequencej of weights j
threshold values for jeach of nodes. The primary goal of train-
ing is to minimize the error function by searching for a set of
de activacin del nodo (bias en la nomenclatura anglosajona). Este umbral
leading to the node form a weight vector Wj = (w1j, . . . , wij,
. . . , wnj), where wij represents the connection weight from the
connection strengths and threshold values that cause the ANN
to produce outputs that are equal or close to targets. After
(bj ) debe ser superado para que el nodo pueda activarse. La ecuacin que
ith node in the preceding layer to this node.
The output of node j, yj, is obtained by computing the value
training has been accomplished, it is hoped the ANN is then
capable of generating reasonable results given new inputs. In
define esa operacin es: contrast, an unsupervised training algorithm does not involve
a teacher. During training, only an input data set is provided
to the ANN that automatically adapts its connection weights
to cluster those input patterns into classes with similar prop-
erties. There are occasions when a combination of these two
jy = f (X W b ) j j (2.46)
training strategies leads to reinforcement learning. A score or
grade is used to rate the network performance over a series of
training patterns. Most hydrologic applications have utilized
supervised training. The manner in which the nodes of an
ANN are structured is closely related to the algorithm used to
La idea central de las ANN es que los parmetros (b , w ) pueden ser train it. j The jrest of this section includes several commonly
FIG. 2. Schematic Diagram of Node j used training algorithms.
ajustados para que la red reproduzca algn comportamiento deseado. De
116 / JOURNAL OF HYDROLOGIC ENGINEERING / APRIL 2000
este modo, se puede entrenar una red para realizar un trabajo determinando
Downloaded 05 May 2009 to 158.42.64.133. Redistribution subject to ASCE license or copyright; see http://pubs.asce.org/copyright
n
0
-1
a = purelin(n)
Linear Transfer Function
54 Neurons of this type are used asCAPTULO 2. MARCO
linear approximators TERICO
in Chapter 4, Linear
Filters.
The sigmoid transfer function
1 shown below takes the input, which can have
anyPurpose f (t)plus
value between = and (2.47)
16tansigminus infinity, and squashes the output into the
Hyperbolic tangent sigmoid transfer function
range 0 to 1. 1+ et
Graph and a
a
Symbol +1
+1
n n
0 0
-1 -1
a = logsig(n)
(a) Funcin de ac- a = tansig(n)
(b) Funcin de ac-
tivacin logsigmoi- tivacin tansigmoi- Ne
Log-Sigmoid Transfer Function Tan-Sigmoid Transfer Function
dal dal
Syntax A
This transfer function is commonly= tansig(N,FP)
used in backpropagation networks, in part
Figura 2.9: Funciones
because it is differentiable. sigmoidal,
de activacin tipo
dA_dN Demuth et~al. (2009)
= tansig('dn',N,A,FP)
Matlab R2008b As previously noted, the bias
info = tansig(code) b is an adjustable (scalar) parameter of the
The symbol inneuron.
the square to the
It is not right of
an input. each transfer
However, function
the constant graph
1 that shown
drives the bias is
above represents
Las funciones sigmoidales son
inputthe associated
ecuaciones
and transfer
must be treated function.
asintticas
as such whenconThese icons
forma
you consider replace
de
the S thedependen
linear
Description
general f in the boxes tansig is
of network a neuraltotransfer
diagrams show function.
the Transfer
particular transferfunctions
que pueden aceptar entradas input
de vectors
todo el in Chapter
espacio 4,
deLinear
los Filters.
nmeros reales (
function being used. output from its net input.
a +) y acota sus salidas entre [0,1] [-1,1]. Tambin son frecuentemente uti-
lizadas las funcionesFor
tipo Transfer
a complete
escaln listing Functions
tansig(N,FP)
of transfer
(definida como takes
functions and N
hard-lim and
their optional
enicons,
DemuthYoufunction
can parameters
also specify
et~al.
your own transfer functions.
Many transfer
(2009) Matlab R2008b) figura (2.10) N functionslas
y finalmente are funciones
included the Neural
S x Q matrix of del
Network
tipo
net input linealToolbox softwa
(column) vectors
Three of the most commonly used functions are shown below.
(ver figura 2.11) queYou
tpicamente se ubican
can experiment en laneuron
with a simple capaand devarious
salidatransfer
de la red.
functions by
FP Struct. of function parameters (ignored)
running the demonstration program nnd2n1
a
+1
and returns A, the S x Q matrix of Ns elements squashed
n
0 tansig('dn',N,A,FP) returns the derivative of A with r
not supplied or is set to [], FP reverts to the default par
2-4
2 -1
Neuron Model and Network Architectures
calculated from N.
a = hardlim(n)
Figura 2.10: Funcin de activacin
Hard-Limit tansig('name')
tipo escaln,
Transfer Demuth
Function returns the
et~al. name of
(2009) this function.
Matlab
R2008b tansig('output',FP) returns the [min max] output ra
The hard-limit transfer function shown above limits the output of the ne
to eithera0, iftansig('active',FP)
the net input argument returns
n is less the
than[min
0, or max]
1, if n active
is greater
inp
or equal to+10. This function is used in Chapter 3, Perceptrons, to create
neurons thattansig('fullderiv') returns 1 or 0, depending on whe
make classification decisions.
n
0 or S x Q.
The toolbox has a function, hardlim, to realize the mathematical hard-lim
transfer function shown above. Tryreturns
-1 tansig('fpnames') the following code: of the function p
the names
na =
= purelin(n)
-5:0.1:5;
tansig('fpdefaults') returns the default function par
Figura 2.11: Funcin de activacin lineal, Demuth et~al. (2009) Matlab R2008b
plot(n,hardlim(n),'c+:');
Linear Transfer Function
It produces a plot of the function hardlim over the range -5 to +5.
Neurons of this type are used as linear approximators in Chapter 4, Lin
All the mathematical transfer functions in the toolbox can be realized wi
Filters.
2.5.3. Reglas de Aprendizajefunction having the same name.
The sigmoid transfer function shown below takes the input, which can h
The
any following figureplus
value between illustrates the linear
and minus transfer
infinity, function.the output int
and squashes
Las range 0 to 1.
redes neuronales tiene la propiedad fundamental de ser capaces
de aprender de su entorno y mejorar suadesempeo mediante el aprendizaje.
+1
n
0
-1
a = logsig(n)
Log-Sigmoid Transfer Function
2.5. LAS REDES NEURONALES ARTIFICIALES (ANN) 55
Ventajas
Limitaciones
59
Captulo 3
61
62 CAPTULO 3. REVISIN DEL ESTADO DEL ARTE
3.1. Antecedentes
1
American Water Works Association
64 CAPTULO 3. REVISIN DEL ESTADO DEL ARTE
2
El primer planteamiento de esta metodologa fue propuesto por Salas~LaCruz and Yev-
jevich (1972) en una publicacin interna de la universidad estatal de Colorado, Fort Collins
3.2. EL MODELO DE TRANSFORMACIONES EN CASCADA 65
Residuos
Serie Remover Remover Regresin variables
Autoregresin Distribucin
Original Tendencia Estacionalidad climticas
Normal
p q
X X
Ws = i Ws (t i) + j Xj (t) + (t) (3.3)
i=1 j=1
Figura 3.4: Demanda diaria en Austin, Texas, durante Junio de 1980 mostrando
el efecto de dos lluvias aisladas. (Maidment et~al., 1985)
h i
W (t) = Wb (t) + g(t) Wp (t) + Ws (t) (3.4)
donde
2 (Ti ) 2 (R ) (R )
X 0 X i i B
0 1
Ws (t) = Ws + (T )
Ti (t) + (Ri )
Ri (t)+
i=1 1 1 i B i=1 1 1 B
1
+ a(t)
1 1 B 2 B 2 7 B 7
(3.5)
donde
B Operador de retardo
3.4. LOS MODELOS FUNCIN DE TRANSFERENCIA DE LA DEMANDA 75
Wb = a0 + a1 m + a2 m2 + ... (3.6)
S(t)
Sd (t) = (3.9)
g(t)
Figura 3.5: Procedimiento para separar y remover tendencia para una serie de de-
mandas mensual en Austin, Texas. (a)Se ajusta una lnea de tendencia para la de-
manda base (b)La demanda base es sustrada y se ajusta una lnea de tendencia
con los valores mximos mensuales (c)La lnea de tendencia de valores mximos
se rota respecto a un punto pivote para producir un serie de demanda estacional
estacionaria (Maidment et~al., 1985)
Funcin de calor
H(T ) = c0 + c1 T (3.10)
Figura 3.7: (a)Demanda diaria en Austin en 1980 (b) Serie de memoria corta produ-
cida por la remocin de tendencia y desestacionalizacin (Maidment et~al., 1985)
climticas y las series de demandas, as como por la forma en que las va-
riables climticas (lluvia y temperatura) son integradas a la hora de construir
un modelo de funcin transferencia de la demanda. Se solventa as una de
las cuestiones mencionadas como lneas de investigacin en la seccin 3.3
(pgina 70) en lo que respecta a la lluvia y su efecto dinmico en la deman-
da de agua. Logran identificar cuantitativamente la disminucin en la parte
estacional de la demanda derivada de una lluvia por encima y por debajo
de un umbral de precipitacin.
Por la parte de la relacin demanda-temperatura se aporta el concep-
to de funcin de calor que resuelve el problema de la no linealidad entre la
demanda y la temperatura. La funcin de calor es una funcin por segmen-
tos lineales que relaciona demanda y temperatura con distintas pendientes
para cada uno de los segmentos. Los extremos de los segmentos (obtenidos
arbitrariamente y por observacin) representan los umbrales a partir desde
los cuales la relacin se modifica, ver grfico (3.6). Es as que cada segmento
acotado por sus extremos nos indica la relacin que existe entre la tempera-
tura y la demanda diaria. Se utiliza en el proceso de desestacionalizacin de
la serie para obtener una serie de memoria corta Ws (t) sin los efectos de la
temperatura ni de la lluvia ya que los datos de das con lluvia no son tomados
en cuenta a la hora de obtener la funcin de calor.
El concepto de dividir la serie temporal en periodos de verano e invierno
y en valores mayores y menores que un umbral de precipitacin determina la
estructura que tendrn los distintos modelos de funcin de transferencia que
se prueban. Es as que se tienen distintos coeficientes para cada parmetro
y periodo, dependiendo de la estructura seleccionada. Los coeficientes de
la ecuacin (3.5) son los siguientes:
(R2 )
7. 0 : Respuesta inmediata en la demanda por una lluvia mayor que el umbral5
(R1 )
8. 1 : Efecto de memoria en la demanda por una lluvia menor que el umbral5
(R2 )
9. 1 : Efecto de memoria en la demanda por una lluvia mayor que el umbral 5
(R )
10. 1 1 : Impacto adicional en la demanda por una lluvia menor que el umbral, registrado
el da siguiente de la lluvia5
(R )
11. 1 2 : Impacto adicional en la demanda por una lluvia mayor que el umbral, registrado
el da siguiente de la lluvia5
Estado R2
Pennsylvania 0.61
Texas 0.73
Florida 0.96
grandes en climas ridos con poco uso industrial intensivo de agua (Shaw
and Maidment, 1987).
En mayor o menor medida, las caractersticas de ciudades del tipo de
las de Pennsylvania, provocan que la demanda base sea mucho ms impor-
tante respecto de la demanda total que la demanda estacional. El mode-
lo de funcin de transferencia de la demanda basa su fortaleza en la ca-
pacidad de modelar y predecir esa componente estacional, por lo que su
proporcin con respecto a la demanda total afecta su desempeo. En esta
metodologa la demanda base es considerada como un preblanqueado de
la serie original.
(T )
Yt = 0 St
tendran que tratar. Los gestores del sistema de agua se vieron en la nece-
sidad de legislar una ordenanza que obligaba al cumplimiento de un pro-
grama de conservacin que limitaba por niveles (segn el riesgo de superar
los lmites preestablecidos para cada nivel) las actividades de uso de agua
de los ciudadanos cuando el conjunto de la demanda superara unos lmites
preestablecidos. Durante los veranos de 1984 y 1985 fue necesaria la aplica-
cin del programa de conservacin por parte de los ciudadanos. Durante
este periodo los gestores del sistema utilizaron un modelo de prediccin de
la demanda llamado WATFORE (Water use Forecasting) que fue desarrollado
por la Universidad de Austin, con el cual generaban predicciones de unos
cuantos das basados en las condiciones de temperatura y lluvia presentes y
futuras. La metodologa del modelo de prediccin de la demanda fue la pre-
sentada en Maidment et~al. (1985). Con el fin de evaluar la efectividad del
programa de conservacin aplicado en los aos 1984 y 1985 se plante un
anlisis que aportara datos que sirviesen para modificar y mejorar el progra-
ma para el verano siguiente. Sin embargo los autores del estudio aclaran que
es muy complicado separar los efectos del programa de conservacin de
agua reflejado en las variaciones de la demanda de agua de los imputables
a los efectos climticos.
En este estudio, con el fin de medir el impacto del programa de conser-
vacin de agua en la ciudad de Austin utilizan el anlisis de intervencin. Se
utiliza un modelo del tipo presentado en la ecuacin (3.5) (Maidment et~al.,
1985) e incorporan un componente de intervencin del tipo
k
X (T )
Ytj = j St
j=1
k
X
Ytj = (0 + 1 B + 2 B 2 + 3 B 3 + 4 B 4 )(S(t))
j=1
88 CAPTULO 3. REVISIN DEL ESTADO DEL ARTE
representado como un pulso que provoca una cada transitoria del nivel de
demanda de agua y puede ser modelado de una manera relativamente
fcil con una funcin de transferencia. La segunda suposicin de esta me-
todologa es que las variaciones estacionales del proceso de demanda de
agua (figura 3.8(a)) son guiadas por la temperatura mxima del aire (figu-
ra 3.8(b)). En los grficos mencionados se observa que ambas series tienen
valores picos mximos contemporneos durante los meses de verano. Con
este anlisis los autores proponen para su metodologa que la temperatura
diaria del aire gua el proceso de demanda, mientras que la lluvia solamente
la perturba transitoriamente.
(a) Demanda de Agua potable (Millones (b) Temperatura mxima diaria (Grados
de galones por da) Fahrenheit)
Figura 3.8: Series temporales de la ciudad de Austin, 1980. (Sastri and Valdes,
1989)
h i
2(tc)
a sen b
g(t) = 2(tc)
+ d; t 6= c (3.14)
b
a=Amplitud
http://upload.wikimedia.org/wikipedia/commons/thumb/d/d4/Sinc_function_%28nor... 18/11/2008
b=Periodo (equivalente a la mitad del ciclo estacional)
Las intervenciones por lluvia las clasifican en tres grupos definidos por el
concepto de IMS6 , que se explica como el lapso de tiempo que dura la me-
moria de la intervencin en la demanda de agua, provocado por un evento
de lluvia:
3. Continua: Igual que la Mltiple pero sin das sin lluvia, seco.
Los estudios empricos reportados en este trabajo sugieren que los efec-
tos de las intervenciones provocadas por la lluvia pueden ser adecuadamen-
te explicados por un modelo lineal que es funcin del tiempo (t) en que ocu-
rre la intervencin, el nmero de das de lluvia ininterrumpida (d(t)), una me-
dia mvil de temperaturas mximas diarias (T (t)), y una media mvil de los
valores ms recientes de demanda de agua (W (t)). La ecuacin del modelo
para captar los efectos de la intervencin por lluvia es:
donde
3 4
1X 1X
x1 (t) = T (t i) x2 (t) = W (t i)
3 i=1 3 i=2
y1 (t) = f [s(t)] y2 (t) = 0, si s(t) = d(t)
y2 (t) = 1, si s(t) 6= d(t) s(t) = d(t) si d(t) < 3
s(t) = 3, si d(t) > 3
1. Paso 1
Se estiman los parmetros a y d, habindose definido antes los valores
de b y c para ajustar g(t) (mnimos cuadrados) a la secuencia de obser-
vaciones de W (t). La funcin ajustada se denomina g(t) y se establece
W = g(t), t = 1, 2, . . . , n, donde n = nmero total de observaciones.
2. Paso 2
= W (t) W (t), t = 1, 2, . . . , n y se estiman los parmetros
Se calcula I(t)
de la ecuacin 3.16, incluyendo los parmetros del modelo ARMA z(t).
3. Paso 3
Se calcula una secuencia mejorada de [g], haciendo que R = W (t)
I(t), t = 1, 2, . . . , n y reajustando g(t) a la secuencia [R(t)]. La nueva se-
cuencia [g(t)] es una versin mejorada de [g(t)] del paso 1. Se repiten los
94 CAPTULO 3. REVISIN DEL ESTADO DEL ARTE
4. Paso 4
Se estiman los parmetros del modelo ARMA para los residuos que resul-
ten de N (t) = W (t) g (t) I (t), t = 1, 2, . . . , n.
(B)
W (t) = a0 T (t) + g(t) + I(t) + h(t) (t) (3.19)
(B)
donde
(B) = 1 1 B 2 B 2 3 B 3
= 1 1 B
a2 1
h(t) = a1 t + t
todos los parmetros se consideran constantes por
segmentos
X
Bm = 0 + 1 H (Tm ) + 2 G(Rm ) + i+2 Xi,m + m (3.20)
i
H (Tm ) = Tm Tm
G(Rm ) = Rm Rm
Histresis en la demanda
Wm = 0 + 1 H (Tm )
Observations Colored
innovations
Whitened
Winters- innovations
Autoregressive filter
Recursive
Least Squares AR(2)
Algoriflam
+ I
Forecast Forecast
k-hours-ahead forecast of z t
FIG. 3. Block Diagram of Adaptive Forecasting System (AFS)
Figura 3.12:requires
Diagrama del sistema de prediccin adaptativo (AFS), (Hom-
a number of historical observations, {zl. z2 . . . . , z J , where to is
wongs et~al.,
the 1994)
time index of the last available data point. Most water utilities do not
have large collections of historical data, so it is necessary to limit the data
requirement to a minimum. However, the accuracy and stability of a fore-
casting system cannot be compromised, and without an appropriate pro-
cedure for carefully choosing initialization data, the effect of initialization
errors may propagate far upstream.
The following initialization procedure is effective since it only causes a
short transient period that does not affect the overall forecasting accuracy
and stability. For the water-use data of the present study, no more than
two weeks of initialization data are needed. When the AFS is started up
for the first time, one week of historical hourly observations (168 data points)
are selected from any normal week (i.e. with normal air temperatures and
normal rainfalls) of the same season for use as the "base pattern." These
data are used to provide initial estimates for the 168 seasonal factors. The
second week of initialization data, {z,}; t = 169, 170, . . . , 336, are used
for "priming" the adaptive algorithm to generate initially smoothed statistics
and other needed estimates. The variance of the irregular component may
be separately estimated, using the whole two weeks of the initialization
data.
MODEL APPLICATION
Results from two validation tests of the AFS are reported in this section.
The objective of the first test was to validate the AFS methodology based
on Arlington's water-use data. Three questions to be answered by this test
are as follows: (1) Is the proposed adaptive method capable of accurately
tracking on-line data, in spite of weekend and weekday dissimilarity and
occasional measurement outliers? (2) How much accuracy improvement
over the Winters forecasts may be achieved by the combined Winters-RLS
approach? and (3) Can the autoregressive filter whiten the recursive resid-
uals (or innovations) from the combined Winters-RLS algorithm? Whi-
100 CAPTULO 3. REVISIN DEL ESTADO DEL ARTE
Taking the derivative of Eq. (12) and setting the derivative where W b b d is the estimated daily base water use; d is the
to zero yields, daily time index from beginning of series (1 on 01 April
obtener Rel 4:82
d umbral
mm de lluvia, ajustar una funcin polinmica a la demanda y 1991), X1 = d and X2 is 0 for weekends and 1 for weekdays.
The daily base use estimated using Eq. (13) and illustrated
se calcula
The la derivada
rainfall depth of 4.82 mm isde
taken la
as thefuncin
rainfall thresh- para obtener en este caso su mximo,
old, c for East Doncaster (Fig. 2). It could be noted that at
in Fig. 4 shows that the trend in daily water use from 1991
to 1999 is slightly increasing at a rate of 0.0004 ML/d and
obteniendo un valor
rainfall lower dedaily
than 4.82 mm, 4.82watermm como
use increases
the rainfall decreases but above this threshold, anymore
as umbral (ver figura 3.14). there is a reduction in daily water use of 0.74 ML/d during
weekdays compared to weekends. Eq. (13) is a base use
45
40
Daily Temperature (degrees Centigrade)
35
30 2
y = 354.29x - 168.14x + 35.218
2
R = 0.5168
25
20
15
Threshold Temp = 15.27
10
0
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5
Reciprocal of Daily Water Use (ML/d)
Figure 1 Threshold temperature, Melbourne Regional Office, Station #86071 (01 April 1991 to 31 December 1999).
60
50
40
Daily Rainfall (mm)
30
2
y = -0.0397x + 0.5736x + 2.7497
20
10
rainfall threshold = 4.82mm
0
0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00 16.00 18.00 20.00
Daily Water Use (Ml/D)
modelos de entre8.5 los cuales el que mejor desempeo ofreci, obtuvo valo-
res de R2 = 0,81 en fases de calibracin y validacin. Este modelo toma en
consideracin en 8sus ecuaciones, un indicador para los das de lunes a vier-
nes y los de fin de semana ya que existe un muy evidente ciclo semanal con
7.5
valores mximos en los fines de semana (ver figura 3.15).
7
Monday Tuesday Wednesday Thursday Friday Saturday Sunday
Day
Figure 3 Average 7-day water use pattern for East Doncaster, 19912001.
model that represents indoor water use and is not climate As found in Gato et al. (2003), the lowest level of
dependent. monthly water use in East Doncaster is from May to Sep-
tember. The month with the lowest total monthly water
Base use as polynomial function of time use is selected for each year to estimate the base use
in Eq. (2).
Daily Rainf
30
2
y = -0.0397x + 0.5736x + 2.7497
20
10
rainfall threshold = 4.82mm
0
0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00 16.00 18.00 20.00
9.5
9
Water Use (ML/D)
8.5
7.5
7
Monday Tuesday Wednesday Thursday Friday Saturday Sunday
Day
Figure 3 Average 7-day water use pattern for East Doncaster, 19912001.
Qd,f
m
or
= Qd,s d,w d
m + i,j + m (3.21)
m = 1, 2, . . . , 365
104 CAPTULO 3. REVISIN DEL ESTADO DEL ARTE
d,w = Qd Qw
(3.23)
i,j i,j j
d,obs
m = Qd,obs Qd,s
+ d,w
(3.24)
m m i,j
d
El proceso m , es modelado usando un proceso autoregresivo AR(1) (Box
et~al., 1976), por lo que para fines de prediccin, la ecuacin es:
43 S. Alvisi et al. | POWADIMA: short-term demand forecasting Journal of Hydroinformatics | 09.1 | 2007
d d
m = 1 m1 (3.25)
Figure 3 | Daily patterns in hourly water demand for the seven days of the week: (a) in winter, (b) in spring, (c) in summer and (d) in autumn.
d;s
dd;obs Qd;obs D
2 Q d;w ; 7 Qh;for d;for h
m m m i;j tk Qm D n;i;j 1tk 8
43 S. Alvisi et al. | POWADIMA: short-term demand forecasting Journal of Hydroinformatics | 09.1 | 2007
donde: Qd,f
m
or
es la demanda media diaria predicha con el mdulo dia-
rio (DM), hasta la fecha m 1.
hn,i,j es la desviacin horaria respecto al patrn diario
h = Qh Qd
(3.27)
n,i,j n,i,j i,j
weekly water demand in season j. Finally, ddm , which Figure 5 shows the pattern of the daily residuals observed
represents the
t+k =
deviation between
1 t+k1the average2dailyt+k24
water + 4
and modelled by means of Equation (7), with reference to a (3.28)
demand Qdm and the mean value estimated solely on the year of measured data at Station 9.
d;s and D
basis of the periodic components Q d;w , is modelled
m i;j
Los coeficientesusing
son calibrados
an autoregressive process en
AR(1)base
(Box et al.a losForerrores
1994). observados obs t , sien-
The hourly demand-forecasting module (HM)
forecasting purposes, this may be written as:
do: The hourly module, like the daily module, is composed of
ddm F1 ddm21 6
two parts: a periodic component and a persistence
whose parameter F1 is calibrated on the basis of the component. Here, the hourly water demand Qh;for
tk fore-
obs
observed deviations:
t = Qh,obs
t (Qd,obs
m + hn,i,j )casted at the tth hour for k hours ahead(3.29)
is given by
Figura 3.17: Estructura de los dos mdulos que conforman el modelo de prediccin
(Alvisi et~al., 2007)
Calibracin Validacin
Diario Horario Diario Horario
EV componente peridico 0.69 0.94 0.36 0.89
EV comp. peridico + persistencia 0.84 0.97 0.76 0.97
RMSE componente peridico 2.83 4.63 13.52 14.64
RMSE comp. peridico + persistencia 2.01 3.17 4.61 4.42
6
Todos estos modelos integran variables climticas para realizar sus predicciones
3.7. LAS REDES NEURONALES (ANN) 107
En los ltimos aos las redes neuronales han sido usadas cada vez ms
para predecir el comportamiento de sistemas complejos, tales como fen-
menos naturales y fsicos (una revisin del estado del arte de la prediccin
con ANN se puede encontrar en Zhang et~al. (1998)). El aumento de su po-
pularidad, se debe en parte a la percepcin de que las ANN son capaces
de sortear muchas de las dificultades que complican la implementacin de
mtodos estadsticos tradicionales. Esto se debe principalmente a que las
ANN no estn sujetas a las reglas restrictivas que gobiernan los modelos es-
tadsticos. El nfasis de la modelacin con ANN se pone en mtodos en los
que el resultado y la precisin son el principal objetivo, mientras que los esta-
dsticos apuntan hacia mtodos universales ptimos estadsticamente (Maier
and Dandy, 2000).
Como ya se ha mencionado en la seccin 2.5, las ANN empezaron a
ser el objeto de investigaciones serias en los aos posteriores a 1940, no se
popularizaron hasta la dcada de 1980 y con las mejoras en la arquitectura
computacional y de velocidad de cmputo de los aos 1990, se logr un
progreso significativo en la utilizacin de las ANN.
En la siguiente seccin presentaremos diversos casos de aplicacin de
las ANN en los recursos hdricos y en la modelacin de la demanda urbana
de agua. Tambin analizaremos un grupo de trabajos en los cuales las ANN
se presentan comparadas con las tcnicas clsicas de series temporales y
algn caso en el que han sido utilizadas conjuntamente.
Las ANN y las series temporales se suelen presentar como tcnicas en-
frentadas. Es muy frecuente encontrar publicaciones que evalan sus desem-
peos realizando comparaciones con los resultados de unas y otras. Limitn-
donos a la modelacin y prediccin de demanda de agua podemos citar
110 CAPTULO 3. REVISIN DEL ESTADO DEL ARTE
a Jain and Ormsbee (2002), Bougadis et~al. (2005), Adamowski (2008), entre
otros. En una poca en la que las ANN eran todava tcnicas relativamente
nuevas, Tang et~al. (1991) publican un estudio en el cual realizan una com-
paracin del desempeo de las ANN contra modelos del tipo Box-Jenkins.
Estudian tres series temporales, una de ellas es la utilizada por Box and Jen-
kins (1970) para desarrollar su metodologa (pasajeros de avin entre 1949 y
1960), otra serie pertenece a la venta de coches en Estados Unidos entre 1966
y 1982, la ltima pertenece a la venta de coches de fabricacin extranjera
a los Estados Unidos entre 1966 y 1982. Las series fueron seleccionadas bus-
cando que tuvieran patrones de comportamiento marcadamente distintos
para probar y comparar el desempeo de ambas tcnicas. Realizaron va-
rias pruebas hasta encontrar una estructura de ANN ptima para cada una
de las series temporales. Finalmente realizaron comparaciones en trminos
de la suma del error cuadrtico y concluyeron que las ANN superaban a las
tcnicas clsicas tanto en la prediccin a corto como a largo plazo.
En cambio, Chatfield (1993) en una primera revisin ya corroboraba em-
pricamente que las predicciones con ANN no eran necesariamente mejores
que otras alternativas. Unos aos ms tarde Faraway and Chatfield (1998) uti-
lizan la serie de Box and Jenkins (1970) para realizar un estudio comparativo
entre modelos del tipo Box-Jenkins, Holt-Winters y ANN. En su trabajo los au-
tores comentan que contrario a las afirmaciones de grandes xitos que se
venan reportando, su evidencia emprica de predicciones con ANN indica
un grado de xito variable y advierten de lo arriesgado que puede resultar
a pesar de que la modelacin con ANN es en esencia no paramtrico
que procesos completos sean automatizados en un ordenador y que sea
utilizado por personas con escaso conocimiento ya sea en ANN o en predic-
cin. Con su estudio demuestran que un buen modelo de ANN para series
de datos temporales debe ser seleccionado combinando habilidades tradi-
cionales de modelacin con conocimientos de anlisis de series temporales
y de los problemas particulares. Los resultados de las predicciones que ob-
tuvieron con las mejores arquitecturas de ANN ajustadas para esta serie (en
trminos de suma de los errores cuadrticos a 1 y 12 pasos, AIC, BIC) no re-
sultan ser mejores que el conocido modelo Box-Jenkins ajustado utilizando un
nmero menor de parmetros. Finalmente, aclaran que es complicado ha-
cer una evaluacin del desempeo de esta nueva tcnica ya que la vasta
mayora de los trabajos que se haban presentado pueden ser criticados des-
de un punto de vista estadstico (el artculo de Tang et~al. (1991) es uno de
ellos). Los estadsticos tienden a percibir las ANN como una tcnica menos
ilustrativa ya que su estructura de caja negra es complicada de entender e
interpretar, adems de que no es posible obtener descriptores del trmino
de error y no hay una forma directa de calcular los intervalos de prediccin.
3.7. LAS REDES NEURONALES (ANN) 111
yt = Lt + Nt
yt = Lt + Nt
Figura 3.18: Residuos de red con arquitectura 15-20-1 sin series de intervencin (Gri-
~C., 1991)
Figura 3.19: Residuos de red con arquitectura 19-35-1 con series de intervencin
(Gri~C., 1991)
114 CAPTULO 3. REVISIN DEL ESTADO DEL ARTE
Modelo AARE
Regresin-desagregacin 1 12.68-8.33
Regresin-desagregacin 2 12.19-8.41
AR 6.25-5.15
MAR 6.11-5.08
S231NN AI 5.91-4.95
RESM1 AI 6.15-4.82
RESM2 AI 6.16-4.87
CREN AI 5.98-4.75
Del cuadro 3.4, se observa que los modelos ANN presentan mejores re-
sultados a la hora de predecir la demanda pico semanal. Sin embargo, nin-
guna de las tcnicas consigue valores elevados de R2 , siendo las redes neuro-
nales las que mejores resultados presentan. El proceso que se busca modelar
y predecir es la demanda pico semanal y utilizan como variable exgena la
temperatura. Es de esperar que la demanda pico semanal no presente una
gran variabilidad, como lo presentan la demanda horaria o la diaria, por lo
que resulta un tanto extrao que los modelos no hayan conseguido mejores
valores.
Zhang et~al. (2006) aplicaron la metodologa de las ANN para prede-
cir la demanda diaria de la ciudad de Lousville, Kentucky con dos das de
antelacin. Para ello construyeron ANNs para invierno9 y verano diferencia-
das entre ellas por la cantidad de variables utilizadas. La de invierno, con
una menor cantidad de variables de entrada a la red, utiliza solamente los
valores de demanda de hasta dos periodos antecedentes. Para el verano
incluyeron variables climticas, temperatura media mxima del da en cur-
so, predicciones de la lluvia para los dos das siguientes, lluvia para el da en
curso, predicciones de lluvia para los dos das siguientes y finalmente la de-
manda del da en curso. La arquitectura de red utilizada fue una red con 10
variables de entrada, 13 nodos ocultos y 2 salidas (10,13,2). Con estas ANN
9
No se presenta la arquitectura de red utilizada
116 CAPTULO 3. REVISIN DEL ESTADO DEL ARTE
consiguieron hacer predicciones a dos das con una precisin del 97.21 % pa-
ra la temporada de invierno y de 95.89 % para la temporada de verano.
3.8. CONCLUSIONES 117
10
En la pg.82 se defini como:
El concepto de demanda base representa el consumo mnimo de agua que el conjunto
de usuarios (domsticos, comerciales, industriales y de servicios pblico-urbanos) de una
determinada ciudad requieren para cubrir sus necesidades mnimas independientemente
de la climatologa imperante, es decir la dotacin mnima de una ciudad.
118 CAPTULO 3. REVISIN DEL ESTADO DEL ARTE
11
Sastri and Valdes (1989) suponen que el proceso de demanda de agua es guiado por
la temperatura media del aire y solamente es perturbado transitoriamente por la ocurrencia
de lluvia
3.8. CONCLUSIONES 119
12
El trabajo de Cutore et~al. (2008) presenta resultados que animan al optimismo en lo que
respecta a estos ltimos puntos
120 CAPTULO 3. REVISIN DEL ESTADO DEL ARTE
Una vez concluido esta revisin del estado del arte que ha abarcado la
modelacin y prediccin de la demanda de las ltimas dcadas, podemos
concluir que los modelos desarrollados hasta la fecha con este fin, no son
aplicables para ciudades en entornos urbanos densamente poblados como
son la mayora de las principales ciudades de Espaa y muchas de las eu-
ropeas mediterrneas. Estas ciudades presentan particularidades y un com-
portamiento marcadamente diferenciado de las ciudades del sur, suroeste
de los Estados Unidos de Norteamrica o de Australia, donde han desarrolla-
do los modelos mencionados. Estos modelos contemplan conceptos como
demanda base y suponen comportamientos de la demanda diaria que va-
riando lentamente a lo largo del ao guiados casi siempre por el ciclo sinu-
soidal de la temperatura del aire.
En cambio la demanda de las ciudades espaolas en entornos densa-
mente poblados, presenta un comportamiento con una variabilidad mucho
mayor, con una relacin temperatura del aire-demanda no lineal y variable
a lo largo del tiempo y del rango de temperaturas registradas (ver seccin
7.3.3). Por lo tanto la temperatura no es un predictor eficiente o requiere su
incorporacin mediante modelos ms complejos. Adicionalmente la deman-
da, presenta sbitas reducciones del consumo provocadas por el calendario
de festividades de las ciudades (propio de cada ciudad y regin), gene-
rando das que registran consumos anmalos, que rompen el patrn regular
semanal y que aportan los registros mnimos a lo largo de las series anuales.
Por otra parte, la demanda tambin es afectada en su tendencia anual en el
3.8. CONCLUSIONES 121
mes de agosto durante el cual, gran parte de las empresas e industrias (salvo
las ligadas al turismo y ocio) suspenden sus actividades y gran parte de la
poblacin utiliza este periodo para vacacionar fuera de la ciudades provo-
cando un descenso de la demanda en la poca ms calurosa del ao.
Los modelos que hasta este punto hemos analizado no contemplan nin-
guna de las peculiaridades mencionadas anteriormente ya que no son pro-
pias del proceso de demanda de las ciudades para las que fueron pensados,
ya sea por su forma de urbanizar o por sus usos y costumbres. La suspensin
de actividades a lo largo de todo un mes y la consecuente disminucin de
la demanda y en gran medida tambin la suspensin de actividades por
festividades, no son propias de ese tipo de ciudades.
Surge pues, la necesidad de idear una metodologa que nos lleve a
identificacin de un modelo que sea capaz de modelar el proceso gene-
rador de la demanda en ciudades densamente pobladas y reproducirlo en
predicciones eficientes.
122 CAPTULO 3. REVISIN DEL ESTADO DEL ARTE
Parte IV
Metodologa
123
Captulo 4
Antecedentes
125
126 CAPTULO 4. ANTECEDENTES
Componentes de variabilidad
sistemtica irregular y atpicos en la
demanda
El pasado es un prlogo.
William Shakespeare
1564-1616
Dramaturgo, poeta y actor ingls
127
128 CAPTULO 5. VARIABILIDAD SISTEMTICA IRREGULAR DEMANDA
siendo
(l1)
(l)
X
j = j+l1 + h jlh , j = 1, 2 . . . (5.4)
h=1
(l)
Los pesos de prediccin j determinan hasta que punto un valor atpico
de magnitud afecta la prediccin. Si un atpico aditivo ha ocurrido en el
periodo t0 (K 0 periodos antes del origen de la prediccin), el error de
prediccin l-periodos adelante sera:
(l)
Yt0 +k+l Yt0 +k (l) = et+k (l) k+1 (5.5)
130 CAPTULO 5. VARIABILIDAD SISTEMTICA IRREGULAR DEMANDA
donde
et0 +k (l) = at0 +k+l + 1 at0 +k+l1 + . . . + 1 at0 +k+l+1 (5.6)
Se debe destacar que existe una relacin directa entre la varianza del
ruido blanco (a2 ) y las varianzas de los errores de prediccin lo que resulta en
un incremento importante de la amplitud de los intervalos de confianza de
las predicciones.
N
1 X 2
2 = Xi X (5.9)
N i=1
132 CAPTULO 5. VARIABILIDAD SISTEMTICA IRREGULAR DEMANDA
Si una gran cantidad de los Xi valores son atpicos, entonces se obtendr una
2 inflada. Los intervalos de prediccin para la metodologa de Box-Jenkins
se basan en la desviacin estndar , la raz cuadrada de 2 , ya que sta re-
presenta las desviaciones de los residuos de las predicciones. Como se men-
cion antes, para obtener los intervalos de prediccin se asume que estos
residuos siguen una distribucin normal con media cero. Bajo este postulado,
el intervalo de prediccin para la siguiente observacin ser:
Yt+1 z 2 (5.10)
afirmacin sern los das de semana santa, que son siempre jueves, viernes,
sbado, domingo y en algunos sitios inclusive el lunes. En este caso los das
de la semana en que ocurren sern siempre los mismos pero variarn la fe-
cha en que acontecen, ya que estn ligados al calendario lunar, por lo que
de nueva cuenta para este tipo de eventos, su variabilidad es irregular en el
tiempo.
Una vez identificados todos los eventos de variabilidad sistemtica irre-
gular, podremos caracterizarlos en base al da de la semana de su ocurren-
cia, obteniendo los impactos significativos tpicos para un evento de este tipo
para cada da de la semana. Hemos de asumir que esta caracterizacin ser
ms representativa de los impactos para cada da de la semana cuanto ms
larga sea la serie temporal de que disponemos. Es poco riguroso esperar que
los eventos atpicos de las series de demanda produzcan siempre los mismos
impactos, ya que siempre existirn variables no consideradas en un modelo
estadstico que aportarn su parte de incertidumbre (el tiempo da con
lluvia o sin lluvia, la temperatura imperante, las condiciones de la economa
regional, etc.). Sin embargo debemos considerar que es una buena aproxi-
macin para mejorar la estimacin de predicciones puntuales de prediccin
de la demanda.
Captulo 6
6.1. Antecedentes
135
136 CAPTULO 6. LOS MODELOS DE INTERVENCIN PARA LA DEMANDA
Yt = (B)Zt (6.2)
donde
2 q (B)Q (B s )
(B) = 1 + 1 B + 2 B + . . . = Zt (6.3)
p (B)P (B s )(1 B)d (1 B s )D
(
0 t 6= h
Ith =
1 t=h
1 Lunes
2
M artes
3 M iercoles
j = 4 Jueves
5 V iernes
6 Sabado
7 Domingo
1. Realizar una anlisis preliminar del cual se obtengan los estadsticos des-
criptivos de la serie temporal en estudio. Se buscar identificar los ciclos
a nivel anual y semanal
Caso de estudio
141
Captulo 7
Caso de estudio
Trying to predict the future is like trying to drive down a country road
at night with no lights while looking out the back window.
Peter Drucker
1909 2005
Abogado y tratadista austraco
143
144 CAPTULO 7. CASO DE ESTUDIO
Tendencia
Millares
350
300
250
Metros cbicos
150
0
2001 2002 2003 2004
Ao
Figura 7.1: Serie de demandas de la ciudad de Valencia de Enero del 2001 a Diciembre del 2004
CAPTULO 7. CASO DE ESTUDIO
7.3. ANLISIS PRELIMINAR 149
350
300
250
Metros Cbicos
Lps
200
150
100
50
0
E F M A M J J A S O N D
Mes
350
300
250
Metros Cbicos
Lps
200
150
100
50
0
E F M A M J J A S O N D
Mes
350
300
250
Metros Cbicos
Lps
200
150
100
50
0
E F M A M J J A S O N D
Mes
350
300
250
Metros Cbicos
Lps
200
150
100
50
0
E F M A M J J A S O N D
Mes
1
P P P
(x(t) x(t+k) ) nk x(t) x(t+k)
rk = h i 1/2 P
h i1/2 (7.1)
1 1
P 2
x2(t+k)
P P
x(t) nk ( x(t) )2 nk
( x (t+k) ) 2
Xt = St + Tt + Et
donde
400
Millares
300
m3 - Tendencia - Ciclo
250
200
150
100
50
0
1
31
61
91
121
151
181
211
241
271
301
331
361
Da
15
Millares
Estacionalidad
10
0
Estacionalidad
-5
-10
-15
-20
-25
-30
-35
1
31
61
91
121
151
181
211
241
271
301
331
361
50
Millares
Residuos
40
30
20
10
Residuos
-10
-20
-30
-40
-50
N/2
X 2mt 2mt
x(t) = a0 + am cos( ) + bm sin( ) (7.2)
m=1
N N
N N
2 X 2mt 2 X 2mt
am = xt cos bm = xt sin (7.3)
N m=1 N N m=1 N
N
donde para m = 2
N
1 X
am = xt (1)t bm = 0 (7.4)
N m=1
2 a2m + b2m
Cm = (7.5)
2s2
Ao 2001
Armnico Frecuencia Periodo (das) Varianza Explicada
52 0.1425 7.0 26 %
3 0.0082 121.7 11 %
104 0.2849 3.5 10 %
1 0.0027 365.0 6%
6 0.0164 60.8 6%
4 0.0110 91.3 5%
2 0.0055 182.5 4%
7 0.0192 52.1 2%
9 0.0247 40.6 2%
156 0.4274 2.3 1%
Ao 2002
Armnico Frecuencia Periodo (das) Varianza Explicada
3 0.0082 121.7 24 %
52 0.1425 7.0 17 %
104 0.2849 3.5 9%
2 0.0055 182.5 6%
8 0.0219 45.6 5%
156 0.4274 2.3 2%
5 0.0137 73.0 2%
7 0.0192 52.1 1%
11 0.0301 33.2 1%
19 0.0521 19.2 1%
Ao 2003
Armnico Frecuencia Periodo (das) Varianza Explicada
52 0.1425 7.0 27 %
3 0.0082 121.7 14 %
104 0.2849 3.5 11 %
1 0.0027 365.0 7%
4 0.0110 91.3 6%
2 0.0055 182.5 5%
6 0.0164 60.8 3%
156 0.4274 2.3 3%
7 0.0192 52.1 2%
10 0.0274 36.5 2%
Ao 2004
Armnico Frecuencia Periodo (das) Varianza Explicada
52 0.1425 7.0 29 %
3 0.0082 121.7 16 %
1 0.0027 365.0 11 %
104 0.2849 3.5 10 %
157 0.4274 2.3 3%
6 0.0164 60.8 2%
12 0.0329 30.4 1%
14 0.0386 26.1 1%
4 0.0603 91.3 1%
22 0.0627 16.6 1%
Peridiograma-2001
Periodograma-2002
140
Periodograma-2003
Periodograma-2004
120
100
Potencia
80
60
40
20
-
00
02
04
06
08
10
12
14
16
18
19
21
23
25
27
29
31
33
35
37
39
41
42
44
46
48
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
Frecuencia (ciclos/da)
120
100
Potencia
80
60
40
20
-
00
02
04
05
07
08
10
12
13
15
17
18
20
22
23
25
27
28
30
32
33
35
36
38
40
41
43
45
46
48
50
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
Frecuencia (ciclos/da)
140
120
100
Potencia
80
60
40
20
-
0.00
0.02
0.03
0.04
0.06
0.07
0.08
0.10
0.11
0.13
0.14
0.15
0.17
0.18
0.19
0.21
0.22
0.24
0.25
0.26
0.28
0.29
0.30
0.32
0.33
0.35
0.36
0.37
0.39
0.40
0.41
0.43
0.44
0.45
0.47
0.48
0.50
Frecuencia (ciclos/da)
120
100
80
Potencia
60
40
20
-
0.00
0.02
0.03
0.04
0.06
0.07
0.08
0.10
0.11
0.13
0.14
0.15
0.17
0.18
0.19
0.21
0.22
0.24
0.25
0.26
0.28
0.29
0.30
0.32
0.33
0.35
0.36
0.37
0.39
0.40
0.41
0.43
0.44
0.45
0.47
0.48
0.50
Frecuencia (ciclos/da)
120
100
80
Potencia
60
40
20
-
0.00
0.02
0.03
0.04
0.06
0.07
0.08
0.10
0.11
0.13
0.14
0.15
0.17
0.18
0.19
0.21
0.22
0.23
0.25
0.26
0.28
0.29
0.30
0.32
0.33
0.34
0.36
0.37
0.39
0.40
0.41
0.43
0.44
0.45
0.47
0.48
0.49
Frecuencia (ciclos/da)
30
25
7.3. ANLISIS PRELIMINAR
20
Grados
15
10
0
2001 2002 2003 2004
Mes
Figura 7.13: Evolucin de la temperatura media, en la ciudad de Valencia del 1 de Enero de 2001 al 31 de
163
35
Evolucin de la temperatura media - 2001
Tmed 7 per. media mvil (Tmed)
30
25
20
Grados
15
10
0
E F M A M J J A S O N D
Mes
30
Evolucin de la temperatura media - 2002
Tmed 7 per. media mvil (Tmed)
25
20
Grados
15
10
0
E F M A M J J A S O N D
Mes
35
Evolucin de la temperatura media - 2003
Tmed 7 per. media mvil (Tmed)
30
25
20
Grados
15
10
0
E F M A M J J A S O N D
Mes
35
Evolucin de la temperatura media - 2004
30
25
20
Grados
15
10
0
E F M A M J J A S O N D
Mes
45.00
Evolucin de la Temperatura - Mensual
Tmaxmensual Tmedmensual
Tminmensual
40.00
35.00
30.00
25.00
Grados
20.00
15.00
10.00
5.00
0.00
-5.00
May-01
May-02
May-03
May-04
Ene-01
Feb-01
Mar-01
Abr-01
Jun-01
Jul-01
Ago-01
Sep-01
Oct-01
Nov-01
Dic-01
Ene-02
Feb-02
Mar-02
Abr-02
Jun-02
Jul-02
Ago-02
Sep-02
Oct-02
Nov-02
Dic-02
Ene-03
Feb-03
Mar-03
Abr-03
Jun-03
Jul-03
Ago-03
Sep-03
Oct-03
Nov-03
Dic-03
Ene-04
Feb-04
Mar-04
Abr-04
Jun-04
Jul-04
Ago-04
Sep-04
Oct-04
Nov-04
Dic-04
Figura 7.18: Evolucin de temperaturas mximas, mnimas y medias mensua-
les, 2001-2004. Grados Centgrados
Se puede observar del grfico 7.18 y del cuadro 7.8 que las temperaturas
ms altas ocurren en los meses de julio y agosto; en cambio las temperaturas
mnimas ocurren en los meses de diciembre, enero y febrero, coincidiendo
como es esperable con las estaciones del verano e invierno respectiva-
mente. La temperatura ms alta observada en la serie estudiada ocurri en
el mes de Agosto de 2001, siendo de 39 C y la mnima fue de -1.80 C. Es
evidente que el rango de variacin de las temperaturas es muy grande. Del
histograma de frecuencias de temperaturas medias (figura 7.19), se obser-
va que existen dos grupos de clases de temperaturas que se presentan con
ms frecuencia. El primer grupo con temperaturas entre los 12 C y 16.5 C y
el segundo entre los 22.5 C y los 27 C, abarcando tres clases cada uno de
los grupos. Las temperaturas extremas tanto mximas como mnimas ocurren
con poca frecuencia y los valores medios, entre los 16.5 C y los 22.5 C tienen
una ocurrencia media.
7.3. ANLISIS PRELIMINAR 167
Mes Temperatura Ao
C 2001 2002 2003 2004
Mxima 22.60 22.60 25.40 24.00
Enero Mnima 5.10 4.80 1.40 1.60
Media 14.90 12.13 12.26 12.98
Mxima 24.30 27.00 22.60 20.80
Febrero Mnima 3.00 5.50 2.50 0.50
Media 13.30 14.24 11.38 10.70
Mxima 31.00 29.00 25.40 24.00
Marzo Mnima 7.40 6.50 4.00 -1.80
Media 18.99 15.27 14.19 12.27
Mxima 29.10 28.40 28.20 25.80
Abril Mnima 8.20 8.40 7.40 6.20
Media 17.64 16.38 16.58 15.10
Mxima 31.20 30.00 30.50 27.40
Mayo Mnima 8.00 9.60 11.00 9.20
Media 20.02 18.50 19.61 17.91
Mxima 32.50 32.00 36.50 37.00
Junio Mnima 16.00 13.20 18.00 14.50
Media 24.00 23.69 26.33 24.02
Mxima 34.70 35.00 38.40 33.40
Julio Mnima 18.00 17.10 21.50 17.00
Media 25.86 25.22 27.85 25.32
Mxima 39.00 33.00 36.90 38.40
Agosto Mnima 21.30 17.00 21.40 20.20
Media 27.26 24.99 28.11 27.45
Mxima 31.00 32.30 32.70 33.00
Septiembre Mnima 17.70 14.50 15.50 15.00
Media 23.40 23.76 23.84 24.11
Mxima 30.40 30.00 30.20 32.90
Octubre Mnima 14.20 12.80 9.00 9.60
Media 21.47 20.54 19.56 20.62
Mxima 24.40 29.00 23.20 22.30
Noviembre Mnima 4.40 6.10 8.40 2.80
Media 13.48 16.66 16.05 13.67
Mxima 21.60 23.20 25.00 23.20
Diciembre Mnima 1.80 6.80 4.00 1.80
Media 10.64 14.64 13.04 11.37
Desviaciones
150000
100000
50000
Variacin (m3)
-50000
-100000
-150000
-200000
0 5 10 15 20 25 30 35
Temperatura C
Desviaciones
150000 Semana Santa
Agosto
Festivos
100000
Puentes
50000
Variacin (m3)
-50000
-100000
-150000
-200000
0 5 10 15 20 25 30 35
Temperatura C
100000
50000
Variacin (m3)
-50000
-100000
-150000
-200000
0 5 10 15 20 25 30 35
Temperatura C
Desviaciones
150000
100000
50000
Variacin (m3)
-50000
-100000
-150000
-200000
0 5 10 15 20 25 30 35
Temperatura C
200000
Desviaciones
150000
Semana Santa
Agosto
Festivos
100000
Puentes
50000
Variacin (m3)
-50000
-100000
-150000
-200000
0 5 10 15 20 25 30 35
Temperatura C
200000
Desviaciones Filtrada
150000
100000
50000
Variacin (m3)
-50000
-100000
-150000
-200000
0 5 10 15 20 25 30 35
Temperatura C
Desviaciones
150000
100000
50000
Variacin (m3)
-50000
-100000
-150000
-200000
0 5 10 15 20 25 30 35
Temperatura C
200000
Desviaciones
150000 Semana Santa
Agosto
Festivos
100000
Puentes
50000
Variacin (m3)
-50000
-100000
-150000
-200000
0 5 10 15 20 25 30 35
Temperatura C
150000
100000
50000
Variacin (m3)
-50000
-100000
-150000
-200000
0 5 10 15 20 25 30 35
Temperatura C
200000
Desviaciones
150000
100000
50000
Variacin (m3)
-50000
-100000
-150000
-200000
0 5 10 15 20 25 30 35
Temperatura C
50000
Variacin (m3)
-50000
-100000
-150000
-200000
0 5 10 15 20 25 30 35
Temperatura C
Desviaciones Depurada
150000
100000
50000
Variacin (m3)
-50000
-100000
-150000
-200000
0 5 10 15 20 25 30 35
Temperatura C
Mnimo
380 Mximo
Media
360 Media Global
340
Demanda Diaria (m3)
320
300
280
260
240
220
200
0 2 3 5 6 8 9 11 12 14 15 17 18 20 21 23 24 26 27 29 30 32
Temperatura C
350
330
VOLMEN (m3)
310
290
270
250
L M M J V S D
DA
Millares
35 350
30 300
25 250
20 200
m3
15 150
Temperatura media C
10 100
5 50
Demanda m3
Temperatura
0 0
2001 2002 2003 2004
Ao
Figura 7.26: Evolucin de la temperatura media y de la demanda diaria, Aos 2001 al 2004
CAPTULO 7. CASO DE ESTUDIO
Evolucin de Temperatura y Demandas 2001
40 400
Demanda m3
Temperatura
Millares
35 350
30 300
7.3. ANLISIS PRELIMINAR
25 250
20 200
m3
15 150
Temperatura media C
10 100
5 50
0 0
E F M A M J J A S O N D
Mes
Modelo RMSE
ARMA (0,0,0)cc 26414.8
ARMA (0,1,0)cc 21488.2
ARIMA (0,0,0)x(0,1,0)cc 18241.2
ARIMA (0,1,0)x(0,1,0) 16827.6
Cuadro 7.12: Valor del RMSE para cada grado de diferencias regulares o es-
tacionales
3
Residuos
-3
-6
-9
01/01/01
01/04/01
30/06/01
28/09/01
27/12/01
27/03/02
25/06/02
23/09/02
22/12/02
22/03/03
20/06/03
18/09/03
17/12/03
16/03/04
14/06/04
12/09/04
11/12/04
11/03/05
Figura 7.28: Residuos del modelo ARIMA(0,1,0) con constante
0.6
0.2
-0.2
-0.6
-1
0
10
15
20
25
30
Retardos
Figura 7.29: ACF de los residuos del modelo ARIMA(0,1,0) con constante
7.4. IDENTIFICACIN DEL MODELO DE PREDICCIN 185
0.6
0.2
-0.2
-0.6
-1
0 5 10 15 20 25 30
Retardos
Figura 7.30: PACF de los residuos del modelo ARIMA (0,1,0) con constante
0.6
0.2
-0.2
-0.6
-1
0 5 10 15 20 25 30
Retardos
0.6
0.2
-0.2
-0.6
-1
0 5 10 15 20 25 30
Retardos
Una vez que hemos conseguido que la serie sea estacionaria por medio
de diferenciacin, el siguiente paso para ajustar un modelo ARIMA es deter-
minar si se requieren trminos AR MA para captar la autocorrelacin que
todava pudiera existir en la serie.
Programas como Statgraphics Plus nos permiten hacer pruebas de dis-
tintas combinaciones de trminos hasta identificar cual entrega mejores re-
sultados. Sin embargo observado el grfico de ACF (grfico 7.31) y el de PACF
(grfico 7.32) se puede identificar el nmero de trminos AR y/ MA necesa-
rios.
En el caso que estamos analizando los grfico de ACF y PACF nos indi-
can una leve sobre diferenciacin ya que los valores de correlacin se han
vuelto negativos. Estos presentan el patrn caracterstico que nos indica la
necesidad de uno o varios componentes de media mvil (MA) no estacio-
nales (MA signature): un corte rpido del ACF y una disminucin lenta del
PACF (es decir que cuenta con varios valores significativos) y de valor nega-
tivo. El nmero de valores de PACF fuera de los lmites crticos nos sealan
que 2 componentes MA no estacionales deben ser incluidos en el modelo. Es
evidente tambin el patrn caracterstico que nos indica la necesidad de in-
cluir en el modelo un componente de media mvil estacional (SMA), ya que
la autocorrelacin en el periodo estacional es negativa. En base a lo ante-
rior, el modelo que inclua inicialmente solo los rdenes de diferencias se ha
transformado en un ARIMA (0,1,2)x(0,1,1)7.
188 CAPTULO 7. CASO DE ESTUDIO
Periodo de Periodo de
Estadstico Estimacin Validacin
RMSE 12,465.10 11,143.56
MAE 8,841.01 7,932.46
MAPE 2.876 2.40995
ME -118.286 -17.6564
MPE -0.145004 -0.086111
0.6
0.2
-0.2
-0.6
-1
0 5 10 15 20 25 30
Retardos
Figura 7.33: ACF de los residuos del modelo (A) ARIMA (0,1,1)x(0,1,1)7
7.4. IDENTIFICACIN DEL MODELO DE PREDICCIN 191
0.6
0.2
-0.2
-0.6
-1
0 5 10 15 20 25 30
Retardo
Figura 7.34: PACF de los residuos del modelo (A) ARIMA (0,1,1)x(0,1,1)7
3
Ordenada
0
0 0.1 0.2 0.3 0.4 0.5
Frecuencia
0.8
0.6
Ordenada
0.4
0.2
Figura 7.36: Periodograma acumulativo de los residuos del modelo (A) ARIMA
(0,1,1)x(0,1,1)7
7.4. IDENTIFICACIN DEL MODELO DE PREDICCIN 193
Modelo (B) ARIMA (0,1,1)X(0,1,1)7 + Tmax El modelo (B) tiene la misma es-
tructura del modelo (A) pero le ha sido incluida la temperatura mxima (Tmax)
como variable exgena con el fin de mejorar el modelo con la informacin
que nos aporta la relacin temperatura-demanda. El cuadro 7.16 de desem-
peo del modelo nos indica que en la fase de estimacin el modelo presenta
peores resultados con respecto a los obtenidos por el modelo (A). Los esta-
dsticos que miden la magnitud de los errores (RMSE, MAE, MAPE) e incluso
los estadsticos que miden el sesgo (ME, MPE) presentan peores resultados.
En cambio, en la fase de validacin la mejora es significativa con respecto
a la fase de estimacin y tambin si comparamos los resultados con los ob-
tenidos con el modelo (A). En cuanto a los grficos de ACF Y PACF (7.37 y
7.38) presenta los mismos fallos que el modelo (A), lo cual es esperable ya
que como se dijo antes, la estructura del modelo es la misma. La inclusin de
la temperatura no aporta mejoras en la autocorrelacin de los residuos en los
retardos peridicos. El periodograma (7.39) y el periodograma acumulativo
de los residuos (7.40) evidencian mejoras en el desempeo del modelo con
respecto a los del modelo (A). Los valores de la ordenada se han reducido.
En cambio el modelo falla en el tests de aleatoriedad de los residuos por ra-
chas(de tendencias) y de autocorrelacin (Box-Pierce).
La inclusin de la temperatura mxima (Tmax) como variable exgena en el
modelo se justifica ya que como se observa en el cuadro 7.17, es altamente
significativa estadsticamente.
Periodo de Periodo de
Estadstico Estimacin Validacin
RMSE 12,631.40 10,640.84
MAE 8,912.25 7,629.09
MAPE 2.89865 2.31316
ME -465.374 2.322
MPE -0.245292 -0.06569
0.6
0.2
-0.2
-0.6
-1
0 5 10 15 20 25 30
Retardos
Figura 7.37: ACF de los residuos del modelo (B) ARIMA (0,1,1)x(0,1,1)7 + Tmax
0.6
0.2
-0.2
-0.6
-1
0 5 10 15 20 25 30
Retardo
Figura 7.38: PACF de los residuos del modelo (B) ARIMA (0,1,1)x(0,1,1)7 + Tmax
7.4. IDENTIFICACIN DEL MODELO DE PREDICCIN 195
20
16
Ordenada
12
0
0 0.1 0.2 0.3 0.4 0.5
Frecuencia
0.8
0.6
Ordenada
0.4
0.2
0
0 0.1 0.2 0.3 0.4 0.5
Frecuencia
Figura 7.40: Periodograma acumulativo de los residuos del modelo (B) ARIMA
(0,1,1)x(0,1,1)7 + Tmax
196 CAPTULO 7. CASO DE ESTUDIO
Modelo (C) ARIMA (0,1,2)X(0,1,1)7 Siguiendo las conclusiones a las que lle-
gamos en la seccin 7.4.1, donde el PACF de la serie con una diferencia
regular (d) y una estacional (D) nos indica que es necesaria la inclusin en el
modelo de dos componentes de media mvil regular MA(2), se ha construi-
do el modelo que hemos denominado (C). Se puede decir que este modelo
es diferente en su estructura respecto a los modelos (A) y (B) ya que utiliza
dos componentes de media mvil en vez de una para intentar captar la es-
tructura de la serie de demandas de la mejor manera. Es decir que utiliza los
errores en la prediccin para el momento t-1 y t-2 y para la parte estacional
del modelo utiliza los errores de prediccin de una semana atrs, es decir t-7.
Con esta estructura el modelo supera las 5 pruebas realizadas a sus residuos
de aleatoriedad (long term cycles, tendencia), autocorrelacin (Box-Pierce)
as como tambin el anlisis de las medias y varianzas de la primer y segunda
mitad de la serie de residuos para investigar si estas diferencias son significati-
vas, que en este caso no lo fueron.
Periodo de Periodo de
Estadstico Estimacin Validacin
RMSE 12,297.30 11,101.84
MAE 8,684.44 7,926.92
MAPE 2.82554 2.41304
ME -123.628 -24.5575
MPE -0.154342 -0.095516
0.6
0.2
-0.2
-0.6
-1
0 5 10 15 20 25 30
Retardo
Figura 7.41: ACF de los residuos del modelo (C) ARIMA (0,1,2)x(0,1,1)7
198 CAPTULO 7. CASO DE ESTUDIO
0.6
0.2
-0.2
-0.6
-1
0 5 10 15 20 25 30
Retardo
Figura 7.42: PACF de los residuos del modelo (C) ARIMA (0,1,2)x(0,1,1)7
3
Ordenada
0
0 0.1 0.2 0.3 0.4 0.5
Frecuencia
0.8
Ordenada
0.6
0.4
0.2
0
0 0.1 0.2 0.3 0.4 0.5
Frecuencia
Figura 7.44: Periodograma acumulativo de los residuos del modelo (C) ARIMA
(0,1,2)x(0,1,1)7
200 CAPTULO 7. CASO DE ESTUDIO
Modelo (D) ARIMA (0,1,2)X(0,1,1)7 + Tmax Este modelo tiene la misma es-
tructura que el anterior (C), es decir dos componentes de media mvil re-
gular (MA2) que ya vimos que aportaron una mejora en la serie de residuos
obtenidos. Adems hemos incluido tambin la temperatura mxima (Tmax)
como variable exgena en busca de introducir en el modelo la relacin
temperatura-demanda que ya vimos que fue de utilidad en el desempeo
del modelo (B). Por lo tanto este modelo (D) cuenta con 4 parmetros que
debern ser estimados.
Al igual que en los anteriores modelos se ha analizado el desempeo (ver
cuadros 7.20 y 7.21) del modelo en las fases de validacin y estimacin. El
modelo con la estructura actual supera en la fase de estimacin a todos los
modelos anteriores y en la fase de validacin presenta los menores valores
en los estadsticos que miden la magnitud de los errores (RMSE, MAE y MAPE)
y es superado por el modelo (B) en los estadsticos que miden el sesgo (ME y
MPE). El modelo obtuvo un valor de -9.9 m3 para el error medio (ME) lo que
indica que tiende a subestimar las predicciones en esa cantidad de metros
cbicos, lo cual es un valor mnimo si tomamos en cuenta que el valor medio
de la demanda diaria es de 321,573 m3 (ver cuadro 7.2). De cualquier forma
en la siguiente seccin veremos que este criterio no es suficiente a la hora de
tomar una decisin sobre el modelo a elegir.
Periodo de Periodo de
Estadstico Estimacin Validacin
RMSE 12,082.80 10,603.67
MAE 8,517.06 7,553.24
MAPE 2.77203 2.29683
ME -53.1731 -9.90066
MPE -0.127269 -0.081778
0.6
0.2
-0.2
-0.6
-1
0 5 10 15 20 25 30
Retardo
Figura 7.45: ACF de los residuos del modelo (D) ARIMA(0,1,2)x(0,1,1)7 + Tmax
0.6
0.2
-0.2
-0.6
-1
0 5 10 15 20 25 30
Retardo
Figura 7.46: PACF de los residuos del modelo (D) ARIMA(0,1,2)x(0,1,1)7 + Tmax
202 CAPTULO 7. CASO DE ESTUDIO
3
Ordenada
0
0 0.1 0.2 0.3 0.4 0.5
Frecuencia
0.8
Ordenada
0.6
0.4
0.2
0
0 0.1 0.2 0.3 0.4 0.5
Frecuencia
Figura 7.48: Periodograma acumulativo de los residuos del modelo (D) ARI-
MA(0,1,2)x(0,1,1)7 + Tmax
7.4. IDENTIFICACIN DEL MODELO DE PREDICCIN 203
Comparacin de modelos
El cuadro 7.22 presenta el resumen del anlisis de los residuos para los
cuatro modelos para distintos tests. Si un modelo ha sido bien ajustado a una
serie y se ha logrado captar su estructura, entonces esperaramos que los
residuos formen una secuencia de nmeros aleatorios o ruido blanco.
n
1X
ME = et (7.6)
n
t=1
n
1X 2
M SE = et (7.8)
n
t=1
evitan que los errores se anulen entre ellos hacindolos positivos, ya sea
tomando su valor absoluto, como lo hace el MAE (7.7), o hacindolos cua-
drticos como el MSE (7.8). El MAE tiene la ventaja de ser ms interpretable y
fcil de explicar para los no especialistas en el tema. El MSE tiene la ventaja
de ser ms manejable matemticamente y por eso es utilizado frecuente-
mente en la optimizacin estadstica. Los estadsticos anteriores tratan la pre-
cisin del modelo y su magnitud depende de la escala de los datos, por lo
tanto no proporcionan un punto de comparacin entre diferentes series tem-
porales o diferentes intervalos. Es necesario entonces utilizar medidas relativos
o porcentuales de error.
Yt F t
P Et = 100 (7.9)
Yt
n
1X
MP E = P Et (7.10)
n
t=1
n
1X
M AP E = |P Et | (7.11)
n
t=1
7.4. IDENTIFICACIN DEL MODELO DE PREDICCIN 205
Sin embargo tanto el MPE (7.10), como el ME, tienden a ser pequeos
porque los PEs (errores porcentuales) positivos y negativos tienden a anularse.
En cambio el MAPE (7.11) que utiliza los valores de los PEs absolutos nos aporta
informacin ms concreta. Es de ms utilidad, por ejemplo saber que el MAPE
de un modelo es 5 % que simplemente saber que un determinado modelo
tiene un MSE de 185.
Existen modificaciones del AIC que tambin se usan, como seran el BIC
de Schwarz (Bayesian Information Criterion) el FPE (Final prediction error).
Una diferencia en los valores del AIC de 2 menos no se considera sustancial
y deberamos considerar la opcin de seleccionar un modelo ms simple. El
cuadro 7.23 es un resumen de los resultados obtenidos para cada modelo,
incluyendo adems una columna donde se ha calculado el AIC para ca-
da uno de ellos. En base a estos, si no tomramos en cuenta los que hemos
denominado como criterios alternativos y observramos solamente los esta-
dsticos, sera muy complicado elegir el mejor modelo entre (B) y (D), ya que
el primero obtiene valores mnimos para los estadsticos ME y MPE, y el se-
gundo valores mnimos para RMSE, MAE y MAPE. En cambio si observamos los
valores de Log-verosimilitud, AIC y BIC, podemos ver que el modelo D obtiene
los resultados ms satisfactorios aun y considerando que este modelo incluye
un trmino adicional por el que fue penalizado.
Modelo RMSE MAE MAPE ME MPE Log-verosim AIC BIC
A 11,143.56 7,932.46 2.409 -17.65 -0.0861 -15,738.40 31,480.87 31,491.43
B 10,662.31 7,629.09 2.323 2.32 -0.0656 -15,696.90 31,399.77 31,415.61
C 11,101.84 7,926.92 2.413 -24.56 -0.0955 -15,723.20 31,452.44 31,468.29
D 10,603.67 7,553.24 2.297 -9.90 -0.0817 -15,680.70 31,369.31 31,390.43
Modelo seleccionado
Millares
350
300
250
200
Metros Cbicos
150
7.4. IDENTIFICACIN DEL MODELO DE PREDICCIN
100
50
0
E F M A M J J A S O N D
Mes
375000
350000
Demanda Predicha (m3/da)
325000
300000
275000
250000
225000
225000 250000 275000 300000 325000 350000 375000 400000
Demanda Observada (m3/da)
375000
350000
Demanda Predicha (m3/da)
325000
300000
275000
250000
225000
225000 250000 275000 300000 325000 350000 375000 400000
Millares
350
300
250
200
Metros Cbicos
150
100
50
0
E F M A M J J A S O N D
Mes
Figura 7.52: Prediccin a un da. Grfico de Validacin vs. Observacin del, Modelo C. Ao 2004
CAPTULO 7. CASO DE ESTUDIO
7.4. IDENTIFICACIN DEL MODELO DE PREDICCIN 213
375000
350000
Demanda Predicha (m3/da)
325000
300000
275000
250000
225000
225000 250000 275000 300000 325000 350000 375000 400000
Millares
350
300
250
200
Metros Cbicos
150
100
50
0
E F M A M J J A S O N D
Mes
Figura 7.54: Prediccin a siete das. Grfico de Validacin vs. Observacin del Modelo C. Ao 2004
CAPTULO 7. CASO DE ESTUDIO
7.4. IDENTIFICACIN DEL MODELO DE PREDICCIN 215
donde
0
50
L
15/03/2004
16/03/2004
17/03/2004
M MI
J
18/03/2004
19/03/2004
V
Residuos
20/03/2004
S
21/03/2004
D
L
22/03/2004
23/03/2004
Observacin
24/03/2004
M MI
J
25/03/2004
26/03/2004
V
27/03/2004
S
Validacin
28/03/2004
D
L
29/03/2004
30/03/2004
Da
31/03/2004
M MI
J
01/04/2004
02/04/2004
V
03/04/2004
S
04/04/2004
D
Validacin Marzo-Abril 2004
L
05/04/2004
06/04/2004
07/04/2004
M MI
J
08/04/2004
09/04/2004
V
10/04/2004
S
12/04/2004
13/04/2004
14/04/2004
M MI
J
15/04/2004
217 7.4. IDENTIFICACIN DEL MODELO DE PREDICCIN
218 CAPTULO 7. CASO DE ESTUDIO
Parte VI
Mejoras Metodolgicas
219
Captulo 8
8.1. Introduccin
Las redes neuronales artificiales han venido siendo utilizada en los ltimos
aos para la resolucin de problemas en el rea de los recursos hdricos y
ms recientemente en la modelacin y prediccin de la demanda de agua
potable (Gri~C., 1991; Jain and Ormsbee, 2002; Joo et~al., 2002; Bougadis
et~al., 2005; Zhang et~al., 2006). A lo largo de esta seccin utilizaremos el
mismo conjunto de datos con los que se construyeron los modelos ARIMA
de la seccin anterior para identificar un grupo de ANN que logren captar
el proceso que sigue la demanda diaria de la ciudad de Valencia, Espaa,
en el periodo de 2001 a 2004. El objetivo del desarrollo de esta seccin es
el de realizar una comparacin efectiva e imparcial en igualdad de datos
disponibles de los modelos ANN con las metodolodas de series temporales y
no el de innovar en los planteamientos de anlisis de la demanda de agua
con estas tcnicas. El trabajo numrico de las ANN se realiz con el software
MATLAB R2008b y su toolbox de redes neuronales.
La identificacin de la arquitectura ptima de una ANN requiere del mis-
mo anlisis exploratorio del conjunto de datos que se ha desarrollado en la
seccin 7.3 como apoyo para la identificacin de los modelos de series tem-
porales ARIMA. Faraway and Chatfield (1998) recomiendan que un buen mo-
delo de ANN para series de datos temporales debe ser seleccionado combi-
nando habilidades tradicionales de modelacin con conocimientos de an-
lisis de series temporales y de los problemas particulares. Al haber realizado
en las secciones 7.3 y 7.4 un anlisis preliminar (estacionareidad, estacionali-
221
222 CAPTULO 8. MODELOS BASADOS EN REDES NEURONALES
Variable Tipo
Demanda antecedente (Yt1 ) Numrica
Demanda antecedente (Yt7 ) Numrica
Demanda predicha (Yt+1 ) Numrica
Temperatura mxima (T maxt1 ) Numrica
Festivos Binaria
Laborable/No laborable Binaria
Indicador Agosto Binaria
Cuadro 8.1: Variables utilizadas en los vectores de entrada a las redes neuro-
nales
Como una primer intento hemos construido una ANN 231, o lo que es
lo mismo, un vector de dos entradas, 3 neuronas en la capa oculta y una
neurona en la capa de salida, as como un vector que contiene el conjunto
de datos objetivo correspondiente a cada da que se va a predecir. El cuadro
8.2 presenta las principales caractersticas de la red y la figura 8.1 presenta su
topologa. Se ha probado su desempeo para predecir la demanda diaria a
un da.
224 CAPTULO 8. MODELOS BASADOS EN REDES NEURONALES
Yt-1 1
2 1 Yt+1
Yt-7
2
3
Dato Caracterstica
Entradas 2
Salidas 1
Capas 3
Neuronas capa oculta 3
Neuronas capa salida 1
Funcin de inicializado de red Nguyen-Widrow
Funcin de transferencia Tansigmoidal/lineal
Periodo de Periodo de
Estadstico Entrenamiento Validacin
RMSE 14,207.18 14,395.23
MAE 10,393.00 10,379.10
MAPE 3.38 3.15
ME 0.00 1,103.90
MPE -0.22 0.146
Error Mx. Abs. 72,628.6 67,676.40
r 0.833 0.776
R2 0.694 0.603
Millares
350
300
250
200
Metros Cbicos
150
100
50
0
E F M A M J J A S O N D
Mes
Figura 8.2: Grfico de Validacin vs. Observacin, Ao 2004. Prediccin a 1 da Red 231
CAPTULO 8. MODELOS BASADOS EN REDES NEURONALES
8.3. ELECCIN DE ANNS 227
0.8
0.6
Ordenada
0.4
0.2
Frecuencia
0.6
0.2
-0.2
-0.6
-1
0 5 10 15 20 25 30
Retardo
375000
350000
Demanda Predicha (m /da)
3
325000
300000
275000
250000
225000
225000 250000 275000 300000 325000 350000 375000 400000
Demanda Observada (m3/da)
375000
350000
Demanda Predicha (m /da)
3
325000
300000
275000
250000
225000
225000 250000 275000 300000 325000 350000 375000 400000
Demanda Observada (m3/da)
Una vez vistos los resultados de la red anterior y comprobado que los
errores an conservan rastros de autocorrelacin segn el ACF presentado.
Se ha construido una red ms compleja, ANN 441, con un vector de 4 entra-
das, 4 neuronas en la capa oculta y una neurona en la capa de salida, as
como un vector que contiene el conjunto de datos objetivo correspondiente
a cada da que se va a predecir. Con esta estructura de red, no solo se le pro-
porciona informacin de los valores de la demanda registrada en 1 y 7 das
antecedentes. Adicionalmente se le proporciona informacin cualitativa del
ciclo semanal, con valores asignados de valor 1 a los das laborables (lunes
a viernes) y valor 0 para los das del fin de semana (sbado y domingo). Fi-
nalmente se le proporciona un indicador de das no laborables regido por el
calendario de festividades de la comunidad y que alteran el patrn semanal
que presenta la demanda. De esta forma, los das como por ejemplo, San
Jos (19 marzo), semana santa (fechas variables), etc. son considerados con
valor 0, mientras que el resto de los das se les asigna el valor 1 (ver Apndice
B, pgina 317 del calendario de festividades de la ciudad de Valencia).
El cuadro 8.4 presenta las principales caractersticas de la red y la figura
8.7 presenta su topologa. Se ha probado su desempeo para predecir la
demanda diaria a un da.
Yt-1 1 1
Yt-7
2 2
1 Yt+1
Festivos [0,1] 3 3
Laborable /
4 4
No laborable [0,1]
Dato Caracterstica
Entradas 4
Salidas 1
Capas 3
Neuronas capa oculta 4
Neuronas capa salida 1
Funcin de inicializado de red Nguyen-Widrow
Funcin de transferencia Tansigmoidal/lineal
Periodo de Periodo de
Estadstico Entrenamiento Validacin
RMSE 10,922.64 11,359.23
MAE 7,775.30 8,332.94
MAPE 2.50 2.49
ME 0.00 3,859.20
MPE -0.12 1.09
Error Mx. Abs. 67,682.83 42,232.96
r 0.90 0.88
R2 0.81 0.78
Millares
350
300
8.3. ELECCIN DE ANNS
250
200
Metros Cbicos
150
100
50
0
E F M A M J J A S O N D
Mes
Figura 8.8: Grfico de Validacin vs. Observacin, Ao 2004. Prediccin a 1 da Red 441
233
234 CAPTULO 8. MODELOS BASADOS EN REDES NEURONALES
0.8
0.6
Ordenada
0.4
0.2
0.6
Autocorrelacin
0.2
-0.2
-0.6
-1
0 5 10 15 20 25 30
Retardo
375000
350000
Demanda Predicha (m3/da)
325000
300000
275000
250000
225000
225000 250000 275000 300000 325000 350000 375000 400000
Demanda Observada (m3/da)
375000
350000
Demanda Predicha (m3/da)
325000
300000
275000
250000
225000
225000 250000 275000 300000 325000 350000 375000 400000
Demanda Observada (m3/da)
Si bien los resultados de la red anterior (ANN 441) han mejorado sensi-
blemente respecto a la inicial (ANN 231), se ha buscado una red un grado
ms compleja y se le ha aadido una neurona adicional en la capa oculta.
La intencin es evaluar si la adicin de una neurona resulta en una mejora en
las predicciones realizadas.
Una vez vistos los resultados de la red anterior y comprobado que los
errores an conservan rastros de autocorrelacin en los retardos peridicos
segn el ACF presentado. Se ha construido una red ms compleja, ANN 451,
con un vector de 4 entradas, 5 neuronas en la capa oculta y una neurona
en la capa de salida, as como un vector que contiene el conjunto de da-
tos objetivo correspondiente a cada da que se va a predecir. El vector de
entradas conserva la estructura anterior.
El cuadro 8.6 presenta las principales caractersticas de la red y la figura
8.13 presenta su topologa. Se ha probado su desempeo para predecir la
demanda diaria a un da.
Yt-1 1
2
Yt-7
2
3 1 Yt+1
Festivos [0,1] 3
4
Laborable /
4
No laborable [0,1]
5
Dato Caracterstica
Entradas 4
Salidas 1
Capas 3
Neuronas capa oculta 5
Neuronas capa salida 1
Funcin de inicializado de red Nguyen-Widrow
Funcin de transferencia Tansigmoidal/lineal
Periodo de Periodo de
Estadstico Entrenamiento Validacin
RMSE 10,841.71 11,459.44
MAE 7,686.65 8,234.82
MAPE 2.47 2.46
ME 0.00 3,565.81
MPE -0.12 1.00
Error Mx. Abs. 68,081.78 45,260.81
r 0.90 0.88
R2 0.82 0.78
Millares
350
300
8.3. ELECCIN DE ANNS
250
200
Metros Cbicos
150
100
50
0
E F M A M J J A S O N D
Mes
Figura 8.14: Grfico de Validacin vs. Observacin, Ao 2004. Prediccin a 1 da Red 451
239
240 CAPTULO 8. MODELOS BASADOS EN REDES NEURONALES
0.8
0.6
Ordenada
0.4
0.2
0.6
Autocorrelaciones
0.2
-0.2
-0.6
-1
0 5 10 15 20 25 30
Retardo
375000
350000
Demanda Predicha (m3/da)
325000
300000
275000
250000
225000
225000 250000 275000 300000 325000 350000 375000 400000
Demanda Observada (m3/da)
375000
350000
Demanda Predicha (m /da)
3
325000
300000
275000
250000
225000
225000 250000 275000 300000 325000 350000 375000 400000
Demanda Observada (m3/da)
Los resultados de la red anterior (ANN 451) no han sido mejores que los
de la red que cuenta con una neurona menos en la capa oculta. En esta
nueva red que analizaremos a continuacin, hemos conservado las 5 neu-
ronas en la capa oculta y se ha incluido una nueva variable cualitativa al
vector de entradas. La nueva variable intenta informar a la red, de la dismi-
nucin que sufre la demanda durante los meses de agosto. Ya se ha comen-
tado en captulos anteriores que la demanda disminuye durante este mes
principalmente por la suspensin de labores de muchas empresas por el pe-
riodo vacacional. En muchos casos los habituales residentes abandonan la
ciudad hacia poblaciones aledaas. Se le ha asignado el valor 0 a los 31 das
de los meses de agosto y el valor 1 al resto de los das. El cuadro 8.8 presenta
las principales caractersticas de la red y la figura 8.13 presenta su topologa.
Se ha probado su desempeo para predecir la demanda diaria a un da.
Yt-1 1 1
Yt-7 2 2
Laborable /
4 4
No laborable [0,1]
Indicador de mes de
Agosto [0,1] 5 5
Dato Caracterstica
Entradas 5
Salidas 1
Capas 3
Neuronas capa oculta 5
Neuronas capa salida 1
Funcin de inicializado de red Nguyen-Widrow
Funcin de transferencia Tansigmoidal/lineal
Periodo de Periodo de
Estadstico Entrenamiento Validacin
RMSE 10,397.26 11,556.67
MAE 7,453.43 8,381.00
MAPE 2.39 2.50
ME 0.00 3,949.43
MPE -0.11 1.12
Error Mx. Abs. 51,855.07 61,913.09
r 0.91 0.88
R2 0.83 0.78
Millares
350
300
250
200
Metros Cbicos
150
100
50
0
E F M A M J J A S O N D
Mes
Figura 8.20: Grfico de Validacin vs. Observacin, Ao 2004. Prediccin a 1 da Red 551
CAPTULO 8. MODELOS BASADOS EN REDES NEURONALES
8.3. ELECCIN DE ANNS 245
0.8
0.6
Ordenada
0.4
0.2
0.6
Autocorrelaciones
0.2
-0.2
-0.6
-1
0 10 20 30
Retardo
375000
350000
Demanda Predicha (m3/da)
325000
300000
275000
250000
225000
225000 250000 275000 300000 325000 350000 375000 400000
Demanda Observada (m3/da)
375000
350000
Demanda Predicha (m3/da)
325000
300000
275000
250000
225000
225000 250000 275000 300000 325000 350000 375000 400000
Demanda Observada (m3/da)
Yt-1 1
1
Yt-7 2
3
Laborable /
4
No laborable [0,1]
4
Indicador de mes de
Agosto [0,1] 5
Dato Caracterstica
Entradas 5
Salidas 1
Capas 3
Neuronas capa oculta 4
Neuronas capa salida 1
Funcin de inicializado de red Nguyen-Widrow
Funcin de transferencia Tansigmoidal/lineal
Periodo de Periodo de
Estadstico Entrenamiento Validacin
RMSE 10,577.14 11,419.78
MAE 7,605.18 8,283.65
MAPE 2.45 2.47
ME 0.00 3,751.88
MPE -0.11 1.06
Error Mx. Abs. 53,718.16 63,132.19
r 0.91 0.88
R2 0.83 0.78
Millares
350
300
8.3. ELECCIN DE ANNS
250
200
Metros Cbicos
150
100
50
0
E F M A M J J A S O N D
Mes
Figura 8.26: Grfico de Validacin vs. Observacin, Ao 2004. Prediccin a 1 da Red 541
249
250 CAPTULO 8. MODELOS BASADOS EN REDES NEURONALES
0.8
0.6
Ordenada
0.4
0.2
0.6
Autocorrelacin
0.2
-0.2
-0.6
-1
0 5 10 15 20 25 30
Retardo
375000
350000
Demanda Predicha (m /da)
3
325000
300000
275000
250000
225000
225000 250000 275000 300000 325000 350000 375000 400000
Demanda Observada (m3/da)
375000
350000
Demanda Predicha (m /da)
3
325000
300000
275000
250000
225000
225000 250000 275000 300000 325000 350000 375000 400000
Demanda Observada (m3/da)
Yt-1 1
1
Yt-7 2
3
Laborable /
4
No laborable [0,1]
4
Temperatura
mxima diaria 5
Periodo de Periodo de
Estadstico Entrenamiento Validacin
RMSE 10,947.54 11,428.93
MAE 7,612.77 8,221.85
MAPE 2.44 2.44
ME 3.96 4,087.98
MPE -0.12 1.12
Error Mx. Abs. 67,658.60 50,416.62
r 0.90 0.88
R2 0.81 0.78
Millares
350
300
250
200
Metros Cbicos
150
100
50
0
E F M A M J J A S O N D
Mes
Figura 8.32: Grfico de Validacin vs. Observacin, Ao 2004. Prediccin a 1 da Red 541 + Tmax
CAPTULO 8. MODELOS BASADOS EN REDES NEURONALES
8.3. ELECCIN DE ANNS 255
0.8
0.6
Ordenada
0.4
0.2
0.6
Autocorrelacin
0.2
-0.2
-0.6
-1
0 5 10 15 20 25 30
Retardo
375000
350000
Demanda Predicha (m3/da)
325000
300000
275000
250000
225000
225000 250000 275000 300000 325000 350000 375000 400000
Demanda Observada (m3/da)
375000
350000
Demanda Predicha (m3/da)
325000
300000
275000
250000
225000
225000 250000 275000 300000 325000 350000 375000 400000
Demanda Observada (m3/da)
tanto en las predicciones a 1, pero sobre todo a 7 das. Las posibles mejoras
significaran mejores ajustes hasta un determinado punto. Sin embargo, ya
que el proceso de demanda de agua no puede ser considerado de hecho
no lo es como fsicamente basado, sino que es la respuesta del conjunto de
una poblacin a sus requerimientos diarios de agua, el proceso tiene siempre
una incertidumbre asociada esperable, que limita el grado de ajuste tanto
de la metodologa de redes neuronales como de cualquier otra.
8.5. COMPARACIN DE LAS METODOLOGAS EMPLEADAS 261
El ms simple de los modelos ARIMA (lnea 1 del cuadro 8.15) que solo
utiliza datos del pasado de la serie de demandas para calibrar sus pa-
rmetros autoregresivos y de media mvil, presenta mejores resultados
que la ANN ms simple (lnea 2 del mismo cuadro) que tambin utiliza
solo valores del pasado de la serie de demandas para entrenarse.
Los resultados de los modelos de ambas metodologas que incorporan a
la temperatura en sus estructuras (lneas 3 y 4 del cuadro 8.15), resultan
262 CAPTULO 8. MODELOS BASADOS EN REDES NEURONALES
Los resultados obtenidos estn acordes con los obtenidos por De~la
Fuente~Garca et~al. (1996), donde concluye que la metodologa Box-
Jenkins obtiene mejores resultados que la de redes neuronales (y que la
de espacio de los estados) cuando la serie que se est tratando tiene
un patrn de estacionalidad, que es nuestro caso.
265
266 CAPTULO 9. RASGOS PECULIARES DE LA DEMANDA
valores atpicos, nos hemos limitado a identificar los atpicos del tipo aditivo
(AO) de la serie en estudio. Se ha ajustado el modelo ARIMA(0,1,2)x(0,1,1) y
se ha ejecutado simultneamente la bsqueda de valores atpicos del tipo
antes mencionado. Previamente se le indicaron al modelo los das en los que
tiene lugar algn tipo de evento derivado de los patrones de festividad de la
ciudad. Se ha generado un catlogo de festividades que se tienen registra-
das en Valencia, se presentan en el cuadro 9.1. Es de esperar que estos das
sean identificados como atpicos. Los resultados se presentan en el cuadro
9.2. Se han eliminado los das clasificados como festivos pero que no fueron
estadsticamente significativos, en su mayora por que se presentan en fin de
semana y su efecto en la mayora de los casos se anula.
Los resultados presentados en el cuadro 9.2 confirman que los das en los
que se presenta una festividad, las variaciones que se registran son estadsti-
camente significativas y pueden ser considerados como valores atpicos de
variabilidad sistemtica irregular. Por otra parte, se han identificado tambin
valores que no son explicados por el calendario de festividades y que po-
dran considerarse como impactos puntuales, no sistemticos que debern
ser removidos o reemplazados por valores ms representativos. La presencia
y combinacin de las dos clases de eventos invariablemente estarn introdu-
ciendo un sesgo en la estimacin de los parmetros del modelo, por lo que
se puede verificar que los que se han obtenido anteriormente no son los me-
jores que se pueden obtener. Los que han sido obtenido tomando en cuenta
las valores atpicos han considerado los 4 aos de la serie, es decir que no se
ha reservado un conjunto de datos para validar el desempeo del modelo
estimado. Como se mencion anteriormente, la finalidad de esta seccin es
la de identificar valores atpicos, su magnitud y propiedades estadsticas. En
secciones posteriores se identificar como se hizo en secciones anteriores
un modelo que considere los valores atpicos utilizando 3 aos para estimar
los parmetros del modelo y uno para validar el desempeo.
9.1. IDENTIFICACIN DE RASGOS PECULIARES DE LA DEMANDA 267
Fecha Festividad/Evento Da
01-ene Ao nuevo Variable
06-ene Da de reyes Variable
Variable Semana Santa Viernes
Variable Semana Santa Sbado
Variable Semana Santa Domingo
Variable Semana Santa Lunes
19-mar San Jos Variable
01-may Da del trabajo Variable
15-ago Virgen de la Asuncin Variable
09-oct Da de la comunidad Valenciana Variable
12-oct Da de la hispanidad Variable
01-nov Da de todos los santos Variable
06-dic Da de la Constitucin Variable
08-dic Da de la inmaculada concepcin Variable
25-dic Navidad Variable
Ao 2001
Ao 2002
Ao 2003
Ao 2004
Para este caso 12 de los 15 das festivos fueron identificados como at-
picos. Los das 1 mayo, 15 de agosto y 9 de octubre acontecieron en fin de
semana y su efecto se disip. El da 11 de octubre que no es festivo, acon-
teci un da lunes y present un descenso significativo como resultado del
enlace entre los das del fin de semana que le preceden y el da martes 12
de octubre que le sucede. Un comportamiento similar se observ el da mar-
tes 7 de diciembre. Present descensos en la demanda esperada por estar
precedido del da festivo lunes 6 de diciembre y a continuacin el da mir-
coles 8 de diciembre. El da martes 7 de diciembre enlaza dos das festivos
aconteciendo en das laborables. Ver cuadro 9.6
Fecha Festividad/Evento Da Estimacin (m3 ) ET (m3 ) t Sig.
01-ene-04 Ao nuevo Jue -37,886.53 7,499.35 -5.05 0.000
06-ene-04 Da de reyes Mar -35,776.64 7,467.12 -4.79 0.000
19-mar-04 San Jos Vie -21,864.64 7,477.70 -2.92 0.004
09-abr-04 Semana Santa Vie -43,599.03 8,305.07 -5.25 0.000
10-abr-04 Semana Santa Sb -55,757.41 9,036.49 -6.17 0.000
11-abr-04 Semana Santa Dom -33,795.65 9,034.03 -3.74 0.000
12-abr-04 Semana Santa Lun -39,903.60 8,262.13 -4.83 0.000
11-oct-04 Atpico provocado por enlace Lun -31,285.30 8,097.27 -3.86 0.000
12-oct-04 Da de la hispanidad Mar -39,903.11 8,075.51 -4.94 0.000
01-nov-04 Da de todos los santos Lun -35,497.11 7,505.15 -4.73 0.000
06-dic-04 Da de la constitucin Lun -27,330.51 8,314.85 -3.29 0.001
07-dic-04 Atpico provocado por enlace Mar -28,012.93 8,950.43 -3.13 0.002
08-dic-04 Da de la inmaculada concepcin Mi -25,695.99 8,291.65 -3.10 0.002
25-dic-04 Navidad Sb -18,949.32 7,834.72 -2.42 0.016
Festivos no identificados como atpicos
01-may-04 Da del trabajo Sb Su efecto se anula en fin de semana
15-ago-04 Virgen de la Asuncin Dom Su efecto se anula en fin de semana
09-oct-04 Da de la comunidad Valenciana Sb Su efecto se anula en fin de semana
-5,000
-10,000
-15,000
-20,000
3
m
-25,000
-30,000
-35,000
-40,000
-45,000
Lunes Martes Mircoles Jueves Viernes
Da
Figura 9.1: Descensos de la demanda media para los das de lunes a viernes
provocados por festivos durante los aos 2001 al 2004
Los festivos de semana santa han sido analizados por separado en otro
cuadro (ver cuadro 9.8) ya que presentan valores muy diferentes a los del res-
to de los festivos que resultan en descensos globales mximos. Los descensos
observados durante los das festivos de semana santa han sido graficados en
la figura 9.2. Si bien es cierto que es complicado obtener un patrn de un
conjunto tan limitado de eventos, el agrupamiento de 4 das festivos conse-
cutivos nos permite obtener un patrn aproximado promediando cada uno
de los das de los diferentes aos (ver grfico 9.3). De esta manera podemos
observar que el descenso ms importante se presenta al inicio del conjunto
de das festivos consecutivos, es decir el viernes. Posteriormente los descensos
se reducen paulatinamente en sbado y domingo para volver a aumentar el
da lunes. Se ha ajustado una funcin polinmica de orden 3 que nos repro-
duce este patrn con un valor de R2 cercano a 1. Una mayor cantidad de
eventos nos permitira obtener una funcin que resultara ms representativa
del conjunto de eventos.
276 CAPTULO 9. RASGOS PECULIARES DE LA DEMANDA
-10,000
-20,000
-30,000
Descenso en m3
-40,000
-50,000
-60,000
-70,000
Viernes
Sbado
-80,000
Domingo
Lunes
-90,000
S.S.2001 S.S 2002 AO S.S 2003 S.S 2004
-10,000
-20,000
-30,000
3
m
-40,000
-60,000
-70,000
Viernes Sbado Domingo Lunes
Da
Con el fin de conocer los impactos que los eventos detectados tienen
sobre los parmetros de los modelos ARIMA, se ha procedido a identificar un
nuevo modelo que los incluye considerando la estructura de un modelo de
m intervenciones y un modelo ARIMA de la forma contemplada en captulos
anteriores. Se han utilizado los datos diarios de demanda de los 3 primeros
aos (2001, 2002, 2003) junto con los eventos detectados en ese mismo pe-
riodo y cuyas magnitudes se han presentado en los cuadros 9.3, 9.4, 9.5. Los
eventos que fueron detectados como atpicos de variabilidad sistemtica
irregular y que no tienen relacin con el calendario de festividades con el
que contamos, han sido reemplazadas por valores representativos de la serie
en estudio porque entendemos que esos valores son errores de registro o de
manipulacin de los registros diarios de demanda.
Con estas condicionantes se ha identificado el modelo que hemos nom-
brado E, sus parmetros se presentan en el cuadro 9.9 y los estadsticos
descriptivos de los residuos en el cuadro 9.18
Periodo de
Estadstico Estimacin (E)
RMSE 9,599.31
MAE 7,397.67
MAPE 2.36
ME 541.19
MPE 0.13
que miden el ajuste del modelo sean mejores a los obtenidos para los mo-
delos anteriores. Esto queda demostrado si comparamos los resultados de los
modelos ARIMA que no han tomado en cuenta las intervenciones obtenidos
en fase de validacin con los del cuadro 9.18. De estos podemos observar
que los estadsticos que analizan los residuos nos indican un mejor ajuste del
modelo E.
Cuadro 9.11: Comparacin del desempeo de los modelos (E) y (C), fase de
estimacin
Una vez obtenidos los parmetros del modelo que contempla un con-
junto de intervenciones, se ha procedido a probar su desempeo para pre-
decir la demanda de agua diaria a un da empleando la metodologa pro-
puesta.
Consideraciones
Intervencin media
Da Estimada m3
Viernes -59,953.53
Sbado -52,207.28
Domingo -37,339.63
Lunes -39,617.25
Fecha Festividad/Evento Da
01-ene-04 Ao nuevo Jue
06-ene-04 Da de reyes Mar
19-mar-04 San Jos Vie
09-abr-04 Semana Santa Vie
10-abr-04 Semana Santa Sb
11-abr-04 Semana Santa Dom
12-abr-04 Semana Santa Lun
11-oct-04 Atpico provocado por enlace Lun
12-oct-04 Da de la hispanidad Mar
01-nov-04 Da de todos los santos Lun
06-dic-04 Da de la constitucin Lun
07-dic-04 Atpico provocado por enlace Mar
08-dic-04 Da de la inmaculada concepcin Mi
Festivos no identificados como atpicos
01-may-04 Da del trabajo Sb
15-ago-04 Virgen de la Asuncin Dom
09-oct-04 Da de la comunidad Valenciana Sb
25-dic-04 Navidad Sb
Cuadro 9.16: Residuos mensuales acumulados del modelo (E) con y sin inter-
venciones
Cuadro 9.17: Correlacin y R2 mensuales del modelo (E) con y sin interven-
ciones
Validacin Ao 2004 - Prediccin a 1 da - Modelo E con intervenciones
400
Millares
350
300
250
200
150
Metros Cbicos
100
0
E F M A M J J A S O N D
-50
Mes
Figura 9.4: Prediccin a un da. Grfico de Validacin vs. Observacin del, Modelo E con intervenciones.
Ao 2004
285
286 CAPTULO 9. RASGOS PECULIARES DE LA DEMANDA
DIA DE LA SEMANA
J V S D L M MI J V S D L M MI J V S D L M MI J V S D L M MI J V S
400000 40000
Errores
Demandas Prediccin
Demandas Observacin 35000
375000
30000
350000
25000
DEMANDA EN M3
ERRORES EN M3
325000 20000
15000
300000
10000
275000
5000
250000 0
01/01/2004
02/01/2004
03/01/2004
04/01/2004
05/01/2004
06/01/2004
07/01/2004
08/01/2004
09/01/2004
10/01/2004
11/01/2004
12/01/2004
13/01/2004
14/01/2004
15/01/2004
16/01/2004
17/01/2004
18/01/2004
19/01/2004
20/01/2004
21/01/2004
22/01/2004
23/01/2004
24/01/2004
25/01/2004
26/01/2004
27/01/2004
28/01/2004
29/01/2004
30/01/2004
31/01/2004
Figura 9.5: Prediccin vs. Observacin, mes de Enero del 2004. Modelo E sin
intervenciones
PREDICCIN VS. OBSERVACIN. HORIZONTE DE PREDICCION=1 DA.
MES DE ENERO - MODELO "E" CON INTERVENCIONES
DIA DE LA SEMANA
J V S D L M MI J V S D L M MI J V S D L M MI J V S D L M MI J V S
400000 40000
Errores
Demandas Prediccin
Demandas Observacin 35000
375000
30000
350000
25000
3
3
DEMANDA EN M
ERRORES EN M
325000 20000
15000
300000
10000
275000
5000
250000 0
01/01/2004
02/01/2004
03/01/2004
04/01/2004
05/01/2004
06/01/2004
07/01/2004
08/01/2004
09/01/2004
10/01/2004
11/01/2004
12/01/2004
13/01/2004
14/01/2004
15/01/2004
16/01/2004
17/01/2004
18/01/2004
19/01/2004
20/01/2004
21/01/2004
22/01/2004
23/01/2004
24/01/2004
25/01/2004
26/01/2004
27/01/2004
28/01/2004
29/01/2004
30/01/2004
31/01/2004
Figura 9.6: Prediccin vs. Observacin, mes de Enero del 2004. Modelo E con
intervenciones
9.3. MEJORAS DEL MODELO CON INTERVENCIONES 287
DIA DE LA SEMANA
D L M MI J V S D L M MI J V S D L M MI J V S D L M MI J V S D
400000 40000
Errores
Demandas Prediccin
Demandas Observacin 35000
375000
30000
350000
25000
DEMANDA EN M3
ERRORES EN M3
325000 20000
15000
300000
10000
275000
5000
250000 0
01/02/2004
02/02/2004
03/02/2004
04/02/2004
05/02/2004
06/02/2004
07/02/2004
08/02/2004
09/02/2004
10/02/2004
11/02/2004
12/02/2004
13/02/2004
14/02/2004
15/02/2004
16/02/2004
17/02/2004
18/02/2004
19/02/2004
20/02/2004
21/02/2004
22/02/2004
23/02/2004
24/02/2004
25/02/2004
26/02/2004
27/02/2004
28/02/2004
29/02/2004
Figura 9.7: Prediccin vs. Observacin, mes de Febrero del 2004. Modelo E sin
intervenciones
PREDICCIN VS. OBSERVACIN. HORIZONTE DE PREDICCION=1 DA.
MES DE FEBRERO - MODELO "E" CON INTERVENCIONES
DIA DE LA SEMANA
D L M MI J V S D L M MI J V S D L M MI J V S D L M MI J V S D
400000 40000
Errores
Demandas Prediccin
Demandas Observacin 35000
375000
30000
350000
25000
3
3
DEMANDA EN M
ERRORES EN M
325000 20000
15000
300000
10000
275000
5000
250000 0
01/02/2004
02/02/2004
03/02/2004
04/02/2004
05/02/2004
06/02/2004
07/02/2004
08/02/2004
09/02/2004
10/02/2004
11/02/2004
12/02/2004
13/02/2004
14/02/2004
15/02/2004
16/02/2004
17/02/2004
18/02/2004
19/02/2004
20/02/2004
21/02/2004
22/02/2004
23/02/2004
24/02/2004
25/02/2004
26/02/2004
27/02/2004
28/02/2004
29/02/2004
Figura 9.8: Prediccin vs. Observacin, mes de Febrero del 2004. Modelo E
con intervenciones
288 CAPTULO 9. RASGOS PECULIARES DE LA DEMANDA
DIA DE LA SEMANA
L M MI J V S D L M MI J V S D L M MI J V S D L M MI J V S D L M MI
400000 40000
Errores
Demandas Prediccin
Demandas Observacin 35000
375000
30000
350000
25000
3
3
DEMANDA EN M
ERRORES EN M
325000 20000
15000
300000
10000
275000
5000
250000 0
01/03/2004
02/03/2004
03/03/2004
04/03/2004
05/03/2004
06/03/2004
07/03/2004
08/03/2004
09/03/2004
10/03/2004
11/03/2004
12/03/2004
13/03/2004
14/03/2004
15/03/2004
16/03/2004
17/03/2004
18/03/2004
19/03/2004
20/03/2004
21/03/2004
22/03/2004
23/03/2004
24/03/2004
25/03/2004
26/03/2004
27/03/2004
28/03/2004
29/03/2004
30/03/2004
31/03/2004
Figura 9.9: Prediccin vs. Observacin, mes de Marzo del 2004. Modelo E sin
intervenciones
PREDICCIN VS. OBSERVACIN. HORIZONTE DE PREDICCION=1 DA.
MES DE MARZO - MODELO "E" CON INTERVENCIONES
DIA DE LA SEMANA
L M MI J V S D L M MI J V S D L M MI J V S D L M MI J V S D L M MI
400000 40000
Errores
Demandas Prediccin
Demandas Observacin 35000
375000
30000
350000
25000
3
3
DEMANDA EN M
ERRORES EN M
325000 20000
15000
300000
10000
275000
5000
250000 0
01/03/2004
02/03/2004
03/03/2004
04/03/2004
05/03/2004
06/03/2004
07/03/2004
08/03/2004
09/03/2004
10/03/2004
11/03/2004
12/03/2004
13/03/2004
14/03/2004
15/03/2004
16/03/2004
17/03/2004
18/03/2004
19/03/2004
20/03/2004
21/03/2004
22/03/2004
23/03/2004
24/03/2004
25/03/2004
26/03/2004
27/03/2004
28/03/2004
29/03/2004
30/03/2004
31/03/2004
Figura 9.10: Prediccin vs. Observacin, mes de Marzo del 2004. Modelo E
con intervenciones
9.3. MEJORAS DEL MODELO CON INTERVENCIONES 289
DIA DE LA SEMANA
J V S D L M MI J V S D L M MI J V S D L M MI J V S D L M MI J V
400000 40000
Errores
Demandas Prediccin
Demandas Observacin 35000
375000
30000
350000
25000
3
3
DEMANDA EN M
ERRORES EN M
325000 20000
15000
300000
10000
275000
5000
250000 0
01/04/2004
02/04/2004
03/04/2004
04/04/2004
05/04/2004
06/04/2004
07/04/2004
08/04/2004
09/04/2004
10/04/2004
11/04/2004
12/04/2004
13/04/2004
14/04/2004
15/04/2004
16/04/2004
17/04/2004
18/04/2004
19/04/2004
20/04/2004
21/04/2004
22/04/2004
23/04/2004
24/04/2004
25/04/2004
26/04/2004
27/04/2004
28/04/2004
29/04/2004
30/04/2004
Figura 9.11: Prediccin vs. Observacin, mes de Abril del 2004. Modelo E sin
intervenciones
PREDICCIN VS. OBSERVACIN. HORIZONTE DE PREDICCION=1 DA.
MES DE ABRIL - MODELO "E" CON INTERVENCIONES
DIA DE LA SEMANA
J V S D L M MI J V S D L M MI J V S D L M MI J V S D L M MI J V
400000 40000
Errores
Demandas Prediccin
Demandas Observacin 35000
375000
30000
350000
25000
3
3
DEMANDA EN M
ERRORES EN M
325000 20000
15000
300000
10000
275000
5000
250000 0
01/04/2004
02/04/2004
03/04/2004
04/04/2004
05/04/2004
06/04/2004
07/04/2004
08/04/2004
09/04/2004
10/04/2004
11/04/2004
12/04/2004
13/04/2004
14/04/2004
15/04/2004
16/04/2004
17/04/2004
18/04/2004
19/04/2004
20/04/2004
21/04/2004
22/04/2004
23/04/2004
24/04/2004
25/04/2004
26/04/2004
27/04/2004
28/04/2004
29/04/2004
30/04/2004
Figura 9.12: Prediccin vs. Observacin, mes de Abril del 2004. Modelo E con
intervenciones
290 CAPTULO 9. RASGOS PECULIARES DE LA DEMANDA
DIA DE LA SEMANA
S D L M MI J V S D L M MI J V S D L M MI J V S D L M MI J V S D L
400000 40000
Errores
Demandas Prediccin
Demandas Observacin 35000
375000
30000
350000
25000
3
3
DEMANDA EN M
ERRORES EN M
325000 20000
15000
300000
10000
275000
5000
250000 0
01/05/2004
02/05/2004
03/05/2004
04/05/2004
05/05/2004
06/05/2004
07/05/2004
08/05/2004
09/05/2004
10/05/2004
11/05/2004
12/05/2004
13/05/2004
14/05/2004
15/05/2004
16/05/2004
17/05/2004
18/05/2004
19/05/2004
20/05/2004
21/05/2004
22/05/2004
23/05/2004
24/05/2004
25/05/2004
26/05/2004
27/05/2004
28/05/2004
29/05/2004
30/05/2004
31/05/2004
Figura 9.13: Prediccin vs. Observacin, mes de Mayo del 2004. Modelo E sin
intervenciones
PREDICCIN VS. OBSERVACIN. HORIZONTE DE PREDICCION=1 DA.
MES DE MAYO - MODELO "E" CON INTERVENCIONES
DIA DE LA SEMANA
S D L M MI J V S D L M MI J V S D L M MI J V S D L M MI J V S D L
400000 40000
Errores
Demandas Prediccin
Demandas Observacin 35000
375000
30000
350000
25000
3
3
DEMANDA EN M
ERRORES EN M
325000 20000
15000
300000
10000
275000
5000
250000 0
01/05/2004
02/05/2004
03/05/2004
04/05/2004
05/05/2004
06/05/2004
07/05/2004
08/05/2004
09/05/2004
10/05/2004
11/05/2004
12/05/2004
13/05/2004
14/05/2004
15/05/2004
16/05/2004
17/05/2004
18/05/2004
19/05/2004
20/05/2004
21/05/2004
22/05/2004
23/05/2004
24/05/2004
25/05/2004
26/05/2004
27/05/2004
28/05/2004
29/05/2004
30/05/2004
31/05/2004
Figura 9.14: Prediccin vs. Observacin, mes de Mayo del 2004. Modelo E con
intervenciones
9.3. MEJORAS DEL MODELO CON INTERVENCIONES 291
DIA DE LA SEMANA
M MI J V S D L M MI J V S D L M MI J V S D L M MI J V S D L M MI
400000 40000
Errores
Demandas Prediccin
Demandas Observacin 35000
375000
30000
350000
25000
3
3
DEMANDA EN M
ERRORES EN M
325000 20000
15000
300000
10000
275000
5000
250000 0
01/06/2004
02/06/2004
03/06/2004
04/06/2004
05/06/2004
06/06/2004
07/06/2004
08/06/2004
09/06/2004
10/06/2004
11/06/2004
12/06/2004
13/06/2004
14/06/2004
15/06/2004
16/06/2004
17/06/2004
18/06/2004
19/06/2004
20/06/2004
21/06/2004
22/06/2004
23/06/2004
24/06/2004
25/06/2004
26/06/2004
27/06/2004
28/06/2004
29/06/2004
30/06/2004
Figura 9.15: Prediccin vs. Observacin, mes de Junio del 2004. Modelo E sin
intervenciones
PREDICCIN VS. OBSERVACIN. HORIZONTE DE PREDICCION=1 DA.
MES DE JUNIO - MODELO "E" CON INTERVENCIONES
DIA DE LA SEMANA
M MI J V S D L M MI J V S D L M MI J V S D L M MI J V S D L M MI
400000 40000
Errores
Demandas Prediccin
Demandas Observacin
35000
375000
30000
350000
25000
DEMANDA EN M3
ERRORES EN M3
325000 20000
15000
300000
10000
275000
5000
250000 0
01/06/2004
02/06/2004
03/06/2004
04/06/2004
05/06/2004
06/06/2004
07/06/2004
08/06/2004
09/06/2004
10/06/2004
11/06/2004
12/06/2004
13/06/2004
14/06/2004
15/06/2004
16/06/2004
17/06/2004
18/06/2004
19/06/2004
20/06/2004
21/06/2004
22/06/2004
23/06/2004
24/06/2004
25/06/2004
26/06/2004
27/06/2004
28/06/2004
29/06/2004
30/06/2004
Figura 9.16: Prediccin vs. Observacin, mes de Junio del 2004. Modelo E con
intervenciones
292 CAPTULO 9. RASGOS PECULIARES DE LA DEMANDA
DIA DE LA SEMANA
J V S D L M MI J V S D L M MI J V S D L M MI J V S D L M MI J V S
400000 40000
Errores
Demandas Prediccin
Demandas Observacin 35000
375000
30000
350000
25000
3
3
DEMANDA EN M
ERRORES EN M
325000 20000
15000
300000
10000
275000
5000
250000 0
01/07/2004
02/07/2004
03/07/2004
04/07/2004
05/07/2004
06/07/2004
07/07/2004
08/07/2004
09/07/2004
10/07/2004
11/07/2004
12/07/2004
13/07/2004
14/07/2004
15/07/2004
16/07/2004
17/07/2004
18/07/2004
19/07/2004
20/07/2004
21/07/2004
22/07/2004
23/07/2004
24/07/2004
25/07/2004
26/07/2004
27/07/2004
28/07/2004
29/07/2004
30/07/2004
31/07/2004
Figura 9.17: Prediccin vs. Observacin, mes de Julio del 2004. Modelo E sin
intervenciones
PREDICCIN VS. OBSERVACIN. HORIZONTE DE PREDICCION=1 DA.
MES DE JULIO - MODELO "E" CON INTERVENCIONES
DIA DE LA SEMANA
J V S D L M MI J V S D L M MI J V S D L M MI J V S D L M MI J V S
400000 40000
Errores
Demandas Prediccin
Demandas Observacin 35000
375000
30000
350000
25000
3
3
DEMANDA EN M
ERRORES EN M
325000 20000
15000
300000
10000
275000
5000
250000 0
01/07/2004
02/07/2004
03/07/2004
04/07/2004
05/07/2004
06/07/2004
07/07/2004
08/07/2004
09/07/2004
10/07/2004
11/07/2004
12/07/2004
13/07/2004
14/07/2004
15/07/2004
16/07/2004
17/07/2004
18/07/2004
19/07/2004
20/07/2004
21/07/2004
22/07/2004
23/07/2004
24/07/2004
25/07/2004
26/07/2004
27/07/2004
28/07/2004
29/07/2004
30/07/2004
31/07/2004
Figura 9.18: Prediccin vs. Observacin, mes de Julio del 2004. Modelo E con
intervenciones
9.3. MEJORAS DEL MODELO CON INTERVENCIONES 293
DIA DE LA SEMANA
D L M MI J V S D L M MI J V S D L M MI J V S D L M MI J V S D L M
400000 40000
Errores
Demandas Prediccin
Demandas Observacin 35000
375000
30000
350000
25000
3
3
DEMANDA EN M
ERRORES EN M
325000 20000
15000
300000
10000
275000
5000
250000 0
01/08/2004
02/08/2004
03/08/2004
04/08/2004
05/08/2004
06/08/2004
07/08/2004
08/08/2004
09/08/2004
10/08/2004
11/08/2004
12/08/2004
13/08/2004
14/08/2004
15/08/2004
16/08/2004
17/08/2004
18/08/2004
19/08/2004
20/08/2004
21/08/2004
22/08/2004
23/08/2004
24/08/2004
25/08/2004
26/08/2004
27/08/2004
28/08/2004
29/08/2004
30/08/2004
31/08/2004
Figura 9.19: Prediccin vs. Observacin, mes de Agosto del 2004. Modelo E
sin intervenciones
PREDICCIN VS. OBSERVACIN. HORIZONTE DE PREDICCION=1 DA.
MES DE AGOSTO - MODELO "E" CON INTERVENCIONES
DIA DE LA SEMANA
D L M MI J V S D L M MI J V S D L M MI J V S D L M MI J V S D L M
400000 40000
Errores
Demandas Prediccin
Demandas Observacin 35000
375000
30000
350000
25000
3
3
DEMANDA EN M
ERRORES EN M
325000 20000
15000
300000
10000
275000
5000
250000 0
01/08/2004
02/08/2004
03/08/2004
04/08/2004
05/08/2004
06/08/2004
07/08/2004
08/08/2004
09/08/2004
10/08/2004
11/08/2004
12/08/2004
13/08/2004
14/08/2004
15/08/2004
16/08/2004
17/08/2004
18/08/2004
19/08/2004
20/08/2004
21/08/2004
22/08/2004
23/08/2004
24/08/2004
25/08/2004
26/08/2004
27/08/2004
28/08/2004
29/08/2004
30/08/2004
31/08/2004
Figura 9.20: Prediccin vs. Observacin, mes de Agosto del 2004. Modelo E
con intervenciones
294 CAPTULO 9. RASGOS PECULIARES DE LA DEMANDA
DIA DE LA SEMANA
MI J V S D L M MI J V S D L M MI J V S D L M MI J V S D L M MI J
400000 40000
Errores
Demandas Prediccin
Demandas Observacin 35000
375000
30000
350000
25000
DEMANDA EN M3
ERRORES EN M3
325000 20000
15000
300000
10000
275000
5000
250000 0
01/09/2004
02/09/2004
03/09/2004
04/09/2004
05/09/2004
06/09/2004
07/09/2004
08/09/2004
09/09/2004
10/09/2004
11/09/2004
12/09/2004
13/09/2004
14/09/2004
15/09/2004
16/09/2004
17/09/2004
18/09/2004
19/09/2004
20/09/2004
21/09/2004
22/09/2004
23/09/2004
24/09/2004
25/09/2004
26/09/2004
27/09/2004
28/09/2004
29/09/2004
30/09/2004
Figura 9.21: Prediccin vs. Observacin, mes de Septiembre del 2004. Modelo
E sin intervenciones
PREDICCIN VS. OBSERVACIN. HORIZONTE DE PREDICCION=1 DA.
MES DE SEPTIEMBRE - MODELO "E" CON INTERVENCIONES
DIA DE LA SEMANA
MI J V S D L M MI J V S D L M MI J V S D L M MI J V S D L M MI J
400000 40000
Errores
Demandas Prediccin
Demandas Observacin 35000
375000
30000
350000
25000
3
3
DEMANDA EN M
ERRORES EN M
325000 20000
15000
300000
10000
275000
5000
250000 0
01/09/2004
02/09/2004
03/09/2004
04/09/2004
05/09/2004
06/09/2004
07/09/2004
08/09/2004
09/09/2004
10/09/2004
11/09/2004
12/09/2004
13/09/2004
14/09/2004
15/09/2004
16/09/2004
17/09/2004
18/09/2004
19/09/2004
20/09/2004
21/09/2004
22/09/2004
23/09/2004
24/09/2004
25/09/2004
26/09/2004
27/09/2004
28/09/2004
29/09/2004
30/09/2004
Figura 9.22: Prediccin vs. Observacin, mes de Septiembre del 2004. Modelo
E con intervenciones
9.3. MEJORAS DEL MODELO CON INTERVENCIONES 295
DIA DE LA SEMANA
V S D L M MI J V S D L M MI J V S D L M MI J V S D L M MI J V S D
400000 40000
Errores
Demandas Prediccin
Demandas Observacin
35000
375000
30000
350000
25000
3
3
DEMANDA EN M
ERRORES EN M
325000 20000
15000
300000
10000
275000
5000
250000 0
01/10/2004
02/10/2004
03/10/2004
04/10/2004
05/10/2004
06/10/2004
07/10/2004
08/10/2004
09/10/2004
10/10/2004
11/10/2004
12/10/2004
13/10/2004
14/10/2004
15/10/2004
16/10/2004
17/10/2004
18/10/2004
19/10/2004
20/10/2004
21/10/2004
22/10/2004
23/10/2004
24/10/2004
25/10/2004
26/10/2004
27/10/2004
28/10/2004
29/10/2004
30/10/2004
31/10/2004
Figura 9.23: Prediccin vs. Observacin, mes de Octubre del 2004. Modelo E
sin intervenciones
PREDICCIN VS. OBSERVACIN. HORIZONTE DE PREDICCION=1 DA.
MES DE OCTUBRE - MODELO "E" CON INTERVENCIONES
DIA DE LA SEMANA
V S D L M MI J V S D L M MI J V S D L M MI J V S D L M MI J V S D
400000 40000
Errores
Demandas Prediccin
Demandas Observacin 35000
375000
30000
350000
25000
3
3
DEMANDA EN M
ERRORES EN M
325000 20000
15000
300000
10000
275000
5000
250000 0
01/10/2004
02/10/2004
03/10/2004
04/10/2004
05/10/2004
06/10/2004
07/10/2004
08/10/2004
09/10/2004
10/10/2004
11/10/2004
12/10/2004
13/10/2004
14/10/2004
15/10/2004
16/10/2004
17/10/2004
18/10/2004
19/10/2004
20/10/2004
21/10/2004
22/10/2004
23/10/2004
24/10/2004
25/10/2004
26/10/2004
27/10/2004
28/10/2004
29/10/2004
30/10/2004
31/10/2004
Figura 9.24: Prediccin vs. Observacin, mes de Octubre del 2004. Modelo E
con intervenciones
296 CAPTULO 9. RASGOS PECULIARES DE LA DEMANDA
DIA DE LA SEMANA
L M MI J V S D L M MI J V S D L M MI J V S D L M MI J V S D L M
400000 40000
Errores
Demandas Prediccin
Demandas Observacin 35000
375000
30000
350000
25000
DEMANDA EN M3
ERRORES EN M3
325000 20000
15000
300000
10000
275000
5000
250000 0
01/11/2004
02/11/2004
03/11/2004
04/11/2004
05/11/2004
06/11/2004
07/11/2004
08/11/2004
09/11/2004
10/11/2004
11/11/2004
12/11/2004
13/11/2004
14/11/2004
15/11/2004
16/11/2004
17/11/2004
18/11/2004
19/11/2004
20/11/2004
21/11/2004
22/11/2004
23/11/2004
24/11/2004
25/11/2004
26/11/2004
27/11/2004
28/11/2004
29/11/2004
30/11/2004
Figura 9.25: Prediccin vs. Observacin, mes de Noviembre del 2004. Modelo
E sin intervenciones
PREDICCIN VS. OBSERVACIN. HORIZONTE DE PREDICCION=1 DA.
MES DE NOVIEMBRE - MODELO "E" CON INTERVENCIONES
DIA DE LA SEMANA
L M MI J V S D L M MI J V S D L M MI J V S D L M MI J V S D L M
400000 40000
Errores
Demandas Prediccin
Demandas Observacin 35000
375000
30000
350000
25000
3
3
DEMANDA EN M
ERRORES EN M
325000 20000
15000
300000
10000
275000
5000
250000 0
01/11/2004
02/11/2004
03/11/2004
04/11/2004
05/11/2004
06/11/2004
07/11/2004
08/11/2004
09/11/2004
10/11/2004
11/11/2004
12/11/2004
13/11/2004
14/11/2004
15/11/2004
16/11/2004
17/11/2004
18/11/2004
19/11/2004
20/11/2004
21/11/2004
22/11/2004
23/11/2004
24/11/2004
25/11/2004
26/11/2004
27/11/2004
28/11/2004
29/11/2004
30/11/2004
Figura 9.26: Prediccin vs. Observacin, mes de Noviembre del 2004. Modelo
E con intervenciones
9.3. MEJORAS DEL MODELO CON INTERVENCIONES 297
DIA DE LA SEMANA
MI J V S D L M MI J V S D L M MI J V S D L M MI J V S D L M MI J V
400000 40000
Errores
Demandas Prediccin
Demandas Observacin 35000
375000
30000
350000
25000
DEMANDA EN M3
ERRORES EN M3
325000 20000
15000
300000
10000
275000
5000
250000 0
01/12/2004
02/12/2004
03/12/2004
04/12/2004
05/12/2004
06/12/2004
07/12/2004
08/12/2004
09/12/2004
10/12/2004
11/12/2004
12/12/2004
13/12/2004
14/12/2004
15/12/2004
16/12/2004
17/12/2004
18/12/2004
19/12/2004
20/12/2004
21/12/2004
22/12/2004
23/12/2004
24/12/2004
25/12/2004
26/12/2004
27/12/2004
28/12/2004
29/12/2004
30/12/2004
31/12/2004
Figura 9.27: Prediccin vs. Observacin, mes de Diciembre del 2004. Modelo
E sin intervenciones
PREDICCIN VS. OBSERVACIN. HORIZONTE DE PREDICCION=1 DA.
MES DE DICIEMBRE - MODELO "E" CON INTERVENCIONES
DIA DE LA SEMANA
MI J V S D L M MI J V S D L M MI J V S D L M MI J V S D L M MI J V
400000 40000
Errores
Demandas Prediccin
Demandas Observacin 35000
375000
30000
350000
25000
DEMANDA EN M3
ERRORES EN M3
325000 20000
15000
300000
10000
275000
5000
250000 0
01/12/2004
02/12/2004
03/12/2004
04/12/2004
05/12/2004
06/12/2004
07/12/2004
08/12/2004
09/12/2004
10/12/2004
11/12/2004
12/12/2004
13/12/2004
14/12/2004
15/12/2004
16/12/2004
17/12/2004
18/12/2004
19/12/2004
20/12/2004
21/12/2004
22/12/2004
23/12/2004
24/12/2004
25/12/2004
26/12/2004
27/12/2004
28/12/2004
29/12/2004
30/12/2004
31/12/2004
Figura 9.28: Prediccin vs. Observacin, mes de Diciembre del 2004. Modelo
E con intervenciones
298 CAPTULO 9. RASGOS PECULIARES DE LA DEMANDA
0.8
0.6
Ordenada
0.4
0.2
0
0 0.1 0.2 0.3 0.4 0.5 0.6
Frecuencia
0.6
Autocorrelacin
0.2
-0.2
-0.6
-1
0 5 10 15 20 25 30
Retardo
375000
350000
Demanda Predicha (m3/da)
325000
300000
275000
250000
225000
225000 250000 275000 300000 325000 350000 375000 400000
de estos valores contra los que obtendra una prediccin simple como pue-
de ser un modelo de persistencia, es decir que el valor predicho sea igual al
observado 7 periodos antes, se puede presenta mes a mes en el cuadro 9.19.
Si analizamos los desempeos mes a mes durante el ao 2004 encon-
tramos que en aquellos meses en los que ocurrieron eventos y que fueron
modelados mediante intervenciones se han obtenido valores superiores a los
obtenidos con el modelo de persistencia. El cuadro 9.19 presenta los valores
de correlacin y de determinacin obtenidos mes a mes. Se han destacado
en gris los meses con intervenciones.
Si bien la prediccin es peor que la obtenida a un da, los resultados
nos indican que es ms vlida una prediccin utilizando la metodologa pro-
puesta, a pesar de las asunciones que se han considerado, que un modelo
de persistencia, es decir que el valor de la demanda sea la misma que el de
la semana anterior. La prediccin obtenida con el modelo servir no solo co-
mo una estimacin puntual de la demanda esperada dentro de siete das,
sino tambin como una estimacin del volmen global acumulado a lo largo
de los siete das.
Periodo de
Estadstico Validacin (E)
RMSE 14,253.10
MAE 10,344.19
MAPE 3.11
ME 90.50
MPE 0.06
375000
Demanda Predicha (m3/da)
350000
325000
300000
275000
250000
225000
225000 250000 275000 300000 325000 350000 375000 400000
Demanda Observada (m3/da)
350
Millares
300
250
200
150
100
Metros Cbicos
Residuos Observacin Validacin
50
0
9.3. MEJORAS DEL MODELO CON INTERVENCIONES
-50 E F M A M J J A S O N D
-100
Mes
Figura 9.33: Prediccin a un da. Grfico de Validacin vs. Observacin del, Modelo E con intervenciones.
Ao 2004
303
304 CAPTULO 9. RASGOS PECULIARES DE LA DEMANDA
Modelo 1,95
Modelo C 30,305
Modelo E sin interv 21,245
Modelo E con interv 17,680
Conclusiones
305
Captulo 10
10.1. Conclusiones
307
308 CAPTULO 10. CONCLUSIONES Y LNEAS FUTURAS DE INVESTIGACIN
Apndices
313
Apndice A
6. Journal of hydrology
8. Hydrological processes
12. Simulation
13. Neurocomputing
315
316
Apndice B
317
318 APNDICE B. DAS FESTIVOS NO LABORABLES EN VALENCIA
Mes Da Festividad
Ao Nuevo, Reyes, San Vi-
Enero 1,6,22
cente Mrtir
Febrero
Marzo 19 San Jos
Abril
Mayo 1 Da del Trabajo
Junio
Julio
Agosto 15 Virgen de la Asuncin
Septiembre
Da de la Comunidad Valen-
Octubre 9,12
ciana, Da de la Hispanidad
Noviembre 1 Da de todos los santos
Da de la Constitucin, Da de
Diciembre 6,8,25 la Inmaculada Concepcin,
Navidad
Box, G., G. M. Jenkins, and G. Reinsel (1976). Time Series Analysis: Forecasting
and Control. San Francisco, California: Holden-Day. Revisin de la version
de 1970.
319
320 BIBLIOGRAFA
Chang, I., G. C. Tiao, and C. Chen (1988, May). Estimation of time series para-
meters in the presence of outliers. Technometrics 30, 193204.
Chen, C. and L.-M. Liu (1991). Recent developments of time series analy-
sis in environmental impact studies. Journal of environmental science and
health 26, 12171252.
Chen, C. and L.-M. Liu (1993a, January). Forecasting time series with outliers.
Journal of forecasting 12, 1335.
Chen, C. and L.-M. Liu (1993b, March). Joint estimation of model parameters
and outliers effects in time series. Journal of the american statistical asso-
ciation 88, 284297.
De la Fuente Garca, D., R. Pino Diez, C. Surez Riestra, and J. L. Mayo Rodr-
guez (1996). Anlisis comparativo de los mtodos de previsin univariante,
box-jenkins, redes neuronales artificiales y espacios de estado. Estudios de
Economa Aplicada (5), 533.
Demuth, H., M. Beale, and M. Hagan (2009, March). Neural Networks toolbox
6. Users Guide. Matlab. The MathWorks.
Faraway, J. and C. Chatfield (1998, Jun). Time series forecasting with neural
networks: a comparative study using the airline data. Journal of the Royal
Statistical Society 47, 231250.
BIBLIOGRAFA 321
Gato, S., N. Jayasuriya, and P. Roberts (2007b, April). Temperature and rainfall
thresholds for base use urban water demand modelling. Journal of Hydro-
logy 337, 364376.
Ghiassi, M., D. K. Zimbra, and S. H. (2008, March). Urban water demand fore-
casting with a dynamic neural network model. Journal of water resources
planning and management 134, 138146.
Gri C., R. (1991). Neural network for water demand time series forecasting.
In S. B. Heidelberg (Ed.), Artificial Neural Networks, Volume 540/1991 of Lec-
ture Notes in Computer Science, pp. 453 460. Springer-Verlag.
Jain, A. and E. Ormsbee (2002, July). Short-term water demand forecast mo-
deling techniques conventional methodsversus ai. Journal of American
Water Works Association 94, 6472.
Ledolter, J. (1989). The effect of additive outliers on the forecasts from arima
models. International Journal of forecasting 5, 231240.
Liu, L.-M. (2006, October). Time series analysis and forecasting (Second ed.).
Scientific computing associates.
Maidment, D. R. and S.-P. Miaou (1986, June). Daily water use in nine cities.
Water Resources Research 22, 845851.
Maidment, D. R., S.-P. Miaou, and M. M. Crawford (1985, April). Transfer fun-
ctions models of daily urban water use. Water Resources Research 21, 452
432.
Maier, H. R. and G. C. Dandy (2000, January). Neural networks for the pre-
diction and forecasting of water resources variables: a review of modelling
issues and applications. Environmental Modelling & Software 15, 101124.
McCulloch, W. S. and W. Pitts (1943). A logical calculus for the ideas immanent
in nervous activity. Bulletin of Mathematical Biophysics 5, 115133.
Miaou, S.-P. (1990, February). A class of time series urban water demand mo-
dels with nonlinear climatic effects. Water Resources Research 26, 169178.
Oh, H.-S. and H. Yamauchi (1974). An economic analysis of the patterns and
trends of water consumption within the service areas of the honolulu board
of water supply. Technical Report 84, Water Resources Research Center,
University of Hawaii. 95 p.
Salas LaCruz, J. and V. Yevjevich (1972). Stochastic structure of water use time
series. Hydrology paper 52, Colorado State University, Fort Collins. 71 p.
Sastri, T. and J. B. Valdes (1989, July). Rainfall intervention analysis for on-line
applications. Journal of Water Resources Planning and Management 115,
397415.
Seidel, H. (1978). A statistical analysis of water utility operating data for 1965
and 1970. Journal of American Water Works Association 70, 315323.
Tang, Z., C. de Almeida, and P. A. Fishwich (1991, November). Time series fo-
recasting using neural networks vs. box-jenkins methodology. Simulation 57,
303310.
Zhang, G. P. (2003). Timer series forecasting using a hybrid arima and neural
network model. Neurocomputing 50, 159175.