Beruflich Dokumente
Kultur Dokumente
TESIS DOCTORAL
Septiembre 2009
TESIS DOCTORAL
TESIS DOCTORAL
Dirigida por:
Johan Wideberg
Dr. Ingeniero Industrial
Septiembre 2009
Esta Tesis ha sido realizada gracias al proyecto TRA200509138, concedido por el Ministerio
de Ciencia y Tecnologa a travs del programa Plan Nacional I+D, y a VODAFONE dentro
del marco del Proyecto Minerva (1C-021).
AGRADECIMIENTOS
Esta Tesis Doctoral, si bien ha requerido de esfuerzo y mucha dedicacin por parte de la autora
y sus directores, su finalizacin no hubiese sido posible sin la cooperacin de todas y cada una
de las personas y entidades que a continuacin menciono. A Vodafone, especialmente a
Santiago Borrero, Jess Prez y M Satur Torre. Al Centro de Gestin de Trfico del Suroeste
(DGT), en particular a Ana Luz Jimnez. A Alejandro Carballar y Ana Madera del Proyecto
Minerva. A Manuel Garca de ITSoft. A todos ellos gracias por su inestimable colaboracin en
el desarrollo de este trabajo.
Me gustara agradecer sinceramente a Dr. Francisco Garca Bentez, Dr. Luis M. Romero Prez
y Dr. Johan Wideberg, la confianza depositada en m, as como su dedicacin y apoyo para que
este trabajo llegara a buen trmino. Sus conocimientos, orientaciones, paciencia y motivacin
han sido fundamentales para mi formacin como investigadora.
De igual manera agradecer a Dr. Jose Mara del Castillo Granados los conocimientos y consejos
ofrecidos para la realizacin de esta Tesis, especialmente en la ltima etapa.
A mis compaeros de Departamento, por ofrecerme su ayuda y amistad, haciendo an ms
agradable el trabajo cotidiano.
A mis padres, mi hermano y mis abuelos, por el apoyo incondicional que me han dado en todo
momento y porque, a pesar de la distancia, el nimo y alegra que me brindan me dan la
fortaleza necesaria para seguir adelante.
A Fran, por ser la persona con la que comparto mi vida, por su amor, paciencia y comprensin,
porque en su compaa las cosas malas se convierten en buenas, la tristeza se transforma en
alegra y la soledad no existe.
Por ltimo, y no menos importante, a mi hija Pilar, su nacimiento ha coincidido con el final de
la Tesis. Ella es lo mejor que me ha pasado nunca, y ha venido a este mundo a darme el ltimo
empujn para terminar este trabajo.
CONTENIDO
CAPTULO 1 INTRODUCCIN ..................................................................................................1
1.1
MOTIVACIN............................................................................................................1
1.2
1.3
OBJETIVOS ................................................................................................................4
1.4
ANTECEDENTES ......................................................................................................6
1.5
INTRODUCCIN .....................................................................................................17
2.2
2.3
2.3.1
Introduccin...........................................................................................................23
2.3.2
2.3.3
2.4
2.4.1
2.4.2
2.4.3
2.4.4
2.5
2.6
2.6.1
2.6.2
2.6.3
2.7
2.7.1
Introduccin...........................................................................................................32
2.7.2
INTRODUCCIN .....................................................................................................37
3.2
3.3
VOLUMEN ...............................................................................................................42
3.4
VELOCIDAD ............................................................................................................46
3.5
3.6
CONGESTIN ..........................................................................................................53
3.7
DENSIDAD DE TRFICO.......................................................................................54
3.8
3.8.1
3.8.2
3.8.3
3.9
CONCLUSIONES .....................................................................................................62
INTRODUCCIN .....................................................................................................65
4.2
4.3
4.3.1
4.3.2
4.3.3
4.3.4
4.3.5
4.3.6
4.3.7
Conclusiones .......................................................................................................112
ii
INTRODUCCIN ...................................................................................................117
5.2
5.3
VOLUMENES AGREGADOS.............................................................................................121
5.3.1
Introduccin.........................................................................................................121
5.3.2
5.3.3
5.3.4
5.4
CASOS PRCTICOS..............................................................................................140
5.4.1
5.4.2
CONCLUSIONES ...................................................................................................153
6.1.1
Introduccin.........................................................................................................153
6.1.2
6.1.3
6.2
BIBLIOGRAFA ..........................................................................................................................165
APNDICE I GLOSARIO ............................................................................................................173
APNDICE II PUBLICACIONES.................................................................................................179
iii
iv
NDICE DE FIGURAS
Figura 2-1: Arquitectura de la red GSM. ................................................................................... 19
Figura 2-2: Estructura de IMSI (Fuente: Rec. GSM 03.03) ....................................................... 26
Figura 2-3: Estructura de LAI (Fuente: Rec. GSM 03.03)......................................................... 26
Figura 2-4: Estructura de CGI (Fuente: Rec. GSM 03.03). ....................................................... 27
Figura 2-5: Definicin de celdas y reas de localizacin. .......................................................... 27
Figura 2-6: Antena omnidireccional (izquierda) y directiva sectores 120 (derecha). ............ 28
Figura 3-1: Flujo (rojo) y nmero de llamadas de telfonos (verde) en funcin del tiempo.
Izquierda: northbound (desde ciudad), derecha: southbound (hacia ciudad). Todos los datos son
promediados sobre intervalos de 15 minutos. (Thiessenhusen et al., 2006) ............................... 44
Figura 3-2: Ejemplo de ubicacin de aforo virtual. ................................................................... 44
Figura 3-3: Comparacin entre flujo real por un aforo virtual y el estimado tras el ajuste
(Caceres et al., 2006). ................................................................................................................. 45
Figura 3-4: Representacin de un aforo virtual. ..................................................................... 46
Figura 3-5: Promedio velocidades: telfonos vs. detectores. InterCiudad (arriba) e Intra
Ciudad (abajo) Motorway Northbound. (Ygnace, 2001) ............................................................ 47
Figura 3-6: Velocidad en funcin del tiempo obtenidos de datos GSM (+), detectores (), FCD
() (Thiessenhusen et al., 2006). ................................................................................................. 48
Figura 3-7: Concepto de estimacin de velocidad usando doblehandover (Birle et al., 2006).49
Figura 3-8: Zona handover (a) con solapamiento tpico y (b) con solapamiento debido a
edificios (Birle et al., 2006). ....................................................................................................... 50
Figura 3-9: Tiempos de viaje en la autova de Ayalon, sentido Norte (BarGera, 2007). ......... 52
Figura 3-10: Estimaciones de tiempos de viajes y velocidades en funcin del tiempo de salida:
datos GSM vs. LPR (Kummala, 2002). ...................................................................................... 52
Figura 3-11: Relacin entre volumen de llamadas y nivel de incidentes en la autova A7 (agosto
y septiembre 2000). Nota: Nivel de incidentes (level of incident): 0 = ningn incidente
detectado por los detectores, 14 = al menos 14 detectores (de 21) detectan un incidente en los
correspondientes intervalos de 12 min; Volumen de llamadas (call volume): promedio de
vi
Figura 4-15: Evolucin del n de llamadas y de vehculos en una frontera segn el intervalo
horario. ........................................................................................................................................ 94
Figura 4-16: Factor de intensidad del paso de vehculos segn el intervalo horario ti............... 95
Figura 4-17: Factor de intensidad del paso de vehculos segn el intervalo horario ti............... 96
Figura 4-18: Evolucin horaria del error relativo en valor absoluto para cada uno de los
modelos. ...................................................................................................................................... 99
Figura 4-19: Evolucin horaria del error absoluto para cada uno de los modelos. .................... 99
Figura 4-20: Distribucin acumulada del valor absoluto del error relativo en porcentajes
(arriba). Zoom en torno a los valores de error relativo absoluto 15-30% (abajo). .................... 100
Figura 4-21: Test grfico de normalidad. ................................................................................. 103
Figura 4-22: Histograma del error relativo de cada modelo segn el n de bins definido por
Knuth. ........................................................................................................................................ 104
Figura 4-23: Histograma del error relativo de cada modelo segn el n de bins definido por
Stone.......................................................................................................................................... 104
Figura 4-24: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 1 y la frontera 2. ........................................................................................................... 106
Figura 4-25: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 3 y la frontera 4. ........................................................................................................... 106
Figura 4-26: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 5 y la frontera 6 en cada periodo horario. .................................................................... 107
Figura 4-27: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 7 y la frontera 8 en cada periodo horario. .................................................................... 107
Figura 4-28: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 9 y la frontera 10 en cada periodo horario. .................................................................. 108
Figura 4-29: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 11 y la frontera 12 en cada periodo horario. ................................................................ 108
Figura 4-30: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan
la frontera 1 y la frontera 2. ....................................................................................................... 109
Figura 4-31: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan
la frontera 3 y la frontera 4. ....................................................................................................... 110
vii
Figura 4-32: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan
la frontera 5 y la frontera 6 en cada periodo horario. ................................................................ 110
Figura 4-33: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan
la frontera 7 y la frontera 8 en cada periodo horario. ................................................................ 111
Figura 4-34: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan
la frontera 9 y la frontera 10 en cada periodo horario. .............................................................. 111
Figura 4-35: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan
la frontera 11 y la frontera 12 en cada periodo horario. ............................................................ 112
Figura 5-1: Red de Sioux Falls, incluyendo distribucin ficticia de LAs y celdas. ................. 141
Figura 5-2: Correlacin entre los volmenes observados en fronteras (grupos de arcos) y los
modelados al asignar la matriz previa (a) y la matriz estimada (b). .......................................... 144
Figura 5-3: Correlacin entre la matriz previa y la matriz estimada. ....................................... 145
Figura 5-4: Nodos de la red de Madrid agrupados en 15 LAs. ................................................ 146
Figura 5-5: Correlacin entre los volmenes observados en fronteras (grupos de arcos) y los
modelados al asignar la matriz previa (a) y la matriz estimada (b). .......................................... 147
Figura 5-6: Correlacin entre los volmenes de arcos observados (pertenecientes a alguna
frontera observada) y los modelados al asignar la matriz previa (a) y la matriz estimada (b). . 149
Figura 5-7: (a) Evolucin de la funcin objetivo durante el proceso de ajuste de la matriz. (b)
Zoom para los subproblemas 25. (c) Zoom para el trmino de las restricciones de la funcin
objetivo. ..................................................................................................................................... 151
viii
NDICE DE TABLAS
Tabla 3-1: Comparativa de volmenes derivados de handovers o procesos de LU. .................. 64
Tabla 4-1: Extracto de los datos entregados por el operador. .................................................... 70
Tabla 4-2: ID fronteras asociados a cada punto kilomtrico y sentido. ..................................... 79
Tabla 4-3: Das observados. ....................................................................................................... 80
Tabla 4-4: Medidas de error para cada modelo. ......................................................................... 98
Tabla 4-5: Percentiles del error relativo en valor absoluto para cada modelo. ........................ 100
Tabla 4-6: Correlacin por rango (Spearman) y lineal (Pearson) entre { yi , yi } para cada
modelo. ...................................................................................................................................... 101
Tabla 4-7: Valores de Logaritmo de la verosimilitud (LLF), AIC y BIC del conjunto de errores
relativos de cada modelo, junto al nmero de parmetros de cada modelo. ............................. 105
Tabla 5-1: Fronteras observadas vlidas y arcos asociados. .................................................... 142
Tabla 5-2: Comparativa de ecuacin de la recta de regresin y R2, antes y despus de ajuste. 149
Tabla 6-1: Ejemplos de Aplicaciones segn mercados de negocio. ......................................... 161
ix
CAPTULO 1
INTRODUCCIN
1.1 MOTIVACIN
La creciente movilidad existente en la sociedad actual, potenciada por el incremento del uso del
automvil, exige tcnicas y mecanismos cada vez ms complejos para una correcta gestin y
planificacin de la red viaria. El objetivo de dicha planificacin del transporte es responder
adecuadamente a las necesidades de movilidad de la poblacin, por medio del dimensionado de
la infraestructura y de la utilizacin de los medios de transporte, estableciendo los costes de la
solucin adoptada, las fuentes de los recursos necesarios, y los plazos respectivos de las etapas
propuestas. Asimismo, la complejidad de los sistemas de transporte actuales ha mostrado la
conveniencia de contar con herramientas analticas que permitan al planificador disponer de un
adecuado conocimiento del sistema y poder hacer predicciones. Un modo de lograrlo es
caracterizar las vas en trminos de una serie de parmetros como son la velocidad, tiempos de
viajes, flujos, etc. La obtencin de esos datos de trfico de una forma precisa y rpida es de vital
importancia para la planificacin y gestin del trfico.
Las nuevas tecnologas, cada vez ms extendidas en la sociedad, juegan un papel clave para
introducir mejoras en la estimacin de estos parmetros y as hacer frente a los principales
problemas de trfico: movilidad, saturacin y seguridad. Un modo de conseguirlo es mediante la
telefona mvil. Segn los ltimos estudios de mercado, las tasas de penetracin de telefona
celular superan ya el 90% de la poblacin de gran cantidad de pases (CDB, 2006). Por ello,
parece lgico pensar que cada vehculo puede llevar a bordo algn telfono. La propia gestin
de movilidad que poseen las redes de telefona celular genera ciertos parmetros para su
correcto funcionamiento, tal que un tratamiento apropiado de ellos, sin necesidad de revelar
informacin confidencial de sus abonados, permitir determinar ciertos datos relativos a la
movilidad de vehculos mediante los telfonos que se lleven a bordo.
La idea del empleo de telfonos mviles para monitorizar el trfico rodado no es nueva. Sobre
este tema han aparecido mltiples trabajos en los ltimos aos, los cuales se revisan con ms
detalle en la Seccin 1.4 y el Captulo 3. Sobre este campo lleva varios aos trabajando el
Grupo de Transportes de la E.T.S.I. de Sevilla. En uno de los trabajos previos, se realiz un
estudio sobre una zona piloto (Cceres et al., 2005), financiado por el Ministerio de Fomento a
travs de las Ayudas a la Realizacin de Proyectos I+D en el rea de Transportes
FOM/486/2003, el cual demostr la viabilidad de la inferencia de datos de trfico a travs de
informacin disponible de telefona celular. Para ello se desarroll una herramienta simuladora
que, al tiempo que modelaba la situacin de trfico del escenario de estudio mediante un
simulador de trfico comercial, AIMSUN, generaba unos datos de localizacin de telfonos
similares a como se consiguen en las redes GSM. Con esos registros de localizacin ficticios,
el proceso de estimacin se fundament en un anlisis para controlar el paso por las distintas
celdas que cubran el tramo estudiado, actuando los telfonos como equipos de medida
annimos e indirectos. Los datos extrados proporcionaron informacin de movilidad con la que
inferir parmetros como matrices OD y volmenes. Adems, este simulador permiti la
posibilidad de evaluar los resultados inferidos puesto que, mientras generaba los registros de
localizacin oportunos, paralelamente, almacenaba los datos de la situacin de trfico simulada
a fin de evaluar la precisin de estimacin de esta tcnica. Los resultados obtenidos revelaron el
potencial de esta nueva tcnica al obtener gran precisin en la estimacin de datos de trfico.
Este hecho, junto con la existencia de proyectos similares en otros pases donde participan
operadores de telefona mvil, impuls la investigacin dentro de este campo de cara a la
implementacin sobre un escenario real.
Captulo 1: INTRODUCCIN
como una muestra extensa de la que extraer datos, convirtindose sus terminales en sondas
annimas para caracterizar el trfico de un modo transparente.
En lo que respecta a la gestin del trfico de vehculos, una de las fuentes de informacin ms
demandadas, con vista a la gestin de la red de infraestructura terrestre y su planificacin
estratgica, son los datos de movilidad origendestino. Estos datos, organizados en matrices
origendestino (OD), proporcionan una estimacin del nmero de personas que se desplazan
entre puntos de una determinada red en un periodo de tiempo dado, definiendo el mapa de
movilidad. La estimacin precisa de estas matrices, para modos de transporte mecanizados, es
imprescindible para que la Administracin optimice el uso de esta infraestructura desde el punto
de vista del usuario (en su utilizacin diaria) as como desde el punto de vista de las inversiones
a realizar, necesarias para la adecuacin de estas infraestructuras a las necesidades previstas y
pronosticadas en escenarios futuros.
La estimacin de una matriz OD, desde la toma inicial de datos hasta la explotacin de los
primeros resultados, supone un largo proceso que puede abarcar un periodo de incluso aos.
Esta restriccin, junto con los costes econmicos y los medios necesarios para llevarla a cabo,
implica que el nico usuario posible de dichas matrices sea la Administracin. Por ello, una
matriz OD obtenida de una forma automtica y, en cierto modo, inmediata supondra una
autntica revolucin en los estudios de movilidad encargados por la Administracin. Junto a
ello, podra dar tambin una respuesta inmediata a los problemas derivados de la movilidad,
permitiendo abordar temas a los que hasta ahora ha dedicado pocos recursos, como la movilidad
de fin de semana, movilidad asociada a ocio, movilidad a pie, etc.
Histricamente, las matrices origendestino han sido estimadas en base a tres metodologas
diferentes.
1. Estimacin directa: Llevando a cabo un proceso de encuestacin, domiciliario o viario
(directo sobre una muestra de vehculos o por ficha proporcionada a conductores, o
indirecto por captacin de nmeros de matrculas).
2. Estimacin por modelos de demanda: Haciendo uso de un modelo de distribucin (e.g.:
modelo de gravedad).
3. Estimacin mediante conteos de trfico: Utilizando conteos de trfico a fin de actualizar
una matriz origendestino preexistente.
De las tres aproximaciones anteriores, la primera de ellas, que utiliza resultados de la teora de
muestras, es la que proporciona los resultados ms fiables. Sin embargo, llevar a cabo una
encuesta amplia y detallada, que permita elaborar matrices OD completas, resulta ser un
proceso costoso, desde el punto de vista econmico y social (las encuestas a vehculos sobre el
viario son altamente distorsionantes, consumen mucho tiempo y dan lugar a resultados con
ciertos sesgos).
La segunda de ellas aplica modelos sintticos, de demanda de viajes, al sistema de transporte
actual para obtener estimaciones de los flujos origendestino. Estos modelos pueden ser
calibrados especficamente para el rea de estudio o transferidos desde reas similares.
La tercera alternativa es la ms profusamente utilizada en las ltimas dcadas y ha dado lugar a
innumerables contribuciones desde el trabajo pionero de Low (1972). La metodologa en la que
se basa exige, como prerrequisito, un conjunto de aforos que recogen conteos de trfico
(volmenes observados) y una matriz OD previa (obtenida de algn estudio cronolgicamente
anterior o de una encuestacin bsica que predefina la estructura de la matriz final a obtener).
Los aforos de trfico es un tipo de informacin que se recoge de forma automtica en un
conjunto de puntos asociados a arcos del viario y, por consiguiente, se encuentran disponibles
en reas urbanas a muy bajo coste. De aqu que esta ltima alternativa presenta las ventajas
econmicas de eliminar encuestas, las manipulaciones de datos, los chequeos y las validaciones
en gran medida. Sin embargo, presenta la desventaja de depender de la infraestructura de
detectores (aforos) existente.
El problema de ajustar una matriz de viajes OD, a partir de mediciones de aforos en una red de
trfico y de una matriz OD desactualizada, ha suscitado un gran inters en los ltimos aos.
Esto es debido, fundamentalmente, a que la informacin se puede obtener ms rpida y
econmicamente que la obtenida tradicionalmente mediante la realizacin de encuestas. Es en
este contexto donde se va a centrar esta Tesis, pero introduciendo una novedad respecto a los
volmenes observados. En lugar de los tradicionales conteos de trfico realizados por los aforos,
se utilizarn como volmenes observados datos de movilidad derivados de la telefona mvil.
Esto implicar el desarrollo de modelos de inferencia de volmenes de trfico mediante datos de
telfonos as como algoritmos de ajuste adaptados a las caractersticas de esos volmenes.
1.3 OBJETIVOS
Como ya se ha comentado en lneas anteriores, la obtencin de datos de una forma precisa y
rpida es una de las principales preocupaciones para la planificacin y gestin del trfico. Entre
Captulo 1: INTRODUCCIN
esta informacin de trfico destacan las matrices origendestino, las cuales son esenciales con
vista a la gestin de la red y su planificacin. De las metodologas existentes para la estimacin
de matrices OD, la ms extendida se basa en el ajuste de una matriz previa (obtenida de algn
estudio cronolgicamente anterior o de una encuestacin bsica que predefina la estructura de la
matriz final a obtener) mediante conteos de trfico medidos en un subconjunto de arcos de la
red, a fin de encontrar una matriz OD que, cuando sea asignada a la red, reproduzca los
conteos de trfico observados.
Una posible alternativa, tanto para la determinacin de las matrices de movilidad OD como
para la captacin de aforos en determinados puntos de la red de infraestructura terrestre
(carreteras, viarios,), consiste en la utilizacin de ciertos datos de posicin de telfonos
mviles, los cuales son conocidos por los operadores mviles para su correcta administracin de
servicios. Estos terminales no tienen una posicin fija sino que pueden moverse libremente.
Esto obliga a los operadores a disponer de mecanismos para realizar un seguimiento de sus
usuarios y as proporcionarles los servicios contratados lo ms rpido posible y con menor coste
de sealizacin.
La idea fundamental reside en que si a bordo de un vehculo hay un telfono encendido, dicho
vehculo puede ser considerado como un sonda. Segn el informe presentado en Enero de
2009 por la CMT el nmero de abonados de telefona mvil en Espaa supera ya el 100 % de la
poblacin total. En la Unin Europea, la media se sita en torno al 90% (CDB, 2006), siendo
esta tendencia similar en la mayora de pases del mundo desarrollado. Dicho crecimiento se
refleja en nuestros hbitos ya que el telfono mvil se convierte en un elemento indispensable
en nuestra vida diaria. Este hecho hace pensar que los terminales mviles pueden convertirse en
posibles sondas de nuestra movilidad puesto que nos acompaan a lo largo de todo el da.
No resulta extrao que cada vehculo lleve a bordo un telfono mvil, propiedad de su
conductor o del resto de sus ocupantes. La propia gestin de movilidad que poseen las redes de
telefona celular ofrece una estimacin de la posicin de sus abonados, referida a la zona que les
proporciona cobertura. De modo que la posicin de un vehculo puede ser monitorizada
mediante el anlisis de los registros de posicin que el telfono que lleva a bordo enva al
sistema. El tratamiento de estos datos, sin la necesidad de revelar informacin confidencial de
sus abonados, permitir determinar ciertos datos relativos al desplazamiento de vehculos
mediante los telfonos que se lleven a bordo.
El objetivo final es presentar las nuevas tecnologas como una alternativa viable para su uso en
los estudios de movilidad de transporte, para lo cual ser necesario desarrollar:
1.4 ANTECEDENTES
La idea de la utilizacin de mviles para monitorizar las condiciones del trfico rodado no es
nueva. La aparicin de legislaciones en diferentes pases que exigieron precisin en la
localizacin de llamadas de emergencias (E112, Europa 2002/22/EC) propici una exhaustiva
investigacin sobre nuevas tcnicas que mejoraran los datos de posicin proporcionados por los
operadores. Como consecuencia de estos trabajos, surgieron nuevas aplicaciones relacionadas
con la informacin de posicin (LBS), muchas de ellas enfocadas al sector del Transporte. Esta
Captulo 1: INTRODUCCIN
Captulo 1: INTRODUCCIN
de facturacin, incluso existen proyectos que desarrollan un software propio para captura de
sealizacin de los telfonos mviles. A continuacin se enumeran una serie de proyectos
relacionados con la materia. Todos focalizan su atencin en el uso de los datos de localizacin
asociados a telfonos mviles para obtener informacin sobre desplazamientos de vehculos,
respetando en todo momento la privacidad del abonado mvil.
Uno de los ms recientes es el desarrollado por el SENSEable City Laboratory del MIT con
estudios realizados en diferentes ciudades del mundo como Graz (Austria), Miln o Roma
(Italia). En el desarrollado en Graz se consigui mapear una ciudad en tiempo real, siguiendo a
miles de personas que se desplazaban por la ciudad con sus telfonos mviles encendidos (Ratti
et al., 2005). Esto fue posible gracias a la colaboracin del operador austriaco A1/Mobilkom
que entreg datos annimos de los telfonos para permitir a los investigadores del MIT
desarrollar el proyecto Mobile Landscapes. Con ello, se crearon mapas digitales del uso de los
terminales en el rea metropolitana de Graz, visualizando la dinmica total de la ciudad en
tiempo real. Los investigadores cruzaron tres tipos de datos cedidos por el operador: la densidad
de las llamadas (medida en Erlang), los orgenes y destinos de stas (a travs de handovers), y
las posiciones de usuarios muestreados a intervalos regulares. La misma metodologa se aplic a
la ciudad de Miln, obteniendo resultados similares (Ratti et al., 2006).
Otro estudio desarrollado por el SENSEable City Laboratory fue en la ciudad de Roma, aunque
ste estuvo enfocado a cuestiones de dinmica social de una ciudad, tales como relaciones entre
hbitos telefnicos y tipos de actividad asociadas al terreno (reas residenciales, comerciales,
zonas tursticas,). El proyecto Real Time Rome utiliz diferentes tipos de datos procedentes
de telfonos mviles. Uno de ellos fue una medida de uso de ancho de banda de la red,
recogidos a nivel de antena (Erlangs). Los otros se correspondan con datos de posicin y
trayectoria de usuarios llamantes obtenidos mediante la plataforma Lochness del operador
Telecom Italia. La investigacin se centr principalmente en revelar la similitud entre zonas
urbanas basndose en patrones del uso de la red mvil. Agrupando reas con actividad
telefnica similar se clasificaba la ciudad en zonas, de modo que dichas zonas eran comparadas
con otras definidas segn el tipo de actividad que se desarrollaba en el rea (comercial,
residencial, turstica). Para ello, se dividi la ciudad en pxeles y utiliz esos datos de uso de
la red para promediar valores de Erlang que caracterizaban cada pxel (Reades et al., 2007).
Segn los valores que tomaba dicha magnitud en cada pxel y aplicando el algoritmo de
agrupacin K-Means, se obtenan clusters que representaban caractersticas espacio-temporales
de la ciudad en funcin del uso del telfono mvil, por ejemplo, se obtenan diferentes clusters a
primera hora de la maana debido a desplazamientos asociados a la jornada laboral que a ltima
hora de la tarde de un fin de semana, donde los cluster estn asociados a actividades de ocio. Por
10
tanto, el proyecto revel patrones de movilidad diarios segn los hbitos telefnicos de los
habitantes de una ciudad.
En Europa, se ha desarrollado un sistema de informacin sobre trfico denominado MTS
(Mobile Traffic Services). MTS utiliza la informacin de la red GSM sobre el desplazamiento
de los telfonos mviles (presentes en los vehculos) para monitorizar el trfico y as ayudar a
las autoridades a gestionar el flujo de vehculos por vas y/o posibles congestiones. El piloto se
ha realizado en la provincia de NoordBrabant en Holanda, en colaboracin con LogicaCMG,
Vodafone y el gobierno local (MTS, 2003). El software base fue desarrollado por Applied
Generics, una empresa que proporciona soluciones avanzadas de localizacin de mviles e
informacin de trfico a los operadores, cuyo producto RoDIN24 monitoriza una red de
telefona mvil para adquirir localizaciones annimas en tiempo real de gran cantidad de
telfonos, muchos de los cuales estarn dentro de un vehculo.
En la regin de Flandes, el operador de telefona belga PROXIMUS y la sociedad britnica ITIS
Holdings han desarrollado tambin un proyecto piloto que utiliza estas tcnicas para el control
de trfico en carreteras a travs de las posiciones de telfonos mviles en los vehculos en
movimiento. ITIS recibe del operador PROXIMUS el nmero de mviles conectados a cada
estacin base, sin revelar informacin confidencial de sus abonados, con objetivo de poder
determinar, entre otros datos, la velocidad de desplazamiento de cada telfono celular entre una
antena y la siguiente (ITIS Holdings, 2004).
En 1999, TRL (Transport Research Laboratory) particip en un proyecto de actualizacin de
matrices origendestino con datos de telefona mvil en el Reino Unido. La investigacin
encontr que era posible obtener informacin de matrices origendestino mediante la
localizacin de telfonos mviles, junto con otras medidas de informacin de trfico tales como
tiempos y velocidades del viaje. TRL desarroll un algoritmo para analizar los datos annimos
de telfonos procedentes de facturacin, proporcionados por el operador BTCellnet
(actualmente O2) y convertirlos en informacin asociada a trfico (White y Gower, 1999; White
y Wells, 2002).
Otro proyecto europeo que ha desarrollado esta tcnica es STRIP (System for Traffic
Information and Positioning), el cual investig y valid el uso de la posicin de un telfono
mvil para la estimacin de tiempos de viaje (Ygnace, 2001). El proyecto fue realizado bajo el
programa SERTI (Southern European Road Thelematics Implementation), en colaboracin con
el gobierno francs y el operador de telefona SFR (Cegetel Group). Para la obtencin de datos
de telfonos se us el mtodo de localizacin conocido como Abis Probing, que monitoriza la
Captulo 1: INTRODUCCIN
11
informacin de sealizacin enviada por los interfaces radio Abis y A. STRIP se dividi en dos
subsistemas base: uno de captura de datos que recoga mensajes de telfonos mviles en tiempo
real y calculaba su localizacin; y otro de procesamiento y presentacin que calculaba tiempos
de viaje en secciones de va, indicando la direccin de movimiento y mostrando la posicin de
las llamadas.
En 2002, Finnra (Finnish Road Administration) y el operador de telefona mvil Radiolinja
desarrollaron un sistema donde se capturaron los datos de un conjunto de telfonos (encendidos)
en un cierto tramo para proporcionar estimaciones de tiempos de viaje (Kummala, 2002,
Virtanen, 2002). Teniendo en cuenta que cada terminal intercambia informacin peridicamente
con las estaciones base ms cercanas, el anlisis del tiempo que llevaban los telfonos
comunicndose con estaciones bases permiti estimar tiempos de viaje. A fin de validar la
tcnica, estas estimaciones se compararon con otras obtenidas mediante identificacin de
matrcula LPR (License Plate Recognition), mostrando esta nueva alternativa resultados ms
exactos cuando se analizaba el trfico en tramos largos (aproximadamente de 10 km) donde la
entrada, salida o parada de vehculos es poco frecuente. Junto con ello, se observ que el nuevo
sistema no se vea afectado por condiciones atmosfricas adversas, como s ocurra con los
sistemas de LPR. Respecto a la privacidad de los datos, el cifrado de las identidades de los
telfonos impeda que fuera posible conocer qu telfono realizaba cada viaje detectado; no
obstante, tampoco se almacenaba ninguno de los datos despus de ser utilizados.
En Alemania, Vodafone (dentro del programa ESGI 2004) propuso ofrecer ciertos servicios de
informacin de trfico por carretera a sus clientes de telefona mvil. Para ello, se plante
generar datos de flujo y velocidad de vehculos usando informacin de sealizacin que ya est
disponible de las operaciones estndar de su red de telefona mvil. En dicho proyecto se
investig la viabilidad del uso del handover para generar informacin de trfico, analizando
datos recogidos entre Julio y Septiembre del 2003 (previamente procesados por Vodafone)
sobre una autopista en Alemania. Un handover se produce cuando un telfono con una llamada
activa se mueve de una celda a otra y la llamada es transferida desde la antena servidora a la que
gestiona la nueva celda, sin interrumpirse la comunicacin. Entonces, la captura de informacin
annima asociada a cada una de esas llamadas traspasadas (como celdas implicadas, instante y
duracin del handover, junto con algn otro tipo de informacin de sealizacin) permiti que
fuera posible calcular datos como velocidad o flujo a travs de los handover efectuados entre
celdas, asociando previamente carreteras a cada una de las celdas y realizando clculos
oportunos de ubicacin de fronteras de dichas celdas (Smith Institute, 2006).
12
Pero no slo en Europa se estn desarrollando proyectos relacionados con esta tcnica, la
empresa israelita Decell Ltd. tiene desarrollado un producto denominado AutoRoute1, el cual
lleva a cabo un muestreo peridico y aleatorio de telfonos mviles que viajan a bordo de
vehculos en movimiento en una determinada zona. Segn estas muestras de mviles registrados
en una red sobre un lugar concreto, se estiman ciertos parmetros de trfico (como velocidad,
densidad o flujos) para cada tramo de la carretera (DecellAutoroute, 2006). Este sistema
convierte datos que constantemente son generados dentro de una red mvil en informacin
precisa y en tiempo real de trfico por una carretera. Adems provee a los conductores de rutas
recomendadas que corresponden al tiempo de recorrido previsto para alcanzar un destino
concreto segn la ubicacin estimada. Los conductores pueden tambin recibir alarmas
instantneas sobre incidencias relevantes de trfico tales como accidentes, obras, etc.
AutoRoute1 genera informacin en tiempo real de trfico mientras se respeta la privacidad y
anonimato de sus abonados mviles. Ello se asegura teniendo en cuenta que toda la informacin
de localizacin es almacenada y procesada dentro del servidor AutoRoute1, el cual fsicamente
se establece dentro del entorno del operador. De forma que, al igual que pasa con informacin
de facturacin, estos datos no pueden emitirse al exterior y son inaccesibles a cualquier persona
fuera de la organizacin del operador.
En EE.UU. existen diferentes proyectos relacionados con esta tcnica. La mayora de ellos estn
desarrollados por los Departamentos de Transporte de diferentes estados junto con la
colaboracin de empresas y operadores de telefona. Uno de ellos es el que desarroll VDOT
(Virginia Department of Transportation) junto con AirSage para demostrar la viabilidad del
empleo de datos de telfonos para la vigilancia del trfico (VDOT, 2005). Para ello, AirSage
elabor un software que recopilaba informacin de sealizacin asociada a localizacin enviada
automticamente por telfonos que estn simplemente encendidos o en llamada para controlar
su movimiento (Airsage, 2007). Esa informacin permita conocer la posicin de telfonos
annimos en ciertos instantes la cual, una vez procesada y representada sobre un mapa,
mostraba la velocidad con la que fluctuaba el trfico en cualquier carretera dada por la que
existieran vehculos con telfonos a bordo.
Otro proyecto americano fue el desarrollado en Maryland por Delcan Corp. junto con ITIS
Holdings el cual construa un mapa en tiempo real del trfico a lo largo de sus principales
carreteras usando los movimientos de telfonos (Delcan, 2005). Este proyecto tena como
objetivo principal el conocer el estado del trfico en ciertas vas para enfocarlo a la deteccin de
eventos, tales como congestin o accidentes, sin necesidad de usar sensores, cmaras u otros
elementos que requieren de instalacin adicional de nuevos equipos sobre el terreno. En lugar
Captulo 1: INTRODUCCIN
13
de estos elementos se utilizaron los telfonos mviles, propiedad de los conductores, como
sondas annimas. De esta manera se logra obtener informacin sobre cualquier punto de la red
viaria en el que existan telfonos, ya que los operadores conocen aproximaciones de las
localizaciones de sus abonados en trminos de antena (celda) a la que deben encaminar las
llamadas. La informacin tomada de los mviles se trat annimamente, evitando la posibilidad
de rastreo de personas concretas en su movimiento hacia un destino. Dicha informacin
perteneca tanto a seales radio que los telfonos envan a las estaciones base como a seales
derivadas del proceso de movimiento de telfonos con llamada activa de una estacin base
(antena) a otra, denominado handover. Entonces, conociendo esa informacin junto con los
mapas de carreteras se poda conocer la ubicacin aproximada de los telfonos y cmo de
rpido se estaban moviendo.
Estos son algunos de los proyectos desarrollados en los ltimos aos. Todos ellos centran su
atencin en un objetivo comn, el uso de los datos de localizacin de telfonos mviles, los
cuales son ya conocidos por los operadores, para obtener informacin sobre desplazamientos de
vehculos. La mayora de ellos se han desarrollado con la colaboracin de operadores mviles
sin necesidad de vulnerar los derechos de intimidad de sus abonados. No obstante, la principal
barrera a superar para la implantacin completa de esta alternativa consistir en el
establecimiento de acuerdos con los operadores para la utilizacin de los sistemas de telefona
mvil en aplicaciones de valor aadido como son la gestin del trfico y su planificacin. Estos
acuerdos pueden verse favorecidos cuando los operadores descubran el rendimiento econmico
real del uso de sus sistemas para este tipo de servicios enfocados al trfico, sin afectar a su
funcionamiento.
14
Captulo 1: INTRODUCCIN
15
modo que es posible realizar una comparacin del algoritmo propuesto frente a otros que
utilizan aforos a nivel de arco.
Finalmente, en el Captulo 6 se agrupan las conclusiones y se sugieren posibles lneas para
futuras investigaciones.
16
CAPTULO 2
REDES DE TELEFONA CELULAR: GSM
2.1 INTRODUCCIN
Las redes telefnicas mviles surgieron como un nuevo servicio que facilitaba la comunicacin
entre usuarios sin requerir una conexin permanente (fija) con la red, de forma que el usuario
consegua una ms amplia libertad de movimiento, pudiendo acceder, va radio, a centrales de
conmutacin a travs de estaciones base radioelctricas distribuidas por la zona de servicio.
Como consecuencia, un usuario que va a realizar una llamada accede a la red a travs de la
estacin que gestione la zona de cobertura en la que se encuentre. Por otro lado, cuando se
recibe una llamada, la red debe conocer, en todo momento, dnde est el usuario destinatario de
la llamada para que sta pueda ser encaminada correctamente. Por ello debe realizar un
seguimiento de forma automtica que permita encontrar la estacin base (celda) que da servicio
a cada telfono con el menor retraso posible. Bajo este razonamiento, un telfono mvil que est
encendido, independientemente de que est haciendo uso de la red (llamada, sms, etc.),
puntualmente informa a la red de su posicin actual en trminos de la zona de cobertura en la
que se encuentra. Este hecho permite que un sistema de telefona mvil tenga continuamente
localizados a sus abonados para proporcionar los servicios contratados lo ms rpido posible y
con el menor coste de sealizacin.
A esta propiedad de la red se le llama localizacin, la cual debe ser dinmica, ya que, por
definicin, el usuario puede moverse por la red, y debe actualizarse en funcin del
desplazamiento y del tiempo. Asimismo, como consecuencia de esa movilidad, un usuario
puede cambiar de zona de cobertura de las estaciones base de la red. En esos casos, debe
asegurarse la continuidad de las llamadas en curso de forma automtica, para lo cual existe la
operacin de traspaso de llamadas o handover.
El dinamismo caracterstico de la vida moderna est modificando el estilo de vida tanto a nivel
individual como colectivo de la sociedad actual. Como consecuencia, surge la necesidad de
18
soluciones cada vez ms avanzadas que permitan la comunicacin entre personas mientras stas
se estn desplazando por la red. Este hecho fomenta que los sistemas de telefona mvil estn
experimentando un rpido crecimiento, especialmente impulsado por la caracterstica de
permitir establecer cualquier tipo de comunicacin con la red (llamadas, sms, acceso a
Internet), independientemente de la posicin y movimiento del terminal. Para garantizar esta
movilidad de los abonados manteniendo la calidad de los servicios, una red de telefona dispone
de un sistema completo con funciones de acceso, transmisin, conmutacin y sealizacin, que
proporcionan servicios de telecomunicacin a usuarios a travs de acceso va radio.
En los siguientes apartados se presentan conceptos bsicos relacionados con los sistemas de
telefona mvil, revisando su arquitectura de red y sus principales elementos. Adems se
introducen nociones bsicas respecto a la planificacin y dimensionado de la red, describiendo
las principales funcionalidades asociadas a la gestin de movilidad a fin de comprender mejor
cmo puede ayudar la telefona mvil en la inferencia de parmetros asociados al trfico. Para
su elaboracin se ha utilizado la siguiente bibliografa: Gibson (1999), Hernando Rbanos
(2002), Huidobro (2002), Sallent et al. (2003), Rappaport (2002) y Ilyas y Mahgoub (2005).
2.2
En lo que se refiere a la estructura bsica del sistema GSM, ste se organiza como una red de
estaciones base radioelctricas que proporcionan cobertura completa al rea de servicio. Cada
estacin base (BTS) tiene asociada una zona de cobertura, denominada celda, que opera en un
conjunto de canales de radio diferentes a los usados en las celdas adyacentes y que se
encuentran distribuidas segn un plan celular. Un grupo de BTSs se encuentra conectado a un
controlador (BSC), encargado de aspectos como el handover (traspaso de llamada de una
estacin base a otra) o el control de potencia de las BTSs y de los mviles. En consecuencia, el
BSC se encarga del manejo de toda la red de radio y supone una autntica novedad respecto a
los anteriores sistemas celulares.
Una o varias BSCs se conectan a una central de conmutacin de mviles (MSC). ste es el
corazn del GSM como responsable de la inicializacin, enrutamiento, control y finalizacin de
las llamadas, as como de la informacin sobre la tarificacin. Es tambin el interfaz entre
diversas redes GSM o entre una de ellas y las redes pblicas de telefona o datos. La
informacin referente a los abonados se encuentra almacenada en dos bases de datos que se
conocen como registro de posiciones base (HLR) y registro de posiciones de visitantes (VLR).
19
Los diferentes elementos que constituyen una red de telefona celular GSM se clasifican en
cuatro grupos fundamentales:
1.
MS (Mobile Station).
ME (Mobile Equipment).
SIM (Subscriber Identity Module).
2.
3.
4.
20
Es el dispositivo mvil y se identifica dentro de cualquier red GSM por el International Mobile
Equipment Identity (IMEI). El IMEI es un nmero de 15 cifras y tiene la siguiente estructura:
IMEI = TAC / FAC / SNR / sp donde:
TAC = Type Approval Code (6 CIFRAS).
FAC = Final Assembly Code, identifica al fabricante (2 cifras).
SNR = Serial Number (6 cifras).
sp = Cifra suplementaria de reserva (1 cifra).
Los equipos tienen la peculiaridad de variar la potencia de emisin de seal sobre la celda en la
que se encuentren con el objetivo de poder mantener en todo momento el nivel de potencia de
transmisin ptimo, limitando interferencias cocanal inducidas sobre celdas adyacentes y
reduciendo el consumo. Esta potencia de emisin es caracterstica del mvil, de manera que su
nivel de potencia mximo es importante dado que implica un aumento de la capacidad del
terminal para poder alejarse de la estacin base y poder seguir disfrutando del servicio.
La SIM es una pequea tarjeta inteligente dotada de memoria y microprocesador que sirve para
identificar al abonado. Esta tarjeta se inserta en el interior del mvil y permite al usuario acceder
a todos los servicios disponibles por parte de su operador. Sin la tarjeta SIM, el terminal no
tiene utilidad porque no puede hacer uso de la red. Puesto que la tarjeta SIM permite identificar
al abonado independientemente del terminal usado, se proporciona al usuario la posibilidad de
continuar recibiendo y efectuando llamadas y utilizar todos los servicios que tiene contratados
insertando la tarjeta SIM en otro terminal.
La SIM est protegida por un nmero de cuatro dgitos que recibe el nombre de PIN (Personal
Identification Number). Una vez que se introduce el PIN en el terminal, ste activa el proceso de
bsqueda de las redes GSM que estn disponibles para intentar validarse en ellas. Una vez que
la red valida el terminal, el telfono queda registrado en la celda que lo ha validado. Es
importante destacar que la red que valida el terminal es la que se tiene contratada.
21
La tarjeta SIM contiene el IMSI (International Mobile Subscriber Identity), usado para
identificar y validar al abonado en cualquier sistema GSM. Adems, contiene los
procedimientos de criptografa para la confidencialidad de la informacin del usuario o las
memorias del telfono (alfanumricas o para mensajes de texto, SMS).
2. Subsistema de estaciones base (Base Station Subsystem, BSS): Sirve para conectar a las
estaciones mviles con los NSS (Network SubSystem), adems de ser los encargados de la
transmisin y recepcin. Constan de dos elementos diferenciados: la estacin base o BTS (Base
Transceiver Station) y la BSC (Base Station Controller).
La BTS alberga todos los receptores/transmisores que dan servicio a una celda, los cuales estn
encargados de recibir y enviar informacin al canal radio, abasteciendo una interfaz fsica entre
la estacin mvil y la BSC. Las antenas usadas en cada celda de la red pueden estar situadas en
el centro de la celda (omnidireccional) o directivas (sectores de 120). Normalmente la potencia
de transmisin determina el tamao de la celda.
22
Gateway Mobile Services Switching Center (GMSC): Es una MSC que adems es
utilizada para dirigir hacia la red mvil las llamadas originadas en la red fija. De modo
que acta como dispositivo pasarela que se encarga de servir de mediador entre las
redes de telefona fijas y las mviles, haciendo que los protocolos de comunicaciones
que existen en ambas redes se entiendan. Esta central se encarga de interrogar al HLR
adecuado para conocer la posicin del mvil al que va dirigida la llamada para,
posteriormente, encaminar la llamada hacia la MSC correspondiente.
Home Location Registrer (HLR): Es una base de datos que contiene informacin sobre
los usuarios conectados a un determinado MSC. Analiza informacin relativa a los
niveles de suscripcin, servicios suplementarios y localizacin actual o ms reciente de
los mviles que pertenecen a la red local de ese MSC. El HRL funciona conjuntamente
con el VLR.
23
Acceso remoto a todos los elementos que componen la red GSM (BSS, MSC,
VLR, HLR, EIR y AuC).
Gestin de las alarmas y del estado del sistema con posibilidad de efectuar
varios tipos de pruebas para analizar las prestaciones y verificar el correcto
funcionamiento del mismo.
Recogida de todos los datos relativos al trfico de los abonados necesarios para
la facturacin.
En redes de telefona de grandes dimensiones pueden existir ms de una OMC. En este caso
existir un OMC general desde el que es posible controlarlo todo (OMCN) y otros OMC
limitados al control de algunas zonas (OMCR).
2.3
2.3.1 Introduccin
En los sistemas de telefona mvil, dado que los terminales pueden moverse libremente por la
red, es necesario realizar un seguimiento automtico de los mismos para poder encontrar la
celda donde se encuentra con el menor retardo posible, lo cual es fundamental, por ejemplo, en
el caso de una llamada entrante. Para lograrlo se emplea una base de datos jerrquica de dos
niveles formados por el HLR y varios VLRs. Dada la importancia de estas bases de datos para
las funciones de movilidad implementadas en las redes de telefona mvil, a continuacin se
describe con ms detalle aspectos significativos relacionados con estas bases de datos.
24
Datos permanentes, entre los que figuran la identificacin del abonado (IMSI y
MSISDN), informacin relativa a teleservicios, servicios portadores y servicios
suplementarios (con sus parmetros) contratados, junto a limitaciones de
servicio.
El HLR, como todas las bases de datos de la red, est implementado en una estacin de trabajo
cuyas prestaciones (memoria, procesadores, capacidad de los discos) son actualizables cuando
crece el nmero de abonados. Asociado al HLR trabaja el centro de autentificacin (AuC), que
contiene la informacin por la que se comprueba la autenticidad de las llamadas con el fin de
evitar los posibles fraudes, la utilizacin de tarjetas de abonado (SIMs) robadas o el disfrute del
servicio por parte de impagados.
25
Esta base de datos dispone tambin de informacin relativa a si el abonado se encuentra activo o
no, lo que evita el uso improductivo de la red (envo de seales a un terminal desconectado).
2.4
26
MCC
MSIN
MNC
NMSI
IMSI
Mobile Country Code (MCC): tres dgitos que identifican el pas de domicilio del
abonado mvil (Ej.: 214 para Espaa).
ii)
Mobile Network Code (MNC): dos dgitos para usos GSM. EL MNC identifica al
operador (GSM/PLMN) dentro del pas del abonado mvil (Ej.: 01 para Vodafone).
iii)
MCC
MNC
LAC
27
MCC
MNC
LAC
CI
2.5
Puesto que el mbito geogrfico de cobertura puede ser muy grande, se introduce el concepto de
rea de localizacin (LA), que consiste en una zona geogrfica cubierta por una agrupacin de
celdas, siendo una celda la zona en la cual una estacin base proporciona los servicios.
La forma de las celdas usada en la planificacin radio depende del tipo de antena y de la
potencia emitida por cada estacin base. En los modelos de planificacin, las coberturas de
estaciones base se idealizan mediante hexgonos que recubren el plano sin superposicin.
Normalmente se usan dos tipos de antenas, las de diagrama horizontal omnidireccional y las
directivas.
Si se usan antenas omnidireccionales, idealmente el rea de cobertura ser circular, y se utiliza
un crculo para modelar dicha rea. En un contexto real, si se pretende cubrir una determinada
zona con antenas omnidireccionales (crculos), se producir solapamiento entre ellos, lo cual es
28
poco eficiente desde el punto de vista de uso del espectro pues en la zona de superposicin se
atendera el trfico con ms frecuencias de las necesarias. Por otro lado, para reducir la
interferencia y obtener mayor ganancia que favorezca la comunicacin en entornos de cobertura
difcil, como son los de naturaleza urbana e interiores de edificios, se utilizan las antenas
directivas. En este caso, en cada emplazamiento se disponen tres antenas con diagramas de
radiacin horizontal que abarcan 120, como se ve en la Figura 2-6.
Como se ha comentado en lneas anteriores, idealmente, las superficies cubiertas por cada
antena se asimilan a hexgonos, y se les suele llamar sectores. Cada sector tiene sus propias
frecuencias y es servido por sus propios transmisores, de forma que los sectores son celdas pero
iluminadas desde un vrtice. Esta disposicin reduce la interferencia producida ya que las
antenas directivas radian muy poca potencia hacia atrs y en direcciones separadas
angularmente, por lo que la interferencia ser pequea en esas direcciones.
Con la incorporacin de los sistemas de telefona de generaciones ms avanzadas (2.5G/3G),
surgen nuevos y ms completos servicios a proporcionar a los abonados. Los sistemas mviles
GSM, GPRS y UMTS comparten una estructura de red para la conmutacin de paquetes
sustancialmente equivalente, ya que UMTS hereda la arquitectura creada para GSM y GPRS.
No obstante, los nuevos servicios ofrecidos implica la incorporacin de nuevos elementos en la
red para lograr una optimizacin en la localizacin de los terminales en los diferentes servicios
existentes. Al igual que ocurre para servicios de voz, estas redes deben mantener actualizada la
informacin sobre la posicin de cada telfono para conocer hacia dnde enrutar los paquetes de
datos que le llegan. En esos casos, se precisa conocer con mayor exactitud el conjunto de celdas
sobre el que difundir el mensaje de aviso a un terminal para el envo de paquetes de datos. Con
objeto de obtener una solucin de compromiso entre el trfico de sealizacin debido a avisos y
el originado por actualizaciones de posicin, adicionalmente a la jerarqua de celda y rea de
localizacin, aparecen otros niveles como son el RA (Routing Area). Un RA se define como un
29
30
a la red, debe existir un proceso automtico y transparente que mantenga a la red informada de
las ubicacin de sus terminales a nivel de LA.
Para conseguirlo aparece el proceso Location Update (LU), el cual implica un intercambio de
mensajes de sealizacin entre el terminal y la red, y el posterior registro en las bases de datos
para actualizarlas con arreglo a esos mensajes. La frecuencia de ejecucin del proceso de LU
depende del estado del telfono. Cuando el telfono est encendido y desocupado (IDLE), basta
que la red conozca el LA donde se encuentra para alertarle en caso de una llamada entrante. Por
tanto, el telfono puede moverse por las distintas celdas del LA sin necesidad de actualizar su
posicin. En este caso, los eventos que lanzan el proceso LU para actualizar la posicin son los
siguientes. i) Cuando el terminal mvil se enciende y se conecta a la red, se registra en el LA en
el que se encuentre. ii) Por otro lado, la movilidad del terminal puede provocar un cambio de
posicin que suponga la entrada en un rea de localizacin diferente. Mediante un anlisis de la
sealizacin enviada por canales de broadcast se conoce el LA en el que se encuentra un
terminal. De ese modo, es posible detectar la entrada en un nuevo rea, comparando el nuevo
valor recibido con el anterior valor de LA almacenado de modo que, si ha cambiado se ejecuta
el Location Area Update. iii) Asimismo, si el telfono no tiene ningn tipo de actividad existe
un mecanismo peridico que lanza reportes automticos a la red con la ltima posicin
almacenada por el telfono. Por ello, cada vez que finaliza un temporizador, se obliga a realizar
un registro peridico para notificar su presencia en la red aunque se encuentre en el mismo LA.
Este conjunto de procesos permite que la red conozca continuamente la ubicacin del terminal
en trminos de rea de localizacin.
Para gestionar la movilidad en sistemas de telefona de generaciones ms avanzadas (2.5G/3G),
entre otros procedimientos, existe una actualizacin a nivel de RA. De este modo, cuando el
terminal detecta que ha entrado en un nuevo RA, comparando el identificador de rea de
enrutamiento (RAI) que tiene almacenado con el RAI recibido va radio, se inicia
automticamente un proceso para la actualizacin correspondiente.
31
identificador del terminal al que se debe entregar la llamada. Finalmente todos los terminales
analizan este mensaje y responde solamente el terminal buscado. En ese momento ya se puede
establecer el canal necesario para cursar la llamada puesto que se conoce la estacin base
(celda) que dara servicio al telfono.
32
Desde el punto de vista operativo, el handover tiene 3 etapas: medida, toma de decisin y
ejecucin. Por ello, durante el handover se produce un intercambio de informacin de
sealizacin entre el terminal y centrales de la red (como son las BTS, BSC, MSC). Como
resultado, se toma la decisin de hacer o no el handover. La decisin la toma siempre la BSC
que se ocupa del abonado en ese momento. Si la decisin es negativa, se mantiene la
comunicacin con la estacin base actual (misma celda). En caso de que se deba ejecutar el
handover, se produce un intercambio de informacin con la red, derivndose ciertos parmetros
asociados a cada una de esas llamadas traspasadas (como celdas implicadas, instante y duracin
del handover, junto con algn otro tipo de informacin de sealizacin).
En el caso de GSM, el handover consiste en una transferencia de recursos que implica la
interrupcin del enlace actual y la creacin de uno nuevo. Esto se debe fundamentalmente a que
las estaciones base vecinas utilizan portadoras y/o bases de tiempo distintas y los terminales no
son capaces de conectarse simultneamente a ambas. En esos casos, denominado Hard
Handover, el terminal se desconecta de su estacin base origen y durante un tiempo (del orden
de milisegundos) no est conectada a ninguna otra estacin base. Esto provoca una interrupcin
de la seal vocal apenas perceptible por el abonado. Sin embargo, esta situacin no es aplicable
a comunicaciones de datos (2.5G/3G), donde una interrupcin de ese tipo se traduce en prdida
de los datos, dado que la red no est preparada para estos cortes. Por ello existe otro tipo de
handover, denominado SoftHandover, durante el cual el terminal estar conectado a la estacin
base origen mediante un canal y a la estacin base destino mediante otro. As pues, la
transmisin se realiza en paralelo por los dos canales, es decir, no se produce interrupcin del
enlace. Este es el esquema utilizado en redes ms avanzadas.
33
34
estaciones base (BTS) o centrales (MSC). Este modelo caracteriza la dependencia temporal y
espacial de la distribucin de trfico de llamadas mediante el trfico ofrecido A1 en una celda.
Este ltimo modelo es muy utilizado a la hora de determinar la ubicacin de los principales
componentes en una red mvil (BTS, MSC,). Estos componentes deben estar dimensionados
para soportar un trfico prximo al previsto a fin de aumentar la eficiencia del sistema. En
cambio, debido a su capacidad para describir la dependencia temporal del comportamiento de
los usuarios en detalle, el modelo de movilidad es el ms extendido para la caracterizacin del
trfico en cada celda particular.
A continuacin se presenta un modelo de trfico, simplificado pero bastante general, cuyo
planteamiento est basado en la teora de trfico telefnico usando el citado modelo de
movilidad. El modelo se encarga de estudiar el dimensionamiento y la gestin de los recursos
que se ponen a disposicin de un sistema de telecomunicacin, en este caso, de telefona mvil,
para optimizar tanto su rentabilidad como la calidad de servicio ofrecida por celda.
En el contexto de las redes mviles 2G, como GSM, el concepto de capacidad queda fcilmente
definido en la medida en que hay bsicamente trfico de voz en la red. En cambio, en el marco
de los sistemas 2,5G y 3G, en los que se plantea un entorno multiservicio con requerimientos de
calidad de servicio muy diversos, el concepto de capacidad de la red debe entenderse de forma
ms amplia y su estimacin no resulta tan inmediata como en el entorno slo de voz. En base al
razonamiento anterior y dado que el estudio se centra en redes GSM, el modelo est referido
nicamente al trfico telefnico de voz, por ser el trfico dominante en GSM. Asimismo, el
modelo debe estar basado en pronsticos de demanda en funcin del tipo de zona, ya que el
trfico telefnico vara segn las caractersticas de los abonados y de la celda en cuestin.
En este modelo se considera que la llegada de llamadas puede modelarse mediante un proceso
de Poisson de tasa de llegada , de forma que la probabilidad de que en la hora de mayor
ocupacin (o BH) se produzcan n llamadas, se define como:
pn
e ( ) n
n!
(1)
El trfico A se cuantifica mediante la intensidad del trfico la cual se mide como intentos de llamadas por unidad de tiempo y
espacio (llamadas/segkm2) y teniendo en cuenta la media de duracin de llamadas E[tllamadasl], siendo A= E[tllamadasl] (en
Erlang/km2). Esta medida representa la cantidad de trfico que se ofrece en una zona determinada.
35
M L
3600
(2)
En los procesos de llegada de Poisson, el tiempo t comprendido entre dos intentos consecutivos
es una variable aleatoria continua que se modela mediante una distribucin exponencial
negativa, cuya densidad de probabilidad es: f (td ) e td , td 0 . El parmetro de la
distribucin es igual a 1/Tc, siendo Tc la duracin media de la ocupacin del recurso, es decir,
duracin media de la llamada. Entonces, la intensidad del trfico A ofrecido al recurso en
cuestin se define como:
A
(Erlang)
(3)
M L Tc
(Erlang).
3600
Esta expresin permite interpretar la intensidad de trfico como el tiempo medio total de
ocupacin de los recursos en la hora de mayor ocupacin, BH.
Con este parmetro de intensidad de trfico quedan expuestos los conceptos bsicos que ms
adelante sern usados en el mbito de la Tesis. Sin embargo, es necesario indicar que una
llamada generada en una celda determinada puede proceder de una llegada nueva o una llegada
de traspaso ya que una llamada puede concluir en la celda donde se origina o ser objeto de
traspaso a otra u otras celdas. Por tanto, en general, toda llamada puede descomponerse en dos:
las que se inician y concluyen en una misma celda y las que experimentan traspasos
(handovers). De modo que la tasa de llamadas entrantes del modelo de Poisson estar formada
por c y h, siendo stas las tasas de llegada de nuevas llamadas y las de traspasadas,
respectivamente. Estas tasas c y h definen sendos procesos de Poisson y estarn relacionadas
entre s. Esta relacin se demuestra utilizando la hiptesis de equilibrio de flujos de llamadas, en
la cual la tasa de llamadas que abandonan una celda coincide con las que llegan y vale h:
h ph [(1 pb )c (1 pbh )h ] h
ph (1 pb )c
1 ph (1 pbh )
(4)
36
h
ph (1 pb )
nh
c 1 ph (1 pbh )
(5)
CAPTULO 3
ESTADO DEL ARTE EN EL MBITO DE LA
ESTIMACIN DE PARMETROS DE
TRFICO MEDIANTE LA TELEFONA MVIL
3.1 INTRODUCCIN
El captulo anterior describe los conceptos bsicos y funcionalidades principales existentes en
los sistemas de telefona mvil para garantizar la movilidad de los abonados, manteniendo la
calidad de los servicios. Durante su ejecucin, estos procedimientos proporcionan informacin
sobre la localizacin de los usuarios que, tras el tratamiento oportuno, puede ser til para la
caracterizacin del trfico vehicular, con parmetros tales como velocidad, volumen o
movilidad origendestino, entre otros. En los siguientes apartados se hace una revisin
exhaustiva del EstadodelArte en el mbito de la estimacin de estos parmetros a partir de
la telefona mvil, describiendo mtodos usados en diferentes proyectos, tanto de simulacin
como pruebas piloto, existentes en el sector acadmico e industrial.
38
zonas que pudieran tener una relacin causal con los movimientos de transporte que se dan entre
ellas.
Estas matrices pueden ser elaboradas con diferentes niveles de agregacin, dependiendo del
grado de detalle que se desee (tamao de las zonas) o el tipo de informacin necesario: por
modo de transporte (vehculo privado, autobs), por bien transportado (personas,
mercancas). Las unidades empleadas para definir una matriz OD estn fuertemente
relacionadas con este nivel de agregacin. De este modo stas podran ser vehculos, personas,
mercancas, o incluso telfonos mviles.
En los sistemas de telefona existe una clasificacin de la zona de servicio en celdas y reas de
localizacin (LA), aunque adicionalmente existen las reas de enrutamiento (RA) para 2.5G y
3G. Segn lo visto en el Captulo 2, la red maneja una estimacin de posicin de un terminal
mientras est encendido dentro de su cobertura segn los diferentes estados: encendido y
desocupado (idle), o con comunicaciones activas (dedicated o active), incluso, en 2.5G/3G
existe un estado adicional en el cual el terminal se encuentra en espera de iniciar una
comunicacin en el contexto de paquetes una vez registrado en GPRS (standby). Si esto se
traslada al dominio de telfonos a bordo de vehculos en movimiento, un terminal que tenga
establecida una comunicacin con la red proporciona datos bastante continuos del recorrido: a
nivel de celdas por las que est circulando. Incluso si el terminal no est en uso sino
simplemente encendido, tambin ofrece datos vlidos del recorrido, puesto que continuamente
se conoce el LA en el que se encuentra. En este caso, aunque los datos de localicazin son
menos precisos y frecuentes, tambin permiten identificar viajes. Por ello, construir una matriz
OD mediante datos de localizacin de telfonos mviles exige definir el nivel de agregacin
que se desea conseguir, es decir, si las zonas de transporte sern las celdas o las LAs
existentes en la zona de servicio de la red de telefona existente en la regin bajo estudio.
Segn lo expuesto anteriormente, el nivel de agregacin de la matriz est directamente
relacionado con el tipo de datos de localizacin que la genere. Por ello, si se pretende obtener
una matriz de viajes entre celdas origendestino, se precisa conocer las celdas por las que los
telfonos transitan en todo momento. Esto es posible cuando se trata de datos asociados a
comunicaciones (llamadas) efectuadas por los telfonos. En estos casos, la muestra de datos
asociada es ms reducida que si se utilizara el conjunto de telfonos encendidos.
Sobre esta idea de matriz entre celdas OD se han presentado recientemente varios trabajos.
Tras aos de estudio, White y Wells (2002) publicaron los resultados de un proyecto
desarrollado conjuntamente por TRL (Transport Research Laboratory) y HA (Highways
39
40
41
42
reas (viajes intrazonales). En base al razonamiento anterior, ambas metodologas pueden ser
consideradas como vlidas para obtener una matriz previa para, posteriormente ajustarla con
otra informacin mediante mtodos tradicionales, pero no para ser usada directamente como
matriz de viajes fiable.
3.3 VOLUMEN
Se denomina volumen de trfico Q al nmero de vehculos que pasan por un punto o seccin
transversal de una va por unidad de tiempo. Las unidades ms usadas son la hora y el da,
definiendo el volumen horario [veh/h] y volume diario [veh/da], respectivamente. Las
distribuciones temporales de los volmenes de trfico se deben a diferentes estilos y forma de
vida, los cuales determinan patrones de viaje basados en el tiempo (ciertas pocas del ao, horas
especficas del da, etc.). Estos volmenes pueden ser entendidos como la utilizacin de la
vialidad por la demanda de transporte. De modo que los estudios de volmenes se realizan con
el propsito de obtener informacin sobre el movimiento de vehculos sobre puntos o secciones
especficas dentro de una red viaria, proporcionando una descripcin intuitiva del
comportamiento dinmico del trfico.
Para la medicin de esta magnitud suelen utilizarse los aforos. Un aforo mide la cantidad de
vehculos que transitan por un determinado punto o seccin del viario. Tradicionalmente, estos
aforos son un tipo de informacin que se recoge de forma automtica en un conjunto de puntos
asociados a tramos del viario. La medicin de este parmetro de trfico obliga por tanto a
instalar elementos adicionales en las vas (espiras, cmaras, etc). Este volumen de paso de
vehculos vara segn la movilidad de la poblacin, categora de la va, temporalidad, etc. Para
conocer de un modo preciso y continuo las caractersticas del trfico de vehculos que circula
por la red viaria sera necesario observar todas las vas de manera casi permanente, lo cual
implicara disponer de una infraestructura considerable de elementos medidores del aforo. As
pues, surge la necesidad de nuevos medios que permitan caracterizar el trfico de un modo
rpido, preciso y permanente, sin excesivo coste.
La telefona mvil constituye una alternativa real, plausible y competitiva para conseguir esta
informacin. En contraste con los sensores fijos, los telfonos mviles proporcionan
informacin respecto a comportamiento del trfico sobre cualquier zona donde exista cobertura
telefnica, sin necesidad de un despliegue adicional de infraestructura. En estos casos, el
volumen estara asociado al paso de telfonos por un determinado punto o zona de la red, en
lugar de vehculos. Para ello existen ciertos eventos y procesos en GSM relacionados con la
43
gestin de movilidad que permiten detectar el cambio de zonas, bien a nivel de celdas
(handover) o bien a nivel de reas de localizacin (proceso LU).
Analizando la topologa de la red junto con la distribucin de celdas y reas de localizacin es
posible asociar fronteras entre dichas zonas con secciones de va en las que es posible
monitorizar el paso de telfonos. En tales fronteras se considerar que existe una especie de
aforo virtual para la observacin del paso de entidades por las vas como hacen los aforos
tradicionales. Con ello, cada vez que un telfono cambie de celda durante una llamada
(handover) o cambie de LA mientras est encendido (proceso LU), se podr considerar que ha
pasado por alguna de las vas monitorizada por un aforo virtual localizado en la frontera
correspondiente. El nmero de vas que atraviesen la frontera, el cual determina la precisin de
la medida del aforo, depende de la extensin de la zona fronteriza. En el caso de un aforo
virtual que monitorice el paso de una celda a otra, el nmero de vas observadas suele ser
menor que en caso de uno que monitorice el paso de un rea de localizacin a otro puesto que
un LA comprende una extensin de terreno mayor formado por varias celdas.
En los ltimos aos se han publicado diferentes estudios relacionados con esta idea. Uno de
ellos es el desarrollado por Thiessenhusen et al. (2006) del DLR utilizando datos suministrados
por Vodafone. La investigacin utiliz el handover como evento para detectar el paso de
telfonos de un cierto operador por aforos virtuales ubicados en las fronteras entre dos celdas.
Durante un handover, se almacena una serie de parmetros asociados, como celdas implicadas o
instante en el que se produce. El anlisis de esos parmetros permiti detectar el trnsito por la
frontera correspondiente. Los resultados publicados mostraron cmo ese flujo de telfonos
(llamadas) est estrechamente relacionado con el flujo de vehculos medido por detectores
instalados sobre los mismos puntos en la red. En la Figura 3-1 se comparan ambos valores a lo
largo de un da. Se aprecia que existen los picos tpicos asociados a horas puntas tanto por la
maana como por la tarde, mostrando la influencia de los hbitos telefnicos (horarios tpicos
de llamadas) en los cambios de flujo de vehculos tpicos.
No obstante, con el uso del handover slo se monitoriza el paso de telfonos que tengan una
comunicacin activa (p.ej., llamada). De este modo, la muestra de terminales de las que se
obtienen datos es reducida e interesara ampliar su tamao a fin de conseguir una muestra ms
representativa del conjunto total de vehculos. Por ello, existe otra alternativa de monitorizacin
de trfico por una frontera pero, en este caso, a nivel de rea de localizacin.
6000
60
6000
60
4000
40
4000
40
2000
20
2000
20
flow (veh/h)
0
0
10
15
20
time (h)
flow (veh/h)
8000
counts/h
80
8000
80
counts/h
44
0
0
10
15
20
time (h)
Figura 3-1: Flujo (rojo) y nmero de llamadas de telfonos (verde) en funcin del tiempo.
Izquierda: northbound (desde ciudad), derecha: southbound (hacia ciudad). Todos los datos son
promediados sobre intervalos de 15 minutos. (Thiessenhusen et al., 2006)
El trabajo presentado por Caceres et al. (2007) utiliza este criterio. Para validar sus algoritmos,
no utiliz datos reales de un operador sino una herramienta conjunta que integraba un simulador
de trfico vehicular junto con un mdulo especfico para modelar la gestin de movilidad usada
en una red GSM sobre un conjunto de telfonos asociados a vehculos. Con ello se elaboraban
unas bases de datos HLR y VLR ficticias con registros de localizacin. Como ya se ha
comentado, cuando el telfono est simplemente encendido, el telfono notifica su nueva
posicin cuando entra en un nuevo LA (proceso LU), quedando reflejado el trnsito entre ese
par de LA. En su investigacin, se consider la existencia de aforos virtuales sobre secciones
de vas que coincidan con las fronteras entre reas de localizacin. Aunque, dado que el paso de
un LA a otro se efecta por una celda concreta del LA destino, y esa informacin de celda de
entrada es conocida (cuando se ejecuta el proceso de LU se indica tanto el LA como la celda
dentro de ese LA), realmente se observarn fronteras entre celdas de LA contiguos por los que
se va a efectuar el trnsito. En base a ello, el aforo virtual monitorizara el paso desde un LA a
otro por una celda concreta, logrando una resolucin a nivel de celda para la identificacin de la
va por la que circul el telfono (Figura 3-2).
45
Para validar esta idea se analizaron unas bases de datos generadas con simuladores buscando,
para cada telfono, los registros asociados a cambios de rea de localizacin. Conociendo ese
registro (instante de tiempo, nuevo LA y celda) junto con el LA anterior, y observando si
pertenece a una frontera de inters, se conocera el instante de paso por dicha frontera, se logr
computar el paso de un telfono por el aforo virtual correspondiente. Este flujo se corresponde
con telfonos encendidos de un nico operador, por lo que es extendido a un conjunto de
vehculos equivalente mediante algoritmos de ajuste apropiados. La Figura 3-3 compara el flujo
real y el estimado tras el ajuste que se obtuvo para un aforo virtual tpico.
Flow [ veh / h ]
2500
2000
1500
1000
500
0
loop data
mobile phones counts adjusted to vehicles
2:00 3:00 4:00 6:00 8:00 9:00 10:00 12:00 14:00 15:00 16:00 18:00 20:00 21:00 22:00 23:59
Time [ hh : mm ]
Figura 3-3: Comparacin entre flujo real por un aforo virtual y el estimado tras el ajuste.
(Caceres et al., 2006).
Los resultados mostraron alta correlacin entre valores reales medidos por un detector y los
estimados con telfonos mediante datos procedentes de procesos de LU por cambiar de LA,
debido a que la mayora de los vehculos (telfonos a bordo) son contabilizados. Cualquier
telfono encendido notifica a la red el cambio de LA y, por tanto, ese paso ser detectado por el
aforo virtual. Esta es una de las ventajas que esta alternativa presenta con respecto al
handover, considerar como muestra el conjunto de todos los telfonos encendidos de un
operador y no exclusivamente los que estn haciendo handover (llamada al pasar de una celda a
otra). Asimismo, el uso de un nivel de agregacin en trminos de LA no supone perder
precisin respecto al handover (nivel de celda). Esto se debe a que un LA es una agrupacin de
celdas y, por tanto, la entrada en un nuevo LA se efecta por una de esas celda. En la Figura
3-4, un proceso de LU ejecutado al pasar desde el LA1 al LA2 no permitira distinguir si el paso
ha sido por el punto 1 o el 3 debido a que ambos puntos pertenecen a la celda por la que se entra
al LA2 (celda 3). En cambio, un proceso de LU ejecutado al pasar en el otro sentido (desde el
LA2 al LA1) s que permitira identificar si ha ocurrido por el punto 1 o el 3, puesto que los
puntos pertenecen a celdas diferentes para la entrada al LA1 (celda 1 y celda 2,
respectivamente). En esos casos, se aprecia que la precisin es la misma que con el handover.
No obstante, esta alternativa presenta una desventaja respecto al handover ya que las fronteras
46
entre LAs son espacialmente menos frecuentes que entre celdas y, por tanto, se dispondrn de
menos aforos virtuales de ese tipo.
celda 3
LA 1
LA 2
1
3
celda 1
celda 2
3.4 VELOCIDAD
La velocidad es uno de los parmetros ms estudiados para evaluar la calidad del servicio de
una va segn la demanda que soporta, especialmente en entornos urbanos. Muestra la relacin
entre el espacio recorrido por un vehculo y la unidad de tiempo (km/h o m/s). La velocidad se
suele medir en un punto o tramo corto de una va para determinar la rapidez con que pasan los
vehculos (fluidez del trfico). La velocidad puede ser definida segn diferentes enfoques:
velocidad instantnea, velocidad media temporal, velocidad media espacial o velocidad de
recorrido, entre otros. La velocidad de cada vehculo sufre variaciones durante un viaje ya que
depende de muchos factores, como la categora de la va (urbana, autova), ancho de la va o
nmero de carriles por sentido de circulacin. Adems existen otros factores variables que
tambin influyen, como climatologa, temporalidad (hora punta, da festivo). Desde el punto
de vista de trfico, conocer la velocidad de un vehculo en un momento dado es poco
representativo y resulta ms eficiente trabajar con velocidades medias de recorrido. Para ello, se
utilizan diferentes alternativas como el empleo de coche flotante (vehculos equipados con
sensores que se sumergen en la circulacin de una va y capturan informacin de trfico) o
detectores en puntos fijos que realizan las mediciones mediante identificacin de vehculos.
Ambas alternativas suponen un gasto adicional de instalacin y mantenimiento de los equipos.
Bajo el enfoque de la telefona, Lovell (2001) comenz e investigar sobre la viabilidad de
mediciones de velocidad de vehculos usando el seguimiento annimo de llamadas procedentes
de telfonos mviles. Para ello utiliz mtodos de simulacin que incluan algoritmos de
47
140
120
120
100
80
60
probe speed N.bound
40
segment
20
140
100
80
probe speeds
N.bound
60
loop speeds
N.bound
0
.0
00
8: 00
:4 0.
22 6:0 00
:3 0.
21 24:0 .00
: 0
20 12:0 .00
: 0
19 0:0 99
:0 9.
18 7:5 00
:4 0.
16 36:0 .00
: 0
15 24:0 .00
: 0
14 2:0 00
:1 0.
13 00:0 .00
: 0
12 48:0 00
: .
10 6:00 99
3 .
9: 3:59 00
2 .
8: :00 0
12 .0
7: 0:00 00
0 .
6: 8:00 00
4 .
4: :00 00
36 .
3: :00 0
24 .0
2: 2:00 00
1 .
1: 0:00
0
0:
00
0:
:0 :00
23:00:00
22:00:00
21:00:00
20:00:00
19:00:00
18:00:00
17:00:00
16:00:00
15:00:00
14:00:00
13:00:00
12:00:00
11:00:00
10:00:00
09:00:00
08:00:00
07:00:00
06:00:00
05:00:00
04:00:00
03:00:00
02:00:00
01:00
00
time distribution
40
Figura 3-5: Promedio velocidades: telfonos vs. detectores InterCiudad (arriba) e IntraCiudad
(abajo) Motorway Northbound. (Ygnace, 2001)
48
GSM
Loop
FCD
Speed (km/h)
200
150
100
50
0
5
10
15
20
Time (h)
Figura 3-6: Velocidad en funcin del tiempo obtenidos de datos GSM (+), detectores (), FCD ()
(Thiessenhusen et al., 2006).
El principal problema de esta metodologa es que la muestra slo considera a aquellos telfonos
que efectan llamadas lo suficientemente largas como para atravesar la celda completamente, lo
cual es poco frecuente. Adems, la identificacin de la ruta seguida por el telfonovehculo
49
Velocity:
23 m/s = 82.5 km/h
Figura 3-7: Concepto de estimacin de velocidad usando doblehandover (Birle et al., 2006).
Sin embargo, en entornos urbanos suelen existir diferentes rutas para conectar zonas donde se
producen los handover. Por lo que esa identificacin de va es ms problemtica y no es
suficiente el concepto tpico de handover como fuente de informacin. Para solventar ese
problema en reas urbanas, propusieron utilizar datos procedentes de handovers en zonas donde
stos se producen debido a un solapamiento de cobertura causado por la presencia de edificios,
las cuales son ms pequeas y excepcionales dentro de una celda (Figura 3-8 b).
Con ello se consigue en reas urbanas una identificacin de localizaciones nicas dentro de una
celda ms viable que con el solapamiento tpico (Figura 3-8 a). Sin embargo, este mtodo
requiere informacin adicional del nivel de potencia de seal de las celdas vecinas, es decir,
informes de medida con los que identificar la ruta tomada por el terminal mvil al cruzar la
celda. Los resultados conseguidos mejoraron en gran medida la precisin en la estimacin de
velocidad para entornos urbanos, pese a requerir un tratamiento ms exhaustivo de los datos.
50
(a)
(b)
Figura 3-8: Zona handover (a) con solapamiento tpico y (b) con solapamiento debido a edificios
(Birle et al., 2006).
51
cual se identificaron las zonas donde exista el tpico solapamiento de cobertura entre celdas
(zonas handover). Los tiempos de viaje fueron obtenidos mediante el anlisis de la sealizacin
enviada al ejecutar el traspaso de una llamada entre dos zonas handover contiguas. Sin
embargo, esta alternativa presenta como dificultad aadida problemas en el emparejamiento de
zonas handover con la red viaria debido al tamao que poseen. Solventar esta problemtica
requiere la utilizacin de algoritmos avanzados de mapmatching como los desarrollados por
Estimotion Ltd. (ITIS Inc.), cuya tecnologa patentada se encarga de la medicin y prediccin
de tiempos de viaje en tramos de carretera con alta calidad y en tiempo real.
Utilizando la citada tecnologa de Estimotion, BarGera (2007) estudi las velocidades y
tiempos proporcionados utilizando el evento de handover. El sistema reciba observaciones
procedentes de handovers ejecutados por telfonos existentes en la zona estudiada y
almacenaba, para cada handover, el instante de tiempo junto con el identificador de celda
asociado a las antenas de antes y despus de la ejecucin de dicho handover. El sistema era
capaz de calcular el rea donde era ms probable que el terminal estuviera localizado cuando
ejecut el handover (zonas handover), con una probabilidad de acierto del 85%. La dimensin
tpica de esas zonas handover estaba en torno a 3001000m, de ah la complejidad de emparejar
esas zonas con secciones de la red viaria. Esta tecnologa de anlisis consideraba la posibilidad
de que las observaciones realmente no estuvieran relacionadas con vehculos desplazndose por
la va designada sino por otras prximas a ella, lo cual es frecuente en entornos urbanos.
Finalmente, el sistema generaba estimaciones vlidas de tiempos de viaje (en torno al 63%) para
las secciones analizadas durante el periodo de observacin (10:0020:00), empleando una
muestra cuyo tamao est en torno al 13% del trfico total. Los tiempos de viaje eran
convertidos a velocidades medias de seccin aplicando simplemente el ratio de longitud
correspondiente a dicha seccin.
Para probar la validez de las estimaciones, las medidas basadas en telfonos mviles fueron
comparadas con otras obtenidas con detectores y coches flotantes. Los resultados mostraron una
buena correlacin entre todas las medidas, donde slo 4 valores atpicos fueron excluidos de la
muestra al obtener medidas (con coches flotantes) considerablemente mayores que las del resto
(con detectores y telfonos mviles). La Figura 3-9 compara los tiempos de viaje obtenidos con
los detectores, coches flotantes (Floating Car Data, FCD) y mediante telfonos mviles,
observndose una buena correspondencia entre los tres tipos de medidas. Segn la figura, existe
una leve desviacin, en torno a 1 minuto, entre los tiempos de viaje estimados con datos de
telefona mvil y los procedentes de detectores, especialmente en situaciones de no-congestin.
52
Figura 3-9: Tiempos de viaje en la autova de Ayalon, sentido Norte (BarGera, 2007).
Respecto a los tiempos de viaje, cabe destacar el trabajo de investigacin desarrollado por
Finnra (Finnish Road Administration) en 2002 (Kummala, 2002; Virtanen, 2002). Este trabajo
se bas en la idea de que los telfonos mviles que se muevan siguiendo una cierta ruta siempre
cambiarn de estacin base (celda) en torno al mismo lugar. Segn lo expuesto en el captulo
anterior, un telfono mvil encendido intercambia regularmente informacin con las estaciones
base que conforman la red. Esto permite que la red conozca, aproximadamente, dnde buscar a
un telfono, por ejemplo, a la hora de encaminar una llamada entrante.
30
25
20
15
10
Cellphone (GSM)
Camera (LPR)
5
5:00
7:00
9:00
11:00
13:00
15:00
17:00
19:00
21:00
23:00
Departure Time
Figura 3-10: Estimaciones de tiempos de viajes y velocidades en funcin del tiempo de salida: datos
GSM vs. LPR (Kummala, 2002).
53
As pues, el trabajo desarrollado por Finnra propuso una monitorizacin de esa sealizacin
intercambiada entre el telfono y la red para estudiar el tiempo que precisaba cada telfono en
cruzar una seccin de va, desde que entra en un rea gestionada por una estacin base
determinada hasta la siguiente. Esto permite estimar la duracin de tiempo de viaje asociado a
esa seccin. Para la prueba piloto slo se necesit monitorizar el 5% de los telfonos para
actualizar los patrones de tiempos cada 30 minutos. Los resultados obtenidos (Figura 3-10)
fueron contrastados con los obtenidos mediante cmaras (LPR, License Plate Recognition),
mostrando la alternativa basada en GSM mayor precisin debido a que no se vea afectada por
problemas asociados a la visibilidad como condiciones meteorolgicas adversas, frecuentes en
pases nrdicos.
3.6 CONGESTIN
Un fenmeno de congestin se origina por la existencia de algn evento que motive un cambio
en los valores medios tpicos de velocidad y tiempos de viaje asociados a una seccin. En los
apartados anteriores se han descrito algunos mtodos basados en telefona que consiguen
caracterizar secciones de vas en trminos de velocidad y tiempos. Un anlisis de variaciones
bruscas en cualquiera de esos parmetros respecto a valores tpicos puede ser empleado para la
deteccin de congestiones. Anlogamente, se puede hacer uso de otra magnitud relacionada con
la intensidad de trfico telefnico. El dimensionado de una red de telefona mvil atiende a la
naturaleza del trfico telefnico cursado y su distribucin con respecto al tiempo y destino. Esta
magnitud vara segn proceda de un trfico continuo de llamadas (ncleos urbanos) u otro ms
espordico caracterstico de zonas de poca poblacin. Generalmente, estas zonas se asocian a
vas, como carreteras o autovas, alejadas de los ncleos urbanos. Por ello, el trfico telefnico
que soportan las estaciones base de esas vas se corresponde dominantemente con el generado
por los ocupantes de los vehculos que circulen por ellas.
Para la deteccin de eventos como accidentes, atascos o cualquier incidente que altere el flujo
normal de trfico, es posible hacer uso de un histrico de intensidades tpicas de trfico
telefnico medidas sobre esas mismas estaciones bases en diferentes horarios. Para comprender
este razonamiento es necesario resaltar que los usuarios de telefona mvil poseen ciertos
hbitos en la realizacin de llamadas. Estos hbitos siguen ciertos patrones de modo que,
cuando aparecen eventos que motivan un cambio, los valores tpicos de intensidad suelen
modificarse. Este es el caso de situaciones de congestin, en los cuales los usuarios tienden a
realizar ms llamadas por diversas razones, como avisar en el trabajo o incluso aprovechar el
tiempo para hablar con algn conocido. Este motivo modifica la intensidad de trfico tpica al
54
incrementarse el volumen de llamadas cursado por el sistema. Una simple comparacin con
valores tradicionales puede detectar la existencia de alguna incidencia que motive el aumento de
la actividad telefnica.
40,00
30,00
N of calls (mean)
incalls
outcalls
Dot/Lines show Means
10,00
20,00
0,00
0,00
2,00
4,00
6,00
8,00
10,00
12,00
14,00
level of incident on A7
Figura 3-11: Relacin entre volumen de llamadas y nivel de incidentes en la autova A7 (agosto y
septiembre 2000). Nota: Nivel de incidentes (level of incident): 0 = ningn incidente detectado por
los detectores, 14 = al menos 14 detectores (de 21) detectan un incidente en los correspondientes
intervalos de 12 min; Volumen de llamadas (call volume): promedio de nmero de llamadas
entrantes y salientes registradas en los correspondientes intervalos de 12 min (Ygnace, 2001).
El estudio desarrollado por INRETS analiz la relacin entre el volumen de llamadas (entrantes
y salientes) y la congestin de una va (Ygnace, 2001). Para ello, se consider la hiptesis de
que los conductores tienden a hacer ms llamadas cuando se encuentran en alguna situacin de
congestin. En la Figura 3-11 se muestra la relacin entre el volumen de llamadas de telfonos
mviles y el nivel de incidentes en un tramo de autova de 80 millas. El anlisis demostr que
las llamadas entrantes no aportaban informacin relevante. Sin embargo, se detect una relacin
significativa entre llamadas salientes de mviles sobre esa va y el nivel de incidentes, la cual
reflejaba el incremento de la actividad telefnica al estar los vehculos parados.
55
Figura 3-12: Intensidad de trfico telefnico a 10:00 a.m. en el rea metropolitana de Graz.
(Fuente: http://senseable.mit.edu/projects/graz/highres/highres.zip)
Esta lnea es la que sigue Ratti et al. (2005) en su trabajo del SENSEable City Laboratory
(MIT). En l se consigue representar sobre mapas de una ciudad ciertos parmetros de trfico,
visualizando la dinmica de sus habitantes en tiempo real. Uno de esos parmetros fue la
intensidad de trfico telefnico o densidad de las llamadas (medida en Erlang) de los abonados
de un cierto operador, para lo cual cont con la cooperacin del operador austriaco
A1/Mobilkom que proporcion ciertos datos annimos de telfonos. Esta investigacin tambin
representaba sobre mapas informacin relacionada con la movilidad de usuarios a travs de
handovers. Asimismo, mediante una inscripcin previa en un servicio de rastreo del operador,
56
En ambos estudios del MIT se lleg a la conclusin de que el nmero de llamadas realizadas
con telfonos mviles est estrechamente relacionado con la densidad de personas y, en el caso
de zonas donde no existen ncleos residenciales prximos sino autovas o carreteras, con la
densidad de vehculos mediante los telfonos de sus ocupantes. As pues, aplicando ciertos
algoritmos de expansin, es posible convertir esa medida de intensidad de trfico en celda
[telfonosLLAMADA/celda] a magnitudes relacionadas con la densidad en trminos de
vehculos/celda.
57
Figura 3-14: Medidas de uso de la red mvil (Erlangs) en 6 lugares de Roma (Reades et al., 2007).
Este enfoque se comprende mejor en otro estudio desarrollado por el SENSEable City
Laboratory (MIT) en Roma (Reades et al., 2007). En el citado estudio, se consigui definir
patrones de actividad, segn la zona y el da analizado, empleando medidas expresadas en
Erlangs de uso de la red celular (llamadas) proporcionados por un operador. La Figura 3-14
muestra cmo las medidas de Erlang cambiaban con el tiempo en seis lugares seleccionados, los
cuales representaban zonas residenciales (Piazza Bologna), tursticas (Panten), ocio
(Trastevere, Estadio Olmpico) y principales puntos de entrada a la cuidad por tren (Termini) y
coche (Tiburtina). Como indican las grficas, los valores de Erlangs de lunes a viernes en cada
punto son muy similares, aunque el ratio vara de un lugar a otro. Por otro lado, los valores del
sbado y domingo suelen tener valores inferiores respecto a los valores tpicos de das
laborables, reflejando un patrn de comportamiento diferente segn el tipo de da. Sin embargo,
a pesar de esas diferencias entre das laborables y fin de semana, la Figura 3-14 muestra que los
seis lugares muestran un comportamiento similar: una rpida subida de actividad telefnica por
la maana entre las 6 y 10 a.m. en das laborables, con un ritmo ms lento y algo retrasado en el
tiempo durante el fin de semana, un valle al medioda, una nueva subida por la tarde y un
descenso abrupto por la noche.
Por otro lado, los altos niveles nocturnos de uso de red, entre medianoche y las 2 a.m., los fines
de semana cerca del Panten y Trastevere, en comparacin con los de lugares orientados a zonas
residenciales o industriales, sugeran una actividad fuertemente orientada al ocio. Esta
caracterstica permite la posibilidad de identificar, por ejemplo, zonas de ocio y culturales
58
atendiendo al patrn de uso de la red celular. Por ello, este estudio tambin aplic la actividad
telefnica (densidad de llamadas) a otra lnea como es la dinmica de una ciudad. Segn esas
medidas de uso de la red (en erlangs) se dividi la ciudad en zonas, de modo que se estableci
una relacin de dichas zonas con otras zonas definidas segn la actividad desarrollada en ellas
(comercial, turstica, residencial,). Ello permiti representar caractersticas espaciotemporales de la ciudad en funcin del uso del telfono mvil. Se observ que la actividad
telefnica de das laborables en cada zona exhiba un patrn temporal ms dinmico, mientras
que en fin de semana la actividad present mayor dispersin espacial. Una caracterstica con
implicaciones para la comprensin de la dinmica urbana de una ciudad fue el alto nivel de
actividad por la maana de das laborables en zonas asociadas a estaciones de trenes, autobuses
o intercambiadores, en comparacin con los niveles de zona residenciales a esa misma hora.
Desde un punto de vista de planificacin urbana, esta relacin era obvia pero la visualizacin
espacial y temporal de estas caractersticas a esta escala est comenzando a ser posible mediante
la infraestructura ya existente en sistemas de telefona mvil.
El nivel de precisin de posicin ms fino conseguido de una red de telefona celular, sin
realizar ninguna modificacin en ella ni en los terminales, es a nivel de celda. Es decir, se
localiza el terminal dentro el rea de cobertura de la estacin base a la que est conectado. Con
59
ello se obtiene una aproximacin de la zona geogrfica en la que se encuentra el telfono, pero
no la posicin exacta. Por ello, existe un margen de error que depende del radio de la celda. Este
radio oscila entre los 100 m y 1 km en ciudades. En entornos rurales depende de la densidad de
las antenas, aunque suele oscilar entre 5 y 20 km. Ese margen de error empeora a medida que
aumenta el nivel de agregacin, por ejemplo, a nivel del rea de localizacin (agrupaciones de
celdas), que es el nivel de resolucin con el que trabaja la red celular para gestionar terminales
simplemente encendidos. El uso de resolucin a nivel de LA implica que la zona geogrfica en
la que se puede encontrar el telfono es ms extensa, dando lugar a una mayor incertidumbre.
Esta resolucin afecta al mapeado de telfonos sobre vas existentes en la zona en la que se
informe que se encuentra el terminal, lo cual puede ser relevante para ciertos parmetros. Una
de esas situaciones problemticas se presenta con la existencia de mltiples vas dentro de una
celda para parmetros que usen handover (vase la Figura 3-16), donde las celdas implicadas en
los handovers son las mismas para las dos posibles rutas. En tales situaciones no es posible
desagregar la velocidad o el tiempo de viaje estimado por ruta, ya que cada una tiene diferente
longitud de seccin de va que recorre la celda. Sin embargo, esta situacin no es tan relevante
en otros casos como la medida de volmenes. En ellos, la informacin de volmenes de paso de
telfonos mviles entre dos celdas proporciona informacin agregada de paso total por las dos
vas. No obstante, cada mtodo toma el nivel de agregacin apropiado segn la resolucin
requerida para la prediccin del parmetro. Incluso pueden paliarse tales efectos mediante el uso
de algoritmos de mapmatching (Pyo et al., 2001, White et al., 2000) o completando la
informacin disponible con otros de los muchos parmetros que se pueden extraer de la red de
telefona mvil para determinar una posicin ms exacta del terminal.
60
parmetros de trfico estimados mediante telefona mvil deberan ser utilizados para completar
otro sistema de monitorizacin de trfico, pero no como sistema exclusivo. Incluso realizar
modificaciones en la red o en los propios terminales tambin supondra una mejora en la calidad
de las predicciones, por ejemplo la utilizacin de telfonos equipados con AGPS con el
objetivo de obtener una mejor precisin de los datos de localizacin.
Otro factor que debe ser seriamente considerado es la frecuencia de renovacin de esos datos de
localizacin, la cual depender de si el telfono est simplemente encendido (las actualizaciones
tienen lugar tras vencer un temporizador o cambiar de rea de localizacin) o si realiza algn
tipo de uso de la red, como una llamada, en la que la actualizacin es continua e instantnea
mientras dure la conexin.
No obstante, en trminos de coste y prestaciones ofrecidas para lograr calidad en las
estimaciones, la informacin de posicin proporcionada por una red GSM sin modificaciones
permite obtener datos fiables para monitorizar el movimiento de telfonos y, por tanto,
vehculos sin necesidad de desplegar una infraestructura adicional. As mismo, se trata de un
sistema bastante ms econmico dado que aprovecha la tecnologa y mdulos propios de las
redes GSM para obtener la posicin de cualquier terminal mvil, por muy sencillo que sea.
61
62
al abonado: datos del trfico, personales, y de localizacin. Los datos de mayor inters para los
servicios LBS son los asociados al ltimo grupo, los datos de localizacin.
En el punto 14 de la citada directiva aparece una descripcin de los datos de localizacin,
indicando que: Los datos de localizacin pueden referirse a la latitud, la longitud y la altitud
del equipo terminal del usuario, a la direccin de la marcha, al nivel de precisin de la
informacin de la localizacin, a la identificacin de la celda de red en la que est localizado el
equipo terminal en un determinado momento o a la hora en que la informacin de localizacin
ha sido registrada. Adems, esta directiva proporciona regulaciones sobre los datos de
localizacin en el artculo 9, donde indica:
En caso de que puedan tratarse datos de localizacin [] slo podrn tratarse estos datos si
se hacen annimos, o previo consentimiento de los usuarios o abonados, en la medida y por el
tiempo necesarios para la prestacin de un servicio con valor aadido. El proveedor del
servicio deber informar a los usuarios o abonados, antes de obtener su consentimiento, del
tipo de datos de localizacin distintos de los datos de trfico que sern tratados, de la finalidad
y duracin del tratamiento y de si los datos se transmitirn a un tercero a efectos de la
prestacin del servicio con valor aadido.
Con ello, queda claro que estos servicios requieren acuerdos previos y que la proteccin de la
privacidad es un aspecto fundamental para cualquiera de estos servicios. En particular, la
inferencia de datos de trfico mediante datos de localizacin procedentes de telefona se trata de
un ejemplo claro del empleo de los servicios LBS donde el beneficiario principal no slo es la
Administracin sino la sociedad al completo, puesto que este servicio supone una mejora en la
gestin y planificacin de la red. Es necesario resaltar que el servicio no infringe la ley sobre
proteccin de la intimidad, ya que hace uso de datos annimos para no asociar desplazamientos
a usuarios concretos. Slo se pretende conocer informacin referente a la localizacin de un
terminal, visto como un elemento annimo de la red que se mueve a travs de ella, sin importar
las caractersticas del usuario u otro tipo de informacin asociada a l.
3.9 CONCLUSIONES
Una vez expuestos los procesos asociados a la gestin de movilidad de los sistemas de telefona
en el Captulo 2 y revisado el Estado del Arte respecto a su aplicabilidad en la estimacin de
parmetros de trfico, se puede concluir afirmando que son dos los procesos viables que
permiten monitorizar el movimiento de terminales. Por un lado se dispone del handover, el cual
permite conocer el momento en el que un terminal con una llamada activa cambia de una celda
63
a otra al necesitar la comunicacin ser transferida de la estacin base servidora a una nueva.
Con ello se permite detectar el paso de terminales con llamadas activas por las fronteras entre
celdas. Por otro lado existe el proceso de LU, el cual es ejecutado por cualquier terminal
encendido para que la red se mantenga informada de la localizacin aproximada del terminal, en
trminos de rea de localizacin (LA), logrando as encaminar rpidamente las llamadas
entrantes en el caso que stas ocurran. En base a este razonamiento, cada vez que un telfono
cambie de LA mientras est encendido se considerar que ha cruzado la correspondiente
frontera entre LAs.
La deteccin del movimiento de terminales derivados de handovers y/o procesos de LU presenta
una serie de ventajas e inconvenientes comparndolos entre s. Cuando se emplea el handover,
la informacin extrada viene referida a frontera entre celdas, la cual, dada las dimensiones
tpicas de una celda, no abarca una extensin de terreno muy amplia. Con ello, el nmero de
vas que discurren por la frontera es limitado, alcanzndose una mejor precisin cuanto menor
es la zona fronteriza. En el caso de un proceso de LU para monitorizar el paso de un LA a otro,
al ser un rea de localizacin una regin que comprende un grupo de celdas, la zona fronteriza
observada posee un mayor tamao que en el caso anterior. Esto provoca el aumento del nmero
de vas que cruzan la frontera y, por tanto, del nivel de agregacin de la informacin de
traspasos proporcionada en este caso. No obstante, esta situacin no ocurre siempre al utilizar el
proceso de LU. Al ejecutarse este proceso no slo se dispone de informacin del nuevo LA de
entrada sino de la celda por la que lo ha hecho. De modo que la zona fronteriza a monitorizar
realmente no comprende toda la frontera entre los LAs sino la seccin de esa frontera limtrofe
con una celda concreta. En base a este razonamiento, la desventaja del proceso de LU respecto
al handover en trminos de precisin a nivel de celda slo ocurre en determinadas situaciones.
Esta afirmacin se puede ver ms claramente en la Figura 3-17. El paso desde la celda 1 a la 3
monitorizado por un aforo virtual que emplee el handover entre ese par de celdas observara
el movimiento de terminales por el punto 1. En cambio, ese movimiento no podra ser detectado
por un aforo virtual que emplee el proceso de LU ejecutado cuando se cambia del LA1 al
LA2, ya que ste observara tanto el punto 1 como el 3. En este caso no se podra distinguir si el
paso ha sido a travs del punto 1 o del 3 debido a que ambos puntos limitan con la misma celda
por la que se entra al LA2 (celda 3). Con ello, la informacin proporcionada por ese aforo
virtual se correspondera con el movimiento por cualquiera de las vas asociadas a ambos
puntos, es decir, informacin agregada de traspaso. Por el contrario, un proceso de LU ejecutado
al pasar en el otro sentido (desde el LA2 al LA1) s que permitira identificar si ha ocurrido por
64
el punto 1 o el 3, puesto que los puntos limitan con celdas diferentes para la entrada al LA1
(celda 1 y celda 2, respectivamente).
LA 2
celda 3
LA 1
1
3
celda 1
celda 2
Por otro lado, el hecho de analizar datos procedentes de handover (llamadas) conlleva que la
muestra de terminales de la que se recogen los datos la forman aquellos que han tenido activa
una llamada en el momento de paso por la frontera. Esto implica que el tamao de la muestra es
estadsticamente menos representativo que si se utilizaran datos de terminales que estuvieran
simplemente encendidos, como ocurre en el caso de datos procedentes del proceso LU. La Tabla
3-1 resume estas caractersticas bsicas.
Tabla 3-1: Comparativa de volmenes derivados de handovers o procesos de LU.
Ventajas
LU
Handover
Mayor precisin
(menor nmero de vas por frontera)
Inconvenientes
Menor precisin
(mayor nmero de vas por frontera)
Menor tamao de la muestra
Atendiendo a estas conclusiones, una red GSM (sin modificar) puede no ofrecer prestaciones
ptimas para fines de localizacin y monitorizacin de usuarios, especialmente en lo que a
movilidad se refiere. No obstante, la rpida expansin de este tipo de sistemas de telefona junto
a los resultados alcanzados en proyectos similares relacionados con la obtencin de parmetros
de trfico, impulsa a incorporar mtodos basados en estas nuevas tecnologas en los estudios de
transporte. Por ello, los Captulos 2 y 3 han descrito y revisado conceptos y procedimientos
relacionados con los sistemas de telefona mvil para afrontar los objetivos de esta Tesis con un
mayor conocimiento de la materia.
CAPTULO 4
INFERENCIA DE VOLMENES DE TRFICO
MEDIANTE LA TELEFONA MVIL
4.1 INTRODUCCIN
Se denomina volumen de trfico al nmero de vehculos que pasan por un punto o seccin
transversal de una va durante un periodo de tiempo determinado. Estos volmenes pueden ser
entendidos como una medida del nivel de utilizacin del viario por la demanda de transporte.
Los estudios de volmenes se realizan con el propsito de obtener informacin del movimiento
de vehculos sobre puntos o secciones especficas dentro de una red viaria, proporcionando una
descripcin intuitiva del comportamiento dinmico del trfico.
Las distribuciones temporales de volmenes de trfico se deben a diferentes estilos y formas de
vida, los cuales determinan patrones de viaje basados en el tiempo (pocas del ao, horas del
da, etc.). Por otro lado, los telfonos mviles se han convertido en un elemento indispensable
en nuestra rutina diaria. stos intercambian continuamente informacin con las estaciones de un
sistema de telefona mvil a fin de disponer de servicios telefnicos de calidad, con lo que una
monitorizacin de datos generados por dichos terminales puede ofrecer un fiel reflejo de las
pautas de movilidad de los usuarios. En concreto, ciertas situaciones que tienen lugar durante el
funcionamiento tpico de esos sistemas pueden desempear una tarea similar a las llevadas a
cabo por las tradicionales estaciones de aforo en lo referente a conteos de trfico. Este captulo
est dedicado a profundizar en este campo, desarrollando una metodolologa para inferir
volmenes de trfico de vehculos a partir de la telefona mvil mediante modelos matemticos.
66
viario; a este valor medido se le conoce con el nombre de aforo, trmino que tambin
identifica al de estacin de aforo o punto de aforo. Tradicionalmente, estos aforos son un
tipo de informacin que se recoge de forma automtica en un conjunto de puntos asociados a
arcos del viario. Para ello se han de instalar elementos adicionales en las vas (espiras, cmaras
de video). Este volumen de paso de vehculos no es constante sino que oscila segn la
movilidad de la poblacin, categora de la va, temporalidad, etc. Para conocer en detalle las
caractersticas del trfico de vehculos que circula por la red sera necesario monitorizar un
nmero considerable de vas de modo casi permanente con algn tipo de detector, algo inviable
cuando existen restricciones presupuestarias. As pues, surge la necesidad de otras alternativas
que permitan caracterizar el trfico de un modo rpido, preciso y permanente, sin excesivo
coste.
Un modo de conseguir esta informacin es mediante la telefona mvil. En contraste con los
sensores fijos, los telfonos mviles proporcionan informacin respecto al comportamiento del
trfico sobre cualquier zona donde exista cobertura telefnica, sin necesidad de un despliegue
adicional de infraestructura. En estos casos, el volumen estara asociado al movimiento de
telfonos por una determinada zona de la red, dado que existen ciertos eventos y procesos en la
telefona mvil relacionados con la gestin de movilidad que permiten detectar el cambio de
zona, bien entre celdas (mediante handover) o bien entre reas de localizacin (mediante
procesos LU, Location Update). Respecto a esta idea, en la seccin 3.3 se presentaron los
conocimientos actuales sobre el clculo de volmenes mediante la telefona mvil, junto con
una revisin del EstadodelArte sobre la obtencin de volmenes con datos procedentes de
telfonos.
Existen estudios en la literatura en los cuales se afirma que el flujo de telfonos mviles
derivado de llamadas con handover y el flujo de vehculos proporcionado por detectores
(espiras, gomas, cmaras) en los mismos puntos estn directamente relacionados en la
mayora de los intervalos horarios de un da tpico (Thiessenhusen et al., 2006; Hpfner et al.,
2007), mostrando picos caractersticos similares en las horas punta de maana y de tarde. No
obstante, esos estudios manifestaron la dificultad de obtener flujos de vehculos precisos
directamente de datos de llamadas debido a la naturaleza de dichos datos. Por tanto, la principal
cuestin es determinar cmo el flujo de telfonos estar relacionado con el flujo de vehculos ya
que en los conteos de terminales que pasan por fronteras entre celdas no se monitoriza el
conjunto completo de vehculos que la han atravesado, sino slo una muestra de ellos.
Ciertos factores que tienen su origen en la naturaleza de los datos de telfonos mviles afectan a
la hora de cuantificar la relacin entre vehculos y telfonos. Por un lado, la telefona mvil
67
aporta informacin asociada a movilidad de telfonos que i) son de un cierto operador y ii) que
estn encendidos. Los telfonos apagados o de otro operador son transparentes, es decir, aunque
crucen la frontera no sern detectados en el proceso de conteo. En el caso del handover, existe
otro condicionante adicional asociado a la naturaleza del evento, que implica que el telfono
est realizando una llamada en el momento de cambio de celda. Adicionalmente a los factores
citados, la existencia de ms de un telfono por vehculo tambin perturba la estimacin de flujo
usando datos de telfonos.
La carencia de una relacin directa e inmediata entre conteos de telfonos que ejecutan
handover y conteos de vehculos sugiere la necesidad de un tratamiento especial para relacionar
ambas magnitudes, el cual puede requerir la realizacin de algn proceso de calibracin usando
conteos de vehculos obtenidos, por ejemplo, mediante detectores ubicados en la misma zona en
la que se realiza el conteo de telfonos. En la literatura se han propuesto diferentes modelos
diseados para correlacionar ambas magnitudes, como un sencillo modelo basado en funciones
de transferencia generadas directamente con datos de aforos (Bekhor et al., 2008) u otro ms
complejo basado en tcnicas de asimilacin de datos como la relajacin Newtoniana o tcnica
nudging (Herrera y Bayen, 2008). En ambos casos, la utilizacin de modelos para relacionar
ambas variables hizo posible alcanzar estimaciones ms precisas de flujo de vehculos.
Ante las conclusiones anteriores, y dada la naturaleza de la informacin procedente de telefona
mvil, parece lgica la necesidad de usar modelos matemticos que se encarguen de medir esa
relacin con un objetivo claramente predictivo. Los modelos matemticos son ampliamente
utilizados para resolver problemas concretos de ingeniera u otras reas cientficas, y
constituyen un marco terico general para la formulacin de la inferencia estadstica. En los
siguientes apartados se proponen una serie de modelos para predecir volmenes de vehculos a
partir de la telefona mvil con objeto de ser usados en los estudios de transporte en sustitucin
o de forma complementaria a medidas de volmenes proporcionadas por los habituales aforos.
68
En esta etapa tambin se deben analizar los medios de los que se dispone y el procedimiento a
seguir. Como se ha comentado en el apartado 3.9, la telefona mvil ofrece dos procesos
asociados a la gestin de movilidad que permiten monitorizar el paso de terminales, bien entre
celdas mediante el handover, o bien entre reas de localizacin (LA) mediante el proceso de
Location Update (LU). A partir de la red viaria real se elabora un modelo de red compuesto,
principalmente, por nodos y arcos. La mayora de los nodos corresponden a una interseccin o
cruce, mientras que los arcos corresponden a los segmentos de vas de comunicacin que unen
los nodos. Analizando la topologa de un modelo de red de transporte junto con la distribucin
de celdas y LAs del sistema celular existente, es posible asociar fronteras entre dichas zonas con
secciones de va (arcos). Con ello, cada vez que un telfono cambie de celda durante una
llamada (handover) o cambie de LA mientras est encendido (proceso LU), se podr considerar
que ha pasado por alguno de los arcos que conforman la correspondiente frontera. En aquellos
casos en los que la frontera slo comprenda un arco, el paso de terminales computado se
asociar ntegramente a dicho arco. Sin embargo, cuando son ms de uno los arcos implicados
en una frontera, el nivel de resolucin proporcionado por estos datos slo informa del paso por
la frontera, pero no permite distinguir sobre qu arco del total se ha realizado el traspaso. Dada
esta situacin, la cual es mayoritaria, la informacin de traspasos proporcionada ser en forma
69
agregada por grupos de arcos, en lugar de a nivel individual de arco (formato tradicional de las
estaciones de aforo).
El procedimiento a escoger depender, por tanto, de las especificaciones que se necesiten para
abordar el problema en cuestin. Las fronteras a monitorizar vienen ya establecidas por el
propio diseo de las redes de telefona mvil, puesto que se utilizan las mismas celdas y/o reas
de localizacin definidas en el dimensionado y diseo de la red celular. El tamao de un rea de
localizacin depende en gran medida de las celdas que la forman. El radio de las celdas depende
de parmetros como trfico que tienen que soportar, topologa del terreno, tipo de antena o
incluso edificios alrededor de la estacin base, variando su tamao desde cientos de metros a
kilmetros.
Dada una regin de estudio, puesto que las reas de localizacin son agrupaciones de celdas, el
nmero de fronteras entre celdas es mayor que entre LA y, por tanto, se monitorizara un
nmero mayor de arcos utilizando handovers que procesos de LU. No obstante, si la zona a
estudiar es extensa (p.ej. una comunidad autnoma), las fronteras entre LAs por una celda
concreta pueden englobar un nmero suficientemente elevado de arcos para abordar un
determinado estudio. En esta Tesis, el principal objetivo de los datos de telfonos est orientado
al campo de la estimacin de matrices origendestino mediante volmenes observados, por lo
que interesa disponer de informacin en un nmero de arcos de la red suficientemente
representativo. As pues, ser la dimensin de la red de transporte la que condicione la eleccin
de tomar datos procedentes de llamadas (cambios de celda) o registros de LU (cambios de LA).
Por ejemplo, si el estudio se centrara en una red urbana, la monitorizacin del paso de un LA a
otro no es admisible dado que tpicamente una ciudad es cubierta con un nico LA y el nmero
de posibles fronteras a monitorizar es muy bajo; en cambio, existirn numerosas celdas. Por
ello, sera ms apropiado en esos casos utilizar datos de llamadas al permitir monitorizar un
mayor nmero de fronteras.
4.3.1.2
Una vez conocidos los medios de los que se dispone, y los posibles procedimientos que ofrece
la telefona mvil, es necesario elegir cul va a ser el procedimiento a seguir. Como se ha
analizado en el apartado anterior, la dimensin de la red es determinante a la hora de seleccionar
el evento de telefona del que se obtendrn los datos fuente. Sin embargo, la implementacin de
los modelos de captura de datos de telfonos est sujeta en gran medida a las caractersticas
tcnicas de la plataforma del operador que proporcione los datos. Esa plataforma deber tener
habilitada la funcionalidad necesaria para extraer informacin de las bases de datos relativa a
70
llamadas o cambios de rea de localizacin. En su defecto, la disposicin por parte del operador
para la instalacin de mdulos que implementen tal extraccin tambin condiciona el xito del
proceso de captura de datos.
Para la realizacin de esta Tesis se ha contado con la inestimable colaboracin del operador
VODAFONE que se ha prestado a proporcionar datos de telfonos debidamente encriptados. En
el caso de la plataforma del citado operador, los datos de llamadas estn accesibles sin coste ni
impacto en los mdulos del sistema puesto que son almacenados con fines de facturacin y
control del funcionamiento de la red. Para el caso de datos asociados a procesos de LU, aunque
stos son generados automticamente por el sistema, slo se almacenan temporalmente. Por
ello, sera necesario realizar un volcado peridico de las bases de datos del sistema en un
servidor central del que tomar los datos. Esto requiere una modificacin de los mdulos
existentes en la plataforma del operador ya que las APIs necesarias para su almacenamiento
permanente no estn accesibles en la actualidad.
Tras considerar las posibilidades ofrecidas y desde la perspectiva de bajo coste e impacto en
mdulos de la infraestructura del operador, se preferi que los estudios numricos desarrollados
en este Captulo utilizaran como datos fuente informacin de llamadas realizadas sobre un
conjunto de celdas. En concreto, el conjunto de datos proporcionado por VODAFONE se
corresponde con registros encriptados de llamadas efectuadas por sus abonados en celdas bajo
estudio durante periodos de 24 horas. Un extracto del formato de los datos entregados por el
operador se muestra en la Tabla 4-1. En particular, estas celdas han sido previamente
seleccionadas por disponer en las proximidades de sus fronteras con otras celdas de una estacin
de aforo con la que contrastar y/o calibrar los valores de volmenes de trfico inferidos con el
modelo diseado.
Tabla 4-1: Extracto de los datos entregados por el operador.
IMSI
ID Nmero
Origen
ID Numero
Destino
Fecha
20240
3210
508
10/04/2008
9:30:00
1,53
GSM2
20240
3210
508
10/04/2008
9:31:00
2,45
GSM2
20241
3205
17362
10/04/2008 18:10:00
0,33
GSM1
20241
3205
1055
10/04/2008 18:11:00
1,12
GSM1
Es preciso mencionar que cualquier nmero que aparezca en la informacin proporcionada por
el operador respecto a la identidad de los abonados se encuentra encriptado con un identificador
nico y permanente durante todo el intervalo de tiempo analizado (24 horas). Con ello se
71
garantiza la privacidad de los abonados pero sin impedir realizar un seguimiento de la movilidad
que ha tenido cada terminal en trminos de celdas en las que ha efectuado llamadas. Todo ello
permite, finalmente, monitorizar el paso de terminales de una celda a otra para inferir
volmenes agregados por grupos de arcos que cruzan la frontera en cuestin.
72
llamada y que dure lo suficiente para que sea traspasada a otra celda. Puede darse el caso que la
llamada finalice antes de cambiar de celda, por lo que el handover no llegara a realizarse y, a
pesar de que el telfono est en movimiento, el telfono no formara parte de la muestra. Por
ello, se deben considerar otras situaciones de movilidad que amplen los criterios para la
seleccin de la muestra. Se sabe que cuando un usuario realiza una llamada, por cuestiones de
facturacin, el sistema siempre almacena en una base de datos un registro conteniendo
informacin relativa a esa llamada, como hora de inicio, duracin, ID telfono llamado, ID
telfono llamante o identificacin de la celda donde se origina la llamada (LAI+CI). Por ello,
tambin es factible detectar el paso de un terminal de una celda a otra sin necesidad de que est
realizando una llamada en el momento de cruzar la frontera, como en el caso del handover. Esto
ocurre cuando desde un mismo terminal se realizan dos llamadas consecutivas en celdas
diferentes y colindantes en un corto periodo de tiempo T, por ejemplo, 15 minutos (Figura 4-1
b). En ese caso, dado que hay constancia de que el terminal ha estado en dos celdas en un corto
periodo de tiempo, se puede considerar que est en movimiento y que, por tanto, tambin ha
pasado por la frontera entre celdas. As pues, aunque el instante de paso de una celda a otra no
se conozca con la misma exactitud que en el caso del handover, se supone que habr ocurrido
dentro de ese periodo T. Este tiempo (T=15 minutos) es admisible dado que est dentro de los
rangos de tiempo respecto de los cuales se suele proporcionar las medidas de intensidades de
trfico de las tradicionales estaciones de aforo. Esta pareja de llamadas junto a las que ejecutan
handover permiten construir una muestra mayor de terminales para monitorizar su movimiento
de una zona a otra, denominndose a esos tipos de llamadas como llamadas en movilidad.
Figura 4-1: Llamadas en movilidad: (a) handover y (b) 2 llamadas en t1 y t2 tal que t2-t1T=15min.
Es importante destacar que la situacin mostrada en la Figura 4-1 b slo se contabiliza como
una nica llamada en movilidad, pese a realizarse 2 llamadas. Esto es as dado que el concepto
de movilidad se asocia al movimiento del terminal desde el cual se realizan llamadas y, en esta
situacin, es el mismo terminal el que realiza las dos llamadas, siendo stas usadas para detectar
su movimiento. Entonces, el anlisis de registros de llamadas almacenados en las bases de datos
73
en busca de llamadas en movilidad, realizadas en las celdas de inters, permitir contabilizar los
terminales que se desplazan de una celda a otra como si existiera una especie de estacin de
aforo virtual en la frontera entre ellas.
Un modelo de red de transporte es una representacin simplificada de la red vial y est formado,
principalmente, por nodos y arcos, los cuales representan las intersecciones y los tramos viales,
respectivamente, de la infraestructura vial. Analizando la distribucin de las celdas y el modelo
de red de transporte se identificarn las posibles fronteras observadas y se establecer una
correspondencia con los arcos del modelo. Una frontera observada o aforo virtual lo
conforman los arcos cuyo nodo inicial y nodo final estn en celdas distintas y contiguas (Figura
4-2). Con ello, cada vez que un telfono con una llamada activa accede a la celda B procedente
de otra A o el mismo telfono realice dos llamadas consecutivas (<15minutos) en la celda A y
B, respectivamente, se podr considerar que ha pasado por el aforo virtual posicionado en
dicha frontera observada, es decir, por alguno de los arcos que la cruzan. La informacin de
conteo proporcionada estar definida de forma agregada por grupos de arcos, en lugar de a nivel
individual de arco (formato proporcionado por los tradicionales aforos).
l5
l3
l4
l9
l 10
l2
celda 1
celda 3
l1
l7
k
l8
l6
l
celda 2
{l 9, l 10}
74
patrones de llamadas para usuarios en movimiento y estticos. Esto conlleva que el trfico
telefnico en redes mviles dependa tanto del tiempo como del espacio, siendo esa dependencia
espacial mucho ms variable que en redes fijas.
Atendiendo a un contexto de movilidad de vehculos, un modo de abordar este anlisis
descriptivo es cuantificar la comodidad a la hora de efectuar llamadas. Las llamadas se pueden
dividir en dos categoras: aquellas que son recibidas por el usuario, denominadas llamadas
entrantes, y las que son realizadas por ese usuario, denominadas llamadas salientes.
Lgicamente, un parmetro para evaluar la citada comodidad ser la tasa de llamadas salientes.
Destacar que cada llamada entrante tiene su origen en una saliente de otro usuario, por ello slo
se van a considerar las llamadas salientes de cada usuario al analizar el trfico telefnico de red.
La duracin de una llamada tambin ser otro parmetro caracterstico a estudiar. Ambos
parmetros estn fuertemente afectados por la movilidad de los usuarios (estticos, peatones u
ocupantes de vehculos), ya que sta condiciona la realizacin de llamadas. Por ejemplo, un
conductor normalmente iniciar un nmero de llamadas menor comparado con un usuario
ubicado en su trabajo; respecto a la duracin, los pasajeros de vehculos harn llamadas ms
largas en comparacin con las realizadas por conductores.
La Figura 4-3 muestra la intensidad del trfico telefnico, representada en trminos de nmero
de llamadas realizadas, en una celda Zk a lo largo de un da laboral tpico. Para sistemas de
telefona mvil, los picos suelen producirse entre las 10:00 y 12:00 debido a la actividad
comercial y laboral de los usuarios, mostrando un segundo pico entre 18:00 y 20:00 debido al
9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
Figura 4-3: Trfico telefnico (nmero de llamadas por hora) durante un da en una celda.
Cabe sealar que la intensidad de trfico telefnico puede variar de un da a otro, semanalmente,
o incluso segn el periodo del ao (verano, Semana Santa,), mostrando diferentes patrones
asociados con los hbitos de los usuarios y/o las caractersticas de la zona gestionada por la
75
Celda 7
Celda 5
Celda 9
Celda 1
300
200
100
0
10 11 12 13 14 15 16 17
18 19 20 21 22 23
Figura 4-4: Promedio del nmero de llamadas por hora en diferentes celdas a lo largo de 18 das.
En la Figura 4-4 se puede observar que, esencialmente, existen tres perodos de actividad
durante un da laborable tpico, uno de muy poca actividad y dos claros picos donde la actividad
es mayor, variando su rango de una celda a otra. El primero se corresponde con el perodo
nocturno (00:007:00), donde la realizacin de llamadas es poco probable. El segundo periodo
se extiende durante la mayor parte de la jornada laboral (8:0016:00). El ltimo perodo es el
correspondiente a la tarde y el final del da (16:0000:00). A su vez, se observa que la actividad
telefnica en un da laborable aumenta bruscamente por la maana entre las 7:00 y 10:00; en
300
2min<td5min
td>5min
200
100
0
10 11 12 13 14 15 16 17 18 19 20 21 22 23
Figura 4-5: Nmero de llamadas por hora durante un da segn la duracin de la llamada td.
76
duracin de llamadas a lo largo del da. Analizando esa duracin en trminos medios (Figura
4-6), se aprecia ms claramente que los usuarios tienden a hacer llamadas ms largas a partir de
las 19:00. La propia naturaleza del servicio condiciona esta variacin en la duracin, ya que
puede verse influenciada por las tarifas existentes o, incluso, por la disponibilidad de los
usuarios. Adems, el promedio de duracin de llamada puede variar segn las caractersticas de
la zona (p. ej., usuarios en zonas residenciales tienden a hacer llamadas ms largas que usuarios
4
3
2
1
0
10 11 12 13 14 15 16 17 18 19 20 21 22 23
Tiempo (24 horas)
77
nodo inicial y final de un arco, para conocer los arcos que cruzan una frontera observada. De
modo que la fluctuacin del radio no suele tener gran impacto en aquellos nodos ubicados
dentro del radio efectivo de una celda, como se aprecia en la Figura 4-7 (a) y (b).
Por otro lado, se ha comentado ya que el rea de servicio de una celda suele superponerse
parcialmente con el de una o ms de sus celdas vecinas. Este solapamiento tiene lugar para
evitar agujeros en la cobertura debido a una disminucin del nivel de potencia de seal lejos
de la antena servidora. El tamao de la zona de solape se determina mediante el establecimiento
de un umbral mnimo de seal recibida. ste es un parmetro de diseo importante en las redes
celulares puesto que garantiza que un abonado situado cerca del borde de una celda pueda
recibir servicio de mltiples direcciones en caso que la servidora falle. Ms informacin
respecto al solapamiento entre celdas puede ser encontrada en Thornton y Grace (2005).
Zona de solape
l1
l1
i
l2
j
l2
j
(a)
(b)
l1
l2
j
(c)
78
Trfico peatonal
La presencia de peatones es un aspecto importante a considerar en la inferencia de volmenes
de vehculos mediante la realizacin de llamadas en movilidad. Estas llamadas estn asociadas a
terminales desplazndose de una celda a otra, sin conocer la velocidad a la que lo hacen. Esto
implica que las llamadas en movilidad observadas pueden ser efectuadas por telfonos en
movimiento tanto a bordo de vehculos como de peatones en el caso de que la frontera entre
celdas est prxima a entornos urbanos. En base a ese razonamiento, no es posible distinguir
nicamente con datos de llamadas si un terminal que se mueve de una celda a otra pertenece a
un usuario de vehculo o a un peatn. Introduciendo modificaciones en la red, la velocidad de
traspaso podra ser detectada, resolvindose as este problema. No obstante, dado que se ha
optado por emplear datos de telefona sin introducir modificaciones, se considerar que las vas
que soporten trfico de peatones no son vlidas para ser monitorizadas. Es decir, si existiera una
frontera entre celdas asociada a ese tipo de vas, las llamadas observadas procederan de
usuarios de diferente tipo de movilidad. Como el inters se centra en el estudio de vehculos,
cuando una frontera entre celdas est formada por arcos con un trfico de peatones significativo,
esa frontera es desechada del conjunto de fronteras observadas, aunque cumpla la definicin de
frontera observada. Slo fronteras cuyos arcos no poseen un trfico de peatones significativo
son consideradas como vlidas para formar parte del conjunto de fronteras observadas. Esto
implica la necesidad de un procesado previo para evaluar las fronteras entre celdas y calificarlas
como aptas para el proceso de inferencia.
Puntos kilomtricos en estudio
Se pretende determinar el volumen de vehculos asociado a un nmero conocido de llamadas en
movilidad generadas en una frontera entre celdas. Para alcanzar este objetivo, se van a plantear
una serie de modelos que, con fines predictivos, se encarguen de proporcionar esa magnitud de
un modo similar a las clsicas estaciones de aforo. La elaboracin de esos modelos no es una
tarea sencilla ya que, como se expone ms adelante, no existe una dependencia directa entre
ambas magnitudes. Por ello, una vez definidos los modelos, se va a emplear un histrico de
datos, tanto de llamadas en movilidad como de vehculos que han pasado por una zona, no slo
para llevar a cabo el ajuste de parmetros de esos modelos sino para la validacin de las
predicciones realizadas. As pues, se exige que las fronteras entre celdas dispongan de una
estacin de aforo en las proximidades encargada de proporcionar los volmenes de vehculos
que realmente atraviesan la frontera entre celdas para constituir el citado histrico de datos.
Asmismo, bajo las condiciones expuestas en el punto anterior, la seleccin de los puntos
kilomtricos en los que se localizan las fronteras entre celdas en las que se realizar la
79
monitorizacin estar restringida a zonas en las que sea poco probable que los usuarios en
movilidad existentes se correspondan con peatones. Seleccionando fronteras entre celdas
cruzadas por vas donde el trfico sea esencialmente de vehculos, alejadas de entornos urbanos,
se elimina el efecto negativo que los peatones introducen. Esta ser una condicin necesaria
para considerar como vlida la informacin que se pueda derivar de las llamadas.
Finalmente, para identificar tales fronteras se realiz un estudio de campo sobre vas
pertenecientes a anillos alrededor del rea metropolitana de Sevilla. Una vez conocidos los
puntos de la red viaria en los que existen estaciones de aforo, se seleccionaron los ms
adecuados para realizar el estudio. La Figura 4-8 muestra los 6 puntos kilomtricos escogidos
pertenecientes a las vas sobre las que se realiza la monitorizacin. Estos 6 puntos dan lugar a 12
fronteras observadas, dos para cada punto kilmetrico, estando cada una de ellas asociada a un
sentido de paso. Sobre esos puntos, el Centro de Gestin de Trfico de la DGT facilit las
mediciones de intensidades horarias de vehculos y VODAFONE los registros de llamadas
generados en las celdas implicadas en las fronteras durante los das seleccionados para ser
observados. Con ellos se elabor el histrico de datos que relacionaba nmero de vehculos y de
llamadas en movilidad {(x1,y1), ..., (xn,yn)}. La Tabla 4-2 muestra los IDs de cada una de las
fronteras observadas en este estudio.
Figura 4-8: Puntos kilomtricos en los que en sus proximidades existe una frontera entre celdas.
Tabla 4-2: ID fronteras asociados a cada punto kilomtrico y sentido.
ID
Frontera
PK
A 49 PK 46 A 4 PK 518
S.HUELVA S.MADRID
A 4 PK 488
S.MADRID
A 4 PK 527
S.MADRID
A 92 PK 32
S.MALAGA
A 92 PK 43
S.MALAGA
ID
Frontera
10
11
12
PK
A 4 PK 518
S.SEV
A 49 PK 46
S.SEV
A 92 PK 32
S.SEV
A 92 PK 43
S.SEV
A 4 PK 488
S.SEV
A 4 PK 527
S.MADRID
80
Das de observacin
Los datos con los que se debe trabajar proceden de medidas u observaciones tomadas a partir de
la muestra. Dado que se pretende que la informacin extrada sea lo ms representativa posible,
se seleccionarn para monitorizar das que, a priori, presentan pocas variaciones respecto a un
da tpico. Esto implica que las mediciones se deben llevar a cabo en das centrales de la
semana: Martes, Mircoles y Jueves. Adems, deben estar sujetos a las siguientes condiciones:
no ser festivo, que el da anterior y posterior tampoco sea festivo, y que no pertenezca a una
semana con eventos especiales (Semana Santa, Feria de Abril,). En base a esos criterios, los
das seleccionados para tomar las observaciones de los datos de llamadas son 18 (martes,
mircoles y jueves de 6 semanas), los cuales se muestran en la Tabla 4-3.
Tabla 4-3: Das observados.
MARZO 2008
L M X J V S D
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
ABRIL 2008
L M X J V
1 2 3 4
7 8 9 10 11
14 15 16 17 18
21 22 23 24 25
28
29
S D
5 6
12 13
19 20
26 27
CDIGO DE
COLORES
Festivos
Observados
30
Horario de observacin
El comportamiento de los usuarios a la hora de realizar llamadas tambin est condicionado por
la hora, bien por las tarifas existentes, la jornada laboral o porque en ciertos periodos puede ser
socialmente inadecuado realizar una llamada. Incluso, ste puede verse influido por la celda
segn las caractersticas de la zona a la que da servicio (rea residencial, centro comercial).
Prueba de ello es que la actividad telefnica durante la franja horaria entre la 1:00 a.m. y 6:00
a.m. es muy reducida, siendo poco probable hacer una llamada; en cambio, a partir de las 18:00
aumenta la tendencia a realizar llamadas por el inicio de tarifas reducidas. En este sentido, es
conveniente emplear medidas de dispersin para determinar el rango horario donde el nmero
de llamadas realizadas no presenta mucha dispersin respecto de la media. Una de estas
medidas es el coeficiente de variacin (CV), definido como el cociente entre la desviacin tpica
y la media, CV
de la distribucin respecto a un valor central. El valor del CV ser igual a 0 cuando no existan
diferencias entre los datos, resultando entonces una distribucin totalmente homognea. La
81
Figura 4-9 muestra el CV conseguido para las distribuciones de llamadas realizadas en cada una
Coeficiente de Variacin CV
C1
C2
C3
C4
C5
C6
C7
C8
C9
C10
C11
C12
4
3
2
1
0
9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Desde el punto de vista prctico, interesa centrar el anlisis en un rango horario donde las
curvas presenten valores bajos de CV. Esto ocurre dentro del intervalo 8:0021:00 observando
la Figura 4-9, en la cual el valor de CV permanece en todo momento por debajo de 0.5. Fuera de
ese intervalo, los valores de CV alcanzados son bastante mayores que la unidad, indicando en
ese caso que la realizacin de llamadas posee una variabilidad mayor respecto de la media.
Entonces, se tomar como intervalo de observacin la franja horaria entre las 8:00 y 21:00, en la
cual la realizacin de llamadas responde a un comportamiento, en cierto grado, homogneo para
todas las celdas. Con ello se consigue que los modelos de prediccin diseados sean ms
estables para cualquier periodo de tiempo comprendido en dicha franja.
4
Magnitud
x 10
1.5
24 horas
12 horas
0.5
0
8 horas
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
Frequencia (1/horas)
Por otro lado, realizando un anlisis de la actividad telefnica generada por usuarios de
telfonos mviles, se aprecian ciertos ciclos de comportamiento relacionados con los patrones
de movilidad de los usuarios. Analizando la Densidad Espectral de Potencia de las llamadas
(Figura 4-10), para realizar un estudio en frecuencia, se observan 3 picos en torno a periodos de
82
24 horas, 12 horas y 8 horas, los cuales son representativos de la periodicidad del conjunto de
datos de llamadas analizados. Lgicamente, el pico de las 24 horas est asociado a la frecuencia
con que los datos de llamadas son almacenados. El pico en torno a las 12 horas representa ciclos
repetitivos de comportamiento cada 12 horas correspondientes a pautas da/noche. Asimismo, el
pico de periodicidad en torno a las 8 horas responde a comportamientos asociados a la jornada
laboral.
Introduccin
83
cpulas empricas fueron estudiadas originalmente por Deheuvels (1979). La idea consiste en
construir una funcin cpula a partir de valores muestrales {(x1,y1), ..., (xn,yn)} recogidos para
las variables univariantes sin establecer dependencia de ningn parmetro. De esta forma, la
cpula es no paramtrica y queda definida nicamente a partir de la muestra de datos disponible.
Sea (x, y){(x1,y1), ..., (xn,yn)} una muestra de tamao n obtenida a partir de una distribucin
bivariante (X, Y), la definicin de cpula emprica (Nelsen, 2006) responde a la expresin:
i j n de pares ( x, y ) de la muestra tales que x x( i ) e y y( j )
Cn ,
n
n n
1 n
I ( xk x( i ) , yk y( j ) ) i, j 1,....n
n k 1
(6)
con x(i), e y(j) 1 i, j n, los estadsticos de orden definidos a partir de la muestra. Deheuvels
(1979) demostr que cuando el tamao muestral crece, la cpula emprica converge a la cpula
verdadera. Es por ello que la cpula emprica constituye un instrumento adecuado para estudiar,
a grandes rasgos, la relacin de dependencia entre U y V, y por tanto, la relacin entre X e Y.
En este sentido, existe una cpula que representa la condicin de independencia entre variables,
definida como (u,v)=uv. Se dice que dos variables X e Y no son dependientes si y slo si
C(u,v)=(u,v). Cuando C(u,v)(u,v), las variables X e Y son dependientes y la dependencia
depende de las variables a travs de transformaciones crecientes no lineales de las variables.
Esta es una propiedad destacable de las funciones cpula, la posibilidad para detectar
independencia entre variables frente a otras medidas clsicas que no lo permiten como el
coeficiente de correlacin lineal (que en caso de ser cero, nicamente permite confirmar la
ausencia de dependencia lineal entre las variables).
Una manera sencilla de presentar y comparar las cpulas es a travs de los diagramas de
contorno. El diagrama de contorno de una cpula es la representacin grfica de sus curvas de
nivel, las cuales son conjuntos en [0, 1]n dados por C(u,v)=k, con k constante. Empleando estos
diagramas, se pueden comparar la cpula de independencia y la cpula emprica obtenida para
el conjunto de datos {xi, yi} en los puntos kilomtricos o fronteras estudiadas (Figura 4-11). Se
aprecia que ambas cpulas muestran un comportamiento similar. A la vista de la similitud entre
ambas cpulas, y dado que la cpula emprica converge hacia la verdadera conforme el tamao
muestral crece (Deheuvels, 1979), es posible afirmar que las variables X e Y no poseen una
relacin de dependencia directa.
84
Independencia (u,v)
v=FY(y)
v=FY(y)
0.6
4
0.
0.3
0.5
1
0.
0.2
0.2
0.1
0.2
0.4
0.3
0.2
0.6
0.
5
0.4
0.2
0.7
0.2
1
0.
0.4
0.6
0.1
0.4
0.3
0.8
7
0.
6
0.
0.2
0.6
0.9
0.8
0.8
0.5
0.2
8
0.
0.4
7
0.
0.4
0.3
9
0.
0.5
0.3
0. 1
0.8
0.1
0.6
0.4
0.6
u=FX(x)
(a)
0.8
0.3
0.2
0.1
0.2
0.4
0.6
0.8
0.1
u=FX(x)
(b)
En estas condiciones, se hace necesario introducir en los modelos otras dependencias que se
encarguen de medir esa relacin desconocida entre X e Y que no tiene por qu ser cuantificable
por un nico parmetro. A la vista del anlisis descriptivo de los datos de llamadas, definir
modelos en los que, adems de las llamadas en movilidad, intervenga una dependencia temporal
parece lo ms intuitivo. Desde el enfoque de datos discretos, existe una amplia gama de
modelos estadsticos con capacidad de prediccin como modelos lineales generalizados,
modelos paramtricos, etc. En los siguientes apartados se van a plantear una serie de modelos
empleando ecuaciones paramtricas para modelar la relacin entre las variables Y (nmero de
vehculos) y X (nmero de llamadas en movilidad), junto a otros trminos dependientes, de cara
a que los modelos puedan ser utilizados con un objetivo predictivo.
Para la eleccin del modelo ms adecuado parece conveniente decidirse por aqul que mejores
resultados proporcione. Como se ha comentado, para abordar el problema se dispone de un
histrico dado por una muestra bidimensional que relaciona ambas variables. En este sentido,
para cada uno de los das observados se dispone de una muestra formada por 13 parejas de
datos: nmero de llamadas y nmero de vehculos registrados cada hora desde las 8:00 a las
21:00. Con objeto de disponer de un tamao de muestra suficiente para ajustar un modelo, se
obtuvo para cada punto kilomtrico una muestra mayor mediante la agregacin de los D das
observados (D=18) en una sola muestra. Finalmente, el tamao de la muestra resultante,
{(x1,y1), ..., (xn,yn)}, ha sido de n=234 registros (1813) para cada uno de los K=12 puntos
kilomtricos estudiados. De modo que el estudio predictivo har uso de esas variables para
ajustar los parmetros de los modelos. Esos parmetros se encargarn de cuantificar
adecuadamente la relacin entre las variables de cara a que el modelo proporcione medidas
admisibles de volmenes de vehculos sin necesidad de instalar una estacin de aforo en la zona.
85
Lgicamente es imposible predecir con total exactitud, por lo que los resultados obtenidos por
los modelos contendrn ciertos errores de prediccin. En este sentido, es importante indicar que
no todo el histrico ser utilizado para el proceso de estimacin de parmetros, ya que una parte
del histrico, denominada conjunto de validacin, estar reservada para ser utilizada con
posterioridad en la evaluacin de las predicciones realizadas, no participando en el ajuste. Por lo
general, se reserva una tercera o cuarta parte de los datos disponibles para validar los resultados.
El resto del histrico se utilizar para realizar los ajustes y recibe el nombre de conjunto de
entrenamiento.
En la notacin de los modelos que a continuacin se van a formular se emplear el ndice i para
designar el intervalo horario, d para el da observado, y k para el punto kilomtrico o frontera.
4.3.5.2
86
llamadas, como probabilidad de hacer una llamada o su duracin, segn el intervalo horario ti y
la frontera observada k. Cabe resaltar que la naturaleza de las celdas estudiadas, alejadas de
entornos urbanos, permite suponer que prcticamente la totalidad de las llamadas en movilidad
observadas el intervalo horario ti y la frontera k, nll mov(ti, k), sern realizadas por usuarios en
movimiento asociados al trfico vehicular sobre las vas existentes en esa frontera. Estos
usuarios constituyen, por tanto, una muestra de la poblacin de vehculos que han cruzado la
frontera k en cada intervalo ti, nveh(ti, k).
Respecto al primer tipo de llamadas en movilidad (suceso M), se hace necesario introducir un
trmino que refleje la importancia de la probabilidad de que un telfono del operador
monitorizado, y a bordo de un vehculo, realice dos llamadas en el intervalo horario ti. Teniendo
en cuenta que el evento hacer dos llamadas a bordo de vehculo con el operador de inters es
una superposicin de dos realizaciones independientes del evento Ahacer una llamada a
bordo de vehculo con el operador de inters, y considerando que este evento A tiene una
probabilidad de xito que vara con el tiempo, PAPll veh(ti), entonces la probabilidad de xito del
suceso M se puede aproximar por Pll veh(ti)Pll veh(ti). Dado que se asume que la poblacin que
genera las llamadas en movilidad son el conjunto de vehculos que han cruzado la frontera,
nveh(ti, k), el nmero de llamadas en movilidad originadas por el suceso M vendr dado por:
nM (ti , k ) = nveh (ti , k )PM = nveh (ti , k )Pll veh (ti )Pll veh (ti ) nveh (ti , k )Pll2veh (ti )
(7)
Para el segundo tipo de llamada en movilidad (suceso L), el planteamiento es similar pero
introduciendo un trmino relacionado con la probabilidad de que la llamada ejecute handover.
As pues, la probabilidad de xito de este suceso L precisa de dos terminos; por un lado, la antes
mencionada probabilidad de Ahacer una llamada a bordo de vehculo con el operador de
inters, y por otro, la probabilidad de que dicha llamada requiera handover, Ph. Respecto a ello,
la probabilidad de que sobre una llamada se ejecute un handover viene dada por el hecho de que
la duracin de la misma, td, supere el tiempo de permanencia en la celda, tp. Asumiendo que la
poblacin que genera las llamadas en movilidad es el conjunto de vehculos que han cruzado la
frontera, nveh(ti, k), el nmero de llamadas en movilidad generadas en las condiciones asociadas
al suceso L vendra definido como:
nL (ti , k ) = nveh (ti , k )PL = nveh (ti , k )Pll veh (ti )Ph (ti , k )
(8)
nll mov (ti , k ) nveh (ti , k )Pll2veh (ti ) nveh (ti , k )Pll veh (ti )Ph (ti , k )
nveh (ti , k )[ Pll2veh (ti ) Pll veh (ti )Ph (ti , k )]
87
(9)
Esta expresin es obtenida considerando despreciable la probabilidad de sucesos tales como que
se realicen dos llamadas desde el mismo vehculo en la misma celda, o que se llame en cada
celda efectuando adicionalmente el proceso de handover. Dichos sucesos, posibles en la
realidad, no llegaron a presentarse en ninguna ocasin sobre la muestra tomada en los puntos
monitorizados, por lo que no fueron considerados como situaciones en movilidad factibles.
Atendiendo a la expresin anterior, la probabilidad de que un terminal efecte una llamada en
movilidad, denominada P(ti,k), puede aproximarse por:
P (ti , k ) Pll2veh (ti ) Pll veh (ti ) Ph (ti , k )
(10)
Entonces, el nmero de vehculos que cruzan una frontera k en el intervalo horario ti vendr
dado por:
nll mov (ti , k ) P (ti , k )nveh (ti , k ) nveh (ti , k )
(11)
Esta expresin proporciona un valor para el volumen de vehculos que pasan por frontera entre
celdas en funcin de las llamadas en movilidad detectadas y otras variables relacionadas con las
llamadas. El nmero de llamadas en movilidad asociadas al cruce de una frontera en el intervalo
horario dado, nll mov(ti, k), se obtiene mediante un anlisis de los registros de llamadas realizadas
sobre las celdas implicadas en la frontera k, proporcionados por el operador. Para los otros
trminos: probabilidad de que un vehculo haga una llamada y probabilidad de handover, Pll veh y
Ph respectivamente, se precisa de un tratamiento estadstico adicional atendiendo a la
dependencia temporal de las caractersticas de las llamadas. Los siguientes puntos exponen en
detalle el mtodo desarrollado para la obtencin de los citados trminos.
Probabilidad de hacer una llamada a bordo de vehculo con el operador de inters, Pll veh(ti)
Es habitual que un conjunto de datos siga algn tipo de distribucin estadstica. Definir
adecuadamente la probabilidad de xito de algn suceso puede resultar tedioso si no se conoce
esa distribucin. La propia representacin de los valores nos puede sugerir el empleo de alguna
de las muchas distribuciones conocidas (Poisson, Uniforme, Normal, etc.), determinando as la
que mejor se ajuste a los datos. Sin embargo, hay algunas formas de acercarse a tal trmino de
probabilidad sin necesidad del conocimiento previo de la distribucin; tal es el caso de un
procedimiento emprico en el cual la asignacin de las probabilidades de los sucesos de inters
se basa en la informacin observada. En esos casos, se requiere realizar un gran nmero de
experimentos para hallar la probabilidad de xito del suceso, en nuestro caso la probabilidad de
88
hacer una llamada a bordo de un vehculo con el operador monitorizado (Vodafone). Bajo este
enfoque emprico, la probabilidad se determina sobre la base de la proporcin de veces que
ocurre un evento favorable o xitos respecto al total de resultados posibles.
N veces que ocurre el evento de inters
N total de resultados posibles
veh(ti),
operador realizadas a bordo de vehculos en el intervalo horario ti divido por el nmero de total
de vehculos que han pasado en dicho intervalo:
N veces que ocurre el evento de inters
N llamadas realizadas por vehculos
n
d 1 k 1
(ti , d , k ) 2 nM (ti , d , k )
n
d 1 k 1
veh
(12)
(ti , d , k )
siendo K el nmero total de fronteras estudiadas y D el nmero total de das observados. Como
se puede notar, se ha establecido una dependencia segn el intervalo horario ti considerado. A la
vista de las conclusiones alcanzadas en la seccin 4.3.3, la fuerte dependencia temporal
existente en el comportamiento de los usuarios para la realizacin de llamadas tambin influye
en esta probabilidad. La Figura 4-12, que representa la probabilidad Pll
veh(ti)
obtenida
empricamente, refleja tal variacin con el tiempo. Cabe destacar que esta probabilidad Pll veh(ti)
es vlida para cualquiera de las fronteras monitorizadas ya que el evento hacer llamada a bordo
de vehculo con el operador de inters es independiente de la celda en la que se haga, salvo
quiz zonas agrestes de difcil conduccin en las que la incomodidad del viaje hace poco
deseable la realizacin de una llamada. No obstante, sera interesante recalibrar dicha
89
probabilidad cada cierto tiempo para atender posibles modificaciones en la red viaria, como
creacin de nuevas vas cruzando una frontera, o cambios en la conducta de los usuarios al
realizar llamadas.
0.015
0.01
0.005
8h-9h
9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h
Intervalo horario ti
Figura 4-12: Probabilidad de hacer una llamada a bordo de vehculo.
Se aprecia que esta probabilidad de hacer una llamada a bordo de un vehculo por parte de
usuarios en movilidad sigue en gran medida los patrones de la actividad telefnica diaria
reflejados en la Figura 4-3 (cualquier usuario). El pico de maana se centra en torno al mismo
rango horario en ambos casos; mientras que el pico de la tarde est ms suavizado en el caso de
llamadas realizadas por usuarios en movilidad. Esta caracterstica puede tener su origen en que,
durante la jornada laboral, el hecho de estar en movimiento no impide que los usuarios realicen
llamadas cuando as lo requieran. Mientras que, fuera de ese horario laboral, el usuario es ms
reacio a llamar mientras est en movimiento. De ah la menor tendencia a realizar llamadas
fuera de la jornada laboral en el caso de usuarios en movimiento.
Probabilidad de handover Ph(t i, k)
Se considera a continuacin un escenario de handover simplificado (Sallent et al., 2003),
suponiendo un sistema celular regular con celdas por las cuales discurren una serie de vas. Se
modela la distancia que recorre un mvil dentro de una celda antes de cruzar la frontera de esa
celda como una variable aleatoria con distribucin uniforme en el intervalo [0, L] metros. El
tiempo de permanencia en la celda, tp, si el mvil se desplaza a velocidad uniforme de V m/s
ser tambin una variable aleatoria con distribucin uniforme en el intervalo tp [0, L/V]
segundos, de manera que su funcin de densidad de probabilidad vendr dada por:
f (t p )
1
L /V
L
t p 0,
V
(13)
Si la duracin de la llamada, td, puede modelarse como una variable aleatoria exponencial de
media Tc segundos, su correspondiente funcin de densidad de probabilidad se expresa como:
90
td
1
f (td ) e Tc
Tc
td 0,
(14)
La probabilidad de que dicho usuario deba efectuar un handover a lo largo de la llamada viene
dada por el hecho de que la duracin de la misma supere el tiempo de permanencia en la celda.
As, la probabilidad de handover puede calcularse a partir de un ejercicio de probabilidad
condicionada:
L
V
Ph P (td t p | t p ) f (t p ) dt p
(15)
tp
Tc
(16)
tp
Ph e
0
tp
Tc
L
V
f (t p ) e
tp
Tc
L
, finalmente se tiene que:
V Tc
1
1
L
dt p 1 e con
L /V
V Tc
(17)
Ph
0.6
0.4
0.2
0
4
5
6
7
Fac tor de movilidad =L/VT c
10
91
dentro de una celda hasta entrar en otra celda (cruzar la frontera), esta longitud depende de las
vas existentes dentro de la celda origen de la frontera. Algo similar ocurre con la velocidad, V,
donde su valor depende del tipo de va que tenga asociada (autova, carretera nacional,).
Aunque la velocidad podra oscilar para la misma va segn el intervalo horario debido, por
ejemplo, al nivel de saturacin que experimente, se considerar como uniforme dentro de la
celda origen de la frontera. Por ello, el valor de depender muy estrechamente de la frontera k
observada en trminos de longitud y velocidad asociada a la va que discurre por la celda origen
de esa frontera. De igual modo, teniendo en cuenta la dependencia temporal de la duracin de
las llamadas (apartado 4.3.3), tambin depender del intervalo horario analizado. As pues, el
valor de la probabilidad de handover ser funcin del intervalo horario y de la frontera, Ph(ti ,k,).
Para el clculo de la longitud L se podra realizar un estudio previo que utilizara informacin de
cobertura proporcionada por el operador, permitiendo definir, con ayuda de un GIS, la longitud
del tramo que debe recorrer un mvil dentro de una celda hasta entrar en otra. No obstante,
existen funcionalidades bsicas en la red que permiten conocer el identificador de la celda
(antena) a la que est conectado un telfono. De manera que, con ayuda de un GPS, es posible
establecer una correspondencia entre punto kilomtrico de una va y celda que le da servicio. En
base a esto, se puede conocer no slo la longitud del tramo que recorre un mvil dentro de una
celda, sino la velocidad media de viaje por dicho tramo en cualquier momento del da, todo ello
sin necesitar que el operador revele informacin confidencial de cobertura. Con esta sencilla
aplicacin, implementada sobre dispositivos mviles (BlackBerry, Windows Mobile,), se
recorreran varias veces los tramos de va mediante la tcnica de coche flotante, a fin de poder
caracterizar la celda origen de cada frontera k en trminos de longitud L y velocidad V.
Por ltimo, faltara estimar la duracin media de la llamada Tc para determinar completamente
el valor de y, por consiguiente, de la probabilidad de handover. Esta duracin es posible
obtenerla empricamente mediante el anlisis de los datos de llamadas proporcionados por el
operador. Considerando la dependencia temporal puesta de manifiesto en el apartado 4.3.3, se
determina un valor de duracin media de llamadas segn el intervalo horario considerado, Tc(ti).
Esa duracin dependiente del intervalo ti, junto con los valores de velocidad y longitud
correspondientes al tramo de va que discurre por la celda origen de la frontera k, permiten
definir la probabilidad de handover como una funcin variable con el tiempo y la frontera,
Ph(ti,k,). La Figura 4-14 muestra la probabilidad de handover alcanzada en la celda origen de
una frontera, centrndose en el intervalo 8:0021:00 segn lo expuesto en el apartado 4.3.4.
92
0.06
0.05
Ph(ti, k )
0.04
0.03
0.02
0.01
0
8h-9h
9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h
Intervalo horario ti
(ti , k )
siendo (ti , k )
Lk
Vk Tc (ti )
(18)
a x(ti , k )
Lk
d , con (ti , k )
b
Vk Tc (ti )
1
1 e b2 ( ti ,k ) c
Pll2veh (ti ) Pll veh (ti )
(ti , k )
(19)
93
una frontera entre esas celdas, nveh(ti, k). La naturaleza de los trminos y variables implicadas en
el modelo condiciona que la variable de salida sea funcin del tiempo y el espacio.
Para estimar los parmetros {a,b1,b2,c,d} del modelo existen diferentes procedimientos de
ajuste, los cuales utilizaran la parte del histrico que relaciona ambas variables denominada
conjunto de entrenamiento para fijar los parmetros. En este caso, se va a emplear una tcnica
de ajuste de parmetros tratando de satisfacer algn criterio de ajuste. El criterio empleado
atiende al error relativo, a la vista de que no posee la misma importancia que una estimacin
exceda en 50 sobre un valor real de 100 que sobre uno de 1000, siendo ms grave la primera
situacin que la ltima. As mismo, dado que en este caso tiene la misma importancia errar por
exceso o por defecto, el valor absoluto tambin debe ser considerado en el criterio. As pues, el
ajuste buscar la minimizacin de la suma del valor absoluto del error relativo entre valores
observados y modelados, resolviendo el siguiente problema de optimizacin:
Minimizar
a ,b1 ,b2 , c , d
y j y j
j 1
yj
Modelos adicionales
94
funcin del tiempo de una forma diferenciada. Ya se coment anteriormente que los usuarios
poseen diferentes hbitos en la realizacin de llamadas segn la hora considerada debido a
criterios como tarifas u horario admisible de realizacin de llamada. Mientras que, en relacin
con el flujo de vehculos, ste flucta con el tiempo atendiendo a criterios diferentes, como hora
punta por inicio de jornada laboral, hora valle, etc.
50
800
Vehculos
Llamadas
40
30
20
400
200
10
0
600
0 1 2 3 4 5 6 7 8 9 1011121314151617181920212223
Intervalo horario ti
Intervalo horario ti
Figura 4-15: Evolucin del n de llamadas y de vehculos en una frontera segn el intervalo horario.
nveh (ti )
, con
f v (ti )
nveh
nveh (ti ) es el n medio de vehculos que pasan en el intervalo ti de cada uno de los
D K
1
nveh (ti , d , k )
D K d 1 k 1
es el n medio de vehculos que han pasado desde las 8h hasta las 21h,
1 21h
nveh (ti ), siendo H el n de intervalos horarios entre 8h-21h
H i 8 h
95
El factor de intensidad es, por tanto, la relacin entre el nmero medio de vehculos contados en
un periodo horario ti y el nmero medio del total de vehculos contados desde las 8:00 hasta las
21:00. As pues, este factor se encarga de regular las observaciones en cada periodo horario
segn su importancia relativa dentro de los periodos horarios considerados. Por ejemplo, en
intervalos horarios donde el flujo de trfico tiende a ser mayor debido a hora punta, el factor de
intensidad fv har que las observaciones destaquen sobre las de otros intervalos. La Figura 4-16
8h-9h 9h-10h 10h-11h11h-12h 12h-13h 13h-14h 14h-15h15h-16h 16h-17h 17h-18h18h-19h 19h-20h 20h-21h
Intervalo horario t i
Figura 4-16: Factor de intensidad del paso de vehculos segn el intervalo horario ti.
gll (ti )
Pll veh (ti ), es la probabilidad de hacer una llamada con el operador de inters
ll
veh
ll veh i
H i 8 h
96
Cabe destacar que ambos factores de intensidad fv (ti) y gll (ti), obtenidos empricamente con
datos observados, se pueden considerar vlidos durante un cierto tiempo (p.ej: 5 meses), debido
a que las caractersticas de la muestra son ms o menos estables. No obstante, sera aconsejable
realizar un calibrado de ambos factores peridicamente, a fin de actualizarlos con posibles
8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h
Intervalo horario t i
Figura 4-17: Factor de intensidad del paso de vehculos segn el intervalo horario ti.
97
y j y j
j 1
yj
La resolucin de este problema para cada uno de los modelos, implementada sobre Matlab, ha
permitido inferir los parmetros que caracterizan los modelos de prediccin. Estos cinco
modelos, junto al definido en (19), enumerado como modelo 6 y 6 f ( x, ti , k ) , sern
evaluados y comparados entre s para seleccionar el que proporcione mejores predicciones del
nmero de vehculos que atraviesan una frontera asociado a llamadas en movilidad en ella.
Introduccin
Para abordar la evaluacin y comparacin entre los seis modelos anteriormente planteados se ha
utilizado el conjunto de validacin, formado por una parte del histrico de valores observados
reservada para este fin. Dada la variedad de los modelos, esta comparacin se ha realizado en
base a criterios tales como las medidas de error clsicas (error medio, error absoluto y relativo,
etc.) o la evaluacin de la distribucin acumulada del error relativo absoluto en trminos de
percentiles. Incluso, se han empleado otros criterios ms minuciosos, como la correlacin por
98
Medidas de error
Cuando se utilizan modelos de prediccin, es inevitable que el resultado est afectado por
errores debidos a los propios modelos, puesto que stos siempre llevan implcita alguna
indeterminacin. Dado que se dispone de un histrico de valores observados yi con los que
comparar las predicciones yi hechas por cada uno de los modelos, es posible efectuar un
anlisis directo de las medidas de error. Los estadsticos ms comunes a la hora de cuantificar el
error son el error medio, el error absoluto medio y el error relativo medio. A la vista de que
presenta la misma gravedad errar en una prediccin tanto en exceso como por defecto, el error
relativo se ha estudiado en valor absoluto. La Tabla 4-4 muestra esas medidas de error para cada
uno de los modelos empleando los valores observados y las predicciones. Tambin se han
incluido otras medidas relacionadas con los valores mximos del error absoluto y del error
relativo en valor absoluto que se han encontrado entre los pares de datos.
Tabla 4-4: Medidas de error para cada modelo.
ME
MAE
MARE
Error
absoluto
mximo
Error relativo
absoluto
mximo
Modelo 1
118.5430
237.2021
0.2318
Modelo 2
103.8163
210.6609
0.2039
1488.0287
0.9761
0.8302
Modelo 3
106.6021
210.0152
0.2032
0.8529
Modelo 4
112.8573
223.9775
0.2169
1.0103
Modelo 5
113.5008
223.2356
0.2157
1.0723
Modelo 6
95.1117
203.5965
0.2000
0.9985
(ME: error medio; MAE: Error absoluto medio; MARE: Error relativo medio en valor absoluto)
En base a estas medidas, los mejores modelos son el 6, 2 y 3. Conviene destacar que no es
posible establecer un orden claro de prioridad entre esos tres modelos dado que sus medidas de
99
error son muy similares entre ellas. Las Figura 4-18 y Figura 4-19 muestran, respectivamente, el
error relativo medio en valor absoluto y el error absoluto medio para cada modelo atendiendo al
periodo horario, aprecindose que los modelos 2, 3 y 6 son los que presentan mejor
comportamiento.
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
8h-9h
9h-10h
10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h
Intervalo horario t i
y1 =afvgll
y2 =(a+bx)fvgll
y3 =(a+bx+cx2 )fvgll
y4 =(a+bx)
y5 =(a+bx+cx2 )
y6 = f (x,ti,k))
Figura 4-18: Evolucin horaria del error relativo en valor absoluto para cada uno de los modelos.
400
350
300
250
200
150
100
50
0
8h-9h
9h-10h
10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h
Intervalo horario t i
y1 =afvgll
y2 =(a+bx)fvgll
y3 =(a+bx+cx2 )fvgll
y4 =(a+bx)
y5 =(a+bx+cx2 )
y6 = f (x,ti,k))
Figura 4-19: Evolucin horaria del error absoluto para cada uno de los modelos.
4.3.6.3
100
porcentaje. Analizando la distribucin de frecuencias del error relativo en valor absoluto para
cada uno de los modelos, los percentiles alcanzados se muestran en la siguiente tabla:
Tabla 4-5: Percentiles del error relativo en valor absoluto para cada modelo.
Percentiles
25
30
50
60
75
85
100
Los mejores modelos sern aquellos que posean valores ms pequeos de error relativo en valor
absoluto para cada uno de los percentiles. Numricamente, se observa que los modelos 6, 3 y 2
destacan en estos trminos respecto a los dems. En ellos, por ejemplo, el percentil 60 refleja
que el 60% de las predicciones alcanzaron errores relativos en valor absoluto inferiores a 0.21.
Esto tambin se aprecia ms claramente a nivel grfico. En este sentido, la Figura 4-20 muestra
la distribucin acumulada del error relativo en valor absoluto conseguido por cada modelo. El
eje vertical est graduado en percentiles, por ello la mediana se alcanza en el percentil 50. Se
observa que los mejores modelos son, por orden de preferencia, el modelo 6, el 3 y el 2, dado
que la curva para el resto de modelos es visiblemente inferior a la de esos tres modelos.
Percentiles
100
75
50
25
0
10
20
30
80
50
60
70
80
90
100
110
120
Percentiles
85
80
75
70
65
60
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
y2 =(a+bx)fvgll
y3 =(a+bx+cx2 )fvgll
y4 =(a+bx)
y5 =(a+bx+cx2 )
y6 = f (x,ti,k))
Figura 4-20: Distribucin acumulada del valor absoluto del error relativo en porcentajes (arriba).
Zoom en torno a los valores de error relativo absoluto 15-30% (abajo).
4.3.6.4
101
Otro criterio a tener en cuenta dentro de la comparativa de modelos es la correlacin entre las
predicciones y los valores reales. Se considera que dos variables estn correlacionadas cuando
los valores de una de ellas varan sistemticamente con respecto a los valores de la otra. En este
sentido, si tenemos dos variables (A y B) existe correlacin si al aumentar los valores de A lo
hacen tambin los de B y viceversa. Aplicando esto al conjunto de valores observados {yi} y
estimados { yi }, se puede evaluar la calidad de las predicciones examinando si existe
correlacin. El coeficiente de correlacin lineal, o coeficiente de Pearson, es el instrumento
tradicionalmente utilizado para medir la dependencia entre variables aleatorias. Si r = 0, no
existe relacin lineal. Pero esto no implica necesariamente una independencia total entre las dos
variables. Puede ocurrir que, an con r prximo a 0, la variacin de una de ellas influya en el
valor que pueda tomar la otra caso que existan relaciones no lineales entre las dos variables.
Estas limitaciones no existen si se utiliza la correlacin entre rangos, la cual considera la
concordancia de los datos. El concepto de concordancia est relacionado con la probabilidad de
encontrar valores altos (o bajos) de una variable asociados a valores altos (o bajos) de la otra
variable. Si esto no ocurre, las variables son discordantes. De modo que la concordancia detecta
relaciones no lineales que la correlacin no puede detectar. En consecuencia, las medidas de
correlacin que trabajan con rangos no presentan las limitaciones de la correlacin lineal.
Dentro de estas medidas destaca el denominado coeficiente de correlacin de Spearman.
Se procede a analizar la calidad de las predicciones yi de cada modelo analizando la
dependencia en trminos de correlacin por rango de Spearman y correlacin lineal o de
Pearson. La siguiente tabla muestra estas correlaciones para cada uno de los modelos.
Tabla 4-6: Correlacin por rango (Spearman) y lineal (Pearson) entre { yi , yi } para cada modelo.
Correlacin
por rango
Correlacin
lineal
Modelo 1
Modelo 2
Modelo 3
Modelo 4
Modelo 5
Modelo 6
0.25102
0.51398
0.51375
0.39904
0.39904
0.56623
0.28436
0.4698
0.48134
0.33953
0.34893
0.53333
En trminos de correlacin por rango, destacan claramente sobre los dems los modelos 6, 2 y
3; especialmente el modelo 6, alcanzando valores elevados para el tamao de la muestra
considerada. Respecto al coeficiente de correlacin lineal, ocurre algo similar. Por ello, se
establece que los mejores modelos bajo este enfoque de correlacin son el modelo 6, seguido de
los modelos 2 y 3.
102
4.3.6.5
(20)
yi yi
.
yi
Para determinar el LLF se precisa conocer la funcin de verosimilitud del conjunto de medidas
del error relativo, en la cual interviene la funcin de densidad de probabilidad seguida. La
construccin de esta funcin se simplifica, en gran medida, si se asume que la distribucin del
conjunto de datos es normal. Sin embargo, realizando un test de normalidad, se demuestra que
los datos analizados, en este caso errores relativos entre los valores observados y estimados por
103
cada uno de los modelos, no siguen una distribucin normal. Esta afirmacin se puede
comprobar grficamente mediante el test grfico de normalidad mostrado en la Figura 4-21. En
ella se representa la probabilidad acumulada emprica de cada conjunto de datos. Si los puntos
se ajustasen muy bien a la lnea recta sera seal de que se acepta la bondad de ajuste y los datos
provienen de una distribucin normal. Otras funciones de densidad de probabilidad
introduciran curvatura en el grfico, siendo esto lo que ocurre para las medidas consideradas de
error relativo.
104
generado por Knuth (Figura 4-22), la altura de las barras mantiene la tendencia de subida o
bajada respecto del mximo. Por ello, se toma el criterio de Knuth para la discretizacin del
error relativo y la obtencin de las funciones de densidad de probabilidad que permitan calcular
la verosimilitud junto a los estadsticos AIC y BIC.
y1 =afvgll
y3 =(a+bx+cx2 )fvgll
y2 =(a+bx)fvgll
600
600
600
400
400
400
200
200
200
0
-1
0
-1
nbins ptimo 20
nbins ptimo 14
y4 =(a+bx)
y5 =(a+bx+cx2 )
0
-1
600
600
400
400
400
200
200
200
-1
0
-2
nbins ptimo 20
-1
y6 = f (x,ti,k))
600
0
-2
nbins ptimo 14
0
-1
nbins ptimo 14
nbins ptimo 21
Figura 4-22: Histograma del error relativo de cada modelo segn el n de bins definido por Knuth.
y1 =afvgll
y3 =(a+bx+cx2 )fvgll
y2 =(a+bx)fvgll
150
150
100
100
400
300
200
50
50
0
-1
100
0
-1
nbins ptimo 65
nbins ptimo 63
y4 =(a+bx)
y5 =(a+bx+cx2 )
0
-1
200
200
300
150
150
200
100
100
100
50
50
-1
nbins ptimo 29
0
-2
-1
nbins ptimo 49
y6 = f (x,ti,k))
400
0
-2
nbins ptimo 28
0
-1
nbins ptimo 67
Figura 4-23: Histograma del error relativo de cada modelo segn el n de bins definido por Stone.
105
As, tras realizar el proceso y obtener, posteriormente, los estadsticos AIC y BIC, se obtienen
los valores mostrados en la Tabla 4-7.
Tabla 4-7: Valores de Logaritmo de la verosimilitud (LLF), AIC y BIC del conjunto de errores
relativos de cada modelo, junto al nmero de parmetros de cada modelo.
Modelo 1
Modelo 2
Modelo 3
Modelo 4
Modelo 5
Modelo 6
LLF
-7345
-6423
-6356
-7082
-6175
-7113
AIC
14697
12854
12721
14167
12357
14237
BIC
14714
12877
12751
14179
12375
14267
N param
3
4
5
2
3
5
Dado que los mejores modelos son los que conseguen el mayor valor de LLF, y menor valor de
AIC y BIC, el ranking de modelos segn cada criterio es:
Ranking de mejor modelo por Log-Likelihood:
532461
532461
532461
Es necesario comentar que estos criterios de seleccin de modelo tambin consideran el nmero
de parmetros existente, penalizando aquellos que tengan muchos parmetros. De ah que, en el
orden de prioridad anterior, los modelos 5 y 4 destaquen en la seleccin de modelos. Estos
modelos 4 y 5, junto al modelo 1, son los que menos parmetros poseen. Sin embargo,
atendiendo a los criterios estudiados en los anteriores apartados (medidas directas de error,
percentiles y correlacin por rango y lineal), parece conveniente que los modelos 1, 4 y 5 sean
descartados del conjunto de modelos admisibles. En consecuencia, la seleccin de modelos se
establecera entre los modelos 2, 3 y 6, siendo el nuevo orden de prioridad:
Ranking de mejor modelo por Log-Likelihood:
326
326
326
4.3.6.6
Anlisis grfico
106
ID Frontera 1
1400
[veh]
1200
1000
800
600
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
16h-17h
17h-18h
18h-19h
19h-20h
20h-21h
Intervalo horario t i
ID Frontera 2
1600
[veh]
1400
1200
1000
800
600
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
16h-17h
17h-18h
18h-19h
19h-20h
20h-21h
Intervalo horario t i
y1 =afvgll
y reales
y2 =(a+bx)fvgll
y3 =(a+bx+cx2 )fvgll
y4 =(a+bx)
y5 =(a+bx+cx2 )
y6 = f (x,ti,k))
Figura 4-24: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 1 y la frontera 2.
ID Frontera 3
1000
[veh]
900
800
700
600
500
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
16h-17h
17h-18h
18h-19h
19h-20h
20h-21h
16h-17h
17h-18h
18h-19h
19h-20h
20h-21h
Intervalo horario t i
ID Frontera 4
2500
[veh]
2000
1500
1000
500
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
Intervalo horario t i
y reales
y1 =afvgll
y2 =(a+bx)fvgll
y3 =(a+bx+cx2 )fvgll
y4 =(a+bx)
y5 =(a+bx+cx2 )
y6 = f (x,ti,k))
Figura 4-25: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 3 y la frontera 4.
107
ID Frontera 5
1100
[veh]
1000
900
800
700
600
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
16h-17h
17h-18h
18h-19h
19h-20h
20h-21h
Intervalo horario t i
ID Frontera 6
1200
1100
[veh]
1000
900
800
700
600
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
16h-17h
17h-18h
18h-19h
19h-20h
20h-21h
Intervalo horario t i
y1 =afvgll
y reales
y2 =(a+bx)fvgll
y3 =(a+bx+cx2 )fvgll
y4 =(a+bx)
y5 =(a+bx+cx2 )
y6 = f (x,ti,k))
Figura 4-26: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 5 y la frontera 6 en cada periodo horario.
ID Frontera 7
1600
[veh]
1400
1200
1000
800
600
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
16h-17h
17h-18h
18h-19h
19h-20h
20h-21h
Intervalo horario t i
ID Frontera 8
1200
1100
[veh]
1000
900
800
700
600
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
16h-17h
17h-18h
18h-19h
19h-20h
20h-21h
Intervalo horario t i
y reales
y1 =afvgll
y2 =(a+bx)fvgll
y3 =(a+bx+cx2 )fvgll
y4 =(a+bx)
y5 =(a+bx+cx2 )
y6 = f (x,ti,k))
Figura 4-27: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 7 y la frontera 8 en cada periodo horario.
108
ID Frontera 9
1000
950
[veh]
900
850
800
750
700
650
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
16h-17h
17h-18h
18h-19h
19h-20h
20h-21h
Intervalo horario t i
ID Frontera 10
1100
[veh]
1000
900
800
700
600
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
16h-17h
17h-18h
18h-19h
19h-20h
20h-21h
Intervalo horario t i
y1 =afvgll
y reales
y2 =(a+bx)fvgll
y3 =(a+bx+cx2 )fvgll
y4 =(a+bx)
y5 =(a+bx+cx2 )
y6 = f (x,ti,k))
Figura 4-28: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 9 y la frontera 10 en cada periodo horario.
ID Frontera 11
1000
900
[veh]
800
700
600
500
400
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
16h-17h
17h-18h
16h-17h
17h-18h
18h-19h
19h-20h
20h-21h
Intervalo horario t i
ID Frontera 12
2500
[veh]
2000
1500
1000
500
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
18h-19h
19h-20h
20h-21h
Intervalo horario t i
y reales
y1 =afvgll
y2 =(a+bx)fvgll
y3 =(a+bx+cx2 )fvgll
y4 =(a+bx)
y5 =(a+bx+cx2 )
y6 = f (x,ti,k))
Figura 4-29: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 11 y la frontera 12 en cada periodo horario.
109
[veh]
1200
1000
800
600
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
16h-17h
17h-18h
18h-19h
19h-20h
20h-21h
16h-17h
17h-18h
18h-19h
19h-20h
20h-21h
Intervalo horario t i
ID Frontera 2
1600
[veh]
1400
1200
1000
800
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
Intervalo horario t i
y reales
y2 =(a+bx)fvgll
y3 =(a+bx+cx2 )fvgll
y6 = f (x,ti,k))
Figura 4-30: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan la
frontera 1 y la frontera 2.
110
ID Frontera 3
1000
[veh]
900
800
700
600
500
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
16h-17h
17h-18h
18h-19h
19h-20h
20h-21h
16h-17h
17h-18h
18h-19h
19h-20h
20h-21h
Intervalo horario t i
ID Frontera 4
2500
[veh]
2000
1500
1000
500
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
Intervalo horario t i
y reales
y2 =(a+bx)fvgll
y3 =(a+bx+cx2 )fvgll
y6 = f (x,ti,k))
Figura 4-31: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan la
frontera 3 y la frontera 4.
ID Frontera 5
1100
[veh]
1000
900
800
700
600
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
16h-17h
17h-18h
18h-19h
19h-20h
16h-17h
17h-18h
18h-19h
19h-20h
20h-21h
Intervalo horario t i
ID Frontera 6
1200
1100
[veh]
1000
900
800
700
600
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
20h-21h
Intervalo horario t i
y reales
y2 =(a+bx)fvgll
y3 =(a+bx+cx2 )fvgll
y6 = f (x,ti,k))
Figura 4-32: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan la
frontera 5 y la frontera 6 en cada periodo horario.
111
ID Frontera 7
1600
[veh]
1400
1200
1000
800
600
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
16h-17h
17h-18h
18h-19h
19h-20h
20h-21h
Intervalo horario t i
ID Frontera 8
1200
1100
[veh]
1000
900
800
700
600
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
16h-17h
17h-18h
18h-19h
19h-20h
20h-21h
Intervalo horario t i
y reales
y2 =(a+bx)fvgll
y3 =(a+bx+cx2 )fvgll
y6 = f (x,ti,k))
Figura 4-33: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan la
frontera 7 y la frontera 8 en cada periodo horario.
ID Frontera 9
1000
950
[veh]
900
850
800
750
700
650
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
16h-17h
17h-18h
18h-19h
19h-20h
20h-21h
16h-17h
17h-18h
18h-19h
19h-20h
20h-21h
Intervalo horario t i
ID Frontera 10
1050
1000
[veh]
950
900
850
800
750
700
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
Intervalo horario t i
y reales
y2 =(a+bx)fvgll
y3 =(a+bx+cx2 )fvgll
y6 = f (x,ti,k))
Figura 4-34: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan la
frontera 9 y la frontera 10 en cada periodo horario.
112
ID Frontera 11
900
[veh]
800
700
600
500
400
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
16h-17h
17h-18h
18h-19h
19h-20h
20h-21h
16h-17h
17h-18h
18h-19h
19h-20h
20h-21h
Intervalo horario t i
ID Frontera 12
2500
[veh]
2000
1500
1000
500
8h-9h
9h-10h
10h-11h
11h-12h
12h-13h
13h-14h
14h-15h
15h-16h
Intervalo horario t i
y reales
y2 =(a+bx)fvgll
y3 =(a+bx+cx2 )fvgll
y6 = f (x,ti,k))
Figura 4-35: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan la
frontera 11 y la frontera 12 en cada periodo horario.
4.3.7 Conclusiones
En este Captulo se ha presentado una metodologa para estimar volmenes de vehculos que
cruzan una frontera entre celdas en funcin de datos de una red de telefona mvil. Tras discutir
la informacin necesaria para este objetivo, se han desarrollado seis modelos para inferir dichos
volmenes empleando las llamadas en movilidad generadas en cada periodo horario, junto con
otra informacin asociada a las caractersticas de esas llamadas, tales como intensidad horaria
de llamadas, duracin, o incluso las caractersticas de las vas que cruzan la frontera. Los
modelos formulados han sido los siguientes:
Modelo 1: y1 (ti ) a f v (ti ) gll (ti ) .
Modelo 2: y 2 (ti ) [a b x(ti )] f v (ti ) gll (ti ), donde x(ti ) nll mov (ti , k ) .
Modelo 3: y3 (ti ) [a b x(ti ) c x 2 (ti )] f v (ti ) gll (ti ), donde x(ti ) nll mov (ti , k ) .
Modelo 4: y 4 (ti ) a b x(ti ), donde x(ti ) nll mov (ti , k ) .
Modelo 5: y5 (ti ) a b x(ti ) c x 2 (ti ), donde x(ti ) nll mov (ti , k ) .
Modelo 6: y 6 (ti , k )
113
a x(ti , k )
Lk
d , con (ti , k )
b
Vk Tc (ti )
1
1 e b2 (ti , k ) c
Pll2veh (ti ) Pll veh (ti )
(ti , k )
114
prestaciones, aunque en menor medida que las del modelo 1, sigan proporcionando resultados
limitados. En cambio, los modelos 2 y 3, los cuales s contienen informacin tanto de las
llamadas en movilidad como de variabilidad horaria, consiguen resultados eficientes,
demostrando una capacidad predictiva admisible para cualquier frontera entre celdas.
Por otro lado, el modelo 6 alcanza predicciones razonables de volmenes de vehculos aunque
exige realizar un estudio previo para caracterizar la frontera en trminos de velocidad y longitud
de las vas que discurren por la celda origen de cada frontera. Su forma funcional establece una
dependencia espacial con la frontera monitorizada, por lo que las predicciones no slo dependen
del nmero de llamadas en movilidad sino sobre qu frontera han sido observadas. Este modelo
es menos flexible que los modelos 2 y 3, dado que requiere un estudio previo de la frontera,
pero su capacidad predictiva, evaluada en anteriores apartados, tambin lo habilita como un
modelo apto para estimar volmenes de vehculos. En consecuencia, los modelos 2, 3 y 6 sern
los seleccionados para predecir volmenes de vehculos, por ser los que mejores prestaciones
alcanzan; mientras que los modelos 1, 4 y 5 son descartados como modelos viables para la
inferencia.
Observando los resultados respecto a la comparacin de los criterios estudiados sobre esos tres
modelos {2, 3 y 6}, resulta difcil establecer un orden de prioridad claro dado que:
i)
respecto a las medidas de error medio, error absoluto y error relativo, as como de
percentiles del error relativo en valor absoluto, aunque el modelo 6 presenta una
ligera ventaja respecto a los modelos 2 y 3, el orden de magnitud es muy similar en
los tres modelos;
115
finalmente se ha optado por considerar como igualmente viables los modelos 2, 3 y 6 para
estimar volmenes de vehculos, ponindose de manifiesto:
i)
ii)
iii)
Respecto a este ltimo punto, es necesario destacar lo siguiente. Los telfonos mviles se han
convertido hoy en da en un elemento indispensable en nuestra vida diaria, especialmente en lo
que respecta a nuestra movilidad. Los datos que los sistemas de telefona mvil generan para su
propio funcionamiento pueden arrojar cierta informacin relacionada con nuestros movimientos.
De ah que existan en la literatura diferentes estudios en los que se afirma que la telefona mvil
puede convertirse en una herramienta viable para la monitorizacin del trfico. En este Captulo
se han propuesto una serie de modelos para la estimacin de volmenes de vehculos en funcin
de, entre otras variables, llamadas realizadas por telfonos mviles bajo ciertas situaciones
expuestas en el apartado 4.3.3, denominadas llamadas en movilidad. La naturaleza de la
principal variable de entrada al modelo, llamadas en movilidad, posee una fuerte componente de
aleatoriedad. Este tipo de datos no representa el conjunto total de telfonos que han pasado por
una zona sino slo aquellos pertenecientes al operador de inters que, a su vez, han realizado
llamadas bajo ciertas condiciones. Ello condiciona en gran medida la representatividad de la
muestra y, por tanto, de los resultados. Pese a estas dificultades, los valores de prediccin de los
modelos finalmente seleccionados han alcanzado resultados razonables en comparacin con
valores observados por estaciones de aforo. En este sentido, la validacin experimental de los
modelos propuestos ha manifestado evidencias de que la telefona mvil, mediante llamadas en
movilidad, constituye una alternativa vlida para la determinacin de volmenes de vehculos
pasando por una zona frente a los procedimientos tradicionales basados en aforos.
Una aplicacin inmediata de esos volmenes inferidos de la telefona mvil se puede enfocar al
campo de las metodologas de ajuste de matrices de movilidad, tradicionalmente realizadas a
partir de aforos de la red, aunque realizando una serie de modificaciones que contemplen el
origen de los volmenes utilizados. El siguiente captulo aborda esta cuestin.
116
CAPTULO 5
APLICACIN A LA ESTIMACIN DE
MATRICES ORIGENDESTINO
5.1 INTRODUCCIN
Las matrices de viajes OrigenDestino (OD) son una fuente esencial de informacin
correspondiente a la demanda de transporte en todos los estudios de planificacin, gestin y
control del sistema de transporte. Estas matrices aportan informacin sobre el nmero de viajes
realizados entre una zona origen i y una destino j en un determinado intervalo de tiempo. Por
ello, para caracterizar el funcionamiento de un sistema de transporte es bsico conocer, entre
otros parmetros, la matriz origendestino. Histricamente, las matrices origendestino han sido
estimadas en base a tres metodologas diferentes:
1. Estimacin directa: Llevando a cabo un proceso de encuestacin, domiciliario o viario
(directo sobre una muestra de vehculos o por ficha proporcionada a conductores, o
indirecto por captacin de nmeros de matrculas).
2. Estimacin por modelos de demanda: Haciendo uso de un modelo de distribucin (e.g.:
modelo de gravedad).
3. Estimacin mediante conteos de trfico: Utilizando conteos de trfico a fin de actualizar
una matriz origendestino preexistente.
De las tres aproximaciones anteriores, la tercera alternativa es la ms profusamente utilizada en
las ltimas dcadas y ha dado lugar a innumerables contribuciones desde el trabajo pionero de
Low (1972). La metodologa en la que se basa exige, como prerrequisito, un conjunto de
conteos de flujos de trfico (volmenes observados) y una matriz OD previa, la cual puede ser
obtenida de algn estudio cronolgicamente anterior o de una encuestacin bsica que predefina
la estructura de la matriz final a obtener. Bajo el enfoque de esta metodologa, suelen utilizarse
modelos basados en optimizacin matemtica para intentar determinar la matriz de viajes ms
118
idnea. Dicha matriz debe ser consistente con la informacin contenida en los volmenes de
trfico en los arcos observados mediante el uso de una funcin objetivo a minimizar basada en
informacin con respecto a la matriz de viajes previa. En estos modelos basados, la matriz
previa se supone que es una matriz OD desactualizada a la que hay que realizar
ajustes/cambios para adecuarse a los volmenes observados cuando sea asignada a la red.
Recientemente, los sistemas de telefona mvil se estn considerando como una tecnologa
prometedora para la captura de datos de trfico debido a sus ventajas con respecto a las tcnicas
tradicionales. Respecto a ello, en el anterior captulo se present una metodologa que permita
inferir volmenes de trfico a partir de conteos de paso de telfonos por fronteras entre celdas.
Dichas fronteras pueden englobar uno o varios arcos de la red de transporte, proporcionando en
ese caso informacin agregada de volmenes para grupos de arcos en lugar de volmenes a
nivel de arco individual. Parece lgico que las metodologas de estimacin clsicas deban
adaptarse para incorporar este tipo de informacin a su formulacin de modo que pueda ser
usada en lugar de (o adems de) medidas proporcionadas por los tradicionales aforos.
Este captulo presenta una metodologa para la estimacin o ajuste de una matriz previa cuya
principal novedad es el uso de informacin agregada de volmenes observados en agrupaciones
de arcos inferidos de la telefona mvil. En particular, se ha optado por adaptar la metodologa
propuesta por Doblas y Benitez (2005), que ya demostr su eficiencia en la estimacin de
matrices con aforos tradicionales, para que pueda ser empleada con la informacin inferida de la
telefona, es decir, a nivel de volumen por grupos de arcos. La eleccin como base terica de esa
metodologa reside en que, a diferencia de otras, sta implementa un control de la distorsin
experimentada por la matriz previa durante el ajuste. En general, este tipo de metodologas
busca que la matriz resultante reproduzca, al ser asignada a la red, los volmenes observados lo
ms fielmente posible, y derive de una matriz previa que proporciona informacin til al
proceso dado que se supone como una observacin de la verdadera matriz OD a estimar.
Llevar a cabo una encuesta amplia y detallada que permita elaborar una matriz previa resulta ser
un proceso costoso, por lo que una distorsin excesiva de dicha informacin invalida cualquier
esfuerzo presupuestario y humano dedicado a su elaboracin. En base a este razonamiento, en la
definicin de la funcin objetivo se buscar un compromiso entre la distorsin de la solucin
con relacin a la matriz previa y a los volmenes observados a nivel agregado de arcos.
Se ha empleado como punto de partida la metodologa de Doblas y Benitez (2005) por haber
sido ampliamente estudiada y desarrollada por nuestro grupo de investigacin, as como por
haber mostrado magnificos resultados en el campo del ajuste de matrices con volmenes
observados. No obstante, la adaptacin implementada en la formulacin a nivel de volumen por
119
grupos de arcos tambin sera vlida para cualquier otra metodologa de ajuste de matrices
basada en volmenes observados (por ejemplo, Spiess, 1990).
120
telfonos que realicen llamadas. En el caso de que se trabaje a nivel de reas de localizacin, los
registros deben de estar actualizados a nivel de LA, lo cual ocurre en los sistemas de telefona
con independencia del estado del telfono, siendo por tanto la muestra ms extensa.
Independientemente del nivel de agregacin seleccionado, la elaboracin de este tipo de
matrices implicara monitorizar los registros iniciales y finales que cada telfono efecta sobre
la regin analizada en el intervalo de tiempo de inters, los cuales determinan la zona origen y
destino del viaje asociado al usuario portador del telfono. Este anlisis permite distinguir entre
los viajes de inters (pares OD de la matriz) del resto de viajes de paso, los cuales son viajes
que se iniciaron o terminaron en otros orgenes o destinos distintos a los estudiados.
En general, un proceso de encuestacin tradicional requiere trabajar con una muestra
representativa de la poblacin. Debido a ello, las metodologas de estimacin basadas en
matrices procedentes de encuestas resultan o poco fiables o muy costosas desde el punto de
vista econmico y/o social. Sin embargo, el empleo de datos de telfonos mviles supone
utilizar una muestra muy extensa de la poblacin, puesto que las tasas de penetracin de
telefona se sitan ya en torno al 90% en muchos pases europeos (CDB, 2006), siendo en
Espaa el 110.8% (CMT, Enero 2009). Junto a ello destaca su bajo coste de implantacin dado
que utiliza la misma infraestructura existente en los sistemas de telefona, sin necesidad de
instalar mdulos adicionales. Sin embargo, en lo que respecta a precisin de localizacin, este
tipo de matrices derivadas directamente de la telefona mvil posee ciertos inconvenientes que
las invalidan como matrices de viajes finales. La desventaja principal se encuentra fuertemente
relacionada con el tamao de las zonas de transporte derivadas de una zonificacin que
emplee la distribucin celular de una red de telefona mvil.
Desde el punto de vista de dimensin de las zonas de transporte que definen una matriz OD, la
zonificacin tradicional se realiza minuciosamente mediante criterios socioeconmicos o
agregaciones de poblacin seleccionando zonas que pudieran tener una relacin causal con los
movimientos que se dan entre ellas. El tamao de estas zonas debe ser tal que el error de
agregacin causado por el supuesto que todas las actividades se concentran en ella no sea muy
grande, es decir, bajo impacto de viajes intrazonales. Adems, estas zonas deben ser lo ms
homogneas posible en cuanto al uso del suelo y/o la composicin de la poblacin. En cambio,
en matrices elaboradas directamente con registros telefnicos, las zonas de transporte vienen
ya fijadas por el propio diseo del sistema de telefona, puesto que se utilizan las mismas celdas
y/o reas de localizacin definidas en el dimensionado de la red celular. El tamao de las celdas
respecto al mbito geogrfico de su cobertura depende en gran medida de parmetros tales como
trfico que tiene soportar, topologa del terreno, tipo de antena o incluso edificios alrededor de
121
la estacin base, variando el radio de una celda desde cientos de metros (entornos urbanos) a
kilmetros (entornos rurales). Considerando a su vez que las reas de localizacin se definen
como agrupaciones de celdas, este tamao ser considerablemente mayor.
Atendiendo al enfoque de uso de esas reas (celdas y/o LA) como zonas de transporte, no ser
vlida la hiptesis de bajo impacto de viajes intrazonales dado que es lgico que comprendan
varias de las clsicas zonas de transporte entre las que s se dan viajes. Con las posibilidades que
ofrece la telefona mvil, esos viajes intrazonales sern generalmente imposibles de detectar
aunque, si se atiende a matrices en trminos de macro zonas (agrupacin de varias zonas de
transporte clsicas segn un determinado criterio), se permitira elaborar una matriz de viajes.
Por tanto, el uso datos de telefona es vlido para obtener una matriz final a nivel de macro zona
o una matriz exclusivamente de viajes interzonales que pueda ser utilizada como previa para,
posteriormente, ajustarla con otra informacin (aforos, volmenes agregados derivados de
telfonos,) mediante mtodos tradicionales, pero no para usarla directamente como matriz de
viajes final. Adems, la obtencin de una matriz de movilidad monitorizando el origen y destino
de una muestra de telfonos mviles presenta como desventaja que las matrices OD inferidas
no estaran desagregadas ni por motivo ni por modo de transporte, ni aportaran informacin
sobre caractersticas de los individuos, como as ocurre en el caso de las procedentes de
encuestas. En cambio presentaran como ventaja destacable que la obtencin de la matriz sera
de forma automtica y sobre una muestra de tamao elevado.
No obstante, los mtodos ms extendidos para la resolucin del problema de estimacin de una
matriz de viajes OD son aquellos basados en modelos matemticos que utilizan las mediciones
de aforos en un conjunto de arcos de la red de trfico junto con otra informacin previa. Son en
ellos en los que se ha centrado esta Tesis para la estimacin de matrices, fusionando conceptos
tradicionales de estimacin mediante modelos matemticos junto con una nueva fuente de
informacin de volmenes de trfico derivados de la telefona mvil.
122
proporcionan el volumen total de vehculos que circula por cada uno de los arcos observados de
la red de transporte en dicho periodo de tiempo.
La mayora de los modelos de actualizacin de matrices emplean conteos de trfico obtenidos
de aforos (detectores) instalados sobre arcos del viario. Ciertos sistemas que realizan tales
conteos suelen ser descartados para su uso en mtodos de estimacin de matrices debido a que
no son capaces de desagregar la informacin medida sobre grupos de arcos en informacin
individual de cada arco (e.g. las IMD no desagregan por sentido de circulacin). Este trabajo
propone una metodologa para el uso de la informacin agregada proporcionada por sistemas de
estas caractersticas. En particular, la metodologa se va a centrar en datos de volmenes
derivados de la telefona mvil por considerarse sta como una tecnologa prometedora para la
captura de datos de trfico. Para ello es necesario introducir novedades metodolgicas para la
explotacin de la informacin agregada de movilidad entre zonas derivada de tales sistemas de
telefona, es decir, volmenes observados sobre grupos de arcos de la red en lugar de sobre
arcos individuales (tradicionales aforos). Se ha diseado una metodologa fcil de aplicar,
adecuada para abordar problemas de estimacin de matrices en aplicaciones reales de gran
envergadura con un gran nmero de zonas de transporte involucradas.
123
que realizar cambios para obtener las mnimas desviaciones posibles entre los volmenes
estimados en los arcos y los observados.
En general, se puede concluir que los distintos mtodos para el problema de estimacin de
matrices de viajes OD, desarrollados en la literatura a partir de volmenes de trfico
observados, presentan la forma genrica siguiente (Yang et al., 1992):
Minimizar
v, T
s.a.
F1 T,T F2 v, v
(21)
v = M (T)
Las funciones F1 y F2 son dos mtricas que miden la distancia entre la matriz OD estimada,
T , y la matriz previa dada, T , y entre los volmenes estimados y los observados en los arcos
aforados, v y v respectivamente. Los procedimientos ms habituales para las funciones F1 y F2
son el de mxima verosimilitud, mnimos cuadrados generalizados y derivaciones del principio
de mxima entropa. Los parmetros y son los correspondientes factores de peso que
reflejan la confianza relativa en los datos disponibles T y v . Finalmente, la expresin v=M(T)
representa el proceso de asignacin considerado para modelar los volmenes en los arcos a
partir de la matriz estimada.
Tpicamente, el problema de estimacin puede ser interpretado como la bsqueda de una matriz
OD que, una vez asignada a la red, reproduzca los conteos de trfico observados y, adems, sea
semejante a la matriz previa. La nueva contribucin respecto a los mtodos existentes en la
literatura es el uso de informacin agregada de volmenes observados sobre grupos de arcos de
la red en lugar de sobre arcos individuales. Este tipo de informacin puede ser usada
conjuntamente con los conteos de trfico obtenidos de las tradicionales estaciones de aforo,
dado que los aforos son un caso especial en el que el nmero de arcos del grupo es uno. El
procedimiento de estimacin presentado en esta Tesis se basa en los dos criterios siguientes, que
permiten traducirlo a expresiones matemticas con vistas a su implementacin prctica:
1. Que la matriz resultante reproduzca, al ser asignada a la red, los datos de los volmenes
agregados lo ms fielmente posible.
2. Que la informacin contenida en la matriz OD previa, obtenida habitualmente por
medio de complejos y costosos procesos de encuestacin domiciliaria, no se vea
distorsionada en exceso. Una distorsin excesiva de dicha informacin invalida
cualquier esfuerzo presupuestario y humano dedicado a tareas de encuestacin.
Esta metodologa implementa un algoritmo de ajuste de matrices a partir de informacin
agregada de volmenes observados, junto con una matriz previa. La matriz previa a utilizar
124
125
arco y el coste (o el tiempo) para recorrerlo. Se establece la hiptesis de que las funciones de
coste son separables, el tiempo en recorrer un arco no depende del volumen de otros arcos. El
tratamiento de los efectos de la congestin es una caracterstica importante para distinguir entre
los modelos para la evaluacin de la matriz OD. Cada modelo supone que la congestin se
puede tratar exgenamente (por asignacin proporcional) o endgenamente (por asignacin en
equilibrio). Finalmente, la asignacin de la matriz OD al modelo de red para obtener los
volmenes y tiempos de viaje modelados sobre cada arco se basa en el equilibrio de usuario
(userequilibrium) determinista o estocstico, cumpliendo los requisitos de asignacin en
equilibrio segn el primer principio de Wardrop (Patriksson, 1994).
A continuacin se presenta la notacin matemtica necesaria para la formulacin del modelo.
ndices:
iI
jJ
aA
bB
k Kij
Constantes:
ak
a b
uij , lij
uiO , liO
u Dj , l Dj
u ,l
v |b
|b
Funciones:
sa (va )
126
Variables:
va
volumen en el arco a
hk
flujo en el camino k
pk
hk
Tij
Pij , a
k Kij
ak
pk
v |b
volumen en la frontera b
Tij
Nivel Superior
Minimizar
Tij
f Tij
1
2
v
bB
(a)
i I , j J
(b)
iI
(c)
l Dj Tij u Dj
jJ
(d)
jJ
(22)
iI
l Tij u
(e)
iI jJ
2.
Nivel Inferior
Minimizar
va
g va sa (v) dv
va
a A
s.t.
va ak hk , a A
iI jJ kKij
k Kij
Tij , i I , j J
hk 0 k K ij , i I , j J
(23)
127
El modelo propuesto tiene una estructura binivel, donde el problema de nivel superior estima la
matriz de viajes Tij en funcin de un volumen va en los arcos dado. El problema de nivel inferior
es el conocido como TAP (Traffic Assignment Problem), un problema de asignacin que
determina los volmenes va en los arcos, segn las condiciones de equilibrio de usuario, para
una matriz de viajes Tij dada (Beckmann et al., 1956).
Respecto al problema de estimacin de una matriz de viajes OD expuesto en la ecuacin (22),
los volmenes derivados de la telefona mvil con los que realizar el ajuste, v b , son obtenidos
sobre fronteras b entre celdas de la red celular, cada una de las cuales comprende un grupo de
arcos del modelo de red. La formulacin que se propone en este trabajo incluye un trmino
cuadrtico para controlar la distancia entre los volmenes observados y estimados (modelados).
Sin embargo, para controlar la distorsin de la matriz estimada (o ajustada) respecto de la previa
se opta por un conjunto de restricciones de variables acotadas (22) (b) y de restricciones
funcionales (22) (c, d, e). Dichas restricciones deben definir unos rangos admisibles de
variacin para la informacin contenida en la matriz OD en distintos niveles de agregacin
(para cada celda de la matriz OD, viajes generados al agregar segn destinos, viajes atrados al
agregar segn orgenes, y viajes totales al agregar en orgenes y destinos, respectivamente). A
diferencia de la formulacin empleada en (21), la medida de la distorsin entre las matrices
estimada y previa se ha modelado mediante dicho conjunto de restricciones en lugar de
mediante una funcin F1. Para obtener estrictamente la notacin equivalente a (21) bastara con
definir la lagrangiana del problema y as elevar las restricciones (22) (b, c, d y e) a la funcin
objetivo.
Respecto a los volmenes v b de todas las fronteras observadas bB, es necesario realizar un
clculo adicional sobre los volmenes va obtenidos del nivel inferior (23). De modo que el
volumen en la frontera b puede ser expresado, en trminos de proporciones de viajes, como la
suma de los volmenes va de cada uno de los arcos que cruzan la frontera b, obteniendo la
siguiente expresin:
ij
d sa (va )
0 para cada arco a
dva
(24)
A, es decir, el tiempo
necesario para recorrer un arco aumenta conforme aumenta el trfico en l, est garantizada la
128
unicidad de solucin con respecto a los volmenes en arcos va (Sheffi, 1985); pudindose
derivar una solucin factible para cada v b conforme a la expresin (24).
El problema de la estimacin de matrices OD mediante volmenes observados consiste en
encontrar la distribucin de viajes entre nond celdas (Tij) a partir de los aforos disponibles en la
red, en este caso, fronteras observadas. En la mayor parte de los casos el nmero de incgnitas
(nond) es muy superior al de fronteras observadas, por lo que es imposible determinar una
matriz OD nica, considerando el problema indeterminado. Esto significa que existen muchas
matrices que satisfacen las ecuaciones del problema y el objetivo pasa a ser el encontrar la
solucin que mejor se adapte a determinados criterios preespecificados. Para la presente
metodologa, dichos criterios son establecidos y modelados matemticamente en el problema de
nivel superior (22) mediante las restricciones (22) (b, c, d y e).
La exactitud de las matrices obtenidas mediante esta formulacin se encuentra afectada por la
precisin de los resultados de partida: volmenes observados, viajes generados y atrados por
cada centroide, etc. En una red real, la falta de exactitud de estos datos hace que, en ocasiones,
no se verifiquen las condiciones de equilibrio en la red modelada. Bajo esta hiptesis, es
razonable permitir que las soluciones obtenidas en el proceso de la estimacin no reproduzcan
los datos exactamente; consecuentemente, el objetivo a perseguir ser obtener la matriz OD
estimada que mejor reproduzca los datos observados tanto a nivel de volmenes como de matriz
previa.
Es necesario realizar algunos comentarios sobre el sistema de inecuaciones lineales mostrados
en (22) (b, c, d y e). Dado que el objetivo de dichas restricciones es controlar la distorsin de la
informacin contenida en la matriz estimada T respecto de la matriz previa T , es evidente que
las correspondientes cotas deberan ser definidas, bien en trminos absolutos o relativos,
conforme a valores derivados de la estimacin inicial Tij(0) , lo cual garantizara una regin
factible novaca. Ello se describe con ms detalle en el apartado 5.3.4.3. Asimismo, merece la
pena destacar que las cotas superiores e inferiores empleadas en (22) para cada restriccin
dependen del diseador, es decir, no hay un valor universal para todos los casos sino valores
especficos para cada problema dado. Estas consideraciones, junto a algunas orientaciones para
la definicin de dichas cotas, son parte de la prctica usual seguida en aplicaciones desarrolladas
y testeadas en el campo de estimaciones de matrices OD (Doblas y Benitez, 2005).
129
130
5.3.4.1
Introduccin
s.a.
f x
gl (x) 0, l = 1,2, ,L
(25)
lxu
x N
donde gl(x) seran las restricciones funcionales definidas en (22) (c, d y e), y lxu las
restricciones de variables acotadas definidas en (22) (b). Para tal problema, se sabe que las
condiciones de KuhnTucker son necesarias y suficientes para caracterizar el ptimo de dicho
problema. El Mtodo de la Funcin Lagrangiana Aumentada o Mtodo de los Multiplicadores
(Reklaitis et al., 1983) consiste, bsicamente, en aadir una serie de trminos cuadrticos a la
funcin clsica de Lagrange f(x), formando una funcin sin restricciones cuyo mnimo es un
punto que cumple las condiciones de KuhnTucker del problema original. Sin embargo, es
necesario indicar que la funcin Lagrangiana Aumentada conseguida en nuestro caso no incluir
las restricciones de variables acotadas. De modo que la funcin lagrangiana aumentada queda
expresada como:
Laug (x, ) = f (x) +
l 1
gl (x) l
l2
(26)
131
trminos de penalizacin y los multiplicadores (actualizados segn una sencilla regla) los que
fuerzan la convergencia hacia una solucin factible ptima.
El procedimiento consiste en optimizar (minimizar) en x la funcin lagrangiana aumentada (26),
siendo el trmino l constante de una etapa a otra; mientras que los multiplicadores l slo
permanecen constantes durante cada etapa o subproblema. En cada etapa se hallan los x ptimos
para esos multiplicadores de modo que, una vez obtenido el ptimo para esa etapa del proceso,
se procede a actualizar los multiplicadores conforme a la regla (j n 1) g j ( x ( n ) ) (j n ) para
acometer la siguiente etapa (n+1) del proceso de optimizacin. Esto se repite hasta alcanzar un
grado de convergencia razonable. El operador representa:
si < 0
0 si 0
(27)
Minimizar
x
lxu
s.a.
(28)
x N
para un vector constante de multiplicadores asociados a esta etapa del proceso. Se denota m al
contador para identificar las sucesivas estimaciones obtenidas por el algoritmo. El mtodo de
FW se basa en aproximar linealmente la funcin objetivo en torno al punto actual x ( m ) . A
continuacin, se busca el punto y de la regin factible que minimice la funcin objetivo
linealizada, que se traduce en el problema de optimizacin lineal definido como:
Minimizar Laug x ( m ) y
T
s.a.
(a)
lyu
(b)
y N
(c)
(29)
132
Entonces, con la solucin en la msima iteracin del problema linealizado, y ij( m ) , se obtiene un
nuevo estimado de (28) mediante la siguiente regla de actualizacin:
xij( m 1) = xij( m ) ( m ) y ij( m ) xij( m ) xij( m ) ( m ) d ij( m )
(30)
Esta expresin est escrita en trminos de la direccin de descenso en el estimado actual, d(m), la
cual es la diferencia entre el punto extremo auxiliar y ( m ) y el estimado actual x ( m ) . El paso ( m )
se obtiene como solucin del siguiente problema de optimizacin unidimensional:
Minimizar
s.a.
Laug x ( m 1) x ( m ) d ( m )
0 1
(31)
donde pertenece al intervalo [0, 1] puesto que el punto auxiliar y est localizado en un vrtice
de la regin factible definida por el conjunto polidrico definido por (29).
Por tanto, segn el mtodo de la Funcin Lagrangiana Aumentada, las restricciones funcionales
(22) (c, d y e) se integran en una funcin objetivo equivalente, mientras que las restricciones de
variables acotadas (22) (b) son tratadas directamente con el mtodo de direcciones factibles
(FrankWolfe). Con ello se consigue que las restricciones de variables acotadas se cumplan en
todo momento, mientras que el cumplimiento de las restricciones funcionales es producto de un
proceso iterativo que va penalizando las violaciones cometidas por medio de trminos que
aumentan la funcin de Lagrange clsica.
5.3.4.2
Implementacin
iO
Dj
133
Variables:
iO
iO
Dj
Dj
yij
dij
(m)
msima iteracin
Con la anterior notacin, la funcin Lagrangiana Aumentada (26) puede ser escrita como:
1
Laug T, b Tij ak pk v
ab kKij
2 bB iI jJ
nd
1 no
iO uiO Tij iO
2 i 1
j 1
no
1 nd
Dj u Dj Tij Dj
2 j 1
i 1
no nd
1
u Tij
2
i 1 j 1
no
iO
i 1
nd
Dj
j 1
O 2
i
D 2
j
no
nd
nd
Tij l
O
i
j 1
no
Tij l
i 1 j 1
i 1
ij
O
i
l Dj Dj
2
iO
D 2
j
(32)
134
1
Min Laug Tij b Tij ak pk v
Tij
ab kKij
2 bB iI jJ
nd
1 no
iO uiO Tij iO
2 i 1
j 1
no
1 nd
Dj u Dj Tij Dj
2 j 1
i 1
no nd
1
u Tij
2
i 1 j 1
s.a.
no
iO
i 1
nd
Dj
j 1
O 2
i
D 2
j
no
nd
Tij l
j 1
no
Tij l
i 1 j 1
O
i
Tij l
D
j
i 1
nd
O
i
2
D
j
2
iO
2
Dj
(33)
Al finalizar cada etapa (m) de optimizacin, los multiplicadores para el nuevo subproblema
(m+1) se actualizan en funcin del estimado ptimo Tij( m ) y de los multiplicadores y
correspondientes a la etapa (m), de acuerdo con la regla (34). El proceso se da por concluido
cuando se alcanza un grado de convergencia que se considere razonable.
nd
iO m 1 uiO Tij m iO m
j 1
no
Dj m 1 u Dj Tij m Dj m
i 1
no
nd
m 1 u Tij m m
i 1 j 1
iO m 1
Dj m 1
m 1
nd
T
j 1
no
T
i 1
no
liO iO m ,
i I
l Dj Dj m ,
j J
ij
ij
nd
T
i 1 j 1
ij
(34)
l m
va
ak pk
Tij kKij
v b a b va
v b
Tij
a b
a A
va
ak pk
Tij aA a b kKij
135
(35)
a A
iO
Dj
b Tij ak pk v
ab kKij
bB
p
b ak k
ab k Kij
nd
O
O
O
T
l
u
Tij iO
ij
i
i
i
j 1
j 1
no
no
Tij l Dj Dj u Dj Tij Dj
i 1
i 1
nd
(36)
no nd
T
l
u
Tij i I , j J
ij
i 1 j 1
i 1 j 1
no
nd
Una vez calculado el gradiente, se procede a obtener el punto extremo yij del problema
linealizado (29) que, adaptado al problema de ajuste de la matriz Tij, se convierte en:
Minimizar
yij
no
nd
Laug
i 1 j 1
Tij
yij
(a)
Tijm
(b)
yij N
(37)
(c)
Debido a la estructura especial del problema, este punto extremo yij( m ) se puede hallar de forma
sencilla, sin necesidad de utilizar el mtodo simplex, mediante la siguiente expresin lgica:
L
aug
yij( m )
Tij
Tij( m )
L
aug
0 lij
Tij
Tij( m )
L
aug
0 Tij( m )
Tij
Tij( m )
0 uij i I , j J
(38)
Las sucesivas estimaciones del algoritmo de FW son computadas con la siguiente adaptacin
de la expresin (30) conforme a la notacin de matrices OD:
Tij( m 1) = Tij( m ) ( m ) yij( m ) Tij( m ) Tij( m ) ( m ) d ij( m ) , donde: ( m )
para cada i I, j J, donde dij( m ) yij( m ) Tij( m ) es la direccin de descenso FW .
(39)
136
Finalmente, el clculo del paso ptimo ser la solucin del problema unidimensional de
optimizacin (31) adaptado a nuestro problema en notacin OD. Para ello es necesario
formular la funcin Lagrangiana aumentada (32) para el nuevo estimado (m+1) expresndola en
funcin del paso , es decir, evaluarla para Tij( m 1) Tij( m ) ( m ) dij( m ) , donde Tij( m ) y dij( m ) son
conocidos; consiguiendo una funcin unidimensional Laug :
1
Laug b Tij( m ) ak pk dij( m ) ak pk v
2 bB iI jJ
k Kij
ab
k Kij
ab
2
2
2
1
O
O
O
O 2
O
O
(m)
(m)
(m)
(m)
i ui Tij dij i
i Tij dij li i
iO
2 iI
j J
j J
j J
j J
2
2
2
2
1
Dj u Dj Tij( m ) dij( m ) Dj
Dj Tij( m ) dij( m ) l Dj Dj
Dj
2 j J
iI
iI
iI
iI
2
2
1
u Tij( m ) dij( m ) 2 Tij( m ) dij( m ) l 2
2
iI jJ
iI jJ
iI jJ
iI jJ
(40)
Tij( m ) hasta yij( m ) impide utilizar expresiones analticas, como la usada en Spiess (1990), para el
clculo del paso ya que el cambio no es infinitesimal y no puede admitirse la hiptesis de que
las proporciones permanecen costantes. Junto a ello, la existencia del operador , definido en
(27), condiciona la eleccin de un algoritmo robusto de bsqueda que, sin hacer uso del clculo
de derivadas, se encargue de minimizar una funcin unidimensional sobre un intervalo [a, b],
tales como bsqueda dicotmica, exhaustiva, seccin dorada, etc. En el algoritmo de Doblas y
Bentez (2005) se utiliz el mtodo de biseccin pero, tras considerar la dificultad de usar
derivadas y expresiones analticas, se ha optado por el algoritmo denominado bsqueda por la
Seccin Dorada. Adems de no usar informacin de la derivada de la funcin, este eficiente
algoritmo tiene como ventaja el ser ptimo con respecto al nmero de evaluaciones de la
funcin objetivo, conocido el intervalo de incertidumbre, el de definicin de la funcin y sin
necesidad de predefinir el nmero de iteraciones (i.e.: Fibonacci). Este hecho, teniendo en
cuenta las dimensiones de las matrices manejadas, simplifica en gran medida los clculos
necesarios; de ah su eleccin como mtodo de resolucin. El algoritmo se basa en la bsqueda
del mnimo de una funcin unimodal, en este caso la funcin definida en (40), mediante
reducciones iterativas del rango de bsqueda de valores de dentro del cual el ptimo se sabe
que existe (Bazaraa y Shetty, 1979). El algoritmo garantiza que cada nueva evaluacin de la
funcin acotar el mnimo, tras aplicar los ratios correspondientes, dentro de un intervalo
137
0.61803 (razn urea) veces ms pequeo que el intervalo de bsqueda de la anterior iteracin.
En nuestro problema, el valor ptimo de se encuentra aplicando el algoritmo iterativamente
dentro del intervalo inicial [0, 1] en la direccin dij(m). De modo que una vez encontrado el paso
ptimo, se procede a la actualizacin de la matriz OD para la siguiente iteracin.
Para la finalizacin del algoritmo de optimizacin, la aproximacin relativa a las proporciones
de rutas pk implica cierto zigzagueo en los valores de la funcin objetivo entre estimaciones
sucesivas, lo cual dificulta el poder incorporar un criterio de finalizacin basado en valores
de las derivadas, en valores de la funcin objetivo en dos pasos consecutivos, o en la
diferencia relativa entre dos estimados sucesivos. Por ello, el criterio de terminacin del
algoritmo se basa en i) un nmero mximo de subproblemas (o etapas Lagrangianas), y ii) un
nmero mximo de iteraciones por subproblema. Es necesario especificar que no hay reglas
especficas para elegir este nmero mximo de subproblemas e iteraciones, al igual que ocurra
con las cotas superiores e inferiores definidas en (22), sino que estos valores dependen del
criterio del planificador y su conocimiento prctico. Por ltimo, indicar que una caracterstica de
este algoritmo es que la matriz OD, para la cual se obtiene el mejor valor de la funcin
objetivo dentro las diferentes iteraciones de una etapa o subproblema concreto, es almacenada y
usada como punto de partida para el siguiente subproblema.
5.3.4.3
Por razones de simplificacin de las ecuaciones, los valores de los factores de peso opcionales
|b sern fijados a uno para todas las fronteras de los casos prcticos que en los siguientes
apartados se evalan. Asimismo, se ha puesto especial inters en la eleccin de los factores de
peso ( iO, jD, ) asociados con las restricciones funcionales integradas dentro de la funcin
Lagrangiana aumentada (32), y sobre el comportamiento del algoritmo desarrollado para niveles
de congestin de la red (cuantificada por el nmero de iteraciones necesarias para conseguir una
solucin en equilibrio).
El extenso rango o intervalo de valores en el cual se encuentran las magnitudes implicadas en el
problema de estimacin de matrices OD, las cuales son viajes generados, atrados y totales,
insta hacia un proceso natural de escalado de las restricciones basado en los valores iniciales de
dichas magnitudes, es decir, respecto al estimado inicial Tij(0) a diferentes niveles de agregacin.
Por tanto, cada restriccin funcional (22) (c, d y e) es normalizada (o escalada) por su
correspondiente valor inicial, resultando un conjunto de restricciones normalizadas que dan
lugar a penalizaciones de violaciones de las restricciones proporcionales a valores relativos de
las correspondientes magnitudes. En otras palabras, no posee la misma importancia exceder en
138
un viaje una cota superior de 10 que una cota superior de 104, estando ms penalizada la
violacin de la cota superior en la primera situacin que en la ltima.
El proceso de escalado de restricciones se presenta esquemticamente para una pareja genrica
de restricciones de viajes generados, lo cual obliga a modificar levemente la notacin
matemtica para mostrar claramente la relacin directa en la expresin (32). En primer lugar, se
formulan las restricciones y la pareja correspondiente de multiplicadores como se indica:
O
i
(0)
i
l
O
Oi jJ Tij
(0)
i
uiO jJ Tij
(0)
Oi
O
jJ Tij(0)
O
i
(0)
i
0 iO
(0)
i
jJ
(41)
Tij liO
0 i
Oi(0)
para cada i I con Oi(0) 0, donde Tij(0) representa la estimacin actual, que en nuestro caso
coincide con la matriz de partida o matriz OD previa. Las restricciones impuestas sobre los
viajes atrados y los viajes totales debern ser modificada de forma anloga usando las
magnitudes D (0)
iI Tij(0) para cada j J con Dj(0) 0 y T (0) iI jJ Tij(0) .
j
j Tij uiO
liO
Oi(0)
Oi(0)
Oi(0)
l Dj
D (0)
j
l
T
(0)
Tij
i ij
(0)
j
(0)
u Dj
(42)
D (0)
j
u
T (0)
En base al razonamiento anterior, dado que cada restriccin est escalada (normalizada)
respecto a su magnitud correspondiente Oi(0), Dj(0) o T(0) , el trmino cuadrtico de
penalizacin de la funcin lagrangiana aumentada es reformulado introduciendo un factor de
peso global W comn a todas ellas ( iO, jD, ). Este factor de peso W se refiere a la
ponderacin del trmino de restricciones de la Lagrangiana Aumentada (32) con respecto a
los trminos de la funcin objetivo original:
uO
jJ Tij O
i
W
i
Oi(0)
iI
O 2
j J
Tij liO
Oi(0)
2
iO
donde las siguientes manipulaciones llevan hacia la definicion original dada en (32):
(43)
2
2
2
2
1 O
O
(0)
O
(0) 2
O
O
(0)
iO Oi(0)
W (0) ui Tij i Oi
i Oi Tij li i Oi
iI Oi
j J
j J
O
O
(0)
O
i
i
i
2
2
iO iO Oi(0)
1
O
O
2
O
u
T
T
l
i
i
ij
i
i
ij
i
i
i
2W
2 iI
j J
j J
iO
(0) 2
Oi
139
(44)
Aquellos casos en los cuales Oi(0) = 0 o Dj(0) = 0, sern tratados individualmente conforme a sus
cotas superiores. La tarea reside ahora en la eleccin de un valor apropiado para W. Es
conveniente usar valores suficientemente grandes a fin de no partir de una solucin inicial con
mltiples restricciones violadas; de lo contrario el proceso reajustado a travs de la penalizacin
del trmino cuadrtico de la funcin Lagrangiana aumentada y las sucesivas actualizaciones de
los multiplicadores puede no comportarse correctamente. Por otro lado, el mencionado
parmetro W, aunque suficientemente grande, no debera ser mayor que un valor capaz de
bloquear el proceso de optimizacin, ya que valores elevados de W pueden impedir la
evolucin del algoritmo hacia estimados que mejoren el valor de la funcin objetivo. Sin
embargo, valores pequeos pueden dar lugar a una relajacin excesiva en el cumplimiento
de las restricciones que se pueda hacer irreversible. Por ello, Doblas y Bentez (2005)
proporcionan una regla simple avalada por un buen comportamiento en trabajos reales de ajuste
de matrices, la cual consiste en la eleccin de valores de W del mismo orden de magnitud que el
valor inicial de la funcin objetivo definida en (22) (a).
De forma anloga a lo sucedido con las restricciones, el trmino de la funcin Lagrangiana
aumentada (32) asociado con los volmenes de frontera debe ser modificado mediante una
normalizacin respecto del volumen observado en cada frontera, v b , quedando:
Laug T, b
2 bB iI jJ
Tij ak pk v
kK
ab
ij
vb
(45)
140
Configuracin de la red
4
va
, donde va es el volumen del arco a, Ta representa el tiempo
ca
141
Figura 5-1: Red de Sioux Falls, incluyendo distribucin ficticia de LAs y celdas.
Inicialmente existan un conjunto mayor de fronteras entre celdas pero, tras realizar un
procesado previo, finalmente slo 22 fronteras fueron calificadas como vlidas para ser
utilizadas en el ensayo. La razn principal residi en criterios topogrficos dado que haba arcos
que cruzaban fronteras entre celdas pero cuyo nodo origen o destino no estaba incluido en
alguna de las dos celdas asociadas a la frontera. Ese fue el caso de los arcos 37 y 38, los cuales
cruzaban las fronteras entre la celda 3 y 9 y entre la 9 y 10, pero su nodo origen o su nodo
destino estaba en la celda 3 o en la 10. Por tanto, esos arcos introducan distorsin en la
monitorizacin de esas fronteras (entre 3 y 9 y entre 9 y 10), dado que pese a cruzarlas, no
cumplan la definicin de frontera observada indicada en el apartado 4.3.2. Una frontera
observada o aforo virtual lo conforman los arcos cuyo nodo inicial y nodo final estn en
celdas distintas y contiguas. Ante esta situacin, las 4 fronteras correspondientes (una frontera
entre celdas son dos fronteras observadas, una por cada sentido) no podan pertenecer al
conjunto de fronteras observadas vlidas. Idntica situacin experimentaban los arcos 56 y 60,
anulando las dos fronteras observadas asociadas a la frontera entre la celda 7 y 8. La Tabla 5-1
muestra las fronteras observadas consideradas definitivamente vlidas y sus corresponientes
arcos.
142
Id
frontera
1
Celda
Origen
1
Celda
Destino
2
Id
Arcos
1, 9
Id
frontera
12
Celda
Origen
5
Celda
Destino
2
7, 10
13
3
4
5
6
7
8
9
2
2
2
3
3
4
4
1
4
5
1
4
2
3
14
15
16
17
18
19
20
5
5
6
7
7
7
8
6
7
5
4
5
9
10
10
21
41, 72
11
3, 11
13
16
31, 35
32
23
27
24, 29,
30
28
Id
Arcos
19
21, 48,
51
20, 50
53
17, 55
43
58
44, 70
66
22
10
75
143
en la misma frontera. En este sentido, el error relativo absoluto medio alcanzado por los
modelos de prediccion seleccionados en el Captulo 4 durante la validacin numrica
empleando volmenes observados por estaciones de aforo se situ en torno al 20%. Bajo esta
condicin, finalmente, los volmenes observados de frontera son obtenidos multiplicando el
volumen agregado de cada frontera anteriormente explicado por un coeficiente aleatorio entre
0.8 y 1.2. Este rango es usado para introducir una distorsin en el volumen de frontera
observado a fin de simular la discrepancia entre volmenes inferidos de datos de telfonos
mviles y volmenes reales de vehculos que realmente circularon.
5.4.1.2
Resultados
El objetivo de este apartado es presentar los resultados de este primer ensayo realizado para
verificar la consistencia y eficiencia del algoritmo desarrollado. Para este caso se ha tomado un
valor de W =10 junto con unos criterios de terminacin de asignaciones para el cdigo
comercial usado (EMME/2) basados en un nmero medio de iteraciones por asignacin para
alcanzar las condiciones de equilibrio de usuario Niter=20, relative gap (%)=0.5, normalized
gap (min)=0.5. Para ms detalles sobre estos criterios de terminacin de la etapa de asignacin
(nmero de iteraciones, rgap, ngap) y otros, consultar las referencias EMME/2 (1998),
MINUTP (1993), TRANSCAD (2006), y TRIPS (1990).
Para el problema de nivel superior (22), los valores de las cotas superiores e inferiores, {uij, lij}
en el caso de cada viaje o par OD, sern +25% y 25% de Tij(0) respectivamente; para viajes
generados { uiO , liO }, +15% y 15% de Oi(0) jJ Tij(0) ; para viajes atrados { u Dj , l Dj }, +15% y
iI Tij(0) ; y para viajes totales {u,l}, +10% y 0% de T (0) iI jJ Tij(0) . Se
15% de D (0)
j
aprecia que estos valores de cotas estn expresados en trminos del estimado inicial para que,
tras normalizar, se obtengan cotas relativas. Estos valores limitarn la distorsin experimentada
por la matriz OD previa.
Para presentar los resultados ms significativos se utiliza tanto formato numrico como grfico.
La Figura 5-2a muestra los volmenes de frontera (o agregados por grupos de arcos que cruzan
cada frontera) obtenidos al asignar la matriz OD previa a la red de Sioux Falls frente a los
volmenes observados en dichas fronteras. Estos ltimos procederan de datos de movilidad
derivados de conteos de telfonos cruzando fronteras entre celdas colindantes. La Figura 5-2b
corresponde a la representacin de los volmenes de frontera obtenidos por asignacin de la
matriz estimada usando el mtodo propuesto frente a los observados derivados de paso de
telfonos por el mismo conjunto de fronteras. Esta figura muestra una buena correlacin entre
144
los volmenes observados y los modelados al asignar la matriz final estimada (R2=0.737),
teniendo en cuenta el inters de preservar la informacin contenida en la matriz OD de partida,
alcanzando una razonable mejora respecto al R2 de partida (R2=0.488). Respecto a la pendiente
de la recta (y=a+bx), tambin se logrado una mejora (b=0.967) respecto de la previa (b=0.912).
35000
30000
25000
20000
15000
10000
y = 0,912x + 781,693
5000
R = 0,488
35000
30000
25000
20000
15000
10000
y = 0,967x + 645,073
5000
R = 0,737
0
0
5000
10000
5000
Figura 5-2: Correlacin entre los volmenes observados en fronteras (grupos de arcos) y los
modelados al asignar la matriz previa (a) y la matriz estimada (b).
145
5000
4500
4000
3500
R2 = 0,934
3000
2500
2000
1500
1000
500
0
0
500
1000 1500 2000 2500 3000 3500 4000 4500 5000 5500
Viajes de los pares O-D de la matriz previa
Configuracin de la red
En este segundo ensayo, se ha tomado una red de gran tamao correspondiente a la red de la
Comunidad Autnoma de Madrid (para el ao 2004), cuyas dimensiones topolgicas son 1079
centroides, 9557 nodos regulares, 11791179 pares OD y 21713 arcos dirigidos (CRT, 2004).
Por cuestiones de nitidez grfica, la representacin del modelo de red ha sido omitida ya que la
visualizacin de los arcos y nodos resulta poco ntida debido a sus dimensiones.
Como se ha mencionado anteriormente, se precisa un conjunto de volmenes en fronteras
(agregados sobre grupos de arcos) junto con una matriz OD previa para realizar el proceso de
ajuste. La matriz OD previa se toma de un estudio anterior desarrollado sobre esta red, el cual
dispone de una matriz en perodo de hora punta de la maana (8:009:00 a.m.), correspondiente
a la Encuesta Domiciliaria de Movilidad 2004, con 11791179 pares OD.
Para los volmenes observados se ha utilizado un procedimiento basado en el citado estudio
previo desarrollado sobre esta red. De l, se tom una matriz OD resultado de un proceso de
ajuste con aforos tradicionales. Esta matriz, tras asignarla a la red, permiti disponer de unos
volmenes de todos los arcos que podan considerarse, tericamente, como reales. Estos
volmenes de arco seran los empleados ms adelante para obtener los volmenes de frontera
(grupos de arcos). Basndose en los resultados del ensayo desarrollado en el Captulo 4 sobre
volmenes inferidos con datos de telefona mvil, stos presentan pequeas diferencias respecto
a la medida proporcionada por una estacin de aforo instalada en la misma frontera. De modo
que esos volmenes de arco anteriormente obtenidos son escalados por un coeficiente aleatorio
146
entre 0.8 y 1.2 para introducir una distorsin en el volumen final observado que permita simular
el valor de error relativo en valor absoluto, alcanzado en el citado ensayo, entre volmenes
inferidos de datos de telfonos mviles y volmenes de vehculos que realmente circularon.
Pero la metodologa emplea volmenes sobre grupos de arcos correspondientes a fronteras entre
celdas. Por ello, se requera disponer de una distribucin celular, la cual se traz de un modo
ficticio usando 15 LAs y 20 celdas por LA (Figura 5-4). Esta distribucin permiti identificar
los grupos de arcos que conforman cada frontera, agrupando arcos usando la definicin de
frontera observada: arcos cuyos nodos de inicio y fin estn en celdas diferentes y vecinas.
Una vez conocidos los grupos de arcos para cada frontera existente, el volumen de una frontera
observada se gener sumando los volmenes de cada uno de los arcos identificados como parte
147
de cada frontera. Sin embargo, no todas las fronteras existentes sobre una red pueden ser usadas
como vlidas debido a sus caractersticas. Esto implica la realizacin de un preprocesado sobre
el conjunto inicial de fronteras entre celdas para obtener el conjunto final de fronteras vlidas
usadas como observadas para el proceso de ajuste. En esta red, existen 412 fronteras observadas
vlidas con 1265 arcos implicados, donde el principal criterio seguido para su seleccin ha sido
evitar posibles problemas derivados de la existencia de peatones, descartando fronteras en las
que existiera algn arco con trfico de peatones asociado.
5.4.2.2
Resultados
En este caso, se ha tomado un valor de W =103 en torno al orden del valor inicial de la funcin
objetivo (32) evaluada para este problema junto con los criterios por defecto de terminacin
de las asignaciones, que emplean un nmero alto de iteraciones por asignacin (primer criterio a
ser cumplido en todos los casos) Niter=200, relative gap(%)=1, normalized gap(min)=1.
Estos valores difieren de los tomados en la red de Sioux Falls, en especial en lo que respecta al
nmero de iteraciones por asignacin, debido a que los niveles de congestin sobre la red de
Madrid son ciertamente ms altos, de modo que las condiciones de equilibrio de usuario son
ms difciles de obtener. En el problema de nivel superior (22), los valores de las cotas
superiores e inferiores de las restricciones son iguales a las del ensayo en la red de Sioux Falls.
15000
12500
10000
7500
5000
y = 0,9122x + 98,36
R2 = 0,5272
2500
0
0
2500
5000
7500
15000
12500
10000
7500
5000
y = 0,9929x + 138,42
R2 = 0,7631
2500
0
0
2500
5000
7500
Figura 5-5: Correlacin entre los volmenes observados en fronteras (grupos de arcos) y los
modelados al asignar la matriz previa (a) y la matriz estimada (b).
148
5000
4000
3000
2000
1000
y = 0,8713x + 53,219
R2 = 0,5143
0
0
1000
2000
3000
4000
5000
149
4000
3000
2000
1000
5000
y = 1,0632x + 10,6958
R2 = 0,7599
0
0
1000
2000
3000
4000
5000
Figura 5-6: Correlacin entre los volmenes de arcos observados (pertenecientes a alguna frontera
observada) y los modelados al asignar la matriz previa (a) y la matriz estimada (b).
La Tabla 5-2 compara los resultados (R2 y ecuacin de recta regresin) evaluados a nivel
individual de arco y de grupos de arcos. Lgicamente, el R2 alcanzado tras el ajuste evaluado a
nivel de volumen agregado (grupos de arcos) ser mejor que el evaluado a nivel de volumen de
arco, dado que la informacin observada en la que se basa el proceso de ajuste viene expresada
a esa escala agregada por grupos de arcos. Bajo este mismo razonamiento, el offset y la
pendiente de la recta evaluada a nivel de volumen de arco no alcanzarn una mejora
significativa frente a los de la previa. Mientras que en el caso de la recta evaluada sobre
volmenes agregados tras el ajuste s se consigue que la pendiente sea muy prxima a la unidad
(b=0.9929), idealmente 45, manteniendo un valor de offset bajo pese a trabajar con escala
agregada de volmenes.
Tabla 5-2: Comparativa de ecuacin de la recta de regresin y R2, antes y despus de ajuste.
Comparando volmenes
en grupos de arcos
R2=0.5272
y=98.36+0.9122x
R2=0.7631
y=138.42+0.9929x
Comparando volmenes
en arcos
R2=0.5143
y=53.219+0.8713x
R2=0.7599
y=10.696+1.0632 x
Otro criterio para evaluar este planteamiento de ajuste con volmenes agregados sobre grupos
de arcos en lugar de mediante volmenes en arcos es comparar los resultados que se obtendran
empleando ambas metodologas: con volmenes a nivel de arco y de frontera (grupos de arcos).
De cara a la eleccin de una metodologa de estimacin que trabaje con volmenes de arcos
para ajustar una matriz previa, la ms adecuada, a efectos de comparacin con la planteada en
150
esta Tesis, es la desarrollada por Doblas y Benitez (2005). Se trata de valorar el uso de
volmenes agregados sobre grupos de arcos en lugar de los clsicos conteos de trfico, por ello
esa metodologa es la que mejor comparativa de prestaciones ofrecera dado que, en esencia, el
algoritmo de ajuste seguido en esta Tesis est basado en l, pero con las modificaciones
oportunas para trabajar a nivel de grupos de arcos.
En base al razonamiento anterior, se realiz un proceso de ajuste de la misma matriz OD de
partida pero utilizando como volmenes observados medidas proporcionadas por aforos
instalados sobre 1420 arcos de la red, disponibles de un estudio anterior desarrollado sobre la
misma red. Es preciso hacer notar que en el ensayo empleando volmenes de frontera se
monitorizaron 1265 arcos asociados a las 412 fronteras observadas. De manera que, aplicando la
metodologa desarrollada por Doblas y Benitez (2005), la cual realizaba el proceso de ajuste con
volmenes observados a nivel de arcos, el coeficiente R2 entre los volmenes observados y los
estimados (R20.80) no reflej una mejora muy significativa comparada con la metodologa
propuesta a nivel de grupos de arcos (R20.76). Sin embargo, utilizar datos procedentes de
estaciones de aforo implica unos costes asociados a la infraestructura de detectores que con la
telefona mvil no existiran. En este ltimo caso, los volmenes se basaran en datos de
telfonos ya disponibles por los operadores para su propio funcionamiento, sin necesidad de
instalacin de mdulos adicionales ni reducir significativamente la exactitud obtenida del ajuste,
como se ha demostrado en este ensayo.
Un ltimo aspecto a comentar es la convergencia del algoritmo de ajuste. La Figura 5-7a
muestra la evolucin de la funcin objetivo de la Lagrangiana Aumentada (32) durante el
proceso de ajuste, mostrando la rpida convergencia lograda, dadas las dimensiones del
problema, ejecutndolo con 5 subproblemas de 10 iteraciones cada una. La evolucin tpica de
la Lagrangiana aumentada, respecto al trmino ms significativo, se aprecia con ms detalle en
la Figura 5-7b. El trmino correspondiente a las restricciones funcionales (Figura 5-7c) muestra
un orden de magnitud muy inferior al del trmino cuadrtico asociado a los volmenes de
frontera, reflejando el nivel de control que sobre la informacin contenida en la matriz OD
ejerce el trmino correspondiente a las restricciones. Este efecto se debe a que las restricciones
de viajes generados, atrados y totales no suelen violar las cotas superiores e inferiores que
tienen impuestas, por lo que no son tan restrictivas como las de variables acotadas. La rpida
convergencia alcanzada con las etapas del algoritmo tambin puede ser observada en las
grficas demostrando que, a efectos prcticos, el proceso iterativo se podra haber detenido
antes de que los criterios de terminacin impuestos sean alcanzados (nmero de subproblemas y
nmero de iteraciones por subproblema), consiguiendo ajustes ms rpidos.
151
5,00E+08
Funcin objetivo
4,00E+08
3,00E+08
2,00E+08
Lagrangiana Aumentada
Trmino restricciones funcionales
Trmino cuadrtico de volmenes observados
1,00E+08
0,00E+00
1
Subproble mas
(a)
Funcin objetivo
2,696E+08
Lagrangiana Aumentada
Trmino cuadrtico de volmenes observados
2,694E+08
2,691E+08
2,689E+08
2,686E+08
Funcin objetivo
Subproble mas
(b)
2,00E+04
1,75E+04
1,50E+04
1,25E+04
1,00E+04
7,50E+03
5,00E+03
2,50E+03
0,00E+00
Subproble mas
(c)
Figura 5-7: (a) Evolucin de la funcin objetivo durante el proceso de ajuste de la matriz. (b) Zoom
para los subproblemas 25. (c) Zoom para el trmino de las restricciones de la funcin objetivo.
Con ello se ha realizado una validacin experimental en la que se revela que emplear volmenes
agregados sobre grupos de arcos, en lugar de desagregados a nivel individual de arco, en los
procedimientos para el ajuste de matrices constituye una alternativa viable que no penaliza
significativamente la exactitud obtenida. En especial, si estos volmenes agregados se infirieran
de la telefona mvil se lograra reducir el coste econmico y temporal del estudio frente a los
procedimientos tradicionales basados en aforos.
152
CAPTULO 6
CONCLUSIONES Y LNEAS FUTURAS
6.1 CONCLUSIONES
6.1.1 Introduccin
Esta Tesis est enfocada a la aplicacin de los sistemas de telefona mvil en los estudios de
movilidad de transporte. El objetivo principal ha sido la realizacin de aportaciones importantes
en el campo de la inferencia de volmenes de trfico y en la estimacin de matrices OD,
orientndolas a datos tomados de los sistemas de telefona mvil. La telefona mvil se est
convirtiendo en un sector de gran utilidad en el mbito del trfico. En este contexto, el Captulo
3 revis en profundidad el EstadodelArte presentando los conocimientos actuales sobre la
estimacin de parmetros de trfico mediante el uso de informacin procedente de sistemas de
telefona mvil, as como las prestaciones y beneficios que ofrecen este tipo de estimaciones.
En el Captulo 4 se formularon un conjunto de modelos para la inferencia de volmenes de
trfico de vehculos mediante telfonos mviles que pasan por una determinada zona (frontera
de una celda a otra). Tras realizar un minucioso estudio comparativo entre ellos, atendiendo a
diferentes criteros, y contrastar los resultados, se seleccionaron aquellos que presentaron mejor
balance entre todos los criterios junto a una cierta exactitud de las predicciones. La forma
funcional de los modelos seleccionados puso de manifiesto:
i)
154
155
mvil se lograra reducir a su vez el coste econmico y temporal del estudio respecto del uso
tradicional de estaciones de aforo.
Finalmente, se desea destacar que los mayores beneficios que puede reportar un desarrollo
integrado de los mtodos planteados en esta Tesis, tanto de inferencia de volmenes como de
ajuste de matrices, vienen expresados en trminos de ventajas para la sociedad obtenidos desde
el punto de vista tecnolgico. El hecho de que cada uno de esos mtodos pueda ser abordado
mediante la misma tecnologa usada por los sistemas de telefona convencionales y que exista la
posibilidad de desarrollar una herramienta capaz de integrarlos es de sumo inters para los
planificadores de transporte. Una herramienta de ajuste de matrices mediante volmenes
derivados de telfonos mviles confiere un gran potencial prctico al proceso, dado que resuelve
la problemtica debida a, fundamentalmente:
Coste. El desarrollo de modelos de estimacin que tomen datos de sistemas de
telefona mvil y terminales convencionales usados hoy en da por cualquier usuario
supone un ahorro econmico importante asociado a gastos de instalacin y
mantenimiento que conllevaran las estaciones de aforo. Desde el punto de vista de
cobertura, la red de telefona tambin ofrece un ahorro considerable dado que su zona
de servicio abarca toda la cobertura nacional, incluyendo la red viaria, mientras que la
infraestructura de los clsicos aforos es limitada, condicionando por tanto la captura de
conteos de trfico.
Tiempo. La realizacin de grandes encuestas de movilidad supone un coste
econmico y humano muy elevado, por lo que su ejecucin suele abordarse
aproximadamente cada 5 aos. Es evidente que durante ese tiempo pueda producirse un
incremento/decremento de la movilidad en una ciudad o regin debido a la variacin en
la poblacin o del parque automotor, entre otros. Con lo cual, la percepcin de
movilidad reflejada por esas encuestas suele quedarse obsoleta al poco tiempo de su
elaboracin. El disponer de datos de movilidad generados por telfonos de usuarios en
los desplazamientos que habitualmente realizan durante un da, permite actualizar de un
modo ms continuo esos datos, incluso pueden servir para elaborar otro tipo de matrices
de movilidad a niveles ms extensos de zonificacin (macrozonas).
Fiabilidad. Aunque la realizacin de encuestas est sujeta a fuertes controles de
calidad para regular su fiabilidad, en ocasiones, suelen introducir cierto sesgo debido al
diseo, seleccin o determinacin del tamao de la muestra que la genera. Incluso,
puede darse el caso que los individuos ms mviles sean los que presenten menor
156
probabilidad de ser entrevistados, pues son los que pasan menos tiempo en casa. Por
otro lado, la realizacin de encuestas directamente a vehculos sobre el viario es
ciertamente incmoda para los usuarios y consumen mucho tiempo, con la consiguiente
distorsin que se deriva de estos hechos. En cambio, utilizar como muestra ciertos
telfonos mviles de individuos que los llevan consigo en todo momento (i.e.: encuesta
panel), lo cual es algo habitual en nuestros estilos de vida, permite obtener datos
razonablemente representativos de las pautas de movilidad de los usuarios sin provocar
ningn tipo de perturbacin.
No obstante, el mejor criterio para evaluar el uso de la telefona mvil en el mbito de la
movilidad de vehculos es determinar el impacto de los datos estimados a partir de ella en
trminos econmicos y tcnicos. Los siguientes apartados analizan las prestaciones de
estimaciones derivadas de sistemas de telefona mvil, enfocndolas a un nivel generalizado
entre los posibles parmetros de trfico que se pueden derivar de estos sistemas.
Ventajas
157
Inconvenientes
158
159
estimacin de parmetros de trfico. Una solucin sencilla es considerar vlidas para extraer
datos de trfico mediante telefona mvil nicamente aquellas zonas alejadas de ncleos
urbanos o de reas residenciales dado que en esos casos los usuarios sern los ocupantes de los
vehculos que circulan por vas como autovas, vas interurbanas o similares
Si se quisiera extraer informacin de trfico mediante la telefona en entornos urbanos,
considerando la grave influencia de la presencia de peatones o usuarios estticos, se hace
indispensable una diferenciacin entre stos y los usuarios en movimiento. Los procedimientos
encargados de la identificacin y filtrado de esos telfonos novlidos resultan ser una tarea
compleja pero necesaria en la estimacin de la mayora de parmetros de trfico. Otros
parmetros, tales como velocidad o tiempos de viaje, no se ven tan afectados por estas
circunstancias puesto que los telfonos estticos son directamente filtrados debido al propio
carcter del evento usado: el handover.
Por tanto, la estimacin de datos de trfico basados en telefona mvil debe combinarse con
otros procedimientos basados en velocidad u otros mtodos capaces de implementar tal
diferenciacin. En ese sentido, el IAGB (Institute for Applications of Geodesy to Engineering)
dentro del proyecto DoiT desarroll algoritmos para determinar y describir patrones de
movilidad mediante datos annimos de telefona mvil para la identificacin del modo de
transporte que est utilizando el telfono. (Wiltschko, 2006). En ellos se desarrollaron unas
funciones de anlisis y modelos de prediccin para estimar la cantidad de miembros en cada
clase o modo de transporte, logrando as distinguir entre clases activas o no activas (vlidas
o no vlidas). En consecuencia, se consigui mayor precicisn que utilizando modelos de
estimacin de verosimilitud, requiriendo la integracin de horarios y rutas de lneas de
transporte pblico (autobuses, trenes, etc.) en los modelos. Por otra parte, es necesario resaltar
que la presencia de varios telfonos mviles en un vehculo tambin perturba la estimacin de
parmetros de trfico. Por todo ello, es necesario indicar que los datos obtenidos de telfonos
mviles deben ser calibrados con otros mtodos de monitorizacin, como detectores o cmaras,
antes de usarlos como valor definitivo.
160
Es obvio que las nuevas tecnologas deben ser aprovechadas para introducir mejoras en la
sociedad actual. Y qu mejor beneficio que hacer frente a los dos problemas fundamentales de
trfico: la saturacin y la seguridad. La saturacin en las carreteras, especialmente aguda en las
zonas urbanas y en las grandes ciudades, provocan molestias a los conductores, con los
consiguientes efectos negativos sobre el medio ambiente. Por otro lado, para los conductores y
otros usuarios de la carretera, unos sistemas que permitan reforzar la seguridad en trminos de
tiempo de respuesta constituyen la primera preocupacin. De manera que unos sistemas de
informacin de trfico que permitan hacer predicciones de movilidad de usuarios segn el
historial de movimientos de fechas anteriores daran un paso adelante para solventar estos
problemas. Este apartado analiza la aplicabilidad y rentabilidad de herramientas basadas en
telefona mvil, haciendo nfasis en los campos de inters de esta Tesis: volmenes de trfico y
matrices de movilidad.
6.1.3.1
Aplicabilidad
161
otras aplicaciones adicionales que se pueden derivar de un sistema de informacin de este tipo,
algunas de las cuales ya fueron comentadas en el captulo del EstadodelArte.
Tabla 6-1: Ejemplos de Aplicaciones segn mercados de negocio.
Sector
Administracin y otras autoridades
pblicas
Compaas de logstica y flotas
Proveedores de servicios LBS
Consultoras de Transporte
Empresas de Telecomunicaciones
Marketing
6.1.3.2
Aplicaciones
Matrices Origen Destino
Volmenes y flujos
Vigilancia Congestin e Incidentes
Estudios de tiempos de viaje y/o velocidades
Estudios de planificacin
Estudios de contaminacin
Gestin y planificacin de rutas
Direccionamiento guiado
Vigilancia de congestin
Estudios de tiempos de viaje
Planificacin
Contaminacin atmosfrica
Estudios de transporte
Servicios de informacin en tiempo real (sms, WAP)
Campaas, ubicaciones estratgicas, etc
Rentabilidad
162
sistema de informacin de trfico, el cual resultara muy llamativo para la Administracin, que
se encarga de realizar las inversiones para mejorar la gestin y planificacin de la red.
El coste medio de una encuesta (encuesta+procesado) para estimar matrices OD oscila
alrededor de los 30 . Para ajustar las matrices O-D de modo apropiado, estas encuestas deben
efectuarse sobre una muestra representativa de la poblacin; por ello, su coste resulta muy
elevado. A ello se le une el coste temporal, debido a que el tratamiento de los datos de las
encuestas supone un largo proceso. Por ello estas encuestas suelen actualizarse con los datos
recogidos por los tradicionales aforos. El emplear informacin derivada de la telefona para
actualizar o, incluso, generar estas matrices sera una alternativa de especial inters para la
Administracin puesto que se conseguiran revolucionar los estudios de movilidad desde el
punto de vista de coste (utilizara la infraestructura existente de telefona celular), fiabilidad (son
datos de movilidad reales) y temporal, pudiendo dar respuesta inmediata a los problemas
derivados de ella.
6.1.3.3
Como ya se ha comentado, una matriz O-D obtenida de una forma automtica y, en cierto
modo, inmediata supondra una autntica revolucin en los estudios de movilidad encargados
por la Administracin. Junto a ello, podra dar tambin una respuesta inmediata a los problemas
derivados de la movilidad, permitiendo abordar temas a los que hasta ahora ha dedicado pocos
recursos, como la movilidad en fin de semana, movilidad motivo ocio, movilidad a pie, etc.
Asimismo, este sistema de informacin puede solventar otros problemas derivados del
incremento de trfico experimentado en la mayora de las reas metropolitanas de los pases
desarrollados como la saturacin, la seguridad y la escasez de nuevos servicios. Por ello, sector
pblico y privado deben trabajar de manera conjunta para introducir estas herramientas de
automatizacin, fomentando la integracin de las nuevas tecnologas en nuestra vida cotidiana.
Adicionalmente, este tipo de desarrollo en I+D+i aportara un retorno proveniente de la imagen
social que se generara en la colaboracin operadororganismo pblico para la incorporacin de
nuevas tecnologas en la mejora de la planificacin de la movilidad mecanizada.
163
164
BIBLIOGRAFA
Abrahamsson T. Estimation of origin-destination matrices using traffic counts a literature
survey. Interim report, International Institute for Applied Systems Analysis, A-2361. Laxenburg,
Austria, 1998.
Ahas R., lar M. Location based servicesnew challenges for planning and public
administration?. Futures, vol. 37(6), 547-561, 2005
AirSage. Using Cellular Technology to Provide an Intelligent Traffic Roadmap. Disponible on
line (Acceso Junio, 2007): http://www.airsage.com/pdf/trafficewise_release.pdf
Akin D., Sisiopiku V. P. Estimating origin-destination matrices using location information from
cell phones. Proc. of 49th Annual North American Meetings of the Regional Science Association
International, Puerto Rico, 2002.
Bar-Gera H. Evaluation of a cellular phone-based system for measurement of traffic speeds and
travel times: A case study from Israel. Transportation Research Part C, vol. 15(6), 380391,
2007.
Bar-Gera H. Transport Network Test Problems. Ben-Gurion University of the Negev.
Disponible online (Acceso Mayo, 2007b): http://www.bgu.ac.il/~bargera/tntp/
Bazaraa M. S., Shetty C. M. Nonlinear Programming: Theory and Algorithms. John Wiley &
Sons, Inc, 1979.
Beckmann M., McGuire C., Winsten C. Studies in the Economics of Transportation. Yale
University Press, New Haven, Connecticut, 1956.
Bekhor S., Hirsh M., Nimre S., Feldman I. Identifying Spatial and Temporal Congestion
Characteristics using Passive Mobile Phone Data. Transportation Research Board 87th Annual
Meeting, CD-ROM paper no. 1534, 2008.
Bell M.G.H. The estimation of an origin-destination matrix by constrained generalized least
squares. Transportation Research 25, 1322, 1991.
166
Birle C., Wermuth M. The Traffic Online Project. Special Session: Cellular-based traffic data
collection. SS45 (EU). 13th World Congress on ITS, London, United Kingdom, 2006.
Bolla R., Davoli F., Giordano F. Estimating road traffic parameters from mobile
communications. 7th World Congress on ITS, Torino, Italy, 2000.
Caceres N., Benitez F.G., Romero L.M., Vzquez J., Wideberg J. Herramienta para la
inferencia y actualizacin de matrices O-D de movilidad a travs de datos de telefona celular.
Informe Final FOM/486/2003, 2005.
Caceres N., Wideberg J. P., Benitez F. G. Deriving origin-destination data from a mobile phone
network. IET Proc. Intelligent Transport Systems, vol. 1(1), pp. 1526, 2007.
Caceres N., Wideberg J., Benitez F.G. Review of traffic data estimations extracted from cellular
networks, IET Proc. Intelligent Transport Systems, vol. 2(3), pp179192, 2008.
Cascetta E. Estimation of trip matrices from traffic counts and survey data: A generalized least
squares estimator, Transportation Research, 18B, 1984.
Cascetta E., Nguyen S. A unified framework for estimating or updating origin/destination
matrices from traffic counts. Transportation Research, 22B. 437-455, 1988.
Cayford R., Johnson T. Operational Parameters Affecting Use of Anonymous Cell Phone
Tracking for Generating Traffic Information. Transportation Research Board 82th Annual
Meeting, vol. 1(3):033865, 2003.
CMT (Comisin del Mercado de las Telecomunicaciones). Informe Telefona Mvil. Enero,
2009.
CDB, Communities Dominate Brands. A mobile phone for every living person in Western
Europe:
penetration
hits
100%.
Disponible
online
(Acceso
Octubre,
2007):
http://communities-dominate.blogs.com/brands/2006/03/phone_for_every.html
CRT, Consorcio Regional de Transportes de la Comunidad de Madrid, Modelizacin de la
Movilidad en Da Laborable de 2004 en la Comunidad de Madrid, 2004.
Chen Y., Florian M. OD demand adjustment problem with congestion: Part I. model analysis
and optimality conditions. In L. Bianco and P. Toth (Eds.), Advanced Methods in
Transportation Analysis, pp. 122. Berlin: Springer-Verlag, 1996.
BIBLIOGRAFA
167
Decell AutoRoute1 Real-Time Route Guidance. Disponible online (Acceso Junio, 2006):
http://www.decell.com/autoroute1/real_time.htm
Deheuvels P. La Fonction de Dependence Empirique et ses Propiets. Un test non parametrique
dindependence. Academie Royale de Belgique Bulletin de la Classe des Sciences-5e, 65: 274
292, 1979.
Delcan. Press Release. Delcan.NET and ITIS Holdings in Partnership. Disponible online
(Acceso Abril, 2005): http://www.itisholdings.com/pdf/delcanitis290405.pdf
Doblas F.J., Benitez F.G., 2005. An Approach to Estimating and Updating Origin-Destination
Matrices Based Upon Traffic Counts Preserving the Prior Structure of a Survey Matrix.
Transportation Research Part BMethodological, vol. 39, no. 7, pp. 565591.
EIA/TIA IS-95. Mobile Station-Base Station Compatibility Standard for Dual-Mode Wideband
Spread Spectrum Cellular System, 1993.
EMME/2. Users Manual, Software Release 9. INRO Consultants Inc, 1998.
Gavish B., Sridhar S. The impact of Mobility on Cellular Network Configuration, 4th Intern.
Conf. on Telecommunication Systems: Modelling and Analysis, pp. 197211, ATSMA,1996.
Gibson J.D. (ed). The mobile communications handbook, Second Edition. CRC Press & IEEE
Press, 1999.
Hellinga B., Fu L., Takada H. Traffic network condition monitoring via mobile phone location
referencing an emerging opportunity. Proc. of the 6th Transportation Specialty Conference
held in conjunction with the Annual Conference of the Canadian Society of Civil Engineers,
Toronto, Canada, 2005.
Hernando Rbanos J.M. Sistemas de Comunicaciones Mviles de Tercera Generacin IMT
2000 (UMTS). Ed. Fundacin Airtel-Vodafone, 2002.
Herrera J., Bayen A. Traffic flow reconstruction using mobile sensors and loop detector data.
Transportation Research Board 87th Annual Meeting, CD-ROM paper no. 1868, 2008.
Hong D., Rappaport S.S. Traffic model and performance analysis for cellular mobile radio
telephone systems with prioritized and nonprioritized handoff procedures, IEEE Trans. Veh.
Technol., vol. VT35, no. 3, pp. 448461, 1986.
168
Hpfner M., Lemmer K., Ehrenpfordt I. Cellular Data for Traffic Management First Results of
a Field Test. ITS Europe Conference, CD-ROM paper no. 2407, 2007.
Huidobro J.M. Comunicaciones Mviles. Ed. Paraninfo, 2002.
Ilyas M., Mahgoub I. (Editors). Mobile Computing Handbook. CRC Press, 2005.
ITIS Holdings Press Releases. Estimotion Technology chosen for traffic collection in Antwerp.
Disponible online (Acceso Septiembre 2004): http://www.itisholdings.com/pdf/itisproximus.pdf
Kummala J. Travel time service utilising mobile phones. Finnish Road Administration, Helsinki.
Finnra Report 55/2002. 67pp, 2002.
LeBlanc L.J. An Algorithm for the Discrete Network Design Problem. Transport Science, 9(3),
pp. 183199, 1975.
Linauer M., Leihs D. Generating floating car data by using GSMnetwork. Proc. of the 10th
World Congress and Exhibition on Intelligent Transport Systems and Services. Madrid, 2003.
Lovell D. J. Accuracy of speed measurements from cellular phone vehicle location systems.
ITS Journal, vol. 6, no. 4, pp. 303325, 2001.
Low D.E. A new approach to transport system modelling. Traffic Quarterly, vol. 26, no. 3, pp.
391404, 1972.
Maher M.J. Inferences on trip matrices from observations on link volumes: A Bayesian
statistical approach. Transportation Research, 17B. 435447, 1983.
MINUTP. Technical User Manual. Hague Consulting Group, HCG. V.93A, 1993.
MTS (Mobile Traffic Service), LogicaCMG. LogicaCMG provides reliable and comprehensive
traffic information based on GSM network data. Disponible online (Acceso Noviembre, 2003):
http://www.logica.com/logicacmg+provides+reliable+and+comprehensive+traffic+information
+based+on+gsm+network+data/400002401
Nelsen R. B. An Introduction to Copulas (Second Edition). Springer Series in Statistics.
Springer, New York, 2006.
BIBLIOGRAFA
169
Pan C., Lu J., Di S., Ran B. Cellular-Based Data-Extracting Method for Trip Distribution.
Transportation Research Record: Journal of the Transportation Research Board No. 1945, pp.
3339, 2006.
Patriksson M. The Traffic Assignment Problem: Models and Methods. VSP BV, 1994.
Pyo J.S., Shin D.H., Sung T.K. Development of a Map Matching Method Using the Multiple
Hypothesis Technique. IEEE Intelligent Transportation Systems Conference Proceedings.
Oakland, Calif., pp. 2327, 2001.
Rappaport T.S. Wireless Communications: Principles and Practice, Second Edition. Prentice
Hall, New Jersey, 2002.
Ratti C., Pulselli R.M., Williams S., Frenchman D. Mobile Landscapes: using location data
from cell-phones for urban analysis. Environment and Planning B: Planning and Design, vol.
33(5), pp 727-748, 2006.
Ratti C., Sevtsuk A, Huang S., Pailer R. Mobile Landscapes: Graz in Real Time. Proceedings of
the 3rd Symposium on LBS & TeleCartography. Vienna, Austria, 2005.
Reades J., Calabrese F., Sevtsuk A., Ratti C. Cellular Census: Explorations in Urban Data
Collection. IEEE Pervasive Computing, vol. 6, no. 3, pp. 3038, 2007.
Reklaitis G.V., Ravindran A., Ragsdell K.M. Engineering Optimization: Methods and
Applications. John Wiley & Sons, Inc, 1983.
Rose G. Mobile phones as traffic probes: practices, prospects and issues. Transport Reviews,
vol. 26, no. 3, 275291, 2006.
Sallent O., Valenzuela J.L., Agust R. Principios de Comunicaciones Mviles. Ediciones UPC,
Barcelona, Espaa, 2003.
Sheffi Y. Urban Transport Networks: Equilibrium Analysis with Mathematical Programming
Methods. Prentice-Hall, Inc., 1985.
Smith B.L., Fontaine M.D. Private-Sector Provision of Congestion Data. NCHRP 70-01,
University of Virginia, 2006.
170
Smith B.L., Pack M.L., Lovell D.J., Sermons M.W. Transportation management applications of
anonymous mobile call sampling. Proceedings of the 11th Annual Meeting of ITS America,
Miami, Florida, 2001.
Smith Institute. Realtime traffic monitoring using mobile phone data. Disponible online
(Acceso
Mayo,
2006):
www.smithinst.ac.uk/Projects/ESGI49/ESGI49-
Vodafone/Report/TrafficMonitoring.pdf
Sohn K. Dynamic estimation of origin-destination flows using cell phones as probes. SDI 2004
R04, Dept. of Urban Transportation, Seoul Development Institute, Korea, 2004.
Spiess H. A maximum likelihood model for estimating origin-destination matrices.
Transportation Research, 21B. 395412, 1987.
Spiess H. A Gradient Approach for the O-D Matrix Adjustment Problem. Publication no. 693,
Centre for Research on Transportation, University of Montreal, 1990.
Steele R., Nofal M. Teletraffic performance of microcellular personal communication networks,
IEE ProceedingsI, vol. 139, no. 4, pp. 448461, 1992.
Suwansirikul C., Friesz T.L., Tobin R.L. Equilibrium decomposed optimization: A heuristic for
the continuous equilibrium network design problem. Transport Science, 21, pp. 254263, 1987.
Thiessenhusen K.-U., Schfer R.-P., Lang T. Traffic data from cell phones: a comparison with
loops and probe vehicle data. 13th World Congress on ITS, CD-ROM, paper no. 1550. London,
United Kingdom, 2006.
Thornton J., Grace D. Effect of Lateral Displacement of a High Altitude Platform on Cellular
Interference and Handoff. IEEE Trans. Wireless Communications, vol. 4(4), pp. 14831490,
2005.
TRANSCAD. User's Guide, Version 4.8. Newton, MA, Caliper Corporation, 2006.
TRIPS. MVESTM program. INSMVA Systematica, 1990.
Van Zuylen H.J., Willumsen L.G. The most likely trip matrix estimated from traffic counts.
Transportation Research, 14B, 281293, 1980.
VDOT. Cell phones could keep you out of traffic jams. Disponible online (Acceso Septiembre,
2005): http://www.airsage.com/pdf/news-4-27-05.pdf
BIBLIOGRAFA
171
Virtanen J. Mobile phones as probes in travel time monitoring. Finnish Road Administration,
Helsinki, 2002.
White C.E., Bernstein D., Kornhauser A.L. Some Map Matching Algorithms for Personal
Navigation Assistants. Transportation Research Part C, vol. 8, pp. 91108, 2000.
White J.K., Gower P. Collecting origin-destination information from cellular phone location
data. TRL Unpublished Report, 1999.
White J., Wells I. Extracting origin destination information from mobile phone data. 11th
International Conference on Road Transport Information and Control (Conf. Publ. No. 486).
pp. 3034, 2002.
Wiltschko T., Schwieger V, Mhlenbrink W. Generating Floating Phone Data for Traffic Flow
Optimization. Proceedings of the 3rd International Symposium Networks for Mobility, Stuttgart,
Germany, 2006.
Yang H., Sasaki T., Iida Y., Asakura Y. Estimation of origin-destination matrices from link
traffic counts on congested networks. Transport Research 26B, 6, pp. 417434, 1992.
Ygnace J.-L. Travel time/speed estimates on the French Rhone corridor network using cellular
phones as probes. Final report of the SERTI V program, INRETS, Lyon, France, 2001.
Yim Y. The state of cellular probes. California PATH Research Report: UCBITSPRR2003
25, 2003.
Zeng Q-A., Mukumoto K., Fukuda K. Performance analysis of mobile cellular radio systems
with two-level priority reservation handoff procedure, IEICE Trans. Commun., vol. E80-B, no.
4, pp. 598604, 1997.
172
APNDICE I
GLOSARIO
A
AIC: Akaike Information Criterion (Criterio de Informacin de Akaike).
AMPS: Advanced Mobile Phone System.
AOA: Angel Of Arrival.
AuC: Authentication Center.
B
BER: Bit Error Rate.
BH: Busy Hour (hora de mayor ocupacin).
BIC: Bayesian Information Criterion (Criterio de Informacin Bayesiano).
BPR: Bureau of Public Roads.
174
C
CC: Country Code.
CGI: Cell Global Identity. CGI = LAI + CI.
CI: Cell Identity.
CIR: Carrier to Interference Ratio.
CMT: Comisin Mercado de las Telecomunicaciones.
CSPDN: Circuit Switched Public Data Network.
CV: Coeficiente de Variacin.
E
EIR: Equipment Identity Register.
F
FCD: Floating Car Data.
FW: FrankWolfe.
G
GMSC: Gateway Mobile Services Switching Center.
GPRS: General Packed Radio Service.
GSM: Global System for Mobile Communications.
Apndice I: GLOSARIO
175
H
HLR: Home Location Register.
HO: Handover.
I
IMD: Intensidad Media Diaria.
IMEI: International Mobile Equipment Identity.
IMSI: International Mobile Subscriber Identity. IMSI = MCC + MNC+ MSIN = MCC + NMSI.
ISDN: Integrated Services Digital Network.
ITS: Intelligent Traffic Systems.
L
LA: Location Area (rea de localizacin).
LAC: Location Area Code.
LAI: Location Area Identification. LAI = MCC +MNC +LAC.
LLF: Log-Likelihood Function.
LMSI: Local Mobile Station Identity.
LPR: License Plate Recognition.
LU: Location Update.
M
MCC: Mobile Country Code.
ME: Mobile Equipment.
176
N
NDC: National Destination Code.
NMC: Network management Center.
NMSI: National Mobile Station Identity.
NSS: Network Sub-System
O
OD: OrigenDestino.
OMC: Operation and Maintance Center.
OMC-N: Operation and Maintenance Center National.
OMC-R: Operation and Maintenance Center Regional.
P
PDU: Protocol Data Unit.
PIN: Personal Identification Number.
Apndice I: GLOSARIO
R
RA: Routing Area.
RAI: Routing Area Identification.
RLC: Radio Link Control.
RLP: Radio Link Protocol.
RSSI: Radio Signal Strenght Indicator.
RTB: Red Telefnica Bsica.
S
SIM: Subscriber Identity Module.
SN: Subscriber Number.
T
TAP: Traffic Assignment Problem.
TAZ: Traffic Analysis Zone.
TDOA: Time Difference Of Arrival.
TMSI: Temporary Mobile Subscriber Identity.
177
178
U
UMTS: Universal Mobile Telecommunications System.
V
VLR: Visitor Location Register.
VMS: Variable Message Signs.
APNDICE II
PUBLICACIONES
Algunos de los resultados obtenidos en esta Tesis se encuentran recogidos en las publicaciones
que se listan a continuacin, junto con otras aportaciones tambin relacionadas con ella.
PUBLICACIONES EN REVISTAS
Caceres N., Wideberg J.P., Benitez F.G. Deriving origindestination data from a mobile
phone network. IET Proc. Intelligent Transport Systems, vol. 1(1), pp. 1526, 2007.
Caceres N., Wideberg J., Benitez F.G. Review of traffic data estimations extracted from
cellular networks, IET Proc. Intelligent Transport Systems, vol. 2(3), pp. 179192,
2008.
Forecasting Traffic Flow Using Anonymous Mobile Phone Data. (En revisin 2009).
CONGRESOS INTERNACIONALES
Caceres N., Wideberg J. P., Benitez F. G. Deriving Traffic Data from a Cellular
Network. 13th World Congress on Intelligent Transport System and Services. London,
United Kingdom. 2006.
180
CONGRESOS NACIONALES
Caceres N., Romero L. M., Vzquez J., Wideberg J. P., Benitez F. G. Inferencia y
Actualizacin de Matrices O-D de Movilidad a Travs de Datos de Telefona Celular.
VII Congreso de Ingeniera del Transporte. Ciudad Real, Espaa, 2006. CIT 2006.
Caceres N., Romero L.M., Benitez F. G., Wideberg J. P. Metodologa Binivel para la
Estimacin de Matrices de Movilidad con Datos Agregados de Telefona Mvil. VIII
Congreso de Ingeniera de Transporte. A Corua, Espaa, 2008. CIT 2008.
OTRAS PUBLICACIONES
Cceres N., Bentez F.G., Romero L.M., Vzquez J., Wideberg J. Herramienta para la
inferencia y actualizacin de matrices OD de movilidad a travs de datos de telefona
celular. Informe Final FOM/486/2003. ISBN: 84-88783-77-9, 2005.
OTROS MRITOS
I Premio Vodafone al Proyecto de Desarrollo e Innovacin Mvil en el mbito de la
Investigacin, entregado por la Fundacin Vodafone Espaa en 2007 al equipo formado por
Noelia Cceres Snchez, Francisco Garca Bentez y Johan P. Wideberg del grupo de
Ingeniera e Infraestructura de los Transportes (Escuela Tcnica Superior de Ingenieros,
Universidad de Sevilla), por el proyecto Uso de datos de una Red GSM para la inferencia
de datos de movilidad interurbana de vehculos.