Sie sind auf Seite 1von 201

Noelia Cceres Snchez

TESIS DOCTORAL

ESTIMACIN DE MATRICES DE MOVILIDAD


MEDIANTE DATOS DE TELEFONA MVIL

Septiembre 2009
TESIS DOCTORAL

Noelia Cceres Snchez

TESIS DOCTORAL

ESTIMACIN DE MATRICES DE MOVILIDAD


MEDIANTE DATOS DE TELEFONA MVIL
Presentada por:

Noelia Cceres Snchez


Ingeniero de Telecomunicacin

Dirigida por:

Francisco Garca Bentez


Dr. Ingeniero Industrial

Luis M. Romero Prez


Dr. Ingeniero Industrial

Johan Wideberg
Dr. Ingeniero Industrial

Septiembre 2009

Departamento de Ingeniera Mecnica y de los Materiales


Ingeniera e Infraestructura de los Transportes
Escuela Tcnica Superior de Ingenieros
Universidad de Sevilla

Esta Tesis ha sido realizada gracias al proyecto TRA200509138, concedido por el Ministerio
de Ciencia y Tecnologa a travs del programa Plan Nacional I+D, y a VODAFONE dentro
del marco del Proyecto Minerva (1C-021).

A Fran, mi compaero de viaje


A Pilar, nuestra ilusin

AGRADECIMIENTOS
Esta Tesis Doctoral, si bien ha requerido de esfuerzo y mucha dedicacin por parte de la autora
y sus directores, su finalizacin no hubiese sido posible sin la cooperacin de todas y cada una
de las personas y entidades que a continuacin menciono. A Vodafone, especialmente a
Santiago Borrero, Jess Prez y M Satur Torre. Al Centro de Gestin de Trfico del Suroeste
(DGT), en particular a Ana Luz Jimnez. A Alejandro Carballar y Ana Madera del Proyecto
Minerva. A Manuel Garca de ITSoft. A todos ellos gracias por su inestimable colaboracin en
el desarrollo de este trabajo.
Me gustara agradecer sinceramente a Dr. Francisco Garca Bentez, Dr. Luis M. Romero Prez
y Dr. Johan Wideberg, la confianza depositada en m, as como su dedicacin y apoyo para que
este trabajo llegara a buen trmino. Sus conocimientos, orientaciones, paciencia y motivacin
han sido fundamentales para mi formacin como investigadora.
De igual manera agradecer a Dr. Jose Mara del Castillo Granados los conocimientos y consejos
ofrecidos para la realizacin de esta Tesis, especialmente en la ltima etapa.
A mis compaeros de Departamento, por ofrecerme su ayuda y amistad, haciendo an ms
agradable el trabajo cotidiano.
A mis padres, mi hermano y mis abuelos, por el apoyo incondicional que me han dado en todo
momento y porque, a pesar de la distancia, el nimo y alegra que me brindan me dan la
fortaleza necesaria para seguir adelante.
A Fran, por ser la persona con la que comparto mi vida, por su amor, paciencia y comprensin,
porque en su compaa las cosas malas se convierten en buenas, la tristeza se transforma en
alegra y la soledad no existe.
Por ltimo, y no menos importante, a mi hija Pilar, su nacimiento ha coincidido con el final de
la Tesis. Ella es lo mejor que me ha pasado nunca, y ha venido a este mundo a darme el ltimo
empujn para terminar este trabajo.

CONTENIDO
CAPTULO 1 INTRODUCCIN ..................................................................................................1
1.1

MOTIVACIN............................................................................................................1

1.2

MBITO DE LA TESIS .............................................................................................2

1.3

OBJETIVOS ................................................................................................................4

1.4

ANTECEDENTES ......................................................................................................6

1.5

ESTRUCTURA DE LA TESIS .................................................................................13

CAPTULO 2 REDES DE TELEFONA CELULAR: GSM ..........................................................17


2.1

INTRODUCCIN .....................................................................................................17

2.2

ARQUITECTURA DE LA RED GSM .....................................................................18

2.3

BASES DE DATOS HLR Y VLR ............................................................................23

2.3.1

Introduccin...........................................................................................................23

2.3.2

Home Location Register (HLR) ............................................................................24

2.3.3

Visitor Location Register (VLR) ...........................................................................24

2.4

IDENTIDADES Y NMEROS DE USUARIO Y RED...........................................25

2.4.1

Internacional Mobile Station Identity (IMSI) ........................................................25

2.4.2

Temporary Mobile Subscriber Identity (TMSI) ....................................................26

2.4.3

Location Area Identification (LAI) .......................................................................26

2.4.4

Cell Global Identity CGI o Cell ID .......................................................................27

2.5

DISEO DE LA RED CELULAR ............................................................................27

2.6

GESTIN DE MOVILIDAD ....................................................................................29

2.6.1

Actualizacin de la posicin (Location Update) ...................................................29

2.6.2

Entrega de llamada (Paging) .................................................................................30

2.6.3

Traspaso (Handover) .............................................................................................31

2.7

TRFICO Y DIMENSIONADO ..............................................................................32

2.7.1

Introduccin...........................................................................................................32

2.7.2

Modelos de trfico telefnico ................................................................................33


i

CAPTULO 3 ESTADO DEL ARTE EN EL MBITO DE LA ESTIMACIN DE PARMETROS DE


TRFICO MEDIANTE LA TELEFONA MVIL ............................................................................37
3.1

INTRODUCCIN .....................................................................................................37

3.2

MATRICES ORIGENDESTINO ............................................................................37

3.3

VOLUMEN ...............................................................................................................42

3.4

VELOCIDAD ............................................................................................................46

3.5

TIEMPOS DE VIAJE ................................................................................................50

3.6

CONGESTIN ..........................................................................................................53

3.7

DENSIDAD DE TRFICO.......................................................................................54

3.8

CARACTERSTICAS DE LOS DATOS DE TELEFONA MVIL.......................58

3.8.1

Precisin de localizacin .......................................................................................58

3.8.2

Tamao de la muestra ............................................................................................60

3.8.3

Aspectos legales ....................................................................................................61

3.9

CONCLUSIONES .....................................................................................................62

CAPTULO 4 INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL


.....................................................................................................................................................65
4.1

INTRODUCCIN .....................................................................................................65

4.2

ANTECEDENTES Y ESTADO ACTUAL...............................................................65

4.3

METODOLOGA PARA LA INFERENCIA DE VOLMENES DE VEHCULOS .


...................................................................................................................................67

4.3.1

Planteamiento del problema ..................................................................................68

4.3.2

Conteo de paso de telfonos entre celdas. Extraccin de la muestra.....................71

4.3.3

Anlisis descriptivo de los datos de llamadas .......................................................73

4.3.4

Tratamiento de los datos ........................................................................................76

4.3.5

Elaboracin de modelos de prediccin ..................................................................82

4.3.6

Contraste de modelos ............................................................................................97

4.3.7

Conclusiones .......................................................................................................112

ii

CAPTULO 5 APLICACIN A LA ESTIMACIN DE MATRICES ORIGENDESTINO ............117


5.1

INTRODUCCIN ...................................................................................................117

5.2

ANTECEDENTES Y ESTADO ACTUAL.............................................................119

5.3

METODOLOGA DE AJUSTE DE MATRICES ORIGENDESTINO MEDIANTE

VOLUMENES AGREGADOS.............................................................................................121
5.3.1

Introduccin.........................................................................................................121

5.3.2

Definicin del problema ......................................................................................122

5.3.3

Formulacin matemtica .....................................................................................124

5.3.4

Algoritmo de ajuste .............................................................................................129

5.4

CASOS PRCTICOS..............................................................................................140

5.4.1

Experimento 1: Red SiouxFalls .........................................................................140

5.4.2

Experimento 2: Red Comunidad Autnoma de Madrid ......................................145

CAPTULO 6 CONCLUSIONES Y LNEAS FUTURAS .............................................................153


6.1

CONCLUSIONES ...................................................................................................153

6.1.1

Introduccin.........................................................................................................153

6.1.2

Evaluacin del uso de telfonos mviles para movilidad de vehculos...............156

6.1.3

Estudio de mercado .............................................................................................159

6.2

LNEAS FUTURAS ................................................................................................162

BIBLIOGRAFA ..........................................................................................................................165
APNDICE I GLOSARIO ............................................................................................................173
APNDICE II PUBLICACIONES.................................................................................................179

iii

iv

NDICE DE FIGURAS
Figura 2-1: Arquitectura de la red GSM. ................................................................................... 19
Figura 2-2: Estructura de IMSI (Fuente: Rec. GSM 03.03) ....................................................... 26
Figura 2-3: Estructura de LAI (Fuente: Rec. GSM 03.03)......................................................... 26
Figura 2-4: Estructura de CGI (Fuente: Rec. GSM 03.03). ....................................................... 27
Figura 2-5: Definicin de celdas y reas de localizacin. .......................................................... 27
Figura 2-6: Antena omnidireccional (izquierda) y directiva sectores 120 (derecha). ............ 28
Figura 3-1: Flujo (rojo) y nmero de llamadas de telfonos (verde) en funcin del tiempo.
Izquierda: northbound (desde ciudad), derecha: southbound (hacia ciudad). Todos los datos son
promediados sobre intervalos de 15 minutos. (Thiessenhusen et al., 2006) ............................... 44
Figura 3-2: Ejemplo de ubicacin de aforo virtual. ................................................................... 44
Figura 3-3: Comparacin entre flujo real por un aforo virtual y el estimado tras el ajuste
(Caceres et al., 2006). ................................................................................................................. 45
Figura 3-4: Representacin de un aforo virtual. ..................................................................... 46
Figura 3-5: Promedio velocidades: telfonos vs. detectores. InterCiudad (arriba) e Intra
Ciudad (abajo) Motorway Northbound. (Ygnace, 2001) ............................................................ 47
Figura 3-6: Velocidad en funcin del tiempo obtenidos de datos GSM (+), detectores (), FCD
() (Thiessenhusen et al., 2006). ................................................................................................. 48
Figura 3-7: Concepto de estimacin de velocidad usando doblehandover (Birle et al., 2006).49
Figura 3-8: Zona handover (a) con solapamiento tpico y (b) con solapamiento debido a
edificios (Birle et al., 2006). ....................................................................................................... 50
Figura 3-9: Tiempos de viaje en la autova de Ayalon, sentido Norte (BarGera, 2007). ......... 52
Figura 3-10: Estimaciones de tiempos de viajes y velocidades en funcin del tiempo de salida:
datos GSM vs. LPR (Kummala, 2002). ...................................................................................... 52
Figura 3-11: Relacin entre volumen de llamadas y nivel de incidentes en la autova A7 (agosto
y septiembre 2000). Nota: Nivel de incidentes (level of incident): 0 = ningn incidente
detectado por los detectores, 14 = al menos 14 detectores (de 21) detectan un incidente en los
correspondientes intervalos de 12 min; Volumen de llamadas (call volume): promedio de

nmero de llamadas entrantes y salientes registradas en los correspondientes intervalos de 12


min (Ygnace, 2001). .................................................................................................................... 54
Figura 3-12: Intensidad de trfico telefnico a 10:00 a.m. en el rea metropolitana de Graz. .. 55
Figura 3-13: Representaciones de la densidad de llamadas de telfonos mviles en el rea
metropolitana de Miln (20 km 20 km) entre las 4 p.m. y las 6 p.m. ...................................... 56
Figura 3-14: Medidas de uso de la red mvil (Erlangs) en 6 lugares de Roma (Reades et al.,
2007). .......................................................................................................................................... 57
Figura 3-15: Localizacin por Identificacin Global de Celda CGI. ......................................... 58
Figura 3-16: Mltiples vas dentro de una celda. ....................................................................... 59
Figura 3-17: Fronteras entre celdas y LAs. ................................................................................ 64
Figura 4-1: Llamadas en movilidad: (a) handover y (b) 2 llamadas en t1 y t2 tal que
t2-t1T=15min.............................................................................................................................. 72
Figura 4-2: Definicin de frontera observada o aforo virtual en un modelo de red. .............. 73
Figura 4-3: Trfico telefnico (nmero de llamadas por hora) durante un da en una celda. .... 74
Figura 4-4: Promedio del nmero de llamadas por hora en diferentes celdas a lo largo de 18
das. ............................................................................................................................................. 75
Figura 4-5: Nmero de llamadas por hora durante un da segn la duracin de la llamada td. .. 75
Figura 4-6: Duracin media de las llamadas durante un da. ..................................................... 76
Figura 4-7: Ejemplos de solapamiento entre celdas. .................................................................. 77
Figura 4-8: Puntos kilomtricos en los que en sus proximidades existe una frontera entre celdas.
..................................................................................................................................................... 79
Figura 4-9: Coeficiente de Variacin de la distribucin de llamadas en diferentes celdas. ....... 81
Figura 4-10: Densidad Espectral de Potencia de la distribucin de llamadas en una celda. ...... 81
Figura 4-11: Diagrama de contorno de isoprobabilidad de la cpula independencia y la
emprica. ...................................................................................................................................... 84
Figura 4-12: Probabilidad de hacer una llamada a bordo de vehculo. ...................................... 89
Figura 4-13: Probabilidad de handover Ph segn el el factor de movilidad . ........................... 90
Figura 4-14: Evolucin de la probabilidad de handover en la celda origen de la frontera k segn
el intervalo horario ti. .................................................................................................................. 92

vi

Figura 4-15: Evolucin del n de llamadas y de vehculos en una frontera segn el intervalo
horario. ........................................................................................................................................ 94
Figura 4-16: Factor de intensidad del paso de vehculos segn el intervalo horario ti............... 95
Figura 4-17: Factor de intensidad del paso de vehculos segn el intervalo horario ti............... 96
Figura 4-18: Evolucin horaria del error relativo en valor absoluto para cada uno de los
modelos. ...................................................................................................................................... 99
Figura 4-19: Evolucin horaria del error absoluto para cada uno de los modelos. .................... 99
Figura 4-20: Distribucin acumulada del valor absoluto del error relativo en porcentajes
(arriba). Zoom en torno a los valores de error relativo absoluto 15-30% (abajo). .................... 100
Figura 4-21: Test grfico de normalidad. ................................................................................. 103
Figura 4-22: Histograma del error relativo de cada modelo segn el n de bins definido por
Knuth. ........................................................................................................................................ 104
Figura 4-23: Histograma del error relativo de cada modelo segn el n de bins definido por
Stone.......................................................................................................................................... 104
Figura 4-24: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 1 y la frontera 2. ........................................................................................................... 106
Figura 4-25: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 3 y la frontera 4. ........................................................................................................... 106
Figura 4-26: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 5 y la frontera 6 en cada periodo horario. .................................................................... 107
Figura 4-27: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 7 y la frontera 8 en cada periodo horario. .................................................................... 107
Figura 4-28: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 9 y la frontera 10 en cada periodo horario. .................................................................. 108
Figura 4-29: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 11 y la frontera 12 en cada periodo horario. ................................................................ 108
Figura 4-30: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan
la frontera 1 y la frontera 2. ....................................................................................................... 109
Figura 4-31: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan
la frontera 3 y la frontera 4. ....................................................................................................... 110

vii

Figura 4-32: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan
la frontera 5 y la frontera 6 en cada periodo horario. ................................................................ 110
Figura 4-33: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan
la frontera 7 y la frontera 8 en cada periodo horario. ................................................................ 111
Figura 4-34: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan
la frontera 9 y la frontera 10 en cada periodo horario. .............................................................. 111
Figura 4-35: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan
la frontera 11 y la frontera 12 en cada periodo horario. ............................................................ 112
Figura 5-1: Red de Sioux Falls, incluyendo distribucin ficticia de LAs y celdas. ................. 141
Figura 5-2: Correlacin entre los volmenes observados en fronteras (grupos de arcos) y los
modelados al asignar la matriz previa (a) y la matriz estimada (b). .......................................... 144
Figura 5-3: Correlacin entre la matriz previa y la matriz estimada. ....................................... 145
Figura 5-4: Nodos de la red de Madrid agrupados en 15 LAs. ................................................ 146
Figura 5-5: Correlacin entre los volmenes observados en fronteras (grupos de arcos) y los
modelados al asignar la matriz previa (a) y la matriz estimada (b). .......................................... 147
Figura 5-6: Correlacin entre los volmenes de arcos observados (pertenecientes a alguna
frontera observada) y los modelados al asignar la matriz previa (a) y la matriz estimada (b). . 149
Figura 5-7: (a) Evolucin de la funcin objetivo durante el proceso de ajuste de la matriz. (b)
Zoom para los subproblemas 25. (c) Zoom para el trmino de las restricciones de la funcin
objetivo. ..................................................................................................................................... 151

viii

NDICE DE TABLAS
Tabla 3-1: Comparativa de volmenes derivados de handovers o procesos de LU. .................. 64
Tabla 4-1: Extracto de los datos entregados por el operador. .................................................... 70
Tabla 4-2: ID fronteras asociados a cada punto kilomtrico y sentido. ..................................... 79
Tabla 4-3: Das observados. ....................................................................................................... 80
Tabla 4-4: Medidas de error para cada modelo. ......................................................................... 98
Tabla 4-5: Percentiles del error relativo en valor absoluto para cada modelo. ........................ 100
Tabla 4-6: Correlacin por rango (Spearman) y lineal (Pearson) entre { yi , yi } para cada
modelo. ...................................................................................................................................... 101
Tabla 4-7: Valores de Logaritmo de la verosimilitud (LLF), AIC y BIC del conjunto de errores
relativos de cada modelo, junto al nmero de parmetros de cada modelo. ............................. 105
Tabla 5-1: Fronteras observadas vlidas y arcos asociados. .................................................... 142
Tabla 5-2: Comparativa de ecuacin de la recta de regresin y R2, antes y despus de ajuste. 149
Tabla 6-1: Ejemplos de Aplicaciones segn mercados de negocio. ......................................... 161

ix

CAPTULO 1
INTRODUCCIN

1.1 MOTIVACIN
La creciente movilidad existente en la sociedad actual, potenciada por el incremento del uso del
automvil, exige tcnicas y mecanismos cada vez ms complejos para una correcta gestin y
planificacin de la red viaria. El objetivo de dicha planificacin del transporte es responder
adecuadamente a las necesidades de movilidad de la poblacin, por medio del dimensionado de
la infraestructura y de la utilizacin de los medios de transporte, estableciendo los costes de la
solucin adoptada, las fuentes de los recursos necesarios, y los plazos respectivos de las etapas
propuestas. Asimismo, la complejidad de los sistemas de transporte actuales ha mostrado la
conveniencia de contar con herramientas analticas que permitan al planificador disponer de un
adecuado conocimiento del sistema y poder hacer predicciones. Un modo de lograrlo es
caracterizar las vas en trminos de una serie de parmetros como son la velocidad, tiempos de
viajes, flujos, etc. La obtencin de esos datos de trfico de una forma precisa y rpida es de vital
importancia para la planificacin y gestin del trfico.
Las nuevas tecnologas, cada vez ms extendidas en la sociedad, juegan un papel clave para
introducir mejoras en la estimacin de estos parmetros y as hacer frente a los principales
problemas de trfico: movilidad, saturacin y seguridad. Un modo de conseguirlo es mediante la
telefona mvil. Segn los ltimos estudios de mercado, las tasas de penetracin de telefona
celular superan ya el 90% de la poblacin de gran cantidad de pases (CDB, 2006). Por ello,
parece lgico pensar que cada vehculo puede llevar a bordo algn telfono. La propia gestin
de movilidad que poseen las redes de telefona celular genera ciertos parmetros para su
correcto funcionamiento, tal que un tratamiento apropiado de ellos, sin necesidad de revelar
informacin confidencial de sus abonados, permitir determinar ciertos datos relativos a la
movilidad de vehculos mediante los telfonos que se lleven a bordo.

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

La idea del empleo de telfonos mviles para monitorizar el trfico rodado no es nueva. Sobre
este tema han aparecido mltiples trabajos en los ltimos aos, los cuales se revisan con ms
detalle en la Seccin 1.4 y el Captulo 3. Sobre este campo lleva varios aos trabajando el
Grupo de Transportes de la E.T.S.I. de Sevilla. En uno de los trabajos previos, se realiz un
estudio sobre una zona piloto (Cceres et al., 2005), financiado por el Ministerio de Fomento a
travs de las Ayudas a la Realizacin de Proyectos I+D en el rea de Transportes
FOM/486/2003, el cual demostr la viabilidad de la inferencia de datos de trfico a travs de
informacin disponible de telefona celular. Para ello se desarroll una herramienta simuladora
que, al tiempo que modelaba la situacin de trfico del escenario de estudio mediante un
simulador de trfico comercial, AIMSUN, generaba unos datos de localizacin de telfonos
similares a como se consiguen en las redes GSM. Con esos registros de localizacin ficticios,
el proceso de estimacin se fundament en un anlisis para controlar el paso por las distintas
celdas que cubran el tramo estudiado, actuando los telfonos como equipos de medida
annimos e indirectos. Los datos extrados proporcionaron informacin de movilidad con la que
inferir parmetros como matrices OD y volmenes. Adems, este simulador permiti la
posibilidad de evaluar los resultados inferidos puesto que, mientras generaba los registros de
localizacin oportunos, paralelamente, almacenaba los datos de la situacin de trfico simulada
a fin de evaluar la precisin de estimacin de esta tcnica. Los resultados obtenidos revelaron el
potencial de esta nueva tcnica al obtener gran precisin en la estimacin de datos de trfico.
Este hecho, junto con la existencia de proyectos similares en otros pases donde participan
operadores de telefona mvil, impuls la investigacin dentro de este campo de cara a la
implementacin sobre un escenario real.

1.2 MBITO DE LA TESIS


Una de las principales caractersticas en la sociedad actual es el continuo incremento en la
movilidad de personas y mercancas. Esto conlleva un conjunto de problemas tales como
congestin y retraso. Resolver problemas derivados de la movilidad se considera hoy uno de los
ejes centrales en la gestin y planificacin de la red viaria. Para conocer eficientemente las
caractersticas del trfico vehicular existente en la red viaria sera necesario aforar todas las vas
de manera casi permanente, lo cual implicara disponer de una infraestructura considerable cuyo
coste de instalacin y mantenimiento es poco asumible. As pues, surge la necesidad de nuevas
alternativas que permitan caracterizar el trfico de un modo rpido, preciso y continuo, sin un
excesivo coste. El desarrollo de la telefona mvil impulsa su uso como alternativa para la
gestin de trfico. Su extendido uso en las sociedades modernas hace considerar a sus abonados

Captulo 1: INTRODUCCIN

como una muestra extensa de la que extraer datos, convirtindose sus terminales en sondas
annimas para caracterizar el trfico de un modo transparente.
En lo que respecta a la gestin del trfico de vehculos, una de las fuentes de informacin ms
demandadas, con vista a la gestin de la red de infraestructura terrestre y su planificacin
estratgica, son los datos de movilidad origendestino. Estos datos, organizados en matrices
origendestino (OD), proporcionan una estimacin del nmero de personas que se desplazan
entre puntos de una determinada red en un periodo de tiempo dado, definiendo el mapa de
movilidad. La estimacin precisa de estas matrices, para modos de transporte mecanizados, es
imprescindible para que la Administracin optimice el uso de esta infraestructura desde el punto
de vista del usuario (en su utilizacin diaria) as como desde el punto de vista de las inversiones
a realizar, necesarias para la adecuacin de estas infraestructuras a las necesidades previstas y
pronosticadas en escenarios futuros.
La estimacin de una matriz OD, desde la toma inicial de datos hasta la explotacin de los
primeros resultados, supone un largo proceso que puede abarcar un periodo de incluso aos.
Esta restriccin, junto con los costes econmicos y los medios necesarios para llevarla a cabo,
implica que el nico usuario posible de dichas matrices sea la Administracin. Por ello, una
matriz OD obtenida de una forma automtica y, en cierto modo, inmediata supondra una
autntica revolucin en los estudios de movilidad encargados por la Administracin. Junto a
ello, podra dar tambin una respuesta inmediata a los problemas derivados de la movilidad,
permitiendo abordar temas a los que hasta ahora ha dedicado pocos recursos, como la movilidad
de fin de semana, movilidad asociada a ocio, movilidad a pie, etc.
Histricamente, las matrices origendestino han sido estimadas en base a tres metodologas
diferentes.
1. Estimacin directa: Llevando a cabo un proceso de encuestacin, domiciliario o viario
(directo sobre una muestra de vehculos o por ficha proporcionada a conductores, o
indirecto por captacin de nmeros de matrculas).
2. Estimacin por modelos de demanda: Haciendo uso de un modelo de distribucin (e.g.:
modelo de gravedad).
3. Estimacin mediante conteos de trfico: Utilizando conteos de trfico a fin de actualizar
una matriz origendestino preexistente.

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

De las tres aproximaciones anteriores, la primera de ellas, que utiliza resultados de la teora de
muestras, es la que proporciona los resultados ms fiables. Sin embargo, llevar a cabo una
encuesta amplia y detallada, que permita elaborar matrices OD completas, resulta ser un
proceso costoso, desde el punto de vista econmico y social (las encuestas a vehculos sobre el
viario son altamente distorsionantes, consumen mucho tiempo y dan lugar a resultados con
ciertos sesgos).
La segunda de ellas aplica modelos sintticos, de demanda de viajes, al sistema de transporte
actual para obtener estimaciones de los flujos origendestino. Estos modelos pueden ser
calibrados especficamente para el rea de estudio o transferidos desde reas similares.
La tercera alternativa es la ms profusamente utilizada en las ltimas dcadas y ha dado lugar a
innumerables contribuciones desde el trabajo pionero de Low (1972). La metodologa en la que
se basa exige, como prerrequisito, un conjunto de aforos que recogen conteos de trfico
(volmenes observados) y una matriz OD previa (obtenida de algn estudio cronolgicamente
anterior o de una encuestacin bsica que predefina la estructura de la matriz final a obtener).
Los aforos de trfico es un tipo de informacin que se recoge de forma automtica en un
conjunto de puntos asociados a arcos del viario y, por consiguiente, se encuentran disponibles
en reas urbanas a muy bajo coste. De aqu que esta ltima alternativa presenta las ventajas
econmicas de eliminar encuestas, las manipulaciones de datos, los chequeos y las validaciones
en gran medida. Sin embargo, presenta la desventaja de depender de la infraestructura de
detectores (aforos) existente.
El problema de ajustar una matriz de viajes OD, a partir de mediciones de aforos en una red de
trfico y de una matriz OD desactualizada, ha suscitado un gran inters en los ltimos aos.
Esto es debido, fundamentalmente, a que la informacin se puede obtener ms rpida y
econmicamente que la obtenida tradicionalmente mediante la realizacin de encuestas. Es en
este contexto donde se va a centrar esta Tesis, pero introduciendo una novedad respecto a los
volmenes observados. En lugar de los tradicionales conteos de trfico realizados por los aforos,
se utilizarn como volmenes observados datos de movilidad derivados de la telefona mvil.
Esto implicar el desarrollo de modelos de inferencia de volmenes de trfico mediante datos de
telfonos as como algoritmos de ajuste adaptados a las caractersticas de esos volmenes.

1.3 OBJETIVOS
Como ya se ha comentado en lneas anteriores, la obtencin de datos de una forma precisa y
rpida es una de las principales preocupaciones para la planificacin y gestin del trfico. Entre

Captulo 1: INTRODUCCIN

esta informacin de trfico destacan las matrices origendestino, las cuales son esenciales con
vista a la gestin de la red y su planificacin. De las metodologas existentes para la estimacin
de matrices OD, la ms extendida se basa en el ajuste de una matriz previa (obtenida de algn
estudio cronolgicamente anterior o de una encuestacin bsica que predefina la estructura de la
matriz final a obtener) mediante conteos de trfico medidos en un subconjunto de arcos de la
red, a fin de encontrar una matriz OD que, cuando sea asignada a la red, reproduzca los
conteos de trfico observados.
Una posible alternativa, tanto para la determinacin de las matrices de movilidad OD como
para la captacin de aforos en determinados puntos de la red de infraestructura terrestre
(carreteras, viarios,), consiste en la utilizacin de ciertos datos de posicin de telfonos
mviles, los cuales son conocidos por los operadores mviles para su correcta administracin de
servicios. Estos terminales no tienen una posicin fija sino que pueden moverse libremente.
Esto obliga a los operadores a disponer de mecanismos para realizar un seguimiento de sus
usuarios y as proporcionarles los servicios contratados lo ms rpido posible y con menor coste
de sealizacin.
La idea fundamental reside en que si a bordo de un vehculo hay un telfono encendido, dicho
vehculo puede ser considerado como un sonda. Segn el informe presentado en Enero de
2009 por la CMT el nmero de abonados de telefona mvil en Espaa supera ya el 100 % de la
poblacin total. En la Unin Europea, la media se sita en torno al 90% (CDB, 2006), siendo
esta tendencia similar en la mayora de pases del mundo desarrollado. Dicho crecimiento se
refleja en nuestros hbitos ya que el telfono mvil se convierte en un elemento indispensable
en nuestra vida diaria. Este hecho hace pensar que los terminales mviles pueden convertirse en
posibles sondas de nuestra movilidad puesto que nos acompaan a lo largo de todo el da.
No resulta extrao que cada vehculo lleve a bordo un telfono mvil, propiedad de su
conductor o del resto de sus ocupantes. La propia gestin de movilidad que poseen las redes de
telefona celular ofrece una estimacin de la posicin de sus abonados, referida a la zona que les
proporciona cobertura. De modo que la posicin de un vehculo puede ser monitorizada
mediante el anlisis de los registros de posicin que el telfono que lleva a bordo enva al
sistema. El tratamiento de estos datos, sin la necesidad de revelar informacin confidencial de
sus abonados, permitir determinar ciertos datos relativos al desplazamiento de vehculos
mediante los telfonos que se lleven a bordo.
El objetivo final es presentar las nuevas tecnologas como una alternativa viable para su uso en
los estudios de movilidad de transporte, para lo cual ser necesario desarrollar:

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

a. Una metodologa para la inferencia de volmenes (aforos) en determinadas zonas de la


red utilizando informacin de terminales mviles annimos a bordo de vehculos.
Para la captacin de aforos en determinados puntos de la red, los datos de mviles
proporcionaran flujos mediante la determinacin del nmero de mviles que atraviesan
los arcos que se desean monitorizar y seran transformados, usando mtodos estadsticos
de estimacin oportunos, a su equivalente en nmero de vehculos.
b. Un algoritmo de estimacin y ajuste para la actualizacin de una matriz de movilidad
mediante esos volmenes inferidos de telfonos mviles.
Conocida una matriz de movilidad ya obsoleta, denominada matriz previa, sta se
ajustara utilizando tcnicas de estimacin, mediante volmenes observados en un
conjunto de arcos, adaptadas a los requerimientos que exige utilizar informacin
derivada de telfonos mviles. Con este nuevo algoritmo, en lugar de utilizar los
tradicionales aforos, se utilizaran los volmenes derivados de los telfonos mviles que
pasan de una celda a otra, transformados en su equivalente en vehculos. Como ya se
explica en captulos posteriores, tpicamente una frontera entre celdas comprende varios
arcos, de modo que el paso de terminales proporciona volmenes agregados del grupo
de arcos que cruzan la frontera. No obstante, la informacin de los aforos derivados de
telfonos mviles podra ser complementada con la de aforos tradicionales (espiras,
cmaras de vdeo, etc.), dado que stos son un caso especial en la que la frontera es
cruzada por un nico arco, dotando al algoritmo de mayor versatilidad.
Una vez que las matrices de movilidad OD se han inferido mediante el algoritmo
citado en el punto precedente, stas se asignaran al modelo de red existente de la regin
bajo estudio. Los resultados proporcionados mediante este proceso de asignacin seran
los flujos de trfico en cada uno de los arcos de la red.

1.4 ANTECEDENTES
La idea de la utilizacin de mviles para monitorizar las condiciones del trfico rodado no es
nueva. La aparicin de legislaciones en diferentes pases que exigieron precisin en la
localizacin de llamadas de emergencias (E112, Europa 2002/22/EC) propici una exhaustiva
investigacin sobre nuevas tcnicas que mejoraran los datos de posicin proporcionados por los
operadores. Como consecuencia de estos trabajos, surgieron nuevas aplicaciones relacionadas
con la informacin de posicin (LBS), muchas de ellas enfocadas al sector del Transporte. Esta

Captulo 1: INTRODUCCIN

temtica est siendo estudiada en numerosos centros de investigacin, universidades y


departamentos relacionados con el transporte de todo el mundo. Cabe destacar la labor del
Department of Civil Engineering (Univ. de Waterloo), con las publicaciones de varios trabajos
de investigacin (Hellinga et al., 2005), y la del Institute of Transportation Studies (Univ. de
California, Berkeley), por las mltiples aportaciones relacionadas con la materia, como una
revisin del EstadodelArte (Yim, 2003). No obstante, el creciente inters en este campo ha
hecho surgir en los ltimos aos numerosos proyectos piloto por parte de diferentes entidades.
Una revisin detallada sobre proyectos piloto y otros estudios relacionados con la materia
aparece en trabajos como Caceres et al. (2008) o en un informe presentado por el VDOT, en
referencia al proyecto NCHRP 7001, (Smith y Fontaine, 2006). En un apndice de este ltimo
informe se revisan diferentes proyectos (finalizados y en curso) que emplean sistemas de
monitorizacin de trfico basados en WLT (Wireless Location Technology). Haciendo uso de
informacin publicada hasta entonces, se elabor un documento que recopila datos como
entidades participantes, objetivos, tecnologa usada, etc., de cada uno de esos proyectos, junto
con resultados obtenidos caso de haber finalizado.
Sobre este tema se han presentado en los ltimos aos innumerables publicaciones en revistas y
libros. En 2000, se present un modelo de estimacin de trfico mediante un algoritmo que
estimaba parmetros de trfico a partir de datos de posicin de telfonos (Bolla et al., 2000). En
2001, se elaboraron diferentes estudios sobre datos annimos de posicin de telfonos mviles
orientados a aplicaciones de transporte, como velocidades o tiempos de viaje (Lovell, 2001,
Smith et al., 2001). Tambin se deben destacar estudios sobre estimacin de matrices origen
destino mediante registros de telfonos mviles (Pan et al., 2006) o utilizando simulaciones de
datos de telefona mvil (Caceres et al., 2007, Sohn, 2004, Akin y Sisiopiku, 2002), as como
otros estudios orientados a la efectividad de la tcnica, como el de Cayford y Johnson (2003),
que examinaron los principales parmetros a considerar: precisin, frecuencia de las mediciones
y nmero de localizaciones necesarias para la correcta descripcin del trfico.
De todos ellos, la precisin es el parmetro que posee mayor relevancia para alcanzar los
resultados deseados. El nivel de precisin ms fino proporcionado por la red GSM sin realizar
ninguna modificacin en ella ni en los terminales es a nivel de celda, es decir, con el rea de
cobertura de la estacin base a la que est conectado el terminal mvil. Esta precisin depende
del radio de la celda, pudiendo ser de 200 m en ciudades y oscilando entre 5 y 20 km en
entornos rurales. No obstante, existen otros modelos que poseen mayor precisin pero requieren
la modificacin de la red (instalando elementos adicionales para realizar mediciones de seal:
ngulo de llegada, nivel de seal, etc.) o implican la modificacin de los terminales (GPS,
relojes para medir tiempos de llegada, etc.). Dado el gasto asociado a estas modificaciones

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

adicionales as como que la informacin recopilada debe ser estadsticamente representativa, es


decir, que el tamao de la muestra sea lo mayor posible (la mayora de los abonados no
disponen de terminales modificados), esta Tesis centra su atencin en la localizacin
proporcionada por una red GSM tpica sin modificar. Este nivel, a pesar de que ofrece una
precisin que no es la ptima, es suficiente para una apropiada estimacin de ciertos parmetros
de trfico.
En la actualidad, existen multitud de estudios piloto relacionados con esta nueva alternativa.
Todos ellos han mostrado magnficos resultados para una posible implementacin en la
realidad. Sin embargo, pese a ser una fuente de datos fiable y real que permite monitorizar la
movilidad de los habitantes de una zona, estos datos de localizacin agregados no se utilizan de
manera sistemtica para describir la planificacin de sistemas urbanos o interurbanos.
Principalmente, esto se debe al acceso restringido a estos datos de localizacin disponibles por
los operadores de telefona. Adems, la carencia de una normativa detallada para el manejo de
estos datos por parte de terceros junto con la creciente preocupacin asociada a trminos de
privacidad frenan el desarrollo de esta alternativa. No obstante, numerosos estudios (Ahas y
lar, 2005, Ratti et al., 2006, y Rose, 2006) realizados en los ltimos aos estn demostrando
que la utilizacin de estos datos no vulnera los derechos de los abonados y que, con la
colaboracin del operador, se pueden obtener nuevos productos que beneficien no slo a los
operadores sino a toda la sociedad. Incluso se muestra que poseen numerosas ventajas respecto
a los mtodos anteriores:

Gran tamao de la muestra de datos, asociado con la tasa de penetracin de


telefona mvil.

Cualquier zona puede ser monitorizada, dada la extensa cobertura de telefona.

No se precisa de instalacin adicional de elementos en el vehculo ni en la red para


ser monitorizado.

Datos generados quasi en tiempo real.

PROYECTOS RELACIONADOS CON DATOS DE TRFICO DERIVADOS DE


TELEFONA CELULAR
Existen mltiples proyectos en los que se estudia esta tcnica. Algunos de ellos utilizan la
propia localizacin usada por los operadores GSM cuando un telfono est simplemente
encendido, otros emplean ciertos datos asociados a situaciones concretas como llamadas o datos

Captulo 1: INTRODUCCIN

de facturacin, incluso existen proyectos que desarrollan un software propio para captura de
sealizacin de los telfonos mviles. A continuacin se enumeran una serie de proyectos
relacionados con la materia. Todos focalizan su atencin en el uso de los datos de localizacin
asociados a telfonos mviles para obtener informacin sobre desplazamientos de vehculos,
respetando en todo momento la privacidad del abonado mvil.
Uno de los ms recientes es el desarrollado por el SENSEable City Laboratory del MIT con
estudios realizados en diferentes ciudades del mundo como Graz (Austria), Miln o Roma
(Italia). En el desarrollado en Graz se consigui mapear una ciudad en tiempo real, siguiendo a
miles de personas que se desplazaban por la ciudad con sus telfonos mviles encendidos (Ratti
et al., 2005). Esto fue posible gracias a la colaboracin del operador austriaco A1/Mobilkom
que entreg datos annimos de los telfonos para permitir a los investigadores del MIT
desarrollar el proyecto Mobile Landscapes. Con ello, se crearon mapas digitales del uso de los
terminales en el rea metropolitana de Graz, visualizando la dinmica total de la ciudad en
tiempo real. Los investigadores cruzaron tres tipos de datos cedidos por el operador: la densidad
de las llamadas (medida en Erlang), los orgenes y destinos de stas (a travs de handovers), y
las posiciones de usuarios muestreados a intervalos regulares. La misma metodologa se aplic a
la ciudad de Miln, obteniendo resultados similares (Ratti et al., 2006).
Otro estudio desarrollado por el SENSEable City Laboratory fue en la ciudad de Roma, aunque
ste estuvo enfocado a cuestiones de dinmica social de una ciudad, tales como relaciones entre
hbitos telefnicos y tipos de actividad asociadas al terreno (reas residenciales, comerciales,
zonas tursticas,). El proyecto Real Time Rome utiliz diferentes tipos de datos procedentes
de telfonos mviles. Uno de ellos fue una medida de uso de ancho de banda de la red,
recogidos a nivel de antena (Erlangs). Los otros se correspondan con datos de posicin y
trayectoria de usuarios llamantes obtenidos mediante la plataforma Lochness del operador
Telecom Italia. La investigacin se centr principalmente en revelar la similitud entre zonas
urbanas basndose en patrones del uso de la red mvil. Agrupando reas con actividad
telefnica similar se clasificaba la ciudad en zonas, de modo que dichas zonas eran comparadas
con otras definidas segn el tipo de actividad que se desarrollaba en el rea (comercial,
residencial, turstica). Para ello, se dividi la ciudad en pxeles y utiliz esos datos de uso de
la red para promediar valores de Erlang que caracterizaban cada pxel (Reades et al., 2007).
Segn los valores que tomaba dicha magnitud en cada pxel y aplicando el algoritmo de
agrupacin K-Means, se obtenan clusters que representaban caractersticas espacio-temporales
de la ciudad en funcin del uso del telfono mvil, por ejemplo, se obtenan diferentes clusters a
primera hora de la maana debido a desplazamientos asociados a la jornada laboral que a ltima
hora de la tarde de un fin de semana, donde los cluster estn asociados a actividades de ocio. Por

10

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

tanto, el proyecto revel patrones de movilidad diarios segn los hbitos telefnicos de los
habitantes de una ciudad.
En Europa, se ha desarrollado un sistema de informacin sobre trfico denominado MTS
(Mobile Traffic Services). MTS utiliza la informacin de la red GSM sobre el desplazamiento
de los telfonos mviles (presentes en los vehculos) para monitorizar el trfico y as ayudar a
las autoridades a gestionar el flujo de vehculos por vas y/o posibles congestiones. El piloto se
ha realizado en la provincia de NoordBrabant en Holanda, en colaboracin con LogicaCMG,
Vodafone y el gobierno local (MTS, 2003). El software base fue desarrollado por Applied
Generics, una empresa que proporciona soluciones avanzadas de localizacin de mviles e
informacin de trfico a los operadores, cuyo producto RoDIN24 monitoriza una red de
telefona mvil para adquirir localizaciones annimas en tiempo real de gran cantidad de
telfonos, muchos de los cuales estarn dentro de un vehculo.
En la regin de Flandes, el operador de telefona belga PROXIMUS y la sociedad britnica ITIS
Holdings han desarrollado tambin un proyecto piloto que utiliza estas tcnicas para el control
de trfico en carreteras a travs de las posiciones de telfonos mviles en los vehculos en
movimiento. ITIS recibe del operador PROXIMUS el nmero de mviles conectados a cada
estacin base, sin revelar informacin confidencial de sus abonados, con objetivo de poder
determinar, entre otros datos, la velocidad de desplazamiento de cada telfono celular entre una
antena y la siguiente (ITIS Holdings, 2004).
En 1999, TRL (Transport Research Laboratory) particip en un proyecto de actualizacin de
matrices origendestino con datos de telefona mvil en el Reino Unido. La investigacin
encontr que era posible obtener informacin de matrices origendestino mediante la
localizacin de telfonos mviles, junto con otras medidas de informacin de trfico tales como
tiempos y velocidades del viaje. TRL desarroll un algoritmo para analizar los datos annimos
de telfonos procedentes de facturacin, proporcionados por el operador BTCellnet
(actualmente O2) y convertirlos en informacin asociada a trfico (White y Gower, 1999; White
y Wells, 2002).
Otro proyecto europeo que ha desarrollado esta tcnica es STRIP (System for Traffic
Information and Positioning), el cual investig y valid el uso de la posicin de un telfono
mvil para la estimacin de tiempos de viaje (Ygnace, 2001). El proyecto fue realizado bajo el
programa SERTI (Southern European Road Thelematics Implementation), en colaboracin con
el gobierno francs y el operador de telefona SFR (Cegetel Group). Para la obtencin de datos
de telfonos se us el mtodo de localizacin conocido como Abis Probing, que monitoriza la

Captulo 1: INTRODUCCIN

11

informacin de sealizacin enviada por los interfaces radio Abis y A. STRIP se dividi en dos
subsistemas base: uno de captura de datos que recoga mensajes de telfonos mviles en tiempo
real y calculaba su localizacin; y otro de procesamiento y presentacin que calculaba tiempos
de viaje en secciones de va, indicando la direccin de movimiento y mostrando la posicin de
las llamadas.
En 2002, Finnra (Finnish Road Administration) y el operador de telefona mvil Radiolinja
desarrollaron un sistema donde se capturaron los datos de un conjunto de telfonos (encendidos)
en un cierto tramo para proporcionar estimaciones de tiempos de viaje (Kummala, 2002,
Virtanen, 2002). Teniendo en cuenta que cada terminal intercambia informacin peridicamente
con las estaciones base ms cercanas, el anlisis del tiempo que llevaban los telfonos
comunicndose con estaciones bases permiti estimar tiempos de viaje. A fin de validar la
tcnica, estas estimaciones se compararon con otras obtenidas mediante identificacin de
matrcula LPR (License Plate Recognition), mostrando esta nueva alternativa resultados ms
exactos cuando se analizaba el trfico en tramos largos (aproximadamente de 10 km) donde la
entrada, salida o parada de vehculos es poco frecuente. Junto con ello, se observ que el nuevo
sistema no se vea afectado por condiciones atmosfricas adversas, como s ocurra con los
sistemas de LPR. Respecto a la privacidad de los datos, el cifrado de las identidades de los
telfonos impeda que fuera posible conocer qu telfono realizaba cada viaje detectado; no
obstante, tampoco se almacenaba ninguno de los datos despus de ser utilizados.
En Alemania, Vodafone (dentro del programa ESGI 2004) propuso ofrecer ciertos servicios de
informacin de trfico por carretera a sus clientes de telefona mvil. Para ello, se plante
generar datos de flujo y velocidad de vehculos usando informacin de sealizacin que ya est
disponible de las operaciones estndar de su red de telefona mvil. En dicho proyecto se
investig la viabilidad del uso del handover para generar informacin de trfico, analizando
datos recogidos entre Julio y Septiembre del 2003 (previamente procesados por Vodafone)
sobre una autopista en Alemania. Un handover se produce cuando un telfono con una llamada
activa se mueve de una celda a otra y la llamada es transferida desde la antena servidora a la que
gestiona la nueva celda, sin interrumpirse la comunicacin. Entonces, la captura de informacin
annima asociada a cada una de esas llamadas traspasadas (como celdas implicadas, instante y
duracin del handover, junto con algn otro tipo de informacin de sealizacin) permiti que
fuera posible calcular datos como velocidad o flujo a travs de los handover efectuados entre
celdas, asociando previamente carreteras a cada una de las celdas y realizando clculos
oportunos de ubicacin de fronteras de dichas celdas (Smith Institute, 2006).

12

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

Pero no slo en Europa se estn desarrollando proyectos relacionados con esta tcnica, la
empresa israelita Decell Ltd. tiene desarrollado un producto denominado AutoRoute1, el cual
lleva a cabo un muestreo peridico y aleatorio de telfonos mviles que viajan a bordo de
vehculos en movimiento en una determinada zona. Segn estas muestras de mviles registrados
en una red sobre un lugar concreto, se estiman ciertos parmetros de trfico (como velocidad,
densidad o flujos) para cada tramo de la carretera (DecellAutoroute, 2006). Este sistema
convierte datos que constantemente son generados dentro de una red mvil en informacin
precisa y en tiempo real de trfico por una carretera. Adems provee a los conductores de rutas
recomendadas que corresponden al tiempo de recorrido previsto para alcanzar un destino
concreto segn la ubicacin estimada. Los conductores pueden tambin recibir alarmas
instantneas sobre incidencias relevantes de trfico tales como accidentes, obras, etc.
AutoRoute1 genera informacin en tiempo real de trfico mientras se respeta la privacidad y
anonimato de sus abonados mviles. Ello se asegura teniendo en cuenta que toda la informacin
de localizacin es almacenada y procesada dentro del servidor AutoRoute1, el cual fsicamente
se establece dentro del entorno del operador. De forma que, al igual que pasa con informacin
de facturacin, estos datos no pueden emitirse al exterior y son inaccesibles a cualquier persona
fuera de la organizacin del operador.
En EE.UU. existen diferentes proyectos relacionados con esta tcnica. La mayora de ellos estn
desarrollados por los Departamentos de Transporte de diferentes estados junto con la
colaboracin de empresas y operadores de telefona. Uno de ellos es el que desarroll VDOT
(Virginia Department of Transportation) junto con AirSage para demostrar la viabilidad del
empleo de datos de telfonos para la vigilancia del trfico (VDOT, 2005). Para ello, AirSage
elabor un software que recopilaba informacin de sealizacin asociada a localizacin enviada
automticamente por telfonos que estn simplemente encendidos o en llamada para controlar
su movimiento (Airsage, 2007). Esa informacin permita conocer la posicin de telfonos
annimos en ciertos instantes la cual, una vez procesada y representada sobre un mapa,
mostraba la velocidad con la que fluctuaba el trfico en cualquier carretera dada por la que
existieran vehculos con telfonos a bordo.
Otro proyecto americano fue el desarrollado en Maryland por Delcan Corp. junto con ITIS
Holdings el cual construa un mapa en tiempo real del trfico a lo largo de sus principales
carreteras usando los movimientos de telfonos (Delcan, 2005). Este proyecto tena como
objetivo principal el conocer el estado del trfico en ciertas vas para enfocarlo a la deteccin de
eventos, tales como congestin o accidentes, sin necesidad de usar sensores, cmaras u otros
elementos que requieren de instalacin adicional de nuevos equipos sobre el terreno. En lugar

Captulo 1: INTRODUCCIN

13

de estos elementos se utilizaron los telfonos mviles, propiedad de los conductores, como
sondas annimas. De esta manera se logra obtener informacin sobre cualquier punto de la red
viaria en el que existan telfonos, ya que los operadores conocen aproximaciones de las
localizaciones de sus abonados en trminos de antena (celda) a la que deben encaminar las
llamadas. La informacin tomada de los mviles se trat annimamente, evitando la posibilidad
de rastreo de personas concretas en su movimiento hacia un destino. Dicha informacin
perteneca tanto a seales radio que los telfonos envan a las estaciones base como a seales
derivadas del proceso de movimiento de telfonos con llamada activa de una estacin base
(antena) a otra, denominado handover. Entonces, conociendo esa informacin junto con los
mapas de carreteras se poda conocer la ubicacin aproximada de los telfonos y cmo de
rpido se estaban moviendo.
Estos son algunos de los proyectos desarrollados en los ltimos aos. Todos ellos centran su
atencin en un objetivo comn, el uso de los datos de localizacin de telfonos mviles, los
cuales son ya conocidos por los operadores, para obtener informacin sobre desplazamientos de
vehculos. La mayora de ellos se han desarrollado con la colaboracin de operadores mviles
sin necesidad de vulnerar los derechos de intimidad de sus abonados. No obstante, la principal
barrera a superar para la implantacin completa de esta alternativa consistir en el
establecimiento de acuerdos con los operadores para la utilizacin de los sistemas de telefona
mvil en aplicaciones de valor aadido como son la gestin del trfico y su planificacin. Estos
acuerdos pueden verse favorecidos cuando los operadores descubran el rendimiento econmico
real del uso de sus sistemas para este tipo de servicios enfocados al trfico, sin afectar a su
funcionamiento.

1.5 ESTRUCTURA DE LA TESIS


El documento final de esta Tesis Doctoral se ha dividido en 6 captulos.
En el Captulo 1 se ha expuesto la temtica en la cual se enmarca la Tesis, realizndose una
introduccin al problema de estimacin de matrices de viajes origendestino en redes de trfico
actuales y procedindose a revisar los antecedentes sobre el uso de la telefona mvil en la
monitorizacin del trfico.
En el Captulo 2 se describe el funcionamiento de las redes de telefona mvil, revisndose con
especial detenimiento el tratamiento seguido para gestionar la movilidad de sus abonados a fin
de comprender la utilidad de la telefona mvil en los estudios de transporte.

14

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

En el Captulo 3 se revisa el EstadodelArte, procedindose a presentar los conocimientos


actuales sobre la estimacin de parmetros de trfico mediante el uso de informacin procedente
de los sistemas de telefona mvil.
El Captulo 4 est dedicado a desarrollar una metodologa para la inferencia de volmenes de
trfico de vehculos mediante el flujo de telfonos mviles que atraviesan una determinada
zona. En el captulo se lleva a cabo una revisin de los procedimientos actuales de obtencin de
volmenes en arcos, enfocando el problema al caso del nivel de precisin disponible de los
sistemas de telefona mvil. Para el desarrollo de la metodologa, se propone el uso de modelos
matemticos que permita expresar en forma cuantitativa relaciones de dependencia de vehculos
y telfonos mviles de modo que puedan ser usados con fines predictivos. En particular, se
pretende que los modelos planteados proporcionen medidas admisibles de volmenes de
vehculos sin necesidad de instalar una estacin de aforo sobre la zona. El captulo se completa
con un ensayo numrico sobre diferentes fronteras entre celdas en el que se evala el
rendimiento de los modelos propuestos mediante un anlisis comparativo entre ellos,
contrastando los volmenes estimados con medidas proporcionadas por estaciones de aforo
ubicadas en puntos prximos a dichas fronteras, y seleccionando aquellos modelos que mejor
balance alcancen entre todos los criterios evaluados.
Para completar el estudio propuesto para esta Tesis, en el Captulo 5 se aborda el problema de
estimacin de matrices Origen-Destino mediante un algoritmo cuya principal novedad es el uso
de datos de volmenes agregados sobre grupos de arcos como sera la informacin inferida
mediante la telefona mvil. En este captulo se propone una metodologa de ajuste de una
matriz previa mediante un modelo de estructura binivel empleando la adaptacin a nivel de
grupos de arcos de un algoritmo robusto y eficiente que trabaja a nivel clsico de volumen de
arco. La eleccin de dicho algoritmo como fundamento reside en la importancia de dos criterios
tomados a la hora de emprender la resolucin del problema: i) que la matriz resultante
reproduzca, al ser asignada a la red, los datos de volmenes agregados lo ms fielmente posible
y ii) que la informacin contenida en la matriz OD previa no se vea distorsionada en exceso
durante el ajuste, puesto que una distorsin excesiva de dicha informacin invalida cualquier
esfuerzo presupuestario y humano dedicado a tareas de encuestacin. Para analizar la
consistencia y eficiencia del algoritmo desarrollado se completa el captulo con un estudio
numrico sobre dos redes: una de pequea escala pero muy conocida en los estudios de
transporte, la red de Sioux Falls. Y otra que se correspondera con la red de la Comunidad de
Madrid, para la cual tambin se dispone de datos de aforos tradicionales (a nivel de arco), de

Captulo 1: INTRODUCCIN

15

modo que es posible realizar una comparacin del algoritmo propuesto frente a otros que
utilizan aforos a nivel de arco.
Finalmente, en el Captulo 6 se agrupan las conclusiones y se sugieren posibles lneas para
futuras investigaciones.

16

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

CAPTULO 2
REDES DE TELEFONA CELULAR: GSM

2.1 INTRODUCCIN
Las redes telefnicas mviles surgieron como un nuevo servicio que facilitaba la comunicacin
entre usuarios sin requerir una conexin permanente (fija) con la red, de forma que el usuario
consegua una ms amplia libertad de movimiento, pudiendo acceder, va radio, a centrales de
conmutacin a travs de estaciones base radioelctricas distribuidas por la zona de servicio.
Como consecuencia, un usuario que va a realizar una llamada accede a la red a travs de la
estacin que gestione la zona de cobertura en la que se encuentre. Por otro lado, cuando se
recibe una llamada, la red debe conocer, en todo momento, dnde est el usuario destinatario de
la llamada para que sta pueda ser encaminada correctamente. Por ello debe realizar un
seguimiento de forma automtica que permita encontrar la estacin base (celda) que da servicio
a cada telfono con el menor retraso posible. Bajo este razonamiento, un telfono mvil que est
encendido, independientemente de que est haciendo uso de la red (llamada, sms, etc.),
puntualmente informa a la red de su posicin actual en trminos de la zona de cobertura en la
que se encuentra. Este hecho permite que un sistema de telefona mvil tenga continuamente
localizados a sus abonados para proporcionar los servicios contratados lo ms rpido posible y
con el menor coste de sealizacin.
A esta propiedad de la red se le llama localizacin, la cual debe ser dinmica, ya que, por
definicin, el usuario puede moverse por la red, y debe actualizarse en funcin del
desplazamiento y del tiempo. Asimismo, como consecuencia de esa movilidad, un usuario
puede cambiar de zona de cobertura de las estaciones base de la red. En esos casos, debe
asegurarse la continuidad de las llamadas en curso de forma automtica, para lo cual existe la
operacin de traspaso de llamadas o handover.
El dinamismo caracterstico de la vida moderna est modificando el estilo de vida tanto a nivel
individual como colectivo de la sociedad actual. Como consecuencia, surge la necesidad de

18

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

soluciones cada vez ms avanzadas que permitan la comunicacin entre personas mientras stas
se estn desplazando por la red. Este hecho fomenta que los sistemas de telefona mvil estn
experimentando un rpido crecimiento, especialmente impulsado por la caracterstica de
permitir establecer cualquier tipo de comunicacin con la red (llamadas, sms, acceso a
Internet), independientemente de la posicin y movimiento del terminal. Para garantizar esta
movilidad de los abonados manteniendo la calidad de los servicios, una red de telefona dispone
de un sistema completo con funciones de acceso, transmisin, conmutacin y sealizacin, que
proporcionan servicios de telecomunicacin a usuarios a travs de acceso va radio.
En los siguientes apartados se presentan conceptos bsicos relacionados con los sistemas de
telefona mvil, revisando su arquitectura de red y sus principales elementos. Adems se
introducen nociones bsicas respecto a la planificacin y dimensionado de la red, describiendo
las principales funcionalidades asociadas a la gestin de movilidad a fin de comprender mejor
cmo puede ayudar la telefona mvil en la inferencia de parmetros asociados al trfico. Para
su elaboracin se ha utilizado la siguiente bibliografa: Gibson (1999), Hernando Rbanos
(2002), Huidobro (2002), Sallent et al. (2003), Rappaport (2002) y Ilyas y Mahgoub (2005).

2.2

ARQUITECTURA DE LA RED GSM

En lo que se refiere a la estructura bsica del sistema GSM, ste se organiza como una red de
estaciones base radioelctricas que proporcionan cobertura completa al rea de servicio. Cada
estacin base (BTS) tiene asociada una zona de cobertura, denominada celda, que opera en un
conjunto de canales de radio diferentes a los usados en las celdas adyacentes y que se
encuentran distribuidas segn un plan celular. Un grupo de BTSs se encuentra conectado a un
controlador (BSC), encargado de aspectos como el handover (traspaso de llamada de una
estacin base a otra) o el control de potencia de las BTSs y de los mviles. En consecuencia, el
BSC se encarga del manejo de toda la red de radio y supone una autntica novedad respecto a
los anteriores sistemas celulares.
Una o varias BSCs se conectan a una central de conmutacin de mviles (MSC). ste es el
corazn del GSM como responsable de la inicializacin, enrutamiento, control y finalizacin de
las llamadas, as como de la informacin sobre la tarificacin. Es tambin el interfaz entre
diversas redes GSM o entre una de ellas y las redes pblicas de telefona o datos. La
informacin referente a los abonados se encuentra almacenada en dos bases de datos que se
conocen como registro de posiciones base (HLR) y registro de posiciones de visitantes (VLR).

Captulo 2: REDES DE TELEFONA CELULAR GSM

19

Los diferentes elementos que constituyen una red de telefona celular GSM se clasifican en
cuatro grupos fundamentales:
1.

MS (Mobile Station).
ME (Mobile Equipment).
SIM (Subscriber Identity Module).

2.

BSS (Base Station SubSystem).


BSC (Base Station Controller).
BTS (Base Transceiver Station).

3.

NSS (Network and Switching Subsystem).


MSC (Mobile Switching Center).
GMSC (Gateway Mobile Switching Center).
VLR (Visitor Location Register).
HLR (Home Location Register).
AuC (Authentication Center).
EIR (Equipment Identity Register).

4.

NMC (Network Management Center).


OMC (Operation and Maintenance Center).

Figura 2-1: Arquitectura de la red GSM.

20

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

A continuacin se describe cada elemento en base a la clasificacin anterior.


1. Estacin Mvil (Mobile Station, MS). Consta de dos elementos bsicos: el equipo mvil
(ME) y la tarjeta SIM (Subscriber Identity Module).

Mobile Equipment (ME)

Es el dispositivo mvil y se identifica dentro de cualquier red GSM por el International Mobile
Equipment Identity (IMEI). El IMEI es un nmero de 15 cifras y tiene la siguiente estructura:
IMEI = TAC / FAC / SNR / sp donde:
TAC = Type Approval Code (6 CIFRAS).
FAC = Final Assembly Code, identifica al fabricante (2 cifras).
SNR = Serial Number (6 cifras).
sp = Cifra suplementaria de reserva (1 cifra).
Los equipos tienen la peculiaridad de variar la potencia de emisin de seal sobre la celda en la
que se encuentren con el objetivo de poder mantener en todo momento el nivel de potencia de
transmisin ptimo, limitando interferencias cocanal inducidas sobre celdas adyacentes y
reduciendo el consumo. Esta potencia de emisin es caracterstica del mvil, de manera que su
nivel de potencia mximo es importante dado que implica un aumento de la capacidad del
terminal para poder alejarse de la estacin base y poder seguir disfrutando del servicio.

Subscriber Identity Module (SIM)

La SIM es una pequea tarjeta inteligente dotada de memoria y microprocesador que sirve para
identificar al abonado. Esta tarjeta se inserta en el interior del mvil y permite al usuario acceder
a todos los servicios disponibles por parte de su operador. Sin la tarjeta SIM, el terminal no
tiene utilidad porque no puede hacer uso de la red. Puesto que la tarjeta SIM permite identificar
al abonado independientemente del terminal usado, se proporciona al usuario la posibilidad de
continuar recibiendo y efectuando llamadas y utilizar todos los servicios que tiene contratados
insertando la tarjeta SIM en otro terminal.
La SIM est protegida por un nmero de cuatro dgitos que recibe el nombre de PIN (Personal
Identification Number). Una vez que se introduce el PIN en el terminal, ste activa el proceso de
bsqueda de las redes GSM que estn disponibles para intentar validarse en ellas. Una vez que
la red valida el terminal, el telfono queda registrado en la celda que lo ha validado. Es
importante destacar que la red que valida el terminal es la que se tiene contratada.

Captulo 2: REDES DE TELEFONA CELULAR GSM

21

La tarjeta SIM contiene el IMSI (International Mobile Subscriber Identity), usado para
identificar y validar al abonado en cualquier sistema GSM. Adems, contiene los
procedimientos de criptografa para la confidencialidad de la informacin del usuario o las
memorias del telfono (alfanumricas o para mensajes de texto, SMS).
2. Subsistema de estaciones base (Base Station Subsystem, BSS): Sirve para conectar a las
estaciones mviles con los NSS (Network SubSystem), adems de ser los encargados de la
transmisin y recepcin. Constan de dos elementos diferenciados: la estacin base o BTS (Base
Transceiver Station) y la BSC (Base Station Controller).

Base Transceiver Station (BTS)

La BTS alberga todos los receptores/transmisores que dan servicio a una celda, los cuales estn
encargados de recibir y enviar informacin al canal radio, abasteciendo una interfaz fsica entre
la estacin mvil y la BSC. Las antenas usadas en cada celda de la red pueden estar situadas en
el centro de la celda (omnidireccional) o directivas (sectores de 120). Normalmente la potencia
de transmisin determina el tamao de la celda.

Base Station Controller (BSC)

Se encarga de la gestin de varias BTSs en lo relativo a los recursos de radio: asignacin,


utilizacin y liberacin de las frecuencias, handovers y funcionamiento con saltos de
frecuencias, controlando la conexin entre las BTSs y las MSCs (centrales de conmutacin que
proporcionan la conexin con la red fsica y otras redes).
3. Subsistema de conmutacin y red (Network and Switching Subsystem, NSS): Es el
sistema encargado de administrar las comunicaciones que se realizan entre los diferentes
elementos de la red. Para poder realizarlas, la NSS se divide en 7 sistemas diferentes, cada uno
con una misin dentro de la red:

Mobile Services Switching Center (MSC): Es el componente central del NSS y se


encarga de las labores de conmutacin para estaciones mviles situadas en su rea de
influencia, as como de proporcionar la conexin con otras redes. Adems, proporciona
las funciones adicionales necesarias para sustentar la movilidad y organizar la
asignacin de los recursos radioelctricos. Entre esas funciones se destacan las
siguientes:

Procedimientos para la localizacin y registro de abonados y su


actualizacin.

22

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

Gestin de llamadas y aviso a la estacin mvil de llamadas entrantes.

Procedimientos para el traspaso de llamadas (handovers).

Recopilacin de datos de trfico y facturacin.

Gateway Mobile Services Switching Center (GMSC): Es una MSC que adems es
utilizada para dirigir hacia la red mvil las llamadas originadas en la red fija. De modo
que acta como dispositivo pasarela que se encarga de servir de mediador entre las
redes de telefona fijas y las mviles, haciendo que los protocolos de comunicaciones
que existen en ambas redes se entiendan. Esta central se encarga de interrogar al HLR
adecuado para conocer la posicin del mvil al que va dirigida la llamada para,
posteriormente, encaminar la llamada hacia la MSC correspondiente.

Home Location Registrer (HLR): Es una base de datos que contiene informacin sobre
los usuarios conectados a un determinado MSC. Analiza informacin relativa a los
niveles de suscripcin, servicios suplementarios y localizacin actual o ms reciente de
los mviles que pertenecen a la red local de ese MSC. El HRL funciona conjuntamente
con el VLR.

Visitor Location Registrer (VLR): Contiene informacin sobre los niveles de


suscripcin, servicios suplementarios y localizacin para un abonado que se encuentra o
al menos se encontraba recientemente visitando el rea gestionada por el MSC. Esta
base de datos dispone tambin de informacin relativa a si el abonado se encuentra
activo o no, lo que evita el uso improductivo de la red (envo de seales a una
localizacin que se encuentra desconectada).

Authentication Center (AuC): Asociado al HLR trabaja el centro de autentificacin


(AuC), que contiene la informacin por la que se comprueba la autenticidad de las
llamadas con el fin de evitar los posibles fraudes, la utilizacin de tarjetas de abonado
(SIMs) robadas o el disfrute del servicio por parte de morosos. Tambin se encarga de
soportar funciones de encriptacin.

Equipment Identy Registrer (EIR): Tambin es un elemento para la seguridad de las


redes GSM pero a nivel de validez de terminales. La EIR contiene una base de datos con
la identificacin de todos los terminales que son vlidos para ser usados en la red. De
manera que se puede impedir que se realice una llamada cuando se detecte que ha sido
robado, pertenece a algn modelo no homologado o sufre algn fallo susceptible de
afectar negativamente a la red.

Captulo 2: REDES DE TELEFONA CELULAR GSM

23

4. Network Management Center (NMC): Es un sistema de operacin que constituye la


mxima jerarqua dentro del sistema de explotacin. De este centro dependen todos los dems
centros de operacin y mantenimiento (Operation and Maintenance Center, OMC). Estos
centros tienen las siguientes funciones:
o

Acceso remoto a todos los elementos que componen la red GSM (BSS, MSC,
VLR, HLR, EIR y AuC).

Gestin de las alarmas y del estado del sistema con posibilidad de efectuar
varios tipos de pruebas para analizar las prestaciones y verificar el correcto
funcionamiento del mismo.

Recogida de todos los datos relativos al trfico de los abonados necesarios para
la facturacin.

Supervisin del flujo de trfico a travs de las centrales.

Visualizacin de la configuracin de la red con posibilidad de cambiarla por


control remoto.

Administracin de los abonados y posibilidad de poder conocer su posicin


dentro del rea de cobertura.

En redes de telefona de grandes dimensiones pueden existir ms de una OMC. En este caso
existir un OMC general desde el que es posible controlarlo todo (OMCN) y otros OMC
limitados al control de algunas zonas (OMCR).

2.3

BASES DE DATOS HLR Y VLR

2.3.1 Introduccin
En los sistemas de telefona mvil, dado que los terminales pueden moverse libremente por la
red, es necesario realizar un seguimiento automtico de los mismos para poder encontrar la
celda donde se encuentra con el menor retardo posible, lo cual es fundamental, por ejemplo, en
el caso de una llamada entrante. Para lograrlo se emplea una base de datos jerrquica de dos
niveles formados por el HLR y varios VLRs. Dada la importancia de estas bases de datos para
las funciones de movilidad implementadas en las redes de telefona mvil, a continuacin se
describe con ms detalle aspectos significativos relacionados con estas bases de datos.

24

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

2.3.2 Home Location Register (HLR)


Cuando se inscribe un nuevo abono de usuario a la red GSM, todas las informaciones para su
identificacin se memorizan en el HLR de la MSC asociada al rea en la que se encuentre en ese
momento inicial. El HLR contiene informacin administrativa (nivel de subscripcin, servicios
suplementarios, etc.) de cada abonado asignado al mismo, junto con los datos de localizacin,
incluyendo informacin sobre la posible rea visitada a efectos de enrutar llamadas destinadas al
mismo. Para ello, requiere trabajar conjuntamente con los VLRs. La informacin contenida en
el HLR puede clasificarse como:
o

Datos permanentes, entre los que figuran la identificacin del abonado (IMSI y
MSISDN), informacin relativa a teleservicios, servicios portadores y servicios
suplementarios (con sus parmetros) contratados, junto a limitaciones de
servicio.

Datos temporales (actualizables), que son los relativos a la localizacin del


terminal a fin de encaminar las llamadas entrantes al MSC donde est
registrado. Esta informacin comprende el MSRN, direcciones del VLR y del
MSC e identidad temporal (TMSI) que tiene asignado el terminal.

El HLR, como todas las bases de datos de la red, est implementado en una estacin de trabajo
cuyas prestaciones (memoria, procesadores, capacidad de los discos) son actualizables cuando
crece el nmero de abonados. Asociado al HLR trabaja el centro de autentificacin (AuC), que
contiene la informacin por la que se comprueba la autenticidad de las llamadas con el fin de
evitar los posibles fraudes, la utilizacin de tarjetas de abonado (SIMs) robadas o el disfrute del
servicio por parte de impagados.

2.3.3 Visitor Location Register (VLR)


El VLR almacena, de modo temporal, informacin de todos los abonados que en un momento
dado estn registrados dentro de su rea de servicio. Esta informacin es requerida y obtenida a
partir de los datos contenidos en el HLR del que depende el usuario. En general, para simplificar
las sealizaciones requeridas y la estructura del sistema, los fabricantes implementan el VLR y
el MSC juntos, de modo que el rea geogrfica controlada por el MSC corresponde a la
controlada por el VLR.
Cuando un terminal entra en la zona controlada por un MSC, esta central chequea en su base de
datos asociada para determinar si el usuario est en su Home Area (donde se registr por
primera vez), o en un Roaming Area, es decir, que el usuario se encuentra en modo

Captulo 2: REDES DE TELEFONA CELULAR GSM

25

itinerancia. En el caso de un usuario itinerante, se notifica esa situacin al VLR correspondiente


a ese rea visitada. El terminal ejecuta entonces un proceso de inscripcin o registro y recibe
una direccin de visitante que se traduce en un nmero de ruta, MSRN (Mobile Subscriber
Roaming Number), que sirve para encaminar las llamadas destinadas a l hacia el rea donde se
encuentra actualmente el mvil. Adems, es necesario enviar esta informacin hacia el HLR
asociado al usuario (el de su Home Area).
El VLR contiene tambin otras informaciones necesarias para el tratamiento de las llamadas
entrantes/salientes, las cuales se obtienen mediante un dilogo entre el VLR y el HLR. La
informacin bsica contenida en el VLR, toda ella de carcter temporal, es la siguiente:
o

Identidad permanente del abonado (IMSI).

Identidad temporal del abonado (TMSI).

Nmero telefnico del abonado (MSISDN).

Nmero de encaminamiento (MSRN).

Identidad de la zona de localizacin (LAI).

Servicios contratados por el usuario (servicios suplementarios, restricciones).

Esta base de datos dispone tambin de informacin relativa a si el abonado se encuentra activo o
no, lo que evita el uso improductivo de la red (envo de seales a un terminal desconectado).

2.4

IDENTIDADES Y NMEROS DE USUARIO Y RED

Para los procesos de autentificacin de los usuarios y encaminamiento de las llamadas, se ha


establecido un conjunto de nmeros asociados a los usuarios y a los elementos de la red. A
continuacin se describen los ms relevantes.

2.4.1 Internacional Mobile Station Identity (IMSI)


El IMSI se almacena en la tarjeta SIM y se asigna al abonado en el momento de suscribirse. Es
un nmero interno de red que identifica al abonado para el acceso a las bases de datos. Como
este nmero se difunde por el interfaz radio y puede ser captado, para preservar la
confidencialidad de la identidad, la red asigna una identidad ficticia al abonado, denominada
TMSI (Temporary Mobile Subscriber Identity), una vez que ste ya est registrado. De modo
que slo se transmite por radio si es necesario. Se compone de un mximo de 15 dgitos y tiene
la siguiente estructura:

26

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

MCC

MSIN

MNC
NMSI
IMSI

Figura 2-2: Estructura de IMSI (Fuente: Rec. GSM 03.03)

Se aprecia que est compuesto de tres elementos:


i)

Mobile Country Code (MCC): tres dgitos que identifican el pas de domicilio del
abonado mvil (Ej.: 214 para Espaa).

ii)

Mobile Network Code (MNC): dos dgitos para usos GSM. EL MNC identifica al
operador (GSM/PLMN) dentro del pas del abonado mvil (Ej.: 01 para Vodafone).

iii)

Mobile Station Identification Number (MSIN) identifica al abonado mvil dentro


de un operador (GSM/PLMN), mximo 10 cifras.

2.4.2 Temporary Mobile Subscriber Identity (TMSI)


Es la identidad temporal que se le da al abonado mvil para evitar enviar continuamente el IMSI
por el interfaz radio. Consiste en un identificador ficticio que tendr el abonado durante un
intervalo de tiempo. El TMSI tiene importancia nicamente local, es decir, identifica a un
terminal nicamente dentro del rea controlada por el VLR y, por tanto, del MSC. Su
significado temporal es crear la correspondencia entre TMSI e IMSI, de modo que cuando el
mvil se desplaza al rea controlada por otro MSC, se le tiene que asignar un nuevo TMSI.

2.4.3 Location Area Identification (LAI)


Un rea de localizacin (LA) es una zona geogrfica cubierta por una agrupacin de celdas,
siendo una celda la zona en la cual una estacin base proporciona los servicios. Las reas de
localizacin se identifican mediante un nmero denominado LAI (Location Area Identity), que
tiene la estructura mostrada en la Figura 2-3, donde MCC y MNC tienen el mismo significado
que en el IMSI. El LAC es un cdigo que identifica el LA dentro de la red.

MCC

MNC

LAC

Location Area Identification


Figura 2-3: Estructura de LAI (Fuente: Rec. GSM 03.03)

Captulo 2: REDES DE TELEFONA CELULAR GSM

27

2.4.4 Cell Global Identity (CGI)


La celda dentro de un LA se identifica unvocamente mediante el parmetro CI (Cell Identity).
Para identificar la celda dentro de la red se emplea el parmetro CGI o Cell-ID. Este parmetro
es la identidad global de celda y se emplea para conocer la celda con la que la estacin mvil
tiene actualmente contacto radio o con la que tuvo el ltimo contacto radio. El parmetro Cell
ID o CGI se obtiene concatenando la identificacin de LA (LAI) y la identidad de celda (CI).

MCC

MNC

LAC

CI

Location Area Identification


Cell Global Identification (CGI)

Figura 2-4: Estructura de CGI (Fuente: Rec. GSM 03.03).

2.5

DISEO DE LA RED CELULAR

Puesto que el mbito geogrfico de cobertura puede ser muy grande, se introduce el concepto de
rea de localizacin (LA), que consiste en una zona geogrfica cubierta por una agrupacin de
celdas, siendo una celda la zona en la cual una estacin base proporciona los servicios.

Figura 2-5: Definicin de celdas y reas de localizacin.

La forma de las celdas usada en la planificacin radio depende del tipo de antena y de la
potencia emitida por cada estacin base. En los modelos de planificacin, las coberturas de
estaciones base se idealizan mediante hexgonos que recubren el plano sin superposicin.
Normalmente se usan dos tipos de antenas, las de diagrama horizontal omnidireccional y las
directivas.
Si se usan antenas omnidireccionales, idealmente el rea de cobertura ser circular, y se utiliza
un crculo para modelar dicha rea. En un contexto real, si se pretende cubrir una determinada
zona con antenas omnidireccionales (crculos), se producir solapamiento entre ellos, lo cual es

28

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

poco eficiente desde el punto de vista de uso del espectro pues en la zona de superposicin se
atendera el trfico con ms frecuencias de las necesarias. Por otro lado, para reducir la
interferencia y obtener mayor ganancia que favorezca la comunicacin en entornos de cobertura
difcil, como son los de naturaleza urbana e interiores de edificios, se utilizan las antenas
directivas. En este caso, en cada emplazamiento se disponen tres antenas con diagramas de
radiacin horizontal que abarcan 120, como se ve en la Figura 2-6.

Figura 2-6: Antena omnidireccional (izquierda) y directiva sectores 120 (derecha).

Como se ha comentado en lneas anteriores, idealmente, las superficies cubiertas por cada
antena se asimilan a hexgonos, y se les suele llamar sectores. Cada sector tiene sus propias
frecuencias y es servido por sus propios transmisores, de forma que los sectores son celdas pero
iluminadas desde un vrtice. Esta disposicin reduce la interferencia producida ya que las
antenas directivas radian muy poca potencia hacia atrs y en direcciones separadas
angularmente, por lo que la interferencia ser pequea en esas direcciones.
Con la incorporacin de los sistemas de telefona de generaciones ms avanzadas (2.5G/3G),
surgen nuevos y ms completos servicios a proporcionar a los abonados. Los sistemas mviles
GSM, GPRS y UMTS comparten una estructura de red para la conmutacin de paquetes
sustancialmente equivalente, ya que UMTS hereda la arquitectura creada para GSM y GPRS.
No obstante, los nuevos servicios ofrecidos implica la incorporacin de nuevos elementos en la
red para lograr una optimizacin en la localizacin de los terminales en los diferentes servicios
existentes. Al igual que ocurre para servicios de voz, estas redes deben mantener actualizada la
informacin sobre la posicin de cada telfono para conocer hacia dnde enrutar los paquetes de
datos que le llegan. En esos casos, se precisa conocer con mayor exactitud el conjunto de celdas
sobre el que difundir el mensaje de aviso a un terminal para el envo de paquetes de datos. Con
objeto de obtener una solucin de compromiso entre el trfico de sealizacin debido a avisos y
el originado por actualizaciones de posicin, adicionalmente a la jerarqua de celda y rea de
localizacin, aparecen otros niveles como son el RA (Routing Area). Un RA se define como un

Captulo 2: REDES DE TELEFONA CELULAR GSM

29

subconjunto de celdas de un LA y posee una funcionalidad similar a la de las LA en GSM. El


tamao de un RA es siempre menor o igual al del LA al que pertenece.

2.6 GESTIN DE MOVILIDAD


La creciente movilidad exigida en la vida moderna est modificando los hbitos de vida tanto a
nivel individual como colectivo en la sociedad actual. Como consecuencia, surge la necesidad
de soluciones que permitan la comunicacin entre personas mientras stas se estn desplazando
por la red. Para garantizar esta movilidad de los abonados, manteniendo la calidad de los
servicios, una red de telefona celular dispone de un conjunto de procesos encargados,
bsicamente, del seguimiento del usuario y de la llamada. Esta seccin describe los principales
procesos relacionados con la gestin de la movilidad.

2.6.1 Actualizacin de la posicin (Location Update)


Dado que entre los terminales mviles y la red no existe un vnculo fsico continuo, se necesitan
una serie de procesos para dar soporte a la movilidad de los terminales. Es decir, la red debe
conocer una cierta estimacin de la posicin de esos terminales a fin de conocer la central con la
que establecer una conexin (por ejemplo, en caso de una llamada entrante). La gestin de la
movilidad se ocupa del seguimiento del usuario y, cuando proceda, del mantenimiento de la
comunicacin establecida. Su correcta ejecucin depende del estado del terminal.
En GSM se utiliza un esquema de dos estados: DEDICATED (ocupado con una llamada) y
IDLE (encendido y desocupado). En el caso de que el usuario se encuentre realizando una
llamada (DEDICATED), como consecuencia de su movilidad puede ocurrir que se aleje de la
estacin base servidora y sea necesario conmutar la comunicacin a otra estacin base desde la
que recibir mejor calidad de seal. Esta operacin se denomina Handover y se describe en el
siguiente subapartado. En esta situacin, la red siempre conoce la estacin base a la que est
conectado el terminal durante la comunicacin, es decir, las celdas por las que transita,
notificando la nueva posicin cada vez que cambie de celda.
Cuando un terminal se encuentra encendido y desocupado (IDLE), el usuario debe estar
localizado en todo momento para que la red pueda encaminarle las llamadas entrantes cuando
stas ocurran. El rea de localizacin (LA) es el nivel de resolucin con el que trabajar la red
celular en la bsqueda de terminales. Esto es, cada terminal mvil se encuentra asociado a una
nica rea de localizacin y esta informacin se mantiene continuamente actualizada en las
base de datos. Como los terminales pueden cambiar de posicin y, por tanto, el punto de acceso

30

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

a la red, debe existir un proceso automtico y transparente que mantenga a la red informada de
las ubicacin de sus terminales a nivel de LA.
Para conseguirlo aparece el proceso Location Update (LU), el cual implica un intercambio de
mensajes de sealizacin entre el terminal y la red, y el posterior registro en las bases de datos
para actualizarlas con arreglo a esos mensajes. La frecuencia de ejecucin del proceso de LU
depende del estado del telfono. Cuando el telfono est encendido y desocupado (IDLE), basta
que la red conozca el LA donde se encuentra para alertarle en caso de una llamada entrante. Por
tanto, el telfono puede moverse por las distintas celdas del LA sin necesidad de actualizar su
posicin. En este caso, los eventos que lanzan el proceso LU para actualizar la posicin son los
siguientes. i) Cuando el terminal mvil se enciende y se conecta a la red, se registra en el LA en
el que se encuentre. ii) Por otro lado, la movilidad del terminal puede provocar un cambio de
posicin que suponga la entrada en un rea de localizacin diferente. Mediante un anlisis de la
sealizacin enviada por canales de broadcast se conoce el LA en el que se encuentra un
terminal. De ese modo, es posible detectar la entrada en un nuevo rea, comparando el nuevo
valor recibido con el anterior valor de LA almacenado de modo que, si ha cambiado se ejecuta
el Location Area Update. iii) Asimismo, si el telfono no tiene ningn tipo de actividad existe
un mecanismo peridico que lanza reportes automticos a la red con la ltima posicin
almacenada por el telfono. Por ello, cada vez que finaliza un temporizador, se obliga a realizar
un registro peridico para notificar su presencia en la red aunque se encuentre en el mismo LA.
Este conjunto de procesos permite que la red conozca continuamente la ubicacin del terminal
en trminos de rea de localizacin.
Para gestionar la movilidad en sistemas de telefona de generaciones ms avanzadas (2.5G/3G),
entre otros procedimientos, existe una actualizacin a nivel de RA. De este modo, cuando el
terminal detecta que ha entrado en un nuevo RA, comparando el identificador de rea de
enrutamiento (RAI) que tiene almacenado con el RAI recibido va radio, se inicia
automticamente un proceso para la actualizacin correspondiente.

2.6.2 Entrega de llamada (Paging)


En caso de que haya una llamada dirigida a un terminal mvil, la red debe tener sus mecanismos
para poder avisar al mvil y establecer finalmente la conexin. Este proceso se denomina
paging y consiste en el envo de mensajes de aviso por canales radio destinados a ello.
Cuando se presenta una llamada entrante, se consulta la base de datos HLR para determinar el
LA en el que se encuentra actualmente el destinatario de la llamada. A continuacin, el mensaje
de bsqueda slo se difunde en las celdas pertenecientes a ese LA, enviando un mensaje con el

Captulo 2: REDES DE TELEFONA CELULAR GSM

31

identificador del terminal al que se debe entregar la llamada. Finalmente todos los terminales
analizan este mensaje y responde solamente el terminal buscado. En ese momento ya se puede
establecer el canal necesario para cursar la llamada puesto que se conoce la estacin base
(celda) que dara servicio al telfono.

2.6.3 Traspaso (Handover)


Para mantener una comunicacin (voz y/o datos) con un terminal mvil, es necesario que exista
una conexin punto a punto entre el terminal origen y el de destino, la cual debe extenderse en
el tiempo mientras dure la comunicacin. Por ello, la red precisa conocer continuamente el
punto de acceso a la red por el que encaminar la comunicacin, es decir, la estacin base (celda)
en la que se encuentran los terminales implicados. Esa informacin de posicin de los abonados
a nivel de celda es almacenada y actualizada en las bases de datos (HLR y VLR) oportunas.
Dado que un terminal puede moverse entre reas de servicio de distintas estaciones base durante
una conexin activa con la red (voz y/o datos), una red debe disponer de mecanismos adecuados
para que ese terminal est permanentemente conectado y controlado por la red durante la
comunicacin. El HandOver (HO) surge como solucin al problema del mantenimiento de una
comunicacin cuando la calidad del enlace es insuficiente, principalmente cuando el terminal se
mueve entre dos celdas de la red. Con los mecanismos adecuados, se consigue un cambio de
una celda a otra de un modo transparente para el usuario y sin degradar la calidad de la
comunicacin. Este proceso permite que un terminal est siempre conectado tanto a la red como
a la mejor estacin base servidora. Existen otros casos en los que puede iniciarse el handover tal
como un elevado nivel de interferencia, el cual imposibilita la comunicacin con la calidad
adecuada, o bien que por razones de trfico se deban liberar recursos de esa estacin base y
continuar la comunicacin a travs de otra con menor trfico. En el proceso de handover
intervienen mecanismos para evitar efectos indeseados, como los cambios de estacin base
innecesarios (efecto pingpong), mediante el uso de parmetros que miden la calidad del enlace
como el RSSI (Radio Signal Strenght Indicator), BER (Bit Error Rate), relacin CIR, entre
otros.
Durante el diseo de la red, el operador define un conjunto de celdas para cada estacin base
(celda) a las que se permite realizar el handover. Tpicamente, este conjunto de celdas coincide
con las celdas vecinas que la rodean, aunque puede variar segn la topologa de la zona.
Asimismo, se ordena dicha lista de celdas vecinas conforme a una prioridad en funcin de
parmetros de diseo de la red. En el caso de que se tome la decisin de ejecutar un handover, el
BSC inicia el proceso de traspaso a aquella celda de la lista con mayor prioridad.

32

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

Desde el punto de vista operativo, el handover tiene 3 etapas: medida, toma de decisin y
ejecucin. Por ello, durante el handover se produce un intercambio de informacin de
sealizacin entre el terminal y centrales de la red (como son las BTS, BSC, MSC). Como
resultado, se toma la decisin de hacer o no el handover. La decisin la toma siempre la BSC
que se ocupa del abonado en ese momento. Si la decisin es negativa, se mantiene la
comunicacin con la estacin base actual (misma celda). En caso de que se deba ejecutar el
handover, se produce un intercambio de informacin con la red, derivndose ciertos parmetros
asociados a cada una de esas llamadas traspasadas (como celdas implicadas, instante y duracin
del handover, junto con algn otro tipo de informacin de sealizacin).
En el caso de GSM, el handover consiste en una transferencia de recursos que implica la
interrupcin del enlace actual y la creacin de uno nuevo. Esto se debe fundamentalmente a que
las estaciones base vecinas utilizan portadoras y/o bases de tiempo distintas y los terminales no
son capaces de conectarse simultneamente a ambas. En esos casos, denominado Hard
Handover, el terminal se desconecta de su estacin base origen y durante un tiempo (del orden
de milisegundos) no est conectada a ninguna otra estacin base. Esto provoca una interrupcin
de la seal vocal apenas perceptible por el abonado. Sin embargo, esta situacin no es aplicable
a comunicaciones de datos (2.5G/3G), donde una interrupcin de ese tipo se traduce en prdida
de los datos, dado que la red no est preparada para estos cortes. Por ello existe otro tipo de
handover, denominado SoftHandover, durante el cual el terminal estar conectado a la estacin
base origen mediante un canal y a la estacin base destino mediante otro. As pues, la
transmisin se realiza en paralelo por los dos canales, es decir, no se produce interrupcin del
enlace. Este es el esquema utilizado en redes ms avanzadas.

2.7 TRFICO Y DIMENSIONADO


2.7.1 Introduccin
El dimensionado en un sistema de telefona mvil es una actividad compleja que requiere
cuantificar, aunque sea de manera terica e incorporando muchas simplificaciones e hiptesis, la
capacidad que tendr la red de soportar usuarios para una configuracin dada y unos ciertos
requisitos de calidad. Esta capacidad vendr referida, esencialmente, al trfico telefnico
ofrecido en una celda y su distribucin con respecto al tiempo, para garantizar un grado de
servicio bsico. Ese trfico telefnico vara segn la estacin base, el mes, da e incluso instante
dentro del da. La duracin de las conversaciones es otra variable importante a considerar a la
hora del dimensionado.

Captulo 2: REDES DE TELEFONA CELULAR GSM

33

Tradicionalmente, este dimensionado se efecta conforme a la intensidad de trfico de la hora


de mayor ocupacin BH (Busy Hour) perodo de 60 min. de un da para el cual la carga de
trfico es mxima , y viene expresada en Erlangs. Un Erlang es una unidad adimensional
utilizada en telecomunicaciones como una medida estadstica del volumen de trfico o
intensidad; en concreto, se emplea para caracterizar el sistema en el mbito de trfico telefnico.
Por ejemplo, si el uso total del telfono mvil por hora en un rea dada es de 180 minutos, esto
representa 3 Erlangs.
El trfico telefnico indica la cantidad de informacin (voz y/o datos) transportada por una va
de comunicacin o canal. Este trfico se mide en trminos de tiempo (entendido como tiempo
de ocupacin del canal) y depende del nmero de comunicaciones y de la duracin de las
mismas. Por ejemplo, en el caso de un canal que se ha utilizado para diez llamadas en una hora,
cada una con una duracin de tres minutos, dado que el comportamiento del canal es en serie
(las comunicaciones se suceden una detrs de la otra), se cuantifica que el canal ha estado
ocupado durante un periodo de tiempo de treinta minutos: 0,5 Erlang, o bien que la ocupacin
del canal ha sido del 50%. As pues, la intensidad de trfico telefnico expresada en Erlangs
mide el promedio de llamadas en progreso simultneamente durante el periodo de una hora o la
ocupacin media de un canal por unidad de tiempo (hora).

2.7.2 Modelos de trfico telefnico


En el despliegue y la operacin de una red mvil, el dimensionado de los recursos
radioelctricos debe ser tratado como un aspecto clave. Para abordar el problema del
dimensionado suelen emplearse modelos de trfico, los cuales definen una serie de conceptos y
parmetros que posteriormente sern utilizados en las metodologas desarrolladas en esta Tesis.
En redes telefnicas fijas el trfico es caracterizado con gran precisin. En cambio, un modelado
preciso de las caractersticas de trfico en redes de telefona mvil suele ser ms complejo. En
general, el trfico telefnico generado en una zona puede describirse, principalmente,
atendiendo a dos modelos de trfico que difieren de su punto de vista de la red. i) El modelo de
movilidad (mobility model o traffic source model), el cual describe el sistema desde la
perspectiva del usuario mvil. En l, el escenario de trfico telefnico se representa como un
conjunto de entidades individuales (usuarios) realizando un recorrido aleatorio a travs del rea
de servicio y con una demanda aleatoria de recursos, es decir, de canales de radio. ii) En
cambio, existe un modelo de trfico de red (network traffic model), para el cual el trfico
telefnico viene descrito como una observacin realizada desde elementos de la red, como

34

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

estaciones base (BTS) o centrales (MSC). Este modelo caracteriza la dependencia temporal y
espacial de la distribucin de trfico de llamadas mediante el trfico ofrecido A1 en una celda.
Este ltimo modelo es muy utilizado a la hora de determinar la ubicacin de los principales
componentes en una red mvil (BTS, MSC,). Estos componentes deben estar dimensionados
para soportar un trfico prximo al previsto a fin de aumentar la eficiencia del sistema. En
cambio, debido a su capacidad para describir la dependencia temporal del comportamiento de
los usuarios en detalle, el modelo de movilidad es el ms extendido para la caracterizacin del
trfico en cada celda particular.
A continuacin se presenta un modelo de trfico, simplificado pero bastante general, cuyo
planteamiento est basado en la teora de trfico telefnico usando el citado modelo de
movilidad. El modelo se encarga de estudiar el dimensionamiento y la gestin de los recursos
que se ponen a disposicin de un sistema de telecomunicacin, en este caso, de telefona mvil,
para optimizar tanto su rentabilidad como la calidad de servicio ofrecida por celda.
En el contexto de las redes mviles 2G, como GSM, el concepto de capacidad queda fcilmente
definido en la medida en que hay bsicamente trfico de voz en la red. En cambio, en el marco
de los sistemas 2,5G y 3G, en los que se plantea un entorno multiservicio con requerimientos de
calidad de servicio muy diversos, el concepto de capacidad de la red debe entenderse de forma
ms amplia y su estimacin no resulta tan inmediata como en el entorno slo de voz. En base al
razonamiento anterior y dado que el estudio se centra en redes GSM, el modelo est referido
nicamente al trfico telefnico de voz, por ser el trfico dominante en GSM. Asimismo, el
modelo debe estar basado en pronsticos de demanda en funcin del tipo de zona, ya que el
trfico telefnico vara segn las caractersticas de los abonados y de la celda en cuestin.
En este modelo se considera que la llegada de llamadas puede modelarse mediante un proceso
de Poisson de tasa de llegada , de forma que la probabilidad de que en la hora de mayor
ocupacin (o BH) se produzcan n llamadas, se define como:
pn

e ( ) n
n!

(1)

En este modelo simplificado de trfico de voz, si M es el nmero de estaciones mviles y L el


nmero medio de intentos de llamada por mvil en la hora de mayor ocupacin, BH, se tiene:

El trfico A se cuantifica mediante la intensidad del trfico la cual se mide como intentos de llamadas por unidad de tiempo y
espacio (llamadas/segkm2) y teniendo en cuenta la media de duracin de llamadas E[tllamadasl], siendo A= E[tllamadasl] (en
Erlang/km2). Esta medida representa la cantidad de trfico que se ofrece en una zona determinada.

Captulo 2: REDES DE TELEFONA CELULAR GSM

35

M L
3600

(2)

En los procesos de llegada de Poisson, el tiempo t comprendido entre dos intentos consecutivos
es una variable aleatoria continua que se modela mediante una distribucin exponencial
negativa, cuya densidad de probabilidad es: f (td ) e td , td 0 . El parmetro de la
distribucin es igual a 1/Tc, siendo Tc la duracin media de la ocupacin del recurso, es decir,
duracin media de la llamada. Entonces, la intensidad del trfico A ofrecido al recurso en
cuestin se define como:
A

(Erlang)

Sustituyendo en (3) los valores y resulta: A

(3)

M L Tc
(Erlang).
3600

Esta expresin permite interpretar la intensidad de trfico como el tiempo medio total de
ocupacin de los recursos en la hora de mayor ocupacin, BH.
Con este parmetro de intensidad de trfico quedan expuestos los conceptos bsicos que ms
adelante sern usados en el mbito de la Tesis. Sin embargo, es necesario indicar que una
llamada generada en una celda determinada puede proceder de una llegada nueva o una llegada
de traspaso ya que una llamada puede concluir en la celda donde se origina o ser objeto de
traspaso a otra u otras celdas. Por tanto, en general, toda llamada puede descomponerse en dos:
las que se inician y concluyen en una misma celda y las que experimentan traspasos
(handovers). De modo que la tasa de llamadas entrantes del modelo de Poisson estar formada
por c y h, siendo stas las tasas de llegada de nuevas llamadas y las de traspasadas,
respectivamente. Estas tasas c y h definen sendos procesos de Poisson y estarn relacionadas
entre s. Esta relacin se demuestra utilizando la hiptesis de equilibrio de flujos de llamadas, en
la cual la tasa de llamadas que abandonan una celda coincide con las que llegan y vale h:

h ph [(1 pb )c (1 pbh )h ] h

ph (1 pb )c
1 ph (1 pbh )

(4)

Donde ph es la probabilidad de handover, pb es la probabilidad de bloqueo para una nueva


llamada y pbh es la probabilidad de bloqueo para un intento de handover, considerando bloqueo
como la ausencia de canales para asignar. De la ecuacin anterior se desprende que la tasa de
llamadas entrantes por traspaso en una celda h es una fraccin de la tasa de llamadas ofrecidas a
esa celda c, siendo ese parmetro de proporcionalidad nh el siguiente:

36

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

h
ph (1 pb )

nh
c 1 ph (1 pbh )

(5)

La probabilidad de handover ph ser igual a la probabilidad de que la duracin de una llamada


(td) supere el tiempo de permanencia en la celda (tp). Para el clculo de pb y pbh se utilizan
modelos de procesos estocsticos de trfico para obtener la probabilidad de que haya n canales
ocupados, generalmente mediante el modelo de ErlangB.
En este apartado se han presentado algunos de los conceptos bsicos relacionados con el trfico
de voz en el mbito de un modelo para la evaluacin y dimensionado de sistemas de telefona
mvil. Estos conceptos sern empleados posteriormente en el planteamiento de las
metodologas desarrolladas en la Tesis. El modelo de trfico expuesto puede ser aplicado a
situaciones muy generales ya que sigue las principales hiptesis asumidas en redes de telefona
mvil: las llegadas de llamadas siguen un proceso de Poisson y el intervalo de tiempo entre
llegadas sucesivas sigue una distribucin exponencial negativa. En la literatura existen
numerosos modelos de trfico que asumen estas distribuciones (Hong y Rappaport, 1986; Steele
y Nofal, 1992; Zeng et al., 1997; Gavish y Sridhar, 1996), cuyos desarrollos son mucho ms
extensos que los expuestos en este apartado. Es necesario indicar que este apartado slo se ha
centrado en los aspectos bsicos relativos al dimensionado de los recursos radio a fin de
presentar unas nociones bsicas al lector.

CAPTULO 3
ESTADO DEL ARTE EN EL MBITO DE LA
ESTIMACIN DE PARMETROS DE
TRFICO MEDIANTE LA TELEFONA MVIL

3.1 INTRODUCCIN
El captulo anterior describe los conceptos bsicos y funcionalidades principales existentes en
los sistemas de telefona mvil para garantizar la movilidad de los abonados, manteniendo la
calidad de los servicios. Durante su ejecucin, estos procedimientos proporcionan informacin
sobre la localizacin de los usuarios que, tras el tratamiento oportuno, puede ser til para la
caracterizacin del trfico vehicular, con parmetros tales como velocidad, volumen o
movilidad origendestino, entre otros. En los siguientes apartados se hace una revisin
exhaustiva del EstadodelArte en el mbito de la estimacin de estos parmetros a partir de
la telefona mvil, describiendo mtodos usados en diferentes proyectos, tanto de simulacin
como pruebas piloto, existentes en el sector acadmico e industrial.

3.2 MATRICES ORIGENDESTINO


Las matrices origendestino (OD) se utilizan para cuantificar y sintetizar la movilidad asociada
al desplazamiento de personas y/o mercancas sobre una regin. Estas matrices aportan
informacin sobre el nmero de viajes realizados entre una zona de transporte origen i y una
destino j en un determinado intervalo de tiempo. As pues, se trata de una estructura de
informacin que representa la demanda de transporte sobre un rea durante un perodo temporal
especfico. Tradicionalmente, las reas que conforman las zonas de transporte orgenes y
destinos de una matriz, es decir, las zonas donde empiezan y terminan los viajes, vienen
definidas por criterios socioeconmicos o agregaciones de poblacin que se corresponden con

38

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

zonas que pudieran tener una relacin causal con los movimientos de transporte que se dan entre
ellas.
Estas matrices pueden ser elaboradas con diferentes niveles de agregacin, dependiendo del
grado de detalle que se desee (tamao de las zonas) o el tipo de informacin necesario: por
modo de transporte (vehculo privado, autobs), por bien transportado (personas,
mercancas). Las unidades empleadas para definir una matriz OD estn fuertemente
relacionadas con este nivel de agregacin. De este modo stas podran ser vehculos, personas,
mercancas, o incluso telfonos mviles.
En los sistemas de telefona existe una clasificacin de la zona de servicio en celdas y reas de
localizacin (LA), aunque adicionalmente existen las reas de enrutamiento (RA) para 2.5G y
3G. Segn lo visto en el Captulo 2, la red maneja una estimacin de posicin de un terminal
mientras est encendido dentro de su cobertura segn los diferentes estados: encendido y
desocupado (idle), o con comunicaciones activas (dedicated o active), incluso, en 2.5G/3G
existe un estado adicional en el cual el terminal se encuentra en espera de iniciar una
comunicacin en el contexto de paquetes una vez registrado en GPRS (standby). Si esto se
traslada al dominio de telfonos a bordo de vehculos en movimiento, un terminal que tenga
establecida una comunicacin con la red proporciona datos bastante continuos del recorrido: a
nivel de celdas por las que est circulando. Incluso si el terminal no est en uso sino
simplemente encendido, tambin ofrece datos vlidos del recorrido, puesto que continuamente
se conoce el LA en el que se encuentra. En este caso, aunque los datos de localicazin son
menos precisos y frecuentes, tambin permiten identificar viajes. Por ello, construir una matriz
OD mediante datos de localizacin de telfonos mviles exige definir el nivel de agregacin
que se desea conseguir, es decir, si las zonas de transporte sern las celdas o las LAs
existentes en la zona de servicio de la red de telefona existente en la regin bajo estudio.
Segn lo expuesto anteriormente, el nivel de agregacin de la matriz est directamente
relacionado con el tipo de datos de localizacin que la genere. Por ello, si se pretende obtener
una matriz de viajes entre celdas origendestino, se precisa conocer las celdas por las que los
telfonos transitan en todo momento. Esto es posible cuando se trata de datos asociados a
comunicaciones (llamadas) efectuadas por los telfonos. En estos casos, la muestra de datos
asociada es ms reducida que si se utilizara el conjunto de telfonos encendidos.
Sobre esta idea de matriz entre celdas OD se han presentado recientemente varios trabajos.
Tras aos de estudio, White y Wells (2002) publicaron los resultados de un proyecto
desarrollado conjuntamente por TRL (Transport Research Laboratory) y HA (Highways

Captulo 3: ESTADO DEL ARTE EN EL MBITO DE LA ESTIMACIN DE PARMETROS DE TRFICO


MEDIANTE LA TELEFONA MVIL

39

Agency) en el Reino Unido. Dicho proyecto consisti en la extraccin de informacin sobre


movilidad entre celdas origendestino con datos annimos de localizacin asociados a llamadas
realizadas por usuarios, proporcionados por el operador BTCellnet (actualmente O2). Se sabe
que, cuando un telfono efecta una llamada, se conoce la estacin base servidora en todo
momento y, por tanto, la celda en la que se encuentra. Con fines de facturacin, se almacenan
mltiples datos asociados a cada llamada, como la posicin del telfono al inicio y fin de la
llamada o la duracin de la misma, entre otros. El citado trabajo hace uso de esos datos de
posiciones inicial y final de cada llamada para obtener informacin de movilidad sobre una
regin bajo estudio en trminos de celdas origen y destino. As pues, se consigue construir una
matriz de viajes donde las zonas de transporte se corresponden con las celdas que definen la
cobertura en la regin analizada. El principal inconveniente de las matrices eleboradas bajo este
criterio es que la informacin recopilada es parcial. El viaje detectado con las llamadas est
limitado al recorrido que realiz el usuario con la llamada activa, el cual lgicamente no suele
corresponderse con el recorrido completo realizado por el usuario; por ejemplo, en su
desplazamiento de casa al trabajo. No obstante, la matriz resultante proporcionara una matriz
de partida que podra ser tratada posteriormente con algoritmos de expansin u otros
procedimientos similares para inferir una matriz vlida.
Lgicamente, el empleo de este tipo de informacin asociada a la telefona mvil implica la
colaboracin de un operador que los suministre. Esos datos se recibiran y trataran de forma
agregada y annima, segn los reglamentos vigentes, de modo que no exista posibilidad de
asociar datos con abonados reales. Slo se pretende conocer informacin referente a la
localizacin de un terminal, visto como una sonda annima que se mueve a travs de la red. A
pesar de ello, conseguir la cooperacin de un operador de telefona no es una tarea sencilla. Por
ello, es habitual recurrir a la ayuda de simuladores para conseguir datos de localizacin
necesarios para implementar sus algoritmos de estimacin ya que poseen la ventaja de que la
informacin real de posicin de cada vehculo puede ser extrada segn un tiempo de
muestreo deseado, y as validar con mayor facilidad dichos algoritmos.
Uno de esos trabajos basados en simulaciones es el desarrollado por Akin y Sisiopiku (2002), el
cual tambin elabor una matriz de viajes entre celdas pero mediante datos de localizacin
generados por un conjunto especfico de telfonos sobre una cierta zona. Para desarrollar los
modelos y validar sus algoritmos, los datos de localizacin (registros en las celdas de una
regin) fueron creados mediante una funcin generadora de nmeros aleatorios en MS Excel.
Los nmeros generados representaban los identificadores de celdas visitadas durante un da por
un conjunto de telfonos mviles pertenecientes a un operador ficticio. Esos telfonos

40

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

tcnicamente transmitan su posicin cada 5 minutos, representando una muestra de viajeros


sobre una ciudad ficticia. Tras obtener una matriz mediante algoritmos oportunos, se efectuaban
los correspondientes ajustes dado que los viajes se derivaban de una muestra limitada asociada a
un conjunto concreto de telfonos y haba que extenderlo a la demanda total de trfico.
Pese a los buenos resultados logrados, los anteriores estudios no aprovechan la ventaja de la alta
penetracin de la telefona celular en la sociedad actual, puesto que manejan solamente una
pequea muestra del total de telfonos existentes en la zona. En un caso utilizan slo datos de
aquellos que efectan llamadas y en otro, datos de un conjunto exclusivo de telfonos capaces
de transmitir peridicamente su posicin a un servidor central. Sera de vital importancia
aumentar el tamao de esa muestra de las que se derivan las matrices. Esto supone utilizar datos
del conjunto de telfonos que estn encendidos de un operador, de los cuales se conoce en todo
momento el LA en el que se encuentran.
Este es el objetivo perseguido en el trabajo elaborado por Caceres et al. (2007). Su investigacin
plante la obtencin directa de una matriz OD considerando como zonas de transporte de la
matriz el conjunto de reas de localizacin (LA), definidas por una red GSM, existentes sobre la
regin a estudiar. Debido a que la gestin de movilidad de una red GSM obliga a que el terminal
notifique al sistema su posicin cuando entra en un nuevo LA (proceso LU, Location Update),
junto a los reportes peridicos de posicin (PLU), los telfonos mviles encendidos siempre
proporcionarn informacin actualizada de las LAs por las que han pasado. El anlisis de los
registros efectuados por cada telfono en un intervalo de tiempo dado permiti conocer el LA de
origen (registro inicial) y de destino (registro final) asociado al viaje que ha seguido el vehculo
que transportaba el telfono. Adems, este tipo de anlisis de registros logr distinguir entre
viajes vlidos, pares OD de la matriz estudiada, del resto de viajes de paso, los cuales son
viajes que se iniciaron o terminaron en orgenes o destinos distintos a los que conforman la
matriz. La validacin de la metodologa se realiz mediante un simulador de trfico, generando
bases de datos HLR y VLR ficticias con los registros de localizacin. Asimismo, dado que los
valores estimados venan expresados en trminos de movilidad de telfonos, este trabajo
implement un algoritmo para extender datos de telfonos encendidos de un operador concreto
al conjunto global de vehculos mediante un factor de correccin. Entonces, tras comparar la
matriz OD de viajes real y estimada, los reducidos niveles de error mostraron la posibilidad
de obtener una matriz correlada con los viajes realizados en un rea extensa de estudio. Sin
embargo, dado que los LA abarcan reas de gran dimensin, lgicamente existirn
desplazamientos dentro de ellas, denominados viajes intrazonales, que no podran ser

Captulo 3: ESTADO DEL ARTE EN EL MBITO DE LA ESTIMACIN DE PARMETROS DE TRFICO


MEDIANTE LA TELEFONA MVIL

41

detectados analizando exclusivamente registros generados mediante procesos LU (cuyo


resolucin ms fina es a nivel de LA).
Un desarrollo intermedio entre las dos ideas anteriores fue el propuesto por Pan et al. (2006), el
cual fue validado en la ciudad de Shanghai. En el citado trabajo se combin la alta penetracin
de la telefona mvil, empleando telfonos que simplemente estn encendidos, y la precisin a
nivel de celda para confeccionar una distribucin de viajes. Al ejecutar el proceso de LU
(off/on, cambio LA o registro peridico en ausencia de actividad telefnica), se notifica a la red
el LA en el que se encuentra junto con la celda dentro de ese LA. Pero la posicin de un
terminal no slo se actualiza cada vez que se ejecuta un proceso de LU, sino cuando el telfono
registra algn tipo de actividad (realice una llamada o enve un sms). Empleando ambos
conjuntos de datos se logra fusionar las ventajas de utilizar una muestra extensa (cualquier
telfono encendido) y precisin a nivel de celda. Sin embargo, se pierde cierta informacin de
movilidad asociada al hecho de que un telfono encendido puede moverse por las celdas de un
LA sin que quede constancia de su paso por ninguna de ellas, ya que no se precisa ejecutar un
proceso de LU mientras no cambie de LA o registre actividad telefnica (llamadas, sms); no
obstante el registro peridico PLU suaviza este inconveniente. Para obtener la distribucin de
viajes, la metodologa utiliza dos escenarios de tiempo basados en las caractersticas de las
zonas que conforman la matriz. Por ejemplo, los viajeros permanecen en casa desde las 10:30
p.m. hasta las 6:30 a.m. del da siguiente (escenario temporal A) y estarn en sus lugares de
trabajo desde las 9:30a.m. hasta las 11:30a.m. (escenario temporal B) de ese nuevo da.
Analizando los registros de localizacin generados por los telfonos, una tabla de distribucin
de viajes es generada computando telfonos que han permanecido en la zona i (e.g. casa)
durante el escenario temporal A y estn en la zona j (e.g. trabajo) durante el escenario temporal
B. El almacenamiento propio de los sistemas de telefona, tanto de la localizacin como los
instantes de actualizacin, permite que los flujos OD puedan ser obtenidos de una forma
sencilla mediante un anlisis de dicha informacin.
En cualquier caso, tanto para matrices obtenidas mediante llamadas como con procesos LU, la
principal ventaja es que los datos son recopilados directamente de flujo de trfico y no de
procesos de encuestacin (encuestas domiciliarias, telefnicas, reconocimiento matrculas, etc.)
los cuales son procesos costosos y suelen dar lugar a resultados con ciertos sesgos. Sin embargo,
ambos procesos presentan como desventaja la pobre precisin obtenida en la localizacin. Los
datos de posicin derivados de la telefona mvil vienen expresados en trminos de celdas y LA
en la que se encuentran. El tamao de esas zonas, aunque vara de entornos urbanos o rurales,
suele ser grande, de modo que es normal que muchos de los viajes ocurran dentro de dichas

42

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

reas (viajes intrazonales). En base al razonamiento anterior, ambas metodologas pueden ser
consideradas como vlidas para obtener una matriz previa para, posteriormente ajustarla con
otra informacin mediante mtodos tradicionales, pero no para ser usada directamente como
matriz de viajes fiable.

3.3 VOLUMEN
Se denomina volumen de trfico Q al nmero de vehculos que pasan por un punto o seccin
transversal de una va por unidad de tiempo. Las unidades ms usadas son la hora y el da,
definiendo el volumen horario [veh/h] y volume diario [veh/da], respectivamente. Las
distribuciones temporales de los volmenes de trfico se deben a diferentes estilos y forma de
vida, los cuales determinan patrones de viaje basados en el tiempo (ciertas pocas del ao, horas
especficas del da, etc.). Estos volmenes pueden ser entendidos como la utilizacin de la
vialidad por la demanda de transporte. De modo que los estudios de volmenes se realizan con
el propsito de obtener informacin sobre el movimiento de vehculos sobre puntos o secciones
especficas dentro de una red viaria, proporcionando una descripcin intuitiva del
comportamiento dinmico del trfico.
Para la medicin de esta magnitud suelen utilizarse los aforos. Un aforo mide la cantidad de
vehculos que transitan por un determinado punto o seccin del viario. Tradicionalmente, estos
aforos son un tipo de informacin que se recoge de forma automtica en un conjunto de puntos
asociados a tramos del viario. La medicin de este parmetro de trfico obliga por tanto a
instalar elementos adicionales en las vas (espiras, cmaras, etc). Este volumen de paso de
vehculos vara segn la movilidad de la poblacin, categora de la va, temporalidad, etc. Para
conocer de un modo preciso y continuo las caractersticas del trfico de vehculos que circula
por la red viaria sera necesario observar todas las vas de manera casi permanente, lo cual
implicara disponer de una infraestructura considerable de elementos medidores del aforo. As
pues, surge la necesidad de nuevos medios que permitan caracterizar el trfico de un modo
rpido, preciso y permanente, sin excesivo coste.
La telefona mvil constituye una alternativa real, plausible y competitiva para conseguir esta
informacin. En contraste con los sensores fijos, los telfonos mviles proporcionan
informacin respecto a comportamiento del trfico sobre cualquier zona donde exista cobertura
telefnica, sin necesidad de un despliegue adicional de infraestructura. En estos casos, el
volumen estara asociado al paso de telfonos por un determinado punto o zona de la red, en
lugar de vehculos. Para ello existen ciertos eventos y procesos en GSM relacionados con la

Captulo 3: ESTADO DEL ARTE EN EL MBITO DE LA ESTIMACIN DE PARMETROS DE TRFICO


MEDIANTE LA TELEFONA MVIL

43

gestin de movilidad que permiten detectar el cambio de zonas, bien a nivel de celdas
(handover) o bien a nivel de reas de localizacin (proceso LU).
Analizando la topologa de la red junto con la distribucin de celdas y reas de localizacin es
posible asociar fronteras entre dichas zonas con secciones de va en las que es posible
monitorizar el paso de telfonos. En tales fronteras se considerar que existe una especie de
aforo virtual para la observacin del paso de entidades por las vas como hacen los aforos
tradicionales. Con ello, cada vez que un telfono cambie de celda durante una llamada
(handover) o cambie de LA mientras est encendido (proceso LU), se podr considerar que ha
pasado por alguna de las vas monitorizada por un aforo virtual localizado en la frontera
correspondiente. El nmero de vas que atraviesen la frontera, el cual determina la precisin de
la medida del aforo, depende de la extensin de la zona fronteriza. En el caso de un aforo
virtual que monitorice el paso de una celda a otra, el nmero de vas observadas suele ser
menor que en caso de uno que monitorice el paso de un rea de localizacin a otro puesto que
un LA comprende una extensin de terreno mayor formado por varias celdas.
En los ltimos aos se han publicado diferentes estudios relacionados con esta idea. Uno de
ellos es el desarrollado por Thiessenhusen et al. (2006) del DLR utilizando datos suministrados
por Vodafone. La investigacin utiliz el handover como evento para detectar el paso de
telfonos de un cierto operador por aforos virtuales ubicados en las fronteras entre dos celdas.
Durante un handover, se almacena una serie de parmetros asociados, como celdas implicadas o
instante en el que se produce. El anlisis de esos parmetros permiti detectar el trnsito por la
frontera correspondiente. Los resultados publicados mostraron cmo ese flujo de telfonos
(llamadas) est estrechamente relacionado con el flujo de vehculos medido por detectores
instalados sobre los mismos puntos en la red. En la Figura 3-1 se comparan ambos valores a lo
largo de un da. Se aprecia que existen los picos tpicos asociados a horas puntas tanto por la
maana como por la tarde, mostrando la influencia de los hbitos telefnicos (horarios tpicos
de llamadas) en los cambios de flujo de vehculos tpicos.
No obstante, con el uso del handover slo se monitoriza el paso de telfonos que tengan una
comunicacin activa (p.ej., llamada). De este modo, la muestra de terminales de las que se
obtienen datos es reducida e interesara ampliar su tamao a fin de conseguir una muestra ms
representativa del conjunto total de vehculos. Por ello, existe otra alternativa de monitorizacin
de trfico por una frontera pero, en este caso, a nivel de rea de localizacin.

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

Mobil phone calls - southbound

Mobil phone calls - northbound

6000

60

6000

60

4000

40

4000

40

2000

20

2000

20

flow (veh/h)

0
0

10

15

20

time (h)

flow (veh/h)

8000

flow (loop data)


GSM counts

counts/h

80

8000

80

flow (loop data)


GSM counts

counts/h

44

0
0

10

15

20

time (h)

Figura 3-1: Flujo (rojo) y nmero de llamadas de telfonos (verde) en funcin del tiempo.
Izquierda: northbound (desde ciudad), derecha: southbound (hacia ciudad). Todos los datos son
promediados sobre intervalos de 15 minutos. (Thiessenhusen et al., 2006)

El trabajo presentado por Caceres et al. (2007) utiliza este criterio. Para validar sus algoritmos,
no utiliz datos reales de un operador sino una herramienta conjunta que integraba un simulador
de trfico vehicular junto con un mdulo especfico para modelar la gestin de movilidad usada
en una red GSM sobre un conjunto de telfonos asociados a vehculos. Con ello se elaboraban
unas bases de datos HLR y VLR ficticias con registros de localizacin. Como ya se ha
comentado, cuando el telfono est simplemente encendido, el telfono notifica su nueva
posicin cuando entra en un nuevo LA (proceso LU), quedando reflejado el trnsito entre ese
par de LA. En su investigacin, se consider la existencia de aforos virtuales sobre secciones
de vas que coincidan con las fronteras entre reas de localizacin. Aunque, dado que el paso de
un LA a otro se efecta por una celda concreta del LA destino, y esa informacin de celda de
entrada es conocida (cuando se ejecuta el proceso de LU se indica tanto el LA como la celda
dentro de ese LA), realmente se observarn fronteras entre celdas de LA contiguos por los que
se va a efectuar el trnsito. En base a ello, el aforo virtual monitorizara el paso desde un LA a
otro por una celda concreta, logrando una resolucin a nivel de celda para la identificacin de la
va por la que circul el telfono (Figura 3-2).

Figura 3-2: Ejemplo de ubicacin de aforo virtual.

Captulo 3: ESTADO DEL ARTE EN EL MBITO DE LA ESTIMACIN DE PARMETROS DE TRFICO


MEDIANTE LA TELEFONA MVIL

45

Para validar esta idea se analizaron unas bases de datos generadas con simuladores buscando,
para cada telfono, los registros asociados a cambios de rea de localizacin. Conociendo ese
registro (instante de tiempo, nuevo LA y celda) junto con el LA anterior, y observando si
pertenece a una frontera de inters, se conocera el instante de paso por dicha frontera, se logr
computar el paso de un telfono por el aforo virtual correspondiente. Este flujo se corresponde
con telfonos encendidos de un nico operador, por lo que es extendido a un conjunto de
vehculos equivalente mediante algoritmos de ajuste apropiados. La Figura 3-3 compara el flujo
real y el estimado tras el ajuste que se obtuvo para un aforo virtual tpico.

Flow [ veh / h ]

2500
2000
1500
1000
500
0

loop data
mobile phones counts adjusted to vehicles
2:00 3:00 4:00 6:00 8:00 9:00 10:00 12:00 14:00 15:00 16:00 18:00 20:00 21:00 22:00 23:59

Time [ hh : mm ]

Figura 3-3: Comparacin entre flujo real por un aforo virtual y el estimado tras el ajuste.
(Caceres et al., 2006).

Los resultados mostraron alta correlacin entre valores reales medidos por un detector y los
estimados con telfonos mediante datos procedentes de procesos de LU por cambiar de LA,
debido a que la mayora de los vehculos (telfonos a bordo) son contabilizados. Cualquier
telfono encendido notifica a la red el cambio de LA y, por tanto, ese paso ser detectado por el
aforo virtual. Esta es una de las ventajas que esta alternativa presenta con respecto al
handover, considerar como muestra el conjunto de todos los telfonos encendidos de un
operador y no exclusivamente los que estn haciendo handover (llamada al pasar de una celda a
otra). Asimismo, el uso de un nivel de agregacin en trminos de LA no supone perder
precisin respecto al handover (nivel de celda). Esto se debe a que un LA es una agrupacin de
celdas y, por tanto, la entrada en un nuevo LA se efecta por una de esas celda. En la Figura
3-4, un proceso de LU ejecutado al pasar desde el LA1 al LA2 no permitira distinguir si el paso
ha sido por el punto 1 o el 3 debido a que ambos puntos pertenecen a la celda por la que se entra
al LA2 (celda 3). En cambio, un proceso de LU ejecutado al pasar en el otro sentido (desde el
LA2 al LA1) s que permitira identificar si ha ocurrido por el punto 1 o el 3, puesto que los
puntos pertenecen a celdas diferentes para la entrada al LA1 (celda 1 y celda 2,
respectivamente). En esos casos, se aprecia que la precisin es la misma que con el handover.
No obstante, esta alternativa presenta una desventaja respecto al handover ya que las fronteras

46

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

entre LAs son espacialmente menos frecuentes que entre celdas y, por tanto, se dispondrn de
menos aforos virtuales de ese tipo.

celda 3

LA 1

LA 2

1
3

celda 1

celda 2

Figura 3-4: Representacin de un aforo virtual.

3.4 VELOCIDAD
La velocidad es uno de los parmetros ms estudiados para evaluar la calidad del servicio de
una va segn la demanda que soporta, especialmente en entornos urbanos. Muestra la relacin
entre el espacio recorrido por un vehculo y la unidad de tiempo (km/h o m/s). La velocidad se
suele medir en un punto o tramo corto de una va para determinar la rapidez con que pasan los
vehculos (fluidez del trfico). La velocidad puede ser definida segn diferentes enfoques:
velocidad instantnea, velocidad media temporal, velocidad media espacial o velocidad de
recorrido, entre otros. La velocidad de cada vehculo sufre variaciones durante un viaje ya que
depende de muchos factores, como la categora de la va (urbana, autova), ancho de la va o
nmero de carriles por sentido de circulacin. Adems existen otros factores variables que
tambin influyen, como climatologa, temporalidad (hora punta, da festivo). Desde el punto
de vista de trfico, conocer la velocidad de un vehculo en un momento dado es poco
representativo y resulta ms eficiente trabajar con velocidades medias de recorrido. Para ello, se
utilizan diferentes alternativas como el empleo de coche flotante (vehculos equipados con
sensores que se sumergen en la circulacin de una va y capturan informacin de trfico) o
detectores en puntos fijos que realizan las mediciones mediante identificacin de vehculos.
Ambas alternativas suponen un gasto adicional de instalacin y mantenimiento de los equipos.
Bajo el enfoque de la telefona, Lovell (2001) comenz e investigar sobre la viabilidad de
mediciones de velocidad de vehculos usando el seguimiento annimo de llamadas procedentes
de telfonos mviles. Para ello utiliz mtodos de simulacin que incluan algoritmos de

Captulo 3: ESTADO DEL ARTE EN EL MBITO DE LA ESTIMACIN DE PARMETROS DE TRFICO


MEDIANTE LA TELEFONA MVIL

47

posicionamiento para diferentes tcnicas de localizacin (AOA, TDOA), tamaos de muestra,


media y varianza de velocidades de vehculos o incluso distancia. Los resultados mostraron que
un sistema de este tipo poda clasificar las velocidades de los vehculos que transportaban los
telfonos, as como el grado de congestin conforme a tres niveles: bajo, medio, y alto. Este
trabajo necesit la incorporacin de mdulos adicionales a los que existen comnmente en las
redes de telefona para aumentar la precisin de localizacin con la que efectuar los clculos.
Algo similar present Ygnace (2001) en el informe del proyecto STRIP. Este proyecto instal
elementos sobre una va a estudiar para monitorizar los interfaces radio Abis/A. Esto permita
identificar ciertos mensajes de sealizacin intercambiados entre un terminal encendido y la red
para conseguir una estimacin temporal de la posicin del terminal mediante tcnicas de redes
neuronales (precisin: 100150m). Esta estimacin, junto con ciertos algoritmos e informacin
histrica en bases de datos, servan para identificar correctamente la posicin del vehculo sobre
la va que lo soportaba y as hacer predicciones de velocidad y tiempos de viaje. Los resultados
de la estimacin fueron contrastados con los medidos por detectores instalados en la va
analizada, mostrando la relacin entre ambas cantidades. Estas estimaciones eran menos
precisas en secciones urbanas de la va debido al posicionamiento errneo de usuarios que
realmente estaban prximos a la va pero no sobre ella. A pesar de ello, los resultados (Figura
3-5) mostraron que la tecnologa de monitorizacin del interfaz Abis/A puede considerarse
viable para segmentos de va interurbanos; aunque resalt la necesidad de una mejora de los
algoritmos de posicionamiento, especialmente para aplicaciones enfocadas a su uso en tiempo
real.
160

140

120

120
100
80
60
probe speed N.bound

40

segment

20

Average speed in km/h

Mean speed in km/hour

140

100

80
probe speeds
N.bound

60

loop speeds

loop speed N.bound


segment

N.bound

0
.0
00
8: 00
:4 0.
22 6:0 00
:3 0.
21 24:0 .00
: 0
20 12:0 .00
: 0
19 0:0 99
:0 9.
18 7:5 00
:4 0.
16 36:0 .00
: 0
15 24:0 .00
: 0
14 2:0 00
:1 0.
13 00:0 .00
: 0
12 48:0 00
: .
10 6:00 99
3 .
9: 3:59 00
2 .
8: :00 0
12 .0
7: 0:00 00
0 .
6: 8:00 00
4 .
4: :00 00
36 .
3: :00 0
24 .0
2: 2:00 00
1 .
1: 0:00
0
0:

00
0:
:0 :00
23:00:00
22:00:00
21:00:00
20:00:00
19:00:00
18:00:00
17:00:00
16:00:00
15:00:00
14:00:00
13:00:00
12:00:00
11:00:00
10:00:00
09:00:00
08:00:00
07:00:00
06:00:00
05:00:00
04:00:00
03:00:00
02:00:00
01:00
00

time distribution

40

time distribution on the urban freeway

Figura 3-5: Promedio velocidades: telfonos vs. detectores InterCiudad (arriba) e IntraCiudad
(abajo) Motorway Northbound. (Ygnace, 2001)

48

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

En general, los trabajos anteriores necesitaron la instalacin de elementos adicionales en la red


y/o modificacin de los terminales. Sin embargo, una de las principales ventajas del uso de la
telefona celular es que no es necesario llevar a cabo dichas modificaciones para obtener
parmetros de trfico viables. El trabajo presentado por Thiessenhusen et al. (2006) del DLR
con datos de Vodafone pone de manifiesto esta afirmacin. En el citado se emple informacin
procedente de los handover ejecutados para medir ciertos parmetros de trfico como la
velocidad. El handover se produce cuando un telfono pasa de una celda a otra mientras
mantiene una comunicacin activa (p.ej., llamada), producindose una conmutacin de la
llamada a la estacin base que gestiona esa nueva celda. Ese instante en el que se produce el
handover queda registrado, junto con otros parmetros como las celdas implicadas en l. Si la
llamada es suficientemente larga como para que la nueva celda a la que se acaba de entrar sea
atravesada completamente, se dispondr de informacin temporal de entrada (handover inicial)
y salida (handover final) de dicha celda. Estos tiempos, junto con las ubicaciones de las
fronteras entre celdas (conocidas por el operador), permiten realizar una estimacin de
velocidad media para la seccin de va que atraviesa la celda comprendida entre ambas fronteras
donde existi handover. Esto ser viable en aquellos casos en los que la identificacin de la va
dentro de la celda sea nica y la duracin de la llamada sea la suficiente para que se produzca un
doble handover. La Figura 3-6 compara las mediciones de velocidad tomadas con tres fuentes
diferentes: datos de telfonos GSM, detectores y FDC tomados por GPS instalados en taxis.

Southbound, A9, 2003-07-18


250

GSM
Loop
FCD

Speed (km/h)

200
150
100
50
0
5

10

15

20

Time (h)

Figura 3-6: Velocidad en funcin del tiempo obtenidos de datos GSM (+), detectores (), FCD ()
(Thiessenhusen et al., 2006).

El principal problema de esta metodologa es que la muestra slo considera a aquellos telfonos
que efectan llamadas lo suficientemente largas como para atravesar la celda completamente, lo
cual es poco frecuente. Adems, la identificacin de la ruta seguida por el telfonovehculo

Captulo 3: ESTADO DEL ARTE EN EL MBITO DE LA ESTIMACIN DE PARMETROS DE TRFICO


MEDIANTE LA TELEFONA MVIL

49

puede ser problemtica debido a la existencia de varias posibles, especialmente en entornos


urbanos. Aun as, el reducido coste de implantacin de un sistema de este tipo permite
considerarlo como alternativa viable para la determinacin de velocidad.
Una metodologa similar presentaron Birle et al. (2006) en referencia al proyecto
TrafficOnLine, que tambin consider el handover como principio bsico para estimar
parmetros de trfico como velocidad (Figura 3-7). Como se ha comentado, el mtodo es
preciso mientras sea posible identificar la seccin de va (ruta) que conecta ese par de zonas
donde se producen los handovers. En general, esto ocurre en autovas o carreteras principales en
las que no existen otras vas prximas con las que confundir la identificacin.

Start Call at 18:59:07

End of Call at 18:59:19

Velocity:
23 m/s = 82.5 km/h

Figura 3-7: Concepto de estimacin de velocidad usando doblehandover (Birle et al., 2006).

Sin embargo, en entornos urbanos suelen existir diferentes rutas para conectar zonas donde se
producen los handover. Por lo que esa identificacin de va es ms problemtica y no es
suficiente el concepto tpico de handover como fuente de informacin. Para solventar ese
problema en reas urbanas, propusieron utilizar datos procedentes de handovers en zonas donde
stos se producen debido a un solapamiento de cobertura causado por la presencia de edificios,
las cuales son ms pequeas y excepcionales dentro de una celda (Figura 3-8 b).
Con ello se consigue en reas urbanas una identificacin de localizaciones nicas dentro de una
celda ms viable que con el solapamiento tpico (Figura 3-8 a). Sin embargo, este mtodo
requiere informacin adicional del nivel de potencia de seal de las celdas vecinas, es decir,
informes de medida con los que identificar la ruta tomada por el terminal mvil al cruzar la
celda. Los resultados conseguidos mejoraron en gran medida la precisin en la estimacin de
velocidad para entornos urbanos, pese a requerir un tratamiento ms exhaustivo de los datos.

50

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

(a)

(b)
Figura 3-8: Zona handover (a) con solapamiento tpico y (b) con solapamiento debido a edificios
(Birle et al., 2006).

3.5 TIEMPOS DE VIAJE


La determinacin de tiempos de recorrido, junto con la de velocidad, resulta imprescindible en
los estudios de planificacin de una red viaria. Se denomina tiempo de recorrido al tiempo que
invierte cada vehculo en desplazarse entre dos puntos fijos. Estos tiempos son medidos en
tramos de va de cierta longitud para conocer la calidad del servicio que prestan as como sus
variaciones a lo largo de ellos. El modo de obtencin de estos tiempos vara segn el tramo
observado. En tramos de longitud media y/o corta se utilizan, normalmente, equipos de
observadores que anotan el instante en que entra y sale del tramo cada vehculo, distinguindolo
mediante el nmero de placa, tipo de vehculo, etc. En cambio, para tramos de mayor longitud,
se suele medir recorriendo varias veces dicho tramo con un vehculo y hacer mediciones de
tiempo mediante la tcnica de vehculo flotante. La incorporacin de nuevas tecnologas est
dotando de cierto automatismo a los procesos de medicin con el empleo de cmaras y tcnicas
de reconocimiento de imgenes; aunque la estimacin final contina siendo un proceso costoso.
Lgicamente, el concepto de tiempo est estrechamente relacionado con la velocidad, por ello
cualquiera de los mtodos basados en telefona mvil descritos en el apartado anterior puede
emplearse para la estimacin de tiempos de viaje en la seccin de va que discurre por una
celda. En general, el concepto de doblehandover es el ms extendido para la estimacin de
tiempos y velocidades. Tal es el caso del trabajo presentado por Linauer y Leihs (2003), en el

Captulo 3: ESTADO DEL ARTE EN EL MBITO DE LA ESTIMACIN DE PARMETROS DE TRFICO


MEDIANTE LA TELEFONA MVIL

51

cual se identificaron las zonas donde exista el tpico solapamiento de cobertura entre celdas
(zonas handover). Los tiempos de viaje fueron obtenidos mediante el anlisis de la sealizacin
enviada al ejecutar el traspaso de una llamada entre dos zonas handover contiguas. Sin
embargo, esta alternativa presenta como dificultad aadida problemas en el emparejamiento de
zonas handover con la red viaria debido al tamao que poseen. Solventar esta problemtica
requiere la utilizacin de algoritmos avanzados de mapmatching como los desarrollados por
Estimotion Ltd. (ITIS Inc.), cuya tecnologa patentada se encarga de la medicin y prediccin
de tiempos de viaje en tramos de carretera con alta calidad y en tiempo real.
Utilizando la citada tecnologa de Estimotion, BarGera (2007) estudi las velocidades y
tiempos proporcionados utilizando el evento de handover. El sistema reciba observaciones
procedentes de handovers ejecutados por telfonos existentes en la zona estudiada y
almacenaba, para cada handover, el instante de tiempo junto con el identificador de celda
asociado a las antenas de antes y despus de la ejecucin de dicho handover. El sistema era
capaz de calcular el rea donde era ms probable que el terminal estuviera localizado cuando
ejecut el handover (zonas handover), con una probabilidad de acierto del 85%. La dimensin
tpica de esas zonas handover estaba en torno a 3001000m, de ah la complejidad de emparejar
esas zonas con secciones de la red viaria. Esta tecnologa de anlisis consideraba la posibilidad
de que las observaciones realmente no estuvieran relacionadas con vehculos desplazndose por
la va designada sino por otras prximas a ella, lo cual es frecuente en entornos urbanos.
Finalmente, el sistema generaba estimaciones vlidas de tiempos de viaje (en torno al 63%) para
las secciones analizadas durante el periodo de observacin (10:0020:00), empleando una
muestra cuyo tamao est en torno al 13% del trfico total. Los tiempos de viaje eran
convertidos a velocidades medias de seccin aplicando simplemente el ratio de longitud
correspondiente a dicha seccin.
Para probar la validez de las estimaciones, las medidas basadas en telfonos mviles fueron
comparadas con otras obtenidas con detectores y coches flotantes. Los resultados mostraron una
buena correlacin entre todas las medidas, donde slo 4 valores atpicos fueron excluidos de la
muestra al obtener medidas (con coches flotantes) considerablemente mayores que las del resto
(con detectores y telfonos mviles). La Figura 3-9 compara los tiempos de viaje obtenidos con
los detectores, coches flotantes (Floating Car Data, FCD) y mediante telfonos mviles,
observndose una buena correspondencia entre los tres tipos de medidas. Segn la figura, existe
una leve desviacin, en torno a 1 minuto, entre los tiempos de viaje estimados con datos de
telefona mvil y los procedentes de detectores, especialmente en situaciones de no-congestin.

52

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

Figura 3-9: Tiempos de viaje en la autova de Ayalon, sentido Norte (BarGera, 2007).

Respecto a los tiempos de viaje, cabe destacar el trabajo de investigacin desarrollado por
Finnra (Finnish Road Administration) en 2002 (Kummala, 2002; Virtanen, 2002). Este trabajo
se bas en la idea de que los telfonos mviles que se muevan siguiendo una cierta ruta siempre
cambiarn de estacin base (celda) en torno al mismo lugar. Segn lo expuesto en el captulo
anterior, un telfono mvil encendido intercambia regularmente informacin con las estaciones
base que conforman la red. Esto permite que la red conozca, aproximadamente, dnde buscar a
un telfono, por ejemplo, a la hora de encaminar una llamada entrante.

Travel Time [min]

30

25

20

15

10

Cellphone (GSM)

Camera (LPR)

5
5:00

7:00

9:00

11:00

13:00

15:00

17:00

19:00

21:00

23:00

Departure Time

Figura 3-10: Estimaciones de tiempos de viajes y velocidades en funcin del tiempo de salida: datos
GSM vs. LPR (Kummala, 2002).

Captulo 3: ESTADO DEL ARTE EN EL MBITO DE LA ESTIMACIN DE PARMETROS DE TRFICO


MEDIANTE LA TELEFONA MVIL

53

As pues, el trabajo desarrollado por Finnra propuso una monitorizacin de esa sealizacin
intercambiada entre el telfono y la red para estudiar el tiempo que precisaba cada telfono en
cruzar una seccin de va, desde que entra en un rea gestionada por una estacin base
determinada hasta la siguiente. Esto permite estimar la duracin de tiempo de viaje asociado a
esa seccin. Para la prueba piloto slo se necesit monitorizar el 5% de los telfonos para
actualizar los patrones de tiempos cada 30 minutos. Los resultados obtenidos (Figura 3-10)
fueron contrastados con los obtenidos mediante cmaras (LPR, License Plate Recognition),
mostrando la alternativa basada en GSM mayor precisin debido a que no se vea afectada por
problemas asociados a la visibilidad como condiciones meteorolgicas adversas, frecuentes en
pases nrdicos.

3.6 CONGESTIN
Un fenmeno de congestin se origina por la existencia de algn evento que motive un cambio
en los valores medios tpicos de velocidad y tiempos de viaje asociados a una seccin. En los
apartados anteriores se han descrito algunos mtodos basados en telefona que consiguen
caracterizar secciones de vas en trminos de velocidad y tiempos. Un anlisis de variaciones
bruscas en cualquiera de esos parmetros respecto a valores tpicos puede ser empleado para la
deteccin de congestiones. Anlogamente, se puede hacer uso de otra magnitud relacionada con
la intensidad de trfico telefnico. El dimensionado de una red de telefona mvil atiende a la
naturaleza del trfico telefnico cursado y su distribucin con respecto al tiempo y destino. Esta
magnitud vara segn proceda de un trfico continuo de llamadas (ncleos urbanos) u otro ms
espordico caracterstico de zonas de poca poblacin. Generalmente, estas zonas se asocian a
vas, como carreteras o autovas, alejadas de los ncleos urbanos. Por ello, el trfico telefnico
que soportan las estaciones base de esas vas se corresponde dominantemente con el generado
por los ocupantes de los vehculos que circulen por ellas.
Para la deteccin de eventos como accidentes, atascos o cualquier incidente que altere el flujo
normal de trfico, es posible hacer uso de un histrico de intensidades tpicas de trfico
telefnico medidas sobre esas mismas estaciones bases en diferentes horarios. Para comprender
este razonamiento es necesario resaltar que los usuarios de telefona mvil poseen ciertos
hbitos en la realizacin de llamadas. Estos hbitos siguen ciertos patrones de modo que,
cuando aparecen eventos que motivan un cambio, los valores tpicos de intensidad suelen
modificarse. Este es el caso de situaciones de congestin, en los cuales los usuarios tienden a
realizar ms llamadas por diversas razones, como avisar en el trabajo o incluso aprovechar el
tiempo para hablar con algn conocido. Este motivo modifica la intensidad de trfico tpica al

54

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

incrementarse el volumen de llamadas cursado por el sistema. Una simple comparacin con
valores tradicionales puede detectar la existencia de alguna incidencia que motive el aumento de
la actividad telefnica.

call volume (12 mn frame)

40,00

30,00

N of calls (mean)
incalls
outcalls
Dot/Lines show Means

10,00

20,00

0,00
0,00

2,00

4,00

6,00

8,00

10,00

12,00

14,00

level of incident on A7

Figura 3-11: Relacin entre volumen de llamadas y nivel de incidentes en la autova A7 (agosto y
septiembre 2000). Nota: Nivel de incidentes (level of incident): 0 = ningn incidente detectado por
los detectores, 14 = al menos 14 detectores (de 21) detectan un incidente en los correspondientes
intervalos de 12 min; Volumen de llamadas (call volume): promedio de nmero de llamadas
entrantes y salientes registradas en los correspondientes intervalos de 12 min (Ygnace, 2001).

El estudio desarrollado por INRETS analiz la relacin entre el volumen de llamadas (entrantes
y salientes) y la congestin de una va (Ygnace, 2001). Para ello, se consider la hiptesis de
que los conductores tienden a hacer ms llamadas cuando se encuentran en alguna situacin de
congestin. En la Figura 3-11 se muestra la relacin entre el volumen de llamadas de telfonos
mviles y el nivel de incidentes en un tramo de autova de 80 millas. El anlisis demostr que
las llamadas entrantes no aportaban informacin relevante. Sin embargo, se detect una relacin
significativa entre llamadas salientes de mviles sobre esa va y el nivel de incidentes, la cual
reflejaba el incremento de la actividad telefnica al estar los vehculos parados.

3.7 DENSIDAD DE TRFICO


En el mbito de vehculos, la densidad es otro parmetro clave para medir la calidad de servicio
que ofrece una seccin de va. La densidad de trfico representa el nmero de vehculos que
ocupan una longitud especfica de una va o carril de ella, en un instante dado, excluyendo los
vehculos estacionados. Se expresa en vehculos por kilmetro [veh/km], ya sea referido a un
carril o a todos los carriles de una va. Por su naturaleza espacial (se mide a lo largo de una

Captulo 3: ESTADO DEL ARTE EN EL MBITO DE LA ESTIMACIN DE PARMETROS DE TRFICO


MEDIANTE LA TELEFONA MVIL

55

longitud), la medicin directa de la densidad no es una tarea sencilla ya que precisa la


observacin de longitudes significativas de una seccin de va. No obstante, si se dispone de
cierta informacin en puntos de esa seccin, la densidad [veh/km] se estima como el cociente
entre flujo [veh/h] y velocidad [km/h], pero esto slo es vlido bajo ciertas condiciones.
La telefona mvil sugiere nuevas formas de obtencin de esta magnitud. La unidad Erlang est
relacionada con la demanda de utilizacin de los recursos de estaciones base que dan servicio a
una zona, es decir, trfico telefnico que se produce durante un determinado periodo de tiempo
en cada celda. Como cualquier otro tipo de trfico, el telefnico posee tambin un concepto
ligado a la ocupacin. As pues, esta magnitud puede proporcionar una estimacin de la
ocupacin de una celda en trminos de consumo de recursos ofrecidos por la estacin base
asociada y, por tanto, medir el nmero de telfonos a los que dicha celda est dando servicio.

Figura 3-12: Intensidad de trfico telefnico a 10:00 a.m. en el rea metropolitana de Graz.
(Fuente: http://senseable.mit.edu/projects/graz/highres/highres.zip)

Esta lnea es la que sigue Ratti et al. (2005) en su trabajo del SENSEable City Laboratory
(MIT). En l se consigue representar sobre mapas de una ciudad ciertos parmetros de trfico,
visualizando la dinmica de sus habitantes en tiempo real. Uno de esos parmetros fue la
intensidad de trfico telefnico o densidad de las llamadas (medida en Erlang) de los abonados
de un cierto operador, para lo cual cont con la cooperacin del operador austriaco
A1/Mobilkom que proporcion ciertos datos annimos de telfonos. Esta investigacin tambin
representaba sobre mapas informacin relacionada con la movilidad de usuarios a travs de
handovers. Asimismo, mediante una inscripcin previa en un servicio de rastreo del operador,

56

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

se monitorizaban peridicamente las posiciones de usuarios que previamente se haban dado de


alta. La Figura 3-12 muestra los valores de intensidad de trfico gestionada por antenas de Graz
(Austria) usando mapas de color, donde colores claros representan intensidades altas, y verdes y
negros valores bajos o nulos de intensidad, respectivamente. En Miln (Italia) se aplic tambin
la misma metodologa (Ratti et al., 2006). La Figura 3-13 muestra grficamente
representaciones de la densidad de llamadas en diferentes horarios, observando una variacin de
niveles de densidad en funcin del tiempo.

Figura 3-13: Representaciones de la densidad de llamadas de telfonos mviles en el rea


metropolitana de Miln (20 km 20 km) entre las 4 p.m. y las 6 p.m.
(Fuente:http://www.envplan.com/misc/b32047).

En ambos estudios del MIT se lleg a la conclusin de que el nmero de llamadas realizadas
con telfonos mviles est estrechamente relacionado con la densidad de personas y, en el caso
de zonas donde no existen ncleos residenciales prximos sino autovas o carreteras, con la
densidad de vehculos mediante los telfonos de sus ocupantes. As pues, aplicando ciertos
algoritmos de expansin, es posible convertir esa medida de intensidad de trfico en celda
[telfonosLLAMADA/celda] a magnitudes relacionadas con la densidad en trminos de
vehculos/celda.

Captulo 3: ESTADO DEL ARTE EN EL MBITO DE LA ESTIMACIN DE PARMETROS DE TRFICO


MEDIANTE LA TELEFONA MVIL

57

Figura 3-14: Medidas de uso de la red mvil (Erlangs) en 6 lugares de Roma (Reades et al., 2007).

Este enfoque se comprende mejor en otro estudio desarrollado por el SENSEable City
Laboratory (MIT) en Roma (Reades et al., 2007). En el citado estudio, se consigui definir
patrones de actividad, segn la zona y el da analizado, empleando medidas expresadas en
Erlangs de uso de la red celular (llamadas) proporcionados por un operador. La Figura 3-14
muestra cmo las medidas de Erlang cambiaban con el tiempo en seis lugares seleccionados, los
cuales representaban zonas residenciales (Piazza Bologna), tursticas (Panten), ocio
(Trastevere, Estadio Olmpico) y principales puntos de entrada a la cuidad por tren (Termini) y
coche (Tiburtina). Como indican las grficas, los valores de Erlangs de lunes a viernes en cada
punto son muy similares, aunque el ratio vara de un lugar a otro. Por otro lado, los valores del
sbado y domingo suelen tener valores inferiores respecto a los valores tpicos de das
laborables, reflejando un patrn de comportamiento diferente segn el tipo de da. Sin embargo,
a pesar de esas diferencias entre das laborables y fin de semana, la Figura 3-14 muestra que los
seis lugares muestran un comportamiento similar: una rpida subida de actividad telefnica por
la maana entre las 6 y 10 a.m. en das laborables, con un ritmo ms lento y algo retrasado en el
tiempo durante el fin de semana, un valle al medioda, una nueva subida por la tarde y un
descenso abrupto por la noche.
Por otro lado, los altos niveles nocturnos de uso de red, entre medianoche y las 2 a.m., los fines
de semana cerca del Panten y Trastevere, en comparacin con los de lugares orientados a zonas
residenciales o industriales, sugeran una actividad fuertemente orientada al ocio. Esta
caracterstica permite la posibilidad de identificar, por ejemplo, zonas de ocio y culturales

58

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

atendiendo al patrn de uso de la red celular. Por ello, este estudio tambin aplic la actividad
telefnica (densidad de llamadas) a otra lnea como es la dinmica de una ciudad. Segn esas
medidas de uso de la red (en erlangs) se dividi la ciudad en zonas, de modo que se estableci
una relacin de dichas zonas con otras zonas definidas segn la actividad desarrollada en ellas
(comercial, turstica, residencial,). Ello permiti representar caractersticas espaciotemporales de la ciudad en funcin del uso del telfono mvil. Se observ que la actividad
telefnica de das laborables en cada zona exhiba un patrn temporal ms dinmico, mientras
que en fin de semana la actividad present mayor dispersin espacial. Una caracterstica con
implicaciones para la comprensin de la dinmica urbana de una ciudad fue el alto nivel de
actividad por la maana de das laborables en zonas asociadas a estaciones de trenes, autobuses
o intercambiadores, en comparacin con los niveles de zona residenciales a esa misma hora.
Desde un punto de vista de planificacin urbana, esta relacin era obvia pero la visualizacin
espacial y temporal de estas caractersticas a esta escala est comenzando a ser posible mediante
la infraestructura ya existente en sistemas de telefona mvil.

3.8 CARACTERSTICAS DE LOS DATOS DE TELEFONA


MVIL
3.8.1 Precisin de localizacin
El esquema de localizacin en los sistemas GSM se basa en la existencia de reas de
localizacin y celdas (Figura 3-15). Con ello se pretende tener organizado el rea de servicio
(cobertura) en una serie de zonas para proporcionar eficientemente servicios a sus usuarios.

Figura 3-15: Localizacin por Identificacin Global de Celda, CGI.

El nivel de precisin de posicin ms fino conseguido de una red de telefona celular, sin
realizar ninguna modificacin en ella ni en los terminales, es a nivel de celda. Es decir, se
localiza el terminal dentro el rea de cobertura de la estacin base a la que est conectado. Con

Captulo 3: ESTADO DEL ARTE EN EL MBITO DE LA ESTIMACIN DE PARMETROS DE TRFICO


MEDIANTE LA TELEFONA MVIL

59

ello se obtiene una aproximacin de la zona geogrfica en la que se encuentra el telfono, pero
no la posicin exacta. Por ello, existe un margen de error que depende del radio de la celda. Este
radio oscila entre los 100 m y 1 km en ciudades. En entornos rurales depende de la densidad de
las antenas, aunque suele oscilar entre 5 y 20 km. Ese margen de error empeora a medida que
aumenta el nivel de agregacin, por ejemplo, a nivel del rea de localizacin (agrupaciones de
celdas), que es el nivel de resolucin con el que trabaja la red celular para gestionar terminales
simplemente encendidos. El uso de resolucin a nivel de LA implica que la zona geogrfica en
la que se puede encontrar el telfono es ms extensa, dando lugar a una mayor incertidumbre.
Esta resolucin afecta al mapeado de telfonos sobre vas existentes en la zona en la que se
informe que se encuentra el terminal, lo cual puede ser relevante para ciertos parmetros. Una
de esas situaciones problemticas se presenta con la existencia de mltiples vas dentro de una
celda para parmetros que usen handover (vase la Figura 3-16), donde las celdas implicadas en
los handovers son las mismas para las dos posibles rutas. En tales situaciones no es posible
desagregar la velocidad o el tiempo de viaje estimado por ruta, ya que cada una tiene diferente
longitud de seccin de va que recorre la celda. Sin embargo, esta situacin no es tan relevante
en otros casos como la medida de volmenes. En ellos, la informacin de volmenes de paso de
telfonos mviles entre dos celdas proporciona informacin agregada de paso total por las dos
vas. No obstante, cada mtodo toma el nivel de agregacin apropiado segn la resolucin
requerida para la prediccin del parmetro. Incluso pueden paliarse tales efectos mediante el uso
de algoritmos de mapmatching (Pyo et al., 2001, White et al., 2000) o completando la
informacin disponible con otros de los muchos parmetros que se pueden extraer de la red de
telefona mvil para determinar una posicin ms exacta del terminal.

Figura 3-16: Mltiples vas dentro de una celda.

Asimismo, hay diferencias en los requerimientos de calidad en las estimaciones de parmetros


segn los usos finales a los que estn destinados. Por ejemplo, datos que puedan ser usados con
el fin de informar al viajero probablemente sean menos exigentes que si se utilizarn para la
deteccin de incidentes o la gestin del trfico. Por ello, en casos de altos niveles de calidad, los

60

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

parmetros de trfico estimados mediante telefona mvil deberan ser utilizados para completar
otro sistema de monitorizacin de trfico, pero no como sistema exclusivo. Incluso realizar
modificaciones en la red o en los propios terminales tambin supondra una mejora en la calidad
de las predicciones, por ejemplo la utilizacin de telfonos equipados con AGPS con el
objetivo de obtener una mejor precisin de los datos de localizacin.
Otro factor que debe ser seriamente considerado es la frecuencia de renovacin de esos datos de
localizacin, la cual depender de si el telfono est simplemente encendido (las actualizaciones
tienen lugar tras vencer un temporizador o cambiar de rea de localizacin) o si realiza algn
tipo de uso de la red, como una llamada, en la que la actualizacin es continua e instantnea
mientras dure la conexin.
No obstante, en trminos de coste y prestaciones ofrecidas para lograr calidad en las
estimaciones, la informacin de posicin proporcionada por una red GSM sin modificaciones
permite obtener datos fiables para monitorizar el movimiento de telfonos y, por tanto,
vehculos sin necesidad de desplegar una infraestructura adicional. As mismo, se trata de un
sistema bastante ms econmico dado que aprovecha la tecnologa y mdulos propios de las
redes GSM para obtener la posicin de cualquier terminal mvil, por muy sencillo que sea.

3.8.2 Tamao de la muestra


Como ya se ha referido previamente, una de las ventajas de la obtencin de parmetros de
trfico basados en la telefona mvil es la posibilidad de capturar informacin de un modo ms
continuo que con los mtodos tradicionales. Esta continuidad en la captura depende de la
frecuencia de renovacin de los datos obtenidos de cada terminal. Lo deseable es conocer la
posicin exacta en trminos de sus coordenadas espaciales y temporales (x, y, z; t). Sin
embargo, eso no es posible con redes o terminales sin modificar. As pues, lo ms preciso que se
puede conseguir es conocer la localizacin en la que se encuentra cada terminal en trminos de
celda, dado que es el nivel de resolucin ms preciso disponible sin alterar la red ni los
terminales. Pero esto slo es posible cuando el telfono tiene establecida una comunicacin con
la red. Con ello, el tamao de la muestra de datos depender del nmero de llamadas efectuadas
por los abonados as como la duracin de las mismas. Sin embargo, la realizacin de llamadas
no tiene una tasa tan elevada como la mera existencia de terminales que simplemente estn
encendidos. Un telfono encendido y desocupado, estado ms frecuente, ofrece datos menos
precisos en trminos de posicin y ms dispersos en el tiempo, dado que el terminal interacta
con la red menos frecuentemente. En ese estado, las notificaciones a la red de la posicin son
puntuales bajo ciertos eventos, como el vencimiento de un temporizador o cambio de rea de

Captulo 3: ESTADO DEL ARTE EN EL MBITO DE LA ESTIMACIN DE PARMETROS DE TRFICO


MEDIANTE LA TELEFONA MVIL

61

localizacin, por lo que la actualizacin de datos de posicin es menos frecuente. Tampoco


aportara informacin a nivel de trfico telefnico (Erlangs), dado que en ese estado no consume
recursos. De modo que el empleo de informacin procedente de terminales en ese estado limita
su aplicacin a ciertos parmetros de trfico.
En cambio, utilizar informacin obtenida de terminales ocupados con llamadas afectara al
tamao de la muestra de datos disponible para las estimaciones, dado que el conjunto de
terminales en ese estado se reduce considerablemente. Esta limitacin restringe su uso a
estimaciones de parmetros que necesiten muestras pequeas. En algunos casos puede ser
necesario obtener mayor precisin de posicin y no una muestra de telfonos de tamao
elevado, como ocurre con la velocidad o tiempos de viaje. En cambio en otros, la calidad de la
estimacin depende en gran medida de la alta penetracin de telfonos que actan como
sondas para inferir los datos de trfico, como ocurre con las matrices OD, densidad, etc. Por
ello, las metodologas descritas anteriormente llegan a un equilibrio entre tamao de muestra y
precisin de posicin deseada a la hora de su planteamiento, consiguiendo que estas
limitaciones no afecten a la calidad de los resultados.

3.8.3 Aspectos legales


Es importante destacar que estas tcnicas de estimacin de parmetros de trfico mediante
telfonos mviles no infringen aspectos relacionados con la privacidad de los usuarios. Todos
los datos analizados se reciben y se tratan en forma agregada y annima, segn las normativas
europeas, de modo que no exista posibilidad de asociar datos de localizacin con abonados
concretos. El objetivo de estas tcnicas basadas en telefona mvil es mostrar su aplicabilidad y
aptitud para mejorar los mtodos de clculo de parmetros de trfico y as lograr una eficiente
gestin y planificacin del trfico.
Sin embargo, la principal preocupacin asociada a estos servicios basados en localizacin (LBS)
reside en la caracterstica de que los movimientos que un abonado realiza sean continuamente
monitorizados, especialmente cuando esos datos de localizacin se ponen a disposicin de
aplicaciones cuyos beneficiarios son terceras personas. Pero todos estos servicios se enmarcan
dentro de la legalidad puesto que se rigen por normativas que se encargan de velar por la
proteccin de la intimidad. En concreto, la directiva 2002/58/EC de la Unin Europea se
encarga de regular el tratamiento de los datos personales y la proteccin de la intimidad en el
sector de las comunicaciones electrnicas. En ella se distinguen tres grupos de datos asociados

62

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

al abonado: datos del trfico, personales, y de localizacin. Los datos de mayor inters para los
servicios LBS son los asociados al ltimo grupo, los datos de localizacin.
En el punto 14 de la citada directiva aparece una descripcin de los datos de localizacin,
indicando que: Los datos de localizacin pueden referirse a la latitud, la longitud y la altitud
del equipo terminal del usuario, a la direccin de la marcha, al nivel de precisin de la
informacin de la localizacin, a la identificacin de la celda de red en la que est localizado el
equipo terminal en un determinado momento o a la hora en que la informacin de localizacin
ha sido registrada. Adems, esta directiva proporciona regulaciones sobre los datos de
localizacin en el artculo 9, donde indica:
En caso de que puedan tratarse datos de localizacin [] slo podrn tratarse estos datos si
se hacen annimos, o previo consentimiento de los usuarios o abonados, en la medida y por el
tiempo necesarios para la prestacin de un servicio con valor aadido. El proveedor del
servicio deber informar a los usuarios o abonados, antes de obtener su consentimiento, del
tipo de datos de localizacin distintos de los datos de trfico que sern tratados, de la finalidad
y duracin del tratamiento y de si los datos se transmitirn a un tercero a efectos de la
prestacin del servicio con valor aadido.
Con ello, queda claro que estos servicios requieren acuerdos previos y que la proteccin de la
privacidad es un aspecto fundamental para cualquiera de estos servicios. En particular, la
inferencia de datos de trfico mediante datos de localizacin procedentes de telefona se trata de
un ejemplo claro del empleo de los servicios LBS donde el beneficiario principal no slo es la
Administracin sino la sociedad al completo, puesto que este servicio supone una mejora en la
gestin y planificacin de la red. Es necesario resaltar que el servicio no infringe la ley sobre
proteccin de la intimidad, ya que hace uso de datos annimos para no asociar desplazamientos
a usuarios concretos. Slo se pretende conocer informacin referente a la localizacin de un
terminal, visto como un elemento annimo de la red que se mueve a travs de ella, sin importar
las caractersticas del usuario u otro tipo de informacin asociada a l.

3.9 CONCLUSIONES
Una vez expuestos los procesos asociados a la gestin de movilidad de los sistemas de telefona
en el Captulo 2 y revisado el Estado del Arte respecto a su aplicabilidad en la estimacin de
parmetros de trfico, se puede concluir afirmando que son dos los procesos viables que
permiten monitorizar el movimiento de terminales. Por un lado se dispone del handover, el cual
permite conocer el momento en el que un terminal con una llamada activa cambia de una celda

Captulo 3: ESTADO DEL ARTE EN EL MBITO DE LA ESTIMACIN DE PARMETROS DE TRFICO


MEDIANTE LA TELEFONA MVIL

63

a otra al necesitar la comunicacin ser transferida de la estacin base servidora a una nueva.
Con ello se permite detectar el paso de terminales con llamadas activas por las fronteras entre
celdas. Por otro lado existe el proceso de LU, el cual es ejecutado por cualquier terminal
encendido para que la red se mantenga informada de la localizacin aproximada del terminal, en
trminos de rea de localizacin (LA), logrando as encaminar rpidamente las llamadas
entrantes en el caso que stas ocurran. En base a este razonamiento, cada vez que un telfono
cambie de LA mientras est encendido se considerar que ha cruzado la correspondiente
frontera entre LAs.
La deteccin del movimiento de terminales derivados de handovers y/o procesos de LU presenta
una serie de ventajas e inconvenientes comparndolos entre s. Cuando se emplea el handover,
la informacin extrada viene referida a frontera entre celdas, la cual, dada las dimensiones
tpicas de una celda, no abarca una extensin de terreno muy amplia. Con ello, el nmero de
vas que discurren por la frontera es limitado, alcanzndose una mejor precisin cuanto menor
es la zona fronteriza. En el caso de un proceso de LU para monitorizar el paso de un LA a otro,
al ser un rea de localizacin una regin que comprende un grupo de celdas, la zona fronteriza
observada posee un mayor tamao que en el caso anterior. Esto provoca el aumento del nmero
de vas que cruzan la frontera y, por tanto, del nivel de agregacin de la informacin de
traspasos proporcionada en este caso. No obstante, esta situacin no ocurre siempre al utilizar el
proceso de LU. Al ejecutarse este proceso no slo se dispone de informacin del nuevo LA de
entrada sino de la celda por la que lo ha hecho. De modo que la zona fronteriza a monitorizar
realmente no comprende toda la frontera entre los LAs sino la seccin de esa frontera limtrofe
con una celda concreta. En base a este razonamiento, la desventaja del proceso de LU respecto
al handover en trminos de precisin a nivel de celda slo ocurre en determinadas situaciones.
Esta afirmacin se puede ver ms claramente en la Figura 3-17. El paso desde la celda 1 a la 3
monitorizado por un aforo virtual que emplee el handover entre ese par de celdas observara
el movimiento de terminales por el punto 1. En cambio, ese movimiento no podra ser detectado
por un aforo virtual que emplee el proceso de LU ejecutado cuando se cambia del LA1 al
LA2, ya que ste observara tanto el punto 1 como el 3. En este caso no se podra distinguir si el
paso ha sido a travs del punto 1 o del 3 debido a que ambos puntos limitan con la misma celda
por la que se entra al LA2 (celda 3). Con ello, la informacin proporcionada por ese aforo
virtual se correspondera con el movimiento por cualquiera de las vas asociadas a ambos
puntos, es decir, informacin agregada de traspaso. Por el contrario, un proceso de LU ejecutado
al pasar en el otro sentido (desde el LA2 al LA1) s que permitira identificar si ha ocurrido por

64

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

el punto 1 o el 3, puesto que los puntos limitan con celdas diferentes para la entrada al LA1
(celda 1 y celda 2, respectivamente).

LA 2

celda 3

LA 1

1
3

celda 1

celda 2

Figura 3-17: Fronteras entre celdas y LAs.

Por otro lado, el hecho de analizar datos procedentes de handover (llamadas) conlleva que la
muestra de terminales de la que se recogen los datos la forman aquellos que han tenido activa
una llamada en el momento de paso por la frontera. Esto implica que el tamao de la muestra es
estadsticamente menos representativo que si se utilizaran datos de terminales que estuvieran
simplemente encendidos, como ocurre en el caso de datos procedentes del proceso LU. La Tabla
3-1 resume estas caractersticas bsicas.
Tabla 3-1: Comparativa de volmenes derivados de handovers o procesos de LU.

Ventajas
LU

Mayor tamao de la muestra

Handover

Mayor precisin
(menor nmero de vas por frontera)

Inconvenientes
Menor precisin
(mayor nmero de vas por frontera)
Menor tamao de la muestra

Atendiendo a estas conclusiones, una red GSM (sin modificar) puede no ofrecer prestaciones
ptimas para fines de localizacin y monitorizacin de usuarios, especialmente en lo que a
movilidad se refiere. No obstante, la rpida expansin de este tipo de sistemas de telefona junto
a los resultados alcanzados en proyectos similares relacionados con la obtencin de parmetros
de trfico, impulsa a incorporar mtodos basados en estas nuevas tecnologas en los estudios de
transporte. Por ello, los Captulos 2 y 3 han descrito y revisado conceptos y procedimientos
relacionados con los sistemas de telefona mvil para afrontar los objetivos de esta Tesis con un
mayor conocimiento de la materia.

CAPTULO 4
INFERENCIA DE VOLMENES DE TRFICO
MEDIANTE LA TELEFONA MVIL

4.1 INTRODUCCIN
Se denomina volumen de trfico al nmero de vehculos que pasan por un punto o seccin
transversal de una va durante un periodo de tiempo determinado. Estos volmenes pueden ser
entendidos como una medida del nivel de utilizacin del viario por la demanda de transporte.
Los estudios de volmenes se realizan con el propsito de obtener informacin del movimiento
de vehculos sobre puntos o secciones especficas dentro de una red viaria, proporcionando una
descripcin intuitiva del comportamiento dinmico del trfico.
Las distribuciones temporales de volmenes de trfico se deben a diferentes estilos y formas de
vida, los cuales determinan patrones de viaje basados en el tiempo (pocas del ao, horas del
da, etc.). Por otro lado, los telfonos mviles se han convertido en un elemento indispensable
en nuestra rutina diaria. stos intercambian continuamente informacin con las estaciones de un
sistema de telefona mvil a fin de disponer de servicios telefnicos de calidad, con lo que una
monitorizacin de datos generados por dichos terminales puede ofrecer un fiel reflejo de las
pautas de movilidad de los usuarios. En concreto, ciertas situaciones que tienen lugar durante el
funcionamiento tpico de esos sistemas pueden desempear una tarea similar a las llevadas a
cabo por las tradicionales estaciones de aforo en lo referente a conteos de trfico. Este captulo
est dedicado a profundizar en este campo, desarrollando una metodolologa para inferir
volmenes de trfico de vehculos a partir de la telefona mvil mediante modelos matemticos.

4.2 ANTECEDENTES Y ESTADO ACTUAL


Para la medicin de los volmenes de trfico suelen utilizarse estaciones de aforo. Una estacin
de aforo mide la cantidad de vehculos que transitan por un determinado punto o seccin del

66

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

viario; a este valor medido se le conoce con el nombre de aforo, trmino que tambin
identifica al de estacin de aforo o punto de aforo. Tradicionalmente, estos aforos son un
tipo de informacin que se recoge de forma automtica en un conjunto de puntos asociados a
arcos del viario. Para ello se han de instalar elementos adicionales en las vas (espiras, cmaras
de video). Este volumen de paso de vehculos no es constante sino que oscila segn la
movilidad de la poblacin, categora de la va, temporalidad, etc. Para conocer en detalle las
caractersticas del trfico de vehculos que circula por la red sera necesario monitorizar un
nmero considerable de vas de modo casi permanente con algn tipo de detector, algo inviable
cuando existen restricciones presupuestarias. As pues, surge la necesidad de otras alternativas
que permitan caracterizar el trfico de un modo rpido, preciso y permanente, sin excesivo
coste.
Un modo de conseguir esta informacin es mediante la telefona mvil. En contraste con los
sensores fijos, los telfonos mviles proporcionan informacin respecto al comportamiento del
trfico sobre cualquier zona donde exista cobertura telefnica, sin necesidad de un despliegue
adicional de infraestructura. En estos casos, el volumen estara asociado al movimiento de
telfonos por una determinada zona de la red, dado que existen ciertos eventos y procesos en la
telefona mvil relacionados con la gestin de movilidad que permiten detectar el cambio de
zona, bien entre celdas (mediante handover) o bien entre reas de localizacin (mediante
procesos LU, Location Update). Respecto a esta idea, en la seccin 3.3 se presentaron los
conocimientos actuales sobre el clculo de volmenes mediante la telefona mvil, junto con
una revisin del EstadodelArte sobre la obtencin de volmenes con datos procedentes de
telfonos.
Existen estudios en la literatura en los cuales se afirma que el flujo de telfonos mviles
derivado de llamadas con handover y el flujo de vehculos proporcionado por detectores
(espiras, gomas, cmaras) en los mismos puntos estn directamente relacionados en la
mayora de los intervalos horarios de un da tpico (Thiessenhusen et al., 2006; Hpfner et al.,
2007), mostrando picos caractersticos similares en las horas punta de maana y de tarde. No
obstante, esos estudios manifestaron la dificultad de obtener flujos de vehculos precisos
directamente de datos de llamadas debido a la naturaleza de dichos datos. Por tanto, la principal
cuestin es determinar cmo el flujo de telfonos estar relacionado con el flujo de vehculos ya
que en los conteos de terminales que pasan por fronteras entre celdas no se monitoriza el
conjunto completo de vehculos que la han atravesado, sino slo una muestra de ellos.
Ciertos factores que tienen su origen en la naturaleza de los datos de telfonos mviles afectan a
la hora de cuantificar la relacin entre vehculos y telfonos. Por un lado, la telefona mvil

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

67

aporta informacin asociada a movilidad de telfonos que i) son de un cierto operador y ii) que
estn encendidos. Los telfonos apagados o de otro operador son transparentes, es decir, aunque
crucen la frontera no sern detectados en el proceso de conteo. En el caso del handover, existe
otro condicionante adicional asociado a la naturaleza del evento, que implica que el telfono
est realizando una llamada en el momento de cambio de celda. Adicionalmente a los factores
citados, la existencia de ms de un telfono por vehculo tambin perturba la estimacin de flujo
usando datos de telfonos.
La carencia de una relacin directa e inmediata entre conteos de telfonos que ejecutan
handover y conteos de vehculos sugiere la necesidad de un tratamiento especial para relacionar
ambas magnitudes, el cual puede requerir la realizacin de algn proceso de calibracin usando
conteos de vehculos obtenidos, por ejemplo, mediante detectores ubicados en la misma zona en
la que se realiza el conteo de telfonos. En la literatura se han propuesto diferentes modelos
diseados para correlacionar ambas magnitudes, como un sencillo modelo basado en funciones
de transferencia generadas directamente con datos de aforos (Bekhor et al., 2008) u otro ms
complejo basado en tcnicas de asimilacin de datos como la relajacin Newtoniana o tcnica
nudging (Herrera y Bayen, 2008). En ambos casos, la utilizacin de modelos para relacionar
ambas variables hizo posible alcanzar estimaciones ms precisas de flujo de vehculos.
Ante las conclusiones anteriores, y dada la naturaleza de la informacin procedente de telefona
mvil, parece lgica la necesidad de usar modelos matemticos que se encarguen de medir esa
relacin con un objetivo claramente predictivo. Los modelos matemticos son ampliamente
utilizados para resolver problemas concretos de ingeniera u otras reas cientficas, y
constituyen un marco terico general para la formulacin de la inferencia estadstica. En los
siguientes apartados se proponen una serie de modelos para predecir volmenes de vehculos a
partir de la telefona mvil con objeto de ser usados en los estudios de transporte en sustitucin
o de forma complementaria a medidas de volmenes proporcionadas por los habituales aforos.

4.3 METODOLOGA PARA LA INFERENCIA DE VOLMENES


DE VEHCULOS
La inferencia estadstica comprende una serie de mtodos y procedimientos para deducir
propiedades (hacer inferencias) de una poblacin, a partir de una pequea parte de la misma
(muestra). Lgicamente es imposible predecir con exactitud y es por ello que la bondad de estas
deducciones se medir atendiendo a su grado de acierto. En este trabajo se va a plantear el uso
de la inferencia estadstica para predecir volmenes de vehculos utilizando informacin

68

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

derivada de la telefona mvil, de modo que el estudio estadstico correspondiente comprender


los siguientes pasos, los cuales sern abordados en los sucesivos apartados:
1. Planteamiento del problema.
2. Extraccin de la muestra.
3. Anlisis descriptivo de los datos.
4. Tratamiento de los datos.
5. Elaboracin de modelos y estimacin de los parmetros.
6. Contraste de modelos.
7. Conclusiones.

4.3.1 Planteamiento del problema


En esta fase inicial del problema se definen con precisin la poblacin, la caracterstica a
estudiar, las variables dependientes e independientes, etc. Bajo el contexto de nuestro problema,
la poblacin o universo se corresponde con el conjunto de vehculos que pasan por una zona en
un periodo de tiempo determinado (por ejemplo, cada hora), de modo que la caracterstica a
estudiar ser la intensidad de paso de vehculos por dicha zona.
4.3.1.1

Alternativas ofrecidas por la telefona mvil

En esta etapa tambin se deben analizar los medios de los que se dispone y el procedimiento a
seguir. Como se ha comentado en el apartado 3.9, la telefona mvil ofrece dos procesos
asociados a la gestin de movilidad que permiten monitorizar el paso de terminales, bien entre
celdas mediante el handover, o bien entre reas de localizacin (LA) mediante el proceso de
Location Update (LU). A partir de la red viaria real se elabora un modelo de red compuesto,
principalmente, por nodos y arcos. La mayora de los nodos corresponden a una interseccin o
cruce, mientras que los arcos corresponden a los segmentos de vas de comunicacin que unen
los nodos. Analizando la topologa de un modelo de red de transporte junto con la distribucin
de celdas y LAs del sistema celular existente, es posible asociar fronteras entre dichas zonas con
secciones de va (arcos). Con ello, cada vez que un telfono cambie de celda durante una
llamada (handover) o cambie de LA mientras est encendido (proceso LU), se podr considerar
que ha pasado por alguno de los arcos que conforman la correspondiente frontera. En aquellos
casos en los que la frontera slo comprenda un arco, el paso de terminales computado se
asociar ntegramente a dicho arco. Sin embargo, cuando son ms de uno los arcos implicados
en una frontera, el nivel de resolucin proporcionado por estos datos slo informa del paso por
la frontera, pero no permite distinguir sobre qu arco del total se ha realizado el traspaso. Dada
esta situacin, la cual es mayoritaria, la informacin de traspasos proporcionada ser en forma

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

69

agregada por grupos de arcos, en lugar de a nivel individual de arco (formato tradicional de las
estaciones de aforo).
El procedimiento a escoger depender, por tanto, de las especificaciones que se necesiten para
abordar el problema en cuestin. Las fronteras a monitorizar vienen ya establecidas por el
propio diseo de las redes de telefona mvil, puesto que se utilizan las mismas celdas y/o reas
de localizacin definidas en el dimensionado y diseo de la red celular. El tamao de un rea de
localizacin depende en gran medida de las celdas que la forman. El radio de las celdas depende
de parmetros como trfico que tienen que soportar, topologa del terreno, tipo de antena o
incluso edificios alrededor de la estacin base, variando su tamao desde cientos de metros a
kilmetros.
Dada una regin de estudio, puesto que las reas de localizacin son agrupaciones de celdas, el
nmero de fronteras entre celdas es mayor que entre LA y, por tanto, se monitorizara un
nmero mayor de arcos utilizando handovers que procesos de LU. No obstante, si la zona a
estudiar es extensa (p.ej. una comunidad autnoma), las fronteras entre LAs por una celda
concreta pueden englobar un nmero suficientemente elevado de arcos para abordar un
determinado estudio. En esta Tesis, el principal objetivo de los datos de telfonos est orientado
al campo de la estimacin de matrices origendestino mediante volmenes observados, por lo
que interesa disponer de informacin en un nmero de arcos de la red suficientemente
representativo. As pues, ser la dimensin de la red de transporte la que condicione la eleccin
de tomar datos procedentes de llamadas (cambios de celda) o registros de LU (cambios de LA).
Por ejemplo, si el estudio se centrara en una red urbana, la monitorizacin del paso de un LA a
otro no es admisible dado que tpicamente una ciudad es cubierta con un nico LA y el nmero
de posibles fronteras a monitorizar es muy bajo; en cambio, existirn numerosas celdas. Por
ello, sera ms apropiado en esos casos utilizar datos de llamadas al permitir monitorizar un
mayor nmero de fronteras.
4.3.1.2

Proceso de captura de datos

Una vez conocidos los medios de los que se dispone, y los posibles procedimientos que ofrece
la telefona mvil, es necesario elegir cul va a ser el procedimiento a seguir. Como se ha
analizado en el apartado anterior, la dimensin de la red es determinante a la hora de seleccionar
el evento de telefona del que se obtendrn los datos fuente. Sin embargo, la implementacin de
los modelos de captura de datos de telfonos est sujeta en gran medida a las caractersticas
tcnicas de la plataforma del operador que proporcione los datos. Esa plataforma deber tener
habilitada la funcionalidad necesaria para extraer informacin de las bases de datos relativa a

70

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

llamadas o cambios de rea de localizacin. En su defecto, la disposicin por parte del operador
para la instalacin de mdulos que implementen tal extraccin tambin condiciona el xito del
proceso de captura de datos.
Para la realizacin de esta Tesis se ha contado con la inestimable colaboracin del operador
VODAFONE que se ha prestado a proporcionar datos de telfonos debidamente encriptados. En
el caso de la plataforma del citado operador, los datos de llamadas estn accesibles sin coste ni
impacto en los mdulos del sistema puesto que son almacenados con fines de facturacin y
control del funcionamiento de la red. Para el caso de datos asociados a procesos de LU, aunque
stos son generados automticamente por el sistema, slo se almacenan temporalmente. Por
ello, sera necesario realizar un volcado peridico de las bases de datos del sistema en un
servidor central del que tomar los datos. Esto requiere una modificacin de los mdulos
existentes en la plataforma del operador ya que las APIs necesarias para su almacenamiento
permanente no estn accesibles en la actualidad.
Tras considerar las posibilidades ofrecidas y desde la perspectiva de bajo coste e impacto en
mdulos de la infraestructura del operador, se preferi que los estudios numricos desarrollados
en este Captulo utilizaran como datos fuente informacin de llamadas realizadas sobre un
conjunto de celdas. En concreto, el conjunto de datos proporcionado por VODAFONE se
corresponde con registros encriptados de llamadas efectuadas por sus abonados en celdas bajo
estudio durante periodos de 24 horas. Un extracto del formato de los datos entregados por el
operador se muestra en la Tabla 4-1. En particular, estas celdas han sido previamente
seleccionadas por disponer en las proximidades de sus fronteras con otras celdas de una estacin
de aforo con la que contrastar y/o calibrar los valores de volmenes de trfico inferidos con el
modelo diseado.
Tabla 4-1: Extracto de los datos entregados por el operador.

Hora Duracin Cell Id


(Nombre)
(hh:mm) (min)

IMSI

ID Nmero
Origen

ID Numero
Destino

Fecha

20240

3210

508

10/04/2008

9:30:00

1,53

GSM2

20240

3210

508

10/04/2008

9:31:00

2,45

GSM2

20241

3205

17362

10/04/2008 18:10:00

0,33

GSM1

20241

3205

1055

10/04/2008 18:11:00

1,12

GSM1

Es preciso mencionar que cualquier nmero que aparezca en la informacin proporcionada por
el operador respecto a la identidad de los abonados se encuentra encriptado con un identificador
nico y permanente durante todo el intervalo de tiempo analizado (24 horas). Con ello se

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

71

garantiza la privacidad de los abonados pero sin impedir realizar un seguimiento de la movilidad
que ha tenido cada terminal en trminos de celdas en las que ha efectuado llamadas. Todo ello
permite, finalmente, monitorizar el paso de terminales de una celda a otra para inferir
volmenes agregados por grupos de arcos que cruzan la frontera en cuestin.

4.3.2 Conteo de paso de telfonos entre celdas. Extraccin de la muestra


La inferencia estadstica persigue estimar parmetros de una poblacin a partir de una muestra
de la misma. En general, la estadstica lo que nos permite no es el conocimiento exacto de lo
que ocurrir, sino lo que ms probablemente pueda ocurrir. Para ello dicha muestra o porcin de
poblacin tiene como requisito que sea representativa de la poblacin o universo al que
pertenece, es decir, sea relativamente similar al conjunto de la que fue extrada. Dado que en
nuestro problema la poblacin la constituye el conjunto de vehculos que pasan por un tramo de
va, la seleccin de la muestra consistir en tomar miembros de ese conjunto de vehculos.
Segn lo expuesto en apartados anteriores, la telefona mvil est muy extendida en la sociedad
actual, en especial en el caso de usuarios en movilidad dado que les proporciona un modo
eficiente y rpido de comunicacin. Bajo este enfoque, una posible muestra estara relacionada
con los telfonos mviles pertenecientes a los ocupantes de los vehculos que circulan por una
va. El funcionamiento estndar de los sistemas de telefona mvil permite conocer el flujo de
telfonos que pasan de una celda a otra mientras realizan llamadas. En entornos prximos a la
red viaria, ese movimiento de telfonos estara directamente relacionado con los vehculos que
han pasado por la zona asociada a la frontera entre celdas, en trminos de la porcin de
vehculos que en su interior transportaban los telfonos desde los que se han realizado tales
llamadas.
Para la identificacin de tal conjunto de telfonos, lo ms inmediato es tomar aquellos
terminales que realizaron un handover. Se sabe que cuando un terminal con una llamada activa
entra en el rea de servicio de otra antena (celda), se ejecuta un handover, notificando a la red
tanto su nueva posicin en trminos de identidad de celda como el instante de entrada. Con ello,
en las bases de datos del sistema siempre se crea un registro para la entrada de un terminal con
una llamada activa en una nueva celda. Un anlisis de los instantes en los que se producen esos
registros debido a handovers (cambios de celda) permite detectar el paso de terminales con
llamadas activas por una zona asociada a la frontera de una celda con otra (Figura 4-1 a).
No obstante, emplear exclusivamente telfonos que han generado handovers restringe en cierta
medida el tamao de la muestra dado que el handover requiere unas condiciones apropiadas
para ser ejecutado. stas son que un usuario en movilidad (a bordo de vehculo) haga una

72

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

llamada y que dure lo suficiente para que sea traspasada a otra celda. Puede darse el caso que la
llamada finalice antes de cambiar de celda, por lo que el handover no llegara a realizarse y, a
pesar de que el telfono est en movimiento, el telfono no formara parte de la muestra. Por
ello, se deben considerar otras situaciones de movilidad que amplen los criterios para la
seleccin de la muestra. Se sabe que cuando un usuario realiza una llamada, por cuestiones de
facturacin, el sistema siempre almacena en una base de datos un registro conteniendo
informacin relativa a esa llamada, como hora de inicio, duracin, ID telfono llamado, ID
telfono llamante o identificacin de la celda donde se origina la llamada (LAI+CI). Por ello,
tambin es factible detectar el paso de un terminal de una celda a otra sin necesidad de que est
realizando una llamada en el momento de cruzar la frontera, como en el caso del handover. Esto
ocurre cuando desde un mismo terminal se realizan dos llamadas consecutivas en celdas
diferentes y colindantes en un corto periodo de tiempo T, por ejemplo, 15 minutos (Figura 4-1
b). En ese caso, dado que hay constancia de que el terminal ha estado en dos celdas en un corto
periodo de tiempo, se puede considerar que est en movimiento y que, por tanto, tambin ha
pasado por la frontera entre celdas. As pues, aunque el instante de paso de una celda a otra no
se conozca con la misma exactitud que en el caso del handover, se supone que habr ocurrido
dentro de ese periodo T. Este tiempo (T=15 minutos) es admisible dado que est dentro de los
rangos de tiempo respecto de los cuales se suele proporcionar las medidas de intensidades de
trfico de las tradicionales estaciones de aforo. Esta pareja de llamadas junto a las que ejecutan
handover permiten construir una muestra mayor de terminales para monitorizar su movimiento
de una zona a otra, denominndose a esos tipos de llamadas como llamadas en movilidad.

Figura 4-1: Llamadas en movilidad: (a) handover y (b) 2 llamadas en t1 y t2 tal que t2-t1T=15min.

Es importante destacar que la situacin mostrada en la Figura 4-1 b slo se contabiliza como
una nica llamada en movilidad, pese a realizarse 2 llamadas. Esto es as dado que el concepto
de movilidad se asocia al movimiento del terminal desde el cual se realizan llamadas y, en esta
situacin, es el mismo terminal el que realiza las dos llamadas, siendo stas usadas para detectar
su movimiento. Entonces, el anlisis de registros de llamadas almacenados en las bases de datos

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

73

en busca de llamadas en movilidad, realizadas en las celdas de inters, permitir contabilizar los
terminales que se desplazan de una celda a otra como si existiera una especie de estacin de
aforo virtual en la frontera entre ellas.
Un modelo de red de transporte es una representacin simplificada de la red vial y est formado,
principalmente, por nodos y arcos, los cuales representan las intersecciones y los tramos viales,
respectivamente, de la infraestructura vial. Analizando la distribucin de las celdas y el modelo
de red de transporte se identificarn las posibles fronteras observadas y se establecer una
correspondencia con los arcos del modelo. Una frontera observada o aforo virtual lo
conforman los arcos cuyo nodo inicial y nodo final estn en celdas distintas y contiguas (Figura
4-2). Con ello, cada vez que un telfono con una llamada activa accede a la celda B procedente
de otra A o el mismo telfono realice dos llamadas consecutivas (<15minutos) en la celda A y
B, respectivamente, se podr considerar que ha pasado por el aforo virtual posicionado en
dicha frontera observada, es decir, por alguno de los arcos que la cruzan. La informacin de
conteo proporcionada estar definida de forma agregada por grupos de arcos, en lugar de a nivel
individual de arco (formato proporcionado por los tradicionales aforos).

l5

l3
l4

Frontera 2: De celda 3 a celda 1 F2= {l 2, l 4}


Frontera 3: De celda 3 a celda 2 F3= {l 5}
Frontera 4: De celda 2 a celda 3 F4= {l 6}
Frontera 5: De celda 1 a celda 2 F5= {l 7}

l9
l 10

Frontera 1: De celda 1 a celda 3 F1= {l 1, l 3}

l2

celda 1

celda 3

l1

l7

k
l8

l6
l

celda 2

Frontera 6: De celda 3 a celda 2 F6= {l 8}


Arcos no observados

{l 9, l 10}

Figura 4-2: Definicin de frontera observada o aforo virtual en un modelo de red.

4.3.3 Anlisis descriptivo de los datos de llamadas


Dada la naturaleza de la informacin usada para la inferencia de volmenes de vehculos,
asociada con llamadas realizadas por usuarios a bordo de stos, surge la necesidad de realizar un
anlisis descriptivo de esos datos de llamadas. Este anlisis, adems de examinar el trfico
telefnico que tiene que soportar la red celular, debe atender un aspecto importante influido por
la movilidad de los usuarios de telfonos mviles, el cual viene referido a la conducta de stos a
la hora de realizar llamadas. En redes fijas, los usuarios en sus lugares de trabajo (parques
industriales o empresariales) poseen diferentes hbitos de llamadas a los de reas residenciales.
Una diferenciacin similar existe en los sistemas de telefona mvil, donde existen diferentes

74

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

patrones de llamadas para usuarios en movimiento y estticos. Esto conlleva que el trfico
telefnico en redes mviles dependa tanto del tiempo como del espacio, siendo esa dependencia
espacial mucho ms variable que en redes fijas.
Atendiendo a un contexto de movilidad de vehculos, un modo de abordar este anlisis
descriptivo es cuantificar la comodidad a la hora de efectuar llamadas. Las llamadas se pueden
dividir en dos categoras: aquellas que son recibidas por el usuario, denominadas llamadas
entrantes, y las que son realizadas por ese usuario, denominadas llamadas salientes.
Lgicamente, un parmetro para evaluar la citada comodidad ser la tasa de llamadas salientes.
Destacar que cada llamada entrante tiene su origen en una saliente de otro usuario, por ello slo
se van a considerar las llamadas salientes de cada usuario al analizar el trfico telefnico de red.
La duracin de una llamada tambin ser otro parmetro caracterstico a estudiar. Ambos
parmetros estn fuertemente afectados por la movilidad de los usuarios (estticos, peatones u
ocupantes de vehculos), ya que sta condiciona la realizacin de llamadas. Por ejemplo, un
conductor normalmente iniciar un nmero de llamadas menor comparado con un usuario
ubicado en su trabajo; respecto a la duracin, los pasajeros de vehculos harn llamadas ms
largas en comparacin con las realizadas por conductores.
La Figura 4-3 muestra la intensidad del trfico telefnico, representada en trminos de nmero
de llamadas realizadas, en una celda Zk a lo largo de un da laboral tpico. Para sistemas de
telefona mvil, los picos suelen producirse entre las 10:00 y 12:00 debido a la actividad
comercial y laboral de los usuarios, mostrando un segundo pico entre 18:00 y 20:00 debido al

Trfico Telefnico [llamadas]

fin de la jornada laboral.


400
300
200
100
0

9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

Tiempo (24 horas)

Figura 4-3: Trfico telefnico (nmero de llamadas por hora) durante un da en una celda.

Cabe sealar que la intensidad de trfico telefnico puede variar de un da a otro, semanalmente,
o incluso segn el periodo del ao (verano, Semana Santa,), mostrando diferentes patrones
asociados con los hbitos de los usuarios y/o las caractersticas de la zona gestionada por la

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

75

celda. Aunque, normalmente, estos patrones de volumen de llamadas tienden a mostrar un


comportamiento similar en diferentes zonas. La Figura 4-4 muestra el nmero de llamadas
realizadas a lo largo de un da laborable tpico en diferentes celdas bajo estudio. En ella se

Trfico Telefnico [llamadas]

aprecia que, a grandes rasgos, los patrones de llamadas son similares.


400

Celda 7
Celda 5
Celda 9
Celda 1

300
200
100
0

10 11 12 13 14 15 16 17

18 19 20 21 22 23

Tiempo (24 horas)

Figura 4-4: Promedio del nmero de llamadas por hora en diferentes celdas a lo largo de 18 das.

En la Figura 4-4 se puede observar que, esencialmente, existen tres perodos de actividad
durante un da laborable tpico, uno de muy poca actividad y dos claros picos donde la actividad
es mayor, variando su rango de una celda a otra. El primero se corresponde con el perodo
nocturno (00:007:00), donde la realizacin de llamadas es poco probable. El segundo periodo
se extiende durante la mayor parte de la jornada laboral (8:0016:00). El ltimo perodo es el
correspondiente a la tarde y el final del da (16:0000:00). A su vez, se observa que la actividad
telefnica en un da laborable aumenta bruscamente por la maana entre las 7:00 y 10:00; en

Trfico Telefnico [llamadas]

cambio, la transicin hacia la noche refleja descensos ms graduales.


400
td1min
1min<td2min

300

2min<td5min
td>5min

200
100
0

10 11 12 13 14 15 16 17 18 19 20 21 22 23

Tiempo (24 horas)

Figura 4-5: Nmero de llamadas por hora durante un da segn la duracin de la llamada td.

Un comportamiento similar experimenta la duracin de las llamadas. En la Figura 4-5 se


desglosan las llamadas realizadas segn su duracin, mostrando cmo vara la tendencia de

76

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

duracin de llamadas a lo largo del da. Analizando esa duracin en trminos medios (Figura
4-6), se aprecia ms claramente que los usuarios tienden a hacer llamadas ms largas a partir de
las 19:00. La propia naturaleza del servicio condiciona esta variacin en la duracin, ya que
puede verse influenciada por las tarifas existentes o, incluso, por la disponibilidad de los
usuarios. Adems, el promedio de duracin de llamada puede variar segn las caractersticas de
la zona (p. ej., usuarios en zonas residenciales tienden a hacer llamadas ms largas que usuarios

Duracin media llamadas [min]

en un zonas comerciales durante la misma hora).

4
3
2
1
0

10 11 12 13 14 15 16 17 18 19 20 21 22 23
Tiempo (24 horas)

Figura 4-6: Duracin media de las llamadas durante un da.

4.3.4 Tratamiento de los datos


En el apartado anterior se han analizado los rasgos caractersticos de los datos en trminos de
nmero de llamadas realizadas y su duracin. Esta seccin se encarga de revisar en detalle otros
aspectos significativos relacionados con los datos de llamadas, as como el tratamiento que se ha
realizado sobre ellos para eliminar posibles errores.
Radio de cobertura de las celdas
Cada antena transmite a telfonos mviles residentes en el espacio radioelctrico de su rea de
cobertura denominada celda. Ese rea de cobertura viene caracterizado por dos radios: i) el
radio total de la celda y ii) el radio efectivo. El radio de servicio efectivo, definido mediante
niveles potencia de seal, es aquel en el cual un telfono se comunica con una nica estacin
base servidora. El resto del rea de servicio se disea de modo que sea gestionado por ms
estaciones base, denominndose zona de solape. Es necesario tener en cuenta que el radio total
de las celdas no es esttico, sino que puede variar dinmicamente en funcin de ciertos factores
aleatorios (condiciones metereolgicas, carga de llamadas...). No obstante, esta incertidumbre
en el radio no afecta a la deteccin de paso de terminales de una celda a otra debido al propio
concepto de frontera observada (Figura 4-2). En ella, se identifica la celda donde se ubican el

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

77

nodo inicial y final de un arco, para conocer los arcos que cruzan una frontera observada. De
modo que la fluctuacin del radio no suele tener gran impacto en aquellos nodos ubicados
dentro del radio efectivo de una celda, como se aprecia en la Figura 4-7 (a) y (b).
Por otro lado, se ha comentado ya que el rea de servicio de una celda suele superponerse
parcialmente con el de una o ms de sus celdas vecinas. Este solapamiento tiene lugar para
evitar agujeros en la cobertura debido a una disminucin del nivel de potencia de seal lejos
de la antena servidora. El tamao de la zona de solape se determina mediante el establecimiento
de un umbral mnimo de seal recibida. ste es un parmetro de diseo importante en las redes
celulares puesto que garantiza que un abonado situado cerca del borde de una celda pueda
recibir servicio de mltiples direcciones en caso que la servidora falle. Ms informacin
respecto al solapamiento entre celdas puede ser encontrada en Thornton y Grace (2005).

Zona de solape

l1

l1

i
l2
j

l2
j

(a)

(b)

l1

l2

j
(c)

Figura 4-7: Ejemplos de solapamiento entre celdas.

Un valor tpico de la zona de solape en una celda es el 3040% de la cobertura completa de la


celda (EIA/TIA IS-95, 1993). Este valor puede variar dependiendo, entre otros factores, de la
densidad de poblacin y/o de la interferencia causada por grandes edificios. En general, una
celda tiene 6 celdas vecinas, de modo que su rea total de solape es la suma del solapamiento
con cada una de esas vecinas, situndose entonces la zona de solape de una celda con alguna de
sus vecinas en torno al 57% del total de cobertura. En entornos nourbanos, el radio tpico de
una celda se sita alrededor de 1 km, por tanto la zona de solape entre dos celdas puede llegar a
ser mayor que el rea definida para ser representada por un nodo. Cuando ocurre esta situacin,
el concepto de frontera observada no se cumple puesto que no se satisface la condicin de estar
el nodo inicial y final en celdas diferentes. En esta situacin (Figura 4-7 c), el nodo (inicial o
final) de un arco se encuentra en una zona que pertenece a dos celdas, pudiendo ser una de ellas
la misma en la que se encuentra el otro nodo (final o inicial). En ese caso, esa frontera no puede
ser considerada como frontera observada al no cumplir la definicin. Todo ello sugiere la
necesidad de prestar especial atencin a la hora de identificar el conjunto de fronteras
observadas dado que no todas las fronteras son susceptibles de ser monitorizadas.

78

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

Trfico peatonal
La presencia de peatones es un aspecto importante a considerar en la inferencia de volmenes
de vehculos mediante la realizacin de llamadas en movilidad. Estas llamadas estn asociadas a
terminales desplazndose de una celda a otra, sin conocer la velocidad a la que lo hacen. Esto
implica que las llamadas en movilidad observadas pueden ser efectuadas por telfonos en
movimiento tanto a bordo de vehculos como de peatones en el caso de que la frontera entre
celdas est prxima a entornos urbanos. En base a ese razonamiento, no es posible distinguir
nicamente con datos de llamadas si un terminal que se mueve de una celda a otra pertenece a
un usuario de vehculo o a un peatn. Introduciendo modificaciones en la red, la velocidad de
traspaso podra ser detectada, resolvindose as este problema. No obstante, dado que se ha
optado por emplear datos de telefona sin introducir modificaciones, se considerar que las vas
que soporten trfico de peatones no son vlidas para ser monitorizadas. Es decir, si existiera una
frontera entre celdas asociada a ese tipo de vas, las llamadas observadas procederan de
usuarios de diferente tipo de movilidad. Como el inters se centra en el estudio de vehculos,
cuando una frontera entre celdas est formada por arcos con un trfico de peatones significativo,
esa frontera es desechada del conjunto de fronteras observadas, aunque cumpla la definicin de
frontera observada. Slo fronteras cuyos arcos no poseen un trfico de peatones significativo
son consideradas como vlidas para formar parte del conjunto de fronteras observadas. Esto
implica la necesidad de un procesado previo para evaluar las fronteras entre celdas y calificarlas
como aptas para el proceso de inferencia.
Puntos kilomtricos en estudio
Se pretende determinar el volumen de vehculos asociado a un nmero conocido de llamadas en
movilidad generadas en una frontera entre celdas. Para alcanzar este objetivo, se van a plantear
una serie de modelos que, con fines predictivos, se encarguen de proporcionar esa magnitud de
un modo similar a las clsicas estaciones de aforo. La elaboracin de esos modelos no es una
tarea sencilla ya que, como se expone ms adelante, no existe una dependencia directa entre
ambas magnitudes. Por ello, una vez definidos los modelos, se va a emplear un histrico de
datos, tanto de llamadas en movilidad como de vehculos que han pasado por una zona, no slo
para llevar a cabo el ajuste de parmetros de esos modelos sino para la validacin de las
predicciones realizadas. As pues, se exige que las fronteras entre celdas dispongan de una
estacin de aforo en las proximidades encargada de proporcionar los volmenes de vehculos
que realmente atraviesan la frontera entre celdas para constituir el citado histrico de datos.
Asmismo, bajo las condiciones expuestas en el punto anterior, la seleccin de los puntos
kilomtricos en los que se localizan las fronteras entre celdas en las que se realizar la

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

79

monitorizacin estar restringida a zonas en las que sea poco probable que los usuarios en
movilidad existentes se correspondan con peatones. Seleccionando fronteras entre celdas
cruzadas por vas donde el trfico sea esencialmente de vehculos, alejadas de entornos urbanos,
se elimina el efecto negativo que los peatones introducen. Esta ser una condicin necesaria
para considerar como vlida la informacin que se pueda derivar de las llamadas.
Finalmente, para identificar tales fronteras se realiz un estudio de campo sobre vas
pertenecientes a anillos alrededor del rea metropolitana de Sevilla. Una vez conocidos los
puntos de la red viaria en los que existen estaciones de aforo, se seleccionaron los ms
adecuados para realizar el estudio. La Figura 4-8 muestra los 6 puntos kilomtricos escogidos
pertenecientes a las vas sobre las que se realiza la monitorizacin. Estos 6 puntos dan lugar a 12
fronteras observadas, dos para cada punto kilmetrico, estando cada una de ellas asociada a un
sentido de paso. Sobre esos puntos, el Centro de Gestin de Trfico de la DGT facilit las
mediciones de intensidades horarias de vehculos y VODAFONE los registros de llamadas
generados en las celdas implicadas en las fronteras durante los das seleccionados para ser
observados. Con ellos se elabor el histrico de datos que relacionaba nmero de vehculos y de
llamadas en movilidad {(x1,y1), ..., (xn,yn)}. La Tabla 4-2 muestra los IDs de cada una de las
fronteras observadas en este estudio.

Figura 4-8: Puntos kilomtricos en los que en sus proximidades existe una frontera entre celdas.
Tabla 4-2: ID fronteras asociados a cada punto kilomtrico y sentido.
ID
Frontera
PK

A 49 PK 46 A 4 PK 518
S.HUELVA S.MADRID

A 4 PK 488
S.MADRID

A 4 PK 527
S.MADRID

A 92 PK 32
S.MALAGA

A 92 PK 43
S.MALAGA

ID
Frontera

10

11

12

PK

A 4 PK 518
S.SEV

A 49 PK 46
S.SEV

A 92 PK 32
S.SEV

A 92 PK 43
S.SEV

A 4 PK 488
S.SEV

A 4 PK 527
S.MADRID

80

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

Das de observacin
Los datos con los que se debe trabajar proceden de medidas u observaciones tomadas a partir de
la muestra. Dado que se pretende que la informacin extrada sea lo ms representativa posible,
se seleccionarn para monitorizar das que, a priori, presentan pocas variaciones respecto a un
da tpico. Esto implica que las mediciones se deben llevar a cabo en das centrales de la
semana: Martes, Mircoles y Jueves. Adems, deben estar sujetos a las siguientes condiciones:
no ser festivo, que el da anterior y posterior tampoco sea festivo, y que no pertenezca a una
semana con eventos especiales (Semana Santa, Feria de Abril,). En base a esos criterios, los
das seleccionados para tomar las observaciones de los datos de llamadas son 18 (martes,
mircoles y jueves de 6 semanas), los cuales se muestran en la Tabla 4-3.
Tabla 4-3: Das observados.

MARZO 2008
L M X J V S D
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31

ABRIL 2008
L M X J V
1 2 3 4
7 8 9 10 11
14 15 16 17 18
21 22 23 24 25
28

29

S D
5 6
12 13
19 20
26 27

CDIGO DE
COLORES
Festivos
Observados

30

Horario de observacin
El comportamiento de los usuarios a la hora de realizar llamadas tambin est condicionado por
la hora, bien por las tarifas existentes, la jornada laboral o porque en ciertos periodos puede ser
socialmente inadecuado realizar una llamada. Incluso, ste puede verse influido por la celda
segn las caractersticas de la zona a la que da servicio (rea residencial, centro comercial).
Prueba de ello es que la actividad telefnica durante la franja horaria entre la 1:00 a.m. y 6:00
a.m. es muy reducida, siendo poco probable hacer una llamada; en cambio, a partir de las 18:00
aumenta la tendencia a realizar llamadas por el inicio de tarifas reducidas. En este sentido, es
conveniente emplear medidas de dispersin para determinar el rango horario donde el nmero
de llamadas realizadas no presenta mucha dispersin respecto de la media. Una de estas
medidas es el coeficiente de variacin (CV), definido como el cociente entre la desviacin tpica
y la media, CV

, el cual cuantifica la separacin (dispersin o variabilidad) de los valores

de la distribucin respecto a un valor central. El valor del CV ser igual a 0 cuando no existan
diferencias entre los datos, resultando entonces una distribucin totalmente homognea. La

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

81

Figura 4-9 muestra el CV conseguido para las distribuciones de llamadas realizadas en cada una

Coeficiente de Variacin CV

de las celdas bajo estudio, procedentes de datos cedidos por VODAFONE.

C1
C2
C3
C4
C5
C6
C7
C8
C9
C10
C11
C12

4
3
2
1
0

9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Tiempo (24 horas)

Figura 4-9: Coeficiente de Variacin de la distribucin de llamadas en diferentes celdas.

Desde el punto de vista prctico, interesa centrar el anlisis en un rango horario donde las
curvas presenten valores bajos de CV. Esto ocurre dentro del intervalo 8:0021:00 observando
la Figura 4-9, en la cual el valor de CV permanece en todo momento por debajo de 0.5. Fuera de
ese intervalo, los valores de CV alcanzados son bastante mayores que la unidad, indicando en
ese caso que la realizacin de llamadas posee una variabilidad mayor respecto de la media.
Entonces, se tomar como intervalo de observacin la franja horaria entre las 8:00 y 21:00, en la
cual la realizacin de llamadas responde a un comportamiento, en cierto grado, homogneo para
todas las celdas. Con ello se consigue que los modelos de prediccin diseados sean ms
estables para cualquier periodo de tiempo comprendido en dicha franja.
4

Magnitud

x 10

1.5
24 horas

12 horas

0.5
0

8 horas
0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0.5

Frequencia (1/horas)

Figura 4-10: Densidad Espectral de Potencia de la distribucin de llamadas en una celda.

Por otro lado, realizando un anlisis de la actividad telefnica generada por usuarios de
telfonos mviles, se aprecian ciertos ciclos de comportamiento relacionados con los patrones
de movilidad de los usuarios. Analizando la Densidad Espectral de Potencia de las llamadas
(Figura 4-10), para realizar un estudio en frecuencia, se observan 3 picos en torno a periodos de

82

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

24 horas, 12 horas y 8 horas, los cuales son representativos de la periodicidad del conjunto de
datos de llamadas analizados. Lgicamente, el pico de las 24 horas est asociado a la frecuencia
con que los datos de llamadas son almacenados. El pico en torno a las 12 horas representa ciclos
repetitivos de comportamiento cada 12 horas correspondientes a pautas da/noche. Asimismo, el
pico de periodicidad en torno a las 8 horas responde a comportamientos asociados a la jornada
laboral.

4.3.5 Elaboracin de modelos de prediccin


4.3.5.1

Introduccin

La inferencia estadstica es una tcnica mediante la cual se deducen propiedades o se hacen


predicciones en base a una informacin parcial o completa obtenida mediante tcnicas
descriptivas sobre individuos de una muestra. En nuestro problema en cuestin, se pretende
predecir volmenes de trfico de vehculos a partir de informacin de llamadas generadas por
una muestra constituida por ciertos telfonos mviles que van a bordo de esos vehculos. Por
ello, inicialmente, se busc analizar la relacin de dependencia entre vehculos y las
denominadas llamadas en movilidad (Figura 4-1). Para abordar el problema, se ha dispuesto de
un histrico dado por una muestra bidimensional que relaciona ambas variables
{(x1,y1), ..., (xn,yn)}, siendo xi e yi observaciones de llamadas en movilidad y de vehculos,
respectivamente, que han pasado por alguna frontera observada entre celdas en un intervalo de
tiempo ti.
Es en este marco de cuantificacin de dependencia entre variables en el que aparecen unas
funciones denominadas cpulas. Las cpulas son una poderosa herramienta para representar las
relaciones de dependencia entre distintas variables aleatorias a travs de la distribucin de
probabilidad conjunta (Nelsen, 2006). En base a ellas, la funcin de distribucin conjunta de
una serie de variables puede expresarse como la funcin cpula aplicada sobre las distribuciones
marginales consideradas individualmente, esto es, F(x1,, x2,, xm) = C(F1(x1), F2(x2), , Fm(xm)).
As pues, una cpula, C , es una funcin de distribucin multivariante cuyas leyes marginales se
distribuyen uniformemente entre 0,1 . En el caso bivariante, C (u , v) pU u , V v es una
funcin de distribucin definida en 0,1 0,1 , donde U y V son dos variables aleatorias
2

uniformemente distribuidas. Entonces, dadas dos variables aleatorias X e Y con distribuciones


marginales FX(x) y FY(y) respectivamente, existe una cpula C, tal que FXY(x,,y)=C(FX(x), FY(y)).
Para la obtencin de la cpula asociada a las variables de inters X (nmero de llamadas en
movilidad) e Y (nmero de vehculos), se ha optado por el clculo de la cpula emprica. Las

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

83

cpulas empricas fueron estudiadas originalmente por Deheuvels (1979). La idea consiste en
construir una funcin cpula a partir de valores muestrales {(x1,y1), ..., (xn,yn)} recogidos para
las variables univariantes sin establecer dependencia de ningn parmetro. De esta forma, la
cpula es no paramtrica y queda definida nicamente a partir de la muestra de datos disponible.
Sea (x, y){(x1,y1), ..., (xn,yn)} una muestra de tamao n obtenida a partir de una distribucin
bivariante (X, Y), la definicin de cpula emprica (Nelsen, 2006) responde a la expresin:
i j n de pares ( x, y ) de la muestra tales que x x( i ) e y y( j )
Cn ,

n
n n
1 n
I ( xk x( i ) , yk y( j ) ) i, j 1,....n
n k 1

(6)

con x(i), e y(j) 1 i, j n, los estadsticos de orden definidos a partir de la muestra. Deheuvels
(1979) demostr que cuando el tamao muestral crece, la cpula emprica converge a la cpula
verdadera. Es por ello que la cpula emprica constituye un instrumento adecuado para estudiar,
a grandes rasgos, la relacin de dependencia entre U y V, y por tanto, la relacin entre X e Y.
En este sentido, existe una cpula que representa la condicin de independencia entre variables,
definida como (u,v)=uv. Se dice que dos variables X e Y no son dependientes si y slo si
C(u,v)=(u,v). Cuando C(u,v)(u,v), las variables X e Y son dependientes y la dependencia
depende de las variables a travs de transformaciones crecientes no lineales de las variables.
Esta es una propiedad destacable de las funciones cpula, la posibilidad para detectar
independencia entre variables frente a otras medidas clsicas que no lo permiten como el
coeficiente de correlacin lineal (que en caso de ser cero, nicamente permite confirmar la
ausencia de dependencia lineal entre las variables).
Una manera sencilla de presentar y comparar las cpulas es a travs de los diagramas de
contorno. El diagrama de contorno de una cpula es la representacin grfica de sus curvas de
nivel, las cuales son conjuntos en [0, 1]n dados por C(u,v)=k, con k constante. Empleando estos
diagramas, se pueden comparar la cpula de independencia y la cpula emprica obtenida para
el conjunto de datos {xi, yi} en los puntos kilomtricos o fronteras estudiadas (Figura 4-11). Se
aprecia que ambas cpulas muestran un comportamiento similar. A la vista de la similitud entre
ambas cpulas, y dado que la cpula emprica converge hacia la verdadera conforme el tamao
muestral crece (Deheuvels, 1979), es posible afirmar que las variables X e Y no poseen una
relacin de dependencia directa.

84

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

Independencia (u,v)

Copula empirica C(u,v)


0.9

v=FY(y)

v=FY(y)

0.6

4
0.

0.3

0.5

1
0.

0.2

0.2

0.1

0.2

0.4

0.3

0.2

0.6

0.
5

0.4

0.2

0.7

0.2

1
0.

0.4

0.6

0.1

0.4

0.3

0.8

7
0.

6
0.

0.2

0.6

0.9

0.8

0.8

0.5

0.2

8
0.

0.4

7
0.

0.4

0.3

9
0.

0.5

0.3

0. 1

0.8

0.1

0.6

0.4

0.6

u=FX(x)
(a)

0.8

0.3
0.2

0.1

0.2

0.4

0.6

0.8

0.1

u=FX(x)
(b)

Figura 4-11: Diagrama de contorno de isoprobabilidad de la cpula independencia y la emprica.

En estas condiciones, se hace necesario introducir en los modelos otras dependencias que se
encarguen de medir esa relacin desconocida entre X e Y que no tiene por qu ser cuantificable
por un nico parmetro. A la vista del anlisis descriptivo de los datos de llamadas, definir
modelos en los que, adems de las llamadas en movilidad, intervenga una dependencia temporal
parece lo ms intuitivo. Desde el enfoque de datos discretos, existe una amplia gama de
modelos estadsticos con capacidad de prediccin como modelos lineales generalizados,
modelos paramtricos, etc. En los siguientes apartados se van a plantear una serie de modelos
empleando ecuaciones paramtricas para modelar la relacin entre las variables Y (nmero de
vehculos) y X (nmero de llamadas en movilidad), junto a otros trminos dependientes, de cara
a que los modelos puedan ser utilizados con un objetivo predictivo.
Para la eleccin del modelo ms adecuado parece conveniente decidirse por aqul que mejores
resultados proporcione. Como se ha comentado, para abordar el problema se dispone de un
histrico dado por una muestra bidimensional que relaciona ambas variables. En este sentido,
para cada uno de los das observados se dispone de una muestra formada por 13 parejas de
datos: nmero de llamadas y nmero de vehculos registrados cada hora desde las 8:00 a las
21:00. Con objeto de disponer de un tamao de muestra suficiente para ajustar un modelo, se
obtuvo para cada punto kilomtrico una muestra mayor mediante la agregacin de los D das
observados (D=18) en una sola muestra. Finalmente, el tamao de la muestra resultante,
{(x1,y1), ..., (xn,yn)}, ha sido de n=234 registros (1813) para cada uno de los K=12 puntos
kilomtricos estudiados. De modo que el estudio predictivo har uso de esas variables para
ajustar los parmetros de los modelos. Esos parmetros se encargarn de cuantificar
adecuadamente la relacin entre las variables de cara a que el modelo proporcione medidas
admisibles de volmenes de vehculos sin necesidad de instalar una estacin de aforo en la zona.

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

85

Lgicamente es imposible predecir con total exactitud, por lo que los resultados obtenidos por
los modelos contendrn ciertos errores de prediccin. En este sentido, es importante indicar que
no todo el histrico ser utilizado para el proceso de estimacin de parmetros, ya que una parte
del histrico, denominada conjunto de validacin, estar reservada para ser utilizada con
posterioridad en la evaluacin de las predicciones realizadas, no participando en el ajuste. Por lo
general, se reserva una tercera o cuarta parte de los datos disponibles para validar los resultados.
El resto del histrico se utilizar para realizar los ajustes y recibe el nombre de conjunto de
entrenamiento.
En la notacin de los modelos que a continuacin se van a formular se emplear el ndice i para
designar el intervalo horario, d para el da observado, y k para el punto kilomtrico o frontera.
4.3.5.2

Modelo basado en la probabilidad de llamada y probabilidad de handover

Se va a plantear un modelo de prediccin basado en el fenmeno fsico asociado a las llamadas


en movilidad (Figura 4-1). Para definirlo se ha considerado que un telfono mvil ha efectuado
una llamada en movilidad cuando el usuario o bien ha realizado una llamada en cada una de las
dos celdas que componen la frontera en un pequeo intervalo de tiempo (suceso M), o bien
realiza una llamada en su celda origen con la suficiente duracin como para que se efecte el
handover (suceso L).
Es importante destacar que, aunque el suceso M exige la realizacin de dos llamadas, slo se
contabiliza como una nica llamada en movilidad dado que el concepto de movilidad se asocia
nicamente al terminal desde el cual se han realizado las dos llamadas, necesarias para la
deteccin de movimiento.
A la vista de estas situaciones, parece lgico que las observaciones de llamadas en movilidad
estn afectadas por el hecho de que las llamadas se realicen en periodos de tiempo donde sea
ms o menos probable realizarlas. Adems, en el caso de handovers, la duracin de las llamadas
tambin afectar a esas observaciones ya que, cuanto mayor sea la duracin de una llamada,
ms probable ser que se inicie un handover si el telfono est en movimiento. Por ello, la
dependencia temporal del comportamiento de los usuarios al realizar llamadas, puesta de
manifiesto al comprobar como el nmero total de llamadas y su duracin media varan a lo largo
del da (apartado 4.3.3), debe ser considerada a la hora de disear un modelo que permita
estimar el nmero de vehculos conocido un nmero de llamadas en movilidad.
Para la formulacin de un modelo terico que represente con fidelidad la relacin entre el
nmero de llamadas en movilidad y el de vehculos, se plantea una expresin que modele cada
una de las situaciones anteriormente citadas haciendo uso de parmetros caractersticos de las

86

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

llamadas, como probabilidad de hacer una llamada o su duracin, segn el intervalo horario ti y
la frontera observada k. Cabe resaltar que la naturaleza de las celdas estudiadas, alejadas de
entornos urbanos, permite suponer que prcticamente la totalidad de las llamadas en movilidad
observadas el intervalo horario ti y la frontera k, nll mov(ti, k), sern realizadas por usuarios en
movimiento asociados al trfico vehicular sobre las vas existentes en esa frontera. Estos
usuarios constituyen, por tanto, una muestra de la poblacin de vehculos que han cruzado la
frontera k en cada intervalo ti, nveh(ti, k).
Respecto al primer tipo de llamadas en movilidad (suceso M), se hace necesario introducir un
trmino que refleje la importancia de la probabilidad de que un telfono del operador
monitorizado, y a bordo de un vehculo, realice dos llamadas en el intervalo horario ti. Teniendo
en cuenta que el evento hacer dos llamadas a bordo de vehculo con el operador de inters es
una superposicin de dos realizaciones independientes del evento Ahacer una llamada a
bordo de vehculo con el operador de inters, y considerando que este evento A tiene una
probabilidad de xito que vara con el tiempo, PAPll veh(ti), entonces la probabilidad de xito del
suceso M se puede aproximar por Pll veh(ti)Pll veh(ti). Dado que se asume que la poblacin que
genera las llamadas en movilidad son el conjunto de vehculos que han cruzado la frontera,
nveh(ti, k), el nmero de llamadas en movilidad originadas por el suceso M vendr dado por:
nM (ti , k ) = nveh (ti , k )PM = nveh (ti , k )Pll veh (ti )Pll veh (ti ) nveh (ti , k )Pll2veh (ti )

(7)

Para el segundo tipo de llamada en movilidad (suceso L), el planteamiento es similar pero
introduciendo un trmino relacionado con la probabilidad de que la llamada ejecute handover.
As pues, la probabilidad de xito de este suceso L precisa de dos terminos; por un lado, la antes
mencionada probabilidad de Ahacer una llamada a bordo de vehculo con el operador de
inters, y por otro, la probabilidad de que dicha llamada requiera handover, Ph. Respecto a ello,
la probabilidad de que sobre una llamada se ejecute un handover viene dada por el hecho de que
la duracin de la misma, td, supere el tiempo de permanencia en la celda, tp. Asumiendo que la
poblacin que genera las llamadas en movilidad es el conjunto de vehculos que han cruzado la
frontera, nveh(ti, k), el nmero de llamadas en movilidad generadas en las condiciones asociadas
al suceso L vendra definido como:
nL (ti , k ) = nveh (ti , k )PL = nveh (ti , k )Pll veh (ti )Ph (ti , k )

(8)

El total de llamadas en movilidad observadas en el intervalo horario ti se corresponde con la


suma de ambos conjuntos de llamadas {nM y nL}, obtenindose una expresin en la que el valor
observado de las llamadas en movilidad se corresponde con la media de vehculos que realizan
una llamada en movilidad:

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

nll mov (ti , k ) nveh (ti , k )Pll2veh (ti ) nveh (ti , k )Pll veh (ti )Ph (ti , k )
nveh (ti , k )[ Pll2veh (ti ) Pll veh (ti )Ph (ti , k )]

87

(9)

Esta expresin es obtenida considerando despreciable la probabilidad de sucesos tales como que
se realicen dos llamadas desde el mismo vehculo en la misma celda, o que se llame en cada
celda efectuando adicionalmente el proceso de handover. Dichos sucesos, posibles en la
realidad, no llegaron a presentarse en ninguna ocasin sobre la muestra tomada en los puntos
monitorizados, por lo que no fueron considerados como situaciones en movilidad factibles.
Atendiendo a la expresin anterior, la probabilidad de que un terminal efecte una llamada en
movilidad, denominada P(ti,k), puede aproximarse por:
P (ti , k ) Pll2veh (ti ) Pll veh (ti ) Ph (ti , k )

(10)

Entonces, el nmero de vehculos que cruzan una frontera k en el intervalo horario ti vendr
dado por:
nll mov (ti , k ) P (ti , k )nveh (ti , k ) nveh (ti , k )

nll mov (ti , k )


P (ti , k )

nll mov (ti , k )


2
ll veh

(ti ) Pll veh (ti )Ph (ti , k )

(11)

Esta expresin proporciona un valor para el volumen de vehculos que pasan por frontera entre
celdas en funcin de las llamadas en movilidad detectadas y otras variables relacionadas con las
llamadas. El nmero de llamadas en movilidad asociadas al cruce de una frontera en el intervalo
horario dado, nll mov(ti, k), se obtiene mediante un anlisis de los registros de llamadas realizadas
sobre las celdas implicadas en la frontera k, proporcionados por el operador. Para los otros
trminos: probabilidad de que un vehculo haga una llamada y probabilidad de handover, Pll veh y
Ph respectivamente, se precisa de un tratamiento estadstico adicional atendiendo a la
dependencia temporal de las caractersticas de las llamadas. Los siguientes puntos exponen en
detalle el mtodo desarrollado para la obtencin de los citados trminos.
Probabilidad de hacer una llamada a bordo de vehculo con el operador de inters, Pll veh(ti)
Es habitual que un conjunto de datos siga algn tipo de distribucin estadstica. Definir
adecuadamente la probabilidad de xito de algn suceso puede resultar tedioso si no se conoce
esa distribucin. La propia representacin de los valores nos puede sugerir el empleo de alguna
de las muchas distribuciones conocidas (Poisson, Uniforme, Normal, etc.), determinando as la
que mejor se ajuste a los datos. Sin embargo, hay algunas formas de acercarse a tal trmino de
probabilidad sin necesidad del conocimiento previo de la distribucin; tal es el caso de un
procedimiento emprico en el cual la asignacin de las probabilidades de los sucesos de inters
se basa en la informacin observada. En esos casos, se requiere realizar un gran nmero de
experimentos para hallar la probabilidad de xito del suceso, en nuestro caso la probabilidad de

88

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

hacer una llamada a bordo de un vehculo con el operador monitorizado (Vodafone). Bajo este
enfoque emprico, la probabilidad se determina sobre la base de la proporcin de veces que
ocurre un evento favorable o xitos respecto al total de resultados posibles.
N veces que ocurre el evento de inters
N total de resultados posibles

Como ya se ha comentado anteriormente, la naturaleza de las celdas estudiadas, alejadas de


entornos urbanos y de zonas residenciales, permite suponer que prcticamente la totalidad de las
llamadas en movilidad observadas en cada una de las fronteras sern realizadas por usuarios
inmersos en el trfico vehicular. As pues, la probabilidad de hacer una llamada a bordo de
vehculo con el operador de inters, Pll

veh(ti),

ser igual al nmero de llamadas de dicho

operador realizadas a bordo de vehculos en el intervalo horario ti divido por el nmero de total
de vehculos que han pasado en dicho intervalo:
N veces que ocurre el evento de inters
N llamadas realizadas por vehculos

N total de resultados posibles


ti N total de vehculos cruzan fronteras ti
En esta expresin, el nmero total de vehculos que cruzan las fronteras se conoce a partir de las
estaciones de aforo existentes en las proximidades de cada frontera. Por otro lado, el trmino de
llamadas del operador de inters realizadas desde vehculos estar relacionado directamente con
las llamadas en movilidad observadas. Teniendo en cuenta que una llamada en movilidad
originada por el suceso M implica la realizacin de dos llamadas por parte del terminal que viaja
a bordo del vehculo, la probabilidad de hacer una llamada a bordo de vehculo con el operador
de inters en el intervalo horario ti se define como:
D

Pll veh (ti )

n
d 1 k 1

(ti , d , k ) 2 nM (ti , d , k )

n
d 1 k 1

veh

(12)

(ti , d , k )

siendo K el nmero total de fronteras estudiadas y D el nmero total de das observados. Como
se puede notar, se ha establecido una dependencia segn el intervalo horario ti considerado. A la
vista de las conclusiones alcanzadas en la seccin 4.3.3, la fuerte dependencia temporal
existente en el comportamiento de los usuarios para la realizacin de llamadas tambin influye
en esta probabilidad. La Figura 4-12, que representa la probabilidad Pll

veh(ti)

obtenida

empricamente, refleja tal variacin con el tiempo. Cabe destacar que esta probabilidad Pll veh(ti)
es vlida para cualquiera de las fronteras monitorizadas ya que el evento hacer llamada a bordo
de vehculo con el operador de inters es independiente de la celda en la que se haga, salvo
quiz zonas agrestes de difcil conduccin en las que la incomodidad del viaje hace poco
deseable la realizacin de una llamada. No obstante, sera interesante recalibrar dicha

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

89

probabilidad cada cierto tiempo para atender posibles modificaciones en la red viaria, como
creacin de nuevas vas cruzando una frontera, o cambios en la conducta de los usuarios al
realizar llamadas.

Pll veh (ti )

0.015

0.01

0.005

8h-9h

9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h

Intervalo horario ti
Figura 4-12: Probabilidad de hacer una llamada a bordo de vehculo.

Se aprecia que esta probabilidad de hacer una llamada a bordo de un vehculo por parte de
usuarios en movilidad sigue en gran medida los patrones de la actividad telefnica diaria
reflejados en la Figura 4-3 (cualquier usuario). El pico de maana se centra en torno al mismo
rango horario en ambos casos; mientras que el pico de la tarde est ms suavizado en el caso de
llamadas realizadas por usuarios en movilidad. Esta caracterstica puede tener su origen en que,
durante la jornada laboral, el hecho de estar en movimiento no impide que los usuarios realicen
llamadas cuando as lo requieran. Mientras que, fuera de ese horario laboral, el usuario es ms
reacio a llamar mientras est en movimiento. De ah la menor tendencia a realizar llamadas
fuera de la jornada laboral en el caso de usuarios en movimiento.
Probabilidad de handover Ph(t i, k)
Se considera a continuacin un escenario de handover simplificado (Sallent et al., 2003),
suponiendo un sistema celular regular con celdas por las cuales discurren una serie de vas. Se
modela la distancia que recorre un mvil dentro de una celda antes de cruzar la frontera de esa
celda como una variable aleatoria con distribucin uniforme en el intervalo [0, L] metros. El
tiempo de permanencia en la celda, tp, si el mvil se desplaza a velocidad uniforme de V m/s
ser tambin una variable aleatoria con distribucin uniforme en el intervalo tp [0, L/V]
segundos, de manera que su funcin de densidad de probabilidad vendr dada por:
f (t p )

1
L /V

L
t p 0,
V

(13)

Si la duracin de la llamada, td, puede modelarse como una variable aleatoria exponencial de
media Tc segundos, su correspondiente funcin de densidad de probabilidad se expresa como:

90

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

td

1
f (td ) e Tc
Tc

td 0,

(14)

La probabilidad de que dicho usuario deba efectuar un handover a lo largo de la llamada viene
dada por el hecho de que la duracin de la misma supere el tiempo de permanencia en la celda.
As, la probabilidad de handover puede calcularse a partir de un ejercicio de probabilidad
condicionada:
L
V

Ph P (td t p | t p ) f (t p ) dt p

(15)

A su vez, la probabilidad condicionada de que la duracin de la llamada sea superior al tiempo


de permanencia en la celda vale:

P (td t p | t p ) f (td )dtd e

tp
Tc

(16)

tp

Definiendo el factor de movilidad como


L
V

Ph e
0

tp
Tc

L
V

f (t p ) e

tp
Tc

L
, finalmente se tiene que:
V Tc

1
1
L
dt p 1 e con

L /V
V Tc

(17)

La Figura 4-13 representa la probabilidad de handover en funcin del factor de movilidad . De


la lectura de la ecuacin (17) se puede concluir afirmando que ser ms fcil que la llamada
deba ejecutar un handover:
1. Cuanto ms pequeas sean las distancias a recorrer (menor L).
2. Cuanto mayor sea la velocidad del mvil (mayor V).
3. Cuanto ms larga sea la duracin de las llamadas (mayor Tc).
1
0.8

Ph

0.6
0.4
0.2
0

4
5
6
7
Fac tor de movilidad =L/VT c

10

Figura 4-13: Probabilidad de handover Ph segn el el factor de movilidad .

Cabe destacar que depende de 3 parmetros: longitud L, velocidad V y duracin media de la


llamada Tc. Respecto al parmetro L, al tratarse de la distancia que debe recorrer un mvil

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

91

dentro de una celda hasta entrar en otra celda (cruzar la frontera), esta longitud depende de las
vas existentes dentro de la celda origen de la frontera. Algo similar ocurre con la velocidad, V,
donde su valor depende del tipo de va que tenga asociada (autova, carretera nacional,).
Aunque la velocidad podra oscilar para la misma va segn el intervalo horario debido, por
ejemplo, al nivel de saturacin que experimente, se considerar como uniforme dentro de la
celda origen de la frontera. Por ello, el valor de depender muy estrechamente de la frontera k
observada en trminos de longitud y velocidad asociada a la va que discurre por la celda origen
de esa frontera. De igual modo, teniendo en cuenta la dependencia temporal de la duracin de
las llamadas (apartado 4.3.3), tambin depender del intervalo horario analizado. As pues, el
valor de la probabilidad de handover ser funcin del intervalo horario y de la frontera, Ph(ti ,k,).
Para el clculo de la longitud L se podra realizar un estudio previo que utilizara informacin de
cobertura proporcionada por el operador, permitiendo definir, con ayuda de un GIS, la longitud
del tramo que debe recorrer un mvil dentro de una celda hasta entrar en otra. No obstante,
existen funcionalidades bsicas en la red que permiten conocer el identificador de la celda
(antena) a la que est conectado un telfono. De manera que, con ayuda de un GPS, es posible
establecer una correspondencia entre punto kilomtrico de una va y celda que le da servicio. En
base a esto, se puede conocer no slo la longitud del tramo que recorre un mvil dentro de una
celda, sino la velocidad media de viaje por dicho tramo en cualquier momento del da, todo ello
sin necesitar que el operador revele informacin confidencial de cobertura. Con esta sencilla
aplicacin, implementada sobre dispositivos mviles (BlackBerry, Windows Mobile,), se
recorreran varias veces los tramos de va mediante la tcnica de coche flotante, a fin de poder
caracterizar la celda origen de cada frontera k en trminos de longitud L y velocidad V.
Por ltimo, faltara estimar la duracin media de la llamada Tc para determinar completamente
el valor de y, por consiguiente, de la probabilidad de handover. Esta duracin es posible
obtenerla empricamente mediante el anlisis de los datos de llamadas proporcionados por el
operador. Considerando la dependencia temporal puesta de manifiesto en el apartado 4.3.3, se
determina un valor de duracin media de llamadas segn el intervalo horario considerado, Tc(ti).
Esa duracin dependiente del intervalo ti, junto con los valores de velocidad y longitud
correspondientes al tramo de va que discurre por la celda origen de la frontera k, permiten
definir la probabilidad de handover como una funcin variable con el tiempo y la frontera,
Ph(ti,k,). La Figura 4-14 muestra la probabilidad de handover alcanzada en la celda origen de
una frontera, centrndose en el intervalo 8:0021:00 segn lo expuesto en el apartado 4.3.4.

92

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

0.06
0.05

Ph(ti, k )

0.04
0.03
0.02
0.01
0

8h-9h

9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h
Intervalo horario ti

Figura 4-14: Evolucin de la probabilidad de handover en la celda origen de la frontera k segn el


intervalo horario ti.

Definicin del modelo


Muchos procedimientos estadsticos suponen que los datos siguen algn tipo de modelo
matemtico que se define mediante una ecuacin, en la que se desconoce alguno de sus
parmetros, siendo stos calculados o estimados a partir de la informacin obtenida en un
estudio diseado para tal fin. En este caso, se va a definir un modelo a partir del fenmeno fsico
de llamadas en movilidad empleando la expresin terica del volumen de vehculos que pasan
por una frontera k en un intervalo horario ti definida en (11). Tras sustituir las expresiones
anteriores de Pll veh (ti ) y Ph(ti ,k), esa ecuacin quedara expresada como:
nveh (ti , k )

nll mov (ti , k )


,
1
( ti , k )
2

Pll veh (ti ) Pll veh (ti )


1 e

(ti , k )

siendo (ti , k )

Lk
Vk Tc (ti )

(18)

Como ya se coment, la expresin (18) es obtenida asumiendo una serie de hiptesis y


considerando despreciables sucesos tales como que se llame en cada celda efectuando
adicionalmente el proceso de handover, o, incluso, obviando ciertas situaciones en movilidad no
detectadas, como llamadas que terminan antes de que el vehculo abandone la celda (no
handover) y, al no realizarse una llamada en la nueva celda, no es detectado. Estos sucesos
inducen prdidas deben ser consideradas en la definicin del modelo. En este sentido, se
introducen una serie de parmetros en la expresin (18) para corregir las indeterminaciones
introducidas con las hiptesis necesarias para generar el modelo, quedando formulado como:
y(ti , k )

a x(ti , k )
Lk
d , con (ti , k )
b
Vk Tc (ti )
1
1 e b2 ( ti ,k ) c
Pll2veh (ti ) Pll veh (ti )
(ti , k )

(19)

En ese modelo, las variables x e y se corresponden, respectivamente, con el nmero de llamadas


en movilidad realizadas entre dos celdas, nll mov(ti, k), y el nmero de vehculos que traspasan

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

93

una frontera entre esas celdas, nveh(ti, k). La naturaleza de los trminos y variables implicadas en
el modelo condiciona que la variable de salida sea funcin del tiempo y el espacio.
Para estimar los parmetros {a,b1,b2,c,d} del modelo existen diferentes procedimientos de
ajuste, los cuales utilizaran la parte del histrico que relaciona ambas variables denominada
conjunto de entrenamiento para fijar los parmetros. En este caso, se va a emplear una tcnica
de ajuste de parmetros tratando de satisfacer algn criterio de ajuste. El criterio empleado
atiende al error relativo, a la vista de que no posee la misma importancia que una estimacin
exceda en 50 sobre un valor real de 100 que sobre uno de 1000, siendo ms grave la primera
situacin que la ltima. As mismo, dado que en este caso tiene la misma importancia errar por
exceso o por defecto, el valor absoluto tambin debe ser considerado en el criterio. As pues, el
ajuste buscar la minimizacin de la suma del valor absoluto del error relativo entre valores
observados y modelados, resolviendo el siguiente problema de optimizacin:
Minimizar
a ,b1 ,b2 , c , d

y j y j

j 1

yj

, siendo y j los valores observados e y j los valores modelados

La resolucin de este problema se ha implementado sobre Matlab, resultando los siguientes


valores de los parmetros: {a,b1,b2,c,d}{2.96417, -43.40174, -0.167134, -0.01205, 707.4249}.
4.3.5.3

Modelos adicionales

El objetivo final de esta investigacin es correlacionar el volumen de vehculos (Y) en una


determinada seccin del viario con el nmero de llamadas en movilidad (X) generadas en la
frontera asociada entre celdas. El anterior modelo estimaba unos valores para ese volumen de
vehculos a partir del nmero de llamadas en movilidad observado pero, adicionalmente,
introduca una dependencia temporal y espacial que haca que las predicciones variaran segn el
periodo horario y la frontera en cuestin. Este hecho implica realizar un estudio previo para
caracterizar la frontera en trminos de longitud y velocidad de las vas existentes en la celda
origen correspondiente. En general, lo ideal sera emplear modelos que slo tuvieran
dependencia con una variable, en este caso, llamadas en movilidad, pero las conclusiones
extradas de las cpulas revelan la imposibilidad de emplear ese tipo de modelos. Eliminar la
dependencia espacial evita realizar el estudio para conocer las caractersticas geomtricas de
cada frontera monitorizada; en cambio, a la vista del anlisis descriptivo de datos de llamadas,
mantener en la formulacin de los modelos la dependencia temporal parece lo ms apropiado.
La dependencia asociada al periodo horario en cuestin es importante puesto que las dos
variables implicadas en el proceso, llamadas realizadas y vehculos circulando, varan en

94

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

funcin del tiempo de una forma diferenciada. Ya se coment anteriormente que los usuarios
poseen diferentes hbitos en la realizacin de llamadas segn la hora considerada debido a
criterios como tarifas u horario admisible de realizacin de llamada. Mientras que, en relacin
con el flujo de vehculos, ste flucta con el tiempo atendiendo a criterios diferentes, como hora
punta por inicio de jornada laboral, hora valle, etc.
50

800

Vehculos

Llamadas

40
30
20

400
200

10
0

600

0 1 2 3 4 5 6 7 8 9 1011121314151617181920212223

Intervalo horario ti

0 1 2 3 4 5 6 7 8 9 1011 1213 14 1516171819 20 2122 23

Intervalo horario ti

Figura 4-15: Evolucin del n de llamadas y de vehculos en una frontera segn el intervalo horario.

La Figura 4-15 muestra la variacin temporal de la intensidad del nmero de llamadas


realizadas y del nmero de vehculos que pasan por una frontera determinada en un da
concreto. Se observa que en ambos casos los periodos horarios de mayor intensidad estn
prximos en el tiempo pero con cierto desfase; mientras que el pico de vehculos aparece en
torno las 7:00 (inicio jornada laboral), a esa hora el nmero de llamadas es bajo ya que es poco
usual realizar llamadas en ese intervalo horario. Este comportamiento es extensible a otras
fronteras. En este sentido, las predicciones deben incluir algn trmino asociado a esa
variabilidad horaria tanto de la intensidad de llamadas como de la intensidad de vehculos. Los
modelos que a continuacin se presentan introducen unos factores asociados al tiempo, que
modelan la dependencia temporal de esas intensidades. El clculo de esos factores de intensidad
se realizar de modo que sean independientes de las caractersticas de la frontera, eliminando la
dependencia espacial y dando lugar a modelos ms verstiles.
Factor de intensidad de vehculos
El factor de intensidad, fv, asociado a la variacin horaria del flujo de vehculos, se define como:

nveh (ti )
, con
f v (ti )
nveh

nveh (ti ) es el n medio de vehculos que pasan en el intervalo ti de cada uno de los
D K
1
nveh (ti , d , k )
D K d 1 k 1
es el n medio de vehculos que han pasado desde las 8h hasta las 21h,

D das observados por las K fronteras, tal que nveh (ti )


nveh

tal que nveh

1 21h
nveh (ti ), siendo H el n de intervalos horarios entre 8h-21h
H i 8 h

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

95

El factor de intensidad es, por tanto, la relacin entre el nmero medio de vehculos contados en
un periodo horario ti y el nmero medio del total de vehculos contados desde las 8:00 hasta las
21:00. As pues, este factor se encarga de regular las observaciones en cada periodo horario
segn su importancia relativa dentro de los periodos horarios considerados. Por ejemplo, en
intervalos horarios donde el flujo de trfico tiende a ser mayor debido a hora punta, el factor de
intensidad fv har que las observaciones destaquen sobre las de otros intervalos. La Figura 4-16

Factor intensidad de vehculos fv( t i )

muestra la variacin con el tiempo del factor de intensidad fv(ti).


1.4
1.2
1
0.8
0.6
0.4
0.2
0

8h-9h 9h-10h 10h-11h11h-12h 12h-13h 13h-14h 14h-15h15h-16h 16h-17h 17h-18h18h-19h 19h-20h 20h-21h

Intervalo horario t i

Figura 4-16: Factor de intensidad del paso de vehculos segn el intervalo horario ti.

Factor de intensidad de llamadas


Anlogamente, el factor de intensidad de llamadas, gll, se encarga de reflejar la variacin
temporal del nmero de llamadas realizadas. Este factor gll se define como la relacin entre la
probabilidad de que un vehculo realice una llamada con el operador de inters en el intervalo
horario ti, definida en (12), y la probabilidad media en todo el rango horario estudiado,
atendiendo a la siguiente expresin:

gll (ti )

Pll veh (ti )


Pll veh

Pll veh (ti ), es la probabilidad de hacer una llamada con el operador de inters

a bordo de vehculo en el intervalo horario ti ,definida en (12)


, donde
21h
P 1 P (t ), siendo H el n de intervalos horarios entre 8h-21h

ll
veh
ll veh i

H i 8 h

Con ello, se busca regular las observaciones de llamadas realizadas en funcin de su


importancia dentro de los intervalos horarios considerados. La Figura 4-17 refleja la variacin
con el tiempo del factor de intensidad gll (ti), mostrando que en periodos horarios donde es ms
probable hacer llamadas, este factor de intensidad realzar las observaciones.

96

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

Cabe destacar que ambos factores de intensidad fv (ti) y gll (ti), obtenidos empricamente con
datos observados, se pueden considerar vlidos durante un cierto tiempo (p.ej: 5 meses), debido
a que las caractersticas de la muestra son ms o menos estables. No obstante, sera aconsejable
realizar un calibrado de ambos factores peridicamente, a fin de actualizarlos con posibles

Factor intensidad de llamadas gll ( t i )

cambios de tendencia asociados a los usuarios de la va.


1.8
1.6
1.4
1.2
1
0.8
0.6
0.4
0.2
0

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h

Intervalo horario t i
Figura 4-17: Factor de intensidad del paso de vehculos segn el intervalo horario ti.

Definicin del modelo


Los anteriores factores de intensidad fv (ti) y gll (ti) constituyen la base principal en la definicin
de los nuevos modelos para proporcionar una prediccin del nmero de vehculos que
atraviesan una frontera k en funcin del nmero de llamadas en movilidad observadas nll mov(ti,
k). Es importante resaltar que, a pesar de que esas llamadas en movilidad observadas estn
asociadas a un punto kilomtrico o frontera k, la forma funcional de los modelos no tiene en
cuenta esta dependencia y tratar las observaciones de cada frontera del mismo modo.
As pues, se proponen varios modelos, con diferente nmero de parmetros, para encontrar la
forma funcional que mejor se ajuste al fenmeno. En todos ellos, la variable dependiente es
y(ti,), el nmero de vehculos que cruzan una frontera en un intervalo horario ti.
Modelo 1: y1 (ti ) a f v (ti ) gll (ti )
Modelo 2: y 2 (ti ) (a b x(ti )) f v (ti ) gll (ti ), donde x(ti ) nll mov (ti , k )
Modelo 3: y3 (ti ) (a b x(ti ) c x 2 (ti )) f v (ti ) gll (ti ), donde x(ti ) nll mov (ti , k )
El modelo 1, con 3 parmetros {a, , }, carece de informacin sobre el nmero de llamadas en
movilidad observadas. Se ha propuesto para estudiar la importancia del uso de las llamadas en
movilidad en la prediccin del volumen de paso de vehculos. El modelo 2, con 4 parmetros

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

97

{a, b, , }, establece una dependencia de primer orden con el nmero de llamadas en


movilidad observadas. Por ltimo, el modelo 3, con 5 parmetros {a, b, c, , }, es similar al
modelo 2 pero estableciendo una dependencia de segundo orden con el nmero de llamadas en
movilidad observadas.
As mismo, para estudiar la importancia del uso de los factores de intensidad fv (ti) y gll (ti) en la
formulacin del modelo, se plantean dos modelos adicionales en los cuales y son fijados a
cero, definiendo dos sencillos modelos que nicamente emplean las llamadas en movilidad
observadas. stos son los siguientes:
Modelo 4: y 4 (ti ) a b x(ti ), donde x(ti ) nll mov (ti , k ) , 2 parmetros {a,b}.
Modelo 5: y5 (ti ) a b x(ti ) c x 2 (ti ), donde x(ti ) nll mov (ti , k ) , 3 parmetros {a,b,c}
Para la estimacin de los parmetros de cada uno de estos cinco modelos, se emplea el mismo
procedimiento presentado en el apartado 4.3.5.2 donde, utilizando el conjunto de entrenamiento
definido a partir del histrico de datos observados, los parmetros son ajustados buscando la
minimizacin de la suma del valor absoluto del error relativo entre valores observados y
modelados:
Minimizar
parmetros

y j y j

j 1

yj

, siendo y j los valores observados e y j los valores modelados

La resolucin de este problema para cada uno de los modelos, implementada sobre Matlab, ha
permitido inferir los parmetros que caracterizan los modelos de prediccin. Estos cinco
modelos, junto al definido en (19), enumerado como modelo 6 y 6 f ( x, ti , k ) , sern
evaluados y comparados entre s para seleccionar el que proporcione mejores predicciones del
nmero de vehculos que atraviesan una frontera asociado a llamadas en movilidad en ella.

4.3.6 Contraste de modelos


4.3.6.1

Introduccin

Para abordar la evaluacin y comparacin entre los seis modelos anteriormente planteados se ha
utilizado el conjunto de validacin, formado por una parte del histrico de valores observados
reservada para este fin. Dada la variedad de los modelos, esta comparacin se ha realizado en
base a criterios tales como las medidas de error clsicas (error medio, error absoluto y relativo,
etc.) o la evaluacin de la distribucin acumulada del error relativo absoluto en trminos de
percentiles. Incluso, se han empleado otros criterios ms minuciosos, como la correlacin por

98

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

rango (o de Spearman) y el coeficiente de correlacin lineal (o de Pearson), para comparar, uno


a uno, los valores yi estimados por cada modelo frente a los observados yi. Adicionalmente, se
han estudiado otras medidas de contraste de modelos en las que tambin se tiene en cuenta la
eficiencia y simplicidad de los modelos en trminos del nmero de parmetros. Las ms
extendidas son el criterio de informacin de Akaike, AIC, y criterio de informacin bayesiano,
BIC. Por ltimo, lgicamente, se han comparado los modelos grficamente, representando en la
misma figura los valores observados y las predicciones hechas por cada modelo en cada una de
las fronteras. Los modelos ms adecuados han sido los que presentan mejor balance entre todos
los criterios considerados.
4.3.6.2

Medidas de error

Cuando se utilizan modelos de prediccin, es inevitable que el resultado est afectado por
errores debidos a los propios modelos, puesto que stos siempre llevan implcita alguna
indeterminacin. Dado que se dispone de un histrico de valores observados yi con los que
comparar las predicciones yi hechas por cada uno de los modelos, es posible efectuar un
anlisis directo de las medidas de error. Los estadsticos ms comunes a la hora de cuantificar el
error son el error medio, el error absoluto medio y el error relativo medio. A la vista de que
presenta la misma gravedad errar en una prediccin tanto en exceso como por defecto, el error
relativo se ha estudiado en valor absoluto. La Tabla 4-4 muestra esas medidas de error para cada
uno de los modelos empleando los valores observados y las predicciones. Tambin se han
incluido otras medidas relacionadas con los valores mximos del error absoluto y del error
relativo en valor absoluto que se han encontrado entre los pares de datos.
Tabla 4-4: Medidas de error para cada modelo.

ME
MAE
MARE
Error
absoluto
mximo
Error relativo
absoluto
mximo

Modelo 1
118.5430
237.2021
0.2318

Modelo 2
103.8163
210.6609
0.2039

1488.0287

1399.7732 1406.7949 1562.8313 1552.9211 1449.5156

0.9761

0.8302

Modelo 3
106.6021
210.0152
0.2032

0.8529

Modelo 4
112.8573
223.9775
0.2169

1.0103

Modelo 5
113.5008
223.2356
0.2157

1.0723

Modelo 6
95.1117
203.5965
0.2000

0.9985

(ME: error medio; MAE: Error absoluto medio; MARE: Error relativo medio en valor absoluto)

En base a estas medidas, los mejores modelos son el 6, 2 y 3. Conviene destacar que no es
posible establecer un orden claro de prioridad entre esos tres modelos dado que sus medidas de

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

99

error son muy similares entre ellas. Las Figura 4-18 y Figura 4-19 muestran, respectivamente, el
error relativo medio en valor absoluto y el error absoluto medio para cada modelo atendiendo al
periodo horario, aprecindose que los modelos 2, 3 y 6 son los que presentan mejor

Error relativo en valor absoluto [%]

comportamiento.
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0

8h-9h

9h-10h

10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h

Intervalo horario t i
y1 =afvgll

y2 =(a+bx)fvgll

y3 =(a+bx+cx2 )fvgll

y4 =(a+bx)

y5 =(a+bx+cx2 )

y6 = f (x,ti,k))

Figura 4-18: Evolucin horaria del error relativo en valor absoluto para cada uno de los modelos.

400

Error absoluto [veh]

350
300
250
200
150
100
50
0

8h-9h

9h-10h

10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h

Intervalo horario t i
y1 =afvgll

y2 =(a+bx)fvgll

y3 =(a+bx+cx2 )fvgll

y4 =(a+bx)

y5 =(a+bx+cx2 )

y6 = f (x,ti,k))

Figura 4-19: Evolucin horaria del error absoluto para cada uno de los modelos.

4.3.6.3

Distribucin acumulada de error relativo en valor absoluto. Percentiles

Los percentiles pertenecen al grupo de estadsticos asociados a medidas de posicin. Se emplean


para proporcionar informacin sobre el conjunto de datos que se est analizando, indicando qu
valores de la variable se presentan en la realidad con una frecuencia por debajo de un

100

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

porcentaje. Analizando la distribucin de frecuencias del error relativo en valor absoluto para
cada uno de los modelos, los percentiles alcanzados se muestran en la siguiente tabla:
Tabla 4-5: Percentiles del error relativo en valor absoluto para cada modelo.

Percentiles
25
30
50
60
75
85
100

Modelo 1 Modelo 2 Modelo 3 Modelo 4 Modelo 5 Modelo 6


0,0799
0,0769
0,0763
0,0777
0,0799
0,0772
0,0982
0,0933
0,0933
0,096
0,0967
0,0938
0,2039
0,1694
0,1694
0,1763
0,1783
0,1646
0,26
0,2141
0,2121
0,2286
0,2246
0,212
0,3596
0,3076
0,3034
0,3351
0,3311
0,2986
0,4298
0,379
0,3791
0,4117
0,4113
0,3703
0,9765
0,83
0,8492
1,0723
1,0103
0,9985

Los mejores modelos sern aquellos que posean valores ms pequeos de error relativo en valor
absoluto para cada uno de los percentiles. Numricamente, se observa que los modelos 6, 3 y 2
destacan en estos trminos respecto a los dems. En ellos, por ejemplo, el percentil 60 refleja
que el 60% de las predicciones alcanzaron errores relativos en valor absoluto inferiores a 0.21.
Esto tambin se aprecia ms claramente a nivel grfico. En este sentido, la Figura 4-20 muestra
la distribucin acumulada del error relativo en valor absoluto conseguido por cada modelo. El
eje vertical est graduado en percentiles, por ello la mediana se alcanza en el percentil 50. Se
observa que los mejores modelos son, por orden de preferencia, el modelo 6, el 3 y el 2, dado
que la curva para el resto de modelos es visiblemente inferior a la de esos tres modelos.

Percentiles

100

75

50

25
0

10

20

30

80

50

60

70

80

90

100

110

120

era = error relativo absoluto [%]


90

Percentiles

85
80
75
70
65
60
15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

era = error relativo absoluto [%]


y1 =afvgll

y2 =(a+bx)fvgll

y3 =(a+bx+cx2 )fvgll

y4 =(a+bx)

y5 =(a+bx+cx2 )

y6 = f (x,ti,k))

Figura 4-20: Distribucin acumulada del valor absoluto del error relativo en porcentajes (arriba).
Zoom en torno a los valores de error relativo absoluto 15-30% (abajo).

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

4.3.6.4

101

Correlacin por rango (de Spearman) y correlacin lineal (de Pearson)

Otro criterio a tener en cuenta dentro de la comparativa de modelos es la correlacin entre las
predicciones y los valores reales. Se considera que dos variables estn correlacionadas cuando
los valores de una de ellas varan sistemticamente con respecto a los valores de la otra. En este
sentido, si tenemos dos variables (A y B) existe correlacin si al aumentar los valores de A lo
hacen tambin los de B y viceversa. Aplicando esto al conjunto de valores observados {yi} y
estimados { yi }, se puede evaluar la calidad de las predicciones examinando si existe
correlacin. El coeficiente de correlacin lineal, o coeficiente de Pearson, es el instrumento
tradicionalmente utilizado para medir la dependencia entre variables aleatorias. Si r = 0, no
existe relacin lineal. Pero esto no implica necesariamente una independencia total entre las dos
variables. Puede ocurrir que, an con r prximo a 0, la variacin de una de ellas influya en el
valor que pueda tomar la otra caso que existan relaciones no lineales entre las dos variables.
Estas limitaciones no existen si se utiliza la correlacin entre rangos, la cual considera la
concordancia de los datos. El concepto de concordancia est relacionado con la probabilidad de
encontrar valores altos (o bajos) de una variable asociados a valores altos (o bajos) de la otra
variable. Si esto no ocurre, las variables son discordantes. De modo que la concordancia detecta
relaciones no lineales que la correlacin no puede detectar. En consecuencia, las medidas de
correlacin que trabajan con rangos no presentan las limitaciones de la correlacin lineal.
Dentro de estas medidas destaca el denominado coeficiente de correlacin de Spearman.
Se procede a analizar la calidad de las predicciones yi de cada modelo analizando la
dependencia en trminos de correlacin por rango de Spearman y correlacin lineal o de
Pearson. La siguiente tabla muestra estas correlaciones para cada uno de los modelos.
Tabla 4-6: Correlacin por rango (Spearman) y lineal (Pearson) entre { yi , yi } para cada modelo.

Correlacin
por rango
Correlacin
lineal

Modelo 1

Modelo 2

Modelo 3

Modelo 4

Modelo 5

Modelo 6

0.25102

0.51398

0.51375

0.39904

0.39904

0.56623

0.28436

0.4698

0.48134

0.33953

0.34893

0.53333

En trminos de correlacin por rango, destacan claramente sobre los dems los modelos 6, 2 y
3; especialmente el modelo 6, alcanzando valores elevados para el tamao de la muestra
considerada. Respecto al coeficiente de correlacin lineal, ocurre algo similar. Por ello, se
establece que los mejores modelos bajo este enfoque de correlacin son el modelo 6, seguido de
los modelos 2 y 3.

102

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

4.3.6.5

Criterio de informacin de Akaike y criterio de informacin bayesiano: AIC BIC

El modelo perfecto no existe, puesto que todos constituyen simplificaciones de la realidad a


travs de una serie de parmetros. Siempre son preferibles modelos con menos parmetros
debido a que, adems de ser ms sencillos de estimar, son ms estables y estn sometidos a
menos sesgo. Por ello existen unas medidas de contraste entre modelos que penalizan en cierto
modo que stos tengan muchos parmetros.
Las ms conocidas son el criterio de informacin de Akaike, AIC, y criterio de informacin
bayesiano, BIC. Ambos estadsticos se utilizan en la seleccin de modelos para tomar el mejor
de entre un conjunto de varios admisibles. As pues, un modelo es mejor que otro si tiene un
valor AIC (o BIC) menor. Las frmulas matemticas del AIC y BIC se enuncian a continuacin:
AIC 2 LLF 2 P
BIC 2 LLF P ln( N )

(20)

En ellas intervienen el logaritmo de la funcin verosimilitud de cada modelo (LLF), el nmero


de parmetros ajustados (P) y el nmero total de observaciones o tamao de la muestra (N). En
el clculo de la funcin de verosimilitud interviene un producto de probabilidades de
observaciones individuales, por lo que habitualmente interesa tomar logaritmos, ya que stos
transforman los productos en sumas y los cocientes en restas. De ah que el clculo de AIC y
BIC emplee el logaritmo de la funcin de verosimilitud.
La funcin de verosimilitud es un indicador para sealar la capacidad de ajuste de un modelo,
permitiendo con ello su empleo en la comparacin de modelos. Su valor ser mayor cuanto
mejor sea el ajuste, mientras que tendr un valor ms cercano a 0 cuando el ajuste sea malo. Por
ello, junto a los estadsticos AIC y BIC de cada uno de los modelos, tambin se emplea el
logaritmo de la funcin verosimilitud (LLF) para el contraste de modelos. El clculo de estos
tres indicadores se realiza sobre un conjunto de datos que, en este caso, se tratar de medidas del
error relativo entre valores reales y predicciones, yi e yi respectivamente, para cada modelo,
eri

yi yi
.
yi

Para determinar el LLF se precisa conocer la funcin de verosimilitud del conjunto de medidas
del error relativo, en la cual interviene la funcin de densidad de probabilidad seguida. La
construccin de esta funcin se simplifica, en gran medida, si se asume que la distribucin del
conjunto de datos es normal. Sin embargo, realizando un test de normalidad, se demuestra que
los datos analizados, en este caso errores relativos entre los valores observados y estimados por

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

103

cada uno de los modelos, no siguen una distribucin normal. Esta afirmacin se puede
comprobar grficamente mediante el test grfico de normalidad mostrado en la Figura 4-21. En
ella se representa la probabilidad acumulada emprica de cada conjunto de datos. Si los puntos
se ajustasen muy bien a la lnea recta sera seal de que se acepta la bondad de ajuste y los datos
provienen de una distribucin normal. Otras funciones de densidad de probabilidad
introduciran curvatura en el grfico, siendo esto lo que ocurre para las medidas consideradas de
error relativo.

Figura 4-21: Test grfico de normalidad.

En consecuencia, la hiptesis de distribucin normal no es vlida, de manera que se precisa otro


procedimiento para determinar la funcin de verosimilitud de cada conjunto de errores relativos
de los modelos. La conveniencia del uso de histogramas como estimadores no-paramtricos de
la funcin de densidad de una variable sugiere que un modo de lograrlo consiste en discretizar la
variable aleatoria continua, asociada a cada conjunto de datos, empleando un nmero apropiado
de bins. As pues, las funciones de densidad de probabilidad empleadas estarn basadas en
histogramas cuyo nmero de bins ser fijado por algn criterio. En particular, se han usado el
criterio de Knuth y el criterio de Stone para determinar dicho nmero de bins de un modo
ptimo (Knuth, 2006). Aplicando este procedimiento al conjunto de medidas de error relativo de
cada modelo, se obtienen los siguientes histogramas (Figura 4-22 y Figura 4-23), representando
la distribucin estadstica experimental (histograma) de los errores relativos de cada modelo
junto con una curva de densidad normal superpuesta sobre cada histograma. Se observa que la
discretizacin alcanzada con el nmero de bins definido por Knuth es ms armoniosa que la
resultante de Stone. Es decir, en el histograma generado con el nmero de bins definido por
Stone (Figura 4-23), la altura de las barras no sigue una tendencia estable de subida o bajada,
sino que se aprecia una oscilacin en la altura de las barras. En cambio, en el histograma

104

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

generado por Knuth (Figura 4-22), la altura de las barras mantiene la tendencia de subida o
bajada respecto del mximo. Por ello, se toma el criterio de Knuth para la discretizacin del
error relativo y la obtencin de las funciones de densidad de probabilidad que permitan calcular
la verosimilitud junto a los estadsticos AIC y BIC.
y1 =afvgll

y3 =(a+bx+cx2 )fvgll

y2 =(a+bx)fvgll

600

600

600

400

400

400

200

200

200

0
-1

0
-1

nbins ptimo 20

nbins ptimo 14

y4 =(a+bx)

y5 =(a+bx+cx2 )

0
-1

600

600

400

400

400

200

200

200

-1

0
-2

nbins ptimo 20

-1

y6 = f (x,ti,k))

600

0
-2

nbins ptimo 14

0
-1

nbins ptimo 14

nbins ptimo 21

Figura 4-22: Histograma del error relativo de cada modelo segn el n de bins definido por Knuth.
y1 =afvgll

y3 =(a+bx+cx2 )fvgll

y2 =(a+bx)fvgll

150

150

100

100

400
300
200

50

50

0
-1

100

0
-1

nbins ptimo 65

nbins ptimo 63

y4 =(a+bx)

y5 =(a+bx+cx2 )

0
-1

200

200

300

150

150

200

100

100

100

50

50

-1

nbins ptimo 29

0
-2

-1

nbins ptimo 49

y6 = f (x,ti,k))

400

0
-2

nbins ptimo 28

0
-1

nbins ptimo 67

Figura 4-23: Histograma del error relativo de cada modelo segn el n de bins definido por Stone.

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

105

As, tras realizar el proceso y obtener, posteriormente, los estadsticos AIC y BIC, se obtienen
los valores mostrados en la Tabla 4-7.
Tabla 4-7: Valores de Logaritmo de la verosimilitud (LLF), AIC y BIC del conjunto de errores
relativos de cada modelo, junto al nmero de parmetros de cada modelo.

Modelo 1
Modelo 2
Modelo 3
Modelo 4
Modelo 5
Modelo 6

LLF
-7345
-6423
-6356
-7082
-6175
-7113

AIC
14697
12854
12721
14167
12357
14237

BIC
14714
12877
12751
14179
12375
14267

N param
3
4
5
2
3
5

Dado que los mejores modelos son los que conseguen el mayor valor de LLF, y menor valor de
AIC y BIC, el ranking de modelos segn cada criterio es:
Ranking de mejor modelo por Log-Likelihood:

532461

Ranking de mejor modelo por AIC:

532461

Ranking de mejor modelo por BIC:

532461

Es necesario comentar que estos criterios de seleccin de modelo tambin consideran el nmero
de parmetros existente, penalizando aquellos que tengan muchos parmetros. De ah que, en el
orden de prioridad anterior, los modelos 5 y 4 destaquen en la seleccin de modelos. Estos
modelos 4 y 5, junto al modelo 1, son los que menos parmetros poseen. Sin embargo,
atendiendo a los criterios estudiados en los anteriores apartados (medidas directas de error,
percentiles y correlacin por rango y lineal), parece conveniente que los modelos 1, 4 y 5 sean
descartados del conjunto de modelos admisibles. En consecuencia, la seleccin de modelos se
establecera entre los modelos 2, 3 y 6, siendo el nuevo orden de prioridad:
Ranking de mejor modelo por Log-Likelihood:

326

Ranking de mejor modelo por AIC:

326

Ranking de mejor modelo por BIC:

326

4.3.6.6

Anlisis grfico

Por ltimo, la comparacin de modelos se realizar grficamente utilizando el conjunto de


validacin. Para ello, se representan las predicciones de vehculos hechas por cada uno de los
modelos para cada frontera segn el nmero medio de llamadas en movilidad observadas en
cada periodo horario. Junto a ellas, tambin se representan los valores medios de vehculos
observados en cada periodo horario y frontera, estableciendo una comparacin visual de la
precisin alcanzada por cada modelo as como el orden de magnitud del error de prediccin.

106

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

ID Frontera 1
1400

[veh]

1200

1000

800

600
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

16h-17h

17h-18h

18h-19h

19h-20h

20h-21h

Intervalo horario t i
ID Frontera 2
1600

[veh]

1400

1200

1000

800

600
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

16h-17h

17h-18h

18h-19h

19h-20h

20h-21h

Intervalo horario t i
y1 =afvgll

y reales

y2 =(a+bx)fvgll

y3 =(a+bx+cx2 )fvgll

y4 =(a+bx)

y5 =(a+bx+cx2 )

y6 = f (x,ti,k))

Figura 4-24: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 1 y la frontera 2.

ID Frontera 3
1000

[veh]

900
800
700
600
500
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

16h-17h

17h-18h

18h-19h

19h-20h

20h-21h

16h-17h

17h-18h

18h-19h

19h-20h

20h-21h

Intervalo horario t i
ID Frontera 4
2500

[veh]

2000

1500

1000

500
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

Intervalo horario t i
y reales

y1 =afvgll

y2 =(a+bx)fvgll

y3 =(a+bx+cx2 )fvgll

y4 =(a+bx)

y5 =(a+bx+cx2 )

y6 = f (x,ti,k))

Figura 4-25: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 3 y la frontera 4.

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

107

ID Frontera 5
1100

[veh]

1000
900
800
700
600
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

16h-17h

17h-18h

18h-19h

19h-20h

20h-21h

Intervalo horario t i
ID Frontera 6
1200
1100

[veh]

1000
900
800
700
600
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

16h-17h

17h-18h

18h-19h

19h-20h

20h-21h

Intervalo horario t i
y1 =afvgll

y reales

y2 =(a+bx)fvgll

y3 =(a+bx+cx2 )fvgll

y4 =(a+bx)

y5 =(a+bx+cx2 )

y6 = f (x,ti,k))

Figura 4-26: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 5 y la frontera 6 en cada periodo horario.

ID Frontera 7
1600

[veh]

1400
1200
1000
800
600
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

16h-17h

17h-18h

18h-19h

19h-20h

20h-21h

Intervalo horario t i
ID Frontera 8
1200
1100

[veh]

1000
900
800
700
600
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

16h-17h

17h-18h

18h-19h

19h-20h

20h-21h

Intervalo horario t i
y reales

y1 =afvgll

y2 =(a+bx)fvgll

y3 =(a+bx+cx2 )fvgll

y4 =(a+bx)

y5 =(a+bx+cx2 )

y6 = f (x,ti,k))

Figura 4-27: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 7 y la frontera 8 en cada periodo horario.

108

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

ID Frontera 9
1000
950

[veh]

900
850
800
750
700
650
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

16h-17h

17h-18h

18h-19h

19h-20h

20h-21h

Intervalo horario t i
ID Frontera 10
1100

[veh]

1000

900
800

700

600
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

16h-17h

17h-18h

18h-19h

19h-20h

20h-21h

Intervalo horario t i
y1 =afvgll

y reales

y2 =(a+bx)fvgll

y3 =(a+bx+cx2 )fvgll

y4 =(a+bx)

y5 =(a+bx+cx2 )

y6 = f (x,ti,k))

Figura 4-28: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 9 y la frontera 10 en cada periodo horario.

ID Frontera 11
1000
900

[veh]

800
700
600
500
400
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

16h-17h

17h-18h

16h-17h

17h-18h

18h-19h

19h-20h

20h-21h

Intervalo horario t i
ID Frontera 12
2500

[veh]

2000

1500

1000

500
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

18h-19h

19h-20h

20h-21h

Intervalo horario t i
y reales

y1 =afvgll

y2 =(a+bx)fvgll

y3 =(a+bx+cx2 )fvgll

y4 =(a+bx)

y5 =(a+bx+cx2 )

y6 = f (x,ti,k))

Figura 4-29: Volmenes de vehculos observados y estimados con cada modelo que cruzan la
frontera 11 y la frontera 12 en cada periodo horario.

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

109

Grficamente, se aprecia que los modelos 2 y 3 consiguen valores muy similares de


estimaciones de volmenes de vehculos dado un nmero de llamadas en movilidad. Esto tiene
su origen en la forma funcional de los modelos, dado que ambas se diferencian nicamente en el
trmino cuadrtico que multiplica al nmero de llamadas en movilidad (cx2). El orden de
magnitud de ese parmetro c no introduce un cambio significativo en la prediccin, mientras
que el resto de parmetros se mantienen del mismo orden en ambos modelos. En consecuencia,
las diferencias entre las predicciones de ambos modelos apenas son apreciables en la escala
grfica utilizada, no ocurriendo lo mismo atendiendo a otros criterios como error absoluto, error
relativo o correlacin, entre otros, como ya se demostr con anterioridad. Algo similar ocurre
con las predicciones de los modelos 4 y 5. Por ello, resulta complejo establecer una clasificacin
clara atendiendo a un anlisis visual. No obstante, centrndose en los modelos seleccionados
segn los criterios desarrollados en los apartados anteriores, modelo 2, 3 y 6, se observa que sus
predicciones son las que mejor seguimiento realizan de los picos y valles de los valores
observados de volmenes de vehculos. Este hecho encaja con las conclusiones alcanzadas
anteriormente en trminos de error, percentiles y correlacin. Por ello, parece lgico pensar que
esos tres modelos modelo 2, 3 y 6 son los ms adecuados para la prediccin de volmenes
de vehculos a partir de un nmero de llamadas en movilidad realizadas en un periodo de
tiempo. Las siguientes figuras se centran en las predicciones de volmenes de vehculos hechas
por esos tres modelos y los valores reales observados por estaciones de aforo.
ID Frontera 1
1400

[veh]

1200

1000

800

600
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

16h-17h

17h-18h

18h-19h

19h-20h

20h-21h

16h-17h

17h-18h

18h-19h

19h-20h

20h-21h

Intervalo horario t i
ID Frontera 2
1600

[veh]

1400

1200

1000

800
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

Intervalo horario t i

y reales

y2 =(a+bx)fvgll

y3 =(a+bx+cx2 )fvgll

y6 = f (x,ti,k))

Figura 4-30: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan la
frontera 1 y la frontera 2.

110

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

ID Frontera 3
1000

[veh]

900
800
700
600
500
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

16h-17h

17h-18h

18h-19h

19h-20h

20h-21h

16h-17h

17h-18h

18h-19h

19h-20h

20h-21h

Intervalo horario t i
ID Frontera 4
2500

[veh]

2000

1500

1000

500
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

Intervalo horario t i

y reales

y2 =(a+bx)fvgll

y3 =(a+bx+cx2 )fvgll

y6 = f (x,ti,k))

Figura 4-31: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan la
frontera 3 y la frontera 4.
ID Frontera 5
1100

[veh]

1000
900
800
700
600
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

16h-17h

17h-18h

18h-19h

19h-20h

16h-17h

17h-18h

18h-19h

19h-20h

20h-21h

Intervalo horario t i
ID Frontera 6
1200
1100

[veh]

1000
900
800
700
600
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

20h-21h

Intervalo horario t i

y reales

y2 =(a+bx)fvgll

y3 =(a+bx+cx2 )fvgll

y6 = f (x,ti,k))

Figura 4-32: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan la
frontera 5 y la frontera 6 en cada periodo horario.

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

111

ID Frontera 7
1600

[veh]

1400
1200
1000
800
600
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

16h-17h

17h-18h

18h-19h

19h-20h

20h-21h

Intervalo horario t i
ID Frontera 8
1200
1100

[veh]

1000
900
800
700
600
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

16h-17h

17h-18h

18h-19h

19h-20h

20h-21h

Intervalo horario t i

y reales

y2 =(a+bx)fvgll

y3 =(a+bx+cx2 )fvgll

y6 = f (x,ti,k))

Figura 4-33: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan la
frontera 7 y la frontera 8 en cada periodo horario.
ID Frontera 9
1000
950

[veh]

900
850
800
750
700
650
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

16h-17h

17h-18h

18h-19h

19h-20h

20h-21h

16h-17h

17h-18h

18h-19h

19h-20h

20h-21h

Intervalo horario t i
ID Frontera 10
1050
1000

[veh]

950
900
850
800
750
700
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

Intervalo horario t i

y reales

y2 =(a+bx)fvgll

y3 =(a+bx+cx2 )fvgll

y6 = f (x,ti,k))

Figura 4-34: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan la
frontera 9 y la frontera 10 en cada periodo horario.

112

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

ID Frontera 11
900

[veh]

800
700
600
500
400
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

16h-17h

17h-18h

18h-19h

19h-20h

20h-21h

16h-17h

17h-18h

18h-19h

19h-20h

20h-21h

Intervalo horario t i
ID Frontera 12
2500

[veh]

2000

1500

1000

500
8h-9h

9h-10h

10h-11h

11h-12h

12h-13h

13h-14h

14h-15h

15h-16h

Intervalo horario t i

y reales

y2 =(a+bx)fvgll

y3 =(a+bx+cx2 )fvgll

y6 = f (x,ti,k))

Figura 4-35: Volmenes de vehculos observados y estimados con modelos 2, 3 y 6 que cruzan la
frontera 11 y la frontera 12 en cada periodo horario.

4.3.7 Conclusiones
En este Captulo se ha presentado una metodologa para estimar volmenes de vehculos que
cruzan una frontera entre celdas en funcin de datos de una red de telefona mvil. Tras discutir
la informacin necesaria para este objetivo, se han desarrollado seis modelos para inferir dichos
volmenes empleando las llamadas en movilidad generadas en cada periodo horario, junto con
otra informacin asociada a las caractersticas de esas llamadas, tales como intensidad horaria
de llamadas, duracin, o incluso las caractersticas de las vas que cruzan la frontera. Los
modelos formulados han sido los siguientes:
Modelo 1: y1 (ti ) a f v (ti ) gll (ti ) .
Modelo 2: y 2 (ti ) [a b x(ti )] f v (ti ) gll (ti ), donde x(ti ) nll mov (ti , k ) .
Modelo 3: y3 (ti ) [a b x(ti ) c x 2 (ti )] f v (ti ) gll (ti ), donde x(ti ) nll mov (ti , k ) .
Modelo 4: y 4 (ti ) a b x(ti ), donde x(ti ) nll mov (ti , k ) .
Modelo 5: y5 (ti ) a b x(ti ) c x 2 (ti ), donde x(ti ) nll mov (ti , k ) .

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

Modelo 6: y 6 (ti , k )

113

a x(ti , k )
Lk
d , con (ti , k )
b
Vk Tc (ti )
1
1 e b2 (ti , k ) c
Pll2veh (ti ) Pll veh (ti )
(ti , k )

Los modelos 1, 2, 3, 4 y 5 no establecen diferenciacin en sus predicciones segn la frontera


monitorizada, de modo que la principal variable de entrada al modelo, x(ti), es el nmero de
llamadas en movilidad detectadas en una frontera k cualquiera, x(ti) = nll mov(ti, k). En cambio, el
modelo 6 s que posee una dependencia espacial, estableciendo una diferenciacin segn la
frontera monitorizada. As pues, las variables de entrada al modelo son las llamadas en
movilidad en una determinada frontera, x(ti, k) = nll mov(ti, k), junto a otro tipo de informacin
relacionada con caractersticas de las llamadas y de la propia frontera.
El ajuste de los parmetros de los modelos definidos se ha llevado a cabo buscando la
minimizacin de la suma del valor absoluto del error relativo entre valores observados y
modelados. El Captulo se ha completado con un estudio numrico en el que se contrastan los
modelos y se comparan entre s en base a una serie de criterios. Dada la variedad de modelos,
estos criterios de comparacin contemplan indicadores tales como las clsicas medidas de error
(medio, absoluto y relativo), percentiles del error relativo absoluto, o correlaciones (lineal y por
rango) entre volmenes reales y predicciones, adems de un anlisis grfico de resultados.
Tambin se han empleado el criterio de informacin de Akaike y el criterio de informacin
bayesiano como medidas de contraste para evaluar la forma funcional en la seleccin de los
mejores modelos.
Tras el estudio de comparacin y contraste se extraen una serie de conclusiones, destacando que
aquellos modelos que incluyen en su forma funcional tanto informacin de llamadas en
movilidad como sobre variabilidad horaria de llamadas realizadas y/o de vehculos circulando,
alcanzan predicciones ms exactas que el resto. Tal es el caso de los modelos 2, 3 y 6.
En base a los criterios estudiados, se puede afirmar que los modelos 1, 4 y 5 son los que peores
prestaciones consiguen. En lo que respecta al modelo 1, esto se refleja en el hecho de que el
modelo depende exclusivamente de los factores de variabilidad horaria de intensidad de
llamadas y de vehculos circulando, independientes de la frontera. La informacin del nmero
de llamadas en movilidad realizadas no interviene en el modelo, perdindose entonces la
informacin respecto a un cierto orden de magnitud del paso por la frontera en cuestin.
Respecto a los modelos 4 y 5 ocurre algo similar pero en este caso, aunque su forma funcional s
que depende de las llamadas en movilidad realizadas en cada frontera en cuestin, carece de
informacin sobre variabilidad horaria. Ya se razon en apartados anteriores que el intervalo
horario es un aspecto importante a la hora de realizar las predicciones. De ah que sus

114

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

prestaciones, aunque en menor medida que las del modelo 1, sigan proporcionando resultados
limitados. En cambio, los modelos 2 y 3, los cuales s contienen informacin tanto de las
llamadas en movilidad como de variabilidad horaria, consiguen resultados eficientes,
demostrando una capacidad predictiva admisible para cualquier frontera entre celdas.
Por otro lado, el modelo 6 alcanza predicciones razonables de volmenes de vehculos aunque
exige realizar un estudio previo para caracterizar la frontera en trminos de velocidad y longitud
de las vas que discurren por la celda origen de cada frontera. Su forma funcional establece una
dependencia espacial con la frontera monitorizada, por lo que las predicciones no slo dependen
del nmero de llamadas en movilidad sino sobre qu frontera han sido observadas. Este modelo
es menos flexible que los modelos 2 y 3, dado que requiere un estudio previo de la frontera,
pero su capacidad predictiva, evaluada en anteriores apartados, tambin lo habilita como un
modelo apto para estimar volmenes de vehculos. En consecuencia, los modelos 2, 3 y 6 sern
los seleccionados para predecir volmenes de vehculos, por ser los que mejores prestaciones
alcanzan; mientras que los modelos 1, 4 y 5 son descartados como modelos viables para la
inferencia.
Observando los resultados respecto a la comparacin de los criterios estudiados sobre esos tres
modelos {2, 3 y 6}, resulta difcil establecer un orden de prioridad claro dado que:
i)

respecto a las medidas de error medio, error absoluto y error relativo, as como de
percentiles del error relativo en valor absoluto, aunque el modelo 6 presenta una
ligera ventaja respecto a los modelos 2 y 3, el orden de magnitud es muy similar en
los tres modelos;

ii) grficamente, las predicciones de los tres modelos reflejan un comportamiento


semejante a la hora de alcanzar con exactitud los picos y valles en las curvas de los
volmenes reales;
iii) respecto a correlacin por rango y correlacin lineal, el modelo 6 refleja una cierta
mejora respecto a los modelos 3 y 2;
iv) aunque, respecto a los estadsticos AIC, BIC y log-verosimilitud, los modelos 3 y 2,
son mejores que el modelo 6.
En general, puede decirse que el modelo 6 presenta una capacidad predictiva ligeramente
superior al considerar dependencia espacial, funcin de caractersticas geomtricas que habra
que medir especficamente para cada punto kilomtrico monitorizado. Sin embargo dicha
mejora puede no ser suficiente para justificar la prdida de flexibilidad del modelo frente a los
modelos 2 y 3, que son independientes de la frontera. A la vista de estas conclusiones,

Captulo 4: INFERENCIA DE VOLMENES DE TRFICO MEDIANTE LA TELEFONA MVIL

115

finalmente se ha optado por considerar como igualmente viables los modelos 2, 3 y 6 para
estimar volmenes de vehculos, ponindose de manifiesto:
i)

lo insuficiente de usar exclusivamente informacin de llamadas en movilidad,

ii)

la necesidad de incorporar en los modelos informacin sobre la variabilidad


horaria de la conducta de los usuarios que se desplazan, en medios mecanizados,
a la hora de realizar llamadas, u otras caractersticas asociadas a la circulacin de
vehculos, y

iii)

la aplicabilidad de la metodologa a cualquier frontera dentro de unos rangos


admisibles de error en comparacin con medidas proporcionadas por las
tradicionales estaciones de aforo.

Respecto a este ltimo punto, es necesario destacar lo siguiente. Los telfonos mviles se han
convertido hoy en da en un elemento indispensable en nuestra vida diaria, especialmente en lo
que respecta a nuestra movilidad. Los datos que los sistemas de telefona mvil generan para su
propio funcionamiento pueden arrojar cierta informacin relacionada con nuestros movimientos.
De ah que existan en la literatura diferentes estudios en los que se afirma que la telefona mvil
puede convertirse en una herramienta viable para la monitorizacin del trfico. En este Captulo
se han propuesto una serie de modelos para la estimacin de volmenes de vehculos en funcin
de, entre otras variables, llamadas realizadas por telfonos mviles bajo ciertas situaciones
expuestas en el apartado 4.3.3, denominadas llamadas en movilidad. La naturaleza de la
principal variable de entrada al modelo, llamadas en movilidad, posee una fuerte componente de
aleatoriedad. Este tipo de datos no representa el conjunto total de telfonos que han pasado por
una zona sino slo aquellos pertenecientes al operador de inters que, a su vez, han realizado
llamadas bajo ciertas condiciones. Ello condiciona en gran medida la representatividad de la
muestra y, por tanto, de los resultados. Pese a estas dificultades, los valores de prediccin de los
modelos finalmente seleccionados han alcanzado resultados razonables en comparacin con
valores observados por estaciones de aforo. En este sentido, la validacin experimental de los
modelos propuestos ha manifestado evidencias de que la telefona mvil, mediante llamadas en
movilidad, constituye una alternativa vlida para la determinacin de volmenes de vehculos
pasando por una zona frente a los procedimientos tradicionales basados en aforos.
Una aplicacin inmediata de esos volmenes inferidos de la telefona mvil se puede enfocar al
campo de las metodologas de ajuste de matrices de movilidad, tradicionalmente realizadas a
partir de aforos de la red, aunque realizando una serie de modificaciones que contemplen el
origen de los volmenes utilizados. El siguiente captulo aborda esta cuestin.

116

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

CAPTULO 5
APLICACIN A LA ESTIMACIN DE
MATRICES ORIGENDESTINO

5.1 INTRODUCCIN
Las matrices de viajes OrigenDestino (OD) son una fuente esencial de informacin
correspondiente a la demanda de transporte en todos los estudios de planificacin, gestin y
control del sistema de transporte. Estas matrices aportan informacin sobre el nmero de viajes
realizados entre una zona origen i y una destino j en un determinado intervalo de tiempo. Por
ello, para caracterizar el funcionamiento de un sistema de transporte es bsico conocer, entre
otros parmetros, la matriz origendestino. Histricamente, las matrices origendestino han sido
estimadas en base a tres metodologas diferentes:
1. Estimacin directa: Llevando a cabo un proceso de encuestacin, domiciliario o viario
(directo sobre una muestra de vehculos o por ficha proporcionada a conductores, o
indirecto por captacin de nmeros de matrculas).
2. Estimacin por modelos de demanda: Haciendo uso de un modelo de distribucin (e.g.:
modelo de gravedad).
3. Estimacin mediante conteos de trfico: Utilizando conteos de trfico a fin de actualizar
una matriz origendestino preexistente.
De las tres aproximaciones anteriores, la tercera alternativa es la ms profusamente utilizada en
las ltimas dcadas y ha dado lugar a innumerables contribuciones desde el trabajo pionero de
Low (1972). La metodologa en la que se basa exige, como prerrequisito, un conjunto de
conteos de flujos de trfico (volmenes observados) y una matriz OD previa, la cual puede ser
obtenida de algn estudio cronolgicamente anterior o de una encuestacin bsica que predefina
la estructura de la matriz final a obtener. Bajo el enfoque de esta metodologa, suelen utilizarse
modelos basados en optimizacin matemtica para intentar determinar la matriz de viajes ms

118

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

idnea. Dicha matriz debe ser consistente con la informacin contenida en los volmenes de
trfico en los arcos observados mediante el uso de una funcin objetivo a minimizar basada en
informacin con respecto a la matriz de viajes previa. En estos modelos basados, la matriz
previa se supone que es una matriz OD desactualizada a la que hay que realizar
ajustes/cambios para adecuarse a los volmenes observados cuando sea asignada a la red.
Recientemente, los sistemas de telefona mvil se estn considerando como una tecnologa
prometedora para la captura de datos de trfico debido a sus ventajas con respecto a las tcnicas
tradicionales. Respecto a ello, en el anterior captulo se present una metodologa que permita
inferir volmenes de trfico a partir de conteos de paso de telfonos por fronteras entre celdas.
Dichas fronteras pueden englobar uno o varios arcos de la red de transporte, proporcionando en
ese caso informacin agregada de volmenes para grupos de arcos en lugar de volmenes a
nivel de arco individual. Parece lgico que las metodologas de estimacin clsicas deban
adaptarse para incorporar este tipo de informacin a su formulacin de modo que pueda ser
usada en lugar de (o adems de) medidas proporcionadas por los tradicionales aforos.
Este captulo presenta una metodologa para la estimacin o ajuste de una matriz previa cuya
principal novedad es el uso de informacin agregada de volmenes observados en agrupaciones
de arcos inferidos de la telefona mvil. En particular, se ha optado por adaptar la metodologa
propuesta por Doblas y Benitez (2005), que ya demostr su eficiencia en la estimacin de
matrices con aforos tradicionales, para que pueda ser empleada con la informacin inferida de la
telefona, es decir, a nivel de volumen por grupos de arcos. La eleccin como base terica de esa
metodologa reside en que, a diferencia de otras, sta implementa un control de la distorsin
experimentada por la matriz previa durante el ajuste. En general, este tipo de metodologas
busca que la matriz resultante reproduzca, al ser asignada a la red, los volmenes observados lo
ms fielmente posible, y derive de una matriz previa que proporciona informacin til al
proceso dado que se supone como una observacin de la verdadera matriz OD a estimar.
Llevar a cabo una encuesta amplia y detallada que permita elaborar una matriz previa resulta ser
un proceso costoso, por lo que una distorsin excesiva de dicha informacin invalida cualquier
esfuerzo presupuestario y humano dedicado a su elaboracin. En base a este razonamiento, en la
definicin de la funcin objetivo se buscar un compromiso entre la distorsin de la solucin
con relacin a la matriz previa y a los volmenes observados a nivel agregado de arcos.
Se ha empleado como punto de partida la metodologa de Doblas y Benitez (2005) por haber
sido ampliamente estudiada y desarrollada por nuestro grupo de investigacin, as como por
haber mostrado magnificos resultados en el campo del ajuste de matrices con volmenes
observados. No obstante, la adaptacin implementada en la formulacin a nivel de volumen por

Captulo 5: APLICACIN A LA ESTIMACIN DE MATRICES ORIGEN-DESTINO

119

grupos de arcos tambin sera vlida para cualquier otra metodologa de ajuste de matrices
basada en volmenes observados (por ejemplo, Spiess, 1990).

5.2 ANTECEDENTES Y ESTADO ACTUAL


Los mtodos de estimacin de matrices origendestino basados en la utilizacin de datos de
aforos automticos para actualizar una matriz previa han experimentado un gran desarrollo en
los ltimos 30 aos. Esto lo ha motivado, fundamentalmente, el hecho de que este tipo de
informacin se puede conseguir ms rpida y econmicamente que la obtenida tradicionalmente
mediante la realizacin de encuestas.
Estimar una matriz OD puede ser visto como el problema de encontrar una matriz que, cuando
sea asignada a la red, reproduzca los conteos de trfico observados. En general, hay un gran
nmero de matrices que pueden reproducir los conteos de trfico observados, de modo que el
sistema de ecuaciones resultante es indeterminado y puede tener muchas soluciones posibles. El
nmero de pares OD (elementos de la matriz) excede en gran medida el nmero de arcos para
los cuales se han recogido los conteos de trfico. Por tanto, el problema pasara a ser la eleccin
de la mejor matriz entre todas las posibles que reproducen los conteos de trfico observado.
Algunos modelos resuelven este problema postulando un modelo general de distribucin de
viajes, por ejemplo un modelo de gravedad, mientras que otros adoptan tcnicas de inferencia
estadstica. Son innumerables las contribuciones en este campo con algoritmos desarrollados
para la resolucin del problema de estimacin de la matriz OD usando conteos de trfico. Los
mtodos ms comunes incluyen maximizacin de la entropa (Van Zuylen y Willumsen, 1980),
mxima verosimilitud (Spiess, 1987), mnimos cuadrados generalizados (Cascetta, 1984; Bell,
1991) o tcnicas de inferencia bayesiana (Maher, 1983). Una revisin de esos modelos se puede
consultar en Cascetta y Nguyen (1988), Chen y Florian (1996), Abrahamsson (1998).
Respecto a la obtencin de una matriz OD, diferentes estudios revisados en el Apartado 3.2
relacionados con uso de telfonos mviles (Pan et al., 2006; White y Wells, 2002; Akin y
Sisiopiku, 2002), sugieren la posibilidad de obtener directamente matrices OD mediante
registros de localizacin generados por usuarios de telfonos mviles. Una matriz OD
elaborada mediante datos de telfonos puede clasificarse segn el nivel de agregacin que se
logra alcanzar, es decir, segn las zonas de transporte sean las celdas o las reas de
localizacin existentes en la zona de servicio de red existente en la regin bajo estudio. Esta
diferenciacin es necesaria puesto que est estrechamente relacionada con el tamao de la
muestra que generar la matriz. Cuando las zonas de transporte son las celdas, se precisa que
los registros de localizacin estn actualizados a nivel de celda, lo cual slo ocurre en el caso de

120

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

telfonos que realicen llamadas. En el caso de que se trabaje a nivel de reas de localizacin, los
registros deben de estar actualizados a nivel de LA, lo cual ocurre en los sistemas de telefona
con independencia del estado del telfono, siendo por tanto la muestra ms extensa.
Independientemente del nivel de agregacin seleccionado, la elaboracin de este tipo de
matrices implicara monitorizar los registros iniciales y finales que cada telfono efecta sobre
la regin analizada en el intervalo de tiempo de inters, los cuales determinan la zona origen y
destino del viaje asociado al usuario portador del telfono. Este anlisis permite distinguir entre
los viajes de inters (pares OD de la matriz) del resto de viajes de paso, los cuales son viajes
que se iniciaron o terminaron en otros orgenes o destinos distintos a los estudiados.
En general, un proceso de encuestacin tradicional requiere trabajar con una muestra
representativa de la poblacin. Debido a ello, las metodologas de estimacin basadas en
matrices procedentes de encuestas resultan o poco fiables o muy costosas desde el punto de
vista econmico y/o social. Sin embargo, el empleo de datos de telfonos mviles supone
utilizar una muestra muy extensa de la poblacin, puesto que las tasas de penetracin de
telefona se sitan ya en torno al 90% en muchos pases europeos (CDB, 2006), siendo en
Espaa el 110.8% (CMT, Enero 2009). Junto a ello destaca su bajo coste de implantacin dado
que utiliza la misma infraestructura existente en los sistemas de telefona, sin necesidad de
instalar mdulos adicionales. Sin embargo, en lo que respecta a precisin de localizacin, este
tipo de matrices derivadas directamente de la telefona mvil posee ciertos inconvenientes que
las invalidan como matrices de viajes finales. La desventaja principal se encuentra fuertemente
relacionada con el tamao de las zonas de transporte derivadas de una zonificacin que
emplee la distribucin celular de una red de telefona mvil.
Desde el punto de vista de dimensin de las zonas de transporte que definen una matriz OD, la
zonificacin tradicional se realiza minuciosamente mediante criterios socioeconmicos o
agregaciones de poblacin seleccionando zonas que pudieran tener una relacin causal con los
movimientos que se dan entre ellas. El tamao de estas zonas debe ser tal que el error de
agregacin causado por el supuesto que todas las actividades se concentran en ella no sea muy
grande, es decir, bajo impacto de viajes intrazonales. Adems, estas zonas deben ser lo ms
homogneas posible en cuanto al uso del suelo y/o la composicin de la poblacin. En cambio,
en matrices elaboradas directamente con registros telefnicos, las zonas de transporte vienen
ya fijadas por el propio diseo del sistema de telefona, puesto que se utilizan las mismas celdas
y/o reas de localizacin definidas en el dimensionado de la red celular. El tamao de las celdas
respecto al mbito geogrfico de su cobertura depende en gran medida de parmetros tales como
trfico que tiene soportar, topologa del terreno, tipo de antena o incluso edificios alrededor de

Captulo 5: APLICACIN A LA ESTIMACIN DE MATRICES ORIGEN-DESTINO

121

la estacin base, variando el radio de una celda desde cientos de metros (entornos urbanos) a
kilmetros (entornos rurales). Considerando a su vez que las reas de localizacin se definen
como agrupaciones de celdas, este tamao ser considerablemente mayor.
Atendiendo al enfoque de uso de esas reas (celdas y/o LA) como zonas de transporte, no ser
vlida la hiptesis de bajo impacto de viajes intrazonales dado que es lgico que comprendan
varias de las clsicas zonas de transporte entre las que s se dan viajes. Con las posibilidades que
ofrece la telefona mvil, esos viajes intrazonales sern generalmente imposibles de detectar
aunque, si se atiende a matrices en trminos de macro zonas (agrupacin de varias zonas de
transporte clsicas segn un determinado criterio), se permitira elaborar una matriz de viajes.
Por tanto, el uso datos de telefona es vlido para obtener una matriz final a nivel de macro zona
o una matriz exclusivamente de viajes interzonales que pueda ser utilizada como previa para,
posteriormente, ajustarla con otra informacin (aforos, volmenes agregados derivados de
telfonos,) mediante mtodos tradicionales, pero no para usarla directamente como matriz de
viajes final. Adems, la obtencin de una matriz de movilidad monitorizando el origen y destino
de una muestra de telfonos mviles presenta como desventaja que las matrices OD inferidas
no estaran desagregadas ni por motivo ni por modo de transporte, ni aportaran informacin
sobre caractersticas de los individuos, como as ocurre en el caso de las procedentes de
encuestas. En cambio presentaran como ventaja destacable que la obtencin de la matriz sera
de forma automtica y sobre una muestra de tamao elevado.
No obstante, los mtodos ms extendidos para la resolucin del problema de estimacin de una
matriz de viajes OD son aquellos basados en modelos matemticos que utilizan las mediciones
de aforos en un conjunto de arcos de la red de trfico junto con otra informacin previa. Son en
ellos en los que se ha centrado esta Tesis para la estimacin de matrices, fusionando conceptos
tradicionales de estimacin mediante modelos matemticos junto con una nueva fuente de
informacin de volmenes de trfico derivados de la telefona mvil.

5.3 METODOLOGA DE AJUSTE DE MATRICES ORIGEN


DESTINO MEDIANTE VOLUMENES AGREGADOS
5.3.1 Introduccin
Una matriz OD de viajes, T=[Tij], es una tabla de doble entrada que, en una celda genrica ij,
contiene el nmero de viajes que tienen lugar entre la zona de transporte origen i y la de
destino j durante un cierto periodo de tiempo. Los aforos o conteos de trfico tradicionales

122

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

proporcionan el volumen total de vehculos que circula por cada uno de los arcos observados de
la red de transporte en dicho periodo de tiempo.
La mayora de los modelos de actualizacin de matrices emplean conteos de trfico obtenidos
de aforos (detectores) instalados sobre arcos del viario. Ciertos sistemas que realizan tales
conteos suelen ser descartados para su uso en mtodos de estimacin de matrices debido a que
no son capaces de desagregar la informacin medida sobre grupos de arcos en informacin
individual de cada arco (e.g. las IMD no desagregan por sentido de circulacin). Este trabajo
propone una metodologa para el uso de la informacin agregada proporcionada por sistemas de
estas caractersticas. En particular, la metodologa se va a centrar en datos de volmenes
derivados de la telefona mvil por considerarse sta como una tecnologa prometedora para la
captura de datos de trfico. Para ello es necesario introducir novedades metodolgicas para la
explotacin de la informacin agregada de movilidad entre zonas derivada de tales sistemas de
telefona, es decir, volmenes observados sobre grupos de arcos de la red en lugar de sobre
arcos individuales (tradicionales aforos). Se ha diseado una metodologa fcil de aplicar,
adecuada para abordar problemas de estimacin de matrices en aplicaciones reales de gran
envergadura con un gran nmero de zonas de transporte involucradas.

5.3.2 Definicin del problema


La necesidad de obtener matrices de viajes OD de forma rpida y econmica es esencial en la
planificacin del transporte. Una matriz OD es difcil y, en ocasiones, costosa de obtener por
mediciones directas o encuestas; en cambio, se puede obtener una estimacin razonable de ella
usando conteos de trfico en un conjunto de arcos de la red de transporte y otra informacin
adicional. Esta informacin puede estar disponible en trminos de una matriz OD previa, T ,
y/o en el nmero de viajeros que se atrajeron o se originaron en diversas zonas.
Los mtodos de estimacin de matrices ms extendidos solamente necesitan de conteos de
trfico en un conjunto de arcos y una informacin a priori de la estructura de la matriz de viajes.
En general, la mayora de los modelos para la estimacin de una matriz OD utilizan
informacin a priori sobre ella en trminos de una matriz OD previa. sta puede ser obtenida
por una encuesta sobre una muestra o a partir de una matriz antigua, probablemente
desactualizada considerada como una observacin prxima a la verdadera matriz que se desea
estimar. Por otro lado, los datos del conjunto de conteos de trfico tambin se consideran como
una observacin directa de la realidad que el modelo matemtico debe reproducir. Por tanto, en
el proceso de ajuste, la matriz previa se considera que es una matriz OD obsoleta a la que hay

Captulo 5: APLICACIN A LA ESTIMACIN DE MATRICES ORIGEN-DESTINO

123

que realizar cambios para obtener las mnimas desviaciones posibles entre los volmenes
estimados en los arcos y los observados.
En general, se puede concluir que los distintos mtodos para el problema de estimacin de
matrices de viajes OD, desarrollados en la literatura a partir de volmenes de trfico
observados, presentan la forma genrica siguiente (Yang et al., 1992):
Minimizar
v, T
s.a.

F1 T,T F2 v, v

(21)

v = M (T)

Las funciones F1 y F2 son dos mtricas que miden la distancia entre la matriz OD estimada,

T , y la matriz previa dada, T , y entre los volmenes estimados y los observados en los arcos
aforados, v y v respectivamente. Los procedimientos ms habituales para las funciones F1 y F2
son el de mxima verosimilitud, mnimos cuadrados generalizados y derivaciones del principio
de mxima entropa. Los parmetros y son los correspondientes factores de peso que
reflejan la confianza relativa en los datos disponibles T y v . Finalmente, la expresin v=M(T)
representa el proceso de asignacin considerado para modelar los volmenes en los arcos a
partir de la matriz estimada.
Tpicamente, el problema de estimacin puede ser interpretado como la bsqueda de una matriz
OD que, una vez asignada a la red, reproduzca los conteos de trfico observados y, adems, sea
semejante a la matriz previa. La nueva contribucin respecto a los mtodos existentes en la
literatura es el uso de informacin agregada de volmenes observados sobre grupos de arcos de
la red en lugar de sobre arcos individuales. Este tipo de informacin puede ser usada
conjuntamente con los conteos de trfico obtenidos de las tradicionales estaciones de aforo,
dado que los aforos son un caso especial en el que el nmero de arcos del grupo es uno. El
procedimiento de estimacin presentado en esta Tesis se basa en los dos criterios siguientes, que
permiten traducirlo a expresiones matemticas con vistas a su implementacin prctica:
1. Que la matriz resultante reproduzca, al ser asignada a la red, los datos de los volmenes
agregados lo ms fielmente posible.
2. Que la informacin contenida en la matriz OD previa, obtenida habitualmente por
medio de complejos y costosos procesos de encuestacin domiciliaria, no se vea
distorsionada en exceso. Una distorsin excesiva de dicha informacin invalida
cualquier esfuerzo presupuestario y humano dedicado a tareas de encuestacin.
Esta metodologa implementa un algoritmo de ajuste de matrices a partir de informacin
agregada de volmenes observados, junto con una matriz previa. La matriz previa a utilizar

124

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

proceder de una generada mediante un proceso de encuestacin o de una matriz antigua


(probablemente desactualizada). Para los volmenes, pese a que la informacin puede proceder
de cualquier sistema que proporcione conteos de trfico en ese formato agregado sobre grupos
de arcos, la metodologa se centrar en el uso de conteos derivados de sistemas de telefona
mvil. Recientemente, estos sistemas estn siendo empleados con xito para la monitorizacin
del trfico; por ello el estudio se centra en el contexto de volmenes agregados derivados de
ellos. No obstante, la metodologa es aplicable a cualquier otro sistema que proporcione
volmenes de forma agregada, incluso puede ser combinada con los tradicionales aforos. El
algoritmo de ajuste fue diseado para ser implementado fcilmente en cdigos comerciales de
asignacin EMME/2 (1998), MINUTP (1993), TRANSCAD (2006), TRIPS (1990), etc.

5.3.3 Formulacin matemtica


La idea ms intuitiva y sencilla para traducir los criterios anteriormente expuestos a una
formulacin matemtica adecuada es plantear el problema como uno de optimizacin
matemtica en el que se trata de minimizar una funcin cuadrtica que mida las discrepancias
entre volmenes observados (ya sean de aforos automticos, derivados de telfonos mviles o
de cualquier otro sistema) y volmenes tericos o modelados (los que se obtienen por
asignacin), as como la distancia entre la matriz OD de viajes previa y los sucesivos
estimados que se obtienen como resultado del proceso de ajuste. En la formulacin que se
propone se respeta esta idea en lo que respecta a los volmenes observados, sin embargo, para
controlar la distorsin de la matriz previa se opta por un conjunto de restricciones de variables
acotadas (para cada celda de la matriz OD) y de restricciones funcionales (para la informacin
contenida en la matriz OD en distintos niveles de agregacin: viajes generados al agregar
segn destinos, viajes atrados al agregar segn orgenes y viajes totales al agregar en orgenes y
destinos) que mantengan la variacin de la informacin contenida en la matriz estimada
respecto de la previa dentro de unos rangos considerados admisibles.
Se considera que el rea objeto de nuestro estudio se encuentra dividida en no+nd zonas de
transporte (no orgenes y nd destinos) con viajes desde cada una de las zonas origen hasta todos
los destinos. Cada zona es representada por un nodo denominado centroide, donde los viajes se
inician o terminan. La matriz de viajes se denotar por T = [Tij], siendo su elemento (i, j) el
nmero de viajes desde el origen i al destino j durante un cierto periodo de tiempo. La red de
transporte correspondiente al rea estudiada se representa mediante un grafo dirigido G=(N,A)
donde N y A son el conjunto de nodos y arcos (dirigidos) respectivamente. En los arcos del
modelo de la red de transporte pueden existir congestin y esto se suele modelar por funciones
de coste sa(va). Las funciones de coste describen la relacin entre el volumen de trfico en el

Captulo 5: APLICACIN A LA ESTIMACIN DE MATRICES ORIGEN-DESTINO

125

arco y el coste (o el tiempo) para recorrerlo. Se establece la hiptesis de que las funciones de
coste son separables, el tiempo en recorrer un arco no depende del volumen de otros arcos. El
tratamiento de los efectos de la congestin es una caracterstica importante para distinguir entre
los modelos para la evaluacin de la matriz OD. Cada modelo supone que la congestin se
puede tratar exgenamente (por asignacin proporcional) o endgenamente (por asignacin en
equilibrio). Finalmente, la asignacin de la matriz OD al modelo de red para obtener los
volmenes y tiempos de viaje modelados sobre cada arco se basa en el equilibrio de usuario
(userequilibrium) determinista o estocstico, cumpliendo los requisitos de asignacin en
equilibrio segn el primer principio de Wardrop (Patriksson, 1994).
A continuacin se presenta la notacin matemtica necesaria para la formulacin del modelo.
ndices:
iI

zonas origen (no elementos)

jJ

zonas destino (nd elementos)

aA

arcos genricos de la red

bB

fronteras (cada frontera comprende un conjunto de arcos observados)

k Kij

rutas o caminos desde origen i a destino j

Constantes:

ak

1 si el arco a pertenece a la ruta k, 0 en otro caso

a b

1 si el arco a pertenece a la frontera b, 0 en otro caso

uij , lij

cotas superiores e inferiores para el par OD (i, j)

uiO , liO

cotas superiores e inferiores para viajes generados por la zona i

u Dj , l Dj

cotas superiores e inferiores para viajes atrados por la zona j

u ,l

cotas superiores e inferiores para los viajes totales

v |b

volumen observado en la frontera b

|b

factor de peso (opcional) otorgado a la frontera b

Funciones:
sa (va )

funciones de coste del arco a

126

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

Variables:
va

volumen en el arco a

hk

flujo en el camino k

pk

hk
Tij

Pij , a

k Kij

proporcin de viajes (del total Tij) que circula por el camino k

ak

pk

proporcin de viajes desde el nodo i al nodo j a travs del arco a.

v |b

volumen en la frontera b

Tij

demanda (viajes) desde el origen i al destino j (Destacar que es una variable


para el proceso global de ajuste, pero constante en cada etapa de asignacin)

Con esto, la formulacin matemtica que se propone es la siguiente.


1.

Nivel Superior
Minimizar
Tij

f Tij

1
2

v
bB

s.a. lij Tij uij

(a)

i I , j J

(b)

liO Tij uiO

iI

(c)

l Dj Tij u Dj

jJ

(d)

jJ

(22)

iI

l Tij u

(e)

iI jJ

2.

Nivel Inferior
Minimizar
va

g va sa (v) dv
va

a A

s.t.

va ak hk , a A
iI jJ kKij

k Kij

Tij , i I , j J

hk 0 k K ij , i I , j J

(23)

Captulo 5: APLICACIN A LA ESTIMACIN DE MATRICES ORIGEN-DESTINO

127

El modelo propuesto tiene una estructura binivel, donde el problema de nivel superior estima la
matriz de viajes Tij en funcin de un volumen va en los arcos dado. El problema de nivel inferior
es el conocido como TAP (Traffic Assignment Problem), un problema de asignacin que
determina los volmenes va en los arcos, segn las condiciones de equilibrio de usuario, para
una matriz de viajes Tij dada (Beckmann et al., 1956).
Respecto al problema de estimacin de una matriz de viajes OD expuesto en la ecuacin (22),
los volmenes derivados de la telefona mvil con los que realizar el ajuste, v b , son obtenidos
sobre fronteras b entre celdas de la red celular, cada una de las cuales comprende un grupo de
arcos del modelo de red. La formulacin que se propone en este trabajo incluye un trmino
cuadrtico para controlar la distancia entre los volmenes observados y estimados (modelados).
Sin embargo, para controlar la distorsin de la matriz estimada (o ajustada) respecto de la previa
se opta por un conjunto de restricciones de variables acotadas (22) (b) y de restricciones
funcionales (22) (c, d, e). Dichas restricciones deben definir unos rangos admisibles de
variacin para la informacin contenida en la matriz OD en distintos niveles de agregacin
(para cada celda de la matriz OD, viajes generados al agregar segn destinos, viajes atrados al
agregar segn orgenes, y viajes totales al agregar en orgenes y destinos, respectivamente). A
diferencia de la formulacin empleada en (21), la medida de la distorsin entre las matrices
estimada y previa se ha modelado mediante dicho conjunto de restricciones en lugar de
mediante una funcin F1. Para obtener estrictamente la notacin equivalente a (21) bastara con
definir la lagrangiana del problema y as elevar las restricciones (22) (b, c, d y e) a la funcin
objetivo.
Respecto a los volmenes v b de todas las fronteras observadas bB, es necesario realizar un
clculo adicional sobre los volmenes va obtenidos del nivel inferior (23). De modo que el
volumen en la frontera b puede ser expresado, en trminos de proporciones de viajes, como la
suma de los volmenes va de cada uno de los arcos que cruzan la frontera b, obteniendo la
siguiente expresin:

v b va a|b va a|b Tij ak pk a|b Tij Pij , a b B


iI jJ kK
aA
ab
a A
a A
i, j

ij

Si las funciones de coste son tales que

d sa (va )
0 para cada arco a
dva

(24)

A, es decir, el tiempo

necesario para recorrer un arco aumenta conforme aumenta el trfico en l, est garantizada la

128

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

unicidad de solucin con respecto a los volmenes en arcos va (Sheffi, 1985); pudindose
derivar una solucin factible para cada v b conforme a la expresin (24).
El problema de la estimacin de matrices OD mediante volmenes observados consiste en
encontrar la distribucin de viajes entre nond celdas (Tij) a partir de los aforos disponibles en la
red, en este caso, fronteras observadas. En la mayor parte de los casos el nmero de incgnitas
(nond) es muy superior al de fronteras observadas, por lo que es imposible determinar una
matriz OD nica, considerando el problema indeterminado. Esto significa que existen muchas
matrices que satisfacen las ecuaciones del problema y el objetivo pasa a ser el encontrar la
solucin que mejor se adapte a determinados criterios preespecificados. Para la presente
metodologa, dichos criterios son establecidos y modelados matemticamente en el problema de
nivel superior (22) mediante las restricciones (22) (b, c, d y e).
La exactitud de las matrices obtenidas mediante esta formulacin se encuentra afectada por la
precisin de los resultados de partida: volmenes observados, viajes generados y atrados por
cada centroide, etc. En una red real, la falta de exactitud de estos datos hace que, en ocasiones,
no se verifiquen las condiciones de equilibrio en la red modelada. Bajo esta hiptesis, es
razonable permitir que las soluciones obtenidas en el proceso de la estimacin no reproduzcan
los datos exactamente; consecuentemente, el objetivo a perseguir ser obtener la matriz OD
estimada que mejor reproduzca los datos observados tanto a nivel de volmenes como de matriz
previa.
Es necesario realizar algunos comentarios sobre el sistema de inecuaciones lineales mostrados
en (22) (b, c, d y e). Dado que el objetivo de dichas restricciones es controlar la distorsin de la
informacin contenida en la matriz estimada T respecto de la matriz previa T , es evidente que
las correspondientes cotas deberan ser definidas, bien en trminos absolutos o relativos,
conforme a valores derivados de la estimacin inicial Tij(0) , lo cual garantizara una regin
factible novaca. Ello se describe con ms detalle en el apartado 5.3.4.3. Asimismo, merece la
pena destacar que las cotas superiores e inferiores empleadas en (22) para cada restriccin
dependen del diseador, es decir, no hay un valor universal para todos los casos sino valores
especficos para cada problema dado. Estas consideraciones, junto a algunas orientaciones para
la definicin de dichas cotas, son parte de la prctica usual seguida en aplicaciones desarrolladas
y testeadas en el campo de estimaciones de matrices OD (Doblas y Benitez, 2005).

Captulo 5: APLICACIN A LA ESTIMACIN DE MATRICES ORIGEN-DESTINO

129

5.3.4 Algoritmo de ajuste


Respecto al problema de estimacin de matrices, dadas las dimensiones de las redes reales y la
capacidad de los ordenadores actuales, puede resultar inviable acometer el problema mediante
un mtodo que trabaje directamente con las restricciones funcionales y de variables acotadas
propuestas en (22). Esto se debe, principalmente, al clculo y manipulacin de matrices de
grandes dimensiones; por ejemplo, una red de transporte real de tamao medio puede tener del
orden de unos 500 centroides, cantidad que implica una matriz OD de 250000 celdas.
Se pretende disear una metodologa fcil de aplicar y adecuada para abordar problemas de
estimacin de matrices en aplicaciones reales de gran envergadura (elevado nmero de zonas y
centroides). Por ello, la limitacin antes mencionada ha motivado la utilizacin de un mtodo de
transformacin (penalizacin) en el cual las restricciones funcionales se integran en una funcin
objetivo equivalente, pudindose tratar directamente las restricciones de variables acotadas.
El planteamiento seguido en esta Tesis est basado en el mtodo propuesto por Doblas y
Bentez (2005) que combina el mtodo de transformacin denominado mtodo del Lagrangiano
aumentado (o de los multiplicadores) con el mtodo de aproximacin lineal de FrankWolfe.
stos centraron el problema de estimacin de matrices en el uso de conteos de trfico en arcos
preservando la estructura de una matriz previa conocida. Sin embargo, el planteamiento
desarrollado en esta Tesis introduce una modificacin para utilizar en el proceso de ajuste
volmenes agregados en grupos de arcos en lugar de volmenes en arcos individuales (aforos
tradicionales). Esta modificacin es esencial para la utilizacin de informacin derivada de la
telefona mvil como volmenes observados, debido a que estos sistemas proporcionan
informacin agregada a nivel de fronteras entre celdas (grupos de arcos que la cruzan) y no a
nivel individual de arco. No obstante, el modelo formulado puede ser usado conjuntamente con
los tradicionales conteos de trfico dado que los aforos son un caso especial en el que el nmero
de arcos del grupo es uno. Por ello, es necesario resaltar que la metodologa propuesta no
excluye el uso de informacin procedente tanto de aforos tradicionales como de otras fuentes,
aunque por razones de claridad se ha dirigido el problema de estimacin exclusivamente a
informacin de volmenes observados derivada de telfonos mviles.
Esta seccin se dedica a introducir la metodologa propuesta por Doblas y Benitez (2005), as
como a presentar y discutir las modificaciones necesarias que afectan al algoritmo de resolucin
del problema de optimizacin propuesto para utilizar los datos derivados de telfonos mviles.

130

5.3.4.1

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

Introduccin

A continuacin se presenta el mtodo combinado de la Funcin Lagrangiana Aumentada con el


algoritmo de FrankWolfe. Una descripcin ms detallada sobre el proceso de optimizacin
matemtica puede ser encontrada en Doblas y Benitez (2005).
Mtodo de la Funcin Lagrangiana Aumentada o de los Multiplicadores
El problema (22) puede formularse como un problema genrico de minimizacin con
restricciones lineales gl(x) y variables acotadas [l, u]:
Minimizar
x

s.a.

f x
gl (x) 0, l = 1,2, ,L

(25)

lxu
x N

donde gl(x) seran las restricciones funcionales definidas en (22) (c, d y e), y lxu las
restricciones de variables acotadas definidas en (22) (b). Para tal problema, se sabe que las
condiciones de KuhnTucker son necesarias y suficientes para caracterizar el ptimo de dicho
problema. El Mtodo de la Funcin Lagrangiana Aumentada o Mtodo de los Multiplicadores
(Reklaitis et al., 1983) consiste, bsicamente, en aadir una serie de trminos cuadrticos a la
funcin clsica de Lagrange f(x), formando una funcin sin restricciones cuyo mnimo es un
punto que cumple las condiciones de KuhnTucker del problema original. Sin embargo, es
necesario indicar que la funcin Lagrangiana Aumentada conseguida en nuestro caso no incluir
las restricciones de variables acotadas. De modo que la funcin lagrangiana aumentada queda
expresada como:
Laug (x, ) = f (x) +

l 1

gl (x) l

l2

(26)

donde = (l) L , siendo l y l el multiplicador y el factor de peso (o escala) asociado a la


restriccin lsima, respectivamente. Cabe destacar que el empleo de la funcin Lagrangiana
Aumentada para resolver el problema puede ser visto, en general, como una optimizacin sin
restricciones pero, debido a la estructura de este problema, se consigue conservar las nond
restricciones de las variables acotadas del problema original. El trmino correspondiente a las
restricciones l se encarga de penalizar las violaciones de las restricciones que se cometan
durante el proceso de optimizacin. La aplicacin de este mtodo a problemas del tipo (25)
garantiza la convergencia hacia un punto que cumple las condiciones de optimalidad, siendo los

Captulo 5: APLICACIN A LA ESTIMACIN DE MATRICES ORIGEN-DESTINO

131

trminos de penalizacin y los multiplicadores (actualizados segn una sencilla regla) los que
fuerzan la convergencia hacia una solucin factible ptima.
El procedimiento consiste en optimizar (minimizar) en x la funcin lagrangiana aumentada (26),
siendo el trmino l constante de una etapa a otra; mientras que los multiplicadores l slo
permanecen constantes durante cada etapa o subproblema. En cada etapa se hallan los x ptimos
para esos multiplicadores de modo que, una vez obtenido el ptimo para esa etapa del proceso,
se procede a actualizar los multiplicadores conforme a la regla (j n 1) g j ( x ( n ) ) (j n ) para
acometer la siguiente etapa (n+1) del proceso de optimizacin. Esto se repite hasta alcanzar un
grado de convergencia razonable. El operador representa:
si < 0

0 si 0

(27)

En cada etapa o subproblema, es decir, en cada resolucin aproximada de las sucesivas


lagrangianas aumentadas, el mtodo empleado es el de FrankWolfe. Este mtodo consiste en
hallar una direccin auxiliar resolviendo el problema (26) linealizado sin salirse de la regin
factible. Esta direccin auxiliar determina una direccin de descenso que permite hallar un
nuevo estimado que mejore el valor de la funcin de lagrange aumentada.
Mtodo de FrankWolfe
Centrando la atencin en el algoritmo de FrankWolfe (FW) presentado en trminos de la
funcin Lagrangiana Aumentada genrica sujeta a restricciones de variables acotadas, el
problema que pretende ser optimizado mediante el mtodo de aproximacin lineal de FW es:
Laug x

Minimizar
x

lxu

s.a.

(28)

x N
para un vector constante de multiplicadores asociados a esta etapa del proceso. Se denota m al
contador para identificar las sucesivas estimaciones obtenidas por el algoritmo. El mtodo de
FW se basa en aproximar linealmente la funcin objetivo en torno al punto actual x ( m ) . A
continuacin, se busca el punto y de la regin factible que minimice la funcin objetivo
linealizada, que se traduce en el problema de optimizacin lineal definido como:
Minimizar Laug x ( m ) y
T

s.a.

(a)

lyu

(b)

y N

(c)

(29)

132

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

Entonces, con la solucin en la msima iteracin del problema linealizado, y ij( m ) , se obtiene un
nuevo estimado de (28) mediante la siguiente regla de actualizacin:
xij( m 1) = xij( m ) ( m ) y ij( m ) xij( m ) xij( m ) ( m ) d ij( m )

(30)

Esta expresin est escrita en trminos de la direccin de descenso en el estimado actual, d(m), la
cual es la diferencia entre el punto extremo auxiliar y ( m ) y el estimado actual x ( m ) . El paso ( m )
se obtiene como solucin del siguiente problema de optimizacin unidimensional:
Minimizar

s.a.

Laug x ( m 1) x ( m ) d ( m )
0 1

(31)

donde pertenece al intervalo [0, 1] puesto que el punto auxiliar y est localizado en un vrtice
de la regin factible definida por el conjunto polidrico definido por (29).
Por tanto, segn el mtodo de la Funcin Lagrangiana Aumentada, las restricciones funcionales
(22) (c, d y e) se integran en una funcin objetivo equivalente, mientras que las restricciones de
variables acotadas (22) (b) son tratadas directamente con el mtodo de direcciones factibles
(FrankWolfe). Con ello se consigue que las restricciones de variables acotadas se cumplan en
todo momento, mientras que el cumplimiento de las restricciones funcionales es producto de un
proceso iterativo que va penalizando las violaciones cometidas por medio de trminos que
aumentan la funcin de Lagrange clsica.
5.3.4.2

Implementacin

A continuacin, se introduce una notacin adicional a la presentada en la seccin 5.3.3 para


reescribir el mtodo combinado de la funcin Lagrangiana Aumentada con el algoritmo de
FrankWolfe en trminos de magnitudes asociadas al problema de estimacin de matrices OD.
Constantes:

iO

factor de peso asociado a las restricciones de viajes generados por la zona i

Dj

factor de peso asociado a las restricciones de viajes atrados por la zona j

factor de peso asociado a las restricciones de viajes totales

Captulo 5: APLICACIN A LA ESTIMACIN DE MATRICES ORIGEN-DESTINO

133

Variables:

iO

multiplicador asociado a la cota superior de la restriccin de viajes generados por la


zona i

iO

multiplicador asociado a la cota inferior de la restriccin de viajes generados por la zona


i

Dj

multiplicador asociado a la cota superior de la restriccin de viajes atrados por la zona j

Dj

multiplicador asociado a la cota inferior de la restriccin de viajes atrados por la zona j

multiplicador asociado a la cota superior de la restriccin de viajes totales

multiplicador asociado a la cota inferior de la restriccin de viajes totales

yij

punto extremo auxiliar del algoritmo de FrankWolfe

dij

direccin de descenso del algoritmo de FrankWolfe

(m)

msima iteracin

Con la anterior notacin, la funcin Lagrangiana Aumentada (26) puede ser escrita como:

1
Laug T, b Tij ak pk v

ab kKij
2 bB iI jJ


nd

1 no
iO uiO Tij iO

2 i 1
j 1

no

1 nd
Dj u Dj Tij Dj

2 j 1
i 1

no nd
1
u Tij
2
i 1 j 1

no

iO
i 1

nd

Dj
j 1

O 2
i

D 2
j

no

nd

nd

Tij l
O
i

j 1
no

Tij l
i 1 j 1

i 1

ij

O
i

l Dj Dj

2
iO

D 2
j

(32)

donde T = [Tij ], siendo = {O, D}, y = {O, D} vectores de multiplicadores asociados a


cotas superiores e inferiores de las restricciones, respectivamente. En cada etapa o subproblema
(m) los multiplicadores permanecen constantes, la variable de decisin es la matriz Tij. Por lo
que el problema de optimizacin se define como:

134

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

1
Min Laug Tij b Tij ak pk v

Tij
ab kKij
2 bB iI jJ


nd

1 no
iO uiO Tij iO

2 i 1
j 1

no

1 nd
Dj u Dj Tij Dj

2 j 1
i 1

no nd
1
u Tij
2
i 1 j 1

s.a.

no

iO
i 1

nd

Dj

j 1

O 2
i

D 2
j

no

nd

Tij l
j 1
no

Tij l
i 1 j 1

O
i

Tij l
D
j

i 1

nd

O
i

2
D
j

2
iO

2
Dj

(33)

lij Tij uij

Al finalizar cada etapa (m) de optimizacin, los multiplicadores para el nuevo subproblema
(m+1) se actualizan en funcin del estimado ptimo Tij( m ) y de los multiplicadores y
correspondientes a la etapa (m), de acuerdo con la regla (34). El proceso se da por concluido
cuando se alcanza un grado de convergencia que se considere razonable.
nd

iO m 1 uiO Tij m iO m
j 1
no

Dj m 1 u Dj Tij m Dj m
i 1

no

nd

m 1 u Tij m m
i 1 j 1

iO m 1
Dj m 1
m 1

nd

T
j 1
no

T
i 1

no

liO iO m ,

i I

l Dj Dj m ,

j J

ij

ij

nd

T
i 1 j 1

ij

(34)

l m

Para minimizar la funcin Lagrangiana Aumentada mediante el algoritmo de FrankWolfe es


necesario calcular su gradiente, resolver el problema linealizado para hallar el punto extremo
auxiliar y la direccin de descenso, y obtener el paso ptimo. Teniendo en cuenta la ecuacin
(24) de los volmenes en fronteras v b expresada en trminos de Tij y de proporciones pk, de
caminos o rutas usadas por los usuarios, es posible introducir una hiptesis que permita
obtener una aproximacin de la derivada analtica y as obtener Laug T fcilmente. Dicha
hiptesis consiste en considerar constantes las proporciones de viaje pk correspondientes a la
matriz OD actual, T(m), al producirse un cambio infinitesimal en los viajes de una nica casilla
de la matriz, conservando el resto constantes. De modo que, las derivadas parciales de los
volmenes de frontera v b con respecto a las variables Tij se definen como:

Captulo 5: APLICACIN A LA ESTIMACIN DE MATRICES ORIGEN-DESTINO

va
ak pk
Tij kKij
v b a b va

v b
Tij

a b
a A

va
ak pk
Tij aA a b kKij

135

(35)

a A

Con la expresin anterior se puede obtener fcilmente la expresin del gradiente de la


Lagrangiana Aumentada, que viene dada por:
Laug T
Tij

iO

Dj

b Tij ak pk v

ab kKij
bB

p
b ak k

ab k Kij

nd

O
O
O

T
l
u
Tij iO

ij
i
i
i

j 1
j 1

no
no

Tij l Dj Dj u Dj Tij Dj

i 1
i 1

nd

(36)

no nd

T
l
u
Tij i I , j J

ij

i 1 j 1
i 1 j 1

no

nd

Una vez calculado el gradiente, se procede a obtener el punto extremo yij del problema
linealizado (29) que, adaptado al problema de ajuste de la matriz Tij, se convierte en:

Minimizar
yij

no

nd

Laug

i 1 j 1

Tij

yij

(a)

Tijm

s.a. lij yij uij

(b)

yij N

(37)

(c)

Debido a la estructura especial del problema, este punto extremo yij( m ) se puede hallar de forma
sencilla, sin necesidad de utilizar el mtodo simplex, mediante la siguiente expresin lgica:
L
aug
yij( m )
Tij

Tij( m )

L
aug
0 lij

Tij

Tij( m )

L
aug
0 Tij( m )

Tij

Tij( m )

0 uij i I , j J

(38)

Las sucesivas estimaciones del algoritmo de FW son computadas con la siguiente adaptacin
de la expresin (30) conforme a la notacin de matrices OD:
Tij( m 1) = Tij( m ) ( m ) yij( m ) Tij( m ) Tij( m ) ( m ) d ij( m ) , donde: ( m )
para cada i I, j J, donde dij( m ) yij( m ) Tij( m ) es la direccin de descenso FW .

(39)

136

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

Finalmente, el clculo del paso ptimo ser la solucin del problema unidimensional de
optimizacin (31) adaptado a nuestro problema en notacin OD. Para ello es necesario
formular la funcin Lagrangiana aumentada (32) para el nuevo estimado (m+1) expresndola en
funcin del paso , es decir, evaluarla para Tij( m 1) Tij( m ) ( m ) dij( m ) , donde Tij( m ) y dij( m ) son
conocidos; consiguiendo una funcin unidimensional Laug :

1
Laug b Tij( m ) ak pk dij( m ) ak pk v

2 bB iI jJ
k Kij
ab
k Kij
ab

2
2

2
1
O
O
O
O 2
O
O
(m)
(m)
(m)
(m)
i ui Tij dij i
i Tij dij li i
iO

2 iI
j J
j J
j J
j J

2
2

2
2
1
Dj u Dj Tij( m ) dij( m ) Dj
Dj Tij( m ) dij( m ) l Dj Dj
Dj

2 j J
iI
iI
iI
iI

2
2

1
u Tij( m ) dij( m ) 2 Tij( m ) dij( m ) l 2

2
iI jJ
iI jJ
iI jJ
iI jJ

(40)

El paso ptimo ser la solucin de un problema unidimensional de minimizacin de la funcin


Laug donde [0, 1] (31). Cabe destacar que la magnitud del desplazamiento permitido de

Tij( m ) hasta yij( m ) impide utilizar expresiones analticas, como la usada en Spiess (1990), para el
clculo del paso ya que el cambio no es infinitesimal y no puede admitirse la hiptesis de que
las proporciones permanecen costantes. Junto a ello, la existencia del operador , definido en
(27), condiciona la eleccin de un algoritmo robusto de bsqueda que, sin hacer uso del clculo
de derivadas, se encargue de minimizar una funcin unidimensional sobre un intervalo [a, b],
tales como bsqueda dicotmica, exhaustiva, seccin dorada, etc. En el algoritmo de Doblas y
Bentez (2005) se utiliz el mtodo de biseccin pero, tras considerar la dificultad de usar
derivadas y expresiones analticas, se ha optado por el algoritmo denominado bsqueda por la
Seccin Dorada. Adems de no usar informacin de la derivada de la funcin, este eficiente
algoritmo tiene como ventaja el ser ptimo con respecto al nmero de evaluaciones de la
funcin objetivo, conocido el intervalo de incertidumbre, el de definicin de la funcin y sin
necesidad de predefinir el nmero de iteraciones (i.e.: Fibonacci). Este hecho, teniendo en
cuenta las dimensiones de las matrices manejadas, simplifica en gran medida los clculos
necesarios; de ah su eleccin como mtodo de resolucin. El algoritmo se basa en la bsqueda
del mnimo de una funcin unimodal, en este caso la funcin definida en (40), mediante
reducciones iterativas del rango de bsqueda de valores de dentro del cual el ptimo se sabe
que existe (Bazaraa y Shetty, 1979). El algoritmo garantiza que cada nueva evaluacin de la
funcin acotar el mnimo, tras aplicar los ratios correspondientes, dentro de un intervalo

Captulo 5: APLICACIN A LA ESTIMACIN DE MATRICES ORIGEN-DESTINO

137

0.61803 (razn urea) veces ms pequeo que el intervalo de bsqueda de la anterior iteracin.
En nuestro problema, el valor ptimo de se encuentra aplicando el algoritmo iterativamente
dentro del intervalo inicial [0, 1] en la direccin dij(m). De modo que una vez encontrado el paso
ptimo, se procede a la actualizacin de la matriz OD para la siguiente iteracin.
Para la finalizacin del algoritmo de optimizacin, la aproximacin relativa a las proporciones
de rutas pk implica cierto zigzagueo en los valores de la funcin objetivo entre estimaciones
sucesivas, lo cual dificulta el poder incorporar un criterio de finalizacin basado en valores
de las derivadas, en valores de la funcin objetivo en dos pasos consecutivos, o en la
diferencia relativa entre dos estimados sucesivos. Por ello, el criterio de terminacin del
algoritmo se basa en i) un nmero mximo de subproblemas (o etapas Lagrangianas), y ii) un
nmero mximo de iteraciones por subproblema. Es necesario especificar que no hay reglas
especficas para elegir este nmero mximo de subproblemas e iteraciones, al igual que ocurra
con las cotas superiores e inferiores definidas en (22), sino que estos valores dependen del
criterio del planificador y su conocimiento prctico. Por ltimo, indicar que una caracterstica de
este algoritmo es que la matriz OD, para la cual se obtiene el mejor valor de la funcin
objetivo dentro las diferentes iteraciones de una etapa o subproblema concreto, es almacenada y
usada como punto de partida para el siguiente subproblema.
5.3.4.3

Especificaciones del modelo

Por razones de simplificacin de las ecuaciones, los valores de los factores de peso opcionales

|b sern fijados a uno para todas las fronteras de los casos prcticos que en los siguientes
apartados se evalan. Asimismo, se ha puesto especial inters en la eleccin de los factores de
peso ( iO, jD, ) asociados con las restricciones funcionales integradas dentro de la funcin
Lagrangiana aumentada (32), y sobre el comportamiento del algoritmo desarrollado para niveles
de congestin de la red (cuantificada por el nmero de iteraciones necesarias para conseguir una
solucin en equilibrio).
El extenso rango o intervalo de valores en el cual se encuentran las magnitudes implicadas en el
problema de estimacin de matrices OD, las cuales son viajes generados, atrados y totales,
insta hacia un proceso natural de escalado de las restricciones basado en los valores iniciales de
dichas magnitudes, es decir, respecto al estimado inicial Tij(0) a diferentes niveles de agregacin.
Por tanto, cada restriccin funcional (22) (c, d y e) es normalizada (o escalada) por su
correspondiente valor inicial, resultando un conjunto de restricciones normalizadas que dan
lugar a penalizaciones de violaciones de las restricciones proporcionales a valores relativos de
las correspondientes magnitudes. En otras palabras, no posee la misma importancia exceder en

138

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

un viaje una cota superior de 10 que una cota superior de 104, estando ms penalizada la
violacin de la cota superior en la primera situacin que en la ltima.
El proceso de escalado de restricciones se presenta esquemticamente para una pareja genrica
de restricciones de viajes generados, lo cual obliga a modificar levemente la notacin
matemtica para mostrar claramente la relacin directa en la expresin (32). En primer lugar, se
formulan las restricciones y la pareja correspondiente de multiplicadores como se indica:

O
i
(0)
i

l
O

Oi jJ Tij
(0)
i

uiO jJ Tij

(0)
Oi
O

jJ Tij(0)

O
i
(0)
i

0 iO

(0)
i

jJ

(41)

Tij liO

0 i

Oi(0)

para cada i I con Oi(0) 0, donde Tij(0) representa la estimacin actual, que en nuestro caso
coincide con la matriz de partida o matriz OD previa. Las restricciones impuestas sobre los
viajes atrados y los viajes totales debern ser modificada de forma anloga usando las
magnitudes D (0)
iI Tij(0) para cada j J con Dj(0) 0 y T (0) iI jJ Tij(0) .
j

j Tij uiO
liO

Oi(0)
Oi(0)
Oi(0)
l Dj
D (0)
j
l
T

(0)

Tij

i ij
(0)
j

(0)

u Dj

(42)

D (0)
j

u
T (0)

En base al razonamiento anterior, dado que cada restriccin est escalada (normalizada)
respecto a su magnitud correspondiente Oi(0), Dj(0) o T(0) , el trmino cuadrtico de
penalizacin de la funcin lagrangiana aumentada es reformulado introduciendo un factor de
peso global W comn a todas ellas ( iO, jD, ). Este factor de peso W se refiere a la
ponderacin del trmino de restricciones de la Lagrangiana Aumentada (32) con respecto a
los trminos de la funcin objetivo original:
uO
jJ Tij O
i
W
i

Oi(0)
iI

O 2

j J

Tij liO

Oi(0)

2
iO

donde las siguientes manipulaciones llevan hacia la definicion original dada en (32):

(43)

Captulo 5: APLICACIN A LA ESTIMACIN DE MATRICES ORIGEN-DESTINO

2
2
2
2
1 O
O
(0)
O
(0) 2
O
O
(0)
iO Oi(0)
W (0) ui Tij i Oi
i Oi Tij li i Oi

iI Oi
j J
j J

O
O
(0)

O
i
i
i

2
2
iO iO Oi(0)

1
O
O

2
O

u
T

T
l

i
i
ij
i
i
ij
i
i
i
2W

2 iI
j J
j J
iO

(0) 2

Oi

139

(44)

Aquellos casos en los cuales Oi(0) = 0 o Dj(0) = 0, sern tratados individualmente conforme a sus
cotas superiores. La tarea reside ahora en la eleccin de un valor apropiado para W. Es
conveniente usar valores suficientemente grandes a fin de no partir de una solucin inicial con
mltiples restricciones violadas; de lo contrario el proceso reajustado a travs de la penalizacin
del trmino cuadrtico de la funcin Lagrangiana aumentada y las sucesivas actualizaciones de
los multiplicadores puede no comportarse correctamente. Por otro lado, el mencionado
parmetro W, aunque suficientemente grande, no debera ser mayor que un valor capaz de
bloquear el proceso de optimizacin, ya que valores elevados de W pueden impedir la
evolucin del algoritmo hacia estimados que mejoren el valor de la funcin objetivo. Sin
embargo, valores pequeos pueden dar lugar a una relajacin excesiva en el cumplimiento
de las restricciones que se pueda hacer irreversible. Por ello, Doblas y Bentez (2005)
proporcionan una regla simple avalada por un buen comportamiento en trabajos reales de ajuste
de matrices, la cual consiste en la eleccin de valores de W del mismo orden de magnitud que el
valor inicial de la funcin objetivo definida en (22) (a).
De forma anloga a lo sucedido con las restricciones, el trmino de la funcin Lagrangiana
aumentada (32) asociado con los volmenes de frontera debe ser modificado mediante una
normalizacin respecto del volumen observado en cada frontera, v b , quedando:

Laug T, b
2 bB iI jJ

Tij ak pk v

kK

ab
ij

vb

(45)

No obstante, por cuestiones de sencillez en la formulacin matemtica as como de tamao de


las ecuaciones, esta normalizacin no es introducida en la formulacin original. El hecho de
presentar un modelo que incluya esta normalizacin puede complicar la comprensin del
modelo por lo que se ha optado por no reformular las expresiones en funcin de dichas
normalizaciones.

140

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

5.4 CASOS PRCTICOS


5.4.1 Experimento 1: Red SiouxFalls
5.4.1.1

Configuracin de la red

Se ha aplicado el procedimiento de estimacin descrito en la seccin anterior a la red de Sioux


Falls. Esta red consta de 24 nodos, los cuales son todos centroides, 528 pares OD y 76 arcos
dirigidos. Esta red de transporte originalmente fue descrita por LeBlanc (1975) y posteriormente
usada por mltiples autores, como Suwansirikul et al. (1987), del cual se han tomado los
atributos de arcos para este ensayo. Es necesario resaltar que, para este modelo de red, los
atributos son idnticos para el arco dirigido desde el nodo A al nodo B y el asociado al sentido
contrario, aunque esto no suele ocurrir en el caso de redes reales.
La informacin topolgica para el diseo de red se ha tomado de la web de BarGera (2007b).
Las funciones de coste o demora responden a la expresin general de las BPR (Bureau of Public

4
va
, donde va es el volumen del arco a, Ta representa el tiempo
ca

Roads), sa (va ) Ta 1 0.15

de viaje a velocidad de flujo libre y ca es la capacidad del arco a.


Para completar la construccin de la red para este ensayo es necesario definir la distribucin
celular de la red de telefona asociada a dicha red de transporte, es decir, las celdas y reas de
localizacin que cubren los nodos de la red de transporte. Esto permite identificar el conjunto de
fronteras observadas, y sus correspondientes grupos de arcos observados, que constituirn el
conjunto de volmenes de trfico inferidos de la telefona mvil. Tpicamente, el radio de una
celda vara desde 200 metros en entornos urbanos a dimensiones entre los 5 y 20 km en
entornos rurales. Debido al carcter de este ensayo junto a la sencillez topologica de esta red, no
se han utilizado criterios de dimensin o tamao para el diseo celular, de modo que los nodos
se han agrupado en celdas de un modo arbitrario atendiendo a criterios de vecindad.
Posteriormente, dichos conjuntos de celdas se han agrupado en reas de localizacin,
obteniendo la red mostrada en la Figura 5-1, la cual contiene 22 fronteras observadas vlidas
con 34 arcos implicados.

Captulo 5: APLICACIN A LA ESTIMACIN DE MATRICES ORIGEN-DESTINO

141

Figura 5-1: Red de Sioux Falls, incluyendo distribucin ficticia de LAs y celdas.

Inicialmente existan un conjunto mayor de fronteras entre celdas pero, tras realizar un
procesado previo, finalmente slo 22 fronteras fueron calificadas como vlidas para ser
utilizadas en el ensayo. La razn principal residi en criterios topogrficos dado que haba arcos
que cruzaban fronteras entre celdas pero cuyo nodo origen o destino no estaba incluido en
alguna de las dos celdas asociadas a la frontera. Ese fue el caso de los arcos 37 y 38, los cuales
cruzaban las fronteras entre la celda 3 y 9 y entre la 9 y 10, pero su nodo origen o su nodo
destino estaba en la celda 3 o en la 10. Por tanto, esos arcos introducan distorsin en la
monitorizacin de esas fronteras (entre 3 y 9 y entre 9 y 10), dado que pese a cruzarlas, no
cumplan la definicin de frontera observada indicada en el apartado 4.3.2. Una frontera
observada o aforo virtual lo conforman los arcos cuyo nodo inicial y nodo final estn en
celdas distintas y contiguas. Ante esta situacin, las 4 fronteras correspondientes (una frontera
entre celdas son dos fronteras observadas, una por cada sentido) no podan pertenecer al
conjunto de fronteras observadas vlidas. Idntica situacin experimentaban los arcos 56 y 60,
anulando las dos fronteras observadas asociadas a la frontera entre la celda 7 y 8. La Tabla 5-1
muestra las fronteras observadas consideradas definitivamente vlidas y sus corresponientes
arcos.

142

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

Tabla 5-1: Fronteras observadas vlidas y arcos asociados.

Id
frontera
1

Celda
Origen
1

Celda
Destino
2

Id
Arcos
1, 9

Id
frontera
12

Celda
Origen
5

Celda
Destino
2

7, 10

13

3
4
5
6
7
8
9

2
2
2
3
3
4
4

1
4
5
1
4
2
3

14
15
16
17
18
19
20

5
5
6
7
7
7
8

6
7
5
4
5
9
10

10

21

41, 72

11

3, 11
13
16
31, 35
32
23
27
24, 29,
30
28

Id
Arcos
19
21, 48,
51
20, 50
53
17, 55
43
58
44, 70
66

22

10

75

La metodologa propuesta exige, como prerrequisito, un conjunto de volmenes en fronteras (o


volmenes agregados sobre grupos de arcos) y una matriz OD previa. En general, esta matriz
previa es obtenida de algn estudio cronolgicamente anterior o de una encuestacin bsica que
predefina la estructura de la matriz final a obtener. Para este ensayo, no se dispone de tal matriz
de partida aunque s de una matriz OD factible, disponible en la web de BarGera (2007b). De
modo que dicha matriz ser considerada como matriz auxiliar para obtener una matriz previa
mediante un proceso de distorsin. Este proceso de distorsin consiste en multiplicar la matriz
auxiliar por una matriz de coeficientes aleatorios entre 0.5 y 1.5, segn posibles
incrementos/decrementos del nmero de viajes en cada par OD; obteniendo finalmente una
matriz de partida (o previa) para ajustar, la cual estar formada tambin por 528 pares OD
definidos por los 24 centroides de la red.
Por otro lado, para el proceso de ajuste tambin se necesitan datos de volumen en cada frontera
observada, es decir, volumen agregado por grupos de arcos que cruzan cada frontera.
Obviamente, no se dispone de datos derivados de una red de telefona real para este ensayo. Por
ello, la obtencin de unos volmenes para ser utilizados en el proceso implica algn proceso de
simulacin que permita obtener tales datos. De modo que, una vez que se tienen identificados
los arcos que pertenecen a cada frontera observada vlida, se obtiene el volumen de cada
frontera sumando los volmenes del grupo de arcos que conforman tal frontera. Estos
volmenes de arco son tomados de una solucin factible con respecto a flujos en arcos,
proporcionada por BarGera (2007b). Como se explic en la seccin 4.3 la inferencia de
volmenes mediante datos de telfonos no es un proceso exacto sino que ofrece pequeas
fluctuaciones o errores de estimacin respecto a la medida proporcionada por un aforo instalado

Captulo 5: APLICACIN A LA ESTIMACIN DE MATRICES ORIGEN-DESTINO

143

en la misma frontera. En este sentido, el error relativo absoluto medio alcanzado por los
modelos de prediccion seleccionados en el Captulo 4 durante la validacin numrica
empleando volmenes observados por estaciones de aforo se situ en torno al 20%. Bajo esta
condicin, finalmente, los volmenes observados de frontera son obtenidos multiplicando el
volumen agregado de cada frontera anteriormente explicado por un coeficiente aleatorio entre
0.8 y 1.2. Este rango es usado para introducir una distorsin en el volumen de frontera
observado a fin de simular la discrepancia entre volmenes inferidos de datos de telfonos
mviles y volmenes reales de vehculos que realmente circularon.
5.4.1.2

Resultados

El objetivo de este apartado es presentar los resultados de este primer ensayo realizado para
verificar la consistencia y eficiencia del algoritmo desarrollado. Para este caso se ha tomado un
valor de W =10 junto con unos criterios de terminacin de asignaciones para el cdigo
comercial usado (EMME/2) basados en un nmero medio de iteraciones por asignacin para
alcanzar las condiciones de equilibrio de usuario Niter=20, relative gap (%)=0.5, normalized
gap (min)=0.5. Para ms detalles sobre estos criterios de terminacin de la etapa de asignacin
(nmero de iteraciones, rgap, ngap) y otros, consultar las referencias EMME/2 (1998),
MINUTP (1993), TRANSCAD (2006), y TRIPS (1990).
Para el problema de nivel superior (22), los valores de las cotas superiores e inferiores, {uij, lij}
en el caso de cada viaje o par OD, sern +25% y 25% de Tij(0) respectivamente; para viajes
generados { uiO , liO }, +15% y 15% de Oi(0) jJ Tij(0) ; para viajes atrados { u Dj , l Dj }, +15% y
iI Tij(0) ; y para viajes totales {u,l}, +10% y 0% de T (0) iI jJ Tij(0) . Se
15% de D (0)
j
aprecia que estos valores de cotas estn expresados en trminos del estimado inicial para que,
tras normalizar, se obtengan cotas relativas. Estos valores limitarn la distorsin experimentada
por la matriz OD previa.
Para presentar los resultados ms significativos se utiliza tanto formato numrico como grfico.
La Figura 5-2a muestra los volmenes de frontera (o agregados por grupos de arcos que cruzan
cada frontera) obtenidos al asignar la matriz OD previa a la red de Sioux Falls frente a los
volmenes observados en dichas fronteras. Estos ltimos procederan de datos de movilidad
derivados de conteos de telfonos cruzando fronteras entre celdas colindantes. La Figura 5-2b
corresponde a la representacin de los volmenes de frontera obtenidos por asignacin de la
matriz estimada usando el mtodo propuesto frente a los observados derivados de paso de
telfonos por el mismo conjunto de fronteras. Esta figura muestra una buena correlacin entre

144

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

los volmenes observados y los modelados al asignar la matriz final estimada (R2=0.737),
teniendo en cuenta el inters de preservar la informacin contenida en la matriz OD de partida,
alcanzando una razonable mejora respecto al R2 de partida (R2=0.488). Respecto a la pendiente
de la recta (y=a+bx), tambin se logrado una mejora (b=0.967) respecto de la previa (b=0.912).

35000

30000
25000
20000
15000
10000

y = 0,912x + 781,693

5000

R = 0,488

Volmenes de frontera modelados


despus del ajuste (viajes)

Volmenes de frontera modelados


antes del ajuste (viajes)

35000

30000
25000
20000
15000
10000

y = 0,967x + 645,073

5000

R = 0,737

0
0

5000

10000

15000 20000 25000 30000 35000

Volmenes de frontera observados


(viajes inferidos de telfonos)
(a)

5000

10000 15000 20000 25000 30000 35000

Volmenes de frontera observados


(viajes inferidos de telfonos)
(b)

Figura 5-2: Correlacin entre los volmenes observados en fronteras (grupos de arcos) y los
modelados al asignar la matriz previa (a) y la matriz estimada (b).

Lo anterior evala los resultados del ajuste en trminos de volmenes, no obstante, la


metodologa tambin atiende a criterios de control de la distorsin que experimenta la
informacin contenida en la matriz estimada, a diferentes niveles de agregacin (viajes
generados, atrados y totales), durante el proceso de ajuste. En este sentido, para evaluar la
distorsin experimentada por la matriz estimada respecto a la previa durante el ajuste, se
presenta la Figura 5-3, la cual compara el nmero de viajes de cada celda de la matriz OD
previa frente al nmero de viajes de los mismos pares OD de la matriz final estimada usando la
metodologa. El grfico revela los reducidos niveles de desviacin del nmero de viajes de cada
par OD de la matriz estimada respecto a los de la matriz previa (R2=0.934). Se puede ver
claramente que la nube de puntos queda confinada en una estrecha banda delimitada por los
incrementos y decrementos mximos establecidos como parmetros del proceso de ajuste y que,
en este caso, son de un 25%. Una grfica similar se puede obtener para los viajes generados
(agregacin en destinos) y para los viajes atrados (agregacin en orgenes), pero las bandas en
este caso situarn el nmero de viajes dentro de unos incrementos/decrementos del 15%.

Viajes de los pares O-D de la


matriz ajustada

Captulo 5: APLICACIN A LA ESTIMACIN DE MATRICES ORIGEN-DESTINO

145

5000
4500
4000
3500

R2 = 0,934

3000
2500
2000
1500
1000
500

Lneas de incremento y decremento del 25%

0
0

500

1000 1500 2000 2500 3000 3500 4000 4500 5000 5500
Viajes de los pares O-D de la matriz previa

Figura 5-3: Correlacin entre la matriz previa y la matriz estimada.

5.4.2 Experimento 2: Red Comunidad Autnoma de Madrid


5.4.2.1

Configuracin de la red

En este segundo ensayo, se ha tomado una red de gran tamao correspondiente a la red de la
Comunidad Autnoma de Madrid (para el ao 2004), cuyas dimensiones topolgicas son 1079
centroides, 9557 nodos regulares, 11791179 pares OD y 21713 arcos dirigidos (CRT, 2004).
Por cuestiones de nitidez grfica, la representacin del modelo de red ha sido omitida ya que la
visualizacin de los arcos y nodos resulta poco ntida debido a sus dimensiones.
Como se ha mencionado anteriormente, se precisa un conjunto de volmenes en fronteras
(agregados sobre grupos de arcos) junto con una matriz OD previa para realizar el proceso de
ajuste. La matriz OD previa se toma de un estudio anterior desarrollado sobre esta red, el cual
dispone de una matriz en perodo de hora punta de la maana (8:009:00 a.m.), correspondiente
a la Encuesta Domiciliaria de Movilidad 2004, con 11791179 pares OD.
Para los volmenes observados se ha utilizado un procedimiento basado en el citado estudio
previo desarrollado sobre esta red. De l, se tom una matriz OD resultado de un proceso de
ajuste con aforos tradicionales. Esta matriz, tras asignarla a la red, permiti disponer de unos
volmenes de todos los arcos que podan considerarse, tericamente, como reales. Estos
volmenes de arco seran los empleados ms adelante para obtener los volmenes de frontera
(grupos de arcos). Basndose en los resultados del ensayo desarrollado en el Captulo 4 sobre
volmenes inferidos con datos de telefona mvil, stos presentan pequeas diferencias respecto
a la medida proporcionada por una estacin de aforo instalada en la misma frontera. De modo
que esos volmenes de arco anteriormente obtenidos son escalados por un coeficiente aleatorio

146

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

entre 0.8 y 1.2 para introducir una distorsin en el volumen final observado que permita simular
el valor de error relativo en valor absoluto, alcanzado en el citado ensayo, entre volmenes
inferidos de datos de telfonos mviles y volmenes de vehculos que realmente circularon.
Pero la metodologa emplea volmenes sobre grupos de arcos correspondientes a fronteras entre
celdas. Por ello, se requera disponer de una distribucin celular, la cual se traz de un modo
ficticio usando 15 LAs y 20 celdas por LA (Figura 5-4). Esta distribucin permiti identificar
los grupos de arcos que conforman cada frontera, agrupando arcos usando la definicin de
frontera observada: arcos cuyos nodos de inicio y fin estn en celdas diferentes y vecinas.

Figura 5-4: Nodos de la red de Madrid agrupados en 15 LAs.

Una vez conocidos los grupos de arcos para cada frontera existente, el volumen de una frontera
observada se gener sumando los volmenes de cada uno de los arcos identificados como parte

Captulo 5: APLICACIN A LA ESTIMACIN DE MATRICES ORIGEN-DESTINO

147

de cada frontera. Sin embargo, no todas las fronteras existentes sobre una red pueden ser usadas
como vlidas debido a sus caractersticas. Esto implica la realizacin de un preprocesado sobre
el conjunto inicial de fronteras entre celdas para obtener el conjunto final de fronteras vlidas
usadas como observadas para el proceso de ajuste. En esta red, existen 412 fronteras observadas
vlidas con 1265 arcos implicados, donde el principal criterio seguido para su seleccin ha sido
evitar posibles problemas derivados de la existencia de peatones, descartando fronteras en las
que existiera algn arco con trfico de peatones asociado.
5.4.2.2

Resultados

En este caso, se ha tomado un valor de W =103 en torno al orden del valor inicial de la funcin
objetivo (32) evaluada para este problema junto con los criterios por defecto de terminacin
de las asignaciones, que emplean un nmero alto de iteraciones por asignacin (primer criterio a
ser cumplido en todos los casos) Niter=200, relative gap(%)=1, normalized gap(min)=1.
Estos valores difieren de los tomados en la red de Sioux Falls, en especial en lo que respecta al
nmero de iteraciones por asignacin, debido a que los niveles de congestin sobre la red de
Madrid son ciertamente ms altos, de modo que las condiciones de equilibrio de usuario son
ms difciles de obtener. En el problema de nivel superior (22), los valores de las cotas
superiores e inferiores de las restricciones son iguales a las del ensayo en la red de Sioux Falls.
15000

12500
10000
7500
5000

y = 0,9122x + 98,36
R2 = 0,5272

2500
0
0

2500

5000

7500

10000 12500 15000

Volmene s de fronte ra observados


(viajes inferidos de datos de te lfonos)
(a)

Volmenes de frontera modelados


despus del ajuste (viajes)

Volmenes de frontera modelados


antes del ajuste (viajes)

15000

12500
10000
7500
5000

y = 0,9929x + 138,42
R2 = 0,7631

2500
0
0

2500

5000

7500

10000 12500 15000

Volme ne s de fronte ra obse rvados


(viaje s infe ridos de datos de te l fonos)
(b)

Figura 5-5: Correlacin entre los volmenes observados en fronteras (grupos de arcos) y los
modelados al asignar la matriz previa (a) y la matriz estimada (b).

Como se ha comentado previamente, la metodologa de ajuste atiende a dos criterios: i) que la


matriz resultante reproduzca, al ser asignada a la red, los datos de los volmenes agregados lo
ms fielmente posible; y ii) que la informacin contenida en la matriz OD previa no se vea
distorsionada en exceso durante el proceso de ajuste. Para evaluar la calidad del ajuste en

148

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

trminos de volmenes se procede a comparar, numrica y grficamente, los coeficientes R2


antes y despus del ajuste a nivel de volmenes de frontera. La Figura 5-5a muestra los
volmenes agregados por grupos de arcos que cruzan cada frontera observada obtenidos tras
asignar la matriz OD previa frente a los volmenes observados en dichas fronteras derivados
de datos de telfonos. La Figura 5-5b corresponde a la representacin de los volmenes de
frontera obtenidos al asignar la matriz ajustada usando la metodologa frente a los volmenes
observados de frontera derivados de los telfonos. Se aprecia que el proceso de ajuste consigue
valores aceptables (R2=0.7631) para el nmero de arcos implicados (1265 arcos, un 5.83% del
total de arcos de la red). Respecto a la valoracin de la metodologa en trminos de distorsin de
la informacin contenida en la matriz OD estimada respecto a la de partida, la matriz OD
previa y la ajustada alcanzan un indudable alto valor de correlacin entre ellas (R2=0.9893)
debido a las restricciones impuestas.
Cabe destacar que observando la Figura 5-5 se aprecian dos outliers que potencialmente afectan
a los valores de R2. Esos outliers pueden ser debidos a que la frontera o grupo de arcos contiene,
por ejemplo, algn arco con lnea de transporte pblico asociada o incluso, que tenga prximo
un ncleo residencial que introduzca prdidas. Estas situaciones inducen alteraciones respecto a
la media, de modo que los modelos de estimacin de volmenes no pronostican con la precisin
esperada. Se podra estudiar en detalle el origen de esos outliers para decidir si se consideran
vlidas o no las fronteras asociadas; sin embargo, dado que en el planteamiento inicial se
consideraron vlidas, se ha optado por mantenerlas en la representacin de los resultados.
En este ensayo, al disponer de volmenes de arcos para generar los de frontera surge la
posibilidad de evaluar las comparaciones de volmenes pero a nivel de arco, es decir,
desagregando los volmenes observados de frontera (grupos de arcos) en volumen a nivel
individual de arco. La Figura 5-6 a y b muestra la representacin de los volmenes observados
desagregados a nivel de arco frente a los volmenes obtenidos por asignacin de la matriz OD
previa y la ajustada, respectivamente, sobre el conjunto de arcos implicados en las fronteras.
Observando la Figura 5-5b y la Figura 5-6b se hace patente el comportamiento similar en
trminos de correlacin entre los volmenes observados y estimados, representndolos tanto a
nivel de frontera (agregado por arcos) como a nivel de arco.

Captulo 5: APLICACIN A LA ESTIMACIN DE MATRICES ORIGEN-DESTINO

5000

4000
3000
2000
1000

y = 0,8713x + 53,219
R2 = 0,5143

0
0

1000

2000

3000

4000

Volmenes de arco modelados


despus del ajuste (viajes)

5000

Volmenes de arco modelados antes


del ajuste (viajes)

149

4000
3000
2000
1000

5000

Volme ne s de arco obse rvados


(viaje s infe ridos de te l fonos)
(a)

y = 1,0632x + 10,6958
R2 = 0,7599

0
0

1000

2000

3000

4000

5000

Volme ne s de arco obse rvados


(viaje s infe ridos de datos de te l fonos)
(b)

Figura 5-6: Correlacin entre los volmenes de arcos observados (pertenecientes a alguna frontera
observada) y los modelados al asignar la matriz previa (a) y la matriz estimada (b).

La Tabla 5-2 compara los resultados (R2 y ecuacin de recta regresin) evaluados a nivel
individual de arco y de grupos de arcos. Lgicamente, el R2 alcanzado tras el ajuste evaluado a
nivel de volumen agregado (grupos de arcos) ser mejor que el evaluado a nivel de volumen de
arco, dado que la informacin observada en la que se basa el proceso de ajuste viene expresada
a esa escala agregada por grupos de arcos. Bajo este mismo razonamiento, el offset y la
pendiente de la recta evaluada a nivel de volumen de arco no alcanzarn una mejora
significativa frente a los de la previa. Mientras que en el caso de la recta evaluada sobre
volmenes agregados tras el ajuste s se consigue que la pendiente sea muy prxima a la unidad
(b=0.9929), idealmente 45, manteniendo un valor de offset bajo pese a trabajar con escala
agregada de volmenes.
Tabla 5-2: Comparativa de ecuacin de la recta de regresin y R2, antes y despus de ajuste.

Antes del ajuste

Despus del ajuste

Comparando volmenes
en grupos de arcos

R2=0.5272
y=98.36+0.9122x

R2=0.7631
y=138.42+0.9929x

Comparando volmenes
en arcos

R2=0.5143
y=53.219+0.8713x

R2=0.7599
y=10.696+1.0632 x

Otro criterio para evaluar este planteamiento de ajuste con volmenes agregados sobre grupos
de arcos en lugar de mediante volmenes en arcos es comparar los resultados que se obtendran
empleando ambas metodologas: con volmenes a nivel de arco y de frontera (grupos de arcos).
De cara a la eleccin de una metodologa de estimacin que trabaje con volmenes de arcos
para ajustar una matriz previa, la ms adecuada, a efectos de comparacin con la planteada en

150

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

esta Tesis, es la desarrollada por Doblas y Benitez (2005). Se trata de valorar el uso de
volmenes agregados sobre grupos de arcos en lugar de los clsicos conteos de trfico, por ello
esa metodologa es la que mejor comparativa de prestaciones ofrecera dado que, en esencia, el
algoritmo de ajuste seguido en esta Tesis est basado en l, pero con las modificaciones
oportunas para trabajar a nivel de grupos de arcos.
En base al razonamiento anterior, se realiz un proceso de ajuste de la misma matriz OD de
partida pero utilizando como volmenes observados medidas proporcionadas por aforos
instalados sobre 1420 arcos de la red, disponibles de un estudio anterior desarrollado sobre la
misma red. Es preciso hacer notar que en el ensayo empleando volmenes de frontera se
monitorizaron 1265 arcos asociados a las 412 fronteras observadas. De manera que, aplicando la
metodologa desarrollada por Doblas y Benitez (2005), la cual realizaba el proceso de ajuste con
volmenes observados a nivel de arcos, el coeficiente R2 entre los volmenes observados y los
estimados (R20.80) no reflej una mejora muy significativa comparada con la metodologa
propuesta a nivel de grupos de arcos (R20.76). Sin embargo, utilizar datos procedentes de
estaciones de aforo implica unos costes asociados a la infraestructura de detectores que con la
telefona mvil no existiran. En este ltimo caso, los volmenes se basaran en datos de
telfonos ya disponibles por los operadores para su propio funcionamiento, sin necesidad de
instalacin de mdulos adicionales ni reducir significativamente la exactitud obtenida del ajuste,
como se ha demostrado en este ensayo.
Un ltimo aspecto a comentar es la convergencia del algoritmo de ajuste. La Figura 5-7a
muestra la evolucin de la funcin objetivo de la Lagrangiana Aumentada (32) durante el
proceso de ajuste, mostrando la rpida convergencia lograda, dadas las dimensiones del
problema, ejecutndolo con 5 subproblemas de 10 iteraciones cada una. La evolucin tpica de
la Lagrangiana aumentada, respecto al trmino ms significativo, se aprecia con ms detalle en
la Figura 5-7b. El trmino correspondiente a las restricciones funcionales (Figura 5-7c) muestra
un orden de magnitud muy inferior al del trmino cuadrtico asociado a los volmenes de
frontera, reflejando el nivel de control que sobre la informacin contenida en la matriz OD
ejerce el trmino correspondiente a las restricciones. Este efecto se debe a que las restricciones
de viajes generados, atrados y totales no suelen violar las cotas superiores e inferiores que
tienen impuestas, por lo que no son tan restrictivas como las de variables acotadas. La rpida
convergencia alcanzada con las etapas del algoritmo tambin puede ser observada en las
grficas demostrando que, a efectos prcticos, el proceso iterativo se podra haber detenido
antes de que los criterios de terminacin impuestos sean alcanzados (nmero de subproblemas y
nmero de iteraciones por subproblema), consiguiendo ajustes ms rpidos.

Captulo 5: APLICACIN A LA ESTIMACIN DE MATRICES ORIGEN-DESTINO

151

5,00E+08
Funcin objetivo

4,00E+08
3,00E+08
2,00E+08

Lagrangiana Aumentada
Trmino restricciones funcionales
Trmino cuadrtico de volmenes observados

1,00E+08
0,00E+00
1

Subproble mas
(a)

Funcin objetivo

2,696E+08

Lagrangiana Aumentada
Trmino cuadrtico de volmenes observados

2,694E+08
2,691E+08
2,689E+08
2,686E+08

Funcin objetivo

Subproble mas
(b)

2,00E+04
1,75E+04
1,50E+04
1,25E+04
1,00E+04
7,50E+03
5,00E+03
2,50E+03
0,00E+00

Trmino restricciones funcionales


1

Subproble mas
(c)

Figura 5-7: (a) Evolucin de la funcin objetivo durante el proceso de ajuste de la matriz. (b) Zoom
para los subproblemas 25. (c) Zoom para el trmino de las restricciones de la funcin objetivo.

Con ello se ha realizado una validacin experimental en la que se revela que emplear volmenes
agregados sobre grupos de arcos, en lugar de desagregados a nivel individual de arco, en los
procedimientos para el ajuste de matrices constituye una alternativa viable que no penaliza
significativamente la exactitud obtenida. En especial, si estos volmenes agregados se infirieran
de la telefona mvil se lograra reducir el coste econmico y temporal del estudio frente a los
procedimientos tradicionales basados en aforos.

152

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

CAPTULO 6
CONCLUSIONES Y LNEAS FUTURAS

6.1 CONCLUSIONES
6.1.1 Introduccin
Esta Tesis est enfocada a la aplicacin de los sistemas de telefona mvil en los estudios de
movilidad de transporte. El objetivo principal ha sido la realizacin de aportaciones importantes
en el campo de la inferencia de volmenes de trfico y en la estimacin de matrices OD,
orientndolas a datos tomados de los sistemas de telefona mvil. La telefona mvil se est
convirtiendo en un sector de gran utilidad en el mbito del trfico. En este contexto, el Captulo
3 revis en profundidad el EstadodelArte presentando los conocimientos actuales sobre la
estimacin de parmetros de trfico mediante el uso de informacin procedente de sistemas de
telefona mvil, as como las prestaciones y beneficios que ofrecen este tipo de estimaciones.
En el Captulo 4 se formularon un conjunto de modelos para la inferencia de volmenes de
trfico de vehculos mediante telfonos mviles que pasan por una determinada zona (frontera
de una celda a otra). Tras realizar un minucioso estudio comparativo entre ellos, atendiendo a
diferentes criteros, y contrastar los resultados, se seleccionaron aquellos que presentaron mejor
balance entre todos los criterios junto a una cierta exactitud de las predicciones. La forma
funcional de los modelos seleccionados puso de manifiesto:
i)

lo insuficiente de usar exclusivamente informacin de llamadas en movilidad,

ii) la necesidad de incorporar en los modelos informacin sobre la variabilidad horaria


de la conducta de los usuarios que se desplazan, en medios mecanizados, a la hora
de realizar llamadas, y
iii) la aplicabilidad de la metodologa a ciertas fronteras entre celdas dentro de unos
rangos admisibles de error.

154

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

En el estudio numrico, los valores de prediccin de los modelos seleccionados mostraron


resultados razonables en comparacin con volmenes observados por estaciones de aforo
instaladas sobre las mismas vas, pese a la naturaleza de la principal variable de entrada al
modelo: llamadas en movilidad. Este tipo de datos no representa el conjunto total de telfonos
que han pasado por una zona sino slo aquellos pertenecientes al operador de inters que, a su
vez, han realizado llamadas bajo ciertas condiciones analizadas en el apartado 4.3.2. Ante esta
situacin, la representatividad de la muestra queda condicionada en cierta medida. Lo ideal sera
emplear datos generados por telfonos que simplemente estuvieran encendidos, sin condicionar
la muestra a la realizacin de llamadas. Aunque estos datos son generados internamente por los
sistemas de telefona en su funcionamiento, como ya se explic en el Captulo 2, recopilarlos
implica una modificacin de los mdulos existentes en la plataforma del operador ya que las
APIs necesarias para su almacenamiento permanente no estn accesibles. En consecuencia, y
buscando un bajo impacto en los mdulos del operador de telefona, se opt por emplear datos
de llamadas; ms concretamente, llamadas en movilidad, las cuales se asocian a un conjunto
menos representativo de la poblacin. La validacin experimental realizada de los modelos
propuestos, los cuales consideraban esas dificultades, mostr evidencias de que la telefona
mvil constituye una alternativa vlida para la determinacin de volmenes de vehculos
pasando por una zona frente a los procedimientos tradicionales con aforos, dado que no se
reduca en gran medida la precisin lograda.
Una aplicacin inmediata de esos volmenes inferidos de la telefona mvil se enfoc al mbito
de la obtencin de matrices de movilidad. Bajo este planteamiento, el Captulo 5 abord el
problema de estimacin de matrices OD presentando un algoritmo cuya principal novedad es
el uso de informacin agregada de volmenes sobre grupos de arcos, la cual podra proceder,
entre otros, de los sistemas de telefona mvil. Para ello, se propuso una metodologa de ajuste
de una matriz previa mediante un modelo de estructura binivel empleando la adaptacin a escala
de volmenes por grupos de arcos de un algoritmo robusto y eficiente presentado por Doblas y
Benitez (2005), el cual trabajaba a nivel clsico de volumen de arco. Respecto al algoritmo de
resolucin propuesto se realiz un estudio numrico que permiti efectuar una comparativa
frente a ajustes de matrices mediante datos de aforos, destacando i) la convergencia del
algoritmo propuesto y ii) la aplicabilidad de la metodologa a redes reales de mediano o gran
tamao. En este sentido se puso de manifiesto que emplear volmenes agregados sobre grupos
de arcos en los procedimientos para el ajuste de matrices constituye una alternativa viable, sin
disminuir significativamente la exactitud alcanzada, frente a los procedimientos basados en
volmenes de arco. Adicionalmente, si los volmenes agregados se infirieran de la telefona

Captulo 6: CONCLUSIONES Y LNEAS FUTURAS

155

mvil se lograra reducir a su vez el coste econmico y temporal del estudio respecto del uso
tradicional de estaciones de aforo.
Finalmente, se desea destacar que los mayores beneficios que puede reportar un desarrollo
integrado de los mtodos planteados en esta Tesis, tanto de inferencia de volmenes como de
ajuste de matrices, vienen expresados en trminos de ventajas para la sociedad obtenidos desde
el punto de vista tecnolgico. El hecho de que cada uno de esos mtodos pueda ser abordado
mediante la misma tecnologa usada por los sistemas de telefona convencionales y que exista la
posibilidad de desarrollar una herramienta capaz de integrarlos es de sumo inters para los
planificadores de transporte. Una herramienta de ajuste de matrices mediante volmenes
derivados de telfonos mviles confiere un gran potencial prctico al proceso, dado que resuelve
la problemtica debida a, fundamentalmente:
Coste. El desarrollo de modelos de estimacin que tomen datos de sistemas de
telefona mvil y terminales convencionales usados hoy en da por cualquier usuario
supone un ahorro econmico importante asociado a gastos de instalacin y
mantenimiento que conllevaran las estaciones de aforo. Desde el punto de vista de
cobertura, la red de telefona tambin ofrece un ahorro considerable dado que su zona
de servicio abarca toda la cobertura nacional, incluyendo la red viaria, mientras que la
infraestructura de los clsicos aforos es limitada, condicionando por tanto la captura de
conteos de trfico.
Tiempo. La realizacin de grandes encuestas de movilidad supone un coste
econmico y humano muy elevado, por lo que su ejecucin suele abordarse
aproximadamente cada 5 aos. Es evidente que durante ese tiempo pueda producirse un
incremento/decremento de la movilidad en una ciudad o regin debido a la variacin en
la poblacin o del parque automotor, entre otros. Con lo cual, la percepcin de
movilidad reflejada por esas encuestas suele quedarse obsoleta al poco tiempo de su
elaboracin. El disponer de datos de movilidad generados por telfonos de usuarios en
los desplazamientos que habitualmente realizan durante un da, permite actualizar de un
modo ms continuo esos datos, incluso pueden servir para elaborar otro tipo de matrices
de movilidad a niveles ms extensos de zonificacin (macrozonas).
Fiabilidad. Aunque la realizacin de encuestas est sujeta a fuertes controles de
calidad para regular su fiabilidad, en ocasiones, suelen introducir cierto sesgo debido al
diseo, seleccin o determinacin del tamao de la muestra que la genera. Incluso,
puede darse el caso que los individuos ms mviles sean los que presenten menor

156

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

probabilidad de ser entrevistados, pues son los que pasan menos tiempo en casa. Por
otro lado, la realizacin de encuestas directamente a vehculos sobre el viario es
ciertamente incmoda para los usuarios y consumen mucho tiempo, con la consiguiente
distorsin que se deriva de estos hechos. En cambio, utilizar como muestra ciertos
telfonos mviles de individuos que los llevan consigo en todo momento (i.e.: encuesta
panel), lo cual es algo habitual en nuestros estilos de vida, permite obtener datos
razonablemente representativos de las pautas de movilidad de los usuarios sin provocar
ningn tipo de perturbacin.
No obstante, el mejor criterio para evaluar el uso de la telefona mvil en el mbito de la
movilidad de vehculos es determinar el impacto de los datos estimados a partir de ella en
trminos econmicos y tcnicos. Los siguientes apartados analizan las prestaciones de
estimaciones derivadas de sistemas de telefona mvil, enfocndolas a un nivel generalizado
entre los posibles parmetros de trfico que se pueden derivar de estos sistemas.

6.1.2 Evaluacin del uso de telfonos mviles para movilidad de vehculos


Este apartado revisa las principales ventajas e inconvenientes a nivel tcnico que se han
encontrado tanto en el desarrollo de este trabajo, como en otros realizados en diferentes
proyectos pilotos.
6.1.2.1

Ventajas

Un modo de estudiar la efectividad de estas tcnicas basadas en la telefona mvil es


compararlas con los resultados obtenidos con metodologas tradicionales, respecto a las cuales
presenta ciertas ventajas. Principalmente, el tratamiento de esos datos supone manejar una
muestra muy extensa de la poblacin, debido a las altas cuotas de penetracin en gran parte de
las ciudades del mundo. Junto a ello, destaca su bajo coste de implantacin debido a que
cualquier terminal de los que son utilizados hoy en da por la mayora de usuarios puede ser
vlido como sonda de trfico.
Para conocer detalladamente las caractersticas del trfico vehicular existente en la red viaria
sera necesario aforar un gran nmero de vas de manera casi permanente, lo cual implicara
disponer de una infraestructura considerable. Por ello, en contraste con las redes de sensores
fijos (detectores, cmaras, etc.), la telefona mvil proporciona informacin para analizar y
cuantificar las variables de circulacin sobre cualquier zona donde exista cobertura telefnica
(GSM, GPRS y/o UMTS), sin necesidad de un costoso despliegue de infraestructura adicional.
Algunos de los trabajos presentados hasta el momento dejan constancia de que este tipo de

Captulo 6: CONCLUSIONES Y LNEAS FUTURAS

157

tcnicas consiguen magnficos resultados sin necesidad de gastos excesivos de mantenimiento,


debido a que no sufre los deterioros de los equipos que estn instalados a lo largo de las vas.
Asimismo, su funcionamiento es independiente de las condiciones meteorolgicas, como
pasara bajo situaciones de poca visibilidad con otro tipo de sistemas como el de lectura del
nmero de matrcula.
Por otro lado, las soluciones basadas en telefona mvil permiten derivar resultados de la
informacin procesada de un modo ms rpido que con las tcnicas tradicionales. Esto ocurre en
el caso de la estimacin tradicional de matrices OD mediante encuestas que, desde la toma
inicial de datos hasta la explotacin de los primeros resultados, supone un largo proceso que
puede abarcar un periodo de incluso aos. Las metodologas presentadas en el Estadodel
Arte muestran la rapidez conseguida a la hora de confeccionar informacin de las
caractersticas del trfico (tiempos de viaje, velocidad, etc.), llegando algunas de ellas a
proporcionar informacin en tiempo real. Esta capacidad mejora de modo considerable los
sistemas de informacin de usuarios, como consulta WEB/WAP/SMS o mediante sealizacin
VMS (Variable Message Signs), dado que facilita la toma de decisiones sobre la ruta a tomar,
hora de salida e incluso el modo de transporte a emplear. En consecuencia, se produce un efecto
de realimentacin que favorece el flujo de circulacin al conseguirse reducir los tiempos de
viaje empleados por los viajeros, debido a que stos escogen las rutas ms rpidas y menos
congestionadas.
No obstante, la principal ventaja se refleja en la mejora de la gestin y planificacin del trfico
debido al reducido tiempo de procesado de los datos. Esta mejora no se puede cuantificar en
trminos econmicos, pero s en calidad del servicio desde la perspectiva de uso diario de las
vas por parte del usuario. Segn lo expuesto en el apartado anterior, estas soluciones basadas en
telefona mvil conseguiran mejorar los sistemas de monitorizacin de trfico vehicular desde
el punto de vista de tiempo, coste (utilizara la infraestructura existente de telefona celular),
cobertura y representatividad estadstica de la muestra (alta tasa de penetracin telefnica).
6.1.2.2

Inconvenientes

Las metodologas basadas en la telefona celular poseen ciertas limitaciones de naturaleza


tcnica que podran afectar a la capacidad de la estimacin de datos de trfico. Estas
limitaciones tienen diferentes impactos segn el parmetro de trfico estudiado y, aunque ya han
sido comentadas a lo largo de la Tesis, a continuacin se describen las ms importantes.

158

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

Precisin en la informacin de posicin


La precisin de localizacin obtenida a partir de datos de telfonos mviles vara segn el
estado del telfono (encendido, llamada...). Lo ideal sera conocer la posicin exacta en
trminos de (x, y, z, t). Sin embargo, esto no es posible sin modificaciones en la red o en los
terminales. El nivel de precisin ms fino proporcionado por un sistema de telefona mvil es a
nivel de celda durante una llamada. De modo que se localiza al telfono dentro del rea de
cobertura de la estacin base a la que est conectado. Esta ubicacin es una aproximacin de la
zona geogrfica en la que un telfono se encuentra, pero no su posicin exacta. Hay un margen
de error que depende del radio de la celda. Este radio oscila entre los 100 m y 1 km en ciudades.
En entornos rurales depende de la densidad de las antenas, aunque suele oscilar entre 5 y 20 km.
Ese margen de error empeora para los telfonos que no tienen una conexin activa a la red (no
llamada), donde la precisin de la informacin de posicin es a nivel de rea de localizacin
(LA). Por ejemplo, si se trabaja a nivel de LA (agrupaciones de celdas) en lugar de a nivel de
celda, la zona geogrfica donde el telfono se puede encontrar es ms amplia y, por tanto, hay
una mayor incertidumbre.
Con independencia del inconveniente asociado al tamao de las celdas, y ms an de las reas
de localizacin, existe otra dificultad que afecta al mapeado o matching de telfonos sobre
vas existentes en el rea de servicio de estas zonas. Este efecto se puede suavizar mediante un
estudio exhaustivo entre la topologa de la red viaria y las celdas de la red, lo cual es una tarea
difcil, o mediante algoritmos de mapmatching. El nivel de error medio en el mapeado puede
ser relevante para ciertos parmetros, por lo que es un aspecto a tener en cuenta a la hora de
proporcionar resultados.
Adicionalmente, es necesario indicar que el uso del cambio de rea de localizacin quiz no es
el evento ms apropiado para el estudio de movilidad de reas urbanas. Debido a la propia
naturaleza de la distribucin celular de una red, las reas de localizacin (grupos de celdas)
pueden abarcar extensiones de terreno de grandes dimensiones. Esto implica que las fronteras
entre LA sean espacialmente poco frecuentes y, por tanto, el conjunto de reas de las que se
podr inferir los volmenes de paso ser pequeo.
Validez de los datos
La existencia de un nico telfono activo (de un pasajero o del propio conductor) dentro del
vehculo asegura dicho vehculo como una sonda vlida. Sin embargo, esta suposicin no es
suficiente en zonas con densidad de poblacin alta donde los peatones, usuarios de telfonos
mviles que estn en edificios o cualquier tipo de usuarios estticos, pueden afectar a la

Captulo 6: CONCLUSIONES Y LNEAS FUTURAS

159

estimacin de parmetros de trfico. Una solucin sencilla es considerar vlidas para extraer
datos de trfico mediante telefona mvil nicamente aquellas zonas alejadas de ncleos
urbanos o de reas residenciales dado que en esos casos los usuarios sern los ocupantes de los
vehculos que circulan por vas como autovas, vas interurbanas o similares
Si se quisiera extraer informacin de trfico mediante la telefona en entornos urbanos,
considerando la grave influencia de la presencia de peatones o usuarios estticos, se hace
indispensable una diferenciacin entre stos y los usuarios en movimiento. Los procedimientos
encargados de la identificacin y filtrado de esos telfonos novlidos resultan ser una tarea
compleja pero necesaria en la estimacin de la mayora de parmetros de trfico. Otros
parmetros, tales como velocidad o tiempos de viaje, no se ven tan afectados por estas
circunstancias puesto que los telfonos estticos son directamente filtrados debido al propio
carcter del evento usado: el handover.
Por tanto, la estimacin de datos de trfico basados en telefona mvil debe combinarse con
otros procedimientos basados en velocidad u otros mtodos capaces de implementar tal
diferenciacin. En ese sentido, el IAGB (Institute for Applications of Geodesy to Engineering)
dentro del proyecto DoiT desarroll algoritmos para determinar y describir patrones de
movilidad mediante datos annimos de telefona mvil para la identificacin del modo de
transporte que est utilizando el telfono. (Wiltschko, 2006). En ellos se desarrollaron unas
funciones de anlisis y modelos de prediccin para estimar la cantidad de miembros en cada
clase o modo de transporte, logrando as distinguir entre clases activas o no activas (vlidas
o no vlidas). En consecuencia, se consigui mayor precicisn que utilizando modelos de
estimacin de verosimilitud, requiriendo la integracin de horarios y rutas de lneas de
transporte pblico (autobuses, trenes, etc.) en los modelos. Por otra parte, es necesario resaltar
que la presencia de varios telfonos mviles en un vehculo tambin perturba la estimacin de
parmetros de trfico. Por todo ello, es necesario indicar que los datos obtenidos de telfonos
mviles deben ser calibrados con otros mtodos de monitorizacin, como detectores o cmaras,
antes de usarlos como valor definitivo.

6.1.3 Estudio de mercado


Segn lo expuesto anteriormente, los datos de movilidad origendestino son una de las fuentes
de informacin ms importantes requeridas con vista a la gestin de la red de infraestructura
terrestre y su planificacin estratgica. En el captulo anterior se ha planteado una nueva
alternativa para la obtencin de esos datos de movilidad de una forma ms rpida y precisa,
haciendo uso de volmenes de trfico inferidos de telfonos mviles.

160

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

Es obvio que las nuevas tecnologas deben ser aprovechadas para introducir mejoras en la
sociedad actual. Y qu mejor beneficio que hacer frente a los dos problemas fundamentales de
trfico: la saturacin y la seguridad. La saturacin en las carreteras, especialmente aguda en las
zonas urbanas y en las grandes ciudades, provocan molestias a los conductores, con los
consiguientes efectos negativos sobre el medio ambiente. Por otro lado, para los conductores y
otros usuarios de la carretera, unos sistemas que permitan reforzar la seguridad en trminos de
tiempo de respuesta constituyen la primera preocupacin. De manera que unos sistemas de
informacin de trfico que permitan hacer predicciones de movilidad de usuarios segn el
historial de movimientos de fechas anteriores daran un paso adelante para solventar estos
problemas. Este apartado analiza la aplicabilidad y rentabilidad de herramientas basadas en
telefona mvil, haciendo nfasis en los campos de inters de esta Tesis: volmenes de trfico y
matrices de movilidad.
6.1.3.1

Aplicabilidad

Una herramienta de ajuste de matrices mediante volmenes derivados de telfonos mviles


confiere un gran potencial prctico al proceso. No obstante, la informacin derivada de la
telefona permite obtener un amplio abanico de productos relacionados con datos de trfico, los
cuales pueden ser proporcionados a administraciones pblicas, consultoras de transporte, otras
compaas de telecomunicaciones, compaas de logstica u otras organizaciones relacionadas
con vehculos.
Principalmente, la metodologa expuesta para estimacin de matrices de movilidad est
enfocada a un uso por parte de la Administracin. Es ella la encargada de optimizar el uso de la
infraestructura terrestre desde el punto de vista del usuario (en su utilizacin diaria) as como
desde el punto de vista de las inversiones a realizar para la adecuacin de estas infraestructuras a
las necesidades previstas y pronosticadas en escenarios futuros. Con tcnicas tradicionales, los
datos de movilidad obtenidos resultan en ocasiones poco fiables. Por ello, las cuantiosas
inversiones que realiza para afrontar sus objetivos pueden verse justificadas al obtener unas
matrices OD ajustadas con datos reales y actuales procedentes de telefona celular. Estos datos
de telefona, dado su extendido uso en la sociedad espaola actual con una cuota de penetracin
de 110.8% (CMT, Enero 2009) y teniendo Vodafone una cuota de mercado por clientes del
31.2% (CMT, Enero 2009), representan a una muestra significativa de la poblacin,
contribuyendo con ello a la mejora de los estudios de movilidad.
No obstante, sus resultados beneficiarn no slo a la Administracin, sino a usuarios del sistema
de transporte (tanto privado como pblico) y a la sociedad en su conjunto. La Tabla 6-1 muestra

Captulo 6: CONCLUSIONES Y LNEAS FUTURAS

161

otras aplicaciones adicionales que se pueden derivar de un sistema de informacin de este tipo,
algunas de las cuales ya fueron comentadas en el captulo del EstadodelArte.
Tabla 6-1: Ejemplos de Aplicaciones segn mercados de negocio.

Sector
Administracin y otras autoridades
pblicas
Compaas de logstica y flotas
Proveedores de servicios LBS
Consultoras de Transporte
Empresas de Telecomunicaciones
Marketing

6.1.3.2

Aplicaciones
Matrices Origen Destino
Volmenes y flujos
Vigilancia Congestin e Incidentes
Estudios de tiempos de viaje y/o velocidades
Estudios de planificacin
Estudios de contaminacin
Gestin y planificacin de rutas
Direccionamiento guiado
Vigilancia de congestin
Estudios de tiempos de viaje
Planificacin
Contaminacin atmosfrica
Estudios de transporte
Servicios de informacin en tiempo real (sms, WAP)
Campaas, ubicaciones estratgicas, etc

Rentabilidad

En 2006 la Unin Europea (UE) aprob definitivamente la directiva 2006/24/CE sobre


retencin de datos telefnicos y de comunicaciones electrnicas. Dicha normativa obliga a los
operadores a retener ciertos datos durante un periodo de entre 6 y 24 meses para la lucha contra
el terrorismo y otros delitos graves. Todas las llamadas telefnicas debern ser registradas, tanto
las recibidas como las perdidas o no contestadas. La citada directiva tambin afectar a la
retencin de los datos correspondientes a la localizacin del lugar desde el que se realizan las
llamadas desde telfonos mviles.
Segn los clculos de las autoridades europeas, la creacin de una base de datos con todas las
llamadas efectuadas y recibidas por cada usuario, junto con la infraestructura necesaria, le
supondr a cada compaa una inversin que superar los 100 millones de euros, sin incluir el
gasto anual asociado a su mantenimiento. Esta infraestructura para almacenar los datos puede
utilizarse adicionalmente para otro tipo de aplicaciones. En concreto, segn lo comentado en
prrafos anteriores, sera de gran utilidad en aplicaciones relacionadas con los sistemas
inteligentes de transporte (ITS), los cuales requieren datos de localizacin annimos para
efectuar sus estimaciones y ajustes. Con ello, el gasto para desplegar esta nueva infraestructura
impuesta por la Unin Europea podra verse compensado con la distribucin de este nuevo

162

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

sistema de informacin de trfico, el cual resultara muy llamativo para la Administracin, que
se encarga de realizar las inversiones para mejorar la gestin y planificacin de la red.
El coste medio de una encuesta (encuesta+procesado) para estimar matrices OD oscila
alrededor de los 30 . Para ajustar las matrices O-D de modo apropiado, estas encuestas deben
efectuarse sobre una muestra representativa de la poblacin; por ello, su coste resulta muy
elevado. A ello se le une el coste temporal, debido a que el tratamiento de los datos de las
encuestas supone un largo proceso. Por ello estas encuestas suelen actualizarse con los datos
recogidos por los tradicionales aforos. El emplear informacin derivada de la telefona para
actualizar o, incluso, generar estas matrices sera una alternativa de especial inters para la
Administracin puesto que se conseguiran revolucionar los estudios de movilidad desde el
punto de vista de coste (utilizara la infraestructura existente de telefona celular), fiabilidad (son
datos de movilidad reales) y temporal, pudiendo dar respuesta inmediata a los problemas
derivados de ella.
6.1.3.3

Valor Aadido para la Sociedad de la Informacin

Como ya se ha comentado, una matriz O-D obtenida de una forma automtica y, en cierto
modo, inmediata supondra una autntica revolucin en los estudios de movilidad encargados
por la Administracin. Junto a ello, podra dar tambin una respuesta inmediata a los problemas
derivados de la movilidad, permitiendo abordar temas a los que hasta ahora ha dedicado pocos
recursos, como la movilidad en fin de semana, movilidad motivo ocio, movilidad a pie, etc.
Asimismo, este sistema de informacin puede solventar otros problemas derivados del
incremento de trfico experimentado en la mayora de las reas metropolitanas de los pases
desarrollados como la saturacin, la seguridad y la escasez de nuevos servicios. Por ello, sector
pblico y privado deben trabajar de manera conjunta para introducir estas herramientas de
automatizacin, fomentando la integracin de las nuevas tecnologas en nuestra vida cotidiana.
Adicionalmente, este tipo de desarrollo en I+D+i aportara un retorno proveniente de la imagen
social que se generara en la colaboracin operadororganismo pblico para la incorporacin de
nuevas tecnologas en la mejora de la planificacin de la movilidad mecanizada.

6.2 LNEAS FUTURAS


Tras la realizacin de esta Tesis, y teniendo en cuenta el EstadodelArte y el Estadodela
Prctica en el momento de su terminacin, as como las conclusiones anteriormente expuestas,
el siguiente prrafo presenta unas sugerencias para posibles futuras lneas de investigacin:

Captulo 6: CONCLUSIONES Y LNEAS FUTURAS

163

Perfeccionamiento de los modelos de prediccin de volmenes de vehculos


propuestos.
En primer lugar, resulta prometedora la continuacin directa de la lnea de investigacin
de la Tesis mediante el diseo de modelos ms robustos para estimar los volmenes
debido a que las llamadas en movilidad presentan una fuerte componente de
aleatoriedad y un reducido tamao de la muestra respecto a la poblacin. Se sugiere un
estudio ms completo que tenga en cuenta patrones de movilidad asociados a las vas
que conforman la frontera entre celdas as como sus caractersticas topolgicas (cercana
a una ciudad, polgonos en sus alrededores).
A continuacin se proponen nuevas lneas directamente relacionadas con la Tesis.
Investigacin y desarrollo de modelos de estimacin de volmenes de trfico basados
en datos del cambio de rea de localizacin generados por telfonos que simplemente se
encuentran encendidos.
Estudio de otros parmetros de trfico (velocidades, tiempos de viaje, densidad.).
Desarrollo de una metodologa para la elaboracin de matrices a nivel de macrozonas.
Desarrollo de modelos de identificacin de peatones para el filtrado y depuracin de
la muestra con terminales vlidos.
Anlisis de clusterizacin entre curvas de intensidades de vehculos proporcionados
por estaciones de aforo e intensidades inferidas de la telefona mvil.

164

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

BIBLIOGRAFA
Abrahamsson T. Estimation of origin-destination matrices using traffic counts a literature
survey. Interim report, International Institute for Applied Systems Analysis, A-2361. Laxenburg,
Austria, 1998.
Ahas R., lar M. Location based servicesnew challenges for planning and public
administration?. Futures, vol. 37(6), 547-561, 2005
AirSage. Using Cellular Technology to Provide an Intelligent Traffic Roadmap. Disponible on
line (Acceso Junio, 2007): http://www.airsage.com/pdf/trafficewise_release.pdf
Akin D., Sisiopiku V. P. Estimating origin-destination matrices using location information from
cell phones. Proc. of 49th Annual North American Meetings of the Regional Science Association
International, Puerto Rico, 2002.
Bar-Gera H. Evaluation of a cellular phone-based system for measurement of traffic speeds and
travel times: A case study from Israel. Transportation Research Part C, vol. 15(6), 380391,
2007.
Bar-Gera H. Transport Network Test Problems. Ben-Gurion University of the Negev.
Disponible online (Acceso Mayo, 2007b): http://www.bgu.ac.il/~bargera/tntp/
Bazaraa M. S., Shetty C. M. Nonlinear Programming: Theory and Algorithms. John Wiley &
Sons, Inc, 1979.
Beckmann M., McGuire C., Winsten C. Studies in the Economics of Transportation. Yale
University Press, New Haven, Connecticut, 1956.
Bekhor S., Hirsh M., Nimre S., Feldman I. Identifying Spatial and Temporal Congestion
Characteristics using Passive Mobile Phone Data. Transportation Research Board 87th Annual
Meeting, CD-ROM paper no. 1534, 2008.
Bell M.G.H. The estimation of an origin-destination matrix by constrained generalized least
squares. Transportation Research 25, 1322, 1991.

166

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

Birle C., Wermuth M. The Traffic Online Project. Special Session: Cellular-based traffic data
collection. SS45 (EU). 13th World Congress on ITS, London, United Kingdom, 2006.
Bolla R., Davoli F., Giordano F. Estimating road traffic parameters from mobile
communications. 7th World Congress on ITS, Torino, Italy, 2000.
Caceres N., Benitez F.G., Romero L.M., Vzquez J., Wideberg J. Herramienta para la
inferencia y actualizacin de matrices O-D de movilidad a travs de datos de telefona celular.
Informe Final FOM/486/2003, 2005.
Caceres N., Wideberg J. P., Benitez F. G. Deriving origin-destination data from a mobile phone
network. IET Proc. Intelligent Transport Systems, vol. 1(1), pp. 1526, 2007.
Caceres N., Wideberg J., Benitez F.G. Review of traffic data estimations extracted from cellular
networks, IET Proc. Intelligent Transport Systems, vol. 2(3), pp179192, 2008.
Cascetta E. Estimation of trip matrices from traffic counts and survey data: A generalized least
squares estimator, Transportation Research, 18B, 1984.
Cascetta E., Nguyen S. A unified framework for estimating or updating origin/destination
matrices from traffic counts. Transportation Research, 22B. 437-455, 1988.
Cayford R., Johnson T. Operational Parameters Affecting Use of Anonymous Cell Phone
Tracking for Generating Traffic Information. Transportation Research Board 82th Annual
Meeting, vol. 1(3):033865, 2003.
CMT (Comisin del Mercado de las Telecomunicaciones). Informe Telefona Mvil. Enero,
2009.
CDB, Communities Dominate Brands. A mobile phone for every living person in Western
Europe:

penetration

hits

100%.

Disponible

online

(Acceso

Octubre,

2007):

http://communities-dominate.blogs.com/brands/2006/03/phone_for_every.html
CRT, Consorcio Regional de Transportes de la Comunidad de Madrid, Modelizacin de la
Movilidad en Da Laborable de 2004 en la Comunidad de Madrid, 2004.
Chen Y., Florian M. OD demand adjustment problem with congestion: Part I. model analysis
and optimality conditions. In L. Bianco and P. Toth (Eds.), Advanced Methods in
Transportation Analysis, pp. 122. Berlin: Springer-Verlag, 1996.

BIBLIOGRAFA

167

Decell AutoRoute1 Real-Time Route Guidance. Disponible online (Acceso Junio, 2006):
http://www.decell.com/autoroute1/real_time.htm
Deheuvels P. La Fonction de Dependence Empirique et ses Propiets. Un test non parametrique
dindependence. Academie Royale de Belgique Bulletin de la Classe des Sciences-5e, 65: 274
292, 1979.
Delcan. Press Release. Delcan.NET and ITIS Holdings in Partnership. Disponible online
(Acceso Abril, 2005): http://www.itisholdings.com/pdf/delcanitis290405.pdf
Doblas F.J., Benitez F.G., 2005. An Approach to Estimating and Updating Origin-Destination
Matrices Based Upon Traffic Counts Preserving the Prior Structure of a Survey Matrix.
Transportation Research Part BMethodological, vol. 39, no. 7, pp. 565591.
EIA/TIA IS-95. Mobile Station-Base Station Compatibility Standard for Dual-Mode Wideband
Spread Spectrum Cellular System, 1993.
EMME/2. Users Manual, Software Release 9. INRO Consultants Inc, 1998.
Gavish B., Sridhar S. The impact of Mobility on Cellular Network Configuration, 4th Intern.
Conf. on Telecommunication Systems: Modelling and Analysis, pp. 197211, ATSMA,1996.
Gibson J.D. (ed). The mobile communications handbook, Second Edition. CRC Press & IEEE
Press, 1999.
Hellinga B., Fu L., Takada H. Traffic network condition monitoring via mobile phone location
referencing an emerging opportunity. Proc. of the 6th Transportation Specialty Conference
held in conjunction with the Annual Conference of the Canadian Society of Civil Engineers,
Toronto, Canada, 2005.
Hernando Rbanos J.M. Sistemas de Comunicaciones Mviles de Tercera Generacin IMT
2000 (UMTS). Ed. Fundacin Airtel-Vodafone, 2002.
Herrera J., Bayen A. Traffic flow reconstruction using mobile sensors and loop detector data.
Transportation Research Board 87th Annual Meeting, CD-ROM paper no. 1868, 2008.
Hong D., Rappaport S.S. Traffic model and performance analysis for cellular mobile radio
telephone systems with prioritized and nonprioritized handoff procedures, IEEE Trans. Veh.
Technol., vol. VT35, no. 3, pp. 448461, 1986.

168

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

Hpfner M., Lemmer K., Ehrenpfordt I. Cellular Data for Traffic Management First Results of
a Field Test. ITS Europe Conference, CD-ROM paper no. 2407, 2007.
Huidobro J.M. Comunicaciones Mviles. Ed. Paraninfo, 2002.
Ilyas M., Mahgoub I. (Editors). Mobile Computing Handbook. CRC Press, 2005.
ITIS Holdings Press Releases. Estimotion Technology chosen for traffic collection in Antwerp.
Disponible online (Acceso Septiembre 2004): http://www.itisholdings.com/pdf/itisproximus.pdf
Kummala J. Travel time service utilising mobile phones. Finnish Road Administration, Helsinki.
Finnra Report 55/2002. 67pp, 2002.
LeBlanc L.J. An Algorithm for the Discrete Network Design Problem. Transport Science, 9(3),
pp. 183199, 1975.
Linauer M., Leihs D. Generating floating car data by using GSMnetwork. Proc. of the 10th
World Congress and Exhibition on Intelligent Transport Systems and Services. Madrid, 2003.
Lovell D. J. Accuracy of speed measurements from cellular phone vehicle location systems.
ITS Journal, vol. 6, no. 4, pp. 303325, 2001.
Low D.E. A new approach to transport system modelling. Traffic Quarterly, vol. 26, no. 3, pp.
391404, 1972.
Maher M.J. Inferences on trip matrices from observations on link volumes: A Bayesian
statistical approach. Transportation Research, 17B. 435447, 1983.
MINUTP. Technical User Manual. Hague Consulting Group, HCG. V.93A, 1993.
MTS (Mobile Traffic Service), LogicaCMG. LogicaCMG provides reliable and comprehensive
traffic information based on GSM network data. Disponible online (Acceso Noviembre, 2003):
http://www.logica.com/logicacmg+provides+reliable+and+comprehensive+traffic+information
+based+on+gsm+network+data/400002401
Nelsen R. B. An Introduction to Copulas (Second Edition). Springer Series in Statistics.
Springer, New York, 2006.

BIBLIOGRAFA

169

Pan C., Lu J., Di S., Ran B. Cellular-Based Data-Extracting Method for Trip Distribution.
Transportation Research Record: Journal of the Transportation Research Board No. 1945, pp.
3339, 2006.
Patriksson M. The Traffic Assignment Problem: Models and Methods. VSP BV, 1994.
Pyo J.S., Shin D.H., Sung T.K. Development of a Map Matching Method Using the Multiple
Hypothesis Technique. IEEE Intelligent Transportation Systems Conference Proceedings.
Oakland, Calif., pp. 2327, 2001.
Rappaport T.S. Wireless Communications: Principles and Practice, Second Edition. Prentice
Hall, New Jersey, 2002.
Ratti C., Pulselli R.M., Williams S., Frenchman D. Mobile Landscapes: using location data
from cell-phones for urban analysis. Environment and Planning B: Planning and Design, vol.
33(5), pp 727-748, 2006.
Ratti C., Sevtsuk A, Huang S., Pailer R. Mobile Landscapes: Graz in Real Time. Proceedings of
the 3rd Symposium on LBS & TeleCartography. Vienna, Austria, 2005.
Reades J., Calabrese F., Sevtsuk A., Ratti C. Cellular Census: Explorations in Urban Data
Collection. IEEE Pervasive Computing, vol. 6, no. 3, pp. 3038, 2007.
Reklaitis G.V., Ravindran A., Ragsdell K.M. Engineering Optimization: Methods and
Applications. John Wiley & Sons, Inc, 1983.
Rose G. Mobile phones as traffic probes: practices, prospects and issues. Transport Reviews,
vol. 26, no. 3, 275291, 2006.
Sallent O., Valenzuela J.L., Agust R. Principios de Comunicaciones Mviles. Ediciones UPC,
Barcelona, Espaa, 2003.
Sheffi Y. Urban Transport Networks: Equilibrium Analysis with Mathematical Programming
Methods. Prentice-Hall, Inc., 1985.
Smith B.L., Fontaine M.D. Private-Sector Provision of Congestion Data. NCHRP 70-01,
University of Virginia, 2006.

170

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

Smith B.L., Pack M.L., Lovell D.J., Sermons M.W. Transportation management applications of
anonymous mobile call sampling. Proceedings of the 11th Annual Meeting of ITS America,
Miami, Florida, 2001.
Smith Institute. Realtime traffic monitoring using mobile phone data. Disponible online
(Acceso

Mayo,

2006):

www.smithinst.ac.uk/Projects/ESGI49/ESGI49-

Vodafone/Report/TrafficMonitoring.pdf
Sohn K. Dynamic estimation of origin-destination flows using cell phones as probes. SDI 2004
R04, Dept. of Urban Transportation, Seoul Development Institute, Korea, 2004.
Spiess H. A maximum likelihood model for estimating origin-destination matrices.
Transportation Research, 21B. 395412, 1987.
Spiess H. A Gradient Approach for the O-D Matrix Adjustment Problem. Publication no. 693,
Centre for Research on Transportation, University of Montreal, 1990.
Steele R., Nofal M. Teletraffic performance of microcellular personal communication networks,
IEE ProceedingsI, vol. 139, no. 4, pp. 448461, 1992.
Suwansirikul C., Friesz T.L., Tobin R.L. Equilibrium decomposed optimization: A heuristic for
the continuous equilibrium network design problem. Transport Science, 21, pp. 254263, 1987.
Thiessenhusen K.-U., Schfer R.-P., Lang T. Traffic data from cell phones: a comparison with
loops and probe vehicle data. 13th World Congress on ITS, CD-ROM, paper no. 1550. London,
United Kingdom, 2006.
Thornton J., Grace D. Effect of Lateral Displacement of a High Altitude Platform on Cellular
Interference and Handoff. IEEE Trans. Wireless Communications, vol. 4(4), pp. 14831490,
2005.
TRANSCAD. User's Guide, Version 4.8. Newton, MA, Caliper Corporation, 2006.
TRIPS. MVESTM program. INSMVA Systematica, 1990.
Van Zuylen H.J., Willumsen L.G. The most likely trip matrix estimated from traffic counts.
Transportation Research, 14B, 281293, 1980.
VDOT. Cell phones could keep you out of traffic jams. Disponible online (Acceso Septiembre,
2005): http://www.airsage.com/pdf/news-4-27-05.pdf

BIBLIOGRAFA

171

Virtanen J. Mobile phones as probes in travel time monitoring. Finnish Road Administration,
Helsinki, 2002.
White C.E., Bernstein D., Kornhauser A.L. Some Map Matching Algorithms for Personal
Navigation Assistants. Transportation Research Part C, vol. 8, pp. 91108, 2000.
White J.K., Gower P. Collecting origin-destination information from cellular phone location
data. TRL Unpublished Report, 1999.
White J., Wells I. Extracting origin destination information from mobile phone data. 11th
International Conference on Road Transport Information and Control (Conf. Publ. No. 486).
pp. 3034, 2002.
Wiltschko T., Schwieger V, Mhlenbrink W. Generating Floating Phone Data for Traffic Flow
Optimization. Proceedings of the 3rd International Symposium Networks for Mobility, Stuttgart,
Germany, 2006.
Yang H., Sasaki T., Iida Y., Asakura Y. Estimation of origin-destination matrices from link
traffic counts on congested networks. Transport Research 26B, 6, pp. 417434, 1992.
Ygnace J.-L. Travel time/speed estimates on the French Rhone corridor network using cellular
phones as probes. Final report of the SERTI V program, INRETS, Lyon, France, 2001.
Yim Y. The state of cellular probes. California PATH Research Report: UCBITSPRR2003
25, 2003.
Zeng Q-A., Mukumoto K., Fukuda K. Performance analysis of mobile cellular radio systems
with two-level priority reservation handoff procedure, IEICE Trans. Commun., vol. E80-B, no.
4, pp. 598604, 1997.

172

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

APNDICE I
GLOSARIO

A
AIC: Akaike Information Criterion (Criterio de Informacin de Akaike).
AMPS: Advanced Mobile Phone System.
AOA: Angel Of Arrival.
AuC: Authentication Center.

B
BER: Bit Error Rate.
BH: Busy Hour (hora de mayor ocupacin).
BIC: Bayesian Information Criterion (Criterio de Informacin Bayesiano).
BPR: Bureau of Public Roads.

174

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

BSC: Base Station Controller.


BSS: Base Station Sub-System.
BTS: Base Transceiver Station.

C
CC: Country Code.
CGI: Cell Global Identity. CGI = LAI + CI.
CI: Cell Identity.
CIR: Carrier to Interference Ratio.
CMT: Comisin Mercado de las Telecomunicaciones.
CSPDN: Circuit Switched Public Data Network.
CV: Coeficiente de Variacin.

E
EIR: Equipment Identity Register.

F
FCD: Floating Car Data.
FW: FrankWolfe.

G
GMSC: Gateway Mobile Services Switching Center.
GPRS: General Packed Radio Service.
GSM: Global System for Mobile Communications.

Apndice I: GLOSARIO

175

H
HLR: Home Location Register.
HO: Handover.

I
IMD: Intensidad Media Diaria.
IMEI: International Mobile Equipment Identity.
IMSI: International Mobile Subscriber Identity. IMSI = MCC + MNC+ MSIN = MCC + NMSI.
ISDN: Integrated Services Digital Network.
ITS: Intelligent Traffic Systems.

L
LA: Location Area (rea de localizacin).
LAC: Location Area Code.
LAI: Location Area Identification. LAI = MCC +MNC +LAC.
LLF: Log-Likelihood Function.
LMSI: Local Mobile Station Identity.
LPR: License Plate Recognition.
LU: Location Update.

M
MCC: Mobile Country Code.
ME: Mobile Equipment.

176

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

MNC: Mobile Network Code.


MS: Mobile Station.
MSC: Mobile services Switching Center.
MSIN: Mobile Station Identification Number.
MSISDN: Mobile Subscriber ISDN Number. MSISDN = CC + NDC +SN
MSRN: Mobile Station Roaming Number. MSRN = CC + NDC + SN
MT: Mobile Termination.

N
NDC: National Destination Code.
NMC: Network management Center.
NMSI: National Mobile Station Identity.
NSS: Network Sub-System

O
OD: OrigenDestino.
OMC: Operation and Maintance Center.
OMC-N: Operation and Maintenance Center National.
OMC-R: Operation and Maintenance Center Regional.

P
PDU: Protocol Data Unit.
PIN: Personal Identification Number.

Apndice I: GLOSARIO

PLMN: Public Land Mobile Network.


PLU: Periodic Location Update.
PSPDN: Packet Switched Public Data Network.
PSTN: Public Switched Telephone Network.

R
RA: Routing Area.
RAI: Routing Area Identification.
RLC: Radio Link Control.
RLP: Radio Link Protocol.
RSSI: Radio Signal Strenght Indicator.
RTB: Red Telefnica Bsica.

S
SIM: Subscriber Identity Module.
SN: Subscriber Number.

T
TAP: Traffic Assignment Problem.
TAZ: Traffic Analysis Zone.
TDOA: Time Difference Of Arrival.
TMSI: Temporary Mobile Subscriber Identity.

177

178

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

U
UMTS: Universal Mobile Telecommunications System.

V
VLR: Visitor Location Register.
VMS: Variable Message Signs.

APNDICE II
PUBLICACIONES

Algunos de los resultados obtenidos en esta Tesis se encuentran recogidos en las publicaciones
que se listan a continuacin, junto con otras aportaciones tambin relacionadas con ella.
PUBLICACIONES EN REVISTAS

Caceres N., Wideberg J.P., Benitez F.G. Deriving origindestination data from a mobile
phone network. IET Proc. Intelligent Transport Systems, vol. 1(1), pp. 1526, 2007.

Caceres N., Wideberg J., Benitez F.G. Review of traffic data estimations extracted from
cellular networks, IET Proc. Intelligent Transport Systems, vol. 2(3), pp. 179192,
2008.

A BiLevel Approach to Estimating Origin-Destination Trip Matrices from Cellular


Phone Data preserving the Structure of Prior Matrices' Information. (En revisin 2009).

Forecasting Traffic Flow Using Anonymous Mobile Phone Data. (En revisin 2009).

CONGRESOS INTERNACIONALES

Caceres N., Wideberg J. P., Benitez F. G. Deriving Traffic Data from a Cellular
Network. 13th World Congress on Intelligent Transport System and Services. London,
United Kingdom. 2006.

180

ESTIMACIN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONA MVIL

CONGRESOS NACIONALES

Caceres N., Romero L. M., Vzquez J., Wideberg J. P., Benitez F. G. Inferencia y
Actualizacin de Matrices O-D de Movilidad a Travs de Datos de Telefona Celular.
VII Congreso de Ingeniera del Transporte. Ciudad Real, Espaa, 2006. CIT 2006.

Caceres N., Wideberg J. P., Benitez F. G. Monitorizacin de la Movilidad y el Trfico


Mediante Datos de Telefona Mvil. VII Congreso Espaol Sobre Sistemas Inteligentes
de Transporte. Valencia. ITS Espaa. 2007.

Caceres N., Romero L.M., Benitez F. G., Wideberg J. P. Metodologa Binivel para la
Estimacin de Matrices de Movilidad con Datos Agregados de Telefona Mvil. VIII
Congreso de Ingeniera de Transporte. A Corua, Espaa, 2008. CIT 2008.

OTRAS PUBLICACIONES

Cceres N., Bentez F.G., Romero L.M., Vzquez J., Wideberg J. Herramienta para la
inferencia y actualizacin de matrices OD de movilidad a travs de datos de telefona
celular. Informe Final FOM/486/2003. ISBN: 84-88783-77-9, 2005.

OTROS MRITOS
I Premio Vodafone al Proyecto de Desarrollo e Innovacin Mvil en el mbito de la
Investigacin, entregado por la Fundacin Vodafone Espaa en 2007 al equipo formado por
Noelia Cceres Snchez, Francisco Garca Bentez y Johan P. Wideberg del grupo de
Ingeniera e Infraestructura de los Transportes (Escuela Tcnica Superior de Ingenieros,
Universidad de Sevilla), por el proyecto Uso de datos de una Red GSM para la inferencia
de datos de movilidad interurbana de vehculos.

Das könnte Ihnen auch gefallen