Beruflich Dokumente
Kultur Dokumente
Introduccin
(i) Flix R. Rodrguez 2007/08
ndice de la Introduccin
Motivacin:
El problema del acceso a datos espaciotemporales Objetos espacio-temporales Consultas espacio-temporales Consideraciones sobre trayectorias y temporalidad
Bibliografa
Estructuras Avanzadas de Almacenamiento de la Informacin, 2007/08 2
Motivacin
Nuevas aplicaciones que requieren cambios tanto en las caractersticas espaciales de los datos (posicin o extensin -espacio del objeto-) como en la temporales. Ejemplos:
Cambio en Datos de La Tierra: Aplicaciones medioambientales: Datos climticos o de la superficie terrestre, gestin de fuegos forestales, Objetos mviles en el espacio D-dim: trayectorias de vehculos (monitorizacin del trfico), navegacin inteligente, comunicacin mvil, BDs de Imgenes, Multimedia (Video),
Estructuras Avanzadas de Almacenamiento de la Informacin, 2007/08 3
Requerimientos
En definitiva, los mtodos de acceso debera ser capaces de soportar:
Datos complejos (imgenes, multimedia,) Datos voluminosos
en almacenamiento secundario o terciario Paralelismo
STDB?
BDs espacio-temporales: espacio-temporales: BDs Temporales especiales:
Tienen todas las caractersticas de las BDTs con el aadido de que los atributos tambin pueden ser espaciales.
STDB
Las STDB abren una nueva lnea de I+D referente a:
Representaciones eficientes del espacio y el tiempo Modelos de datos Lenguajes de Consulta Procesamiento de consultas e indexacin Interfaces grficas de usuario para datos espaciotemporales
Objetos espacio-temporales
Puntos mviles:
Cada objeto se modela como un punto Las extensiones (espacio del objeto) no importan
Consultas espacio-temporales
Seleccin (Selection queries):
encontrar todos los objetos contenidos en una determinada rea A en un tiempo determinado t
Tiempo
Temporalidad: Temporalidad
Tiempo de Transaccin o Tiempo de Validez Generalmente se considera el Tiempo de Transaccin
Bitemporalidad: Bitemporalidad
Tiempo de Transaccin y Tiempo de Validez Se considera TT_inicial, TT_final, TV_inicial, TV_final
Tiempo de Transaccin: tiempo(s) en el que los datos se encontraban o se encuentran en la BD Tiempo de Validez: tiempo(s) en el que los datos son ciertos en la realidad modelada
Estructuras Avanzadas de Almacenamiento de la Informacin, 2007/08 9
Trayectorias
Los objetos mviles generan trayectorias Generalmente se muestrean las posiciones de los objetos a intervalos de tiempo peridicos t Interpolacin lineal: sencilla y generalmente bastante exacta Trayectoria: secuencia de localizaciones de 2 o 3 dimensiones
Estructuras Avanzadas de Almacenamiento de la Informacin, 2007/08 10
Indexando el pasado
Indexar datos histricos Volumen de datos en continuo crecimiento en el tiempo no es factible guardar el estado completo de la BD por cada actualizacin realizada minimizacin de la historia:
Por muestreo: toma de muestra cada cierto intervalo de tiempo Registrar slo el cambio
S(t1) S(t2) S(t3) S(t4) S(t5)
y o2 o1 x
y o2
o3 x
y o3 o2 o1 Query region Q x
y o3 o2 o1 x
y o3 x o1 t
o1
t1
t2
t3
t4
t5
13
Indexando el pasado
Categorizacin de ndices:
Estructuras espaciales con la dimensin Tiempo:
Tratamiento del tiempo como una dimensin extra en una estructura espacial existente Preferencia del dominio espacial RT-tree, 3D R-tree, STR-tree. Estudiaremos el 3D R-tree
xt = xref + v (t tref)
La funcin lineal produce segmentos de recta en una determinada trayectoria objetos a indexar
Estructuras Avanzadas de Almacenamiento de la Informacin, 2007/08 16
Mtodos de transformacin:
El dominio espacio-tiempo se transforma en otro espacio de representacin
18
Regiones mviles
Cada objeto se modela por su MBR
Puede cambiar segn el objeto se mueva
La extensin se considera
Estructuras Avanzadas de Almacenamiento de la Informacin, 2007/08 19
20
10
y o2 o1 x
y o2
o3 x
y o3 o2 o1 Query region Q x
y o3 o2 o1 x
y o3 x o1 t
o1
t1
t2
t3
t4
t5
21
Tipos de consulta
Pasado, presente y futuro: futuro
consultas por rodaja de tiempo (time-slice queries)
encontrar todos los objetos que cruzan una cierta rea en el tiempo t
22
11
Tipos de consulta
Pasado: Pasado
consultas de trayectorias
cul es la velocidad mxima de un determinado objeto en la ltima hora
Futuro: Futuro
consultas de ventana mvil
encontrar los objetos que intersecan un rea mvil en un determinado intervalo de tiempo
23
24
12
25
26
13
x o2 t3
o3
t1
t2
t4 Query region Q
tnow
3D R-tree
Theodoridis-Vazirgiannis-Sellis No hay discriminacin entre dimensiones espaciales y temporales Asume que los tiempos del intervalo [t1,t2) estn perfectamente delimitados
Regin R1: objetos A y E Regin R2: objetos B, C y D
28
14
3D R-tree
problema: problema qu pasa con los objetos vivos, con tahora?
Las estructuras R-tree y sus variantes no estn diseadas para lmites abiertos y en expansin
* Tomar tahora = t2 muy lejano en el tiempo grandes ineficiencia * Para movimientos conocidos a priori diseo ms apropiado
Cajas muy
Cajas cerradas
29
Rendimiento 3D R-tree
Theodoridis-Vazirgiannis-Sellis: comparativa 3D R-tree vs. dos estructuras separadas:
uno para datos espaciales (2D R-tree) otra para datos temporales (1D R-tree o segment-tree)
30
15
Rendimiento 3D R-tree
3D R-tree es superior en consultas espacio-temporales para trabajos mixtos, depende de la selectividad de los operadores Eficiencia muy limitada en consultas por rodaja de tiempo: dependientes de los objetos vivos en el tiempo de consulta (en tahora) y ms an del nmero total de entradas en la historia
Estructuras Avanzadas de Almacenamiento de la Informacin, 2007/08 31
RT-tree
Xu-Han-Lu R-tree con entradas (id, MBR, ts, te):
Id: identificador del objeto MBR: caja contenedora del objeto ts, te: intervalo donde el objeto es vlido (ts: time start, te: time end)
32
16
RT-tree
Cada objeto tiene una extensin espacial y otra temporal
A B
A B A B
33
Rendimiento RT-tree
Las consultas espaciales tan eficientes como un R-tree Las consultas por rodaja de tiempo y por intervalos de tiempo podran recorrer el rbol completo Estructura muy ineficiente (requiere gran cantidad de almacenamiento)
Estructuras Avanzadas de Almacenamiento de la Informacin, 2007/08 34
17
2+3 R-tree
Nascimento-Silva-Theodoridis Indexa pasado y presente solucin del problema de las geometras abiertas manteniendo 2 rboles: un 2D R-tree para indexar el presente, los datos espaciales actuales (tahora) un 3D R-tree para indexar la informacin pasada, los datos espacio-temporales histricos: - una dimensin es la temporal - dos dimensiones son espaciales para la trayectoria del objeto
Estructuras Avanzadas de Almacenamiento de la Informacin, 2007/08 35
2+3 R-tree
Cualquier variacin temporal supone:
almacenar el objeto de estado actual en el 2D R-tree migracin del objeto de estado anterior al 3D R-tree: as [t1, t2) siempre son conocidos
36
18
STR-tree
Pfoser-Jensen-Theodoris Es un rbol R con algoritmo de insercin/divisin modificado Orientado especficamente a almacenar trayectorias almacenndose por segmentos de trayectoria en MBRs Utiliza el tiempo como una dimensin ms
38
19
STR-tree
las hojas tienen la forma: (id, tid, MBR, o)
id: identificador tid: identificador de trayectoria MBR: caja mnima contenedora de la trayectoria o: orientacin de la trayectoria en la MBR
39
STR-tree
Intenta mantener:
la cercana espacial de segmentos de trayectoria (se preserva mediante en rbol R) los segmentos pertenecientes a una misma trayectoria se almacenen juntos
40
20
STR-tree
Utiliza un parmetro p que equilibra propiedades espaciales y preservacin de trayectorias:
p: nmero de niveles reservados para conservar la trayectoria se insertan los segmentos de lnea de una trayectoria tan cerca como sea posible de sus segmentos predecesores en la trayectoria dentro de p niveles p pequea decrementa la conservacin de la trayectoria e incrementa la cercana espacial
41
21
HR-tree
Nascimento-Silva
43
Rendimiento HR-tree
Nascimento el al.
Ms eficiente que 3D R-tree y 2+3 R-tree para consultas por rodaja de tiempo
encontrar todos los objetos que cruzan una cierta rea en el tiempo t
Menos eficiente que 3D R-tree y 2+3 R-tree ms eficientes que HR-tree para consultas por intervalos de tiempo
encontrar todos los objetos que cruzan una cierta rea en el intervalo de tiempo [t1,t2]
22
HR+-tree
Tao-Papadias Variacin del HR-tree que elimina la replicacin de algunas entradas:
se relaja la imposicin del HR-tree de que en cualquier nodo sus ascendientes tengan la misma raz (esto es, misma marca de tiempo o time-stamp) en un nodo conviven entradas de diferentes marcas de tiempo (diferentes padres) pero cada padre slo tiene acceso a las entradas de su misma marca de tiempo
Estructuras Avanzadas de Almacenamiento de la Informacin, 2007/08 45
MV3R-tree
Tao-Papadias Multi-version 3-dimensional R-tree: multi-version R-tree y un pequeo 3R-tree auxiliar construido sobre las hojas del primero
23
MV3R-tree
El 3D R-tree es relativamente pequeo respecto al MVR-tree favorece las consultas de intervalo de tiempo Cada nodo contiene entradas de la forma: (MBR, p, ts, te) MBR: caja mnima contenedora de todas las entradas del correspondiente subrbol p: apuntador al nodo del siguiente nivel ts, te: tiempo de insercin y de borrado de la entrada respectivamente
Estructuras Avanzadas de Almacenamiento de la Informacin, 2007/08 47
Rendimiento MV3R-tree
Bajo extensa experimentacin sobre datos con agilidad superior al 20%
Agilidad: porcentaje de variacin de objetos en la siguiente rodaja de tiempo
Ms eficiente que HR-tree y 3D R-tree para consultas por rodaja de tiempo y por intervalos de tiempo Las necesidades de espacio del MV3R-tree son muy altas
48
24
49
datos bitemporales
VT : tiempo de validez inicial VT : tiempo de validez final (now para valores actuales, tahora) TT : tiempo de transaccin inicial TT : tiempo de transaccin final (UC para valores hasta que cambien)
50
25
RST-tree
Saltenis-Jensen Basado en R*-tree Datos almacenados: valores espaciales en 2 dimensiones:
puntos o extensiones
51
RST-tree
Formato de las entradas de ndice:
(TT, TT, VT, VT/, now-flag, <parte espacial>, <p>) p: puntero al nodo del siguiente nivel
si (now-flag)
VT/
sino
VT/
26
RST-tree
Las consultas espaciales, temporales o espaciotemporales se realizan segn un esquema de priorizacin de las dimensiones sobre rboles R El volumen de una regin r tetra-dimensional se computa:
spacial_area(r): rea de la extensin espacial de r bitemporal_area(r): rea de la regin parametrizada por tiempo de la extensin bitemporal
Estructuras Avanzadas de Almacenamiento de la Informacin, 2007/08 53
TB tree
Pfoser-Jensen-Theodoridis Trajectory Bundle tree
(rbol de empaquetamiento de trayectorias o rbol de manojos de trayectorias)
27
TB tree
Crece de izquierda a derecha: el nodo ms a la izquierda contiene la primera insercin, el nodo ms a la derecha, la ltima incorporacin Las hojas slo pueden contener segmentos pertenecientes a una misma trayectoria. Las hojas con una misma trayectoria se encadenan en listas doblemente enlazadas
55
(Pfoser et al.)
56
28
TPR tree
Saltenis-Jensen-LeuteneggerLopez Time parameterized R-tree Utiliza cajas contenedoras parametrizadas sobre un rbol R En tiempo de construccin, se construyen los rectngulos contenedores conservativos (CBR) que encierran un conjunto de objetos mviles
El problema de las MBR a nivel de hoja por localizacin de los objetos en R trees 57
TPR tree
Los lmites del CBR se marcan por la velocidad del objeto:
Lmite inferior: la velocidad mnima de los puntos incluidos Lmite superior: la velocidad mxima Los CBR nunca se acortan o contraen => garanta de contener siempre los mismos objetos mviles Cuando los CBR se hacen muy grandes, si la posicin de un objeto se actualiza, se recalculan todos los CBR de los nodos del camino que lleva a la hoja donde se almacene el objeto
Estructuras Avanzadas de Almacenamiento de la Informacin, 2007/08 58
29
MOF+-tree
Modificacin del MOF-tree utilizando una codificacin diferente
59
Bibliografa
[Man06] Y. Manolopoulos, A. Nanopoulos, A. N. Papadopoulos & Y. Theodoridis. R-trees: Theory and Applications. Springer, 2006. [Mok03] M. F. Mokbel, T. M. Ghanem & W. G. Aref. Spatio-temporal Access Methods. ACM Computing surveys, 2003. Las Referencias incluidas en [Mok03] [Sel01] T. Sellis. ChoroChronos. Research on Spatiotemporal Database Systems. 2001 http://www.dbnet.ece.ntua.gr/~choros
Estructuras Avanzadas de Almacenamiento de la Informacin, 2007/08 60
30