Beruflich Dokumente
Kultur Dokumente
Instituto de Computación
Integrantes Tutoras
Daniela Vila Regina Motz
Martín Balestra Verónika Peralta
Agenda
Motivación
Wrapper Mediador
Mediador
Final Data
Warehouse
Wrapper Mediador
Metadata
Introducción al sistema WW existente
Funcionalidades
XML
Extractor
Grouped
iRules Sorted
XML
XML XML
Metadata en la evolución del sistema WW
Metadata existente – Proyecto 2004 (cont.)
Limpieza y XML
Homogenización
de Datos
Homogenized
XML
Objetivos del Proyecto 2005
• Estructuración y definición de una nueva metadata
que provea mayor información con respecto a los
datos extraídos
• Traducción de la metadata existente al lenguaje
OWL
• Administración de la evolución del sistema
(propagación de cambios)
• Actualización de la metadata del sistema
• Utilización de parámetros de calidad en la
elección de los datos a almacenar en el Data
Warehouse
Estado actual del proyecto
Tareas Realizadas
• Estudio del entorno y la arquitectura del
sistema y las funcionalidades de cada módulo
• Identificación de los puntos en los cuales el
sistema exporta metadata, elaborando un
documento que especifica el estudio realizado
• Definición de la nueva metadata del sistema y
elaboración de una política de calidad
• Diseño de un prototipo
• Implementación en curso del prototipo
Estado actual del proyecto
Nueva Metadata
• Se define una política de calidad
describiendo la información necesaria tanto
del archivo como del contenido de la
metadata
• Información del archivo de metadata
o Descripción del módulo que la generó
o Validez de la metadata
o Objetivo de la metadata
o Consumidores conocidos de la metadata
Estado actual del proyecto
Nueva Metadata (cont.)
• Información del contenido de la metadata
o Fuente de origen
o Proceso que genera la metadata
o Regla de selección de la metadata
• Para cada archivo también deben tenerse en
cuenta las condiciones en que se genera la
metadata, descartando información
generada con excepciones o problemas en la
ejecución del sistema
Estado actual del proyecto
Jerarquía Descripción
Info
Validez
Objetivo
Consumidore
s
Fuente
iRules uRules sorted grouped Proceso
homogenized salida
Regla
Extraído de [3]
Estado actual del proyecto
Procesos Definidos
• Reprocesamiento de la metadata generada
por el sistema, agregando políticas de
calidad sobre la misma y traduciendo la
metadata existente (escrita en XML) al
lenguaje OWL
• Monitoreo de las páginas propiamente dicho
y su reprocesamiento en caso de cambios
detectados procurando el mínimo impacto
posible
Estado actual del proyecto
Reprocesamiento de la Metadata
WrapperTranslator
+processIRules()
+processURules()
+processSorted()
Runner (2004) RunnerMetadata +processGrouped()
+processMetadata()
MediatorTranslator
+processHomogenized()
+processJoined()
Extraído de [4]
Estado actual del proyecto
Control de Cambios
+processPull() +proccessMetadata()
Mediator (2004)
WrapperTranslator
+integrate() MediatorTranslator
+processIRules()
Wrapper (2004) +processURules()
+processHomogenized()
+processSorted()
+processJoined()
+processGrouped()
+wrap()
Extraído de [4]
Estado actual del proyecto
Arquitectura
Wrapper Mediator
Metadata
XML XML
Metadata
OWL OWL
Estado actual del proyecto
Prototipo en Implementación
• El prototipo presenta una primera
generación de metadata en OWL a partir de
la metadata que exporta el sistema en XML
o No se ha incorporado aún la selección basada
en parámetros de calidad
• Se ha iniciado el monitoreo de las páginas
Web registradas en el sistema
o No se ha procesado todavía el impacto de
cambios de las páginas en el sistema
Tareas Pendientes
• Llevar el prototipo al sistema final,
incorporando el chequeo de algunas
restricciones en cuanto a la metadata generada
• Incorporar al diseño y desarrollo la evaluación
de parámetros de calidad para las fuentes
• Implementar el módulo de actualización de
información del Data Warehouse procesando el
impacto de los cambios en el sistema
o La implementación de este módulo se extiende hasta
los mediadores intermedios
Referencias
[1] A. Marotta, R. Motz, R. Ruggia. Managing Source Schema
Evolution in Web Warehouses. International Workshop on
Information Integration on the Web (WIIW ‘2001).
[2] V. Giaudrone, M. Guerra, M. Vaccaro. Informe General.
Proyecto de Grado 2004. Extracción e integración en una
arquitectura de Web Warehouse.
[3] D. Vila, M. Balestra. Metadata del sistema.
[4] D. Vila, M. Balestra. Documento de diseño.