Beruflich Dokumente
Kultur Dokumente
Módulo
Web Semántica
Eduardo Mena
Área de Lenguajes y Sistemas Informáticos
Dpto. de Informática e Ingeniería de Sistemas
emena@unizar.es, 976-76 23 40
Despacho D0.17, Edificio Ada Byron
Master Servicios Web, Seguridad Informática y Aplicaciones de Comercio Electrónico
Departamento de Informática e Ingeniería de Sistemas (Universidad de Zaragoza)
Bases de Datos Federadas
Objetivo:
Una BD varias BDs
Problemas de heterogeneidad
Sintáctica
Semántica
Conocer las tendencias futuras (I+D)
Saber aplicar nuestros conocimientos a casos reales
Redes de Computadores
Distribución/compartición de recursos
BD centralizada BD distribuida (¿varias BDs?)
Centralización
mantener un único depósito de datos donde acceder desde distintos
nodos
Integración
enlazar virtualmente los distintos depósitos de datos (heterogéneos)
para ofrecer una visión similar a un único depósito centralizado
Transparencia de red
el usuario no debe ser consciente del uso de la red
transparencia de localización: dónde están los datos, lenguajes “locales”
necesarios
transparencia de nombres: nombres únicos en todo el sistema distribuido,
independientes de la localización
Transparencia de fragmentación
el usuario no debe ser consciente de la existencia de varios depósitos de datos
Transparencia de replicación
el usuario no debe ser consciente de la existencia de varias copias de los datos
Distribución
Autonomía
Tipo de control que los SGBD tienen sobre cada BD local
Autonomía de diseño: existe si los administradores de la BD (ABD)
pueden cambiar el esquema conceptual de sus BDs independientemente
de si forman parte de un sistema distribuido o no.
Heterogeneidad
Distinto hardware, SO, software comunicaciones.
WHERE VUELOREAL.ID=BILLETES.ID
FRAGMENTACIÓN
ASIGNACIÓN
Primero horizontal...
Completitud
Todo elemento de la relación debe estar en alguno de los fragmentos.
Reconstrucción
La relación inicial debe poder reconstruirse aplicando operadores
sobre los fragmentos
PROCESAMIENTO
Más fácil Más difícil Más difícil
DE PREGUNTAS
CONTROL DE
Difícil Más difícil Más fácil
CONCURRENCIA
el costo total
suma de los costos de procesamiento de todas las preguntas,
actualizaciones (multiplicando cada costo por el nº de veces que se
pregunta / actualiza) y costos de almacenar todos los fragmentos
sujeto a las siguientes restricciones:
tiempo de respuesta máximo para cada pregunta
existe un almacenamiento máximo en cada nodo
no superar la carga de procesamiento en cada nodo
Ventajas
Técnicas válidas para integración de otras organizaciones de datos
(no sólo BDs)
Vista 1 . . . . . Vista m
– No hay que olvidar que las bases de datos locales pueden ser
heterogéneas (distintos modelos de datos)
Traducción
A partir de tablas y atributos relacionales (esquema exportado) se
identifican entidades, relaciones y atributos (enriquecimiento
semántico)
Pueden aparecer nuevas entidades
(especializaciones/generalizaciones, etc.)
Integración
Aplicación de las propiedades semánticas entre las entidades y
relaciones de distintos esquemas locales canónicos (sinonimia, unión,
generalización/especialización, etc.)
Master Servicios Web, Seguridad Informática y Aplicaciones de Comercio Electrónico
Departamento de Informática e Ingeniería de Sistemas (Universidad de Zaragoza)
Uso del esquema global
Procesamiento de preguntas
Las preguntas realizadas sobre el esquema global deben responderse
sobre los esquemas locales
Información de enlace
Relación entre los elementos de datos del esquema global y los
elementos de datos de los esquemas locales
Semántica,
formatos,
etc.
Telnet C C++ Java
Oracle Sybase
IP WWW FTP Formularios
Informix
Archie Interfaces ad hoc
Basados en Basados en
palabras clave Agentes
Altavista, TSIMMIS,
Yahoo! DISCO
Basados en
Ontologías
Relaciones
Interontología
IRM
Based
System
Enhanced with Ontology Server
Ontology Server
Vocabulary Enlaces
Enlaces
hEterogeneity Enlaces Enlaces
Resolution
Master Servicios Web, Seguridad Informática y Aplicaciones de Comercio Electrónico
Departamento de Informática e Ingeniería de Sistemas (Universidad de Zaragoza)
Procesamiento de Preguntas (Query Processor)
Construcción
Seleccionar
Comienzo Ontología Usuario de la pregunta
Editar pregunta
Expansión incremental
a otra ontología
Elegir plan con
Acceso a menor pérdida
Acceder datos
los datos subyacentes Generar Planes
Correlacionar y
mostrar respuesta Integrar nueva ont.
y ont. usuario
Seleccionar
No Si ontología destino
Final Más datos?
Master Servicios Web, Seguridad Informática y Aplicaciones de Comercio Electrónico
Departamento de Informática e Ingeniería de Sistemas (Universidad de Zaragoza)
Multiples ontologías: Transformaciones de la pregunta
Query Processor
Pregunta del usuario expresada en Respuesta expresada según la
términos de la Ontología Usuario semántica de la Ontología Usuario
Rel. del IRM Correlación
F. Trans. Inv. del IRM F. Trans. del IRM
Pregunta expresada en términos Respuesta expresada según la
de la Ontología Destino semántica de la Ontología Destino
Traducción a Enlaces Correlación
F. Trans. Inv. de enlaces F. Trans. de enlaces
Respuesta expresada según la
Pregunta expresada en Enlaces
semántica de los depósitos
Objetivos
Separar contenido de visualización
Orientado a humanos y a programas (servicios)
Búsquedas semánticas (expresar qué se está buscando)
Claves
Ontologías
Servicios Web