Beruflich Dokumente
Kultur Dokumente
Ingeniera de Sistemas
ASIGNATURA: Bases de Datos II
2011
CRDITOS
El mdulo de estudio de la asignatura Bases de Datos II del Programa Ingeniera de Sistemas es propiedad de la
Corporacin Universitaria Remington. Las imgenes fueron tomadas de diferentes fuentes que se relacionan en los
derechos de autor y las citas en la bibliografa. El contenido del mdulo est protegido por las leyes de derechos de
autor que rigen al pas.
Este material tiene fines educativos y no puede usarse con propsitos econmicos o comerciales. El autor es Tutor del
CAT de la ciudad de Armenia y el trabajo se desarrollo con el apoyo del Operador Logstico FUNEC
AUTOR
Carolina Henao Murillo
Especialista En Gerencia Informtica
Terminacin: Cursando Actualmente Segundo Semestre, Ingeniera De Sistemas, Curso: Diplomado En Docencia
Universitaria, Curso: Fortalecimiento De La Tecnologa En La Educacin
Curso: Asesora Para La Aprehensin de Procesos Tecnolgicos
Instructora Sena, Tutora CUR
caritohenao@hotmail.com
Nota: el autor certific (de manera verbal o escrita) No haber incurrido en fraude cientfico, plagio o vicios de autora; en
caso contrario eximi de toda responsabilidad a la Corporacin Universitaria Remington, y se declar como el nico
responsable.
RESPONSABLES
Escuela de Ciencias Bsicas e Ingeniera
Director Dr. Mauricio Seplveda
Director Pedaggico
Octavio Toro Chica
dirpedagogica.director@remington.edu.co
Coordinadora de Medios y Mediaciones
Anglica Ricaurte Avendao
mediaciones.coordinador01@remington.edu.co
GRUPO DE APOYO
Personal de la Unidad de Medios y Mediaciones
EDICIN Y MONTAJE
Primera versin. Febrero de 2011.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Derechos Reservados
Esta obra es publicada bajo la licencia CreativeCommons. Reconocimiento-No Comercial-Compartir Igual 2.5 Colombia.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
TABLA DE CONTENIDO
1.
2.
INTRODUCCIN ............................................................................................................. 9
2.1.
2.2.
3.
FUNCIONALIDAD ......................................................................................................... 22
3.1.
Bases de Datos Orientadas a Objetos (BDOO) y Bases de Datos Objeto Relacionales (BDOR)
22
3.2.
3.3.
3.4.
4.
DISTRIBUCIN ............................................................................................................. 70
4.1.
4.2.
5.
RENDIMIENTO ............................................................................................................. 99
5.1.
6.
7.
8.
BIBLIOGRAFA............................................................................................................ 119
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
1. MAPA DE LA ASIGNATURA
BASES DE DATOS II
PROPSITO GENERAL DEL MDULO
Lograr una perspectiva global de las diversas tecnologas de bases de datos avanzadas y
su importancia en el mundo informtico.
OBJETIVO GENERAL
Proponer un modelo avanzado de bases de datos que administre la informacin de una
manera ptima, utilizando las herramientas tecnolgicas adecuadas.
OBJETIVOS ESPECFICOS
Conocer las principales tendencias en el rea de sistemas de bases de datos.
Determinar el tipo de base de datos que se requiere en una organizacin.
Disear el modelo avanzado de la base de datos basado en modelos que extienden
o sustituyen al modelo relacional.
Implementar la base de datos utilizando las tecnologas de bases de datos
avanzadas.
UNIDAD 1
UNIDAD 2
UNIDAD 3
UNIDAD 4
Fundamentacin
conceptual en el
futuro de las bases
de datos y bases
de datos activas.
Fundamentacin
procedimental y
competencias
interpretativas y
propositivas en el
manejo de BDOO,
bases de datos
deductivos
y
difusos. Al igual
que bases de
datos multimedia
y web, y almacn
de datos y XML.
Capacidad para
representar y
recordar
objetos y sus
propiedades en
bases de datos
distribuidas,
federadas
y
mviles.
Habilidad
y
destreza
para
usar
equipos,
procedimientos
de
rutina
y
complejos en el
rendimiento de
las bases de
datos GRID y
paralelas.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
2. INTRODUCCIN
Se busca dar una visin general del futuro de la informacin, para ello se deben conocer los
antecedentes, evolucin y actualidad de las bases de datos, con el fin de enmarcar la importancia
del manejo de la informacin por medio de las tecnologas aplicadas para esta tarea.
OBJETIVO GENERAL
Conocer las principales tendencias en el rea de sistemas de bases de datos.
OBJETIVOS ESPECFICOS
Conocer los antecedentes, evolucin y actualidad de las bases de datos, enmarcando la
importancia del manejo de la informacin por medio de las tecnologas aplicadas.
Conceptualizar que por medio de los sistemas de bases de datos activas se logra un nuevo
nivel de independencia de datos.
Prueba Inicial
1. Sabe usted que es una base de datos.
2. Identifica usted la importancia del manejo de la informacin en nuestro entorno.
3. Describa mnimo tres caractersticas que se debe tener en cuenta para el manejo de la
informacin.
4. Reconoce el valor del manejo de los datos haciendo uso de las tecnologas de la
informacin y las comunicaciones.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/futuro.pdf
EMPRESA ABIERTA
Datos mal gestionados Zachman (1996)
El 70% de los informes se utilizan para volver a introducir datos en bases de datos
80/90% del tiempo se dedica al mantenimiento
60/70% se dedica a mantener interfaces y transformar datos de una base a otra
100M$ a parchear programas por errores al pasar datos
70% de las lneas de cdigo slo mueven datos
20/40% de toda la mano de obra de EEUU se dedica a recoger, almacenar y recuperar informacin
Avances en el hardware y las comunicaciones
Leyes de la evolucin del hardware:
Ley de Moore
Ley de Hoagland
Ley de Joy
Prediccin de gray
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Mquinas paralelas
Tcnicas de compresin
Dispositivos de almacenamiento ptico
Digitalizadores de audio y vdeo
Factores y Lneas de Evolucin:
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/futuro.pdf
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/futuro.pdf
Funcionabilidad Inteligencia
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/futuro.pdf
Rendimiento
BD paralelas
BD en tiempo real
BD en memoria principal
Distribucin
BD distribuidas
BD federadas
Multibases de datos
BD mviles
BD y web
Inteligencia
BD activas
BD deductivas
BD orientadas a objetos
BD seguras
BD difusas
Almacenes de datos
BD multimedia
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/futuro.pdf
Ejercicio Tema 1
Segn el planteamiento de esta unidad, y desde su punto de vista como aspirante al ttulo de
Ingeniero de Sistemas, cree un ensayo en el cual plasme su punto de vista prospectivo sobre el
futuro de la informacin y su manejo haciendo uso de las tecnologas aplicadas para esta tarea.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Debe ser capaz de monitorizar y reaccionar ante eventos de manera oportuna y eficiente.
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/activas.pdf
SGBD DEDUCTIVO:
Capaz de deducir hechos adicionales a partir de la base de datos extensional aplicando axiomas
deductivos y reglas de inferencia.
SGBD PASIVO:
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/activas.pdf
VENTAJAS
Mayor productividad
Mejor mantenimiento
Reutilizacin de cdigo
Reduccin del trfico de mensajes
UTILIDAD EN SGBD
Instantneas
Datos derivados
Reglas de integridad
Seguridad y auditora
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Posibilidad
de
optimizacin
semntica Facilitar el acceso a la
BD a usuarios finales
Gestin de versiones
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/activas.pdf
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/activas.pdf
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/activas.pdf
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/activas.pdf
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/activas.pdf
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/activas.pdf
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/activas.pdf
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/activas.pdf
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/activas.pdf
3. FUNCIONALIDAD
Conocer que antes de la llegada de las Bases de Datos Orientadas a Objetos, las Bases de Datos
tradicionales no estaban diseadas para almacenar objetos, por ende al guardar los datos de un
programa con el enfoque Orientado a Objeto aumentaba de modo significativo su complejidad,
dando espacio a ms cdigo y ms esfuerzos de programacin, as como la dificultad de la
diferencia de esquemas.
OBJETIVO GENERAL
Determinar el tipo de base de datos que se requiere en una organizacin.
OBJETIVOS ESPECFICOS
Conocer que antes de la llegada de las Bases de Datos Orientadas a Objetos, las Bases de
Datos tradicionales no estaban diseadas para almacenar objetos.
Comprender que surgen recientes aplicaciones que consisten en ofrecer recursos para
definir Reglas Deductivas que permiten concluir, inferir u obtener informacin nueva a
partir de los datos almacenados o sucesos condicionados.
Prueba Inicial
1. Sabe usted que es un objeto.
2. Identifica usted los objetos que componen una base de datos.
3. Normaliza usted una base de datos.
modelo relacional requiere abstraerse lo suficiente como para adaptar los objetos del mundo real
a tablas.
Las bases de datos orientadas a objetos surgen para evitar los problemas que surgen al tratar de
representar cierta informacin, aprovechar las ventajas del paradigma orientado a objetos en el
campo de las bases de datos y para evitar transformaciones entre modelos de datos (usar el
mismo modelo de objetos).
1. Conceptos relacionados con las bases de datos orientadas a objetos: En este apartado se
explican los conceptos relacionados con las BDOO:
Base de datos orientada a objetos (BDOO): una coleccin persistente y compatible de objetos
definida por un modelo de datos orientado a objetos.
Modelo de datos orientado a objetos: Un modelo de datos que captura la semntica de los
objetos soportados en la programacin orientada a objetos.
Sistema Gestor de Bases de Datos Orientadas a Objetos (SGBDOO): El gestor de una base de
datos orientada a objetos.
2. Origen de las Bases de Datos Orientadas a Objetos: El origen de las BDOO se encuentra
bsicamente en las siguientes razones:
La existencia de problemas para representar cierta informacin y modelar ciertos aspectos
del mundo real, puesto que los modelos clsicos permiten representar gran cantidad de
datos, pero las operaciones y representaciones que se pueden realizar sobre ellos son
bastante simples.
El paso del modelo de objetos al modelo relacional genera dificultades que en el caso de
las BDOO no surgen ya que el modelo es el mismo.
Por lo tanto, las bases de datos orientadas a objetos surgen bsicamente para tratar de
paliar las deficiencias de los modelos anteriores y para proporcionar eficiencia y sencillez a
las aplicaciones.
Las debilidades y limitaciones de los SGBDR son:
Pobre representacin de las entidades del mundo real.
Sobrecarga y poca riqueza semnticas.
Soporte inadecuado para las restricciones de integridad y empresariales
Estructura de datos homognea
Operaciones limitadas
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
del mundo real. El estado de un objeto es descrito mediante atributos mientras que su
comportamiento es definido mediante mtodos.
Las caractersticas asociadas a las BDOO son:
Objetos: cada entidad del mundo real se modela como un objeto.
La forma de identificar objetos es mediante un identificador de objetos (OID, Object
Identifier), nico para cada objeto. Generalmente este identificador no es accesible ni
modificable para el usuario (modo de aumentar la integridad de entidades y la integridad
referencial). Los OID son independientes del contenido. Es decir, si un objeto cambia los
valores de atributos, sigue siendo el mismo objeto con el mismo OID. Si dos objetos tienen
el mismo estado pero diferentes OID, son equivalentes pero tienen identidades diferentes.
Encapsulamiento: cada objeto contiene y define procedimientos (mtodos) y la interfaz
mediante la cual se puede acceder a l y otros objetos pueden manipularlo. La mayora de
los SGBDOO permite el acceso directo a los atributos incluyendo operaciones definidas por
el propio SGBDOO las cuales leen y modifican los atributos para evitar que el usuario
tenga que implementar una cantidad considerable de mtodos cuyo nico propsito sea el
de leer y escribir los atributos de un objeto. Generalmente, los SGBDOO permiten al
usuario especificar qu atributos y mtodos son visibles en la interfaz del objeto y pueden
invocarse desde afuera.
Otros conceptos utilizados de la misma manera que en la POO son:
Clases
Herencia simple, mltiple y repetida.
Polimorfismo de operacin, de inclusin y paramtrico; ligadura tarda (late binding); sobrecarga
(overloading) y suplantacin o anulacin (overriding).
Objetos complejos
4. Manifiesto Malcolm Atkinson: Caractersticas de un BDOO: En 1989 se hizo el Manifiesto de los
sistemas de base de datos orientados a objetos el cual propuso trece caractersticas obligatorias
para un SGBDOO y cuatro opcionales. Las trece caractersticas obligatorias estaban basadas en dos
criterios: deba tratarse de un sistema orientado a objetos y un SGBD.
Caractersticas obligatorias de orientacin a objetos:
1. Deben soportarse objetos complejos
2. Deben soportarse mecanismos de identidad de los objetos
3. Debe soportarse la encapsulacin
4. Deben soportarse los tipos o clases
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
5.
6.
7.
8.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
La ltima versin del estndar, ODMG 3.0, propone los siguientes componentes principales de la
arquitectura ODMG para un SGBDOO:
Modelo de objetos
Lenguaje de definicin de objetos (ODL, Object Definition Language)
Lenguaje de consulta de objetos (OQL, Object Query Language)
Conexin con los lenguajes C++, Smalltalk y Java (al menos)
El modelo de objetos ODMG permite que tanto los diseos como las implementaciones, sean
portables entre los sistemas que lo soportan.
ODL es un lenguaje para definir la especificacin de los tipos de objetos para sistemas compatibles
con ODMG. ODL es el equivalente de DDL (Data Definition Language o lenguaje de definicin de
datos) de los SGBD tradicionales. Define los atributos y las relaciones entre tipos y especifica la
signatura de las operaciones. Su principal objetivo es el de facilitar la portabilidad de los esquemas
entre sistemas compatibles al mismo tiempo que proporciona interoperabilidad entre distintos
SGBD. La sintaxis de ODL extiende el lenguaje de definicin de interfaces (IDL) de la arquitectura
CORBA (Common Object Request Broker Architecture).
OQL es un lenguaje declarativo del tipo de SQL que permite realizar consultas sobre bases de
datos orientadas a objetos, incluyendo primitivas de alto nivel para conjuntos de objetos y
estructuras. Est basado en SQL-92, proporcionando un superconjunto de la sentencia SELECT.
OQL no posee primitivas para modificar el estado de los objetos, ya que stas se deben realizar a
travs de los mtodos que dichos objetos poseen. La sintaxis bsica de OQL es una estructura
SELECT...FROM...WHERE..., como en SQL.
7. Bases de Datos Objeto - Relacionales:
Introduccin a las Bases de datos Objeto-Relacionales: Una Base de Datos Objeto Relacional
(BDOR) es una base de datos que desde el modelo relacional evoluciona hacia una base de datos
ms extensa y compleja incorporando para obtener este fin, conceptos del modelo orientado a
objetos. Podemos decir que un Sistema de Gestin Objeto-Relacional (SGBDOR) contiene dos
tecnologas; la tecnologa relacional y la tecnologa de objetos.
En una base de datos objeto-relacional se siguen almacenando tuplas, aunque la estructura de las
tuplas no est restringida a contener escalares (tipos compuestos como vectores, conjuntos, etc.)
sino que las relaciones pueden ser definidas en funcin de otras, que es lo que denominamos
herencia directa.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
8. Caractersticas de las Bases de datos Objeto-Relacionales: Con las Bases de Datos ObjetoRelacional, se pueden crear nuevos tipos de datos, que permiten gestionar aplicaciones ms
complejas con una gran riqueza de dominios. Estos pueden ser tipos compuestos, lo que implica
que se debe definir al menos dos mtodos transformadores:
Uno para convertir el tipo nuevo a ASCII
Otro que convierte de ASCII al nuevo tipo.
Se soportan tipos complejos como: registros, conjuntos, referencias, listas, pilas, colas y arreglos.
Se pueden crear funciones que tengan un cdigo en algn lenguaje de programacin como por
ejemplo: SQL, Java, C, etc.
Existe una mayor capacidad expresiva para los conceptos y asociaciones.
Se pueden crear operadores asignndole un nombre y existencia de nuevas consultas con mayor
capacidad consultiva.
Se soporta el encadenamiento dinmico y herencia en los tipos tupla o registro.
Se pueden compartir varias bibliotecas de clases ya existentes, esto es lo que conocemos como
reusabilidad.
Posibilidad de incluir el chequeo de las reglas de integridad referencial a travs de los triggers.
Soporte adicional para seguridad y activacin de la versin cliente-servidor.
Anotar como punto final de este apartado, el inconveniente que tienen las BDOR, y es que
aumenta la complejidad del sistema y por tanto se ocasiona un aumento del costo asociado.
9. Tipos de Datos definidos por el Usuario: Los usuarios pueden definir sus propios tipos de datos,
a partir de los tipos bsicos provistos por el sistema o por otros tipos de datos predefinidos
anteriormente por el usuario. Estos tipos de datos pueden pertenecer a dos categoras distintas:
Los tipos de objetos (object types)
Los tipos para colecciones (collection types).
10. Tipos de Objetos: Un tipo de objetos define a lo que conocemos como una entidad del mundo
real. Se los pueden interpretar como una plantilla de objetos de ese tipo. Est compuesto por los
siguientes elementos:
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
atributo de tipo REF almacena una referencia a un objeto del tipo definido, e implementa
una relacin de asociacin entre los dos tipos de objetos.
Tipos para Colecciones: Los tipos para colecciones se definen para poder implementar
relaciones 1:N. Un dato de tipo coleccin est formado por un nmero indefinido de
elementos, todos del mismo tipo. As es posible almacenar un conjunto de tuplas en un
nico atributo, en forma de array o de tabla anidada.
Los tipos para colecciones tambin tienen por defecto unas funciones constructoras de
colecciones cuyo nombre coincide con el del tipo. Los argumentos de entrada de estas funciones
son el conjunto de elementos que forman la coleccin separados por parntesis.
12. El Tipo VARRAY: Un array es un conjunto ordenado de elementos del mismo tipo. Cada
elemento tiene asociado un ndice que indica su posicin dentro del array. Un tipo VARRAY se
puede utilizar para:
Definir el tipo de datos de una columna de una tabla relacional.
Definir el tipo de datos de un atributo de un tipo de objetos.
Para definir una variable PL/SQL, un parmetro, o el tipo que devuelve una funcin.
No se produce ninguna reserva de espacio al declarar un tipo VARRAY. Se almacenar con
el resto de columnas de su tabla, si el espacio que requiere lo permite. En caso contrario,
se almacenar aparte de la tabla como un BLOB.
Es imposible poner condiciones sobre los elementos almacenados dentro de un VARRAY,
en las consultas. Esta es la principal limitacin que tiene este tipo de dato.
Tablas Anidadas: Una tabla anidada es un conjunto de elementos del mismo tipo en el que
no existe un orden predefinido. Estas tablas solamente pueden tener una columna que
puede ser de un tipo de datos bsico, o de un tipo de objetos definido por el usuario.
13. Herencia de tipos: La herencia de tipos surge por la posibilidad de definir tipos que sean
subtipos de otros supertipos. Aparte de que los subtipos definen sus propios atributos y sus
mtodos, los subtipos heredan los atributos y los mtodos definidos para sus supertipos. Los
subtipos son capaces de redefinir los mtodos que heredan, que es lo que conocemos como
polimorfismo.
Por ejemplo, desde el objeto general supertipo TIPO_PERSONA podemos definir el subtipo
TIPO_EMPLEADO que heredarn las caractersticas de su supertipo TIPO_PERSONA. El tipo objeto
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Ejercicio Tema 1
1. Defina: Base de datos orientada a objetos (BDOO), Modelo de datos orientado a objetos y
Sistema Gestor de Bases de Datos Orientadas a Objetos (SGBDOO).
2. Mencione y explique las caractersticas asociadas a las BDOO.
3. Explique las caractersticas obligatorias de orientacin a objetos y SGBD, segn el
Manifiesto Malcolm Atkinson.
4. Cite las ventajas e inconvenientes de las BDOO.
5. Qu es y que componentes posee el ODMG: el estndar de facto para modelos de
objetos.
6. Cules son las caractersticas de las Bases de datos Objeto-Relacionales?
7. Cules son los Tipos de Datos definidos por el Usuario?. Mencinelos y ejemplifquelos.
8. En qu consiste la herencia de tipos?
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/Funcionalidad2.pdf
Existen diversas clases de BDDs y para cada una de ellas existe una semntica bien definida. Las
BDDs son muy usadas en las reas de: inteligencia artificial, sistemas expertos, representacin del
conocimiento, tecnologa de agentes, sistemas de informacin, integracin de datos, por nombrar
algunas.
Existe una importante relacin entre BDDs y programacin lgica. Una BDD es, en esencia, un
programa lgico; mapeo de relaciones base hacia hechos, y reglas que son usadas para definir
nuevas relaciones en trminos de las relaciones base y el procesamiento de consultas.
2. Representacin de la informacin: Las BDDs se representan mediante:
Conjunto de aserciones, o hechos, conocidos como la base de datos extensional (EDB): Los
hechos se especifican de manera similar a como se especifican las relaciones, excepto que no es
necesario incluir los nombres de los atributos. Recordemos que una tupla en una relacin describe
algn hecho del mundo real cuyo significado queda determinado en parte por los nombres de los
atributos. En una Base de Datos Deductiva, el significado del valor del atributo en una tupla queda
determinado exclusivamente por su posicin dentro de la tupla.
Conjunto de reglas (axiomas), referidos como la base de datos intencional (IDB): Las reglas se
parecen un poco a las vistas relacionales. Especifican relaciones virtuales que no estn
almacenadas realmente, pero que se pueden formar a partir de los hechos aplicando mecanismos
de inferencia basados en las especificaciones de las reglas. La principal diferencia entre las reglas y
las vistas es que en las primeras puede haber recursin y por tanto pueden producir vistas que no
es posible definir en trminos de las vistas relacionales estndar.
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/Funcionalidad2.pdf
3. Manejo de las BDDs, Sintaxis y semntica de Datalog: En un sistema de BDDs por lo regular se
usa un lenguaje declarativo para especificar reglas. Con lenguaje declarativo se quiere decir un
lenguaje que define lo que un programa desea lograr, en vez de especificar los detalles de cmo
lograrlo.
Una mquina de inferencia (o mecanismo de deduccin) dentro del sistema puede deducir hechos
nuevos a partir de la base de datos interpretando las reglas. El modelo empleado en las BDDs est
ntimamente relacionado con el modelo de datos relacional, y sobre todo con el formalismo del
clculo relacional. Tambin est relacionado con el campo de la programacin lgica y el lenguaje
Prolog. Los trabajos sobre BDDs basados en lgica han utilizado Prolog como punto de partida.
Con un subconjunto de Prolog llamado Datalog se definen reglas declarativamente junto con un
conjunto de relaciones existentes que se tratan como literales en el lenguaje. Aunque la estructura
gramatical se parece a la de Prolog, su semntica operativa (esto es, la forma como debe
ejecutarse un programa en Datalog) queda abierta.
4. Sintaxis y semntica de Datalog: Las BDDs se componen de clusulas de Horn que constituyen
reglas del tipo "modus ponendo ponens", es decir, "Si es verdad el antecedente, entonces es
verdad el consecuente". No obstante, la forma de escribir las clusulas de Horn es al contrario de
lo habitual. Primero se escribe el consecuente y luego el antecedente.
%hechos
hombre(teraj).
hombre(abraham).
hombre(najor).
hombre(haran).
hombre(lot).
hombre(ismael).
hombre(isaac).
hombre(batuel).
hombre(laban).
hombre(esaud).
hombre(jacob).
mujer(sarai).
mujer(melca).
mujer(jesca).
mujer(agar).
mujer(rebeca).
padre(teraj,sarai).
padre(teraj,abraham).
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
padre(teraj,najor).
padre(teraj,haran).
padre(abraham,ismael).
padre(abraham,isaac).
padre(najor,batuel).
padre(haran,melca).
padre(haran,jesca).
padre(haran,lot).
padre(isaac,esaud).
padre(isaac,jacob).
padre(batuel,laban).
padre(batuel,rebeca).
madre(agar,ismael).
madre(sarai,isaac).
madre(melca,batuel).
madre(rebeca,esaud).
madre(rebeca,jacob).
casado(abraham,sarai).
casado(isaac,rebeca).
casado(najor,melca).
%reglas
hijo(X,Y) :- hombre(X),(padre(Y,X);madre(Y,X)).
hija(X,Y) :- mujer(X),(padre(Y,X);madre(Y,X)).
abuelo(X,Y) :- padre(X,Z),(padre(Z,Y);madre(Z,Y)).
abuela(X,Y) :- madre(X,Z),(padre(Z,Y);madre(Z,Y)).
hermano(X,Y) :- (X\==Y),hombre(X),hijo(X,Z),(hijo(Y,Z);hija(Y,Z)).
hermana(X,Y) :- (X\==Y),mujer(X),hija(X,Z),(hijo(Y,Z);hija(Y,Z)).
tio(X,Y) :- hermano(X,Z),(padre(Z,Y);madre(Z,Y)).
tia(X,Y) :- hermana(X,Z),(padre(Z,Y);madre(Z,Y)).
6
sobrino(X,Y) :- hombre(X),(tio(Y,X);tia(Y,X)).
sobrina(X,Y) :- mujer(X),(tio(Y,X);tia(Y,X)).
primo(X,Y) :- hombre(X),sobrino(X,Z),(padre(Z,Y);madre(Z,Y)).
prima(X,Y) :- mujer(X),sobrina(X,Z),(padre(Z,Y);madre(Z,Y)).
a_directo(X,Y) :- (hijo(Y,X);hija(Y,X)).
a_directo(X,Y) :- (hijo(Z,X);hija(Z,X)),a_directo(Z,Y).
a_indirecto(X,Y) :- not(a_directo(X,Y)),(sobrino(Y,X);sobrina(Y,X)).
a_indirecto(X,Y):not(a_directo(X,Z)),(sobrino(Z,X);sobrina(Z,X)),(a_indirecto(Z,Y);a_directo(Z,Y)).
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
ascendiente(X,Y) :- a_directo(X,Y);a_indirecto(X,Y).
d_directo(X,Y) :- (padre(Y,X);madre(Y,X)).
d_directo(X,Y) :- (padre(Z,X);madre(Z,X)),d_directo(Z,Y).
d_indirecto(X,Y) :- not(d_directo(X,Y)),(tio(Y,X);tia(Y,X)).
d_indirecto(X,Y):not(d_directo(Z,Y)),(d_directo(X,Z);d_indirecto(X,Z)),d_indirecto(Z,Y).
El antecedente puede ser una conjuncin de condiciones que se denomina secuencia de objetivos.
Cada objetivo se separa con una coma y puede considerarse similar a una instruccin o llamada a
procedimiento de los lenguajes imperativos. Para representar la disyuncin se utiliza punto y coma
en lugar de la coma, aunque, estrictamente no corresponde a una disyuncin, sino que
internamente se transforma en disyunciones.
En Datalog los valores constantes son de tipo numrico o cadenas de caracteres que empiezan
exclusivamente con letras minsculas y las variables siempre comienzan con una letra mayscula.
Si los argumentos son constantes, el predicado se toma como verdadero, si los argumentos son
variables se le considera una consulta o bien parte de una regla o restriccin.
Para hacer una consulta, utilizamos una clusula de Horn con uno de los parmetros vacos
(poniendo una variable en lugar donde queramos recibir los datos):
?- abuelo(X,isaac).
X = teraj
X = teraj
Yes.
En esta consulta preguntamos por los abuelos de Isaac. Tras utilizar las reglas que hemos
especificado, encontramos que los abuelos son Teraj, por parte de su madre Sarai, y Teraj por
parte de su padre, Abraham. Por ltimo, devuelve verdadero cuando se llega al final del recorrido
del rbol de deduccin. Puede ser, y de hecho es frecuente si no diseamos bien las reglas, que
una consulta caiga en un bucle infinito al realizar la deduccin.
5. Sistema de inferencia: En Datalog no existen instrucciones de control. Su ejecucin se basa en
dos conceptos: la unificacin y el backtracking.
Gracias a la unificacin, cada objetivo determina un subconjunto de clusulas susceptibles de ser
ejecutadas. Cada una de ellas se denomina punto de eleccin. Datalog selecciona el primer punto
de eleccin y sigue ejecutando el programa hasta determinar si el objetivo es verdadero o falso. En
caso de ser falso entra en juego el backtracking, que consiste en deshacer todo lo ejecutado
situando el programa en el mismo estado en el que estaba justo antes de llegar al punto de
eleccin. Entonces se toma el siguiente punto de eleccin que estaba pendiente y se repite de
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
nuevo el proceso. Todos los objetivos terminan su ejecucin bien en xito ("verdadero"), bien en
fracaso ("falso").
Existen principalmente dos tipos de inferencia computacional basados en la interpretacin de las
reglas por la teora de la demostracin:
1. Mecanismo de Inferencia Ascendente: Tambin llamado encadenamiento hacia delante o
resolucin ascendente. La mquina de inferencia parte de los hechos y aplica las reglas
para generar hechos nuevos. Conviene usar una estrategia de bsqueda para generar slo
los hechos que sean pertinentes a una consulta.
2. Mecanismo de Inferencia Descendente: Tambin llamado encadenamiento hacia atrs o
resolucin descendente. Parte del predicado que es el objetivo de la consulta e intenta
encontrar coincidencias con las variables que conduzcan a hechos vlidos de la base de
datos. Retrocede desde el objetivo buscado para determinar hechos que lo satisfacen. Si
no existieran los hechos que buscamos, el sistema entonces buscar la primera regla cuya
cabeza (LHS) tenga el mismo nombre de predicado que la consulta.
3. Ventajas: Las principales ventajas al utilizar una BDD son las siguientes:
Tener la capacidad de expresar consultas por medio de reglas lgicas.
Permitir consultas recursivas y algoritmos eficientes para su evaluacin.
Contar con negaciones estratificadas.
Soportar objetos y conjuntos complejos.
Contar con mtodos de optimizacin que garanticen la traduccin de especificaciones
dentro de planes eficientes de acceso.
Como caracterstica fundamental de una Base de Datos Deductiva es la posibilidad de
inferir informacin a partir de los datos almacenados, es imperativo modelar la base de
datos como un conjunto de frmulas lgicas, las cuales permiten inferir otras frmulas
nuevas.
4. Inconvenientes: La explotacin de las reglas de deduccin en una BDD plantea algunos
problemas:
Encontrar criterios que permitan, para una ley dada; decidir su utilizacin como regla de
deduccin o como regla de coherencia.
Replantear correctamente, en un contexto deductivo, las convenciones habituales en una
base de datos (representaciones de informaciones negativas, eficacia de las respuestas a
las interrogaciones, cierre del dominio).
Desarrollar procedimientos eficaces de deduccin. La posibilidad de caer en bucles
infinitos es un problema muy importante.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/Funcionalidad2.pdf
Datos con analogas sobre dominios discretos: Este grupo de datos se construye sobre
dominios discretos en los que existen definidas relaciones de proximidad entre sus
valores. En este caso se deber almacenar la representacin de los datos adems de la
representacin de las relaciones de proximidad definidas para los valores en el dominio.
Tipo de dato Indefinido (undefined): Cuando un atributo toma el valor undefined, esto
refleja el hecho de que ningn valor de su dominio es permitido. Por ejemplo: el nmero
de telfono de alguien que no tiene telfono.
Tipo de dato desconocido (unknown): Los datos de este tipo expresan nuestra ignorancia
sobre el valor que el atributo toma, sin embargo expresa tambin que puede tomar uno
de los valores del dominio. Por ejemplo la fecha de nacimiento de alguien, la
desconocemos pero tiene que tener alguna.
Tipo de dato nulo (null): Cuando un atributo toma el valor nulo, esto significa que no
tenemos informacin sobre l, ya sea porque no conocemos su valor o porque es
imposible asignarle un valor del dominio. Por ejemplo el email de alguien es null si
desconocemos su valor o si lo tiene o no.
8. Manejo de las BDRD: Para el manejo de las bases de datos relacionales difusas (BDRD) se
utiliza el lenguaje Fuzzy SQL (FSQL) que es un lenguaje que deriva de SQL, incorporando las
siguientes novedades.
Etiquetas Lingsticas: En las sentencias FSQL las etiquetas van precedidas del smbolo $,
para poder distinguirlas fcilmente.
Comparadores Difusos: Permiten comparar dos atributos o un atributo con una constante.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Conectivas Lgicas: Pueden usarse NOT, AND y OR, para enlazar condiciones difusas
simples.
Umbral de Cumplimiento (threshold): Tras cada condicin simple puede imponerse un
umbral de cumplimiento mnimo (por defecto es 1), con el siguiente formato:
<condicin_simple> THOLD. La palabra reservada THOLD es opcional y puede sustituirse
por un comparador tradicional (=, <, <=...) modificando el sentido de la consulta. Por
defecto es equivalente al comparador >=.
Constantes Difusas: Pueden usarse en el SELECT todas las constantes difusas ya definidas:
UNKNOWN, UNDEFINED y NULL, $[a,b,c,d] (Distrib. de posibilidad Trapezoidal), $label
(Etiquetas), [n,m] (Intervalo) y #n (valores aproximados).
Funcin CDEG (<atributo>): Usada en la lista de seleccin, la funcin CDEG calcula, para
cada tupla, el grado de cumplimiento del atributo del argumento en la condicin de la
clusula WHERE.
Funcin CDEG(*): Calcula el grado de cumplimiento de cada tupla en la condicin de forma
global, para todos sus atributos y no slo para uno de ellos en particular. La funcin CDEG
usa, por defecto, los operadores tpicos para la negacin (1x), conjuncin (t-norma del
mnimo) y disyuncin (s-norma del mximo), pero pueden usarse otros (si se definen).
Carcter Comodn %: Similar al carcter comodn * de SQL, pero este incluye adems la
funcinCDEG aplicada a todos los atributos de la condicin. No incluye CDEG (*).
Condicin con IS: Tambin admite condiciones del tipo: <atributo_difuso> IS [NOT]
{UNKNOWN | UNDEFINED | NULL}.
Cuantificadores Difusos: Tiene dos modalidades que se aplican como condicin en la
clusula HAVING que sigue a una clusula GROUP BY:
Q elementos de X cumplen A:
$Cuantificador FUZZY[r] (condicin_difusa) THOLD
9. Ventajas:
Almacenar Imprecisin: la informacin que tengamos de un atributo particular de un
objeto, aunque esta informacin no sea el valor exacto. Suelen usar Etiquetas Lingsticas
con alguna definicin asociada (por ejemplo, un conjunto difuso visto como una
Distribucin de Posibilidad), o sin ninguna definicin asociada (escalares con una
relacin de similitud definida entre ellos).
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/funcionalidad%203.pdf
1.
2.
3.
4.
nivel de datos, concreto y analtico. El concepto clave de las nuevas bases de datos, a partir de la
presente dcada, ser "significado", superando el clsico "dato" o "informacin".
4. Cuestiones de La Base de Datos Multimedia: Estos son algunos de las cuestiones que
an quedan por discutir a la hora de tratar con bases de Datos Multimedia:
Modelado: Dado que se va a trabajar con objetos complejos, que van desde simples textos
hasta videos, pasando por imgenes y sonido, el objetivo es encontrar un modelo que
permita describir la estructura de los objetos, y sobre el que pueda definirse lenguajes de
acceso especializados. Si queremos almacenar datos de texto, la mejor opcin es una Base
de Datos Relacional, pero para almacenar objetos de video, por ejemplo, una mejor
opcin sera una base de Datos Orientada a Objetos. Elegir una u otra a sabiendas de que
habr ambos tipos de datos es algo sobre lo que se debe seguir investigando. Y es que en
un objeto multimedia que represente el parte de una compaa de seguros en un
accidente, por ejemplo, este podra tener imgenes del accidente, formularios de los
implicados, grabaciones de audio de ambas partes, informe sobre los hechos decidir que
modelado es ms conveniente constituye una cuestin compleja sobre la que an se
debate.
Indexacin de imgenes: A la hora de indexar la informacin de una imagen, la cuestin es
optar por tcnicas de reconocimiento y procesamiento de imgenes o bien por la
asignacin manual de frases y trminos. La primera de estas tcnicas sufre un problema de
escalabilidad, ya que no es capaz de manejar el crecimiento continuo de trabajo, debido
en gran parte a que es una tcnica a la que le queda mucho por avanzar. La asignacin
manual de trminos est actualmente ms acogida por su sencillez de adaptacin, aunque
resolver sus problemas de ambigedad de trminos requiere tcnicas ms complejas.
Por ejemplo, si decidiramos buscar Calatrava podramos encontrarnos con obras del famoso
arquitecto, con poblaciones con ese nombre o con personas con ese apellido. Una solucin a esto
es relacionar el trmino con su contexto. Es decir, diferenciar las imgenes con Calatrava que
estn junto a Venecia o Puente no trataran sobre lo mismo que si acompaa a Ciudad Real o
Poblacin.
Recuperacin de textos: Un problema que tambin est relacionado con la recuperacin
de la informacin. Por un lado, y similar a lo expuesto con las imgenes, hay problemas a
la hora de indexar correctamente frases. En contraposicin a la utilizacin de trminos
unitarios, parece que aadir descriptores supone una mejora sustancial, estos deben ser
buenos indicadores del contenido. Por otro lado, el vocabulario del usuario es usualmente
diferente del usado a la hora de indexar el documento, por lo que sera ideal el uso de un
diccionario de sinnimos para ampliar la consulta del usuario. El problema de esto es, una
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Este tipo de bases de datos necesitan grandes anchos de banda para obtener un
rendimiento ptimo.
Complejidad en cuanto a programar operaciones, o incluso la interfaz, debido a la alta
cantidad de formatos que hay que manejar, lo que puede repercutir en su rendimiento.
7. Bases De Datos Web
Introduccin: La utilizacin de la World Wide Web (www) para presentar y acumular datos se ha
desarrollado mucho ms all de la sencilla presentacin de pginas, ya no se hacen los antiguos
diseos web en los que los diseadores creaban una pgina independiente para cada elemento de
la coleccin que queran mostrar, esas pginas eran difciles de mantener y de organizar.
Cabe hacer mencin especial al gran nmero de aplicaciones a las que da soporte Internet, as
como a la naturaleza de las mismas, ya que no son aplicaciones estticas sino que estn en
constante renovacin (esto hace que sea especialmente importante separar los datos con los que
se trabaja de la aplicacin que los gestiona). Todo ello influye en la forma de almacenar y organizar
la informacin, debiendo de tener en cuenta todos estos factores a la hora de crear una BBDD
para la web.
Cualquier sitio web que presente informacin sobre un conjunto de elementos similares es
candidato para la utilizacin de una base de datos web.
La solucin general consiste en definir una base de datos, aadir un registro para cada elemento
(directamente en la base de datos o dinmicamente por la web) y despus consultar dicha base de
datos para generar pginas web sobre la marcha. Una pgina de men codificada en HyperText
Markup Language (HTML) convierte en una consulta a una base de datos de varios registros. Esto
supone una increble ventaja sobre todo a la hora del mantenimiento ya que es ms fcil tratar
una base de datos que muchas pginas individuales. Tambin un aumento de las capacidades del
HTML ya que ste tiene muchas limitaciones. Las tecnologas web estn reemplazando
arquitecturas como la terminal o cliente-servidor, incluyendo servicios y servidores web y de base
de datos entre ellos.
El funcionamiento de un navegador web es el siguiente:
1. El usuario haciendo uso del navegador web (sistema cliente) solicita visualizar una pgina
web.
2. El navegador solicita esta pgina (que est codificada en lenguaje HTML, el lenguaje que
puede interpretar) al servidor web (sistema servidor).
3. El servidor web enva la informacin que le han pedido, en HTML, al navegador del
usuario.
4. El navegador muestra la pgina web en la pantalla del usuario.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/funcionalidad%203.pdf
8. Integracin Web BBDD: Tras observar la necesidad de que los servidores contacten
con las bases de datos se necesitan mecanismos para conseguir esta comunicacin; stos
mecanismos son conocidos cmo middleware web a bases de datos. Como hemos visto en
el primer apartado, es necesario integrar la web con Bases de Datos; para conseguir esta
integracin necesitamos una extensin que nos permite la comunicacin entre el servidor
web y la base de datos. Esta extensin se conoce como middleware web a Bases de Datos.
Nuestro servidor web se puede comunicar con este middleware a travs de dos interfaces:
CGI (Common Gateway Interface): Interfaz de entrada comn (en castellano) es
tecnologa web que permite a un cliente (explorador web) solicitar datos de un programa
ejecutado en un servidor web. CGI especifica un estndar para transferir datos entre el
cliente y el programa. Es un mecanismo de comunicacin entre el servidor web y una
aplicacin externa cuyo resultado final de la ejecucin son objetos MIME. En una
aplicacin CGI, el servidor web pasa las solicitudes del cliente a un programa externo. Este
programa puede estar hecho en cualquier lenguaje que soporte el servidor, aunque por
razones de portabilidad se suelen usar lenguajes de script (PHP, Perl, Python, ASP..), y
puede realizar multitud de operaciones incluyendo el acceso a la base de datos. La salida
de dicho programa es enviada al cliente en lugar del archivo esttico tradicional. El CGI
tiene una gran desventaja y es que al utilizar scripts que son programas externos, estos
deben de ejecutarse con cada solicitud lo que disminuye mucho la eficiencia del sistema
servidor; sin embargo las tecnologas web estn ampliando horizontes y pasando parte de
la carga que antes soportaba el servidor al cliente por medio de tecnologas como AJAX
(Javascript asncrono y XML).
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
10. Datos Semiestructurados: Los datos semiestructurados son datos que pueden ser irregulares o
incompletos y cuya estructura puede cambiar de forma rpida o impredecible. Debido a esto, a
este tipo de datos no se les puede fijar un esquema fijo de antemano. La informacin asociada a
dicho esquema normalmente est contenida dentro de los propios datos. La diferencia entre los
SGBD semiestructurados con los relacionales o los orientados a objetos es que estos ltimos
deben seguir un esquema predefinido, como es el caso de los relacionales, cuyo esquema est
orientado a tablas, o los orientados a objetos, que ofrecen la posibilidad de crear estructuras ms
ricas pero aun as los datos deben estar fijados a un esquema predefinido. Es por eso que estos
SGBD tienen problemas a la hora de manejar datos semiestructurados.
Soluciones para el tratamiento de los datos semiestructurados: Existen una serie de
modelos y SGBD que permiten tratar con datos semiestructurados:
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/funcionalidad%203.pdf
Como se puede observar en la figura, un objeto OEM est compuesto por un identificador nico
de objeto, por ejemplo &9, una etiqueta textual descriptiva, name, un tipo, string, y un valor, Ann
Beech. Estos objetos pueden clasificarse como atmicos o complejos. Los atmicos son objetos
que contienen un valor para el tipo base (entero, cadena de caracteres,) y pueden reconocerse
en el diagrama porque no tienen ninguna arista saliente. Todos los dems son objetos complejos,
cuyo tipo es un conjunto de identificadores de objetos. Los objetos complejos pueden ser padres
de mltiples objetos o hijos de mltiples padres.
Este tipo de objetos se puede considerar como una cudrupla (label,oid, type, value).
Por ejemplo:
{Staff, &4, set, (&9, &10)}
{name, &9, string, Ann Beech}
{salary, &10, decimal, 12000}
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
2. Lore (Lightweight Object Repository): Lore es un SGBD para datos semiestructurados que
utiliza el modelo OEM. Tiene un lenguaje de consulta propio, Lorel, que es una extensin
del lenguaje OQL (Object Query Lenguaje). Las caractersticas ms notables de este SGBD
son:
Tiene una sintaxis similar a SQL.
Obtiene resultados significativos an en ausencia de algunos datos.
Opera uniformemente con datos de diferentes tipos.
Devuelve informacin heterognea.
Resmenes de datos que se generan y mantienen dinmicamente que permiten realizar
consultas significativas y son utilizados por el procesador de consultas para aumentar la
eficiencia de cada consulta.
Un ejemplo de consulta Lorel sera:
SELECT s.Oversees
FROM DreamHome.Staff s
WHERE s.name = Ann Beech
Cuyo resultado sera:
Answer
PropertyForRent &5
street &11 2 Manor Rd
type &12 Flat
monthlyRent &13 375
OverseenBy &4
PropertyForRent &6
Street &14 18 Dale Rd
type &15 1
annualRent &16 7200
OverseenBt &4
3. XML (eXtensible Markup Lenguage): XML es un metalenguaje (un lenguaje para describir
otros lenguajes) que permite a los diseadores crear sus propias etiquetas personalizadas
para proporcionar funcionalidad no disponible en HTML.
Fue en 1998 cuando la W3C (World Wide Web Consortium) ratifico formalmente la primera
versin de XML como un estndar de intercambio de datos. Existen dos modelos de datos
principales a la hora de trabajar con XML.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Estos son el modelo centrado en los datos y el modelo centrado en los documentos. En un modelo
centrado en los documentos, XML se utiliza como formato de almacenamiento e intercambio para
datos que estn estructurados.
En este caso, los datos podran almacenarse en un SGBD relacional, objeto-relacional u orientado a
objetos. Por tanto, para poder almacenar datos XML en SGBD tradicionales es necesario
transformar las colecciones XML en esquemas compatibles con los SGBD tradicionales. Por
ejemplo, XML ha sido completamente integrado en los sistemas Oracle9i, Oracle10g y Oracle11g a
travs de una extensin llamada Oracle XML DB. En el caso de las consultas SQL, en el estndar
SQL: 2003 hay definidas una serie de extensiones a SQL que permiten la publicacin de cdigo
XML. Estas extensiones son conocidas como SQL/XML.
En el caso de que XML se use para codificar datos semiestructurados, los SGBD tradicionales no
podrn gestionarlos correctamente. Para realizar esto se necesitara un modelo centrado en los
documentos. Para estos sistemas se usa una base de datos XML nativa (NXD, Native XML
Database). Las NXD Definen un modelo de datos (lgico) para un documento XML (para el
documento, no para los datos contenidos en el) y almacena y extrae documentos de acuerdo con
dicho modelo. Ejemplos de estos modelos son el modelo de los datos de XPath, los XML Infoset, y
los modelos explicitados por el DOM y los eventos en SAX 1.0.Se pueden distinguir dos tipos de
NXD segn su almacenamiento:
Basados en texto: almacenan el cdigo XML como texto, por ejemplo como un archivo de
un sistema de archivos o como un dato de tipo CLOB en un SGBD relacional.
Basados en modelo: almacenan el cdigo XML en alguna representacin interna en forma
de rbol.
4. Tecnologas Web Dinmicas:
CGI (COMMON GATEWAY INTERFACE) La interfaz de pasarela comn (Common Gateway
Interface, CGI) es un protocolo estndar que permite extender las capacidades de HTTP,
permitiendo interactuar una aplicacin con un servidor web. sta aplicacin puede estar
escrita en varios lenguajes como C, C++, Java, Perl, Python La tarea de un servidor es
responder las peticiones (en el caso de un servidor web, de navegadores web) devolviendo
una salida. Cada vez que llega una peticin, el servidor analiza que se est pidiendo y
devuelve la respuesta apropiada.
A continuacin se describe la forma de actuacin de un CGI de forma esquemtica:
1. En primera instancia, el servidor recibe una peticin (el cliente ha activado un URL que
contiene el CGI), y comprueba si se trata de una invocacin de un CGI.
2. Posteriormente, el servidor prepara el entorno para ejecutar la aplicacin. Esta informacin
procede mayoritariamente del cliente.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
1.
2.
3.
4.
5.
Ventajas:
Independencia del Hardware y el Software.
Independencia de la ubicacin.
Facilita el mantenimiento de las aplicaciones web, materializando la separacin entre la
persistencia de datos y las capas de presentacin y dominio de la aplicacin.
Facilita la portabilidad del sistema.
Independencia de la plataforma.
Inconvenientes:
1. Decremento de la seguridad al estar accesible desde cualquier ubicacin.
2. Incremento de la complejidad de diseo de la aplicacin web.
3. Fiabilidad dependiente de la disponibilidad de red del servidor y/o servidores donde se
aloja la Base de Datos.
Ejercicio Tema 3
1. Qu es Middleware Web a Bases de Datos?
2. Cules son las principales caractersticas que debe cumplir un SGBD utilizado en
tecnologa web?
3. Cul es la diferencia entre los SGBD semiestructurados con los relacionales o los
orientados a objetos?
4. Defina: CGI (COMMON GATEWAY INTERFACE).
5. Qu es PHP (Hypertext Pre-Processor)?
6. Cules son las dos maneras de conectarse a una base de datos web ASP.net?. Explique
su respuesta.
7. Cite un ejemplo de BBDD-WEB.
8. Qu son las Bases de Datos Multimedia?
9. Cules son los componentes de una base de informacin hipermedial?
10. Cules son los requisitos de una Base de Datos Multimedia?
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/FUNCIONALIDAD%204.pdf
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Tipos de Datos: En esta rea del almacn de datos es donde se encuentran todos los datos
contenidos en la base de datos.
Datos Detallados: Son los que se obtienen directamente del procesado de los datos, no se
encuentran almacenados en lnea, sino que se puede acceder a ellos con un nivel ms bajo
de detalle. Se almacenan de disco ocupando mucho espacio, sin embargo as se facilita el
acceso.
Datos Poco Resumidos y Muy Resumidos: Contienen los datos que el gestor del Almacn
de datos ha establecido como resmenes predefinidos, con el propsito de acelerar las
consultas. Pueden verse modificados constantemente con el fin de responder a las
variaciones de las consultas. Los datos poco resumidos corresponden al primer nivel de
agregacin de los datos detallados actualmente, o lo que es lo mismo a las consultas que
se realizan habitualmente, siendo estos almacenados en disco. Mientras que los muy
resumidos corresponden con el nivel ms alto de agregacin, o lo que es lo mismo a las
consultas que se realizan muy a menudo y que se deben obtener muy rpidamente.
Datos de Archivo/ Copia de seguridad: Es el rea donde se guardan los datos detallados y
resumidos con el fin de mantener un archivo y copias de seguridad de los datos.
Metadatos: Describen la estructura de los datos que se contienen en el almacn y pueden
ser utilizados por los gestores de carga, del almacn de datos y de consultas.
El Sistema Gestor de Base de Datos (SGBD): El principal problema que se encuentra al
utilizar almacenes de datos es el tamao del mismo, por tanto es de gran importancia una
buena eleccin de un SGBD que debe cumplir con unos requisitos tales como:
Una buena velocidad de carga.
El Procesamiento de carga.
La gestin de la calidad de los datos.
La velocidad de las consultas.
Escalabilidad en el nmero de usuarios.
Administracin del almacn.
Anlisis dimensional integrado.
La funcionalidad avanzada de consultas.
Gestor de Consultas: Es el encargado en gestionar las operaciones asociadas a las
consultas que realizan los usuarios, dirigiendo las consultas a las tablas apropiadas y
planificar la ejecucin de las mismas. La complejidad del gestor viene determinada por la
funcionalidad de la base de datos y las herramientas de acceso de los usuarios finales.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/FUNCIONALIDAD%204.pdf
aplicaciones. XML se ha consolidado como uno de los principales lenguajes para el intercambio de
informacin.
XML no es un lenguaje que haya sido diseado para el almacenamiento de datos. El tener que
repetir etiquetas en todo el documento aade una redundancia que hace que XML no sea un
lenguaje eficiente a la hora de representar datos. Aun as podemos destacar una serie de ventajas:
Las etiquetas hacen que los datos estn autodocumentados.
Su capacidad de extensin hace adaptable al lenguaje al mbito en el que se est
aplicando.
Permite representar estructuras de datos anidados.
Los documentos XML tienen un formato no rgido, lo que quiere decir que se puede aadir
ms informacin o simplemente ignorarla.
7. Lenguaje De Definicin De Datos XML: Aunque el lenguaje XML no aparece como un lenguaje
especfico para disear bases de datos, posteriormente sus ventajas para el intercambio de
informacin han hecho que cada vez sea ms ampliamente utilizado como lenguaje para la
descripcin de datos.
Los lenguajes de definicin son aquellos que nos permiten, al igual que en bases de datos
relaciones, describir la estructura que van a tener los datos (es decir, los documentos XML). Al
igual que SQL (en bases de datos relacionales) proporciona una sintaxis para describir la estructura
de los datos en base al modelo relacional, el lenguaje de definicin de datos XML puede tener un
modelo de datos subyacente y una sintaxis para describirlo. El modelo subyacente al que se tiene
que ajustar un documento XML, viene determinado, o bien por una DTD (Document Type
Definition) o bien por un XML Schema, que adems es en s un fichero XML.
A continuacin se muestra una tabla donde se comparan las bases de datos relacionales, las
orientadas a objetos y los datos XML:
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/FUNCIONALIDAD%204.pdf
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
8. Almacenamiento de Datos XML: Debido a la aceptacin que ha tenido XML se hace necesario
mecanismos para el almacenamiento y gestin de datos XML. Una solucin natural son los ficheros
de texto plano, pero debido a los diversos problemas que estos conllevan se utilizan soluciones
basadas en la tecnologa de bases de datos. Estas son las diferentes alternativas para el
almacenamiento de datos XML:
Almacenamiento en ficheros planos.
Almacenamiento en BD.
En BD relacionales
Almacenamiento como cadenas de caracteres
Representacin en rbol
Asignacin a relaciones
En BD como ficheros planos: atributo de tipo XML en una columna
Almacenamiento en BD XML Nativas
Bases de datos Relaciones y XML: Existen diferentes mecanismos para almacenar la
informacin de los documentos XML en bases de datos relacionales:
Almacenamiento como cadenas de caracteres: esta solucin trata de almacenar todo el
documento XML en un campo de una tabla. El inconveniente que tiene esta solucin es
que el SGBD no puede conocer la estructura del documento XML.
Representacin en rbol: los datos son representados como un rbol y se almacenan en
dos tablas:
Nodos(id, tipo, etiqueta, valor)
Hijos(id-hijo, id-padre)
La tabla hijo establece la relacin entre cada elemento y atributo y su elemento padre.
Se puede aadir un atributo ms (posicin) a hijo, que guarda el orden de los hijos. Esta
aproximacin tiene la ventaja de que permite almacenar cualquier dato XML, aunque ste no
tenga una estructura conocida (DTD o esquema XML) en formato relacional.
Asignacin a relaciones: se trata de un enfoque hbrido en el que los elementos XML, cuyo
esquema es conocido, se asignan a relaciones y atributos. Para cada tipo de elemento
cuyo esquema es conocido, se crea una relacin del modo siguiente:
Se crea un atributo id para almacenar una identificacin nica para cada elemento.
Todos los atributos de elemento se convierten en atributos de la relacin.
Todos los subelementos que se producen una sola vez se convierten en atributos.
Si el valor del subelemento es texto, el atributo almacena el texto como valor.
Para subelementos complejos, la relacin correspondiente al subelemento almacena el
contenido del subelemento junto al id del padre y el atributo almacena el id del
subelemento.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Extensiones XML a las bases de datos: Las extensiones XML a las bases de datos permiten
el almacenamiento y la gestin de documentos XML en SGBD convencionales,
habitualmente relacionales u objeto-relaciones (OR). Existen diferentes aproximaciones
para el almacenamiento:
Almacenamiento no estructurado: los documentos XML se almacenan directamente en
formato de texto en un atributo de tipo fichero, como por ejemplo, CLOB (Carcter Large
Object).
Almacenamiento estructurado: se usa un metamodelo de documentos XML capaz de
representar rboles de nodos de documentos XML, que se construye utilizando primitivas
de modelado del SGBD convencional que hay por debajo. La estructura de los documentos
XML se convierte en el esquema de base de datos. El contenido de los documentos XML se
puede consultar utilizando las facilidades proporcionadas por el SGBD.
Ejercicio de autoevaluacn
Cul es el objetivo de los almacenes de datos?
Qu es el repositorio de datos operacionales?
Cules son los requisitos que debe cumplir el SGBD?
Cules son los cinco grupos en que pueden clasificarse las herramientas de acceso para los
usuarios?
Enumere las caractersticas de los mercados de datos.
Describa los diferentes flujos de datos que pueden darse en un almacn de datos.
Qu es Lenguaje De Definicin De Datos XML?
Cules son las diferentes alternativas para el almacenamiento de datos XML?
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
4. DISTRIBUCIN
Conocer que las bases de datos distribuidas son un grupo de informacin que corresponde a un
sistema que se encuentra repartido entre computadores de una misma red, ya sea a nivel local o
global, cada sitio en la red es independiente tanto en sus capacidades de procesamiento, como en
la realizacin de operaciones locales; en cada uno de estos equipos debe ejecutarse un programa
a nivel global que admita la consulta de toda la informacin como si se tratase de uno solo.
OBJETIVO GENERAL
Disear el modelo avanzado de la base de datos basado en modelos que extienden o
sustituyen al modelo relacional.
OBJETIVOS ESPECFICOS
Conocer que las bases de datos distribuidas son un grupo de informacin que corresponde
a un sistema que se encuentra repartido entre computadores de una misma red, ya sea a
nivel local o global.
Comprender que un sistema de bases de datos federadas es una coleccin de sistemas de
bases de datos cooperativos y autnomos.
Prueba Inicial
1. Sabe usted Qu son Bases de Datos Distribuidas?
2. Identifica usted los tipos de almacenamiento en una base de datos distribuida.
3. Identifique mnimo tres ventajas y tres desventajas de la implementacin de las bases de
datos distribuidas.
4. Sabe usted Qu son Bases de Datos Federadas y Mviles?
5. Enumere 3 caractersticas principales de los Sistemas Gestores de Bases de Datos
Federadas.
6. Defina que son las bases de datos mviles.
7. Identifique cuales con las aplicaciones mviles y los tipos de datos.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
http://www.iessanvicente.com/colaboraciones/BBDDdistribuidas.pdf
Para tener una base de datos distribuida debe cumplirse las condiciones de una Red
Computacional. Una red de comunicacin provee las capacidades para que un proceso
ejecutndose en un sitio de la red enve y reciba mensajes de otro proceso ejecutndose en un
sitio distinto. Parmetros a considerar incluyen: Retraso en la entrega de mensajes, Costo de
transmisin de un mensaje y Confiabilidad de la red. Diferentes tipos de redes: POINT-TO-POINT,
BROADCAST, LAN, WAN.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Global Schema: Define todos los datos que estn incluidos en la bd distribuida tal como si
la bd no fuera distribuida. Consiste de una definicin de relaciones globales.
Fragmentation Schema: Traduccin entre relaciones globales y fragmentos. (Una relacin
global puede consistir de varios fragmentos pero un fragmento est asociado con slo una
relacin global).
Allocation Schema: Define el sitio (o sitios) en el cual un fragmento est localizado.
Local Maping Schema: Traduce los fragmentos locales a los objetos que son manejados
por el SMBD local
Separacin entre fragmentacin y localizacin.
Transparencia de Fragmentacin
Transparencia de Localizacin
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
http://www.iessanvicente.com/colaboraciones/BBDDdistribuidas.pdf
http://www.iessanvicente.com/colaboraciones/BBDDdistribuidas.pdf
3. Tipos de almacenamiento:
Replica: El sistema conserva varias copias o rplicas idnticas de una tabla. Cada rplica se
almacena en un nodo diferente.
Ventajas:
Disponibilidad: El sistema sigue funcionando an en caso de cada de uno de los nodos.
Aumento del paralelismo: Varios nodos pueden realizar consultas en paralelo sobre la
misma tabla. Cuantas ms rplicas existan de la tabla, mayor ser la posibilidad de que el
dato buscado se encuentre en el nodo desde el que se realiza la consulta, minimizando
con ello el trfico de datos entre nodos.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Inconveniente:
Aumento de la sobrecarga en las actualizaciones: El sistema debe asegurar que todas las rplicas
de la tabla sean consistentes. Cuando se realiza una actualizacin sobre una de las rplicas, los
cambios deben propagarse a todas las rplicas de dicha tabla a lo largo del sistema distribuido.
Fragmentacin: Existen tres tipos de fragmentacin la horizontal, la vertical y la mixta.
Fragmentacin Horizontal: Una tabla T se divide en subconjuntos, T1, T2, ...Tn. Los fragmentos se
definen a travs de una operacin de seleccin y su reconstruccin se realizar con una operacin
de unin de los fragmentos componentes. Cada fragmento se sita en un nodo.
Pueden existir fragmentos no disjuntos: combinacin de fragmentacin y replicacin.
Ejemplo:
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Fragmentacin Vertical: Una tabla T se divide en subconjuntos, T1, T2, ...Tn. Los fragmentos se
definen a travs de una operacin de proyeccin.
Cada fragmento debe incluir la clave primaria de la tabla. Su reconstruccin se realizar con una
operacin de join de los fragmentos componentes, pueden existir fragmentos no disjuntos:
combinacin de fragmentacin y replicacin.
Ejemplo:
http://www.iessanvicente.com/colaboraciones/BBDDdistribuidas.pdf
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Fragmentacin Mixta: Como el mismo nombre indica es una combinacin de las dos anteriores
vistas he aqu un ejemplo a partir de una tabla fragmentada horizontalmente.
http://www.iessanvicente.com/colaboraciones/BBDDdistribuidas.pdf
http://www.iessanvicente.com/colaboraciones/BBDDdistribuidas.pdf
http://www.iessanvicente.com/colaboraciones/BBDDdistribuidas.pdf
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
definidas sobre relaciones globales a consultas definidas sobre fragmentos. As tambin, ser
necesario mezclar las respuestas a consultas fragmentadas para obtener una sola respuesta a una
consulta global. El acceso a una base de datos distribuida debe hacerse en forma transparente. En
resumen, la transparencia tiene como punto central la independencia de datos.
La responsabilidad sobre el manejo de transparencia debe estar compartida tanto por el sistema
operativo, el sistema de manejo de bases de datos y el lenguaje de acceso a la base de datos
distribuida. Entre estos tres mdulos se deben resolver los aspectos sobre el procesamiento
distribuido de consultas y sobre el manejo de nombres de objetos distribuidos.
5. Procesamiento Distribuido de Consultas: El procesamiento de consultas es de suma
importancia en bases de datos centralizadas. Sin embargo, en BDD ste adquiere una
relevancia mayor. El objetivo es convertir transacciones de usuario en instrucciones para
manipulacin de datos. No obstante, el orden en que se realizan las transacciones afecta
grandemente la velocidad de respuesta del sistema. As, el procesamiento de consultas
presenta un problema de optimizacin en el cual se determina el orden en el cual se hace
la menor cantidad de operaciones. En BDD se tiene que considerar el procesamiento local
de una consulta junto con el costo de transmisin de informacin al lugar en donde se
solicit la consulta.
6. Recuperacin: En los entornos distribuidos de datos podemos encontrar lo siguientes:
Fallo de los nodos: Cuando un nodo falla, el sistema deber continuar trabajando con los
nodos que an funcionan. Si el nodo a recuperar es una base de datos local, se debern
separar los datos entre los nodos restantes antes de volver a unir de nuevo el sistema
Copias mltiples de fragmentos de datos: El subsistema encargado del control de
concurrencia es el responsable de mantener la consistencia en todas las copias que se
realicen y el subsistema que realiza la recuperacin es el responsable de hacer copias
consistentes de los datos de los nodos que han fallado y que despus se recuperarn.
Transaccin distribuida correcta: Se pueden producir fallos durante la ejecucin de una
transaccin correcta si se plantea el caso de que al acceder a alguno de los nodos que
intervienen en la transaccin, dicho nodo falla.
Fallo de las conexiones de comunicaciones: El sistema debe ser capaz de tratar los
posibles fallos que se produzcan en las comunicaciones entre nodos. El caso ms extremo
es el que se produce cuando se divide la red. Esto puede producir la separacin de dos o
ms particiones donde las particiones de cada nodo pueden comunicarse entre s pero no
con particiones de otros nodos.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Para implementar las soluciones a estos problemas, supondremos que los datos se
encuentran almacenados en un nico nodo sin repeticin. De sta manera slo existir
un nico catlogo y un nico DM (Data Manager) encargados del control y acceso a las
distintas partes de los datos. Para mantener la consistencia de los datos en el entorno
distribuido contaremos con los siguientes elementos:
Catlogo: Programa o conjunto de programas encargados de controlar la ejecucin
concurrente de las transacciones.
CM (Cache Manager): Subsistema que se encarga de mover los datos entre las memorias
voltiles y no voltiles, en respuesta a las peticiones de los niveles ms altos del sistema de
bases de datos. Sus operaciones son Fetch(x) y Flush(x).
RM (Recovery Manager): Subsistema que asegura que la base de datos contenga los
efectos de la ejecucin de transacciones correctas y ninguno de incorrectas. Sus
operaciones son Start, Commit, Abort, Read, Write, que utilizan a su vez los servicios del
CM.
DM (Data Manager): Unifica las llamadas a los servicios del CM y el RM.
TM (Transaction Manager): Subsistema encargado de determinar que nodo deber
realizar cada operacin a lo largo de una transaccin.
Las operaciones de transaccin que soporta una base de datos son: Start, Commit y Abort. Para
comenzar una nueva transaccin se utiliza la operacin Start. Si aparece una operacin commit, el
sistema de gestin da por terminada la transaccin con normalidad y sus efectos permanecen en
la base de datos. Si, por el contrario, aparece una operacin abort, el sistema de gestin asume
que la transaccin no termina de forma normal y todas las modificaciones
7. Ventajas y Desventajas:
Ventajas:
Los sistemas de bases de datos distribuidos tienen mltiples ventajas. En primer lugar los
datos son localizados en lugar ms cercano, por tanto, el acceso es ms rpido, el
procesamiento es rpido debido a que varios nodos intervienen en el procesamiento de
una carga de trabajo, nuevos nodos se pueden agregar fcil y rpidamente. La
comunicacin entre nodos se mejora, los costos de operacin se reducen, son amigables al
usuario, la probabilidad de que una falla en un solo nodo afecte al sistema es baja y existe
una autonoma e independencia entre los nodos.
Las razones por las que compaas y negocios migran hacia bases de datos distribuidas
incluyen razones organizacionales y econmicas, para obtener una interconexin confiable
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
y flexible con las bases de datos existentes, y por un crecimiento futuro. El enfoque
distribuido de las bases de datos se adapta ms naturalmente a la estructura de las
organizaciones. Adems, la necesidad de desarrollar una aplicacin global (que incluya a
toda la organizacin), se resuelva fcilmente con bases de datos distribuidas. Si una
organizacin crece por medio de la creacin de unidades o departamentos nuevos,
entonces, el enfoque de bases de datos distribuidas permite un crecimiento suave.
Los datos se pueden colocar fsicamente en el lugar donde se accedan ms
frecuentemente, haciendo que los usuarios tengan control local de los datos con los que
interactan. Esto resulta en una autonoma local de datos permitiendo a los usuarios
aplicar polticas locales respecto del tipo de accesos a sus datos.
Mediante la replicacin de informacin, las bases de datos distribuidas pueden presentar
cierto grado de tolerancia a fallos haciendo que el funcionamiento del sistema no dependa
de un solo lugar como en el caso de las bases de datos centralizadas.
La independencia de datos se puede dar en dos aspectos: lgica y fsica.
Desventajas:
Las razones por las que compaas y negocios migran hacia bases de datos distribuidas
incluyen razones organizacionales y econmicas, para obtener una interconexin confiable
y flexible con las bases de datos existentes, y por un crecimiento futuro. El enfoque
distribuido de las bases de datos se adapta ms naturalmente a la estructura de las
organizaciones. Adems, la necesidad de desarrollar una aplicacin global (que incluya a
toda la organizacin), se resuelva fcilmente con bases de datos distribuidas. Si una
organizacin crece por medio de la creacin de unidades o departamentos nuevos,
entonces, el enfoque de bases de datos distribuidas permite un crecimiento suave.
Los datos se pueden colocar fsicamente en el lugar donde se accedan ms
frecuentemente, haciendo que los usuarios tengan control local de los datos con los que
interactan. Esto resulta en una autonoma local de datos permitiendo a los usuarios
aplicar polticas locales respecto del tipo de accesos a sus datos.
Mediante la replicacin de informacin, las bases de datos distribuidas pueden presentar
cierto grado de tolerancia a fallos haciendo que el funcionamiento del sistema no dependa
de un solo lugar como en el caso de las bases de datos centralizadas.
La independencia de datos se puede dar en dos aspectos: lgica y fsica.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Ejercicio Tema 1
1.
2.
3.
4.
5.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
A continuacin se muestra una figura que ilustra la conexin entre los diferentes elementos que
forman una base de datos federada.
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/Distribuidas2.pdf
Como se puede apreciar en la figura anterior, un SGBDF est formado por varios gestores de bases
de datos. Dichos gestores pueden ser tanto gestores de bases de datos centralizadas (SGBD) como
gestores de bases de datos distribuidas (SGBDD). Los SGBDD, adems, pueden ser a su vez
sistemas de bases de datos federados. Tanto los sistemas gestores como las bases de datos que lo
forman son denominados componentes del SGBDF.
Los componentes de un SGBDF pueden ejecutar tanto sus operaciones locales como participar en
la ejecucin de las consultas sobre los datos federados (operaciones globales). La autonoma de
cada componente es controlada por el administrador del sistema junto a cada administrador de
cada uno de los componentes. Esto es debido a que dicha autonoma difiere segn la necesidad de
federacin existente de cada base de datos con el esquema global. Todas las federaciones en
conjunto forman el sistema federado. En cualquier momento, segn la necesidad, cualquiera de
ellas puede variar. Como se ha dicho antes, el usuario final es transparente a las uniones entre
componentes que haya por debajo, por lo que el nico cambio que un usuario puede percibir es
que tenga acceso a diferentes datos en el esquema global.
3. Tipos de SGBDF: Los SGBDF se pueden clasificar en 2 grandes categoras: fuertemente
acoplados y dbilmente acoplados. Antes de detallar ambas categoras, se muestra un
esquema que especfica los diferentes tipos de bases de datos federadas.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/Distribuidas2.pdf
Nivel Externo: Est representado por el esquema externo. Este esquema est compuesto
por las diferentes vistas que poseen los usuarios a los datos compartidos.
Para mostrar de forma ms clara esta arquitectura se sugiere la siguiente figura:
de otra base de datos con una tecnologa diferente, es decir, de otro fabricante. En este
caso las posibilidades se reducen, y es necesaria la incorporacin de algn componente
extra que incrementa el costo considerablemente.
8. Caso de Uso: MySQL: A continuacin se va a realizar un ejemplo sencillo de base de datos
federada. Para ello se va a utilizar el SGBD MySQL, que dispone de una versin gratuita
que permite crear bases de datos federadas.
En primer lugar se va a definir la tabla cliente que ser consultada por la tabla federada. Notar que
pertenece a la base de datos bbdd1.
CREATE DATABASE IF NOT EXISTS bbdd1;
USE bbdd1;
DROP TABLE IF EXISTS `cliente`;
CREATE TABLE `cliente` (
`idCliente` int(10) unsigned NOT NULL auto_increment,
`Nombre` varchar(45) NOT NULL,
`Apellidos` varchar(45) NOT NULL,
PRIMARY KEY (`idCliente`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/08-09/Distribuidas2.pdf
Ahora, nuestra base de datos federada va a contener otra tabla que va a tener una federacin a
esta primera tabla definida.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
La tabla federada que se acaba de crear muestra los mismos datos que la tabla remota a la que
consulta. Notar que con referencia a la definicin de la primera tabla existen 2 diferencias:
El motor de consulta cambia de MyISAM a FEDERATED.
Se aade el atributo COMMENT donde se especifica la direccin de la tabla remota a la
que tiene que consultar.
9. Base de Datos Mviles:
Introduccin: En los ltimos aos se han producido grandes avances en las tecnologas de
comunicacin inalmbricas. Estos avances, junto al uso cada vez ms extendido de los
dispositivos mviles, han causado la aparicin de una nueva disciplina: la computacin
mvil. Gracias a la computacin mvil, los usuarios pueden acceder a una base de datos
remota en cualquier momento y en cualquier lugar. Los empleados de una empresa
pueden trabajar desde su casa, desde las instalaciones del cliente o mientras estn de
viaje, de la misma forma que si estuvieran en la oficina. La computacin mvil introduce el
concepto de base de datos mvil. Una base de datos mvil es una base de datos portable,
fsicamente independiente del servidor corporativo de base de datos y capaz de
comunicarse con ese servidor desde sitios remotos para compartir datos corporativos.
Utilizando bases de datos mviles, los trabajadores pueden acceder a los datos
corporativos desde cualquier dispositivo que disponga de conexin a Internet.
Arquitectura: La arquitectura general de una plataforma mvil es un modelo distribuido
formado por computadores fijos, estaciones base y unidades mviles. Los computadores
fijos son computadores de uso general que no disponen de medios para comunicarse con
las unidades mviles. Las estaciones base disponen de enlaces inalmbricos para conectar
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
con las unidades mviles; son mquinas que actan de intermediarios entre las unidades
mviles y los computadores fijos. Los computadores fijos y las estaciones base estn
interconectados por medio de una red fija (cableada) de alta velocidad. Las unidades
mviles se conectan a las estaciones base mediante enlaces inalmbricos; los enlaces ms
comunes son el estndar 802.11 (Wi-Fi), el servicio GPRS y la tecnologa Bluetooth.
Las unidades mviles se pueden mover libremente por un espacio conocido como dominio de
movilidad geogrfica, cuyo alcance est determinado por la cobertura de los enlaces inalmbricos.
Este dominio se divide en dominios ms pequeos llamados celdas. Cada celda es controlada por
una estacin base. El movimiento de las unidades mviles dentro del dominio de movilidad
geogrfica no debe estar restringido, es decir, se debe garantizar el acceso a la informacin
aunque las unidades mviles se muevan entre las celdas.
Modos de funcionamiento: Hay dos modos de funcionamiento para trabajar con los
datos:
El usuario de un dispositivo mvil se conecta al servidor de base de datos corporativo y
trabaja directamente con los datos.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
El usuario descarga una copia de los datos y trabaja con ellos de forma local.
Posteriormente, se conectar al servidor de base de datos corporativo para actualizar la
base de datos.
La adopcin del modo funcionamiento depende fundamentalmente de los requisitos de cada
aplicacin. Otro factor importante a la hora de elegir el modo de funcionamiento es la tecnologa
de comunicacin utilizada para conectar a las estaciones base; el costo puede ser elevado si la
conexin con el servidor es permanente y se utiliza una comunicacin de pago como GPRS.
6. Sistemas Gestores de Bases de Datos mviles: Muchos fabricantes ofrecen SGBD mviles
capaces de comunicarse con los principales SGBD relacionales. Estos SGBD mviles estn
adaptados a los recursos limitados de las unidades mviles y proporcionan una serie de
funcionalidades adicionales:
Comunicacin con el servidor centralizado de base de datos mediante tcnicas de
comunicacin inalmbrica.
Replicacin de datos en el servidor centralizado de base de datos y en el dispositivo mvil.
Sincronizacin de datos entre el servidor centralizado de base de datos y el dispositivo
mvil.
Gestin de datos en el dispositivo mvil.
Anlisis de los datos almacenados en el dispositivo mvil.
7. Aplicaciones mviles y tipos de datos: Las aplicaciones mviles se clasifican en las dos
siguientes categoras: aplicaciones verticales y aplicaciones horizontales (Imielinski y
Badrinath, 1994).
En las aplicaciones verticales, los usuarios acceden a los datos en una celda especfica; fuera de la
celda los datos no estn disponibles. Un ejemplo de aplicacin vertical es la obtencin de
informacin sobre las plazas libres de un determinado parking. En las aplicaciones horizontales, los
datos estn distribuidos por todo el sistema, y los usuarios pueden acceder a ellos desde cualquier
celda. La aplicacin horizontal ms comn es el acceso al correo electrnico.
Los datos se clasifican en tres categoras:
Datos privados: pertenecen a un usuario y slo l puede acceder a ellos y manejarlos. Por
ejemplo, los datos del perfil de un usuario de cualquier aplicacin que gestione datos
personales.
Datos pblicos: pueden ser consultados por cualquier usuario, pero slo pueden ser
modificados por una nica fuente. Por ejemplo, los datos de las cotizaciones de la bolsa.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Datos compartidos: pueden ser accedidos por un grupo determinado de usuarios, quienes
tienen permisos para leerlos y para escribirlos. Por ejemplo, los datos de seguros de una
compaa aseguradora que vende productos utilizando agentes comerciales.
Las aplicaciones horizontales utilizan, principalmente, datos pblicos, mientras que las
aplicaciones horizontales suelen utilizar ms los datos compartidos.
8. Ejemplos de bases de datos mviles: iAnywhere Solutions, empresa filial de Sybase, lidera
el ranking del mercado de bases de datos mviles gracias a SQL Anywhere. Este paquete
proporciona bases de datos que pueden utilizarse tanto a nivel de servidor (soporta
mquinas de hasta 64bits) como a nivel de dispositivo mvil. SQL Anywhere se compone
de las siguientes tecnologas:
SQL Anywhere Server: sistema gestor de bases de datos relacionales para los sistemas de
bases de datos mviles.
Ultralite: sistema gestor de bases de datos que puede embeberse en dispositivos mviles.
Mobilink: tecnologa de sincronizacin para el intercambio de datos entre bases de datos
relacionales y bases de datos no relacionales.
QAnywhere: facilita el desarrollo de aplicaciones mviles robustas y seguras.
SQL Remote: permite a los usuarios de dispositivos mviles sincronizar sus datos con otras
bases de datos SQL Anywhere.
DB2 Everyplace de IBM es una base de datos relacional y un servidor de sincronizacin que
permite extender las aplicaciones y los datos empresariales a dispositivos mviles. Gracias a un
consumo de recursos reducido, esta base de datos puede integrarse en dispositivos como PDAs y
telfonos mviles.
Microsoft tambin ofrece una base de datos para dispositivos mviles. Se trata de Microsoft SQL
Server Compact 3.5, un motor de bases de datos que permite desarrollar aplicaciones en cualquier
plataforma Windows incluyendo Tablet PCs, Pocket PCs, Smart Phones y equipos de escritorio.
Oracle Database Lite 10g es la solucin de Oracle para desarrollar aplicaciones en entornos
mviles. Proporciona un cliente que permite la realizacin de consultas SQL para acceder a los
datos locales del dispositivo y un servidor para gestionar los datos de forma centralizada.
Otros productos menos utilizados son Borlands JDataStore, una base de datos Java para
dispositivos mviles y aplicaciones Web, o MobiSnap, un proyecto de investigacin cuyo objetivo
es soportar el desarrollo de aplicaciones con bases de datos relacionales en entornos mviles.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
9. Caso de estudio: Oracle Database Lite 10g: Oracle Database Lite 10g es una solucin
integrada para el desarrollo de aplicaciones en entornos mviles. Para evitar que los
dispositivos mviles estn continuamente conectados al servidor, Oracle Database Lite
10g proporciona una pequea base de datos para gestionar los datos empresariales de
forma local en el dispositivo mvil.
La figura anterior muestra la arquitectura de las aplicaciones Oracle Database Lite 10g. Esta
arquitectura contiene los siguientes componentes:
Mobile Sync Module: aplicacin instalada en el dispositivo mvil que permite la
sincronizacin de datos con el servidor empresarial.
Oracle Lite RDBMS: sistema gestor de bases de datos relacionales creado especficamente
para dispositivos mviles. Proporciona interfaces ODBC, JDBC, SODA y ADO para permitir
la utilizacin de aplicaciones desarrolladas en lenguajes como Java, C/C++ y Visual Basic.
Oracle Lite database: base de datos instalada en el dispositivo mvil.
Mobile Server: servidor intermedio entre los dispositivos mviles y el servidor empresarial.
Permite la instalacin y actualizacin de aplicaciones en los dispositivos mviles y se
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
comunica con el mdulo Mobile Sync para sincronizar los datos entre el dispositivo mvil y
el servidor empresarial.
Message Generator and Processor (MGP): mdulo utilizado en la sincronizacin de datos
para detectar y solucionar cualquier conflicto que pueda producirse en la actualizacin de
los datos del servidor.
Mobile Server Repository: repositorio que contiene informacin necesaria para que el
Mobile Server pueda ejecutarse. Esta informacin se almacena junto a los datos del
negocio, en la misma base de datos.
Los pasos para poner en funcionamiento una aplicacin con Oracle Database Lite 10g son los
siguientes:
1. Instalar y configurar la base de datos Oracle en el servidor.
2. Instalar y configurar el Mobile Server en el equipo que har de intermediario entre los
dispositivos mviles y el servidor.
3. Instalar y configurar el Mobile Server Repository en el servidor.
4. Instalar Oracle Lite RDBMS y Mobile Sync en los dispositivos mviles; para facilitar esta
tarea, Oracle ofrece un producto llamado Mobile Development Kit, que instala
rpidamente todos los componentes en los dispositivos mviles.
Una base de datos local Oracle Lite contiene un subconjunto de los datos almacenados en la base
de datos Oracle. Los cambios realizados en el dispositivo mvil deben sincronizarse con los datos
del servidor. De esta tarea se encarga el mdulo Mobile Sync; primero enva los cambios al Mobile
Server, y despus descarga los nuevos cambios y los aplica en la base de datos local Oracle Lite.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
ellos. Este tipo de sistemas son sistemas gestores de bases de datos embebidos en el
mismo dispositivo.
Las bases de datos federadas son un conjunto de esquemas unificados, a diferencia de las
bases de datos mviles, que slo disponen de un esquema global.
Los sistemas de bases de datos federados permiten dar acceso a una gran cantidad de
datos que los dems sistemas no podran permitir ni soportar.
7. En qu casos es ms recomendable usar un sistema u otro?: Las bases de datos mviles
son recomendadas en los casos en los que los usuarios deben estar movindose de un
lugar para otro para realizar las funciones y cuando la informacin que deben tratar se
puede mostrar y tratar en un dispositivo mvil. Este tipo de base de datos tambin
permite a los dispositivos mviles y a las aplicaciones que corren en ellos almacenar datos,
con todas las ventajas que ofrece un gestor de base de datos. Los sistemas de bases de
datos federados son usados cuando la cantidad de datos es muy grande y, adems,
cuando los mismos se encuentren en diferentes sistemas. Estos sistemas permiten unificar
las bases de datos para permitir al usuario acceder a los datos de forma transparente, sin
que sea consciente de la modularidad de la base de datos, y as poder acceder a diferentes
datos de diferentes bases de datos a la vez.
EJERCICIO DE AUTOEVALUACIN
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
5. RENDIMIENTO
Identificar de forma general el concepto de paralelismo en las bases de datos, el cual se puede
definir como la particin de la base de datos (normalmente a nivel de relaciones) para procesar de
manera paralela en diferentes discos y con distintos procesadores una sola operacin sobre la
base de datos.
OBJETIVO GENERAL
Implementar la base de datos utilizando las tecnologas de bases de datos avanzadas.
OBJETIVOS ESPECFICOS
Identificar de forma general el concepto de paralelismo en las bases de datos y
reconocerla como una tecnologa innovadora para manejar ordenadamente todo tipo de
recursos, entre ellos equipos de cmputo, almacenamiento y aplicaciones definidas.
Prueba Inicial
1. Defina que son las Bases de Datos Paralelas.
2. Qu es paralelismo E/S?
3. Qu es paralelismo entre consultas?
4. Enumere 5 caractersticas de las Bases de Datos GRID.
5. Identifique 5 ventajas e inconvenientes de las Bases de Datos en un Sistema GRID.
6. Qu son los metadatos en Bases de Datos en un Sistema GRID.
Las empresas utilizan cada vez mayores volmenes de datos para planificar sus
actividades. Las consultas usadas para estos fines son de ayuda a la toma de decisiones y
pueden necesitar hasta varios terabytes de datos que no se pueden manejar con un nico
procesador en el tiempo necesario.
La naturaleza orientada a conjuntos de las consultas se presta a la paralelizacin.
Las mquinas paralelas con varios procesadores son relativamente baratas.
El paralelismo se usa para mejorar la velocidad en la ejecucin de consultas. Adems el
paralelismo se usa para proporcionar dimensionabilidad ya que la creciente carga de trabajo se
trata sin incrementar el tiempo de respuesta pero incrementando el grado de paralelismo. Existen
cuatro arquitecturas de sistemas paralelos:
De memoria compartida: Todos los procesadores comparten una memoria comn.
De discos compartidos: Todos los procesadores comparten un conjunto de discos comn.
Sin compartimiento: Los procesadores no comparten ni memoria ni disco.
Jerrquica: Este modelo es un hbrido de las arquitecturas anteriores.
Paralelismo de E/S: De forma general podemos hablar de paralelismo de E/S cuando
hablamos de divisiones en las relaciones entre varios discos para reducir el tiempo
necesario de su recuperacin. Normalmente la divisin ms comn en un entorno de
bases de datos paralelas es la divisin horizontal. En este tipo de divisin las tuplas de
cada relacin se dividen entre varios discos de modo que cada tupla resida en un disco
distinto. Suponiendo que tenemos n discos (D0,D1,,Dn-1) entre los que se van a dividir
los datos, existen varias estrategias de divisin:
Turno rotatorio: Se recorre la relacin y la i-sima tupla se enva al disco Di mod n quedando una
distribucin homognea de las tuplas en los discos.
Divisin por asociacin: Se escogen varios atributos del esquema de la relacin y se designan
como atributos de divisin. Se escoge una funcin de asociacin cuyo rango es
{0,1,,n-1}. Cada tupla de la relacin original se asocia en trminos de los atributos de divisin. Si
la funcin de asociacin devuelve i, la tupla de ubica en el disco DI.
Divisin por rangos: Se distribuye rangos contiguos de valores de los atributos a cada disco. Para
ello se escoge un atributo de divisin, AD, como vector de divisin y la relacin se divide de la
siguiente manera:
Sea *vo, v1, , vn-2] el vector de divisin con i<j y vi<vj. Considrese una tupla t tal que t[A]=x.
Si x< vo entonces t se ubica en el disco Do.
Si xvn-2 entonces t se ubica en el disco Dn-1.
Si vix < vi+1 entonces t se ubica en el disco DI+1
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Comparativa entre tcnicas de divisin: Cuando ya hemos dividido una relacin en varios
discos se puede recuperar en paralelo utilizndolos todos de la misma manera que se
puede escribir en paralelo cuando se est dividiendo una relacin. Por lo tanto, cuando se
quiera leer (o escribir) la relacin completa ganaremos tiempo gracias al paralelismo.
Adems de leer de forma completa una relacin existen otro tipo de lecturas o consultas:
Exploracin de la relacin completa: Ya mencionada
Consultas concretas: Buscan tuplas con un determinado valor para un atributo concreto.
Consultas de rango: Buscan tuplas con un valor que est dentro de un rango para un
atributo concreto.
Las tcnicas de divisin explicadas permiten estos tipos de acceso pero con diferentes niveles de
eficacia:
Turno rotatorio: Se adapta bien a la exploracin completa pero no es eficiente para
consultas concretas y de rango ya que tiene que buscar en todos los discos.
Divisin por asociacin: Este esquema se adapta bien a las consultas concretas basadas en
el atributo de divisin ya que dirigimos la consulta al disco que se nos indica la funcin de
asociacin para el atributo y el valor del mismo. Tambin se adapta bien a una exploracin
completa si la funcin de asociacin reparte bien las tuplas en los discos. Sin embargo no
es adecuada esta tcnica para consultas concretas cuando el atributo de bsqueda no
coincide con el atributo de divisin.
Divisin por rangos: Se adapta bien a las consultas concretas y de rango basadas en el
atributo de divisin. Para consultas concretas se debe analizar el vector de divisin para
ver en que disco est la tupla al igual que para una consulta de rango se consulta el vector
de divisin para ver en que rango de discos estn las tuplas.
Resumiendo, la eleccin de la tcnica depende de las operaciones que se vayan a ejecutar.
En general se prefiere divisin por asociacin o por rangos a turno rotatorio. En la siguiente tabla
se resume la comparativa:
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/Rendimiento.pdf
El problema de las divisiones por asociacin es que tienden a almacenar un alto porcentaje de
tuplas en algunos discos especficos, situacin que no se da con el turno rotatorio. Esto se debe a
que muchas tuplas contiene valores similares en sus atributos. Para minimizar este problema se
debe de elegir un vector de divisin equilibrado.
Si una relacin contiene un nmero pequeo de tuplas sta no debe ser dividida y debe
almacenarse en un solo disco.
2. Paralelismo entre consultas: Los sistemas de bases de datos con arquitectura paralela
deben asegurar de que dos procesadores no actualicen simultneamente los mismos
datos de manera independiente. Cuando un procesador accede a los datos o los actualiza,
el sistema de bases de datos debe garantizar que tenga su ltima versin en la memoria
intermedia. El problema de asegurar que la versin sea la ltima disponible se denomina
problema de coherencia de cache. Existen una serie de protocolos para garantizar la
coherencia de cache, que normalmente se integran con los de control de concurrencia
para reducir la sobrecarga.
Los protocolos de este tipo de sistemas de disco compartido son los siguientes:
Antes de cualquier acceso de lectura o escritura de una pgina, la transaccin la bloquea
en modo compartido o excluso, segn corresponda. Inmediatamente despus de obtener
el bloqueo compartido o exclusivo de la pgina, la transaccin lee tambin su copia ms
reciente del disco compartido.
Antes de que una transaccin libere el bloqueo exclusivo de una pgina, la traslada al disco
compartido, posteriormente libera el bloqueo.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Con este protocolo se garantiza que cuando una transaccin establece un bloqueo
compartido o exclusivo sobre una pgina, obtenga la copia correcta de la pgina.
3. Paralelismo en consultas: Es la ejecucin en paralelo de una nica consulta entre varios
procesadores y discos, cuyo objetivo es acelerar las consultas de ejecucin prologada. Por
tanto se puede hacer paralelas las consultas haciendo paralelas las operaciones que las
forman.
Existen dos maneras de ejecutar en paralelo una sola consulta:
Paralelismo en operaciones. Se puede acelerar el procesamiento de las consulta haciendo
paralela la ejecucin de cada una de sus operaciones individuales ordenacin, seleccin,
proyeccin y reunin.
Paralelismo entre Operaciones. Se puede acelerar el procesamiento de la consulta
ejecutando en paralelo las diferentes operaciones de las expresiones de las consultas.
Por lo tanto el objetivo que se persigue es dividir la relacin que interviene en la consulta por
medio de tcnicas de divisin de relaciones, guardar dichas relaciones en discos que van a ser
gestionados cada uno de ellos por un procesador, a su vez, cada procesador ejecuta su consulta
local y cada uno de estos resultados parciales se unen para formar la respuesta a la consulta.
Paralelismo en operaciones: Ya que las operaciones relacionales trabajan con relaciones
que contienen grandes conjuntos de tuplas, las operaciones se pueden paralelizar
ejecutndolas sobre subconjuntos diferentes de las relaciones en paralelo. Segn el tipo
de operacin se siguen distintos criterios en el tratamiento que son:
Ordenacin Paralela
Reunin Paralela.
Ordenacin paralela: Dependiendo del criterio en la divisin de la relacin se pueden
distinguir dos tipos de ordenacin:
Ordenacin divisin de Rangos: Esta forma de divisin por rangos posee dos etapas
diferenciadas:
Redistribuir las tuplas de la relacin utilizando una estrategia de divisin por rangos, de
manera que todas las tuplas que se hallen dentro del rango i-simo se enven al
procesador Pi, que almacena temporalmente la relacin en el disco Di. Para implementar
en paralelo la divisin por rangos cada procesador lee las tuplas de su disco y las enva al
procesador de destino. Cada procesador P0,P1Pn tambin recibe las tuplas
correspondientes a su particin y las almacena localmente.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Cada uno de los procesadores ordena localmente su particin de la relacin sin interactuar con los
dems. La operacin final de mezcla es trivial ya que la divisin por rangos de la primera etapa
asegura que los valores de la clave del procesador Pi sean menores que los procesador Pj
Ordenacin y mezcla externa paralela: Este tipo de ordenacin es una alternativa a la efectuada
por la divisin por rangos. Las etapas que se definen una vez que la relacin se ha divida entre los
diferentes discos D1,D2Dn-a son las siguientes:
1. Cada procesador Pi ordena localmente los datos del disco Di
2. El sistema mezcla las partes ordenadas por cada procesador para obtener el resultado
ordenado final.
A su vez el paso en el que el sistema realiza la mezcla puede ser tambin paralelizado mediante la
siguiente secuencia de acciones.
1. El sistema divide en rangos las particiones ordenadas encada procesador Pi entre los
procesadores P0,P1Pn-1. Enva las tuplas de acuerdo con el orden establecido por lo que
cada procesador recibe las tuplas en corrientes ordenadas.
2. Cada procesador Pi, realiza una mezcla de las corrientes segn las recibe para obtener una
sola parte ordenada.
3. Las partes ordenadas de los procesadores P0,P1 Pn-1 se concatenan para obtener el
resultado final.
Reunin paralela: La operacin reunin exige que el sistema compare pares de tuplas
para ver si satisface la condicin de reunin, si la cumple aade el par al resultado de la
reunin. Los algoritmos de reunin paralela intentan repartir entre varios procesadores los
pares que hay que comparar. Cada procesador procesa luego localmente parte de la
reunin. Despus, el sistema rene los resultados de cada procesador para producir el
resultado final. Existe un problema por el cual no todas los tipos de reuniones pueden ser
divididas por lo que existen distintas formas de proceder que son:
Reunin por Divisin: Vlida para reuniones de tipo equirreuniones y reuniones naturales, en la
cual existen n procesadores y las relaciones que hay que reunir son r y s. La reunin por divisin
funciona de esta forma:
El sistema divide las relaciones r y s en n particiones r0,r1,rn-1 y s0,s1,sn-1
Enva las particiones ri y si al procesador Pi, donde la reunin se procesa localmente.
Existen dos maneras diferentes de dividir las relaciones r y s y son:
Divisin por rangos de los atributos de reunin, en el que se debe usar el mismo vector de
divisin.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Divisin por asociacin de los atributos de reunin, se debe usar la misma funcin de
asociacin.
Una vez divididas las relaciones se pueden utilizar localmente cualquier tcnica de reunin en cada
procesador Pi para calcular la reunin de ri y s.
Reunin con fragmentos y replicas: Proporcionan una alternativa para las reuniones que no puede
ser procesada por la tcnica de reunin por divisin, como por ejemplo si la condicin de reunin
es una desigualdad. En este tipo de reuniones pueden paralelizarse utilizando una tcnica
denominada fragmentos y replicas, cuyo funcionamiento es el siguiente.
1. El sistema divide una de las relaciones (por ejemplo s) mediante cualquier tcnica de
divisin, incluida por turno rotatorio.
2. El sistema replica la otra relacin r en todos los procesadores
3. El procesador Pi procesa localmente la reunin de ri con todos, utilizando cualquier tcnica
de reunin.
Reunin por asociacin dividida en paralelo. La reunin por asociacin realizada en cada
procesador es independiente de las realizadas en otros procesadores, y recibir las tuplas de ri y de
si es parecido a leerlas del disco. En concreto, se puede utilizar el algoritmo hbrido de reunin por
asociacin para guardar en cach algunas de las tuplas de entrada, y evitar as los costos de
escribirlas y volver a leerlas.
http://alarcos.inf-cr.uclm.es/doc/bbddavanzadas/07-08/Rendimiento.pdf
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Por otro lado, podemos decir que con Grid, no ponemos atencin en los datos que se transmiten
en s, como es el caso de los sistemas Cliente-Servidor sino que el punto de inters y estudio son
los recursos computacionales y el uso que se hace de ellos.
Otro avance de Grid es que genera un incremento de las posibilidades del uso de internet ya que
proporciona un incremento de su usabilidad. De este modo se obtiene una mayor velocidad de
procesamiento as como la facilidad de tener bases de datos de mayor tamao.
Una definicin de computacin Grid encontrada en wikipedia es la siguiente:
GRID COMPUTING: Es una tecnologa innovadora que permite utilizar de forma coordinada todo
tipo de recursos (entre ellos cmputo, almacenamiento y aplicaciones especficas) que no estn
sujetos a un control centralizado. En este sentido es una nueva forma de computacin distribuida,
en la cual los recursos pueden ser heterogneos (diferentes arquitecturas, supercomputadores,
clusters...) y se encuentran conectados mediante redes de rea extensa (por ejemplo Internet).
Desarrollado en mbitos cientficos a principios de los aos 90 su entrada al mercado comercial
siguiendo la idea de la llamada Utility Computing supone una revolucin que dar mucho que
hablar. Las caractersticas de esta arquitectura seran:
Capacidad de balanceo de sistemas: no habra necesidad de calcular la capacidad de los
sistemas en funcin de los picos de trabajo, ya que la capacidad se puede reasignar desde
la granja de recursos a donde se necesite;
Alta disponibilidad. Con la nueva funcionalidad, si un servidor falla, se reasignan los
servicios en los servidores restantes;
Reduccin de costos: Con esta arquitectura los servicios son gestionados por "granjas de
recursos". Ya no es necesario disponer de "grandes servidores" y podremos hacer uso de
componentes de bajo costo.
7. Grid middleware: En las tecnologas Grid, adems de tenerse en cuenta el hardware como
son los recursos, los dispositivos de almacenamiento y por supuesto la propia red Grid, es
necesario un soporte software que gestione todas las transferencias y el modo en que se
realizan, as como la seguridad, todo esto resulta una tarea complicada y no exenta de
posibles errores. Esto no implica que la aparicin de un error en un equipo y en una
localizacin determinada, provoque el error en toda la red.
8. Bases de datos GRID: Las Bases de Datos Grid nos proporcionan una visin uniforme de
bases de datos heterogneas en los entornos Grid. Es decir, puesto que existen diversos
tipos de bases de datos, refirindonos con ellos a que stas pueden ser relacionales,
orientadas a objetos, en XML, etctera, nuestro sistema nos tiene que proporcionar la
abstraccin necesaria de los datos para que el usuario no distinga entre s est accediendo
a una relacional o a una orientada a objetos, ya que el usuario no le importa cmo se
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
realice el trabajo, solo necesita que se haga y debe ser el Grid middleware quien se ocupe
de que se efecte correctamente.
Por otro lado la especificacin de los servicios de bases de datos deben ser ortogonales a los
mecanismos de autentificacin y autorizacin de los sistemas Grid, lo que significa que las bases
de datos deben poseer sistemas de seguridad que identifiquen a un usuario del Grid y que por
tanto permitan o no su acceso. Las propias bases de datos deben de ser transparentes al usuario,
logrando as que este se abstraiga de todo lo relacionado con el cmo se hace, donde o incluso
que recursos o almacenamiento est siendo utilizado. Del mismo modo, no deber preocuparse
por la administracin de los recursos.
9. Requisitos para la utilizacin de BBDD en Grid: Para utilizar Base de Datos en el GRID,
estas primeramente deben de cumplir una serie de condiciones previas, como son las
normas de seguridad en un GRID.
Algunos aspectos claves de la seguridad en el GRID son:
Autentificacin: Verificacin de la validez de la identidad de un usuario, recurso, servicio,..
Autorizacin: Cada recurso o usuario solo debe usar los servicios para los que est
permitido (control de acceso).
Integridad: Asegura que los datos no han sido alterados fraudulentamente.
Confidencialidad: Informacin sensible como puede ser informacin de carcter. personal,
orientacin sexual, datos mdicos o bancarios, no puede ser observada por terceros.
Gestin de claves: Hace referencia a la gestin de seguridad, proceso de distribucin,
generacin y almacenamiento de claves.
Encriptacin:
Simtrica: El proceso de encriptacin se realiza usando la misma clave privada.
Inconvenientes: El emisor y el receptor deben intercambiar la clave.
Asimtrica: Se utilizan dos claves diferentes para encriptar y desencriptar datos.
Criptografa de clave pblica.
Lentitud considerable en mensajes grandes.
Aparicin de patrones que puede simplificar su criptoanlisis.
Secure Socket Layer/ Transport Layer Security (SSL/ TLS): Protocolo de comunicacin
segura.
Autentificacin Mutua: Dos entidades que quieren comunicarse usan su clave pblica
almacenada en un certificado digital para autentificarse.
Estos servicios fundamentales se garantizan mediante:
GRID Security Infrastructure (GSI)
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Notificacin: Sirve para notificar los cambios que se producen a los clientes que deseen
recibir esa informacin. Los clientes deben poder expresar si estn interesados en recibir
las notificaciones cuando se inserten o se borren datos o cuando se realicen
actualizaciones o en caso de varias acciones como insertar y actualizar. La forma ms
sencilla de que este servicio se ponga en funcionamiento es que el sistema gestor de base
de datos subyacente proporcione la ayuda necesaria, por ejemplo mediante disparadores.
Planificacin: Se debe permitir por ejemplo que cuando un superordenador conecte con
un DBS, la informacin recuperada del DBS se pueda procesar por el superordenador.
El ancho de banda en la red que los conecta necesita ser reservada. Como el acceso exclusivo a un
DBS no es prctico, se requieren mecanismos con suficientes recursos (discos, CPUs, memoria,
red).
11. Ventajas e Inconvenientes de las BBDD en un Sistema GRID: Las bases de datos alojadas
en un sistema GRID van a heredar todas las caractersticas: ventajas e inconvenientes del
sistema al que pertenecen. La Computacin GRID est creada con el fin de ofrecer una
solucin a determinadas cuestiones, como problemas que requieren de:
Un gran nmero de ciclos de procesamiento o un acceso a una gran cantidad de datos.
Las principales ventajas de un sistema GRID son:
Nunca queda obsoleta, ya que se integran diferentes tipos de mquinas y de recursos y
todos los recursos se aprovechan. Si se renuevan todas las PCs de una oficina, se pueden
incorporar las antiguas y las nuevas.
Facilita la posibilidad de compartir, acceder y gestionar informacin, mediante la
colaboracin y la flexibilidad operacional, aunando no slo recursos tecnolgicos dispares,
sino tambin personas y aptitudes diversas.
Permite a las empresas acceder y compartir bases de datos remotas. Esto es de gran
importancia en las empresas que se dedican a la investigacin, en donde enormes
cantidades de informacin son generadas y analizadas casi a diario.
Las empresas pueden mejorar la calidad y el tiempo de entrega de los productos y
servicios que ofrecen, a la vez que reducen costos de TI al permitir la colaboracin
transparente y la comparticin de recursos.
Tiende a incrementar la productividad otorgando a los usuarios finales acceso a los
recursos de computacin, datos y almacenamiento que necesiten, cuando los necesiten.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
se conecta al GRID pueda comunicar al resto los servicios que ofrece. Del mismo modo
podremos saber las operaciones que soporta cada uno.
El sistema gestor de bases de datos (SGBD) va a ser el encargado de saber qu servicios ofrece
cada una de las bases de datos, que operaciones se pueden realizar sobre ellas y de gestionar los
permisos de acceso a cada una.
Servicios que describen los metadatos: Los servicios que cada sistema debe tener
disponibles dentro del GRID son los siguientes:
Metadatos: Nos dan la informacin sobre los servicios que ofrece el sistema. Adems,
cuando los usuarios del sistema soliciten un servicio no saben en qu sistema est y
mediante los metadatos se pueden construir dinmicamente las interfaces para acceder a
los distintos sistemas de bases de datos que forman parte del GRID.
Manejo de consultas: Como hemos comentado ms arriba los lenguajes pueden ser
diferentes. Por eso en los metadatos se proporciona la informacin necesaria sobre el
lenguaje de consulta que soporta cada base de datos. Tambin es importante que los
resultados de una consulta se puedan enviar a distintos destinos y que sean comprensibles
por stos para poder construir sistemas ms amplios y complejos.
Transacciones: Estas operaciones son en las que interviene un nico sistema de base de
datos y a su vez que cada sistema individual tome parte en las transacciones distribuidas.
La gran variedad de tipos de transacciones que maneja el sistema gestor de base de datos
de un sistema GRID, debido sobre todo a la heterogeneidad de los sistemas individuales
que lo componen, hace que el servicio deba poner claramente en conocimiento del resto
cual es el tipo de transacciones que soporta el sistema individual de base de datos.
Carga del sistema o carga de datos. Cuando tenemos grandes cantidades de taos este tipo
de servicio debe ser capaz de acceder a los protocolos de comunicacin del sistema GRID
para llevar a cabo la transferencia de esos datos.
Notificacin. Sirve para notificar los cambios que se producen a los clientes que deseen
recibir esa informacin. Los clientes deben poder expresar si estn interesados en recibir
las notificaciones cuando se inserten o se borren datos o cuando se realicen
actualizaciones o en caso de varias acciones como insertar y actualizar. La forma ms
sencilla de que este servicio se ponga en funcionamiento es que el sistema gestor de base
de datos subyacente proporcione la ayuda necesaria, por ejemplo mediante disparadores.
Planificacin: Se debe permitir por ejemplo que cuando un superordenador conecte con
un sistema de base de datos, la informacin recuperada de ese sistema pueda ser
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
procesada por el superordenador. El ancho de banda en la red que los conecta necesita
ser reservada. Como el acceso exclusivo a un sistema de base de datos no es prctico, se
requieren mecanismos con suficientes recursos (discos, CPUs, memoria, red).
EJERCICIO DE AUTOEVALUACIN
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
6. PISTAS DE APRENDIZAJE
Recuerde: Las bases de datos tradicionales, son llamadas tambin pasivas.
Tenga en Cuenta: Cualquier modificacin sobre el comportamiento reactivo se puede llevar a cabo
cambiando solamente las reglas activas, sin necesidad de variar las aplicaciones.
Tener Presente: Para definir Reglas Deductivas que permiten concluir, inferir u obtener
informacin nueva a partir de los datos almacenados o sucesos condicionados.
Recuerde: Una base de datos multimedia es un conjunto de informacin combinada, la cual puede
ser texto, arte grfico, sonido, animacin y vdeo.
Tenga en Cuenta: El Almacn de Datos permite recopilar la informacin de una forma confiable,
segura y de calidad.
Tenga Presente: Las bases de datos distribuidas son un grupo de informacin que corresponde a
un sistema que se encuentra repartido entre computadores de una misma red.
Recuerde: Una red de comunicacin suministra las capacidades para que un proceso en ejecucin
en un sitio de la red enve y reciba mensajes de otro que se encuentra ejecutndose en un sitio
distinto.
Acurdese: En un sistema federado los usuarios tienen acceso a la informacin, de los distintos
sistemas, a travs de una interfaz comn.
Tenga en Cuenta: Las propiedades de una base de datos federada son: heterogeneidad,
autonoma y distribucin.
Recuerde: Gracias a esta computacin, los usuarios logran acceder a una base de datos remota en
cualquier momento y en cualquier lugar.
Tener Presente: Una base de datos paralela es una tecnologa innovadora que maneja
ordenadamente todo tipo de recursos, entre ellos equipos de cmputo, almacenamiento y
aplicaciones definidas.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
7. GLOSARIO
Bases de Datos Activas: Un sistema de bases de datos activas es un sistema de gestin de bases
de datos (SGBD) que contiene un subsistema que permite la definicin y la gestin de reglas de
produccin (reglas activas).
Datos: Conjunto de smbolos que representan una determinada informacin.
Distribucin: Se denomina distribucin al reparto de uno o varios elementos.
Evento: Un evento es una variante de las propiedades para los campos cuyos tipos sean
delegados. Es decir, permiten controlar la forman en que se accede a los campos delegados y dan
la posibilidad de asociar cdigo a ejecutar cada vez que se aada o elimine un mtodo de un
campo delegado.
Objeto: Un programa tradicional se compone de procedimientos y datos, un programa orientado a
objetos se compone solamente de objetos, que es una encapsulacin general de datos y de los
procedimientos para manipularlo.
Orientado a Objetos: Orientacin a Objeto En la programacin tradicional, se distingue entre los
datos y los procedimientos. En la tcnica de programacin orientada a objeto no es as, puesto que
no existen.
Portabilidad: Se define como la caracterstica que posee un software para ejecutarse en diferentes
plataformas, el cdigo fuente del software es capaz de reutilizarse en vez de crearse un nuevo
cdigo cuando el software pasa de una plataforma a otra. A mayor portabilidad menor es la
dependencia del software con respecto a la plataforma.
Red: Una red de computadoras, tambin llamada red de ordenadores o red informtica, es un
conjunto de equipos informticos conectados entre s por medio de dispositivos fsicos que envan
y reciben impulsos elctricos, ondas electromagnticas o cualquier otro medio para el transporte
de datos, con la finalidad de compartir informacin y recursos y ofrecer servicios. Este trmino
tambin engloba aquellos medios tcnicos que permiten compartir la informacin.
Servidor: En informtica, un servidor es una computadora que, formando parte de una red, provee servicios
a otras computadoras denominadas clientes.
XML: El XML es considerado como un metalenguaje de definicin de documentos estructurados mediante
marcas o etiquetas. Se trata de un estndar del W3C cuyo objetivo es crear unas reglas bsicas para permitir
el intercambio de informacin estructurada entre aplicaciones, y en particular, entre aplicaciones web.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
8. BIBLIOGRAFA
Sistemas de bases de datos orientadas a objetos: Conceptos y arquitecturas. Editorial: AddisonWesley / Diaz de Santos. Autores: Elisa Bertino, Lorenzo Martino.
Sistemas de bases de datos: Un enfoque prctico para diseo, implementacin y gestin. 4
Edicin. Editorial: Pearson Addison- Wesley. Autores: Thomas M. Connolly, Carolyn E. Begg.
Fundamentos de Bases de datos. 5 Edicin. Editorial: McGraw Hill. Autores: Silberschatz, Korth,
Sudarshan
Bases de Datos Orientadas a Objeto y el estndar ODMG. Autores: Clara Martn Sastre y Enrique
Medarde Caballero.
http://tejo.usal.es/~fgarcia/docencia/poo/02-03/trabajos/S1T3.pdf
http://kybele.escet.urjc.es/documentos/BD/T3-ModeloOR.pdf
http://informatica.uv.es/iiguia/DBD/Practicas/boletin_1.pdf
http://informatica.uv.es/iiguia/DBD/Teoria/capitulo_4.pdf
L.Mota Herranz y M. Celma Gimnez - Mtodos para la comprobacin de la integridad de en bases
de datos deductivas
Gonzlez Alvarado, Carlos. Sistema de Bases de Datos. Editorial Tecnolgica de Costa Rica, Primera
Edicin, 1996.
Elmasri, Ramez. Sistemas de Bases de Datos. Editorial Addison Wesley Iberoamericana S-A.
Segunda Edicin, 1997.
I.C. Silvia Eloisa Carln Salgado y M.Sc. Rosendo Moreno Rodrguez - Valorizacin de las bases de
datos deductivas y de las bases de datos activas
http://gpd.sip.ucm.es/ Rafael Caballero Roldn. Introduccin a las bases de datos deductivas
P. Julin Iranzo. Apuntes de Programacin Declarativa, 2002
http://sistemas.itlp.edu.mx/revistadsyc Marco Antonio Castro Liera - Bases de Datos Relacionales
Difusas
Grosky, William I. Managing Multimedia Information in Database Systems, University of Detroit,
1997
Connolly T., Begg C., Sistemas de b ases de datos - Un enfoque practica para diseo,
implementacin y gestin. Ed PearsonAddison-Wesley.
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
Rob P., Coronel C., Sistemas de bases de datos - Diseo Implementacion y Administracion. Ed.
Thomson.
Atzeni P.,Stefano C., Database Systems - Concepts, Languages and Architectures. Ed. McGraw
Hill.
Introduccin a la Documtica http://tramullas.com/documatica/indice.html, Jess Tramullas y
Kronos 1997, 2000.
http://es.wikipedia.org/wiki/Common_Gateway_Interface.html
http://es.wikipedia.org/wiki/AJAX
http://es.wikipedia.org/wiki/P%C3%A1gina_web
http://es.wikipedia.org/wiki/Contenido_din%C3%A1mico
http://www.iec.csic.es/criptonomicon/bd/
http://msdn2.microsoft.com/es-es/library/ms178371(VS.80).aspx
Tecnologa y Diseo de Bases de Datos, PIATTINI VELTHUIS, MARIO G / MARCOS MARTINEZ,
ESPERANZA / CALERO MUOZ, CORAL / VELA SNCHEZ, BELN
Sistemas de Bases de Datos. Un enfoque prctico para diseo, implementacin y gestin,
THOMAS M. CONNOLLY/ CAROLYN E. BEGG
Oracle9i
Data
Warehousing
Guide
Release
2
(9.2):
http://www.mpiinf.mpg.de/departments/d5/teaching/ss05/is05/oracle/server.920/a96520/toc.ht
m
http://es.geocities.com/lenguajesde_recuperacion/xquery.htm
http://www.rhernando.net/modules/tutorials/doc/bd/dw.html
http://es.wikipedia.org/wiki/Almac%C3%A9n_de_datos
http://usuarios.lycos.es/jrodr35/
http://html.rincondelvago.com/bases-de-datos-distribuidas_1.html
http://sacbeob.8m.com/tutoriales/bddistribuidas/index.htm
http://www.cs.cinvestav.mx/SC/prof_personal/adiaz/Disdb/Cap_1.html
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia
http://es.wikipedia.org/wiki/Grid_computing
http://www.catedravodafone.etsit.upm.es/formacion/seminarios/grid.html
http://seti.astroseti.org/setiathome/que.php
http://ciencia.astroseti.org/planetary/articulo.php?num=320
http://es.wikipedia.org/wiki/Computaci%C3%B3n_distribuida#Grid
http://websearch.internet2.edu/query.html?Search.x=0&Search.y=0&qt=middleware&col=i2sites
&charset=iso-8859-1
http://wiki.dbgrid.org/index.php
http://www.gridpp.ac.uk/papers/DAISStatementSpec.pdf
SilBerschatz, Kort, Sudarshan Fundamentos de Base de Datos (4 y 5 Edicin), Espaa, Mc Graw
Hill, 2002 y 2007.
http://www.ayi-asociados.com/presentaciones/Grid_cast-B&N.pdf
(http://www.fdi.ucm.es/profesor/rubensm/Doctorado/Introduccion%20a%20la%20Seguridad%20
en%20un%20GRID.pdf)
http://www.gae.unican.es/Top/Presentaciones/SC06/SemanadelaCiencia_UNICAN_v1.ppt
http://indico.ifca.es/indico/getFile.py/access?contribId=9&resId=1&materialId=slides&confId=75
http://www.error500.net/garbagecollector/archives/categorias/bases_de_datos/sistema_gestor_
de_base_de_datos_sgbd.php
http://psicosix.iespana.es/bd2/trabajo01.pdf
http://eu-datagrid.web.cern.ch/eu-datagrid/
DATABASES AND THE GRID. Watson, P. University of Newcastle [2001] WHAT IS THE GRID? A
THREE POINT CHECKLIST. Foster, I., University of Chicago [2002]
ORACLE DATABASE 10G: THE DATABASE FOR THE GRID. An Oracle White Paper.Oracle [2003]
Corporacin Universitaria Remington - Calle 51 51-27 Conmutador 5111000 Ext. 2701 Fax: 5137892. Edificio Remington
Pgina Web: www.remington.edu.co - Medelln - Colombia