Sie sind auf Seite 1von 42

FUNDAMENTOS DE BASE DE DATOS DISTRIBUIDAS

1.1 Conceptos Bsicos

Bases de Datos Distribuidas

Base de Datos Distribuida (BDD)

Una Base de Datos Distribuida (BDD) es un conjunto de mltiples bases de datos lgicamente relacionadas, las cuales se encuentran distribuidas entre diferentes sitios interconectados por una red de comunicaciones, los cuales tienen la capacidad de procesamiento autnomo lo cual indica que puede realizar operaciones locales o distribuidas.

Bases de Datos Distribuidas

Sistema de Bases de Datos Distribuida


Un sistema de Bases de Datos Distribuida (SBDD) es un sistema en el cual: Mltiples sitios de bases de datos estn ligados por un sistema de comunicaciones. de tal forma que, un usuario en cualquier sitio puede acceder los datos en cualquier parte de la red exactamente como si los datos estuvieran ah.

Bases de Datos Distribuidas

Por qu son necesarias las BDD?


La respuesta es que las empresas ya estn generalmente distribuidas al menos de manera lgica (en divisiones, departamentos, grupos de trabajo, etc.) Y es muy probable que tambin lo estn de manera fsica (en plantas, fbricas, laboratorios, etc.);

Bases de Datos Distribuidas

De esto deducimos que por lo general tambin los datos ya estn distribuidos Ya que cada unidad organizacional dentro de la empresa mantendr los datos que son importantes para su propia operacin Por lo tanto, el valor de la informacin total de la empresa est divido en lo que a veces llamamos islas de informacin

Bases de Datos Distribuidas

Ventajas:
Lo que hace un Sistema Distribuido es proporcionar los puentes necesarios para conectar a esas islas entre s En otras palabras, permite que la estructura de la BD refleje la estructura de la empresa los datos locales son conservados localmente en el lugar donde pertenecen de manera ms lgica Y al mismo tiempo, permite tener acceso a datos remotos cuando sea necesario.

Bases de Datos Distribuidas

Ventajas:
El arreglo distribuido combina eficiencia de procesamiento (los datos se mantienen cerca del punto en donde se usan ms frecuentemente). Con una mayor accesibilidad (es posible acceder a una cuenta remota y viceversa, por medio de la red de comunicaciones).

Probablemente el mayor beneficio de los sistemas distribuidos es que permiten que la estructura de la
BD refleje la estructura de la empresa

Bases de Datos Distribuidas

Desventajas:
Costo del desarrollo del software. Complejidad, se debe asegurar que la base de datos sea transparente. Falta de experiencia, las BDD son un campo

relativamente nuevo y poco comn por lo cual no existe


muncho personal con experiencia o conocimientos adecuados.

Bases de Datos Distribuidas

Ejemplos de algunos DDBMS :


Implementaciones comerciales: La mayora de los productos SQL actuales proporcionan algn tipo de soporte de BDD (con diversos grados de funcionalidad).
Ingres/Star, el componente de BDD de Ingres La opcin de BDD de Oracle La propiedad de datos distribuidos de DB2

Bases de Datos Distribuidas

Principio Fundamental
Ante el usuario, un sistema distribuido debe lucir exactamente igual que un sistema que no es distribuido
En otras palabras, los usuarios de un sistema distribuido deben ser capaces de comportarse exactamente como si no fuera distribuido. Todos los problemas de los sistemas distribuidos son, o deberan ser, problemas internos o en el nivel de implementacin, y no externos o en el nivel de usuario.

1.2 Objetivos de las BDD

Bases de Datos Distribuidas

El principio fundamental nos conduce a 12 reglas u objetivos: 1.- Autonoma local. Los sitios en un sistema distribuido deben ser autnomos.
La autonoma local significa que todas las operaciones en un sitio dado estn controladas por ese sitio; ningn sitio X debe depender de algn otro sitio Y para su operacin satisfactoria. La seguridad, integridad y representacin de almacenamiento de los datos locales permanecen bajo el control y jurisdiccin del sitio local.

Bases de Datos Distribuidas

12 reglas u objetivos:
2.- No dependencia de un sitio central. La autonoma local implica que todos los sitios deben ser tratados como iguales.
Por lo tanto, no debe haber particularmente ninguna dependencia de un sitio maestro central para algn servicio central, tal que todo el sistema dependa de ese sitio central.

Razones por las cuales no debera haber un sitio central: El sitio central puede ser un cuello de botella
El sistema sera vulnerable; es decir, si el sitio central falla, tambin fallar todo el sistema

Bases de Datos Distribuidas

12 reglas u objetivos:
3.- Operacin continua. Una ventaja de los sistemas distribuidos es que deben proporcionar mayor confiabilidad y mayor disponibilidad.
Confiabilidad. La probabilidad de que el sistema est listo y funcionando en cualquier momento dado. Los SD no son una propuesta de todo o nada; pueden continuar operando cuando hay alguna falla en algn componente independiente. Disponibilidad. La probabilidad de que el sistema est listo y funcionando continuamente a lo largo de un perodo especificado.

Bases de Datos Distribuidas

12 reglas u objetivos:
4.- Independencia de ubicacin. Conocida tambin como transparencia de ubicacin.
Los usuarios no tienen que saber dnde estn almacenados fsicamente los datos, sino que deben ser capaces de comportarse como si todos los datos estuvieran almacenados en su propio sitio local.
Esto simplifica los programas de los usuarios. En particular, permite que los datos emigren de un sitio a otro sin invalidar ninguno de estos programas o actividades.

Bases de Datos Distribuidas

12 reglas u objetivos:
5.- Independencia de fragmentacin. Un sistema soporta la fragmentacin de datos cuando puede ser dividida en o partes o fragmentos, para efectos de almacenamiento fsico.
La fragmentacin es necesaria por razones de rendimiento: los datos pueden estar almacenados en la ubicacin donde son usados ms frecuentemente para que la mayora de las operaciones sean locales y se reduzca el trfico en la red. Los usuarios deben comportarse como si los datos en realidad estuvieran sin fragmentacin alguna.

Bases de Datos Distribuidas

12 reglas u objetivos:
6.- Independencia de replicacin. El sistema soporta replicacin de datos cuando un fragmento puede ser representado por muchas copias distintas, o rplicas, guardadas en muchos sitios distintos.
Las rplicas son principales: necesarias por dos razones

1. Significan un mejor rendimiento.

Bases de Datos Distribuidas

12 reglas u objetivos:
6.- Independencia de replicacin
2. Pueden significar una mejor disponibilidad (un objeto replicado permanece disponible para su procesamiento, mientras est disponible al menos una copia). Por supuesto, la principal desventaja de las rplicas es que al actualizarlas es necesario actualizar todas: el problema de la propagacin de la actualizacin.

Bases de Datos Distribuidas

12 reglas u objetivos:
7.- Procesamiento de consultas distribuidas. La optimizacin es importante en un sistema distribuido que en uno centralizado, incluso mucho ms.
El punto bsico es que en una consulta que involucra a varios sitios, habr muchas formas posibles de mover los datos en el sistema para satisfacer la solicitud, y es crucialmente importante que se encuentre una estrategia eficiente.

Bases de Datos Distribuidas

12 reglas u objetivos:
8.- Administracin de transacciones distribuidas. Existen dos aspectos principales en la administracin de transacciones: control de recuperacin y control de la concurrencia.
Ambos aspectos requieren un tratamiento amplio en el ambiente distribuido. Ya que una sola transaccin puede involucrar la ejecucin de cdigo en muchos sitios.

Bases de Datos Distribuidas

12 reglas u objetivos:
9.- Independencia de hardware. Soporte para un gran nmero de mquinas diferentes. Poder integrar todos los datos de todos estos sistemas y presentar al usuario una imagen del sistema nico. 10.-Independencia de sistema operativo. Obviamente es necesario no slo tener la posibilidad de ejecutar el mismo DBMS en diferentes plataformas de hardware, sino tambin ejecutarlo en diferentes plataformas de sistema operativo.

Bases de Datos Distribuidas

12 reglas u objetivos:
11.- Independencia de red. Si el sistema va a tener la posibilidad de soportar muchos sitios distintos es obviamente necesario tener la posibilidad de soportar tambin una variedad de redes de comunicacin distintas.

Bases de Datos Distribuidas

12 reglas u objetivos:
12.- Independencia de DBMS. Lo que se necesita es que todos los ejemplares de DBMS en sitios diferentes soporten la misma interfaz.
Aunque no tienen que ser necesariamente copias del mismo software DBMS.

En otras palabras, sera posible que el sistema distribuido fuera heterogneo, al menos en cierto grado.
Sera muy bueno si diferentes DBMS pudieran participar de alguna forma en un sistema distribuido.

1.3 Disciplinas Estudio

Bases de Datos Distribuidas

Como principales disciplinas de estudio para conocer las bases de datos tenemos las siguientes:
A) INGENIERIA: Para conocer como se desarrollan y que forma tendrn para implementarse. B) ALGEBRA: Buscando establecer relaciones en base a funciones algebraicas. C) BASES DE DATOS: Buscando un adecuado funcionamiento de acuerdo a los principios de estas.

D) REDES: Implementado en adecuado sistema para su funcionamiento sin concurrencia.

Bases de Datos Distribuidas

Hospitales

Comercios
Bancos Proceso comercial Proceso educativo Farmacias

ARQUITECTURA DE BASES DE DATOS DISTRIBUIDAS

Bases de Datos Distribuidas

ARQUITECTURA GENERAL DE BASES DE DATOS


Podemos destacar tres niveles principales segn la visin y la funcin que realice el usuario sobre la base de datos: Nivel Interno: es el nivel ms cercano al almacenamiento fsico de los datos. Permite escribirlos tal y como estn almacenados en el ordenador. En este nivel se disean los archivos que contienen la informacin, la ubicacin de los mismos y su organizacin, es decir se crean los archivos de configuracin.

Nivel conceptual: En este nivel se representan los datos que se van a utilizar sin tener en cuenta aspectos como lo que representamos en el nivel interno.

Bases de Datos Distribuidas

Nivel externo: es el ms cercano al usuario. En este nivel se describen los datos o parte de los datos que ms interesan a los usuarios. Estos tres niveles de visin de usuarios los proporcionan los sistemas gestores de base de datos.

Bases de Datos Distribuidas

La mayora de los sistemas de manejo de bases de datos disponibles actualmente estn basadas en la arquitectura ANSI-SPARC la cual divide a un sistema en tres niveles: interno, conceptual y externo.

Bases de Datos Distribuidas

La arquitectura define la estructura de un sistema. Al definir la arquitectura se deben identificar las componentes de un sistema, las funciones que realiza cada una de las componentes y las interrelaciones e interacciones entre cada componente.
Desde el punto de vista de las bases de datos, conceptualmente existen tres tipos de ambientes que se integran con mltiples procesadores:

Consisten de diversos procesadores los cuales accedan una misma memoria y un misma unidad de almacenamiento (uno o varios discos).

1. Arquitectura de memoria compartida.

Bases de Datos Distribuidas

Consiste de diversos procesadores cada uno de ellos con su memoria local pero compartiendo una misma unidad de almacenamiento (uno o varios discos).

2. Arquitecturas de disco compartido.

Bases de Datos Distribuidas

3. Arquitecturas nada compartido. Consiste de diversos procesadores cada uno con su


propia memoria almacenamiento. y su propia unidad

Bases de Datos Distribuidas

de

Bases de Datos Distribuidas

Desafortunadamente, no existe un equivalente de una arquitectura estndar para sistemas de manejo de bases de datos distribuidas. La tecnologa y prototipos de SMBDD se han desarrollado ms o menos en forma independiente uno de otro y cada sistema ha adoptado su propia arquitectura.

Bases de Datos Distribuidas

Para definir un esquema de estandarizacin en bases de datos distribuidas se debe definir un modelo de referencia el cual sera un marco de trabajo conceptual cuyo propsito es dividir el trabajo de estandarizacin en piezas manejables y mostrar a un nivel general como esas piezas se relacionan unas con otras. Para definir ese modelo de referencia se puede seguir uno de los siguientes tres enfoques:

Bases de Datos Distribuidas

Se definen las componentes del sistema junto con las relaciones entre ellas. As, un SMBD consiste de un nmero de componentes, cada uno de los cuales proporciona alguna funcionalidad.

1. Basado en componentes.

Bases de Datos Distribuidas

Se identifican las diferentes clases de usuarios junto con la funcionalidad que el sistema ofrecer para cada clase. La especificacin del sistema en esta categora tpicamente determina una estructura jerrquica para las clases de usuarios. La ventaja de este enfoque funcional es la claridad con la cual se especifican los objetivos del sistema. Sin embargo, este enfoque no proporciona una forma de alcanzar los objetivos.

2. Basado en funciones.

Bases de Datos Distribuidas

Se identifican los diferentes tipos de descripcin de datos y se especifica un marco de trabajo arquitectural el cual define las unidades funcionales que realizarn y/o usarn los datos de acuerdo con las diferentes vistas.

3. Basado en datos.

Bases de Datos Distribuidas

La ventaja de este enfoque es la importancia que asigna al manejo de datos. Este es un enfoque significativo para los SMBD dado que su propsito principal es manejar datos. Sin embargo, la desventaja de este enfoque es que es prcticamente imposible especificar un modelo arquitectural sin especificar los modelos para cada una de sus unidades funcionales. Este es el enfoque seguido por el modelo ANSI/SPARC.

Bases de Datos Distribuidas

Das könnte Ihnen auch gefallen