Sie sind auf Seite 1von 6

1. Fundamentos de Base de Datos Distribuidas 1.1 Conceptos generales (SMBDD).

Consiste en una coleccin de sitios, conectados por medio de algn tipo de red de comunicacin, en el cual cada sitio es un sistema de BD completo por derecho propio, pero los sitios han acordado trabajar juntos, a fin de que un usuario de cualquier sitio pueda acceder a los datos desde cualquier lugar de la red, exactamente como si los datos estuvieran guardados en el propio sitio del usuario. Una BDD es en realidad un tipo de BD virtual cuyas partes componentes estn almacenadas en varias BD reales distintas que se encuentran en varios sitios distintos (de hecho, es la unin lgica de esas BD reales). En otras palabras, cada sitio local tiene Sus propias BD reales Sus propios usuarios locales Su propio DBMS local Software de administracin de transacciones (incluyendo su propio software local para bloqueo, registro en bitcora, recuperacin, etc.) As como su propio administrador de comunicacin de datos local. Es comn suponer que los sitios componentes estn dispersos fsicamente quiz tambin dispersos geogrficamente -, aunque de hecho basta con que estn dispersos lgicamente.

1.2 Los doce objetivos de una base de datos distribuida

1.- Autonoma local. Los sitios en un sistema distribuido deben ser autnomos. La autonoma local significa que todas las operaciones en un sitio dado estn controladas por ese sitio; ningn sitio X debe depender de algn otro sitio Y para su operacin satisfactoria. La seguridad, integridad y representacin de almacenamiento de los datos locales permanecen bajo el control y jurisdiccin del sitio local.

2.- No dependencia de un sitio central. La autonoma local implica que todos los sitios deben ser tratados como iguales. Por lo tanto, no debe haber particularmente ninguna dependencia de un sitio maestro central para algn servicio central, tal que todo el sistema dependa de ese sitio central. Razones por las cuales no debera haber un sitio central: El sitio central puede ser un cuello de botella

El sistema sera vulnerable; es decir, si el sitio central falla, tambin fallar todo el sistema

Base de Datos Distribuidas

Lorenzo de Jess Organista Oliveros

3.- Operacin contina. Una ventaja de los sistemas distribuidos es que deben proporcionar mayor confiabilidad y mayor disponibilidad.

Confiabilidad. La probabilidad de que el sistema est listo y funcionando en cualquier momento dado. Los SD no son una propuesta de todo o nada; pueden continuar operando cuando hay alguna falla en algn componente independiente. Disponibilidad. La probabilidad de que el sistema est listo y funcionando continuamente a lo largo de un perodo especificado.

4.- Independencia de ubicacin. Conocida tambin como transparencia de ubicacin. Los usuarios no tienen que saber dnde estn almacenados fsicamente los datos, sino que deben ser capaces de comportarse como si todos los datos estuvieran almacenados en su propio sitio local. Esto simplifica los programas de los usuarios. En particular, permite que los datos emigren de un sitio a otro sin invalidar ninguno de estos programas o actividades.

5.- Independencia de fragmentacin. Un sistema soporta la fragmentacin de datos cuando puede ser dividida en o partes o fragmentos, para efectos de almacenamiento fsico. La fragmentacin es necesaria por razones de rendimiento: los datos pueden estar almacenados en la ubicacin donde son usados ms frecuentemente para que la mayora de las operaciones sean locales y se reduzca el trfico en la red. Los usuarios deben comportarse como si los datos en realidad estuvieran sin fragmentacin alguna.

6.- Independencia de replicacin. El sistema soporta replicacin de datos cuando un fragmento puede ser representado por muchas copias distintas, o rplicas, guardadas en muchos sitios distintos. Las rplicas son necesarias por dos razones principales: Significan un mejor rendimiento (las aplicaciones pueden operar sobre las copias locales en lugar de tener que comunicarse con sitios remotos) Pueden significar una mejor disponibilidad (un objeto replicado permanece disponible para su procesamiento, mientras est disponible al menos una copia).

Por supuesto, la principal desventaja de las rplicas es que al actualizarlas es necesario actualizar todas: el problema de la propagacin de la actualizacin.

Base de Datos Distribuidas

Lorenzo de Jess Organista Oliveros

7.- Procesamiento de consultas distribuidas. La optimizacin es importante en un sistema distribuido que en uno centralizado, incluso mucho ms. El punto bsico es que en una consulta que involucra a varios sitios, habr muchas formas posibles de mover los datos en el sistema para satisfacer la solicitud, y es crucialmente importante que se encuentre una estrategia eficiente.

8.- Administracin de transacciones distribuidas. Existen dos aspectos principales en la administracin de transacciones: control de recuperacin y control de la concurrencia. Ambos aspectos requieren un tratamiento amplio en el ambiente distribuido. Ya que una sola transaccin puede involucrar la ejecucin de cdigo en muchos sitios. Puede involucrar actualizaciones en muchos sitios y se debe de cuidar que la transaccin no caiga en un bloqueo mortal (basado en el bloqueo). Para el control de la recuperacin, es necesario asegurarse que una transaccin dada sea atmica en el ambiente distribuido, el sistema debe por lo tanto asegurarse de que la transaccin sea confirmada o deshecha (se puede utilizar el protocolo de confirmacin de dos fases).

9.- Independencia de hardware. Soporte para un gran nmero de mquinas diferentes. Poder integrar todos los datos de todos estos sistemas y presentar al usuario una imagen del sistema nico. 10.- Independencia de sistema operativo. Obviamente es necesario no slo tener la posibilidad de ejecutar el mismo DBMS en diferentes plataformas de hardware, sino tambin ejecutarlo en diferentes plataformas de sistema operativo. 11.- Independencia de red. Si el sistema va a tener la posibilidad de soportar muchos sitios distintos es obviamente necesario tener la posibilidad de soportar tambin una variedad de redes de comunicacin distintas. 12.- Independencia de DBMS. Lo que se necesita es que todos los ejemplares de DBMS en sitios diferentes soporten la misma interfaz. Aunque no tienen que ser necesariamente copias del mismo software DBMS.

En otras palabras, sera posible que el sistema distribuido fuera heterogneo, al menos en cierto grado. Sera muy bueno si diferentes DBMS pudieran participar de alguna forma en un sistema distribuido.

Base de Datos Distribuidas

Lorenzo de Jess Organista Oliveros

1.3 Ventajas de las bases de datos distribuidas contra las bases de datos centralizadas ORGANIZATIVAS: Adaptacin a la organizacin de la institucin (unin de compaas/descentralizacin), respondiendo a cambios Almacenar los datos donde son generados y/o usados, la mayor parte locales Proporcionar autonoma local, controlndose desde cada nodo. Poltica general contra poltica local ECONMICAS: Costes de comunicacin y de creacin de pequeos sistemas TCNICAS: Flexibilidad, acceso desde distintos lugares y por distintas personas a la vez Fiabilidad/disponibilidad, en un determinado momento / intervalo. Varios sitios, duplicaciones, evitan fallos Modularidad Mejora del rendimiento, BD ms pequeas, operaciones de menor volumen Crecimiento incremental, aadiendo poder de procesamiento y almacenamiento 1.4 Sistema Cliente-servidor Una aplicacin cliente servidor se basa en el modelo de solicitud respuesta, el caso ms simple corresponde a la situacin en la cual una aplicacin (el cliente) solicita un recurso y otra (el servidor) la atiende para brindarle el servicio de ser posible. En el siguiente esquema se muestra dicho proceso.

En los sistemas aislados se ha explotado este modelo para controlar y administrar algunos recursos, como ejemplo podemos citar algunos componentes del SO (Sistema Operativo): el administrador de procesos, el manejador de ventanas en ambientes orientados a ventanas en ambiente grfico y el gestor de medios de almacenamiento masivo (discos, duros, CDs, DVDs, etc.). Donde debemos recalcar que a pesar de tratar el caso de sistemas modernos monousuario, ya que stos ofrecen la opcin de la multitarea, es necesario controlar las acciones de los procesos que el usuario ejecuta en primer o segundo plano para evitar conflictos e inconsistencias. Para regular las relaciones entre el cliente y el servidor normalmente se definen reglas, las cuales se encapsulan en libreras que permiten la operacin entre las entidades involucradas. Estas reglas conforman los denominados protocolos de interaccin. Y los procedimientos pblicos habilitados para la interaccin se organizan en Interfaces de Programacin de Aplicaciones (API). Este binomio permite a los desarrolladores conocer como utilizar los mtodos de trabajo, las variables involucradas y sus tipos, as como el alcance y restricciones de explotacin. En los sistemas de cmputo conectados en red local (LAN) o en redes amplias (WAN), adems se deben tomar en cuenta las facilidades que el Sistema Operativo de Red (NOS) ofrece, as como las restricciones que impone. De aqu se puede inferir que es importante conocer y controlar no solo la dinmica de lo que sucede

Base de Datos Distribuidas

Lorenzo de Jess Organista Oliveros

en cada nodo de la red, sino como se deben coordinar los diferentes nodos y medios de enlace entre ellos, es decir se deben considerar cada uno de los elementos involucrados en el sistema: locales, remotos e intermediarios. 1.5 Problemas de los sistemas distribuidos

Complejidad del sistema, desarrollo de software ms costoso, problemas de sincronizacin, dificultad para conocer la correccin de los algoritmos paralelos, deteccin de cadas de nodos Dependencia de la red de comunicaciones, sobrecarga de procesamiento de mensajes Dificultad de diseo, fases adicionales Poca madurez de los productos comerciales, orientados a replicacin Funciones de administracin compleja, sincronizacin y coordinacin Dificultad de cambio, inexistencia de metodologas Personal especializado

1.6 Soporte de SQL El SQL es un lenguaje de acceso a bases de datos que explota la flexibilidad y potencia de los sistemas relacionales permitiendo gran variedad de operaciones. Es un lenguaje declarativo de "alto nivel" o "de no procedimiento", que gracias a su fuerte base terica y su orientacin al manejo de conjuntos de registros, y no a registros individuales, permite una alta productividad en codificacin y la orientacin a objetos. De esta forma una sola sentencia puede equivaler a uno o ms programas que se utilizaran en un lenguaje de bajo nivel orientado a registros. Los sistemas de gestin de base de datos con soporte SQL ms utilizados son, por orden alfabtico:

DB2 Firebird Informix Interbase MariaDB Microsoft SQL Server MySQL Oracle PostgreSQL PervasiveSQL SQLite SQL Server Sybase ASE

Ejemplo: Soporte SQL en Microsoft SQL Server 2005 Las consultas distribuidas obtienen acceso a datos de varios orgenes de datos heterogneos. Estos orgenes de datos pueden estar almacenados en el mismo equipo o en equipos diferentes. Microsoft SQL Server 2005 admite consultas distribuidas utilizando OLE DB.

Base de Datos Distribuidas

Lorenzo de Jess Organista Oliveros

Los usuarios de SQL Server pueden utilizar consultas distribuidas para obtener acceso a lo siguiente: Datos distribuidos almacenados en varias instancias de SQL Server. Datos heterogneos almacenados en varios orgenes de datos relacionales y no relacionales a los que se obtiene acceso mediante un proveedor OLE DB.

Los proveedores OLE DB exponen datos en objetos tabulares denominados conjuntos de filas. SQL Server permite hacer referencia a conjuntos de filas desde proveedores OLE DB en instrucciones Transact-SQL como si fuesen tablas de SQL Server. En las instrucciones SELECT, INSERT, UPDATE y DELETE de Transact-SQL, se puede hacer referencia directa a las tablas y vistas de orgenes de datos externos. Puesto que las consultas distribuidas usan OLE DB como interfaz subyacente, stas tienen acceso a los sistemas DBMS relacionales tradicionales con procesadores de consultas SQL, as como a los datos administrados por orgenes de datos de diversa capacidad y sofisticacin. Siempre que el software propietario de los datos los exponga en un conjunto de filas tabular a travs del proveedor OLE DB, los datos se podrn usar en consultas distribuidas. Nota: Usar consultas distribuidas en SQL Server es similar a la funcionalidad de tablas vinculadas a travs de ODBC. Esta funcionalidad, que ofreca antes Microsoft Access, se ha incorporado ahora a SQL Server utilizando OLE DB como interfaz a los datos externos. La siguiente ilustracin muestra las conexiones entre un equipo cliente, una instancia de SQL Server y un proveedor OLE DB.

Base de Datos Distribuidas

Lorenzo de Jess Organista Oliveros

Das könnte Ihnen auch gefallen