Sie sind auf Seite 1von 8

INTRODUCCION

La cantidad de innovaciones tecnológicas que ha habido en los últimos años ha promovido un


cambio a los sistemas de información y en general a las aplicaciones computacionales. Los
cambios tecnológicos van de la mano con la demanda de los usuarios y programas. Por lo tanto
existe un continuo desarrollo de nuevos productos.
Para las aplicaciones existe una demanda permanente por mayor funcionalidad, mayor
número de servicios, más flexibilidad y mejor rendimiento. Se debe buscar siempre formas
para enlazar las soluciones ofrecidas por la tecnología disponible a las necesidades de las
aplicaciones de los usuarios.
Un área en la cual las soluciones están integrando tecnología con nuevas arquitecturas o
formas de hacer las cosas es el área de los sistemas distribuidos de información.
1. MOTIVACION
Existen dos fuerzas que han impulsado la evolución de los sistemas de base de datos. Por
un lado los usuarios y por otro lado la tecnología. Los sistemas de cómputo distribuidos son
ejemplos claros en donde presiones organizacionales se combinan con la disponibilidad de
nuevas tecnologías para hacer realidad tales aplicaciones.
1.1. La presión por datos distribuidos
La presión de los usuarios
Las bases de datos grandes permiten organizar la información relevante a alguna parte
de la operación de una organización. Cualquier organización que ha incorporado
sistemas de información para su funcionamiento ha experimentado dos fases.

Sistemas de Base de
Datos
Fuerzas evolucionarias en los sistemas de Base de Datos
En la Primera fase se ha agrupado toda la información en un solo lugar. La idea original
era que todos los accesos a datos podrían ser integrados en un solo lugar usando
herramientas de base de datos tales como lenguajes de descripción de datos,
lenguajes de manipulación de datos, mecanismos de acceso, verificadores de
restricciones y lenguajes de alto nivel.
En la Segunda Fase se promovió la descentralización de los sistemas de base de datos
corporativos. Ese enfoque presento grandes beneficios para el control de la seguridad
de la información y la disponibilidad.
Sin embargo muy pronto empezaron a aparecer inconvenientes con este enfoque. Se
presentaron problemas de consistencia de la información entre los sistemas locales y
centrales y se hallaron dificultades al transferir información de entre diferentes
departamentos de una corporación.
En la Tercera Fase se ha tratado de formalizar la descentralización de las bases de
datos y de sus funciones manteniendo la integridad de la información.
La presión de la tecnología
Existen buenas razones para distribuir datos. Las más obvia es la referente a la
sobrecarga de los canales de entrada y salida a los discos en donde se almacena la
información. Es mucho mejor distribuir los accesos a la información sobre diferentes
canales que concentrarlos en un solo. Otra razón es que las redes de computadoras
empezaron a trabajar a velocidad razonables.
El hacer una descentralización de la información se justifica por las siguientes razones:
 Permitir autonomía local y promover la evolución de los sistemas de cambios.
 Proveer una arquitectura de sistemas simple, flexible y tolerante a fallas.
 Ofrecer buenos rendimientos.
Su realización conlleva la superación de dificultades entre las que se pueden
mencionar:
 Asegurar el acceso entre diferentes sitios y el procesamiento de datos.
 Transformar datos e integrar diferentes tipos de procesamiento.
 Distribuir datos en los nodos del ambiente.
 Controlar el acceso a los datos disponibles.
 Soportar la recuperación de errores de módulos del sistema de manera segura y
eficiente.
 Asegurar que los sistemas locales y globales permanezcan evitando la interferencia
destructiva.
También la aplicación de técnicas de distribución de información requiere de superar
algunas dificultades. Entre ellas se puede mencionar:
 El desarrollo de modelos para estimar la capacidad y el tráfico.
 Soportar el diseño de sistemas de información distribuidos.
 Considerar la competencia que habrá por el uso de los recursos.
1.2. Heterogeneidad y la presión para integrar datos.
Existe todavía un argumento importante para el desarrollo de sistemas de bases de
datos distribuidas; este se refiere a la integración de necesidades de procesamiento no
locales.
En los sistemas de bases de datos distribuidos se persigue la integración de sistemas
de bases de datos diversos no necesariamente homogéneos para dar a los usuarios
una visión global de la información disponible.
1.3. Computación Distribuida
Los sistema de cómputo distribuidos se interconectan por una red de comunicaciones
y cooperan entre ellos para realizas sus tareas asignadas.
En computación distribuida los elementos que se pueden distribuir son:
 Control.  Funciones.
 Datos.  Procesamiento
 Lógico.

Tecnología de Redes de
Base de Datos Computadoras
Integración Distribución

Sistemas de BD
Distribuidas
Integración
Integración ≠ centralización
Motivación de los sistemas de bases de datos distribuidos

1.4. Sistemas de bases de datos distribuidas


Una Base de Datos Distribuida (BDD) es un conjunto de múltiples bases de datos las
cuales se encuentran distribuidas entre diferentes sitios interconectados por una red.
Un Sistema de Base de Datos Distribuida (SBDD) es un sistema en el cual múltiples
sitios de bases de datos están ligados por un sistema de comunicaciones.
Un Sistema de Manejo de Base de Datos Distribuidas (SMBDD) se encarga del manejo
de la Base de datos distribuida y proporciona un mecanismo de acceso que hace que la
distribución sea transparente a los usuarios.
Un Sistema de Base de Datos Distribuida (SBDD) es entonces el resultado de la
integración de una base de datos distribuida con un sistema para su manejo.
Un sistema de multiprocesamiento puede administrar una base de datos pero lo hace
usualmente a través de un solo sistema de manejo de base de datos.
Un Sistema de Manejo de Base de Datos Distribuida (SMBDD) consiste en un
conjunto de sitios los cuales tiene un sistema de procesamiento de datos completo
que incluye una base de datos local.

Querétaro
Monterrey
Puebla

Red de
Comunicacion Un sistema centralizado sobre una red
Guadalaja
México
Querétaro Monterrey

Puebla

Red de
Comunicaciones

México Guadalajara

Un medio ambiente distribuido para bases de datos


1.4.1. Ambientes con múltiples procesadores
Existen tres tipos de ambientes que se integran con múltiples procesadores.
1. Arquitectura de memoria compartida. Consiste en diversos procesadores
los cuales ingresan a una misma memoria y una misma unidad de
almacenamiento.

P1 Pn M
BD

2. Arquitecturas de disco compartido. Consiste en diversos procesadores


cada uno de ellos con su memoria local pero compartiendo una misma
unidad de almacenamiento.

P1 Pn BD

M M

Arquitectura de disco compartido

3. Arquitecturas nada compartido. Consiste de diversos procesadores cada


uno con su propia memoria y su propia unidad de almacenamiento

Arquitectura nada compartido

P1 Pn

BD BD

M M
1.4.2. Aplicaciones
Los ambientes en los que se encuentra con mayor frecuencia el uso de las
bases de datos distribuidas son:
 Cualquier organización que tiene una estructura descentralizada.
 Organismos gubernamentales y/o de servicio público.
 La industria de la manufactura. Ejemplo, la industria automotriz.
 Aplicaciones de control y comando militar.
 Líneas de transportación aérea.
 Cadenas hoteleras.
 Servicios bancarios y financieros.
1.4.3. Ventajas
En primer lugar los datos son localizados en un lugar más cercano, por tanto el
acceso y el procesamiento es más rápido, nuevos nodos se pueden agregar
fácil y rápidamente, los costos de operación se reducen, son amigables al
usuario, la probabilidad de que una falla en un solo nodo afecte al sistema es
baja y existe una autonomía e independencia entre nodos.
Los datos se pueden colocar físicamente en el lugar donde se acceda más
frecuentemente. .
Mediante la replicación de información, las bases de datos distribuidas pueden
presentar cierto grado de tolerancia a fallas.
1.4.4. Desventajas
La principal desventaja se refiere al control y manejo de los datos. La
probabilidad de violación de seguridad es creciente.
1.5. Aspectos importantes de los Sistemas de Manejo de Base de Datos Distribuidos
Existen varios factores relacionados a la construcción de bases de datos distribuidas.
Entre los más importantes se encuentran los siguientes:
1. Diseño de la base de datos distribuida. Se debe considerar el problema de cómo
distribuir la información entre diferentes sitios. Primero, como fragmentar la
información. Segundo, como asignar cada fragmento entre los diferentes sitios de
la red y finalmente una parte importante en el diseño de una BDD se refiere al
manejo del directorio. Si existe únicamente usuarios globales, se debe manejar un
solo directorio global.
2. Procesamiento de consultas. Es de suma importancia en bases de datos
centralizadas. En BDD se tiene que considerar el procesamiento local de una
consulta junto con el costo de transmisión de información al lugar en donde se
solicitó la consulta.
3. Control de Concurrencia. Es la actividad de coordinar accesos concurrentes a la
base de datos esto permite a los usuarios acceder a la base de datos en una forma
multiprogramada. En BDD el control de concurrencia es aún más complejo que en
sistemas centralizados. un aspecto interesante del control de concurrencia es el
manejo de interbloqueos. El sistema no debe permitir que dos o más
transacciones se bloqueen entre ellas.
4. Confiabilidad. En cualquier sistema de base de datos se debe ofrecer garantías de
que la información es confiable.

Manejo de
Directorio

Procesamiento Diseño de Confiabilidad


de Consultas Distribución

Control de
Concurrencia

Manejo de
Interbloqueos

Factores importantes en Bases de Datos Distribuida


1.6. Estado del Arte
A continuación se nombra el estado actual de las bases de datos comerciales.
1. Manejo transparente de datos distribuidos, fragmentados y replicados.
2. Mejoramiento de la confiabilidad y disponibilidad de la información mediante
transacciones distribuidas.
3. Mejoramiento de la eficiencia.
4. Mejor escalabilidad de las Bases de Datos
2. ALMACENAMIENTO DISTRIBUIDO
BASES DE DATOS DISTRIBUIDAS
Es una colección de datos que pertenecen a un solo sistema, pero se encuentra esparcido
en varios sitios de la red conectados entre sí mediante una red de comunicaciones.
OBJETIVOS DE LAS BASES DE DATOS DISTRIBUIDAS
Se almacenan físicamente en varias bases de datos reales distintas, ubicadas en diferentes
sitios.
Un usuario puede realizar operaciones sobre los datos en su propio sitio local exactamente
como si ese sitio no participara en absoluto en el sistema distribuido.
2.1. SISTEMA DE GESTION DE BASE DE DATOS DISTRIBUIDAS (SGBDD)
Esta es la función que desempeñan los SGBDD. Una base de datos permite al usuario
acceder a datos almacenados sin que él deba saber cómo están organizados esos
datos en el sistema, garantiza que ningún usuario sin autorización pueda ver o
manipular los datos.
Las principales funciones que debe cumplir un SGBD se relacionan con la creación y
mantenimiento de la base de datos.
2.1.1. FUNCIONES Y ARQUITECTURA DE UN SGBDD
OBJETIVOS DE LOS SGBDD
 Permitir la definición de todos los datos.
 Permitir la manipulación de los datos.
 Permitir controles de seguridad.
 Permitir los accesos concurrentes.
Una mala concepción a la hora de diseñar una base de datos puede dar origen
a:
 La redundancia de datos.
 Incoherencia en los datos.
 Perdida de datos
 Estado de la tabla.
COMPONENTES DE UN SISTEMA GESTOR DISTRIBUIDO
 Hardware
- Los nodos de procesamiento pueden estar formados por múltiples y
distintos tipos de hardware.
 Software
- La base de datos se almacena en varias computadoras que se pueden
comunicar a su vez pro distintos medios de comunicación.
 Datos
- Una base de datos parcialmente duplicada contiene ciertos elementos
de datos que están duplicados y algunos que no lo están.
 Procedimientos
- En los sistemas distribuidos más sencillos, los datos no están
duplicados y solo el nodo que almacena los datos puede actualizarlos.
 Personal
2.2. DOCE REGLAS DE LAS BASES DE DATOS DISTRIBUIDAS
Principio fundamental: para el usuario un sistema distribuido debe ser igual que uno
centralizado.
1. Autonomía Local.
2. No dependencia de un sitio central.
3. Operación Continua.
4. Independencia con respecto a la localización.
5. Independencia con respecto a la fragmentación.
6. Independencia de réplica.
7. Procesamiento Distribuido de Consultas.
8. Manejo Distribuido de Transacciones.
9. Independencia con respecto al equipo.
10. Independencia con respecto al Sistema Operativo.
11. Independencia con respecto a la red.
12. Independencia con respecto al Sistema de Manejo de Base de Datos.
2.3. VENTAJAS E INCONVENIENTES DE LAS BASES DE DATOS DISTRIBUIDAS
VENTAJAS DE LAS BASES DE DATOS DISTRIBUIDAS
 Compartimiento de datos.
 Autonomía.
 Disponibilidad.
INCONVENIENTES DE LAS BASES DE DATOS DISTRIBUIDAS
 Coste de desarrollo del software.
 Mayor probabilidad de errores.
 Mayor sobrecarga de procesamiento.

Das könnte Ihnen auch gefallen