Sie sind auf Seite 1von 12

Diseo conceptual de bases de datos.

Modelo entidad-relacin

Introduccin Para la introduccin a este captulo se toman algunos prrafos del texto de Batini, Ceri y Navathe (1994). "El diseo de bases de datos es el proceso por el que se determina la organizacin de una base de datos, incluidos su estructura, contenido y las aplicaciones que se han de desarrollar. Durante mucho tiempo, el diseo de bases de datos fue considerado una tarea para expertos: ms un arte que una ciencia. Sin embargo, se ha progresado mucho en el diseo de bases de datos y ste se considera ahora una disciplina estable, con mtodos y tcnicas propios. Debido a la creciente aceptacin de las bases de datos por parte de la industria y el gobierno en el plano comercial, y a una variedad de aplicaciones cientficas y tcnicas, el diseo de bases de datos desempea un papel central en el empleo de los recursos de informacin en la mayora de las organizaciones. El diseo de bases de datos ha pasado a constituir parte de la formacin general de los informticos, en el mismo nivel que la capacidad de construir algoritmos usando un lenguaje de programacin convencional." "Las ltimas dos dcadas se han caracterizado por un fuerte crecimiento en el nmero e importancia de las aplicaciones de bases de datos. Las bases de datos son componentes esenciales de los sistemas de informacin, usadas rutinariamente en todos los computadores [...]. El diseo de bases de datos se ha convertido en una actividad popular, desarrollada no slo por profesionales sino tambin por no especialistas. A finales de la dcada de 1960, cuando las bases de datos entraron por primera vez en el mercado del software, los diseadores de bases de datos actuaban como artesanos, con herramientas muy primitivas: diagramas de bloques y estructuras de registros eran los formatos comunes para las especificaciones, y el diseo de bases de datos se confunda frecuentemente con la implantacin de las bases de datos. Esta situacin ahora ha cambiado: los mtodos y modelos de diseo de bases de datos han evolucionado paralelamente con el progreso de la tecnologa en los sistemas de bases de datos. Se ha entrado en la era de los sistemas relacionales de bases de datos, que ofrecen poderosos lenguajes de consulta, herramientas para el desarrollo de aplicaciones e interfaces amables con los usuarios. La tecnologa de bases de datos cuenta ya con un marco terico, que incluye la teora relacional de datos, procesamiento y optimizacin de consultas, control de concurrencia, gestin de transacciones y recuperacin, etc. Segn ha avanzado la tecnologa de bases de datos, as se han desarrollado las metodologas y tcnicas de diseo. Se ha alcanzado un consenso, por ejemplo, sobre la descomposicin del proceso de diseo en fases, sobre los principales objetivos de cada fase y sobre las tcnicas para conseguir estos objetivos." "Desafortunadamente, las metodologas de diseo de bases de datos no son muy populares; la mayora de las organizaciones y de los diseadores individuales confa muy poco en las metodologas para llevar a cabo el diseo y esto se considera, con frecuencia, una de las principales causas de fracaso en el desarrollo de los sistemas de

informacin. Debido a la falta de enfoques estructurados para el diseo de bases de datos, a menudo se subestiman el tiempo o los recursos necesarios para un proyecto de bases de datos, las bases de datos son inadecuadas o ineficientes en relacin a las demandas de la aplicacin, la documentacin es limitada y el mantenimiento es difcil. Muchos de estos problemas se deben a la falta de una claridad que permita entender la naturaleza exacta de los datos, a un nivel conceptual y abstracto. En muchos casos, los datos se describen desde el comienzo del proyecto en trminos de las estructuras finales de almacenamiento; no se da peso a un entendimiento de las propiedades estructurales de los datos que sea independiente de los detalles de la realizacin." Metodologa de diseo de bases de datos El diseo de una base de datos es un proceso complejo que abarca decisiones a muy distintos niveles. La complejidad se controla mejor si se descompone el problema en subproblemas y se resuelve cada uno de estos subproblemas independientemente, utilizando tcnicas especficas. As, el diseo de una base de datos se descompone en diseo conceptual, diseo lgico y diseo fsico. El diseo conceptual parte de las especificaciones de requisitos de usuario y su resultado es el esquema conceptual de la base de datos. Un esquema conceptual es una descripcin de alto nivel de la estructura de la base de datos, independientemente del SGBD que se vaya a utilizar para manipularla. Un modelo conceptual es un lenguaje que se utiliza para describir esquemas conceptuales. El objetivo del diseo conceptual es describir el contenido de informacin de la base de datos y no las estructuras de almacenamiento que se necesitarn para manejar esta informacin. El diseo lgico parte del esquema conceptual y da como resultado un esquema lgico. Un esquema lgico es una descripcin de la estructura de la base de datos en trminos de las estructuras de datos que puede procesar un tipo de SGBD. Un modelo lgico es un lenguaje usado para especificar esquemas lgicos (modelo relacional, modelo de red, etc.). El diseo lgico depende del tipo de SGBD que se vaya a utilizar, no depende del producto concreto. El diseo fsico parte del esquema lgico y da como resultado un esquema fsico. Un esquema fsico es una descripcin de la implementacin de una base de datos en memoria secundaria: las estructuras de almacenamiento y los mtodos utilizados para tener un acceso eficiente a los datos. Por ello, el diseo fsico depende del SGBD concreto y el esquema fsico se expresa mediante su lenguaje de definicin de datos. Modelos de datos Un modelo de datos es una serie de conceptos que puede utilizarse para describir un conjunto de datos y las operaciones para manipularlos. Hay dos tipos de modelos de datos: los modelos conceptuales y los modelos lgicos. Los modelos conceptuales se utilizan para representar la realidad a un alto nivel de abstraccin. Mediante los modelos conceptuales se puede construir una descripcin de la realidad fcil de entender. En los modelos lgicos, las descripciones de los datos tienen una correspondencia sencilla con la estructura fsica de la base de datos.

En el diseo de bases de datos se usan primero los modelos conceptuales para lograr una descripcin de alto nivel de la realidad, y luego se transforma el esquema conceptual en un esquema lgico. El motivo de realizar estas dos etapas es la dificultad de abstraer la estructura de una base de datos que presente cierta complejidad. Un esquema es un conjunto de representaciones lingsticas o grficas que describen la estructura de los datos de inters. Los modelos conceptuales deben ser buenas herramientas para representar la realidad, por lo que deben poseer las siguientes cualidades: Expresividad: deben tener suficientes conceptos para expresar perfectamente la realidad. Simplicidad: deben ser simples para que los esquemas sean fciles de entender. Minimalidad: cada concepto debe tener un significado distinto.

Formalidad: todos los conceptos deben tener una interpretacin nica, precisa y bien definida. En general, un modelo no es capaz de expresar todas las propiedades de una realidad determinada, por lo que hay que aadir aserciones que complementen el esquema. El modelo entidad-relacin El modelo entidad-relacin es el modelo conceptual ms utilizado para el diseo conceptual de bases de datos. Fue introducido por Peter Chen en 1976. El modelo entidad-relacin est formado por un conjunto de conceptos que permiten describir la realidad mediante un conjunto de representaciones grficas y lingsticas. Originalmente, el modelo entidad-relacin slo inclua los conceptos de entidad, relacin y atributo. Ms tarde, se aadieron otros conceptos, como los atributos compuestos y las jerarquas de generalizacin, en lo que se ha denominado modelo entidad-relacin extendido.

Figura 6.1: Conceptos del modelo entidad-relacin extendido. Entidad Cualquier tipo de objeto o concepto sobre el que se recoge informacin: cosa, persona, concepto abstracto o suceso. Por ejemplo: coches, casas, empleados, clientes, empresas, oficios, diseos de productos, conciertos, excursiones, etc. Las entidades se representan grficamente mediante rectngulos y su nombre aparece en el interior. Un nombre de entidad slo puede aparecer una vez en el esquema conceptual. Hay dos tipos de entidades: fuertes y dbiles. Una entidad dbil es una entidad cuya existencia depende de la existencia de otra entidad. Una entidad fuertees una entidad que no es dbil.

Relacin (interrelacin) Es una correspondencia o asociacin entre dos o ms entidades. Cada relacin tiene un nombre que describe su funcin. Las relaciones se representan grficamente mediante rombos y su nombre aparece en el interior. Las entidades que estn involucradas en una determinada relacin se denominan entidades participantes. El nmero de participantes en una relacin es lo que se denomina grado de la relacin. Por lo tanto, una relacin en la que participan dos entidades es una relacin binaria; si son tres las entidades participantes, la relacin es ternaria; etc. Una relacin recursiva es una relacin donde la misma entidad participa ms de una vez en la relacin con distintos papeles. El nombre de estos papeles es importante para determinar la funcin de cada participacin. La cardinalidad con la que una entidad participa en una relacin especifica el nmero mnimo y el nmero mximo de correspondencias en las que puede tomar parte cada ocurrencia de dicha entidad. La participacin de una entidad en una relacin es obligatoria (total) si la existencia de cada una de sus ocurrencias requiere la existencia de, al menos, una ocurrencia de la otra entidad participante. Si no, la participacin es opcional (parcial). Las reglas que definen la cardinalidad de las relaciones son las reglas de negocio. A veces, surgen problemas cuando se est diseado un esquema conceptual. Estos problemas, denominados trampas, suelen producirse a causa de una mala interpretacin en el significado de alguna relacin, por lo que es importante comprobar que el esquema conceptual carece de dichas trampas. En general, para encontrar las trampas, hay que asegurarse de que se entiende completamente el significado de cada relacin. Si no se entienden las relaciones, se puede crear un esquema que no represente fielmente la realidad. Una de las trampas que pueden encontrarse ocurre cuando el esquema representa una relacin entre entidades, pero el camino entre algunas de sus ocurrencias es ambiguo. El modo de resolverla es reestructurando el esquema para representar la asociacin entre las entidades correctamente. Otra de las trampas sucede cuando un esquema sugiere la existencia de una relacin entre entidades, pero el camino entre una y otra no existe para algunas de sus ocurrencias. En este caso, se produce una prdida de informacin que se puede subsanar introduciendo la relacin que sugera el esquema y que no estaba representada. Atributo Es una caracterstica de inters o un hecho sobre una entidad o sobre una relacin. Los atributos representan las propiedades bsicas de las entidades y de las relaciones. Toda la informacin extensiva es portada por los atributos. Grficamente, se representan mediante bolitas que cuelgan de las entidades o relaciones a las que pertenecen.

Cada atributo tiene un conjunto de valores asociados denominado dominio. El dominio define todos los valores posibles que puede tomar un atributo. Puede haber varios atributos definidos sobre un mismo dominio. Los atributos pueden ser simples o compuestos. Un atributo simple es un atributo que tiene un solo componente, que no se puede dividir en partes ms pequeas que tengan un significado propio. Un atributo compuesto es un atributo con varios componentes, cada uno con un significado por s mismo. Un grupo de atributos se representa mediante un atributo compuesto cuando tienen afinidad en cuanto a su significado, o en cuanto a su uso. Un atributo compuesto se representa grficamente mediante un valo. Los atributos tambin pueden clasificarse en monovalentes o polivalentes. Un atributo monovalente es aquel que tiene un solo valor para cada ocurrencia de la entidad o relacin a la que pertenece. Un atributo polivalente es aquel que tiene varios valores para cada ocurrencia de la entidad o relacin a la que pertenece. A estos atributos tambin se les denomina multivaluados, y pueden tener un nmero mximo y un nmero mnimo de valores. La cardinalidad de un atributo indica el nmero mnimo y el nmero mximo de valores que puede tomar para cada ocurrencia de la entidad o relacin a la que pertenece. El valor por omisin es . Por ltimo, los atributos pueden ser derivados. Un atributo derivado es aquel que representa un valor que se puede obtener a partir del valor de uno o varios atributos, que no necesariamente deben pertenecer a la misma entidad o relacin. Identificador Un identificador de una entidad es un atributo o conjunto de atributos que determina de modo nico cada ocurrencia de esa entidad. Un identificador de una entidad debe cumplir dos condiciones: 1. No pueden existir dos ocurrencias de la entidad con el mismo valor del identificador. 2. Si se omite cualquier atributo del identificador, la condicin anterior deja de cumplirse. Toda entidad tiene al menos un identificador y puede tener varios identificadores alternativos. Las relaciones no tienen identificadores. Jerarqua de generalizacin Una entidad E es una generalizacin de un grupo de entidades E , E , ... E , si cada ocurrencia de cada una de esas entidades es tambin una ocurrencia de E. Todas las propiedades de la entidad genrica E son heredadas por las subentidades. Cada jerarqua es total o parcial, y exclusiva o superpuesta. Una jerarqua es total si cada ocurrencia de la entidad genrica corresponde al menos con una ocurrencia de alguna subentidad. Es parcial si existe alguna ocurrencia de la entidad genrica que no corresponde con ninguna ocurrencia de ninguna subentidad. Una jerarqua es exclusivasi cada ocurrencia de la entidad genrica corresponde, como mucho, con una

ocurrencia de una sola de las subentidades. Es superpuesta si existe alguna ocurrencia de la entidad genrica que corresponde a ocurrencias de dos o ms subentidades diferentes. Un subconjunto es un caso particular de generalizacin con una sola entidad como subentidad. Un subconjunto siempre es una jerarqua parcial y exclusiva. Metodologa de diseo conceptual El primer paso en el diseo de una base de datos es la produccin del esquema conceptual. Normalmente, se construyen varios esquemas conceptuales, cada uno para representar las distintas visiones que los usuarios tienen de la informacin. Cada una de estas visiones suelen corresponder a las diferentes reas funcionales de la empresa como, por ejemplo, produccin, ventas, recursos humanos, etc. Estas visiones de la informacin, denominadas vistas, se pueden identificar de varias formas. Una opcin consiste en examinar los diagramas de flujo de datos, que se pueden haber producido previamente, para identificar cada una de las reas funcionales. La otra opcin consiste en entrevistar a los usuarios, examinar los procedimientos, los informes y los formularios, y tambin observar el funcionamiento de la empresa. A los esquemas conceptuales correspondientes a cada vista de usuario se les denomina esquemas conceptuales locales. Cada uno de estos esquemas se compone de entidades, relaciones, atributos, dominios de atributos e identificadores. El esquema conceptual tambin tendr una documentacin, que se ir produciendo durante su desarrollo. Las tareas a realizar en el diseo conceptual son las siguientes: 1. 2. 3. 4. 5. 6. 7. 8. Identificar las entidades. Identificar las relaciones. Identificar los atributos y asociarlos a entidades y relaciones. Determinar los dominios de los atributos. Determinar los identificadores. Determinar las jerarquas de generalizacin (si las hay). Dibujar el diagrama entidad-relacin. Revisar el esquema conceptual local con el usuario.

1. Identificar las entidades En primer lugar hay que definir los principales objetos que interesan al usuario. Estos objetos sern las entidades. Una forma de identificar las entidades es examinar las especificaciones de requisitos de usuario. En estas especificaciones se buscan los nombres o los sintagmas nominales que se mencionan (por ejemplo: nmero de empleado, nombre de empleado, nmero de inmueble, direccin del inmueble, alquiler,

nmero de habitaciones). Tambin se buscan objetos importantes como personas, lugares o conceptos de inters, excluyendo aquellos nombres que slo son propiedades de otros objetos. Por ejemplo, se pueden agrupar el nmero de empleado y el nombre de empleado en una entidad denominada empleado, y agrupar nmero de inmueble, direccin del inmueble, alquiler y nmero de habitaciones en otra entidad denominada inmueble. Otra forma de identificar las entidades es buscar aquellos objetos que existen por s mismos. Por ejemplo, empleado es una entidad porque los empleados existen, sepamos o no sus nombres, direcciones y telfonos. Siempre que sea posible, el usuario debe colaborar en la identificacin de las entidades. A veces, es difcil identificar las entidades por la forma en que aparecen en las especificaciones de requisitos. Los usuarios, a veces, hablan utilizando ejemplos o analogas. En lugar de hablar de empleados en general, hablan de personas concretas, o bien, hablan de los puestos que ocupan esas personas. Para liarlo an ms, los usuarios usan, muchas veces, sinnimos y homnimos. Dos palabras son sinnimos cuando tienen el mismo significado. Los homnimos ocurren cuando la misma palabra puede tener distintos significados dependiendo del contexto. No siempre es obvio saber si un objeto es una entidad, una relacin o un atributo. Por ejemplo cmo se podra clasificar matrimonio? Pues de cualquiera de las tres formas. El anlisis es subjetivo, por lo que distintos diseadores pueden hacer distintas interpretaciones, aunque todas igualmente vlidas. Todo depende de la opinin y la experiencia de cada uno. Los diseadores de bases de datos deben tener una visin selectiva y clasificar las cosas que observan dentro del contexto de la empresa u organizacin. A partir de unas especificaciones de usuario es posible que no se pueda deducir un conjunto nico de entidades, pero despus de varias iteraciones del proceso de anlisis, se llegar a obtener un conjunto de entidades que sean adecuadas para el sistema que se ha de construir. Conforme se van identificando las entidades, se les dan nombres que tengan un significado y que sean obvias para el usuario. Los nombres de las entidades y sus descripciones se anotan en el diccionario de datos. Cuando sea posible, se debe anotar tambin el nmero aproximado de ocurrencias de cada entidad. Si una entidad se conoce por varios nombres, stos se deben anotar en el diccionario de datos como alias o sinnimos. 2. Identificar las relaciones Una vez definidas las entidades, se deben definir las relaciones existentes entre ellas. Del mismo modo que para identificar las entidades se buscaban nombres en las especificaciones de requisitos, para identificar las relaciones se suelen buscar las expresiones verbales (por ejemplo: oficina tiene empleados, empleado gestiona inmueble, cliente visita inmueble). Si las especificaciones de requisitos reflejan estas relaciones es porque son importantes para la empresa y, por lo tanto, se deben reflejar en el esquema conceptual.

Pero slo interesan las relaciones que son necesarias. En el ejemplo anterior, se han identificado las relaciones empleado gestiona inmueble y cliente visita inmueble. Se podra pensar en incluir una relacin entre empleado y cliente: empleado atiende a cliente, pero observando las especificaciones de requisitos no parece que haya inters en modelar tal relacin. La mayora de las relaciones son binarias (entre dos entidades), pero no hay que olvidar que tambin puede haber relaciones en las que participen ms de dos entidades, as como relaciones recursivas. Es muy importante repasar las especificaciones para comprobar que todas las relaciones, explcitas o implcitas, se han encontrado. Si se tienen pocas entidades, se puede comprobar por parejas si hay alguna relacin entre ellas. De todos modos, las relaciones que no se identifican ahora se suelen encontrar cuando se valida el esquema con las transacciones que debe soportar. Una vez identificadas todas las relaciones, hay que determinar la cardinalidad mnima y mxima con la que participa cada entidad en cada una de ellas. De este modo, el esquema representa de un modo ms explcito la semntica de las relaciones. La cardinalidad es un tipo de restriccin que se utiliza para comprobar y mantener la calidad de los datos. Estas restricciones son aserciones sobre las entidades que se pueden aplicar cuando se actualiza la base de datos para determinar si las actualizaciones violan o no las reglas establecidas sobre la semntica de los datos. Conforme se van identificando las relaciones, se les van asignando nombres que tengan significado para el usuario. En el diccionario de datos se anotan los nombres de las relaciones, su descripcin y las cardinalidades con las que participan las entidades en ellas. 3. Identificar los atributos y asociarlos a entidades y relaciones Al igual que con las entidades, se buscan nombres en las especificaciones de requisitos. Son atributos los nombres que identifican propiedades, cualidades, identificadores o caractersticas de entidades o relaciones. Lo ms sencillo es preguntarse, para cada entidad y cada relacin, qu informacin se quiere saber de ...? La respuesta a esta pregunta se debe encontrar en las especificaciones de requisitos. Pero, en ocasiones, ser necesario preguntar a los usuarios para que aclaren los requisitos. Desgraciadamente, los usuarios pueden dar respuestas a esta pregunta que tambin contengan otros conceptos, por lo que hay que considerar sus respuestas con mucho cuidado. Al identificar los atributos, hay que tener en cuenta si son simples o compuestos. Por ejemplo, el atributo direccin puede ser simple, teniendo la direccin completa como un solo valor: `San Rafael 45, Almazora; o puede ser un atributo compuesto, formado por la calle(`San Rafael), el nmero (`45) y la poblacin (`Almazora). El escoger entre atributo simple o compuesto depende de los requisitos del usuario. Si el usuario no necesita acceder a cada uno de los componentes de la direccin por separado, se puede representar como un atributo simple. Pero si el usuario quiere acceder a los

componentes de forma individual, entonces se debe representar como un atributo compuesto. Tambin se deben identificar los atributos derivados o calculados, que son aquellos cuyo valor se puede calcular a partir de los valores de otros atributos. Por ejemplo, el nmero de empleados de cada oficina, la edad de los empleados o el nmero de inmuebles que gestiona cada empleado. Algunos diseadores no representan los atributos derivados en los esquemas conceptuales. Si se hace, se debe indicar claramente que el atributo es derivado y a partir de qu atributos se obtiene su valor. Donde hay que considerar los atributos derivados es en el diseo fsico. Cuando se estn identificando los atributos, se puede descubrir alguna entidad que no se ha identificado previamente, por lo que hay que volver al principio introduciendo esta entidad y viendo si se relaciona con otras entidades. Es muy til elaborar una lista de atributos e ir eliminndolos de la lista conforme se vayan asociando a una entidad o relacin. De este modo, uno se puede asegurar de que cada atributo se asocia a una sola entidad o relacin, y que cuando la lista se ha acabado, se han asociado todos los atributos. Hay que tener mucho cuidado cuando parece que un mismo atributo se debe asociar a varias entidades. Esto puede ser por una de las siguientes causas: Se han identificado varias entidades, como director, supervisor y administrativo, cuando, de hecho, pueden representarse como una sola entidad denominada empleado. En este caso, se puede escoger entre introducir una jerarqua de generalizacin, o dejar las entidades que representan cada uno de los puestos de empleado. Se ha identificado una relacin entre entidades. En este caso, se debe asociar el atributo a una sola de las entidades y hay que asegurarse de que la relacin ya se haba identificado previamente. Si no es as, se debe actualizar la documentacin para recoger la nueva relacin. Conforme se van identificando los atributos, se les asignan nombres que tengan significado para el usuario. De cada atributo se debe anotar la siguiente informacin: Nombre y descripcin del atributo. Alias o sinnimos por los que se conoce al atributo. Tipo de dato y longitud. Valores por defecto del atributo (si se especifican). Si el atributo siempre va a tener un valor (si admite o no nulos). Si el atributo es compuesto y, en su caso, qu atributos simples lo forman. Si el atributo es derivado y, en su caso, cmo se calcula su valor.

Si el atributo es multievaluado.

4. Determinar los dominios de los atributos El dominio de un atributo es el conjunto de valores que puede tomar el atributo. Por ejemplo el dominio de los nmeros de oficina son las tiras de hasta tres caracteres en donde el primero es una letra y el siguiente o los dos siguientes son dgitos en el rango de 1 a 99; el dominio de los nmeros de telfono y los nmeros de fax son las tiras de 9 dgitos. Un esquema conceptual est completo si incluye los dominios de cada atributo: los valores permitidos para cada atributo, su tamao y su formato. Tambin se puede incluir informacin adicional sobre los dominios como, por ejemplo, las operaciones que se pueden realizar sobre cada atributo, qu atributos pueden compararse entre s o qu atributos pueden combinarse con otros. Aunque sera muy interesante que el sistema final respetara todas estas indicaciones sobre los dominios, esto es todava una lnea abierta de investigacin. Toda la informacin sobre los dominios se debe anotar tambin en el diccionario de datos. 5. Determinar los identificadores Cada entidad tiene al menos un identificador. En este paso, se trata de encontrar todos los identificadores de cada una de las entidades. Los identificadores pueden ser simples o compuestos. De cada entidad se escoger uno de los identificadores como clave primaria en la fase del diseo lgico. Cuando se determinan los identificadores es fcil darse cuenta de si una entidad es fuerte o dbil. Si una entidad tiene al menos un identificador, es fuerte (otras denominaciones son padre, propietaria o dominante). Si una entidad no tiene atributos que le sirvan de identificador, es dbil (otras denominaciones son hijo, dependiente o subordinada). Todos los identificadores de las entidades se deben anotar en el diccionario de datos. 6. Determinar las jerarquas de generalizacin En este paso hay que observar las entidades que se han identificado hasta el momento. Hay que ver si es necesario reflejar las diferencias entre distintas ocurrencias de una entidad, con lo que surgirn nuevas subentidades de esta entidad genrica; o bien, si hay entidades que tienen caractersticas en comn y que realmente son subentidades de una nueva entidad genrica. En cada jerarqua hay que determinar si es total o parcial y exclusiva o superpuesta. 7. Dibujar el diagrama entidad-relacin

Una vez identificados todos los conceptos, se puede dibujar el diagrama entidadrelacin correspondiente a una de las vistas de los usuarios. Se obtiene as un esquema conceptual local. 8. Revisar el esquema conceptual local con el usuario Antes de dar por finalizada la fase del diseo conceptual, se debe revisar el esquema conceptual local con el usuario. Este esquema est formado por el diagrama entidadrelacin y toda la documentacin que describe el esquema. Si se encuentra alguna anomala, hay que corregirla haciendo los cambios oportunos, por lo que posiblemente haya que repetir alguno de los pasos anteriores. Este proceso debe repetirse hasta que se est seguro de que el esquema conceptual es una fiel representacin de la parte de la empresa que se est tratando de modelar. Resumen El diseo de bases de datos se descompone en tres etapas: diseo conceptual, diseo lgico y diseo fsico. El diseo conceptual es el proceso por el cual se construye un modelo de la informacin que se utiliza en una empresa u organizacin, independientemente del SGBD que se vaya a utilizar para implementar el sistema y de los equipos informticos o cualquier otra consideracin fsica. Un modelo conceptual es un conjunto de conceptos que permiten describir la realidad mediante representaciones lingsticas y grficas. Los modelos conceptuales deben poseer una serie de propiedades: expresividad, simplicidad, minimalidad y formalidad. El modelo conceptual ms utilizado es el modelo entidad-relacin, que posee los siguientes conceptos: entidades, relaciones, atributos, dominios de atributos, identificadores y jerarquas de generalizacin. En la metodologa del diseo conceptual se construye un esquema conceptual local para cada vista de cada usuario o grupo de usuarios. En el diseo lgico se obtiene un esquema lgico local para cada esquema conceptual local. Estos esquemas lgicos se integran despus para formar un esquema lgico global que represente todas las vistas de los distintos usuarios de la empresa. Por ltimo, en el diseo fsico, se construye la implementacin de la base de datos sobre un SGBD determinado. Ya que este diseo debe adaptarse al SGBD, es posible que haya que introducir cambios en el esquema lgico para mejorar las prestaciones a nivel fsico. Cada vista de usuario comprende los datos que un usuario maneja para llevar a cabo una determinada tarea. Normalmente, estas vistas corresponden a las distintas reas funcionales de la empresa, y se pueden identificar examinando los diagramas de flujo de datos o entrevistando a los usuarios, examinando los procedimientos, informes y formularios, y observando el funcionamiento de la empresa. Cada esquema conceptual local est formado por entidades, relaciones, atributos, dominios de atributos, identificadores y puede haber tambin jerarquas de generalizacin. Adems, estos esquemas se completan documentndolos en el diccionario de datos.

Bibliografa Los aspectos sobre el modelo entidad-relacin en donde se incorporan caractersticas del modelo entidad-relacin extendido, como las jerarquas de generalizacin, se tratan muy bien en los textos de Batini, Ceri y Navathe (1994) y Connolly, Begg y Strachan (1996). Estos ltimos son los que mejor presentan la metodologa del diseo conceptual, proporcionando todo tipo de "trucos" para identificar cada uno de los componentes de un esquema conceptual.

Das könnte Ihnen auch gefallen