Sie sind auf Seite 1von 56

UNIVERSIDAD TECNOLÓGICA INDOAMÉRICA

FACULTAD DE INGENIRIA Y TECNOLOGIAS DE LA INFORMACION Y


COMUNICACION

PROYECTO DATAWAREHOUSE

TEMA: CONSTRUCCION DE UN DATAWAREHOUSE DE UNA BASE DE


DATOS RELACIONAL DE VENTAS, USANDO EL MODELO DE COPO DE NIEVE

INTEGRANTES:

RAMOS BONILLA LUIS NICOLAS

YUCAILLA MASABANDA FRANKLIN PATRICIO

QUINCHA SALTOS DANIEL FABRICIO

TUTOR:

Msc: Jenny León Toro

FEBRERO 2018
INDICE DE CONTENIDO
INTRODUCCIÓN ........................................................................................................................ 4
JUSTIFICACION ......................................................................................................................... 5
OBJETIVOS ................................................................................................................................. 6
OBJETIVO GENERAL ............................................................................................................ 6
OBJETIVOS ESPECÍFICOS .................................................................................................... 6
MARCO TEORICO ...................................................................................................................... 7
SISTEMAS DE INFORMACION .................................................................................................... 7
APLICACIÓN DE LOS SISTEMAS DE INFORMACION ................................................................... 7
TIPOS DE SISTEMAS DE INFORMACION .................................................................................... 8
ELEMENTOS QUE CONFORMAN UN SISTEMA DE INFORMACION .......................................... 10
QUÉ ES INTELIGENCIA DE NEGOCIOS ...................................................................................... 11
DATAWAREHOUSE .................................................................................................................. 11
DATA MARTS ........................................................................................................................... 12
DATA MINING .......................................................................................................................... 12
OLTP (Online Transaction Proccesing) .................................................................................... 12
OLAP (Online Analitical Proccesing) ........................................................................................ 12
MODELOS DE ALMACENAMIENTO .......................................................................................... 12
MOLAP..................................................................................................................................... 12
Ventajas y Desventajas del Modelo MOLAP ........................................................................... 13
ROLAP ...................................................................................................................................... 13
Ventajas y Desventajas del Modelo ROLAP ............................................................................ 13
HOLAP...................................................................................................................................... 14
HECHO ..................................................................................................................................... 14
MEDIDA ................................................................................................................................... 14
DIMENSIÓN ............................................................................................................................. 14
DIAGRAMA EN ESTRELLA ........................................................................................................ 14
DIAGRAMA COPO DE NIEVE .................................................................................................... 14
ESQUEMA EN COPO DE NIEVE ................................................................................................ 15
Ventajas Modelo en estrella ................................................................................................... 16
Ventajas Modelo copo de nieve:............................................................................................. 16
Desventajas esquema copo de nieve ...................................................................................... 17
DISEÑO METODOLOGICO ............................................................................................................ 18
Modelo Copo de Nive.............................................................................................................. 18
Dimensión Persona ................................................................................................................. 20
Dimensión Región ................................................................................................................... 24
Dimensión Moneda ................................................................................................................. 27
Dimensión Tiempo .................................................................................................................. 31
Dimensión Espacio .................................................................................................................. 38
Dimensión Modelo .................................................................................................................. 45
Dimensión Hecho Ventas ........................................................................................................ 48
QlikView .................................................................................................................................. 50
CONCLUSIONES Y RECOMENDACIONES ...................................................................................... 55
CONCLUSIONES ....................................................................................................................... 55
RECOMENDACIONES ............................................................................................................... 55
BIBLIOGRAFIA .............................................................................................................................. 56
INTRODUCCIÓN

Un Data Warehouse (DWH) es un conjunto de datos orientados a temas, integrados, no volátiles


e históricos, organizados de tal forma que sirven de apoyo a la toma de decisiones , dado que
permiten analizar la información consolidada según diferentes puntos de vista. Dicho proceso de
consolidación de información involucra actividades de extracción de diversas fuentes de datos,
transformación de la información necesaria y finalmente su carga en el DWH. Usualmente se
denomina a este proceso ETL, del inglés Extraction, Transformation and Loading.

Las transformaciones aplicadas a los datos provenientes de las distintas fuentes son básicamente
de limpieza y de estructuración. Las transformaciones de limpieza son necesarias para asegurar
la calidad de los datos finalmente almacenados en el DWH e incluye entre otros, la corrección de
errores, eliminación de redundancia y resolución de inconsistencias, así como el asegurar las
reglas de negocio definidas. Los cambios en la estructura se realizan para adecuar los esquemas
a las funcionalidades de un DWH, e incluyen la adecuación al modelo de datos del DWH, cambios
de formato, operaciones de agregación, entre otras.

Un data warehouse es de gran importancia pues puede ayudar a las organizaciones a extraer el
máximo valor de los datos que se generan en el día a día, permitiendo además analizarlos y
compararlos con sus valores históricos y no solo mediante datos actuales. Aun así, en algunos
casos, sobre todo cuando hablamos de big data, el data warehouse puede tener ciertas limitaciones
que sin embargo pueden ser resueltas gracias a su ductibilidad.

El uso de un DWH simplifica los procesos de toma de decisiones porque ofrece imágenes
integradas de los datos. Facilita el proceso de comparación, proyección a futuro, relación con
otros datos, muestra de indicadores, información consolidada, entre otras, el acceso a los datos es
fácil y rápido, permitiendo a los usuarios hacer sus propias consultas, ayuda a mejorar el buen
funcionamiento de los sistemas operacionales retroalimentando demandas para los sistemas
transaccionales, además Un data warehouse se emplea para hacer el trabajo analítico, dejando las
bases de datos transaccionales libres para centrarse en las transacciones, tiene la capacidad de
analizar datos de múltiples fuentes y puede negociar las diferencias en cuanto a esquemas de
almacenamiento utilizando procesos de ETL, al integrar datos de múltiples sistemas de origen,
permite una visión central en toda la empresa, mantiene el historial de datos incluso si los sistemas
transaccionales de origen no lo hacen, mejora los datos, proporcionando códigos y descripciones
coherentes, incluso arreglando datos erróneos, presenta la información de la organización de
forma coherente.
JUSTIFICACION

El presente proyecto explora nuevas herramientas del área informática, para que se
optimicen la elaboración de informes para la toma de decisiones de las distintas áreas , es
asi que empresas dedicadas a la venta de productos tiene la gran necesidad de contar con
este tipo de herramientas, que les ayuda a lograr mayor confianza en la competitividad en
el ámbito del comercio, es por ello que se plantea una solución basada en tecnologías de
información mediante la implementación de un almacen de datos mejor llamado Data
Warehouse, el mismo que nos permite obtener datos y generar información tratada y útil,
la cual apoyara el análisis del negocio que se requieren, como son el enfoque sobre las
ventas que se realizan, lo que permitirá dar un soporte al área Directiva en la toma de
decisiones.

Este proyecto ayudara en un mediano plazo a procesar, administrar y consultar volúmenes


de informaicon, aumentar la eficiencia y competitividad, por otra parte, las empresas que
actualmente no cuentan con este modelo encontrará una propuesta oportuna con visión
en el futuro, al considerar adquiririr y desarrollar nuevas tecnologías que les permitan
administrar sus recursos mediante la información que generan los sistemas de
información.

Los nuevos retos que actualmente enfrenta una empresa en el país van encaminados a que
las empresas se vuelven cada vez mas competitivas en el mundo laboral y el modelo copo
de nieve de Data Warehouse seria una herramienta clave para analizar desde diversas
perspectivas la información de las empresas.

Es por ello que la propuesta de este tipo de modelo es proveer el empleo de herramientas
informáticas, conservación y explotación de la información histórica de los sistemas
transaccionales, omitir registros innecesarios en las bases de datos y generar aquellos
indispensables para la toma de decisiones, ya que las empresas dedicadas a las ventas,
constituyéndose una herramienta de suma importancia área los administradores de las
empresas, que les permita afrontar las exigencias competitivas, mejorando la entrega
completa de información.
OBJETIVOS

OBJETIVO GENERAL

 Construir Un Datawarehouse de la Base de Datos Relacional de Ventas Usando


El Modelo De Copo De Nieve

OBJETIVOS ESPECÍFICOS

 Diseñar el Datawarehouse tomando la Base de Datos relaciona usando el modelo


de copo de nieve.
 Realizar el proceso ETL(Extraccion, Transformación y Carga) en el Datawarehouse
para nutrir de información las tablas de hechos y dimensiones definidas.
 Generar reportes con la información del Datawarehouse para facilitar el análisis de los
datos.
MARCO TEORICO

SISTEMAS DE INFORMACION

El termino Sistemas de Información (SI), ha sido empleado en el tiempo en una multitud


de campos y disciplinas, y se le ha atribuido algunos de los siguientes significados: En la
teoría general de sistemas, un SI es un sistema, automático o manual, que comprende
personas, máquinas y/o métodos organizados para agrupar, procesar, transmitir y
diseminar datos que representan información para el usuario. [1]

En Informática, un sistema de información es cualquier equipo o sistema interconectado


o subsistema de equipos de computación o telecomunicación que es usado en la
adquisición, almacenamiento, manipulación, administración, movimiento, control,
presentación, conmutación, intercambio, transmisión, o recepción de voz y/o datos, e
incluye software, firmware, y hardware. [2]

APLICACIÓN DE LOS SISTEMAS DE INFORMACION

‘’El sistema de información gerencial (SIG) es un nombre general para la disciplina


académica que cubre el uso de las personas, tecnologías, y procedimientos -
colectivamente, el sistema de la información – para problemas de negocios.

Este campo está directamente relacionado con la administración por objetivos, y el


monitoreo de los principales indicadores de desempeño. Los SI pueden también ayudar
al procesamiento de información específica para la toma de decisiones, (analizando el
comportamiento de los indicadores).

En los negocios, los SI proveen soporte no solamente los procesos de negocios y


operaciones, sino también el proceso de tomar decisiones y hacer estrategias
competitivas, los cuales son campos de los SIG”. [1]

“Como un área de estudios, los SIG algunas veces es referido, en un sentido restrictivo
como administración de la tecnología de la información. El estudio de los SI es
usualmente una disciplina de la administración d negocios y el comercio, Este involucra
frecuentemente la ingeniería de software, y también se distingue de la misma por la
concentración en la integraron de sistemas computarizados con la ayuda de la
organización.

El área de estudio no debe ser confundida con las ciencias de la computación la cual es
más teórica en naturaleza y lidia principalmente con la creación de software, y no con la
ingeniería de computación, la cual se focaliza en el diseño del hardware de computación”.
[4]

Los SI son una herramienta importante dentro de los negocios, y requeridos para poder
dar apoyo al proceso de toma de decisiones de las organizaciones. Desde esta perspectiva
debe ser absolutamente claro que toda organización requiere de SI, y los requiere durante
toda su existencia. Lo único que se requiere es que evolucionen adecuadamente en el
tiempo, es la forma en que se implementarán estos sistemas. [1] [3]

TIPOS DE SISTEMAS DE INFORMACION

a) Sistemas de Información Transaccionales

“Los Si que logran la automatización de los procesos operativos dentro de una


organización, son denominados Sistemas Transaccionales, ya que su función primordial
consiste en procesar transacciones tales como pagos, cobros, pólizas, entradas, salidas,
etc. Estos se caracterizan por:

 Su uso permite el logro de ahorros significativos de mano de obra, debido a que


automatizan tareas operativas de la organización.
 Típicamente, es el primer tipo de SI que se implanta en organizaciones que
evolucionen hacia las tecnologías de la información. El comienzo, es para el
apoyo de las tareas a nivel operativo de la empresa.
 Estos SI por lo general, requieren un volumen considerable de entrada y salida de
información, pero sus cálculos, procesos y métodos suelen ser poco sofisticados.

Además, los SI Trasnacionales tienen la propiedad de ser recolectores de grandes


volúmenes de información, a través de estos sistemas se cargan las grandes bases de
información para su explotación posterior en otros tipos de sistemas, a medida que la
organización evoluciona y genera una cultura de la información. Este tipo de sistema
resulta típicamente ser fáciles de justificar ante la dirección general, ya que sus beneficios
son visibles y palpables.” [7]

b) Sistemas de Información de Soporte para la Toma de Decisiones

El segundo tipo de SI, corresponden a los que apoyan el proceso de toma de decisiones
son los llamados Sistemas de Soporte a la Toma de Decisiones, Sistemas para la Toma
de Decisión de Grupo, Sistemas Expertos de Soporte a la Toma de Decisiones y Sistema
de Información para Ejecutivos.

Típicamente los SI para la toma de decisiones suelen ser muy complejos y profundos en
cálculos, mientras que la entrada y salida de información es relativamente poca. Apoyan
la toma de decisiones que, por su misma naturaleza son repetitivos y de decisiones no
estructuradas que no suelen repetirse.

Por lo general este tipo de Si no suele ahorrar mano de obra, resultando de difícil
justificación económica para su desarrollo; y es casi nulo los ingresos del proyecto de
inversión. Suelen ser SI altamente interactivos y amigables al usuario, disponiendo de
altos estándares de diseño gráfico y visual, ya que éstos están dirigidos al usuario final.

El desarrollo de este tipo de SI efectuado directamente por el usuario final, por lo que
raras veces se incluye la participación operativa de los analistas y programadores del área
de informática. [8] [9]

c) Sistemas de Información Estratégicos

“Estos Si tienen como objetivo en las organizaciones lograr ventajas competitivas, a


través del uso de la tecnología de información. Ayudan a los niveles directivos a atacar y
dirigir las cuestiones estratégicas y las tendencias a largo plazo dentro y en el entorno de
la institución; no es apoyan la automatización de procesos operativos ni proporcionar
información para apoyar la toma de decisiones.

Su interés principal es hacer frente a los cambios que ocurren en el entorno con las
capacidades con las que se cuentan. Por su naturaleza, importancia y aspectos
considerados de supervivencia de la organización son casi siempre desarrollados “en
casa” (in house), es decir, dentro de la misma organización, por lo que resultan casi
imposibles de adaptarse a paquetes disponibles en el mercado. Su desarrollo típicamente
es efectuado mediante una rutina de incrementos y a través de su evolución dentro de la
organización. Se comienza con un proceso o función en particular y, a partir de este se
van agregando nuevas funciones o procesos.

Los SI estratégicos poseen como objetivo lograr consolidar ventajas que los competidores
no posean, tales como ventajas en costos y servicios diferenciados con clientes y
proveedores. Por tal sentido, se considera que estos SI son creadores de barreras de
entrada al negocio. Pero para su plena efectividad deben apoyarse en un proceso de
innovación de productos y procesos dentro de la organización debido a que buscan la
consolidación de ventajas competitivas y una forma de lograrlo es innovando o creando
productos y procesos.” [8]

ELEMENTOS QUE CONFORMAN UN SISTEMA DE INFORMACION

Un SI está compuesto por seis (06) elementos claramente identificables, tal y como se
muestran en la Figura 1.

Base de Datos: Es donde se almacena toda la información que se requiere para la toma de
decisiones.

La información se organiza en registros específicos e identificables.

 Transacciones: Corresponde a todos los elementos de interfaz que permiten al


usuario: consultar, agregar, modificar o eliminar un registro específico de
Información.
 Informes: Corresponden a todos los elementos de interfaz mediante los cuales el
usuario puede obtener uno o más registros y/o información de tipo estadístico
(contar, sumar) de acuerdo a criterios de búsqueda y selección definidos.
 Procesos: Corresponden a todos aquellos elementos que, de acuerdo a una lógica
predefinida, obtienen información de la base de datos y generan nuevos registros
de información. Los procesos sólo son controlados por el usuario (de ahí que
aparezca en línea de puntos).
 Usuario: Identifica a todas las personas que interactúan con el sistema, esto
incluye desde el máximo nivel ejecutivo que recibe los informes de estadísticas
procesadas, hasta el usuario operativo que se encarga de recolectar e ingresar la
información al sistema. [6]

QUÉ ES INTELIGENCIA DE NEGOCIOS

Es combinación de tecnología, herramientas y procesos que me permiten transformar mis


datos almacenados en información, esta información en conocimiento y este
conocimiento dirigido a un plan o una estrategia comercial. La inteligencia de negocios
debe ser parte de la estrategia empresarial, esta le permite optimizar la utilización de
recursos, monitorear el cumplimiento de los objetivos de la empresa y la capacidad de
tomar buenas decisiones para así obtener mejores resultados. [10]

DATAWAREHOUSE

Es la integración de datos consolidados, almacenados en un dispositivo de memoria no


volátil, proveniente de múltiples y posiblemente diferentes fuentes de datos. Con el
propósito del análisis y a partir de este tomar decisiones en función de mejorar la gestión
del negocio. Contiene un conjunto de cubos de datos que permiten a través de técnicas de
OLAP consolidar, ver y resumir los datos acordes a diferentes dimensiones de estos. [11]
DATA MARTS

Es un subconjunto del Data Warehouse, usado normalmente para el análisis parcial de los
datos. El objetivo de subdividir está dado por la complejidad computacional del análisis
global de todas las dimensiones del Data Warehouse y por la necesidad de rapidez. [12]

DATA MINING

Es el descubrimiento de conocimiento oculto en las bases de datos. Relaciones entre estos


y tendencias que permiten una toma de decisiones acertada. Incluye Asociación,
Caracterización, Clasificación, Análisis de Series Cronológicas, etc. [11].

OLTP (Online Transaction Proccesing)

Se les llama así a las aplicaciones orientadas principalmente a la inserción, actualización


y eliminación de datos, diseñada casi siempre usando el modelo Relacional. Estos
sistemas están optimizados para realizar estas operaciones en un tiempo corto. [12]

OLAP (Online Analitical Proccesing)

Son los sistemas que se usan para analizar los datos que las OLTP introducen en la Base
de Datos. A diferencia de los primeros estos casi siempre usan el modelo
multidimensional para organizar los datos en la Base de Datos ya que brindan mejores
resultados a la hora del análisis de estos. [12]

MODELOS DE ALMACENAMIENTO
MOLAP

En estos sistemas los datos se encuentran almacenados en una estructura


multidimensional. Para optimizar los tiempos de respuesta, el resumen de la información
es usualmente calculado por adelantado. [13]
Ventajas y Desventajas del Modelo MOLAP

Ventajas Desventajas

Mayor performance en el Tamaño limitado para la


desarrollo arquitectura del cubo

Poco tiempo de calculo realizado No se puede acceder a datos que no


en el momento están en el cubo

Puede escribir sobre la base de No puede explotar el paralelismo


datos en la Base de Datos

Posibilita hacer cálculos más


complicados

Tabla #1: Ventajas y Desventajas del Modelo MOLAP

ROLAP

Son sistemas en los cuales los datos se encuentran almacenados en base de datos
relacional. Típicamente los datos son detallados, evitando las agregaciones y las tablas se
encuentran normalizadas. Los esquemas más comunes sobre los que se trabaja con estrella
o copo de nieve, aunque es posible trabajar sobre cualquier base de datos relacional. [13]

Ventajas y Desventajas del Modelo ROLAP

Ventajas Desventajas

Uso total de la seguridad e Mas Lentos


integridad de la base de datos

Escalable para grandes volúmenes Construcción más cara

Los datos pueden ser compilado Los cálculos están limitados a las
con aplicaciones SQL funciones de la base de datos

Datos y estructuras más dinámicos


Tabla #2: Ventajas y Desventajas del Modelo ROLAP

HOLAP

Estos sistemas mantienen los registros detallados en la base de datos relacional, mientras
que los datos resumidos o agregados se almacenan en una base de datos multidimensional
separada. Son conocidos como Híbridos debido a que contiene las características de los
sistemas anteriores intentando rescatar lo mejor de cada uno. [13]

HECHO

Es una operación que se realiza en el negocio en un tiempo determinado. Son objeto de


análisis para la toma de decisiones. Se Representan en una caja con su nombre y las
medidas que lo caracterizan. [14]

MEDIDA

Es una propiedad de un Hecho (casi siempre numérica), que es usada para su análisis.
[14]

DIMENSIÓN

Es una característica de un hecho que permite su análisis posterior, en el proceso de toma


de decisiones. [14]

DIAGRAMA EN ESTRELLA

Su nombre lo adquiere debido a que su implementación en un ambiente relacional


(MOLAP Multidimentional Online Analitical Processing) está dado por varias tablas que
almacenan las jerarquías dimensionales y una tabla que contiene el hecho con una relación
1:m con estas tablas de dimensiones. [12]

DIAGRAMA COPO DE NIEVE

Las bases de datos relacionales a menudo emplean esquemas de copo de nieve para
proporcionar los mejores tiempos de repuestas posibles a las consultas complejas. Si bien
el esquema de copo de nieve se considera fundamentalmente una herramienta con la que
el administrador de base de datos puede aumentar el rendimiento y simplificar el diseño
del almacén de datos, también se utiliza para representar la información del almacén de
datos de forma que tenga mas sentido para los usuarios finales. [12]

ESQUEMA EN COPO DE NIEVE

El esquema en copo de nieve (snowflake schema) es un esquema de representación


derivado del esquema en estrella, en el que las tablas de dimensión se normalizan en
múltiples tablas. Por esta razón, la tabla de hechos deja de ser la única tabla del esquema
que se relaciona con otras tablas, y aparecen nuevas joins gracias a que las dimensiones
de análisis se representan ahora en tablas de dimensión normalizadas. En la estructura
dimensional normalizada, la tabla que representa el nivel base de la dimensión es la que
hace join directamente con la tabla de hechos. La diferencia entre ambos esquemas (star
y snowflake) reside entonces en la estructura de las tablas de dimensión. Para conseguir
un esquema en copo de nieve se ha de tomar un esquema en estrella y conservar la tabla
de hechos, centrándose únicamente en el modelado de las tablas de dimensión, que si bien
en el esquema en estrella se encontraban totalmente denormalizadas, ahora se dividen en
subtablas tras un proceso de normalización. Es posible distinguir dos tipos de esquemas
en copo de nieve, un snowflake completo (en el que todas las tablas de dimensión en el
esquema en estrella aparecen ahora normalizadas en el snowflake) o un snowflake parcial
(sólo se lleva a cabo la normalización de algunas de ellas). [9]
Características de este tipo de modelo Copo de Nieve:

Posee mayor complejidad en su estructura.

Hace una mejor utilización del espacio.

Es muy útil en tablas de dimensiones de muchas tuplas.

Las tablas de dimensiones están normalizadas, por lo que requiere menos esfuerzo de
diseño.

Puede desarrollar clases de jerarquías fuera de las tablas de dimensiones, que permiten
realizar análisis de lo general a lo detallado y viceversa.

[13]

Ventajas Modelo en estrella

 Este esquema es simple y veloz para ser usado en análisis multidimensionales.


Permite acceder tanto a datos agregados como de detalle.
 El diseño de esquemas en estrella permite implementar la funcionalidad de una
base de datos multidimensional utilizando una clásica base de datos relacional.
 Es su simple desde el punto de vista del usuario final. Las consultas no son
complicadas, ya que las condiciones y los joins sólo involucran a la tabla de
hechos y a las de dimensiones.
 Son mas simples de manejar que los modelos de copo de nieve.
 Es la opción con mejor rendimiento y velocidad pues permite indexar las
dimensiones de forma individualizada sin que repercuta en el rendimiento de la
base de datos en su conjunto.

Ventajas Modelo copo de nieve:

 El único argumento a favor de los esquemas en copo de nieve es que al estar


normalizadas las tablas de dimensiones, se evita la redundancia de datos y con
ello se ahorra espacio.
 Se puede usar un esquema de copo de nieve en un Datawarehouse, aunque estos
sean realmente grandes y complejos, pero nunca en sistemas donde el tiempo de
respuesta sea un factor crítico para los usuarios.

Desventajas esquema copo de nieve

 Si se poseen múltiples tablas de dimensiones, cada una de ellas con varias


jerarquías, se creará un número de tablas bastante considerable, que pueden llegar
al punto de ser inmanejables.
 Al existir muchas uniones y relaciones entre tablas, el desempeño puede verse
reducido. [14]
DISEÑO METODOLOGICO

Modelo Copo de Nive

Se procedió a la construcción del modelo de copo de nieve una vez analizado la base de
datos según los requerimientos.
Una vez concluido la construcción se procedió a la creación de un Nuevo Proyecto en la
herramienta de visual studio que permitirá cargar los datos al modelo de datawarehouse,
pero antes de eso se procedió a realizar la conexión de los dos modelos con el usuario y
contraseña respectiva de SQL SERVER.

Se realizó la conexión a la base de datos del con el usuario y contraseña respectiva de


SQL SERVER.

Primero creamos la tarea de ejecución SQL para limpiar las tablas respectivas, por otra
parte, la tarea de flujo de datos para grabar los datos mediante instrucciones o consultas
SQL.
En la tarea de ejecución SQL se procedió a seleccionar la conexión creada, luego de eso
mediante las instrucciones ingresamos todas las tablas a ser limpiadas durante la
ejecución.

Dimensión Persona

En el proceso de flujo de datos seleccionamos las tareas de origen OLEDB, Copiar


columna, y destino OLEDB para proceder a cargar los datos.
En la tarea de origen OLEDB seleccionamos la base de datos del proyecto final luego de
eso generamos una consulta de los datos que queremos grabar en el modelo de
datawarehouse.

En este paso lo que se realizo es que una vez generado la instruccion damos en vista
previa para constatar que los datos sean seleccionados correctamente.
En este paso se selecciona la conexión del datawarehouse y la tabla de destino que se
pretende grabar.

Se procede a seleccionar en asignaciones, y se escoge el campo de origen y de destino


para su posterior culminación.
Una vez culminado todos los procesos de limpiar ejecutar y grabar tareas, damos clic en
INICIAR para ejecutar todas las tareas y como observamos no se dio ningún error al
momento de grabar las tareas.

Para comprobar finalmente nos trasladamos al SQL SERVER y vemos que se grabó en
la tabla seleccionada sin ningún percance.
Dimensión Región

En el proceso de flujo de datos seleccionamos las tareas de origen OLEDB, Copiar


columna, y destino OLEDB para proceder a cargar los datos.

En la tarea de origen OLEDB seleccionamos la base de datos del proyecto final luego de
eso generamos una consulta de los datos que queremos grabar en el modelo de
datawarehouse.
En este paso lo que se realizo es que una vez generado la instrucción damos en vista
previa para constatar que los datos sean seleccionados correctamente.

En este paso se selecciona la conexión del datawarehouse y la tabla de destino que se


pretende grabar.
Se procede a seleccionar en asignaciones, y se escoge el campo de origen y de destino
para su posterior culminación.

Una vez culminado todos los procesos de limpiar ejecutar y grabar tareas, damos clic en
INICIAR para ejecutar todas las tareas y como observamos no se dio ningún error al
momento de grabar las tareas.
Para comprobar finalmente nos trasladamos al SQL SERVER y vemos que se grabó en
la tabla seleccionada sin ningún percance.

Dimensión Moneda

En el proceso de flujo de datos seleccionamos las tareas de origen OLEDB, Copiar


columna, y destino OLEDB para proceder a cargar los datos.
En la tarea de origen OLEDB seleccionamos la base de datos del proyecto final luego de
eso generamos una consulta de los datos que queremos grabar en el modelo de
datawarehouse.

En este paso lo que se realizo es que una vez generado la instrucción damos en vista
previa para constatar que los datos sean seleccionados correctamente.
En este paso se selecciona la conexión del datawarehouse y la tabla de destino que se
pretende grabar.

Se procede a seleccionar en asignaciones, y se escoge el campo de origen y de destino


para su posterior culminación.
Una vez culminado todos los procesos de limpiar ejecutar y grabar tareas, damos clic en
INICIAR para ejecutar todas las tareas y como observamos no se dio ningún error al
momento de grabar las tareas.

Para comprobar finalmente nos trasladamos al SQL SERVER y vemos que se grabó en
la tabla seleccionada sin ningún percance.
Dimensión Tiempo

En el proceso de flujo de datos seleccionamos las tareas de origen OLEDB, Copiar


columna, y destino OLEDB para proceder a cargar los datos.

En la tarea de origen OLEDB seleccionamos la base de datos del proyecto final luego de
eso generamos una consulta de los datos que queremos grabar en el modelo de
datawarehouse.
En este paso lo que se realizo es que una vez generado la instrucción damos en vista
previa para constatar que los datos sean seleccionados correctamente.

En este paso se selecciona la conexión del datawarehouse y la tabla de destino que se


pretende grabar.
Se procede a seleccionar en asignaciones, y se escoge el campo de origen y de destino
para su posterior culminación.

Una vez culminado todos los procesos de limpiar ejecutar y grabar tareas, damos clic en
INICIAR para ejecutar todas las tareas y como observamos no se dio ningún error al
momento de grabar las tareas.
Para comprobar finalmente nos trasladamos al SQL SERVER y vemos que se grabó en
la tabla seleccionada sin ningún percance.

Dimensión Producto

En el proceso de flujo de datos seleccionamos las tareas de origen OLEDB, Copiar


columna, y destino OLEDB para proceder a cargar los datos.
En la tarea de origen OLEDB seleccionamos la base de datos del proyecto final luego de
eso generamos una consulta de los datos que queremos grabar en el modelo de
datawarehouse.

En este paso lo que se realizo es que una vez generado la instrucción damos en vista
previa para constatar que los datos sean seleccionados correctamente.
En este paso se selecciona la conexión del datawarehouse y la tabla de destino que se
pretende grabar.

Se procede a seleccionar en asignaciones, y se escoge el campo de origen y de destino


para su posterior culminación.
Una vez culminado todos los procesos de limpiar ejecutar y grabar tareas, damos clic en
INICIAR para ejecutar todas las tareas y como observamos no se dio ningún error al
momento de grabar las tareas.

Para comprobar finalmente nos trasladamos al SQL SERVER y vemos que se grabó en
la tabla seleccionada sin ningún percance.
Dimensión Espacio

En el proceso de flujo de datos seleccionamos las tareas de origen OLEDB, Copiar


columna, y destino OLEDB para proceder a cargar los datos.

En la tarea de origen OLEDB seleccionamos la base de datos del proyecto final luego de
eso generamos una consulta de los datos que queremos grabar en el modelo de
datawarehouse.
En este paso lo que se realizo es que una vez generado la instrucción damos en vista
previa para constatar que los datos sean seleccionados correctamente.

En este paso se selecciona la conexión del datawarehouse y la tabla de destino que se


pretende grabar.
Se procede a seleccionar en asignaciones, y se escoge el campo de origen y de destino
para su posterior culminación.

Una vez culminado todos los procesos de limpiar ejecutar y grabar tareas, damos clic en
INICIAR para ejecutar todas las tareas y como observamos no se dio ningún error al
momento de grabar las tareas.
Para comprobar finalmente nos trasladamos al SQL SERVER y vemos que se grabó en
la tabla seleccionada sin ningún percance.

Dimensión Subcategoría

En el proceso de flujo de datos seleccionamos las tareas de origen OLEDB, Copiar


columna, y destino OLEDB para proceder a cargar los datos.
En la tarea de origen OLEDB seleccionamos la base de datos del proyecto final luego de
eso generamos una consulta de los datos que queremos grabar en el modelo de
datawarehouse.

En este paso lo que se realizo es que una vez generado la instrucción damos en vista
previa para constatar que los datos sean seleccionados correctamente.
En este paso se selecciona la conexión del datawarehouse y la tabla de destino que se
pretende grabar.

Se procede a seleccionar en asignaciones, y se escoge el campo de origen y de destino


para su posterior culminación.
Una vez culminado todos los procesos de limpiar ejecutar y grabar tareas, damos clic en
INICIAR para ejecutar todas las tareas y como observamos no se dio ningún error al
momento de grabar las tareas.

Para comprobar finalmente nos trasladamos al SQL SERVER y vemos que se grabó en
la tabla seleccionada sin ningún percance.
Dimensión Modelo

En el proceso de flujo de datos seleccionamos las tareas de origen OLEDB, Copiar


columna, y destino OLEDB para proceder a cargar los datos.

En la tarea de origen OLEDB seleccionamos la base de datos del proyecto final luego de
eso generamos una consulta de los datos que queremos grabar en el modelo de
datawarehouse.
En este paso lo que se realizo es que una vez generado la instrucción damos en vista
previa para constatar que los datos sean seleccionados correctamente.

En este paso se selecciona la conexión del datawarehouse y la tabla de destino que se


pretende grabar.
Se procede a seleccionar en asignaciones, y se escoge el campo de origen y de destino
para su posterior culminación.

Una vez culminado todos los procesos de limpiar ejecutar y grabar tareas, damos clic en
INICIAR para ejecutar todas las tareas y como observamos no se dio ningún error al
momento de grabar las tareas.
Para comprobar finalmente nos trasladamos al SQL SERVER y vemos que se grabó en
la tabla seleccionada sin ningún percance.

Dimensión Hecho Ventas

Creamos el procedure para poder cargar los datos en la dimensión hechos con una
consulta sql.
En la tarea de ejecución SQL se procedió a seleccionar la conexión creada, luego de eso
mediante las instrucciones ingresamos el procedure creado previamente para poder
realizar la ejecución.

Una vez culminado todos los procesos de limpiar ejecutar y grabar tareas, damos clic en
INICIAR para ejecutar todas las tareas y como observamos no se dio ningún error al
momento de grabar las tareas.
Para comprobar finalmente nos trasladamos al SQL SERVER y vemos que se grabó en
la tabla seleccionada sin ningún percance.

QlikView

En el editor de Script creamos la conexión hacia la base de datos y después ingresamos


todas las tablas del datawarehouse del modelo copo de nieve, después damos un clic en
la opción de recargar para que los datos de las tablas seleccionadas se muestren.
Para crear el reporte de los años, damos un clic en la pantalla y seleccionamos un cuadro
de lista primero ingresamos el título, después seleccionamos el cargo que en este caso
serán los años y para finalizar le damos aceptar.

Para verificar que se realizó correctamente observamos que se cargaron todos los años en
el cuadro de lista.
Para el siguiente reporte de los productos, damos un clic en la pantalla y seleccionamos
un cuadro de lista primero ingresamos el título, después seleccionamos el cargo que en
este caso serán los todos los productos y para finalizar le damos aceptar.

Para verificar que se realizó correctamente observamos que se cargaron todos los
productos en el cuadro de lista.
Para el siguiente reporte que es de las ventas, damos un clic en la pantalla y seleccionamos
un gráfico primero ingresamos el título, después en la opción de expresiones le damos
añadir y creamos una definición para obtener la suma de los productos.

Para finalizar en la opción de estilo seleccionamos el aspecto, la orientación para que se


muestren los datos en el reporte de las ventas y le damos aceptar.
Para verificar que se realizó correctamente observamos que se cargaron todas las ventas
realizadas en él gráfico.
CONCLUSIONES Y RECOMENDACIONES

CONCLUSIONES

Se cumplió con el objetivo de diseñar un datawarehouse con el modelo copo de nieve


basados en la base de datos relacional de ventas la misma que ha sido de gran ayuda en
el desarrollo del presenté proyecto.

El desarrollo del proceso de extracción, transformación y carga ha sido de gran ayuda,


gracias a ello se puede garantizar la integridad datos, ganando tiempo y recursos.

La entrega de reportes requeridos por parte de una empresa es cumplida en su totalidad,


de esta manera el tiempo es reducido en relación al proceso original, logrando más
eficiencia y mejorar su competitividad.

RECOMENDACIONES

 Se recomienda utilizar el modelo copo de nieve para implementación de


datawarehouse gracias a la gran facilidad de su desarrollo en relación a los demás
modelos existentes.
 El realizar el proceso ETL se recomienda tomar en cuenta las fuentes, de donde
se obtiene los datos, siendo estos íntegros y sin modificar la relación de los
mismos.
 Por último se recomienda que se de apertura a los proyectos de este tipo por que
aportan un considerable conocimiento, llegando a tener beneficios a través de los
reportes obtenidos, mejorando así las decisiones que tomen los dueños de las
empresas que usen el modelo de datawarehouse copo de nieve.
BIBLIOGRAFIA

[1] R. Murdick. Sistemas de Información. Prentice Hall Latinoamericana: México,


(1989)

[2] Federal Standard 1037C. MIL-STD-188, and National Information Systems


Security Glossary, (2005).

[3] M.J Earl,, J.L. Sampler, J.E. Short, "Strategies for Business Process Reengineering:
Evidenc from Field Studies," Journal of Management Information Systems, 12(1), pp. 31-
56, 1995.

[4] E K, Clemons, S P. Reddi, M C. Row, The Impact of Information Technology on


Organization of Economic Activity: The "Move to the Middle" Hypothesis, (1999).
[5] Microsft Data Warehouse Training, Datawarehouse Conceptos, 2006.

[6] Bocij et al. Business Information Systems, Prentice Hall, 2005.

[7] Bocij Prentice Hall. Business Information Systems, 2005.

[8] Information Systems– Fundamentals and Issues - an introductory text by John


Lindsay, Kingston University, School of Information Systems, Kingston University,
UK, 2001.

[9] Association for Information Systems (AIS) (2008) web site (online) recuperado de:
http://www.aisnet.org/

[10] ORACLE, (2005). Recuperado de


(http://www.oracle.com/ocom/groups/public/@otn/documents/webcontent/317529_esa.
pdf)

[11] Chaudhuri & Dayal, Datawarehouse Conceptos, 1997.

[12] Microsft Data Warehouse Training, Datawarehouse Conceptos, 2000.

[13] Ibarra Angela, Procesamiento en Línea OLAP, Universidad Nacional del Noreste
Argentina, 2006.

[14] Robert Wrembel & Christian Concilia,, Datawarehouse Conceptos, 2007.

Das könnte Ihnen auch gefallen