Beruflich Dokumente
Kultur Dokumente
PROYECTO DATAWAREHOUSE
INTEGRANTES:
TUTOR:
FEBRERO 2018
INDICE DE CONTENIDO
INTRODUCCIÓN ........................................................................................................................ 4
JUSTIFICACION ......................................................................................................................... 5
OBJETIVOS ................................................................................................................................. 6
OBJETIVO GENERAL ............................................................................................................ 6
OBJETIVOS ESPECÍFICOS .................................................................................................... 6
MARCO TEORICO ...................................................................................................................... 7
SISTEMAS DE INFORMACION .................................................................................................... 7
APLICACIÓN DE LOS SISTEMAS DE INFORMACION ................................................................... 7
TIPOS DE SISTEMAS DE INFORMACION .................................................................................... 8
ELEMENTOS QUE CONFORMAN UN SISTEMA DE INFORMACION .......................................... 10
QUÉ ES INTELIGENCIA DE NEGOCIOS ...................................................................................... 11
DATAWAREHOUSE .................................................................................................................. 11
DATA MARTS ........................................................................................................................... 12
DATA MINING .......................................................................................................................... 12
OLTP (Online Transaction Proccesing) .................................................................................... 12
OLAP (Online Analitical Proccesing) ........................................................................................ 12
MODELOS DE ALMACENAMIENTO .......................................................................................... 12
MOLAP..................................................................................................................................... 12
Ventajas y Desventajas del Modelo MOLAP ........................................................................... 13
ROLAP ...................................................................................................................................... 13
Ventajas y Desventajas del Modelo ROLAP ............................................................................ 13
HOLAP...................................................................................................................................... 14
HECHO ..................................................................................................................................... 14
MEDIDA ................................................................................................................................... 14
DIMENSIÓN ............................................................................................................................. 14
DIAGRAMA EN ESTRELLA ........................................................................................................ 14
DIAGRAMA COPO DE NIEVE .................................................................................................... 14
ESQUEMA EN COPO DE NIEVE ................................................................................................ 15
Ventajas Modelo en estrella ................................................................................................... 16
Ventajas Modelo copo de nieve:............................................................................................. 16
Desventajas esquema copo de nieve ...................................................................................... 17
DISEÑO METODOLOGICO ............................................................................................................ 18
Modelo Copo de Nive.............................................................................................................. 18
Dimensión Persona ................................................................................................................. 20
Dimensión Región ................................................................................................................... 24
Dimensión Moneda ................................................................................................................. 27
Dimensión Tiempo .................................................................................................................. 31
Dimensión Espacio .................................................................................................................. 38
Dimensión Modelo .................................................................................................................. 45
Dimensión Hecho Ventas ........................................................................................................ 48
QlikView .................................................................................................................................. 50
CONCLUSIONES Y RECOMENDACIONES ...................................................................................... 55
CONCLUSIONES ....................................................................................................................... 55
RECOMENDACIONES ............................................................................................................... 55
BIBLIOGRAFIA .............................................................................................................................. 56
INTRODUCCIÓN
Las transformaciones aplicadas a los datos provenientes de las distintas fuentes son básicamente
de limpieza y de estructuración. Las transformaciones de limpieza son necesarias para asegurar
la calidad de los datos finalmente almacenados en el DWH e incluye entre otros, la corrección de
errores, eliminación de redundancia y resolución de inconsistencias, así como el asegurar las
reglas de negocio definidas. Los cambios en la estructura se realizan para adecuar los esquemas
a las funcionalidades de un DWH, e incluyen la adecuación al modelo de datos del DWH, cambios
de formato, operaciones de agregación, entre otras.
Un data warehouse es de gran importancia pues puede ayudar a las organizaciones a extraer el
máximo valor de los datos que se generan en el día a día, permitiendo además analizarlos y
compararlos con sus valores históricos y no solo mediante datos actuales. Aun así, en algunos
casos, sobre todo cuando hablamos de big data, el data warehouse puede tener ciertas limitaciones
que sin embargo pueden ser resueltas gracias a su ductibilidad.
El uso de un DWH simplifica los procesos de toma de decisiones porque ofrece imágenes
integradas de los datos. Facilita el proceso de comparación, proyección a futuro, relación con
otros datos, muestra de indicadores, información consolidada, entre otras, el acceso a los datos es
fácil y rápido, permitiendo a los usuarios hacer sus propias consultas, ayuda a mejorar el buen
funcionamiento de los sistemas operacionales retroalimentando demandas para los sistemas
transaccionales, además Un data warehouse se emplea para hacer el trabajo analítico, dejando las
bases de datos transaccionales libres para centrarse en las transacciones, tiene la capacidad de
analizar datos de múltiples fuentes y puede negociar las diferencias en cuanto a esquemas de
almacenamiento utilizando procesos de ETL, al integrar datos de múltiples sistemas de origen,
permite una visión central en toda la empresa, mantiene el historial de datos incluso si los sistemas
transaccionales de origen no lo hacen, mejora los datos, proporcionando códigos y descripciones
coherentes, incluso arreglando datos erróneos, presenta la información de la organización de
forma coherente.
JUSTIFICACION
El presente proyecto explora nuevas herramientas del área informática, para que se
optimicen la elaboración de informes para la toma de decisiones de las distintas áreas , es
asi que empresas dedicadas a la venta de productos tiene la gran necesidad de contar con
este tipo de herramientas, que les ayuda a lograr mayor confianza en la competitividad en
el ámbito del comercio, es por ello que se plantea una solución basada en tecnologías de
información mediante la implementación de un almacen de datos mejor llamado Data
Warehouse, el mismo que nos permite obtener datos y generar información tratada y útil,
la cual apoyara el análisis del negocio que se requieren, como son el enfoque sobre las
ventas que se realizan, lo que permitirá dar un soporte al área Directiva en la toma de
decisiones.
Los nuevos retos que actualmente enfrenta una empresa en el país van encaminados a que
las empresas se vuelven cada vez mas competitivas en el mundo laboral y el modelo copo
de nieve de Data Warehouse seria una herramienta clave para analizar desde diversas
perspectivas la información de las empresas.
Es por ello que la propuesta de este tipo de modelo es proveer el empleo de herramientas
informáticas, conservación y explotación de la información histórica de los sistemas
transaccionales, omitir registros innecesarios en las bases de datos y generar aquellos
indispensables para la toma de decisiones, ya que las empresas dedicadas a las ventas,
constituyéndose una herramienta de suma importancia área los administradores de las
empresas, que les permita afrontar las exigencias competitivas, mejorando la entrega
completa de información.
OBJETIVOS
OBJETIVO GENERAL
OBJETIVOS ESPECÍFICOS
SISTEMAS DE INFORMACION
“Como un área de estudios, los SIG algunas veces es referido, en un sentido restrictivo
como administración de la tecnología de la información. El estudio de los SI es
usualmente una disciplina de la administración d negocios y el comercio, Este involucra
frecuentemente la ingeniería de software, y también se distingue de la misma por la
concentración en la integraron de sistemas computarizados con la ayuda de la
organización.
El área de estudio no debe ser confundida con las ciencias de la computación la cual es
más teórica en naturaleza y lidia principalmente con la creación de software, y no con la
ingeniería de computación, la cual se focaliza en el diseño del hardware de computación”.
[4]
Los SI son una herramienta importante dentro de los negocios, y requeridos para poder
dar apoyo al proceso de toma de decisiones de las organizaciones. Desde esta perspectiva
debe ser absolutamente claro que toda organización requiere de SI, y los requiere durante
toda su existencia. Lo único que se requiere es que evolucionen adecuadamente en el
tiempo, es la forma en que se implementarán estos sistemas. [1] [3]
El segundo tipo de SI, corresponden a los que apoyan el proceso de toma de decisiones
son los llamados Sistemas de Soporte a la Toma de Decisiones, Sistemas para la Toma
de Decisión de Grupo, Sistemas Expertos de Soporte a la Toma de Decisiones y Sistema
de Información para Ejecutivos.
Típicamente los SI para la toma de decisiones suelen ser muy complejos y profundos en
cálculos, mientras que la entrada y salida de información es relativamente poca. Apoyan
la toma de decisiones que, por su misma naturaleza son repetitivos y de decisiones no
estructuradas que no suelen repetirse.
Por lo general este tipo de Si no suele ahorrar mano de obra, resultando de difícil
justificación económica para su desarrollo; y es casi nulo los ingresos del proyecto de
inversión. Suelen ser SI altamente interactivos y amigables al usuario, disponiendo de
altos estándares de diseño gráfico y visual, ya que éstos están dirigidos al usuario final.
El desarrollo de este tipo de SI efectuado directamente por el usuario final, por lo que
raras veces se incluye la participación operativa de los analistas y programadores del área
de informática. [8] [9]
Su interés principal es hacer frente a los cambios que ocurren en el entorno con las
capacidades con las que se cuentan. Por su naturaleza, importancia y aspectos
considerados de supervivencia de la organización son casi siempre desarrollados “en
casa” (in house), es decir, dentro de la misma organización, por lo que resultan casi
imposibles de adaptarse a paquetes disponibles en el mercado. Su desarrollo típicamente
es efectuado mediante una rutina de incrementos y a través de su evolución dentro de la
organización. Se comienza con un proceso o función en particular y, a partir de este se
van agregando nuevas funciones o procesos.
Los SI estratégicos poseen como objetivo lograr consolidar ventajas que los competidores
no posean, tales como ventajas en costos y servicios diferenciados con clientes y
proveedores. Por tal sentido, se considera que estos SI son creadores de barreras de
entrada al negocio. Pero para su plena efectividad deben apoyarse en un proceso de
innovación de productos y procesos dentro de la organización debido a que buscan la
consolidación de ventajas competitivas y una forma de lograrlo es innovando o creando
productos y procesos.” [8]
Un SI está compuesto por seis (06) elementos claramente identificables, tal y como se
muestran en la Figura 1.
Base de Datos: Es donde se almacena toda la información que se requiere para la toma de
decisiones.
DATAWAREHOUSE
Es un subconjunto del Data Warehouse, usado normalmente para el análisis parcial de los
datos. El objetivo de subdividir está dado por la complejidad computacional del análisis
global de todas las dimensiones del Data Warehouse y por la necesidad de rapidez. [12]
DATA MINING
Son los sistemas que se usan para analizar los datos que las OLTP introducen en la Base
de Datos. A diferencia de los primeros estos casi siempre usan el modelo
multidimensional para organizar los datos en la Base de Datos ya que brindan mejores
resultados a la hora del análisis de estos. [12]
MODELOS DE ALMACENAMIENTO
MOLAP
Ventajas Desventajas
ROLAP
Son sistemas en los cuales los datos se encuentran almacenados en base de datos
relacional. Típicamente los datos son detallados, evitando las agregaciones y las tablas se
encuentran normalizadas. Los esquemas más comunes sobre los que se trabaja con estrella
o copo de nieve, aunque es posible trabajar sobre cualquier base de datos relacional. [13]
Ventajas Desventajas
Los datos pueden ser compilado Los cálculos están limitados a las
con aplicaciones SQL funciones de la base de datos
HOLAP
Estos sistemas mantienen los registros detallados en la base de datos relacional, mientras
que los datos resumidos o agregados se almacenan en una base de datos multidimensional
separada. Son conocidos como Híbridos debido a que contiene las características de los
sistemas anteriores intentando rescatar lo mejor de cada uno. [13]
HECHO
MEDIDA
Es una propiedad de un Hecho (casi siempre numérica), que es usada para su análisis.
[14]
DIMENSIÓN
DIAGRAMA EN ESTRELLA
Las bases de datos relacionales a menudo emplean esquemas de copo de nieve para
proporcionar los mejores tiempos de repuestas posibles a las consultas complejas. Si bien
el esquema de copo de nieve se considera fundamentalmente una herramienta con la que
el administrador de base de datos puede aumentar el rendimiento y simplificar el diseño
del almacén de datos, también se utiliza para representar la información del almacén de
datos de forma que tenga mas sentido para los usuarios finales. [12]
Las tablas de dimensiones están normalizadas, por lo que requiere menos esfuerzo de
diseño.
Puede desarrollar clases de jerarquías fuera de las tablas de dimensiones, que permiten
realizar análisis de lo general a lo detallado y viceversa.
[13]
Se procedió a la construcción del modelo de copo de nieve una vez analizado la base de
datos según los requerimientos.
Una vez concluido la construcción se procedió a la creación de un Nuevo Proyecto en la
herramienta de visual studio que permitirá cargar los datos al modelo de datawarehouse,
pero antes de eso se procedió a realizar la conexión de los dos modelos con el usuario y
contraseña respectiva de SQL SERVER.
Primero creamos la tarea de ejecución SQL para limpiar las tablas respectivas, por otra
parte, la tarea de flujo de datos para grabar los datos mediante instrucciones o consultas
SQL.
En la tarea de ejecución SQL se procedió a seleccionar la conexión creada, luego de eso
mediante las instrucciones ingresamos todas las tablas a ser limpiadas durante la
ejecución.
Dimensión Persona
En este paso lo que se realizo es que una vez generado la instruccion damos en vista
previa para constatar que los datos sean seleccionados correctamente.
En este paso se selecciona la conexión del datawarehouse y la tabla de destino que se
pretende grabar.
Para comprobar finalmente nos trasladamos al SQL SERVER y vemos que se grabó en
la tabla seleccionada sin ningún percance.
Dimensión Región
En la tarea de origen OLEDB seleccionamos la base de datos del proyecto final luego de
eso generamos una consulta de los datos que queremos grabar en el modelo de
datawarehouse.
En este paso lo que se realizo es que una vez generado la instrucción damos en vista
previa para constatar que los datos sean seleccionados correctamente.
Una vez culminado todos los procesos de limpiar ejecutar y grabar tareas, damos clic en
INICIAR para ejecutar todas las tareas y como observamos no se dio ningún error al
momento de grabar las tareas.
Para comprobar finalmente nos trasladamos al SQL SERVER y vemos que se grabó en
la tabla seleccionada sin ningún percance.
Dimensión Moneda
En este paso lo que se realizo es que una vez generado la instrucción damos en vista
previa para constatar que los datos sean seleccionados correctamente.
En este paso se selecciona la conexión del datawarehouse y la tabla de destino que se
pretende grabar.
Para comprobar finalmente nos trasladamos al SQL SERVER y vemos que se grabó en
la tabla seleccionada sin ningún percance.
Dimensión Tiempo
En la tarea de origen OLEDB seleccionamos la base de datos del proyecto final luego de
eso generamos una consulta de los datos que queremos grabar en el modelo de
datawarehouse.
En este paso lo que se realizo es que una vez generado la instrucción damos en vista
previa para constatar que los datos sean seleccionados correctamente.
Una vez culminado todos los procesos de limpiar ejecutar y grabar tareas, damos clic en
INICIAR para ejecutar todas las tareas y como observamos no se dio ningún error al
momento de grabar las tareas.
Para comprobar finalmente nos trasladamos al SQL SERVER y vemos que se grabó en
la tabla seleccionada sin ningún percance.
Dimensión Producto
En este paso lo que se realizo es que una vez generado la instrucción damos en vista
previa para constatar que los datos sean seleccionados correctamente.
En este paso se selecciona la conexión del datawarehouse y la tabla de destino que se
pretende grabar.
Para comprobar finalmente nos trasladamos al SQL SERVER y vemos que se grabó en
la tabla seleccionada sin ningún percance.
Dimensión Espacio
En la tarea de origen OLEDB seleccionamos la base de datos del proyecto final luego de
eso generamos una consulta de los datos que queremos grabar en el modelo de
datawarehouse.
En este paso lo que se realizo es que una vez generado la instrucción damos en vista
previa para constatar que los datos sean seleccionados correctamente.
Una vez culminado todos los procesos de limpiar ejecutar y grabar tareas, damos clic en
INICIAR para ejecutar todas las tareas y como observamos no se dio ningún error al
momento de grabar las tareas.
Para comprobar finalmente nos trasladamos al SQL SERVER y vemos que se grabó en
la tabla seleccionada sin ningún percance.
Dimensión Subcategoría
En este paso lo que se realizo es que una vez generado la instrucción damos en vista
previa para constatar que los datos sean seleccionados correctamente.
En este paso se selecciona la conexión del datawarehouse y la tabla de destino que se
pretende grabar.
Para comprobar finalmente nos trasladamos al SQL SERVER y vemos que se grabó en
la tabla seleccionada sin ningún percance.
Dimensión Modelo
En la tarea de origen OLEDB seleccionamos la base de datos del proyecto final luego de
eso generamos una consulta de los datos que queremos grabar en el modelo de
datawarehouse.
En este paso lo que se realizo es que una vez generado la instrucción damos en vista
previa para constatar que los datos sean seleccionados correctamente.
Una vez culminado todos los procesos de limpiar ejecutar y grabar tareas, damos clic en
INICIAR para ejecutar todas las tareas y como observamos no se dio ningún error al
momento de grabar las tareas.
Para comprobar finalmente nos trasladamos al SQL SERVER y vemos que se grabó en
la tabla seleccionada sin ningún percance.
Creamos el procedure para poder cargar los datos en la dimensión hechos con una
consulta sql.
En la tarea de ejecución SQL se procedió a seleccionar la conexión creada, luego de eso
mediante las instrucciones ingresamos el procedure creado previamente para poder
realizar la ejecución.
Una vez culminado todos los procesos de limpiar ejecutar y grabar tareas, damos clic en
INICIAR para ejecutar todas las tareas y como observamos no se dio ningún error al
momento de grabar las tareas.
Para comprobar finalmente nos trasladamos al SQL SERVER y vemos que se grabó en
la tabla seleccionada sin ningún percance.
QlikView
Para verificar que se realizó correctamente observamos que se cargaron todos los años en
el cuadro de lista.
Para el siguiente reporte de los productos, damos un clic en la pantalla y seleccionamos
un cuadro de lista primero ingresamos el título, después seleccionamos el cargo que en
este caso serán los todos los productos y para finalizar le damos aceptar.
Para verificar que se realizó correctamente observamos que se cargaron todos los
productos en el cuadro de lista.
Para el siguiente reporte que es de las ventas, damos un clic en la pantalla y seleccionamos
un gráfico primero ingresamos el título, después en la opción de expresiones le damos
añadir y creamos una definición para obtener la suma de los productos.
CONCLUSIONES
RECOMENDACIONES
[3] M.J Earl,, J.L. Sampler, J.E. Short, "Strategies for Business Process Reengineering:
Evidenc from Field Studies," Journal of Management Information Systems, 12(1), pp. 31-
56, 1995.
[9] Association for Information Systems (AIS) (2008) web site (online) recuperado de:
http://www.aisnet.org/
[13] Ibarra Angela, Procesamiento en Línea OLAP, Universidad Nacional del Noreste
Argentina, 2006.