Beruflich Dokumente
Kultur Dokumente
Metodologa Kimball
Modelado Dimensional
Modelado Fsico
ETL
Minera de Datos
Reportes
Tabla de Contenido
Antecedentes Metodologa Kimball
Planificacin del proyecto Requerimientos del Negocio Lnea tecnolgica
Arquitectura tecnolgica Seleccin e instalacin de productos
Lnea de datos
Modelo dimensional Modelo fsico ETL
Despliegue
Despliegue Crecimiento Mantenimiento
Objetivos
1. Presentar los enfoques para el desarrollo de DWH 2. Presentar la metodologa de Kimball
ANTECEDENTES
Data Warehouse
El uso de los datos es exploratorio y menos predictible. Modelado multidimensional. Enfocado en la carga y la presentacin de los datos
DWH no es solamente crear un conjunto de reportes que corren peridicamente. Se trata de preguntas que hay que alcanzar y que puede llevar a lugares imprevistos.
Conceptos Clave
Datamart. Repositorio de datos especifico.
Diseado para responder las preguntas especficas. Diseado para servir las necesidades de unidades de negocio (ventas, comercializacin, operaciones, contabilidad, etc.) Es construido usando modelado dimensional
Inteligencia de Negocios.
Reportes y anlisis de datos almacenadas en el DWH Data warehouse/business intelligence (DW/BI) se refiere al sistema completo de extremo a extremo.
Modelos locales y uno o Una arquitectura de mas esquemas de arquitecturas; comparte estrella dimensiones, hechos, reglas, definiciones a travs de la organizacin Modelo empresarial normalizado de alto nivel; datamarts inciales. Realidad del cambio en organizaciones y sistemas
Arquitectura Compuesto de varios niveles de reas de inters y datamarts dependientes Data set DWH datos a nivel atmico; datamarts datos sumarizados
Contiene datos atmicos Carga datamarts con y sumarizados datos atmicos y sumarizados va un rea de inters no persistente
Historia de DWH
Inmon. 1990 Publica Building the Data Warehouse 2002 Mejora su libro y define una arquitectura como una coleccin de fuentes dispares en almacenes de datos detalles y variantes en el tiempo.
Kimball 1996 Publica The Data Warehouse Toolkit 2002 Mejora su libro y define multiples bases de datos llamados datamarts que son organizados por procesos de negocio, pero usan medios de datos estandarizados para la empresa.
Top-Down
Botton-Up
ENFOQUE INMON
El modelo Inmon
Consiste de todas las bases y sistemas de informacin de una organizacin
Modelo CIF (Corporate Information Factory) Fabrica de Informacin corporativa.
Modelado Inmon
Tres niveles en el modelado de los datos Entidad Relacin
Relaciones entre entidades, atributos y relaciones
Modelado Inmon
Relacin entre los niveles Uno y Dos del modelo de datos de Inmon
ENFOQUE KIMBALL
Enfoque Kimball
El modelo dimensional se inicia con tablas:
De hechos De dimensiones
No todos los detalles de las tareas del ciclo de vida deben ser ejecutados en todos los proyectos.
Planificacin
DB Initial Study
Anlisis
DB Design
Comprobacin
Ejecucin
Operacin
Mantenimiento
Mantenimiento
Kimball LifeCycle
Ciclo de Vida
Planificacin del proyecto Requerimientos del Negocio Lnea tecnolgica
Arquitectura tecnolgica Seleccin e instalacin de productos
Lnea de datos
Modelo dimensional Modelo fsico ETL
Despliegue
Despliegue Crecimiento Mantenimiento
Lnea de desarrollo
Luego de definir los requerimientos del negocio, enfocar el proyecto a tres lneas (tracks) concurrentes:
Tecnologa Datos Aplicaciones de BI
El flujo de actividad de las lneas, se indican por las flechas La dependencia entre tareas se indican por el alineamiento vertical de las tareas
Ejercicio 1
Identifique roles para el equipo de desarrollo de un DWH
Ejercicio 1
Identifique roles para el equipo de desarrollo de un DWH
Front Office: Sponsor y Directores
Ejercicio 1
Ejercicio 2
Identifique los recursos necesarios para el desarrollo del proyecto.
Ejercicio 2
Identifique los recursos necesarios para el desarrollo del proyecto.
Los recursos pueden ser: Humanos Equipamiento Servicios de terceros Tiempo
Ciclo de Vida
Planificacin del proyecto Requerimientos del Negocio Lnea tecnolgica
Arquitectura tecnolgica Seleccin e instalacin de productos
Lnea de datos
Modelo dimensional Modelo fsico ETL
Despliegue
Despliegue Crecimiento Mantenimiento
Requerimiento de datos
Fuente de datos Calidad de datos y limpieza de datos Almacenamiento de datos Carga de datos
Bus Matrix
Relaciona los procesos organizacionales a las entidades u objetos que participan en el proceso. Cada fila es un proceso y cada columna una dimensin
Priorizacin de Procesos
Recoleccin de Requerimientos
Quin va ha ir a recoger los requerimientos?.
Los usuarios pueden ser clasificados como: Ejecutivos Senior Administradores de departamentos clave Analistas de negocio DBA de sistemas operacionales Personal de TI Los ejecutivos senior le darn un sentido de direccin y alcance para su almacn de los datos.
Ciclo de Vida
Planificacin del proyecto Requerimientos del Negocio Lnea tecnolgica
Arquitectura tecnolgica Seleccin e instalacin de productos
Lnea de datos
Modelo dimensional Modelo fsico ETL
Despliegue
Despliegue Crecimiento Mantenimiento
Ciclo de Vida
Planificacin del proyecto Requerimientos del Negocio Lnea tecnolgica
Arquitectura tecnolgica Seleccin e instalacin de productos
Lnea de datos
Modelo dimensional Modelo fsico ETL
Despliegue
Despliegue Crecimiento Mantenimiento
Lnea de datos
ETL
Modelado dimensional
Anlisis de los datos de un proceso de negocio para: identificar la granularidad de las tablas de hechos dimensiones y atributos asociados hechos numricos.
Contiene los mismos datos y relaciones que un modelo normalizado en la 3FN, pero estructurado de manera diferente. Mejora el entendimiento y desempeo de consultas al DW Las construcciones primarias son: Tablas de hechos Tablas de dimensiones
Esquema de estrella
Una tabla de hechos Varias tablas de dimensiones. Ejemplo:
Asuma este esquema para una cadena de venta al por menor. El hecho puede ser el ingreso de dinero.
Ventajas:
En la prctica, muchos DWH normalizarn algunas dimensiones y otros no (usan una combinacin de copo de nieve y de estrella)
Diseo fsico
Preparando el entorno de base de datos.
Preparando la seguridad apropiada.
ETL
Los datos en bruto son extrados de los sistemas operacionales y transformados en informacin significativa para el negocio Los procesos ETL deben diseados mucho antes que cualquier datos sea extrada de la fuente
Se verifica la calidad de los datos de entrada. Las condiciones de calidad de datos se controlan continuamente
Ciclo de Vida
Planificacin del proyecto Requerimientos del Negocio Lnea tecnolgica
Arquitectura tecnolgica Seleccin e instalacin de productos
Lnea de datos
Modelo dimensional Modelo fsico ETL
Despliegue
Despliegue Crecimiento Mantenimiento
Aplicacin del BI
Aplicaciones que consultan, analizan y presentan informacin desde el modelo dimensional. Las aplicaciones BI entregan valor al negocio desde la solucin DW/BI. La meta es entregar capacidades al negocio para soportar y mejorar la toma de decisiones. 1. Diseo de Aplicaciones BI. 2. Desarrollo de aplicaciones BI.
Aplicacin del BI
Diseo de Aplicaciones BI.
Identifica las aplicaciones de BI candidatas y interfaces de navegacin apropiadas Orienta las necesidades de los usuarios. Produce la especificacin de las aplicaciones BI
Ciclo de Vida
Planificacin del proyecto Requerimientos del Negocio Lnea tecnolgica
Arquitectura tecnolgica Seleccin e instalacin de productos
Lnea de datos
Modelo dimensional Modelo fsico ETL
Despliegue
Despliegue Crecimiento Mantenimiento
Despliegue
Si la planificacin se ha ejecutado se puede asegurar: Los resultados de las lneas de tecnologa, datos y aplicacin del BI. Disponibilidad de la infraestructura de capacitacin y apoyo.
El despliegue debe ser bien sincronizado. El despliegue debe ser aplazado si todas las piezas, tales como entrenamiento, documentacin, y validacin de datos, no estn listos para la liberacin de produccin.
Mantenimiento
Cuando el sistema esta en produccin Incluye: Tareas tcnico operacionales que son necesarias para mantener el sistema operando ptimamente. Monitorio del uso. Tuning del desempeo. Mantenimiento de la tabla de ndices. Backup del sistema. Apoyo permanente, capacitacin y comunicacin con los usuarios finales
Crecimiento
Los DWH tienden a expandirse (si son exitosos)
Es considerado como un signo de xito. Nuevos requerimientos deben ser priorizados. Empezar el ciclo de nuevo Construir sobre las bases ya establecidas. Enfoque en los nuevos requerimientos
PREGUNTAS