Beruflich Dokumente
Kultur Dokumente
PROCESO ETL
ASIGNATURA
INTELIGENCIA DE NEGOCIOS
DOCENTE
TRUJILLO, 2014
PERU
1. INTRODUCCION
El proceso ETL organiza el flujo de los datos entre diferentes sistemas en una
organizacin y esta fase de importar y cargar datos se suele realizar con una
herramienta ETL (como por ejemplo Informatica Powercenter, Datastage).
Tambin es posible y ocurre a menudo programar el proceso ETL en el lenguaje
dedicado a la base de datos (PL/SQL por ejemplo).
El almacn de datos puede ser implementado en una arquitectura de base de
datos (como Oracle, SQL Server) o en un producto dedicado (Teradata por
ejemplo).
2. INTELIGENCIA EMPRESARIAL O INTELIGENCIA DE NEGOCIOS (BUSINESS
INTELLIGENCE)
Inteligencia empresarial (Business Intelligence), tambin llamado Gestin de
los Datos (Data Management), es un agregado de aplicaciones y herramientas
enfocadas al procesamiento de los datos en una empresa para poder ayudar
tomar decisiones y hacer varios anlisis. Inteligencia empresarial realiza gestin
de datos, consultas a los datos, generacin de los informes/reportes y ms
especficamente todo el procesamiento para traducir la lgica de negocios a la
lgica de sistemas empresariales.
Las reas ms importantes de Business Intelligence son:
de
datos
que
contiene
datos
procedentes
de
sistemas
del
base
de
datos
esta
actualizada
peridicamente
sin
interrumpir
multidimensionales
Esta
informacin
tiene
que
ser
accesible
rpidamente, pero no es tan importante que sea lo mas actual posible y al nivel
de detalle muy bajo. Normalmente un almacn de datos se carga diariamente
durante la noche cuando los sistemas fuente no estn sobrecargados. El objeto
mayor de la arquitectura de un almacn de datos es guardar datos histricos y
agregados. Las instrucciones SQL ejecutadas con mayor frecuencia son SELECT.
Hay tres arquitecturas del diseo de sistemas de almacenes de datos:
4.1
esquema
estrella.
El
afinamiento
est
orientado
facilitar
mantenimiento de dimensiones.
Lo que distingue a la arquitectura en copo de nieve de la esquema
estrella, es que las tablas de dimensiones en este modelo representan
relaciones normalizadas (3NF) y forman parte de un modelo relacional de
base de datos.
Con varios usos del esquema en bola de nieve, el ms comn es cuando
las tablas de dimensiones estn muy grandes o complejos y es muy difcil
representar los datos en esquema estrella.
Por ejemplo, si una tabla dimensional de los clientes (CUSTOMERS)
contiene un million de filas, seria una idea buena crear una tabla con
grupos de clientes (CUSTOMER_GROUPS) y mover los datos comunes
para cada grupo de clientes a esta tabla. El tamao de estas dos tablas
ser mucho menor que de una tabla no normalizada con todos los datos
de clientes.
El problema es que para extraer datos de las tablas en esquema de copo
de nieve, a veces hay que vincular muchas tablas en las sentencias SQL
que puede llegar a ser muy complejo y difcil para mantener.
4.2
la
Tercera
Forma
Normal
(3FN)
las
dimensiones
Informatica PowerCenter
Cognos Decisionstream
Ab Initio
6. BIBLIOGRAFIA
Colaboradores de Wikipedia. Extract, transform and load [en lnea]. Wikipedia,
La enciclopedia libre, 2014 [fecha de consulta: 27 de diciembre del 2014].
Disponible en
<http://es.wikipedia.org/w/index.php?
title=Extract,_transform_and_load&oldid=77241323>.