Beruflich Dokumente
Kultur Dokumente
eficientes.
satisfacen
los
Es orientado a sujetos
Extraccin:
Transformacin:
Una vez que los datos son extrados, stos se transforman. Este proceso
incluye correccin de errores, resolucin de problemas de dominio, borrado de
campos que no son de inters, generacin de claves, agregacin de
informacin, etc.
Carga e Indices:
Chequeo de Calidad:
Liberacin/Publicacin:
Consulta:
Feedback:
Respaldo y Recuperacin:
Sistemas Fuente :
rea
de
almacenamiento
un
conjunto
de
procesos
que
limpian,
Servidor de Presentacin :
Modelo Dimensional :
DataMart :
DataWarehouse :
tablas relacionales.
Aplicaciones de Modelado :
Metadata :
en
aprender
el
lenguaje
de
programacin
de
la
herramienta
consultor caro.
Muchas compaas han encontrado que el uso de herramientas de primera
generacin ha agregado complejidad a sus sistemas. Es comn encontrar
en grandes compaas una gran variedad de soluciones para la limpieza de
datos, cada una con sus herramientas y tcnicas, las cuales requieren
entrenamiento y soporte. Esto genera problemas de mantenimiento y
entrenamiento para mltiples herramientas adems del problema potencial
de resultados diferentes sobre los mismos datos debido a las diferencias en
el software.
Por todo esto las herramientas de segunda generacin son mejores para
un enfoque empresarial que puede acarrear la implementacin de mltiples
datamarts, as como ajustarse a los sistemas OLTP para prevenir problemas de
datos en vez de arreglarlos posteriormente. Tambin puede ser reconfigurado
ms fcilmente para responder a las condiciones cambiantes del negocio.
Definir los datos consistentemente entre todos los futuros usuarios del
datawarehouse.
usuarios del
Hacer que tanto los encargados de ingresar los datos como los encargados de
los procesos de negocios se sientan responsables de la calidad de los datos.
varias
razones
un sistema de este tamao desalienta a los usuarios dado que al momento que se
complete los requerimientos ya habrn cambiado.
En contrapartida a la estrategia anterior los DataMart se basan en la teora Divide
and Conquer, donde se construyen almacenes de informacin especifica que
apuntan a una rea del negocio en particular. El concepto en este caso deriva de
la certeza que cualquier usuario tiene necesidades de informacin limitada, y
aunque tipicamente existen requerimientos para anlisis funcionales cruzados, el
tamao de los requerimientos es reducido materialmente si limitamos el tamao
del warehouse en s mismo.
Dos estrategias distintas se desarrollan a partir del concepto de datamarts, la de
datamarts dependientientes y la de datamarts independientes.
DATAMART DEPENDIENTES
En esta arquitectura los datos son cargados desde los sistemas de produccin
hacia el datawarehouse empresarial y entonces subdivididos en data marts. Se
llaman datamarts dependientes porque utilizan los datos y metadatos del
datawarehouse en lugar de obtenerlos de los sistemas de produccin.
Esta solucin resuelve los problemas de performance, estrategia, finanzas e
incluso algunos de los problemas polticos. Aunque tiene esos puntos a favor,
sigue tenindose que construir el datawarehouse global antes que los datamarts
sean implementados.
CONCLUSIONES
REFERENCIAS BIBLIOGRAFICAS
Len Silverston, W.H. Inmon, Kent Graziano. 'The datamodel resource book'.
http://www.lawebdelprogramador.com/cursos/mostrar.php?
id=278&texto=Data+ Warehouse
http://www.emagister.com/datawarehouse-cursos-1107904.htm
http://es.geocities.com/cibercero/mtd/foro/datawarehouse11.htm#data
http://www.sqlmax.com/dataw1.asp
http://www.ongei.gob.pe/publica/metodologias/Lib5084/14.HTM
http://es.wikipedia.org/wiki/BI_(inform%C3%A1tica)
http://es.wikipedia.org/wiki/Esquema_en_estrella
http://etl-tools.info/es/bi/almacendedatos_esquema-copo-de-nieve.htm