Sie sind auf Seite 1von 8

ESCUELA ACADEMICO PROFESIONAL DE

INGENIERA INDUSTRIAL

HERRAMIENTAS COMPUTACIONALES: DATA


MARTS (DM)

CURSO
: SISTEMAS Y
TECNOLOGIAS DE LA
INFORMACION

DOCENTE

ALUMNO:

: Dr. Pedro Getulio Villavicencio Guardia

URETA CRUZ EDBERG


HUNUCO PER
2016

Introduccin

El mercado de datos constituye una tecnologa de bases de datos que


ha tomado gran auge debido al crecimiento y muchas veces
subutilizacin de los grandes bancos de datos histricos almacenados
en las organizaciones. Es por ello aqu que se presentan algunas
precisiones sobre los conceptos y las metodologas utilizadas en el
desarrollo del mercado de datos. En la primera parte, se establece la
importancia del depsito y del mercado de datos. En este sentido, se
deja claro que el mercado de datos (MD) es un elemento sustantivo
dentro de la ltima generacin de bases de datos, constituida por el
repunte de los depsitos de datos (DD). Segn Poe (1998), DD
constituye, una base de datos de solo lectura, donde la informacin
extrada de los sistemas operacionales corrientes de la empresa es
transformada, integrada y resumida para luego ser usada con
efectividad en el soporte de decisiones.

Base Terica
Para un mejor entendimiento a cerca de un Datamart es necesario
contar con una base terica en lo referente a que es la inteligencia de
negocios, Data Warehouse, Bases de datos OLTP y OLAP y para que
se usa un Datamart.
Inteligencia de Negocios es el conjunto de estrategias y herramientas
enfocadas a la administracin y creacin de conocimiento mediante el
anlisis de datos existentes en una organizacin o empresa. Este
conjunto de herramientas y metodologas tienen en comn las
siguientes caractersticas:
Accesibilidad a la informacin: Los datos son la fuente principal de
este concepto. Lo primero que deben garantizar este tipo de
herramientas y tcnicas ser el acceso de los usuarios a los datos con
independencia de la procedencia de estos.
Apoyo en la toma de decisiones: Se busca ir ms all en la
presentacin de la informacin, de manera que los usuarios tengan
acceso a herramientas de anlisis que les permitan seleccionar y
manipular slo aquellos datos que les interesen.
Orientacin al usuario final. Se busca independencia entre los
conocimientos tcnicos de los usuarios y su capacidad para utilizar
estas herramientas.
Inteligencia de negocios, tambin llamado Business Intelligence (BI),
entonces permite la mejor toma de decisiones en base a informacin
histrica previamente analizada.
Con la ausencia de BI, existe de hecho un hueco: cuando los usuarios
toman decisiones y analizan riesgos y oportunidades basados en
informacin anecdtica, incompleta o desactualizada, lo cual no es
mejor que adivinar.
La BI correcta no solamente advierte a una empresa de los problemas
que surgen, sino tambin destaca las oportunidades y ahorro en
costos, por lo que en muchas empresas se utiliza el concepto de
centro de competencia para la inteligencia de negocios (BI
competency center)1.

DataWarehouse

Es un almacn de datos relacionados a las actividades de una


organizacin y grabadas en una base de datos diseada
especficamente con el propsito de hacer informes para despus
analizar estos informes y conseguir informacin estratgica.
Es el almacn de datos que contiene la informacin de toda la
empresa. Cualquier departamento puede acceder a la informacin de
cualquier otro departamento mediante un nico medio, as como
obligar a que los mismos trminos tengan el mismo
1
http://www.netmedia.info/netmedia/articulos.php?
id_sec=32&id_art=3677&num_page=10769

significado para todos. Un Datamart almacena la informacin de un


rea o departamento especfico y un conjunto de Datamarts forman
un DataWarehouse.

Mercado de datos o DataMart:


Un Datamart es una base de datos departamental, especializada en el
almacenamiento de los datos de un rea de negocio especfica. Se
caracteriza por disponer la estructura ptima de datos para analizar
la informacin al detalle desde todas las perspectivas que afecten a
los procesos de dicho departamento. Un datamart puede ser
alimentado desde los datos de un datawarehouse, o integrar por s
mismo un compendio de distintas fuentes de informacin.
Un Datamart es un subconjunto de los datos del Data Warehouse
cuyo propsito es el de responder a un determinado anlisis, funcin

o necesidad y con una poblacin de usuarios especfica. Al igual que


en un data warehouse, los datos estn estructurados en modelos de
estrella o copo de nieve y un Datamart puede ser dependiente o
independiente de un datawarehouse. (Reinhardt, 2007)

Bases de datos OLTP y OLAP


OLTP - On-Line Transactional Processing
Los sistemas OLTP son bases de datos orientadas al procesamiento de
transacciones. Una transaccin genera un proceso atmico (que debe
ser validado con un commit, o invalidado con un rollback), y que
puede involucrar operaciones de insercin, modificacin y borrado de
datos. El proceso transaccional es tpico de las bases de datos
operacionales.
* El acceso a los datos est optimizado para tareas frecuentes de
lectura y escritura. (Por ejemplo, la enorme cantidad de transacciones
que tienen que soportar las BD de bancos o hipermercados
diariamente).
*
Los datos se estructuran segn el nivel aplicacin (programa de
gestin a medida, ERP o CRM implantado, sistema de informacin
departamental...).
* Los formatos de los datos no son necesariamente uniformes en los
diferentes departamentos (es comn la falta de compatibilidad y la
existencia de islas de datos).
*
El historial de datos suele limitarse a los datos actuales o
recientes.

OLAP - On-Line Analytical Processing

Los sistemas OLAP son bases de datos orientadas al procesamiento


analtico. Este anlisis suele implicar, generalmente, la lectura de
grandes cantidades de datos para llegar a extraer algn tipo de
informacin til: tendencias de ventas, patrones de comportamiento
de los consumidores, elaboracin de informes complejos etc. Este
sistema es tpico de los datamarts.
*
El acceso a los datos suele ser de slo lectura. La accin ms
comn es la consulta, con muy pocas inserciones, actualizaciones o
eliminaciones.
*
Los datos se estructuran segn las reas de negocio, y los
formatos de los datos estn integrados de manera uniforme en toda
la organizacin.
* El historial de datos es a largo plazo, normalmente de dos a cinco
aos.
*
Las bases de datos OLAP se suelen alimentar de informacin
procedente de los sistemas operacionales existentes, mediante un
proceso de extraccin, transformacin y carga (ETL).
TIPOS DE DATAMARTS
Para crear el datamart de un rea funcional de la empresa es preciso
encontrar la estructura ptima para el anlisis de su informacin,
estructura que puede estar montada sobre una base de datos OLTP,
como el propio datawarehouse, o sobre una base de datos OLAP. La
designacin de una u otra depender de los datos, los requisitos y las
caractersticas especficas de cada departamento. De esta forma se
pueden plantear dos tipos de datamarts:
Datamart OLAP
Se basan en los populares cubos OLAP, que se construyen agregando,
segn los requisitos de cada rea o departamento, las dimensiones y
los indicadores necesarios de cada cubo relacional. El modo de
creacin, explotacin y mantenimiento de los cubos OLAP es muy
heterogneo, en funcin de la herramienta final que se utilice.
Datamart OLTP
Pueden basarse en un simple extracto del datawarehouse, no
obstante, lo comn es introducir mejoras en su rendimiento (las
agregaciones y los filtrados suelen ser las operaciones ms usuales)
aprovechando las caractersticas particulares de cada rea de la
empresa. Las estructuras ms comunes en este sentido son las tablas
report, que vienen a ser fact-tables reducidas (que agregan las
dimensiones oportunas), y las vistas materializadas, que se
construyen con la misma estructura que las anteriores, pero con el

objetivo de explotar la reescritura de queries (aunque slo es posibles


en algunos SGBD avanzados, como Oracle).

VENTAJAS :
Los datamarts que estn dotados con estas estructuras ptimas de
anlisis presentan las siguientes ventajas:
* Poco volumen de datos
* Mayor rapidez de consulta
* Consultas SQL y/o MDX sencillas
* Validacin directa de la informacin
* Facilidad para la historizacin de los datos

BENEFICIOS DEL USO DEL DATAMARTS


Los principales beneficios de utilizar Datamarts son:

Acelerar las consultas reduciendo el volumen de datos a


recorrer
Estructurar los datos para su adecuado acceso por una
herramienta
Dividir los datos para imponer estrategias de control de acceso
Segmentar los datos en diferentes plataformas hardware
Permite el acceso a los datos por medio de un gran nmero de
herramientas del mercado, logrando independencia de estas.

CONCLUSIONES

La tecnologa de DD conlleva una nueva forma de pensar por


parte de los desarrolladores, acostumbrados a trabajar sobre
sistemas relacionales transaccionales.
La utilizacin de modelos estrella, el manejo de redundancia y
la falta de normalizacin muchas veces chocan con los
esquemas de desarrollo de bases de datos y requieren de
tiempo para ser asimilados. Pero para el manejo de bases de
datos con informacin masiva para la toma de decisiones no es
posible con los sistemas convencionales de administracin
transaccional.
Los DD y los MD vienen a llenar el vaco existente en cuanto a
la utilizacin de esa valiosa veta de conocimientos, almacenada
en los datos histricos.
Existen muchas metodologas de desarrollo de los MD; sin
embargo, estn enfocados en el modelo tradicional de cascada
o espiral.

Das könnte Ihnen auch gefallen