Sie sind auf Seite 1von 28

BASES DE DATOS CON B.I.

QU ES BUSINESS INTELLIGENCE?

Consiste en transformar los datos operacionales de una empresa en


informacin accionable, es decir, informacin que realmente habilite y
optimice el proceso de toma de decisiones y la definicin de estrategias y
acciones encaminadas a mejorar el desempeo del negocio.
ACIS
ARQUITECTURA DE B.I.

Procesos ETL(Extract, Transform and Load)


Extraccin de los datos desde las distintas fuentes (bases de datos,
archivos planos, etc.)
Transformacin de los datos para convertirlos a formatos consistente
Carga de los datos a la bodega de datos
PRINCIPALES PRODUCTOS DE BUSINESS
INTELLIGENCE QUE EXISTEN HOY EN DA SON:

* Cuadros de Mando Integrales (CMI)

* Sistemas de Soporte a la Decisin (DSS)

* Sistemas de Informacin Ejecutiva (EIS)


CUADROS DE MANDO INTEGRALES (CMI)

El Cuadro de Mando Integral (CMI), tambin conocido como Balanced


Scorecard (BSC) o dashboard, es una herramienta de control empresarial
que permite establecer y monitorizar los objetivos de una empresa y de sus
diferentes reas o unidades.
SISTEMAS DE SOPORTE A LA DECISIN (DSS)

Un Sistema de Soporte a la Decisin (DSS) es una herramienta de Business Intelligence


enfocada al anlisis de los datos de una organizacin.
El DSS es una de las herramientas ms emblemticas del Business Intelligence ya que, entre
otras propiedades, permiten resolver gran parte de las limitaciones de los programas de gestin.

Informes dinmicos, flexibles e interactivos,


No requiere conocimientos tcnicos
Rapidez en el tiempo de respuesta (OLTP-OLAP).
Integracin entre todos los sistemas/departamentos de la compaa
Cada usuario dispone de informacin adecuada a su perfil
Disponibilidad de informacin histrica.
SISTEMAS DE INFORMACIN EJECUTIVA (EIS)

Un Sistema de Informacin para Ejecutivos o Sistema de Informacin


Ejecutiva es una herramienta software, basada en un DSS, que provee a
los gerentes de un acceso sencillo a informacin interna y externa de su
compaa, y que es relevante para sus factores clave de xito.
DATA WAREHOUSE
El trmino Datawarehouse fue acuado por primera vez por Bill Inmon, y se
traduce literalmente comoalmacn de datos.
Un Data Warehouse es un conjunto de datos integrados, orientados a un
tema especfico, que varan con el tiempo y que no son transitorios, los
cuales soportan el proceso de toma de decisiones de la administracin.
William Inmon
CARACTERSTICAS
Integrado: los datos almacenados en el datawarehouse deben integrarse
en una estructura consistente, por lo que las inconsistencias existentes
entre los diversos sistemas operacionales deben ser eliminadas.
Temtico: slo los datos necesarios para el proceso de generacin del
conocimiento del negocio se integran desde el entorno operacional.
Histrico: el tiempo es parte implcita de la informacin contenida en un
datawarehouse. En los sistemas operacionales, los datos siempre reflejan
el estado de la actividad del negocio en el momento presente.
No voltil: el almacn de informacin de un datawarehouse existe para
ser ledo, pero no modificado.
DATAWAREHOUSE ES QUE
CONTIENE METADATOS
Es decir datos sobre los datos. Los metadatos permiten saber la procedencia de la informacin,
su periodicidad de refresco, su fiabilidad, forma de clcuo.
Los objetivos que deben cumplir los metadatos, segn el colectivo al que va dirigido, son:

* Dar soporte al usuario final, ayudndole a acceder al datawarehouse con su propio lenguaje
de negocio, indicando qu informacin hay y qu significado tiene. Ayudar a construir consultas,
informes y anlisis, mediante herramientas de Business Intelligence como DSS, EIS o CMI.

* Dar soporte a los responsables tcnicos del datawarehouse en aspectos de auditora, gestin
de la informacin histrica, administracin del datawarehouse, elaboracin de programas de
extraccin de la informacin, especificacin de las interfaces para la realimentacin a los
sistemas operacionales de los resultados obtenidos.
PROCESO DE CONSTRUCCIN
Se denomina ETL (Extraccin, Transformacin y Carga), a partir de los sistemas
operaciones de una compaa:

* Extraccin: obtencin de informacin de las distintas fuentes tanto internas


como externas.

* Transformacin: filtrado, limpieza, depuracin, homogeneizacin y


agrupacin de la informacin.

* Carga: organizacin y actualizacin de los datos y los metadatos en la base


de datos.
DATAMART

Bodega de datos parcial enfocada a un departamento o dependencia


especfica de la empresa.

Un Data Warehouse no es ms que la unin de todos lo data marts de una


empresa
Ralph Kimball
TIPOS DE DATAMARTS:
Datamart OLAP
Se basan en los populares cubos OLAP, que se construyen agregando, segn los requisitos de cada
rea o departamento, las dimensiones y los indicadores necesarios de cada cubo relacional. El
modo de creacin, explotacin y mantenimiento de los cubos OLAP es muy heterogneo, en funcin
de la herramienta final que se utilice.

Datamart OLTP
Pueden basarse en un simple extracto del datawarehouse, no obstante, lo comn es introducir
mejoras en su rendimiento (las agregaciones y los filtrados suelen ser las operaciones ms usuales)
aprovechando las caractersticas particulares de cada rea de la empresa. Las estructuras ms
comunes en este sentido son las tablas report, que vienen a ser fact-tables reducidas (que agregan
las dimensiones oportunas), y las vistas materializadas, que se construyen con la misma estructura
que las anteriores, pero con el objetivo de explotar la reescritura de queries (aunque slo es
posibles en algunos SGBD avanzados, como Oracle).
BASES DE DATOS OLTP Y OLAP
OLTP - On-Line Transactional Processing

Los sistemas OLTP son bases de datos orientadas al procesamiento de


transacciones. Una transaccin genera un proceso atmico (que debe ser
validado con un commit, o invalidado con un rollback), y que puede
involucrar operaciones de insercin, modificacin y borrado de datos. El
proceso transaccional es tpico de las bases de datos operacionales.
PROCESO
El acceso a los datos est optimizado para tareas frecuentes de lectura y escritura.
(Por ejemplo, la enorme cantidad de transacciones que tienen que soportar las BD
de bancos o hipermercados diariamente).

* Los datos se estructuran segn el nivel aplicacin (programa de gestin a medida,


ERP o CRM implantado, sistema de informacin departamental...).

* Los formatos de los datos no son necesariamente uniformes en los diferentes


departamentos (es comn la falta de compatibilidad y la existencia de islas de datos).

* El historial de datos suele limitarse a los datos actuales o recientes.


OLAP - ON-LINE ANALYTICAL
PROCESSING
Los sistemas OLAP son bases de datos orientadas al procesamiento
analtico. Este anlisis suele implicar, generalmente, la lectura de grandes
cantidades de datos para llegar a extraer algn tipo de informacin til:
tendencias de ventas, patrones de comportamiento de los consumidores,
elaboracin de informes complejos etc. Este sistema es tpico de los
datamarts.
ESTE SISTEMA ES TPICO DE LOS
DATAMARTS.
El acceso a los datos suele ser de slo lectura. La accin ms comn es la
consulta, con muy pocas inserciones, actualizaciones o eliminaciones.

* Los datos se estructuran segn las reas de negocio, y los formatos de los
datos estn integrados de manera uniforme en toda la organizacin.

* El historial de datos es a largo plazo, normalmente de dos a cinco aos.

* Las bases de datos OLAP se suelen alimentar de informacin procedente


de los sistemas operacionales existentes, mediante un proceso de extraccin,
transformacin y carga (ETL).
SISTEMAS OLAP
El estndar OLAP (OnLine Analitical Processing, o procesamiento analtico
en lnea) se refiere a los sistemas y herramientas de Minera de Datos que
utilizan tcnicas para la extraccin y el anlisis de los datos en lnea. Hoy
en da, prcticamente es sinnimo de Base de Datos Multidimensional.
CARACTERSTICAS DE OLAP
Ofrecen una visin multidimensional y jerarquizada de los datos.
Son capaces de analizar tendencias a lo largo de perodos de tiempo.
Pueden presentar vistas de un nmero reducido de dimensiones elegido
por el usuario.
Permiten ahondar en la jerarqua de los datos para acceder a los de ms
bajo nivel.
Son interactivas y soportan mltiples usuarios concurrentemente.
TIPOS DE OLAP
MOLAP (Multidimensional OLAP).
ROLAP (Relational OLAP).
HOLAP - Hbrido (HOLAP) equivale a MOLAP
SISTEMAS MOLAP
El sistema MOLAP utiliza una arquitectura de dos niveles: la bases de datos
multidimensionales y el motor analtico. La base de datos multidimensional
es la encargada del manejo, acceso y obtencin del dato.

Funcionan sobre bases de datos multidimensionales. Ofrecen un


rendimiento superior, aunque requieren de la construccin previa de la
base de datos multidimensional.
SISTEMAS ROLAP
Funcionan sobre bases de datos relacionales. Permiten trabajar sobre las
bases de datos corporativas ya establecidas, utilizando llamadas SQL
estndares.

El sistema ROLAP utiliza una arquitectura de tres niveles. La base de datos


relacional maneja los requerimientos de almacenamiento de datos, y el
motor ROLAP proporciona la funcionalidad analtica. El nivel de base de
datos usa bases de datos relacionales para el manejo, acceso y obtencin
del dato. El nivel de aplicacin es el motor que ejecuta las consultas
multidimensionales de los usuarios.
SISTEMA HOLAP
Los cubos almacenados como HOLAP tienen un tamao menor que los
cubos MOLAP equivalentes y responden con mayor rapidez que los cubos
ROLAP a consultas relativas a datos de resumen. El almacenamiento
HOLAP suele ser adecuado para cubos que requieren tiempos cortos de
respuesta para consultas realizadas en resmenes basados en grandes
cantidades de datos base.
DATAMINING (MINERA DE
DATOS)
El datamining (minera de datos), es el conjunto de tcnicas y tecnologas
que permiten explorar grandes bases de datos, de manera automtica o
semiautomtica, con el objetivo de encontrar patrones repetitivos,
tendencias o reglas que expliquen el comportamiento de los datos en un
determinado contexto.
La Minera de Datos (Data Mining) es un conjunto de tcnicas y procesos de
anlisis de datos que permite extraer informacin de bases de datos y
Almacenes de Datos mediante la bsqueda automatizada de patrones y
relaciones.
MINERA DE DATOS
MODELOS DE MINERA DE
DATOS
De verificacin. El usuario solicita que se verifique cierta hiptesis,
cuando se le responde puede refinar su pregunta, y as sucesivamente.
De descubrimiento. Con este mtodo se descubre nueva informacin que
no estaba previamente en el Almacn de Datos (o, en su caso, en las
bases de datos). No necesita intervencin por parte del usuario. Se
buscan patrones en los datos, o bien elementos fuera de la norma.
Predictivo. Se realizan predicciones sobre el comportamiento futuro de
variables a partir de los patrones existentes en los datos. El usuario indica
sobre qu variable quiere obtener la prediccin.
FASES DE LA MINERA DE DATOS
1. Seleccin y pre-procesamiento de los datos. En esta fase se decide
sobre qu datos se va a trabajar, tanto desde el punto de vista fsico
como lgico. Tambin se depuran los 10 datos. (Este paso no es
necesario si se trabaja sobre un Almacn de Datos, porque los datos ya
estn preparados).
2. Bsqueda de patrones. Se analizan los datos para extraer significado e
informacin. El resultado ser un informe. Se comienza realizando unos
anlisis estadsticos de los datos, y despus se lleva a cabo una
visualizacin grfica de los mismos para tener una primera
aproximacin.
3. Interpretacin y evaluacin. Se interpretan los resultados de la fase
anterior. Verifica si los resultados obtenidos son coherentes y los coteja
con los obtenidos por los anlisis estadsticos y de visualizacin grfica.
TCNICAS DE MINERA DE
DATOS
Las tcnicas ms utilizadas para la extraccin de la informacin son las siguientes:
De consulta e informe. Es la forma tradicional de obtener informacin a partir de bases
de datos relacionales. Consiste en la utilizacin de herramientas que facilitan las
consultas SQL y presentan los resultados en forma de tablas, diagramas o grficos.
Adems pueden utilizar tcnicas estadsticas para analizar los datos obtenidos. Son
apropiadas para el modelo de minera de verificacin.
De inteligencia artificial. Utilizan estructuras de datos y algoritmos basados en rboles
de decisiones, redes neuronales y lgica difusa. Forman parte de los agentes
inteligentes. Son apropiadas para los modelos predictivo y de descubrimiento.
De anlisis multidimensional. Se basan en la utilizacin de bases de datos
multidimensionales. Se utilizan para cruzar los datos de mltiples formas y con
distintos niveles de agregacin.

Das könnte Ihnen auch gefallen