Sie sind auf Seite 1von 12

ANALISIS DE LA INFORMACION Y DECISION PARCIAL 1

LA INTELIGENCIA COMERCIAL:
Es un conjunto de productos y servicios que permiten acceder a datos, analizarlos y convertirlos en
informacin. Representa una iniciativa corporativa amplia que incluye DataWarehouse y DataMining.
Analiza la informacin para tomar decisiones, apoya a la gerencia de la empresa. Permite entender las
necesidades de los clientes.
NECESIDAD DE CONTAR CON INFORMACIN INTEGRADA
Problemas:
Inexistencia de datos corporativos
Islas (informacin de un mismo cliente separada en sistemas de distintas reas)
Falta de datos histricos.
LOS SSD (SISTEMAS PARA EL SOPORTE DE DECISIONES): HISTORIA:
Ciclos manuales:
Recepcin demorada del informe
Prdida de performance de los sistemas operacionales
Extraccin y vuelco de datos operacionales en las PCs:
Maraa de Programas de extraccin
Falta de Credibilidad: Distintos momentos, con distintos algoritmos....
Falta de productividad
Falta de flexibilidad
NUEVO ENFOQUE DE LOS DSS:
Consolidar los datos en un nuevo entorno, integrado, con perspectiva histrica y con facilidad de
manipulacin (e-data = datos reunidos y sincronizados electrnicamente)
La solucin se analiza desde dos enfoques:
Desde la Tecnologa y su evolucin.
Desde los tipos de sistemas existentes.
Necesidad de nuevas herramientas con workstation heterogneas y usuarios autnomos
Que trabajen en trminos de negocios
Con polimorfismo
Con facilidades para que se pueda administrar a los usuarios (crear repositorio, desalentar los
querys que haran caer al sistema, controlar accesos de usuarios a querys y reportes)
Que sean tan expresivas como SQL y generen SQL
Con inteligencia para usar el poder de los Server
Desde los sistemas:
Las actividades:
Operacionales (comprar, vender, producir, transportar)
De toma de decisin (presupuestar, evaluar, planificar)
Los sistemas:
Operacionales (OLTP)
De anlisis orientado a la toma de decisin (OLAP)
Pirmide de Explotacin y Anlisis de la Informacin Facultad de Ingeniera Anlisis de la Informacin y

la decisin.
Tipos de Consultas:
Consultas estndar:

ANALISIS DE LA INFORMACION Y DECISION PARCIAL 1

Listar prstamos hechos al cliente X y fechas de pago en que se demor


Mostrar todos los clientes que compraron el producto X el ao pasado

Anlisis multidimensional:
Mostrar ingresos trimestrales por ventas a grandes clientes por zona (drill) en los aos 2003 y
2004 (Slice)
Modelado:
Desgaste del cliente
Segmentacin:
Clientes que responden a descuentos
Clientes que no responden a promociones
DC (Descubrimiento de Conocimiento):
Anlisis de afinidad
DATAWAREHOUSE
Repositorio de datos histricos referidos a un tema en particular. Coleccin de data marts ms
pequeos. Plataforma de hardware, software y datos separada que permita a un hombre de negocios
tomar decisiones.
Coleccin de datos derivados (Segn Bill Inmon)
Orientados a un tema (<> A una transaccin)
Integrados
Variables en el tiempo
No voltiles
Integra datos de diferentes fuentes u orgenes (Sistemas OLTP, archivos planos, informacin externa,
etc.)
Sus datos se usan para la toma de decisiones. Los datawarehouses des normalizan informacin con el
fin de:
Aliviar la carga de los servidores
Acabar con datos sucios
Seguridad en el acceso a los datos corporativos.
Una nica verdad
ESCALABILIDAD HARD

SMPs: Multiprocesador Simtrico. Comparten memoria fsica y bus.


Clster
MPPs

HERRAMIENTAS

De modelado y diseo de datos (CASE) o modelos de datos prefabricados por industria


De ETL
De administracin
Planificacin de capacidad
Back up
De seguridad
De registro de uso
De control de rendimiento
De usuario final
Para Querys / reportes
Multidemnsionales
Datamining

ANALISIS DE LA INFORMACION Y DECISION PARCIAL 1

SISTEMAS OLTP (ON-LINE TRANSACTIONAL PROCESSING):

Las actividades incluyen comprar, vender, producir, transportar.


Son puramente operacionales.
Usa normalizacin.

SISTEMAS OLAP (ON-LINE ANALYTICAL PROCESSING):


Sistemas especialmente diseados para el anlisis de la informacin en apoyo a la toma de decisiones.
Las actividades incluyen presupuestar, evaluar, planificar. Son orientados a la toma de
decisiones.
Refleja lo que no hay en la normalizacin.
No necesita consistencia
La unidad es la consulta
Se apoya en informacin histrica y proyectada
Utiliza hechos, medidas y dimensiones con las cuales crea el modelo estrella.
Se ve en trminos de Hechos o Medidas, Parmetros o Dimensiones.
Requerimientos de un Sistema OLAP:
Rpido, flexible y con acceso a grandes volmenes de datos;
Rpido acceso a datos y rpidos clculos
Fuertes capacidades analticas (formulaciones estadsticas complejas)
Interfaces amigables
Vistas flexibles: para realizar clculos impensados y ofrecer modalidades de exposicin
(grficos, tablas, etc.)
Soporte a mltiples usuarios: la cantidad de usuarios crece da a da.
OLAP VERSUS DW
Surgieron en forma independiente.
OLAP: hace nfasis en proceso de satisfaccin al usuario final y de explotacin de la informacin
DW: hace hincapi en la obtencin y almacenamiento de los datos; proceso para obtener datos
seguros, consistentes, integrados y disponibles.
Una solucin robusta es la utilizacin de ambos.
Porque no SQL o Excel
Las hojas de clculo guardan la informacin como la veo.
Las hojas de clculo si bien permiten realizar clculos condicionales, permiten realizar libros
multiniveles que no separan la estructura de las vistas.
En la esencia de SQL no est previsto el anlisis, para algunos anlisis se necesita crear muchas
tablas.
OPERACIONAL
Usuario
Uso
Soporte
Interaccin

SOPORTE DECISIONES
Profesional
Anlisis
Estrategias
Ad hoc, no estructurada

Empleado
Ejecucin
Da a da
Predeterminada, repetitiva

ANALISIS DE LA INFORMACION Y DECISION PARCIAL 1


Tiempo Repuesta
Pantallas
Unidad
Caractersticas
Foco
Acceso a Datos
Valores
Naturaleza

> 2,3
Fijas
Transaccin
Read /Write
Ingreso de Datos
Decenas
Corrientes
Dinmico

Organizacin

Por aplicacin seguros de vida, salud,


auto....
Normalizada
Detallada

Estructura
Granularidad

De seg. a minutos
Variables
Consulta
Read
Informacin
Millones
Histricos y proyectados
Esttico hasta
Refresh
Por tema siniestros, plizas,
clientes
Des normalizada
Con cierto nivel de sumarizacin

DATAMINING

Descubrimiento de patrones y tendencias ocultas.


EVOLUCIONES DIVERGENTES

DATA MART

Data Mart
DW Operacional o ODS
Subset de una gran DW.
Mejor performance.
Ms simple para entender y mantener.
Autonoma de los usuarios.
Replica datos y descentraliza accesos.

Webhousing: Integracin de DW con tecnologas Web (Intranet y Extranet).


Ventajas:
Sencillo y econmico.
Disponibilidad.
Aplicaciones dinmicas.
Desventajas
Velocidad de respuesta.
Limitaciones para visualizar reportes complejos.
Dificultan para transmitir imgenes pesadas.

ANALISIS DE LA INFORMACION Y DECISION PARCIAL 1

MODELO MULTIDIMENSIONAL:

Facilitar la definicin y el manejo de datos sumarizados y anlisis a mltiples niveles.


Se puede definir un conjunto de datos en trminos de mltiples dimensiones (un
hipercubo)
Las dimensiones pueden ser jerrquicas y permiten distintos niveles de agregacin
Visualizar los datos, desde mltiples perspectivas.

Aparece para responder a nuevos objetivos:

Requerimientos del anlisis del negocio.


Fcil y obvia.
Tiene que ser flexible a los cambios del negocio.
Debe describir exactamente el pasado.
No se debe buscar solamente una herramienta de sumarizacin,
Para disear no vale el DER.
Es fundamental comprender el negocio para la seleccin correcta de las dimensiones.
Es muy importante disponer de herramientas software adecuadas para explotar el
modelo.

Como crear un modelo Multidimensional:


1.
2.
3.
4.
5.
6.

Identificar las medidas.


Identificar las dimensiones y jerarquas.
Determinar la granularidad.
Construir el modelo estrella.
Verificar el modelo con los usuarios y refinarlo.
Determinar la poblacin del modelo, mediante un mapeo de los datos.

Visualizacin

Tabular:
5

ANALISIS DE LA INFORMACION Y DECISION PARCIAL 1


Lo nico que importa es el contenido.
Es la mejor parar leer los valores exactos y actuales.
Es detallada al mximo.
Permite ver los valores y cantidades de ventas.
Grafica
Son grficos contenidos sobre los nmeros.
Describen tendencias.
Muestran relaciones entre los valores.
Aproximan ms a la realidad.

Crecimiento: Se debe considerar la granularidad, dado que determinar el crecimiento de la


Fac Table. Usar solo las dimensiones necesarias.
Hipercubo

Ms de 3 dimensiones.
Compuesto por una serie de ejes.
Sin lmite de dimensiones.

Densidad del cubo


Un cubo es denso cuando las dimensiones tienen todos sus miembros, Solo se da en muy
pocos casos. Si no se forman agujeritos de informacin. Esto sucede en las combinaciones de
dimensiones donde no hay medidas asociadas.

Vnculo entre DW, MM y OLAP:


Lo ideal es disear especialmente un Datawarehouse para explotar un
Modelo Multidimensional a travs de una herramienta OLAP.
DW + MM + Herramientas OLAP = SOLUCION OLAP

ANALISIS DE LA INFORMACION Y DECISION PARCIAL 1

MEDIDAS:

Informacin cuantitativa
Representan el cunto de una consulta
Primitivas o calculadas
Se almacenan en la FACT TABLE
Son lo que quiero mostrar
Pueden ser Primitivas o Calculadas
Tipos de Medidas:
o Aditivas: Son sumables.
o Semi-Aditivas: Solo pueden ser sumadas a veces. Ej. Stock.
o No aditivas: No tienen sentido sumarlas. Ej. Porcentaje.

DIMENSIONES:

Calificadores que dan sentido a las medidas


Se almacenan en las TABLA DE DIMENSIONES, junto con sus atributos
Se guardan cmo cdigos numricos o pocos caracteres
Pueden tener jerarquas, que son distintos niveles de sumarizacin
Pueden tener mltiples jerarquas. Permiten mltiples niveles de agregacin.
o Da Semana Ao
o Da Mes Ao
o Facilitan los reportes con distinto nivel de detalle.
o Puede ser vista como un rbol donde los miembros de menor nivel son las hojas.
o Deben ser flexibles
Atributos:
7

ANALISIS DE LA INFORMACION Y DECISION PARCIAL 1


o Campos que amplan la informacin de cada elemento de la dimensin.
o Facilitan las consultas a los usuarios finales.
o Atributos variables son aquellos que pueden cambiar en el tiempo. Ej. % de IVA.
Dan sentido a las medidas de la Fact Table.
Tablas
o Son ms cortas y anchas que las Fact Table. Tienden a ser ms anchas que largas.
o Tienen claves que no provienen de la fuente de datos.
o Usan claves numricas simples.
o Estn des normalizadas.
Agregacin:
o Proceso por el cual la informacin de bajo nivel se resume anticipadamente y se
coloca en tablas especiales que almacenan la informacin resumida. La tcnica de
agregacin es parte integral de la solucin al problema de performance.
Dimensin Degenerada:
o Es tener una dimensin sin tabla. Ej.: Guardo el nro. de factura.
Mini Dimensin:
o Abrir una dimensin en 2 o ms pequeas.
Granularidad:
o Es el nivel elemental (Jerarqua Mnima)
o Una vez definida, no se puede minimizar.
o Es el grado mnimo que se representa en la Fact Table.

FACT TABLE (Tabla de hechos):

Centro del modelo dimensional


Tiene punteros a las claves de menor nivel de cada dimensin
Contiene las medidas.
Si necesito distintas granularidades, entonces necesito distintas Fact Table.
No tiene referencias NULAS a ninguna dimensin.
Los atributos pertenecen a las dimensiones y no a los a las Fact Tables.
Son ms largas que anchas.
Una Fact Table sin medidas puede ser posible, pero es un caso atpico. Se utiliza para
registrar un EVENTO, que el hecho se produjo. Evento de vinculacin entre dimensiones
(Enfermedades - Centro Medico).
Se usa ms de una Fact Table cuando las dimensiones no son comunes o cuando
encuentro medidas que son calificadas por dimensiones distintas.

MODELO ESTRELLA
Diseo especial para los procesos analticos. Cada tabla de dimensiones se vincula con la Fact
Table, siempre por el mismo campo. Es simple e intuitivo, como as tambin de
mantenimiento flexible.
CONSIDERACIONES
Cuando se construye un modelo multidimensional de debe tener en cuenta:

Las dimensiones y sus atributos.


Las jerarquas de las dimensiones
La granularidad de las dimensiones.

Si bien los datos son generalmente numricos, podran ser textuales, grficos, sonidos, etc.
Los atributos son generalmente alfabticos.
Formulas (rangos):
8

ANALISIS DE LA INFORMACION Y DECISION PARCIAL 1


Las elementales son las sumas.
Se definen sobre los ejes (no sobre las celdas)

Formulas condicionadas

Depende lo que pidan, puedo sumar o sacar promedio (Si piden media de venta
o total de venta).

ARQUITECTURA
Cualquier arquitectura debe:

Ser soporte de la toma de decisiones.


Permitir una vista multidimensional de datos.
Drill: Hacer un agujero, sobre las dimensiones.
Slice: Rebanar.
Dice: Hacer un cubo ms pequeo

Es poco eficiente usar un formato que refleje fielmente la vista del usuario.
Carga del DW

Qu grado de actualidad deben tener los datos.


Pueden quedar offline? Cunto tiempo?
Que disponibilidad de almacenamiento hay?
Cul es el tiempo de carga?
Eleccin de arquitectura
Refresh

OLAP

ROLAP:
a. Relational OLAP. La base de datos relacional es el soporte.
b. Almacenamiento de los datos en una base de datos Relacional.
c. Tecnologa ms reciente.
d. Metadata es propietaria que genera un modelo multidimensional.
e. No utiliza datos pres calculados.
f. Acceso a los datos mediante SQL.
g. Cada DRILL, SLICE, DICE es un nuevo Query.
h. Es importante la indexacin de la BD.
i. Sufre las limitaciones del SQL, para anlisis complejos.

ANALISIS DE LA INFORMACION Y DECISION PARCIAL 1

MOLAP:
a. Multidimensional OLAP. Usa un esquema multidimensional.
b. Los datos se almacenan de forma similar a como se usaran.
c. Utilizan matrices multidimensionales.
d. Los cubos incluyen datos recalculados.
e. Limitacin en el tamao de los cubos.
f. La carga y pre calculacin requiere un tiempo significativo.

DOLAP
a. Desktop OLAP. Herramientas y cubo residen en la PC.
b. Trabaja con los datos de forma offline.
c. Herramientas son fciles de usar, pero su capacidad analtica es limitada.

10

ANALISIS DE LA INFORMACION Y DECISION PARCIAL 1

IOLAP / HOLAP:
a. Solucin integrada / Hibrida
b. Puede combinar bases relacionales y multidimensionales.

Eleccin de la arquitectura. Cualquier decisin depender de:

Tamao de la base.
Cantidad de dimensiones
Escalabilidad demandada
Tiempo de respuesta
Grado de dispersin
Frecuencia de actualizacin
Infraestructura.

ODS (OPERATIONAL DATA STORE)


Caractersticas:

Datos
Integrados.
Orientados a un tema
Actualizados casi en tiempo real.
Voltiles.
Corrientes.
Detallados.
Beneficios
Reportes operacionales ms rpidos.
Accesibilidad a datos crticos.
Visin completa de un tema.
Con posibilidad de replicar datos en los sistemas operacionales.
Ayuda a alimentar el DW.
Integracin
Mediante procesos bach.
11

ANALISIS DE LA INFORMACION Y DECISION PARCIAL 1


Mediante triggers.

Tratamiento de los datos:

Incompletos: Decisin COMPLETAR


Afectando el resultado:
Constante global.
Valor promedios.
Ms probable
Sin afectar el resultado
Llenar el valor manualmente.
Ignorar.
Datos con ruido: Decisin APLANAR
Encajado: Suavizar, segn valor medio de la caja.
Clster: Detectar outliers.
Regresin: Ajustando valores segn la funcin.
Datos inconsistentes: Decisin DETECTAR Y ELIMINAR
Datos Excesivos: (Afectan la celeridad de la explotacin). Decisin: Reducir sin
afectar la calidad.

12

Das könnte Ihnen auch gefallen