Sie sind auf Seite 1von 42

UNIVERSIDAD LATINA

BASES DE DATOS
NUEVAS TECNOLOGAS
Qu es Business Intelligence (BI)

(Inteligencia Empresarial). Business


Intelligence es la habilidad para
transformar los datos en informacin, y la
informacin en conocimiento, de forma
que se pueda optimizar el proceso de
toma de decisiones en los negocios.

2
Qu es Business Intelligence (BI)

(Inteligencia Empresarial). Business


Intelligence es la habilidad para
transformar los datos en informacin, y la
informacin en conocimiento, de forma
que se pueda optimizar el proceso de
toma de decisiones en los negocios.

3
Definicin de minera de datos
Es la exploracin y anlisis de grandes
cantidades de datos con el objeto de
encontrar patrones y reglas significativas
que generen conocimiento.

4
Metas de la minera de datos
Permitir a una organizacin

MEJORAR sus decisiones a travs de un


mejor CONOCIMIENTO de su informacin
de negocios
Mejorar la ventaja competitiva

5
La minera de datos es un campo
multidisciplinario
Inteligencia
Artificial Estadstica
(Machine
Learning)

Bases de
Datos Minera de datos Ciencias de
(VLDB) la informacin

Graficacin y Otras
visualizacin disciplinas
6
La minera de datos es un subconjunto
de la inteligencia de negocios

7
Minera de datos nos permite
Proceso de utilizar datos crudos para inferir
importantes relaciones entre ellos
Coleccin de tcnicas poderosas para analizar
grandes volmenes de datos
No existe un solo enfoque para minera de datos
sino un conjunto de tcnicas que se pueden
utilizar de manera independiente o en
combinacin
Existe una relacin con la estadstica, aunque
frecuentemente se separan las tcnicas que no
estn basadas en mtodos estadsticos
Tipos de aplicaciones de la minera
de datos
Aplicaciones o problemas de minera de
datos pueden clasificarse en las
siguientes categoras

Clasificacin
Estimacin
Pronstico
Asociacin
Agrupacin o segmentacin
9
Clasificacin
Examinar las caractersticas de un nuevo
objeto y asignarle una clase o categora
de acuerdo a un conjunto de tales objetos
previamente definido
Ejemplos:
Clasificar aplicaciones a crdito como bajo,
medio y alto riesgo
Detectar reclamos fraudulentos de seguros

10
Estimacin
Relacionado con clasificacin
Mientras clasificacin asigna un valor
discreto, estimacin produce un valor
continuo
Ejemplos:
Estimar el precio de una vivienda
Estimar el ingreso total de una familia

11
Pronstico
Predecir un valor futuro con base a
valores pasados
Ejemplos:
Predecir cunto efectivo requerir un cajero
automtico en un fin de semana
Asociacin
Determinar cosas u objetos que van juntos
Ejemplo:
Determinar que productos se adquieren
conjuntamente en un supermercado

13
Agrupacin o segmentacin
Dividir una poblacin en un nmero de
grupos ms homogneos
No depende de clases pre-definidas a
diferencia de clasificacin
Ejemplo:
Dividir la base de clientes de acuerdo con los
hbitos de consumo
Usos de la minera de datos
Administracin de la relacin con los clientes:
Identificar nuevos clientes potenciales para
aumentar ventas
Ampliar la base de cliente con la mnima
inversin por parte de la empresa
Retener clientes existentes evitando que se
vayan a la competencia (attrition)
Vender ms a clientes existentes (ventas
cruzadas)
Usos de la minera de datos
Deteccin de fraudes en el uso de tarjetas
de crdito
Determinar patrones que puedan estar
relacionados con lavado de dinero
Determinar el precio de una casa con
base en sus caractersticas y el precio de
otras casas vendidas
Usos de la minera de datos
Usos de la minera de datos se han
ampliado con el comercio electrnico
Justificacin de la minera de datos
Datos se encuentran disponibles
Poder computacional es cada vez menos
costoso
Las presiones competitivas son enormes
Software para minera de datos se
encuentra disponible
Ciclo de vida de minera de datos
Principales tcnicas de minera de
datos
Anlisis de canasta de supermercado
K vecinos ms cercanos
Deteccin de grupos
Anlisis de encadenamiento
rboles de decisin
Redes neuronales artificiales
Algoritmos genticos
Que es el Dataware Housing.

Un almacn de datos (del ingls data


warehouse) es una coleccin de datos
orientada a un determinado mbito
(empresa, organizacin, etc.),
integrado, no voltil y variable en el
tiempo, que ayuda a la toma de
decisiones en la entidad en la que se
utiliza.
Introduccin a los Almacenes
de Datos
Se desea operar eficientemente con esos datos...
los costes de almacenamiento masivo y conectividad se han
reducido drsticamente en los ltimos aos,
parece razonable recoger los datos (informacin
histrica) en un sistema separado y especfico.

NACE EL DATA-WAREHOUSING

Data warehouses (Almacenes o Bodegas de Datos)


Introduccin a los Almacenes
de Datos
Almacenes de Datos (AD) (data warehouse)
motivacin

disponer de Sistemas de
Informacin de apoyo a la
toma de decisiones*

disponer de bases de datos que permitan extraer conocimiento de


la informacin histrica almacenada en la organizacin

objetivos

anlisis de la previsiones de diseo de


organizacin evolucin estrategias

* DSS: Decision Support Systems


Arquitectura de un Almacn de
Datos
Modelo multidimensional:
en un esquema multidimensional se representa una actividad
que es objeto de anlisis (hecho) y las dimensiones que
caracterizan la actividad (dimensiones).
la informacin relevante sobre el hecho (actividad) se
representa por un conjunto de indicadores (medidas o atributos de
hecho).
la informacin descriptiva de cada dimensin se representa por
un conjunto de atributos (atributos de dimensin).
Arquitectura de un Almacn de
Datos
Marca hecho
Descripcin Semana
Categora
Departamento Mes
Nro_producto Da Trimestre
Tipo Ao

importe
unidades
Almacn dimensin
medidas
Ciudad
Tipo

Regin
atributos
Arquitectura de un Almacn de
Datos
Se pueden obtener hechos a diferentes niveles de
agregacin:
obtencin de medidas sobre los hechos parametrizadas por
atributos de las dimensiones y restringidas por condiciones
impuestas sobre las dimensiones
LUGAR:
Ventas en
miles de ciudad Zaragoza Murcia
Alicante Jerarqua de dimensiones:
HECHO: El primer
Madrid
Euros Barcelona
Valencia PRODUCTO LUGAR TIEMPO
Zumo Pia 1l. 17 Categora Pas Ao
PRODUCTO:
trimestre de 2004 la artculo
Cola 33cl. 57
Jabn Salitre 93
/ \

empresa vendi en Tauritn 33cl 22


Cerveza Kiel 20 cl 5
Gama Prov. Ciudad Trimestre \
\ / / \
Leche Entera Cabra 1l 12
Valencia por un importe 1 2 3 4 1 2 Artculo Supermercado Mes Semana
2004 2005
de 22.000 euros del TIEMPO:
\ /
Da
producto tauritn 33 cl. trimestre
|
Hora

Un nivel de agregacin para un conjunto de


dimensiones se denomina cubo. 26
Arquitectura de un Almacn de
Datos
El almacn de datos puede estar formado por varios
datamarts y, opcionalmente, por tablas adicionales.

subconjunto de un almacn de
Data mart datos, generalmente en forma de
estrella o copo de nieve.

se definen para satisfacer las necesidades


de un departamento o seccin de la
organizacin.
contiene menos informacin de detalle y
ms informacin agregada.
Herramientas OLAP
OLAP procesamiento analtico en lnea (On-Line
Analytical Processing).
Es una solucin utilizada en el campo de la llamada
Inteligencia de negocios (o Business Intelligence)
cuyo objetivo es agilizar la consulta de grandes
cantidades de datos.
Para ello utiliza estructuras multidimensionales (o
Cubos OLAP) que contienen datos resumidos de
grandes Bases de datos o Sistemas
Transaccionales (OLTP).
Se usa en informes de negocios de ventas,
marketing, informes de direccin, minera de datos y
reas similares
28
Ventajas OLAP
Las herramientas de OLAP presentan al usuario una
visin multidimensional de los datos (esquema
multidimensional) para cada actividad que es objeto
de anlisis.
El usuario formula consultas a la herramienta OLAP
seleccionando atributos de este esquema
multidimensional sin conocer la estructura interna
(esquema fsico) del almacn de datos.
La herramienta OLAP genera la correspondiente
consulta y la enva al gestor de consultas del
sistema (p.ej. mediante una sentencia SELECT).
29
Tipos de Sistemas OLAP

1. ROLAP (Procesamiento Analtico


Relacional en Lnea).

Tipos 2. MOLAP (procesamiento Analtico


multidimensional en Lnea).

3. HOLAP (Procesamiento Analtico


Hbrido en Lnea).
ROLAP
Son sistemas en Ventajas
Seguridad e
Desventajas
Consultas ms
los cuales los integridad en la lentas.
base de datos.
datos se Escalable para Construccin
encuentran grandes
volmenes.
cara.

almacenados en Los datos pueden Clculos


ser compartidos limitados a las
una base de datos con aplicaciones funciones de las
relacional. SQL. bases de datos.
Estructura ms
dinmica.
MOLAP
En estos sistemas los Ventajas Desventajas
Mayor Tamao limitado
datos se encuentran rendimiento en el para la
almacenados en una procesamiento de arquitectura del
consultas. cubo.
estructura de datos Posibilita hacer No puede
multidimensional. clculos ms acceder a datos
complicados. que no estn en
el cubo.
No puede
explotar el
paralelismo las
bases de datos.
HOLAP
En estos sistemas mantienen los registros
detallados en la base de datos relacional,
mientras que los datos resumidos o
agregados se almacenan en una base de
datos multidimensional separada.
Comparaciones
ROLAP MOLAP
Los datos son accedidos Los datos son
directamente desde el precalculados y luego
Datawarehouse u otra son almacenados en
fuente de datos relacional cubos de datos
y no son almacenados multidimensionales.
por separado.
Comparaciones
HOLAP
Mantiene los volmenes de datos mas grande en la
base de datos relacional y las agregaciones en una base
de datos MOLAP separada.
Utilidades de OLAP
Tienen acceso a grandes cantidades de
datos.
Analizan las relaciones entre muchos tipos
de elementos empresariales.
Involucran datos agregados.
Comparan datos agregados a travs de
periodos jerrquicos.
Utilidades de OLAP
Presentan datos en diferentes
perspectivas.
Involucran clculos complejos entre
elementos de datos.
Pueden responder con rapidez a
consultas de usuarios.
Beneficios de OLAP
Es de fcil uso y acceso flexible para los
usuarios.
Los datos estn organizados en diferentes
dimensiones, lo que permite un mejor
anlisis.
Permite encontrar la historia en los datos.
Genera ciertas ventajas competitivas.
Requerimientos Funcionales de
los Sistemas OLAP
Construir un Datawarehouse y/o
Datamart.
Uso de herramientas de Almacenamiento
(bases de datos multidimensionales),
Herramientas de Extraccin y Coleccin,
Herramientas para Reportes de Usuario
Final y Herramientas para Anlisis
Inteligentes.
Requerimientos Funcionales de
los Sistemas OLAP
Un servidor que sea altamente escalable.
Un segundo servidor para las
herramientas de consulta de datos.
Operadores para el manejo de
cubos de datos

1. CUBE
2. ROLLUP
3. DRILLDOWN
4. GROUPING SETS
Operadores 5. SLICE (Rebanada)
6. PIVOT
7. Dado
8. Ascenso
9. Descenso
Utilizacin de Herramientas para
OLAP

Das könnte Ihnen auch gefallen