Sie sind auf Seite 1von 18

PARTE I:

INTRODUCCIN
Jos Hernndez Orallo
jorallo@dsic.upv.es

Departamento de Sistemas Informticos y Computacin


Universidad Politcnica de Valencia

Temario
1. Introduccin
1.1. Finalidades y Evolucin de los Sistemas de Informacin.
1.2. Herramientas para la Toma de Decisiones: diferencias e interrelacin.
1.3. Almacenes de Datos, OLAP y Minera de Datos: definicin e interrelacin.

2. Almacenes de Datos
2.1. Introduccin a los Almacenes de Datos.
2.2. Arquitectura de un Sistema de Almacn de Datos.
2.3. Explotacin de un Almacn de Datos: Herramientas OLAP.
2.4. Sistemas ROLAP y MOLAP.
2.5. Carga y Mantenimiento de un Almacn de Datos.
2.6. Diseo de un Almacn de Datos.
2.7. Lneas de Investigacin Abiertas.

3. Minera de Datos
3.1. Introduccin a la Minera de Datos (DM)
3.2. El proceso de KDD
3.3. Tcnicas de Minera de Datos
3.4. Web Mining
3.5. Lneas de Investigacin Abiertas

Objetivos Parte I
Distinguir los sistemas de informacin para la gestin y
los sistemas de informacin para la toma de decisiones.
Conocer la evolucin de las herramientas para el
anlisis de sistemas de informacin para la toma de
decisiones.
Distinguir las propiedades y finalidades de las
diferentes herramientas DSS (soporte a la toma de
decisiones): EIS, OLAP, consultas & informes, minera
de datos.
3

Finalidad de los Sistemas de Informacin

La informacin reduce nuestra


incertidumbre (sobre algn aspecto
de la realidad) y, por tanto, nos
permite tomar mejores decisiones

Finalidad de los Sistemas de Informacin


Inicialmente la finalidad de los sistemas de informacin era
recopilar informacin sobre un parcela del mundo para
ayudar en la toma de decisiones:

recuentos de cereales en Babilonia, de cacao por los pipiles,


censos civiles y militares romanos o chinos,
libros contables de rabes o sefardes,
...

Actualmente, con la informatizacin de las organizaciones y


la aparicin de aplicaciones software operacionales sobre el
sistema de informacin, la finalidad principal de los sistemas
de informacin es dar soporte a los procesos bsicos de la
organizacin (ventas, produccin, personal...).
5

Inters Renovado por la Finalidad Prstina


Una vez satisfecha la necesidad de tener un soporte
informtico para los procesos bsicos de la organizacin
(sistemas de informacin para la gestin).

Las organizaciones exigen nuevas prestaciones de los


sistemas de informacin
(sistemas de informacin para la toma de decisiones).
6

Evolucin
60s: Informes batch:

la informacin es difcil de encontrar y analizar, poco flexible, se


necesita reprogramar cada peticin.

70s: Primeros DSS (Decision Support Systems) y EIS


(Executive Information Systems):

basados en terminal, no integrados con el resto de herramientas.

80s: Acceso a datos y herramientas de anlisis integradas


(conocidas como intelligent business tools):

Herramientas de consultas e informes, hojas de clculo, interfaces


grficos e integrados, fciles de usar.
Acceden a las bases de datos operacionales (killer queries).

90s: Almacenes de Datos y herramientas OLAP.


00s: Herramientas de Minera de Datos y Simulacin.

Herramientas para la Toma de Decisiones


Han aparecido diferentes herramientas de negocio o DSS que
coexisten: EIS, OLAP, consultas & informes, minera de datos, ...
Cul es la diferencia entre EIS y OLAP?
Cul es la diferencia entre informes avanzados y
OLAP?
Cul es la diferencia entre OLAP y Minera de Datos?
Qu interrelaciones existen entre todas estas
herramientas?

Herramientas para la Toma de Decisiones


Cul es la diferencia entre EIS y OLAP?
Un EIS (Executive Information System) es un sistema de informacin y un
conjunto de herramientas asociadas:

Proporciona a los directivos acceso a la informacin de estado y sus actividades


de gestin.
Est especializado en analizar el estado diario de la organizacin (mediante
indicadores clave) para informar rpidamente sobre cambios a los directivos.
La informacin solicitada suele ser, en gran medida, numrica (ventas
semanales, nivel de stocks, balances parciales, etc.) y representada de forma
grfica al estilo de las hojas de clculo.

Las herramientas OLAP (On-Line Analyitical Processing) son ms genricas:

Funcionan sobre un sistema de informacin (transaccional o almacn de datos)


Permiten realizar agregaciones y combinaciones de los datos de maneras mucho
ms complejas y ambiciosas, con objetivos de anlisis ms estratgicos. 9

Herramientas para la Toma de Decisiones


Cul es la diferencia entre
informes avanzados y OLAP?
Los sistemas de informes o consultas avanzadas:

estn basados, generalmente, en sistemas relacionales u objetorelacionales,


utilizan los operadores clsicos: concatenacin, proyeccin,
seleccin, agrupamiento, (en SQL y extensiones).
el resultado se presenta de una manera tabular.

Las herramientas OLAP

Estn basadas, generalmente, en sistemas o interfaces


multidimensionales,
Utilizando operadores especficos (adems de los clsicos): drill,
roll, pivot, slice & dice,
El resultado se presenta de una manera matricial o hbrida.

10

Herramientas para la Toma de Decisiones


Cul es la diferencia entre
OLAP y minera de datos?
Las herramientas OLAP

proporcionan facilidades para manejar y transformar


los datos.
producen otros datos (ms agregados, combinados).
ayudan a analizar los datos porque producen diferentes
vistas de los mismos.

Las herramientas de Minera de Datos:

son muy variadas: permiten extraer patrones, modelos,


descubrir relaciones, regularidades, tendencias, etc.
producen reglas o patrones (conocimiento).

11

Herramientas para la Toma de Decisiones


Qu interrelaciones existen entre todas estas herramientas?
Fuentes
Internas

Herramientas
de consultas e
informes

Base de Datos
Transaccional
Herramientas
EIS

ETL
Fuente de
Datos 1
texto

Interfaz y
Operadores
Herramientas
OLAP

Fuente de
Datos 3
HTML

Fuente de
Datos

Almacn
de Datos

Fuentes
Externas

Herramientas de
Minera de
Datos

La aparicin de algunas de ellas han hecho cambiar la manera


de trabajar de otras herramientas.

12

Almacenes de Datos
El almacn de datos es ahora el sistema de informacin
central en todo estre proceso.
Un almacn de datos es una coleccin de datos:
orientada a un dominio
integrada
no voltil
variante en el tiempo
para ayudar en la toma de decisiones [Immon 1992, 1996]

13

Almacenes de Datos
Actualmente,
Los almacenes de datos y las tcnicas OLAP son las
maneras ms efectivas y tecnolgicamente ms
avanzadas para integrar, transformar y combinar los
datos para facilitar al usuario o a otros sistemas el
anlisis de la informacin.
La tecnologa OLAP generalmente se asocia a los
almacenes de datos, aunque:

Podemos tener Almacenes de Datos sin OLAP y viceversa.

14

Minera de Datos
La Minera de Datos es un conjunto de tcnicas de
anlisis de datos que permiten:
Extraer patrones, tendencias y regularidades para
describir y comprender mejor los datos.
Extraer patrones y tendencias para predecir
comportamientos futuros.
Debido al gran volumen de datos este anlisis ya no
puede ser manual (ni incluso facilitado por herramientas
de almacenes de datos y OLAP) sino que ha de ser
(semi-)automtico.
15

Minera de Datos
La Minera de Datos se diferencia claramente del resto
de herramientas en el sentido de que:
no transforma y facilita el acceso a la
informacin para que el usuario la analice ms
fcilmente.
la minera de datos analiza los datos

16

Minera de Datos
La minera de datos es slo una etapa del proceso de
extraccin de conocimiento a partir de datos.
Este proceso consta de varias fases:

Preparacin de Datos (seleccin, limpieza, y transformacin),


Minera de Datos, Evaluacin, Difusin y Uso de Modelos.

incorpora muy diferentes tcnicas

rboles de decisin, regresin lineal, redes neuronales artificiales,


tcnicas bayesianas, mquinas de soporte vectorial, etc.

de campos diversos:

aprendizaje automtico e I.A., estadstica, bases de datos,

aborda una tipologa variada de problemas:

clasificacin, categorizacin, estimacin/regresin, agrupamiento, ...

17

Almacenes de Datos y Minera de Datos


Es necesario tener almacenes de
datos para realizar minera de datos?
Los almacenes de datos no son imprescindibles para hacer
extraccin de conocimiento a partir de datos.

se puede hacer minera de datos sobre un simple fichero de datos.

Las ventajas de organizar un almacn de datos para


realizar minera de datos se amortizan sobradamente a
medio y largo plazo cuando:

tenemos grandes volmenes de datos, o


stos aumentan con el tiempo, o
provienen de fuentes heterogneas o
se van a combinar de maneras arbitrarias y no predefinidas.

18

Das könnte Ihnen auch gefallen