Sie sind auf Seite 1von 17

ANLISIS Y

EXTRACCIN DE
CONOCIMIENTO
Almacenes y Minera de datos
Objetivo General
El objetivo Fundamental de esta asignatura es:
Conocer el potencial de los almacenes de datos y del
anlisis y la extraccin de la minera de datos, para la
toma de decisiones.
La asignatura se puede dividir en Dos objetivos
especficos.
Conocer las tcnicas de Almacenes de datos y
OLAP para facilitar el procesamiento analtico de
apoyo a la toma de decisiones estratgicas.
Saber de las tcnicas de Minera de datos
apropiadas para problemas concretos de extraccin
del conocimiento.
Parte I. Introduccin
Finalidades y evolucin de sistemas de
informacin
Tipos de datos
Tipos de modelos
Relacin con otras disciplinas
Aplicaciones
Sistemas y herramientas para la toma de
decisiones: Diferencias e interrelacin

Finalidad de los sistemas de
Informacin
La Informacin reduce nuestra
incertidumbre (sobre algn aspecto de la
realidad) y por tanto, permite tomar
mejores decisiones.
Finalidad de los sistemas de
Informacin
Inicialmente la finalidad de los sistemas de
informacin era recopilar informacin sobre
una parcela del mundo para ayudar en la toma
de decisiones.
Actualmente, con la informatizacin de las
organizaciones y la aparicin de aplicaciones
operacionales sobre los sistemas de
informacin, la finalidad principal de los
sistemas de informacin es dar soporte a los
procesos basicos de la organizacin (ventas,
produccin, personal, ).

Finalidad del sistema de
informacin
Una vez satisfecha la necesidad de tener un soporte
informtico para los procesos bsicos de la
organizacin (sistemas de informacin para la
gestin).

Las organizaciones exigen nuevas prestaciones de
los sistemas de informacin
(sistemas de informacin para la toma de
decisiones).
Evolucin
60s: Informes batch:
la informacin es difcil de encontrar y analizar, poco flexible, se necesita
reprogramar cada peticin.

70s: Primeros DSS (Decision Support Systems) y EIS
(Executive Information Systems):
basados en terminal, no integrados con el resto de herramientas.

80s: Acceso a datos y herramientas de anlisis integradas
(conocidas como intelligent business tools):
Herramientas de consultas e informes, hojas de clculo, interfaces grficos e
integrados, fciles de usar.
Acceden a las bases de datos operacionales (killer queries).

90s: Almacenes de Datos y herramientas OLAP.

00s: Herramientas de Minera de Datos y Simulacin
Herramientas para la toma de
decisiones


Un EIS (Executive Information System) es un sistema de informacin y
un conjunto de herramientas asociadas:
Proporciona a los directivos acceso a la informacin de estado y sus
actividades de gestin.
Est especializado en analizar el estado diario de la organizacin
(mediante indicadores clave) para informar rpidamente sobre cambios a
los directivos.
La informacin solicitada suele ser, en gran medida, numrica (ventas
semanales, nivel de stocks, balances parciales, etc.) y representada de
forma grfica al estilo de las hojas de clculo.

Las herramientas OLAP (On-Line Analyitical Processing) son ms
genricas:
Funcionan sobre un sistema de informacin (transaccional o almacn de
datos)
Permiten realizar agregaciones y combinaciones de los datos de maneras
mucho ms complejas y ambiciosas, con objetivos de anlisis ms
estratgicos.

Cul es la diferencia entre EIS y OLAP?
Herramientas para la toma de
decisiones



Los sistemas de informes o consultas avanzadas:
estn basados, generalmente, en sistemas relacionales u objeto-
relacionales,
utilizan los operadores clsicos: concatenacin, proyeccin, seleccin,
agrupamiento, (en SQL y extensiones).
el resultado se presenta de una manera tabular.

Las herramientas OLAP
Estn basadas, generalmente, en sistemas o interfaces
multidimensionales,
Utilizando operadores especficos (adems de los clsicos): drill, roll, pivot,
slice & dice,
El resultado se presenta de una manera matricial o hbrida.


Cul es la diferencia entre informes
avanzados y OLAP
Herramientas para la toma de
decisiones



Las herramientas OLAP
proporcionan facilidades para manejar y transformar los datos.
producen otros datos (ms agregados, combinados).
ayudan a analizar los datos porque producen diferentes vistas de los
mismos.

Las herramientas de Minera de Datos:
son muy variadas: permiten extraer patrones, modelos, descubrir
relaciones, regularidades, tendencias, etc.
producen reglas o patrones (conocimiento).

Cul es la diferencia entre OLAP y
minera de datos?
Herramientas para la toma de
decisiones
11
La aparicin de algunas de ellas han hecho cambiar la
manera de trabajar de otras herramientas.
Qu interrelaciones existen entre todas estas herramientas?
Base de Datos
Transaccional
Fuentes
Internas
Fuentes
Externas
Fuente de
Datos
Fuente de
Datos 3
HTML
Fuente de
Datos 1
texto
Almacn
de Datos
ETL
Interfaz y
Operadores
Herramientas
de consultas e
informes
Herramientas
EIS
Herramientas
OLAP
Herramientas de
Minera de
Datos
Almacenes de datos
El almacn de datos es ahora el sistema de
informacin central en todo este proceso.
Un almacn de datos es una coleccin de datos:
orientada a un dominio
integrada
no voltil
variante en el tiempo
para ayudar en la toma de decisiones [Immon
1992, 1996]
Almacenes de datos
13

Actualmente,










La tecnologa OLAP generalmente se asocia a los almacenes de
datos, aunque:
Podemos tener Almacenes de Datos sin OLAP y
viceversa.
Los almacenes de datos y las tcnicas OLAP son
las maneras ms efectivas y tecnolgicamente
ms avanzadas para integrar, transformar y
combinar los datos para facilitar al usuario o a
otros sistemas el anlisis de la informacin.
Minera de datos
La Minera de Datos es un conjunto de tcnicas
de anlisis de datos que permiten:
Extraer patrones, tendencias y regularidades
para describir y comprender mejor los datos.
Extraer patrones y tendencias para predecir
comportamientos futuros.
Debido al gran volumen de datos este anlisis
ya no puede ser manual (ni incluso facilitado
por herramientas de almacenes de datos y
OLAP) sino que ha de ser (semi-)automtico.

Minera de datos
La Minera de Datos se diferencia claramente
del resto de herramientas en el sentido de que:

no transforma y facilita el acceso a la
informacin para que el usuario la analice
ms fcilmente.


la minera de datos analiza los
datos
Minera de datos
La minera de datos es slo una etapa del proceso de
extraccin de conocimiento a partir de datos.

Este proceso consta de varias fases:
Preparacin de Datos (seleccin, limpieza, y transformacin), Minera de
Datos, Evaluacin, Difusin y Uso de Modelos.
incorpora muy diferentes tcnicas
rboles de decisin, regresin lineal, redes neuronales artificiales, tcnicas
bayesianas, mquinas de soporte vectorial, etc.
de campos diversos:
aprendizaje automtico e I.A., estadstica, bases de datos,
aborda una tipologa variada de problemas:
clasificacin, categorizacin, estimacin/regresin, agrupamiento, ...

Almacenes de datos y Minera de
datos
17
Los almacenes de datos no son imprescindibles para hacer extraccin
de conocimiento a partir de datos.
se puede hacer minera de datos sobre un simple fichero
de datos.

Las ventajas de organizar un almacn de datos para realizar minera
de datos se amortizan sobradamente a medio y largo plazo cuando:
tenemos grandes volmenes de datos, o
stos aumentan con el tiempo, o
provienen de fuentes heterogneas o
se van a combinar de maneras arbitrarias y no
predefinidas.

Es necesario tener almacenes de datos
para realizar minera de datos?

Das könnte Ihnen auch gefallen