Sie sind auf Seite 1von 11

CPEL - CARRERAS UNIVERSITARIAS

PARA PERSONAS CON EXPERIENCIA LABORAL

Inteligencia de Negocios
Data Mining

Ms MBA Luis Morales


2016

Antecedentes
La

importancia del anlisis de datos para la empresa (dato


ahora es un activo)
Crecimiento del Data Warehouse que posibilita la obtencin de
datos
Las empresas se cuestionan:
Quin es mi cliente?
Cuales son los mercados a atacar?
Cul es la trayectoria de mi producto?
Cul es la estrategia de la competencia?

Predecir

el comportamiento y patrones del Negocio

Business Intelligence
Arquitectura
Reportes y
Queries Base

Modelos de
Datos:

Modelo del
Negocio
Repositorio de
Informacin

Data
Warehouse

Anlisis
Multidimensional

Data Staging
Area:

Extraccin
Limpieza
Transformacin
Carga

Anlisis del
Detalle de
Informacin

Anlisis de FCE
Anlisis de Datos
Sumarizados

Data Mining
Estadsticas
Anlisis de
Tendencias y
Comportamientos
Proyecciones

Internet/
Intranets

Caractersticas
Data

Mining:

Proceso de Extraer informacin relevante para la empresa


a fin de descubrir patrones de comportamiento que
faciliten la toma de decisiones de la empresa
Proporcionan conocimiento a la empresa permitiendo
descubrir informacin sin una hiptesis formulada
Responde a preguntas como:

Qu caractersticas tienen los clientes que compran un


determinado producto?
Cul es la caracterstica ms relevante de los compradores?
Cul es el factor que hace que el costo aumente?

Tcnicas
Permiten

especificar el tipo de patrones a ser encontrados.


Caracterizacin:
Identifica las caractersticas generales de una clase objetivo dada
Por ejemplo:

Las caractersticas de los clientes que compraron el nuevo producto


en las tiendas de Lima. El resultado va a permitir navegar al usuario
sobre las caractersticas de los clientes de una base dada

Discriminacin:

Compara caractersticas de una clase objetivo versus una o ms


clases contrastantes
Por ejemplo:

Comparar las caractersticas de los clientes que compran en una


tienda exclusiva versus una tienda por departamentos.

Tcnicas
Asociacin:
Identifica

las reglas de asociacin mostrando la


relacin entre atributos o variables. Es utilizado
en el anlisis de mercado
Por ejemplo:
Edad (X, [20,40]) y Ingreso (X, [10,20]) =>
Compran(X,Carro)
(Soporte=10% y confianza=80%)
El 10% son clientes entre [20,40] aos con un ingreso
entre [10,20] K han comprado un carro y el hay una
probabilidad del 80% que un cliente con esas
caractersticas compre un carro

Tcnicas
Clasificacin:
Proceso

de encontrar un conjunto de modelos


que describan y distingan clases con el propsito
de predecir la clase an desconocida. Puede ser
presentada como:

Reglas de If-Else
rboles de Decisin
Redes Neuronales

Por

ejemplo:

Se desea conocer el modelo de los clientes que


compran un producto determinado.

Tcnicas
<=35

Edad?

Vive en

Compra

Cono Norte?
S

Compra

>35

No

No Compra

Tcnicas
Anlisis

de Clusters:

Permite agrupar clases, dicha agrupacin est basada en


la similitud de caractersticas entre clases.
En caso que hayan datos que no obedezcan al
comportamiento general del modelo, es llamado
OUTLIERS.
Por Ejemplo:

Se quiere identificar a los clientes que solicitan mayores


crditos. En dicho resultado, se tiene que los clientes de
Lima del sexo masculino solicitan entre [20, 100] K sin
embargo se encontr que hay 3 outliers con montos mayores
a 1 milln. Esto puede ayudarnos a descubrir que hay un
mercado que no se est atacando.

Operaciones
Las

acciones a realizar para un Data Mining son los


sgtes:

Data Relevante: Se debe indicar o proporcionar los datos


a ser procesados. Estos datos se pueden obtener desde
un Data Warehouse, Transaccional o de cualquier otra
fuente cuyos datos son considerados verdicos y
relevantes al tema
Tipo de Conocimiento a ser minado: Es la hiptesis que va
a formular o la pregunta que se va a contestar. Se puede
representar como una frmula
Conocimiento del Tema: Indica las variables que van a
participar en el anlisis del tema; estas variables se deben
encontrar en la data relevante.
Medidas de Niveles de Inters: Medidas objetivas a medir
Presentacin y visualizacin de patrones descubiertos.

Operaciones
Ejemplo:

Data Relevante

Tipo de Conocimiento a ser minado

Se tiene las variables de producto, las caractersticas


demogrficas del cliente: Edad, Ubicacin geogrfica,
Profesin

Medidas de Niveles de Inters

Se desea conocer quienes son los clientes que ms compran

Conocimiento del Tema

Se tiene el Data Mart de Ventas de una compaa de


Cosmticos

Ventas Netas USD

Presentacin y visualizacin de patrones descubiertos.

Presentan en un rbol de decisiones las caractersticas de un


cliente que ms compra

Das könnte Ihnen auch gefallen