Sie sind auf Seite 1von 30

Construyendo soluciones

analticas para su
empresa
J orge Rodrguez M.
942150982 / RPM: #0025095
jrodriguez@bs-sac.com
Contenido

1. Situacin actual

2. Data Mining

3. Metodologa

4. Aplicaciones

5. Anexos
Situacin actual
Cmo se hace esto?
Se siente as?
El fin del cliente como medio
El comienzo del cliente con poder
Evolucin de una estrategia centrada en el cliente
Tendencias y perturbaciones en el anlisis
predictivo
Contenido

1. Situacin actual

2. Data Mining

3. Metodologa

4. Aplicaciones

5. Anexos
Data Mining - Por qu se necesita?
Contribuye a las
decisiones tcticas
y estratgicas
Permite a los
usuarios dar
prioridad a
decisiones y
acciones
Proporciona
poderes de
decisin a los
usuarios del
negocio
Ahorra grandes
cantidades de
dinero a una
empresa y abre
nuevas
oportunidades de
negocio
Resulta un buen
punto de encuentro
entre los
investigadores y las
personas de
negocio
Permite que
relaciones no
descubiertas e
identificadas sean
expresadas como
reglas de negocio o
modelos
predictivos
Permite explorar,
visualizar y
comprender los
datos e identificar
patrones,
relaciones y
dependencias que
impactan en los
resultados finales
de la cuenta de
resultados
Es tiempo de anlisis
El que no aplique nuevos remedios debe esperar
nuevos males, porque el tiempo es el mximo
innovador.
Sir Francis Bacon
Valor del Data Mining
Data Mining Plataforma Analtica
Objetivos de
Negocios
Plataforma Integral de Apoyo a la Toma de Decisiones
Incrementa
r
Base de
Clientes
ETL
Data Stage
Oracle
Extraccin
Transformacin
Carga
Datos
Tangible a
Tecnologa
Tangible al
Negocio
Tcnicas
Analticas
Manejo y
Optimizacin
de Campaas
Retencin
Anlisis y
Optimizacin
de Canales
Incrementa
r
Avg. Ticket
Cliente
Valioso
Reduccin
de Costos de
Campaas
Incrementa
r
Lealtad
BI
BO
Micro Strategy
QlikView
Estructura
Presentacin
Distribucin
Informacin
Analytics
SAS Miner
IBM SPSS
Rapid Miner
Optimizacin
Pronsticos
Anlisis estadstico
Conocimiento
Cada
solucin
cubre las
expectativas
Segmentacin
Perfil y Valor
Cross Sell y
Up Sell
Data Mining Software
Data Mining Open Source
Orange es una suite de software para minera de base de datos y aprendizaje automtico basado en componentes que cuenta con
un fcil y potente, rpido y verstil front-end de programacin visual para el anlisis exploratorio de datos y visualizacin, y
librerias para Python y secuencias de comando. Contiene un completo juego de componentes para preprocesamiento de datos,
caracterstica de puntuacin y filtrado, modelado, evaluacin del modelo, y tcnicas de exploracin. Est escrito en C++ y Python,
y su interfaz grfica de usuario se basa en la plataforma cruzada del framework Qt.
RapidMiner, antes llamado YALE (Sin embargo, otro ambiente de aprendizaje), es un ambiente de experimentos en aprendizaje
automtico y minera de datos que se utiliza para tareas de minera de datos tanto en investigacin como en el mundo real.
Permite a los experimentos componerse de un gran nmero de operadores anidables arbitrariamente, que se detallan en archivos
XML y se hacen con la interfaz grfica de usuario de RapidMiner. RapidMiner ofrece ms de 500 operadores para todos los
principales procedimientos de mquina de aprendizaje, y tambin combina esquemas de aprendizaje y evaluadores de atributos del
entorno de aprendizaje Weka. Est disponible como una herramienta stand-alone para el anlisis de datos y como motor para
minera de datos que puede integrarse en tus propios productos.
Escrito en Java, Weka (Entorno Waikato para el Anlisis del Conocimiento) es una conocida suite de software para mquinas de
aprendizaje que soporta varias tareas tpicas de minera de datos, especialmente pre procesamiento de datos, agrupamiento,
clasificacin, regresin, visualizacin y caractersticas de seleccin. Sus tcnicas se basan en la hiptesis de que los datos estn
disponibles en un nico archivo plano o relacin, donde cada punto marcado es etiquetado por un nmero fijo de atributos.
WEKA proporciona acceso a bases de datos SQL utilizando conectividad de bases de datos Java y puede procesar el resultado
devuelto como una consulta de base de datos. Su interfaz de usuario principal es el Explorer, pero la misma funcionalidad puede
ser accedida desde la lnea de comandos o a travs de la interfaz de flujo de conocimientos basada en componentes.
Diseado para los cientficos, ingenieros y estudiantes, jHepWork es un framework para anlisis de datos libre y de cdigo abierto
que fue creado como un intento de hacer un entorno de anlisis de datos usando paquetes de cdigo abierto con una interfaz de
usuario comprensible y para crear una herramienta competitiva a los programas comerciales. Esto se hace especialmente para las
ploteos cientficos interactivos en 2D y 3D y contiene bibliotecas cientficas numricas implementadas en Java para funciones
matemticas, nmeros aleatorios, y otros algoritmos de minera de datos. jHepWork se basa en Jython un lenguaje de
programacin de alto nivel, pero codificacin en Java tambin puede ser usada para llamar libreras jHepWork numricas y
grficas.
KNIME (Konstanz Information Miner) es una plataforma de cdigo abierto de fcil uso y comprensible para integracin de datos,
procesamiento, anlisis, y exploracin. Ofrece a los usuarios la capacidad de crear de forma visual flujos o tuberas de datos,
ejecutar selectivamente algunos o todos los pasos de anlisis, y luego estudiar los resultados, modelos y vistas interactivas. KNIME
est escrito en Java y est basado en Eclipse y hace uso de sus mtodos de extensin para soportar plugins proporcionando as
una funcionalidad adicional. A travs de plugins, los usuarios pueden aadir mdulos de texto, imagen, procesamiento de series de
tiempo y la integracin de varios proyectos de cdigo abierto, tales como el lenguaje de programacin R, WEKA, el kit de
desarrollo de Qumica y LIBSVM.
Contenido

1. Situacin actual

2. Data Mining

3. Metodologa

4. Aplicaciones

5. Anexos
Data Mining Metodologa CRISP-DM
Conocimiento
del negocio
Conocimiento de
la informacin
Preparacin
de los datos
Modelamiento
Evaluacin
Despliegue
Ciclo de vida del cliente
Qu datos analizar?
Contenido

1. Situacin actual

2. Data Mining

3. Metodologa

4. Aplicaciones

5. Anexos
Data Mining - Aplicaciones
Segmentacin
Clientes
Ventas
Cruzadas
Optimizacin
Campaas
Deteccin y
Prevencin
Fraudes
Prdida
Esperada
Prediccin
Portafolio
Inteligencia
Comercial
Cliente
Preferente
Modelos
Retencin
Clientes
Series de
Tiempo
Inteligencia
Operacional
Inteligencia
Riesgos
Inteligencia
Financiera
Lavado de
Dinero
Anlisis
Competencia
Anlisis
Flujos de
Caja
Simulacin de
Inversiones
Pronsticos de
Demanda
Agencia
Operativa
Cobranza
Temprana
Scoring de
Cobranzas
Cobranza
Media-Tarda
Anlisis
Desempeo
Ciclo de
Vida
Predictores de
Riesgo
Adquisicin rentable
Desarrollo de relaciones
Gestin de la retencin del cliente
Segmentacin y estrategias de recobro
Segmentacin de clientes
Contenido

1. Situacin actual

2. Data Mining

3. Metodologa

4. Aplicaciones

5. Anexos
Modelo de maduracin del BI
Prenatal:
Reportes creados
por IT.
manualmente.
Esfuerzo en la
obtencin de
datos.
Incentiva a la
generacin de
planillas en Excel.

Infancia:
Spreadmarts creados
por analistas de
negocios.
Visin fragmentada:
falta de integridad,
nomenclatura,
distintas reglas de
negocio.
Ventaja para el
usuario final: fcil
creacin, comodidad,
control de los datos.

Etapa Crtica: El Golfo
Etapa crtica donde esta la mayora de
las organizaciones.
Mltiples y fragmentadas visiones
como resultado de distintas fuentes de
datos.
Falta de control en la calidad de datos.
Falta de adopcin por parte de los
usuarios.
Niez:
Se reconoce la
necesidad de
centralizar la
informacin y
distribuirla de manera
peridica.
Se desarrollan
repositorios con
distintos fines
(reporting, analticos).
Los analistas tienen
herramientas que le
permiten solamente
analizar y
comprender
informacin para los
procesos que
gestionan.

Adolescencia:
Unificacin de
criterios a nivel del
negocio.
Creacin de un
repositorio de datos a
nivel de la empresa
(Data Warehouse)
Reporting ms
complejo:
dashboards, anlisis
de campaas,
mtricas integradas.
Se puede acceder a
informacin de toda
la organizacin.

Adultez:
Integracin de
proyectos de BI en un
nico Enterprise Data
Warehouse.
Construccin de la
visin nica del
negocio.
Procesos de BI
crticos como los
procesos
transaccionales.
Aparicin de nuevos
e inesperados usos
de los sistemas de
explotacin.

Sabidura:
Provisin de servicios
de inteligencia en
nichos antes
impensados.
Servicios de
informacin analtica
para clientes finales.
Motores de inferencia
online, web mining.

Etapa Crtica: El Abismo
Prdida de flexibilidad.
Volumen inmanejable de reportes,
malas prcticas de auto-service.
Propiedad. Peligro de retorno al
manejo de informacin por silos.
Percepcin sobredimensionada de
tareas de integracin de datos, pocos
medios de explotacin.
Para pasar esta etapa
Lograr cambiar la visin que tiene la
organizacin respecto de la solucin
de BI, dejando de pensar que es slo
una herramienta de reporting.
Eliminar los spreadmarts.
Definir claramente las
responsabilidades de entrega de datos
y servicios ofrecidos.
Para pasar esta etapa:
Anlisis de uso, eliminacin de lo intil,
reportes parametrizables.
Anlisis de necesidades segn perfiles
de usuarios.
Adoptar BI como un recurso crtico,
parte del negocio y no un servicio ms
de IT.
Enlaces importantes

1. http://rapid-i.com/

2. http://orange.biolab.si/

3. http://www.knime.org/

4. http://www.cs.waikato.ac.nz/ml/weka/

5. http://jwork.org/jhepwork/

6. http://voyagememoirs.com/pharmine/2008/05/18/summary/

7. http://www.kdnuggets.com/polls/2010/data-mining-analytics-tools.html

8. http://www.springerlink.com/content/b7437372g47wh517/

9. http://blog.samibadawi.com/2010/04/r-rapidminer-statistica-ssas-or-
weka.html
El requisito del xito es la prontitud en las decisiones
Sir Francis Bacon

Das könnte Ihnen auch gefallen