Beruflich Dokumente
Kultur Dokumente
INDICE DE CONTENIDO
INTRODUCCION............................................................................................................7
CAPITULO I: ASPECTOS GENERALES.......................................................................8
1.1 Definicin del problema........................................................................................................ 8
1.2 Definicin de los objetivos................................................................................................. 10
1.3 Justificacin del Proyecto.................................................................................................. 10
1.4 Alcance del Proyecto........................................................................................................... 11
CONCLUSIONES.........................................................................................................41
REFERENCIAS............................................................................................................ 42
INDICE DE ILUSTRACIONES
INDICE DE GRAFICOS
INDICE DE TABLAS
Introduccin
El desarrollo tecnolgico al que hemos llegado, el aumento desbordante del nmero de
consumidores, la capacidad de compra del consumidor, la enorme demanda de productos,
la diversidad de productos en el mercado, la gran cantidad de servicios que se ofrecen en
todos los giros comerciales, la gran variedad de perfiles del consumidor moderno, la cada
vez mayor exigencia del cliente que demanda nuevos productos de mayor calidad, ms
funcionales, con mayor capacidad de resolucin, con mayor capacidad de respuesta y a
mejor precio, por todo esto y ms en la actualidad se estn creando grandes montaas de
datos, bases de datos de enorme tamao, millones de datos que se han estado
almacenando o que siguen almacenndose, cada da los cerros de informacin en forma
de datos numricos, han planteado a los investigadores y analistas de datos nuevos retos
para el manejo de los mismos y de su anlisis para luego extraer de ellos conocimiento,
sobre todo de la fuente que los gener, el consumidor.
Los mineros entran a las entraas de la tierra, en las montaas se abren camino entre las
rocas, tierra, arcilla, lodo, en busca de la esencia, el metal precioso hasta que encuentran la
veta de oro y plata de entre las toneladas de escombro, piedra y lodo, y extraen el material
realmente valioso.
De la misma manera, el analista entra a las montaas de datos en bsqueda de la esencia
de la informacin sobre las variables del problema. A diario se generan grandes cantidades
de datos dando lugar a inmensas bases de datos, que en su interior contienen informacin
muy valiosa, esencial para el descubrimiento del conocimiento que permita tomar
decisiones sobre el presente y futuro de las organizaciones.
Con la enormidad de las montaas de datos que actualmente se generan, ya no solo es
viable el uso de las tcnicas estadsticas tradicionales para su anlisis y bsqueda de
fundamentos como: probar hiptesis, el muestreo, la teora de lmite central, la teora de la
estimacin, la regresin, el anlisis de varianza, el diseo de experimentos.
Saga Falabella es una de las empresas ms grandes del Per y forma parte del Grupo
Falabella que agrupa las cadenas de tiendas por departamentos ms importantes de
Sudamrica, con presencia en Per, Chile, Argentina y Colombia. (5)
En el Per Falabella desarrolla su actividad comercial a travs de varias reas de
negocio, las principales son las tiendas por departamento. (5) Al cierre del presente trabajo
Saga Falabella cuenta con 19 tiendas, 9 de ellas en provincia y espera duplicar sus
operaciones para finales del ao 2015, para lo cual planea inaugurar durante dicho
periodo entre 15 y 20 tiendas ms.
250000
201059
200000
150000
100000
50000
64439
12771
17333
21452
2007
2008
2009
34773
0
2010
2011
2012
De lo dicho anteriormente en los ltimos aos, los datos grabados de la empresa Saga
Falabella en la base de datos han ido incrementndose considerablemente. Esta
informacin, de gran importancia estratgica para la empresa Saga Falabella, se accede
a travs del uso de tcnicas clsicas como son sentencias SQL y los procedimientos
almacenados. Por tal motivo existe demora en la recuperacin y el anlisis de la
informacin para la elaboracin de informes, formularios y reportes de gestin solicitados
por la alta direccin.
As es necesaria la utilizacin de mtodos analticos ms avanzados, como es la minera
de datos para la explotacin de datos con la finalidad de ayudar a los miembros de la alta
direccin a la toma de decisiones.
(2,4)
Explorar los datos que se encuentran en las profundidades de las bases de datos, como
los almacenes de datos, que algunas veces contienen informacin almacenada durante
varios aos.
Filtrado de datos: El formato de los datos contenidos en la fuente de datos (base de datos,
Data Warehouse) nunca es el idneo, y la mayora de las veces no es posible ni siquiera
utilizar ningn algoritmo de minera sobre los datos en bruto.
Mediante el preprocesado, se filtran los datos (de forma que se eliminan valores
incorrectos, no vlidos, desconocidos, segn las necesidades y el algoritmo a usar), se
obtienen muestras de los mismos (en busca de una mayor velocidad de respuesta del
proceso), o se reducen el nmero de valores posibles (mediante redondeo, clustering entre
otros).
(10)
Usar varias medidas de validez estadstica para determinar si existen problemas en los
datos o en el modelo.
Las herramientas grficas de precisin de modelos de Minera de datos que est disponible
en SQL Server Analysis Services, sirven para validar los modelos de minera de datos.
(14)
Las necesidades de la mercadotecnia actual tienen que ver con saber de antemano lo que el
cliente desea comprar y no simplemente los artculos que se considere conveniente
comercializar; organizar un sistema de distribucin que se acople a los hbitos del comprador y
no a los hbitos de la industria o empresa que genera o promueve el producto, as como tomar
decisiones de distribucin, sobre la base de retroalimentacin proveniente del lugar del mercado.
Se puede tener xito en la comercializacin si se proporciona al cliente lo que desea, en el lugar
adecuado, haciendo que se halle disponible y en la cantidad precisa que se necesite.
(14)
(13)
Un plan de mercadeo debe sustentarse en una investigacin de la situacin actual del mercado y
las tendencias que afectan el futuro de la organizacin. En particular, se deben evaluar los
problemas y las oportunidades que representan compradores, competidores, costos y cambios en
las regulaciones. Adicionalmente, se deben identificar las fortalezas y debilidades de la empresa
misma.
Con un anlisis completo de la situacin, quienes toman las decisiones deben entonces
establecer los objetivos que la empresa quiere alcanzar, de acuerdo a la evaluacin descrita
anteriormente.
(13)
En un plan de mercadeo se disean las estrategias sobre precio, plaza, producto y promocin,
que ayudarn a la empresa a alcanzar sus metas y objetivos.
-
(13)
Las estrategias de precios buscan atacar al mercado, con precios bajos, precios
similares o ms altos que la competencia, polticas de precios para ventas al contado o al
Las estrategias de plaza determinan los mejores canales y redes de distribucin, para
hacer llegar los productos al consumidor final.
Las estrategias de producto son aquellas que se ocupan de las caractersticas propias
del producto y del servicio. Dichas estrategias estn enfocadas en la calidad, sabor,
variedad y empaque de sus productos.
Todas estas estrategias tienen como objetivo estimular un crecimiento en la demanda, lo que trae
consigo un aumento en las ventas y finalmente un aumento en los niveles de produccin. (13)
3.1.2 Crear una vista al Data Source creado previamente que incluya la tabla
MaeCliente(dbo)
A continuacin definimos una vista de la base de datos Northwind que contiene los datos
especficos para nuestro anlisis y que viene dado por la tabla MaeCliente (Maestro de Clientes).
Item
Campos
Descripcin
Tipo de dato
1 cuenta
Cuenta
integer
2 tipo_identidad
integer
3 nro_identidad
integer
4 ap_paterno
Apellido paterno
varchar(50)
5 ap_materno
Apellido materno
varchar(50)
6 nombre
Nombres
varchar(50)
7 diredomi
Direccin domicilio
varchar(50)
8 dptodomi
Departamento domicilio
varchar(50)
9 diretrab
Direccin trabajo
varchar(50)
10 dptotrab
Departamento trabajo
varchar(50)
11 sexo
Sexo
12 estcivil
Estado civil
13 edad
Edad
14 condicion
Condicin habitacional
15 renta
Renta
integer
16 lin_credito
Lnea de crdito
integer
17 consumo
char(1)
varchar(11)
integer
varchar(10)
decimal(9,2)
Para este caso la variable a predecir es el estado civil, el cual tiene como estados
casado, conviviente, divorciado, separado y soltero. Adems presenta como variables de
entrada (input) a la condicin habitacional, el consumo, el distrito del domicilio, el distrito
del trabajo, la edad, la lnea de crdito, la renta y el sexo.
Esto nos determinar la ruta de los escenarios con mayor probabilidad de ocurrencias, en
que las transacciones de compras con tarjeta de crdito clsica en Saga Falabella en la
ciudad de Lima sean realizadas por los clientes de estado civil casado, conviviente,
divorciado, separado o soltero.
Resultados:
El modelo muestra que de todos los datos procesados la mayor probabilidad de ocurrencia para
la variable a predecir, esta en los clientes solteros con un 59.66% de ocurrencia en todos los
escenarios encontrados (93,349 escenarios), y le sigue los clientes casados con un 35.62% de
ocurrencias en todos los escenarios encontrados (55,731 escenarios).
La red de dependencias muestra que las variables que estan mas correlacionadas con la variable
a predecir, dicho de otro modo son aquellas variables que mas influyen en la determinacin del
valor de la variable a predecir. En nuestro caso el estado civil de nuestros clientes viene
determinado por su edad, sexo y condicin de vivienda.
Figura Nro. 10: Modelo final de minera de datos utilizando la tcnica de rboles de Decisiones
Fuente: Plataforma Minera de Datos
De acuerdo al anlisis del sistema el escenario conformado por clientes que tienen una edad
entre 27 a 35 aos y que habitan en casa de sus padres son los que con mayor probabilidad son
solteros y efectan compras con tarjeta de crdito clsica en las tiendas de Saga Falabella en la
ciudad de Lima.
Resultados:
El sistema permite que se seleccione la variable o campo con mayor densidad de ocurrencia
dentro de los grupos. Al seleccionar el sistema establece el o los grupos que tienen una mayor
densidad de ocurrencia de la variable seleccionada colorendolos con un tono ms intenso.
Figura Nro. 15: Modelo de minera de datos final utilizando la tcnica de Clustering
Fuente: Plataforma Minera de Datos
La variable a predecir es el estado civil, con el parmetro soltero. El grupo que tiene mayor
porcentaje de ocurrencias de esta variable y estado es el cluster Nro. 7 (SOLTERO: 90%).
En esta grfica podemos ver los niveles de probabilidad de ocurrencia de los distintos estados de
las variables de anlisis para el cluster elegido.
Como vemos efectivamente el nivel de probabilidad de la variable seleccionada (en este caso
estado civil = Soltero) tiene un nivel de probabilidad alta. En segundo lugar la condicin de
vivienda es la que tiene igualmente un alto nivel de probabilidad de ocurrencia para el
estado=D/Padres o casa de los padres, y as sucesivamente.
Resultados:
-
Del grfico la celda que contiene el valor de 31,737 indica el numero de verdaderos positivos
para el valor destino SOLTERO. En otras palabras, 31,737 casos el modelo predijo
correctamente que las transacciones de compras con tarjeta de crdito clsica en Saga
Falabella en la ciudad de Lima sean realizados por los clientes de estado civil soltero.
Adems la celda con valor 15,505 nos indica que 15,505 casos el modelo predijo
correctamente que las transacciones de compras con tarjeta de crdito clsica en Saga
Falabella en la ciudad de Lima sean realizados por los clientes de estado civil casado.
Existen valores errados como son 7,992 casos en que el modelo predijo como estado civil
casado pero que realmente era soltero, tambin existen 8,566 casos en que el modelo predijo
como estado civil soltero pero que realmente era casado.
CONCLUSIONES
El modelo rbol de decisin trabajado en la plataforma Microsoft SQL Server 2008 R2, nos
permiti construir rutas con mayores probabilidades que se dan para las transacciones de
compras con tarjeta de crdito clsica de los clientes en funcin al estado civil.
El modelo clustering trabajado en la plataforma Microsoft SQL Server 2008 R2, nos permiti
clasificar las variables que tienen un comportamiento recurrente o similar para asi poder
desarrollar estrategias de mercado conjunta.
Los modelos de validacin de las tcnicas de Minera de Datos aplicadas a las transacciones de
ventas con tarjeta de crdito clsica para Saga Falabella, mostraron un rendimiento ptimo. Tal es
el caso que en el grfico de elevacin el modelo se encuentra por encima del modelo aleatorio,
de la misma manera se encontr en la matriz de clasificacin que la relacin entre los valores
verdaderos positivos y los valores errados es mayor que 1.
Despus de analizar las transacciones de ventas con tarjeta de crdito clsica realizados en la
ciudad de Lima a travs de las tcnicas de Minera de Datos, podemos disear algunas
estrategias de mercado como son las estrategias de distribucin y de comunicacin:
- Enviar encartes o folletos especiales con las ofertas del mes, a los clientes de estado civil
soltero con mayor probabilidad de compras, cuya caracterstica presentan una edad de 27 a 35
aos y que habiten en la casa de sus padres.
- Ofrecer cupones o vales de descuentos a los clientes de estado civil soltero con mayor
probabilidad de compras, de los resultados obtenidos estos vales de descuentos se sugieren que
sean dirigidos a los padres de familia como son artefactos elctricos, decoraciones de la casa,
etc.
- Crear spots publicitarios de la empresa Saga Falabella en medios de comunicacin como radio
y/o televisin, para as llegar al agrupamiento que contiene el cluster Nro. 7 identificado en el
anlisis del presente trabajo.
Referencias
(1). Aluja, 2001. La Minera de Datos, entre la estadstica y la inteligencia artificial.
URL: http://www.idescat.cat/sort/questiio/questiiopdf/25.3.4.Aluja.pdf
(2). Biznews.pe. Diario digital de negocios
URL:http://biznews.pe/noticias-empresariales-nacionales/saga-falabella-incrementa-sus-ventas205-pero-cae-su-utilidad-neta
(3). Caldern, 2006. Minera de Datos una herramienta para la toma de decisiones
URL:http://biblioteca.usac.edu.gt/tesis/08/08_0307_CS.pdf
(4). Gestin. El diario de economa y negocios del Per
URL:http://gestion.pe/noticia/419695/saga-falabella-superaria-us-600-millones-ventas-este-ano
(5). La Empresa Saga Falabella
URL: http://cybertesis.upc.edu.pe/upc/2008/garcia_ck/pdf/garcia_ck-TH.3.pdf
(6).Perversi, 2007. Aplicacin de Minera de Datos para la exploracin y deteccin de
patrones delictivos en Argentina.
URL: http://ai.bpa.arizona.edu/research/coplink/index.htm
(7). Vallejos, 2006. Minera de Datos
URL:http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/Mineria_Datos_Vallejo
s.pdf
(8). SQL Server 2012
URL:http://msdn.microsoft.com/es-es/library/ms174493.aspx
(9).Business Intelligence y Data Warehousing en Windows, 2005
URL: http://www.danysoft.com/free/BIyDW.pdf
(10). La metodologa del Data Mining. Una aplicacin al consumo de alcohol en
adolescentes, 2008
URL: http://www.adicciones.es/files/65-80%20palmer.pdf