You are on page 1of 15

“AÑO DEL BUEN SERVICIO AL CIUDADANO”

UNIVERSIDAD CATÓLICA LOS ÁNGELES


CHIMBOTE

FACULTAD SISTEMAS

ESCUELA PROFECIONAL INGENIERIA DE SISTEMAS

VIII CICLO

INTELIGENCIA DE NEGOCIOS

MINERÍA DE DATOS
DATA MINING

COLONIA HERNÁNDEZ PEDRO JESÚS

BUENA VISTA BAJA MZVLT12

22/04/2018
COLONIA HERNÁNDEZ PEDRO JESÚS

MINERÍA DE DATOS

DATA MINING

Analiza los bienes o datos acumulados y extraer una cierta inteligencia o

comunicación del negocio.

CHIMBOTE– PERÚ

2018
DEDIATORIA

La presente investigación va dedicada a mis padres ya que por ellos puedo


tener los materiales para realizar mi investigación.
También va dedicada a todo el público en general el cual le interese la
investigación de tema DATA MINIG.
AGRADECIMIENTO

Agradecer a Dios y a Dios, por darme salud y por tener una cabeza con la que
puedo pensar muy bien y además un cuerpo sano y mente también.

Agradecer a mis seres queridos por el apoyo que se me da para seguir con mis
estudios a la vez les agradezco por darme apoyo moral y fuerzas para la
investigación y así poder desarrollar el trabajo de investigación.
Música »se escribe
de forma extraña pero
ilumina la vida.

Data Mining » se
escribe de forma
extraña pero ilumina el
negocio.
INDICE
DEDIATORIA ....................................................................................................................................... 3
AGRADECIMIENTO ........................................................................................................................... 4
RESUMEN ............................................................................................................................................ 7
INTRODUCTION ................................................................................................................................. 8
DATA MINING .................................................................................................................................... 9
LOS FUNDAMENTOS DEL DATA MINING .................................................................................. 10
VENTAJAS Y DESVENTAJAS AL USAR DATA MINING ........................................................... 11
ARQUITECTURA PARA DATA MINING ....................................................................................... 12
USO DE LA DATA MINING ............................................................................................................. 13
CONCLUSIONES ............................................................................................................................... 14
REFERENCIAS BIBLIOGRÁFICAS................................................................................................. 15
RESUMEN

Data Mining, la extracción de información oculta y predecible de grandes bases


de datos, es una poderosa tecnología nueva con gran potencial para ayudar a
las compañías a concentrarse en la información más importante de sus Bases
de Información (Data Warehouse).Las herramientas de Data Mining predicen
futuras tendencias y comportamientos, permitiendo en los negocios tomar
decisiones proactivas y conducidas por un conocimiento acabado de la
información (knowledge-driven). Los análisis prospectivos automatizados
ofrecidos por un producto así van más allá delos eventos pasados provistos por
herramientas retrospectivas típicas de sistemas de soporte de decisión. Las
herramientas de Data Mining pueden responder a preguntas de negocios que
tradicionalmente consumen demasiado tiempo para poder ser resueltas y a los
cuales los usuarios de esta información casi no están dispuestos a aceptar.
Estas herramientas exploran las bases de datos en busca de patrones ocultos,
encontrando información predecible que un experto no puede llegar a encontrar
porque se encuentra fuera de sus expectativas.

Palabras claves: extracción, análisis y dato


INTRODUCTION

Es una poderosa tecnología nueva con gran potencial para ayudar a las
compañías a concentrarse en la información más importante de sus Bases de
Información (Data Warehouse). La minería de datos (DM, Data Mining)
consiste en la extracción no trivial de información que reside de manera
implícita en los datos. Dicha información era previamente desconocida y
podrá resultar útil para algún proceso. En otras palabras, la minería de datos
prepara, sondea y explora los datos para sacar la información oculta en ellos.
Se utiliza en gran medida en diversas aplicaciones, como la comprensión del
marketing de los consumidores, el análisis de productos, la demanda y el
suministro, el comercio electrónico, la tendencia de inversión en acciones y
bienes raíces, las telecomunicaciones, etc. La minería de datos se basa en
algoritmos matemáticos y habilidades analíticas para impulsar los resultados
deseados de la enorme colección de bases de datos.

¿Con qué finalidad queremos generar información?


Son muchos los motivos que nos llevan a generar información, ya que nos
pueden ayudar a controlar, optimizar, administrar, examinar, investigar,
planificar, predecir, someter, negociar o tomar decisiones de cualquier
ámbito según el dominio en que nos desarrollemos. La información por sí
misma está considerada un bien patrimonial. De esta forma, si una empresa
tiene una pérdida total o parcial de información provoca bastantes perjuicios.
Es evidente que la información debe ser protegida, pero también explotada.
¿Qué nos ha permitido poder generar tanta información?
En los últimos años, debido al desarrollo tecnológico a niveles exponenciales
tanto en el área de cómputo como en la de transmisión de datos, ha sido
posible que se gestionen de una mejor manera el manejo y almacenamiento
de la información. Sin duda existen cuatro factores importantes que nos han
llevado a este suceso:

1. El abaratamiento de los sistemas de almacenamiento tanto temporal


como permanente.
2. El incremento de las velocidades de cómputo en los procesadores.
3. Las mejoras en la confiabilidad y aumento de la velocidad en la
transmisión de datos.
4. El desarrollo de sistemas administradores de bases de datos más
poderosos.
DATA MINING

La idea de data mining no es nueva. Ya desde los años sesenta los estadísticos
manejaban términos como data fishing, data mining o data archaeology con
la idea de encontrar correlaciones sin una hipótesis previa en bases de datos
con ruido. La minería de datos consiste en la extracción no trivial de
información que reside de manera implícita en los datos. Dicha información
era previamente desconocida y podrá resultar útil para algún proceso. En
otras palabras, la minería de datos prepara, sondea y explora los datos para
sacar la información oculta en ellos. A principios de los años ochenta,
Rakesh Agrawal, Gio Wiederhold, Robert Blum y Gregory Piatetsky-
Shapiro, entre otros, empezaron a consolidar los términos de data mining y
KDD.

El término descubrimiento de conocimiento en bases de datos (knowledge


discovery in databases, KDD para abreviar) se refiere al amplio proceso de
búsqueda de conocimiento en bases de datos, y para enfatizar la aplicación a
“alto nivel” de métodos específicos de minería de datos. En general, el
descubrimiento es un tipo de inducción de conocimiento, no supervisado,
que implica dos procesos: - búsqueda de regularidades interesantes entre los
datos de partida, - formulación de leyes que las describan.

Proceso KDD.
Pre-procesamiento de Datos: Limpieza, integración y transformación.

2. Minería de Datos: Uso de métodos inteligentes para extraer


conocimiento (búsqueda de oro).

3. Evaluación de patrones encontrados y presentación Los principales pasos


dentro del proceso interactivo e iterativo del KDD pueden verse en la
figura.
LOS FUNDAMENTOS DEL DATA MINING

Las técnicas de Data Mining son el resultado de un largo proceso de


investigación y desarrollo de productos. Esta evolución comenzó cuando los
datos de negocios fueron almacenados por primera vez en computadoras, y
continuó con mejoras en el acceso a los datos, y más recientemente con
tecnologías generadas para permitir a los usuarios navegar a través de los
datos en tiempo real. Data Mining toma este proceso de evolución más allá
del acceso y navegación retrospectiva de los datos, hacia la entrega de
información prospectiva y proactiva.

Data Mining está listo para su aplicación en la comunidad de negocios


porque está soportado por tres tecnologías que ya están suficientemente
maduras:

- Recolección masiva de datos.


- Potentes computadoras con multiprocesadores.
- Algoritmos de Data Mining.

En la evolución desde los datos de negocios a información de negocios, cada


nuevo paso se basa en el previo. Por ejemplo, el acceso a datos dinámicos es
crítico para las aplicaciones de navegación de datos, y la habilidad para
almacenar grandes bases de datos es crítica para Data Mining. Los
componentes esenciales de la tecnología de Data Mining han estado bajo
desarrollo por décadas, en áreas de investigación como estadísticas,
inteligencia artificial y aprendizaje de máquinas. Hoy, la madurez de estas
técnicas, junto con los motores de bases de datos relacionales de alta
performance, hizo que estas tecnologías fueran prácticas para los entornos
de data warehouse actuales.
VENTAJAS Y DESVENTAJAS AL USAR DATA MINING

Los análisis de datos mediante el Data Mining pueden aportar numerosas


ventajas a las empresas para la optimización de su gestión y tiempo, pero
también para la captación y fidelización de clientes, que les permitirá
aumentar sus ventas. Aquí te dejamos 8 ventajas que nos puede aportar.

1. Permite descubrir información que no esperábamos obtener. Esto se


debe a su funcionamiento con algoritmos, ya que permite hacer muchas
combinaciones distintas.
2. Es capaz de analizar bases de datos con una enorme cantidad de datos.
3. Los resultados son muy fáciles de interpretar y no es necesario tener
conocimientos en ingeniería informática.
4. Permite encontrar, atraer y retener clientes.
5. La empresa puede mejorar la atención al cliente a partir de la
información obtenida.
6. Da a las empresas la posibilidad de ofrecer a los clientes los productos o
servicios que necesitan.
7. Antes de usar los modelos, estos son comprobados mediante estadísticas
para verificar que las predicciones obtenidas son válidas.
8. Ahorra costes a la empresa y abre nuevas oportunidades de negocio.

Una de las desventajas es la dificultad que se presenta a la hora de recopilar


datos. Dependiendo del tipo de datos que se quieran recopilar, puede
conllevar mucho trabajo o la necesidad de tecnología de elevado costo.
Además, el pre-procesamiento de datos puede llevar demasiado tiempo y no
está asegurada la obtención de un modelo válido.
ARQUITECTURA PARA DATA MINING

Para aplicar mejor estas técnicas avanzadas, éstas deben estar totalmente
integradas con el data warehouse así como con herramientas flexibles e
interactivas para el análisis de negocios. Varias herramientas de Data Mining
actualmente operan fuera del warehouse, requiriendo pasos extra para
extraer, importar y analizar los datos. Además, cuando nuevos conceptos
requieren implementación operacional, la integración con el warehouse
simplifica la aplicación de los resultados desde Data Mining. El Data
warehouse analítico resultante puede ser aplicado para mejorar procesos de
negocios en toda la organización, en áreas tales como manejo de campañas
promocionales, detección de fraudes, lanzamiento de nuevos productos, etc.

Un servidor multidimensional OLAP permite que un modelo de negocios


más sofisticado pueda ser aplicado cuando se navega por el data warehouse.
Las estructuras multidimensionales permiten que el usuario analice los datos
de acuerdo a como quiera mirar el negocio - resumido por línea de producto,
u otras perspectivas claves para su negocio. El server de Data Mining debe
estar integrado con el data warehouse y el server OLAP para insertar el
análisis de negocios directamente en esta infraestructura.

Un avanzado, metadata centrado en procesos define los objetivos del Data


Mining para resultados específicos tales como manejos de campaña,
prospecting, y optimización de promociones. La integración con el data
warehouse permite que decisiones operacionales sean implementadas
directamente y monitoreadas. A medida que el data warehouse crece con
nuevas decisiones y resultados, la organización puede "minar" las mejores
prácticas y aplicarlas en futuras decisiones.
USO DE LA DATA MINING

La minería de datos puede contribuir significativamente en las aplicaciones


de administración empresarial basada en la relación con el cliente. En lugar
de contactar con el cliente de forma indiscriminada a través de un centro de
llamadas o enviando cartas, sólo se contactará con aquellos que se perciba
que tienen una mayor probabilidad de responder positivamente a una
determinada oferta o promoción. Por lo general, las empresas que emplean
minería de datos ven rápidamente el retorno de la inversión, pero también
reconocen que el número de modelos predictivos desarrollados puede crecer
muy rápidamente. En lugar de crear modelos para predecir qué clientes
pueden cambiar, la empresa podría construir modelos separados para cada
región y/o para cada tipo de cliente. También puede querer determinar qué
clientes van a ser rentables durante una ventana de tiempo y sólo enviar las
ofertas a las personas que es probable que sean rentables. Para mantener esta
cantidad de modelos, es necesario gestionar las versiones de cada modelo y
pasar a una minería de datos lo más automatizada posible.
CONCLUSIONES

Un Sistema Data Mining nos permite analizar factores de influencia en


determinados procesos, predecir o estimar variables o comportamientos
futuros, segmentar o agrupar ítems similares, además de obtener secuencias
de eventos que provocan comportamientos específicos.

La llegada del Data Mining se considera como la última etapa de la


introducción de métodos cuantitativos, científicos en el mundo del comercio,
industria y negocios. Desde ahora, todos los no-estadísticos -es decir el
99,5% de nosotros - pueden construir modelos exactos de algunas de sus
actividades, para estudiarlas mejor, comprenderlas y mejorarlas.

Dentro de sus funciones tenemos:

 Una tecnología emergente como la Minería de Datos, se presenta


como una herramienta de mucha aplicabilidad para la exploración y
explotación de información en grandes almacenes de datos.

 La correcta implementación de KDD permite la abstracción de


información útil de la base de datos, además muestra dicho
autoaprendizaje de una forma flexible, dinámica y clara.

 En aplicaciones o tareas que requieran una gran capacidad de


procesamiento de datos, KDD aparece como una opción que mejora
el desempeño de algoritmos dado que ofrece maneras eficientes de
almacenar, accesar y manipular datos.

 Existen diversas herramientas de minería de datos, orientadas a


estudios y usos diversos. Es necesario consultar a expertos en el área
para seleccionar la herramienta más adecuada para el problema de la
empresa.

 La minería de datos es de gran ayuda para dar solución a problemas


cotidianos del ser humano, mediante la recolección y análisis de datos
relevantes del entorno.
REFERENCIAS BIBLIOGRÁFICAS

1. Presser Carne, Cynthia. Data mining. Córdoba, AR: El Cid Editor |


apuntes, 2009. ProQuest ebrary. Web. 3 May 2017.Copyright ©
2009. El Cid Editor | apuntes. All rights reserved.

2. Palma, Claudio, Palma, Wilfredo, and Pérez, Ricardo. Data mining:


el arte de
anticipar. Santiago de Chile, CL: RIL editores, 2009. ProQuest
ebrary. Web. 3
May 2017.Copyright © 2009. RIL editores. All rights reserved.

3. López Porrero, Beatriz E., and Pérez Vázquez, Ramiro A.. Limpieza
de datos.
La Habana, CU: Editorial Feijóo, 2005. ProQuest ebrary. Web. 30
June 2017.
Copyright © 2005. Editorial Feijóo. All rights reserved.

4. Sánchez Montoya, Ricardo. Business intelligence (BI) - To BI or not


to BI.
Córdoba, AR: El Cid Editor | apuntes, 2009. ProQuest ebrary. Web.
30 June
2017.Copyright © 2009. El Cid Editor | apuntes. All rights reserved.

5. Torres Pérez, Isis. Integración de conocimiento mediante modelos


basados en
árboles de decisión. La Habana, CU: D - Instituto Superior
Politécnico José
Antonio Echeverría. CUJAE, 2010. ProQuest ebrary. Web. 30 June
2017.
Copyright © 2010. D - Instituto Superior Politécnico José Antonio
Echeverría.
CUJAE. All rights reserved.