Sie sind auf Seite 1von 6

FACULTAD DE INGENIERIA

ESCUELA PROFESIONAL DE INGENIERIA DE


SISTEMAS

CURSO: GESTION DE ERP

DOCENTE: EPIFANIA HUERTA ANDRES

ALUMNO: ACERO ACOSTA RONALD

CICLO: IX

CHIMBOTE – 2018
DATA MINING – MINERÍA DE DATOS

El datamining (minería de datos), es el conjunto de técnicas y tecnologías que permiten


explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo
de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento
de los datos en un determinado contexto.

Básicamente, el datamining surge para intentar ayudar a comprender el contenido de un


repositorio de datos. Con este fin, hace uso de prácticas estadísticas y, en algunos casos,
de algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales.

BENEFICIOS

• Permite descubrir información que no esperábamos obtener. Esto se debe a su


funcionamiento con algoritmos, ya que permite hacer muchas combinaciones
distintas.
• Es capaz de analizar bases de datos con una enorme cantidad de datos.
• Los resultados son muy fáciles de interpretar y no es necesario tener
conocimientos en ingeniería informática.
• Permite encontrar, atraer y retener clientes.
• La empresa puede mejorar la atención al cliente a partir de la información
obtenida.
• Da a las empresas la posibilidad de ofrecer a los clientes los productos o servicios
que necesitan.
• Antes de usar los modelos, estos son comprobados mediante estadísticas para
verificar que las predicciones obtenidas son válidas.
• Ahorra costes a la empresa y abre nuevas oportunidades de negocio.

PROCESO DEL DATA MINING

✓ Determinación de los objetivos. Trata de la delimitación de los objetivos que el


cliente desea bajo la orientación del especialista en data mining.
✓ Preprocesamiento de los datos. Se refiere a la selección, la limpieza, el
enriquecimiento, la reducción y la transformación de las bases de datos. Esta etapa
consume generalmente alrededor del setenta por ciento del tiempo total de un
proyecto de data mining.
✓ Determinación del modelo. Se comienza realizando unos análisis estadísticos de
los datos, y después se lleva a cabo una visualización gráfica de los mismos para
tener una primera aproximación. Según los objetivos planteados y la tarea que
debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes
áreas de la Inteligencia Artificial.
✓ Análisis de los resultados. Verifica si los resultados obtenidos son coherentes y
los coteja con los obtenidos por los análisis estadísticos y de visualización gráfica.
El cliente determina si son novedosos y si le aportan un nuevo conocimiento que
le permita considerar sus decisiones.
ÁREAS DE APLICACIÓN

Existen numerosas áreas donde la minería de datos se puede aplicar, prácticamente en


todas las actividades humanas que generen datos:

➢ Comercio y banca: Segmentación de clientes, previsión de ventas, análisis de


riesgo.
➢ Medicina y Farmacia: Diagnóstico de enfermedades y la efectividad de los
tratamientos.
➢ Seguridad y detección de fraude: Reconocimiento facial, identificaciones
biométricas, accesos a redes no permitidos, etc.
➢ Recuperación de información no numérica: Minería de texto, minería web,
búsqueda e identificación de imagen, video, voz y texto de bases de datos
multimedia.
➢ Astronomía: Identificación de nuevas estrellas y galaxias.
➢ Geología, minería, agricultura y pesca: Identificación de áreas de uso para
distintos cultivos o de pesca o de explotación minera en bases de datos de
imágenes de satélites.
➢ Ciencias Ambientales: Identificación de modelos de funcionamiento de
ecosistemas naturales y/o artificiales para mejorar su observación, gestión y/o
control.
➢ Ciencias Sociales: Estudio de los flujos de la opinión pública. Planificación de
ciudades: identificar barrios con conflicto en función de valores
sociodemográficos, etc.
TÉCNICAS DEL DATA MINING

Las técnicas de la minería de datos provienen de la inteligencia artificial y de la


estadística, dichas técnicas, no son más que algoritmos, más o menos sofisticados que se
aplican sobre un conjunto de datos para obtener unos resultados.

Las técnicas más representativas son:

• Redes neuronales: Son un paradigma de aprendizaje y procesamiento automático


inspirado en la forma en que funciona el sistema nervioso de los animales. Se trata
de un sistema de interconexión de neuronas en una red que colabora para producir
un estímulo de salida.
• Regresión lineal: Es la más utilizada para formar relaciones entre datos. Rápida
y eficaz pero insuficiente en espacios multidimensionales donde puedan
relacionarse más de 2 variables.
• Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado
en el ámbito de la inteligencia artificial y el análisis predictivo, dada una base de
datos se construyen estos diagramas de construcciones lógicas, muy similares a
los sistemas de predicción basados en reglas, que sirven para representar y
categorizar una serie de condiciones que suceden de forma sucesiva, para la
resolución de un problema.
• Modelos estadísticos: Es una expresión simbólica en forma de igualdad o
ecuación que se emplea en todos los diseños experimentales y en la regresión para
indicar los diferentes factores que modifican la variable de respuesta.
• Agrupamiento o Clustering: Es un procedimiento de agrupación de una serie de
vectores según criterios habitualmente de distancia; se tratará de disponer los
vectores de entrada de forma que estén más cercanos aquellos que tengan
características comunes.
• Reglas de asociación: Se utilizan para descubrir hechos que ocurren en común
dentro de un determinado conjunto de datos.
PROTOCOLO DE UN PROYECTO DE MINERÍA DE DATOS

Un proyecto de minería de datos tiene varias fases necesarias que son, esencialmente:

 Comprensión: del negocio y del problema que se quiere resolver.


 Determinación, obtención y limpieza: de los datos necesarios.
 Creación de modelos matemáticos.
 Validación, comunicación: de los resultados obtenidos.
 Integración: si procede, de los resultados en un sistema transaccional o similar.

La relación entre todas estas fases sólo es lineal. En realidad, es mucho más compleja y
esconde toda una jerarquía de subfases. A través de la experiencia acumulada en
proyectos de minería de datos se han ido desarrollando metodologías que permiten
gestionar esta complejidad de una manera más o menos uniforme.

Das könnte Ihnen auch gefallen