Beruflich Dokumente
Kultur Dokumente
MINERIA DE DATOS
Eldatamining(minera de datos), es el conjunto de tcnicas y tecnologas que
permiten explorar grandes bases de datos, de manera automtica o
semiautomtica, con el objetivo de encontrar patrones repetitivos, tendencias o
reglas que expliquen el comportamiento de los datos en un determinado contexto.
De forma general, los datos son la materia prima bruta. En el momento que el
usuario les atribuye algn significado especial pasan a convertirse en
informacin. Cuando los especialistas elaboran o encuentran un modelo,
haciendo que la interpretacin que surge entre la informacin y ese modelo
represente un valor agregado, entonces nos referimos al conocimiento. Vea
msdiferencias entre datos, informacin y conocimiento.
CARACTERISTICAS
Explorar los datos se encuentran en las profundidades de las bases de datos,
como los almacenes de datos, que algunas veces contienen informacin
almacenada durante varios aos.
En algunos casos, los datos se consolidan en un almacn de datos y en
mercados de datos; en otros, se mantienen en servidores de Internet e Intranet.
El entorno de la minera de datos suele tener una arquitectura cliente/servidor.
Las herramientas de la minera de datos ayudan a extraer el mineral de la
informacin enterrado en archivos corporativos o en registros pblicos,
archivados
El minero es, muchas veces un usuario final con poca o ninguna habilidad de
programacin, facultado por barrenadoras de datos y otras poderosas
herramientas indagatorias para efectuar preguntas adhoc y obtener rpidamente
respuestas.
Hurgar y sacudir a menudo implica el descubrimiento de resultados valiosos
e inesperados.
Las herramientas de la minera de datos se combinan fcilmente y pueden
analizarse y procesarse rpidamente.
Asociaciones.
Secuencias.
Clasificaciones.
Agrupamientos.
Pronsticos.
Herramientas
Algortmicas
Para crear un modelo, el algoritmo analiza primero los datos proporcionados, en busca de tipos
especficos de patrones o tendencias.
El algoritmo usa los resultados de este anlisis en un gran nmero de iteraciones para determinar los
parmetros ptimos para crear el modelo de minera de datos.
Existen dos herramientas de programacin muy utilizadas como lenguajes estas son:
Pseudocdig
o
Herramientas
Algortmicas
Diagramas
de flujo
DIAGRAMAS DE FLUJO.
PSEUDOCDIGO.
Otras herramientas
PROGRAMA.
Es un conjunto de instrucciones (rdenes) que guan a la computadora para
realizar alguna actividado resolver un problema.
LENGUAJE DE PROGRAMACIN.
RapidMiner
/ Yale:
Solucin que ofrece un entorno integrado para crear modelos de minera de datos y
trabajar con ellos.
Modelos
i. Clasificar clientes como los que estn en el grupo que responde a una
promocin con cierta probabilidad (o que la densidad de casos exitosos
est arriba de cierta densidad).
fundamentos y tcnicas.
Sin embargo en ocasiones los negocios nos demandan desarrollo mas rpidos
de los modelos.
Pre - requisitos
Paso 0: Partir los datos en los dos subconjuntos mencionados. Diremos que los
subconjuntos son conjunto de entrenamiento y conjunto de prueba.
Paso 1: Entrenar, - i.e. obtener los parmetros del modelo que hacen que
la V.O. se calcule en trminos de las variables de soporte,- uno o ms
modelos con el conjunto de entrenamiento.
Paso 0: Partir los datos en los dos subconjuntos mencionados. Diremos que los
subconjuntos son conjunto de entrenamiento y conjunto de prueba.
Paso 1: Entrenar, - i.e. obtener los parmetros del modelo que hacen que
la V.O. se calcule en trminos de las variables de soporte,- uno o ms
modelos con el conjunto de entrenamiento.
La bondad (de ajuste) del modelo tiene que ver con el objetivo de negocio
a obtener. Por ejemplo, maximizar utilidad, minimizar costo, o bien se define
una funcin de utilidad ad-hoc (no necesariamente monetaria).
ANLISIS
ESTADSTICO
MINERA
DE DATOS
2.
3.
4.
5.
2.
3.
4.
5.
6.
CASO PRACTICO #1
CASO PRACTICO #2
RAZON SOCIAL:
MISION:
VISION:
reas funcionales
Objetivos
Ayudar a mejorar el control de ventas
Clculos
y procesos simples
Optimizar
almacn)
Economizar
tiempos en la
administracin de la ventas
Cdigo
Descripcin
Tipo
Marca
Producto
existencia
ENTRADAS
BASE DE DATOS
HISTORIAL TICKET
Regresar