Beruflich Dokumente
Kultur Dokumente
RESUMEN
Data mining a lo largo de la historia ha sido llamado de distintas
maneras. A partir de los aos sesenta los estadsticos utilizaban el
termino de data fishing (pesca de datos) o data dredging (filtracin
de datos) con la idea de encontrar correlaciones sin una hiptesis
previa en bases de datos con ruido.
Uno de los aspectos que se debe tener claro en el proceso KDD es
distinguir entre una tarea y un mtodo de minera de datos, existen
una serie delimitada de tareas descriptivas y predictivas las cuales
requieren mtodos, tcnicas o algoritmos, en este paper de
investigacin tocaremos solamente todo lo que concierne a los
mtodos
relacionales
estructurales
como
por
ejemplo
basado
relacionales,
distancia,
asociacin
en
grafos,
Aproximaciones
Arboles
de
relacionales,
Modelos
probabilsticos
relacionales
decisin
relacionales,
Induccin
de
basadas
Reglas
programas
en
de
lgico-
Claves:
mtodos
relacionales
estructurales,
Summary:
Data mining throughout history it has been called in different ways.
From the sixties that the statistical used the term data fishing data)
or data dredging (data leakage) with the idea of finding correlations
without a previous hypothesis in databases with noise.
One of the aspects that should be very clear in the KDD process is to
distinguish between a task and a method of data mining, there are a
defined series of descriptive and predictive tasks which require
methods, techniques or algorithms, in this research paper stringed
instruments only everything that affects the relational and structural
methods As for example inductive logic programming (ILP by its
acronym in English), learning based on graphs, probabilistic
relational models, approximations based on relational distance,
relational decision trees, association rules relational, induction
programs of logical-functional., which will be good for a work more
organized and systematized during the analysis and to validate the
results all this evaluating if what techniques to use for analysis.
trees,
association
rules
relational,
logical
induction
programs-functional
1. INTRODUCCION
Una de las partes de mayor variedad dentro de la obtencin de
conocimiento a partir de bases de datos es la que corresponde
a las tcnicas de mineras de datos, esto debido a muchas
caractersticas que pueden influir a la hora de tomar la
decisin, como el objetivo del proyecto, los tipos de variables
que influyen en este, limpieza de los mismos, entre muchos
otros que existen. Para esto se lleva a cabo un proceso de
extraccin de conocimiento como se puede observar en la
Figura 1.
Clasificacin
Estimacin de
nacin)
suave
Preferencias o
probabilidad
Categorizacin
Regresin
priorizacin
Correlaciones y
Reglas de
Factorizaciones
asociacin
Deteccin de
Dependencias
valores e
Funcionales
instancias
anmalas
Relacionales y
estructurales
Algebraicas y
estadisticas
Bayesianas
Basadas en
conteos de
frecuencias y
tablas de
contingencia
Arboles de
decisin y
sistemas de
aprendizaje de
reglas
redes
neuronales
artificiales
Ncleo y
mquinas de
soporte
vectorial
Estocsticas y
difusas
casos, en
densidad o
distancia
SI Duracin (Curso)
Si Duracin (Curso) <15 ENTONCES Seminario (Curso)
Poda tener una o varias condiciones A1, A2, ..., An, pero con
una nica conclusin B1. Por lo que si A1, A2, ..., An son
ciertas, se puede inferir que B1 es cierta. Horn tambin
demostr que cualquier problema que pueda expresarse en
forma lgica clausal se puede transformar en un conjunto de
clusulas de Horn2.
As, el ejemplo anterior de la paternidad, que presentaba
ambigedad, se deba haber escrito de la forma:
Y a la pregunta:
? Madre (X)
El sistema responder:
El sistema responder:
> X= Fernando, Esteban
Ramrez,
&
Ferri,
Mtodos
relacionales
del
ILP
es
que es
la
va
contraria
la
3.1.
Subsuncin
3.2.
10
3.3.
11
3.4.
12
ILP y Recursividad
4.1.
Aproximacin Directa
aunque
muchas
veces
13
es
necesario
un
pre
procesamiento inicial.
Muchas veces se trabaja sobre bases de datos relacionales,
cuyo primer paso es el de transformar los datos a un formato
textual que entienda el ILP. Esto puede ser muy difcil ya que
muchos lenguajes lgicos no utilizan tipificacin de variables,
algo que si existe en los lenguajes relacionales.
Cuando ya se tiene el sistema traducido, se dispone de
especificar las tareas.
Muchos sistemas solo pueden realizar una tarea a la vez. Si el
propsito es predictivo, se debe indicar cul es el predicado
principal. Si el propsito es descriptivo, se debe indicar el
atributo o argumento clave.
4.2.
veces
esto
es
preferible
ya
que
los
mtodos
14
tambin
son
tiles
para
sistemas
relacionales
estructurales.
5.1.
la
evidencia
deseada
transformada
en
una
15
basada
en
bsqueda
voraz:
buscan
la
solucin
ptima
es
mejor
que
la
encontrada
contrario,
se
deja
la
solucin
ptima
encontrada
anteriormente.
Aproximacin basada en ILP: Se puede utilizar ILP para
este mtodo, ya que muchas veces uno puede representar los
grafos en representacin de primer orden, as como tener
conocimiento de base almacenado previamente para poder
resolver problemas de forma ms rpida.
Aproximacin basada en bases de datos inductivas:
Simplemente se almacena los subgrafos encontrados en una
base de datos inductivas para luego ser utilizados.
Aproximacin basada en la teora de grafos: Bsicamente
lo que se pretende con este tipo de aproximacin es el de
iniciar con grafos comunes, iniciando con alguno que tenga
solo un vrtice, y luego ir aumentando los vrtices, para ir
encontrando los patrones requeridos.
Aproximacin basada en funciones de ncleo: Ms que
trabajar sobre el grafo en s, realmente este utiliza la
informacin de los enlaces y de los vrtices, para encontrar un
origen en comn (ncleo) entre los distintos grafos a analizar.
5.2.
16
5.4.
5:
Ejemplo
de
rbol
de
decision
5.5.
17
representa
el
resultado
de
la
funcin.
(Predicado
6. Conclusiones
Los mtodos relacionales y estructurales son ms tiles para
problemas donde existe una gran variedad de estructuras y
relacin entre ellas, como anlisis de molculas.
18
19
7. Referencias y Linkografia
Por Francisco Jose Correa Zabala , Departamento de
Sistemas
Informatica
Computacion
Universidad