Beruflich Dokumente
Kultur Dokumente
com
Para ver trabajos similares o recibir informacin semanal sobre nuevas publicaciones, visite www.monografias.com
www.monografias.com
Para ver trabajos similares o recibir informacin semanal sobre nuevas publicaciones, visite www.monografias.com
www.monografias.com
Cabe resaltar que los efectos sobre la eficiencia de los resultados en la Minera de Datos como apoyo a la
toma de decisiones est generando miles de opiniones desde diferentes perspectivas, entre ellas se puede
destacar: la imposibilidad de encontrar conclusiones nicas referentes a la evaluacin de un resultado
obtenido con esta tcnica. Sin embargo, la consecuencia de los datos arrojados es interesante, por algo
ms que su precisin.
En el siguiente artculo se realiz un anlisis de la aplicacin del Data Mining en los negocios, haciendo
nfasis en cuatro indicadores propuestos por los autores, Castaeda y Rodrguez (2003), los cuales
esbozan el atractivo que ofrece la Minera de Datos en la implementacin de las actividades de negocio:
tales como la bondad, aplicabilidad, la relevancia y la novedad; indicadores que aportan una idea de las
implicaciones y utilidades que proporciona esta prctica.
a) Indicadores de la bondad del resultado
Los ndices de bondad de resultado tratan de aportar una idea acerca del error que se comete al emplear un
modelo para realizar una tarea. Tal como manifiestan Padmanabhan y Tuzhilin (1999), sta es una medida
de la fortaleza estadstica del resultado. Para este indicador se utilizan las siguientes medidas: Precisin,
Ratio de error, Varianza y Matriz de confusin, siendo las dos ltimas derivaciones de las anteriores. La
precisin se utiliza cuando el resultado se presenta en forma de clasificacin o estimacin, la cual se mide a
travs del porcentaje de predicciones que son correctas. Para efectos de la clasificacin, se emplea el
porcentaje de casos bien clasificados y para la estimacin del porcentaje de registros, se emplea una
estimacin que el decisor considere correcta. Para medir la precisin se puede emplear el coeficiente de
confianza, el cual no es ms que la probabilidad condicionada de un hecho con respecto a otro.
La distancia es otra tcnica de Minera de Datos empleada cuando se disponen de variables continuas y
numricas, mediante la raz cuadrada de la suma al cuadrado de las distancias en cada eje. Una medida
que complementa a la precisin es el Ratio de error, que mide el porcentaje de casos en los que el resultado
no coincide con la realidad.
b) Indicadores de relevancia del resultado
Los indicadores ms representativos en este grupo son el Coeficiente de cobertura, el Coeficiente de apoyo
y el Coeficiente de significacin. Estos indicadores tienen que ver directamente con la importancia que tiene
el resultado arrojado por las tcnicas de minera y miden la aportacin a la situacin actual y la frecuencia
de utilidad del resultado, cuando la presentacin de stos se hace en forma de reglas.
El Coeficiente de cobertura mide el porcentaje de registros en los cuales se puede aplicar la regla. Por otro
lado, el Coeficiente de apoyo permite mostrar el porcentaje de ocasiones en que globalmente aparece la
relacin descrita por la regla, se recomienda representar el resultado en porcentaje. Por ltimo, el
Coeficiente de significacin sirve para medir el grado de importancia de la regla a travs de la aportacin
que supone respecto a la pura probabilidad.
c) Indicadores de novedad del resultado
Cuando la informacin es excesivamente abundante y obvia, puede presentarse el problema al generar
reglas. Para ello, existe el Coeficiente de novedad, creado para indicar si una regla es interesante o no en
funcin del nmero de reglas ya generadas, para un rea de conocimiento concreta. Su objetivo es ayudar a
evitar las redundancias en su obtencin. Autores como Buchner et al. (1999), entre otros, abogan por la
inclusin del conocimiento previo del negocio, e intuicin que detentan las decisiones para de esta manera:
restringir el espacio de bsqueda, obtener conocimiento ms preciso y eliminar aqul que resulte no
interesante.
d) Indicadores de aplicabilidad del resultado
La dinmica de las organizaciones actuales demanda cada vez ms, tiempos de respuesta ms rpidos, por
lo cual es necesario que tanto la creacin o generacin de modelos como los resultados del mismo, deben
estar disponibles en el menor tiempo posible. Para lograr esto, hay que buscar la simplicidad de los modelos
y de la forma de representar la salida o resultados del anlisis, para transformar el conocimiento obtenido y
poder aplicarlo al negocio; para lograr esto, se cuenta con el Coeficiente de Simplicidad, la Tasa Interna de
Retorno y el Valor Actual Neto.
Ejemplo 4
www.monografias.com
Para ver trabajos similares o recibir informacin semanal sobre nuevas publicaciones, visite www.monografias.com
www.monografias.com
exploracin de los datos, con el objetivo de proporcionar un mayor conocimiento del sitio web. La
Visualizacin de la Informacin es la disciplina que estudia el uso de representaciones interactivas de datos
abstractos para mejorar su entendimiento.
Sistema desarrollado
El sistema creado en el marco de este proyecto se encarga de recolectar la informacin de Internet
mediante un robot que captura todas las pginas existentes en la web de Zaragoza, siguiendo todos los
enlaces de sta y obteniendo as su estructura; y mediante un analizador semntico de los ficheros log para
analizar el comportamiento de los usuarios. Un fichero log es un fichero existente en el servidor web que
almacena cada una de las peticiones que hacen los usuarios al servidor. Una peticin se genera cada vez
que un usuario pincha en un enlace, o escribe una direccin en el navegador.
De este modo, el sistema generar representaciones visuales basadas en la informacin extrada del
proceso de minera de datos web, permitiendo un profundo anlisis de esa informacin y as entender mejor
los patrones de comportamiento de los ciudadanos dentro de la web. Ese anlisis permitir una mejor toma
de decisiones para poder ofrecer un mejor servicio.
Los principales objetivos del sistema son:
Desarrollar una herramienta que permita analizar el sitio web de Zaragoza
Crear un sistema de Minera Web que extraiga el mayor nmero de mtricas o indicadores relativos
a la web
Analizar distintos tipos de visualizaciones que permitan representar toda la informacin recolectada,
y la implementacin de las que ms se ajusten al problema
Crear una interfaz de usuario interactiva que permita explotar al mximo las capacidades visuales
del sistema, y as, permitir un mayor entendimiento de los mismos
Primer prototipo
Actualmente se ha desarrollado un primer prototipo funcional del sistema.
Esta captura de pantalla muestra una parte de la web de Ayuntamiento de Zaragoza. Cada objeto de la
imagen con forma corresponde a una pgina de la web accesible des de Internet, mientras que las lneas
que los juntan corresponden a enlaces entre ellas. Cada color y forma est relacionado con valores
extrados de los ficheros log, y son asignados mediante un men por parte del usuario del sistema. En la
imagen mostrada anteriormente, se pueden visualizar al mismo tiempo tres valores:
Nmero de visitas: el nmero de veces que cada una de las pginas ha sido visualizada por un
usuario. En la imagen, cuanto ms visitada ha sido una pgina, mayor es su tamao, y su color es
ms azulado.
Ranking en buscadores: la forma de cada pgina est asociado al valor interno que le ha asignado
el motor de bsqueda Google. De este modo, sabemos que la estrella tiene un ranking en Google
muy alto, y por lo tanto, esa pgina saldr en las posiciones ms altas de Google cuando un usuario
la busque. Los hexgonos son pginas con menos ranking, seguido de los tringulos.
Nmero de enlaces salientes: en la imagen, se puede apreciar que cada pgina tiene un color
asignado a su borde. Ese color corresponde al nmero de enlaces que contiene esa web. Identificar
fcilmente las pginas con muchos enlaces es una tarea de alta importancia, ya que ests pginas
sirven de ?punto de entrada? al sitio web. Descubrir que una pgina contiene muchos enlaces, y
que adems es muy visitada implica deducir, que todos los usuarios que vistan esta pgina podrn
acceder a ms contenidos de forma sencilla, lo cual corrobora el buen diseo de la web.
Otras mtricas o valores han sido extrados de los ficheros log, que siempre pueden ser visualizados por
parte del usuario de la aplicacin con el atributo visual (color, forma o color del borde) que el desee.
Referencia bibliogrfica
http://www.zaragoza.es/ciudad/conocimiento/mineria.htm
Autora:
Miriam Cecilia Moreno Lujn
mairim_1729@hotmail.com
Semestre: VIII
ING. RICARDO BUSTAMANTE.
Para ver trabajos similares o recibir informacin semanal sobre nuevas publicaciones, visite www.monografias.com