Sie sind auf Seite 1von 5

www.monografias.

com

5 Ejemplos de la aplicacin de la minera de datos


Miriam Cecilia Moreno Lujn - mairim_1729@hotmail.com
1.
2.
3.
4.

Aplicaciones de la Minera de Datos para recuperar informacin


Implantacin de la Minera de Datos para Recuperar Informacin
El tratamiento de los datos para la toma de decisiones en las actividades de negocio
La rentabilidad econmica de las empresas a travs de los procesos minera de datos, como
herramienta inteligente competitiva
5. Zaragoza Ciudad del Conocimiento Minera de Datos
Ejemplo 1

Aplicaciones de la Minera de Datos para recuperar


informacin
En la actualidad, la implantacin de la Minera de Datos para recuperar informacin en las diversas
organizaciones (bibliotecas y centros de documentacin) as como en el mbito empresarial es una tcnica
habitual.
Tradicionalmente, quienes ms han empleado las tcnicas de la Minera de Datos para recuperar
informacin han sido las relacionadas con la publicidad y con los negocios de la distribucin. Sin embargo,
existen multitud de reas que han integrado en su actividad las tcnicas de la Minera de Datos para
Recuperar
Informacin
Destacan, entre las reas que utilizan la Minera de Datos para recuperar informacin, las siguientes:
1. Econmicas
o Uso fraudulento de tarjetas de crdito
o Clculo de indicadores financieros
o Anlisis de riesgos de crdito
2. Educacin
3. Procesos Industriales
o Modelos de calidad
o Extraccin de modelos de coste
o Prediccin de fallos y accidentes
4. Medicina
o Gestin hospitalaria
o Mejorar el uso de consultas, habitaciones y salas
o Recomendacin de frmacos
o Anlisis de procedimientos mdicos solicitados
5. Biologa y dems ciencias afines
o Anlisis de los genes
o Anlisis de protenas
6. Telecomunicaciones
o Modelos de carga en redes
o Establecimiento de patrones de llamadas
7. Turismo
o Indentificar patrones de reserva
8. Trfico
o Establecimiento de cmaras, GPS...
9. Poltica
o Diseo de campaas
Referencia bibliogrfica
polticashttp://es.oocities.com/mineria.datos/aplicaciones.htm
Ejemplo 2

Para ver trabajos similares o recibir informacin semanal sobre nuevas publicaciones, visite www.monografias.com

www.monografias.com

Implantacin de la Minera de Datos para Recuperar


Informacin
Para poder implantar con xito un programa de Minera de Datos para recuperar informacin hay que tener
en cuenta una serie de factores clave:
1. Especificar claramente los problemas y objetivos de la organizacin. De esta forma se pueden
conocer los datos necesarios para poder elaborar dicha Minera de Datos para recuperar
informacin
2. Trasladar correctamente los objetivos de la organizacin a los objetivos propiamente de la Minera
de Datos para recuperar informacin. Si ambos objetivos se corresponden, esto indica que la
Minera de Datos para recuperar informacin se est llevando a cabo de forma adecuada
3. La integracin del resto de los programas con la organizacin en la cual se va a llevar a cabo la
Minera de Datos para recuperar informacin
4. La calidad de los datos es esencial
5. Uso de herramientas integradas y entornos amigables, destacando principalmente la informatizacin
del proceso en todos los niveles, principalmente la comunicacin entre los miembros del grupo en el
cual se va a instalar la Minera de Datos para recuperar informacin, como en la documentacin que
va a ser generada
6. Necesidad de que los componentes del grupo de la propia organizacin en la que se va a implantar
la Minera de Datos para recuperar informacin, est formada en disciplinas que integren la propia
Minera de Datos para recuperar informacin como en estadstica, por ejemplo
7. Evaluacin de los modelos holsticos relativos a la implantacin de la toma de decisiones en la
organizacin en materia de Minera de Datos para recuperar informacin
Referencia bibliogrfica
http://es.oocities.com/mineria.datos/aplicaciones.htm
Ejemplo 3

El tratamiento de los datos para la toma de decisiones en las


actividades de negocio
Desde un punto de vista ms pragmtico y asocindolo directamente a las Actividades de Negocios, la
Minera de Datos es el conjunto de metodologas, aplicaciones y tecnologas que permiten reunir, depurar y
transformar datos de los sistemas transaccionales e informacin no estructurada (interna y externa a la
compaa) en informacin estructurada, para su explotacin directa o para su anlisis y conversin en
conocimiento y as dar soporte a la toma de decisiones sobre el negocio. Ahora bien, Piatesky-Shapiro
(1991) destacan que desde un punto de vista ms terico, la Minera de Datos se define como el proceso
completo de extraccin de informacin, que se encarga adems de la preparacin de los datos y de la
interpretacin de los resultados obtenidos, a travs de grandes cantidades de datos, posibilitando de esta
manera el encuentro de relaciones o patrones entre los datos procesados.
Por su parte, Molina y Garca (2004) explican que los datos tal cual se almacenan en las bases de datos no
suelen proporcionar beneficios directos; su valor real reside en la informacin que podamos extraer de ellos,
es decir, informacin que nos ayude a tomar decisiones o a mejorar la comprensin de los fenmenos que
nos rodean.
Ejemplos de ello pueden ser: contrastar que todo va bien, analizar diferentes aspectos de la evolucin de la
empresa, presentar informacin de forma ms intuitiva, comparar informacin en diferentes perodos de
tiempo, comparar resultados con previsiones, identificar comportamientos y evoluciones excepcionales,
confirmar o descubrir tendencias e interrelaciones, entre otras acciones.
Para tal efecto, se deben definir medidas cuantitativas para los patrones obtenidos (precisin, utilidad y
beneficio obtenido), para establecer medidas de inters que consideren la validez y simplicidad de los
patrones obtenidos mediante alguna de las tcnicas de Minera de Datos.
El objetivo final de todo esto es incorporar el conocimiento obtenido en algn sistema real, tomar decisiones
a partir de los resultados alcanzados, o simplemente registrar la informacin conseguida y suministrrsela a
quien est interesado.

Para ver trabajos similares o recibir informacin semanal sobre nuevas publicaciones, visite www.monografias.com

www.monografias.com

Cabe resaltar que los efectos sobre la eficiencia de los resultados en la Minera de Datos como apoyo a la
toma de decisiones est generando miles de opiniones desde diferentes perspectivas, entre ellas se puede
destacar: la imposibilidad de encontrar conclusiones nicas referentes a la evaluacin de un resultado
obtenido con esta tcnica. Sin embargo, la consecuencia de los datos arrojados es interesante, por algo
ms que su precisin.
En el siguiente artculo se realiz un anlisis de la aplicacin del Data Mining en los negocios, haciendo
nfasis en cuatro indicadores propuestos por los autores, Castaeda y Rodrguez (2003), los cuales
esbozan el atractivo que ofrece la Minera de Datos en la implementacin de las actividades de negocio:
tales como la bondad, aplicabilidad, la relevancia y la novedad; indicadores que aportan una idea de las
implicaciones y utilidades que proporciona esta prctica.
a) Indicadores de la bondad del resultado
Los ndices de bondad de resultado tratan de aportar una idea acerca del error que se comete al emplear un
modelo para realizar una tarea. Tal como manifiestan Padmanabhan y Tuzhilin (1999), sta es una medida
de la fortaleza estadstica del resultado. Para este indicador se utilizan las siguientes medidas: Precisin,
Ratio de error, Varianza y Matriz de confusin, siendo las dos ltimas derivaciones de las anteriores. La
precisin se utiliza cuando el resultado se presenta en forma de clasificacin o estimacin, la cual se mide a
travs del porcentaje de predicciones que son correctas. Para efectos de la clasificacin, se emplea el
porcentaje de casos bien clasificados y para la estimacin del porcentaje de registros, se emplea una
estimacin que el decisor considere correcta. Para medir la precisin se puede emplear el coeficiente de
confianza, el cual no es ms que la probabilidad condicionada de un hecho con respecto a otro.
La distancia es otra tcnica de Minera de Datos empleada cuando se disponen de variables continuas y
numricas, mediante la raz cuadrada de la suma al cuadrado de las distancias en cada eje. Una medida
que complementa a la precisin es el Ratio de error, que mide el porcentaje de casos en los que el resultado
no coincide con la realidad.
b) Indicadores de relevancia del resultado
Los indicadores ms representativos en este grupo son el Coeficiente de cobertura, el Coeficiente de apoyo
y el Coeficiente de significacin. Estos indicadores tienen que ver directamente con la importancia que tiene
el resultado arrojado por las tcnicas de minera y miden la aportacin a la situacin actual y la frecuencia
de utilidad del resultado, cuando la presentacin de stos se hace en forma de reglas.
El Coeficiente de cobertura mide el porcentaje de registros en los cuales se puede aplicar la regla. Por otro
lado, el Coeficiente de apoyo permite mostrar el porcentaje de ocasiones en que globalmente aparece la
relacin descrita por la regla, se recomienda representar el resultado en porcentaje. Por ltimo, el
Coeficiente de significacin sirve para medir el grado de importancia de la regla a travs de la aportacin
que supone respecto a la pura probabilidad.
c) Indicadores de novedad del resultado
Cuando la informacin es excesivamente abundante y obvia, puede presentarse el problema al generar
reglas. Para ello, existe el Coeficiente de novedad, creado para indicar si una regla es interesante o no en
funcin del nmero de reglas ya generadas, para un rea de conocimiento concreta. Su objetivo es ayudar a
evitar las redundancias en su obtencin. Autores como Buchner et al. (1999), entre otros, abogan por la
inclusin del conocimiento previo del negocio, e intuicin que detentan las decisiones para de esta manera:
restringir el espacio de bsqueda, obtener conocimiento ms preciso y eliminar aqul que resulte no
interesante.
d) Indicadores de aplicabilidad del resultado
La dinmica de las organizaciones actuales demanda cada vez ms, tiempos de respuesta ms rpidos, por
lo cual es necesario que tanto la creacin o generacin de modelos como los resultados del mismo, deben
estar disponibles en el menor tiempo posible. Para lograr esto, hay que buscar la simplicidad de los modelos
y de la forma de representar la salida o resultados del anlisis, para transformar el conocimiento obtenido y
poder aplicarlo al negocio; para lograr esto, se cuenta con el Coeficiente de Simplicidad, la Tasa Interna de
Retorno y el Valor Actual Neto.
Ejemplo 4

La rentabilidad econmica de las empresas a travs de los


procesos minera de datos, como herramienta inteligente
competitiva
Para ver trabajos similares o recibir informacin semanal sobre nuevas publicaciones, visite www.monografias.com

www.monografias.com

Es innegable que organizaciones comerciales, analistas de inversiones, entidades de crdito y dems


usuarios especializados, cada vez solicitan ms informacin sobre la rentabilidad de todas las actividades
de negocio de la organizacin. Estn capacitados los solicitantes para procesar correctamente todo ese
recurso de datos, cada vez ms voluminoso y complejo?
Nos inclinamos a pensar que no, por la siguiente razn: El volumen creciente de datos a que se enfrentan
los usuarios, especialmente aquellos especializados en economa, finanzas y marketing, est haciendo que
la sobrecarga informativa convierta los datos en una masa en la cual no es posible ver con claridad los
mbitos y complejos procesos de la situacin y perspectivas de la empresa. Ante este panorama nos
preguntamos Qu medidas pueden adoptarse? Cabe indicar que los avances tecnolgicos han conducido
a un mundo complejo y cambiante, pero contradictoriamente es una fuente de soluciones.
Siguiendo en el mismo orden de ideas, se resalta que la Minera de Datos o explotacin de datos ha
revolucionado y potenciado las bases de datos tradicionales, pues permite identificar mediante la aplicacin
automtica de algoritmos recursivos, las variables ms relevantes para una decisin concreta o los
subconjuntos de entidades (empresas, clientes, entre otros) ms homogneos con arreglo a unas
caractersticas determinadas.
Otro importante hecho que describen Molina y Garca (2004) es que con la implementacin de procesos de
Minera de Datos, a travs de la aplicacin de algunas tcnicas estadsticas avanzadas y nuevos mtodos
de extraccin de conocimiento en grandes base de datos, se pueden determinar las caractersticas
contables de las empresas ms rentables, al igual que el perfil de sus clientes. Se hace imprescindible, por
un lado, un anlisis exploratorio profundo de la base de datos y el empleo de mtodos robustos, que hagan
que dichos componentes sean menos sensibles a los amplios casos estadsticos. Por otro lado, es
aconsejable disear con base a opiniones de expertos, si no hay informacin adecuada, o utilizar algn
sistema de aprendizaje, por ejemplo, la utilizacin de redes neuronales, para el descubrimiento de patrones
y extraer la informacin de la base de datos disponible.
En fin, estos mtodos y procedimientos se han convertido en retos tecnolgicos para procesar los datos y
convertirlos en conocimiento til para la toma de decisiones. Este camino se presenta como una opcin para
las organizaciones que quieran ser competitivas, valindose de la experiencia acumulada, la cual sin duda
alguna constituye el principal activo del que se dispone para la creacin de valor. De esta manera, una
organizacin que reflexiona, documenta y aprende, est en condiciones de innovar y obtener ventajas
competitivas.
NOTA: Los ejemplos 3 y 4 fueron extrados de la misma referencia bibliogrfica
Referencia bibliogrfica
http://www.scielo.org.ve/scielo.php?pid=S1012-15872007000100008&script=sci_arttext
Ejemplo 5

Zaragoza Ciudad del Conocimiento Minera de Datos


Introduccin
El Ayuntamiento de Zaragoza est participando en un proyecto de investigacin, conjuntamente con la
Universitat Pompeu Fabra de Barcelona, en el que se pretende desarrollar una herramienta que utilice
tcnicas de Visualizacin de la Informacin a los datos recolectados mediante un sistema de Minera Web.
La Minera Web es el proceso de descubrir la informacin o conocimiento potencialmente til y previamente
desconocido a partir de datos web. Existen tres tipos de minera web:
Minera de la estructura web: es el tipo de minera que se encarga de analizar como estn
estructurados los documentos y como estn enlazados.
Minera del contenido web: es el tipo de minera que se encarga de analizar el contenido que se
encuentra en cada una de las pginas que se encuentran en un sitio web.
Minera del uso web: es el tipo de minera que interpreta el comportamiento de los usuarios
analizando los ficheros log del sitio.
Las tcnicas de minera generan una serie de valores o mtricas que cuantifican la informacin contenida en
el sitio web en trminos de estructura, contenido y uso del mismo. Esa informacin es muy til para poder
entender el comportamiento de los usuarios de la web, su estructura, como estn enlazados sus contenidos,
etc.
La gran mayora de herramientas existentes hoy en da son capaces de recopilar toda esta informacin pero
suelen representarla de una manera confusa, y difcil de entender. En este proyecto se pretende utilizar
tcnicas de Visualizacin de la Informacin para crear un sistema visual e interactivo que permita la fcil

Para ver trabajos similares o recibir informacin semanal sobre nuevas publicaciones, visite www.monografias.com

www.monografias.com

exploracin de los datos, con el objetivo de proporcionar un mayor conocimiento del sitio web. La
Visualizacin de la Informacin es la disciplina que estudia el uso de representaciones interactivas de datos
abstractos para mejorar su entendimiento.
Sistema desarrollado
El sistema creado en el marco de este proyecto se encarga de recolectar la informacin de Internet
mediante un robot que captura todas las pginas existentes en la web de Zaragoza, siguiendo todos los
enlaces de sta y obteniendo as su estructura; y mediante un analizador semntico de los ficheros log para
analizar el comportamiento de los usuarios. Un fichero log es un fichero existente en el servidor web que
almacena cada una de las peticiones que hacen los usuarios al servidor. Una peticin se genera cada vez
que un usuario pincha en un enlace, o escribe una direccin en el navegador.
De este modo, el sistema generar representaciones visuales basadas en la informacin extrada del
proceso de minera de datos web, permitiendo un profundo anlisis de esa informacin y as entender mejor
los patrones de comportamiento de los ciudadanos dentro de la web. Ese anlisis permitir una mejor toma
de decisiones para poder ofrecer un mejor servicio.
Los principales objetivos del sistema son:
Desarrollar una herramienta que permita analizar el sitio web de Zaragoza
Crear un sistema de Minera Web que extraiga el mayor nmero de mtricas o indicadores relativos
a la web
Analizar distintos tipos de visualizaciones que permitan representar toda la informacin recolectada,
y la implementacin de las que ms se ajusten al problema
Crear una interfaz de usuario interactiva que permita explotar al mximo las capacidades visuales
del sistema, y as, permitir un mayor entendimiento de los mismos
Primer prototipo
Actualmente se ha desarrollado un primer prototipo funcional del sistema.
Esta captura de pantalla muestra una parte de la web de Ayuntamiento de Zaragoza. Cada objeto de la
imagen con forma corresponde a una pgina de la web accesible des de Internet, mientras que las lneas
que los juntan corresponden a enlaces entre ellas. Cada color y forma est relacionado con valores
extrados de los ficheros log, y son asignados mediante un men por parte del usuario del sistema. En la
imagen mostrada anteriormente, se pueden visualizar al mismo tiempo tres valores:
Nmero de visitas: el nmero de veces que cada una de las pginas ha sido visualizada por un
usuario. En la imagen, cuanto ms visitada ha sido una pgina, mayor es su tamao, y su color es
ms azulado.
Ranking en buscadores: la forma de cada pgina est asociado al valor interno que le ha asignado
el motor de bsqueda Google. De este modo, sabemos que la estrella tiene un ranking en Google
muy alto, y por lo tanto, esa pgina saldr en las posiciones ms altas de Google cuando un usuario
la busque. Los hexgonos son pginas con menos ranking, seguido de los tringulos.
Nmero de enlaces salientes: en la imagen, se puede apreciar que cada pgina tiene un color
asignado a su borde. Ese color corresponde al nmero de enlaces que contiene esa web. Identificar
fcilmente las pginas con muchos enlaces es una tarea de alta importancia, ya que ests pginas
sirven de ?punto de entrada? al sitio web. Descubrir que una pgina contiene muchos enlaces, y
que adems es muy visitada implica deducir, que todos los usuarios que vistan esta pgina podrn
acceder a ms contenidos de forma sencilla, lo cual corrobora el buen diseo de la web.
Otras mtricas o valores han sido extrados de los ficheros log, que siempre pueden ser visualizados por
parte del usuario de la aplicacin con el atributo visual (color, forma o color del borde) que el desee.
Referencia bibliogrfica
http://www.zaragoza.es/ciudad/conocimiento/mineria.htm
Autora:
Miriam Cecilia Moreno Lujn
mairim_1729@hotmail.com
Semestre: VIII
ING. RICARDO BUSTAMANTE.

Para ver trabajos similares o recibir informacin semanal sobre nuevas publicaciones, visite www.monografias.com

Das könnte Ihnen auch gefallen