Beruflich Dokumente
Kultur Dokumente
y transmisin de datos a gran velocidad y bajo costo. Permite encontrar el conocimiento contenido en las inmensas montaas de informacin para luego tomar decisiones mejor fundamentadas para el futuro de una organizacin. La minera de datos aparece como una de las nuevas tecnologas de manejo, ordenamiento y anlisis de los datos
La MD puede ser dividida en: Minera de datos predictiva (mdp): usa primordialmente tcnicas estadsticas. Minera de datos para el descubrimiento de conocimiento (mddc): usa principalmente tcnicas de inteligencia artificial.
Caractersticas
Las herramientas de la minera de datos se combina fcilmente pueden analizarse y procesarse rpidamente Su entorno suele tener una arquitectura cliente-servidor. Por la gran cantidad de datos, a veces es necesario el procesamiento en paralelo para la minera de datos
Muchas tcnicas han sido desarrolladas en el pasado buscando el objetivo de extraer informacin de las bases de datos. La minera de datos es una combinacin de muchas tcnicas probadas, tales como inteligencia artificial, estadsticas y tecnologas de bases de datos.
Desde la dcada de los 60's, la comunidad cientfica abocada a la inteligencia artificial ha estado estudiando e investigando sistemas que sean capaces de aprender. Una clase de esos sistemas se ha llamado algoritmos de induccin.
Un famoso ejemplo es el del juego de golf. Supongamos un jugador que practica el golf todos los Sbados; la decisin de jugar, sin embargo, depende de las condiciones climticas. Si el clima esta bueno, el deportista juega; si est lloviendo, probablemente no jugar. Si almacenamos todos los posibles resultados del clima en una base de datos, junto con la decisin a tomar en cada caso, los resultados se reflejaran en la siguiente tabla.
Temperatura 35 28 20 15 17
Viento No S No S S
Golf S No S S No
De la tabla que se muestra, (que no es ms que una pequea base de datos) se pueden deducir las reglas de los algoritmos de induccin). Por ejemplo: Si clima = lluvioso y humedad = normal, entonces Golf = No.
Estos algoritmos de induccin permiten construir un rbol de decisin: Humedad = Normal ...................Golf = S Clima = Lluvioso Humedad = alta...........................Golf = No Clima = Nublada ................................................................Golf = S Humedad = Baja............................Golf = S Clima = Soleado Humedad = Alta............................Golf = No.
Este simple ejemplo muestra como las reglas determinan si se juega o no golf en un determinado da. El algoritmo modela el proceso de la toma de decisin del jugador. As, los algoritmos pueden generar modelos que ayudan a predecir y entender comportamientos futuros en distintas situaciones.
OTRAS APLICACIONES DE MD Actualmente se aplica en reas tales como: aspectos climatolgicos: prediccin de tormentas, etc. medicina: encontrar la probabilidad de una respuesta satisfactoria a un tratamiento mdico. mercadotecnia: identificar clientes susceptibles de responder a ofertas de productos y servicios por correo, fidelidad de clientes, afinidad de productos, etc. inversin en casas de bolsa y banca: anlisis de clientes, aprobacin de prestamos, determinacin de montos de crdito, etc.
deteccin de fraudes y comportamientos inusuales: telefnicos, seguros, en tarjetas de crdito, de evasin fiscal, electricidad, etc. anlisis de canastas de mercado para mejorar la organizacin de tiendas, segmentacin de mercado (clustering). determinacin de niveles de audiencia de programas televisivos. industria y manufactura: diagnstico de fallas.
Aplicaciones
El FBI del gobierno norteamericano ha realizado investigaciones sobre grandes bases de datos con la finalidad de detectar terroristas potenciales; esto es, se ha metido a grandes bases de datos del sector comercial para estudiar los hbitos y preferencias de compra de los consumidores, con la intencin de detectar posibles terroristas potenciales y descubrirlos antes de que ejecuten un acto.
En consorcios bancarios para detectar fraudes con tarjetas de crdito, tarjetas de debito y tarjetas de otro tipo como las de combustible, tarjetas telefnicas. El sistema utilizado para este fin ha logrado ahorrar ms de 600 millones de Dlares al ao y ha protegido ms de 500 mil millones de operaciones con tarjeta en todo el mundo.
En una compaa operadora de telefona celular, buscando las causas de la desercin de sus clientes, se analiza el perfil del cliente que se da de baja y se estudia el posible comportamiento de clientes nuevos. En este caso se analizan los datos personales del cliente; estado civil, sexo, edad, religin, grado de estudio, estrato ocupacional, nacionalidad, etc. Y se analizan tambin las variables; morosidad, horario de uso, frecuencia de uso, proporcin de llamadas locales, nacionales, internacionales y gratuitas. Se encontr que los clientes que desertaron pertenecan al grupo de los menos promovidos y tenan menos incidencias que la media general entonces, en base a las tendencias encontradas se dise un nuevo sistema de promociones y de atencin al cliente.
En una tienda departamental se pueden conocer ciertos hbitos de los clientes, con respecto al tipo y clase de productos que compran con mayor frecuencia y si estas compras guardan alguna asociacin entre diversos productos, por ejemplo, botanas con cerveza.
Las cadenas de televisin pueden estimar con bastante confiabilidad el rating de un programa determinado, el horario ms adecuado al tipo y contenido del programa.
Una aplicacin especial de la minera de datos es la minera web (o minera de uso de la web, web mining) que consiste en extraer informacin y conocimiento til especficamente de la actividad de un sitio web: anlisis de trfico (visitas y visitantes), contenidos ms accedidos, procedencia, tipo de usuarios, navegadores y sistemas operativos, reglas de asociacin entre pginas (tasa de conversin)
PREGUNTAS
1) Qu es la minera de datos? 2)Orgenes de la minera de datos 3)En que se divide la minera de datos? 4)Quienes son los usuarios de la minera de dato? 5)Menciona la metodologa de la minera de datos 6)Menciona tres aplicaciones de la minera de datos