Sie sind auf Seite 1von 25

La minera de datos es una nueva tecnologa de manejo y anlisis de informacin que aprovecha la capacidad existente hoy en da de procesamiento, almacenamiento

y transmisin de datos a gran velocidad y bajo costo. Permite encontrar el conocimiento contenido en las inmensas montaas de informacin para luego tomar decisiones mejor fundamentadas para el futuro de una organizacin. La minera de datos aparece como una de las nuevas tecnologas de manejo, ordenamiento y anlisis de los datos

Orgenes de la minera de datos


La minera de datos se ha insertado desde los aos 90 en el contexto de las tecnologas de la informacin algoritmia y desarrollo de software. Las lneas de desarrollo en el mbito de minera de datos tienes sus orgenes en tres conceptos importantes: Estadstica clnica Inteligencia artificial Aprendizaje automtico

La MD puede ser dividida en: Minera de datos predictiva (mdp): usa primordialmente tcnicas estadsticas. Minera de datos para el descubrimiento de conocimiento (mddc): usa principalmente tcnicas de inteligencia artificial.

Caractersticas
Las herramientas de la minera de datos se combina fcilmente pueden analizarse y procesarse rpidamente Su entorno suele tener una arquitectura cliente-servidor. Por la gran cantidad de datos, a veces es necesario el procesamiento en paralelo para la minera de datos

Muchas tcnicas han sido desarrolladas en el pasado buscando el objetivo de extraer informacin de las bases de datos. La minera de datos es una combinacin de muchas tcnicas probadas, tales como inteligencia artificial, estadsticas y tecnologas de bases de datos.

Desde la dcada de los 60's, la comunidad cientfica abocada a la inteligencia artificial ha estado estudiando e investigando sistemas que sean capaces de aprender. Una clase de esos sistemas se ha llamado algoritmos de induccin.

Un famoso ejemplo es el del juego de golf. Supongamos un jugador que practica el golf todos los Sbados; la decisin de jugar, sin embargo, depende de las condiciones climticas. Si el clima esta bueno, el deportista juega; si est lloviendo, probablemente no jugar. Si almacenamos todos los posibles resultados del clima en una base de datos, junto con la decisin a tomar en cada caso, los resultados se reflejaran en la siguiente tabla.

Clima Soleado Soleado Nublado Lloviendo Lloviendo

Temperatura 35 28 20 15 17

Humedad Baja Alta Alta Normal Alta

Viento No S No S S

Golf S No S S No

De la tabla que se muestra, (que no es ms que una pequea base de datos) se pueden deducir las reglas de los algoritmos de induccin). Por ejemplo: Si clima = lluvioso y humedad = normal, entonces Golf = No.

Estos algoritmos de induccin permiten construir un rbol de decisin: Humedad = Normal ...................Golf = S Clima = Lluvioso Humedad = alta...........................Golf = No Clima = Nublada ................................................................Golf = S Humedad = Baja............................Golf = S Clima = Soleado Humedad = Alta............................Golf = No.
Este simple ejemplo muestra como las reglas determinan si se juega o no golf en un determinado da. El algoritmo modela el proceso de la toma de decisin del jugador. As, los algoritmos pueden generar modelos que ayudan a predecir y entender comportamientos futuros en distintas situaciones.

OTRAS APLICACIONES DE MD Actualmente se aplica en reas tales como: aspectos climatolgicos: prediccin de tormentas, etc. medicina: encontrar la probabilidad de una respuesta satisfactoria a un tratamiento mdico. mercadotecnia: identificar clientes susceptibles de responder a ofertas de productos y servicios por correo, fidelidad de clientes, afinidad de productos, etc. inversin en casas de bolsa y banca: anlisis de clientes, aprobacin de prestamos, determinacin de montos de crdito, etc.

deteccin de fraudes y comportamientos inusuales: telefnicos, seguros, en tarjetas de crdito, de evasin fiscal, electricidad, etc. anlisis de canastas de mercado para mejorar la organizacin de tiendas, segmentacin de mercado (clustering). determinacin de niveles de audiencia de programas televisivos. industria y manufactura: diagnstico de fallas.

Dnde se utiliza la minera de datos?


Sistemas parcialmente desconocidos: Si el modelo del sistema que produce los datos es bien conocido, entonces no necesitamos de la minera de datos ya que todas las variables son de alguna manera predecibles. Enorme cantidad de datos: Al contar con mucha informacin en algunas bases de datos es importante para una empresa encontrar la forma de analizar montaas de informacin (lo que para un humano sera imposible) y que ello le produzca algn tipo de beneficio. Potente hardware y software: Muchas de las herramientas presentes en la minera de datos estn basadas en el uso intensivo de la computacin, en consecuencia, un equipo conveniente y un software eficiente, con el cual cuente una compaa, aumentar el desempeo del proceso de buscar y analizar informacin, el cual a veces debe vrselas con producciones de datos del orden de los Gbytes/hora (repetimos, algo humanamente imposible).

Aplicaciones
El FBI del gobierno norteamericano ha realizado investigaciones sobre grandes bases de datos con la finalidad de detectar terroristas potenciales; esto es, se ha metido a grandes bases de datos del sector comercial para estudiar los hbitos y preferencias de compra de los consumidores, con la intencin de detectar posibles terroristas potenciales y descubrirlos antes de que ejecuten un acto.

En consorcios bancarios para detectar fraudes con tarjetas de crdito, tarjetas de debito y tarjetas de otro tipo como las de combustible, tarjetas telefnicas. El sistema utilizado para este fin ha logrado ahorrar ms de 600 millones de Dlares al ao y ha protegido ms de 500 mil millones de operaciones con tarjeta en todo el mundo.

En una compaa operadora de telefona celular, buscando las causas de la desercin de sus clientes, se analiza el perfil del cliente que se da de baja y se estudia el posible comportamiento de clientes nuevos. En este caso se analizan los datos personales del cliente; estado civil, sexo, edad, religin, grado de estudio, estrato ocupacional, nacionalidad, etc. Y se analizan tambin las variables; morosidad, horario de uso, frecuencia de uso, proporcin de llamadas locales, nacionales, internacionales y gratuitas. Se encontr que los clientes que desertaron pertenecan al grupo de los menos promovidos y tenan menos incidencias que la media general entonces, en base a las tendencias encontradas se dise un nuevo sistema de promociones y de atencin al cliente.

En una tienda departamental se pueden conocer ciertos hbitos de los clientes, con respecto al tipo y clase de productos que compran con mayor frecuencia y si estas compras guardan alguna asociacin entre diversos productos, por ejemplo, botanas con cerveza.

Las cadenas de televisin pueden estimar con bastante confiabilidad el rating de un programa determinado, el horario ms adecuado al tipo y contenido del programa.

Una aplicacin especial de la minera de datos es la minera web (o minera de uso de la web, web mining) que consiste en extraer informacin y conocimiento til especficamente de la actividad de un sitio web: anlisis de trfico (visitas y visitantes), contenidos ms accedidos, procedencia, tipo de usuarios, navegadores y sistemas operativos, reglas de asociacin entre pginas (tasa de conversin)

PREGUNTAS
1) Qu es la minera de datos? 2)Orgenes de la minera de datos 3)En que se divide la minera de datos? 4)Quienes son los usuarios de la minera de dato? 5)Menciona la metodologa de la minera de datos 6)Menciona tres aplicaciones de la minera de datos

Das könnte Ihnen auch gefallen