Sie sind auf Seite 1von 5

INSTITUTO TECNOLOGICO SUPERIOR DE

LERDO

EJEMPLOS DE DATAMINING
N. 06230083
EDGAR EDUARDO RAMOS SERRANO.

ING. RICARDO DE JESUS BUSTAMANTE.

TOPICOS AVANZADOS DE BASE DE DATOS.

20 DE MAYO DEL 2010 CD.LERDO, DGO.


Introducción.
El principal recurso con el que cuenta cualquier organización para generar
inteligencia y realizar una buena toma de decisiones es la información. Esto es
especialmente cierto en el complejo mundo de la Aduana en donde día a día se
registran y almacenan grandes cantidades de datos relacionados con una infinidad
de trámites aduaneros que requieren ser fiscalizados a fin de reconocer las
operaciones apegadas a derecho de las fraudulentas. Sin embargo esta gran
cantidad de información necesita de herramientas estadísticas que permitan
encontrar un orden y sentido en este mar de datos. Parte muy importante de las
herramientas que hacen esto posible son las conocidas como “Minería de Datos”
en alusión al trabajo de los mineros que mueven montañas de tierra para extraer
pequeñas cantidades de metales preciosos, de igual manera, es como la minería
de datos trabaja con gran cantidad de datos con el fin de obtener información útil
para un fin determinado.

La minería de datos o “data mining” intenta ayudar a comprender el contenido de


una base de datos a través de algoritmos matemáticos que buscan relaciones,
patrones, comportamientos, agrupaciones, secuencias, tendencias o asociaciones,
muchas veces poco evidentes, entre las diferentes variables que componen las
bases de datos. Esto se logra integrando las ventajas de varias disciplinas del
llamado “proceso de extracción de conocimiento en bases de datos” (Knowledge
Discovery in Databases o KDD) tales como la Inteligencia Artificial, la
Computación Gráfica, las Bases de Datos y el Procesamiento Masivo. De forma
general, los datos son la materia prima en bruto que necesita ser trabajada para
poder obtener información de utilidad. En el momento que el usuario le atribuye
algún significado especial a estos datos, los mismos pasan a convertirse en
información y cuando esta información logra ser explicada por medio de un
modelo matemático entonces la base de datos se ha convertido en conocimiento
útil que puede utilizarse para extraer información relevante .De esta forma, las
técnicas de minería de datos nos permiten obtener información útil a partir de
bases de datos gigantescas siendo aplicable a campos tan diversos como lo son
el análisis bursátil, diagnóstico del cáncer, detección de fraude bancario y
aduanero, detección de terroristas, entre otros.
Ejemplos de minería de datos:

Ejemplo 1:

Existen muchas aplicaciones basadas en gran medida en sistemas que incorporan


algún proceso de minería de datos, un ejemplo claro que usamos diariamente, son
los buscadores de Internet (Google, Yahoo, etc.) que antes de ofrecer los
resultados de cualquier consulta deben haber procesado previamente la
información de millones de páginas web para agruparlas por categorías y
temáticas, esta recopilación y organización se realiza obviamente de forma
automática, haciendo uso de herramientas de minería de datos.

Ejemplo 2:

De igual forma cuando realizamos una compra utilizando tarjetas de crédito,


nuestra transacción es analizada en fracciones de segundo por sistemas
informáticos con algoritmos de minería de datos que comparan la transacción en
proceso con nuestro patrón usual de compra para detectar alguna variación que
pueda hacer sospechar al sistema de que la persona que utiliza la tarjeta no es su
dueño verdadero.

Ejemplo 3:

A nivel de aduanas también se está utilizando la minería de datos para identificar


patrones de riesgo sospechosos, en muchos casos más complicados que los que
un experto humano podría detectar, para identificar el fraude aduanero, por
ejemplo, en América Latina, la Aduana del Perú (Superintendencia de
Administración Tributaria, SUNAT) es la primera administración aduanera que ha
utilizado con éxito la minería de datos para luchar contra el fraude aduanero
logrando una mejor detección de la subvaloración de mercancías incrementando
hasta en 14 puntos porcentuales el éxito en los hallazgos en el Proceso de
Selección de Canales de Control al utilizar un sistema informático de inteligencia
de negocios, conocido como SAS, que hace uso de herramientas de minería de
datos .Esto se logró al cruzar la información de las oficinas de impuestos internos
con las de aduanas, lo que ha permitido generar un perfil de los evasores de
impuestos así como de los importadores que subfacturan sus importaciones. Otro
ejemplo importante del uso de la minería de datos en aduanas lo constituye China
que desde su incorporación a la Organización Mundial del Comercio a finales del
2001 ha visto incrementarse aceleradamente la cantidad de mercancías que la
aduana debe revisar, alcanzando en el 2002 el quinto lugar a nivel mundial en
intercambio comercial. Este incremento del comercio internacional involucró un
aumento del riesgo de defraudación por lo que la Aduana China optó por
implementar un sistema informático, llamado EAS, que aplica técnicas estadísticas
de minería de datos capaces de analizar la gran cantidad de información
generadas por el aumento de los despachos. De esta forma, el sistema EAS, ha
permitido detectar riesgos administrativos hasta entonces no detectados,
incrementando los impuestos recuperados en los primeros dos años de su
aplicación en $20 millones. Otro tanto están poniendo en práctica las
administraciones de aduanas de los Balcanes Occidentales (Albania, Macedonia y
Serbia) que están poniendo a prueba un sistema de aseguramiento del riesgo
aduanero llamado RACWEB basado en un enfoque de minería de datos que se
espera complemente a los sistemas de aduanas y asista a los controladores
humanos en la lucha contra el fraude en el trasiego de mercancías haciendo mas
eficiente el control aduanero por medio de una asignación de los criterios de riesgo
basados en técnicas estadísticas de minería de datos.

Ejemplo 4:

Uno de los usos estereotípicos del Data Mining es el análisis de delitos, crímenes
y terrorismo, que hasta donde tengo informado en nuestro país no se usa hasta el
momento, en estados unidos si. Y es mediante este medio como la CIA estudia a
sus posibles criminales ya que ellos tiene una gran bases de datos de todo lo que
se realiza en ese país, donde y cuanto compras, su número de cuentas, si
realizan donaciones, es decir en ese país nadie puede decir que nadie sabe de
nadie, porque la CIA conoce al revés y derecho la vida de todos aunque parezca
falacia, esto ya es una gran realidad. En un articulo que se titula Data Mining and
Predictive Analytics: attlespace Awareness for the War on Terrorism, en el que se
trata de forma comprensible para todo el mundo como el uso de técnicas de
análisis predictivo para poder estimar situaciones de riesgo y mejorar el control
frente a posibles riesgos. Así que dejando al margen las implicaciones morales o
éticas que puede suponer este tipo de análisis, donde la información ya no es
privada, resulta muy interesante como a partir de datos conocidos pueden
estudiarse y estimarse las tasas de criminalidad de zonas, correlaciones entre las
mismas,etc. para establecer posteriormente políticas correctoras. Además realizar
minería de datos sobre datos criminológicos resulta bastante sencillo en el sentido
de que las bases de casos criminales han sido por razones históricas, junto a las
de fiscalidad, las primeras en realizarse.

Aunque este tipo de aplicaciones parezcan sacadas de películas, ya existen


algunas comisarías que utilizan este tipo de técnicas de forma rutinaria, en
concreto el departamento de policía de Nueva York, ya tiene en funcionamiento
un sistema de información en tiempo real que permite acceder a sus bases de
datos en tiempo real.
Ejemplo 5:

Una de las mayores aplicaciones de la minería de datos en tiempo real es el


mundo online. Hay que ofrecer al cliente, en décimas de segundo, un anuncio, una
promoción, etc... en base a lo que está consultando o comprando. Dos ejemplos
muy famosos:

 La publicidad contextual de Google. En una página que quieres que tenga


este tipo de publicidad, solamente tienes que insertar una llamada a un
código de google, pasando muy pocos parámetros, entre ellos tu ID de
usuario del servicio y en cuestión de 1 o 2 segundos realiza consultas que
incluyen:
o Análisis del idioma de la página, para realizar la publicidad en el
mismo idioma.
o Recorre el texto de toda la página en busca de palabras clave, que
son las que los anunciantes han comprado para salir. Aquí hace
análisis de cuantas veces ha salido el anunciante, si para la próxima
vez saldrá otro, si ha llegado al cupo etc...

Das könnte Ihnen auch gefallen