Beruflich Dokumente
Kultur Dokumente
varios grupos en los datos, que luego se pueden utilizar para obtener
resultados ms precisos por prediccin de un sistema de soporte de
decisin. Ni la recopilacin de datos, preparacin de datos, ni
interpretacin de los resultados y presentacin de informes son parte de
la etapa de extraccin de datos, pero que pertenecen al proceso general
KDD como pasos adicionales.
El relacionadas trminos dragado de datos, la pesca de datos y
espionaje datos se refieren a la utilizacin de mtodos de minera de
datos para probar las partes de un conjunto de datos de poblacin
mayor que (o puede ser) demasiado pequeo para inferencias
estadsticas fiables que hacer acerca de la validez de cualquier patrones
descubiertos. Estos mtodos pueden, sin embargo, ser utilizados en la
creacin de nuevas hiptesis para probar en contra de las poblaciones
ms grandes de datos.
Contenidos
1 Etimologa
2 Antecedentes
o 2.1 Investigacin y evolucin
3 Proceso
o 3.1 Pre-procesamiento
o 3.2 La minera de datos
o Validacin 3.3 Resultados
4 Normas
5 usos notables
8 Software
o 8.1 Programas gratis de
aplicaciones de minera
datos
de
cdigo
abierto
9 Vase tambin
10 Referencias
11 Lectura adicional
12 Enlaces externos
Etimologa
En la dcada de 1960, los estadsticos utilizan trminos como "Pesca de
datos" o "datos de dragado" para referirse a lo que ellos consideraban la
mala prctica de anlisis de datos sin una hiptesis a priori. El trmino
"minera de datos" apareci alrededor de 1990 en la comunidad de base
de datos. Por un corto tiempo en la dcada de 1980, una frase "minera
de base de datos" , se utiliz, pero desde que fue registrado como
marca por HNC, una empresa con sede en San Diego, para lanzar su
base de datos Minera de estacin de trabajo; [9] investigadores
consiguiente recurrieron a "minera de datos ". Otros trminos utilizados
incluyen datos Arqueologa, Informacin cosecha, informacin
Descubrimiento, extraccin de conocimiento, etc. Gregory PiatetskyShapiro acu el trmino "Descubrimiento de Conocimiento en Bases de
Datos" para el primer taller sobre el mismo tema (KDD-1989) y este
trmino se hizo ms popular en la IA y mquina Comunidad de
Aprendizaje. Sin embargo, la minera de datos trmino se hizo ms
popular en las comunidades de negocios y de prensa. [10] En la
actualidad, la minera de datos y descubrimiento de conocimiento se
utilizan indistintamente. Desde aproximadamente 2007, "Anlisis
Predictivo" y desde 2011, los trminos "Ciencia de datos" se utiliza
tambin para describir este campo.
Antecedentes
ECML-PKDD
Conferencia - Conferencia
Europea
sobre
el
aprendizaje de la mquina y los Principios y Prctica de
Descubrimiento de Conocimiento en Bases de Datos
Conferencia PAKDD - El informe anual de la Conferencia AsiaPacfico sobre el Descubrimiento de Conocimiento y Minera de
Datos
(3) Transformacin
(4) Data Mining
(5) Interpretacin / Evaluacin.
[1]
La comprensin de negocios
La comprensin de datos
Preparacin de datos
Modelado
Evaluacin
Implementacin
[1]
Validacin Resultados
La minera de datos sin querer puede ser mal utilizada, y puede
entonces producir resultados que parecen ser importantes; pero que en
realidad no predecir el comportamiento futuro y no pueden
ser reproducidas en una nueva muestra de datos y dar poco uso. A
menudo, esto es resultado de la investigacin de demasiadas hiptesis y
no realizar correctamente la prueba de hiptesis estadstica. Una versin
simple de este problema en el aprendizaje automtico se conoce
como sobreajuste, pero el mismo problema puede surgir en diferentes
fases del proceso y por lo tanto una divisin de tren / prueba - en su
caso en absoluto -. Puede no ser suficiente para evitar que esto
suceda [ cita requerida]
En esta seccin se encuentra informacin acerca de las
tareas no-clasificacin en la minera de datos. Slo
de
lo
que ser capaz de extraer los datos y el uso de los datos y sus
derivados;
Israel, Taiwn y Corea del Sur es visto como siendo legal. Como la
minera contenido es transformadora, es decir que no suplanta la obra
original, que es visto como legtimo bajo el uso justo. Por ejemplo, como
parte del acuerdo de Google libro el presidente del tribunal en el caso
dictamin que el proyecto de digitalizacin de Google de libros con
derechos de autor fue legal, en parte debido a la transformacin utiliza
que el proyecto de digitalizacin muestra -. Un texto bienestar y la
minera de datos [ 34]
Software
Ver tambin: Categora: La minera de datos y el software de aprendizaje
automtico.
El software
aplicaciones
libre
de
cdigo
abierto
minera
de
datos
Chemicalize.org: Un
bsqueda web.
minero
estructura
qumica
motor
de
basado en componentes
de
software
escrito
de
datos
de minera
software
de
de datos
visualizacin
STATISTICA
Data
Miner: software
proporcionada por Statsoft.
software
de
de
de
minera
minera
minera
de
de
de
datos
datos
datos
Encuestas de mercado
Varios investigadores y organizaciones han llevado a cabo exmenes de
herramientas de minera de datos y encuestas de la minera de
[36]
[38]
Vase tambin
Mtodos
Clasificacin
Anlisis de conglomerados
rbol de decisin
Anlisis factorial
Algoritmos genticos
Minera Intencin
Redes neuronales
Anlisis de regresin
Secuencia de la minera
Extraccin de textos
Analytics
Bioinformtica
Inteligencia de Negocio
Almacn de datos
El descubrimiento de frmacos
El anlisis predictivo
La minera Web
Ejemplos de aplicacin
Ver tambin: Categora: Se aplica la minera de datos.
Anlisis de clientes
Temas relacionados
La minera de datos es sobre el anlisis de datos; para obtener
informacin sobre la extraccin de informacin de datos, consulte:
La integracin de datos
Transformacin de datos
Descubrimiento electrnico
Extraccin de informacin
Integracin de la informacin
Raspado Web
Referencias
1.
2.
3.
^ Clifton,
Christopher
(2010). "Enciclopedia
Britnica:
Definicin de Minera deDatos". Consultado el 2010-12-09.
4.
^ Hastie,
Trevor; Tibshirani,
Robert; Friedman,
Jerome (2009). "Los elementos de aprendizaje estadstico: Minera
de Datos, Inferencia y prediccin". Consultado el2012-08-07.
5.
6.
7.
8.
9.
10.
^ Piatetsky-Shapiro, Gregorio; Parker, Gary (2011). "Leccin:
Minera de Datos y Descubrimiento de Conocimiento: Una
introduccin" Introduccin
a
la
Minera
de
Datos.. KD Nuggets. Consultado el 30 de agosto 2012.
11.
^ Kantardzic, Mehmed (2003) Data Mining:. Conceptos,
modelos, mtodos y algoritmos. John Wiley & Sons. ISBN 0-47122852-4. OCLC 50055336.
12.
^ "Microsoft Academic Search: Top Conferencias en la
minera de datos".Microsoft Academic Search.
13.
^ "Google Acadmico: Top publicaciones - Minera de datos y
anlisis". Google Acadmico.
14.
^ Proceedings, Conferencias
Internacionales
sobre
el
Descubrimiento de Conocimiento y Minera de Datos, ACM, Nueva
York.
15.
16.
^ Gregory Piatetsky-Shapiro (2002) KDnuggets Metodologa
Encuesta, Gregory
Piatetsky-Shapiro
(2004) KDnuggets
Metodologa
Encuesta, Gregory
Piatetsky-Shapiro
(2007) KDnuggets Metodologa Encuesta, Gregory PiatetskyShapiro (2014) KDnuggets Metodologa Encuesta
17.
^ scar Marbn, Gonzalo Mariscal y Javier Segovia
(2009); Un Minera de Datos y Descubrimiento de Conocimiento
Modelo de proceso. En la minera de datos y descubrimiento de
conocimiento en las solicitudes de la vida real, libro editado por:
Julio Ponce y Adem Karahoca, ISBN 978-3-902613-53-0., Pp 438453, febrero de 2009, I-Tech, Viena, Austria.
18.
^ Lukasz Kurgan y Petr Musilek (2006); Un estudio de
modelos de procesos de descubrimiento de conocimiento y
minera
de
datos. La
Revista
de
Ingeniera
del
Conocimiento. Volumen 21 Nmero 1, marzo de 2006, pp 1-24,
Cambridge University Press, Nueva York, NY, EE.UU. doi: 10.1017 /
S0269888906000737
19.
^ Azevedo, A. y Santos, MF KDD, SEMMA y CRISP-DM: una
visin paralela. En Actas de la Conferencia Europea IADIS en Data
Mining 2008, pp 182-185.
20.
^ Gnnemann, Stephan; Kremer, Hardy; Seidl, Thomas
(2011). "Una extensin del estndar PMML al subespacio modelos
de clustering" Actas del taller de 2011 sobre el marcado predictivo
Modeling
Language
-.
PMML
'11. p. 48. doi: 10.1145
/
2023598.2023605. ISBN 9781450308373.
21.
^. Seltzer, William "La Promesa y Trampas de la Minera de
Datos: Cuestiones ticas" (PDF).
22.
^ Pitts, Chip (15 de marzo de 2007). "El fin de la ilegal
domstica Espionaje? No contar con ella". Washington Espectador.
23.
^ Taipale, Kim A. (15 de diciembre de 2003). "Minera de
Datos y Seguridad Nacional: Conectando los Puntos de dar sentido
a
los
datos" Columbia
Ciencia
y
Tecnologa
de
la
Ley 5 (2).. OCLC 45263753. SSRN 546.782.
24.
^ Resig, John; y Teredesai, Ankur (2004). "Un Marco para la
Minera Servicios de mensajera instantnea". Actas de la
Conferencia DM SIAM 2004.
25.
^ Un b c Piense antes de cavar: Implicaciones de Privacidad de
Data Mining y agregacin, Breve NASCIO Investigacin, septiembre
de 2004
26.
^ Ohm, Paul. "No Construir una base de datos de la
ruina". Harvard Business Review.
27.
^ Darwin Bond-Graham, Hierro Cagebook - El final lgico de
Patentes de Facebook, Counterpunch.org, 03/12/2013
28.
^ Darwin Bond-Graham, Dentro Conferencia de inicio de la
industria de la tecnologa, Counterpunch.org, 09/11/2013
29.
^ De
datos
de
bsqueda
de
identificados, SecurityFocus, agosto de 2006
AOL
individuos
30.
^ Editores Biotech Business Week (30 de junio de
2008); BIOMEDICINA; Regla
de
Privacidad
HIPAA
Impide
Investigacin Biomdica, Biotech Business Week, recuperado 17
de noviembre 2009 de LexisNexis Academic
31.
^ Los investigadores del Reino Unido Dada Data Mining justo
debajo de Nueva UK Leyes de Copyright. Out-Law.com. Consultado
el 14 de noviembre 2014
32.
^ "Las licencias para Europa - Dilogo Estructurado
Stakeholder 2013" de la Comisin Europea.. Consultado el 14 de
noviembre 2014.
33.
^ "Texto y Minera de Datos: Su importancia y la necesidad
de
cambio
en
Europa"Asociacin
de
Bibliotecas
de
Investigacin Europeas.. Consultado el 14 de noviembre 2014.
34.
^ "Juez otorga sentencia sumaria a favor de Google Libros una
victoria
uso
justo"Lexology.com.. Antonelli
Ley Ltd.
Obtenido 14 de noviembre 2014.
35.
^ Mikut, Ralf; . Reischl, Markus (septiembre-octubre de
2011) "Herramientas de minera de datos". Wiley Interdisciplinary
Comentarios:
Minera
de
Datos
y
Descubrimiento
de
Conocimiento 1 (5):.
Desde
431
hasta
445 doi: 10.1002
/widm.24. Consultado el 21 de octubre 2011.
36.
^ Karl
Rexer,
Heather
Allen,
&
Paul
Gearan
(2011); Comprender Mineros de datos,Analytics Magazine, mayo /
junio de 2011 (INFORMA: Instituto para la Investigacin de
Operaciones y las Ciencias de la Administracin).
37.
^ Kobielus, James; The Forrester Wave: anlisis predictivo y
soluciones de minera de datos, Q1 2010, Forrester Research, 01
de julio 2008
38.
^ Herschel, Gareth; Cuadrante Mgico para aplicaciones
cliente Data-Mining,Gartner Inc., 01 de julio 2008
39.
^ Nisbet, Robert A. (2006); Herramientas de minera de
datos: cul es el mejor para CRM? Parte 1, Informacin Informes
Especiales de Gestin, enero de 2006
40.
^ Haughton,
Dominique; Deichmann,
Joel; Eshghi,
Abdolreza; Sayek,
Selin;Teebagy,
Nicols; y
Topi,
Heikki
(2003); Una revisin de los paquetes de software de minera de
datos, El Estadstico de Amrica, vol. 57, No. 4, pp. 290-309
41.
^ Goebel, Michael; Gruenwald, Le (1999); una encuesta de
Minera de Datos y Descubrimiento de Conocimiento Software
Herramientas, SIGKDD Exploraciones, vol. 1, No. 1, pp. 20-33
Lecturas adicionales
Feldman,
Ronen; y
Sanger,
James; El
texto
Manual
Minera, Cambridge University Press, ISBN 978-0-521-83657-9
Mining:.
Tan,
Pang-Ning; Steinbach,
Michael; y
Kumar,
Vipin
(2005); Introduccin a la Minera de Datos, ISBN 0-321-32136-7
Theodoridis,
Sergios; y
Koutroumbas,
Konstantinos
(2009); Reconocimiento de Patrones, cuarta edicin, Academic
Press, ISBN 978-1-59749-272-0
Witten, Ian H.; Frank, Eibe; Hall, Mark A. (30 enero 2011) Data
Mining:. Prcticos Herramientas de Aprendizaje Automtico y
Tcnicas (3
ed.). Elsevier. ISBN 978-0-12-374856-0. (Vase
tambin el software gratuito Weka)
Enlaces externos
Wikimedia Commons
minera de datos.
alberga
contenido
multimedia
sobre la
Almacn de datos
Conceptos
Base de datos
Dimensin
Modelado dimensional
Hecho
OLAP
Esquema en estrella
Agregada
Modelado de anclaje
HOLAP
MOLAP
ROLAP
Variantes
Data mart
Clave sustituta
Tabla de hechos
Early-llegando hecho
Medida
Tabla de dimensiones
Degenerar
Extraccin,
carga (ETL)
Elementos
Hecho
Dimensin
Llenado
transformacin
Extracto
Transformar
Carga
Conceptos
Inteligencia de Negocio
Tablero
La minera de datos
Sistema
de
apoyo
decisiones (DSS)
Cubo OLAP
Expresiones multidimensionales
(MDX)
Herramientas de inteligencia de
negocios
Software
las
Idiomas
Herramientas
de
presentacin
de
informes
Hoja de clculo
Bill Inmon
Ralph Kimball
Relacionada
Gente
Productos
La lgica matemtica
Teora de conjuntos
La teora de grafos
Teora Tipo
Teora de la categora
Anlisis numrico
Teora de la informacin
Combinatoria
lgebra de Boole
Teora de Autmatas
Teora de la computabilidad
Anlisis de algoritmos
Diseo de algoritmos
Optimizacin combinatoria
Geometra Computacional
Teora
de
computacin
la
Algoritmos,estru
cturas de datos
Los lenguajes de
programacin,
compiladores
Analizadores
Intrpretes
Programacin de procedimiento
La programacin funcional
La programacin lgica
Paradigmas de programacin
Multiprocesamiento
La computacin grid
Control de concurrencia
Anlisis de requerimientos
Diseo de software
Programacin
Concurrente,par
alelo,
sistemas
distribuidos
Ingeniera
Software
de
Arquitectura del
sistema
Arquitectura de Computadores
Organizacin ordenador
Sistemas operativos
Enrutamiento
Topologa de la red
Criptografa
SQL
Transacciones
La minera de datos
La computacin afectiva
Telecomunicacio
nes,
la creacin de
redes
Bases de datos
La
inteligencia
artificial,
Aprendizaje
automtico
Inteligencia artificial
Razonamiento automatizado
Lingstica Computacional
Computacin evolutiva
Sistemas expertos
Aprendizaje automtico
Robtica
Visualizacin
Procesamiento de imgenes
Accesibilidad ordenador
La computacin usable
Computacin ubicua
Grficos
de
computadora
La
interaccin
personaordenador
Realidad virtual
La vida artificial
Bioinformtica
Ciencia cognitiva
Qumica Computacional
Neurociencia computacional
Fsica Computacional
Algoritmos numricos
Matemtica simblica
Computacin
cientfica
Portal de Informtica
Sub-disciplinas de la informtica
Hardware
Software
Firmware
Sistema
de
informaci
n
Seguridad de informacin
Big Data
Sistema de recomendacin
Ingeniera de datos
Lgica difusa
Gestin de proyectos
La integracin de datos
Web Semntica
Sistema de comunicaciones
Geometra Computacional
Aprendizaje automtico
La minera de datos
Programacin paralela
Teora de la codificacin
Teora de la computacin
Recuperacin de informacin
La ciencia computacional
La computacin simblica
La computacin distribuida
Computacin evolutiva
Computacin natural
Optimizacin combinatoria
Ciencias
de
la
Computaci
n
Procesamiento en paralelo
Multimedia
Sistemas embebidos
Arquitectura de Computadores
La programacin en parejas
Redes neuronales
Reconocimiento de voz
El anlisis de la seal
IC Design
Voz sobre IP
La sntesis de voz
La interaccin persona-ordenador
Microprocesador
Procesamiento de imgenes
Ingeniera
informtic
a
Mantenimiento de software
Software Measurement
Arquitectura empresarial
Arquitectura de software
Patrn de diseo
Modelado de software
Analizador de sistemas
Anlisis de requerimientos
Desarrollo de software
Ingeniera
de
Software
Diseo de software
Implementacin de software
Mejora Software
Seguridad de la red
Computacin en la nube
Enrutamiento
Teora de la informacin
Red inalambrica
Red celular
Red
de
computad
oras
Criptografa
Simulacin de red
Reconocimiento de patrones
Equipo de red
Diseo de red
Centro de datos
La comunicacin digital
ITIL
ITSM
Negocio electrnico
Inteligencia de Negocio
Gestin de la seguridad
Informtic
a negocio
Gestin de la configuracin
Gestin de la tecnologa
La administracin de energa
Gestin De Servicios
Gestin de proyectos
Gestin de sistemas
Administracin de redes
Gestin de contenido
Gestin de incidencias
Gestin de activos
La gestin integrada
Administrador de sistema
GND: 4428654-5
NDL: 00948240
Control de la Autoridad
Obtenido
de "https://en.wikipedia.org/w/index.php?
title=Data_mining&oldid=682066091"
Categoras:
La minera de datos
Ciencias formales
Categoras ocultas:
Men de Navegacin
Herramientas personales
Crear cuenta
Iniciar sesin
Artculo
Talk
Variantes
Vistas
Leer
Editar
Ver historial
Ms
Buscar
Buscar
Ir
Navegacin
Pagina principal
Contenidos
Contenido Destacado
Eventos actuales
Artculo al azar
Donar a Wikipedia
Tienda de Wikipedia
Interaccin
Ayuda
Acerca de Wikipedia
Portal de la comunidad
Cambios recientes
Contacto pgina
Herramientas
Cambios en enlazadas
Subir archivo
Pginas especiales
Enlace permanente
Informacin de la pgina
Elemento Wikidata
Imprimir / exportar
Crear un libro
Versin imprimible
Idiomas
Azrbaycanca
Catal
etina
Dansk
Deutsch
Eesti
Espaol
Euskara
Franais
Hrvatski
bahasa indonesia
Italiano
Latvieu
Lietuvi
Magiar
Nederlands
Norsk bokml
Polski
Portugus
Romn
Sencillo Ingls
Slovenina
Slovenina
/ srpski
Srpskohrvatski /
Basa Sunda
Suomi
Svenska
Trke
Ting Vit
Editar enlaces
Poltica de privacidad
Acerca de Wikipedia
Aviso legal
Desarrolladores
Vista mvil