0 Bewertungen0% fanden dieses Dokument nützlich (0 Abstimmungen)
296 Ansichten10 Seiten
Este documento resume las principales funciones del programa WEKA Explorer. WEKA Explorer permite cargar datos, aplicar filtros de preprocesamiento, entrenar y probar clasificadores y agrupadores, seleccionar atributos y visualizar datos. El documento explica cómo abrir y modificar datos, aplicar filtros, configurar y ejecutar clasificadores y agrupadores, y guardar resultados.
Este documento resume las principales funciones del programa WEKA Explorer. WEKA Explorer permite cargar datos, aplicar filtros de preprocesamiento, entrenar y probar clasificadores y agrupadores, seleccionar atributos y visualizar datos. El documento explica cómo abrir y modificar datos, aplicar filtros, configurar y ejecutar clasificadores y agrupadores, y guardar resultados.
Este documento resume las principales funciones del programa WEKA Explorer. WEKA Explorer permite cargar datos, aplicar filtros de preprocesamiento, entrenar y probar clasificadores y agrupadores, seleccionar atributos y visualizar datos. El documento explica cómo abrir y modificar datos, aplicar filtros, configurar y ejecutar clasificadores y agrupadores, y guardar resultados.
I) WEKA Weka GUI: ventana para ambientes grficos. En la parte inferior estn estos tres botones: - simple CLI: comando que permite directa ejecucin de comandos Wea.. - E!plorer: e!plorar datos con Wea. - E!perimenter: para reali"ar e!perimentos # conductas estad$sticas %test& %e!iste un tutorial espec$fico para ello&. II) WEKA KNOWE!GE E"#ORER E"#ORER $'arte superior de la ventana %bajo el t$tulo&&. 'rimero el primer (tab) est activo # las otras en gris. Esto es por que es necesario abrir un (data set) antes de e!plorar la data Los (tabs) son: *& 're process: seleccionar # modificar la data que se va a usar. +& Classif#: entrenar # testear sistemas de aprendi"aje %learning sc,emes& que clasifican # generan regresin. -& Cluster: aprender agrupacin de los datos%data&. .& /ssociate: aprender reglas de asociacin para los datos %data&. 0& 1eleccionar atributos: seleccionar los atributos ms importantes del data. 2& 3isuali"e: ver grfica interactiva +4 del data. En cada tab cuando estn activos se abrirn distintas pantallas donde se pueden reali"ar las diferentes acciones. La parte inferior de la ventana %from t,e log bo! do5n5ords& se mantiene visible sin observar en que seleccin se encuentra. L67 869 %en la parte inferior de la ventana& Contiene una barra de movimiento %escrollable te!t field& Cada l$nea de te!to queda registrada con la ,ora que fue ingresada al log. Cuando se generan acciones en Wea el log mantiene un registro de lo que sucede. 1:/:;1 869 %en el e!tremo inferior de la ventana bajo el log bo!& 4espliega mensajes que mantienen informado de lo que sucede. 'or ejemplo: si el E!plorer est ocupado cargando un arc,ivo< el 1tatus 8o! lo dir. :I' =aciendo clic en botn derec,o del >ouse< dentro del 1tatus 8o! se genera un men? con dos opciones: - /vailable memor#: despliega en el Log 8o! la cantidad de memoria disponible para Wea. - @un 7arbage Collector: fuer"a el colector de basura de A/3/ para buscar la memoria que no es usada para liberarla< permitiendo el uso de memoria para nuevas operaciones %tass& =a# que destacar que el colector de basura< est corriendo constantemente igual como (bacground tas). WEB/ 1:/:;1 IC6C % a la derec,a del 1tatus 8o!& Cuando no ,a# procesos corriendo el pjaro se sienta # toma una siesta. El n?mero al lado del s$mbolo (9) entrega el n?mero de procesos corriendo %concurrent processed running&. Cuando el n?mero no sirve< es cero pero aumenta el n?mero de procesos. Cuando el pjaro se para # se mueve< significa que un proceso parti. 1i el pjaro esta de pie pero deja de moverse por un tiempo largo< est enfermo< es decir< algo anda mal. En este caso ,a# que reiniciar el Wea E!plorer. III) #RE #RO%E&O Abrir ar'(i)o* Los primeros tres botones en la parte superior de la seccin de proceso permite abrir datos en Wea: - 6pen fileD aparece un cuadro de dilogo para poder buscar (8ro5se) las datos %data& en el sistema de arc,ivo local. - 6pen ;@LD pregunta por un (;niform @esourse locator /dress) de donde la data est guardada. - 6pen 48D lee la data de una base de datos. La manera ms fcil # ms com?n de obtener la data para introducir en Wea es aquella con formato /@EE %atribute relation file format& # cargarla usando el botn 6pen EileD %/@EE tienen e!tencin. arff&. A REA%I+N !E ,RA-A.O / A REA%I+N -A&E Austo debajo de la l$nea de botones ,a# dos cuadros: (base relation) # (Woring relation) - La (8ase @elation) es la relacin modificable %o data& que ,a sido cargado en Wea. - La (Woring @elation) es una copia de la (8ase @elation) completada con cualquier modificacin reali"ada con los %filters& filtros en el (pre process ) panel. Cuando una (@elation) es cargada por primera ve"< el (Woring @elation) es igual al (8ase @elation) # apenas cualquier filtro es aplicado a la data el (Woring relation) cambia # el (8ase @elation) sigue igual. 1i generamos otra acciones como (8uilding a Classifier)%creando clasificador& o (visuali"ing t,e data) %visuali"ando los datos& estamos siempre actuando en el (Woring relation). Los cuadros que describen las relaciones o (relation) tienen tres entradas: - @elation: el nombre de la relacin< es el mismo que el del arc,ivo que fue cargado. Los filtros decritos a continuacin< modifican el nombre de la relacin. - Instances: el n?mero de instancias en la data %data pointsFrecords& - /ttributes: el n?mero de atributos en la data %(features)&. ,RA-A.AN!O %ON A,RI-U,O& $A,,RI-U,E&) 8ajo el cuadro (8ase @elation) se encuentra el cuadro (/ttributes in 8ase @elation). E!isten tres botones # bajo ellos ,a# una lista de atributos en la base de relacin en curso %(Current 8ase @elation)&< la lista tiene tres columnas: - Co: un n?mero que identifica el atributo< en el orden que estn especificadas en el (data file). - 1election tic bo!es: permite seleccionar quG atributos estn presentes en el (Woring relation). - Came: el nombre del atributo< como fue declarado en el (data file). Cuando se clicea en las distintas filas en la lista de atributos< los campos cambian a la derec,a< al cuadro llamado (/ttribute information for base relation). Este cuadro despliega las caracter$sticas de los atributos en la lista %Currentl# ,ig,lig,ted attribute in t,e list&: - Came: el nombre del atributo es el mismo dado al atributo en la lista. - :#pe: el tipo de atributo< ms com?nmente nominal o numGrico. - >issing: el n?mero %# porcentaje& de instancias que en el data falta el atributo %no especificado&. - 4istinct: el n?mero de diferentes valores que el data contiene para este atributo. - ;nique: el n?mero %# porcentaje& de instancias en la data que tienen un valor para este atributo que ninguna otra instancia tiene. 8ajo estas estad$sticas e!iste una lista que muestra ms informacin acerca de los valores guardados en este atributo< que difieren dependiendo de su tipo. 1i el atributo es nominal< la lista consiste en cada valor posible para el atributo a lo largo del n?mero de instancias que tienen este valor. 1i el atributo es numGrico< la lista muestra cuatro estad$sticos que describen la distribucin de los valores en la data %min.< m!.< (mean)# desviacin estndar& 3olviendo a la lista de atributos< para comen"ar con todas los (tic bo!es) estn ticeados. 'ueden cambiarse onFoff < ,aciendo clic en ellos individualmente. Los tres botones arriba pueden usarse para cambiar la seleccin tambiGn: - /ll: todos los cuadros ticeados. - Cone: ning?n cuadro ticeado. - Invert: los ticeados se vuelven no ticeados # viceversa. C6:/: El (/ttribute tic) es un filtro que es aplicado antes que cualquier otro filtro # a su ve" como cualquier filtro< cualquier cambio que se ,aga no tendr efecto ,asta que se ,aga clic en el botn (/ppl# Eilters). ,RA-A.AN!O %ON 0I,RO& La seccin de pre proceso< permite a los filtros definir las transformaciones de la data en varias formas. El cuadro (Eilters) se usa para ,acer un (set up) de los filtros requeridos. /rriba del cuadro (filters) e!iste un campo de te!to con el nombre de un filtro seguido por algunas opciones. =aciendo clic en este cuadro< se obtiene un cuadro de dilogo con un editor de objetos genGricos %generic object editor&. %UA!RO !E !I1OGO $GENERI% O-.E%, E!I,OR) 'ermite escoger un filtro # tener sus opciones de configuracin. El mismo tipo de cuadro de dilogo es usado para otros objetos como clasificadores %classifiers& # agrupadores %clusters&< como se ver a continuacin. ;n simple clic en el botn i"quierdo del >ouse en el nombre del filtro< en la parte superior de la ventana< genera un la lista %drop do5n list& de todos los filtros< a,$ se ,ace clic en el requerido. Cuando es escogido un filtro< el campo en la ventana cambia para reflejar las opciones disponibles. =aciendo clic en cualquiera de Gstas< da la oportunidad de cambiar su configuracin %settings&. 'or ejemplo< la configuracin puede tomar un string de te!to< en este caso ,a# que tipiar el te!to en el campo de te!to dado. En otros casos se da un cuadro que lista los distintos estados que se pueden elegir %drop do5n list&. E!isten casos que suceden otras opciones dependiendo de la informacin que se requiere. /lgunos objetos muestran una descripcin %brief description& de que ,acen en un cuadro acerca deD %/bout 8o!& que tiene un botn (>ore)< ,aciendo clic en este botn< aparece una ventana que describe las distintas opciones que se pueden reali"ar. En el botn del dilogo (7eneric 6bject Editor) e!isten cuatro botones< los primeros dos< 6'ECD # 1/3ED< permiten guardar las configuraciones de objetos para usos posteriores. El botn C/CCEL< termina la operacin # vuelve atrs sin guardar ning?n cambio. Cuando se estG de acuerdo con todos los objetos # configuracin elegida< clicear 6B # retornar a la ventana principal de E9'L6@E@. A#I%AN!O 0I,RO& El proceso general de configuracin< es elegir el filtro deseado # sus opciones< luego ,acer clic en el botn (/dd) para sumarlo a la lista. Los filtros solo sern aplicados cuando se ,ace clic en el botn (/ppl# Eilters) # sern aplicadas en el orden que apare"can en la lista. 1e puede remover en cualquier filtro de la lista con el botn (4elete). El botn (@eplace) en la parte superior de la seccin de pre proceso reempla"a la (8ase @elation) con el (Current Woring @elation)< ,aciendo los cambios permanentes <al menos ,asta que un nuevo arc,ivo es cargado. Einalmente< el botn (1/3E)D en la parte superior derec,a de la pantalla< guarda el (Woring @elation) en arc,ivo de e!tencin /@EE< dejndolo ,abilitado para usos futuros. I2) %A&I0I%A%I+N $%A&&I0I%A,ION) 1ELECCI6C/C46 ;C CL/1IEIC/46@ En la parte superior de la seccin de clasificadores< est el cuadro (Cassifier). Este cuadro contiene un campo de te!to que da el nombre de los clasificadores seleccionados por el momento # sus opciones. =aciendo clic en el cuadro de te!to< muestra un cuadro de dilogo de un editor genGrico de objeto %generic object editor&< al igual que los filtros. Esto permite elegir un clasificador de los que estn disponibles en la Wea # configurarlo. O#%IONE& !E #RUE-A $,E&, O#,ION&) El resultado de aplicar el clasificador elegido ser< probado seg?n las opciones que sern configuradas ,aciendo clic en el cuadro (test options). E!isten . modos de prueba: - ;se training set: el clasificador es evaluado en torno a la calidad de prediccin de la clase de las instancias que fue entrenado. - 1upplied test set: el clasificador es evaluado en torno a calidad de prediccin de la clase de un set de instancias cargadas de un arc,ivo. =aciendo clic en el botn (1etD) genera un dilogo< por el cual se puede elegir el arc,ivo a probar %,acer el test&. - Cross- validation: el clasificador es evaluado por validacin cru"adas %Cross- validation< usando en n?mero de carpetas %folds& que fueron ingresadas en el campo de te!to (Eolds). - 'ercentage split: el clasificador es evaluado con respecto a la calidad de prediccin de un cierto porcentaje de datos %data&< en los cuales estn sustentadas las pruebas. La cantidad de datos %,eld& sustentada depende del valor ingresado en el campo (H). >a#ores alcances %opciones avan"adas& de opciones de prueba< pueden ser configuradas ,aciendo clic en botn (>ore optionsD): *& 6utput model:%salida del modelo& el modelo de clasificacin del set de total entrenamiento< puede ser visto< visuali"ado o tener otras salidas. +& 6utput per-class stats: %salida estad$stica por clase& las estad$sticas precisinFrellanado %precesionFrecall& # verdaderoFfalso %trueFfalse&< para cada clase pueden obtenerse. -& 6utput entrop# evaluation measures: %salida medidas de evaluacin de entrop$a&< estn incluidas en las salidas las evaluaciones de la entrop$a. .& 6utput confusion matri!: %matri" de confusin& la matri" de confusin de las predicciones de los clasificadores estn incluidas en las salidas 0& 1tore predictions for visuali"ation: %guarda predicciones de visuali"acin&: las predicciones de los clasificadores son recordados para poder ser visuali"ados. 2& Cost-sensitive evaluation: %evaluacin sensible de costo&< los errores son evaluados con respecto a matri" de costos. El botn (1etD)permite especificar la matri" de costos usada. I& @andom 1eed for 9 3alFHsplit: especifica semilla al a"ar %random seed& usada cuando se a"arisan los datos antes de dividirlos para propsitos de evaluacin. A,RI-U,O& !E %A&E Los clasificadores en Wea< estn diseJados para ser entrenados para predecir atributos de clase simple< el cual es el objetivo de la prediccin. /lgunos clasificadores solo pueden aprender clases nominales< otras solo numGricas %problemas de regresin&< # otra< pueden aprender ambas. 'or descarte< las clases sern el ?ltimo atributo en las datos. 1i se requiere entrenar un clasificador para predecir un atributo diferente< ,a# que ,acer clic en el cuadro< bajo el cuadro (:est options) para obtener una lista %drop do5n list& de atributos para elegir. EN,RENAMIEN,O !E %A&I0I%A!ORE& Cuando los clasificadores< las opciones de prueba # las clases #a estn configuradas< el proceso de aprendi"aje empie"a ,aciendo clic en el botn (1tart). >ientras el clasificador est ocupado en entrenamiento< el pjaro se mueve. 1e puede detener el entrenamiento en cualquier momento con el botn (1top). Cuando el entrenamiento est completo< el rea del clasificador de salidas %Classifier output&< a la derec,a del (4ispla#) est lleno de te!to describiendo el resultado del entrenamiento # de la prueba. ;na nueva entrada %lista de resultados& aparece en el cuadro (@esult list)< miramos la lista debajo con resultados< pero antes investigar el te!to que est en la salida. ,E",O !E &AI!A& !E %A&I0I%A!OR $%A&&I0IER OU,#U, ,E",) El te!to en el que (Classifier output) %salidas del clasificador& tiene %scroll bars& barras de seleccin< permitiendo buscar los resultados. /dems< se puede agrandar la ventana E!plorer< para tener un rea ma#or mostrada. Las salidas pueden ser obtenidas %split& en diversas secciones: *& @un information: lista de informacin que muestra las opciones< relaciones de nombre< instancias< atributos # modos de prueba de los tipos de aprendi"aje %learning sc,eme& que ten$an relacin con el proceso. +& Classifier model %full training set& modelo total de clasificacin: una representacin te!tual del modelo de clasificacin que fue producido en entrenamiento total de datos. -& Los resultados de las pruebas elegidas estn quebrantadas. .& 1ummar# %resumen&: una lista de estad$sticas< resumiendo cuan minucioso el clasificador pueda predecir la clase verdadera de las instancias bajo el modo de pruebas. 0& 4etailed accurac# b# class: un quiebre ms detallado por clase %detailed per-class brea do5n& de clasificador de prediccin %classifier prediction accurac#&. 2& Confusin matri!: muestra cuantas instancias ,an sido asignadas a cada clase. Elementos muestran el n?mero de ejemplos de prueba< las cuales la clase actual es la fila< # la clase predic,a es la columna. A I&,A !E RE&U,A!O& $RE&U, I&,) 4espuGs de entrenar varios clasificadores< la lista de resultados tendr varias entradas. =aciendo clic i"quierdo en las entradas %entries flics bac and fort,& entre varios resultados que ,an sido generados. =aciendo clic derec,o en una entrada se abre un men? conteniendo estos $tems: - 3ie5 in main 5indo5 %vista en ventana principal&: muestra las salidas en la ventana principal %igual que ,aciendo clic i"quierdo en la entrada %entr#&&. - 3ie5 in separate 5indo5 %visin en pantalla separada&:abre una ventana independiente para visuali"ar resultados. - 1ave result buffer %7uardar buffer de resultados&: genera un dilogo< permitiendo guardar el arc,ivo de te!to que contiene la salida de te!to. - Load model %cargando el modelo&: carga el objeto del modelo pre-entrenado de un arc,ivo binario. - 1ave model %guarda el modelo&: guarda un objeto de modelo en un arc,ivo binario. Los objetos son guardados en A/3/. - @e-evaluate model on current test set: el modelo #a construido # probado su desempeJo con los datos %data set& que fueron especificados con el botn (1etD) bajo la opcin (1upplied test set). - 3isuali"e classifier errors: genera una ventana de visuali"acin que grafica de los resultados de la clasificacin. Las instancias correctas sern representadas en forma de cruces< # las no correctas sern representadas en cuadrados. - 3isuali"e tree: genera una representacin grfica de la estructura del modelo de clasificacin< si es posible %solo est disponible con algunos clasificadores&. 1e puede generar men?< ,aciendo clic derec,o en una "ona en blanco< moviGndose por las opciones< moviendo el >ouse %pan around b# dragging t,e mouse& # ver las instancias de entrenamiento en cada nodo< ,aciendo clic en ellos. C:@L-clic ,ace "oom en las vistas< mientras que con 1=IE:- dragging< una caja ,ace "oom in. - 3isuali"e margin curve: genera un grfico que ilustra las predicciones del margen. El margen se define como la diferencia entre la prediccin de probabilidad para la clase actual # la probabilidad ms alta que se puede predecir para otras clases. 'or ejemplo< logaritmos de loasting< pueden alcan"ar mejores desempeJos en pruebas de datos con respecto a incrementar los mrgenes de las datas de entrenamiento. - 3isuali"e t,res,old curve: genera un grfico que muestra los (tradeoffs)en prediccin< que son obtenidos variando los valores del (t,res,old) de K.0< la probabilidad que se predijo positiva %positive&< debe ser ma#or que K.0 para instancias que deben predecirse positivas. La grfica puede ser usada para visuali"ar la 'recisionFrecall tradeoff< para el anlisis de la curva @6C %true positive rateF false positive rate& # para otro tipo de curvas. - 3isuali"e cost curve: genera una grfica que da una representacin e!pl$cita de los costos esperados< como los describen 4rummond # =alte %+KKK&. Las opciones son grilladas %gre#ed out& si no se aplica al set de resultados espec$ficos. 2) %U&,ERING &EE%%IONAN!O UN %U&,ER La siendo familiares el proceso de seleccin # los objetos de configuracin< ,aciendo clic en el (clustering sc,eme) listado en la caja (CL;1:E@E@) en la parte posterior de la ventana< muestra un dilogo (generic object editor) por el cual se puede seleccionar un nuevo (clustering sc,eme). %U&,ER MO!E& $MO!O& !E AGRU#A%I+N) La caja de (CL;1:E@ >64E1)< sirve apara elegir a quG se le va a aplicar cluster< # cmo evaluar los resultados. Las primeras tres opciones< son iguales a los de clasificacin: (;1E training set< 1upplied test set # percentage split %seccin .&)M con la diferencia que los datos son asignados para Cluster< en ve" de tratar de predecir una clase espec$fica. La cuarta opcin o modo es el (CL/11E1 :6 CL;1:E@ E3/L;/:I6C)< que compara quG tan bien el cluster elegido cal"a con clases pre-asignadas de datos. La caja drop do5n bajo estas opciones selecciona la clase< al igual que el panel (classif#). En la caja de (CL;1:E@ >64E) ,a# una opcin adicional< la (1tore clusters for visuali"ation) %guarda para visuali"ar& que contiene caja de ticeado< determina si es posible o no visuali"ar los cluster cuando el entrenamiento estG completo. Cuando se trabaje con datasets demasiado grandes< pueden e!istir problemas con la memoria< por lo que podr$a ser de a#uda des,abilitar esta opcin. IGNORAN!O A,RI-U,O& /lgunos atributos debern ser ignorados cundo se ,ace (clustering). El botn (Ignore attributes) genera una pequeJa ventana que permite escoger los atributos a ignorar. Esto se reali"a ,aciendo clic en los atributos< # si se quiere seleccionar un rango consecutivo< se ,ace apretando continuamente la tecla (s,ift) # para atributos separados con la tecla (C:@L). 'ara cancelar se ,ace con el botn (Cancel)< para activar se ,ace a travGs del botn (select). /s$< la pr!ima ve" que se ,aga clustering< los atributos seleccionados sern ignorados. A#REN!IEN!O %U&,ER& La seccin (cluster)< as$ como la seccin (classif#)< tienen botones 1tartF1top< una rea de resultado de te!to # una lista de resultados. Nstos se comportan igual que el contador de partes de clasificacin %classification counterparts&. =aciendo clic derec,o en una entrada en la lista de resultados< genera un men? similar< con la e!cepcin que solo muestra una opcin de visuali"acin: (3I1;/LIOE CL;1:E@ /11I7>EC:). 2I) A&O%IAN!O $A&&O%IA,ING) %ON0IGURAN!O $&E,,ING U#) WEB/ tiene una /sociacin de aprendi"aje %sc,eme for learning assotiations& llamado (/priori). =aciendo clic en la caja (/ssociator) en la parte superior de la ventana genera las configuraciones para (/priori)< no ,a# otros asociadores para escoger. :ampoco ,a# opciones e!tras para probar el %learning sc,eme& aprendi"aje. A#REN!IEN!O A&O%IA%IONE& $EARNING A&&O%IA,ION&) La configurados los parmetros apropiados para (/priori)< ,acer clic en el botn (1tart). Cuando se complete el proceso< ,acer clic derec,o en alguna entrada< as$ se podr ver o guardar los resultados. 2II) &EE%%IONAN!O A,RI-U,O& -3&4UE!A / E2AUA%I+N La seleccin de atributos envuelve la b?squeda en todas las posibles combinaciones de atributos de datos para encontrar que sub-conjuntos de atributos trabajan mejor para la prediccin. 'ara ,acer esto< dos objetos debern ser configurados: ;n evaluador de atributos %attribute evaluator& # un mGtodo de b?squeda %searc, met,od&. El evaluador determina quG mGtodo es usado para asignar un (W6@:=) a cada subconjunto de atributos. El mGtodo de b?squeda determina quG estilo de b?squeda se desarrollar. O#%IONE& $O#,ION&) La caja (/::@I8;:E 1ELEC:I6C1 >64E) tiene dos opciones: - ;se full training set %5ort, of t,e attribute subset&: el peor de los subconjuntos de atributos es determinado usando el conjunto de entrenamiento de datos total %full set of training data&. - Cross-validation: el peor de los subconjuntos de atributos est determinado por un proceso de validacin cru"ada %cross-validation&. Los comps (Eold) # (1eed) especifica el n?mero de registros %(Eolds)& a usar # el (@andom seed) organi"a los datos. /l igual que (Classif#) %seccin .& e!iste un cuadro drop do5n donde se pueden especificar quG atributos tratar %5,ic, attribute to treat as t,e class&. 5A%IEN!O &EE%%I+N $#ER0ARMING &EE%,ION) =aciendo clic en (1tart)< corre el proceso de seleccin de atributos. Cuando termina< los resultados salen en el rea de los resultados< # una entrada se agrega en la lista de resultados< al ,acer clic derec,o en el resultado se generan varias opciones: las tres primeras %vie5 in main 5indo5< vie5 in separate 5indo5 # save result buffer& son iguales que el caso del panel de clasificacin %Classif# panel&. 1i se ,a utili"ado un transformador de atributos %attribute transformer& como componentes principales. % 'rincipal components&< un cuarto item aparece activo: (3isuali"e transformed data). 2III) 2I&UAI6AN!O $2I&UAI6ING) La seccin de visuali"acin de WEB/< permite visuali"ar grficas en +4 de las relaciones de trabajo %5oring relation& en distintos momentos. 'ara ello se usan los controles de visuali"acin #a descritos. %AM-IAN!O A 2I&UA Los puntos de las datos estarn ploteados en el rea principal de la ventana. En la parte superior ,a# dos botones de listas %drop do5n& para seleccionar los ejes del grfico. El de la i"quierda< muestra los atributos del eje 9< # el de la derec,a el atributo del eje L. En el selector del eje 9< e!iste una lista para seleccionar colores< esto permite cambiar el color de los puntos basados en alg?n atributo seleccionado. 8ajo el rea de graficado< e!iste una le#enda que describe quG significa cada color en la grfica. 1i los valores son discretos< se pueden modificar los colores de cada uno ,aciendo clic en ellas< # ,aciendo una correcta seleccin en las ventanas emergentes. / la derec,a del rea del grfico e!isten una serie de (strips) ,ori"ontales< donde cada uno de estos strips representa un atributo # los puntos muestran la distribucin de los valores del atributo. Estos valores estn a"arosamente (scattered) verticalmente< para a#udar a ver los puntos de concentracin. 1e puede seleccionar quG ejes sern usados en el grfico principal ,aciendo clic en las (strips).=aciendo clic i"quierdo en los strip de atributos cambia el eje 9 para ese atributo< # el eje L< se cambia ,aciendo clic derec,o. Los ejes estn marcados con las letras 9 e L para identificarlas. 1obre los strips de atributos< se muestra un (slider) %barra de desli"amiento& llamado (AI::E@) que es un despliegue a"aroso dado a todos los puntos de la grfica. /rrastrndolo %dragging& a la derec,a aumenta el tamaJo de (AI::E@)< que es ?til para probar las concentraciones de los puntos. 1in AI::E@ millones de instancias no se vern diferentes %en un mismo punto o como una sola instancia&. &EE%%IONAN IN&,AN%IA& =a# situaciones que es de a#uda seleccionar un subconjunto de datos al usar una ,erramienta de visuali"acin. ;n caso especial de esto es el (;ser Classiffier)< que permite crear un clasificador propio por medio de selecciones interactivas. 8ajo el botn selector del eje L< e!iste un botn lista %drop do5n& para elegir un mGtodo de seleccin. ;n grupo de datos pueden seleccionarse de cuatro maneras: *& 1elect instance: ,aciendo clic en un punto individual genera una ventana que lista los atributos. 1i ,a# ms de un punto en el mismo lugar< ms de una lista aparecer. +& @ectangle: se puede crear un rectngulo arrastrando< as$ se seleccionan los puntos dentro de Gl. -& 'oligon: se puede crear un pol$gono de cualquier forma< que selecciona los puntos dentro de Gl. =aciendo clic i"quierdo para agregar vGrtices del pol$gono # clic derec,o para completarlo. El pol$gono se cerrar por orden de generar los puntos. .& 'ol#line: se pueden generar l$neas que distinguen los puntos de un lado # del otro. =aciendo clic i"quierdo para fijar las vGrtices de las l$neas # clic derec,o para terminar. En este caso las figuras son abiertas. Cuando el rea graficada fue seleccionada con reclangle< pol#gon o pol#line se torna gris. En este momento al ,acer clic en el botn (submit) remueve todas las instancias de la grfica e!cepto las que estn grises %reas de seleccin&. =aciendo clic en botn (clear) borra el rea de seleccin no afectando la grfica. Cuando cualquier punto ,a sido removido de la grfica el botn (submit) cambia a botn (reset). Este botn deja sin efecto los actos previos de remover< # retorna al grfico original con todos los puntos incluidos. Einalmente< ,aciendo clic en el botn (save) permite guardar las instancias visibles en un arc,ivo nuevo de e!tencin. /@EE.