Sie sind auf Seite 1von 10

Manual WEKA Explorer

Realizado por: Alfredo Gmez Norambuena


I) WEKA
Weka GUI: ventana para ambientes grficos. En la parte inferior estn estos tres botones:
- simple CLI: comando que permite directa ejecucin de comandos Wea..
- E!plorer: e!plorar datos con Wea.
- E!perimenter: para reali"ar e!perimentos # conductas estad$sticas %test& %e!iste un
tutorial espec$fico para ello&.
II) WEKA KNOWE!GE E"#ORER
E"#ORER $'arte superior de la ventana %bajo el t$tulo&&.
'rimero el primer (tab) est activo # las otras en gris.
Esto es por que es necesario abrir un (data set) antes de e!plorar la data
Los (tabs) son:
*& 're process: seleccionar # modificar la data que se va a usar.
+& Classif#: entrenar # testear sistemas de aprendi"aje %learning sc,emes& que clasifican #
generan regresin.
-& Cluster: aprender agrupacin de los datos%data&.
.& /ssociate: aprender reglas de asociacin para los datos %data&.
0& 1eleccionar atributos: seleccionar los atributos ms importantes del data.
2& 3isuali"e: ver grfica interactiva +4 del data.
En cada tab cuando estn activos se abrirn distintas pantallas donde se pueden reali"ar las
diferentes acciones.
La parte inferior de la ventana %from t,e log bo! do5n5ords& se mantiene visible sin observar
en que seleccin se encuentra.
L67 869 %en la parte inferior de la ventana&
Contiene una barra de movimiento %escrollable te!t field&
Cada l$nea de te!to queda registrada con la ,ora que fue ingresada al log.
Cuando se generan acciones en Wea el log mantiene un registro de lo que sucede.
1:/:;1 869 %en el e!tremo inferior de la ventana bajo el log bo!&
4espliega mensajes que mantienen informado de lo que sucede.
'or ejemplo: si el E!plorer est ocupado cargando un arc,ivo< el 1tatus 8o! lo dir.
:I'
=aciendo clic en botn derec,o del >ouse< dentro del 1tatus 8o! se genera un men? con
dos opciones:
- /vailable memor#: despliega en el Log 8o! la cantidad de memoria disponible para
Wea.
- @un 7arbage Collector: fuer"a el colector de basura de A/3/ para buscar la
memoria que no es usada para liberarla< permitiendo el uso de memoria para nuevas
operaciones %tass&
=a# que destacar que el colector de basura< est corriendo constantemente igual como
(bacground tas).
WEB/ 1:/:;1 IC6C % a la derec,a del 1tatus 8o!&
Cuando no ,a# procesos corriendo el pjaro se sienta # toma una siesta.
El n?mero al lado del s$mbolo (9) entrega el n?mero de procesos corriendo %concurrent
processed running&. Cuando el n?mero no sirve< es cero pero aumenta el n?mero de procesos.
Cuando el pjaro se para # se mueve< significa que un proceso parti.
1i el pjaro esta de pie pero deja de moverse por un tiempo largo< est enfermo< es decir< algo
anda mal.
En este caso ,a# que reiniciar el Wea E!plorer.
III) #RE #RO%E&O
Abrir ar'(i)o*
Los primeros tres botones en la parte superior de la seccin de proceso permite abrir datos en
Wea:
- 6pen fileD aparece un cuadro de dilogo para poder buscar (8ro5se) las datos %data&
en el sistema de arc,ivo local.
- 6pen ;@LD pregunta por un (;niform @esourse locator /dress) de donde la data
est guardada.
- 6pen 48D lee la data de una base de datos.
La manera ms fcil # ms com?n de obtener la data para introducir en Wea es aquella con
formato /@EE %atribute relation file format& # cargarla usando el botn 6pen EileD %/@EE
tienen e!tencin. arff&.
A REA%I+N !E ,RA-A.O / A REA%I+N -A&E
Austo debajo de la l$nea de botones ,a# dos cuadros: (base relation) # (Woring relation)
- La (8ase @elation) es la relacin modificable %o data& que ,a sido cargado en Wea.
- La (Woring @elation) es una copia de la (8ase @elation) completada con cualquier
modificacin reali"ada con los %filters& filtros en el (pre process ) panel.
Cuando una (@elation) es cargada por primera ve"< el (Woring @elation) es igual al (8ase
@elation) # apenas cualquier filtro es aplicado a la data el (Woring relation) cambia # el
(8ase @elation) sigue igual.
1i generamos otra acciones como (8uilding a Classifier)%creando clasificador& o (visuali"ing
t,e data) %visuali"ando los datos& estamos siempre actuando en el (Woring relation).
Los cuadros que describen las relaciones o (relation) tienen tres entradas:
- @elation: el nombre de la relacin< es el mismo que el del arc,ivo que fue cargado.
Los filtros decritos a continuacin< modifican el nombre de la relacin.
- Instances: el n?mero de instancias en la data %data pointsFrecords&
- /ttributes: el n?mero de atributos en la data %(features)&.
,RA-A.AN!O %ON A,RI-U,O& $A,,RI-U,E&)
8ajo el cuadro (8ase @elation) se encuentra el cuadro (/ttributes in 8ase @elation). E!isten
tres botones # bajo ellos ,a# una lista de atributos en la base de relacin en curso %(Current
8ase @elation)&< la lista tiene tres columnas:
- Co: un n?mero que identifica el atributo< en el orden que estn especificadas en el
(data file).
- 1election tic bo!es: permite seleccionar quG atributos estn presentes en el (Woring
relation).
- Came: el nombre del atributo< como fue declarado en el (data file).
Cuando se clicea en las distintas filas en la lista de atributos< los campos cambian a la
derec,a< al cuadro llamado (/ttribute information for base relation). Este cuadro despliega
las caracter$sticas de los atributos en la lista %Currentl# ,ig,lig,ted attribute in t,e list&:
- Came: el nombre del atributo es el mismo dado al atributo en la lista.
- :#pe: el tipo de atributo< ms com?nmente nominal o numGrico.
- >issing: el n?mero %# porcentaje& de instancias que en el data falta el atributo %no
especificado&.
- 4istinct: el n?mero de diferentes valores que el data contiene para este atributo.
- ;nique: el n?mero %# porcentaje& de instancias en la data que tienen un valor para este
atributo que ninguna otra instancia tiene.
8ajo estas estad$sticas e!iste una lista que muestra ms informacin acerca de los valores
guardados en este atributo< que difieren dependiendo de su tipo.
1i el atributo es nominal< la lista consiste en cada valor posible para el atributo a lo largo del
n?mero de instancias que tienen este valor.
1i el atributo es numGrico< la lista muestra cuatro estad$sticos que describen la distribucin de
los valores en la data %min.< m!.< (mean)# desviacin estndar&
3olviendo a la lista de atributos< para comen"ar con todas los (tic bo!es) estn ticeados.
'ueden cambiarse onFoff < ,aciendo clic en ellos individualmente.
Los tres botones arriba pueden usarse para cambiar la seleccin tambiGn:
- /ll: todos los cuadros ticeados.
- Cone: ning?n cuadro ticeado.
- Invert: los ticeados se vuelven no ticeados # viceversa.
C6:/: El (/ttribute tic) es un filtro que es aplicado antes que cualquier otro filtro # a su
ve" como cualquier filtro< cualquier cambio que se ,aga no tendr efecto ,asta que se ,aga
clic en el botn (/ppl# Eilters).
,RA-A.AN!O %ON 0I,RO&
La seccin de pre proceso< permite a los filtros definir las transformaciones de la data en
varias formas.
El cuadro (Eilters) se usa para ,acer un (set up) de los filtros requeridos.
/rriba del cuadro (filters) e!iste un campo de te!to con el nombre de un filtro seguido por
algunas opciones. =aciendo clic en este cuadro< se obtiene un cuadro de dilogo con un
editor de objetos genGricos %generic object editor&.
%UA!RO !E !I1OGO $GENERI% O-.E%, E!I,OR)
'ermite escoger un filtro # tener sus opciones de configuracin.
El mismo tipo de cuadro de dilogo es usado para otros objetos como clasificadores
%classifiers& # agrupadores %clusters&< como se ver a continuacin.
;n simple clic en el botn i"quierdo del >ouse en el nombre del filtro< en la parte superior
de la ventana< genera un la lista %drop do5n list& de todos los filtros< a,$ se ,ace clic en el
requerido. Cuando es escogido un filtro< el campo en la ventana cambia para reflejar las
opciones disponibles. =aciendo clic en cualquiera de Gstas< da la oportunidad de cambiar su
configuracin %settings&.
'or ejemplo< la configuracin puede tomar un string de te!to< en este caso ,a# que tipiar el
te!to en el campo de te!to dado.
En otros casos se da un cuadro que lista los distintos estados que se pueden elegir %drop do5n
list&.
E!isten casos que suceden otras opciones dependiendo de la informacin que se requiere.
/lgunos objetos muestran una descripcin %brief description& de que ,acen en un cuadro
acerca deD %/bout 8o!& que tiene un botn (>ore)< ,aciendo clic en este botn< aparece
una ventana que describe las distintas opciones que se pueden reali"ar.
En el botn del dilogo (7eneric 6bject Editor) e!isten cuatro botones< los primeros dos<
6'ECD # 1/3ED< permiten guardar las configuraciones de objetos para usos posteriores.
El botn C/CCEL< termina la operacin # vuelve atrs sin guardar ning?n cambio.
Cuando se estG de acuerdo con todos los objetos # configuracin elegida< clicear 6B #
retornar a la ventana principal de E9'L6@E@.
A#I%AN!O 0I,RO&
El proceso general de configuracin< es elegir el filtro deseado # sus opciones< luego ,acer
clic en el botn (/dd) para sumarlo a la lista. Los filtros solo sern aplicados cuando se ,ace
clic en el botn (/ppl# Eilters) # sern aplicadas en el orden que apare"can en la lista. 1e
puede remover en cualquier filtro de la lista con el botn (4elete).
El botn (@eplace) en la parte superior de la seccin de pre proceso reempla"a la (8ase
@elation) con el (Current Woring @elation)< ,aciendo los cambios permanentes <al menos
,asta que un nuevo arc,ivo es cargado.
Einalmente< el botn (1/3E)D en la parte superior derec,a de la pantalla< guarda el
(Woring @elation) en arc,ivo de e!tencin /@EE< dejndolo ,abilitado para usos futuros.
I2) %A&I0I%A%I+N $%A&&I0I%A,ION)
1ELECCI6C/C46 ;C CL/1IEIC/46@
En la parte superior de la seccin de clasificadores< est el cuadro (Cassifier). Este cuadro
contiene un campo de te!to que da el nombre de los clasificadores seleccionados por el
momento # sus opciones. =aciendo clic en el cuadro de te!to< muestra un cuadro de dilogo
de un editor genGrico de objeto %generic object editor&< al igual que los filtros.
Esto permite elegir un clasificador de los que estn disponibles en la Wea # configurarlo.
O#%IONE& !E #RUE-A $,E&, O#,ION&)
El resultado de aplicar el clasificador elegido ser< probado seg?n las opciones que sern
configuradas ,aciendo clic en el cuadro (test options).
E!isten . modos de prueba:
- ;se training set: el clasificador es evaluado en torno a la calidad de prediccin de la
clase de las instancias que fue entrenado.
- 1upplied test set: el clasificador es evaluado en torno a calidad de prediccin de la
clase de un set de instancias cargadas de un arc,ivo.
=aciendo clic en el botn (1etD) genera un dilogo< por el cual se puede elegir el
arc,ivo a probar %,acer el test&.
- Cross- validation: el clasificador es evaluado por validacin cru"adas %Cross-
validation< usando en n?mero de carpetas %folds& que fueron ingresadas en el campo de
te!to (Eolds).
- 'ercentage split: el clasificador es evaluado con respecto a la calidad de prediccin de
un cierto porcentaje de datos %data&< en los cuales estn sustentadas las pruebas. La
cantidad de datos %,eld& sustentada depende del valor ingresado en el campo (H).
>a#ores alcances %opciones avan"adas& de opciones de prueba< pueden ser configuradas
,aciendo clic en botn (>ore optionsD):
*& 6utput model:%salida del modelo& el modelo de clasificacin del set de total
entrenamiento< puede ser visto< visuali"ado o tener otras salidas.
+& 6utput per-class stats: %salida estad$stica por clase& las estad$sticas precisinFrellanado
%precesionFrecall& # verdaderoFfalso %trueFfalse&< para cada clase pueden obtenerse.
-& 6utput entrop# evaluation measures: %salida medidas de evaluacin de entrop$a&< estn
incluidas en las salidas las evaluaciones de la entrop$a.
.& 6utput confusion matri!: %matri" de confusin& la matri" de confusin de las
predicciones de los clasificadores estn incluidas en las salidas
0& 1tore predictions for visuali"ation: %guarda predicciones de visuali"acin&: las
predicciones de los clasificadores son recordados para poder ser visuali"ados.
2& Cost-sensitive evaluation: %evaluacin sensible de costo&< los errores son evaluados
con respecto a matri" de costos. El botn (1etD)permite especificar la matri" de
costos usada.
I& @andom 1eed for 9 3alFHsplit: especifica semilla al a"ar %random seed& usada cuando
se a"arisan los datos antes de dividirlos para propsitos de evaluacin.
A,RI-U,O& !E %A&E
Los clasificadores en Wea< estn diseJados para ser entrenados para predecir atributos de
clase simple< el cual es el objetivo de la prediccin. /lgunos clasificadores solo pueden
aprender clases nominales< otras solo numGricas %problemas de regresin&< # otra< pueden
aprender ambas.
'or descarte< las clases sern el ?ltimo atributo en las datos. 1i se requiere entrenar un
clasificador para predecir un atributo diferente< ,a# que ,acer clic en el cuadro< bajo el
cuadro (:est options) para obtener una lista %drop do5n list& de atributos para elegir.
EN,RENAMIEN,O !E %A&I0I%A!ORE&
Cuando los clasificadores< las opciones de prueba # las clases #a estn configuradas< el
proceso de aprendi"aje empie"a ,aciendo clic en el botn (1tart). >ientras el clasificador
est ocupado en entrenamiento< el pjaro se mueve. 1e puede detener el entrenamiento en
cualquier momento con el botn (1top). Cuando el entrenamiento est completo< el rea del
clasificador de salidas %Classifier output&< a la derec,a del (4ispla#) est lleno de te!to
describiendo el resultado del entrenamiento # de la prueba.
;na nueva entrada %lista de resultados& aparece en el cuadro (@esult list)< miramos la lista
debajo con resultados< pero antes investigar el te!to que est en la salida.
,E",O !E &AI!A& !E %A&I0I%A!OR
$%A&&I0IER OU,#U, ,E",)
El te!to en el que (Classifier output) %salidas del clasificador& tiene %scroll bars& barras de
seleccin< permitiendo buscar los resultados. /dems< se puede agrandar la ventana E!plorer<
para tener un rea ma#or mostrada.
Las salidas pueden ser obtenidas %split& en diversas secciones:
*& @un information: lista de informacin que muestra las opciones< relaciones de
nombre< instancias< atributos # modos de prueba de los tipos de aprendi"aje %learning
sc,eme& que ten$an relacin con el proceso.
+& Classifier model %full training set& modelo total de clasificacin: una representacin
te!tual del modelo de clasificacin que fue producido en entrenamiento total de datos.
-& Los resultados de las pruebas elegidas estn quebrantadas.
.& 1ummar# %resumen&: una lista de estad$sticas< resumiendo cuan minucioso el
clasificador pueda predecir la clase verdadera de las instancias bajo el modo de
pruebas.
0& 4etailed accurac# b# class: un quiebre ms detallado por clase %detailed per-class
brea do5n& de clasificador de prediccin %classifier prediction accurac#&.
2& Confusin matri!: muestra cuantas instancias ,an sido asignadas a cada clase.
Elementos muestran el n?mero de ejemplos de prueba< las cuales la clase actual es la
fila< # la clase predic,a es la columna.
A I&,A !E RE&U,A!O& $RE&U, I&,)
4espuGs de entrenar varios clasificadores< la lista de resultados tendr varias entradas.
=aciendo clic i"quierdo en las entradas %entries flics bac and fort,& entre varios
resultados que ,an sido generados. =aciendo clic derec,o en una entrada se abre un
men? conteniendo estos $tems:
- 3ie5 in main 5indo5 %vista en ventana principal&: muestra las salidas en la ventana
principal %igual que ,aciendo clic i"quierdo en la entrada %entr#&&.
- 3ie5 in separate 5indo5 %visin en pantalla separada&:abre una ventana
independiente para visuali"ar resultados.
- 1ave result buffer %7uardar buffer de resultados&: genera un dilogo< permitiendo
guardar el arc,ivo de te!to que contiene la salida de te!to.
- Load model %cargando el modelo&: carga el objeto del modelo pre-entrenado de un
arc,ivo binario.
- 1ave model %guarda el modelo&: guarda un objeto de modelo en un arc,ivo binario.
Los objetos son guardados en A/3/.
- @e-evaluate model on current test set: el modelo #a construido # probado su
desempeJo con los datos %data set& que fueron especificados con el botn (1etD) bajo
la opcin (1upplied test set).
- 3isuali"e classifier errors: genera una ventana de visuali"acin que grafica de los
resultados de la clasificacin. Las instancias correctas sern representadas en forma
de cruces< # las no correctas sern representadas en cuadrados.
- 3isuali"e tree: genera una representacin grfica de la estructura del modelo de
clasificacin< si es posible %solo est disponible con algunos clasificadores&. 1e puede
generar men?< ,aciendo clic derec,o en una "ona en blanco< moviGndose por las
opciones< moviendo el >ouse %pan around b# dragging t,e mouse& # ver las instancias
de entrenamiento en cada nodo< ,aciendo clic en ellos. C:@L-clic ,ace "oom en las
vistas< mientras que con 1=IE:- dragging< una caja ,ace "oom in.
- 3isuali"e margin curve: genera un grfico que ilustra las predicciones del margen. El
margen se define como la diferencia entre la prediccin de probabilidad para la clase
actual # la probabilidad ms alta que se puede predecir para otras clases. 'or ejemplo<
logaritmos de loasting< pueden alcan"ar mejores desempeJos en pruebas de datos con
respecto a incrementar los mrgenes de las datas de entrenamiento.
- 3isuali"e t,res,old curve: genera un grfico que muestra los (tradeoffs)en prediccin<
que son obtenidos variando los valores del (t,res,old) de K.0< la probabilidad que se
predijo positiva %positive&< debe ser ma#or que K.0 para instancias que deben
predecirse positivas. La grfica puede ser usada para visuali"ar la 'recisionFrecall
tradeoff< para el anlisis de la curva @6C %true positive rateF false positive rate& #
para otro tipo de curvas.
- 3isuali"e cost curve: genera una grfica que da una representacin e!pl$cita de los
costos esperados< como los describen 4rummond # =alte %+KKK&.
Las opciones son grilladas %gre#ed out& si no se aplica al set de resultados espec$ficos.
2) %U&,ERING
&EE%%IONAN!O UN %U&,ER
La siendo familiares el proceso de seleccin # los objetos de configuracin< ,aciendo clic en
el (clustering sc,eme) listado en la caja (CL;1:E@E@) en la parte posterior de la ventana<
muestra un dilogo (generic object editor) por el cual se puede seleccionar un nuevo
(clustering sc,eme).
%U&,ER MO!E& $MO!O& !E AGRU#A%I+N)
La caja de (CL;1:E@ >64E1)< sirve apara elegir a quG se le va a aplicar cluster< # cmo
evaluar los resultados. Las primeras tres opciones< son iguales a los de clasificacin:
(;1E training set< 1upplied test set # percentage split %seccin .&)M con la diferencia que los
datos son asignados para Cluster< en ve" de tratar de predecir una clase espec$fica.
La cuarta opcin o modo es el (CL/11E1 :6 CL;1:E@ E3/L;/:I6C)< que compara
quG tan bien el cluster elegido cal"a con clases pre-asignadas de datos. La caja drop do5n
bajo estas opciones selecciona la clase< al igual que el panel (classif#).
En la caja de (CL;1:E@ >64E) ,a# una opcin adicional< la (1tore clusters for
visuali"ation) %guarda para visuali"ar& que contiene caja de ticeado< determina si es posible o
no visuali"ar los cluster cuando el entrenamiento estG completo. Cuando se trabaje con
datasets demasiado grandes< pueden e!istir problemas con la memoria< por lo que podr$a ser
de a#uda des,abilitar esta opcin.
IGNORAN!O A,RI-U,O&
/lgunos atributos debern ser ignorados cundo se ,ace (clustering). El botn (Ignore
attributes) genera una pequeJa ventana que permite escoger los atributos a ignorar. Esto se
reali"a ,aciendo clic en los atributos< # si se quiere seleccionar un rango consecutivo< se ,ace
apretando continuamente la tecla (s,ift) # para atributos separados con la tecla (C:@L). 'ara
cancelar se ,ace con el botn (Cancel)< para activar se ,ace a travGs del botn (select). /s$<
la pr!ima ve" que se ,aga clustering< los atributos seleccionados sern ignorados.
A#REN!IEN!O %U&,ER&
La seccin (cluster)< as$ como la seccin (classif#)< tienen botones 1tartF1top< una rea de
resultado de te!to # una lista de resultados. Nstos se comportan igual que el contador de partes
de clasificacin %classification counterparts&. =aciendo clic derec,o en una entrada en la lista
de resultados< genera un men? similar< con la e!cepcin que solo muestra una opcin de
visuali"acin: (3I1;/LIOE CL;1:E@ /11I7>EC:).
2I) A&O%IAN!O $A&&O%IA,ING)
%ON0IGURAN!O $&E,,ING U#)
WEB/ tiene una /sociacin de aprendi"aje %sc,eme for learning assotiations& llamado
(/priori). =aciendo clic en la caja (/ssociator) en la parte superior de la ventana genera las
configuraciones para (/priori)< no ,a# otros asociadores para escoger. :ampoco ,a#
opciones e!tras para probar el %learning sc,eme& aprendi"aje.
A#REN!IEN!O A&O%IA%IONE& $EARNING A&&O%IA,ION&)
La configurados los parmetros apropiados para (/priori)< ,acer clic en el botn (1tart).
Cuando se complete el proceso< ,acer clic derec,o en alguna entrada< as$ se podr ver o
guardar los resultados.
2II) &EE%%IONAN!O A,RI-U,O&
-3&4UE!A / E2AUA%I+N
La seleccin de atributos envuelve la b?squeda en todas las posibles combinaciones de
atributos de datos para encontrar que sub-conjuntos de atributos trabajan mejor para la
prediccin. 'ara ,acer esto< dos objetos debern ser configurados: ;n evaluador de atributos
%attribute evaluator& # un mGtodo de b?squeda %searc, met,od&. El evaluador determina quG
mGtodo es usado para asignar un (W6@:=) a cada subconjunto de atributos. El mGtodo de
b?squeda determina quG estilo de b?squeda se desarrollar.
O#%IONE& $O#,ION&)
La caja (/::@I8;:E 1ELEC:I6C1 >64E) tiene dos opciones:
- ;se full training set %5ort, of t,e attribute subset&: el peor de los subconjuntos de
atributos es determinado usando el conjunto de entrenamiento de datos total %full set
of training data&.
- Cross-validation: el peor de los subconjuntos de atributos est determinado por un
proceso de validacin cru"ada %cross-validation&. Los comps (Eold) # (1eed)
especifica el n?mero de registros %(Eolds)& a usar # el (@andom seed) organi"a los
datos.
/l igual que (Classif#) %seccin .& e!iste un cuadro drop do5n donde se pueden especificar
quG atributos tratar %5,ic, attribute to treat as t,e class&.
5A%IEN!O &EE%%I+N $#ER0ARMING &EE%,ION)
=aciendo clic en (1tart)< corre el proceso de seleccin de atributos. Cuando termina< los
resultados salen en el rea de los resultados< # una entrada se agrega en la lista de resultados<
al ,acer clic derec,o en el resultado se generan varias opciones: las tres primeras %vie5 in
main 5indo5< vie5 in separate 5indo5 # save result buffer& son iguales que el caso del panel
de clasificacin %Classif# panel&. 1i se ,a utili"ado un transformador de atributos %attribute
transformer& como componentes principales. % 'rincipal components&< un cuarto item aparece
activo: (3isuali"e transformed data).
2III) 2I&UAI6AN!O $2I&UAI6ING)
La seccin de visuali"acin de WEB/< permite visuali"ar grficas en +4 de las relaciones de
trabajo %5oring relation& en distintos momentos. 'ara ello se usan los controles de
visuali"acin #a descritos.
%AM-IAN!O A 2I&UA
Los puntos de las datos estarn ploteados en el rea principal de la ventana. En la parte
superior ,a# dos botones de listas %drop do5n& para seleccionar los ejes del grfico.
El de la i"quierda< muestra los atributos del eje 9< # el de la derec,a el atributo del eje L. En
el selector del eje 9< e!iste una lista para seleccionar colores< esto permite cambiar el color de
los puntos basados en alg?n atributo seleccionado.
8ajo el rea de graficado< e!iste una le#enda que describe quG significa cada color en la
grfica. 1i los valores son discretos< se pueden modificar los colores de cada uno ,aciendo
clic en ellas< # ,aciendo una correcta seleccin en las ventanas emergentes.
/ la derec,a del rea del grfico e!isten una serie de (strips) ,ori"ontales< donde cada uno de
estos strips representa un atributo # los puntos muestran la distribucin de los valores del
atributo. Estos valores estn a"arosamente (scattered) verticalmente< para a#udar a ver los
puntos de concentracin. 1e puede seleccionar quG ejes sern usados en el grfico principal
,aciendo clic en las (strips).=aciendo clic i"quierdo en los strip de atributos cambia el eje
9 para ese atributo< # el eje L< se cambia ,aciendo clic derec,o. Los ejes estn marcados
con las letras 9 e L para identificarlas.
1obre los strips de atributos< se muestra un (slider) %barra de desli"amiento& llamado
(AI::E@) que es un despliegue a"aroso dado a todos los puntos de la grfica.
/rrastrndolo %dragging& a la derec,a aumenta el tamaJo de (AI::E@)< que es ?til para
probar las concentraciones de los puntos. 1in AI::E@ millones de instancias no se vern
diferentes %en un mismo punto o como una sola instancia&.
&EE%%IONAN IN&,AN%IA&
=a# situaciones que es de a#uda seleccionar un subconjunto de datos al usar una ,erramienta
de visuali"acin. ;n caso especial de esto es el (;ser Classiffier)< que permite crear un
clasificador propio por medio de selecciones interactivas.
8ajo el botn selector del eje L< e!iste un botn lista %drop do5n& para elegir un mGtodo de
seleccin. ;n grupo de datos pueden seleccionarse de cuatro maneras:
*& 1elect instance: ,aciendo clic en un punto individual genera una ventana que lista los
atributos. 1i ,a# ms de un punto en el mismo lugar< ms de una lista aparecer.
+& @ectangle: se puede crear un rectngulo arrastrando< as$ se seleccionan los puntos
dentro de Gl.
-& 'oligon: se puede crear un pol$gono de cualquier forma< que selecciona los puntos
dentro de Gl. =aciendo clic i"quierdo para agregar vGrtices del pol$gono # clic
derec,o para completarlo. El pol$gono se cerrar por orden de generar los puntos.
.& 'ol#line: se pueden generar l$neas que distinguen los puntos de un lado # del otro.
=aciendo clic i"quierdo para fijar las vGrtices de las l$neas # clic derec,o para
terminar. En este caso las figuras son abiertas.
Cuando el rea graficada fue seleccionada con reclangle< pol#gon o pol#line se torna gris. En
este momento al ,acer clic en el botn (submit) remueve todas las instancias de la grfica
e!cepto las que estn grises %reas de seleccin&. =aciendo clic en botn (clear) borra el rea
de seleccin no afectando la grfica.
Cuando cualquier punto ,a sido removido de la grfica el botn (submit) cambia a botn
(reset). Este botn deja sin efecto los actos previos de remover< # retorna al grfico original
con todos los puntos incluidos. Einalmente< ,aciendo clic en el botn (save) permite guardar
las instancias visibles en un arc,ivo nuevo de e!tencin. /@EE.

Das könnte Ihnen auch gefallen