Criterios de Evaluacion y Modo Inicializacion

Hochgeladen von

Pablo Rodríguez

0% fanden dieses Dokument nützlich (0 Abstimmungen)

8 Ansichten2 Seiten

Copyright

Verfügbare Formate

PDF, TXT oder online auf Scribd lesen

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Dieses Dokument melden

Criterios de Evaluacion y Modo Inicializacion

Copyright:

Verfügbare Formate

Als PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

0% fanden dieses Dokument nützlich (0 Abstimmungen)

8 Ansichten2 Seiten

Criterios de Evaluacion y Modo Inicializacion

Hochgeladen von

Pablo Rodríguez

Criterios de Evaluacion y Modo Inicializacion

Copyright:

Verfügbare Formate

Als PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

Zu Seite

Sie sind auf Seite 1von 2

Im Dokument suchen

Tecnológico de Costa Rica Gabriel Sánchez 201218308

Introducción Reconocimiento de Patrones Javier Sancho 2014159997

Criterio de Evaluación: ● Completitud: todos los miembros

Debido a evaluación del de una clase determinada se
rendimiento de un algoritmo de asignan al mismo clúster.
agrupamiento no se puede basar
únicamente en el número de errores o la Índice Fowlkes-Mallows: si se conocen
precisión y la recuperación de un las asignaciones de clase de verdad se
algoritmo de clasificación supervisado, lo define como la media geométrica de la
esperado es que las métricas de precisión y recuerdo pairwise
evaluación no deben tomar en cuenta los ● FP es el número de falso positivo:
valores absolutos de las etiquetas del puntos que pertenecen a los
clúster, sino definir separaciones de los mismos clústeres en las etiquetas
datos similares a un conjunto de clases verdaderas y no en las etiquetas
fundamental o satisfaciendo algunas predichas) y
suposiciones modo que un miembro ● FN es el número de False
puede pertenecera un grupo bajo cierta Negative (es decir, el número de
métrica y a otro si esta cambia. pares de puntos que pertenece a
los mismos clústeres en las
Ajuste de Rango de Índice: dada una etiquetas predichas y no en las
clusterización tomada como verdadera, etiquetas verdaderas).
este criterio compara la similitud entre la
asignación mencionada y comparar que Coeficiente de silueta si no se conocen
tanto se parece esta a la asignación las etiquetas de verdad, la evaluación
realizada por el algoritmo de clustering, se debe realizarse utilizando el modelo
ignoran las permutaciones y se puede mismo donde puntaje de coeficiente de
normalizar silueta más alto se relaciona con un
Puntajes basados en la información modelo con conglomerados mejor
mutua: es una función que mide la definidos.
concordancia entre las dos asignaciones
al igual que el caso anterior e ignorando Calinski-Harabaz Index
las permutaciones. Si no se conocen las etiquetas de verdad,
● Información mutua normalizada esta métrica asigna la puntuación más
(NMI) se usa a menudo en la alta de Calinski-Harabaza un modelo con
literatur conglomerados mejor definidos, para los
● Información mutua ajustada (AMI). clústeres se da como la relación de la
Reciente, se normaliza en contra media de dispersión entre clústeres y la
del azar dispersión dentro del clúster.

Homogeneidad, integridad y V-medida: Modo de inicialización:

dado el conocimiento de las asignaciones k-means++: Selecciona un centroide
de clase es posible definir alguna métrica aleatoriamente en primera instancia, el
intuitiva usando el análisis de entropía siguiente centroide seleccionado se elige
condicional con dos objetivos deseables basado en una probabilidad de pesos, se
para cualquier asignación de clúster: elige el que este mas largo del centroide
● homogeneidad: cada grupo actual seleccionado. La selección
contiene solo miembros de una continúa hasta que se obtengan los
sola clase.
Tecnológico de Costa Rica Gabriel Sánchez 201218308
Introducción Reconocimiento de Patrones Javier Sancho 2014159997

k-centroides. Incrementa la velocidad de

convergencia.

random: Se eligen k puntos de manera

aleatoria de los datos presentes para
obtener los centroides iniciales. Los
centroides elegidos aleatoriamente se
pueden obtener por medio de semillas o
simplemente omitir estas.

PCA-Based: Por medio de la reducción

de dimensiones con ayuda de PCA se
disminuye el problema de las distancias
euclidianas aumentando la velocidad de
computación. Es pasado un vector de n
dimensiones de la forma (k Clusters, n
Features) y retorna los centroides
iniciales.

Das könnte Ihnen auch gefallen

Las Partes Internas de Una Computadora
Dokument9 Seiten
Las Partes Internas de Una Computadora
PC Tzul
100% (2)
Manual Uml Con Ejercicios
Dokument96 Seiten
Manual Uml Con Ejercicios
Macarena Barragan White
100% (1)
Protocolo LoRaWAN
Dokument21 Seiten
Protocolo LoRaWAN
David Orjuela
100% (2)
Diseño de pavimentos flexibles con MEPDG
Dokument16 Seiten
Diseño de pavimentos flexibles con MEPDG
Rob Santiago Ballón Guzmán
Noch keine Bewertungen
Listas I6W01DF0G
Dokument2 Seiten
Listas I6W01DF0G
Pablo Rodríguez
Noch keine Bewertungen
58396233
Dokument2 Seiten
58396233
Pablo Rodríguez
Noch keine Bewertungen
Electivas Ingeniería Computadores Plan 2100
Dokument3 Seiten
Electivas Ingeniería Computadores Plan 2100
Pablo Rodríguez
Noch keine Bewertungen
Kmeans
Dokument5 Seiten
Kmeans
Pablo Rodríguez
Noch keine Bewertungen
Sistemas Numericos
Dokument12 Seiten
Sistemas Numericos
Pablo Rodríguez
Noch keine Bewertungen
Bitacora 3
Dokument13 Seiten
Bitacora 3
Pablo Rodríguez
Noch keine Bewertungen
Instituto Tecnologico de Costa Rica: Area Academica de Ingenier A en Computadores
Dokument3 Seiten
Instituto Tecnologico de Costa Rica: Area Academica de Ingenier A en Computadores
Pablo Rodríguez
Noch keine Bewertungen
Instruccion Registar Reset - 1
Dokument7 Seiten
Instruccion Registar Reset - 1
Cristhoffer Jeisson Basurto
Noch keine Bewertungen
La Informática y El Tratamiento de La Información
Dokument16 Seiten
La Informática y El Tratamiento de La Información
Jacqueline Morocho
Noch keine Bewertungen
Errores Comunes de Excel
Dokument3 Seiten
Errores Comunes de Excel
Fernando Vallejos
Noch keine Bewertungen
Codigo de Programacion
Dokument3 Seiten
Codigo de Programacion
Angel Garcia Casado
Noch keine Bewertungen
Sybase 15.03 ASE Linux
Dokument8 Seiten
Sybase 15.03 ASE Linux
Pato Pacheco
Noch keine Bewertungen
Procedimiento para Registrar Archivo OCX
Dokument8 Seiten
Procedimiento para Registrar Archivo OCX
Jairo Enrique Sanchez
Noch keine Bewertungen
Versiones de Sistemas Operativos
Dokument15 Seiten
Versiones de Sistemas Operativos
Abigail Oliva
Noch keine Bewertungen
Desarrollo de La Actividad Individual Paso 6
Dokument39 Seiten
Desarrollo de La Actividad Individual Paso 6
SUPPLIER FACILITY GROUP SAS
100% (1)
Glosario de Terminos y Abreviaturas Sobre Redes de Telecomunicaciones PDF
Dokument47 Seiten
Glosario de Terminos y Abreviaturas Sobre Redes de Telecomunicaciones PDF
Carlos Inostroza
Noch keine Bewertungen
Análisis Costo-Beneficio Del Análisis Gigante de Datos A Través Del Uso de Amazon Redshift
Dokument60 Seiten
Análisis Costo-Beneficio Del Análisis Gigante de Datos A Través Del Uso de Amazon Redshift
Digital Harbor Bolivia
Noch keine Bewertungen
Caratula 120928102831 Phpapp02
Dokument24 Seiten
Caratula 120928102831 Phpapp02
Yuli Yhio
Noch keine Bewertungen
Taller punteros estructuras C
Dokument5 Seiten
Taller punteros estructuras C
AndersonFernandoTaguadaAcosta
Noch keine Bewertungen
Qué es un informe
Dokument2 Seiten
Qué es un informe
Victoria Robles
Noch keine Bewertungen
Uso Básico de La Calculadora en Estádistica
Dokument1 Seite
Uso Básico de La Calculadora en Estádistica
Fernanda López
Noch keine Bewertungen
Como Generar Codigo QR
Dokument8 Seiten
Como Generar Codigo QR
Teoloma Hne
Noch keine Bewertungen
Aplicaciones en El Plano de Viviendas: Sketchup
Dokument110 Seiten
Aplicaciones en El Plano de Viviendas: Sketchup
gianella alfaro leon
Noch keine Bewertungen
Documento Workflow Diagrama Por Calles
Dokument50 Seiten
Documento Workflow Diagrama Por Calles
Richard Lopez
Noch keine Bewertungen
Informe de Sistemas Inteligentes
Dokument13 Seiten
Informe de Sistemas Inteligentes
Jocsan Chunque
Noch keine Bewertungen
Criterios Evaluacion Sigb
Dokument7 Seiten
Criterios Evaluacion Sigb
EliecerElChepeSilva
Noch keine Bewertungen
Informe de Laboratorio Tablas de Direcciones Mac
Dokument4 Seiten
Informe de Laboratorio Tablas de Direcciones Mac
Diego Fernando Rojas Mendez
Noch keine Bewertungen
PRÁCTICA 4 - Variables Constantes y Tipos de Datos
Dokument5 Seiten
PRÁCTICA 4 - Variables Constantes y Tipos de Datos
filesjuand
Noch keine Bewertungen
ARNN
Dokument5 Seiten
ARNN
guibur
Noch keine Bewertungen
Guia de Desarrollo Ejercicio 2 Dualidad A Un Problema de Minimizacion Tarea 2 16-01 2020
Dokument8 Seiten
Guia de Desarrollo Ejercicio 2 Dualidad A Un Problema de Minimizacion Tarea 2 16-01 2020
MARIA FERNANDA ZAMBRANO MARTINEZ
Noch keine Bewertungen
Requisitos Sistema Vectorworks2010 PDF
Dokument4 Seiten
Requisitos Sistema Vectorworks2010 PDF
Casildo Cabello Veizaga
Noch keine Bewertungen
UML 2 Caso Practico
Dokument23 Seiten
UML 2 Caso Practico
Dany Vega Aroni
Noch keine Bewertungen
Banco
Dokument2 Seiten
Banco
SkySalvatore
Noch keine Bewertungen