Sie sind auf Seite 1von 2

Un clster o unidad de asignacin

Por ejemplo, puede ser de 8 bytes, mientras que cada sector del disco duro es de 512
bytes, los sectores del disco duro, marcan divisiones en el mismo y son los responsables
de la lectura de la aguja y de la desfragmentacin en los sistemas operativos Microsoft
Windows.

Algoritmo de agrupamiento
La medida ms utilizada para medir la similitud entre los casos es la matriz de correlacin
entre los nxn casos. Sin embargo, tambin existen muchos algoritmos que se basan en la
maximizacin de una propiedad estadstica llamada verosimilitud.
Generalmente, los vectores de un mismo grupo (o clsters) comparten propiedades
comunes. El conocimiento de los grupos puede permitir una descripcin sinttica de un
conjunto de datos multidimensional complejo. De ah su uso en minera de datos. Esta
descripcin sinttica se consigue sustituyendo la descripcin de todos los elementos de
un grupo por la de un representante caracterstico del mismo.
En algunos contextos, como el de la minera de datos, se lo considera una tcnica de
aprendizaje no supervisado puesto que busca encontrar relaciones entre variables
descriptivas pero no la que guardan con respecto a una variable objetivo.

Algoritmo de clsteres de Microsoft


Estas agrupaciones son tiles para la exploracin de datos, la identificacin de
anomalas en los datos y la creacin de predicciones.
Los modelos de agrupacin en clsteres

Por ejemplo, puede discernir lgicamente que las personas que se desplazan a
sus trabajos en bicicleta no viven, por lo general, a gran distancia de sus centros
de trabajo.
Sin embargo, el algoritmo puede encontrar otras caractersticas que no son evidentes
acerca de los trabajadores que se desplazan en bicicleta. En el siguiente diagrama, el
clster A representa los datos sobre las personas que suelen conducir hasta el trabajo, en
tanto que el clster B representa los datos sobre las personas que van hasta all en
bicicleta.
El algoritmo de agrupacin en clsteres se diferencia de otros algoritmos de minera de
datos, como el algoritmo de rboles de decisin de Microsoft, en que no se tiene que
designar una columna de prediccin para generar un modelo de agrupacin en clsteres.
El algoritmo de agrupacin en clsteres entrena el modelo de forma estricta a partir de las
relaciones que existen en los datos y de los clsteres que identifica el algoritmo.

Ejemplo:
Considere un grupo de personas que comparten informacin demogrfica similar y que
adquieren productos similares de la empresa Adventure Works. Este grupo de personas

representa un clster de datos. En una base de datos pueden existir varios clsteres
como stos. Mediante la observacin de las columnas que forman un clster, puede ver
con mayor claridad la forma en que los registros de un conjunto de datos se relacionan
entre s.

Das könnte Ihnen auch gefallen