Sie sind auf Seite 1von 17

Anlise por grupamento hierrquico

Marilena Meira

Objetivo
Descrever e identificar grupos de amostras dentro dos dados originais agrupando-os de modo que permita a identificao das semelhanas entre os grupos de variveis e a diferena entre eles. Formar classes ou grupos sucessivamente maiores atravs da utilizao de alguma medida de similaridade ou de distncia. O resultado apresentado como uma rvore hierrquica (dendograma).

rvore hierrquica (dendograma)

Dendograma
A distncia entre os agrupamentos pode ser considerada: Simples: considera-se a distncia entre os vizinhos mais prximos. Completa: Considera-se a distncia entre os vizinhos mais distantes. Mdia: Considera-se a distncia mdia entre os grupos.

Clculo da distncia mdia entre os agrupamentos

Distncia Euclidiana

Distncia Euclidiana

Distncia Euclidiana

Dendograma
Vizinho mais prximo: A rvore de classificao feita unindo-se grupos que apresentam a menor distncia de conexo.
Dendograma Matriz de distncias
A A B C D E B C D E

Distncia de conexo

Dendograma
Vizinho mais distante: A rvore de classificao feita unindo-se grupos que apresentam a maior distncia de conexo.
Dendograma Matriz de distncias
A A B C D E B C D E

Distncia de conexo

Comparao com PCA

Exemplo de HCA
Seja o seguinte conjunto de dados no sistema cartesiano x,y: Amostra 1: 1, 2 Amostra 2: 2.5, 4.5 Amostra 3: 2, 2 Amostra 4: 4, 1.5 Amostra 5: 4, 2.5

Procedimento no Matlab
1. Defina sua matriz de dados: A = [1 2;2.5 4.5;2 2;4 1.5;4 2.5] 2. Calcule as distncia entre os pontos: D = pdist(A) 3. Transforme o conjunto de dados de distncias em uma matriz: squareform(D)

No Matlab

Procedimento no Matlab
4. Gere a matriz das linkages Z = linkage(D) 5. Gere o dendograma: dendrogram(Z)

No Matlab

Dendograma

Das könnte Ihnen auch gefallen