Sie sind auf Seite 1von 11

TALLER ANALISIS CLUSTER

MARIO RENE SAGASTUME SOLIS


UNIVERSIDAD GALILEO IDE 12004757
TALLER ANALISIS CLUSTER

1. Con la técnica de Análisis de conglomerados clasificar a los jóvenes (base de datos


14-1) por el número de veces que van anualmente al futbol (futbol), la paga semanal
que reciben (paga2) y el número de horas semanales que ven la televisión. Utilizar
análisis cluster jerárquico y no jerárquico (con todos los conglomerados).
Para homogenizar las variables, estandarícelas por medio del procedimiento
“descriptivos” pidiendo que “guarde los valores tipificados como variables”.
Utilice estas variables tipificadas (en la base de datos original).
Indique que casos quedan en cada conglomerado para cada uno de los
procedimientos: a) jerárquico y b) no jerárquico.
Proponga un nombre para cada conglomerado.

2. Usando el análisis de conglomerados clasificar automóviles de acuerdo a sus precios


y a sus propiedades físicas, usando el análisis clúster bietápico. Como variable
categórica use tipo de vehículo y como variables continuas desde “precio en miles”
hasta eficiencia de energía.
Proponga nombres para conglomerados. ( no se realizó el ejercicio 2 por instrucción
del Doc., reyes en la video conferencia)

SOLUCION DE EJERCICIO 1
Para homogenizar las variables, estandarícelas por medio del procedimiento “descriptivos”
pidiendo que “guarde los valores tipificados como variables”.

Estadísticos descriptivos

N Mínimo Máximo Media Desv. típ.

ASISTENCIA ANUAL AL 14 0 8 3.71 3.429


FUTBOL
PAGA SEMANAL EN PTAS 14 1000 2500 1557.14 730.347
HORAS SEMANALES TV 14 5 22 15.86 5.051
N válido (según lista) 14
Estadísticos descriptivos

N Mínimo Máximo Media Desv. típ.

Puntuación Z(fútbol) 14 -1.08319 1.24983 .0000000 1.00000000


ASISTENCIA ANUAL AL
FUTBOL
Puntuación Z(paga2) 14 -.76285 1.29097 .0000000 1.00000000
PAGA SEMANAL EN PTAS
Puntuación Z(tv) HORAS 14 -2.14934 1.21607 .0000000 1.00000000
SEMANALES TV
N válido (según lista) 14

Gráfico
[Conjunto_de_datos1] C:\Users\pc\Downloads\14-1.sav

SOLUCION: SE PUEDE AGRUPAR EN 3 GRUPOS


Correlaciones
[Conjunto_de_datos1] C:\Users\pc\Downloads\14-1.sav

Correlaciones

Puntuación Puntuación Puntuación


Z(fútbol) Z(paga2) Z(tv) HORAS
ASISTENCIA PAGA SEMANALES
ANUAL AL SEMANAL EN TV
FUTBOL PTAS

Puntuación Z(fútbol) Correlación de Pearson 1 -.291 -.229

ASISTENCIA ANUAL AL Sig. (bilateral) .313 .431


FUTBOL N 14 14 14
Correlación de Pearson -.291 1 .025
Puntuación Z(paga2)
Sig. (bilateral) .313 .932
PAGA SEMANAL EN PTAS
N 14 14 14
Correlación de Pearson -.229 .025 1
Puntuación Z(tv) HORAS
Sig. (bilateral) .431 .932
SEMANALES TV
N 14 14 14

SE PUEDE VER QUE HAY 3 GRUPOS

Conglomerado

[Conjunto_de_datos1] C:\Users\pc\Downloads\14-1.sav

Resumen del procesamiento de los casosa,b

Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje

14 100.0 0 .0 14 100.0

a. distancia euclídea al cuadrado usada


b. Vinculación promedio (Inter-grupos)
SOLUCION:
EL NUMERO DE PORCENTAJE DE CASOS VALIDOS ANALIZADOS, EL NUMERO Y
POORCENTAJE DE CASOS CON VALOR PERDIDOS EN VARIAS VARIABLES INCLUIDAS EN LOS
ANALISIS EN EL TAMAÑO TOTAL, ES LA SUMA DE LOS CASOS VALIDOS Y PERIDOS

Vinculación promedio (Inter-grupos)

Historial de conglomeración

Etapa Conglomerado que se combina Coeficientes Etapa en la que el conglomerado Próxima etapa
aparece por primera vez

Conglomerado 1 Conglomerado 2 Conglomerado 1 Conglomerado 2

1 3 9 .000 0 0 8
2 2 8 .000 0 0 9
3 7 10 .104 0 0 6
4 5 11 .379 0 0 5
5 5 13 .575 4 0 9
6 7 14 .679 3 0 10
7 1 6 1.065 0 0 11
8 3 4 1.065 1 0 10
9 2 5 1.640 2 5 12
10 3 7 5.138 8 6 12
11 1 12 5.157 7 0 13
12 2 3 6.565 9 10 13
13 1 2 8.378 11 12 0

SOLUCION: TIENE 13 ETAPAS DE FUSION 14 CASOS DE CONGLOMERADO DE


PERTENECIA

Conglomerado de pertenencia

Caso 4 conglomerados 3 conglomerados 2 conglomerados

1 1 1 1
2 2 2 2
3 3 3 2
4 3 3 2
5 2 2 2
6 1 1 1
7 3 3 2
8 2 2 2
9 3 3 2
10 3 3 2
11 2 2 2
12 4 1 1
13 2 2 2
14 3 3 2
SOLUCION:
SE AGRUPAN LOS INDIVIDUOS ESTIMANDO SUS CARACTERISTICAS
GRUPO 1: 3,9,4 (poco dinero, le gusta el futbol y lo ven por tv)
GRUPO 2: 7,10,14 (poco dinero, no les gusta el Futbol, si lo ven por tv)
GRUPO 3: 2,8,5,11,13 (tienen dinero, no les gusta el futbol, se les gusta la tv)
GRUPO 4: 1,6,12 (poco dinero, no les interesa el futbol, no le interesa la tv)
Análisis de conglomerados de K medias

Notas

Resultados creados 25-NOV-2018 09:02:21


Comentarios
Datos C:\Users\pc\Downloads\14-1.sav
Conjunto de datos activo Conjunto_de_datos1
Filtro <ninguno>
Entrada Peso <ninguno>
Dividir archivo <ninguno>
Núm. de filas del archivo de 14
trabajo
Los valores definidos como perdidos por el
Definición de perdidos
usuario son considerados como perdidos.
Tratamiento de los datos
Los estadísticos se basan en los casos sin
perdidos
Casos utilizados valores perdidos para las variables de
aglomeración utilizadas.
QUICK CLUSTER ZSco01 ZSco02 ZSco03
/MISSING=LISTWISE
/CRITERIA=CLUSTER(4) MXITER(10)
Sintaxis
CONVERGE(0)
/METHOD=KMEANS(NOUPDATE)
/PRINT INITIAL CLUSTER DISTAN.
Tiempo de procesador 00:00:00.03

Recursos Tiempo transcurrido 00:00:00.05


Espacio de trabajo necesario 816 bytes

[Conjunto_de_datos1] C:\Users\pc\Downloads\14-1.sav

Centros iniciales de los conglomerados

Conglomerado

1 2 3 4

Puntuación Z(fútbol) 1.24983 -.79156 1.24983 -1.08319


ASISTENCIA ANUAL AL
FUTBOL
Puntuación Z(paga2) PAGA -.76285 1.29097 -.76285 -.62593
SEMANAL EN PTAS
Puntuación Z(tv) HORAS -2.14934 -.56562 .22625 1.21607
SEMANALES TV
Historial de iteracionesa

Iteración Cambio en los centros de los conglomerados

1 2 3 4

1 .516 .591 .344 .285


2 .000 .000 .000 .000

a. Se ha logrado la convergencia debido a que los centros de los


conglomerados no presentan ningún cambio o éste es pequeño. El
cambio máximo de coordenadas absolutas para cualquier centro es
de .000. La iteración actual es 2. La distancia mínima entre los
centros iniciales es de 2.376.

Pertenencia a los conglomerados

Número de caso Conglomerado Distancia

1 1 .516
2 2 .984
3 3 .344
4 3 .688
5 2 .828
6 1 .516
7 4 .340
8 2 .984
9 3 .344
10 4 .285
11 2 .397
12 2 2.070
13 2 .591
14 4 .539

Solución:
En la tabla de pertenecía la conformación de 3 grupos
Grupo 1 1y6
Grupo 2 2,5,8,11,12,13
Grupo 3 3,4,7,9,10,14
Centros de los conglomerados finales

Conglomerado

1 2 3 4

Puntuación Z(fútbol) 1.10402 -.45133 1.15262 -.98598


ASISTENCIA ANUAL AL
FUTBOL
Puntuación Z(paga2) PAGA -.76285 .97149 -.76285 -.67157
SEMANAL EN PTAS
Puntuación Z(tv) HORAS -1.65443 -.20268 .55619 .95212
SEMANALES TV

Distancias entre los centros de los conglomerados finales

Conglomerado 1 2 3 4

1 2.745 2.211 3.342


2 2.745 2.481 2.078
3 2.211 2.481 2.177
4 3.342 2.078 2.177

Número de casos en cada conglomerado

1 2.000

2 6.000
Conglomerado
3 3.000

4 3.000
Válidos 14.000
Perdidos .000

Das könnte Ihnen auch gefallen