Sie sind auf Seite 1von 1

tolles Lernen

Für das Leben lernen

Problemstellung: Der Datensatz „Hair Salon.csv“ enthält verschiedene Variablen, die für den Kontext der
Marktsegmentierung verwendet werden. Diese spezielle Fallstudie basiert auf verschiedenen Parametern
einer Haarproduktkette im Salon. Von Ihnen wird erwartet, dass Sie für diese Fallstudie eine
Hauptkomponentenanalyse gemäß den Anweisungen in der folgenden Rubrik durchführen.

Hinweis: Dieser spezielle Datensatz enthält auch die Zielvariablenzufriedenheit. Bitte löschen Sie diese
Variable, bevor Sie die Hauptkomponentenanalyse durchführen.

Fragen:

1) Führen Sie eine explorative Datenanalyse durch [sowohl univariate als auch multivariate Analysen
müssen durchgeführt werden]. Die daraus gezogenen Schlussfolgerungen sollten ordnungsgemäß
dokumentiert werden. – 5 Punkte

2) Skalieren Sie die Variablen und schreiben Sie die Schlussfolgerung für die Verwendung des
Skalierungsfunktionstyps für diese Fallstudie. - 3 Punkte

3) Kommentieren Sie den Vergleich zwischen Kovarianz und der Korrelationsmatrix nach der Skalierung.
- 2 Punkte

4) Überprüfen Sie den Datensatz vor und nach der Skalierung auf Ausreißer. Ziehen Sie Ihre
Schlussfolgerungen aus dieser Übung. - 3 Punkte

5) Erstellen Sie die Kovarianzmatrix, die Eigenwerte und den Eigenvektor. - 4 Punkte

6) Schreiben Sie die explizite Form des ersten PCs (in Bezug auf Eigenvektoren) – 5 Punkte

7) Diskutieren Sie die kumulativen Werte der Eigenwerte. Wie hilft es Ihnen bei der Entscheidung über
die optimale Anzahl der Hauptkomponenten? Was sagen die Eigenvektoren aus? Führen Sie eine PCA
durch und exportieren Sie die Daten der Hauptkomponenten-Scores in einen Datenrahmen. – 10 Punkte

8) Erwähnen Sie die geschäftlichen Auswirkungen der Verwendung der Hauptkomponentenanalyse für
diese Fallstudie. – 5 Punkte

Das könnte Ihnen auch gefallen