Sie sind auf Seite 1von 32

bungsblattzur Korrespondenzanalyse CAPCAVersion2.

1
NachTorstenMadsen2010

bersetzung aus dem Englischen mit Vernderungen und Ergnzungen. Das bungsblatt dient als Schritt fr Schritt Anleitung fr das frei erhltliche Statistikprogramm Capca vonTorstenMadsen. JuttaKneisel,InstitutfrUrundFrhgeschichteChristian AlbrechtsUniversittzuKielJohannaMestorf Str.2624118Kiel 29.10.2010

bungsblattKorrespondenzanalysemitCapca

Inhalt
Inhalt.............................................................................................................................................................2 Inhalt.............................................................................................................................................................2 EINFHRUNG.................................................................................................................................................3 Installation.....................................................................................................................................................4 OfficeXPoderOffice2003........................................................................................................................ 4 Office2007................................................................................................................................................4 Windows2007...........................................................................................................................................5 Dateneingabe................................................................................................................................................6 ObligatorischeDaten.....................................................................................................................................7 Datenstruktur............................................................................................................................................8 PCA........................................................................................................................................................9 CA..........................................................................................................................................................9 MS ..........................................................................................................................................................9 OptionaleDaten..........................................................................................................................................10 Klassifikation............................................................................................................................................10 Vorgehensweise..................................................................................................................................11 Gewichtung(weights)............................................................................................................................. 12 Vorgehensweise..................................................................................................................................13 ZahlvonEigenvektorenundPrzisionderBerechnung..........................................................................15 OptionaleEinstellungen.......................................................................................................................... 16 DasSetzenderminimalenSummevonObjektenundVariablenfrdieCA .......................................16 DieDurchfhrungderAnalyse.................................................................................................................... 18 KontrollschritteundFehlermeldungen............................................................................................... 18 MatrixOutput..............................................................................................................................................21 Statistik........................................................................................................................................................23 StatistikfrCA.........................................................................................................................................23 GrafischeDarstellung..................................................................................................................................27 EinstellungenfrCA................................................................................................................................27 EditierenundSpeichernderDiagramme.................................................................................................... 30 LiteraturundLiteraturhinweise.................................................................................................................. 31 Notizen........................................................................................................................................................32
J.Kneisel,Inst.F.UrundFrhgeschichte,CAUKiel

bungsblattKorrespondenzanalysemitCapca

EINFHRUNG

CAPCA

ist

eine

Zusatzfunktion

zu

Microsoft

Excel,

die

es

Ihnen

erlaubt,

Hauptkomponentenanalysen (PCA), Korrespondenzanalyse (CA) und Metric Scaling (MS) bzw. Multidimensionale Skalierung auszufhren und innerhalb der Programmumgebung vllig integriert ist. Sie mssen lediglich die Spalten mit Daten fllen und verschiedene Optionen in einemFormblatt auswhlen, um die Analyse durchzufhren:Dann wirdeinArbeitsblattmit den ErgebnissenderAnalyseangezeigtsowieeineAnzahlvonDiagrammenzurIllustrationerzeugt. In diesem bungsblatt liegt der Schwerpunkt auf der Korrespondenzanalyse (CA), fr weitere Informationen zu den anderen Anwendungsmglichkeiten des Programmes CAPCA lesen Sie bittedasenglischeHandbuch http://www.archaeoinfo.dk/PDF%20files/CAPCA%20manual.pdf Darber hinausgehende Information ber PCA, CA oder MS und verschiedene Anwendungsbeispiele finden Sie in dem Artikel Multivariate data analysis with PCA, CA and MS.

ftp://ftp.rz.unikiel.de/pub/ufg/dateien_studium/Uebungsblaetter_Kneisel/Korrespondenzanalyse_CAPCA.pdf

bungsblattKorrespondenzanalysemitCapca

Installation

Die Installation von CAPCA auf Ihrem Computer ist einfach. Die einzige Vorbedingung ist MicrosoftExcel(MicrosoftOfficeXP,Office2003oderOffice2007). Laden Sie sich die bentigte Programmversion und die zugehrigen Handbcher unter http://www.archaeoinfo.dk/herunter.

OfficeXPoderOffice2003
Sie kopieren die CAPCA.xla Datei in das Verzeichnis fr Ihre persnlichen Nutzereinstellungen C:\Dokumente kopieren. Das Verzeichnis kann verborgen sein. In diesem Fall mssen Sie die Einstellungen im Dateibrowser ndern. Gehen Sie in den Explorer. Im Men Extras OrdneroptionenAnsicht im Fenster Erweiterte Einstellungen scrollen bis Versteckte Dateien und Ordner erscheint dasKstchenAlleDateienundOrdneranzeigenanklicken. Zurck zu Excel. Im Men Extras unter AddIns whlen Sie durchsuchen und whlen Sie die CAPCA.xla Datei aus. Im nachfolgenden Fenster erscheint Auswahl verfgbarer Addins. Klicken Sie CA PCA Analyse an, die dann im Men Fenster Extra hinzufgt wird, CA PCA Analyse. KlickensieaufdieseAuswahl,umdasdieCAPCAEingabeformularaufzurufen. und Einstellungen\Gabi_Mustermann\Anwendungsdaten\Microsoft\AddIns

Office2007
SiekopierendieCAPCA.xlamDateiindasVerzeichnisfrIhrepersnlichenNutzereinstellungen C:\DokumenteundEinstellungen\Gabi_Mustermann\Anwendungsdaten\Microsoft\AddIns. Das Verzeichnis kann verborgen sein. In diesem Fall mssen Sie die Einstellungen im Dateibrowserndern:ImMenEXTRASOrdneroptionenAnsichtimFensterErweiterte Einstellungen scrollen bis Versteckte Dateien und Ordner erscheint das Kstchen Alle DateienundOrdneranzeigenanklicken.

J.Kneisel,Inst.F.UrundFrhgeschichte,CAUKiel

bungsblattKorrespondenzanalysemitCapca

Zurck zu Excel. Drcken Sie den "Office Button" (ganz oben links) und whlen Sie ExcelOptionen (unten rechts). Im Men, das erscheint, whlen Sie links AddIns aus. Im nachfolgenden Fenster klicken Sie CA PCA Analyse an. Whlen Sie unter Verwalten (ganz unten) ExcelAddIns aus und drcken den Gehezu Buttton. Im

folgenden AddIns Fenster sollte CA PCA Analyse mit einem Hkchen ausgewhlt sein. Klicken Sie ok. Wenn Sie nun im Excel Men die Menleiste unter AddIns ffnen erscheint dann ganz linksdieCAPCAAnalysealsAuswahloption. WennCAPCAbereitsalsltereVersion(CAPCA.xla)vorhandenist,mssenSiedieDateilschen. Dazu entfernen Sie CAPCA.xla aus der AddIns Bibliothek. Dann fgen Sie CAPCA wieder wie obenbeschriebenein. Falls eine Meldung erscheint, dass die Datei nicht vorhanden ist, whlen Sie mittels der Option DurchsuchendafrdieDateiCAPCA.xlamaus.

Windows2007
SiekopierendieCAPCA.xlamDateiindasVerzeichnisfrIhrepersnlichenNutzereinstellungen C:\Benutzer\Gabi_Mustermann\AppData\Roaming\Microsoft\AddIns. Das Verzeichnis kann verborgen sein. In diesem Fall mssen Sie die Einstellungen im Dateibrowserndern:ImMenEXTRASOrdneroptionenAnsichtimFensterErweiterte Einstellungen scrollen bis Versteckte Dateien und Ordner erscheint das Kstchen Alle DateienundOrdneranzeigenanklicken. UmdasAddInninExcelzuladen,lesenSiebittebeiOffice2007weiter.

ftp://ftp.rz.unikiel.de/pub/ufg/dateien_studium/Uebungsblaetter_Kneisel/Korrespondenzanalyse_CAPCA.pdf

bungsblattKorrespondenzanalysemitCapca

Dateneingabe

Alle Daten, die Sie analysieren wollen und alle Zusatzinformation mssen in einem einzelnen ExcelArbeitsblatt vorliegen. Das Eingabeformular, wenn Sie CAPCA aktivieren, dient nur dazu, dieVerweiseaufdiePositionderverschiedenenDatenstzemitInformationenimProgrammzu erstellen. Die Verweise mssen folgende Standardnotation beherrschen, um sich auf Zellen in Microsoft Excel zu beziehen. So bezieht sich A1:T36 auf einen rechteckigen Datenblock zwischen Zelle A1 an der oberen linken Ecke und Zelle T36 weiter unten in der rechten Ecke. Die Zellenangaben beziehen sich jeweils nur auf die Daten im aktuellen Arbeitsblatt, das hinter dem Eingabeformular sichtbar ist. Eine Analyse, in der einige oder alle Daten nicht im aktuellen Arbeitsblattsind,funktioniertnicht.

Abb.1

J.Kneisel,Inst.F.UrundFrhgeschichte,CAUKiel

bungsblattKorrespondenzanalysemitCapca

Wenn Sie Daten benutzen mchten, die nicht im aktuellen Arbeitsblatt sind, mssen Sie erweiterte Verweise verwenden (z. B. Sheet1! A1:T36). Auf diese Weise knnen Sie auch Daten von verschiedenen Arbeitsblttern fr eine Analyse verwenden (z. B. Werte in einem ArbeitsblattundNamenfrVariablenundGegenstndeineinemanderen). Es gibt einige Daten, die unbedingt enthalten sein mssen, um eine PCA, CA oder MS durchzufhrenundandere,dieoptionalsind. Die obligatorischen Daten um eine Analyse zu rechnen sind (Abb. 1): eine Matrix mit Werten (blau); eine Spalte mit Objektnamen (Units grn); eine Spalte von Variablennamen (Types, rot). Die optionalen Daten schlieen ein: eine Spalte von alternativen Objektnamen; eine Zeile von alternativen Typennamen; eine Spalte mit Gewichtungen der Objekte und eine Zeile mit GewichtungenderVariablen.

ObligatorischeDaten

Das Eingabeformular enthlt drei Ksten fr den Verweis auf die Position von obligatorischen Daten Objectnames(z.B.Grabnummer,Befundnummer,Ortsname), Variablesnames(z.B.Typ), Valueset(WertebereichBereichderTabelle,inderdieDatenstehen). Bei allen drei Analysen PCA, CA und MS mssen diese Verweise auf die Zellbereiche zur Verfgungstehen. JedochistfrdieMSisteineMatrixvonFaktorenstatteinerMatrixvonObjektenundVariablen notwendig, ein Verweis auf die Variablennamen ist nicht erforderlich und der Eingabekasten funktioniertnicht. Der Verweis auf Zellen fr Objektnamen muss auf eine eindimensionale Zeile hinweisen. D. h., alle Objektnamen mssen in einer Spalte (z. B. A2:A39) oder einer Zeile (z. B. B1:AC1) stehen (sieheauchAbb.1).

ftp://ftp.rz.unikiel.de/pub/ufg/dateien_studium/Uebungsblaetter_Kneisel/Korrespondenzanalyse_CAPCA.pdf

bungsblattKorrespondenzanalysemitCapca

Der Verweis auf Zellen fr Variablennamen muss auf eine eindimensionale Zeile hinweisen. D.h., alle Variablennamen mssen in einer Spalte (z. B. B1:AC1) oder einer Zeile z. B. B2:AC39) stehen. Der Verweis auf Zellen fr den Wertebereich muss auf eine zweidimensionale Zeile (Matrix) hinweisen. D. h., die Werte mssen in einen rechteckigen Block z. B. B2:AC39, oder wenn VariableninZeilenangeordnetsindB2:AC39,liegen.

Datenstruktur
Die Variablen knnen jeweils in Spalten oder Zeilen angelegt werden, weil das Programm dies aber wissen muss, gibt es einen weiteren Kasten, in dem angezeigt wird, ob die Variablen in Spalten (columns) oder in Zeilen (rows) dargestellt sind. Es ist bliche Praxis und eine sehr gute Idee,dieVariableninSpaltenunddieObjekteinZeilenanzulegen. Ferner sollte die Zeile ber dem Wertebereich die Variablennamen und die Spalte links vom Wertebereich die Namen der Objekte enthalten. Auf diese Weise folgen Namen und Werte immereinerstandardisiertenDatenstruktur. Ein Objekt oder ein Variablenname knnte in jeder Spalte bis zu 255 Zeichen lang sein. Sie sollten jedoch immer kurze und so genaue Namen wie mglich whlen (fr andere Programme z. B. WinBASP drfen es nur 8 Zeichen sein). Lange und komplizierte Namen fllen nur Ihren SpeicherunddieDiagrammeleidendannunterzuvielTextinformation. Bis Excel 2003 knnen 65536 Zeilen und 256 Spalten belegt werden. Ab der Version 2007 sind 1048576Zeilenund16384Spaltenmglich,wasfrarchologischeBelangeausreichensollte.

J.Kneisel,Inst.F.UrundFrhgeschichte,CAUKiel

Abb.2

bungsblattKorrespondenzanalysemitCapca

Der Wertebereich muss aus Zahlen bestehen. Zeichen wie in anderen Programmen (x fr vorhanden) werden nicht akzeptiert. Leerstellen werden im Zusammenhang mit PCA, CA oder MSunterschiedlichbehandelt.
PCA

Bei typischen Daten fr die PCA (z. B. Messungen) sind fehlende Werte blich und werden hufig durch leere Zellen vertreten. Weil fehlende Werte in den Daten der PCA nicht erlaubt sind,werdensiehieralsunzulssigeWertebetrachtet.
CA

In einer CA sind Leerzellen normalerweise kein Problem (doch auch sie sind nicht zulssig). blicherweise haben Sie hufig riesige Dateien mit mehr als 90 % Zellen, die Nullwerte enthalten. Folglich werden Zellen ohne Angaben hier als Nullen behandelt. So knnen Wertebereiche verarbeitet werden, ohne diese ganz mit Nullen auszufllen. Zudem ist es von Vorteil die Nullen nicht im Arbeitsblatt zu haben, denn sie erschweren die bersicht und Vernderungenan denDaten. Diese Option von CAPCA ist ein Vorteil zum Programm WinBASP, wodieNullenindenleerenZellenerforderlichsind.
MS

In der MS werden Leerzellen als unzulssige Werte behandelt und stehen fr Variablen, die als stetigbezeichnetwerden,whrendNullenfrVariablenstehen,diekategorischsind. Die Verwendung von Zahlenformaten unterscheidet sich ebenfalls in den drei Analysen. Fr die PCA ist jede reelle Zahl mglich, weil es sich um Werte von Messungen handelt. In der CA sind nur positive ganze Zahlen annehmbar, weil die Werte sich von Kontingenztabellen ableiten lassen. In der MS hngen die Werte von der Aussage der Variablen ab. Fr stetige Variablen ist jedereelleZahlannehmbar,wohingegenfrkategorischeVariablennur1und0akzeptiertwird.

ftp://ftp.rz.unikiel.de/pub/ufg/dateien_studium/Uebungsblaetter_Kneisel/Korrespondenzanalyse_CAPCA.pdf

bungsblattKorrespondenzanalysemitCapca

OptionaleDaten

Klassifikation
Fr die PCA und CA ist es mglich, eine Klassifikationen sowohl mit Objekten als auch mit Variablenzuverbinden.DieKlassifikationenwerdenfarblichinderGrafikdargestellt.Soknnen Sie z. B. in einer Datenbank mit Grbern ein Klassifikationsfeld mit f=Frau, m=Mann und K=Kind erstellen. Diese werden spter farblich in der Grafik unterschieden. Sie knnen aber auch geografische (Dnemark, Deutschland, Schweiz) oder typologische (Becher, Tassen, Schalen) Gruppen bilden, Material (Gold, Silber, Bronze) unterscheiden, um nur einige Beispiele zu nennen. In der MS ist es mglich, eine Klassifikation nur mit den Objekten zu verknpfen. Es kann alles sein, dass die Objekte oder Variablen in Stze unterteilt: eine regelmige Klassifikation; ein chronologischesSchema;einegeografischeUnterteilung.

unbest.

Abb.3

J.Kneisel,Inst.F.UrundFrhgeschichte,CAUKiel

10

bungsblattKorrespondenzanalysemitCapca

Fr jeden Gegenstand oder Variable geben Sie einfach einen Klassennamen vor und die Anzahl der verschiedenen Klassennamen, werden automatisch zur Anzahl von Klassen, die spter in den Plots der Analyse erscheinen werden. So wie bei dem oberen Beispiel Grber der jngeren BronzezeitDnemarksnachdreiPeriodenfarblichimDiagrammmarkiertsind(Abb.3).
Vorgehensweise

Setzen Sie ein Hkchen in der Box Add object classification. Anschlieend mssen Sie auf eine ZeileoderSpalteverweisen,diedieKlassifikationderObjekteenthlt.DerVerweisistwiederum nur in eindimensionaler Hinsicht mglich, d. h., die Objektklassifikationen sollten in eine Spalte (z. B. A3:A39) oder eine Zeile (z. B. C1:AD1) stehen. Vorzugsweise Sie sollten die Objekt KlassifikationineinerSpaltelinksvondenObjektNamenliegen.

Abb.4

ftp://ftp.rz.unikiel.de/pub/ufg/dateien_studium/Uebungsblaetter_Kneisel/Korrespondenzanalyse_CAPCA.pdf

11

bungsblattKorrespondenzanalysemitCapca

SetzenSie ein Hkchen in der Box Add variable classification. Anschlieend mssen Sie auf eine Reihe von Zeilen oder Spalten hinweisen, die die Klassifikation der Variablen enthlt. Der Verweis ist wiederum nur in eindimensionaler Hinsicht mglich. Die Variablenklassifikationen solltenineinerSpalte(z.B.A3:A39)odereinerZeile(z.B.C1:AD1)stehen.Vorzugsweisesollten SiedieKlassifikationderVariablenineinerZeileoberhalbderVariablennamenlegen.

Gewichtung(weights)
Fr PCA, CA und MS, ist es mglich, Gewichtungen sowohl mit Objekten als auch mit Variablen zu verknpfen. Bei der MS ist dies jedoch nur auf eine sehr eingeschrnkte Weise mglich, da SielediglichdanneineGewichtungvorgebenknnen,wenninIhrenDatensovorliegen,dassdie ObjektedurchdieVariablenbeschriebenwerdenundnichtinFormeinerkoeffizientenMatrix. Ferner sind die einzigen mglichen Gewichtsangaben zwischen 1 und 0 (fr vorhanden oder nicht vorhanden siehe unten zu weiteren Informationen ber Gewichtungen), weil ein richtiger Gewichtungsfaktor katastrophal Ergebnisse haben wrde, wenn er auf die Werte stetigerVariablenangewandtwrde.

Abb.5

Setzen Sie ein Hkchen in der Box Apply weights to objects (Abb. 5). Anschlieend mssen Sie auf eine von Zeile oder Spalte verweisen, die die Objektklassifikation enthlt. Der Verweis ist wiederumnurineindimensionalerHinsichtmglich,d.h.Objektklassifikationenmssenineiner Spalte (z. B. AF3:AF39) oder einer Zeile (z. B. C40:AD40) angelegt werden. Vorzugsweise sollten dieObjektKlassifikationineinerSpaltelinksvondenObjektNamenliegen. SetzenSieein Hkchen in der Box Apply weights to variables (Abb. 5). Anschlieend mssen Sie den Verweis auf eine Zeile von Zellen oderSpalten hinweisen, die die Klassifikation enthlt. Der Verweis ist wiederum nur in eindimensionaler Hinsicht mglich. Variablenklassifikationen mssen in einer Spalte (z. B. AF3:AF39) oder einer Zeile (z. B. C40:AD40) angelegt werden.

J.Kneisel,Inst.F.UrundFrhgeschichte,CAUKiel

12

bungsblattKorrespondenzanalysemitCapca

VorzugsweisesolltenSiedieVariablenklassifikationineinerZeileunterhalbdesWertebereiches schreiben. Wichtig:WennSieGewichtungentwederfrObjekteoderfrVariablenverwenden,mssenSie fr jede Datenreihe der Variablen oder der Objekte eine Gewichtung angeben. Sie knnen keinenTeilderZeileoderSpalteinIhremDatenblattleerlassen. Es ist bliche Praxis und eine sehr gute Idee, die Gewichtungen der Variablen unterhalb des Wertebereiches anzulegen und die der Objekte in einer Spalte direkt rechts des Datensatzes (Abb.6). Das Verwenden von Gewichtungen in der PCA und der CA ist vielleicht umstritten, wird hier aber weiter gefasst als lediglich eine Justierung des Einflusses von einzelnen Variablen oder Objekten auf die Datenanalyse. Sie dient hier als Kontrolledafr,welcheVariablen oderObjekteindieDatenanalyse miteinflieensollen.
Vorgehensweise

Da die Gewichtung fr jede Variable bzw. Objekt vorgegeben werden muss, bentigen wir als Erstes eine neutrale Gewichtung. Diese wird auf 1 gesetzt. Wenn Abb.6

alleBereichemit1ausgeflltwerdentreteninderAnalysekeineVernderungenauf. Als Zweites bentigen wir eine Gewichtung, die eine Variable oder ein Objekt von der Analyse ausschliet. Dies wird auf 0 gesetzt. Besonders in Datenstzen, die auf vorhanden/nicht vorhanden basieren, ist es in der CA sehr hufig notwendig sowohl Objekte als auch Variablen zu entfernen, die dazu neigen, merkwrdige Strukturen zu bilden und nicht mit der Mehrheit

ftp://ftp.rz.unikiel.de/pub/ufg/dateien_studium/Uebungsblaetter_Kneisel/Korrespondenzanalyse_CAPCA.pdf

13

bungsblattKorrespondenzanalysemitCapca

derObjekteundVariablenbereinstimmen.DasVerwendenderGewichtung0isteineelegante Weise dies zu tun, anstatt die Ursprungstabelle durch Lschen von Zeilen oder Spalten zu verndern. Werte zwischen 1 und 0 werden als ein Faktor verwendet, der mit den Werten des jeweiligen Objektes oder Variable multipliziert wird. Das Erlauben von Werten zwischen 1 und 0 bedeutet lediglich den Einfluss/Signifikanz eines Objektes oder einer Variablen zu reduzieren, Sie knnen ihnabernichterhhen. Beispiel: Die Variable Pfrieme tauchen in allen Grbern aller drei Perioden auf und stren die Berechnung. Setzen alle anderen Variablen auf 1 und die Variable Pfriem auf 0. So flieen die PfriemenichtindieBerechnungmitein. Denken Sie daran, dass die absoluten Werte der Gewichtungen in den Zellen stehen. Sie sollten die Werte direkt in die Zellen schreiben. Jedoch knnen Sie auch Funktionen in die Zellen einfgen und Excel die Gewichtung berechnen lassen, die auf den Werten Ihrer Datei basieren. So knnen sie, in Verbindung mit einer CA, zum Beispiel eine Funktion schreiben, die die absoluten Werte einer Variable in Prozenten berechnet, wenn die Variablensumme mehr als 100 betrgt. So lassen sich verschiedene Indexe berechnen, zum Beispiel fr Beigaben von Grbern, demnach ein Goldring mehr Wert beigemessen wird als ein Eisenring, usw. (Fischer 2001,260f.).

J.Kneisel,Inst.F.UrundFrhgeschichte,CAUKiel

14

bungsblattKorrespondenzanalysemitCapca

ZahlvonEigenvektorenundPrzisionder Berechnung

SieknnendieZahlvon zuberechnendenEigenvektoren im passendenEingangskastenangeben (Hauptkomponenten oderHauptachsen). Die vorgegebeneZahl ist 3, aberSie knnen den Wert beliebig zwischen 2 und der maximalen Zahl von mglichen Eigenvektoren setzen. Wenn Sie eine hhere Zahl angeben als es Eigenvektoren gibt werden diese automatisch auf das Maximum reduziert. Wenn Sie eine zu kleine Zahlwhlen(1,0odereinenegativeZahl)wird die Zahl zu 3 gendert. Dasselbe gilt, wenn Sie ein Zeichen einfgen, dass nicht als Zahl Abb.7 interpretiertwerdenkann. Die Berechnung von Eigenvektoren in CAPCA beruht auf einem sich wiederholenden Algorithmus, der durch Wright (1985) verffentlicht ist. Das Niveau der Przision der Berechnung ist durch eine Kontrollzahl vorgegeben, die nach jedem Durchlauf berechnet wird. WenndieseZahleinevorherfestgelegteGre(kleingenugwird)erreicht,hrtdieAnalyseauf. An dieser Stelle ist es wichtig, ein wenig darber zu erfahren, wie sich der wiederholende Algorithmusverhlt. Weil der Algorithmus in seinen wiederholenden Berechnungsdurchlufen die Ergebnisse immer wieder durchgeht, die er erhlt, wird er immer identischer mit den Ergebnissen des vorherigen Durchlaufes, und folglich mehr und mehr genauer. Jedoch ist diese wachsende Stabilitt der Ergebnisse nicht in allen berechneten Achsen gleich. Stabilitt wird nach und nach durch eine SequenzderHauptachsenerreicht,undtatschlichisteszweifelhaftobeineStabilittjemalsfr die letzten Hauptachsen in einer groen CA erreicht werden kann, da die Konvergenz bis in die Unendlichkeitfortluft. Wenn wir einen niedrigen Startwert fr die Kontrollzahl setzen, wird die Analyse sehr schnell beendet, aber nur die ersten wenigen berechneten Achsen werden stabil sein. Wenn wir einen hheren Startwert fr die Kontrolle setzen, wird die Analyse lnger bentigen, aber eine

ftp://ftp.rz.unikiel.de/pub/ufg/dateien_studium/Uebungsblaetter_Kneisel/Korrespondenzanalyse_CAPCA.pdf

15

bungsblattKorrespondenzanalysemitCapca

grereAnzahlvonberechnetenAchsenistdannstabil.InderVersion2.0istderStartwertsehr hoch dauerhaft angesetzt, damit die ersten paar Achsen nicht instabil sind. Dies steht im Gegensatz zur Version 1, wo der Benutzer den Wert kontrollieren konnte, was in einigen belegten Fllen aufgrund niedriger Przision zur Instabilitt auf der zweiten Hauptachse fhrte. In der Version 2.0 knnen Sie immer von absoluter Stabilitt fr die ersten drei Achsen ausgehen, und unter normalen Verhltnissen sollte die Stabilitt fr bis zu zehn Achsen gewhrleistetsein.BeimehralszehnAchsenknnenSiejedochkeineStabilittvoraussetzen.

OptionaleEinstellungen

DasSetzenderminimalenSummevonObjektenundVariablenfrdieCA

Fr die CA gibt es zwei Eingabekstchen Minimum sum for objects und Minimum sum for variables Die zwei Eingabekstchen werden beide mit einem EingangsWert 1 gezeigt. Sie knnen mit jeder greren Zahlals1geflltwerden. In einer CA befassen wir uns sehr hufig mir sehr kleinen Mengen, besonders fr Objekte, aber gelegentlich auch fr Variablen. Mit einer Datenstruktur vorhanden/nicht vorhanden (z. B. der Inhalt von Grbern), kann es Abb.8

vorkommen, dass ein Objekt nur ein Artefakt enthlt (ein Grab enthlt ein Gef). Es ist nicht sinnlos, dieses Grab in die Analyse mit einzubeziehen, aber abhngig von der Art von Ergebnissen,diewirsuchen,kannesvernnftigersein,nurjeneObjektezuanalysieren,dieeine Kombinationen von Artefakten (Grber, die mindestens zwei Gefe) aufweisen. Die MinimumsummemussdannbeidenObjektenauf2gesetztwerden. Dies ist ein Unterschied zu der Berechnung im Programm WinBASP, dass immer ein Minimum von 2 jeweils fr die Variablen (Types) und Objekts (Units) verlangt. WinBASP wirft bei der Berechnung einer Korrespondenzanalyse alle Daten heraus, die weniger enthalten. Aber auch dort ist es mglich den Wert hher als 2 anzusetzen. Wie gesagt, es hngt von Ihrer DatenstrukturunddemErgebnisab,dasSieerzielenwollen.

J.Kneisel,Inst.F.UrundFrhgeschichte,CAUKiel

16

bungsblattKorrespondenzanalysemitCapca

Mit einer Datenstruktur, die auf der Anzahl von Gegenstnden beruht (d. h. Zahl von Funden verschiedenerTypenineinerSiedlung)knnenwirannehmen,wiereprsentativdieZhlungist. Es ist selbstverstndlich, dass wir bei Prozentstzen nicht mit Summen niedriger als 50 (ideal nicht niedriger als 100) rechnen sollten. CA beruht auf einer relativen Verteilung, und obwohl aus verschiedenen Grnden die Wirkung von kleinen Proben nicht ebenso verheerend ist wie mit Prozentstzen, gibt es gute Grnde, eine minimale Summe fr die Objekte zu setzen. Wie niedrig Sie das Minimum bestimmen sollten, ist eine archologische Entscheidung. Wenn Sie davon ausgehen, dass Ihre Objektezufllig zusammengesetzt sind (d. h. Ablagerungen), knnen Sie beschlieen einen relativ hohen minimalen Wert zu setzen. Wenn Ihre Proben durch eine absichtliche Auslese in der Vergangenheit (d. h. Inhalt von Horten) sinnvoll zusammengesetzt sind,knnenSiebeschlieeneinenniedrigenminimalenWertzusetzen. Wenn Sie die CA durchfhren, wird das Programm fr jedes Objekt und Variable die Summe, berprfen und diejenigen ausschlieen, die eine kleinere Summe als das von Ihnen gesetzte Minimum aufweisen. Ausschluss bedeutet, dass Summen der Objekte und/oder Variablen verndert werden. Deshalb wird das Ausschlussverfahren wiederholt, bis kein Ausschluss mehr stattfindetundesfolglichzukeinerweiterenModifizierungderSummenmehrkommt.

ftp://ftp.rz.unikiel.de/pub/ufg/dateien_studium/Uebungsblaetter_Kneisel/Korrespondenzanalyse_CAPCA.pdf

17

bungsblattKorrespondenzanalysemitCapca

DieDurchfhrungderAnalyse

Es gibt drei Fenster im Eingabeformular auf der rechten Seite, gekennzeichnet mit CA, PCA und MS.DiedreiFensterenthaltenspezifischeInformationenzudendreiAnalysearten. Indem Sie eines dieser Fenster auswhlen, whlen Sie auch die Art der zu rechnenden Analyse aus. Um die Analyse zu starten, drcken Sie den Button im Eingabeformular unten links. Wenn Sie CA gewhlt haben, erscheint der Button Run CA, wenn Sie PCA gewhlt haben Run PCA und Run MS, wenn Sie MS gewhlt haben. So besteht kein Zweifel an der Art der Analyse, die Sie rechnen.
KontrollschritteundFehlermeldungen

Wenn Sie eine Analyse durchfhren, wird eine Abfolge von Kontrollen der Eingangsdaten vorgenommen,umsicherzustellen,dassdieAnalysewieerwartetundohneFehlerdurchgefhrt wird. Bei jedem Kontrollschritt kann die Analyse unterbrochen werden und eine Fehlermeldung ausgeben,dieSieberdieArtdesProblemsinformiert. Die Abfolge der Kontrollschritte, von denen jeder sofort die Analyse unterbrechen kann, ist wie folgt: 1. Eine SyntaxKontrolle ber die Auswahl der Daten, die in die Analyse einflieen. Wenn ein oder mehre Zellen nicht die entsprechenden Spezifizierungen und Anforderungen von Microsoft Excel entsprechen erscheint folgende Fehlermeldung "The following are notproperExcelinputranges:gefolgtvondenfehlerhaftenEingabedaten. 2. An diesem Punkt knnen Sie die Fehlermeldung bekommen "Unexpected information wasfound.Thecurrentworksheetmaynotbethesheetwithyourdata.DieseMeldung wird whrend eines Versuchs ausgelst die Datenreihen zu lesen, die Sie zur Verfgung gestellt haben. Zum Beispiel, wenn eine Zeile, die nur Zahlen enthalten sollte, Textteile enthlt, wird Excel sofort den Fehlercode 438 ausgeben (Objekt untersttzt diese Eigenschaft oder Methode nicht). Der wahrscheinlichste Grund fr den Fehler ist, dass das Arbeitsblatt mit ihren Daten nicht dem aktuellen Arbeitsblatt (sichtbarer hinter dem Eingabeformular) entspricht. Es kann aber auch sein, dass Ihre Daten Zeichen enthalten, wo nur Zahlen sein sollten. Zum Beispiel ein l statt 1 oder ein o statt 0. Bei der Suchen nach Textfeldern in Ihren Daten, sollten Sie sich darauf konzentrieren, ob einige der Zellen rechts (Zahl) oder links (Zeichen) ausgerichtet sind. Weil dieser Fehler whrend

J.Kneisel,Inst.F.UrundFrhgeschichte,CAUKiel

18

bungsblattKorrespondenzanalysemitCapca

des Lesens von Daten ausgelst wird, kann er an dieser Stelle oder aber auch spter in derberprfungsfolgeauftreten. 3. Das Programm berprft ob die Verweise (auf Objektnamen, Variablennamen, Objektklassifikationen, Variablen Klassifikationen, Gewichtung der Objekte, Gewichtung der Variablen und bei der MS Typen) alle auf eine eindimensionalen Zeile hinweisen. WenneinerdieserVerweisungenmehralseineZeileodereineSpalteumfasst,wirdeine entsprechendeFehlermeldungangezeigt. 4. DasProgrammberprftdieLngederObjektNamenspalteundVariablenNamenszeile, um die Anzahl von Objekten und Variablen festzustellen. Wenn eine von ihnen weniger als drei aufweist, wird eine Fehlermeldung ausgegeben, feststellend, "There must be at least three rows and three columns of data Bitte beachten Sie, dass nicht Ihre Daten falschsind,sondernesandenVerweisenaufdieSpaltenundZeilenliegenkann. 5. Das Programm berprft, ob die Bezge der Verweise auf die Zeilen miteinander bereinstimmen. So mssen ObjektNamen, Klasse und Gewicht dieselbe Lnge haben; ebenso mssen Variablennamen, Klasse, Gewicht und fr die MS Typen, dieselbe Lnge aufweisen. Die Dimensionen der Daten in der Matrix muss in bereinstimmung mit der entsprechend definierten Anzahl der Objekte und Variablen bei den Objektnamen und Variablennamen sein. Wenn ein Fehler auftritt, werden verschiedeneErrorMeldungenerscheinen,dieaufdieentsprechendenUnstimmigkeiten hinweisen. 6. DasProgrammberprft,obdiezurVerfgunggestelltenDateninbereinstimmungmit dendefiniertenBeschrnkungenfrdieausgewhlteAnalysesind.
a.

Fr die Gewichtung wird berprft, ob alle numerische Werte zwischen 1 und 0 liegen. Weightscontainblanksornondigitvalues.AlleWertemssenZahlensein.Wennnicht numerische Werte vorkommen, erhalten Sie die Meldung Some weights are either largerthan1orsmallerthan0.AlleWertemssenzwischen1und0liegen!

b. Fr CA wird berprft, ob alle Werte positive ganze Zahlen (integer) sind und keine Objekte oder Variablen Nullsummen haben. CA kann nicht mit Nullsummen arbeiten, wederfrZeilen nochfrSpalten(geteilt durch 0).WenndieZeilemitGewichtungnicht vorliegt, werden Sie informiert, welche Objekte und/oder VariablenNullsummen haben, und Sie werden aufgefordert, diese zu entfernen. Wenn eine Zeile mit Gewichtungen vorliegt, werden die Objekte oder Variablen mit Nullsummen whrend der Anwendung von CA/ PCA einfach entfernt. Dieser Unterschied bei der Nutzung von Gewichtungen fhrtbeiderAnwendungvonCA/PCAzueinerautomatischenEliminierung.

ftp://ftp.rz.unikiel.de/pub/ufg/dateien_studium/Uebungsblaetter_Kneisel/Korrespondenzanalyse_CAPCA.pdf

19

bungsblattKorrespondenzanalysemitCapca

c. Fr PCA wird berprft, ob alle Werte numerisch sind, und dass keine Zellen leer verbleiben. Wenn das Programm unterbrochen wird, verlieren Sie die Information nicht, die Sie in das Eingabeformulargetippthaben.DasEingabeformularisteinnichtmodales"Gleitformular",d.h., dass Sie nderungen im Arbeitsblatt vornehmen knnen, ohne das Formular zu schlieen. Sie knnen so Fehler korrigieren, die angezeigt werden und schnell die Analyse wiederholen, ohne dieEinstellungenneuvornehmenzumssen. Selbst wenn die Analyse durchgefhrt ist, bleibt das Eingabeformular mit allen seinen Einstellungen erhalten. Sie knnen z. B. nach den ersten Ergebnissen feststellen, dass die Zahl der Eigenvektoren verndert werden muss, Gewichtungen variiert werden mssen etc., und so dienotwendigennderungenvornehmenunddieAnalyseschnellwiederholen. Whrend die Analyse luft, werden zwei StatusKsten an der Unterseite des Eingabeformulars angezeigt(jedochnursichtbar,wennessichumgrereDatenmengenhandeltunddasFenster so lnger offen bleibt). Das Erste heit Convergence measure und das andere Number of Iterations. Das KonvergenzMa beginnt mit einem hohen Wert (negativ oder positiv), der allmhlich kleiner wird bei gleichzeitigem Anstieg der Iterations. Die Berechnung stoppt, wenn dasKonvergenzMaeinenWertvon0,5erreicht.

J.Kneisel,Inst.F.UrundFrhgeschichte,CAUKiel

20

bungsblattKorrespondenzanalysemitCapca

MatrixOutput

Der Gebrauch vonGewichtungenundderautomatische Ausschluss vonObjektenundVariablen mitSummenwenigeralserforderlichfrdieCA,kanndieEingangsdatenbetrchtlichverndern. Ferner ist es im Zusammenhang mit der CA hufig notwendig die Daten in ihrer Verteilung entlang der ersten Hauptachse anzusehen. Um die berprfung der aktuellen Daten, und im Zusammenhang mit einer CA der sortierten Daten, zu ermglichen, wird ein Arbeitsblatt mit demNamenMatrixOutputerstellt(Abb.9).

Abb.9 EsenthltfrallederAnalysearteneineMatrixderEingangsdaten,indergenauenFormwiesie frdieAnalyse(frdieCAineinersortiertenFormderDaten)benutztwurden. DieersteMatrixhatdieKopfzeileDataasanalysed.(Abb.10). DieersteZeileenthltdieNamenderVariablen. DiezweiteZeileenthltdieKlassifikationderVariablen.WennkeineKlassifikationderVariablen eingefgtwurde,bleibtdieseZeileleer. DieersteSpaltedesArbeitsblattesenthltdieNamenderObjekte. Die zweite Spalte enthlt die Klassifikation der Objekte. Wenn keine ObjektKlassifikation eingefgtwurde,bleibtdieseSpalteleer. In der Zelle anfangend mit C3 folgt ein Block von Werten entsprechend der Analyse (mit ModifizierungendurchGewichtungen,fallsvorhanden).

ftp://ftp.rz.unikiel.de/pub/ufg/dateien_studium/Uebungsblaetter_Kneisel/Korrespondenzanalyse_CAPCA.pdf

21

bungsblattKorrespondenzanalysemitCapca

Die erste Zeile unter diesem Block von Werten wird leer sein. In der folgenden Zeile sind die Gewichtungen fr die Variablen angefgt. Wenn keine Gewichtungen der Variablen vorgenommenwurden,bleibtdieseZeileleer.DiefolgendeZeilezeigtdieSummederVariablen an.DieletzteZeilezeigtdieAnzahlderZellenmitnichtNullwertefrjedeVariablean. Die erste Spalte rechts vom Block der Werten ist leer. Die folgende Spalte zeigt die Gewichtung fr die Objekte an. Wenn keine ObjektGewichtung angewandt wurde, bleibt diese Spalte leer. Die folgende Spalte zeigt die Summe von Objekten an. Die letzte Spalte enthlt die Anzahl von ZellenmitnichtNullwertenfrjedesObjekt.
Dataasanalysed Object non Object zero sums cells s s e n n b b b 1.00 1.00 1.00 1.00 2.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 2.00 2.00 1.00 1.00 1.00 2.00 2.00 1.00 1.00 2.00 1.00 2.00 1.00 2.00 1.00 1.00 1.00 1.00 2.00 1.00 2.00 1.00 1.00 2.00 2.00 2.00 1.00 1.00 1.00 2.00 2.00 1.00 1.00 1.00 2.00 1.00 1.00 2.00 2.00 1.00 1.00 1.00 2.00 2.00 1.00 1.00 2.00 1.00 2.00 1.00 2.00 1.00 1.00 1.00 1.00 2.00 1.00 2.00 1.00 1.00 2.00 2.00 2.00 1.00 1.00 1.00 2.00 2.00

1.00 b Dummersdorf Offendorf Ritzerau Gremsmuehlen Hasenthal Linden Hemdingen Ascheberg Ascheberg Augustfelde Beringstedt Bordesholm Bordesholm Borgdorf Gruenthal Nindorf Goennebek Schwissel Hennstedt Hohenaspe Mehlbek Mehlbek Poyenberg Lohbruegge Witzhave Albersdorf Albersdorf Albersdorf Albersdorf Albersdorf Albersdorf Albersdorf Bunsoh Bunsoh Bunsoh Bunsoh Bunsoh a a a a b b b b c c c c c c a a a a a b b b b b c c c c c c d d a a a b c 1.00 1.00 b b 1.00 1.00 1.00

Variablesums Variablenonzero cells

12.00 12.00

20.00 20.00

5.00 5.00

1.00 1.00

3.00 3.00

3.00 3.00

1.00 1.00

2.00 2.00

1.00 1.00

2.00 2.00

2.00 2.00

Abb.10

J.Kneisel,Inst.F.UrundFrhgeschichte,CAUKiel

22

bungsblattKorrespondenzanalysemitCapca

Eine zweite darunter befindliche Matrix ist nur bei einer CA vorhanden. Die Kopfzeile enthlt Data sorted by rank on first principal axis, abgesehen von den Daten selbst enthlt sie nur die ObjektNamen auf der linken Seite und die Variablennamen oberhalb der Daten. Diese Matrix wird immer im Zusammenhang mit einer CA erscheinen, aber abgesehen davon, dass diese Matrix Sie mit einer Seriation versorgt, ist sie nur von beschrnktem Wert. In dem Programm WinBASP haben Sie wesentlich mehr Analysemglichkeiten fr eine Seriation, nichtsdestotrotz ist das Ergebnis das Gleiche. Bei groen Matrizen werden Sie allerdings hier ein Visualisierungsproblem bekommen. Es empfiehlt sich die 1.00 Werte zu markieren und mit der Suchen/Ersetzen Funktion durch Symbole (z. B. einen Kreis ) zu ersetzen: Verringert man danndieAnsichtmitderZoomFunktionerhltmaneinepassableSeriation. BercksichtigenSiebitte,dasswennbereitseinArbeitsblattMatrixoutputbesteht,diesundalle darin enthaltenen Daten berschrieben werden und die Daten von der vorangegangenen Analyse dann verloren sind. Wenn Sie die Daten fr den spteren Gebrauch behalten mchten, solltenSiedasArbeitsblattumbenennen.

Statistik

Wenn Sie eine Analyse durchfhren, wird ein neues Arbeitsblatt, Statistik genannt, erstellt. Die gesamte Statistik sei es im Zusammenhang mit einer PCA, CA oder MS Analyse wird in dieses Arbeitsblatt geschrieben. Bercksichtigen Sie bitte, dass wenn bereits ein Arbeitsblatt Statistic besteht, dies und alle darin enthaltenen Daten berschrieben werden und die Daten von der vorangegangenen Analyse dann verloren sind. Wenn Sie die Daten fr den spteren Gebrauch behaltenmchten,solltenSiedasArbeitsblattumbenennen.

StatistikfrCA
Das Statistikarbeitsblatt enthlt Information ber die Inertia, der Werte fr die berechneten Eigenvektoren, Variablen und ObjektKoordinaten, Information zur Qualitt der Anpassung der VariablenundderObjekte.

ftp://ftp.rz.unikiel.de/pub/ufg/dateien_studium/Uebungsblaetter_Kneisel/Korrespondenzanalyse_CAPCA.pdf

23

bungsblattKorrespondenzanalysemitCapca

Die erste Zeile gibt Ihnen Information die Anzahl der Wiederholungen, die durchgefhrt wurden, bis der Algorithmus ein akzeptables Niveau erreicht hat. Dem folgt die gesamt Inertia der Daten (= Summe der Eigenwerte), die Eigen values fr jede der berechneten Hauptachsen, ihr Prozentsatz der Summe der gesamt Inertia und die entsprechenden kumulativen Prozentstze.

Abb.11

Achtung: In meiner Version des Programms erscheinen die Eigen values, darunter die Variable Coordinates(falsch,stattdessensolltedortExplanation%)stehen,diekumulativenProzentstze sind verrckt (Cumulative Exploration%). Stattdessen sollte in dieser Zelle Variable Coordinates entsprechenddemHandbuchvonThorstenMadsenstehen.

Die folgenden zwei Datenblcke geben die Variablen Koordinaten und Objekt Koordinaten auf den berechneten Hauptachsen wieder. Diese Koordinaten werden fr die Kartierung der Variablen und der Objekte bentigt, werden in erster Linie aber als grafische Darstellung wiedergegeben. Als Teil der Statistik sind sie hier in Listenform aufgefhrt, sie knnen von BenutzernfrKartierungenoderweiterestatistischeAnwendungenverwendetwerden.

Abb.12 Der restliche Teil der Statistik prsentiert mehrere ntzliche Statistiken fr die Interpretation der Ergebnisse, die hauptschlich auf dem Konzept der relativen und absoluten Verteilung der Hauptachsenbasieren.

J.Kneisel,Inst.F.UrundFrhgeschichte,CAUKiel

24

bungsblattKorrespondenzanalysemitCapca

DiezweierstenBlckevondiagnostischenDatenheienQualityoffitinplotsvariablesund Qualityoffitinplotsobjects Die ersteSpalte des Blocks lautetMass*100 und zeigt dieSummederAnzahl vonVariablen und Objekten als Prozentwerte. Das sind die tatschlichen Spalten und Zeilen Summenwerte, die dazu dienen, die Tabelle der erwarteten Werten zu berechnen, die mit den IstWerten verglichenwerden. Die folgende Spalte Inertia% erzhlt Ihnen, wie gro der Anteil der einzelnen Variablen und ObjekteanderGesamtvariationist,beziehungsweisedessenProzentstze.DerRestderSpalten in diesen zwei Blcken (bis zu zehn) zeigt die relative Verteilung der Variablen und Objekte entlang der Hauptachsen jeweils in Kombination zweier Achsen. Es gibt zwei Voraussetzungen fr Daten, um in diesen Spalten zu erscheinen. Als Erstes mssen die Hauptachsen berhaupt berechnet worden sein. Als Zweites ist die Berechnung einer ausreichenden Anzahl von Achsen notwendig, um die relative Verteilung berechnen zu knnen. Wenn der Letztere nicht der Fall ist, finden Sie die Nachrichten Relative contributions could not be calculated als Spaltenberschrift.WennSiedieseNachrichtvorfinden,aberdieInformationbentigen,sollten SiedieAnzahlderinderAnalysezuberechnendenHauptachsenerhhen.

Abb.13 DiefolgendenzweiBlckemitdiagnostischenDatenzeigendierelativeVerteilungderVariablen und Objekte jeweils zu den individuellen Hauptachsen. Wenn nicht genug Achsen berechnet worden sind, um die relative Verteilung zu berechnen, erscheint der Text Relative contributions couldnotbecalculatedinderSpalte.

ftp://ftp.rz.unikiel.de/pub/ufg/dateien_studium/Uebungsblaetter_Kneisel/Korrespondenzanalyse_CAPCA.pdf

25

bungsblattKorrespondenzanalysemitCapca

Relative contribution of a variable to a principal axis wird als der Teil der Inertia der Variablen aufeinerHauptachsegesehen,wodieSummederVerteilungzuallenHauptachsen sichauf100 %beluft.Siewirdwiefolgtberechnet:

wobei ri die ZeilenSumme fr ith Objekt ist, ist fik der Koordinatenwert fr ith Objekt auf der kth Hauptachse,mistdieAnzahlvonHauptachsen,undk'isteineHauptachse.

Abb.13 RelativecontributionofanobjecttoaprincipalaxiswirdalsderTeilderInertiaderObjekteauf einer Hauptachse gesehen, wo die Summe der Verteilung zu allen Hauptachsen sich auf 100 % beluft.Siewirdberechnet:

wobeicjdieSpaltensummefrjthVariableist,istgjkderKoordinatenwertfrjthVariableaufder kthHauptachse,mistdieAnzahlvonHauptachsen,undk'isteineHauptachse.

(SiehehierweiterbeiTorstenMadsen) Abb.14

J.Kneisel,Inst.F.UrundFrhgeschichte,CAUKiel

26

bungsblattKorrespondenzanalysemitCapca

GrafischeDarstellung

Fr alle drei Analysearten ist der beste Weg das Ergebnis zu betrachten, durch eine Darstellung der Objekte und Variablen auf den Hauptachsen. Um solche Diagramme zu schaffen, ffnen Sie ein zustzliches Formular, wo Sie die Parameter fr das Diagramm einstellen knnen. Das tun Sie, indem Sie den Button Go to diagrams drcken. Es gibt einige Dinge, die Sie an dieser Stelle beachtensollten. Obwohl die Koordinaten der Objekte und Variablen fr die Darstellung auf den Hauptachsen in dem Arbeitsblatt Statistics aufgelistet sind, braucht CA/PCA einige zustzlich im Speicher vorhandene Information, um den Graphen zu erstellen. Das bedeutet, dass die Diagramme nur fr die letzte durchgefhrte Analyse erstellt werden knnen. Wenn Sie Excel geschlossen und wieder ffnen knnen Sie keine Analyse direkt aus dem Arbeitsblatt Statistics starten, sondern mssenerneuteineAnalysedurchfhren.ErstdannistderButtonGotodiagramswiederaktiv. Wenn Sie das Diagramm Formular ffnen, verschwindet das Eingabeformular. Es wird jedoch nur nicht geschlossen, nur verborgen. Wenn Sie den Back to calculation Button auf der Diagramm Formular drcken, erscheint das Eingabeformular mit allen Datenzeilen und intakten Einstellungen erneut. Sie knnen dann die Analyse mit nderungen in den Daten oder Einstellungenwiederholen. Fr die Diagramme werden eigene Arbeitsbltter angezeigt (siehe Abb. 9). Die Abkrzungen VO1_VO2 stehen fr Variable und Objekte 1. gegen 2. Hauptachse (Eigenvektor); O1_O2 Objekte 1. gegen 2. Hauptachse (Eigenvektor); V3_V4 Variablen 3. gegen 4. Hauptachse (Eigenvektor).

EinstellungenfrCA
FreineCAerscheintdasDiagrammFormularfolgendermaen: Sie knnen Darstellungen mit bis zu 5 Hauptachsen in jeder Kombination, die sie wnschen, auswhlen, indem Sie Hkchen in die passenden Ksten zur Kombination von Achsen machen. Wenn Sie weniger als fnf Achsen gerechnet haben, ist nur die Zahl der berechneten Achsen

ftp://ftp.rz.unikiel.de/pub/ufg/dateien_studium/Uebungsblaetter_Kneisel/Korrespondenzanalyse_CAPCA.pdf

27

bungsblattKorrespondenzanalysemitCapca

verfgbar (Abb. 15). Fr jede Kombination von Achsen knnen Sie zwischen drei Arten der Darstellung whlen. Die Darstellung der Variablen Variable plots, die Darstellung der Objekte Object plots und beide zusammen kombiniert Combined plot. Letztere ist eine Darstellung, in derObjekteundVariablenzusammendargestelltwerden. Sie knnen auswhlen, wenn die Variablen und/oder Objektnamen in der Darstellung erscheinen sollen. Wenn Objekt und/oder Variablen Klassifikationen vorhanden sind, kann die KlassifizierunginderDarstellungmitunterschiedlichenSignaturenwiedergegebenwerden. IstkeineKlassifikationenvorhanden,sinddieKstchennichtaktiv.SieknnensichauchObjekte und Variablen mit Signaturen anzeigen lassen, entsprechend der Klassenunterteilung basierend auf der Inertia. Aus technischen Grnden knnen Sie nicht diese Option nicht zusammen mit den Klassifikationen verwenden. Wenn Sie Show object Inertia auswhlen, wird Show object classificationautomatischdeaktiviertundumgekehrt.

Abb.15 Wenn relative Verteilungen berechnet wurden, ermglichen zwei Kstchen Variable oder Objekte mit einer niedrigen relativen Verteilung aus dem Diagramm zu entfernen. Ansonsten sinddieKstchendeaktiviert.

J.Kneisel,Inst.F.UrundFrhgeschichte,CAUKiel

28

bungsblattKorrespondenzanalysemitCapca

Abb.16 Aktivieren Sie die Kstchen und zwei Eingabefelder ffnen sich: In diese Felder knnen Sie die Werte einfgen, unter denen die Objekte und Variablen nicht mehr angezeigt werden sollen. Um die Funktion dieser Option zu verstehen, sollte Sie das Folgende bercksichtigen. Die Hauptachsen stellen die Objekte und Variablen verschieden dar. Bei einem Objekt knnen die Variationen erst deutlich auf dritten Achsen erscheinen, whren sie auf denersten zwei Achsen nicht erkennbar sind. Wie schlecht auch immer dessen Darstellung auf den ersten beiden Achsen ist, so ist es dennoch mit seinen Koordinaten vorhanden und erscheint im Diagramm. Seine Lage auf dem Graphen kann eher zufllig sein (obwohl meist in der Nhe vom Zentrum): Es ist abhngig, was die Achsen zeigen und es kann tatschlich auch die Interpretation der Achsen stren. Die relative Verteilung in der Statistik erklrt, wie gut ein Objekt oder eine Variable auf den Hauptachsen vertreten ist, und folglich knnen wir dies verwenden, um Objekte und Variablen, die nur schlecht vertreten sind, zu entfernen. Beachten Sie, sie werden ausdemDiagrammentferntundnichtausderAnalyse.

ftp://ftp.rz.unikiel.de/pub/ufg/dateien_studium/Uebungsblaetter_Kneisel/Korrespondenzanalyse_CAPCA.pdf

29

bungsblattKorrespondenzanalysemitCapca

EditierenundSpeichernderDiagramme

Die Graphen entstehen mittels der in Microsoft Excel vorhandenen Mglichkeiten. Das hat sowohl Vorteile als auch Nachteile. Zuerst der Hauptnachteil, jedes Excel Diagramm ist verknpftmitdenDaten in einem Arbeitsblatt.Sowird als erster Schrittfr die Diagrammevon CAPCA ein Arbeitsblatt mit den Informationen fr das Schaubild namens Chartdata erstellt (siehe Abb. 9). Die Diagramme sind abhngig von Chartdata, wird dies gelscht, werden die Diagramme ebenso gelscht. Chartdata wird automatisch gelscht, wenn der Button Make diagrams gedrckt wird, ebenso die Diagramme, da diese Standardnamen haben (O1_O2; VO1_VO2;V1_V2usw.).WennSiealsodieDiagrammebehaltenwollen,benennenSiediebeide Arbeitsbltterentwederum(Cartdata,O1_O2;VO1_VO2;V1_V2usw.)oderkopierenSiesiealle ineineneueArbeitsmappe. Bitte beachten Sie, dass Sie die Diagramme nicht stckchenweise erstellen knnen, um diese dann in einer anderen Arbeitsmappe abzulegen. Das Arbeitsblatt Chartdata ist fr jeden DurchgangvonMakeDiagramseinmalig. Der Vorteil von Excel, besteht darin, dass die Excel Diagramme, einmal erstellt, sich gut editieren lassen. Sie knnen alle Standard Bearbeitungsoptionen verwenden, einschlielich einzelne Beschriftungen verschieben, um die Diagramme mit Variablen oder Objektnamen leserlicher zu machen. Es ist es sicherlich Wert sich mit den verschiedenen Optionen des Editierensvertrautzumachen. Wenn Sie eine Grafik unabhngig von den Daten in einem Arbeitsblatt speichern mchten, knnen Sie das tun, indem Sie die Grafik kopieren, in die Zwischenablage legen und in ein anderes Programmen einfgen. Ein solches Programm, das Bitmap verarbeiten kann, knnte z. B. Adobe Photoshop sein. Hier gespeichert lsst sich die Darstellung in einem BitmapFormat wie jpg oder tif speichern. Der Vorteil besteht darin, dass die Diagramme in einem leicht zugnglichen Formatgespeichert werden, dasmit allenkompatibelist. Ein Nachteil ist, dass das Diagramm in ein festes Format bertragen wird, was im Hinblick auf eine Verffentlichung schlecht ist. Denn eine einmal in eine Bitmap umgewandelte Grafik kann nicht mehr bearbeitet werden. Eine andere Mglichkeit besteht darin, den Inhalt aus der Zwischenablage in ein auf Vektoren basierendes Grafikprogramm wie Adobe Illustrator zu kopieren. Das ist die professionelle Lsung, wenn eine Verffentlichung das Ziel ist. Alle Teile des Diagrammes bleiben editierbar

J.Kneisel,Inst.F.UrundFrhgeschichte,CAUKiel

30

bungsblattKorrespondenzanalysemitCapca

und die Mglichkeiten des Redigierens gehen weit ber das hinaus, was Sie mit Microsoft Excel tun knnten. Der Nachteil ist, dass nur sehr wenige Zugang zu einem Programm wie Adobe Illustrator haben, und Sie mssen schon ber ein groes Wissen und Kenntnisse des Programmesverfgen,umesrichtignutzenzuknnen.

LiteraturundLiteraturhinweise

Fischer, L. 2001, Das groe Vorbild? Der bergang von der jngeren vorrmischen Eisenzeit im Kerngebiet der Jastorfkultur und das Verhltnis zum keltischen Sden. Arch. Inf. 2001, 24/2, 247270. Gower,J.C.1971Ageneralcoefficientofsimilarityandsomeofitsproperties.Biometrics27,p. 85774. Greenacre,M.J.1984,Theoryandapplicationsofcorrespondenceanalysis(London1984). Madsen,T.1988,Multivariatestatisticsandarchaeology(Aarhus1988).

Mller,J./ZimmermannA.(Hrsg.),ArchologieundKorrespondenzanalyse:Beispiele,Fragen, Perspektiven.InternationaleArchologie23(Espelkamp1997).

Wright,R.1985Detectingpatternintabledarchaeologicaldatabyprincipalcomponentsand correspondenceanalysis:programsinBASICforportablemicrocomputers.Scienceand Archaeology27,3538.

ftp://ftp.rz.unikiel.de/pub/ufg/dateien_studium/Uebungsblaetter_Kneisel/Korrespondenzanalyse_CAPCA.pdf

31

bungsblattKorrespondenzanalysemitCapca

Notizen

J.Kneisel,Inst.F.UrundFrhgeschichte,CAUKiel

32