Ich versichere:
• dass ich die Diplomarbeit selbständig verfasst, andere als die angegebenen Quellen
und Hilfsmittel nicht benutzt und mich auch sonst keiner unerlaubten Hilfe bedient
habe.
............ .................................
Datum Unterschrift
Für Elke,
Arnika,
Hedwig,
und Almuth.
Inhaltsverzeichnis
Inhaltsverzeichnis I
Abbildungsverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . III
Tabellenverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . IV
1 Einleitung 1
2 Wissenstransfer 3
2.1 Definition und Unterscheidungen . . . . . . . . . . . . . . . . . . 3
2.2 Wissen und Transfer . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.3 Wissenstransfer und Wissensmanagement . . . . . . . . . . . . . . 7
2.4 Wissenstransfer und die Organisation . . . . . . . . . . . . . . . . 9
2.5 Allgemeines und Wissenstransfer . . . . . . . . . . . . . . . . . . 10
3 Wahrnehmung 12
3.1 Wahrnehmung und Wissenstransfer . . . . . . . . . . . . . . . . . 12
3.2 Auge und Information . . . . . . . . . . . . . . . . . . . . . . . . 12
3.3 Wahrnehmung und Modell . . . . . . . . . . . . . . . . . . . . . . 13
3.4 Auflösung und Sehschärfe . . . . . . . . . . . . . . . . . . . . . . 16
3.5 Muster und Erkennung . . . . . . . . . . . . . . . . . . . . . . . . 18
3.6 Farbe und Schwarzweiß . . . . . . . . . . . . . . . . . . . . . . . . 22
3.7 Raum und Sehen . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.8 Wissen und Sehen . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.9 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4 Diagramme 33
4.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.2 Daten und Grafik . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.3 Skalen und Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.4 Analyse und Kommunikation . . . . . . . . . . . . . . . . . . . . . 40
4.5 Elemente und Aufbau . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.6 Weber, Fechner und der Sinneseindruck . . . . . . . . . . . . . . . 43
4.7 Fehler und Wahrnehmung . . . . . . . . . . . . . . . . . . . . . . 46
4.8 Diagramme und 3d . . . . . . . . . . . . . . . . . . . . . . . . . . 48
5 Diagrammtypen 50
5.1 Pop Charts und andere Klassiker . . . . . . . . . . . . . . . . . . 50
5.2 Neuere Formen der Darstellung . . . . . . . . . . . . . . . . . . . 54
5.3 Dotplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.4 Multidisplays . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
II
6 Gestaltungsprinzipien 63
6.1 Prinzipien nach Cleveland . . . . . . . . . . . . . . . . . . . . . . 63
6.2 Prinzipien nach Kosslyn . . . . . . . . . . . . . . . . . . . . . . . 66
6.3 Prinzipien nach Tufte . . . . . . . . . . . . . . . . . . . . . . . . . 68
6.4 Fazit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
7 Analyse 74
7.1 Allgemeines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
7.2 Ziel und Zweck . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
7.3 Vorgehensweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
7.4 Getestete Software . . . . . . . . . . . . . . . . . . . . . . . . . . 76
7.5 Kriterienkatalog . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
7.6 Farbe und die Tabellenkalkulationen . . . . . . . . . . . . . . . . 79
7.6.1 Rahmenbedingungen . . . . . . . . . . . . . . . . . . . . . 79
7.6.2 Durchführung . . . . . . . . . . . . . . . . . . . . . . . . . 81
7.6.3 Auswertung . . . . . . . . . . . . . . . . . . . . . . . . . . 81
7.7 Neuerungen und die Tabellenkalkulationen . . . . . . . . . . . . . 84
7.7.1 Dotplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
7.7.2 Panelcharts . . . . . . . . . . . . . . . . . . . . . . . . . . 85
7.7.3 Sparklines . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
7.7.4 Aktuelle Funktionalitäten . . . . . . . . . . . . . . . . . . 86
7.8 Lügenfaktor und die Tabellenkalkulationen . . . . . . . . . . . . . 87
7.8.1 Rahmenbedingungen . . . . . . . . . . . . . . . . . . . . . 87
7.8.2 Durchführung . . . . . . . . . . . . . . . . . . . . . . . . . 88
7.8.3 Untersuchung des Lügenfaktors im Detail. . . . . . . . . . 91
7.9 Reflexion und Analyse . . . . . . . . . . . . . . . . . . . . . . . . 95
Anhang 101
A Kriterienkatalog 101
Literaturverzeichnis 115
III
Abbildungsverzeichnis
1 Bausteine des Wissensmanagements . . . . . . . . . . . . . . . . . 8
2 Das menschliche Auge . . . . . . . . . . . . . . . . . . . . . . . . 13
3 Dreistufiges Wahrnehmungsmodell . . . . . . . . . . . . . . . . . . 14
4 Scharfsicht des Auges . . . . . . . . . . . . . . . . . . . . . . . . . 17
5 Ausgewählte Gestaltgesetze . . . . . . . . . . . . . . . . . . . . . 19
6 Reizzerlegung des Gegenfarbmodells . . . . . . . . . . . . . . . . . 22
7 Kippeffekt 3d . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
8 Hierarchie der Hinweisreize . . . . . . . . . . . . . . . . . . . . . . 28
9 Warme Farben sind näher als Kalte . . . . . . . . . . . . . . . . . 29
10 Goldener Schnitt . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
11 Merkfähigkeit nach Aufnahme . . . . . . . . . . . . . . . . . . . . 32
12 Plot der Zahlentabelle nach Anscombe . . . . . . . . . . . . . . . 34
13 Periodensystem der Visualisierungsmethoden . . . . . . . . . . . . 37
14 Tortendiagramm in 3d . . . . . . . . . . . . . . . . . . . . . . . . 48
15 Schemata klassischer Diagrammtypen . . . . . . . . . . . . . . . . 51
16 Vergleich zwischen Kreisdiagramm und Dotplot . . . . . . . . . . 55
17 Beispiel für einen Multiway Dotplot . . . . . . . . . . . . . . . . . 56
18 Beispiel für einen Matrixplot . . . . . . . . . . . . . . . . . . . . . 57
19 Beispiel für einen Conditional Plot . . . . . . . . . . . . . . . . . 58
20 Mosaikplot der Titanicpassagiere . . . . . . . . . . . . . . . . . . 60
21 Stem-and-Leaf-Plot . . . . . . . . . . . . . . . . . . . . . . . . . . 61
22 Sparklines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
23 Beispiel für Banking . . . . . . . . . . . . . . . . . . . . . . . . . 64
24 Dekomposition einer Kurve in Teilaussagen . . . . . . . . . . . . . 65
25 Beispiel für small multiples . . . . . . . . . . . . . . . . . . . . . . 69
26 Minards Darstellung des Russlandfeldzugs Napoleons . . . . . . . 71
27 6 Farben im Tortendiagramm . . . . . . . . . . . . . . . . . . . . 80
28 Vergleich zwischen Farbe und S/W . . . . . . . . . . . . . . . . . 83
29 Farbschemata bei Excel 2007 . . . . . . . . . . . . . . . . . . . . . 84
30 2 Kurven mit und ohne Raster . . . . . . . . . . . . . . . . . . . . 88
31 Test 1: Balkendiagramme mit den Werten aus Tabelle 9 . . . . . . 89
32 Test 2: Balkendiagramme mit den Werten aus Tabelle 10 . . . . . 90
33 Grundlage für die Berechnung des Lügenfaktors bei Excel 2007 . . 91
34 ymax , ymin und y0 für Lügenfaktor . . . . . . . . . . . . . . . . . . 93
35 Lügenfaktor und Bestandteile . . . . . . . . . . . . . . . . . . . . 94
36 Sichtweisen auf die Visualisierung . . . . . . . . . . . . . . . . . . 96
37 Kopie der Sparkline von Seite 62 . . . . . . . . . . . . . . . . . . . 112
IV
Tabellenverzeichnis
1 Kontinuum von Daten zu Wissen . . . . . . . . . . . . . . . . . . 3
2 Merkmale der Ressource Wissen . . . . . . . . . . . . . . . . . . . 4
3 Wahrnehmung von Diagrammen . . . . . . . . . . . . . . . . . . . 16
4 Technische Auflösung ausgewählter Geräte . . . . . . . . . . . . . 18
5 Hinweisreize für Tiefe . . . . . . . . . . . . . . . . . . . . . . . . . 27
6 Zahlentabelle nach Anscombe . . . . . . . . . . . . . . . . . . . . 33
7 Eigenschaften von Diagrammelementen der Fehlerquote nach sortiert 47
8 Ausgemessene Farbwerte . . . . . . . . . . . . . . . . . . . . . . . 82
9 Werte für den 1.Test des Lügenfaktors . . . . . . . . . . . . . . . 88
10 Werte für den 2.Test des Lügenfaktors . . . . . . . . . . . . . . . 89
11 Allgemeine Kriterien für die Bewertung der Lesbarkeit von Grafiken102
12 Kriterien für die Bewertung der Lesbarkeit von Achsen . . . . . . 104
13 Kriterien für die Bewertung der Lesbarkeit von Tickmarks . . . . 105
14 Kriterien für die Bewertung der Lesbarkeit von Rastern . . . . . . 105
15 Kriterien für die Bewertung der Lesbarkeit von Beschriftung . . . 107
16 Kriterien für die Bewertung der Lesbarkeit von Farben . . . . . . 108
17 Werte zur Untersuchung des Lügenfaktors . . . . . . . . . . . . . 110
18 Benutzte Software . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
19 Nachweis der Datenquellen und angewandte Software . . . . . . . 113
20 Quellen in R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
1
1 Einleitung
Am Anfang steht der Wissenstransfer, dessen Definition den Rahmen für die
folgenden Überlegungen bildet. Wir betrachten den Wissenstransfer aus der Sicht
des Wissensmanagements, der Organisation und des Individuums. Es werden Fak-
ten dargelegt, die zeigen warum der Leser einer Datengrafik vom Ersteller dersel-
ben abhängt.
Basierend auf diesen Fakten werden wir Diagramme kennen lernen. Im Kontext
der Diagramme werden Teile der Wahrnehmung genauer dargelegt. Aufbauend
auf klassischen Diagrammtypen werden ausgewählte neue Typen vorgestellt und
deren Einsatzmöglichkeiten erklärt. Hier sind Fakten zu finden, die den Einsatz
dieser neuen Typen als Ersatz für Bekannte begründen.
1
Ich bin mir der Debatte um Geschlechtsneutralität bewusst, habe aber aus Gründen der
Lesbarkeit in meiner Arbeit vorwiegend die männliche Form, wenn es mir nicht möglich war
neutral zu formulieren, gewählt.
2
In der Analyse wird ein Kriterienkatalog zeigen, wie spezifisch manche Ratschlä-
ge aus der Literatur sind und warum die Diagramme aus Tabellenkalkulationen
in der Standardeinstellung als Ausgangspunkt für Optimierungen zu betrachten
sind. Im Detail betrachten wir noch die Farben und den Lügenfaktor in aktuellen
Tabellenkalkulationen.
2 Wissenstransfer
Man könnte glauben zu wissen, was Wissen ist. In der Literatur findet man dann
vielerlei Definitionen, manchmal sogar eine Liste von Definitionen2 . Das deutet
darauf hin wie ungreifbar das Wissen als Begriff ist und wie notwendig es ist klar
zustellen worüber man spricht.
Folgende Definition von Wissen wird im vorliegenden Text als gültig betrachtet:
In einem weiteren Schritt benötigen wir eine Abgrenzung von Wissen zu Infor-
mation und Daten. Probst/Raub/Romhardt (2003) sprechen in ihrer Arbeit von
einem Kontinuum von Daten und Informationen zu Wissen in dem ein Verdich-
tungsprozess von einzelnen Zeichen hin zu Wissen läuft.4 Der Verlauf einzelner
In Tabelle 2 ist eine kurze Aufstellung und Unterscheidung, wie Willke sie ge-
troffen hat, zu finden. Sowohl Nonaka/Takeuchi6 als auch Willke7 benutzen die
Trennung zwischen explizitem und implizitem Wissen nach Polyani8 . Implizites
5
Anm. zu Tabelle 1: distinction bedeutet Unterscheidung, mastery/capability kann durch Kön-
nen übersetzt werden.
6
Vgl. Nonaka/Takeuchi (1997), S. 71f.
7
Vgl. Willke (2001), S. 12.
8
Vgl. Polyani (1985), S. 18–22.
5
Wissen unterscheidet sich von explizitem Wissen unter anderem dadurch, dass
es nicht oder nur mit erheblichem Aufwand kodifiziert oder ausgedrückt werden
kann. An Hand von Tabelle 2 sieht man, dass es sich bei Diagrammen um expli-
zites respektive explizierbares Wissen handelt. Das implizite Wissen scheint eine
untergeordnete Rolle zu spielen. Manche Gestaltungsprinzipien bei der Erstellung
von Diagrammen entstammen jahrelanger Praxis und man kann nicht explizit je-
de Vorgehensweise begründen. Weiterhin kann nicht angenommen werden, dass
der Leser eines Diagramms diese Gestaltung so versteht, wie der Empfänger es
gemeint hat.
Abschließend muss noch einmal betont werden, dass Wissen als direkt mit einer
Person „verknüpft“ betrachtet werden kann und immer von einer Person erschaf-
fen wird. Daten und Informationen sind nicht notwendigerweise in einer Person
verankert und können auch anders vorliegen. Und es gibt Grund zu der Annahme,
dass es nicht möglich ist jedes bzw. jeden Teil eines Wissens zu explizieren. Die
Kodifikation von Wissen, also die Erfassung aller Inhalte und Zusammenhänge,
ist eine Grundvoraussetzung um einen Transfer vorzunehmen.
Transfer ist ein vieldeutiger Begriff. In der Psychologie bezeichnet er die Beein-
flussung von Lernprozessen durch Erfahrungen, im wirtschaftlichen Bereich das
Übertragen von Werten und die Pädagogik betrachtet den Transfer als die Über-
tragung von Erlerntem auf eine andere Aufgabe.9
Wenn man die bisher zusammen getragenen Fakten zusammen stellt, ergibt sich
folgendes Bild. Wissen, dass nur im Kopf eines Subjekts existiert und dessen Kopf
dieses Wissen auch geschaffen hat, widerspricht dem wortwörtlichen Sinn von
9
Vgl. Becker (2005), S. 240f.
10
Vgl. Becker (2005), S. 242.
6
Wissenstransfer. Transfer würde bedeuten, dass etwas von A nach B gelangt, nur
dass dieses Etwas im Fall des Wissenstransfers Wissen ist und per definitionem
mit einer Person verknüpft ist. Hinzu kommt die Möglichkeit, den Wissenstransfer
als Aktion eines Systems zu interpretieren. Wir sehen, dass diese wortwörtliche
Interpretation des Wortes Wissenstransfer also nicht stimmt. Die Mutmaßung,
es könnte sich um die Übertragung von Information handeln anstatt von Wissen
liegt auf der Hand, gehören Informationen doch zur Basis des Wissens.
Unter Ausschluss der Identität von Sender und Empfänger bleibt für den Wis-
senstransfer die Übertragung von Daten, die auch nur dann funktioniert, wenn
diese Daten wahrgenommen werden können.
Jetzt werden die Daten, die schon Informationen sind, in einen zweiten Kontext
von Relevanzen eingebunden, wodurch sie zu Wissen werden. Diese Relevanzen
sind keine Kriterien wie in der ersten Umwandlung, sondern „Erfahrungsmus-
ter“.13 Aus den bisher angeführten Fakten lassen sich folgende Dinge schließen:
11
Vgl. Willke (2001), S. 8f.
12
Willke (2001), S. 9.
13
Vgl. Willke (2001), S. 11.
7
2. Der Anstoß des Wissenstransfers kann nicht alleine vom Sender ausgehen.
Der Wissenstransfer ist eine Aktion des Empfängers beziehungsweise bedarf
der Mitwirkung des Empfängers.14
3. Die übermittelte Nachricht muss vom Sender nicht nur in Relevanzen ein-
gebettet werden, sondern auch aktiv verarbeitet werden, um mehr als In-
formation zu werden.
4. Der Wissenstransfer kann von beiden Seiten gemeinsam oder jeder für sich
initialisiert werden, aber nur in Kooperation funktionieren.
Der Einflussbereich des Senders ist aber keineswegs gleich Null! Der Sender hat
die Verantwortung und den Einfluss auf Qualität und Quantität der Daten, deren
Kodifizierung und Auswahl des Transfermediums und somit großen Einfluss auf
die Effektivität und Effizienz des Transfers.
Die Überlegungen in diesem Kapitel bisher waren an die Tatsache angelegt, dass
zwei Systeme miteinander kommunizieren und dass diese beiden Systeme Einzel-
personen entsprechen. Natürlich kann das empfangende Systeme aus mehreren
Personen bestehen und man kann die letzten Überlegungen noch einmal für die-
sen Fall durchspielen. Das Ergebnis der Überlegungen wird jedoch dasselbe sein,
da durch die Einführung eines Zielpublikums (und das entspricht einem empfan-
genden System aus mehreren Personen) die Argumentation unverändert bleibt.
Wissenstransfer muss aber auch als Teil eines größeren Ganzen gesehen werden:
als Teil des Wissensmanagements. Probst/Raub/Romhardt (2003) definieren eine
14
Vgl. Polyani (1985), S. 15.
15
Dollinger (2003), S. 9.
8
Prozesslandschaft16 wie Sie in Abbildung 1 zu sehen ist. Man sieht, dass es dort
keinen Kernprozess (im Rahmen) und auch keinen Baustein mit dem Namen „Wis-
senstransfer“ gibt. Das liegt an dem Fokus, der angelegt wird und der liegt auf den
Menschen. Wenn man sich die Definition von Wissen von Seite 3 in Erinnerung
ruft: Das Wissen ist in den Köpfen der Menschen und kann somit nicht berührt
werden. Insofern ist der Wissenstransfer ein Bestandteil der Wissens(ver)teilung
und auch ein Teil der Identifikation, Bewahrung, Erwerb, Entwicklung und ein-
geschränkt auch Nutzung von Wissen.17 All diese Dinge benötigen den Transfer
um zu funktionieren, um Daten zu erhalten oder weiterzugeben.
Die vorangegangenen Argumente deuten darauf hin, dass es eine Weitergabe von
Wissen gibt. Es gibt noch keinen Hinweis inwiefern dieser Transfer effizient ist.
Wissenstransfer ist der Transfer von Daten des Senders zu einem Empfänger mit
dem Ziel, dass dieser die Daten interpretieren kann und durch Lerntransfer soweit
gelangt, dass er Kenntnisse und/oder Fähigkeiten erlangt die vorteilhaft bei der
Lösung von Aufgaben sind.
16
Vgl. Probst/Raub/Romhardt (2003), S. 28–33.
17
Abhängig von der Art und Weise der Nutzung.
9
Und Wissenstransfer ist der Transfer des Empfängers von einem Sender mit dem
Ziel möglichst viele dieser Daten zu empfangen und durch Einbinden in den per-
sönlichen Kontext Vorteile bei der Lösung anderer Aufgaben zu erlangen.
Die Rolle des Wissensmanagements liegt nicht im direkten Beeinflussen des Trans-
fers, sondern im Schaffen von Rahmenbedingungen.
Aus der Perspektive des Wissenstransfers ist die organisationale Wissensbasis die
Grundlage aus der er seine Daten für systeminterne und -externe Kommunikation
gewinnt. Es existieren heutzutage immer mehr Organisationen, die Ihre Daten in
Datenbanken sammeln. Oft ist der Weg dieser Daten über einen automatisierten
Report aus der Datenbank an den Endnutzer, der ihn entweder aktiv angefordert
hat oder diesen automatisiert zugestellt bekommt. Das Spektrum reicht von Data-
Mining bis zu Fehlerberichten in der Haustechnik.
18
Probst/Raub/Romhardt (2003), S. 22.
19
Vgl. Probst/Raub/Romhardt (2003), S. 23.
10
traproduktiv ist, wenn allen alles Wissen zugänglich gemacht wird.20 Für den
Wissenstransfer bedeutet das: Wenn es einfach ist jemandem Daten zu kommuni-
zieren, dann erleichtert das nicht nur die gewünschte Kommunikation sondern es
erleichtert auch die unerwünschte Kommunikation. Wenn es hingegen sehr schwer
ist zu kommunizieren, dann existiert im schlechtesten Fall keine Kommunikation
und somit ein kein Transfer.
Wissenstransfer als Konzept kann nicht direkt aus dem umgangssprachlichen Ge-
brauch übernommen werden. Durch die Natur des Wissens ergibt sich, dass Wis-
sen in einem abgeschlossenem System (im Sinne eines Menschen) entsteht und
von dort in Form eines Datentransfers zu einer anderen Person gelangen kann.
Dem Empfänger obliegt es den Datenstrom zu einer Information umzuwandeln
und diese schließlich in Wissen umzuwandeln.
Nicht alles Wissen ist von vornherein dazu geeignet expliziert und somit wei-
tergegeben zu werden. Zusätzlich ergibt sich die Problematik, dass der Erfolg
des Wissenstransfers — ohne Rücksichtnahme auf Perzeption und Übertragungs-
fehler — stark von der Mitwirkung des Empfängers abhängt. Die Effizienz und
die Effektivität des Wissenstransfers hängt aber auch vom verwendeten Übertra-
gungsmedium ab.21
Somit kann man Wissenstransfer als Prozess definieren, der sowohl Sender als
auch Empfänger unabhängig von einander einbezieht. Ziel des Wissenstransfers
ist es das erlernte Wissen soweit zu festigen, dass der Umgang mit diesem in der
Praxis zur richtigen Zeit möglich ist. Die Unabhängigkeit der beteiligten Systeme
geht so weit, dass es problematisch sein kann, eine Zielgruppe oder Zielsysteme
zu definieren oder das Umfeld des sendenden Systems zu erfassen.
20
Vgl. Probst/Raub/Romhardt (2003), S. 141–148.
21
Näheres dazu später im Kapitel 3.
11
Der Wissenstransfer ist nicht ident mit dem Lerntransfer oder Lernen. Lernen
hat als Ziel den Lerntransfer, also die Übertragung des Gelernten in die Praxis.
Der Wissenstransfer kann im Gegenzug als effektiv betrachtet werden, wenn der
Lerntransfer gelingt. Ziel des Wissenstransfers ist es, möglichst viele Daten zu
transferieren, die in einer für den oder die Empfänger lesbaren Form vorliegen.
22
im Sinne von nicht gleichzeitig
23
Gemeint sind Grafiken in der Größe von Worten. Weiter hinten in der Arbeit ist ein Teilab-
schnitt diesem Thema gewidmet.
12
3 Wahrnehmung
Wir haben bisher die beteiligten Systeme als Teilsysteme eines Prozesses beleuch-
tet, ohne nach den Randbedingungen zu sehen. Im Fall des Wissenstransfers mit-
tels Diagrammen handelt es sich um eine optische Übertragung, das bedeutet
wir beleuchten den menschlichen Sinn Sehen.24 Der Vorgang des Sehens und so-
mit der visuellen Wahrnehmung ist eine kritische Stelle im Wissenstransfer von
Diagrammen oder wie es Cleveland (1994) ausgedrückt hat:
Dieses visuelle Dekodieren der Nachricht ist ein komplexer Vorgang, deren Grund-
züge hier dargelegt werden.
Die Wahrnehmung visueller Reize findet mit dem Auge statt. Dieses kann nicht
jeden Reiz wahrnehmen, sondern nur einen eingeschränkten Bereich der elek-
tromagnetischen Strahlung deren Wellenlänge im Bereich von 380nm bis 760nm
liegt.26 Diese Wellen treffen, wie in Abbildung 2 zu erkennen ist, zu aller erst auf
die Cornea (auch Hornhaut genannt) und fallen dann durch die Öffnung der Iris
auf die Linse. Die Iris ist das Äquivalent zur Blende der Kamera und regelt den
Lichteinfall. Durch die Linse wird das Bild kopfüber auf die Netzhaut (die Reti-
na) und somit auf die Zapfen und Stäbchen projiziert. Die Zapfen und Stäbchen
sind die Rezeptoren in der Netzhaut. Die Sehgrube (auch Fovea) weist eine hohe
Dichte an Zapfen auf, erzeugt so ein sehr scharfes Bild. Wenn man ein Objekt
24
Natürlich gibt es auch noch andere Möglichkeiten Diagramme wahrzunehmen, wie zum Bei-
spiel die Möglichkeit des Ertastens, wie dies in barrierefreien Anwendungen der Fall sein kann.
Wir betrachten die Diagramme ausschließlich als Visualisierungen, da das Miteinbeziehen der
taktilen oder auditiven Komponente den Umfang dieser Arbeit sprengen würde.
25
Cleveland (1994), S. 221.
26
Vgl. Zimmermann/Weigert (1995), S. 30 (Augenempfindlichkeit).
13
fixiert, bewegen wir unsere Augen so, dass das gesehene Objekt auf die Fovea
projiziert wird.27
Das Auge ist aber nur eine Vorstufe der Wahrnehmung, wie auch in Abbildung 3
zu sehen ist. In der Folge benutzen wir ein vereinfachtes dreistufiges Modell für
die visuelle Wahrnehmung des Menschen.28 Durch die Tatsache, dass Licht einmal
wahrgenommen wurde ist eine Voraussetzung für den Wissenstransfer gegeben:
Der Mensch besitzt die Möglichkeit visuelle Reize wahrzunehmen.
Dieser Abschnitt gibt in Kürze das Wahrnehmungsmodell nach Ware (2004) wie-
der.29 Es ist zu zeigen, dass die wahrgenommenen Reize auch zu Daten weiter-
verarbeitet werden. Auf weitere Quellverweise wird verzichtet, wenn es sich nicht
um Quellen Dritter handelt.
27
Vgl. Mayer (2000), S. 33.
28
Vgl. Ware (2004), S. 20.
29
Vgl. Ware (2004), S. 20–22.
14
Wie in Abbildung 3 hervorgehoben wird, ist dies eine wichtige Phase, was die
Orientierung und Farberkennung betrifft.
In Stufe 2 (Pattern Perception) wird das Sichtfeld in Sektoren und einfache Mus-
ter zerlegt (z.B.: gleiche Farbe, Textur, Kontur) und verarbeitet. Ware erwähnt
an dieser Stelle die Zwei-Visuelle-Systeme-Hypothese, nach der es zwei Systeme
gibt: Eines für Handlung und Fortbewegung, sowie eines für symbolische Ob-
jektmanipulation. In Abbildung 3 ist dies durch die Termini „What“-System und
„Action“-System dargestellt. Als Charakteristika dieser Stufe zählt er folgende
Dinge auf:
15
Kennzeichen dieser Phase ist die Verarbeitung der massiven Daten aus Stufe 1 in
Gleichzeitigkeit mit Aufmerksamkeitsmechanismen, also Anfragen.
Stufe 3 bietet Argumente, warum manche Darstellungsformen durch die Art der
Überladung mit Daten nicht funktionieren, wie es etwa bei Liniendiagrammen
mit mehreren Linien der Fall ist. Dies geschieht durch die Beschränkungen im
Kurzzeitgedächtnis. Es bietet sich an nicht mehr als 7±2 Datensymbole zu ver-
wenden, die in etwa die Kapazitätsgrenze darstellen.30 Hier sind unter Datensym-
bolen nicht nur Linien, sondern auch Punktgruppen zu verstehen. Näheres dazu
im Abschnitt Muster und Erkennung.
30
Vgl. Miller (1956).
31
Vgl. Cleveland (1994), S. 223–227.
32
Man spricht heutzutage auch von der Repräsentation dieser Information
16
Dekodieren besteht nun aus zwei Aktionen: Der Mustererkennung und der Wert-
zuordnung33 , welche wiederum aus Suboperationen bestehen, die in Tabelle 3
aufgelistet sind. Aus Tabelle 3 kann man zusätzlich schließen, dass es dem Autor
einer Datengrafik obliegt, diese mit dem Gesichtspunkt zu gestalten, die dem Be-
nutzer Arbeit abnimmt. Sollen in einer Abbildung Größen miteinander verglichen
werden, so kann man diese schon ordnen. Will man bestimmte Werte besonders
betonen, kann man dies tun, indem man die Wertzuordnung oder Erkennbar-
keit erleichtert.34 Alle diese Aktionen müssen allerdings auf der Seite des Senders
überlegt und umgesetzt werden um den Effekt beim Empfänger zu maximieren.
Wie auf Seite 13 schon erwähnt wurde ist die Auflösung des Auges im Bereich
der Fovea am höchsten. Dort ist die Dichte ungefähr 180 Rezeptoren pro Grad
Sichtwinkel, was in etwa dem vierfachen der aktuellen Auflösung von Monitoren
entspricht.35
Eine Möglichkeit detaillierte Information aufzunehmen ist es, diese mit der Fo-
vea zu erfassen. Wenn man der Verfasser einer Visualisierung ist, hat man auch
die Möglichkeit die Parafovea zu nutzen, einen Bereich der in etwa 6 Grad im
Durchmesser um die Fovea liegt.36 Bei einer Entfernung von 60 cm entspräche
33
Im Original als Pattern Perception and Table Look-Up bezeichnet. Vgl. Cleveland (1994),
S. 223f
34
Man findet in der englischsprachigen Literatur an mehreren Stellen die Beschreibung von
information that pops out, also Information, die ins Auge springt.
35
Vgl. Ware (2004), S. 62.
36
Vgl. Ware (2004), S. 56.
17
Abbildung 4: Scharfsicht des Auges (aus: Ware (2004), S. 51): Die Scharfsicht
des Auges fällt schnell mit dem Abstand zur Fovea. Sehr gut zu
sehen ist hier auch der blinde Fleck.
das einem Kreis von 6,29cm Durchmesser.37 Jede Grafik, die in einem Buch in
einen solchen Kreis passt kann also in bester Detailaufnahme als eine Einheit
erfasst werden, unter der Annahme, dass man es etwa 60cm vom Kopf entfernt
hält.38 In Abbildung 4 kann man erkennen, wie das Auflösungsvermögen rund um
die Fovea verteilt ist und auch die Lage des blinden Flecks, der bisher unerwähnt
blieb, aber eine Stelle ohne Auflösung darstellt, da hier der Sehnerv gemeinsam
mit den Blutgefäßen ins Auge mündet. Die Stelle des blinden Flecks ist blind, weil
es dort keine Rezeptoren gibt. Allerdings decken sich die blinden Flecken beider
Augen beim Sehen nicht, sodass das Gehirn aus den beiden Bildern wirklich ein
Gesamtbild ohne Lücken erdenken kann.39
Das Auge kann aber nur erfassen, was da ist. Auf der technischen Seite unter-
scheidet man zwischen Dots beziehungsweise Pixeln pro Inch.
dpi: dots per inch Die Fähigkeit der Ausgabe einer bestimmten Anzahl von
Punkten auf ein Medium. Diese Angabe bezieht sich auf Drucker und ähn-
liches.
ppi: pixel per inch Die Angabe welche Anzahl an kleinsten Bildeinheiten in ei-
nem Medium gespeichert oder ausgelesen werden kann. Das bezieht sich auf
Scanner, Monitore und ähnliches.
37
Berechnung des Autors
38
Entfernung eines Buches vom Gesicht (Schätzung des Autors)
39
Vgl. Mayer (2000), S. 34.
18
Auf der technischen Seite bedeutet das im Fall von aktuellen Monitoren eine Auf-
lösung ab 72dpi und zu erwartenden Druckqualitäten ab 600dpi (vgl. Tabelle 4)
Warum existiert eine Auflösung, die weit höher ist, als es eigentlich notwendig
wäre? Da eine Auflösung von 150 Punkten pro Grad im Auge vorhanden ist,
können die Überauflösungen (bei drucktechnischen Belangen) auf drei Gründe
zurückgeführt werden: Aliasing, Graustufen und die bereits erwähnte unregelmä-
ßige Sehschärfe.40
Aliasing entsteht durch das Umrechnen eines Musters mit einem Neuem ande-
rer Wellenlänge.41 Ein bekanntes Beispiel eines unerwünschten Artefakts sind die
Moirémuster. Das Aliasing kann durch Antialiasing unterbunden werden, indem
man die Durchschnittshelligkeit pro Pixel berechnet und so aus größerer Entfer-
nung ein quasi fehlerfreies Bild entsteht. Da ein normaler Drucker keine echten
Grautöne drucken kann (mit Ausnahme weniger Fotodrucker, die über eine graue
Druckerpatrone verfügen, z.B.:HP Deskjet 9800, also zumindest einen Grauton
ohne Muster erzeugen können), sondern die Grautöne mit schwarzen und wei-
ßen Punkten interpoliert werden, wird eine größere Dichte benötigt um möglichst
viele dieser Graustufen in Form von Mustern zu erzeugen. Das ist ein Grund,
warum Schraffuren als Kennzeichnung von Flächen eher zu unterlassen sind. Ein
anderer ist die Interaktion der Schraffur mit den Begrenzungslinien, die Teil des
schraffierten Objekts sind.
Wie wir vorher schon festgestellt haben, findet in Stufe zwei eine erste Verarbei-
tung von Mustern statt. Diese Verarbeitung muss stattfinden um die optischen
40
Vgl. Ware (2004), S. 63–67.
41
Vgl. Ware (2004), S. 64f.
19
Die Reihung der folgenden Gestaltgesetze ist willkürlich, da sie in der Kombinati-
on die Wirkung ändern können. Das geht bis zum Auslöschen der Wirkung eines
anderen Prinzips.43
(a) Gesetz der Nähe: Dieses Prinzip besagt, dass Elemente, die näher zuein-
ander liegen als Gruppe (oder als zusammengehörig) empfunden werden.
42
Definitionen und Ausführungen in der Folge nach Vgl. Zimbardo/Gerrig (2004), S. 175–178;
Mayer (2000), S. 15, 36–39; Ware (2004), S. 189–201
43
Ware (2004), S. 200f.
20
Nicht nur die kleinen Quadrate der Abbildung formieren Gruppen, auch
die Klammern der Beschriftung bilden Gruppen mit den Buchstaben und
diese wiederum mit den Abbildungen.
(b) Gesetz der Ähnlichkeit: Auch dieses Prinzip dient der Gruppierung, aller-
dings werden ähnliche Elemente gruppiert. Zum Beispiel Elemente der glei-
chen Farbe oder Kontur.
(c) Gesetz der Verbundenheit: Miteinander verbundene Elemente werden als
zueinander gehörend interpretiert.
(d) Gesetz der guten Fortsetzung: Dieses Prinzip hilft sich überlagernde Rei-
ze voneinander zu trennen. So wird die vorliegende Figur als sich zwei kreu-
zende Linien wahrgenommen und nicht als zwei Linien mit einem Knick.
(e) Das Gesetz der Geschlossenheit: Dieses Prinzip heißt oft auch das Gesetz
der guten Gestalt. Beim Sehen hat der Mensch die Tendenz fehlende Teile
zu ergänzen. Dieses Prinzip hilft bei der Trennung von Vorder- und Hinter-
grund. Die rote Fläche wird als Ellipse im Hintergrund wahrgenommen.
(f) Figur und Hintergrund: Eine Figur ist ein Objekt im Vordergrund und
kann vom Hintergrund unterschieden werden. Die Figur im Vordergrund
muss nicht einmal vollkommen abdecken. Die Okklusion des Hintergrunds
wird schon erkannt, wenn das Objekt Transparenz aufweist. Im Falle von
100%iger Transparenz müssen allerdings Kanten und Brechung des trans-
parenten Mediums vorhanden sein, um dieses wahrzunehmen.
(g) Das Prinzip 1 + 1 = 3 oder mehr : Das von Josef Albers geprägte Gesetz
beschreibt die Tatsache, dass zwei Objekte in Kombination bei weitem nicht
nur zwei Objekte sein müssen. Zwei parallele schwarze Linien erzeugen ei-
ne dritte Weiße in Ihrer Mitte. Das bedeutet, dass durch die Interaktionen
zwischen den beiden Objekten unerwünschte Effekte auftreten können, die
allerdings durch das Herabsetzen des Kontrastes zwischen Vorder- und Hin-
tergrund minimiert respektive eliminiert werden können.44
(h) Gesetz des gemeinsamen Schicksals (ohne Abbildung): Elemente, die
eine Eigenschaft teilen werden als zusammengehörig empfunden und zusam-
mengefasst(ohne Abbildung). Dies ist zum Beispiel der Fall, wenn ähnliche
Kurven zu einer Kurvenschar zusammengefasst werden45 .
Die Gestaltgesetze erlauben in Phase 2 die Erkennung von Mustern und die Un-
terscheidung von Vorder- und Hintergrund. Das Verarbeiten erfolgt in der letzten
44
Vgl. Albers (1969), S. 61.
45
Vgl. Schnotz (2002), S. 75.
21
Phase. Es ist festzustellen, dass die hier angeführten Gestaltgesetze keinen An-
spruch auf Vollständigkeit haben. Es wurden die Grundlegendsten für statische
Darstellungen vorgestellt.
Animationen von Daten sind diesem Gesetz insofern unterworfen, als die Folgen
von Bewegungen schwer abschätzbar sind und interagieren.
46
Vgl. Tufte (2005b), S. 56.
47
Übersetzung des Autors
48
Vgl. Chabris/Kosslyn (2005), S. 54.
49
Vgl. Norman (1990), S. 23–27.
50
Vgl. Schnotz (2002), S. 80, Chabris/Kosslyn (2005), S. 48–54
22
Wie schon erwähnt besitzt das Auge zwei verschiedene Arten von Rezeptoren:
Stäbchen und Zapfen. Da Stäbchen bei guten Lichtverhältnissen überstimuliert
werden, kann man sie für das Erfassen von Farbe vernachlässigen. Stäbchen sind
in erster Linie für das Sehen bei sehr schlechten Lichtverhältnissen zuständig.
Das Farbsehen hängt nur von den Zapfen ab, welche als α-, β- und γ-Rezeptoren
vorliegen und für das Sehen der Farben Rot, Grün und Blau sorgen.51 Diese drei
Farben erzeugen dann alle anderen Farben.
Laut der modernen Gegenfarbtheorie geschieht dies indem die Reize aller drei
Zapfenarten auf drei verschiedene Arten verarbeitet werden. Wie man in Abbil-
dung 6 sehen kann, wird zum Beispiel der Luminanzkanal52 durch die Summe
aller drei gebildet, wohingegen der Blau-Gelbkanal durch die Differenz zwischen
Blau und der Summe der anderen beiden gebildet wird.53
Die Gegenfarbtheorie ist auch der Grund, warum wir zwar rötliche Gelbtöne ken-
nen, aber niemand je auf die Idee kommen würde ein bläuliches Gelb zu beschrei-
ben. Die Paare liegen sich im Farbraum gegenüber und sind in dieser Kombination
nicht möglich. Die Umkehrung dieser Überlegung führte historisch zur klassischen
Gegenfarbtheorie.54
51
Vgl. Mayer (2000), S. 46.
52
Anm.: Luminanz ist der Ausdruck für Helligkeit.
53
Vgl. Ware (2004), S. 111.
54
Vgl. Ware (2004), S. 110.
23
Auf dem Gebiet der Visualisierungen wird Farbe klassisch zur nominalen Kodie-
rung verwendet. Man benutzt Farbe zum Beispiel um die Zuordnung von Linien
zu Produkten mittels Farben herzustellen. Die zu berücksichtigende Faktoren
sind55
1. Unterscheidbarkeit.
2. einmalige Farbtöne: Der Abstand der Farben zueinander sollte möglichst
groß sein. Rot, Grün, Gelb und Blau sind ein gutes Beispiel. Es ist keine
gute Idee verschiedene Grüntöne zu wählen.
3. Kontrast mit dem Hintergrund: Ein merkbarer Unterschied in der Luminanz
zusätzlich zur Farbe ist zu empfehlen.
4. Farbsehschwäche.56
5. Anzahl.
6. Objektgröße: Objekt nicht zu klein, vor allem wenn der Farbunterschied auf
der Achse Blau-Gelb zu finden ist.
7. Konventionen: Sie stehen oft im Zusammenhang mit kulturellen Dingen.
Als Beispiel bedeutet rot meist heiß.
Es gilt noch festzuhalten, dass sich die Kodierung mit Farbe nicht in jeder Visua-
lisierung für jede Eigenschaft oder Größe eignet. Sind in einer topographischen
Karte die Flächen gleicher Höhe noch farblich kotierbar (als Fläche zwischen den
Höhenschichtlinien) und kann ihnen so ein Wert kodiert werden, ist es in ei-
ner Balkengrafik schwierig eine weitere Dimension durch farbliche Auszeichnung
hinzuzufügen.57 Kelly/Jasperse/Westbrooke (2005) empfehlen den Einsatz von
Farbe für die ersten Entwürfe nicht, da eine Grafik in Schwarz und Weiß in jedem
Medium verwertbar ist.58
55
Vgl. Ware (2004), S. 123–127.
56
Farbsehschwäche (manchmal auch Farbenblindheit genannt) existiert in zwei Ausprägungen:
Rot-Grün und Blau-Gelb. Man geht davon aus, das etwa 10% der Weltbevölkerung Farb-
sehschwäche besitzen und die Aufteilung zwischen Männern und Frauen im Verhältnis 9 : 1
vorhanden ist.
57
Vgl. Kosslyn (2006), S. 166f.
58
Vgl. Kelly/Jasperse/Westbrooke (2005), S. 12.
59
Der Gamut ist die Bezeichnung für den Umfang des darstellbaren oder empfangbaren Far-
braums. Der Gamut eines Monitors ist anders als der eines Druckers oder auch eines Films.
24
schreibung des Gamuts von Bildschirmen benutzt man die Darstellung in rgb60 .
rgb ist ein additives Farbmodell, bei dem sich die drei Grundfarben zu Weiß
addieren.61
C ≡ rR + gG + bB (1)
rgb und cmyk beschreiben jeweils einen relevanten Ausschnitt aus dem Far-
braum, um alle Anteile des sichtbaren Spektrums darzustellen, hat sich ein wei-
teres Modell als sehr praktikabel erwiesen: hsl. Mit Hilfe dieser Beschreibung
kann man auch die drei Aspekte beleuchten, die für die Visualisierung sehr hilf-
reich sind63 :
H(ue): ist der Farbton. Es ist der qualitative Aspekt des Lichts, der von der
Wellenlänge abhängt.
S(aturation): ist die Sättigung der Farbe. Dies kann durch das Hinzufügen von
Weiß verändert werden.
L(ightness): (manchmal auch L(uminance)) ist die Intensität oder Helligkeit
einer Farbe. Sie beschreibt die Menge des Lichts, dass entweder reflektiert
(bei Druck) oder ausgestrahlt (bei Monitoren) wird. Variation dieses Wertes
geschieht durch das Hinzufügen von Grau.
60
rgb steht für Rot, Grün und Blau. Diese Farben entsprechen nicht genau den umgangs-
sprachlichen Farben Rot, Grün und Blau.
61
Vgl. Ware (2004), S. 101.
62
cmyk steht für Cyan, Magenta, Gelb sowie Schwarz. K bedeutet eigentlich Key.
63
Vgl. Kosslyn (2006), S. 158 und Ware (2004), S. 104f
64
Vgl. Kosslyn (2006), S. 159.
25
Tatsache, dass der Mensch generell nicht mehr als 9 Farben gleichzeitig folgen
kann.65
Zu den Beschränkungen in der Anzahl der zu verwendenden Farben und der Tat-
sache dass Farbe kein Kontinuum ist kommt, dass die Wahrnehmung des Farb-
tons stark von den umgebenden Farben abhängt, also dem Kontrast.66 Diesen
Effekt gibt es auch bei verschiedenen Grautönen auf Hintergründen unterschied-
licher Helligkeit. Problematisch ist dieser Effekt bei der Kodierung von Regionen
mit Farbverläufen oder Graustufen, wie man diese von Landkarten kennt. Wird
die Legende auf einem weißen Hintergrund gedruckt und das Diagramm ist zum
Großteil schwarz, ergeben sich durch den Unterschied im Kontrast falsche Wert-
zuordnungen.67
Als Menschen bewegen wir uns in einer dreidimensionalen Welt68 und weil wir
die Welt um uns herum in erster Linie optisch wahrnehmen, ist es wichtig, auch
die Aspekte des räumlichen Sehens zu beleuchten.
Die Welt erlaubt uns mittels einfacher Hinweise Raum zu erkennen und wahr-
zunehmen, obwohl die Abbildung auf der Netzhaut zweidimensional ist70 . Diese
sind teilweise auf Gewohnheiten zurückzuführen, wie zum Beispiel die Tatsache,
dass wir unbewusst immer annehmen, dass Licht von oben kommt.71 Man kann
dies an Hand von Abbildung 7 leicht nachvollziehen.
65
Eine Zusammenfassung mit ausführlichen Quellenverweisen findet man bei Kosslyn (2006),
S. 159. Die 11 Farben sind Weiß, Grau, Schwarz, Rot, Grün, Gelb, Blau, Pink, Braun, Orange
und Purpur.
66
Vgl. Kosslyn (2006), S. 158
67
Vgl. Ware (2004), S. 72f.
68
de facto sind es vier Dimensionen, da die Zeit — die vierte Dimension — für das räumliche
Sehen keine Relevanz hat, wird Sie hier nicht behandelt.
69
Vgl. Kosslyn (2006), S. 10.
70
Vgl. Mayer (2000), S. 42.
71
Vgl. Ware (2004), S. 245f.
26
Für Diagramme sind in erster Linie die bildhaften Hinweisreize interessant, wel-
che alle verwendet werden können. Es stellt sich für die Anwendung von Tiefe in
Diagrammen, wie in allen anderen Anwendungen, eher die Frage, welchen Hin-
weisreiz man verwenden soll und welche Kategorie. Die Kategorie definiert ob ein
monokular statischer, dynamischer oder ein binokularer Hinweisreiz anzuwenden
ist.
72
Vgl. Ware (2004), S. 259f.
27
kinetische Tiefe ohne korrekte Darstellung der Perspektive darzustellen, nur wird
dies unerwünschte Verzerrungen bei der Rotation nach sich ziehen.73
Die Okklusion ist der wichtigste Hinweisreiz, denn ohne sie können die anderen
Hinweisreize nicht richtig wirken und das Dargestellte ist nicht kohärent. Das
73
Vgl. Ware (2004), S. 283.
28
Tiefenschärfe
Verdeckung
Für den Umgang mit Diagrammen ist noch ein Effekt sehr wichtig: Warme Farben
erscheinen näher als kalte, eine Folge der unterschiedlichen Wellenlängen und der
Brechung in der Linse des Auges.74 Das bedeutet in der Folge, dass es zu optischen
Konflikten an den Grenzen zwischen warmen und kalten Farben kommt. Für
zwei sich kreuzende Linien empfiehlt es sich die wärmere Farbe für die Linie im
Vordergrund zu verwenden. Setzt man die Farben umgekehrt ein, drängt sich
die warme Farbe in den Vordergrund wie man in Abbildung 9 sieht und kann
als störend empfunden werden. Generell sind warme Farben im Vordergrund und
kalte für den Hintergrund zu verwenden.
74
Vgl. Kosslyn (2006), S, 11.
29
Abbildung 9: Warme Farben sind näher als Kalte: Es handelt sich hierbei um
ein Folge der unterschiedlichen Brechung unterschiedlicher Wellen-
länge im Auge. Die Brechung ist auch in Regenbögen und Prismen
zu erkennen: Unterschiedliche Ablenkung verschiedener Farben, die
sich in den Wellenlängen unterscheiden.
2,00
1: 1,62
1,00
Abbildung 10: Der Goldene Schnitt im Vergleich zu einem Quadrat und einem
Rechteck mit Seitenverhältnis 1 : 2.
Bei Tufte (2001) finden wir eine zusätzliche Analogie zum Raumempfinden: Die
Proportionen der Grafik sollten eher im Querformat als im Hochformat sein.75
Der Hauptgrund ist die Analogie zum Horizont. Somit ist es eine gute Überlegung
eher die Fläche unter einer Kurve zu schattieren als die Fläche über einer Kurve.
Dies wird von Tufte noch in Kombination mit dem Goldenen Schnitt gesetzt und
endet in der Empfehlung die Grafik solle, wenn möglich, eine Breite aufweisen,
die gegen das Doppelte der Höhe tendiert.76
Der Goldene Schnitt ist eine ästhetische Faustregel für das Teilen einer Linie. Der
kleiner Teil der geteilten Linie soll sich zum Großen verhalten, wie der große Teil
der geteilten Linie zur Gesamtheit, wie in Gleichung 2 formalisiert dargestellt.
a b
= (2)
b a+b
75
Vgl. Tufte (2001), S. 186f.
76
Vgl. Tufte (2001), S. 190.
30
Unter Anwendung der Formel 2 ergibt sich für das Goldene Rechteck ein Seiten-
verhältnis von 1 : 1, 618. Das Goldene Rechteck kann in Abbildung 10 mit einem
Quadrat 1 : 1 und einem Rechteck mit der doppelten Breite der Höhe, also dem
Seitenverhältnis 1 : 2 verglichen werden.77 Es finden sich bei Tufte einige Ab-
bildungen von anderen Formen, denen auch eine besondere Ästhetik nachgesagt
wird, die alle eine horizontale Ausrichtung besitzen sollen.78
Eine Annahme im Zusammenhang mit räumlichen Sehen kann sein, dass die
Räumlichkeit beschränkt. Man kann diese Räumlichkeit aber benutzen und mit
Ebenen arbeiten, so genannten Layers. Durch Layering kann man eine Trennung
(Separation) herbeiführen, die es erlaubt, unwichtige Information in den Hinter-
grund zu schieben und die Daten in den Vordergrund zu holen. Meist geschieht
dies durch Erhöhen der Helligkeit des Hintergrundes und durch die Verwendung
von Grautönen.79
In der kognitiven Psychologie wirft sich die Frage auf, wie das Wissen die Wahr-
nehmung beeinflusst. Wahrnehmung wird als direkt bezeichnet, wenn man davon
ausgeht, dass Wissen und Wahrnehmung zwei voneinander unabhängige Systeme
sind und als indirekt (manchmal auch als konstruktivistisch bezeichnet), bei der
Ausgangslage des Einflusses von Wissen auf die Wahrnehmung80 .
In der visuellen Wahrnehmung existieren Beispiele sowohl für direkte als auch für
indirekte Wahrnehmung.
Als Beispiel für die indirekte Wahrnehmung wird immer wieder das Beispiel ge-
bracht, dass wir verdeckte Objekte identifizieren können (siehe auch Abbildung
5) oder schon anhand der Konturen Tiere erkennen (man denke an den Umriss
eines Kamels).
Für die direkte Wahrnehmung werden in der Folge immer die Abbildungen von
unmöglichen Gegenständen angegeben. Man denke an die Bilder von M.C. Escher.
Dort existieren Abbildungen von unmöglichen Treppen, unmöglichen Mühlen und
77
Berechnung des Autors
78
Vgl. Tufte (2001), S. 189.
79
Vgl. Tufte (2005a), 53–65.
80
Vgl. Wilkening (1988), S. 203.
31
Es ist nicht unwahrscheinlich, dass diese beiden Arten der Interpretation des
Zusammenhanges zwischen Wissen und Wahrnehmung nebenher existieren und in
einer Wechselwirkung miteinander stehen. Neben den vorher schon ausgeführten
Fakten sollen diese Ansätze auch helfen, Entscheidungen zu treffen, wenn es um
Visualisierungen geht.
3.9 Zusammenfassung
Sehen geschieht unter Beteiligung des Auges und des Gehirns. Die Wahrneh-
mung mit diesem optischen Apparat ist ein dreistufiger Prozess. In der ersten
Phase unterliegt das Sehen vor allem den körperlichen Randbedingungen. In der
zweiten Phase wird das erfasste Bild mittels Mechanismen, die mit den Gestalt-
gesetzen erklärt werden können, weiterverarbeitet und interpretierbar gemacht.
Diese Mechanik erlaubt das Erkennen von Objekten und das Trennen derselben
vom Hintergrund in Phase drei.
Die Bedeutung der Wahrnehmung für Diagramme lässt sich anhand Abbildung
11 sehen. Die Merkfähigkeit für das reine Lesen eines Textes ist am geringsten.
Sehen erhöht die Merkfähigkeit um den Faktor 3 auf 30%. Das Maximum existiert
für das eigene Handeln, was wiederum das Ziel des Wissenstransfers ist.82
81
Vgl. Escher/Ernst (1994), S. 321, 323.
82
Vgl. Mayer (2000), S. 133.
32
Selbst Tun ●
Sagen ●
Sehen ●
Hören ●
Lesen ●
0 20 40 60 80 100
Merkfähigkeit in %
Farbe ist ein kritischer Faktor. Die Verarbeitung erfolgt schon in der ersten Stufe
des dargestellten Prozesses und die Faktoren, die zu berücksichtigen sind, vari-
ieren je nach Einsatz. So gibt es zusätzlich zu den optischen Reizen, die Linien
auslösen können, auch Effekte an der Grenze zwischen zwei farbigen Flächen, die
wiederum auf den Umgang des Auges mit Wellenlängen zurückzuführen ist.83
Als besonders wichtig stellt sich das räumliche Sehen heraus. Es ist nicht möglich,
nicht räumlich zu sehen. Räumliches Sehen funktioniert über Hinweisreize, die in
einer Vielzahl in Diagrammen vorkommen, allen voran die Okklusion, die schon
beim Kreuzen zweier Linien auftritt. Räumliches Sehen ist nicht 3D-Sehen! Das
Gehirn schließt auch auf Raum, wenn man mit einem Auge sieht.
83
Vgl. Kosslyn (2006), S. 162: Bekannt ist dies vor allem für Blau und Rot, die, wenn neben-
einander abgebildet, eine erkennbare (manchmal als vibrierend wahrzunehmende) Grenzlinie
erzeugen.
33
4 Diagramme
4.1 Einleitung
Alle diese Aussagen sind zutreffend. Betrachten wir aber zunächst die Zahlenwerte
in Tabelle 6. Einige wichtige Kennwerte sind für alle vier Serien von Zahlenpaaren
identisch! Wie unterscheiden sich die Zahlenpaare voneinander?
Wie in Abbildung 12 zu sehen ist, wird durch die grafische Aufarbeitung der Zah-
len aus Tabelle 6 die Verschiedenartigkeit dieser Zahlenreihen sichtbar. Grafische
Aufbereitung enthüllt Zusammenhänge und in letzter Konsequenz die Daten. Die
Grafiken müssen nicht allzu groß sein, um diese Zusammenhänge sichtbar zu ma-
chen. Man erkennt auch in kleinen Abbildungen genug, wenn das Muster nur
eindeutig genug herausgearbeitet wurde. Dieses Beispiel betont die Wichtigkeit
# x1,2,3 y1 y2 y3 x4 y4
1 10,00 8,04 9,14 7,46 8,00 6,58
2 8,00 6,95 8,14 6,77 8,00 5,76
3 13,00 7,58 8,74 12,74 8,00 7,71
4 9,00 8,81 8,77 7,11 8,00 8,84
5 11,00 8,33 9,26 7,81 8,00 8,47
6 14,00 9,96 8,10 8,84 8,00 7,04
7 6,00 7,24 6,13 6,08 8,00 5,25
8 4,00 4,26 3,10 5,39 19,00 12,50
9 12,00 10,84 9,13 8,15 8,00 5,56
10 7,00 4,82 7,26 6,42 8,00 7,91
11 5,00 5,68 4,74 5,73 8,00 6,89
A 9,00 Mittelwert x
B 7,50 Mittelwert y
C 110,00 Summe der quadrierten Abweichungen
D 27,50 Regressionssumme der quadrierten Abweichungen
E 0,82 Korrelationskoeffizient
F 3 + 0, 5 · x Regressionsgerade (kleinste Quadrate)
12
12
●
10
10
●
● ● ●
● ● ●
● ●
y1
y2
● ●
8
8
●
● ●
●
●
6
6
●
● ●
●
4
4
●
5 10 15 5 10 15
x1 x2
● ●
12
12
10
10
● ●
●
●
y3
y4
8
● ●
●
●
● ●
●
● ●
●
●
6
● ●
●
● ●
4
5 10 15 5 10 15
x3 x4
Abbildung 12: Plots der Werte aus Tabelle 6 (nach Anscombe (1973)): In den
grafischen Darstellungen lässt sich schon sehr viel mehr über die
Wertepaare aussagen und Muster erkennen.
der Visualisierung von Daten im Zusammenhang mit den Daten selbst, auch wenn
die Darstellung ungenauer scheint als die Berechnung. Sowohl die Darstellung als
auch Kennzahlen tragen zum Verständnis der Daten bei.84
Es werden heutzutage Daten gesammelt und es werden Fragen gestellt. Die Daten
selbst sind nicht die Antworten, sondern die Zusammenhänge zwischen den Daten
sind die Antworten. Diese Zusammenhänge können Abhängigkeiten, Muster auf
Mikro- oder Makroebene, Konzepte und ähnliches sein.
Wie man an Hand des Beispieles von Tabelle 6 und Abbildung 12 ableiten kann,
ist es nicht Sache der Daten sich darzustellen, sondern eine Angelegenheit des
84
Anscombe (1973) in Tufte (1974), S. 132f
35
Erstellers von Datengrafiken. Der Ersteller hat die Möglichkeit gewisse Muster
und Eigenarten der Daten durch Bilder zu betonen. Wenn man so will, kann der
Ersteller die Fragen — die mit großer Wahrscheinlichkeit auftauchen werden —
mit Bildern beantworten. Daraus ergibt sich die Bedeutung von Datengrafiken:
Sie sind nicht Beiwerk des Textes, sondern haben eine eigene Aussage. Sie müssten
also in der Folge gleichberechtigt mit den Absätzen erscheinen und sind Absätzen
gleichzusetzen. Wie sich das mit extremen Verkleinerungen verhält, werden wir
später behandeln.
Ist eine Grafik falsch gewählt oder hat sie keine Aussage, kann der Effekt beim
Adressaten negativ sein. Wenn man sich fragt, wieviele Grafiken ein Text oder
eine Präsentation fassen kann, so ist die Antwort wohl der folgende Satz von John
Wilder Tukey.
There needs to be a
GOOD PICTURE
in response to
EVERY
type of question
FREQUENTLY ASKED 85
Ein letzter Blick auf Abbildung 12 zeigt, dass die 4 Grafiken mehr enthüllen,
als die Kennzahlen der Datentabellen. Trotz Ihrer Größe erlauben sie Schlüsse
und Vergleich untereinander. Eventuell hätte ein Ordnen der Tabelle 6 von Seite
33 nach der Größe schon manchen Schluss erlaubt, aber die Grafik erlaubt dies
viel schneller, ohne das Vergleichen von Werten zueinander. Man kann immer
nur eine Spalte sortieren und die übrigen Tabellenfelder sortieren sich dann in
Abhängigkeit von dieser. Andererseits ist diese Praxis problematisch, weil man
alle Varianten durchspielen müsste, um zu wissen, welche man zeigt.
Der Duden definiert Diagramm in der ersten Form als „zeichnerische Darstellung
von Größenverhältnissen in anschaulicher, leicht überblickbarer Form.“ 86 Die vor-
liegende Arbeit behandelt diese Abbildungen: Diagramme im Sinne quantitativer
85
Tukey (1973), S. 803 Anm. d. Autors: Die Formatierung des Originals wurde genau eingehal-
ten.
86
Wiss. Rat der Dudenredaktion (1990), S. 181.
36
Darstellungen. Das bedeutet, dass die graphische Aufbereitung von Zahlen, also
Datenmaterial im Mittelpunkt steht, wie das der Fall bei statistischen oder kauf-
männischen Grafiken der Fall ist. Bei Kosslyn (1989) finden wir die Unterschei-
dung in Graphs, Charts, Maps und Diagrams 87 und Harris (1999) unterscheidet
die Informationsgrafiken in Charts, Graphs, Tables, Maps und Diagrams 88 . Bei
Wilkinson (2005) finden wir die Sichtweise, dass der Graph eine mathematische
Definition und somit keine Darstellung ist. Die Grafik ist als Repräsentation des
Graphen zu sehen ist und ein Chart ist eine Instanz einer Grafik.89 Dem ist hin-
zuzufügen, dass Wilkinson unter Grafiken auch die Verwendung von Karten und
andere Diagramme sieht, die nicht unbedingt der Kommunikation von Zahlen
dienen.
Bei Tufte (2001) findet sich der Begriff Datengrafik, der eine gute Definition
für Diagramme im Sinne quantitativer Darstellungen darstellt, den wir in der
Folge synonym benutzen werden. Tufte definiert den Begriff der Datengrafiken
wie folgt:
Diese Definition steht nicht in Konkurrenz mit der von Wilkinson und bietet ein
verständlicheres Modell, auch wenn es nur einen Ausschnitt zeigt.
87
Vgl. Kosslyn (1989), S. 186.
88
Vgl. Harris (1999), S. 4.
89
Vgl. Wilkinson (2005), S. 1f.
90
Tufte (2001), S. 13.
91
Detaillierte Beschreibungen sind auf Seite 52 zu finden.
37
Wilkinson (2005) vermeidet die Typologien von Charts, wie sie in Abbildung 13
gezeigt werden. Diese Art der Unterteilung vermeide die Perspektive, dass Gra-
fiken als etwas Allgemeines zu verstehen sind und bringt als Beispiel, dass ein
Kreisdiagramm nichts anderes sei als eine geteilte Balkengrafik in Polarkoordina-
ten.95
Der Unterschied zwischen einem Bild und einem Diagramm ist der Abstraktions-
grad. Während das Bild eine Darstellung der Wirklichkeit sein soll, bietet das
Diagramm eine abstrahierte Fassung einer Wirklichkeit, die in manchen Fällen
wieder auf einer mehrfach gefilterten Wahrnehmung beruht, in dem zum Beispiel
Daten von Sensoren gemessen wurden oder Antworten nur im Rahmen eines vor-
gegebenen Rasters möglich waren.
Skalen dienen der Klassifizierung von Messdaten. In der Statistik benutzt man
gerne das folgende hierarchische Modell (beginnend an der Basis):96
92
vgl. Lengler/Eppler (2007), S. 6.
93
Vgl. Rotman (1993), S. 12f.
94
Vgl. Kosslyn (2006), S. 18f.
95
Vgl. Wilkinson (2005), S. 2.
96
Vgl. Ponocny-Seliger/Ponocny (2005), S. 57f.
39
Die Skalen sind hierarchisch aufgebaut, das bedeutet, dass jede Skala die darun-
ter liegende enthält (in der Auflistung war die Reihenfolge von unten nach oben)
und somit auch Ihre Eigenschaften - aber nicht umgekehrt.97 Jede Intervallskala
ist auch eine Ordinalskala, aber nicht umgekehrt. Nicht jeder Diagrammtyp passt
oder macht Sinn in Verbindung mit jeder Skala, wie man am Beispiel Kreisdia-
gramm und Ordinalskala erkennt.
Der Begriff der Skala kann aber auch die Einteilung der Maßeinheiten auf den
Achsen eines Diagramms bezeichnen, im Sinne eines Maßstabes. Häufig verwendet
werden lineare Skalen, in wissenschaftlichen Arbeiten sehr oft auch logarithmische
Skalen auf der Basis 2 oder 10. Letztere sind für ungeübte Betrachter schwerer zu
lesen, bieten aber den Vorteil vor allem Vergleiche auf Basis von Zweier- und Zeh-
nerpotenzen gut ablesen zu können und die Schiefe98 von Daten zu kurieren.99
97
Vgl. Ponocny-Seliger/Ponocny (2005), S. 58.
98
Schiefe ist im Sinne einer Nicht-Normalverteilung zu sehen und liegt beispielsweise vor, wenn
Daten sich am unteren und oberen Ende eines Spektrums häufen.
99
Vgl. Cleveland (1994), S. 103ff.
40
Visualisierungen von Zahlen können prinzipiell zwei Dingen dienen. Das sind (1)
die Analyse und (2) die Kommunikation von Daten.100 Beide Prozesse können
als Wissenstransfer verstanden werden. Wobei im Fall der Analyse der Wissen-
stransfer auf einer anderen Ebene stattfindet und der Sender identisch mit dem
Empfänger sein kann, aber nicht notwendigerweise ist. Meist folgt der Analy-
se eine Kommunikation des Ergebnisses. Die Analyse versucht also Muster oder
Konzepte in den Daten darzustellen.
Die Verwendung von Visualisierungen und speziell von Diagramme ist üblich.
Das war nicht immer so. Erst zwischen den Hälften des 18. und 19. Jahrhundert
kam es zur Verlagerung der Wissenschaft von Worten zu Bildern. Die Graphen,
die wir heute in Verwendung haben, wurden zum Großteil damals das erste Mal
verwendet.102
Heutzutage bietet der Einsatz von Datengrafiken die Möglichkeit komplexe Zu-
sammenhänge und Zustände einfach und schnell zu kommunizieren. Diagramme
tragen dazu bei, die Verständlichkeit eines Textes zu steigern.104 Leider muss man
sagen, dass damit auch die Möglichkeiten diese Zusammenhänge — mit oder ohne
Absicht — falsch darzustellen, vorhanden ist. Das kann auf die Tatsache zurück-
100
Vgl. Cleveland (1994), S. 23.
101
Vgl. Wilkinson (2005), S. 111.
102
Vgl. Wainer (2005), S. 4.
103
Vgl. Tukey (1980), S. 815.
104
Vgl. Chabris/Kosslyn (1995), S. 29.
41
geführt werden, dass die Grafik schon eine Form der Interpretation der Daten
darstellt.
Die Datengrafik besteht, mit wenigen Ausnahmen105 , immer aus denselben Ele-
menten:106
Diagrammfläche: Die Fläche, auf der die Symbole (Punkte, Linien, Boxen, Flä-
chen, etc.) abgebildet werden. In Microsoft Excel wird unter dem Begriff
Diagrammfläche der gesamte Hintergrund der Grafik verstanden. Die Dia-
grammfläche ist aber die Fläche, auf dem der Inhalt des Diagramms abge-
bildet wird.
Achsenfläche: Die Fläche, die von den Achsen eingeschlossen wird. Sie kann,
muss aber nicht größer als die Diagrammfläche sein.
Achsen: Die Achsen sind meist orthogonal107 angeordnet und folgen laut einer
allgemeinen Konvention immer dem Muster: horizontal (oder in x-Richtung)
findet sich die unabhängige Variable und auf der Vertikalen (respektive in
y-Richtung) befindet sich die abhängige Variable (im Sinne von y = f(x)).
Auf den Achsen befinden sich auch kleine Unterteilungen, die so genannten
Tickmarks oder Ticks, die eine Zuordnung der Symbole zu ihren Werten
erlauben.
Achsenbeschriftung: Die Achsenbeschriftung kann Informationen zu den abge-
bildeten Daten enthalten, aber auch in welcher Skalierung diese vorliegen.
Symbol: Die Symbole sind die Elemente, die das eigentlich Diagramm bilden.
Das wären die Punkte, Linien, Flächen und ähnliches.
Datenbeschriftung: Ist die Bezeichnung der abgebildeten Daten (zum Beispiel:
Jahr, Region oder ähnliches)
Legende: Für den Fall, dass für die Datenbeschriftung kein Platz auf der Dia-
grammfläche vorhanden ist, gibt es eine Tabelle mit der Zuordnung der
Symbole zur Datenbeschriftung.
Titel und Beschreibung: Jedes Diagramm sollte einen Titel haben, damit klar
ist, worum es in dieser Abbildung geht. In manchen Fällen empfiehlt es sich
105
Beispielhaft: kreisförmige Diagramme, 3d-Diagramme und ähnliche
106
Vgl. Cleveland (1994), S. 22–25.
107
d.h.: rechtwinklig
42
Data: Eine Menge von Operationen, die aus den Rohdaten Variable erstellt.
Trans: Transformationen der Variablen (z.B.: Rangordnung)
Scale: Skalentransformationen (z.B.: Logarithmen)
Coord: ein Koordinatensystem.
Element: der tatsächliche Graph (im Sinne von Punkten) und seine ästhetischen
Attribute (z.B.: Farbe).
Guide: Beschreibt die Führungselemente (z.B.: Achsen, Legenden, etc.)
Auf Basis dieser Objekte sind alle Arten von Datengrafiken zu definieren und
aus der entstehenden Definition auch zu produzieren. Es handelt sich hierbei
aber nicht um eine Programmiersprache oder eine Heuristik, sondern um eine
Grammatik109 , die wiederum aus Syntax110 und Semantik111 besteht:
108
Vgl. Wilkinson (2005), S. 6f.
109
„Einer Sprache zugrunde liegendes Regelsystem.“(Wiss. Rat der Dudenredaktion (1990),
S. 288)
110
Regeln die die Kombination von Worten und Sätzen darstellen.Vgl. Wilkinson (2005), S. 21
111
Regelt die Bedeutung sprachlicher Zeichen und Zeichenfolgen. Sie ist im Zusammenhang mit
Grafik als das den Daten zugrunde liegende Konzept zu verstehen.(Vgl. Wilkinson (2005),
S. 357)
112
Übersetzung durch den Autor von Wilkinson (2005), S. 634.
43
Das bedeutet in weiterer Folge, dass die Daten ein fixer Bestandteil der Grafiken
sind. Die Semantik der Daten beeinflusst maßgeblich das Aussehen der Grafik.
Schnotz (2002) empfiehlt für das mühelose Verstehen von Diagrammen die Iden-
tifizierbarkeit repräsentationsrelevanter Werte einerseits und andererseits sollten
Anstrengungen unternommen werden diese in der richtigen Konfiguration abzu-
bilden.113 Ein Weglassen mancher Diagrammelemente kann schwerwiegende Fol-
gen für die Lesbarkeit haben. Im schlimmsten Fall sinkt die Aussage gegen Null
und die Datengrafik erfüllt keine Funktion.
Mitte des 19. Jahrhunderts zeigte Ernst Heinrich Weber in Versuchen, dass Ge-
wicht um einen bestimmten Faktor verändert werden muss, damit man die Än-
derung wahrnimmt. Gustav Theodor Fechner gelang es 1860 diesen Fakt in einer
Formel niederzuschreiben, dem so genannten Weberschen Gesetz (Gl. 3)115 .
∆R
=k (3)
R
∆R
∆E = c · (4)
R
113
Vgl. Schnotz (2002), S. 76.
114
Vgl. Wilkinson (2005), S. 23.
115
Vgl. Mayer (2000), S. 10, Cleveland (1994), S. 240
116
Vgl. Mayer (2000), S. 10f.
44
R
E = c · ln (5)
R0
Das Gesetz besagt, dass der Reiz geometrisch zunehmen muss um die Empfindung
linear anwachsen zu lassen, dass also immer mehr Reiz aufgebracht werden muss
um die Steigerung der Empfindung konstant zu halten. R0 bezeichnet in Gleichung
5 den so genannten Schwellenreiz.
Das Webersche Gesetz wird von Cleveland (1994) aufs Tapet gebracht um ei-
ne relativ umstrittene Praxis zu unterstützen: Den Raster.117 Der Raster ist das
Gitter auf der Diagrammfläche und erlaubt die Konvertierung von kleinen Stei-
gerungen in größere indem er exaktere Vergleiche ermöglicht. Allerdings setzt
Cleveland den Raster ein um Kurven innerhalb von gestapelten Diagrammen zu
vergleichen. Tufte (2001) empfiehlt den Raster weitestgehend wegzulassen oder
zumindest in eine andere Ebene zu verlegen, sodass die Präsenz nur noch impli-
ziert wird.118 Man findet bei Cleveland (1994) nur Raster, die bedingt verwendet
werden können, um Daten abzulesen. Seine Raster sind meist eine Variante um
die Zeichenfläche in gleichgroße Rechtecke oder Quadrate zu teilen, kein Raster,
wie man es zum Beispiel aus Microsoft Excel kennt, die der Beschriftungslogik
der Achsen folgen. Raster können also mehrere Funktionen haben und/oder un-
terstützen: Der (1) Vergleich und genaues Ablesen wird erleichtert und die (2)
Zuordnung wird verbessert.
Tufte (2001) führt gegen den Raster119 das Prinzip der Data-Ink Ratio (Gl. 6)
ein.120 Es sagt aus, dass versucht werden soll, den Anteil der nicht notwendigen
Elemente aus der Grafik zu tilgen.
Data-Ink
Data-Ink Ratio = (6)
total ink used to print the graph
Ziel jeder Visualisierung sei es möglichst viel Chartjunk 121 , wie etwa uninforma-
tive Dekoration, Schraffuren, redundante Information und ähnliches weglassens-
werte, nicht zu zeigen. Der Maximalwert von 1 ist erreichbar, indem man alle
Elemente entfernt, die nicht zur Darstellung der Daten dienen. Wie genau das
definiert ist, kann man bei Tufte (2001) nicht nachlesen. Der Raster kann aber so
117
Vgl. Cleveland (1994), S. 242.
118
Vgl. Tufte (2001), S. 112.
119
Der Raster dient hier als erste Erklärung für sein Prinzip, es richtet sich aber gegen viel mehr.
120
Vgl. Tufte (2001), S. 93f.
121
Vgl. Tufte (2001), S.107–121: Chartjunk bezeichnet die unnötigen Elemente in einer Gra-
fik. Auf http://www.juiceanalytics.com/weblog/?p=161 (online abgerufen 01.04.2007) findet
man ein Excelmakropaket, das hilft, die Excelgrafiken nach den Vorstellungen von Tufte zu
reinigen.
45
gestaltet werden, dass er den Daten „nicht im Weg steht“. Was nicht erwünscht
ist, ist ein Raster von der Feinheit von Millimeterpapier, auf dem man kaum die
Daten von den einzelnen Linien des Rasters unterscheiden kann.
Die Data-Ink-Ratio ist allerdings auch kritisch zusehen. So ist Kosslyn (2006)
der Meinung, dass man damit auch zu weit gehen kann, indem man — wie
Tufte (2001) es getan hat122 — dem Balkendiagramm die Balken nimmt.123 Der
Zusatz, den Tufte (2001) seinen drei Ratschlägen zur Data-Ink-Ratio gegeben hat,
sei also wörtlich genommen: Das Prinzip ist innerhalb der Grenzen der Vernunft
zu benutzen, besonders der dritte Ratschlag.
Das Webersche Gesetz bedeutet aber auch für den Ersteller einer Datengrafik,
dass er Unterschiede so weit als möglich herausarbeiten sollte. Es ist somit ein
Argument für die Praxis, die Achsen einer Grafik nicht bei Null beginnen zu las-
sen, wenn die Darstellung sonst nachteilig ist125 . Leider kann man diese Handlung
auch verwenden um die Tatsachen zu übertreiben, zu verfälschen oder einfach ge-
sagt: um zu lügen.126
Der Unterschied zwischen dem tatsächlichen Reiz und dem empfundenen Reiz
findet man oftmals auch in die Praxis umgesetzt: In geographischen Karten ver-
wendet man manchmal Kreise, deren Größe an die empfundene Größe angepasst
sind, weil die Flächen nach der Reizempfindung interpretiert werden.127 Es kommt
auch zu Fehleinschätzung von Winkeln und in weiterer Folge von Steigungen.128
Im anglikanischen Raum ist als Konkurrenz zu Weber und Fechner noch das
Stevenssche Potenzgesetz (Gl. 7) weit verbreitet.
ψ = k(φ − φ0 )n (7)
122
Vgl. Tufte (2001), S. 100–102.
123
Vgl. Kosslyn (2006), S. 126f.
124
Tufte (2001), S. 96 und 100:Hervorhebung im Fettdruck durch den Verfasser der Arbeit.
125
Vgl. Kelly/Jasperse/Westbrooke (2005), S. 12.
126
Vgl. Krämer (2007), S. 37–50.
127
Vgl. Harris (1999), S. 381.
128
Vgl. Cleveland (1994), S. 66–79.
46
Ein geflügeltes Wort sagt: „Glaube keiner Statistik, die Du nicht selbst gefälscht
hast.“ Dieses Sprichwort wird sehr oft auch in Zusammenhang mit statistischen
Grafiken gebraucht. Aber nicht alle Fehlabbildungen sind gewollte Lügen. Der
Großteil ist entstanden, weil ein guter Effekt gesucht wurde oder weil der Glaube
existiert, dass man schlecht ausgewählte Zahlen durch graphische Effekte verbes-
sern kann oder weil falsche Überlegungen zu Stichproben vorhanden sind.131
Bei Tufte (2001) finden wir den Lügenfaktor (Gl. 8), der das Verhältnis eines
Effekts in der Grafik als Vielfaches desselben Effekts in den Daten beschreibt132 .
Das bedeutet, wenn man eine Steigerung um 200% in den Daten abliest und 500%
500%
darstellt, das einen Lügenfaktor von 200% = 2, 5 ergibt.
Fehlabbildungen, die solche Effekte beinhalten, bedienen sich oft der 3-Dimension-
alität, Perspektive oder einem Fehlgriff in der Variation der Dimension. Nehmen
wir zur Erklärung der letzten Annahme an, man stellt den Wert eines Euro zum
Zeitpunkt der Einführung des Euro mit einem Zuckerwürfel dar und behauptet,
dass er nach x Jahren halb so viel Wert besitzt. Der Effekt in den Daten ist
50%. Dann beschliesst man die Seitenlänge des Würfels zu halbieren, man stellt
aber den Würfel dreidimensional mit seinem Volumen dar, sodass der abgebildete
Effekt 12,5% (entspricht 50%3 ) darstellt. Der Lügenfaktor beträgt 12,5%
50%
= 0, 25.
Man stellt also nur ein Viertel von dem dar, was dargestellt werden sollte. Die
129
Vgl. Stevens (1961), S. 31f.
130
Vgl. Robbins (2005), S. 51.
131
Vgl. Krämer (2007), S. 97–119.
132
Vgl. Tufte (2001), S. 57.
47
richtige Seitenlänge wäre, wenn man unbedingt über das Volumen darstellen woll-
√
te, 3 0, 5 = 0, 79. Es gilt allerdings immer die Empfehlung keine Dimensionen zu
benutzen, die man nicht benötigt, auch weil das Vergleichen von Werten psycho-
physischen Effekten und einer Geschwindigkeitseinbusse beim Lesen unterworfen
ist.133
Nr. Merkmal
1 Anordnung an gemeinsamer Achse bzw. Skala
2 Anordnung an identischer, nicht-ausgerichteter Achse
3 Länge
4 Winkel
Steigung
5 Fläche
6 Volumen
Dichte
Farbsättigung
7 Farbton
133
Vgl. Wilkinson (1994), S. 172, Spence (2004), S. 746 und Tufte (2001), S. 77
134
Vgl. Hollands/Spence (2001), S. 429f.
135
Vgl. Cleveland (1993), S. 142.
136
Vgl. Beattie/Jones (1992), S. 291.
48
Die Auswahl der Daten steht am Anfang und dann kommt die Wahl der Methode
um diese Daten auch darzustellen. Und schliesslich gilt: „If the statistics is boring,
you’ve got the wrong numbers.“ 138
Das bedeutet in der Folge: Das Koordinatensystem muss geändert werden, Ab-
lesehilfen für die z-Achse müssen geschaffen werden (zum Beispiel Raster als
Wände) und die Daten müssen eventuell anders sortiert werden, um sich nicht
gegenseitig zu verdecken. Speziell im Zusammenhang mit Kreis- oder Tortendia-
grammen kann es hier zu extremen Verzerrungen kommen.
137
Vgl. Rogowitz/Treinish (1995).
138
Tufte (2001), S. 80.
139
Vgl. Kapitel 3.7 und die Ausführungen zum Thema
49
Nehmen Sie Zettel und Bleistift und versuchen Sie die Anteile der vier Sektoren
in Abbildung 14 zu schätzen. Eine Auflösung der Werte finden Sie auf Seite 55
(die obere Zeile der Diagramme), wo Sie auch eine ebene Darstellung desselben
Tortendiagramms finden.
Speziell die optische Vergrößerung der Vorderseite durch die„Lippe“, die durch die
Höhe des gekippten Kreises entsteht, verursacht eine Fehleinschätzung der Fläche
des Bereiches im Vordergrund. Das Schätzen der Anteile, also der Winkel auf einer
gekippten Fläche ist eine schwierige Aufgabe. Wenn man die Winkel beiseite lässt
und zu dreidimensionalen Balken- und Säulendiagrammen übergeht, die zumeist
ein Koordinatensystem aufweisen, muss man sich damit beschäftigen, wo man den
Wert ablesen soll, der zu einer Säule oder Balken gehört und unterliegt zusätzlich
noch perspektivischen Verzerrungen.140
140
Vgl. Robbins (2005), S. 23–31, Harris (1999), S. 38, Kosslyn (2006), S. 209f und Tufte (2001),
S. 67f
50
5 Diagrammtypen
Alle Diagrammtypen sind verschieden. Jede hat Ihre Eigenheiten und zum Groß-
teil existieren unzählige Varianten. Zu manchen entstanden in der neueren Zeit
auch Alternativen. Die Diagrammtypen, die heute in Verwendung sind, wurden
— was den täglichen Bürobedarf betrifft — fast alle von William Playfair er-
funden respektive das erste Mal verwendet.141 Bis zum Erscheinen seines The
Commercial and Political Atlas im Jahre 1801 war es unüblich Grafiken zum
Darstellen von Sachverhalten zu benutzen, geschweige denn diese zu benutzen,
um die eigenen Argumente zu untermauern. Es existieren zwar viele Beispiele
für Visualisierungen vor Playfair, allerdings beginnt mit seinem Werk langsam
die moderne Datengrafik. Er bereitete den Boden für das goldene Zeitalter der
Datengrafik.142
Als Pop Charts bezeichnet Cleveland (1994) die drei am häufigsten verwendeten
Arten der Visualisierung: (1) Kreisdiagramme, (2) geteilte Balkendiagramme und
(3) Flächendiagramme. Pop steht hier für populär, weil diese Diagramme immer
wieder in Zeitungen und anderen Breitenmedien zu finden sind. Diese Diagram-
me sind in der Literatur zur Genüge untersucht und reflektiert.144 Sie werden in
die spätere Analyse eingehen, allerdings werden wir diese hier nicht näher behan-
deln.
Einen ähnlichen Status wie die oben angeführten Popcharts haben die Linien-
diagramme. Die Liniendiagramme sind für das tägliche Geschäftsleben ebenso
141
Vgl. Wainer (2005), S. 15f.
142
Vgl. Friendly (2007), S. 13ff.
143
Was in diesem kleinen Rahmen auch nicht möglich wäre. Zum Vergleich: Die Referenz von
Harris (1999) umfasst knapp 400 Seiten und es fehlen viele wichtige neuere Formen, wie zum
Beispiel Dotplot, Trellisdiagramm oder die Sparklines.
144
Vgl. Cleveland (1994), s. 262–269, Harris (1999), S. 281–286, S. 27–52, S. 9–21,Robbins (2005),
S. 13–34, Kosslyn (2006), S. 111–134
51
wichtig wie Balkendiagramme145 . Auch diese werden in die Analyse mit einge-
hen, aber nicht näher behandelt.
148
Vgl. Ponocny-Seliger/Ponocny (2005), S. 1–4: Der Median ist der mittlere Wert einer Reihe,
als der Wert, der sich nach dem wertmäßigen Ordnen einer Reihe, in der Mitte befindet. Das
1.Quartil bezeichnet den Wert, unter dem 25% der anderen Werte liegen, das 3.Quartil ist
entsprechend mit 75% definiert. Man kann den Median auch als 2.Quartil bezeichnen.
149
Vgl. Ponocny-Seliger/Ponocny (2005), S. 1–4: Der Median ist der mittlere Wert einer Reihe,
als der Wert, der sich nach dem wertmäßigen Ordnen einer Reihe, in der Mitte befindet. Das
1.Quartil bezeichnet den Wert, unter dem 25% der anderen Werte liegen, das 3.Quartil ist
entsprechend mit 75% definiert. Man kann den Median auch als 2.Quartil bezeichnen.
54
Die Geschichte der Visualisierungen in den letzten 50 Jahren ist vor allem geprägt
durch die Einführung computergestützter Berechnungen und Visualisierungen.153
Genau genommen zählt der Boxplot des letzten Abschnitts auch zu diesen Neue-
rungen, allerdings ist er gerade in der Statistik als robuste Darstellung von La-
gemaßen von solcher Bedeutung, dass er sich relativ schnell etabliert hat. In den
letzten Jahrzehnten des 20.Jahrhunderts kamen vor allem interaktive Techniken
der explorativen Datenanalyse hinzu.154 Nicht alle neuen Methoden sind für die
150
Vgl. Grosche/Ziegler/Ziegler (1991), S. 148.
151
Anm. des Autors: Stehen die Vektoren rechtwinklig normal aufeinander.
152
Vgl. Grosche/Ziegler/Ziegler (1991), S. 210.
153
Vgl. Friendly (2007), S. 31.
154
Wie etwa die Folgenden: Lensing, Focusing, Brushing und Slicing. Details und mehr bei
Wilkinson (2005), S. 552–577
55
5.3 Dotplot
A
D ●
C ●
B
B ●
D
A ●
C
0 20 40 60 80 100
A
D ●
C ●
B
B ●
D
A ●
C
0 20 40 60 80 100
Abbildung 16: Vergleich zwischen Kreisdiagramm und Dotplot: Es ist leichter die
Werte mittels des Dotplot nachzuvollziehen. Obwohl nicht ange-
führt entspricht die Aufteilung im ersten Fall 40 : 20 : 20 : 20. Im
zweiten Fall ist das Verhältnis 40 : 22 : 20 : 18. Der Unterschied
ist bei den Dotplots besser zu erfassen.
Der Dotplot wurde als Antwort auf die Standardverfahren bei der Datenvisua-
lisierung erfunden, wie die Kreis- und Balkendiagramme, um deren Schwächen
in der Darstellung zu umgehen.157 Der Dotplot ist ein Diagramm, bei dem die
155
z.B.: Chernoff-Gesichter, bei denen multivariate Daten in kleine Cartoongesichter codiert
werden und der Gesichtsausdruck genauso einen Wert repräsentiert wie die Größe der Ohren
(Vgl. Harris (1999), S. 72)
156
Vgl. Ponocny-Seliger/Ponocny (2005), S. 97 multivariat: die Variablen hängen voneinander
ab und.
157
Vgl. Cleveland (1994), S. 152.
56
Wie in Abbildung 16 zu sehen ist, sind die Vorteile gegenüber dem Kreisdiagramm
neben der genaueren Vergleichbarkeit der Daten im Sinne von x > y, x < y oder
x = y, auch die Faktorisierung der Daten im Sinne von x = a · y. Es ist sehr
schwer und nur für geübte Augen erkennbar, dass die Sektoren in der zweiten
Zeile geringfügig voneinander abweichen, wobei dies im Dotplot ersichtlich ist.
5.4 Multidisplays
Die Anordnung mehrerer Grafiken gemeinsam nennt man Multidisplays oder Pa-
nelcharts. Die Anordnung beieinander ergibt sich aus Zusammenhängen, nicht
aus der Tatsache, dass sie nebeneinander stehen. Die Anordnung ist eine Folge
der Datenstruktur.
1932 ●
1931 ●
20 30 40 50 60
Crookston Waseca
Trebi ● ● ● ●
Wisconsin No. 38 ● ● ●
●
No. 457 ● ● ● ●
Glabron ● ● ● ●
Peatland ● ● ● ●
Velvet ● ● ● ●
No. 475 ● ● ● ●
Manchuria ● ● ● ●
No. 462 ● ● ● ●
Svansota ● ● ● ●
20 30 40 50 60
Gerstenernte (Büschel/Acre)
Abbildung 17: Beispiel für einen Multiway Dotplot: Diese Abbildung zeigt die
Erntergebnisse für Gerste verschiedener Sorten auf 6 Farmen in
den Jahren 1931, 1932.
57
So kann, wie in Abbildung 17 zu sehen ist, das Darstellen mehrerer kleiner Dis-
plays sehr sinnvoll sein. In Abbildung 17 ist vor allem die Farm Morris her-
ausragend. Cleveland (1993) enthält eine Abhandlung über die Möglichkeit eines
Aufzeichnungsfehlers in dieser Causa.160 Diese Arten der Darstellung sind ein sehr
guter Ersatz für Kreis-, Balken- und Säulendiagramme.
● ● ●
● ● ● ● ● ●●● ●●●●
●
7.5
●
●● ● ●
●
● ● ● ●●●● ● ●
● ● ●
● ●●●●●● ●●
●●
● ●●
●
● ●●●● ● ● ●
● ●
●
●●●● ● ● ●●
● ●●● ● ● ●●●●
●● ●● ●
6.5
●●
●● ●●
● ● ●●●
●● ●● ●● ●● ●● ● ● ●● ●●●
●● ●●●●
●
●●
●● ●●● ● ● ●
● ●● ● ● ●
●● ●
●● ●●●
Sepal.Length ●
●●
● ●
●●●
●●
● ● ●
●●● ● ● ● ●●● ●
●
●
●●
●
●
●●●
●●
●
●●
●●
●
●
●
●
●
●
● ●
●
● ●●●
●
● ●●●●
● ●●
● ●●
●
●● ●
●
●● ●
5.5
●●●
●●●●●●
● ●● ● ● ● ●
●●
●●
●●●●
●
●● ●● ●
● ● ●●
●●●
● ●
●
●
● ● ●
●● ● ●
●
● ●●● ● ●●
● ● ●
● ●●●
● ●
●●
●●
●●●● ●●●
●●● ●
●●
●
●
●
●
●
●
●●
● ● ●
●
●
●●
●
●●
●●●●● ●
● ●
● ● ● ● ●●●
●● ●●●
4.5
● ●● ●●●
● ●●
●●
● ● ●●● ●●
● ● ●
● ● ●
4.0
● ● ●
● ● ●
● ●● ●
● ● ●● ●
●●● ●● ●●● ● ●
● ●● ● ● ●
● ●● ● ●● ● ●● ●
●●● ● ●●●
● ●● ●
● ● ●●● ● ● ●● ●●
●●● ● ●● ●●● ● ●●
● ●● ●
●● ● ●
● ●● ●●● ● Sepal.Width ●
●
●●
●● ●●
● ●●
●●● ●● ●
● ●
●
● ●
●● ● ● ●
●
3.0
● ●● ● ●●
●● ●
● ●●●●● ●
● ●● ●● ● ● ●●
●● ●●● ● ●● ●●● ●●●● ●● ●● ●●●● ●●●●●●●
●●
●●● ●● ● ●●● ●●●●●●● ●●●●
● ●● ●●●●● ● ● ● ● ● ●●●● ● ● ● ●●● ●
●●● ●●●●● ● ● ● ●
●● ●●
●●● ● ● ● ●●●● ●●●●● ●
● ●● ●● ●● ●●● ●●● ● ●●● ● ●●
● ●● ● ● ● ●● ● ● ● ● ● ●
● ● ●●● ● ● ● ●● ●● ● ● ● ● ● ●●●●
● ● ●●● ●●
● ● ● ● ● ● ●● ● ● ●
●● ● ● ● ● ●
2.0
● ● ●
1 2 3 4 5 6 7
● ● ● ●●●●
●● ● ● ●
●
●●● ● ●●● ● ●●● ● ●
● ● ●● ●● ●●●
●● ●●● ● ● ● ●●● ●
●● ●
●●●● ● ●
●●● ●●●● ● ● ●
●
● ●●
● ●●●
●●●
●● ● ●● ●
●●● ● ●● ●
●
●●●●●● ●
●●
●
● ● ●●●
●●●● ● ● ● ●
● ●●
● ●
●●
●●
●
●
●● ●
●
●●
● ●●●
●●
●●●
●
● ●●
●
● ●●●● ●● ● ●●●● ● ●●
●● ●● ●
●●●
●
●●
●●
●●● ●
●●
●●●●
●●
●
●
● ●●● ●● ●●
●●●
●
●●
●
● ●
●
●●
●●
●●
●●
●
● ●● ●●●●
● ●●
● ●
●●
●●●
●
●
●
●● ● Petal.Length ●
●●
●
●
●
●●
●●
●
●●
●●
●
● ● ●
● ●●●●●
● ● ●●
●● ●
●● ●
●●●
●●●
●●●●●
●●●
●●
●●● ● ●●
●●
●●
●●●
●● ●
●●●●●●●● ●
●
●●
●●●●
●●
●●●●● ●●●● ●● ● ●●
● ● ●●
● ● ●
●●
●●
●
●
●●
2.5
● ● ● ● ● ●●●
● ● ● ● ● ● ● ●
● ● ●●● ● ● ●●● ● ●●
●●●●● ●
●● ● ● ● ● ●● ●
● ●●● ● ● ● ●● ● ●
●●●● ●
●● ● ●● ● ● ● ● ● ●●
●● ●●
● ●● ● ● ●● ●
●● ●
●●●●●●● ● ●● ● ●●●●●● ●
●● ●●●●●
● ● ● ● ● ●
1.5
● ● ● ● ● ●● ●● ● ●
● ● ●● ●●●● ● ● ● ● ●●●●● ●●●●●●
●
● ● ●● ● ● ●●●●●●● ● ●●●● ●
● ●●
●●● ●●●● ●
● ●● ●
●● ● ●● ●
● ● ●●●●
●●
●●● ●
● ●●● ●●
● ●
●●
●
●
●●
●●
●
●●●●
●
●●●●●
Petal.Width
0.5
● ● ●
● ● ●
●● ● ● ● ●●● ● ●●
●●●
●● ● ●● ● ● ● ●● ● ●
●●
●●
● ●●●
●●
●●●●●●● ● ●●●●
●●●●●●●● ● ● ●●●
●●
●●●
● ●● ● ●● ● ● ●●●
Abbildung 18: Beispiel für einen Matrixplot: Es wurden hier für 3 Spezies von
Iris, die Abmessungen der Kelch- (Sepalum) und Kronblätter (Pe-
talum) der Blüten gegeneinander aufgetragen.
Es ergibt sich mitunter die Möglichkeit kleine Vielfache 161 darzustellen, was als
eine Art von Bildergeschichte verstanden werden kann. Das kann bei multivaria-
158
Vgl. Cleveland/Fuentes (1997), S. 1.
159
Vgl. Maindonald (2004), S. 33.
160
Vgl. Cleveland (1993), S. 328–339.
161
Vgl. Tufte (2005a), S. 67–80.
58
ten Daten so weit gehen, dass alle Variablen gegeneinander in einem Matrixplot
gezeichnet werden, wie in Abbildung 18 zu sehen ist.162
Given : wool
0 10 20 30 40 50
70
50
H
●
30
● ●
●
● ●
● ●●
● ● ●
● ●●
●
10
70
Given : tension
50
breaks
M
● ●
●●
30
● ● ● ●
●
● ●
● ●● ●
●
●
10
70
●
●
●
●●
50
●
●
L
30
● ●
●●
● ● ● ●
● ●
●
10
0 10 20 30 40 50
Index
Abbildung 19: Beispiel für einen Conditional Plot: Es handelt sich hier wieder
um einen Rasterchart für die Reißfestigkeit zweier Wollsorten in
verschiedenen Stichproben, der allerdings zwei Konditionen unter-
liegt: (1) Wollsorte und (2) Zugstärke.
Das Begriffswirrwarr bei den Panelcharts hat unter anderem auch urheberrecht-
liche Gründe: Trellis ist ein Markenzeichen der Insightful Corporation.164
S-Plus und R sind zwar Implementierungen von S, einer statistischen Program-
miersprache, aber R ist ein Open Source Produkt und S-Plus kommerziell.
162
Oft bezeichnet der Begriff Matrixplot aber das Auftragen mehrerer Sichtweisen in einem
geordneten Raster
163
Vgl. Harris (1999), S. 143.
164
Produzent von S-Plus.
59
S dient oft als Unterbau für Statistiksoftware und wird deshalb als Lingua Fran-
ca der Statistik bezeichnet.165 R ist ein Dialekt von S, der sich stark an die Pro-
grammiersprache C lehnt. Die Syntax ist fast identisch.166
Um zu zeigen wie Variable von anderen Variablen abhängen, verwendet man gerne
conditional plots, wie in Abbildung 19 beispielhaft dargestellt. Man erkennt hier
die Abhängigkeit der Brüche innerhalb einer Wollsorte in Bezug auf die Zugstärke
und den Unterschied zwischen den Wollsorten. Dies bildet eine Alternative zu
Diagrammen mit zwei y-Achsen und Kurven, die superpositioniert wurden.
Alle diese Verfahren können sich auch aller Methoden bedienen, die auf die Da-
ten in Ihnen anwendbar ist. Das bedeutet, dass man bei der Verwendung eines
Histogramms einen Kerndichteschätzer, bei der Verwendung von Liniendiagram-
men Glättungsfunktionen usw. usf.. Der Fokus der Multidisplays liegt kaum noch
im Anzeigen von Werten, sondern in der Vermittlung von Zusammenhängen und
Verhältnissen innerhalb der Daten.
Eine interessante Form der Verdichtung von Daten stellt auch der Mosaikplot dar,
der besonders gut dazu geeignet ist kategorische Daten in einem Display darzu-
stellen.167 Abbildung 20 erzählt die Schicksale der Passagiere der Titanic. Der
Mosaikplot ist eine Erweiterung des Balkendiagramms auf mehrere Kategorien.
Die Dimensionen zeigen die Anteile der Subkategorien an den Hauptkategorien
und können noch einmal geteilt werden, um eine weitere Kategorie anzuzeigen.
Das bedeutet, dass die horizontale Unterteilung das Verhältnis von Crew zu Klas-
senpassagieren zeigt, welche wiederum in Erwachsene und Kinder geteilt werden.
Die Vertikale Unterteilung spiegelt die Verhältnisse männlich:weiblich und über-
lebte:gestorben. Es sind hier also 4 Kategorien berücksichtigt. In Abbildung 20
findet man eine explodierte Ansicht eines Mosaikplots. Im Normalfall würden sich
alle Balken auch berühren können, sodass eine geschlossene Fläche entsteht. Auf-
grund der extremen Größenunterschiede in den Daten war dies hier nicht möglich,
auch aus Rücksicht auf die Beschriftung.
165
Vgl. Friendly (2007), S. 32f.
166
Vgl. R Development Core Team (2006), S. 1.
167
Vgl. Friendly (1992), S. 4f.
60
Die simpelste Art einen Zustand zu beschreiben ist ein Wort und eine Zahl.168
Allerdings zeigt sie keine Struktur oder Zusammenhänge in den Daten, nur den
Wert.169 Um mehrere Werte darzustellen bedient man sich der Tabelle und in
weiterer Form dann Visualisierungen von Daten. Dies kann auch in semigrafischen
oder wortgroßen Grafiken erfolgen.
168
Vgl. Tufte (2006), S. 168 Zum Beispiel: Zuwachs 12%
169
Vgl. Tukey (1972), S. 293.
61
Eine Art ist der Stem-and-Leaf -Plot. Es handelt sich hier um eine simple Art
des Histogramms.170 Daten werden ihrer Größe nach geordnet und zugeordnet.
Abbildung 21 stellt einen solchen Plot dar. Der Vorteil liegt auf der Hand: Er ist
einfach und schnell zu erstellen, man benötigt keine Hilfsmittel technischer Natur
und kann sich doch einen Überblick über die angesammelten Daten verschaffen.
Nachteil ist das unabsichtliche Runden der Werte. Nehmen wir an Abbildung
21 zeigt die Höhe von Bergen des Voralpenlandes und der Stem entspricht 100
Metern, also würde die Legende lauten:„11k5 = 10 150 Meter“. Wir hätten alle
Berge auf 10 Meter genau. Für einen Überblick wäre das mehr als genug. Für
einen weiteren Vergleich reicht es nicht, da die Genauigkeit stark beschnitten
wurde.
11 57 11k5 = 115 Pfund
12 369
13 259
14 26
15 49
16 4
Das Stem-and-Leaf-Diagramm ist nur ein Beispiel von vielen, in denen die Grenze
zwischen Diagramm und Tabelle verschwimmt.171 Der Nutzen ist es das Muster zu
erkennen und trotzdem die Daten schnell ablesen zu können. Vor allem, weil man
in Wirklichkeit nur ein Blatt Papier benötigt und zu einem plakativen Ergebnis
kommt.
Ein Ergebnis dieser Verkleinerungen sind die Sparklines.172 Tufte (2006) entwi-
ckelte diese Grafik aus der Überlegung heraus, dass die gebräuchlichste Art von
Datendarstellung ein Wort gefolgt von einer Zahl ist. Innerhalb eines Kontextes
170
Vgl. Tukey (1972), S. 295–297, Ponocny-Seliger/Ponocny (2005), S. 14, Harris (1999), S. 369f
171
Vgl. Tufte (2001), S. 139–159.
172
Vgl. Tufte (2006), S. 46-63.
62
erlangt diese Zahl dann Bedeutung.173 Dieser Kontext entsteht indem der Verlauf
oder die Entwicklung der Zahl als Miniatur dem Wort nahe gestellt wird, deswe-
gen auch die Beschreibung mit wortgroßen Grafiken. Um zu verstehen, was das
bedeutet, ist es besser, wir betrachten als Beispiel den folgenden Aktienverlauf
von Daimler Chrysler, 12%, 129174 und Abbildung 22 um die Häufung
solcher Grafiken zu sehen.
Abbildung 22: Sparklines: Um den generellen Verlauf zu sehen und um die Zah-
len im Kontext erfassen zu können, bieten sich Sparklines an (Aus-
schnitt aus einem Screenshot von Andreas Flockermann abgerufen
am 25.03.2007 von http://www.edwardtufte.com/bboard/q-and-
a)
6 Gestaltungsprinzipien
William S. Cleveland ist ein Statistiker, Stephen M. Kosslyn ein Psychologe und
Edward R. Tufte ist ein Statistiker und Politikwissenschaftler, der manchmal als
Designer beschrieben wird. Alle drei haben schon mehrere kritische Publikationen
zum Thema Grafik herausgebracht und sowohl Cleveland als auch Tufte können
sich als Erfinder einer Visualisierungsmethode bezeichnen. Sie vereinen auch die
drei Sichtweisen auf die Visualisierung: (1) Kosslyn vertritt die Sicht der Wis-
senschaft, (2) Cleveland den Standpunkt von Technik und Wissenschaft und (3)
Tufte die Sicht von Kunst und Technik.
Die Prinzipien in diesem Abschnitt sind aus Cleveland (1994): The Elements of
Graphing Data. Cleveland ist Statistiker und hat neben dem oben angeführten
Buch zahlreiche andere wissenschaftliche Arbeiten zum Thema Darstellung von
statistischen Daten geschrieben.
Clear Vision: Das Prinzip der Clear Vision hat den Gedanken der freien Sicht
auf die Daten im Mittelpunkt. Überflüssiges soll vermieden und die Da-
ten eindeutig kodiert werden. Das Anliegen des Prinzips der freien Sicht
176
Vgl. Wijk (2005), S. 8.
177
Vgl. Wilkinson (2005), S. 1.
64
Jährliche Sonnenflecken
1700 1750 1800 1850 1900 1950 2000
Sonnenflecken/Jahr
150
100
50
0
Sonnenflecken/Jahr
100
0
Jahr
Abbildung 23: Das klassische Beispiel für Banking: Die Anzahl der Sonnenfle-
cken pro Jahr. In der unteren Grafik erkennt man, dank Ban-
king, wodurch man die Veränderungen und die Art der Verände-
rungen besser lesen kann. Im vorliegenden Fall eine Art Zyklus
und den Unterschied zwischen dem Ansteigen und Abfallen.(Vgl.
Cleveland (1994), S. 69)
Banking to 45◦ : Das Ansichtsverhältnis eines Graphen ist ein wichtiger Faktor
beim Schätzen von Veränderungsraten. Wenn die Orientierung von Linien-
segmenten bewertet werden soll um Veränderungsraten abzulesen, bringt
man die Segmente in eine mittlere Schräglage von 45◦ .180 Der Effekt ist in
Abbildung 23 wiedergegeben.
Scales: Die Skalen und Achsen sind den Daten anzupassen, nicht umgekehrt.
Die Verwendung von logarithmischen Skalen kann helfen die Darstellung
zu verbessern. Skalenbrüche sollten immer vollständig sein und die Daten
dürfen sich nicht darüber fortsetzen.181
5.90
5.85
data
5.80
5.75
seasonal
0.000
−0.010
5.90
5.85
trend
5.80
5.75
0.002
remainder
0.000
−0.002
time
Abbildung 24: Dekomposition einer Kurve in ihre Teilaussagen: Gezeigt wird die
Zerlegung des CO2 -Ausstoßes des Vulkans Mauna Loa (Hawaii)
in saisonale Schwankungen, einen Trend und den Rest. Die klei-
nen Boxen auf der rechten Seite der Grafik stellen jeweils dieselbe
Größe dar und sollen den Bezug erleichtern.(Vgl. auch Darstellung
derselben Daten in Cleveland (1994), S. 7)
180
Vgl. Cleveland (1994), S. 66–79.
181
Vgl. Cleveland (1994), S. 80–109.
66
General Strategies: Das Visualisieren von Daten ist ein iterativer, experimen-
teller Prozess, bei dem am Ende eine große Menge an Daten in eine kleine
Fläche gepackt ist. Wenn es zur Lesbarkeit beiträgt, sollten Daten mehrmals
gezeichnet werden. Viele nützliche Graphen benötigen vorsichtige und de-
taillierte Betrachtung.182 In Abbildung 24 wird demonstriert, dass auch die
Dekomposition von Daten in Teile zu einem besseren Verständnis beitragen
kann.
Die folgenden Prinzipien sind aus Kosslyn (2006): Graph Design for the Eye and
Mind. Kosslyn ist Psychologe und hat neben dem oben angeführten Buch auch
zahlreiche Papers zu den Themen Visuelle Wahrnehmung, Mentale Bilder und
visuelle Kommunikation geschrieben.
182
Vgl. Cleveland (1994), S. 110–118.
183
Vgl. Kosslyn (2006), S. 6.
184
Vgl. Kosslyn (2006), S. 6.
185
Vgl. Kosslyn (2006), S. 7.
186
Vgl. Kosslyn (2006), S. 7.
187
Vgl. Kosslyn (2006), S. 7.
188
Vgl. Kosslyn (2006), S. 7f.
67
eine Tickmark als eine solche erkennbar sein und sich auch vom Hintergrund
abheben.
Principle of perceptual Organization: 189 Dieses Prinzip bezieht sich auf die
Tatsache, dass der Mensch dazu neigt Elemente zu gruppieren, diesen dann
folgt und sich an sie erinnert. Hierzu gehört neben den Gestaltgesetzen
auch das Dreidimensionale Sehen und das integrieren sowie separieren von
Dimensionen190 .
Verständnis muss gefördert werden und das Gedächtnis muss unterstützt wer-
den.191
Principle of Compatibility: 192 Das verwendete Muster sollte mit dem, was es
repräsentiert korrelieren.
1. Surface-Content Correspondence: Die Verpackung sollte dem Inhalt
entsprechen. Wenn Hitze mit blau markiert ist, wird der Leser Proble-
me bei der Interpretation haben.
2. More is More: Wenn etwas im Wert zunimmt, sollte sich das in der
Grafik als Zuwachs auswirken. Wachstum wird mit einer Bewegung
nach rechts oder nach oben kodiert und nur in Ausnahmefällen anders.
3. Perceptual Distortion: Manche visuelle Dimensionen werden verzerrt.
So wird zum Beispiel Fläche, Intensität von Farbe und Volumen un-
terschätzt, je größer die Rate der Veränderung ist.
4. Spatial Imprecision: Ungenauigkeit beim Bewerten von räumlichen
Verhältnissen hängt mit der Tatsache zusammen, dass verschiedene
Teile des Gehirns die Oberflächeneigenschaften und die räumlichen Ei-
genschaften registrieren.
5. Cultural Conventions: Es ist zum Beispiel nicht gut, für Stopp grün
zu verwenden.
Principle of informative changes: 193 Jede Änderung wird als Veränderung
aufgefasst. Ändert sich die Farbe, wird eine Änderung impliziert.
Principle of capacity limitations: 194 Dieses Prinzip besteht aus zwei Teilen:
Beschränkungen im (1) Kurzzeitgedächtnis und (2) in der Verarbeitung.
Eine Visualisierung wird vom Betrachter nicht verstanden, wenn er mehr
189
Vgl. Kosslyn (2006), S. 8–13.
190
Farbe ist zum Beispiel eine integrierte Dimension. Sie kann als Unterscheidungsmerkmal
fungieren, ist aber nicht so effizient wie der Abstand, als ein Beispiel für eine separierte
Dimension.
191
Vgl. Kosslyn (2006), S. 14.
192
Vgl. Kosslyn (2006), S. 14–16.
193
Vgl. Kosslyn (2006), S. 17.
194
Vgl. Kosslyn (2006), S. 17–20.
68
Die folgenden Prinzipien sind aus Tuftes The Visual Display of Quantitative In-
formation, Envisioning Information, Visual Explanations und Beautiful Evidence.
Tufte ist Politikwissenschaftler und Statistiker, dessen letzte Bücher sich aus-
schließlich mit dem Design von Visualisierungen beschäftigen.
Graphische Integrität: 195 Die Daten sollen für sich sprechen und repräsentieren
ihren Wert direkt proportional. Eindeutiges, ausführliches und gründliches
Beschriften sollten verwendet werden, um grafische Verzerrung und Doppel-
deutigkeit zu bekämpfen. Wichtige Ereignisse sollten ebenfalls in den Daten
beschriftet werden. Die Anzahl der abgebildeten informationsbefördernden
Dimensionen (Variablen) sollte die Anzahl der in den Daten vorhandenen
nicht übertreffen. Grafik darf nicht außerhalb des Kontext zitieren. Es be-
steht die Möglichkeit die Daten zu variieren, aber es soll keine Variation im
Design stattfinden.
Data-Ink: 196 Die verwendeten grafischen Elemente sollten zum Großteil den Da-
ten entsprechen (siehe auch Seite 44). Allerdings muss hier angemerkt wer-
den, dass zum Thema Data-Ink zwei wichtige Ratschläge gehören: „Above
all else show the data.“ und „Revise and edit.“ 197
Multifunctioning Graphical Elements and Small Multiples: 198 Die multifunk-
tionalen grafischen Elemente bilden die Grundlage für die kleinen Vielfa-
chen. Der Autor verlangt jedes grafische Element zu verwenden, um die
Daten zu zeigen. Wenn es sein muss, hat dies auch mehrere Male zu gesche-
hen. Kleine Grafiken können mit einer hohen Datendichte nebeneinander
wiederholt werden und so Serien abbilden, die einen Verlauf mit einer wei-
teren Dimension zeigen, respektive multivariate Zusammenhänge darstellen.
Es bilden sich Serien von Bildern, die groß genug sind um den Unterschied
195
Vgl. Tufte (2001), S. 53–77.
196
Vgl. Tufte (2001), S. 93–105 und 124–137.
197
Beide: Tufte (2001), S. 105.
198
Vgl. Tufte (2001), S. 139–175, Tufte (2005a), S. 66-79
69
Anhand dieser Grafik kann man die fundamentalen Prinzipien von analyti-
schem Design nachvollziehen:
200
Vgl. Tufte (2005a), S. 53–65.
201
Im Normalfall, werden strukturelle Elemente in einer Datengrafik, wie es zum Beispiel das
Raster ist, in Grau gehalten
202
Vgl. Tufte (2005b), S. 73–78.
203
Vgl. Tufte (2006), S. 126f.
204
Vgl. Tufte (2006), S. 128f.
205
Vgl. Tufte (2006), S.126.
206
Vgl. Tufte (2006), S. 129f.
71
Integriere Beweise: 207 In dieser Grafik finden sich neben Worten und Zahlen
verschiedene Diagramme (Temperatur). Tufte schließt das Einbinden von
Bildern in Grafiken nicht aus.
Dokumentiere: 208 Der Kopf der Grafik enthält neben dem Titel und dem Au-
tor auch eine Vielzahl anderer Informationen: Was wird in welcher Form
dargestellt? Wann wurde die Grafik erstellt? Woher kommen die Daten?
Welche Annahmen wurden getroffen? Wer hat die Grafik erstellt? Weiter
unten findet man den Maßstab und Angaben zu Verleger und Drucker unter
dem Rahmen.
Der Inhalt ist das Wichtigste: 209 Das Wort Napoleon ist auf der Karte nicht
zu finden. Minard stellte nur die Fakten — den Tod vieler Menschen —
dar. Die Grafik befindet sich in seinem Werk folgend auf Hannibals Feldzug
über die Alpen und war die Letzte. Tufte tituliert diese Karte auch als
anti-war-poster.210
Minards Russlandfeldzug ist ein vieldiskutiertes Werk. Man findet ihn bei Wilkin-
son (2005)211 als Analysebeispiel und in Form von Neuerstellungen und Nach-
bildungen bei Friendly (1999)212 , bei Ihaka (2001)213 und natürlich besonders
ausführlich bei Tufte (2006)214 .
Tufte vertritt eine Ästhetik der Einfachheit, die er damit begründet, dass die
Daten die komplexe Information darstellen. Gerade dieses Wechselspiel zwischen
Komplexität und Einfachheit ist es, was zum gegenseitigen betonen führt: Es gibt
keine Einfachheit ohne Komplexität.215
6.4 Fazit
Schon in den allgemeinen Gesetzen, die noch keine Ratschläge für spezielle Gra-
fiken enthalten sind einige Gestaltungsregeln enthalten, die an Hand von Visua-
lisierungssoftware zeigbar wäre. Ein Teil der Regeln betrifft die Auswahl oder
207
Vgl. Tufte (2006), S. 130f.
208
Vgl. Tufte (2006), S. 132f.
209
Vgl. Tufte (2006), S. 134-136.
210
Vgl. Tufte (2006), S. 137.
211
Vgl. Wilkinson (2005), S. 623–629.
212
Vgl. Friendly (1999).
213
Vgl. Ihaka (2001), S. 5f.
214
Vgl. Tufte (2006), S. 122–139.
215
Vgl. Maeda (2006), S. 45–51.
73
Handhabung der Daten im Vorfeld. Dann wird das Ergebnis allgemein beschrie-
ben, aber selten der Weg dorthin. Auch tauchen immer wieder Ratschläge für das
extensive, aber intelligente Beschriften auf.
Es wurden viele gute Ratschläge gegeben und in der Literatur anhand von Bei-
spielen dokumentiert, aber wenige konkrete Vorgehensweisen vermittelt.
216
Vgl. Tukey (1967), S. 593.
74
7 Analyse
7.1 Allgemeines
Zweck dieser Analyse war es festzustellen, inwieweit das Wissen zum Thema
Visualisierung in aktuelle Softwareprodukte eingeflossen ist.
7.3 Vorgehensweise
217
Wobei der Begriff Officesoftware treffender wäre, die Entscheidung aber für den deutschen
Begriff fiel
75
aus dieser Analyse ausgeschlossen, weil zwar die meisten Arbeitsplätze Ta-
bellenkalkulation besitzen und eventuell sogar eine Spezialistensoftware218 ,
aber wenige Arbeitsplätze einen Zugang zu Datenbanksoftware besitzen.
Textverarbeitung und Tabellenkalkulation findet man fast auf jedem Ar-
beitsplatz.
2. Die Anwendung ist verbreitet.
3. Die Tabellenkalkulation kann Datengrafiken erzeugen.
4. Die Tabellenkalkulation ist lokal installierbar.
1. Kreisdiagramm
2. Liniendiagramm
3. Balkendiagramm
Dazu wurde ein Kriterienkatalog hinzugezogen. Die Kriterien befinden sich in den
Tabellen 11 bis 16 — im Anhang ab Seite 101 — sowie die Quellenhinweise.
Die Kriterien sind nach Erfüllung bewertet. Wird ein Kriterium erfüllt, bedeutet
dies einen Punkt. Wird ein Kriterium durch Nachbesserung erfüllt, bedeutet dies
auch einen Punkt, allerdings in einem zweiten Bewertungsschema.
218
Das wäre zum Beispiel im Bereich der Buchhaltung Rzl aber genauso jede andere Anwen-
dung, die Zahlen auswerten kann z.B.:Sap
219
Mehrere Charts, die quasi gestapelt sind.
220
Loess oder Lowess steht für locally weighted regression und bezeichnet eine Kurve, die hilft Ab-
hängigkeiten zwischen zwei Variablen als Kurve darzustellen. (Vgl. Cleveland (1994), S. 168–
180)
221
Eine Methode um ein Histogramm mittels einer parametrisierten Kurve anzunähern. (Vgl.
Verzani (2002), S. 18)
222
Das Streuen von Plotsymbolen um etwaige Überlappungen besser sichtbar zu machen. Stellen
Sie sich 20 Datenpunkte vor, die in einem Diagramm aber nur als 5 Punkte zu sehen sind.
Durch Jittering kann man die Punkte so darstellen, dass man — als Beispiel — am Maximum
durch geringe Verschiebungen eine Häufung von 15 Punkten sehen kann, die ein und den
selben Datenwert haben.
76
Die Liste bildet nur einen Ausschnitt aus dem aktuellen Geschehen. Die Auswahl
wurde vom Autor unter dem Gesichtspunkt getroffen, dass diese Darstellungsar-
ten und Werkzeuge Vorteile in üblichen Reportings und ähnlichen Dokumenten
aus dem Büroalltag darstellen.
Microsoft223 hat zu Beginn dieses Jahres sein neues Büropaket Microsoft Of-
fice 2007 veröffentlicht. Die Oberfläche wurde komplett überarbeitet und es soll
herausgefunden werden, ob es auch Änderungen in der Diagrammerzeugung der
Tabellenkalkulation Microsoft Excel 2007 gegeben hat.
Neben dieser neuen Version sind auf dem Markt noch die Vorläuferversionen ver-
breitet, wie Microsoft Office 2003 beziehungsweise dessen Vorgänger Office XP.
Die Diagramm-Engine hat sich in den erwähnten Vorgängerversionen von Office
2007 nicht geändert. Microsoft hält im Augenblick 90% der Marktanteile der Offi-
cesoftware224 und die Auswahl dieser Software ist somit berechtigt. Die Auswahl
einer zweiten Version ist insofern berechtigt, als Microsoft Office einen Quasi-
standard in der Kommunikation zwischen Firmen und Privaten darstellt. Es ist,
durch die Änderung des Dateiformates, nur eine Frage der Zeit, bis der Großteil
der Firmen beginnt auf die Fassung 2007 umzusteigen. Die Tabellenkalkulation
heißt Excel.
Microsofts größter Konkurrent ist die frei verfügbare Open Office Suite von
OpenOffice.org.225 Im März 2007 wurde die Version OpenOffice.org 2.2 relea-
sed. OpenOffice baut auf Suns226 StarOffice auf, ist aber zum Unterschied von
diesem unter einer Open-Source-Lizenz227 frei verfügbar. Das Betrachten dieses
Softwarepakets hat den Vorteil, dass es (1) bei Privatanwendern weit verbreitet
223
http://www.microsoft.com/
224
Vgl. http://futurezone.orf.at/it/stories/173727/ abgerufen am 23.02.2007
225
http://www.openoffice.org/
226
http://www.sun.com/
227
Eine Open Source Lizenz erlaubt die Weitergabe und Bearbeitung des Quellcodes, solange
dieser wieder frei zur Verfügung gestellt wird. Es existieren mehrere Varianten dieser Lizenz.
Vgl. http://www.opensource.org
77
ist und (2) Bestandteil jeder größeren Linuxdistribution ist. Weiters existiert es
in einer Version, die von USB-Stick gestartet werden kann.228 Die Tabellenkalku-
lation heißt Calc.
Als Referenz werden Abbildungen verwendet die mit R erstellt wurden. R ist kei-
ne Tabellenkalkulation, sondern eine Implementierung der Statistikprogrammier-
sprache S 229 von R Development Core Team230 , die unter einer Open-Source-
Lizenz läuft. R besitzt ein starkes grafisches Modul, ist durch Module erweiterbar
und läuft in einer eigenen Kommandozeilenumgebung.231 Durch die Orientierung
an der Kommandozeile ist in dieser Software nur ein Minimum zu erwarten, da
viele Einstellungen erst durch explizites Aufrufen entstehen respektive beeinflusst
werden. Beispiel: Raster. R entwickelt sich gerade zum Standardvisualisierungs-
und Berechnungstool für den akademischen Bereich. Es existiert ein Datenin-
terface mit Microsoft Excel.232 Die mit R erzeugte Referenzgrafik dient als Ver-
gleichsbasis für ein zu erwartendes Minimum.
Wir werden also folgende drei Softwarepakete mit dem Kriterienkatalog und ge-
geneinander vergleichen:
1. R 2.4.1
7.5 Kriterienkatalog
Diese Kriterientabelle stellt den Stand der Dinge dar und erhebt keinen Anspruch
auf Vollständigkeit. Problematisch ist das Einpflegen der Prinzipien in diese Ta-
belle. Manche dieser Gestaltungsregeln sind auf Elemente anwendbar, andere hin-
228
Vgl. http://www.portableapps.com/
229
Es existieren auch kommerzielle Versionen von S, deren wichtigste S-Plus von Insight ist.
230
http://www.r-project.org/
231
Es existieren auch grafische Benutzeroberflächen, die aber meist nur die gängigen Parameter
der gängigen Berechnungen und Visualisierungen abbilden.
232
Für Details sind zu finden bei http://mailman.csd.univie.ac.at/mailman/listinfo/rcom-l
78
gegen sind sehr allgemein geschrieben oder befassen sich mit Überlegungen zu den
Daten. Sie sind Ratschläge.
Zu dem existieren Widersprüche, wie zum Beispiel bei der Thematik Tickmarks
#305 und #306.233 Beide Kriterien haben Ihre Berechtigung und sind das Ergeb-
nis verschiedener Argumentationslinien und verschiedener Kontexte.
Zeigen die Tickmarks nach innen, sind die Werte besser abzulesen, weil sie mit
den Elementen in der Grafik gruppieren. Zeigen die Tickmarks nach außen, grup-
pieren sie besser mit Ihrer eigenen Beschriftung und können nicht zu unerwünsch-
ten Effekten führen. Sie können zum Beispiel nicht mit den Elementen auf der
Achsenfläche in Konflikt geraten. In der Folge entsteht durch die Wahl oder die
Erfüllung eines Kriteriums eine Abhängigkeit anderer Kriterien, die dann erfüllt
oder nicht erfüllt werden müssen.234
Die Kriterien #210 und #211 — sie behandeln die Begriffe Achsenfläche und Da-
tenfläche — setzen voraus, dass es einen Unterscheidung zwischen den Begriffen
in der Software gibt. Es existieren Kriterien die Legende betreffend und das Kri-
terium #518 besagt, dass die Daten direkt zu beschriften sind und keine Legende
verwendet werden soll.
#103 behandelt die Tatsache, dass viele Daten in eine kleine Menge gepackt
werden können. Dies entspricht zwar einer Möglichkeit und könnte mit der Data-
Ink-Ratio (siehe Gleichung 6) berechnet werden, ist aber von der Art der Daten
abhängig. Daten auf Nominalskalen benötigen schon wegen der Beschriftung mehr
Platz als Streudiagramme. #101 verlangt die Werte der y-Achse den zu zeigenden
Effekten anzupassen. Bei Nominalskalen findet man sehr oft die Kategorien auf
der y-Achse, aber keine Funktionswerte. #101 impliziert auch, dass ein Achsbruch
notwendig sein könnte, um die Effekte zu zeigen und #207 verlangt Proportiona-
lität.
Die Kriterien #106 und #110 gehen davon aus, dass mehrere Datenreihen abge-
bildet werden. #111 und #107 gehen davon aus, dass Symbole zum plotten von
Daten verwendet werden und sich diese überlappen.
233
Um beide Kriterien zu erfüllen, müssten die Tickmarks weder nach innen noch nach außen
zeigen, sind also praktisch nicht vorhanden.
234
Die Kriterien der Tickmarks stehen im Zusammenhang mit den Elementen, sowie der Achsen-
bzw. Datenfläche.
79
Und es existieren nicht anwendbare Kriterien, wie zum Beispiel #100: Die Daten-
grafik soll, wenn es möglich ist, ein Querformat aufweisen. Ergo sind die Kriterien
Ratschläge, beziehungsweise eine Reaktion auf Datenstrukturen, wie zum Beispiel
alle Achsenkriterien in Tabelle 12, die mit logarithmischer Skalierung oder einem
Achsenbruch zu tun haben. Ebenso verhält sich der Sachverhalt mit den Beschrif-
tungskriterien in Tabelle 15.
Die Kriterien sind in diesem Sinne, auch wegen der Widersprüche, wieder Ge-
staltungsprinzipien und somit nicht wissenschaftlich eindeutig auswertbar, da sie
Empfehlungen der Autoren darstellen und deren Erfahrungen aus konkreten An-
wendungen widerspiegeln. Die Grenze zwischen Gestaltungskriterium und Prin-
zip ist zu sehr abhängig von der Datenstruktur, welche Visualisierungsmethode
gewählt wurde und vor allem, ob die Abbildung explorativ oder kommunikativ
verwendet wird.
7.6.1 Rahmenbedingungen
Es gibt eine Reihe von Bedingungen die Farbe betreffend und es wäre interessant
eine relativ eindeutige zu finden und auszuwerten.
A
B
C
D
E
F
A
B
C
D
E
F
A
B
C
D
E
F
3 1
4 6
Abbildung 27: Die ersten 6 Farben im Tortendiagramm: bei Excel 2003, Calc 2.2,
Excel 2007 und R (von oben nach unten): Gut zu erkennen sind
die Farben und der Drehsinn bei Excel 2003 und Calc 2.2.
81
7.6.2 Durchführung
Im Folgenden sieht man wie die ersten 6 Farben in den unterschiedlichen Büro-
paketen verarbeitet werden und ob sie dem Kriterium #602 „Die sechs Farben,
die der Mensch am besten unterscheiden kann sind rötliches Purpur, Blau, gelbli-
ches Grau, gelbliches Grün, Rot und bläuliches Grau“ 235 entsprechen. Um dies zu
erreichen werden Kreisdiagramme mit 6 gleich großen Sektoren generiert und die
Farben betrachtet. Die Erstellung basiert auf der Tatsache, dass Farben immer
in der selben Reihenfolge angewandt werden.236 Die Sektoren werden mit den
ersten sechs Buchstaben des Alphabets gekennzeichnet um auch die Reihenfolge
zu erkennen.
In Abbildung 27 ist gut zu erkennen, wie sowohl Excel 2003 als auch Calc 2.2 die
Sektoren von der 12 Uhr-Position aus zählen. Während Excel 2003 im Uhrzei-
gersinn arbeitet, bewegt sich Calc 2.2 in die Gegenrichtung. Die Farben sind bei
beiden identisch (siehe auch Tabelle 8).
Die anderen Farben bei Excel 2007 sind nicht nur auf das geänderte Bedienungs-
konzept zurückzuführen. Excel unterstützt in der neuesten Version mehr Far-
ben.237 Diese werden mitunter dazu benutzt realistischere 3D-Effekte zu zeigen.
Es ist fragwürdig, die Standardeinstellungen von Excel 2007 auszuwerten, weil
gerade im Hinblick auf Farben, das neue Officepaket mehrere Paletten und eine
ausgereifte Vorschau vorzuweisen hat, die es dem Benutzer erleichtert, schnell ein
neues Design auszuprobieren. Belässt man es bei der Standardfarbpalette und
verändert das Subschema nicht, so erhält man eine Kreisdiagramm, wie in Abbil-
dung 27 zu sehen ist.
7.6.3 Auswertung
Alle Grafiken wurden mittels des virtuellen Druckers pdf-Creator 0.80238 in Pdf-
Dokumente gedruckt und schliesslich die Farben mittels der Farbpipette des Bild-
235
Vgl. Kosslyn (2006), S. 159.
236
Sollten 6 Liniendiagramme erzeugt werden, wären die verwendeten Farben identisch mit den
Farben der Kreisdiagramme.
237
Die Anzahl der Farben wurde von 56 auf 4’294’967’296 erhöht (online abgerufen am 17.03.2007
von http://www.xlam.ch/ExcelLim.htm). Weitere Änderungen umfassen die Tickmarks und
die Programmierbarkeit (Vgl. Office IT and Servers User Assistance (2006), S. 118–120)
238
http://www.pdfcreator.de.vu/
82
Excel 2007 weist, wie in Abbildung 27 zu sehen ist, dunkle deckende Farben
auf. Ganz im Gegensatz zu R, dass 5 Pastelltöne verwendet und einen Sektor
in Weiß gesetzt hat. Es handelt sich offensichtlich in allen 4 Fällen nicht um
die 6 Farben, von denen in Kriterium #602 die Rede ist. Die Unterscheidbarkeit
beim Druck in Graustufen ist bei Excel 2003 und Calc 2.2 am besten, wie Sie in
Abbildung28 sehen können. Excel 2007 bietet gleichmäßige Farben, die bei einer
Wiedergabe in Farbe gleichmäßig erscheinen und somit Fehlabbildungen durch
Helligkeitsdifferenzen vermeiden.
R packt zwar helle Töne in die Grafik, bietet aber durch die vorhandene Farb-
sättigung zumindest für die ersten drei Sektoren genügend Unterscheidung. Wie
man in Abbildung 29 sehen kann, bietet Excel 2007 noch Subfarbschemata unter
Zuhilfenahme des ausgemessenen Grundschemas, erweitert um eine Variante in
Graustufen. Da hier eine Variation in der Helligkeit der Farben stattfindet, sind
die unifarbenen Varianten und die Graustufen besser auf einem Monochromdru-
cker wiedergegeben als die sechsfarbige Variante.
Das Kriterium — die Verwendung der 6 Farben rötliches Purpur, Blau, gelb-
liches Grau, gelbliches Grün, Rot und bläuliches Grau — ist von keinem der
Testkandidaten erfüllt worden. Die in Excel 2007 verwendeten Farben lassen eine
239
http://www.gimp.org/
240
Vgl. Harris (1999), S. 282ff.
83
Abbildung 28: Vergleich zwischen Farbe und S/W: Die jeweils obere der beiden
Zeilen stellt Office 2007 dar, die untere Office 2003 bzw. Calc 2.2.
Es wurde mittels pdf-Creator im unteren Teil ein monochromer
Laserdrucker simuliert.
84
Abbildung 29: Farbschemata bei Excel 2007: Die Farbschemata sind in einer Ma-
trix mit Designvariationen ausgekreuzt und basieren auf den neuen
Grundfarben (Screenshot des Autors).
7.7.1 Dotplot
Der Dotplot ist, wie bereits ausgeführt, eine gute Alternative zu Kreisdiagramm
und geteiltem Balkendiagramm. Er bietet den Vorteil die Werte, das sie an ei-
ner gemeinsamen Achse ausgerichtet sind, genauer zu vergleichen. Außerdem las-
sen sich auch negative Werte darstellen, was bei Kreisdiagrammen nicht möglich
ist.241
Die Methode ist schon länger bekannt, in technischen Kreisen weitgehend verbrei-
tet. Von allen Kandidaten beherrscht nur R den Dotplot als native Funktionalität.
Für Excel 2003 existiert ein Makro, dass hilft Dotplots zu erstellen.242 Es basiert
241
Außer in seltenen Fällen. Vgl. Harris (1999), S. 282.
242
Download des Excelmakros über http://peltiertech.com/Excel/Charts/DotPlot.htm (online
abgerufen 01.04.2007)
85
auf dem Überlagern zweier Diagramme, wobei ein Balkendiagramm dazu benutzt
wird, die Führungen für die Punkte zu zeichnen und ein zweites um die Punkte
ans Ende zu setzen.
7.7.2 Panelcharts
Auch die Panelcharts sind, außer in R, nur schwer technisch realisierbar. Von
vornherein existiert in den untersuchten Tabellenkalkulationen keine Vorlage. Das
Stapeln und Anordnen der Grafiken muss von vornherein geplant sein um die
Achsen aufeinander abzustimmen. Als Alternative bieten sich Prozeduren an, die
diese Grafiken annähernd erstellen.243
7.7.3 Sparklines
Die Verkleinerung von Grafiken wird insofern unterstützt, als sie möglich ist. Es ist
aber, um ein lesbares Ergebnis zu bekommen, viel Einstellungsarbeit notwendig.
Als Alternative zur manuellen Erarbeitung bieten sich Anbieter von kommerziel-
len Plug-Ins für Microsoftprodukte an, die mittels eigener Schriftarten arbeiten
und nicht mit den eingebauten Diagrammen.244
In Excel 2007 besteht zwar die Möglichkeit den Hintergrund der Zellen über die
bedingte Formatierung mit horizontalen Balken zu füllen, die im Verhältnis zum
Zellenwert stehen. Allerdings leidet die Lesbarkeit darunter und die Methode mit
einer Formel der Art =wiederholen(”|”;A1/10)245 in einer separaten Zelle bietet
den Komfort, das man die Laufweite der Balken auf seine Wünsche anpassen kann.
Dies entspricht zwar nur der klassischen Strichliste, bietet aber die Möglichkeit,
Größen innerhalb der Tabelle zu visualisieren, die dann auch beim Sortieren der
Tabelle erhalten bleiben und nicht mit der Zahl in Interaktion treten.
243
Einen guten Überblick findet man bei http://processtrends.com/toc_panel_charts.htm (on-
line abgerufen 01.04.2007)
244
Zum Beispiel mit den Produkten von http://www.bonavistasystems.com und
http://www.bissantz.de/sparkmaker/index_de.asp (online abgerufen 01.04.2007)
245
Das ist Excel- und Calcsyntax. Die Komponente A1/10 wurde willkürlich gewählt. Der Divisor
demonstriert allerdings eine Art Maßstab, der auf Werte angewandt werden sollte. Etwaige
Reste der Division werden nicht dargestellt.
86
Erwähnenswert ist noch, dass der Boxplot sowohl bei Calc 2.2 als auch bei Ex-
cel 2003 und Excel 2007 keine Standardform einer Grafik ist. Wieder existieren
für die Microsoftprodukte Workarounds246 und mehrere Plug-Ins247 . Für Calc 2.2
können die Workarounds nachgemacht werden, da sie entweder auf einer allge-
meinen Kursgrafik oder gestapelten Diagrammen beruhen.
246
Bei Microsoft findet man ein Workaround über eine Kursgrafik unter
http://support.microsoft.com/kb/155130/de (abgerufen 13.04.2007) und basierend auf
gestapelten Balkendiagrammen sowohl horizontal als auch vertikal anwendbar bei
http://peltiertech.com/Excel/Charts/BoxWhisker.html (abgerufen 13.04.2007). In bei-
den Fällen werden keine Ausreißer unterstützt, weil die Werte des Boxplots vorab berechnet
werden müssen. Sowohl Excel als auch Calc besitzen Berechnungsroutinen für die Kennwerte
Median, Quartile und Minimum/Maximum.
247
Wobei von den frei verfügbaren Plug-Ins die Versionen http://www.learn-
line.nrw.de/angebote/eda/medio/tipps/boxfunktion.htm (abgerufen 13.04.2007) und
http://peltiertech.com/Excel/Charts/BoxWhisker.html (abgerufen 13.04.2007) interessant
sind. Beide unterstützen in den vorliegenden Fassungen keine Ausreißer. Das ist auf die
Tatsache zurückzuführen, dass die Werte des Boxplots berechnet werden und nicht die
Rohdaten als Basis benutzt werden.
248
http://j-walk.com/ss/excel/files/charttools.htm (abgerufen 13.04.2007). Auf der Seite von
John Walkenbach findet sich auch ein Tool um Konturplots mit Excel zu erstellen:
http://www.j-walk.com/ss/excel/files/gradcontour.htm (abgerufen 13.04.2007).
87
7.8.1 Rahmenbedingungen
Der Lügenfaktor (Lie-Factor) wurde schon auf Seite 46 als Quotient aus tatsäch-
licher und dargestellter Veränderung vorgestellt. In Gleichung 9 ist eine formali-
sierte Form zu sehen, in der Lf der Lügenfaktor ist, und ∆g die relative Änderung
in der Grafik und ∆d die relative Änderung in den Daten beschreibt. ∆ versteht
sich zwingend als relative Änderung wie in Gleichung 10 formuliert.
∆g
Lf = (mit∆d 6= 0) (9)
∆d
| x2 − x1 |
∆= (10)
x1
Daraus folgen drei mögliche Ergebnisse:
1000
1000
800
800
600
600
f(x)
f(x)
400
400
200
200
0
0
0 2 4 6 8 10 0 2 4 6 8 10
x x
Abbildung 30: 2 Kurven mit und ohne Raster: Obwohl es so aussieht, als ob
beide Kurven sich einander annähern, handelt es sich hier um die
Funktion f (x) = x3 und die Funktion f (x) = x3 + 100. Es sind
also zwei identische Kurven, wobei eine um 100 Einheiten die y-
Achse hinauf geschoben wurde. Der Abstand ist somit konstant
100. Der Raster bietet zwar Hilfe, kann aber nicht dazu beitragen
die konstante Differenz zu betonen.
7.8.2 Durchführung
Es bleibt der Fall zu behandeln, in dem die Funktionswerte 249 entweder alle
positiv oder negativ sind. In einem ersten Durchlauf wurde das Verhalten mit
Werten untersucht, die sowohl ungefähr Null, als auch deutlich größer gewählt
wurden. Die Auswahl der Zahlen war willkürlich.
In Abbildung 31 findet man die Ergebnisse für die Auswertung mit den 9 Wer-
ten aus Tabelle 9. Es ist zu erkennen, dass die Werte unterscheidbar dargestellt
werden. Auch die Werte, die ungefähr Null entsprechen sind unterscheidbar.
249
Das sind die Werte, die auf der y-Achse aufgetragen werden.
89
Diagrammtitel 180
180
160
160
140
140
120
120
100
100
Reihe1
Datenreihen1 80
80
60
60
40
40
20
20
0
0 1 2 3 4 5 6 7 8 9
1 2 3 4 5 6 7 8 9
Haupttitel
180
150
160
140
120
100
100
Spalte A
80
60
50
40
20
0
0
Abbildung 31: Test 1: Balkendiagramme mit den Werten aus Tabelle 9: Von links
oben, nach rechts unten sind die Darstellungen von Excel 2007,
Excel 2003, Calc 2.2 und R 2.4.1
Die Darstellungen entsprechen einem Lügenfaktor von 1. Das entspricht den Ef-
fekten in den zu Grunde liegenden Daten und bedeutet keine Verzerrung in der
Darstellung.
Im nächsten Schritt wurde versucht, neun Werte rund um den Wert 5 zu gruppie-
ren. Dies geschah im Intervall ±10% ohne die Grenzen des Intervalls miteinzube-
ziehen, 5 bildet den Mittelwert. Tabelle 10 zeigt die Werte der Reihe im Detail.
5,6
5,6
5,4
5,4
5,2
5,2
5
5
Reihe1
Datenreihen1
4,8 4,8
4,6 4,6
4,4
4,4
4,2
4,2 1 2 3 4 5 6 7 8 9
1 2 3 4 5 6 7 8 9
Haupttitel
5,5
5
5
4,5
4
4
3,5
3
3
2,5 Spalte I
2 2
1,5
1
1
0,5
0
Zei- Zei- Zei- Zei- Zei- Zei- Zei- Zei- Zei-
0
le 7 le 8 le 9 le le le le le le
10 11 12 13 14 15
Abbildung 32: Test 2: Balkendiagramme mit den Werten aus Tabelle 10: Von links
oben, nach rechts unten sind die Darstellungen von Excel 2007,
Excel 2003, Calc 2.2 und R 2.4.1
und Calc nach wie vor bei 0. Bei Excel hingegen lässt sich erkennen, dass dieser
Schnittpunkt einen Wert ungleich Null trägt (siehe dazu auch Abbildung 33).
Ausgehend von der Tatsache, dass im ersten Test die Werte im Bereich 1 bis 170
lagen und der Mittelwert bei 79,44 war und der Lügenfaktor 1 betrug, lässt sich
folgendes schließen: Excel schränkt den dargestellten Wertebereich ein, wenn die
Werte nicht über einen gewissen Prozentsatz vom Mittelwert abweichen.
Im vorliegenden Fall von Excel 2007 (siehe Abbildung 33) liegt der Lügenfaktor
zwischen 0,1/0,4
0,1/4,6
= 11, 5 (beim Vergleich 4,6 und 4,7) und 0,8/1,2
0,8/4,6
= 3, 83 (beim
Vergleich 4,6 und 5,4). Der erste Fall ist allerdings abhängig von der Struktur der
Daten. Betrachtet man die Grenzen bedeutet dies ein Lügenfaktor von mindestens
3,8 und somit eine Übertreibung.
91
5,6
5,4
5,2
Datenreihen1
4,8
4,6
4,4
4,2
1 2 3 4 5 6 7 8 9
Abbildung 33: Grundlage für die Berechnung des Lügenfaktors bei Excel 2007
Recherchen ergaben, dass der Mindestwert der Achse bei Excel ab Version 97 vom
Verhältnis zwischen ymax und ymin abhängt.250 Das Minimum der y-Achse ist 0,
wenn die Differenz der abgebildeten positiven Extrema ymax und ymin größer als
16,667% von ymax ist (siehe Gleichung 11). In der Folge werden 16,667% als 16
dargestellt um die folgenden Berechnungen zu erleichtern.
1
∆y = ymax − ymin > ymax (11)
6
Ist ∆y kleiner als 16 ymax wird das Minimum der y-Achse auf einen Wert y0 gesetzt,
der kleiner oder gleich dem Ergebnis aus Gleichung 12 ist. Kleiner oder gleich,
weil der Wert dem Bemaßungsschema angepasst wird.
250
http://www.xlam.ch/xlimits/charts.htm online abgerufen am 14.04.2007
92
Wenn es sich um einen Scatterplot oder ein Blasendiagramm handelt werden die
Werte automatisch auf einen Wert kleiner oder gleich ymin gesetzt.
Unter den Annahmen, dass (1) alle y-Werte positiv sind, (2) die Kriterien für ein
Verschieben des Ursprungs gerade erfüllen und (3) in der Folge Lf einen Wert
annimmt (der ein Grenzwert oder ein Mindestwert sein kann) ergeben sich für
den Dividenden und den Divisor die folgenden Werte:
1
y0 = ymin − ymax (17)
12
1
ymax
∆d = 6 (18)
ymin
1 1
(ymax − ymin + 12 ymax ) − (ymin − ymin + 12 ymax )
∆g = 1 =
ymin − ymin + 12 ymax
1
ymax − ymin y
6 max
= 1 = 1 =2 (19)
y
12 max
y
12 max
2 ymin
Lfmin = ∆g /∆d = 1 y = 12 (20)
6 max ymax
ymin
Weil aber ymax und ymin über y0 zusammenhängen ergibt sich schliesslich für
Lfmin , wie in Gleichung 21 zu sehen ist, 10.
5
ymin ymax
Lfmin = 12 = 12 6 = 10. (21)
ymax ymax
Das bedeutet, dass sich für Werte, die die Kriterien gerade noch erfüllen, die
Lügenfaktoren gegen 10 bewegen. Und das unter Betrachtung der Extrema: Also
dem größten eingegebenen Wert ymax und dem Kleinsten ymin .
93
1800
1600
1400
1200
1000 ymax
ymin
800 y0
Lf
600
400
200
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
In einem letzten Schritt wurde mit einem fixen Wert ymax von 1000 von der
16,667%-Grenze weg ymin -Werte aufgetragen. Es wurden die y0 -Werte durch Er-
stellen von Grafiken ermittelt. Das Ergebnis ist in Abbildung 34 zu sehen. Die
exakten Werte finden sich im Anhang in Tabelle 17 auf Seite 110.
Wie zu sehen ist schrumpft mit abnehmender Differenz ∆y auch die Differenz
zwischen den Werten y0 und ymin , während der Lügenfaktor stark steigt.
Für alle Wertetripel wurden die Änderungen in den Daten und die Änderungen
in der graphischen Darstellung berechnet. Wie in Abbildung 35 zu erkennen ist,
verändert sich bei Annäherung von ymin an ymax vor allem der Bestandteil des
Lügenfaktors, der die Darstellung behandelt. Dies führt zu einem Lügenfaktor
von über 1000.
Dass der Lügenfaktor im untersuchten Fall unter 10 fällt, kann man auf die Ver-
schiebung von y0 zurückführen. Im Rechenbeispiel wurde ein Wert angenommen,
der quasi einem Maximum entspricht. In der Untersuchung wurde der von der
Software benutzte Wert y0 benutzt.
94
10000
Lf(y)
1000
y0 in % ymax
100
10
∆g
1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
0,1
0,01
∆d
0,001
Daraus folgt aber auch, dass wenn die Darstellung der verkürzten Achsen au-
tomatisch in die Grafik fließt, es automatisch zu Effekten in Größenordnungen
von Größer als 10 kommen kann. Speziell bei Werten, die sich sehr eng um einen
Wert bewegen (indem sie zum Beispiel um einen Wert oszillieren, wie das bei
Umsätzen der Fall sein kann) kommt es, ohne Zutun des Erstellers der Grafik, zu
Übertreibungen. Excel unterstützt auch in der neuen Version keine Achsenbrüche
und somit ist wieder das Können des Erstellers251 gefragt oder eine zusätzliche
Software notwendig um den Lügenfaktor zu dämpfen.
In Verbindung mit dem Weber-Fechnerschen Gesetz gewinnt man eine neue Per-
spektive: Will man die Unterschiede zwischen Werten darstellen und kann dies
nur unter Verwendung von verkürzte Achsen, wird der Lügenfaktor größer. Je
höher der Lügenfaktor ist, umso mehr muss eine Vergrößerung der Differenzen
stattfinden, um den Unterschied wahrzunehmen. In Abbildung 35 ist zu erkennen,
wie ∆g relativ gleichmäßig bleibt während sich ∆d verkleinert. Ein Algorithmus
in Excel 2007 optimiert die grafische Darstellung und der Lügenfaktor steigt in
erster Linie durch das Schrumpfen von ∆d .
251
http://peltiertech.com/Excel/Zips/BrokenYAxis.zip (online abgerufen 14.04.2007)
95
Ist der Kleinste der Werte 10% unter dem Größten, ist bei Excel 2007 mit Ver-
zerrungen in der Größenordnung weniger Zehnerpotenzen zu rechnen. Beträgt
der relative Unterschied nur noch 5% und schrumpft nähert sich der Lügenfaktor
schnell zwei Zehnerpotenzen, verhundertfacht sich also. Beträgt der Unterschied
nur noch 1% wird in Excel 2007 ein Lügenfaktor von 1665 erzeugt. In diesen
Größenordnungen kann, aber muss nicht, klar sein, dass man eine Vergrößerung
betrachtet. Ein Hinweis oder eine Betonung im Sinne des schon erwähnten Ach-
senbruchs ist hier wünschenswert.
Die Tabellenkalkulationen aus der Analyse konnten nicht getestet werden, da je-
des Kriterium auf Annahme eines gewissen Kontextes aus Datenstruktur, Daten-
quantität und Darstellungsmethodik beruht und somit einen Ratschlag darstellt,
aber keine allgemeine Regel. Außerdem gab es bei den gesammelten Kriterien
Prinzipien, die sich widersprechen. Auf eine Auswertung wurde aus den ange-
führten Gründen verzichtet.
Versuchsweise wurde ein Prinzip aus der Tabelle Farbe ausgewählt und unter-
sucht. Dieses wurde nicht erfüllt. Die Neuerungen auf dem Sektor der Visualisie-
rungen, die sich im Bereich der Technik schon durchgesetzt haben und im akade-
mischen Feld immer bekannter werden, sind nicht realisierbar oder nur unter der
Verwendung Produkte Dritter. Das mag auf der einen Seite am kaufmännischen
Fokus von Tabellenkalkulationen liegen und andererseits an der Tatsache, dass es
für die breite Masse noch nicht interessant ist.252 Zudem hat sich gezeigt, dass es
in den Standardeinstellungen von Excel zu Fehlabbildungen im Sinne von Tufte’s
Lie-Factor kommt. Der Lügenfaktor steigt bei abnehmender Differenz zwischen
den Werten deutlich mehr als linear an.
Manche der neueren grafischen Lösungen lassen sich mit Plug-Ins von Fremdan-
bietern oder Workarounds zumindest für die Microsoftprodukte realisieren. Die
252
Der Aufwand der Hersteller konzentriert sich üblicherweise auf Markterfordernisse.
96
Referenzsoftware würde einen Großteil visualisieren, ist jedoch für den Alltag und
den Großteil der Benutzer wegen der fehlenden Bedienungsoberfläche im Stile ei-
ner Tabellenkalkulation unbrauchbar.
Effektivität
Effizienz
Eleganz
Technologie & Werkzeuge
Schönheit
Kunst
Visualisierung Wirkliche Welt
Wissenschaft
Allgemeine Gesetze
Vorhersagekraft
Abbildung 36: Sichtweisen auf die Visualisierung als Disziplin (modifiziert nach:
Wijk (2005), S. 8) und Bewertungskriterien
Es folgt aus diesen Fakten, dass es am Wissen des Erstellers liegt, was er aus den
Daten macht. Die Randbedingung ist Technik.253
In Abbildung 36 ist ein Modell zu sehen, welches Sichtweisen auf die Visualisie-
rung als Disziplin darstellt. Die Technik ist eine von Ihnen. Jede dieser Sicht-
weisen — die technische, die wissenschaftliche und die künstlerische —weist ein
eigenes Bewertungsschema auf. Die technische Sicht verlangt Effektivität und Ef-
fizienz, die Wissenschaftliche allgemeine Gesetze und Vorhersagekraft, und die
Kunst strebt nach Schönheit und Eleganz. Alle diese Standpunkte wollen ernst
genommen werden.254 Die gute Visualisierung versucht alle diese Perspektiven
einzunehmen und im Kontext der Daten zu repräsentieren. Die Widersprüche
in den Kriterien könnten auch auf die verschiedenen Sichtweisen zurückzuführen
sein. Ein anderer Faktor ist die Interaktion der syntaktische Dimension der Grafik
mit der semantischen Dimension der Daten.
253
Wobei die Technik als Technologie und Werkzeuge zu verstehen ist.
254
Vgl. Wijk (2005), S. 8.
97
Was bleibt ist der Best Practice: „Graphing Data should be an iterative, experi-
mental process.255 Proofread your graphs.256 Strive for Clarity.257 “
255
Cleveland (1994), S.112.
256
Cleveland (1994), S. 63.
257
Cleveland (1994), S. 64.
98
Die Aussage von Datengrafiken können eine analytische oder eine kommunikative
Dimension enthalten, je nach Verwendungszweck. Außerdem sind die Daten ein
Bestandteil der Grafik, in dem sie durch Ihre semantische Dimension die Form und
Art der Grafik mit beeinflussen. Diagramme sind dazu geeignet Zusammenhänge
und Veränderungen darzustellen, nur beschränkt um Werte zu kommunizieren.
Es bleibt als Empfehlung die visuelle Gestaltung der Daten (1) auf das Ziel-
publikum maßzuschneidern, (2) auf den Zweck der Visualisierung abzustimmen
(explorativ oder kommunikativ)258 und (3) den Prozess der Gestaltung iterativ zu
gestalten und im Vorfeld mehrere Arten der Darstellung in Erwägung zu ziehen.
Datengrafiken sollten auch als Absatz behandelt werden.
Die Visualisierung für ein größeres Zielpublikum ist im Kontext von Wissenschaft,
Technik und Kunst zu betreiben, um den vielfältigen Sichtweisen gerecht zu wer-
den. Diese Sichtweisen bieten verschiedene Werkzeuge, Kriterien und Ziele um
ein optimales Ergebnis zu erzielen.
Das letzte Viertel des 20. Jahrhunderts hat einige Neuerungen gebracht und stand
im Zeichen der hochdichten Daten und neuer grafischer Methoden, vor allem für
computergestützte Anwendungen. Außerdem wurden Visualisierungswerkzeuge
258
Analog dazu bietet sich ein Beispiel aus der Wirtschaft: Die Zahlen in Reports für die Unter-
nehmenssteuerung sind anders aufbereitet als die Zahlen in einer Bilanz und trotzdem sind
beide Informationen über ein Unternehmen.
100
einer breiten Öffentlichkeit zugängig. Aufgrund der Recherche lassen sich folgende
Trends ableiten:
Wie gezeigt wurde, ist das Thema des Wissenstransfers von Diagrammen stark an
die Technologie, die zur Visualisierung und Analyse der Daten verwendet wird,
gekoppelt. Zusätzlich wirken die Beschränkungen des Mediums und grundlegen-
de Mechanismen der menschlichen Physiologie. Man benutzt Datengrafiken um
Entscheidungsgrundlagen zu schaffen, zu unterhalten, zu dokumentieren oder um
zu forschen.
A Kriterienkatalog
Allgemein
id Beschreibung Quelle
100 Die Datengrafik soll, wenn es möglich Vgl. Tufte (2001), S. 186
ist ein Querformat aufweisen.
101 Die Werte der y-Achse sind den zu zei- Vgl. Kosslyn (2006), S. 86
genden Effekten anzupassen.
102 Die wichtigste Variable ist immer auf Vgl. Kosslyn (2006), S. 81–
der x-Achse. Ist dies nicht entscheidbar 83
ist die mit dem einfachsten Muster aus-
zuwählen.
103 Eine große Menge an quantitativen Da- Vgl. Cleveland (1994),
ten kann auf eine kleine Fläche gepackt S. 110
werden.
104 Machen Sie das wichtigste Element Vgl. Kosslyn (2006), S. 161
zum Herausragendsten.
105 Nominalskalen sind entweder so zu ord- Vgl. Kosslyn (2006), S. 85f
nen, dass der gewünschte Vergleich
möglich ist, oder das einfachste Muster
entsteht.
106 Stellen Sie sicher, dass sich kreuzende Vgl. Kosslyn (2006), S. 143
oder beinahe kreuzende Linien unter-
scheidbar sind.
107 Verwenden Sie unterscheidbare Symbo- Vgl. Kosslyn (2006), S. 143
le für Punkte, die durch Linien verbun-
den sind.
108 Stellen Sie sicher, dass best-fitting- Vgl. Kosslyn (2006), S. 154
Linien unterscheidbar und herausra-
gend sind.
109 Tragen Sie Sorge dafür, dass Hinter- Vgl. Kosslyn (2006), S. 187
grundelemente nicht mit den Inhalten
gruppieren.
102
Tabelle 11: Allgemeine Kriterien für die Bewertung der Lesbarkeit von Grafiken
Achsen
id Beschreibung Quelle
200 Zentrieren Sie Achsenbeschriftung und Vgl. Kosslyn (2006), S. 103
setzen Sie sie parallel zur Achse.
201 Wenn Daten auf verschiedenen Panels Vgl. Cleveland (1994), S. 86
verglichen werden sollen, sind die Ska-
len dem anzupassen.
103
259
Da Cleveland (1994) immer einen Achsenrahmen verwendet, meint er die doppelte Verwen-
dung. Ist beispielhaft die Beschriftung der oberen x-Achse 0, 1, 2, 3, . . ., so muss die untere
x-Achse mit 1, 10, 100, 1000, . . . beschriftet werden, weil 100 = 1, 101 = 10, 102 = 100, . . .
104
Tabelle 12: Kriterien für die Bewertung der Lesbarkeit von Achsen
Tickmarks
id Beschreibung Quelle
300 Verwenden Sie ein Tickmark, wenn der Vgl. Kosslyn (2006), S. 94
Wert wichtig ist.
301 Wähle den Umfang der Tickmarks so, Vgl. Cleveland (1994), S. 80
dass sie mindestens oder in etwa dem
Umfang der Daten entsprechen.
302 Ticks werden bei runden Ziffern und re- Vgl. Kosslyn (2006), S. 104
gulären Größen positioniert.
303 Platzieren Sie größere Tickmarks an Vgl. Kosslyn (2006), S. 94
beschrifteten Ticks und auf dem halb-
en Weg zwischen ihnen — wenn es Sinn
macht.
260
Kosslyn (2006) führt als Beispiel eine Grafik an, deren x-Achse Jahre abbildet und über der
zwei sich kreuzende Linien für die Produktion und die Kosten abgebildet sind.
105
Tabelle 13: Kriterien für die Bewertung der Lesbarkeit von Tickmarks
Raster
id Beschreibung Quelle
400 Der Raster ist in der Ebene hinter den Vgl. Kosslyn (2006), S. 185
Daten!
401 Benutzen Sie einen inneren Raster, Vgl. Kosslyn (2006), S. 71
wenn genaue Vergleiche relevant sind.
402 Benutze eine Referenzlinie, wenn es Vgl. Cleveland (1994), S. 42
einen wichtigen Wert gibt, der zu zei-
gen ist.
403 Verwenden Sie verschiedene Arten von Vgl. Kosslyn (2006), S. 183
Raster, wenn höhere Präzision verlangt
wird.
404 Referenzlinien sollen nicht mir den Da- Vgl. Cleveland (1994), S. 42
ten konkurrieren
405 Machen Sie Rasterlinien relativ dünn Vgl. Kosslyn (2006), S. 182
und leicht.
Tabelle 14: Kriterien für die Bewertung der Lesbarkeit von Rastern
Beschriftung
id Beschreibung Quelle
500 Beschriften Sie alles Datenmaterial Vgl. Kosslyn (2006), S. 106
501 Beschriften Sie Daten so weit als mög- Vgl. Kosslyn (2006), S. 106
lich direkt.
502 Beschriften Sie kritische Punkte (z.B.: Vgl. Kosslyn (2006), S. 149
Extrema) explizit.
106
Tabelle 15: Kriterien für die Bewertung der Lesbarkeit von Beschriftung
261
Die 11 Farben, die nie verwechselt werden sind:: Weiß, Grau, Schwarz, Rot, Grün, Gelb, Blau,
Pink, Braun, Orange und Purpur.
108
609 Schraffur sollte sich durch mindestens Vgl. Kosslyn (2006), S. 170
30◦ unterscheiden.
610 Sorgen Sie dafür, dass die visuellen Vgl. Kosslyn (2006), S. 169
Eigenheiten beim Schattieren unter-
scheidbar sind.
611 Variieren Sie Schraffuren gleichen Mus- Vgl. Kosslyn (2006), S. 171f
ters mit einer Dichte von mindestens
2:1
612 Vermeiden Sie blau und rot in angren- Vgl. Kosslyn (2006), S. 162f
zenden Flächen.
613 Vermeiden Sie blau, wenn die Grafik Vgl. Kosslyn (2006), S. 166
kopiert werden soll.
614 Vermeiden Sie Farbe um quantitative Vgl. Kosslyn (2006), S. 166
Information zu codieren.
615 Verwenden Sie bei Vergleichen keine Vgl. Kosslyn (2006), S. 216
Abstufungen in der Helligkeit. Hell
wird als größer empfunden.
616 Verwenden Sie Farbe nur in Kombina- Vgl. Kosslyn (2006), S. 167
tion mit Farbsättigung um Steigerung
darzustellen.
617 Verwenden Sie Farben zum Gruppieren Vgl. Kosslyn (2006), S. 165
von Elementen.
618 Verwenden Sie Farben, die im Spek- Vgl. Kosslyn (2006), S. 158
trum gut getrennt sind.
619 Verwenden Sie keinen Hintergrund, der Vgl. Kosslyn (2006), S. 186
mit Ihren Daten in Konflikt gerät.
620 Verwenden Sie warme Farben für den Vgl. Kosslyn (2006), S. 161
Vordergrund.
Tabelle 16: Kriterien für die Bewertung der Lesbarkeit von Farben
109
Die Werte in der folgenden Tabelle wurden manuell ermittelt, indem eine Grafik
mit zwei Balken erzeugt wurde. Der eine Balken wurde konstant mit ymax gewählt
und ymin in Fünfer-Schritten an ymax angenähert.
Die erste Position von ymin bei 833,5 wurde gewählt aus der Tatsache, dass 1000-
16,667%=833,33 noch keine Verkürzung hervorruft. Die letzte Position bei 999,
weil bei einer Differenz von 0 keine Verkürzung der Achsen mehr stattfindet.
Der Wert y0 stellt den Ursprung der y-Achse dar und wurde abgelesen. Aufgrund
der abgelesenen Werte kann nicht ausgeschlossen werden, dass y0 auf Grund einer
unbekannten Mechanik bei Änderung des Wertes von ymax sich auf andere Art
und Weise ändert. Am Verlauf der Funktion Lügenfaktor wird sich daran aber
nur wenig ändern.
C.1 Software
In Tabelle 18 ist alle verwendete Software aufgelistet. Nicht näher angeführt sind
Softwarepakete von innerhalb LATEX 2ε , die zur Erstellung notwendig sind und
Teil der Distribution MikTeX 2.4 sind.
Name Version URL Beschreibung
Adobe Reader 8.0 http://www.adobe.com Pdf-Betrachter
Calc 2.2 http://www.openoffice.org Tabellenkalkulation
Darkshot 2.0 http://www.darkleo.com Screenshotsoftware
Draw 2.2 http://www.openoffice.org Vektorgrafiksoftware
Excel 2003 http://www.microsoft.com Tabellenkalkulation
Excel 2007 http://www.microsoft.com Tabellenkalkulation
— Testversion
Gimp 2.2.13 http://www.gimp.org Bildbearbeitungs-
software
GSView 4.7 http://www.tug.org Postscriptsoftware
(um Seite aus Pdf
zu extrahieren)
Inkscape 0.45.1 http://www.inkscape.org Vektorgrafiksoftware
Jabref 2.1 http://jabref.sourceforge.net Literaturverwaltung
für BibTEX
PdfCreator 0.80 http://www.pdfcreator.de.vu Virtueller Drucker
der neben Pdf auch
Postscript und di-
verse Bildformate
erzeugt.
R 2.4.1 http://www.r-project.org Statistiksoftware
Scribus 1.3.3.7 http://www.scribus.com Dtp-Software
TeXnicCenter 1 Beta 6.31 http://www.toolscenter.org Editor für LATEX 2ε
Tabelle 18: Zur Erstellung des Textes und der Abbildungen benutzte Software
C.2 Datenquellen
In Tabelle 19 befinden sich die Datenquellen für alle Abbildungen. Beim Scannen
wurde ein Canon IR2016i eingesetzt. Die verwendete Software finden Sie im Detail
112
in Tabelle 18. Den Quellenverweis, soweit er vorhanden ist, finden Sie direkt bei
der Grafik. In diesem Abschnitt finden Sie nur Datenquellen und verwendete
Software.
Die Datenquellen sind Teil der Beispieldatenquellen von R 2.4.1 und können dort
gefunden werden. Auch ist eine Zusammenstellung der Datenquellen aus R mit
einer Kurzbeschreibung in Tabelle 20 auf Seite 114 zu finden. Für Abbildung 15
gilt — da sie aus mehreren Teilen besteht — dass diese von links nach rechts und
anschließend von oben nach unten aufgelistet sind. Ebenso gilt das für nachfol-
gende Abbildungen.
Man findet hier ebenfalls eine Kopie der Sparkline von Seite 62 in Abbildung 37,
da diese aus ästhetischen und anwendungstechnischen Gründen dort direkt im
Text verankert wurde und so keine Nummerierung tragen konnte.
rnorm
sqrt(abs(x))
16 55 40, 20, 20, 20 R 2.4.1
40, 22, 20, 18
17 56 barley R 2.4.1
18 57 iris R 2.4.1
19 58 Warpbreaks R 2.4.1
20 60 Titanic R 2.4.1 Scribus 1.3.3.7
21 61 women LATEX 2ε
22 62 Online Gimp 2.2.13
23 64 sunspot.year R 2.4.1
24 65 co2 R 2.4.1
25 69 Gsview 4.7 Gimp 2.2.13
26 71 Scan Gimp 2.2.13
27 80 1, 1, 1, 1, 1, 1 Excel 2003 Druck über pdfCreator
1, 1, 1, 1, 1, 1 Calc 2.2 Druck über pdfCreator
1, 1, 1, 1, 1, 1 Excel 2007 Druck über pdfCreator
1, 1, 1, 1, 1, 1 R 2.4.1
28 83 Tab. 8 Draw 2.2 Druck über pdf-Creator
29 84 Excel 2007 Darkshot 2.0
30 88 x3 R 2.4.1
x3 + 100 R 2.4.1
31 89 Tab. 9 Excel 2007 Druck über pdf-Creator
Tab. 9 Excel 2003 Druck über pdf-Creator
Tab. 9 Calc 2.2 Druck über pdf-Creator
Tab. 9 R 2.4.1
32 90 Tab. 10 Excel 2007 Druck über pdf-Creator
Tab. 10 Excel 2003 Druck über pdf-Creator
Tab. 10 Calc 2.2 Druck über pdf-Creator
Tab. 10 R 2.4.1
33 91 Tab. 10 Excel 2007
34 93 Tab. 17 Excel 2007
35 94 Tab. 17 Excel 2007
36 96 Draw 2.2
37 112 LATEX 2ε
Quelle in R Beschreibung
anscombe 4 x-y Reihen mit identischen klassischen Werten,
jedoch verschiedenen Plots
help(pie) Beispielaufteilung aus der Hilfe
rpois Zufallsgenerator für Poissonverteilte Zahlen
VADeaths Sterberate pro 1000 in Virginia (1940)
rchisquared Zufallsgenerator für χ2 -verteilte Zahlen
trees Umfang, Höhe und Volumen von 31 Weichselbäu-
men
cars Geschwindigkeit und Bremsweg von 50 Fahrzeugen
(1920)
rnorm Zufallsgenerator für normalverteilte Zahlen
sqrt(abs(x)) Wurzelfunktion
barley Gerstenernte für 10 Varianten und 6 Feldern
iris Abmessungen von 150 Blüten aus drei Unterfami-
lien der Gattung Iris (1935)
warpbreaks Bruch von 2 Sorten Wolle bei 3 verschiedenen
Spannungen auf einem Webstuhl
Titanic Schicksal der Titanicpassagiere
women Größe und Gewicht von amerikanischen Frauen
(1975)
sunspot.year Jährliche Anzahl der Sonnenflecken von 1700-1988
co2 Kohlendioxidausstoß des Mauna Loa (Hawaii)
Tabelle 20: Quellen in R: Um Details zu diesen Quellen erfahren, tippen Sie in der
Commandshell von R: require(lattice), quittieren Sie mit [Return]
und schließlich help(anscombe). Für die anderen Quellen müssen Sie
nur noch help(Quellenname) tippen.
115
Literatur
Albers, Josef (1969): Search Versus Re-Search. In Tufte, E.R. (Hrsg.): En-
visioning Information (10th printing) (2005). Ceshire, CT: Graphics Press
LLC, 61
Amelingmeyer, Jenny (2004): Wissensmanagement. Analyse und Gestaltung
der Wissensbasis von Unternehmen. Wiesbaden: Dt. Univ.-Verl. (Gabler-
Edition Wissenschaft;Strategisches Kompetenz-Management)
Anscombe, Francis J. (1973): Graphs in Statistical Analysis. In: The Ameri-
can Statistician, 27, 17–21, Entnommen aus: Tufte, R.(1974): Data Analysis
for Politics and Policy, Englewood Cliffs, NJ, Prentice-Hall, Inc., S. 131–134
Baker, M. Pauline/Bushell, Colleen (1995): After the Storm: Conside-
rations for Information Visualization. online abgerufen 14.04.2007 hURL:
http://vis.iu.edu/Publications/Storm.pdfi
Bancroft, T.A. (Hrsg.) (1972): Statistical Papers in Honor of George W.
Snedecor. Ames, IO: The Iowa State University Press – online abgerufen
11.03.2007 hURL: http://www.edwardtufte.com/tufte/tukeyi
Beattie, Vivien/Jones, Michael J. (1992): The Use and Abuse of Graphs in
Annual Reports: Theoretical Framework and Empirical Study. In: Accoun-
ting and Business Research, Vol. 22, No. 88, S. 291–303
Becker, Manfred (2005): Systematische Personalentwicklung: Planung, Steue-
rung und Kontrolle im Funktionszyklus. Stuttgart: Schäffer-Poeschel Verlag
für Wirtschaft.Steuern.Recht
Chabris, Christopher F./Kosslyn, Stephen M. (1995): Illustrated Editorial
is value-added text: A picture is worth 1000 words—right? Only if it’s the
right picture, and if it comes at the right point in text. In: Folio, 1. Februar
1995, S. 28–29
Chabris, Christopher F./Kosslyn, Stephen M. (2005): Representational
Correspondence as a Basic Principle of Diagram Design. In Tergan, S.O./
Keller, T. (Hrsg.): Knowledge and Information Visualization. Berlin,
Heidelberg: Springer Verlag, S. 36–57
Cleveland, William S. (1993): Visualizing Data. Summit, NJ: Hobart Press
Cleveland, William S. (1994): The Elements of Graphing Data (revised edi-
tion). Summit, NJ: Hobart Press
116
sentation: The bad, the good and the better (Department of Conservation
Technical Series 32). Wellington, NZ: DOC Science & Technical Publishing
- online abgerufen 10.03.2007 hURL: http://www.doc.govt.nz/i
Kosslyn, Stephen M. (1989): Understanding Charts and Graphs. In: Applied
Cognitive Psychology, 3, S. 185–226
Kosslyn, Stephen M. (2006): Graph Design for the Exe and Mind. New York,
NY: Oxford University Press
Krämer, Walter (2007): So lügt man mit Statistik (9. Auflage). München:
Piper Verlag GmbH
Lengler, Ralph/Eppler, Martin J. (2007): Towards A Periodic Ta-
ble of Visualization Methods for Management. online abgerufen am
18.02.2007 hURL: http://www.visual-literacy.org/periodic_table/
periodic_table.pdfi
Löffler, Andreas (2007): Sparklines. 2007, (Dokumentation zum LATEX-Paket
Sparklines)
Maeda, John (2006): The Laws of Simplicity: Design, Technology, Business,
Life. Cambridge, MA: The MIT Press
Maindonald, J H (2004): Using R for Data Analysis and Graphics: Intro-
duction, Code and Commentary. online abgerufen am 25.03.2007 hURL:
http://cran.r-project.org/doc/contrib/usingR.pdfi
Mandel, Heinz/Spada, Hans (Hrsg.) (1988): Wissenspsychologie. München;
Weinheim: Psychologie-Verl.-Union
Mayer, Horst O. (2000): Einführung in die Wahrnehmungs-, Lern- und Werbe-
Psychologie. München; Wien: Oldenbourg (Edition Psychologie)
Miller, George A. (1956): The Magical Number Seven, Plus or Minus Two:
Some Limits on Our Capacity for Processing Information. In: The Psycho-
logical Review, 63, 81–97 hURL: http://www.musanim.com/miller1956/i,
online abgerufen am 10.04.2007
Minard, Charles Joseph (1869): Tableaux Graphiques et Cartes Figuratives
de M. Minard, 1845-1869. In Tufte, E.R. (Hrsg.): Beautiful Evidence
(2006). Ceshire, CT: Graphics Press LLC, 122–139
Nonaka, Ikujiro/Takeuchi, Hirotaka (1997): Die Organisation des Wissens:
Wie japanische Unternehmen eine brachliegende Ressource nutzbar machen.
Aus dem Engl. von Friedrich Mader. Frankfurt/Main; New York: Campus-
verlag
118
Norman, Donald A (1990): The design of everyday things. New York, NY:
Bantam Doubelday Dell Publishing Group, Inc.
Office IT and Servers User Assistance (2006): Technical Reference for Mi-
crosoft Office Ressource Kit 2007. Redmond, WA: Microsoft Corporation,
2006 hURL: http://go.microsoft.com/fwlink/?LinkId=79595&clcid=
0x409i
Polyani, Michael (1985): Implizites Wissen (6.Auflage). Frankfurt/Main:
Suhrkamp Taschenbuch Verlag
Ponocny-Seliger, Elisabeth/Ponocny, Ivo (2005): Statistik for you: Eine an-
wendungsbezogene Einführung in die quantitativen Auswertungsmethoden
unter besonderer Berücksichtigung von SPSS 10.0. Wien: Facultas Verlags-
und Buchhandels AG
Probst, Gilbert/Raub, Stefan/Romhardt, Kai (2003): Wissen ma-
nagen: Wie Unternehmen ihre wertvollste Ressource optimal nutzen
(4. überarbeitete Auflage). Wiesbaden: Betriebswirtschaftlicher Verlag
Dr.Th.Gabler/GWV Fachverlage GmbH
R Development Core Team (2006): R Language Definition. Vienna, Aus-
tria: R Foundation for Statistical Computing, 2006 hURL: http://www.
R-project.orgi, ISBN 3-900051-07-0
Robbins, Naomi B. (2005): Creating More Effective Graphs. Hoboken, NJ:
Wiley-Interscience: John Wiley & Sons, Inc.
Rogowitz, Bernice E./Treinish, Lloyd E. (1995): How NOT to Lie with Vi-
sualization. online abgerufen am 27.03.2007 hURL: http://www.research.
ibm.com/dx/proceedings/pravda/truevis.htmi
Rosenblith, W.A. (Hrsg.) (1961): Sensory Communication. Cambridge, MA:
MIT Press
Rotman, Brian (1993): Signifying Nothing: The Semiotics Of Zero. Stanford,
CA: Stanford University Press
Schnotz, Wolfgang (2002): Wissenserwerb mit Texten, Bildern und Diagram-
men. In Issing, Ludwig J./Klimsa, Paul (Hrsg.): Information und Ler-
nen mit Multimedia und Internet (3.Auflage). Weinheim: Verlagsgruppe
Beltz, Psychologische Verlags Union, S. 65–81
Spence, Ian (2004): The Apparent and Effective Dimensionality of Represen-
tations of Objects. In: Human Factors, 64/4, S. 738–747
Stevens, S. S. (1961): The Psychophysics of Sensory Function. In Rosen-
blith, W.A. (Hrsg.): Sensory Communication. Cambridge, MA: MIT
119