Sie sind auf Seite 1von 126

FHWien Studiengang

Wissensmanagement der WKW

Titel der Diplomarbeit:


„Besonderheiten im Wissenstransfer mittels Diagrammen
im Sinne von quantitativen Darstellungen“

Verfasst von: Stefan Steinbauer

Betreut von: MMag. Dr. Priv.-Doz. Ivo Ponocny

Ich versichere:

• dass ich die Diplomarbeit selbständig verfasst, andere als die angegebenen Quellen
und Hilfsmittel nicht benutzt und mich auch sonst keiner unerlaubten Hilfe bedient
habe.

• dass ich dieses Diplomarbeitsthema bisher weder im In- noch im Ausland in


irgendeiner Form als Prüfungsarbeit vorgelegt habe.

............ .................................
Datum Unterschrift
Für Elke,
Arnika,
Hedwig,
und Almuth.

The greatest value of a picture is


when it forces us to notice
what we never expected to see.

— John Wilder Tukey (1915 – 2000) —


I

Inhaltsverzeichnis
Inhaltsverzeichnis I
Abbildungsverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . III
Tabellenverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . IV

1 Einleitung 1

2 Wissenstransfer 3
2.1 Definition und Unterscheidungen . . . . . . . . . . . . . . . . . . 3
2.2 Wissen und Transfer . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.3 Wissenstransfer und Wissensmanagement . . . . . . . . . . . . . . 7
2.4 Wissenstransfer und die Organisation . . . . . . . . . . . . . . . . 9
2.5 Allgemeines und Wissenstransfer . . . . . . . . . . . . . . . . . . 10

3 Wahrnehmung 12
3.1 Wahrnehmung und Wissenstransfer . . . . . . . . . . . . . . . . . 12
3.2 Auge und Information . . . . . . . . . . . . . . . . . . . . . . . . 12
3.3 Wahrnehmung und Modell . . . . . . . . . . . . . . . . . . . . . . 13
3.4 Auflösung und Sehschärfe . . . . . . . . . . . . . . . . . . . . . . 16
3.5 Muster und Erkennung . . . . . . . . . . . . . . . . . . . . . . . . 18
3.6 Farbe und Schwarzweiß . . . . . . . . . . . . . . . . . . . . . . . . 22
3.7 Raum und Sehen . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.8 Wissen und Sehen . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.9 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

4 Diagramme 33
4.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.2 Daten und Grafik . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.3 Skalen und Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.4 Analyse und Kommunikation . . . . . . . . . . . . . . . . . . . . . 40
4.5 Elemente und Aufbau . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.6 Weber, Fechner und der Sinneseindruck . . . . . . . . . . . . . . . 43
4.7 Fehler und Wahrnehmung . . . . . . . . . . . . . . . . . . . . . . 46
4.8 Diagramme und 3d . . . . . . . . . . . . . . . . . . . . . . . . . . 48

5 Diagrammtypen 50
5.1 Pop Charts und andere Klassiker . . . . . . . . . . . . . . . . . . 50
5.2 Neuere Formen der Darstellung . . . . . . . . . . . . . . . . . . . 54
5.3 Dotplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.4 Multidisplays . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
II

5.5 Semigrafische und wortgroße Grafiken . . . . . . . . . . . . . . . . 60

6 Gestaltungsprinzipien 63
6.1 Prinzipien nach Cleveland . . . . . . . . . . . . . . . . . . . . . . 63
6.2 Prinzipien nach Kosslyn . . . . . . . . . . . . . . . . . . . . . . . 66
6.3 Prinzipien nach Tufte . . . . . . . . . . . . . . . . . . . . . . . . . 68
6.4 Fazit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

7 Analyse 74
7.1 Allgemeines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
7.2 Ziel und Zweck . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
7.3 Vorgehensweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
7.4 Getestete Software . . . . . . . . . . . . . . . . . . . . . . . . . . 76
7.5 Kriterienkatalog . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
7.6 Farbe und die Tabellenkalkulationen . . . . . . . . . . . . . . . . 79
7.6.1 Rahmenbedingungen . . . . . . . . . . . . . . . . . . . . . 79
7.6.2 Durchführung . . . . . . . . . . . . . . . . . . . . . . . . . 81
7.6.3 Auswertung . . . . . . . . . . . . . . . . . . . . . . . . . . 81
7.7 Neuerungen und die Tabellenkalkulationen . . . . . . . . . . . . . 84
7.7.1 Dotplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
7.7.2 Panelcharts . . . . . . . . . . . . . . . . . . . . . . . . . . 85
7.7.3 Sparklines . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
7.7.4 Aktuelle Funktionalitäten . . . . . . . . . . . . . . . . . . 86
7.8 Lügenfaktor und die Tabellenkalkulationen . . . . . . . . . . . . . 87
7.8.1 Rahmenbedingungen . . . . . . . . . . . . . . . . . . . . . 87
7.8.2 Durchführung . . . . . . . . . . . . . . . . . . . . . . . . . 88
7.8.3 Untersuchung des Lügenfaktors im Detail. . . . . . . . . . 91
7.9 Reflexion und Analyse . . . . . . . . . . . . . . . . . . . . . . . . 95

8 Die Besonderheiten im Wissenstransfer mittels Diagrammen 98

Anhang 101

A Kriterienkatalog 101

B Werte zur Untersuchung des Lügenfaktors 109

C Software- und Datenquellennachweis 111


C.1 Software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
C.2 Datenquellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

Literaturverzeichnis 115
III

Abbildungsverzeichnis
1 Bausteine des Wissensmanagements . . . . . . . . . . . . . . . . . 8
2 Das menschliche Auge . . . . . . . . . . . . . . . . . . . . . . . . 13
3 Dreistufiges Wahrnehmungsmodell . . . . . . . . . . . . . . . . . . 14
4 Scharfsicht des Auges . . . . . . . . . . . . . . . . . . . . . . . . . 17
5 Ausgewählte Gestaltgesetze . . . . . . . . . . . . . . . . . . . . . 19
6 Reizzerlegung des Gegenfarbmodells . . . . . . . . . . . . . . . . . 22
7 Kippeffekt 3d . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
8 Hierarchie der Hinweisreize . . . . . . . . . . . . . . . . . . . . . . 28
9 Warme Farben sind näher als Kalte . . . . . . . . . . . . . . . . . 29
10 Goldener Schnitt . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
11 Merkfähigkeit nach Aufnahme . . . . . . . . . . . . . . . . . . . . 32
12 Plot der Zahlentabelle nach Anscombe . . . . . . . . . . . . . . . 34
13 Periodensystem der Visualisierungsmethoden . . . . . . . . . . . . 37
14 Tortendiagramm in 3d . . . . . . . . . . . . . . . . . . . . . . . . 48
15 Schemata klassischer Diagrammtypen . . . . . . . . . . . . . . . . 51
16 Vergleich zwischen Kreisdiagramm und Dotplot . . . . . . . . . . 55
17 Beispiel für einen Multiway Dotplot . . . . . . . . . . . . . . . . . 56
18 Beispiel für einen Matrixplot . . . . . . . . . . . . . . . . . . . . . 57
19 Beispiel für einen Conditional Plot . . . . . . . . . . . . . . . . . 58
20 Mosaikplot der Titanicpassagiere . . . . . . . . . . . . . . . . . . 60
21 Stem-and-Leaf-Plot . . . . . . . . . . . . . . . . . . . . . . . . . . 61
22 Sparklines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
23 Beispiel für Banking . . . . . . . . . . . . . . . . . . . . . . . . . 64
24 Dekomposition einer Kurve in Teilaussagen . . . . . . . . . . . . . 65
25 Beispiel für small multiples . . . . . . . . . . . . . . . . . . . . . . 69
26 Minards Darstellung des Russlandfeldzugs Napoleons . . . . . . . 71
27 6 Farben im Tortendiagramm . . . . . . . . . . . . . . . . . . . . 80
28 Vergleich zwischen Farbe und S/W . . . . . . . . . . . . . . . . . 83
29 Farbschemata bei Excel 2007 . . . . . . . . . . . . . . . . . . . . . 84
30 2 Kurven mit und ohne Raster . . . . . . . . . . . . . . . . . . . . 88
31 Test 1: Balkendiagramme mit den Werten aus Tabelle 9 . . . . . . 89
32 Test 2: Balkendiagramme mit den Werten aus Tabelle 10 . . . . . 90
33 Grundlage für die Berechnung des Lügenfaktors bei Excel 2007 . . 91
34 ymax , ymin und y0 für Lügenfaktor . . . . . . . . . . . . . . . . . . 93
35 Lügenfaktor und Bestandteile . . . . . . . . . . . . . . . . . . . . 94
36 Sichtweisen auf die Visualisierung . . . . . . . . . . . . . . . . . . 96
37 Kopie der Sparkline von Seite 62 . . . . . . . . . . . . . . . . . . . 112
IV

Tabellenverzeichnis
1 Kontinuum von Daten zu Wissen . . . . . . . . . . . . . . . . . . 3
2 Merkmale der Ressource Wissen . . . . . . . . . . . . . . . . . . . 4
3 Wahrnehmung von Diagrammen . . . . . . . . . . . . . . . . . . . 16
4 Technische Auflösung ausgewählter Geräte . . . . . . . . . . . . . 18
5 Hinweisreize für Tiefe . . . . . . . . . . . . . . . . . . . . . . . . . 27
6 Zahlentabelle nach Anscombe . . . . . . . . . . . . . . . . . . . . 33
7 Eigenschaften von Diagrammelementen der Fehlerquote nach sortiert 47
8 Ausgemessene Farbwerte . . . . . . . . . . . . . . . . . . . . . . . 82
9 Werte für den 1.Test des Lügenfaktors . . . . . . . . . . . . . . . 88
10 Werte für den 2.Test des Lügenfaktors . . . . . . . . . . . . . . . 89
11 Allgemeine Kriterien für die Bewertung der Lesbarkeit von Grafiken102
12 Kriterien für die Bewertung der Lesbarkeit von Achsen . . . . . . 104
13 Kriterien für die Bewertung der Lesbarkeit von Tickmarks . . . . 105
14 Kriterien für die Bewertung der Lesbarkeit von Rastern . . . . . . 105
15 Kriterien für die Bewertung der Lesbarkeit von Beschriftung . . . 107
16 Kriterien für die Bewertung der Lesbarkeit von Farben . . . . . . 108
17 Werte zur Untersuchung des Lügenfaktors . . . . . . . . . . . . . 110
18 Benutzte Software . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
19 Nachweis der Datenquellen und angewandte Software . . . . . . . 113
20 Quellen in R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
1

1 Einleitung

Die Bedeutung von grafischen Darstellungen ist sprichwörtlich. Trotzdem ge-


schieht es immer wieder, dass man eine Grafik sieht, die nur eine Frage hervor
ruft: Was will mir der Autor1 dieser Grafik eigentlich sagen?

Ziel dieser Arbeit ist es folgendes zu zeigen: Welche Besonderheiten gibt es im


Wissenstransfer mit Diagrammen? Kann man diese Merkmale in aktuellen Tabel-
lenkalkulationen wiederfinden? Dazu gehört der Versuch Kriterien für eine Gra-
fik guter Form — einer Darstellung, die den technischen und wissenschaftlichen
Standards entspricht und Ästhetik vermittelt — aufzustellen und die Tabellen-
kalkulationen nach diesen Kriterien auszuwerten.

Am Anfang steht der Wissenstransfer, dessen Definition den Rahmen für die
folgenden Überlegungen bildet. Wir betrachten den Wissenstransfer aus der Sicht
des Wissensmanagements, der Organisation und des Individuums. Es werden Fak-
ten dargelegt, die zeigen warum der Leser einer Datengrafik vom Ersteller dersel-
ben abhängt.

Um ein Diagramm wahrnehmen zu können, wird Wahrnehmung im Sinne des


Sehens erklärt. Der Schwerpunkt liegt dort auf den Faktoren, die die Wahrneh-
mung von Diagrammen beeinflussen: Muster, Farbe, Raum und Wissen. Das
räumliche Sehen hat eine ungeahnte Bedeutung für Diagramme.

Basierend auf diesen Fakten werden wir Diagramme kennen lernen. Im Kontext
der Diagramme werden Teile der Wahrnehmung genauer dargelegt. Aufbauend
auf klassischen Diagrammtypen werden ausgewählte neue Typen vorgestellt und
deren Einsatzmöglichkeiten erklärt. Hier sind Fakten zu finden, die den Einsatz
dieser neuen Typen als Ersatz für Bekannte begründen.

Gestaltungsprinzipien von Diagrammen werden unter anderem auch einen Ar-


chetypus einer analytischen Grafik zeigen. Trotz Ihres Alters hat sie nicht an Ihrer
Aussagekraft verloren und zeigt wichtige Punkte beim Erstellen und Erarbeiten
einer Datengrafik.

1
Ich bin mir der Debatte um Geschlechtsneutralität bewusst, habe aber aus Gründen der
Lesbarkeit in meiner Arbeit vorwiegend die männliche Form, wenn es mir nicht möglich war
neutral zu formulieren, gewählt.
2

In der Analyse wird ein Kriterienkatalog zeigen, wie spezifisch manche Ratschlä-
ge aus der Literatur sind und warum die Diagramme aus Tabellenkalkulationen
in der Standardeinstellung als Ausgangspunkt für Optimierungen zu betrachten
sind. Im Detail betrachten wir noch die Farben und den Lügenfaktor in aktuellen
Tabellenkalkulationen.

Abschließend werden wir die Besonderheiten des Wissenstransfers mit Dia-


grammen noch einmal Revue passieren lassen und einen Blick in die Zukunft der
quantitativen Abbildungen und ihrer Bedeutung für den Arbeitsalltag wagen.

Im Anhang sind Kriterienkataloge und ein Verzeichnis der verwendeten Softwa-


re und Datenquellen untergebracht, falls der Wunsch besteht, bestimmte Daten
genauer zu betrachten und eigene Grafiken zu erstellen.
3

2 Wissenstransfer

2.1 Definition und Unterscheidungen

Man könnte glauben zu wissen, was Wissen ist. In der Literatur findet man dann
vielerlei Definitionen, manchmal sogar eine Liste von Definitionen2 . Das deutet
darauf hin wie ungreifbar das Wissen als Begriff ist und wie notwendig es ist klar
zustellen worüber man spricht.

Folgende Definition von Wissen wird im vorliegenden Text als gültig betrachtet:

Wissen bezeichnet die Gesamtheit der Kenntnisse und Fähigkeiten,


die Individuen zur Lösung von Problemen einsetzen. Dies umfasst so-
wohl theoretische Erkenntnisse als auch praktische Alltagsregeln und
Handlungsweisen. Wissen stützt sich auf Daten und Informationen,
ist im Gegensatz zu diesen jedoch immer an Personen gebunden. Es
wird von Individuen konstruiert und repräsentiert deren Erwartungen
über Ursache-Wirkungs-Zusammenhänge.3

In einem weiteren Schritt benötigen wir eine Abgrenzung von Wissen zu Infor-
mation und Daten. Probst/Raub/Romhardt (2003) sprechen in ihrer Arbeit von
einem Kontinuum von Daten und Informationen zu Wissen in dem ein Verdich-
tungsprozess von einzelnen Zeichen hin zu Wissen läuft.4 Der Verlauf einzelner

Daten . . . . . . Information . . . . . . Wissen


unstrukturiert . . . . . . strukturiert
isoliert. . . . . . verankert
kontext-unabhängig. . . . . . kontext-abhängig
geringe Verhaltenssteuerung. . . . . . hohe Verhaltenssteuerung
Zeichen . . . . . . kognitive Handlungsmuster
distinction . . . . . . mastery/capability
kein sprunghafter, sondern stetiger Qualitätswandel

Tabelle 1: Kontinuum von Daten über Information zu Wissen (aus: Probst/Raub/


Romhardt (2003), S. 17)

Parameter wird in Tabelle 1 ersichtlich. So ist im Falle von Diagrammen die


Tatsache der Kontextbindung von Wissen ein Merkmal, dass es von Daten und
2
Vgl. Amelingmeyer (2004), S. 41f.
3
Probst/Raub/Romhardt (2003), S. 22.
4
Vgl. Probst/Raub/Romhardt (2003), S. 18.
4

Information trennt. Um zu verstehen, dass Daten keine Information und schon


gar kein Wissen sind, betrachten wir die Eigenschaften und Parameter auf der
linken Seite der Tabelle, die die Daten darstellen. Daten sind Zeichen, die sich
unterscheiden5 , kontext-unabhängig sind und in einer isolierten und unstruktier-
ten Art vorliegen. Bei der Weiterentwicklung von Daten geschieht eine Kontex-
tualisierung, Strukturierung und Verankerung in einem System, wobei man von
Information spricht. Dies geschieht solange bis die ursprünglichen Daten nur noch
schwer wahrnehmbar sind (durch die Verankerung und Verhaltenssteuerung) und
Wissen vorliegt.

Im Fall der vorliegenden Arbeit spielt eine Unterscheidung von verschiedenen


Arten des Wissens eine untergeordnete Rolle. Wir wollen trotz der Tatsache,
dass andere Autoren mit einer unterschiedlichen Definition von Wissen arbeiten,
einige andere Unterscheidungen betrachten.

Merkmale implizites explizites öffentliches proprietäres


Wissen Wissen Wissen Wissen
Kontext- gebunden an gebunden an gemeinsame organisations-
bindung sensorische intellektuelle Praxis geschützte
Erfahrung Erfahrung Praxis
Übertra- gemeinsame Kommuni- Wertsteige- Wertminde-
gung Anwendung kation rung durch rung durch
von Wissen von Wissen Verbreitung Verbreitung
Explizie- aufwendiger Dokumentati- setzt setzt
rung Prozess der on in gemeinsame gemeinsame
Externalisie- 1. Zahlen „Sprache“ Interessen
rung 2. Text voraus voraus
3. Bilder
Aneignung durch durch durch durch
gemeinsame gemeinsames geteilte geteilte
Praxis Lernen Öffentlichkeit Geheimhal-
tung oder
Eigentums-
rechte

Tabelle 2: Merkmale der Ressource Wissen (aus: Willke (2001), S. 67)

In Tabelle 2 ist eine kurze Aufstellung und Unterscheidung, wie Willke sie ge-
troffen hat, zu finden. Sowohl Nonaka/Takeuchi6 als auch Willke7 benutzen die
Trennung zwischen explizitem und implizitem Wissen nach Polyani8 . Implizites
5
Anm. zu Tabelle 1: distinction bedeutet Unterscheidung, mastery/capability kann durch Kön-
nen übersetzt werden.
6
Vgl. Nonaka/Takeuchi (1997), S. 71f.
7
Vgl. Willke (2001), S. 12.
8
Vgl. Polyani (1985), S. 18–22.
5

Wissen unterscheidet sich von explizitem Wissen unter anderem dadurch, dass
es nicht oder nur mit erheblichem Aufwand kodifiziert oder ausgedrückt werden
kann. An Hand von Tabelle 2 sieht man, dass es sich bei Diagrammen um expli-
zites respektive explizierbares Wissen handelt. Das implizite Wissen scheint eine
untergeordnete Rolle zu spielen. Manche Gestaltungsprinzipien bei der Erstellung
von Diagrammen entstammen jahrelanger Praxis und man kann nicht explizit je-
de Vorgehensweise begründen. Weiterhin kann nicht angenommen werden, dass
der Leser eines Diagramms diese Gestaltung so versteht, wie der Empfänger es
gemeint hat.

Abschließend muss noch einmal betont werden, dass Wissen als direkt mit einer
Person „verknüpft“ betrachtet werden kann und immer von einer Person erschaf-
fen wird. Daten und Informationen sind nicht notwendigerweise in einer Person
verankert und können auch anders vorliegen. Und es gibt Grund zu der Annahme,
dass es nicht möglich ist jedes bzw. jeden Teil eines Wissens zu explizieren. Die
Kodifikation von Wissen, also die Erfassung aller Inhalte und Zusammenhänge,
ist eine Grundvoraussetzung um einen Transfer vorzunehmen.

Transfer ist ein vieldeutiger Begriff. In der Psychologie bezeichnet er die Beein-
flussung von Lernprozessen durch Erfahrungen, im wirtschaftlichen Bereich das
Übertragen von Werten und die Pädagogik betrachtet den Transfer als die Über-
tragung von Erlerntem auf eine andere Aufgabe.9

Es bestehen weitere Möglichkeiten, den Transfer zu teilen oder zu klassifizieren:


(1) Positiver, (2) Negativer und (3) Nulltransfer sind Staffelungen nach dem Er-
folg, (1) Lateraler und (2) Vertikaler Transfer nach der Richtung in einer Organi-
sation und schliesslich noch die Teilung in (1) innovativen und (2) Routinetransfer
nach der Art der Anwendung des Übertragenen.10 Teil aller dieser Unterscheidun-
gen ist der Schluss, dass etwas übertragen wird.

2.2 Wissen und Transfer

Wenn man die bisher zusammen getragenen Fakten zusammen stellt, ergibt sich
folgendes Bild. Wissen, dass nur im Kopf eines Subjekts existiert und dessen Kopf
dieses Wissen auch geschaffen hat, widerspricht dem wortwörtlichen Sinn von

9
Vgl. Becker (2005), S. 240f.
10
Vgl. Becker (2005), S. 242.
6

Wissenstransfer. Transfer würde bedeuten, dass etwas von A nach B gelangt, nur
dass dieses Etwas im Fall des Wissenstransfers Wissen ist und per definitionem
mit einer Person verknüpft ist. Hinzu kommt die Möglichkeit, den Wissenstransfer
als Aktion eines Systems zu interpretieren. Wir sehen, dass diese wortwörtliche
Interpretation des Wortes Wissenstransfer also nicht stimmt. Die Mutmaßung,
es könnte sich um die Übertragung von Information handeln anstatt von Wissen
liegt auf der Hand, gehören Informationen doch zur Basis des Wissens.

Willke (2001) gelangt zu dem Schluss, dass es den Informationsaustausch auch


nicht geben kann, weil die beiden austauschenden Systeme nicht dieselben Rele-
vanzkriterien haben, die notwendig wären um aus Daten Informationen zu ma-
chen (welches er als ersten Kontext von Relevanzen bezeichnet).11 Er definiert
einen Prozess der diesem, wie er es nennt, scheinbaren Informationsaustausch zu
Grunde liegt.

Er [Anm.: der Informationsaustausch] besteht darin, dass ein Sys-


tem (Ego) eine Information als Signal in Form einer codierten Be-
obachtung abgibt. Für jedes andere System (Alter) ist dieses Signal
nichts anderes als ein Datum, und auch dies nur, wenn es mit seiner
Ausstattung an Instrumenten das Signal beobachten kann. Alter kann
nun dieses Datum am Maßstab seiner spezifischen Relevanzen bewer-
ten und daraus eine Information konstruieren. Klar ist, dass dies für
Alter eine andere Information ist als für Ego, sonst wären beide Sys-
teme ja identisch.12

Unter Ausschluss der Identität von Sender und Empfänger bleibt für den Wis-
senstransfer die Übertragung von Daten, die auch nur dann funktioniert, wenn
diese Daten wahrgenommen werden können.

Jetzt werden die Daten, die schon Informationen sind, in einen zweiten Kontext
von Relevanzen eingebunden, wodurch sie zu Wissen werden. Diese Relevanzen
sind keine Kriterien wie in der ersten Umwandlung, sondern „Erfahrungsmus-
ter“.13 Aus den bisher angeführten Fakten lassen sich folgende Dinge schließen:

1. Der Prozess zwischen den beiden Systemen ist kein Wissenstransfer im


wörtlichen Sinne, sondern es handelt sich um einen Datentransfer.

11
Vgl. Willke (2001), S. 8f.
12
Willke (2001), S. 9.
13
Vgl. Willke (2001), S. 11.
7

2. Der Anstoß des Wissenstransfers kann nicht alleine vom Sender ausgehen.
Der Wissenstransfer ist eine Aktion des Empfängers beziehungsweise bedarf
der Mitwirkung des Empfängers.14
3. Die übermittelte Nachricht muss vom Sender nicht nur in Relevanzen ein-
gebettet werden, sondern auch aktiv verarbeitet werden, um mehr als In-
formation zu werden.
4. Der Wissenstransfer kann von beiden Seiten gemeinsam oder jeder für sich
initialisiert werden, aber nur in Kooperation funktionieren.

Der Einflussbereich des Senders ist aber keineswegs gleich Null! Der Sender hat
die Verantwortung und den Einfluss auf Qualität und Quantität der Daten, deren
Kodifizierung und Auswahl des Transfermediums und somit großen Einfluss auf
die Effektivität und Effizienz des Transfers.

Das bedeutet aber auch, dass alle am Wissenstransfer beteiligten Personen am


Erfolg dieser Weitergabe von Wissen partizipieren. Der Erfolg, im Sinne eines
effektiven Transfers, kann wie folgt definiert werden:

Wissen wurde dann wirksam weitergegeben, wenn der Lerntransfer


in die Praxis gelingt, das heißt die Lernenden später im „richtigen“
Moment darauf zugreifen. Das muss das erste und wichtigste Ziel jeder
Wissensvermittlung sein.15

Die Überlegungen in diesem Kapitel bisher waren an die Tatsache angelegt, dass
zwei Systeme miteinander kommunizieren und dass diese beiden Systeme Einzel-
personen entsprechen. Natürlich kann das empfangende Systeme aus mehreren
Personen bestehen und man kann die letzten Überlegungen noch einmal für die-
sen Fall durchspielen. Das Ergebnis der Überlegungen wird jedoch dasselbe sein,
da durch die Einführung eines Zielpublikums (und das entspricht einem empfan-
genden System aus mehreren Personen) die Argumentation unverändert bleibt.

2.3 Wissenstransfer und Wissensmanagement

Wissenstransfer muss aber auch als Teil eines größeren Ganzen gesehen werden:
als Teil des Wissensmanagements. Probst/Raub/Romhardt (2003) definieren eine
14
Vgl. Polyani (1985), S. 15.
15
Dollinger (2003), S. 9.
8

Prozesslandschaft16 wie Sie in Abbildung 1 zu sehen ist. Man sieht, dass es dort

Abbildung 1: Bausteine des Wissensmanagements (aus: Probst/Raub/


Romhardt (2003), S. 32): Es gibt keinen Prozess, der Wis-
senstransfer heißt oder der ganzen Bedeutung entspricht.

keinen Kernprozess (im Rahmen) und auch keinen Baustein mit dem Namen „Wis-
senstransfer“ gibt. Das liegt an dem Fokus, der angelegt wird und der liegt auf den
Menschen. Wenn man sich die Definition von Wissen von Seite 3 in Erinnerung
ruft: Das Wissen ist in den Köpfen der Menschen und kann somit nicht berührt
werden. Insofern ist der Wissenstransfer ein Bestandteil der Wissens(ver)teilung
und auch ein Teil der Identifikation, Bewahrung, Erwerb, Entwicklung und ein-
geschränkt auch Nutzung von Wissen.17 All diese Dinge benötigen den Transfer
um zu funktionieren, um Daten zu erhalten oder weiterzugeben.

Es ist nahe liegend zu vermuten, dass die Bezeichnung Wissensmanagement ei-


ne ähnliche Fehlbezeichnung wie Wissenstransfer ist. Eine Argumentationslinie
kann zumindest mit dem Argument begonnen werden, dass Wissen als fest mit
einer Person verbunden zu betrachten ist. Dies ist aber nicht Gegenstand dieser
Arbeit.

Die vorangegangenen Argumente deuten darauf hin, dass es eine Weitergabe von
Wissen gibt. Es gibt noch keinen Hinweis inwiefern dieser Transfer effizient ist.

Wissenstransfer ist der Transfer von Daten des Senders zu einem Empfänger mit
dem Ziel, dass dieser die Daten interpretieren kann und durch Lerntransfer soweit
gelangt, dass er Kenntnisse und/oder Fähigkeiten erlangt die vorteilhaft bei der
Lösung von Aufgaben sind.

16
Vgl. Probst/Raub/Romhardt (2003), S. 28–33.
17
Abhängig von der Art und Weise der Nutzung.
9

Und Wissenstransfer ist der Transfer des Empfängers von einem Sender mit dem
Ziel möglichst viele dieser Daten zu empfangen und durch Einbinden in den per-
sönlichen Kontext Vorteile bei der Lösung anderer Aufgaben zu erlangen.

Die Rolle des Wissensmanagements liegt nicht im direkten Beeinflussen des Trans-
fers, sondern im Schaffen von Rahmenbedingungen.

2.4 Wissenstransfer und die Organisation

Die moderne Organisationstheorie kennt auch den Begriff der organisationalen


Wissensbasis, welche sich wie folgt definiert:

Die organisationale Wissensbasis setzt sich aus individuellen und


kollektiven Wissensbeständen zusammen, auf die eine Organisation
zur Lösung ihrer Aufgaben zurückgreifen kann. Sie umfasst darüber
hinaus die Daten und Informationsbestände, auf welchen individuelles
und organisationales Wissen aufbaut.18

Die Änderungen dieser organisationalen Wissensbasis wird als organisationales


Lernen bezeichnet.19 Das Wissensmanagement benötigt den Wissenstransfer um
manche dieser Veränderungen zu vollziehen, da mittels des Wissenstransfers zu-
mindest die Wissensbasis des Individuum beeinflusst werden kann.

Aus der Perspektive des Wissenstransfers ist die organisationale Wissensbasis die
Grundlage aus der er seine Daten für systeminterne und -externe Kommunikation
gewinnt. Es existieren heutzutage immer mehr Organisationen, die Ihre Daten in
Datenbanken sammeln. Oft ist der Weg dieser Daten über einen automatisierten
Report aus der Datenbank an den Endnutzer, der ihn entweder aktiv angefordert
hat oder diesen automatisiert zugestellt bekommt. Das Spektrum reicht von Data-
Mining bis zu Fehlerberichten in der Haustechnik.

Im Zeitalter von E-Mail und ähnlichen günstigen und einfachen elektronischen


Hilfsmitteln stellt sich verstärkt die Frage, wer was mit welchem Detaillierungs-
grad wissen muss. Es existieren Barrieren individueller Natur, beispielsweise die
Faktoren Vertraulichkeit und Geheimhaltung, sowie die Tatsache, dass es kon-

18
Probst/Raub/Romhardt (2003), S. 22.
19
Vgl. Probst/Raub/Romhardt (2003), S. 23.
10

traproduktiv ist, wenn allen alles Wissen zugänglich gemacht wird.20 Für den
Wissenstransfer bedeutet das: Wenn es einfach ist jemandem Daten zu kommuni-
zieren, dann erleichtert das nicht nur die gewünschte Kommunikation sondern es
erleichtert auch die unerwünschte Kommunikation. Wenn es hingegen sehr schwer
ist zu kommunizieren, dann existiert im schlechtesten Fall keine Kommunikation
und somit ein kein Transfer.

2.5 Allgemeines und Wissenstransfer

Wissenstransfer als Konzept kann nicht direkt aus dem umgangssprachlichen Ge-
brauch übernommen werden. Durch die Natur des Wissens ergibt sich, dass Wis-
sen in einem abgeschlossenem System (im Sinne eines Menschen) entsteht und
von dort in Form eines Datentransfers zu einer anderen Person gelangen kann.
Dem Empfänger obliegt es den Datenstrom zu einer Information umzuwandeln
und diese schließlich in Wissen umzuwandeln.

Nicht alles Wissen ist von vornherein dazu geeignet expliziert und somit wei-
tergegeben zu werden. Zusätzlich ergibt sich die Problematik, dass der Erfolg
des Wissenstransfers — ohne Rücksichtnahme auf Perzeption und Übertragungs-
fehler — stark von der Mitwirkung des Empfängers abhängt. Die Effizienz und
die Effektivität des Wissenstransfers hängt aber auch vom verwendeten Übertra-
gungsmedium ab.21

Somit kann man Wissenstransfer als Prozess definieren, der sowohl Sender als
auch Empfänger unabhängig von einander einbezieht. Ziel des Wissenstransfers
ist es das erlernte Wissen soweit zu festigen, dass der Umgang mit diesem in der
Praxis zur richtigen Zeit möglich ist. Die Unabhängigkeit der beteiligten Systeme
geht so weit, dass es problematisch sein kann, eine Zielgruppe oder Zielsysteme
zu definieren oder das Umfeld des sendenden Systems zu erfassen.

Die Besonderheiten im Hinblick auf Diagramme sind dem hinzuzufügen, die da


sind:

20
Vgl. Probst/Raub/Romhardt (2003), S. 141–148.
21
Näheres dazu später im Kapitel 3.
11

1. Eine mögliche aber nicht notwendige Asynchronität22 bei der Übertragung,


da ein Übertragungsmedium zwischengeschalten wird, das Asynchronität
zuläßt.
2. Es gibt sehr wahrscheinlich mehrere Empfänger, aber nicht notwendiger-
weise.
3. Das Auftreten ist
a) alleine.
b) in Verbindung mit Text.
c) im Text.23
d) gemeinsam mit anderen Diagrammen.
4. Die Übertragung läuft hauptsächlich über den visuellen Kanal. Es besteht
im Kontext einer Präsentation die Möglichkeit auditiver Erklärung.

Der Wissenstransfer ist nicht ident mit dem Lerntransfer oder Lernen. Lernen
hat als Ziel den Lerntransfer, also die Übertragung des Gelernten in die Praxis.
Der Wissenstransfer kann im Gegenzug als effektiv betrachtet werden, wenn der
Lerntransfer gelingt. Ziel des Wissenstransfers ist es, möglichst viele Daten zu
transferieren, die in einer für den oder die Empfänger lesbaren Form vorliegen.

22
im Sinne von nicht gleichzeitig
23
Gemeint sind Grafiken in der Größe von Worten. Weiter hinten in der Arbeit ist ein Teilab-
schnitt diesem Thema gewidmet.
12

3 Wahrnehmung

3.1 Wahrnehmung und Wissenstransfer

Wir haben bisher die beteiligten Systeme als Teilsysteme eines Prozesses beleuch-
tet, ohne nach den Randbedingungen zu sehen. Im Fall des Wissenstransfers mit-
tels Diagrammen handelt es sich um eine optische Übertragung, das bedeutet
wir beleuchten den menschlichen Sinn Sehen.24 Der Vorgang des Sehens und so-
mit der visuellen Wahrnehmung ist eine kritische Stelle im Wissenstransfer von
Diagrammen oder wie es Cleveland (1994) ausgedrückt hat:

No matter how intelligent the choice of information, no matter how


ingenious the encoding of information, and no matter how techno-
logically impressive the production, a graph is a failure if the visual
decoding fails.25

Dieses visuelle Dekodieren der Nachricht ist ein komplexer Vorgang, deren Grund-
züge hier dargelegt werden.

3.2 Auge und Information

Die Wahrnehmung visueller Reize findet mit dem Auge statt. Dieses kann nicht
jeden Reiz wahrnehmen, sondern nur einen eingeschränkten Bereich der elek-
tromagnetischen Strahlung deren Wellenlänge im Bereich von 380nm bis 760nm
liegt.26 Diese Wellen treffen, wie in Abbildung 2 zu erkennen ist, zu aller erst auf
die Cornea (auch Hornhaut genannt) und fallen dann durch die Öffnung der Iris
auf die Linse. Die Iris ist das Äquivalent zur Blende der Kamera und regelt den
Lichteinfall. Durch die Linse wird das Bild kopfüber auf die Netzhaut (die Reti-
na) und somit auf die Zapfen und Stäbchen projiziert. Die Zapfen und Stäbchen
sind die Rezeptoren in der Netzhaut. Die Sehgrube (auch Fovea) weist eine hohe
Dichte an Zapfen auf, erzeugt so ein sehr scharfes Bild. Wenn man ein Objekt

24
Natürlich gibt es auch noch andere Möglichkeiten Diagramme wahrzunehmen, wie zum Bei-
spiel die Möglichkeit des Ertastens, wie dies in barrierefreien Anwendungen der Fall sein kann.
Wir betrachten die Diagramme ausschließlich als Visualisierungen, da das Miteinbeziehen der
taktilen oder auditiven Komponente den Umfang dieser Arbeit sprengen würde.
25
Cleveland (1994), S. 221.
26
Vgl. Zimmermann/Weigert (1995), S. 30 (Augenempfindlichkeit).
13

Abbildung 2: Das menschliche Auge (aus: Ware (2004), S. 39)

fixiert, bewegen wir unsere Augen so, dass das gesehene Objekt auf die Fovea
projiziert wird.27

Das Auge ist aber nur eine Vorstufe der Wahrnehmung, wie auch in Abbildung 3
zu sehen ist. In der Folge benutzen wir ein vereinfachtes dreistufiges Modell für
die visuelle Wahrnehmung des Menschen.28 Durch die Tatsache, dass Licht einmal
wahrgenommen wurde ist eine Voraussetzung für den Wissenstransfer gegeben:
Der Mensch besitzt die Möglichkeit visuelle Reize wahrzunehmen.

3.3 Wahrnehmung und Modell

Dieser Abschnitt gibt in Kürze das Wahrnehmungsmodell nach Ware (2004) wie-
der.29 Es ist zu zeigen, dass die wahrgenommenen Reize auch zu Daten weiter-
verarbeitet werden. Auf weitere Quellverweise wird verzichtet, wenn es sich nicht
um Quellen Dritter handelt.

27
Vgl. Mayer (2000), S. 33.
28
Vgl. Ware (2004), S. 20.
29
Vgl. Ware (2004), S. 20–22.
14

Abbildung 3: Dreistufiges Modell der visuellen Wahrnehmung (aus: Ware (2004),


S. 21)

In Stufe 1 (Parallel Processing to extract Low-Level Properties of the Visual Sce-


ne)erfolgt eine Verarbeitung der visuellen Reize durch die Neuronen im Auge
und dem visuellen Cortex im Gehirn. Als wichtige Charakteristika dieser Stufe
definiert Ware 4 Dinge:

• Schnelle parallele Verarbeitung


• Extraktion von Eigenschaften, wie etwa Orientierung, Farbe, Textur und
Bewegungsmustern
• Transitorische Natur der Information, welche kurz in einem Zeichenspeicher
gehalten wird
• Ein bottom-up datenlastiges Modell der Verarbeitung

Wie in Abbildung 3 hervorgehoben wird, ist dies eine wichtige Phase, was die
Orientierung und Farberkennung betrifft.

In Stufe 2 (Pattern Perception) wird das Sichtfeld in Sektoren und einfache Mus-
ter zerlegt (z.B.: gleiche Farbe, Textur, Kontur) und verarbeitet. Ware erwähnt
an dieser Stelle die Zwei-Visuelle-Systeme-Hypothese, nach der es zwei Systeme
gibt: Eines für Handlung und Fortbewegung, sowie eines für symbolische Ob-
jektmanipulation. In Abbildung 3 ist dies durch die Termini „What“-System und
„Action“-System dargestellt. Als Charakteristika dieser Stufe zählt er folgende
Dinge auf:
15

• Langsames serielles Verarbeiten


• Inanspruchnahme von Kurzzeit- und Langzeitgedächtnis
• Schwerpunkt auf zu erlernende Aspekte von Symbolen
• Ein fließender Zustand zwischen bottom-up Eigenschaftsverarbeitungen
und top-down Aufmerksamkeitsmechanismen
• Verschiedene Pfade für Objekterkennung und Bewegungskoordination

Kennzeichen dieser Phase ist die Verarbeitung der massiven Daten aus Stufe 1 in
Gleichzeitigkeit mit Aufmerksamkeitsmechanismen, also Anfragen.

In Stufe 3 (Sequential Goal-Directed Processing) sinkt die Anzahl der Objekte,


die gleichzeitig im visuellen Kurzzeitgedächtnis gehalten werden können. Um ei-
ne externe Visualisierung benutzen zu können, müssen jetzt Anfragen gestellt
werden, die durch visuelle Suchstrategien beantwortet werden. Die möglichen vi-
suellen Antworten auf diese Fragen bilden Grundmuster aus denen die Objekte
im Kurzzeitgedächtnis zusammengesetzt werden. In dieser Stufe der Wahrneh-
mung sind auch die Schnittstellen zu anderen Subsystemen (in Abbildung 3 nicht
ersichtlich), wie beispielsweise dem motorischen System.

Stufe 3 bietet Argumente, warum manche Darstellungsformen durch die Art der
Überladung mit Daten nicht funktionieren, wie es etwa bei Liniendiagrammen
mit mehreren Linien der Fall ist. Dies geschieht durch die Beschränkungen im
Kurzzeitgedächtnis. Es bietet sich an nicht mehr als 7±2 Datensymbole zu ver-
wenden, die in etwa die Kapazitätsgrenze darstellen.30 Hier sind unter Datensym-
bolen nicht nur Linien, sondern auch Punktgruppen zu verstehen. Näheres dazu
im Abschnitt Muster und Erkennung.

Im Hinblick auf die Diagramme im Sinne quantitativer Darstellungen sollten auch


die Teile des Wahrnehmungsmodells von Cleveland (1994) erwähnt sein.31 Die-
se gründen nicht auf physiologische Faktoren wie das Modell nach Ware (2004),
sondern auf die Arbeit des Empfängers mit dem Diagramm. Aus der Sicht von
Cleveland existieren als Randbedingungen einmal quantitative und kategorische
Informationen, welche wiederum als physische Information (Name, Jahr, Grö-
ße, Gewicht, etc.) und der skalierten Information32 (Symbol, Ort auf dem Dia-
gramm, Abstand zur Grundlinie, etc.) beschrieben werden können. Das visuelle

30
Vgl. Miller (1956).
31
Vgl. Cleveland (1994), S. 223–227.
32
Man spricht heutzutage auch von der Repräsentation dieser Information
16

Dekodieren besteht nun aus zwei Aktionen: Der Mustererkennung und der Wert-
zuordnung33 , welche wiederum aus Suboperationen bestehen, die in Tabelle 3
aufgelistet sind. Aus Tabelle 3 kann man zusätzlich schließen, dass es dem Autor

Vorgang Teilprozess Beschreibung


Mustererkennung Erfassung Erkennen eines Elements
Zusammensetzen Zusammenfassen ähnlicher
Elemente
Schätzen Unterscheiden, Ordnen,
in Verhältnis setzen
Wertzuordnung Scannen Suche nach Element
Interpolieren Lageschätzung des Elements
Zuordnen Element und Wert zuordnen

Tabelle 3: Vorgänge und Teilprozesse bei der Wahrnehmung von Diagrammen


(Vgl. Cleveland (1994), S. 224–226)

einer Datengrafik obliegt, diese mit dem Gesichtspunkt zu gestalten, die dem Be-
nutzer Arbeit abnimmt. Sollen in einer Abbildung Größen miteinander verglichen
werden, so kann man diese schon ordnen. Will man bestimmte Werte besonders
betonen, kann man dies tun, indem man die Wertzuordnung oder Erkennbar-
keit erleichtert.34 Alle diese Aktionen müssen allerdings auf der Seite des Senders
überlegt und umgesetzt werden um den Effekt beim Empfänger zu maximieren.

3.4 Auflösung und Sehschärfe

Wie auf Seite 13 schon erwähnt wurde ist die Auflösung des Auges im Bereich
der Fovea am höchsten. Dort ist die Dichte ungefähr 180 Rezeptoren pro Grad
Sichtwinkel, was in etwa dem vierfachen der aktuellen Auflösung von Monitoren
entspricht.35

Eine Möglichkeit detaillierte Information aufzunehmen ist es, diese mit der Fo-
vea zu erfassen. Wenn man der Verfasser einer Visualisierung ist, hat man auch
die Möglichkeit die Parafovea zu nutzen, einen Bereich der in etwa 6 Grad im
Durchmesser um die Fovea liegt.36 Bei einer Entfernung von 60 cm entspräche

33
Im Original als Pattern Perception and Table Look-Up bezeichnet. Vgl. Cleveland (1994),
S. 223f
34
Man findet in der englischsprachigen Literatur an mehreren Stellen die Beschreibung von
information that pops out, also Information, die ins Auge springt.
35
Vgl. Ware (2004), S. 62.
36
Vgl. Ware (2004), S. 56.
17

Abbildung 4: Scharfsicht des Auges (aus: Ware (2004), S. 51): Die Scharfsicht
des Auges fällt schnell mit dem Abstand zur Fovea. Sehr gut zu
sehen ist hier auch der blinde Fleck.

das einem Kreis von 6,29cm Durchmesser.37 Jede Grafik, die in einem Buch in
einen solchen Kreis passt kann also in bester Detailaufnahme als eine Einheit
erfasst werden, unter der Annahme, dass man es etwa 60cm vom Kopf entfernt
hält.38 In Abbildung 4 kann man erkennen, wie das Auflösungsvermögen rund um
die Fovea verteilt ist und auch die Lage des blinden Flecks, der bisher unerwähnt
blieb, aber eine Stelle ohne Auflösung darstellt, da hier der Sehnerv gemeinsam
mit den Blutgefäßen ins Auge mündet. Die Stelle des blinden Flecks ist blind, weil
es dort keine Rezeptoren gibt. Allerdings decken sich die blinden Flecken beider
Augen beim Sehen nicht, sodass das Gehirn aus den beiden Bildern wirklich ein
Gesamtbild ohne Lücken erdenken kann.39

Das Auge kann aber nur erfassen, was da ist. Auf der technischen Seite unter-
scheidet man zwischen Dots beziehungsweise Pixeln pro Inch.

dpi: dots per inch Die Fähigkeit der Ausgabe einer bestimmten Anzahl von
Punkten auf ein Medium. Diese Angabe bezieht sich auf Drucker und ähn-
liches.
ppi: pixel per inch Die Angabe welche Anzahl an kleinsten Bildeinheiten in ei-
nem Medium gespeichert oder ausgelesen werden kann. Das bezieht sich auf
Scanner, Monitore und ähnliches.

37
Berechnung des Autors
38
Entfernung eines Buches vom Gesicht (Schätzung des Autors)
39
Vgl. Mayer (2000), S. 34.
18

Auf der technischen Seite bedeutet das im Fall von aktuellen Monitoren eine Auf-
lösung ab 72dpi und zu erwartenden Druckqualitäten ab 600dpi (vgl. Tabelle 4)
Warum existiert eine Auflösung, die weit höher ist, als es eigentlich notwendig

Ausgabegerät Auflösung Beispiel


Monitor 72ppi Usabilityempfehlung
TFT Notebook 96ppi Acer Travelmate 3000
S/W-Laserdrucker 600dpi Brother HL-2030
interpoliert 1200dpi
Fotodrucker 1200dpi HP Deskjet 9800
interpoliert 2400dpi

Tabelle 4: Technische Auflösung ausgewählter Geräte

wäre? Da eine Auflösung von 150 Punkten pro Grad im Auge vorhanden ist,
können die Überauflösungen (bei drucktechnischen Belangen) auf drei Gründe
zurückgeführt werden: Aliasing, Graustufen und die bereits erwähnte unregelmä-
ßige Sehschärfe.40

Aliasing entsteht durch das Umrechnen eines Musters mit einem Neuem ande-
rer Wellenlänge.41 Ein bekanntes Beispiel eines unerwünschten Artefakts sind die
Moirémuster. Das Aliasing kann durch Antialiasing unterbunden werden, indem
man die Durchschnittshelligkeit pro Pixel berechnet und so aus größerer Entfer-
nung ein quasi fehlerfreies Bild entsteht. Da ein normaler Drucker keine echten
Grautöne drucken kann (mit Ausnahme weniger Fotodrucker, die über eine graue
Druckerpatrone verfügen, z.B.:HP Deskjet 9800, also zumindest einen Grauton
ohne Muster erzeugen können), sondern die Grautöne mit schwarzen und wei-
ßen Punkten interpoliert werden, wird eine größere Dichte benötigt um möglichst
viele dieser Graustufen in Form von Mustern zu erzeugen. Das ist ein Grund,
warum Schraffuren als Kennzeichnung von Flächen eher zu unterlassen sind. Ein
anderer ist die Interaktion der Schraffur mit den Begrenzungslinien, die Teil des
schraffierten Objekts sind.

3.5 Muster und Erkennung

Wie wir vorher schon festgestellt haben, findet in Stufe zwei eine erste Verarbei-
tung von Mustern statt. Diese Verarbeitung muss stattfinden um die optischen

40
Vgl. Ware (2004), S. 63–67.
41
Vgl. Ware (2004), S. 64f.
19

Eindrücke zu gruppieren und Objekte zu erfassen. Die zugrunde liegenden Prin-


zipien bezeichnet man als Gestaltgesetze.42 Berücksichtigt man diese Prinzipien,
kann man verschiedene unerwünschte Effekte der Wahrnehmung vermeiden oder
erkennen. Zur Demonstration findet man einfache Beispiele für die Gestaltgesetze
in Abbildung 5.

Abbildung 5: Ausgewählte Gestaltgesetze: (a) Nähe, (b) Ähnlichkeit, (c) Verbun-


denheit, (d) gute Fortsetzung, (e) Geschlossenheit, (f) Figur und
Hintergrund, (g) „1+1=3 oder mehr“

Die Reihung der folgenden Gestaltgesetze ist willkürlich, da sie in der Kombinati-
on die Wirkung ändern können. Das geht bis zum Auslöschen der Wirkung eines
anderen Prinzips.43

(a) Gesetz der Nähe: Dieses Prinzip besagt, dass Elemente, die näher zuein-
ander liegen als Gruppe (oder als zusammengehörig) empfunden werden.
42
Definitionen und Ausführungen in der Folge nach Vgl. Zimbardo/Gerrig (2004), S. 175–178;
Mayer (2000), S. 15, 36–39; Ware (2004), S. 189–201
43
Ware (2004), S. 200f.
20

Nicht nur die kleinen Quadrate der Abbildung formieren Gruppen, auch
die Klammern der Beschriftung bilden Gruppen mit den Buchstaben und
diese wiederum mit den Abbildungen.
(b) Gesetz der Ähnlichkeit: Auch dieses Prinzip dient der Gruppierung, aller-
dings werden ähnliche Elemente gruppiert. Zum Beispiel Elemente der glei-
chen Farbe oder Kontur.
(c) Gesetz der Verbundenheit: Miteinander verbundene Elemente werden als
zueinander gehörend interpretiert.
(d) Gesetz der guten Fortsetzung: Dieses Prinzip hilft sich überlagernde Rei-
ze voneinander zu trennen. So wird die vorliegende Figur als sich zwei kreu-
zende Linien wahrgenommen und nicht als zwei Linien mit einem Knick.
(e) Das Gesetz der Geschlossenheit: Dieses Prinzip heißt oft auch das Gesetz
der guten Gestalt. Beim Sehen hat der Mensch die Tendenz fehlende Teile
zu ergänzen. Dieses Prinzip hilft bei der Trennung von Vorder- und Hinter-
grund. Die rote Fläche wird als Ellipse im Hintergrund wahrgenommen.
(f) Figur und Hintergrund: Eine Figur ist ein Objekt im Vordergrund und
kann vom Hintergrund unterschieden werden. Die Figur im Vordergrund
muss nicht einmal vollkommen abdecken. Die Okklusion des Hintergrunds
wird schon erkannt, wenn das Objekt Transparenz aufweist. Im Falle von
100%iger Transparenz müssen allerdings Kanten und Brechung des trans-
parenten Mediums vorhanden sein, um dieses wahrzunehmen.
(g) Das Prinzip 1 + 1 = 3 oder mehr : Das von Josef Albers geprägte Gesetz
beschreibt die Tatsache, dass zwei Objekte in Kombination bei weitem nicht
nur zwei Objekte sein müssen. Zwei parallele schwarze Linien erzeugen ei-
ne dritte Weiße in Ihrer Mitte. Das bedeutet, dass durch die Interaktionen
zwischen den beiden Objekten unerwünschte Effekte auftreten können, die
allerdings durch das Herabsetzen des Kontrastes zwischen Vorder- und Hin-
tergrund minimiert respektive eliminiert werden können.44
(h) Gesetz des gemeinsamen Schicksals (ohne Abbildung): Elemente, die
eine Eigenschaft teilen werden als zusammengehörig empfunden und zusam-
mengefasst(ohne Abbildung). Dies ist zum Beispiel der Fall, wenn ähnliche
Kurven zu einer Kurvenschar zusammengefasst werden45 .

Die Gestaltgesetze erlauben in Phase 2 die Erkennung von Mustern und die Un-
terscheidung von Vorder- und Hintergrund. Das Verarbeiten erfolgt in der letzten

44
Vgl. Albers (1969), S. 61.
45
Vgl. Schnotz (2002), S. 75.
21

Phase. Es ist festzustellen, dass die hier angeführten Gestaltgesetze keinen An-
spruch auf Vollständigkeit haben. Es wurden die Grundlegendsten für statische
Darstellungen vorgestellt.

Es gilt zu erwähnen, dass es auch Gestaltgesetze für Bewegungen im Gesichtsfeld


gibt. Als Beispiel wurde ein Prinzip ausgewählt, weil in Ihm zu sehen ist warum die
Effekte von Animationen in Diagrammen schwer vorhersehbar sind und eventuell
Größen verschleiern.

Gesetz der großen Bewegung: Große Bewegungen verdrängen oder löschen


kleine Bewegungen aus. Klassisches Beispiel sind magische Tricks, bei denen
die große Bewegung dazu dient die kleineren zu verbergen.46

Animationen von Daten sind diesem Gesetz insofern unterworfen, als die Folgen
von Bewegungen schwer abschätzbar sind und interagieren.

Um die Effizienz zu verbessern existiert zusätzlich die Möglichkeit das reprä-


sentative Korrespondenzprinzip47 nach Chabris und Kosslyn zu nutzen. Es sagt
aus, dass Diagramme Information so darstellen sollen, wie es der mentalen Vor-
stellung entspricht. Es bezieht sich auf Diagramme die von mentalen Prozessen
weiterverarbeitet werden, wie das beispielsweise bei Schachdiagrammen der Fall
ist.48 Man kann das Prinzip als Analogon zum Mapping in der Usability be-
trachten, also dem Abbilden von Gegenständen aus der realen Welt die mit der
Realität korrespondieren. Das ist zum Beispiel der Fall, wenn man das Verstel-
len eines Autositzes über ein kleines Modell des Autositzes zulässt.49 Es gilt noch
festzustellen, dass Ersteller von Diagrammen Konventionen und zielgruppen- und
diagrammrelevante Faktoren nicht außer acht lassen sollen.50 Die Farbe Rot ist
ein schlechter Indikator für Kälte und ein Zuwachs, der nach unten aufgetragen
wird, ist schlecht zu verstehen.

46
Vgl. Tufte (2005b), S. 56.
47
Übersetzung des Autors
48
Vgl. Chabris/Kosslyn (2005), S. 54.
49
Vgl. Norman (1990), S. 23–27.
50
Vgl. Schnotz (2002), S. 80, Chabris/Kosslyn (2005), S. 48–54
22

3.6 Farbe und Schwarzweiß

Wie schon erwähnt besitzt das Auge zwei verschiedene Arten von Rezeptoren:
Stäbchen und Zapfen. Da Stäbchen bei guten Lichtverhältnissen überstimuliert
werden, kann man sie für das Erfassen von Farbe vernachlässigen. Stäbchen sind
in erster Linie für das Sehen bei sehr schlechten Lichtverhältnissen zuständig.
Das Farbsehen hängt nur von den Zapfen ab, welche als α-, β- und γ-Rezeptoren
vorliegen und für das Sehen der Farben Rot, Grün und Blau sorgen.51 Diese drei
Farben erzeugen dann alle anderen Farben.

Laut der modernen Gegenfarbtheorie geschieht dies indem die Reize aller drei
Zapfenarten auf drei verschiedene Arten verarbeitet werden. Wie man in Abbil-
dung 6 sehen kann, wird zum Beispiel der Luminanzkanal52 durch die Summe
aller drei gebildet, wohingegen der Blau-Gelbkanal durch die Differenz zwischen
Blau und der Summe der anderen beiden gebildet wird.53

Abbildung 6: Reizzerlegung im Gegenfarbmodell (aus: Ware (2004), S. 111): Im


Gegenfarbmodell werden die Reize der Zapfen in Schwarz-Weiß-
(Luminanz), Rot-Grün- und Gelb-Blau-Kanäle zerlegt. Dies ge-
schieht durch das Übertragen der Summen beziehungsweise Dif-
ferenzen aus den erfassten Eindrücken.

Die Gegenfarbtheorie ist auch der Grund, warum wir zwar rötliche Gelbtöne ken-
nen, aber niemand je auf die Idee kommen würde ein bläuliches Gelb zu beschrei-
ben. Die Paare liegen sich im Farbraum gegenüber und sind in dieser Kombination
nicht möglich. Die Umkehrung dieser Überlegung führte historisch zur klassischen
Gegenfarbtheorie.54

51
Vgl. Mayer (2000), S. 46.
52
Anm.: Luminanz ist der Ausdruck für Helligkeit.
53
Vgl. Ware (2004), S. 111.
54
Vgl. Ware (2004), S. 110.
23

Auf dem Gebiet der Visualisierungen wird Farbe klassisch zur nominalen Kodie-
rung verwendet. Man benutzt Farbe zum Beispiel um die Zuordnung von Linien
zu Produkten mittels Farben herzustellen. Die zu berücksichtigende Faktoren
sind55

1. Unterscheidbarkeit.
2. einmalige Farbtöne: Der Abstand der Farben zueinander sollte möglichst
groß sein. Rot, Grün, Gelb und Blau sind ein gutes Beispiel. Es ist keine
gute Idee verschiedene Grüntöne zu wählen.
3. Kontrast mit dem Hintergrund: Ein merkbarer Unterschied in der Luminanz
zusätzlich zur Farbe ist zu empfehlen.
4. Farbsehschwäche.56
5. Anzahl.
6. Objektgröße: Objekt nicht zu klein, vor allem wenn der Farbunterschied auf
der Achse Blau-Gelb zu finden ist.
7. Konventionen: Sie stehen oft im Zusammenhang mit kulturellen Dingen.
Als Beispiel bedeutet rot meist heiß.

Es gilt noch festzuhalten, dass sich die Kodierung mit Farbe nicht in jeder Visua-
lisierung für jede Eigenschaft oder Größe eignet. Sind in einer topographischen
Karte die Flächen gleicher Höhe noch farblich kotierbar (als Fläche zwischen den
Höhenschichtlinien) und kann ihnen so ein Wert kodiert werden, ist es in ei-
ner Balkengrafik schwierig eine weitere Dimension durch farbliche Auszeichnung
hinzuzufügen.57 Kelly/Jasperse/Westbrooke (2005) empfehlen den Einsatz von
Farbe für die ersten Entwürfe nicht, da eine Grafik in Schwarz und Weiß in jedem
Medium verwertbar ist.58

Um Farbe zu beschreiben, bedient man sich eines Farbraumes. Es gibt mehre-


re Möglichkeiten Farben technisch zu beschreiben. Das hängt mit dem Gamut59
und mit der Absicht, die hinter der Beschreibung steht, zusammen. Für die Be-

55
Vgl. Ware (2004), S. 123–127.
56
Farbsehschwäche (manchmal auch Farbenblindheit genannt) existiert in zwei Ausprägungen:
Rot-Grün und Blau-Gelb. Man geht davon aus, das etwa 10% der Weltbevölkerung Farb-
sehschwäche besitzen und die Aufteilung zwischen Männern und Frauen im Verhältnis 9 : 1
vorhanden ist.
57
Vgl. Kosslyn (2006), S. 166f.
58
Vgl. Kelly/Jasperse/Westbrooke (2005), S. 12.
59
Der Gamut ist die Bezeichnung für den Umfang des darstellbaren oder empfangbaren Far-
braums. Der Gamut eines Monitors ist anders als der eines Druckers oder auch eines Films.
24

schreibung des Gamuts von Bildschirmen benutzt man die Darstellung in rgb60 .
rgb ist ein additives Farbmodell, bei dem sich die drei Grundfarben zu Weiß
addieren.61
C ≡ rR + gG + bB (1)

In Gleichung 1 entspricht C gleich der Farbe, R, G, und B den verwendeten


Lichtquellen und r, g und b der Menge des Lichtes. Dieses Farbmodell ist für
den Druck nicht funktionstüchtig, hier benutzt man cmyk62 , ein subtraktives
Farbmodell, bei dem Weiß durch weglassen aller Komponenten erzeugt wird.

rgb und cmyk beschreiben jeweils einen relevanten Ausschnitt aus dem Far-
braum, um alle Anteile des sichtbaren Spektrums darzustellen, hat sich ein wei-
teres Modell als sehr praktikabel erwiesen: hsl. Mit Hilfe dieser Beschreibung
kann man auch die drei Aspekte beleuchten, die für die Visualisierung sehr hilf-
reich sind63 :

H(ue): ist der Farbton. Es ist der qualitative Aspekt des Lichts, der von der
Wellenlänge abhängt.
S(aturation): ist die Sättigung der Farbe. Dies kann durch das Hinzufügen von
Weiß verändert werden.
L(ightness): (manchmal auch L(uminance)) ist die Intensität oder Helligkeit
einer Farbe. Sie beschreibt die Menge des Lichts, dass entweder reflektiert
(bei Druck) oder ausgestrahlt (bei Monitoren) wird. Variation dieses Wertes
geschieht durch das Hinzufügen von Grau.

Farbe ist eines der unangenehmsten Themen in Zusammenhang mit Diagram-


men, vor allem weil wenige Personen wissen, dass die Anzahl der verarbeitbaren
Farben Beschränkungen unterliegt. Die sechs Farben, die Personen mit normaler
Farbsicht am besten unterscheiden können sind: rötliches Purpur, Blau, gelbliches
Grau, gelbliches Grün, Rot und bläuliches Grau.64 Darüber hinaus existieren Un-
tersuchungen zu 11 Farben, die nie miteinander verwechselt werden und zu der

60
rgb steht für Rot, Grün und Blau. Diese Farben entsprechen nicht genau den umgangs-
sprachlichen Farben Rot, Grün und Blau.
61
Vgl. Ware (2004), S. 101.
62
cmyk steht für Cyan, Magenta, Gelb sowie Schwarz. K bedeutet eigentlich Key.
63
Vgl. Kosslyn (2006), S. 158 und Ware (2004), S. 104f
64
Vgl. Kosslyn (2006), S. 159.
25

Tatsache, dass der Mensch generell nicht mehr als 9 Farben gleichzeitig folgen
kann.65

Zu den Beschränkungen in der Anzahl der zu verwendenden Farben und der Tat-
sache dass Farbe kein Kontinuum ist kommt, dass die Wahrnehmung des Farb-
tons stark von den umgebenden Farben abhängt, also dem Kontrast.66 Diesen
Effekt gibt es auch bei verschiedenen Grautönen auf Hintergründen unterschied-
licher Helligkeit. Problematisch ist dieser Effekt bei der Kodierung von Regionen
mit Farbverläufen oder Graustufen, wie man diese von Landkarten kennt. Wird
die Legende auf einem weißen Hintergrund gedruckt und das Diagramm ist zum
Großteil schwarz, ergeben sich durch den Unterschied im Kontrast falsche Wert-
zuordnungen.67

3.7 Raum und Sehen

Als Menschen bewegen wir uns in einer dreidimensionalen Welt68 und weil wir
die Welt um uns herum in erster Linie optisch wahrnehmen, ist es wichtig, auch
die Aspekte des räumlichen Sehens zu beleuchten.

Unsere Gehirne und Augen interpretieren alle Wahrnehmungen als räumlich.


Wir nehmen die Welt um uns nicht als Wolken oder Punkte wahr, sondern als
Gegenstände mit Oberflächen und Oberflächeneigenschaften.69

Die Welt erlaubt uns mittels einfacher Hinweise Raum zu erkennen und wahr-
zunehmen, obwohl die Abbildung auf der Netzhaut zweidimensional ist70 . Diese
sind teilweise auf Gewohnheiten zurückzuführen, wie zum Beispiel die Tatsache,
dass wir unbewusst immer annehmen, dass Licht von oben kommt.71 Man kann
dies an Hand von Abbildung 7 leicht nachvollziehen.

65
Eine Zusammenfassung mit ausführlichen Quellenverweisen findet man bei Kosslyn (2006),
S. 159. Die 11 Farben sind Weiß, Grau, Schwarz, Rot, Grün, Gelb, Blau, Pink, Braun, Orange
und Purpur.
66
Vgl. Kosslyn (2006), S. 158
67
Vgl. Ware (2004), S. 72f.
68
de facto sind es vier Dimensionen, da die Zeit — die vierte Dimension — für das räumliche
Sehen keine Relevanz hat, wird Sie hier nicht behandelt.
69
Vgl. Kosslyn (2006), S. 10.
70
Vgl. Mayer (2000), S. 42.
71
Vgl. Ware (2004), S. 245f.
26

Abbildung 7: Kippeffekt — Licht von oben (nachgebildet nach Ware (2004),


S. 146): Licht wird immer als von oben kommend angenommen.
Um den Kippeffekt wahrzunehmen, müssen Sie den Text jetzt auf
den Kopf stellen. Im Normalfall stellt sich dann die Umkehr von
konkav zu konvex ein und umgekehrt.

Die Hinweisreiztheorie teilt diese Hinweise in drei Kategorien, je nachdem, wie


diese reproduziert werden können. Dies ist mit einem statischen Bild (monokular
statisch), einem bewegten Bild (monokular dynamisch) oder nur mit zwei Augen
reproduzierbar.72 Einen Überblick hierzu findet man in Tabelle 5.

Für Diagramme sind in erster Linie die bildhaften Hinweisreize interessant, wel-
che alle verwendet werden können. Es stellt sich für die Anwendung von Tiefe in
Diagrammen, wie in allen anderen Anwendungen, eher die Frage, welchen Hin-
weisreiz man verwenden soll und welche Kategorie. Die Kategorie definiert ob ein
monokular statischer, dynamischer oder ein binokularer Hinweisreiz anzuwenden
ist.

Es bestehen Abhängigkeiten innerhalb der Hinweisreize. Alle Reize hängen von


der Okklusion (auch: Verdeckung) ab. Wie in Abbildung 8 zu erkennen ist, beste-
hen mehrere Abhängigkeiten zwischen den Tiefenreizen. Diese sind durch Pfeile
gekennzeichnet und erlauben Rückschlüsse, welcher Tiefenreiz nur in Verbindung
mit anderen Tiefenreizen funktioniert. So kann kinetische Tiefe nur funktionieren,
wenn die lineare Perspektive richtig abgebildet ist. Natürlich ist es möglich die

72
Vgl. Ware (2004), S. 259f.
27

Monokular statisch (bildhafte)


1 Lineare Perspektive: Das inkludiert offensichtliche Hinweise wie
konvergente Linien.
2 Gradient in der Textur: Die einzelnen Elemente einer Textur werden
mit steigender Entfernung zum Auge immer kleiner. Es entsteht
auch der Eindruck des Zusammenrückens.
3 Gradient der Größe: Objekte mit bekannter Größe spielen hier eine
große Rolle. Der Gradient der Größe bedeutet nichts anderes als ein
kleiner werden der Elemente mit Entfernung zum Betrachter.
4 Okklusion: Ist die Verdeckung von Gegenständen. Verdeckte Ge-
genstände können logisch betrachtet nur hinter dem Verdeckenden
lokalisiert sein.
5 Tiefenschärfe: Weiter entfernte Gegenstände verschwimmen, ver-
blassen beziehungsweise sind weniger scharf konturiert.
6 Schatten: Eine Folge der Dreidimensionalität und der Tatsache,
dass Lichtquellen Punkte im Raum sind.
7 Form durch Schattierung: Eine Folge der Reflexion des Lichtes von
Oberflächen sind auch die Schattierungseffekte, die durch die Streu-
ung hervorgerufen werden.
8 Tiefe durch Akkomodation (ist nicht bildhaft): Das Auge fokussiert
eintreffendes Licht auf der Retina. Diese Eigenschaft wird weniger
dazu verwendet um die Entfernung zu Objekten zu schätzen, als
zur Einschätzung der Größe von Objekten.
Monokular dynamisch (bewegtes Bild)
1 Kinetische Tiefe: Durch Bewegung eines Objekts wird dessen Form
sichtbar. Wenn man den Schatten eines Stückes Draht betrachtet
und den Draht dann dreht, entsteht eine Vorstellung von der Form
des Drahtes.
2 Bewegungsparallaxe: Gegenstände im Hintergrund bewegen sich
langsamer als Gegenstände im Vordergrund.
Binokular
1 Augenkonvergenz: Bei der Fixierung eines Objektes, muss sich die
Stellung der Augen verändern. Damit wird die Entfernung ge-
schätzt. Diese Schätzung ist nur innerhalb von Armeslänge genau.
2 Stereoskopische Tiefe: entsteht durch die Überlappung der Sichtfel-
der der beiden Augen.

Tabelle 5: Hinweisreize auf räumliche Tiefe (Vgl. Ware (2004), S. 260–283,


Mayer (2000), S. 42–46)

kinetische Tiefe ohne korrekte Darstellung der Perspektive darzustellen, nur wird
dies unerwünschte Verzerrungen bei der Rotation nach sich ziehen.73

Die Okklusion ist der wichtigste Hinweisreiz, denn ohne sie können die anderen
Hinweisreize nicht richtig wirken und das Dargestellte ist nicht kohärent. Das
73
Vgl. Ware (2004), S. 283.
28

Vergenz Kinetische Tiefe Stereo

Perspektive Texturgradient Schattierung Schatten

Tiefenschärfe
Verdeckung

Abbildung 8: Hierarchie und Zusammenhänge der Hinweisreize auf Tiefe (Vom


Autor übersetzt und neu gezeichnet nach Ware (2004), S. 283)

bedeutet im Zusammenhang mit Diagrammen, dass der Einsatz von Verdeckung


schon der erste Schritt ist, Tiefe darzustellen. Das lässt auch den Schluss zu,
dass das Gestaltgesetz Figur und Hintergrund eher priorisiert wird, ebenso das
Gestaltgesetz Geschlossenheit, da beide im Zusammenhang mit Okklusion wir-
ken.

Für den Umgang mit Diagrammen ist noch ein Effekt sehr wichtig: Warme Farben
erscheinen näher als kalte, eine Folge der unterschiedlichen Wellenlängen und der
Brechung in der Linse des Auges.74 Das bedeutet in der Folge, dass es zu optischen
Konflikten an den Grenzen zwischen warmen und kalten Farben kommt. Für
zwei sich kreuzende Linien empfiehlt es sich die wärmere Farbe für die Linie im
Vordergrund zu verwenden. Setzt man die Farben umgekehrt ein, drängt sich
die warme Farbe in den Vordergrund wie man in Abbildung 9 sieht und kann
als störend empfunden werden. Generell sind warme Farben im Vordergrund und
kalte für den Hintergrund zu verwenden.

74
Vgl. Kosslyn (2006), S, 11.
29

Abbildung 9: Warme Farben sind näher als Kalte: Es handelt sich hierbei um
ein Folge der unterschiedlichen Brechung unterschiedlicher Wellen-
länge im Auge. Die Brechung ist auch in Regenbögen und Prismen
zu erkennen: Unterschiedliche Ablenkung verschiedener Farben, die
sich in den Wellenlängen unterscheiden.

2,00

1: 1,62

1,00

Abbildung 10: Der Goldene Schnitt im Vergleich zu einem Quadrat und einem
Rechteck mit Seitenverhältnis 1 : 2.

Bei Tufte (2001) finden wir eine zusätzliche Analogie zum Raumempfinden: Die
Proportionen der Grafik sollten eher im Querformat als im Hochformat sein.75
Der Hauptgrund ist die Analogie zum Horizont. Somit ist es eine gute Überlegung
eher die Fläche unter einer Kurve zu schattieren als die Fläche über einer Kurve.
Dies wird von Tufte noch in Kombination mit dem Goldenen Schnitt gesetzt und
endet in der Empfehlung die Grafik solle, wenn möglich, eine Breite aufweisen,
die gegen das Doppelte der Höhe tendiert.76

Der Goldene Schnitt ist eine ästhetische Faustregel für das Teilen einer Linie. Der
kleiner Teil der geteilten Linie soll sich zum Großen verhalten, wie der große Teil
der geteilten Linie zur Gesamtheit, wie in Gleichung 2 formalisiert dargestellt.

a b
= (2)
b a+b
75
Vgl. Tufte (2001), S. 186f.
76
Vgl. Tufte (2001), S. 190.
30

Unter Anwendung der Formel 2 ergibt sich für das Goldene Rechteck ein Seiten-
verhältnis von 1 : 1, 618. Das Goldene Rechteck kann in Abbildung 10 mit einem
Quadrat 1 : 1 und einem Rechteck mit der doppelten Breite der Höhe, also dem
Seitenverhältnis 1 : 2 verglichen werden.77 Es finden sich bei Tufte einige Ab-
bildungen von anderen Formen, denen auch eine besondere Ästhetik nachgesagt
wird, die alle eine horizontale Ausrichtung besitzen sollen.78

Eine Annahme im Zusammenhang mit räumlichen Sehen kann sein, dass die
Räumlichkeit beschränkt. Man kann diese Räumlichkeit aber benutzen und mit
Ebenen arbeiten, so genannten Layers. Durch Layering kann man eine Trennung
(Separation) herbeiführen, die es erlaubt, unwichtige Information in den Hinter-
grund zu schieben und die Daten in den Vordergrund zu holen. Meist geschieht
dies durch Erhöhen der Helligkeit des Hintergrundes und durch die Verwendung
von Grautönen.79

3.8 Wissen und Sehen

In der kognitiven Psychologie wirft sich die Frage auf, wie das Wissen die Wahr-
nehmung beeinflusst. Wahrnehmung wird als direkt bezeichnet, wenn man davon
ausgeht, dass Wissen und Wahrnehmung zwei voneinander unabhängige Systeme
sind und als indirekt (manchmal auch als konstruktivistisch bezeichnet), bei der
Ausgangslage des Einflusses von Wissen auf die Wahrnehmung80 .

In der visuellen Wahrnehmung existieren Beispiele sowohl für direkte als auch für
indirekte Wahrnehmung.

Als Beispiel für die indirekte Wahrnehmung wird immer wieder das Beispiel ge-
bracht, dass wir verdeckte Objekte identifizieren können (siehe auch Abbildung
5) oder schon anhand der Konturen Tiere erkennen (man denke an den Umriss
eines Kamels).

Für die direkte Wahrnehmung werden in der Folge immer die Abbildungen von
unmöglichen Gegenständen angegeben. Man denke an die Bilder von M.C. Escher.
Dort existieren Abbildungen von unmöglichen Treppen, unmöglichen Mühlen und

77
Berechnung des Autors
78
Vgl. Tufte (2001), S. 189.
79
Vgl. Tufte (2005a), 53–65.
80
Vgl. Wilkening (1988), S. 203.
31

ähnlichen Dingen81 . Im Bereich der visuellen Wahrnehmung ist diese Kontroverse


gut nachzuvollziehen.

Es ist nicht unwahrscheinlich, dass diese beiden Arten der Interpretation des
Zusammenhanges zwischen Wissen und Wahrnehmung nebenher existieren und in
einer Wechselwirkung miteinander stehen. Neben den vorher schon ausgeführten
Fakten sollen diese Ansätze auch helfen, Entscheidungen zu treffen, wenn es um
Visualisierungen geht.

3.9 Zusammenfassung

Sehen geschieht unter Beteiligung des Auges und des Gehirns. Die Wahrneh-
mung mit diesem optischen Apparat ist ein dreistufiger Prozess. In der ersten
Phase unterliegt das Sehen vor allem den körperlichen Randbedingungen. In der
zweiten Phase wird das erfasste Bild mittels Mechanismen, die mit den Gestalt-
gesetzen erklärt werden können, weiterverarbeitet und interpretierbar gemacht.
Diese Mechanik erlaubt das Erkennen von Objekten und das Trennen derselben
vom Hintergrund in Phase drei.

Weiters erfolgt in der dritten Stufe des Wahrnehmungsprozesses die Endverarbei-


tung von Information. Je bekannter die Objekte sind — je höher Ihre Entspre-
chung in der wahrgenommenen Welt — umso leichter können die Zusammenhänge
zwischen dem Diagramm und der subjektiven Wirklichkeit hergestellt werden.

Die Bedeutung der Wahrnehmung für Diagramme lässt sich anhand Abbildung
11 sehen. Die Merkfähigkeit für das reine Lesen eines Textes ist am geringsten.
Sehen erhöht die Merkfähigkeit um den Faktor 3 auf 30%. Das Maximum existiert
für das eigene Handeln, was wiederum das Ziel des Wissenstransfers ist.82

Im Zusammenhang mit Diagrammen sind für die einwandfreie Darstellung aber


nicht nur die Gestaltgesetze zu berücksichtigen. Der Detaillierungsgrad wird so-
wohl nach oben als auch nach unten limitiert. Teilweise durch technische Medien,
teilweise durch die Limitierungen unserer Optik.

81
Vgl. Escher/Ernst (1994), S. 321, 323.
82
Vgl. Mayer (2000), S. 133.
32

Selbst Tun ●

Sagen ●

Hören und Sehen ●

Sehen ●

Hören ●

Lesen ●

0 20 40 60 80 100

Merkfähigkeit in %

Abbildung 11: Informationsaufnahme und Merkfähigkeit (neu gezeichnet mit


Daten nach Mayer (2000), S. 133)

Farbe ist ein kritischer Faktor. Die Verarbeitung erfolgt schon in der ersten Stufe
des dargestellten Prozesses und die Faktoren, die zu berücksichtigen sind, vari-
ieren je nach Einsatz. So gibt es zusätzlich zu den optischen Reizen, die Linien
auslösen können, auch Effekte an der Grenze zwischen zwei farbigen Flächen, die
wiederum auf den Umgang des Auges mit Wellenlängen zurückzuführen ist.83

Als besonders wichtig stellt sich das räumliche Sehen heraus. Es ist nicht möglich,
nicht räumlich zu sehen. Räumliches Sehen funktioniert über Hinweisreize, die in
einer Vielzahl in Diagrammen vorkommen, allen voran die Okklusion, die schon
beim Kreuzen zweier Linien auftritt. Räumliches Sehen ist nicht 3D-Sehen! Das
Gehirn schließt auch auf Raum, wenn man mit einem Auge sieht.

83
Vgl. Kosslyn (2006), S. 162: Bekannt ist dies vor allem für Blau und Rot, die, wenn neben-
einander abgebildet, eine erkennbare (manchmal als vibrierend wahrzunehmende) Grenzlinie
erzeugen.
33

4 Diagramme

4.1 Einleitung

Warum verwendet man eigentlich nicht Kennzahlen um die Daten zu beschreiben?


Sie sind genau. Sie können übersichtlich in Tabellen abgebildet werden und sie
besitzen eine Aussage, die alle Daten zusammen fasst.

Alle diese Aussagen sind zutreffend. Betrachten wir aber zunächst die Zahlenwerte
in Tabelle 6. Einige wichtige Kennwerte sind für alle vier Serien von Zahlenpaaren
identisch! Wie unterscheiden sich die Zahlenpaare voneinander?

Wie in Abbildung 12 zu sehen ist, wird durch die grafische Aufarbeitung der Zah-
len aus Tabelle 6 die Verschiedenartigkeit dieser Zahlenreihen sichtbar. Grafische
Aufbereitung enthüllt Zusammenhänge und in letzter Konsequenz die Daten. Die
Grafiken müssen nicht allzu groß sein, um diese Zusammenhänge sichtbar zu ma-
chen. Man erkennt auch in kleinen Abbildungen genug, wenn das Muster nur
eindeutig genug herausgearbeitet wurde. Dieses Beispiel betont die Wichtigkeit

# x1,2,3 y1 y2 y3 x4 y4
1 10,00 8,04 9,14 7,46 8,00 6,58
2 8,00 6,95 8,14 6,77 8,00 5,76
3 13,00 7,58 8,74 12,74 8,00 7,71
4 9,00 8,81 8,77 7,11 8,00 8,84
5 11,00 8,33 9,26 7,81 8,00 8,47
6 14,00 9,96 8,10 8,84 8,00 7,04
7 6,00 7,24 6,13 6,08 8,00 5,25
8 4,00 4,26 3,10 5,39 19,00 12,50
9 12,00 10,84 9,13 8,15 8,00 5,56
10 7,00 4,82 7,26 6,42 8,00 7,91
11 5,00 5,68 4,74 5,73 8,00 6,89
A 9,00 Mittelwert x
B 7,50 Mittelwert y
C 110,00 Summe der quadrierten Abweichungen
D 27,50 Regressionssumme der quadrierten Abweichungen
E 0,82 Korrelationskoeffizient
F 3 + 0, 5 · x Regressionsgerade (kleinste Quadrate)

Tabelle 6: Zahlentabelle mit 4 Serien (aus: Anscombe (1973)): Es gibt Überein-


stimmungen in einigen statistischen Kennzahlen, es lässt sich allerdings
aus den Zahlen schwer ein (respektive vier) Muster ablesen.
34

12

12

10

10

● ● ●
● ● ●
● ●
y1

y2
● ●
8

8

● ●


6

6

● ●

4

4

5 10 15 5 10 15

x1 x2

● ●
12

12
10

10

● ●


y3

y4
8

● ●


● ●

● ●


6

● ●

● ●
4

5 10 15 5 10 15

x3 x4

Abbildung 12: Plots der Werte aus Tabelle 6 (nach Anscombe (1973)): In den
grafischen Darstellungen lässt sich schon sehr viel mehr über die
Wertepaare aussagen und Muster erkennen.

der Visualisierung von Daten im Zusammenhang mit den Daten selbst, auch wenn
die Darstellung ungenauer scheint als die Berechnung. Sowohl die Darstellung als
auch Kennzahlen tragen zum Verständnis der Daten bei.84

Es werden heutzutage Daten gesammelt und es werden Fragen gestellt. Die Daten
selbst sind nicht die Antworten, sondern die Zusammenhänge zwischen den Daten
sind die Antworten. Diese Zusammenhänge können Abhängigkeiten, Muster auf
Mikro- oder Makroebene, Konzepte und ähnliches sein.

Wie man an Hand des Beispieles von Tabelle 6 und Abbildung 12 ableiten kann,
ist es nicht Sache der Daten sich darzustellen, sondern eine Angelegenheit des
84
Anscombe (1973) in Tufte (1974), S. 132f
35

Erstellers von Datengrafiken. Der Ersteller hat die Möglichkeit gewisse Muster
und Eigenarten der Daten durch Bilder zu betonen. Wenn man so will, kann der
Ersteller die Fragen — die mit großer Wahrscheinlichkeit auftauchen werden —
mit Bildern beantworten. Daraus ergibt sich die Bedeutung von Datengrafiken:
Sie sind nicht Beiwerk des Textes, sondern haben eine eigene Aussage. Sie müssten
also in der Folge gleichberechtigt mit den Absätzen erscheinen und sind Absätzen
gleichzusetzen. Wie sich das mit extremen Verkleinerungen verhält, werden wir
später behandeln.

Ist eine Grafik falsch gewählt oder hat sie keine Aussage, kann der Effekt beim
Adressaten negativ sein. Wenn man sich fragt, wieviele Grafiken ein Text oder
eine Präsentation fassen kann, so ist die Antwort wohl der folgende Satz von John
Wilder Tukey.

There needs to be a
GOOD PICTURE
in response to
EVERY
type of question
FREQUENTLY ASKED 85

Ein letzter Blick auf Abbildung 12 zeigt, dass die 4 Grafiken mehr enthüllen,
als die Kennzahlen der Datentabellen. Trotz Ihrer Größe erlauben sie Schlüsse
und Vergleich untereinander. Eventuell hätte ein Ordnen der Tabelle 6 von Seite
33 nach der Größe schon manchen Schluss erlaubt, aber die Grafik erlaubt dies
viel schneller, ohne das Vergleichen von Werten zueinander. Man kann immer
nur eine Spalte sortieren und die übrigen Tabellenfelder sortieren sich dann in
Abhängigkeit von dieser. Andererseits ist diese Praxis problematisch, weil man
alle Varianten durchspielen müsste, um zu wissen, welche man zeigt.

4.2 Daten und Grafik

Der Duden definiert Diagramm in der ersten Form als „zeichnerische Darstellung
von Größenverhältnissen in anschaulicher, leicht überblickbarer Form.“ 86 Die vor-
liegende Arbeit behandelt diese Abbildungen: Diagramme im Sinne quantitativer
85
Tukey (1973), S. 803 Anm. d. Autors: Die Formatierung des Originals wurde genau eingehal-
ten.
86
Wiss. Rat der Dudenredaktion (1990), S. 181.
36

Darstellungen. Das bedeutet, dass die graphische Aufbereitung von Zahlen, also
Datenmaterial im Mittelpunkt steht, wie das der Fall bei statistischen oder kauf-
männischen Grafiken der Fall ist. Bei Kosslyn (1989) finden wir die Unterschei-
dung in Graphs, Charts, Maps und Diagrams 87 und Harris (1999) unterscheidet
die Informationsgrafiken in Charts, Graphs, Tables, Maps und Diagrams 88 . Bei
Wilkinson (2005) finden wir die Sichtweise, dass der Graph eine mathematische
Definition und somit keine Darstellung ist. Die Grafik ist als Repräsentation des
Graphen zu sehen ist und ein Chart ist eine Instanz einer Grafik.89 Dem ist hin-
zuzufügen, dass Wilkinson unter Grafiken auch die Verwendung von Karten und
andere Diagramme sieht, die nicht unbedingt der Kommunikation von Zahlen
dienen.

Bei Tufte (2001) findet sich der Begriff Datengrafik, der eine gute Definition
für Diagramme im Sinne quantitativer Darstellungen darstellt, den wir in der
Folge synonym benutzen werden. Tufte definiert den Begriff der Datengrafiken
wie folgt:

Data graphics visually display the measured quantities by means


of the combined use of points, lines, a coordinate system, numbers,
symbols, words, shading, and color.90

Diese Definition steht nicht in Konkurrenz mit der von Wilkinson und bietet ein
verständlicheres Modell, auch wenn es nur einen Ausschnitt zeigt.

Die Visualisierungen von Daten sind sehr vielfältig. Ein Klassifizierungsversuch


von Lengler/Eppler (2007) bringt den Großteil aller Visualisierungsmethoden in
eine Form, in ein Periodensystem der chemischen Elemente. Wie in Abbildung
13 auf Seite 37 zu sehen ist, fällt der Bereich mit den Datengrafiken in den
Bereich der Datenvisualisierungen. Weiters ist eine Zunahme der Komplexität
von links nach rechts sowie von oben nach unten zu erkennen. Man sollte nicht
außer Acht lassen, dass die Detailtiefe gering ist, da es in dieser Visualisierung um
alle Visualisierungsmethoden geht und nicht um die der quantitativen Elemente.
Trotzdem enthalten sie alle geläufigen Typen von Visualisierung quantitativer
Daten91 .

87
Vgl. Kosslyn (1989), S. 186.
88
Vgl. Harris (1999), S. 4.
89
Vgl. Wilkinson (2005), S. 1f.
90
Tufte (2001), S. 13.
91
Detaillierte Beschreibungen sind auf Seite 52 zu finden.
37

Abbildung 13: Periodensystem der Visualisierungsmethoden (aus: Lengler/


Eppler (2007), S. 6)
38

Unter Datenvisualisierung verstehen Lengler/Eppler (2007) 11 verschiedene For-


men der Visualisierung von Daten92 . Ein interessanter Punkt ist das Erscheinen
des Begriffs Tabelle in diesem Zusammenhang. Schon eine Zahl kann als Daten-
visualisierung verstanden werden: Die Einführung der Null in das Dezimalsystem
erlaubt eine Darstellung einer Zahl, die sich alleine durch das Niederschreiben mit
anderen optisch vergleichen ließ.93 Römische Zahlen können zum Beispiel nicht
durch Ihre optische Länge der Größe nach sortiert werden und erlaubten auch
keine einfache Berechnung. Die Tabelle ist die Erweiterung des Konzepts Zahl
auf Gruppen von Zahlen. Die Hauptfunktion einer Tabelle ist das Abbilden der
Details und zwar im Sinne der Werte, wohingegen die Datengrafik auch Details
darstellt, allerdings benutzt sie diese Details zum Herstellen eines Überblicks von
Zusammenhängen: Veränderungen, Zusammenhänge im Sinne des Wortes, Ver-
läufe, Vergleiche. Man kann in einer Tabelle manche Zusammenhänge und Ver-
gleiche nicht so schnell sehen, wie in einer Datengrafik.94

Wilkinson (2005) vermeidet die Typologien von Charts, wie sie in Abbildung 13
gezeigt werden. Diese Art der Unterteilung vermeide die Perspektive, dass Gra-
fiken als etwas Allgemeines zu verstehen sind und bringt als Beispiel, dass ein
Kreisdiagramm nichts anderes sei als eine geteilte Balkengrafik in Polarkoordina-
ten.95

Der Unterschied zwischen einem Bild und einem Diagramm ist der Abstraktions-
grad. Während das Bild eine Darstellung der Wirklichkeit sein soll, bietet das
Diagramm eine abstrahierte Fassung einer Wirklichkeit, die in manchen Fällen
wieder auf einer mehrfach gefilterten Wahrnehmung beruht, in dem zum Beispiel
Daten von Sensoren gemessen wurden oder Antworten nur im Rahmen eines vor-
gegebenen Rasters möglich waren.

4.3 Skalen und Zahlen

Skalen dienen der Klassifizierung von Messdaten. In der Statistik benutzt man
gerne das folgende hierarchische Modell (beginnend an der Basis):96

92
vgl. Lengler/Eppler (2007), S. 6.
93
Vgl. Rotman (1993), S. 12f.
94
Vgl. Kosslyn (2006), S. 18f.
95
Vgl. Wilkinson (2005), S. 2.
96
Vgl. Ponocny-Seliger/Ponocny (2005), S. 57f.
39

Nominalskala: Die Daten entsprechen Namen. Statistische Kennzahlen, wie et-


wa den Mittelwert zu berechnen, wäre sinnlos.Beispiele: Geschlecht, Schul-
bildung, Farbe, Postleitzahl u.ä.
Ordinalskala: Wird auch als Rangskala bezeichnet und bedeutet, dass die Daten
ordenbar sind und einer gewissen Wertigkeit unterliegen. Beispiele: sportli-
che Rangplätze, Ausbildungsgrad u.ä. Es besteht die Möglichkeit Vergleiche
zwischen den Werten zu ziehen indem man Operatoren wie gleich, ungleich,
größer und kleiner anwendet.
Intervallskala: Die Daten tragen neben den Informationen der Rangskala auch
Informationen zu Differenzen zwischen den Werten. Beispiele: Alter, Zeit,
Temperatur und ähnliches. Zu den Aussagen, die über die Daten der Ordi-
nalskala getroffen werden können, kommt die Aussage über die Gleichheit
von Differenzen: Der Temperaturunterschied von 20◦ und 22◦ ist genauso
groß wie der zwischen 37◦ und 39◦ , nämlich 2◦ .
Rationalskala: Die Messwerte erlauben Aussagen über ihr Verhältnis zueinan-
der, lassen sich also mittels Faktoren zueinander in Relation setzen. Bei-
spiele: Länge, Gewicht, Winkel u.ä.

Die Skalen sind hierarchisch aufgebaut, das bedeutet, dass jede Skala die darun-
ter liegende enthält (in der Auflistung war die Reihenfolge von unten nach oben)
und somit auch Ihre Eigenschaften - aber nicht umgekehrt.97 Jede Intervallskala
ist auch eine Ordinalskala, aber nicht umgekehrt. Nicht jeder Diagrammtyp passt
oder macht Sinn in Verbindung mit jeder Skala, wie man am Beispiel Kreisdia-
gramm und Ordinalskala erkennt.

Der Begriff der Skala kann aber auch die Einteilung der Maßeinheiten auf den
Achsen eines Diagramms bezeichnen, im Sinne eines Maßstabes. Häufig verwendet
werden lineare Skalen, in wissenschaftlichen Arbeiten sehr oft auch logarithmische
Skalen auf der Basis 2 oder 10. Letztere sind für ungeübte Betrachter schwerer zu
lesen, bieten aber den Vorteil vor allem Vergleiche auf Basis von Zweier- und Zeh-
nerpotenzen gut ablesen zu können und die Schiefe98 von Daten zu kurieren.99

97
Vgl. Ponocny-Seliger/Ponocny (2005), S. 58.
98
Schiefe ist im Sinne einer Nicht-Normalverteilung zu sehen und liegt beispielsweise vor, wenn
Daten sich am unteren und oberen Ende eines Spektrums häufen.
99
Vgl. Cleveland (1994), S. 103ff.
40

4.4 Analyse und Kommunikation

Was ist der Beweggrund eine Visualisierung zu verwenden?

Visualisierungen von Zahlen können prinzipiell zwei Dingen dienen. Das sind (1)
die Analyse und (2) die Kommunikation von Daten.100 Beide Prozesse können
als Wissenstransfer verstanden werden. Wobei im Fall der Analyse der Wissen-
stransfer auf einer anderen Ebene stattfindet und der Sender identisch mit dem
Empfänger sein kann, aber nicht notwendigerweise ist. Meist folgt der Analy-
se eine Kommunikation des Ergebnisses. Die Analyse versucht also Muster oder
Konzepte in den Daten darzustellen.

Die Anwendungsgebiete sind vielfältig. Ob es sich um die Analyse privater Da-


tenbestände oder ganzer Staaten handelt oder um eine Grafik in einer Präsenta-
tion, einem Artikel, einem Report oder auf einer Seite im Intra-/Internet. Alles
geschieht mit Mitteln der Statistik. Der Begriff der Statistik wird auf das grie-
chische στ ατ ισ zurückgeführt, welches im lateinischen status wiederzufinden ist
und Zustand bedeutet.101

Die Verwendung von Visualisierungen und speziell von Diagramme ist üblich.
Das war nicht immer so. Erst zwischen den Hälften des 18. und 19. Jahrhundert
kam es zur Verlagerung der Wissenschaft von Worten zu Bildern. Die Graphen,
die wir heute in Verwendung haben, wurden zum Großteil damals das erste Mal
verwendet.102

Die Datenanalyse wird unterteilt in die explorierende und die konfirmierende


Datenanalyse. Durch den Einsatz der Rechenkapazität des Computers kam es zur
Erleichterung der Berechnung und der Vorgang der Visualisierung wurde stark
vereinfacht.103

Heutzutage bietet der Einsatz von Datengrafiken die Möglichkeit komplexe Zu-
sammenhänge und Zustände einfach und schnell zu kommunizieren. Diagramme
tragen dazu bei, die Verständlichkeit eines Textes zu steigern.104 Leider muss man
sagen, dass damit auch die Möglichkeiten diese Zusammenhänge — mit oder ohne
Absicht — falsch darzustellen, vorhanden ist. Das kann auf die Tatsache zurück-
100
Vgl. Cleveland (1994), S. 23.
101
Vgl. Wilkinson (2005), S. 111.
102
Vgl. Wainer (2005), S. 4.
103
Vgl. Tukey (1980), S. 815.
104
Vgl. Chabris/Kosslyn (1995), S. 29.
41

geführt werden, dass die Grafik schon eine Form der Interpretation der Daten
darstellt.

4.5 Elemente und Aufbau

Die Datengrafik besteht, mit wenigen Ausnahmen105 , immer aus denselben Ele-
menten:106

Diagrammfläche: Die Fläche, auf der die Symbole (Punkte, Linien, Boxen, Flä-
chen, etc.) abgebildet werden. In Microsoft Excel wird unter dem Begriff
Diagrammfläche der gesamte Hintergrund der Grafik verstanden. Die Dia-
grammfläche ist aber die Fläche, auf dem der Inhalt des Diagramms abge-
bildet wird.
Achsenfläche: Die Fläche, die von den Achsen eingeschlossen wird. Sie kann,
muss aber nicht größer als die Diagrammfläche sein.
Achsen: Die Achsen sind meist orthogonal107 angeordnet und folgen laut einer
allgemeinen Konvention immer dem Muster: horizontal (oder in x-Richtung)
findet sich die unabhängige Variable und auf der Vertikalen (respektive in
y-Richtung) befindet sich die abhängige Variable (im Sinne von y = f(x)).
Auf den Achsen befinden sich auch kleine Unterteilungen, die so genannten
Tickmarks oder Ticks, die eine Zuordnung der Symbole zu ihren Werten
erlauben.
Achsenbeschriftung: Die Achsenbeschriftung kann Informationen zu den abge-
bildeten Daten enthalten, aber auch in welcher Skalierung diese vorliegen.
Symbol: Die Symbole sind die Elemente, die das eigentlich Diagramm bilden.
Das wären die Punkte, Linien, Flächen und ähnliches.
Datenbeschriftung: Ist die Bezeichnung der abgebildeten Daten (zum Beispiel:
Jahr, Region oder ähnliches)
Legende: Für den Fall, dass für die Datenbeschriftung kein Platz auf der Dia-
grammfläche vorhanden ist, gibt es eine Tabelle mit der Zuordnung der
Symbole zur Datenbeschriftung.
Titel und Beschreibung: Jedes Diagramm sollte einen Titel haben, damit klar
ist, worum es in dieser Abbildung geht. In manchen Fällen empfiehlt es sich
105
Beispielhaft: kreisförmige Diagramme, 3d-Diagramme und ähnliche
106
Vgl. Cleveland (1994), S. 22–25.
107
d.h.: rechtwinklig
42

auch einen Beschreibungstext hinzuzufügen. Als Beispiel sei erwähnt, dass


Cleveland (1994) sein The Elements of Graphing Data so geschrieben hat,
dass man die Quintessenz des Textes in den Bildunterschriften nachlesen
kann.
Referenzlinien und beschreibende Elemente: Elemente auf der Diagrammflä-
che, die eine Zusatzinformation oder einen bekannten Anhaltspunkt mar-
kieren. Als Beispiel sei der Einsatz einer Linie, die die Durchschnittstem-
peratur markiert, oder ein kleiner Pfeil mit dem Text „Seebeben“ auf der
Diagrammfläche, gebracht.

Wilkinson (2005) baut in seinem Grammar of Graphics, ausgehend von einer


objektorientierten Überlegung, die ein Chart als eine Instanz einer Grafik sieht,
alle Charts aus 6 Spezifikationen108 :

Data: Eine Menge von Operationen, die aus den Rohdaten Variable erstellt.
Trans: Transformationen der Variablen (z.B.: Rangordnung)
Scale: Skalentransformationen (z.B.: Logarithmen)
Coord: ein Koordinatensystem.
Element: der tatsächliche Graph (im Sinne von Punkten) und seine ästhetischen
Attribute (z.B.: Farbe).
Guide: Beschreibt die Führungselemente (z.B.: Achsen, Legenden, etc.)

Auf Basis dieser Objekte sind alle Arten von Datengrafiken zu definieren und
aus der entstehenden Definition auch zu produzieren. Es handelt sich hierbei
aber nicht um eine Programmiersprache oder eine Heuristik, sondern um eine
Grammatik109 , die wiederum aus Syntax110 und Semantik111 besteht:

Grammatik gibt Sprache Regeln. Grafiken werden durch eine Spra-


che erzeugt. Die Syntax von Grafiken liegt in deren Spezifikationen.
Die Semantik der Grafik liegt in Ihren Daten.112

108
Vgl. Wilkinson (2005), S. 6f.
109
„Einer Sprache zugrunde liegendes Regelsystem.“(Wiss. Rat der Dudenredaktion (1990),
S. 288)
110
Regeln die die Kombination von Worten und Sätzen darstellen.Vgl. Wilkinson (2005), S. 21
111
Regelt die Bedeutung sprachlicher Zeichen und Zeichenfolgen. Sie ist im Zusammenhang mit
Grafik als das den Daten zugrunde liegende Konzept zu verstehen.(Vgl. Wilkinson (2005),
S. 357)
112
Übersetzung durch den Autor von Wilkinson (2005), S. 634.
43

Das bedeutet in weiterer Folge, dass die Daten ein fixer Bestandteil der Grafiken
sind. Die Semantik der Daten beeinflusst maßgeblich das Aussehen der Grafik.

Schnotz (2002) empfiehlt für das mühelose Verstehen von Diagrammen die Iden-
tifizierbarkeit repräsentationsrelevanter Werte einerseits und andererseits sollten
Anstrengungen unternommen werden diese in der richtigen Konfiguration abzu-
bilden.113 Ein Weglassen mancher Diagrammelemente kann schwerwiegende Fol-
gen für die Lesbarkeit haben. Im schlimmsten Fall sinkt die Aussage gegen Null
und die Datengrafik erfüllt keine Funktion.

Es gibt allerdings keinen detaillierten Prozess, der Diagramme definiert, abge-


sehen von der Tatsache, dass die Diagrammerstellung wie folgt grob skizziert
werden kann: [Quelle] → [Diagramm erstellen] → [Renderer].114 Der Renderer
(manchmal auch: Rendering Engine) ist ein Programm respektive Programmteil,
der Daten interpretiert und wiedergibt.

4.6 Weber, Fechner und der Sinneseindruck

Mitte des 19. Jahrhunderts zeigte Ernst Heinrich Weber in Versuchen, dass Ge-
wicht um einen bestimmten Faktor verändert werden muss, damit man die Än-
derung wahrnimmt. Gustav Theodor Fechner gelang es 1860 diesen Fakt in einer
Formel niederzuschreiben, dem so genannten Weberschen Gesetz (Gl. 3)115 .

∆R
=k (3)
R

Hier entspricht ∆R dem für die Wahrnehmung notwendige Reizunterschied, R


dem Reiz und k der Weberschen Konstante. Diese kann verschiedene Werte an-
nehmen, je nach Art des Reizes (Helligkeit, Lautstärke, usw.). Fechner hat spä-
ter auch noch den Zusammenhang zwischen den Intensitäten von Reiz (R) und
Empfindung (E) mittels des Fechnerschen Gesetzes (Gl. 4) hergestellt116 . Durch
formale Integration gelangt man dann zum Weber-Fechnerschen Gesetz (Gl. 5).

∆R
∆E = c · (4)
R

113
Vgl. Schnotz (2002), S. 76.
114
Vgl. Wilkinson (2005), S. 23.
115
Vgl. Mayer (2000), S. 10, Cleveland (1994), S. 240
116
Vgl. Mayer (2000), S. 10f.
44

R
E = c · ln (5)
R0
Das Gesetz besagt, dass der Reiz geometrisch zunehmen muss um die Empfindung
linear anwachsen zu lassen, dass also immer mehr Reiz aufgebracht werden muss
um die Steigerung der Empfindung konstant zu halten. R0 bezeichnet in Gleichung
5 den so genannten Schwellenreiz.

Das Webersche Gesetz wird von Cleveland (1994) aufs Tapet gebracht um ei-
ne relativ umstrittene Praxis zu unterstützen: Den Raster.117 Der Raster ist das
Gitter auf der Diagrammfläche und erlaubt die Konvertierung von kleinen Stei-
gerungen in größere indem er exaktere Vergleiche ermöglicht. Allerdings setzt
Cleveland den Raster ein um Kurven innerhalb von gestapelten Diagrammen zu
vergleichen. Tufte (2001) empfiehlt den Raster weitestgehend wegzulassen oder
zumindest in eine andere Ebene zu verlegen, sodass die Präsenz nur noch impli-
ziert wird.118 Man findet bei Cleveland (1994) nur Raster, die bedingt verwendet
werden können, um Daten abzulesen. Seine Raster sind meist eine Variante um
die Zeichenfläche in gleichgroße Rechtecke oder Quadrate zu teilen, kein Raster,
wie man es zum Beispiel aus Microsoft Excel kennt, die der Beschriftungslogik
der Achsen folgen. Raster können also mehrere Funktionen haben und/oder un-
terstützen: Der (1) Vergleich und genaues Ablesen wird erleichtert und die (2)
Zuordnung wird verbessert.

Tufte (2001) führt gegen den Raster119 das Prinzip der Data-Ink Ratio (Gl. 6)
ein.120 Es sagt aus, dass versucht werden soll, den Anteil der nicht notwendigen
Elemente aus der Grafik zu tilgen.

Data-Ink
Data-Ink Ratio = (6)
total ink used to print the graph

Ziel jeder Visualisierung sei es möglichst viel Chartjunk 121 , wie etwa uninforma-
tive Dekoration, Schraffuren, redundante Information und ähnliches weglassens-
werte, nicht zu zeigen. Der Maximalwert von 1 ist erreichbar, indem man alle
Elemente entfernt, die nicht zur Darstellung der Daten dienen. Wie genau das
definiert ist, kann man bei Tufte (2001) nicht nachlesen. Der Raster kann aber so

117
Vgl. Cleveland (1994), S. 242.
118
Vgl. Tufte (2001), S. 112.
119
Der Raster dient hier als erste Erklärung für sein Prinzip, es richtet sich aber gegen viel mehr.
120
Vgl. Tufte (2001), S. 93f.
121
Vgl. Tufte (2001), S.107–121: Chartjunk bezeichnet die unnötigen Elemente in einer Gra-
fik. Auf http://www.juiceanalytics.com/weblog/?p=161 (online abgerufen 01.04.2007) findet
man ein Excelmakropaket, das hilft, die Excelgrafiken nach den Vorstellungen von Tufte zu
reinigen.
45

gestaltet werden, dass er den Daten „nicht im Weg steht“. Was nicht erwünscht
ist, ist ein Raster von der Feinheit von Millimeterpapier, auf dem man kaum die
Daten von den einzelnen Linien des Rasters unterscheiden kann.

Die Data-Ink-Ratio ist allerdings auch kritisch zusehen. So ist Kosslyn (2006)
der Meinung, dass man damit auch zu weit gehen kann, indem man — wie
Tufte (2001) es getan hat122 — dem Balkendiagramm die Balken nimmt.123 Der
Zusatz, den Tufte (2001) seinen drei Ratschlägen zur Data-Ink-Ratio gegeben hat,
sei also wörtlich genommen: Das Prinzip ist innerhalb der Grenzen der Vernunft
zu benutzen, besonders der dritte Ratschlag.

Maximize the data-ink ratio, within reason.


Erase non-data-ink, within reason.
Erase redundant data-ink, within reason.124

Das Webersche Gesetz bedeutet aber auch für den Ersteller einer Datengrafik,
dass er Unterschiede so weit als möglich herausarbeiten sollte. Es ist somit ein
Argument für die Praxis, die Achsen einer Grafik nicht bei Null beginnen zu las-
sen, wenn die Darstellung sonst nachteilig ist125 . Leider kann man diese Handlung
auch verwenden um die Tatsachen zu übertreiben, zu verfälschen oder einfach ge-
sagt: um zu lügen.126

Der Unterschied zwischen dem tatsächlichen Reiz und dem empfundenen Reiz
findet man oftmals auch in die Praxis umgesetzt: In geographischen Karten ver-
wendet man manchmal Kreise, deren Größe an die empfundene Größe angepasst
sind, weil die Flächen nach der Reizempfindung interpretiert werden.127 Es kommt
auch zu Fehleinschätzung von Winkeln und in weiterer Folge von Steigungen.128

Im anglikanischen Raum ist als Konkurrenz zu Weber und Fechner noch das
Stevenssche Potenzgesetz (Gl. 7) weit verbreitet.

ψ = k(φ − φ0 )n (7)

122
Vgl. Tufte (2001), S. 100–102.
123
Vgl. Kosslyn (2006), S. 126f.
124
Tufte (2001), S. 96 und 100:Hervorhebung im Fettdruck durch den Verfasser der Arbeit.
125
Vgl. Kelly/Jasperse/Westbrooke (2005), S. 12.
126
Vgl. Krämer (2007), S. 37–50.
127
Vgl. Harris (1999), S. 381.
128
Vgl. Cleveland (1994), S. 66–79.
46

Wobei in dieser Gleichung ψ die psychologische Wahrnehmung beschreibt, φ gleich


dem physikalischen Reiz, φ0 gleich der Wahrnehmungsschwelle, k ein messabhän-
giger Faktor und der Exponent n als die Größe, die vom gemessenen Reiz abhängt.
n variiert zwischen 0,33 für Helligkeit bis 3,5 für an den Fingerspitzen empfun-
dene Stromstärke.129 Für die Empfindung von Länge ist der Wert im Intervall
[0,9;1,1], für Fläche [0,6;0,9] und beim Volumen [0,5;0,8].130 Für das Empfinden
von Volumen bedeutet dies, dass wir Volumen als zu klein empfinden, da n < 1
wird auch (φ − φ0 )n < 1.

4.7 Fehler und Wahrnehmung

Ein geflügeltes Wort sagt: „Glaube keiner Statistik, die Du nicht selbst gefälscht
hast.“ Dieses Sprichwort wird sehr oft auch in Zusammenhang mit statistischen
Grafiken gebraucht. Aber nicht alle Fehlabbildungen sind gewollte Lügen. Der
Großteil ist entstanden, weil ein guter Effekt gesucht wurde oder weil der Glaube
existiert, dass man schlecht ausgewählte Zahlen durch graphische Effekte verbes-
sern kann oder weil falsche Überlegungen zu Stichproben vorhanden sind.131

size of effect shown in graphic


Lie Factor = (8)
size of effect in data

Bei Tufte (2001) finden wir den Lügenfaktor (Gl. 8), der das Verhältnis eines
Effekts in der Grafik als Vielfaches desselben Effekts in den Daten beschreibt132 .
Das bedeutet, wenn man eine Steigerung um 200% in den Daten abliest und 500%
500%
darstellt, das einen Lügenfaktor von 200% = 2, 5 ergibt.

Fehlabbildungen, die solche Effekte beinhalten, bedienen sich oft der 3-Dimension-
alität, Perspektive oder einem Fehlgriff in der Variation der Dimension. Nehmen
wir zur Erklärung der letzten Annahme an, man stellt den Wert eines Euro zum
Zeitpunkt der Einführung des Euro mit einem Zuckerwürfel dar und behauptet,
dass er nach x Jahren halb so viel Wert besitzt. Der Effekt in den Daten ist
50%. Dann beschliesst man die Seitenlänge des Würfels zu halbieren, man stellt
aber den Würfel dreidimensional mit seinem Volumen dar, sodass der abgebildete
Effekt 12,5% (entspricht 50%3 ) darstellt. Der Lügenfaktor beträgt 12,5%
50%
= 0, 25.
Man stellt also nur ein Viertel von dem dar, was dargestellt werden sollte. Die

129
Vgl. Stevens (1961), S. 31f.
130
Vgl. Robbins (2005), S. 51.
131
Vgl. Krämer (2007), S. 97–119.
132
Vgl. Tufte (2001), S. 57.
47

richtige Seitenlänge wäre, wenn man unbedingt über das Volumen darstellen woll-

te, 3 0, 5 = 0, 79. Es gilt allerdings immer die Empfehlung keine Dimensionen zu
benutzen, die man nicht benötigt, auch weil das Vergleichen von Werten psycho-
physischen Effekten und einer Geschwindigkeitseinbusse beim Lesen unterworfen
ist.133

In Tabelle 7 findet man eine Hierarchie von Unterscheidungsmöglichkeiten, die


dem Benutzer einer Grafik das Unterscheiden von Proportionen ermöglichen. Sie
kann verwendet werden um die Effektivität beim Ablesen und Vergleichen von
Werten zu bewerten. Hier finden wir das Volumen aus unserem vorherigen Bei-
spiel erst an sechster Stelle. Es existieren aber auch Untersuchungen, dass bei
komplexen Vergleichen diese Hierarchie nicht anwendbar ist um die Performanz
zu erklären.134 Man findet in dieser Aufstellung die Fläche schon an fünfter Stel-
le. Cleveland (1993) bezeichnet Fläche als schlechte Darstellung um Größen zu
vergleichen, weil Effekte, die in anderen Kodierungen schon vorhanden sind leicht
wieder verloren gehen.135

Nr. Merkmal
1 Anordnung an gemeinsamer Achse bzw. Skala
2 Anordnung an identischer, nicht-ausgerichteter Achse
3 Länge
4 Winkel
Steigung
5 Fläche
6 Volumen
Dichte
Farbsättigung
7 Farbton

Tabelle 7: Hierarchie der Eigenschaften für die Wertdarstellung, sortiert nach


Fehlerquote (Vgl. Cleveland (1994), S. 220)

Grafischen Fehlinterpretationen findet man aber nicht nur in den Tagesmedien


oder in Fachzeitschriften, sie sind auch in Jahresberichten zu finden.136 Es gilt also
immer die Datengrafiken auch Korrektur zu lesen, nicht nur den Text. Oft kann
eine Fehlabbildung darauf zurückgeführt werden, dass Nichtexperten einfach und
schnell Visualisierungen erstellen können und die Fehler, die sie begehen gar nicht

133
Vgl. Wilkinson (1994), S. 172, Spence (2004), S. 746 und Tufte (2001), S. 77
134
Vgl. Hollands/Spence (2001), S. 429f.
135
Vgl. Cleveland (1993), S. 142.
136
Vgl. Beattie/Jones (1992), S. 291.
48

wahrnehmen.137 Es entstehen keine Fehlabbildungen durch die falsche Wahl des


Datenmaterials.

Die Auswahl der Daten steht am Anfang und dann kommt die Wahl der Methode
um diese Daten auch darzustellen. Und schliesslich gilt: „If the statistics is boring,
you’ve got the wrong numbers.“ 138

4.8 Diagramme und 3d

Durch die Verbreitung der rechnergestützten Datenverarbeitung und in der Folge


der Steigerung der Leistung der Computer wurde es immer einfacher schnell und
einfach Grafiken aus Daten zu generieren. Heutzutage wird es auch immer ein-
facher dreidimensionale Grafiken zu generieren, die entweder axonometrisch oder
perspektivisch berechnet und mit Effekten wie Tiefenunschärfe versehen werden
können. Mit dem Einsatz der Hinweisreize zu Tiefe139 beginnen wir aber dreidi-
mensional zu sehen.

Abbildung 14: Tortendiagramm in 3d (Vgl. Robbins (2005), S. 18–23)

Das bedeutet in der Folge: Das Koordinatensystem muss geändert werden, Ab-
lesehilfen für die z-Achse müssen geschaffen werden (zum Beispiel Raster als
Wände) und die Daten müssen eventuell anders sortiert werden, um sich nicht
gegenseitig zu verdecken. Speziell im Zusammenhang mit Kreis- oder Tortendia-
grammen kann es hier zu extremen Verzerrungen kommen.
137
Vgl. Rogowitz/Treinish (1995).
138
Tufte (2001), S. 80.
139
Vgl. Kapitel 3.7 und die Ausführungen zum Thema
49

Nehmen Sie Zettel und Bleistift und versuchen Sie die Anteile der vier Sektoren
in Abbildung 14 zu schätzen. Eine Auflösung der Werte finden Sie auf Seite 55
(die obere Zeile der Diagramme), wo Sie auch eine ebene Darstellung desselben
Tortendiagramms finden.

Speziell die optische Vergrößerung der Vorderseite durch die„Lippe“, die durch die
Höhe des gekippten Kreises entsteht, verursacht eine Fehleinschätzung der Fläche
des Bereiches im Vordergrund. Das Schätzen der Anteile, also der Winkel auf einer
gekippten Fläche ist eine schwierige Aufgabe. Wenn man die Winkel beiseite lässt
und zu dreidimensionalen Balken- und Säulendiagrammen übergeht, die zumeist
ein Koordinatensystem aufweisen, muss man sich damit beschäftigen, wo man den
Wert ablesen soll, der zu einer Säule oder Balken gehört und unterliegt zusätzlich
noch perspektivischen Verzerrungen.140

140
Vgl. Robbins (2005), S. 23–31, Harris (1999), S. 38, Kosslyn (2006), S. 209f und Tufte (2001),
S. 67f
50

5 Diagrammtypen

Alle Diagrammtypen sind verschieden. Jede hat Ihre Eigenheiten und zum Groß-
teil existieren unzählige Varianten. Zu manchen entstanden in der neueren Zeit
auch Alternativen. Die Diagrammtypen, die heute in Verwendung sind, wurden
— was den täglichen Bürobedarf betrifft — fast alle von William Playfair er-
funden respektive das erste Mal verwendet.141 Bis zum Erscheinen seines The
Commercial and Political Atlas im Jahre 1801 war es unüblich Grafiken zum
Darstellen von Sachverhalten zu benutzen, geschweige denn diese zu benutzen,
um die eigenen Argumente zu untermauern. Es existieren zwar viele Beispiele
für Visualisierungen vor Playfair, allerdings beginnt mit seinem Werk langsam
die moderne Datengrafik. Er bereitete den Boden für das goldene Zeitalter der
Datengrafik.142

Die folgende Aufzählungen der grafischen Möglichkeiten im Zusammenhang mit


Daten erhebt keinen Anspruch auf Vollständigkeit.143

5.1 Pop Charts und andere Klassiker

Als Pop Charts bezeichnet Cleveland (1994) die drei am häufigsten verwendeten
Arten der Visualisierung: (1) Kreisdiagramme, (2) geteilte Balkendiagramme und
(3) Flächendiagramme. Pop steht hier für populär, weil diese Diagramme immer
wieder in Zeitungen und anderen Breitenmedien zu finden sind. Diese Diagram-
me sind in der Literatur zur Genüge untersucht und reflektiert.144 Sie werden in
die spätere Analyse eingehen, allerdings werden wir diese hier nicht näher behan-
deln.

Einen ähnlichen Status wie die oben angeführten Popcharts haben die Linien-
diagramme. Die Liniendiagramme sind für das tägliche Geschäftsleben ebenso

141
Vgl. Wainer (2005), S. 15f.
142
Vgl. Friendly (2007), S. 13ff.
143
Was in diesem kleinen Rahmen auch nicht möglich wäre. Zum Vergleich: Die Referenz von
Harris (1999) umfasst knapp 400 Seiten und es fehlen viele wichtige neuere Formen, wie zum
Beispiel Dotplot, Trellisdiagramm oder die Sparklines.
144
Vgl. Cleveland (1994), s. 262–269, Harris (1999), S. 281–286, S. 27–52, S. 9–21,Robbins (2005),
S. 13–34, Kosslyn (2006), S. 111–134
51

Abbildung 15: Schemata klassischer Diagrammtypen: (1)Kreisdiagramm, (2)Lini-


endiagramm, (3)Balkendiagramm, (4)Histogramm, (5)Flächendia-
gramm, (6)Streudiagramm, (7)Tukey Boxplot, (8)Spektrogramm
52

wichtig wie Balkendiagramme145 . Auch diese werden in die Analyse mit einge-
hen, aber nicht näher behandelt.

Man findet die oberhalb im Text angeführten Diagrammtypen neben Neueren


auch im Periodensystem der Visualisierungsmethoden (in Abbildung 13 auf Seite
37). Lengler/Eppler (2007) definieren in Ihrem Periodensystem die folgenden Ty-
pen von Datengrafiken — und sie finden kleine Ansichten der Typen in Abbildung
15—, welche man verallgemeinert als klassische Formen beschreiben kann:

Kreisdiagramm (Abb. 15.1): Mit dem Kreis- oder Tortendiagramm werden


klassischerweise Anteile an einer Gesamtheit dargestellt. Die Methode hat
Limitierungen, die auf die Kombination von Winkel und Fläche zurückzu-
führen sind und in der Anzahl der darstellbaren Sektoren. Dies ist vor allem
abhängig auch von der Lage der Daten zueinander. Alles in allem kann man
die Kreisdiagramme als gestapelte Balkendiagramme mit Polarkoordinaten
sehen. Ersatz findet man in Form der Tabelle und im Dotplot (dazu später).
Liniendiagramm (Abb. 15.2): Das Liniendiagramm zeigt Verläufe. Dies führt
von chronologischen Abfolgen bis zu Häufigkeitskurven.146 Aus Vergleichs-
gründen werden oft mehrere Liniendiagramme in einen Chart gepackt be-
ziehungsweise es wird ein Liniendiagramm zu anderen Diagrammen hinzu-
gefügt, um einen annähernden Verlauf aufzuzeigen.
Balkendiagramm (Abb. 15.3): Auch das Balkendiagramm (respektive Säu-
lendiagramm, je nach Ausrichtung) dient dem Aufzeigen von Verläufen und
Zuständen. Allerdings ist hier die Darstellung gewisser Punkte in Zeit und
Raum im Vordergrund. Die wichtigsten Varianten sind die gestapelten und
die nebeneinander gestellten Balkendiagramme.147
Histogramm (Abb. 15.4): Das Histogramm ist eine spezielle Form des Balken-
diagramms, bei dem sich alle Balken berühren und diese gruppierte Werte
wiedergeben. In letzter Zeit wird anstatt beziehungsweise zusätzlich zum
Histogramm oft ein Kerndichteschätzer gestellt. Dieser ist eine geschätz-
te Häufigkeitskurve der Werte und somit eine Art stetiges Histogramm.
Die einfachste Form des Histogramm ist das so genannte „Stem-and-leaf-
diagramm“, dass ganz ohne grafische Elemente auskommt (näheres dazu
später).
145
Bezeichnend für die Tatsache, dass die Liniengrafik an Bedeutung gewinnt ist sicher auch
die Popularisierung des Finanzmarktes. Man findet bei Kosslyn (2006) zwar ein Kapitel zu
Liniengrafiken, Flächendiagramme sind dort eher eine Spielart der Liniendiagramme — Flä-
chendiagramme im Sinne von Blasendiagrammen erscheinen dort nicht explizit.
146
Besondere Erwähnung hat hier die Glockenkurve der Normalverteilung verdient.
147
Manchmal auch Juxtaposition genannt.
53

Flächendiagramm (Abb. 15.5): Das Flächendiagramm stellt die Werte mit-


tels der Fläche dar. Dies reicht vom einfachen Flächendiagramm (Fläche
zwischen zwei Linien respektive Linien und Achse) bis hin zu Blasendia-
grammen (welches hier abgebildet ist), dass eine dritte Variable mittels der
Blasengröße darstellt.
Streudiagramm (Abb. 15.6): Das Streudiagramm ist ein sehr vielseitiges Dia-
gramm, bei dem jeder Punkt den Zusammenhang zwischen zwei Werten
darstellt und als Gesamtheit die Korrelation zwischen zwei Variablen. Sehr
oft findet man hier Linien, die ein approximiertes Modell der Beziehung
darstellen sollen (im vorliegenden Fall mit der Methode der kleinsten Qua-
drate). Das Streudiagramm unterliegt nicht den Beschränkungen in den
Datenmengen, denen die vorher erklärten Diagramme unterliegen.
Tukey Boxplot (Abb. 15.7): Der Tukey Boxplot bildet mit jeder box die Ver-
teilung innerhalb einer Datenreihe ab, in dem er eine Reihe von statistischen
Lagemaßen abbildet:Die Lagemaße Minimum, Median und Maximum, sowie
die Streuungsmaße erstes und drittes Quartil. In manchen Versionen findet
man zusätzlich auch noch den Mittelwert und Ausreißer.148 sreißer.149
Spektrogramm (Abb. 15.8): Das Spektrogramm ist der Versuch 3 Variablen
innerhalb eines Diagramms abzubilden, indem man mit Farbe den z-Wert
abbildet. Der z-Wert entspräche einer dritten und abhängigen Dimension,
die bei Spektrogrammen mittels Farbe abgebildet werden. Ursprünglich ist
das Spektrogramm ein Diagramm aus der Akustik mit der Abbildung von
Zeit, Frequenz und Amplitude (Farbe). Andere Formen dieser Type von
Darstellung sind verschiedene Formen von Landkarten (Höhenschichtlini-
en!) und Konturplots.

Im Periodensystem der Visualisierungsmethoden sind die ersten Einträge zwar


Datenvisualisierungen, nur sind diese nach näherer Betrachtung als Grundlage
für die anderen zu betrachten:

148
Vgl. Ponocny-Seliger/Ponocny (2005), S. 1–4: Der Median ist der mittlere Wert einer Reihe,
als der Wert, der sich nach dem wertmäßigen Ordnen einer Reihe, in der Mitte befindet. Das
1.Quartil bezeichnet den Wert, unter dem 25% der anderen Werte liegen, das 3.Quartil ist
entsprechend mit 75% definiert. Man kann den Median auch als 2.Quartil bezeichnen.
149
Vgl. Ponocny-Seliger/Ponocny (2005), S. 1–4: Der Median ist der mittlere Wert einer Reihe,
als der Wert, der sich nach dem wertmäßigen Ordnen einer Reihe, in der Mitte befindet. Das
1.Quartil bezeichnet den Wert, unter dem 25% der anderen Werte liegen, das 3.Quartil ist
entsprechend mit 75% definiert. Man kann den Median auch als 2.Quartil bezeichnen.
54

Kontinuum: Das Kontinuum ist der Zusammenhang zwischen zwei Gebilden.


Vom Standpunkt der Visualisierung ist der lückenlose Zusammenschluss von
Punkten als Kontinuum zu sehen: Gerade, Kreis, usw.
Tabelle: Die Tabelle ist eine Matrix aus Elementen, die im zweidimensionalen
Fall aus Zeilen und Spalten gebildet wird.150 Die Elemente der Matrix bilden
die Werte, die in einer Tabelle aus Zwecken der Übersicht verzeichnet wer-
den. Es existieren Tabellen unterschiedlicher Dimensionalität. Eindimen-
sionale Tabellen (vom Typ 1 : m oder m : 1) entsprechen Aufzählungen,
zweidimensionale Tabellen (vom Typ m : n) den Tabellen des täglichen
Sprachgebrauchs mit Zeilen und Spalten und mehrdimensionale Tabellen,
die noch weitere Dimensionen erfassen können, allerdings immer nur Aus-
schnittsweise zweidimensional sinnvoll zu repräsentieren sind.
kartesische Koordinaten: Das Koordinatensystem Σ eines affinen Raumes be-
steht im wesentlichen aus einem Ursprung 0 und n linear unabhängigen Vek-
toren x1 , . . . , xn die einen Vektorraum Vn aufspannen. Bildet x1 , . . . , xn eine
orthonormale Basis151 so spricht man von einem kartesischen Koordinaten-
system.152 Im Falle der im täglichen Gebrauch befindlichen Koordinatensys-
teme bedeutet dies zwei Achsen, die im Winkel von 90◦ zueinander stehen
und eine Fläche aufspannen, auf der Punkte oder Punktmengen (Linien,
Kurven, etc.) durch Referenzierung auf das Koordinatensystem dargestellt
werden können.

5.2 Neuere Formen der Darstellung

Die Geschichte der Visualisierungen in den letzten 50 Jahren ist vor allem geprägt
durch die Einführung computergestützter Berechnungen und Visualisierungen.153
Genau genommen zählt der Boxplot des letzten Abschnitts auch zu diesen Neue-
rungen, allerdings ist er gerade in der Statistik als robuste Darstellung von La-
gemaßen von solcher Bedeutung, dass er sich relativ schnell etabliert hat. In den
letzten Jahrzehnten des 20.Jahrhunderts kamen vor allem interaktive Techniken
der explorativen Datenanalyse hinzu.154 Nicht alle neuen Methoden sind für die

150
Vgl. Grosche/Ziegler/Ziegler (1991), S. 148.
151
Anm. des Autors: Stehen die Vektoren rechtwinklig normal aufeinander.
152
Vgl. Grosche/Ziegler/Ziegler (1991), S. 210.
153
Vgl. Friendly (2007), S. 31.
154
Wie etwa die Folgenden: Lensing, Focusing, Brushing und Slicing. Details und mehr bei
Wilkinson (2005), S. 552–577
55

breite Anwendung verwendbar155 , aber manche bieten gerade im modernen Um-


feld Möglichkeiten Daten verbessert darzustellen. Die folgende Auswahl betrifft
Visualisierungstechniken, die Verbesserungen brachten, indem Sie gewisse Nach-
teile klassischer Methoden durch Vorteile ersetzen und die vor allem für klassische
Büroaufgaben tauglich sind: Für das Reporting, webbasierte Anwendungen und
multivariate156 Daten.

5.3 Dotplot

A
D ●

C ●

B
B ●

D
A ●
C

0 20 40 60 80 100

A
D ●

C ●

B
B ●

D
A ●
C

0 20 40 60 80 100

Abbildung 16: Vergleich zwischen Kreisdiagramm und Dotplot: Es ist leichter die
Werte mittels des Dotplot nachzuvollziehen. Obwohl nicht ange-
führt entspricht die Aufteilung im ersten Fall 40 : 20 : 20 : 20. Im
zweiten Fall ist das Verhältnis 40 : 22 : 20 : 18. Der Unterschied
ist bei den Dotplots besser zu erfassen.

Der Dotplot wurde als Antwort auf die Standardverfahren bei der Datenvisua-
lisierung erfunden, wie die Kreis- und Balkendiagramme, um deren Schwächen
in der Darstellung zu umgehen.157 Der Dotplot ist ein Diagramm, bei dem die
155
z.B.: Chernoff-Gesichter, bei denen multivariate Daten in kleine Cartoongesichter codiert
werden und der Gesichtsausdruck genauso einen Wert repräsentiert wie die Größe der Ohren
(Vgl. Harris (1999), S. 72)
156
Vgl. Ponocny-Seliger/Ponocny (2005), S. 97 multivariat: die Variablen hängen voneinander
ab und.
157
Vgl. Cleveland (1994), S. 152.
56

Werte mittels Symbolen auf parallelen (meist gepunkteten) Achsen aufgetragen


werden, die eine gemeinsame Skala besitzen.

Wie in Abbildung 16 zu sehen ist, sind die Vorteile gegenüber dem Kreisdiagramm
neben der genaueren Vergleichbarkeit der Daten im Sinne von x > y, x < y oder
x = y, auch die Faktorisierung der Daten im Sinne von x = a · y. Es ist sehr
schwer und nur für geübte Augen erkennbar, dass die Sektoren in der zweiten
Zeile geringfügig voneinander abweichen, wobei dies im Dotplot ersichtlich ist.

5.4 Multidisplays

Die Anordnung mehrerer Grafiken gemeinsam nennt man Multidisplays oder Pa-
nelcharts. Die Anordnung beieinander ergibt sich aus Zusammenhängen, nicht
aus der Tatsache, dass sie nebeneinander stehen. Die Anordnung ist eine Folge
der Datenstruktur.

1932 ●

1931 ●

20 30 40 50 60

Crookston Waseca
Trebi ● ● ● ●
Wisconsin No. 38 ● ● ●

No. 457 ● ● ● ●
Glabron ● ● ● ●
Peatland ● ● ● ●
Velvet ● ● ● ●
No. 475 ● ● ● ●
Manchuria ● ● ● ●
No. 462 ● ● ● ●
Svansota ● ● ● ●

University Farm Morris


Trebi ● ● ●●
Wisconsin No. 38 ●● ● ●
No. 457 ● ● ● ●
Glabron ● ● ● ●
Peatland ● ● ● ●
Velvet ● ● ● ●
No. 475 ● ● ● ●
Manchuria ● ● ●
No. 462 ● ● ● ●
Svansota ● ● ● ●

Grand Rapids Duluth


Trebi ● ● ● ●
Wisconsin No. 38 ● ● ●●
No. 457 ● ● ● ●
Glabron ● ● ● ●
Peatland ● ● ●●
Velvet ● ● ● ●
No. 475 ● ● ● ●
Manchuria ● ● ● ●
No. 462 ● ● ● ●
Svansota ● ● ● ●

20 30 40 50 60
Gerstenernte (Büschel/Acre)

Abbildung 17: Beispiel für einen Multiway Dotplot: Diese Abbildung zeigt die
Erntergebnisse für Gerste verschiedener Sorten auf 6 Farmen in
den Jahren 1931, 1932.
57

Die Entwicklung dieser Darstellungsformen wurde angetrieben vom Wunsch Mo-


delle aus moderaten bis sehr großen Datensätzen basierend auf Experimenten
zu bauen.158 Durch ein nebeneinander Stellen von Displays entsteht neuer Ein-
blick und man hat die Möglichkeit bedeutsame Aspekte der Daten herauszukeh-
ren.159

So kann, wie in Abbildung 17 zu sehen ist, das Darstellen mehrerer kleiner Dis-
plays sehr sinnvoll sein. In Abbildung 17 ist vor allem die Farm Morris her-
ausragend. Cleveland (1993) enthält eine Abhandlung über die Möglichkeit eines
Aufzeichnungsfehlers in dieser Causa.160 Diese Arten der Darstellung sind ein sehr
guter Ersatz für Kreis-, Balken- und Säulendiagramme.

Anderson's Iris Data − 3 versch. Spezies


2.0 3.0 4.0 0.5 1.5 2.5

● ● ●
● ● ● ● ● ●●● ●●●●

7.5

●● ● ●

● ● ● ●●●● ● ●
● ● ●
● ●●●●●● ●●
●●
● ●●

● ●●●● ● ● ●
● ●

●●●● ● ● ●●
● ●●● ● ● ●●●●
●● ●● ●

6.5
●●
●● ●●
● ● ●●●
●● ●● ●● ●● ●● ● ● ●● ●●●
●● ●●●●

●●
●● ●●● ● ● ●
● ●● ● ● ●
●● ●
●● ●●●
Sepal.Length ●
●●
● ●
●●●
●●
● ● ●
●●● ● ● ● ●●● ●


●●


●●●
●●

●●
●●






● ●

● ●●●

● ●●●●
● ●●
● ●●

●● ●

●● ●

5.5
●●●
●●●●●●
● ●● ● ● ● ●
●●
●●
●●●●

●● ●● ●
● ● ●●
●●●
● ●


● ● ●
●● ● ●

● ●●● ● ●●
● ● ●
● ●●●
● ●
●●
●●
●●●● ●●●
●●● ●
●●






●●
● ● ●


●●

●●
●●●●● ●
● ●
● ● ● ● ●●●
●● ●●●

4.5
● ●● ●●●
● ●●
●●
● ● ●●● ●●

● ● ●
● ● ●
4.0

● ● ●
● ● ●
● ●● ●
● ● ●● ●
●●● ●● ●●● ● ●
● ●● ● ● ●
● ●● ● ●● ● ●● ●
●●● ● ●●●
● ●● ●
● ● ●●● ● ● ●● ●●
●●● ● ●● ●●● ● ●●
● ●● ●
●● ● ●
● ●● ●●● ● Sepal.Width ●

●●
●● ●●
● ●●
●●● ●● ●
● ●

● ●
●● ● ● ●

3.0

● ●● ● ●●
●● ●
● ●●●●● ●
● ●● ●● ● ● ●●
●● ●●● ● ●● ●●● ●●●● ●● ●● ●●●● ●●●●●●●
●●
●●● ●● ● ●●● ●●●●●●● ●●●●
● ●● ●●●●● ● ● ● ● ● ●●●● ● ● ● ●●● ●
●●● ●●●●● ● ● ● ●
●● ●●
●●● ● ● ● ●●●● ●●●●● ●
● ●● ●● ●● ●●● ●●● ● ●●● ● ●●
● ●● ● ● ● ●● ● ● ● ● ● ●
● ● ●●● ● ● ● ●● ●● ● ● ● ● ● ●●●●
● ● ●●● ●●
● ● ● ● ● ● ●● ● ● ●
●● ● ● ● ● ●
2.0

● ● ●
1 2 3 4 5 6 7
● ● ● ●●●●
●● ● ● ●

●●● ● ●●● ● ●●● ● ●
● ● ●● ●● ●●●
●● ●●● ● ● ● ●●● ●
●● ●
●●●● ● ●
●●● ●●●● ● ● ●

● ●●
● ●●●
●●●
●● ● ●● ●
●●● ● ●● ●

●●●●●● ●
●●

● ● ●●●
●●●● ● ● ● ●
● ●●
● ●
●●
●●


●● ●

●●
● ●●●
●●
●●●

● ●●

● ●●●● ●● ● ●●●● ● ●●
●● ●● ●
●●●

●●
●●
●●● ●
●●
●●●●
●●


● ●●● ●● ●●
●●●


●●

● ●

●●
●●
●●
●●

● ●● ●●●●
● ●●
● ●
●●
●●●



●● ● Petal.Length ●
●●



●●
●●

●●
●●

● ● ●

● ●●●●●
● ● ●●
●● ●
●● ●
●●●
●●●
●●●●●
●●●
●●
●●● ● ●●
●●
●●
●●●
●● ●
●●●●●●●● ●

●●
●●●●
●●
●●●●● ●●●● ●● ● ●●
● ● ●●
● ● ●
●●
●●


●●
2.5

● ● ● ● ● ●●●
● ● ● ● ● ● ● ●
● ● ●●● ● ● ●●● ● ●●
●●●●● ●
●● ● ● ● ● ●● ●
● ●●● ● ● ● ●● ● ●
●●●● ●
●● ● ●● ● ● ● ● ● ●●
●● ●●
● ●● ● ● ●● ●
●● ●
●●●●●●● ● ●● ● ●●●●●● ●
●● ●●●●●
● ● ● ● ● ●
1.5

● ● ● ● ● ●● ●● ● ●
● ● ●● ●●●● ● ● ● ● ●●●●● ●●●●●●

● ● ●● ● ● ●●●●●●● ● ●●●● ●
● ●●
●●● ●●●● ●
● ●● ●
●● ● ●● ●
● ● ●●●●
●●
●●● ●
● ●●● ●●
● ●
●●


●●
●●

●●●●

●●●●●
Petal.Width
0.5

● ● ●
● ● ●
●● ● ● ● ●●● ● ●●
●●●
●● ● ●● ● ● ● ●● ● ●
●●
●●
● ●●●
●●
●●●●●●● ● ●●●●
●●●●●●●● ● ● ●●●
●●
●●●
● ●● ● ●● ● ● ●●●

4.5 5.5 6.5 7.5 1 2 3 4 5 6 7

Abbildung 18: Beispiel für einen Matrixplot: Es wurden hier für 3 Spezies von
Iris, die Abmessungen der Kelch- (Sepalum) und Kronblätter (Pe-
talum) der Blüten gegeneinander aufgetragen.

Es ergibt sich mitunter die Möglichkeit kleine Vielfache 161 darzustellen, was als
eine Art von Bildergeschichte verstanden werden kann. Das kann bei multivaria-
158
Vgl. Cleveland/Fuentes (1997), S. 1.
159
Vgl. Maindonald (2004), S. 33.
160
Vgl. Cleveland (1993), S. 328–339.
161
Vgl. Tufte (2005a), S. 67–80.
58

ten Daten so weit gehen, dass alle Variablen gegeneinander in einem Matrixplot
gezeichnet werden, wie in Abbildung 18 zu sehen ist.162

Die Anwendungsmöglichkeiten von Multidisplays oder Panelcharts sind so vielfäl-


tig wie die Bezeichnungen: Bei S-Plus heißen die Grafiken Trellis-, bei R Lattice-
und manchmal findet man die Bezeichnung Draftman’s Chart 163

Given : wool

0 10 20 30 40 50
70
50

H

30

● ●

● ●
● ●●
● ● ●
● ●●

10

70

Given : tension
50
breaks

M
● ●
●●
30

● ● ● ●

● ●
● ●● ●


10
70



●●
50



L
30

● ●
●●
● ● ● ●

● ●

10

0 10 20 30 40 50

Index

Abbildung 19: Beispiel für einen Conditional Plot: Es handelt sich hier wieder
um einen Rasterchart für die Reißfestigkeit zweier Wollsorten in
verschiedenen Stichproben, der allerdings zwei Konditionen unter-
liegt: (1) Wollsorte und (2) Zugstärke.

Das Begriffswirrwarr bei den Panelcharts hat unter anderem auch urheberrecht-
liche Gründe: Trellis ist ein Markenzeichen der Insightful Corporation.164
S-Plus und R sind zwar Implementierungen von S, einer statistischen Program-
miersprache, aber R ist ein Open Source Produkt und S-Plus kommerziell.

162
Oft bezeichnet der Begriff Matrixplot aber das Auftragen mehrerer Sichtweisen in einem
geordneten Raster
163
Vgl. Harris (1999), S. 143.
164
Produzent von S-Plus.
59

S dient oft als Unterbau für Statistiksoftware und wird deshalb als Lingua Fran-
ca der Statistik bezeichnet.165 R ist ein Dialekt von S, der sich stark an die Pro-
grammiersprache C lehnt. Die Syntax ist fast identisch.166

Um zu zeigen wie Variable von anderen Variablen abhängen, verwendet man gerne
conditional plots, wie in Abbildung 19 beispielhaft dargestellt. Man erkennt hier
die Abhängigkeit der Brüche innerhalb einer Wollsorte in Bezug auf die Zugstärke
und den Unterschied zwischen den Wollsorten. Dies bildet eine Alternative zu
Diagrammen mit zwei y-Achsen und Kurven, die superpositioniert wurden.

Alle diese Verfahren können sich auch aller Methoden bedienen, die auf die Da-
ten in Ihnen anwendbar ist. Das bedeutet, dass man bei der Verwendung eines
Histogramms einen Kerndichteschätzer, bei der Verwendung von Liniendiagram-
men Glättungsfunktionen usw. usf.. Der Fokus der Multidisplays liegt kaum noch
im Anzeigen von Werten, sondern in der Vermittlung von Zusammenhängen und
Verhältnissen innerhalb der Daten.

Durch das Schrumpfen der Grafiken gewinnen Methoden der Darstellungsopti-


mierung an Bedeutung. Fehler werden in der Verkleinerung genauso transportiert
und wenn es sich um Multidisplays handelt, eben vervielfacht.

Eine interessante Form der Verdichtung von Daten stellt auch der Mosaikplot dar,
der besonders gut dazu geeignet ist kategorische Daten in einem Display darzu-
stellen.167 Abbildung 20 erzählt die Schicksale der Passagiere der Titanic. Der
Mosaikplot ist eine Erweiterung des Balkendiagramms auf mehrere Kategorien.
Die Dimensionen zeigen die Anteile der Subkategorien an den Hauptkategorien
und können noch einmal geteilt werden, um eine weitere Kategorie anzuzeigen.
Das bedeutet, dass die horizontale Unterteilung das Verhältnis von Crew zu Klas-
senpassagieren zeigt, welche wiederum in Erwachsene und Kinder geteilt werden.
Die Vertikale Unterteilung spiegelt die Verhältnisse männlich:weiblich und über-
lebte:gestorben. Es sind hier also 4 Kategorien berücksichtigt. In Abbildung 20
findet man eine explodierte Ansicht eines Mosaikplots. Im Normalfall würden sich
alle Balken auch berühren können, sodass eine geschlossene Fläche entsteht. Auf-
grund der extremen Größenunterschiede in den Daten war dies hier nicht möglich,
auch aus Rücksicht auf die Beschriftung.

165
Vgl. Friendly (2007), S. 32f.
166
Vgl. R Development Core Team (2006), S. 1.
167
Vgl. Friendly (1992), S. 4f.
60

Abbildung 20: Mosaikplot der Titanicpassagiere: Die Abbildung beschreibt das


Verhältnis von Geschlecht, Reisestatus und ob überlebt wurde oder
nicht (grün=ja/rot=nein). Man sieht, dass alle Kinder überlebt
haben, die nicht in der dritten Klasse gereist sind.

5.5 Semigrafische und wortgroße Grafiken

Die simpelste Art einen Zustand zu beschreiben ist ein Wort und eine Zahl.168
Allerdings zeigt sie keine Struktur oder Zusammenhänge in den Daten, nur den
Wert.169 Um mehrere Werte darzustellen bedient man sich der Tabelle und in
weiterer Form dann Visualisierungen von Daten. Dies kann auch in semigrafischen
oder wortgroßen Grafiken erfolgen.

168
Vgl. Tufte (2006), S. 168 Zum Beispiel: Zuwachs 12%
169
Vgl. Tukey (1972), S. 293.
61

Eine Art ist der Stem-and-Leaf -Plot. Es handelt sich hier um eine simple Art
des Histogramms.170 Daten werden ihrer Größe nach geordnet und zugeordnet.
Abbildung 21 stellt einen solchen Plot dar. Der Vorteil liegt auf der Hand: Er ist
einfach und schnell zu erstellen, man benötigt keine Hilfsmittel technischer Natur
und kann sich doch einen Überblick über die angesammelten Daten verschaffen.
Nachteil ist das unabsichtliche Runden der Werte. Nehmen wir an Abbildung
21 zeigt die Höhe von Bergen des Voralpenlandes und der Stem entspricht 100
Metern, also würde die Legende lauten:„11k5 = 10 150 Meter“. Wir hätten alle
Berge auf 10 Meter genau. Für einen Überblick wäre das mehr als genug. Für
einen weiteren Vergleich reicht es nicht, da die Genauigkeit stark beschnitten
wurde.
11 57 11k5 = 115 Pfund
12 369
13 259
14 26
15 49
16 4

Abbildung 21: Stem-and-Leaf-Plot: Es handelt sich hier um einen kleinen Stem-


and-Leaf-Plot des Gewichtes von 15 Frauen in Pfund. Links neben
der Teilerstrich ist der so genannte Stem (Stamm) und rechts die
Leaves (Blätter). Für die erste Zeile bedeutet dies, dass hier die
Gewichte 115 und 117 Pfund kodiert wurden.

Das Stem-and-Leaf-Diagramm ist nur ein Beispiel von vielen, in denen die Grenze
zwischen Diagramm und Tabelle verschwimmt.171 Der Nutzen ist es das Muster zu
erkennen und trotzdem die Daten schnell ablesen zu können. Vor allem, weil man
in Wirklichkeit nur ein Blatt Papier benötigt und zu einem plakativen Ergebnis
kommt.

Der augenblickliche Trend zu Intra- und Internetportalen verlangt eine andere


Art der Aufarbeitung der Daten. Sie soll schnell erfassbar sein, das wichtigste
darstellen und optisch ansprechend sein. Da eine der Randbedingungen aber der
Platz ist — im Sinne eines Anteils an Fläche — führt dies zur Verkleinerung der
Datengrafiken.

Ein Ergebnis dieser Verkleinerungen sind die Sparklines.172 Tufte (2006) entwi-
ckelte diese Grafik aus der Überlegung heraus, dass die gebräuchlichste Art von
Datendarstellung ein Wort gefolgt von einer Zahl ist. Innerhalb eines Kontextes
170
Vgl. Tukey (1972), S. 295–297, Ponocny-Seliger/Ponocny (2005), S. 14, Harris (1999), S. 369f
171
Vgl. Tufte (2001), S. 139–159.
172
Vgl. Tufte (2006), S. 46-63.
62

erlangt diese Zahl dann Bedeutung.173 Dieser Kontext entsteht indem der Verlauf
oder die Entwicklung der Zahl als Miniatur dem Wort nahe gestellt wird, deswe-
gen auch die Beschreibung mit wortgroßen Grafiken. Um zu verstehen, was das
bedeutet, ist es besser, wir betrachten als Beispiel den folgenden Aktienverlauf
von Daimler Chrysler, 12%, 129174 und Abbildung 22 um die Häufung
solcher Grafiken zu sehen.

Abbildung 22: Sparklines: Um den generellen Verlauf zu sehen und um die Zah-
len im Kontext erfassen zu können, bieten sich Sparklines an (Aus-
schnitt aus einem Screenshot von Andreas Flockermann abgerufen
am 25.03.2007 von http://www.edwardtufte.com/bboard/q-and-
a)

Auf den Internetseiten mancher Anbieter von Finanzinformationen sind Sparkli-


nes schon Standard. Es muss noch einmal betont werden, dass die Größe und die
Datenintensität die Sparklines ausmacht und nicht etwa die Tatsache, dass sie
eine Liniengrafik sind. In Abbildung 22 erkennt man neben den Liniengrafiken
in der mittleren Spalte, auch in der Spalte links daneben eine Verlaufsgrafik mit
binärer Information175 und rechts einen Bulletgraph, ein kleines Balkendiagramm,
dass das Verhältnis von Soll zu Ist ausdrücken soll.
173
Vgl. Tufte (2006), S. 47.
174
Vgl. Löffler (2007), S. 1 und beachten Sie die Tatsache, dass es nicht möglich ist vorangegan-
gene Abbildung wie die übrigen in diesem Text zu beschriften. Würde man Sie freistellen,
würde der Effekt verloren gehen. Sie finden sie freigestellt als Abbildung 37 auf Seite 112
175
hier: Win/Loose, aber es könnte genauso gut jedes andere binäre Kriterium sein: ja/nein,
Mann/Frau, rechts/links, etc.
63

6 Gestaltungsprinzipien

Bis zu diesem Punkt standen physio- und psychologische Randbedingungen für


die Wahrnehmung und verschiedene Formen der Datengrafik im Mittelpunkt.
Im folgenden werden nun die Gestaltungsprinzipien von drei Autoren einschlägi-
ger Literatur dargelegt. Diese haben Ihre Arbeitsschwerpunkte in den verschie-
denen Teilen der für Diagramme relevanten Teile der Visualisierung: Technik,
Wissenschaft und Kunst.176 Sie entsprechen auch den Empfehlungen von Wilkin-
son (2005), der diese Wissenschaftler und ihre Bücher als Quellen für die Anlei-
tung zur Erstellung guter Grafiken empfiehlt.177

William S. Cleveland ist ein Statistiker, Stephen M. Kosslyn ein Psychologe und
Edward R. Tufte ist ein Statistiker und Politikwissenschaftler, der manchmal als
Designer beschrieben wird. Alle drei haben schon mehrere kritische Publikationen
zum Thema Grafik herausgebracht und sowohl Cleveland als auch Tufte können
sich als Erfinder einer Visualisierungsmethode bezeichnen. Sie vereinen auch die
drei Sichtweisen auf die Visualisierung: (1) Kosslyn vertritt die Sicht der Wis-
senschaft, (2) Cleveland den Standpunkt von Technik und Wissenschaft und (3)
Tufte die Sicht von Kunst und Technik.

Etwaige Begriffsübersetzungen aus dem Englischen im nachfolgenden Teil sind


durch den Autor dieser Arbeit entstanden.

6.1 Prinzipien nach Cleveland

Die Prinzipien in diesem Abschnitt sind aus Cleveland (1994): The Elements of
Graphing Data. Cleveland ist Statistiker und hat neben dem oben angeführten
Buch zahlreiche andere wissenschaftliche Arbeiten zum Thema Darstellung von
statistischen Daten geschrieben.

Clear Vision: Das Prinzip der Clear Vision hat den Gedanken der freien Sicht
auf die Daten im Mittelpunkt. Überflüssiges soll vermieden und die Da-
ten eindeutig kodiert werden. Das Anliegen des Prinzips der freien Sicht

176
Vgl. Wijk (2005), S. 8.
177
Vgl. Wilkinson (2005), S. 1.
64

betrifft insbesondere überlagerte Daten und die beschreibenden Elemente,


wie Achsen und Legende.178

Jährliche Sonnenflecken
1700 1750 1800 1850 1900 1950 2000
Sonnenflecken/Jahr

150

100

50

0
Sonnenflecken/Jahr

1700 1750 1800 1850 1900 1950 2000

100
0

Jahr

Abbildung 23: Das klassische Beispiel für Banking: Die Anzahl der Sonnenfle-
cken pro Jahr. In der unteren Grafik erkennt man, dank Ban-
king, wodurch man die Veränderungen und die Art der Verände-
rungen besser lesen kann. Im vorliegenden Fall eine Art Zyklus
und den Unterschied zwischen dem Ansteigen und Abfallen.(Vgl.
Cleveland (1994), S. 69)

Clear Understanding: Der Leser sollte die wichtigsten Schlüsse in grafischer


Form vorfinden. Wenn nicht so gängige Dinge, wie etwa logarithmische Ska-
len verwendet werden, empfiehlt Cleveland, diese zu erklären. Im Falle der
logarithmischen Skalen etwa empfehlen sich zwei. Eine Skala mit dem Lo-
garithmus und eine mit dem tatsächlichen Wert. Wichtig für das Verstehen
eines Graphen ist auch die Klarheit desselben, es ist also unbedingt Kor-
rektur zu lesen.179
178
Vgl. Cleveland (1994), S. 25–54.
179
Vgl. Cleveland (1994), S. 54–66.
65

Banking to 45◦ : Das Ansichtsverhältnis eines Graphen ist ein wichtiger Faktor
beim Schätzen von Veränderungsraten. Wenn die Orientierung von Linien-
segmenten bewertet werden soll um Veränderungsraten abzulesen, bringt
man die Segmente in eine mittlere Schräglage von 45◦ .180 Der Effekt ist in
Abbildung 23 wiedergegeben.
Scales: Die Skalen und Achsen sind den Daten anzupassen, nicht umgekehrt.
Die Verwendung von logarithmischen Skalen kann helfen die Darstellung
zu verbessern. Skalenbrüche sollten immer vollständig sein und die Daten
dürfen sich nicht darüber fortsetzen.181
5.90
5.85
data
5.80
5.75
seasonal

0.000
−0.010
5.90
5.85
trend
5.80
5.75

0.002
remainder

0.000
−0.002

1960 1970 1980 1990

time

Abbildung 24: Dekomposition einer Kurve in ihre Teilaussagen: Gezeigt wird die
Zerlegung des CO2 -Ausstoßes des Vulkans Mauna Loa (Hawaii)
in saisonale Schwankungen, einen Trend und den Rest. Die klei-
nen Boxen auf der rechten Seite der Grafik stellen jeweils dieselbe
Größe dar und sollen den Bezug erleichtern.(Vgl. auch Darstellung
derselben Daten in Cleveland (1994), S. 7)

180
Vgl. Cleveland (1994), S. 66–79.
181
Vgl. Cleveland (1994), S. 80–109.
66

General Strategies: Das Visualisieren von Daten ist ein iterativer, experimen-
teller Prozess, bei dem am Ende eine große Menge an Daten in eine kleine
Fläche gepackt ist. Wenn es zur Lesbarkeit beiträgt, sollten Daten mehrmals
gezeichnet werden. Viele nützliche Graphen benötigen vorsichtige und de-
taillierte Betrachtung.182 In Abbildung 24 wird demonstriert, dass auch die
Dekomposition von Daten in Teile zu einem besseren Verständnis beitragen
kann.

6.2 Prinzipien nach Kosslyn

Die folgenden Prinzipien sind aus Kosslyn (2006): Graph Design for the Eye and
Mind. Kosslyn ist Psychologe und hat neben dem oben angeführten Buch auch
zahlreiche Papers zu den Themen Visuelle Wahrnehmung, Mentale Bilder und
visuelle Kommunikation geschrieben.

Zuallererst muss eine Verbindung mit dem Empfänger hergestellt werden.183


Principle of Relevance: 184 Effektive Kommunikation zeigt die relevanten Da-
ten. Wird zu wenig gezeigt, verwirrt es den Betrachter; wird zu viel gezeigt,
überfordert es den Betrachter.
Principle of Appropriate Knowledge: 185 Die Kommunikation sollte an das
Zielpublikum angepasst sein und etwas Neues zeigen, aber nicht zu viel.
Kosslyn (2006) hebt hier besonders Konzepte, Jargon und Symbole hervor
und die Tatsache, dass der Leser mit der Information umgehen kann, wenn
er das Konzept zumindest in Teilen schon kennt.
Dann ist die Aufmerksamkeit zu erlangen und auf das Wesentliche zu richten.186
Principle of Salience: 187 Die Aufmerksamkeit richtet sich auf die großen wahr-
nehmbaren Unterschiede. Illustrationen sind zum Darstellen von relativen
Werten zu verwenden.
Principle of Discriminality: 188 Im Gegensatz zum vorherigen Prinzip bezieht
sich dieses auf die Unterscheidbarkeit der Elemente voneinander. So muss

182
Vgl. Cleveland (1994), S. 110–118.
183
Vgl. Kosslyn (2006), S. 6.
184
Vgl. Kosslyn (2006), S. 6.
185
Vgl. Kosslyn (2006), S. 7.
186
Vgl. Kosslyn (2006), S. 7.
187
Vgl. Kosslyn (2006), S. 7.
188
Vgl. Kosslyn (2006), S. 7f.
67

eine Tickmark als eine solche erkennbar sein und sich auch vom Hintergrund
abheben.
Principle of perceptual Organization: 189 Dieses Prinzip bezieht sich auf die
Tatsache, dass der Mensch dazu neigt Elemente zu gruppieren, diesen dann
folgt und sich an sie erinnert. Hierzu gehört neben den Gestaltgesetzen
auch das Dreidimensionale Sehen und das integrieren sowie separieren von
Dimensionen190 .
Verständnis muss gefördert werden und das Gedächtnis muss unterstützt wer-
den.191
Principle of Compatibility: 192 Das verwendete Muster sollte mit dem, was es
repräsentiert korrelieren.
1. Surface-Content Correspondence: Die Verpackung sollte dem Inhalt
entsprechen. Wenn Hitze mit blau markiert ist, wird der Leser Proble-
me bei der Interpretation haben.
2. More is More: Wenn etwas im Wert zunimmt, sollte sich das in der
Grafik als Zuwachs auswirken. Wachstum wird mit einer Bewegung
nach rechts oder nach oben kodiert und nur in Ausnahmefällen anders.
3. Perceptual Distortion: Manche visuelle Dimensionen werden verzerrt.
So wird zum Beispiel Fläche, Intensität von Farbe und Volumen un-
terschätzt, je größer die Rate der Veränderung ist.
4. Spatial Imprecision: Ungenauigkeit beim Bewerten von räumlichen
Verhältnissen hängt mit der Tatsache zusammen, dass verschiedene
Teile des Gehirns die Oberflächeneigenschaften und die räumlichen Ei-
genschaften registrieren.
5. Cultural Conventions: Es ist zum Beispiel nicht gut, für Stopp grün
zu verwenden.
Principle of informative changes: 193 Jede Änderung wird als Veränderung
aufgefasst. Ändert sich die Farbe, wird eine Änderung impliziert.
Principle of capacity limitations: 194 Dieses Prinzip besteht aus zwei Teilen:
Beschränkungen im (1) Kurzzeitgedächtnis und (2) in der Verarbeitung.
Eine Visualisierung wird vom Betrachter nicht verstanden, wenn er mehr
189
Vgl. Kosslyn (2006), S. 8–13.
190
Farbe ist zum Beispiel eine integrierte Dimension. Sie kann als Unterscheidungsmerkmal
fungieren, ist aber nicht so effizient wie der Abstand, als ein Beispiel für eine separierte
Dimension.
191
Vgl. Kosslyn (2006), S. 14.
192
Vgl. Kosslyn (2006), S. 14–16.
193
Vgl. Kosslyn (2006), S. 17.
194
Vgl. Kosslyn (2006), S. 17–20.
68

als 4 Informationen gleichzeitig behalten muss. Gleichzeitig kann es Proble-


me beim Verständnis einer Grafik geben, wenn viele Verarbeitungsschritte
notwendig sind um diese zu lesen.

6.3 Prinzipien nach Tufte

Die folgenden Prinzipien sind aus Tuftes The Visual Display of Quantitative In-
formation, Envisioning Information, Visual Explanations und Beautiful Evidence.
Tufte ist Politikwissenschaftler und Statistiker, dessen letzte Bücher sich aus-
schließlich mit dem Design von Visualisierungen beschäftigen.

Graphische Integrität: 195 Die Daten sollen für sich sprechen und repräsentieren
ihren Wert direkt proportional. Eindeutiges, ausführliches und gründliches
Beschriften sollten verwendet werden, um grafische Verzerrung und Doppel-
deutigkeit zu bekämpfen. Wichtige Ereignisse sollten ebenfalls in den Daten
beschriftet werden. Die Anzahl der abgebildeten informationsbefördernden
Dimensionen (Variablen) sollte die Anzahl der in den Daten vorhandenen
nicht übertreffen. Grafik darf nicht außerhalb des Kontext zitieren. Es be-
steht die Möglichkeit die Daten zu variieren, aber es soll keine Variation im
Design stattfinden.
Data-Ink: 196 Die verwendeten grafischen Elemente sollten zum Großteil den Da-
ten entsprechen (siehe auch Seite 44). Allerdings muss hier angemerkt wer-
den, dass zum Thema Data-Ink zwei wichtige Ratschläge gehören: „Above
all else show the data.“ und „Revise and edit.“ 197
Multifunctioning Graphical Elements and Small Multiples: 198 Die multifunk-
tionalen grafischen Elemente bilden die Grundlage für die kleinen Vielfa-
chen. Der Autor verlangt jedes grafische Element zu verwenden, um die
Daten zu zeigen. Wenn es sein muss, hat dies auch mehrere Male zu gesche-
hen. Kleine Grafiken können mit einer hohen Datendichte nebeneinander
wiederholt werden und so Serien abbilden, die einen Verlauf mit einer wei-
teren Dimension zeigen, respektive multivariate Zusammenhänge darstellen.
Es bilden sich Serien von Bildern, die groß genug sind um den Unterschied

195
Vgl. Tufte (2001), S. 53–77.
196
Vgl. Tufte (2001), S. 93–105 und 124–137.
197
Beide: Tufte (2001), S. 105.
198
Vgl. Tufte (2001), S. 139–175, Tufte (2005a), S. 66-79
69

zwischen den einzelnen frames zu erkennen. Gut entworfene small Multiples


sind199 :
• unausweichlich vergleichend
• geschickt multivariat
• geschrumpfte Grafiken von hoher Datendichte
• normalerweise basierend auf einer großen Datenmatrix
• Fast ausschließlich mit Data-Ink gezeichnet
• effizient in der Interpretation
• Oftmals erzählerisch im Inhalt, Veränderungen im Verhältnis von Va-
riablen zeigend, während die Indexvariable sich verändert und enthül-
len auf diese Weise Interaktionen und multiplikative Effekte.

Abbildung 25: Beispiel für Small Multiples (entnommen aus Baker/


Bushell (1995), S. 8): Im unteren Bereich zeigt die Zeitlinie
in groben Zügen das Entstehen einer Gewitterwolke. Meteorolo-
gische Details werden in der großen Version über dieser Zeitlinie
gezeigt.

In Abbildung 25 ist im unteren Bereich eine Anwendung solcher kleinen


Vielfachen zu sehen. Sie bilden dort eine Zeitlinie und zeigen in Miniaturen
die Zustände zu bestimmten Zeitpunkten. Vor allem die Eigenschaft des
erzählerischen Inhalts lässt sich gut nachvollziehen.
199
Vgl. Tufte (2001), S. 175.
70

Layering and Separation: 200 In Envisioning Information bringt Tufte ausführ-


lich das Konzept der Ebenen und Trennung um Information aus einer Grafik
herauszuarbeiten. Dies geschieht im Normalfall über das Verstärken der Lu-
minanz in Ebenen, die als weiter hinten oder weiter unten gesehen werden
sollen.201 Diese Methode Tiefe zu erzeugen entspricht der optischen Tiefen-
schärfe und stellt keine perspektivische Verzerrung dar.
The smallest effective Difference: 202 In Visual Explanations ist eines der
Leitmotive der kleinste wahrnehmbare Unterschied. Dies bezieht sich jedoch
nicht auf Daten, sondern auf Darstellungen allgemein. Alle Unterschiede
sollten so fein wie möglich sein, aber noch immer klar und effektiv.

Tufte’s Lieblingsgrafik ist eine Darstellung des Russlandfeldzuges Napoleons von


Charles Joseph Minard (siehe auch Abbildung 26). Sie stellt wohl — dank Tufte
— die berühmteste statistische Grafik dar.

Anhand dieser Grafik kann man die fundamentalen Prinzipien von analyti-
schem Design nachvollziehen:

Zeige Vergleiche, Kontraste und Unterschiede: 203 Am Beginn des Russland-


feldzuges steht das Überschreiten des Flusses Niemen (In Abbildung 26 fin-
det man eine Anmerkung links unten!). Dort endet die Kampagne auch
wieder. Ersichtlich ist das Verhältnis von nach Moskau ziehender (in heller
Farbe) und zurückkehrender Armee (in schwarz).
Zeige Kausalität, Mechanismen, Struktur und erkläre: 204 Die Temperaturs-
kala im unteren Teil der Grafik beginnt erst beim Rückzug von Moskau.
Sie beginnt am Gefrierpunkt. Das französische Original zeigt, nicht wie die
englische Übersetzung, nur die Reaumur-Skala.205 Beachten Sie die Verän-
derungen in der Breite der Linien beim Überschreiten von Flüssen.
Zeige Multivariate Daten: 206 Diese Grafik enthält 6 Variablen: (1) Die Größe
der Armee, (2+3) die geographische Lage (i.e.: Längen- und Breitengrad),
(4) die Richtung der Armee und (5) die Temperatur zu (6) verschiedenen
Tagen. Multivariate Daten sind immer mehr als 1–2 Variablen.

200
Vgl. Tufte (2005a), S. 53–65.
201
Im Normalfall, werden strukturelle Elemente in einer Datengrafik, wie es zum Beispiel das
Raster ist, in Grau gehalten
202
Vgl. Tufte (2005b), S. 73–78.
203
Vgl. Tufte (2006), S. 126f.
204
Vgl. Tufte (2006), S. 128f.
205
Vgl. Tufte (2006), S.126.
206
Vgl. Tufte (2006), S. 129f.
71

Abbildung 26: Charles Joseph Minards Darstellung des Russlandfeldzuges 1812-


1813.(gescannt und nachbearbeitet aus: Tufte (2006), S. 123f,
Übersetzung Dawn Finley, nachgezeichnet Elaine Morse von Mi-
nard (1869))
72

Integriere Beweise: 207 In dieser Grafik finden sich neben Worten und Zahlen
verschiedene Diagramme (Temperatur). Tufte schließt das Einbinden von
Bildern in Grafiken nicht aus.
Dokumentiere: 208 Der Kopf der Grafik enthält neben dem Titel und dem Au-
tor auch eine Vielzahl anderer Informationen: Was wird in welcher Form
dargestellt? Wann wurde die Grafik erstellt? Woher kommen die Daten?
Welche Annahmen wurden getroffen? Wer hat die Grafik erstellt? Weiter
unten findet man den Maßstab und Angaben zu Verleger und Drucker unter
dem Rahmen.
Der Inhalt ist das Wichtigste: 209 Das Wort Napoleon ist auf der Karte nicht
zu finden. Minard stellte nur die Fakten — den Tod vieler Menschen —
dar. Die Grafik befindet sich in seinem Werk folgend auf Hannibals Feldzug
über die Alpen und war die Letzte. Tufte tituliert diese Karte auch als
anti-war-poster.210

Minards Russlandfeldzug ist ein vieldiskutiertes Werk. Man findet ihn bei Wilkin-
son (2005)211 als Analysebeispiel und in Form von Neuerstellungen und Nach-
bildungen bei Friendly (1999)212 , bei Ihaka (2001)213 und natürlich besonders
ausführlich bei Tufte (2006)214 .

Tufte vertritt eine Ästhetik der Einfachheit, die er damit begründet, dass die
Daten die komplexe Information darstellen. Gerade dieses Wechselspiel zwischen
Komplexität und Einfachheit ist es, was zum gegenseitigen betonen führt: Es gibt
keine Einfachheit ohne Komplexität.215

6.4 Fazit

Schon in den allgemeinen Gesetzen, die noch keine Ratschläge für spezielle Gra-
fiken enthalten sind einige Gestaltungsregeln enthalten, die an Hand von Visua-
lisierungssoftware zeigbar wäre. Ein Teil der Regeln betrifft die Auswahl oder

207
Vgl. Tufte (2006), S. 130f.
208
Vgl. Tufte (2006), S. 132f.
209
Vgl. Tufte (2006), S. 134-136.
210
Vgl. Tufte (2006), S. 137.
211
Vgl. Wilkinson (2005), S. 623–629.
212
Vgl. Friendly (1999).
213
Vgl. Ihaka (2001), S. 5f.
214
Vgl. Tufte (2006), S. 122–139.
215
Vgl. Maeda (2006), S. 45–51.
73

Handhabung der Daten im Vorfeld. Dann wird das Ergebnis allgemein beschrie-
ben, aber selten der Weg dorthin. Auch tauchen immer wieder Ratschläge für das
extensive, aber intelligente Beschriften auf.

Außerdem werden Möglichkeiten zum Vergleich zwischen den Daten besonders


betont. Tukey (1967) ging so weit zu sagen, dass es immer eine Referenzlinie
gibt — implizit oder explizit. Sollten die geplotteten Symbole für sich alleine
stehen, wird das Gehirn sich seine Referenz einfach erfinden, denn was das Auge
besonders gut kann — implizit und explizit — ist vergleichen.216

Es wurden viele gute Ratschläge gegeben und in der Literatur anhand von Bei-
spielen dokumentiert, aber wenige konkrete Vorgehensweisen vermittelt.

216
Vgl. Tukey (1967), S. 593.
74

7 Analyse

7.1 Allgemeines

Wie steht es um den Standard bei Visualisierungen in gängiger Bürosoftware?


Kann der Benutzer davon ausgehen, dass sein Befehl an die Software, eine be-
stimmte Grafik zu erschaffen, optimal umgesetzt wird?

Es existieren viele Untersuchungen zur Materie der Datenvisualisierung. Im Fol-


genden werden nicht nur die bisher gebrachten Argumente — und Schlussfolge-
rungen daraus — dargestellt, sondern auch die Best Practices aus der Literatur.
Gemeinsam stellen diese Fakten einen Kriterienkatalog dar, der im Folgenden zur
Analyse von Software verwendet wird.

7.2 Ziel und Zweck

Zweck dieser Analyse war es festzustellen, inwieweit das Wissen zum Thema
Visualisierung in aktuelle Softwareprodukte eingeflossen ist.

Das Ziel war es festzustellen bis zu welchem Grad Darstellungskriterien automa-


tisch erfüllt werden. Das Ergebnis war ein Kommentar zum Stand der Daten-
visualisierung mit Tabellenkalkulationen. Wenn der Leser es wünscht, kann er
daraus eine Empfehlung für eine Software ablesen, die für eine bestimmte Tätig-
keit geeignet ist.

7.3 Vorgehensweise

Es wurden verschiedene Typen von Büropaketen217 ausgewählt. Die Kriterien für


diese Auswahl waren:

1. Enthält eine Tabellenkalkulation. Der Ausgangspunkt ist, dass die Datengra-


fiken aus Zahlen produziert werden. Datenbankmanagementsoftware wurde

217
Wobei der Begriff Officesoftware treffender wäre, die Entscheidung aber für den deutschen
Begriff fiel
75

aus dieser Analyse ausgeschlossen, weil zwar die meisten Arbeitsplätze Ta-
bellenkalkulation besitzen und eventuell sogar eine Spezialistensoftware218 ,
aber wenige Arbeitsplätze einen Zugang zu Datenbanksoftware besitzen.
Textverarbeitung und Tabellenkalkulation findet man fast auf jedem Ar-
beitsplatz.
2. Die Anwendung ist verbreitet.
3. Die Tabellenkalkulation kann Datengrafiken erzeugen.
4. Die Tabellenkalkulation ist lokal installierbar.

Es wurden nur die Tabellenkalkulationen der Büropakete in den Standardeinstel-


lungen getestet. Da sie ob Ihrer Geläufigkeit für die Vermittlung von Zahlen Stan-
dard sind, waren folgende Formen von Datengrafiken Gegenstand des Tests:

1. Kreisdiagramm
2. Liniendiagramm
3. Balkendiagramm

Dazu wurde ein Kriterienkatalog hinzugezogen. Die Kriterien befinden sich in den
Tabellen 11 bis 16 — im Anhang ab Seite 101 — sowie die Quellenhinweise.

Die Kriterien sind nach Erfüllung bewertet. Wird ein Kriterium erfüllt, bedeutet
dies einen Punkt. Wird ein Kriterium durch Nachbesserung erfüllt, bedeutet dies
auch einen Punkt, allerdings in einem zweiten Bewertungsschema.

Zusätzlich wurde noch untersucht, ob die getestete Software folgende aktuellere


Darstellungsformen unterstützt: (1) Dotplot, (2) Panelcharts219 , (3) Sparklines
und (4) aktuelle Funktionalitäten, wie Loess220 , Kerndichteschätzer221 , Banking
und Jittering222 .

218
Das wäre zum Beispiel im Bereich der Buchhaltung Rzl aber genauso jede andere Anwen-
dung, die Zahlen auswerten kann z.B.:Sap
219
Mehrere Charts, die quasi gestapelt sind.
220
Loess oder Lowess steht für locally weighted regression und bezeichnet eine Kurve, die hilft Ab-
hängigkeiten zwischen zwei Variablen als Kurve darzustellen. (Vgl. Cleveland (1994), S. 168–
180)
221
Eine Methode um ein Histogramm mittels einer parametrisierten Kurve anzunähern. (Vgl.
Verzani (2002), S. 18)
222
Das Streuen von Plotsymbolen um etwaige Überlappungen besser sichtbar zu machen. Stellen
Sie sich 20 Datenpunkte vor, die in einem Diagramm aber nur als 5 Punkte zu sehen sind.
Durch Jittering kann man die Punkte so darstellen, dass man — als Beispiel — am Maximum
durch geringe Verschiebungen eine Häufung von 15 Punkten sehen kann, die ein und den
selben Datenwert haben.
76

Die Liste bildet nur einen Ausschnitt aus dem aktuellen Geschehen. Die Auswahl
wurde vom Autor unter dem Gesichtspunkt getroffen, dass diese Darstellungsar-
ten und Werkzeuge Vorteile in üblichen Reportings und ähnlichen Dokumenten
aus dem Büroalltag darstellen.

Abschließend wurde erhoben, ob die Tabellenkalkulationen in den Standarde-


instellungen lügen und der Lügenfaktor berechnet (siehe auch Seite 46). Dies
geschah für Balkendiagramme.

7.4 Getestete Software

Microsoft223 hat zu Beginn dieses Jahres sein neues Büropaket Microsoft Of-
fice 2007 veröffentlicht. Die Oberfläche wurde komplett überarbeitet und es soll
herausgefunden werden, ob es auch Änderungen in der Diagrammerzeugung der
Tabellenkalkulation Microsoft Excel 2007 gegeben hat.

Neben dieser neuen Version sind auf dem Markt noch die Vorläuferversionen ver-
breitet, wie Microsoft Office 2003 beziehungsweise dessen Vorgänger Office XP.
Die Diagramm-Engine hat sich in den erwähnten Vorgängerversionen von Office
2007 nicht geändert. Microsoft hält im Augenblick 90% der Marktanteile der Offi-
cesoftware224 und die Auswahl dieser Software ist somit berechtigt. Die Auswahl
einer zweiten Version ist insofern berechtigt, als Microsoft Office einen Quasi-
standard in der Kommunikation zwischen Firmen und Privaten darstellt. Es ist,
durch die Änderung des Dateiformates, nur eine Frage der Zeit, bis der Großteil
der Firmen beginnt auf die Fassung 2007 umzusteigen. Die Tabellenkalkulation
heißt Excel.

Microsofts größter Konkurrent ist die frei verfügbare Open Office Suite von
OpenOffice.org.225 Im März 2007 wurde die Version OpenOffice.org 2.2 relea-
sed. OpenOffice baut auf Suns226 StarOffice auf, ist aber zum Unterschied von
diesem unter einer Open-Source-Lizenz227 frei verfügbar. Das Betrachten dieses
Softwarepakets hat den Vorteil, dass es (1) bei Privatanwendern weit verbreitet

223
http://www.microsoft.com/
224
Vgl. http://futurezone.orf.at/it/stories/173727/ abgerufen am 23.02.2007
225
http://www.openoffice.org/
226
http://www.sun.com/
227
Eine Open Source Lizenz erlaubt die Weitergabe und Bearbeitung des Quellcodes, solange
dieser wieder frei zur Verfügung gestellt wird. Es existieren mehrere Varianten dieser Lizenz.
Vgl. http://www.opensource.org
77

ist und (2) Bestandteil jeder größeren Linuxdistribution ist. Weiters existiert es
in einer Version, die von USB-Stick gestartet werden kann.228 Die Tabellenkalku-
lation heißt Calc.

Als Referenz werden Abbildungen verwendet die mit R erstellt wurden. R ist kei-
ne Tabellenkalkulation, sondern eine Implementierung der Statistikprogrammier-
sprache S 229 von R Development Core Team230 , die unter einer Open-Source-
Lizenz läuft. R besitzt ein starkes grafisches Modul, ist durch Module erweiterbar
und läuft in einer eigenen Kommandozeilenumgebung.231 Durch die Orientierung
an der Kommandozeile ist in dieser Software nur ein Minimum zu erwarten, da
viele Einstellungen erst durch explizites Aufrufen entstehen respektive beeinflusst
werden. Beispiel: Raster. R entwickelt sich gerade zum Standardvisualisierungs-
und Berechnungstool für den akademischen Bereich. Es existiert ein Datenin-
terface mit Microsoft Excel.232 Die mit R erzeugte Referenzgrafik dient als Ver-
gleichsbasis für ein zu erwartendes Minimum.

Wir werden also folgende drei Softwarepakete mit dem Kriterienkatalog und ge-
geneinander vergleichen:

1. Microsoft Excel 2007


2. Microsoft Excel 2003
3. OpenOffice.org Calc 2.2

und als Referenz werden wir folgendes Produkt benutzen:

1. R 2.4.1

7.5 Kriterienkatalog

Diese Kriterientabelle stellt den Stand der Dinge dar und erhebt keinen Anspruch
auf Vollständigkeit. Problematisch ist das Einpflegen der Prinzipien in diese Ta-
belle. Manche dieser Gestaltungsregeln sind auf Elemente anwendbar, andere hin-

228
Vgl. http://www.portableapps.com/
229
Es existieren auch kommerzielle Versionen von S, deren wichtigste S-Plus von Insight ist.
230
http://www.r-project.org/
231
Es existieren auch grafische Benutzeroberflächen, die aber meist nur die gängigen Parameter
der gängigen Berechnungen und Visualisierungen abbilden.
232
Für Details sind zu finden bei http://mailman.csd.univie.ac.at/mailman/listinfo/rcom-l
78

gegen sind sehr allgemein geschrieben oder befassen sich mit Überlegungen zu den
Daten. Sie sind Ratschläge.

Zu dem existieren Widersprüche, wie zum Beispiel bei der Thematik Tickmarks
#305 und #306.233 Beide Kriterien haben Ihre Berechtigung und sind das Ergeb-
nis verschiedener Argumentationslinien und verschiedener Kontexte.

Zeigen die Tickmarks nach innen, sind die Werte besser abzulesen, weil sie mit
den Elementen in der Grafik gruppieren. Zeigen die Tickmarks nach außen, grup-
pieren sie besser mit Ihrer eigenen Beschriftung und können nicht zu unerwünsch-
ten Effekten führen. Sie können zum Beispiel nicht mit den Elementen auf der
Achsenfläche in Konflikt geraten. In der Folge entsteht durch die Wahl oder die
Erfüllung eines Kriteriums eine Abhängigkeit anderer Kriterien, die dann erfüllt
oder nicht erfüllt werden müssen.234

Die Kriterien #210 und #211 — sie behandeln die Begriffe Achsenfläche und Da-
tenfläche — setzen voraus, dass es einen Unterscheidung zwischen den Begriffen
in der Software gibt. Es existieren Kriterien die Legende betreffend und das Kri-
terium #518 besagt, dass die Daten direkt zu beschriften sind und keine Legende
verwendet werden soll.

#103 behandelt die Tatsache, dass viele Daten in eine kleine Menge gepackt
werden können. Dies entspricht zwar einer Möglichkeit und könnte mit der Data-
Ink-Ratio (siehe Gleichung 6) berechnet werden, ist aber von der Art der Daten
abhängig. Daten auf Nominalskalen benötigen schon wegen der Beschriftung mehr
Platz als Streudiagramme. #101 verlangt die Werte der y-Achse den zu zeigenden
Effekten anzupassen. Bei Nominalskalen findet man sehr oft die Kategorien auf
der y-Achse, aber keine Funktionswerte. #101 impliziert auch, dass ein Achsbruch
notwendig sein könnte, um die Effekte zu zeigen und #207 verlangt Proportiona-
lität.

Die Kriterien #106 und #110 gehen davon aus, dass mehrere Datenreihen abge-
bildet werden. #111 und #107 gehen davon aus, dass Symbole zum plotten von
Daten verwendet werden und sich diese überlappen.

233
Um beide Kriterien zu erfüllen, müssten die Tickmarks weder nach innen noch nach außen
zeigen, sind also praktisch nicht vorhanden.
234
Die Kriterien der Tickmarks stehen im Zusammenhang mit den Elementen, sowie der Achsen-
bzw. Datenfläche.
79

Und es existieren nicht anwendbare Kriterien, wie zum Beispiel #100: Die Daten-
grafik soll, wenn es möglich ist, ein Querformat aufweisen. Ergo sind die Kriterien
Ratschläge, beziehungsweise eine Reaktion auf Datenstrukturen, wie zum Beispiel
alle Achsenkriterien in Tabelle 12, die mit logarithmischer Skalierung oder einem
Achsenbruch zu tun haben. Ebenso verhält sich der Sachverhalt mit den Beschrif-
tungskriterien in Tabelle 15.

Die Kriterien sind in diesem Sinne, auch wegen der Widersprüche, wieder Ge-
staltungsprinzipien und somit nicht wissenschaftlich eindeutig auswertbar, da sie
Empfehlungen der Autoren darstellen und deren Erfahrungen aus konkreten An-
wendungen widerspiegeln. Die Grenze zwischen Gestaltungskriterium und Prin-
zip ist zu sehr abhängig von der Datenstruktur, welche Visualisierungsmethode
gewählt wurde und vor allem, ob die Abbildung explorativ oder kommunikativ
verwendet wird.

Der erarbeitete Kriterienkatalog kann unter diesen Bedingungen nicht objektiv


angewandt werden; beziehungsweise hätte eine Anwendung des Kriterienkatalogs
keine allgemein gültige Aussage.

7.6 Farbe und die Tabellenkalkulationen

7.6.1 Rahmenbedingungen

Es gibt eine Reihe von Bedingungen die Farbe betreffend und es wäre interessant
eine relativ eindeutige zu finden und auszuwerten.

Grundsätzlich entwirft jede der Tabellenkalkulationen in den Standardeinstellun-


gen die Grafiken in Farbe. Dies ist ein messbares Kriterium. In Tabelle 16 ist das
Kriterium #602 zu finden. Direkte Widersprüche konnten keine gefunden wer-
den. Einschränkungen sind aber auch hier zu setzen. Der Einsatz von Farbe ist
nicht vorauszusetzen, auch wenn alle Tabellenkalkulationen bei der Generierung
von Grafiken so handeln als ob. So existiert die Empfehlungen so wenig Farbe als
möglich zu verwenden (vgl. Kriterium #604).
80

A
B
C
D
E
F

A
B
C
D
E
F

A
B
C
D
E
F

3 1

4 6

Abbildung 27: Die ersten 6 Farben im Tortendiagramm: bei Excel 2003, Calc 2.2,
Excel 2007 und R (von oben nach unten): Gut zu erkennen sind
die Farben und der Drehsinn bei Excel 2003 und Calc 2.2.
81

7.6.2 Durchführung

Im Folgenden sieht man wie die ersten 6 Farben in den unterschiedlichen Büro-
paketen verarbeitet werden und ob sie dem Kriterium #602 „Die sechs Farben,
die der Mensch am besten unterscheiden kann sind rötliches Purpur, Blau, gelbli-
ches Grau, gelbliches Grün, Rot und bläuliches Grau“ 235 entsprechen. Um dies zu
erreichen werden Kreisdiagramme mit 6 gleich großen Sektoren generiert und die
Farben betrachtet. Die Erstellung basiert auf der Tatsache, dass Farben immer
in der selben Reihenfolge angewandt werden.236 Die Sektoren werden mit den
ersten sechs Buchstaben des Alphabets gekennzeichnet um auch die Reihenfolge
zu erkennen.

In Abbildung 27 ist gut zu erkennen, wie sowohl Excel 2003 als auch Calc 2.2 die
Sektoren von der 12 Uhr-Position aus zählen. Während Excel 2003 im Uhrzei-
gersinn arbeitet, bewegt sich Calc 2.2 in die Gegenrichtung. Die Farben sind bei
beiden identisch (siehe auch Tabelle 8).

Die anderen Farben bei Excel 2007 sind nicht nur auf das geänderte Bedienungs-
konzept zurückzuführen. Excel unterstützt in der neuesten Version mehr Far-
ben.237 Diese werden mitunter dazu benutzt realistischere 3D-Effekte zu zeigen.
Es ist fragwürdig, die Standardeinstellungen von Excel 2007 auszuwerten, weil
gerade im Hinblick auf Farben, das neue Officepaket mehrere Paletten und eine
ausgereifte Vorschau vorzuweisen hat, die es dem Benutzer erleichtert, schnell ein
neues Design auszuprobieren. Belässt man es bei der Standardfarbpalette und
verändert das Subschema nicht, so erhält man eine Kreisdiagramm, wie in Abbil-
dung 27 zu sehen ist.

7.6.3 Auswertung

Alle Grafiken wurden mittels des virtuellen Druckers pdf-Creator 0.80238 in Pdf-
Dokumente gedruckt und schliesslich die Farben mittels der Farbpipette des Bild-

235
Vgl. Kosslyn (2006), S. 159.
236
Sollten 6 Liniendiagramme erzeugt werden, wären die verwendeten Farben identisch mit den
Farben der Kreisdiagramme.
237
Die Anzahl der Farben wurde von 56 auf 4’294’967’296 erhöht (online abgerufen am 17.03.2007
von http://www.xlam.ch/ExcelLim.htm). Weitere Änderungen umfassen die Tickmarks und
die Programmierbarkeit (Vgl. Office IT and Servers User Assistance (2006), S. 118–120)
238
http://www.pdfcreator.de.vu/
82

bearbeitungsprogramms Gimp v2.2.13 239 ausgelesen. Die Ergebnisse sind in Ta-


belle 8 nachzulesen. Wie zu erkennen ist, sind die Farben bei Calc 2.2 und Ex-
cel 2003 wirklich identisch. Beide Microsoftprodukte drehen im Uhrzeigersinn,
die anderen beiden dagegen. Weiters ist ersichtlich, dass die Tabellenkalkulatio-
nen bei 12 Uhr zu zeichnen beginnen, wobei die Statistiksoftware R bei 3 Uhr
beginnt. Den Referenzwinkel bei 12 Uhr und 3 Uhr anzusetzen ist üblich.240

Excel 2007 Excel 2003 Calc 2.2 R


1.Farbe 212,59,65 240,40,100 240,40,100 0,0,100
2.Farbe 2,61,67 330,67,60 330,67,60 192,25,90
3.Farbe 79,53,65 60,20,100 60,20,100 6,12,100
4.Farbe 267,38,56 180,20,100 180,20,100 180,12,100
5.Farbe 193,63,69 300,100,40 300,100,40 240,8,98
6.Farbe 27,72,86 0,50,100 0,50,100 48,14,100
Ab 12 Uhr 12 Uhr 12 Uhr 3 Uhr
Sinn Positiv Positiv Negativ Negativ

Tabelle 8: Ausgemessene Farbwerte in HSL (Hue[◦ ],Saturation [%],Lightness [%])

Excel 2007 weist, wie in Abbildung 27 zu sehen ist, dunkle deckende Farben
auf. Ganz im Gegensatz zu R, dass 5 Pastelltöne verwendet und einen Sektor
in Weiß gesetzt hat. Es handelt sich offensichtlich in allen 4 Fällen nicht um
die 6 Farben, von denen in Kriterium #602 die Rede ist. Die Unterscheidbarkeit
beim Druck in Graustufen ist bei Excel 2003 und Calc 2.2 am besten, wie Sie in
Abbildung28 sehen können. Excel 2007 bietet gleichmäßige Farben, die bei einer
Wiedergabe in Farbe gleichmäßig erscheinen und somit Fehlabbildungen durch
Helligkeitsdifferenzen vermeiden.

R packt zwar helle Töne in die Grafik, bietet aber durch die vorhandene Farb-
sättigung zumindest für die ersten drei Sektoren genügend Unterscheidung. Wie
man in Abbildung 29 sehen kann, bietet Excel 2007 noch Subfarbschemata unter
Zuhilfenahme des ausgemessenen Grundschemas, erweitert um eine Variante in
Graustufen. Da hier eine Variation in der Helligkeit der Farben stattfindet, sind
die unifarbenen Varianten und die Graustufen besser auf einem Monochromdru-
cker wiedergegeben als die sechsfarbige Variante.

Das Kriterium — die Verwendung der 6 Farben rötliches Purpur, Blau, gelb-
liches Grau, gelbliches Grün, Rot und bläuliches Grau — ist von keinem der
Testkandidaten erfüllt worden. Die in Excel 2007 verwendeten Farben lassen eine
239
http://www.gimp.org/
240
Vgl. Harris (1999), S. 282ff.
83

Abbildung 28: Vergleich zwischen Farbe und S/W: Die jeweils obere der beiden
Zeilen stellt Office 2007 dar, die untere Office 2003 bzw. Calc 2.2.
Es wurde mittels pdf-Creator im unteren Teil ein monochromer
Laserdrucker simuliert.
84

Abbildung 29: Farbschemata bei Excel 2007: Die Farbschemata sind in einer Ma-
trix mit Designvariationen ausgekreuzt und basieren auf den neuen
Grundfarben (Screenshot des Autors).

Darstellung mit gleicher Helligkeit zu und unterstützen so die gleichmäßige Inter-


pretation der Elemente, soweit diese in Farbe ausgegeben werden. Die Darstel-
lungen in Excel 2003 und Calc 2.2 bieten höhere Unterscheidungsmöglichkeiten
beim monochromen Druck und erleichtern die Unterscheidbarkeit von eingefärb-
ten Elementen. Nicht berücksichtigt wurden Effekte, die auf die Struktur der
Daten zurückzuführen ist.

7.7 Neuerungen und die Tabellenkalkulationen

7.7.1 Dotplot

Der Dotplot ist, wie bereits ausgeführt, eine gute Alternative zu Kreisdiagramm
und geteiltem Balkendiagramm. Er bietet den Vorteil die Werte, das sie an ei-
ner gemeinsamen Achse ausgerichtet sind, genauer zu vergleichen. Außerdem las-
sen sich auch negative Werte darstellen, was bei Kreisdiagrammen nicht möglich
ist.241

Die Methode ist schon länger bekannt, in technischen Kreisen weitgehend verbrei-
tet. Von allen Kandidaten beherrscht nur R den Dotplot als native Funktionalität.
Für Excel 2003 existiert ein Makro, dass hilft Dotplots zu erstellen.242 Es basiert
241
Außer in seltenen Fällen. Vgl. Harris (1999), S. 282.
242
Download des Excelmakros über http://peltiertech.com/Excel/Charts/DotPlot.htm (online
abgerufen 01.04.2007)
85

auf dem Überlagern zweier Diagramme, wobei ein Balkendiagramm dazu benutzt
wird, die Führungen für die Punkte zu zeichnen und ein zweites um die Punkte
ans Ende zu setzen.

7.7.2 Panelcharts

Auch die Panelcharts sind, außer in R, nur schwer technisch realisierbar. Von
vornherein existiert in den untersuchten Tabellenkalkulationen keine Vorlage. Das
Stapeln und Anordnen der Grafiken muss von vornherein geplant sein um die
Achsen aufeinander abzustimmen. Als Alternative bieten sich Prozeduren an, die
diese Grafiken annähernd erstellen.243

7.7.3 Sparklines

Die Verkleinerung von Grafiken wird insofern unterstützt, als sie möglich ist. Es ist
aber, um ein lesbares Ergebnis zu bekommen, viel Einstellungsarbeit notwendig.
Als Alternative zur manuellen Erarbeitung bieten sich Anbieter von kommerziel-
len Plug-Ins für Microsoftprodukte an, die mittels eigener Schriftarten arbeiten
und nicht mit den eingebauten Diagrammen.244

In Excel 2007 besteht zwar die Möglichkeit den Hintergrund der Zellen über die
bedingte Formatierung mit horizontalen Balken zu füllen, die im Verhältnis zum
Zellenwert stehen. Allerdings leidet die Lesbarkeit darunter und die Methode mit
einer Formel der Art =wiederholen(”|”;A1/10)245 in einer separaten Zelle bietet
den Komfort, das man die Laufweite der Balken auf seine Wünsche anpassen kann.
Dies entspricht zwar nur der klassischen Strichliste, bietet aber die Möglichkeit,
Größen innerhalb der Tabelle zu visualisieren, die dann auch beim Sortieren der
Tabelle erhalten bleiben und nicht mit der Zahl in Interaktion treten.

243
Einen guten Überblick findet man bei http://processtrends.com/toc_panel_charts.htm (on-
line abgerufen 01.04.2007)
244
Zum Beispiel mit den Produkten von http://www.bonavistasystems.com und
http://www.bissantz.de/sparkmaker/index_de.asp (online abgerufen 01.04.2007)
245
Das ist Excel- und Calcsyntax. Die Komponente A1/10 wurde willkürlich gewählt. Der Divisor
demonstriert allerdings eine Art Maßstab, der auf Werte angewandt werden sollte. Etwaige
Reste der Division werden nicht dargestellt.
86

7.7.4 Aktuelle Funktionalitäten

Die Benutzerführung des Diagrammelements Näherungsfunktion wurde in Ex-


cel 2007 überarbeitet und nicht erweitert. Calc 2.2 kennt auch Näherungslinien,
allerdings auch keine aktuelle Technik.

Erwähnenswert ist noch, dass der Boxplot sowohl bei Calc 2.2 als auch bei Ex-
cel 2003 und Excel 2007 keine Standardform einer Grafik ist. Wieder existieren
für die Microsoftprodukte Workarounds246 und mehrere Plug-Ins247 . Für Calc 2.2
können die Workarounds nachgemacht werden, da sie entweder auf einer allge-
meinen Kursgrafik oder gestapelten Diagrammen beruhen.

Um in Excel Multidisplays zu imitieren existiert ebenfalls ein hilfreiches Plug-In,


dass auch den Export als Bild gestattet.248

Verbessert wurde in Excel 2007 die Unterstützung logarithmischer Skalen, für


die nun über die Benutzerführung eine beliebige Basis gewählt werden kann. Die
Voreinstellung ist 10. Eine Voreinstellung für natürliche Logarithmen auf der
Basis der Eulerschen Zahl e ist nicht vorgesehen und muss von Hand eingegeben
werden.

246
Bei Microsoft findet man ein Workaround über eine Kursgrafik unter
http://support.microsoft.com/kb/155130/de (abgerufen 13.04.2007) und basierend auf
gestapelten Balkendiagrammen sowohl horizontal als auch vertikal anwendbar bei
http://peltiertech.com/Excel/Charts/BoxWhisker.html (abgerufen 13.04.2007). In bei-
den Fällen werden keine Ausreißer unterstützt, weil die Werte des Boxplots vorab berechnet
werden müssen. Sowohl Excel als auch Calc besitzen Berechnungsroutinen für die Kennwerte
Median, Quartile und Minimum/Maximum.
247
Wobei von den frei verfügbaren Plug-Ins die Versionen http://www.learn-
line.nrw.de/angebote/eda/medio/tipps/boxfunktion.htm (abgerufen 13.04.2007) und
http://peltiertech.com/Excel/Charts/BoxWhisker.html (abgerufen 13.04.2007) interessant
sind. Beide unterstützen in den vorliegenden Fassungen keine Ausreißer. Das ist auf die
Tatsache zurückzuführen, dass die Werte des Boxplots berechnet werden und nicht die
Rohdaten als Basis benutzt werden.
248
http://j-walk.com/ss/excel/files/charttools.htm (abgerufen 13.04.2007). Auf der Seite von
John Walkenbach findet sich auch ein Tool um Konturplots mit Excel zu erstellen:
http://www.j-walk.com/ss/excel/files/gradcontour.htm (abgerufen 13.04.2007).
87

7.8 Lügenfaktor und die Tabellenkalkulationen

7.8.1 Rahmenbedingungen

Der Lügenfaktor (Lie-Factor) wurde schon auf Seite 46 als Quotient aus tatsäch-
licher und dargestellter Veränderung vorgestellt. In Gleichung 9 ist eine formali-
sierte Form zu sehen, in der Lf der Lügenfaktor ist, und ∆g die relative Änderung
in der Grafik und ∆d die relative Änderung in den Daten beschreibt. ∆ versteht
sich zwingend als relative Änderung wie in Gleichung 10 formuliert.

∆g
Lf = (mit∆d 6= 0) (9)
∆d

| x2 − x1 |
∆= (10)
x1
Daraus folgen drei mögliche Ergebnisse:

Übertreibung: ∆d < ∆g ↔ Lf > 1


Der Grafische Effekt vergrößert Relationen in den Daten und stellt somit
eine übertriebene Fassung der Datenrealität dar.
Korrekte Wiedergabe: ∆d = ∆g ↔ Lf = 1
Wenn die Effekte überein stimmen, werden die Daten korrekt wiedergege-
ben.
Untertreibung: ∆d > ∆g ↔ Lf < 1
Wenn die Relationen in den Daten größer sind als die Relationen in der
Grafik wird eine Untertreibung dargestellt.

Es wird ausgeschlossen, dass Wahrnehmungsfehler in die Untersuchung mit ein-


fließen. Wahrnehmungsfehler wie in Abbildung 30 zu sehen sind, waren nicht Ge-
genstand der Untersuchung. Obwohl es sich hier um ein klassisches Beispiel für
eine zu erwartende Fehlinterpretation handelt, ist der dargestellte Effekte gleich
dem Effekt in den Daten.

Es gilt festzustellen, dass der Lügenfaktor nur über die informationsvermittelnde


Variable zu messen ist. Und die Veränderung wird immer als gesamtes wahr-
genommen. Ändert man also zwei Dimensionen eines Plotsymbols, so wird die
Veränderung von Fläche wahrgenommen.
88

1000

1000
800

800
600

600
f(x)

f(x)
400

400
200

200
0

0
0 2 4 6 8 10 0 2 4 6 8 10

x x

Abbildung 30: 2 Kurven mit und ohne Raster: Obwohl es so aussieht, als ob
beide Kurven sich einander annähern, handelt es sich hier um die
Funktion f (x) = x3 und die Funktion f (x) = x3 + 100. Es sind
also zwei identische Kurven, wobei eine um 100 Einheiten die y-
Achse hinauf geschoben wurde. Der Abstand ist somit konstant
100. Der Raster bietet zwar Hilfe, kann aber nicht dazu beitragen
die konstante Differenz zu betonen.

7.8.2 Durchführung

Es wurde angenommen, dass beim Vorhandensein von positiven und negativen


Werten N ull auf jeden Fall Teil der y-Achse sein wird und somit eine korrekte
Abbildung vorhanden sein wird.

Es bleibt der Fall zu behandeln, in dem die Funktionswerte 249 entweder alle
positiv oder negativ sind. In einem ersten Durchlauf wurde das Verhalten mit
Werten untersucht, die sowohl ungefähr Null, als auch deutlich größer gewählt
wurden. Die Auswahl der Zahlen war willkürlich.

17 170 123 125 154 1 2 3 120

Tabelle 9: Werte für den 1.Test des Lügenfaktors

In Abbildung 31 findet man die Ergebnisse für die Auswertung mit den 9 Wer-
ten aus Tabelle 9. Es ist zu erkennen, dass die Werte unterscheidbar dargestellt
werden. Auch die Werte, die ungefähr Null entsprechen sind unterscheidbar.

249
Das sind die Werte, die auf der y-Achse aufgetragen werden.
89

Diagrammtitel 180
180

160
160

140
140

120
120

100
100
Reihe1

Datenreihen1 80
80

60
60

40
40

20
20

0
0 1 2 3 4 5 6 7 8 9
1 2 3 4 5 6 7 8 9

Haupttitel
180

150
160

140

120

100
100
Spalte A
80

60
50

40

20

0
0

Zei- Zei- Zei- Zei- Zei- Zei- Zei- Zei- Zei-


le 1 le 2 le 3 le 4 le 5 le 6 le 7 le 8 le 9

Abbildung 31: Test 1: Balkendiagramme mit den Werten aus Tabelle 9: Von links
oben, nach rechts unten sind die Darstellungen von Excel 2007,
Excel 2003, Calc 2.2 und R 2.4.1

Die Darstellungen entsprechen einem Lügenfaktor von 1. Das entspricht den Ef-
fekten in den zu Grunde liegenden Daten und bedeutet keine Verzerrung in der
Darstellung.

Im nächsten Schritt wurde versucht, neun Werte rund um den Wert 5 zu gruppie-
ren. Dies geschah im Intervall ±10% ohne die Grenzen des Intervalls miteinzube-
ziehen, 5 bildet den Mittelwert. Tabelle 10 zeigt die Werte der Reihe im Detail.

4,8 5 5,2 5,3 4,9 5,1 5,4 4,6 4,7

Tabelle 10: Werte für den 2.Test des Lügenfaktors

Wie in Abbildung 32 zu erkennen ist, arbeiten die verschiedenen Tabellenkal-


kulationen unterschiedlich. Der Schnittpunkt der y- mit der x-Achse liegt bei R
90

5,6
5,6

5,4
5,4

5,2
5,2

5
5

Reihe1
Datenreihen1
4,8 4,8

4,6 4,6

4,4
4,4

4,2
4,2 1 2 3 4 5 6 7 8 9
1 2 3 4 5 6 7 8 9

Haupttitel
5,5

5
5
4,5

4
4
3,5
3

3
2,5 Spalte I

2 2

1,5
1
1

0,5
0
Zei- Zei- Zei- Zei- Zei- Zei- Zei- Zei- Zei-
0

le 7 le 8 le 9 le le le le le le
10 11 12 13 14 15

Abbildung 32: Test 2: Balkendiagramme mit den Werten aus Tabelle 10: Von links
oben, nach rechts unten sind die Darstellungen von Excel 2007,
Excel 2003, Calc 2.2 und R 2.4.1

und Calc nach wie vor bei 0. Bei Excel hingegen lässt sich erkennen, dass dieser
Schnittpunkt einen Wert ungleich Null trägt (siehe dazu auch Abbildung 33).

Ausgehend von der Tatsache, dass im ersten Test die Werte im Bereich 1 bis 170
lagen und der Mittelwert bei 79,44 war und der Lügenfaktor 1 betrug, lässt sich
folgendes schließen: Excel schränkt den dargestellten Wertebereich ein, wenn die
Werte nicht über einen gewissen Prozentsatz vom Mittelwert abweichen.

Im vorliegenden Fall von Excel 2007 (siehe Abbildung 33) liegt der Lügenfaktor
zwischen 0,1/0,4
0,1/4,6
= 11, 5 (beim Vergleich 4,6 und 4,7) und 0,8/1,2
0,8/4,6
= 3, 83 (beim
Vergleich 4,6 und 5,4). Der erste Fall ist allerdings abhängig von der Struktur der
Daten. Betrachtet man die Grenzen bedeutet dies ein Lügenfaktor von mindestens
3,8 und somit eine Übertreibung.
91

5,6

5,4

5,2

Datenreihen1

4,8

4,6

4,4

4,2
1 2 3 4 5 6 7 8 9

Abbildung 33: Grundlage für die Berechnung des Lügenfaktors bei Excel 2007

7.8.3 Untersuchung des Lügenfaktors im Detail.

Recherchen ergaben, dass der Mindestwert der Achse bei Excel ab Version 97 vom
Verhältnis zwischen ymax und ymin abhängt.250 Das Minimum der y-Achse ist 0,
wenn die Differenz der abgebildeten positiven Extrema ymax und ymin größer als
16,667% von ymax ist (siehe Gleichung 11). In der Folge werden 16,667% als 16
dargestellt um die folgenden Berechnungen zu erleichtern.

1
∆y = ymax − ymin > ymax (11)
6

Ist ∆y kleiner als 16 ymax wird das Minimum der y-Achse auf einen Wert y0 gesetzt,
der kleiner oder gleich dem Ergebnis aus Gleichung 12 ist. Kleiner oder gleich,
weil der Wert dem Bemaßungsschema angepasst wird.

y0 = ymin − ((ymax − ymin )/2) (12)

250
http://www.xlam.ch/xlimits/charts.htm online abgerufen am 14.04.2007
92

Wenn es sich um einen Scatterplot oder ein Blasendiagramm handelt werden die
Werte automatisch auf einen Wert kleiner oder gleich ymin gesetzt.

Unter den Annahmen, dass (1) alle y-Werte positiv sind, (2) die Kriterien für ein
Verschieben des Ursprungs gerade erfüllen und (3) in der Folge Lf einen Wert
annimmt (der ein Grenzwert oder ein Mindestwert sein kann) ergeben sich für
den Dividenden und den Divisor die folgenden Werte:

ymax , ymin > 0 (13)


1
ymax − ymin = ymax (14)
6
ymax − ymin
∆d = (15)
ymin
(ymax − y0 ) − (ymin − y0 )
∆g = (16)
ymin − y0

Durch Umformen und Zusammenführen der Gleichungen ergibt sich schliesslich


für den (Lügenfaktor) Lfmin in Gleichung 20.

1
y0 = ymin − ymax (17)
12
1
ymax
∆d = 6 (18)
ymin
1 1
(ymax − ymin + 12 ymax ) − (ymin − ymin + 12 ymax )
∆g = 1 =
ymin − ymin + 12 ymax
1
ymax − ymin y
6 max
= 1 = 1 =2 (19)
y
12 max
y
12 max
2 ymin
Lfmin = ∆g /∆d = 1 y = 12 (20)
6 max ymax
ymin

Weil aber ymax und ymin über y0 zusammenhängen ergibt sich schliesslich für
Lfmin , wie in Gleichung 21 zu sehen ist, 10.
5
ymin ymax
Lfmin = 12 = 12 6 = 10. (21)
ymax ymax

Das bedeutet, dass sich für Werte, die die Kriterien gerade noch erfüllen, die
Lügenfaktoren gegen 10 bewegen. Und das unter Betrachtung der Extrema: Also
dem größten eingegebenen Wert ymax und dem Kleinsten ymin .
93

1800

1600

1400

1200

1000 ymax
ymin
800 y0
Lf
600

400

200

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

Abbildung 34: ymax , ymin und y0 für Lügenfaktor

In einem letzten Schritt wurde mit einem fixen Wert ymax von 1000 von der
16,667%-Grenze weg ymin -Werte aufgetragen. Es wurden die y0 -Werte durch Er-
stellen von Grafiken ermittelt. Das Ergebnis ist in Abbildung 34 zu sehen. Die
exakten Werte finden sich im Anhang in Tabelle 17 auf Seite 110.

Wie zu sehen ist schrumpft mit abnehmender Differenz ∆y auch die Differenz
zwischen den Werten y0 und ymin , während der Lügenfaktor stark steigt.

Für alle Wertetripel wurden die Änderungen in den Daten und die Änderungen
in der graphischen Darstellung berechnet. Wie in Abbildung 35 zu erkennen ist,
verändert sich bei Annäherung von ymin an ymax vor allem der Bestandteil des
Lügenfaktors, der die Darstellung behandelt. Dies führt zu einem Lügenfaktor
von über 1000.

Dass der Lügenfaktor im untersuchten Fall unter 10 fällt, kann man auf die Ver-
schiebung von y0 zurückführen. Im Rechenbeispiel wurde ein Wert angenommen,
der quasi einem Maximum entspricht. In der Untersuchung wurde der von der
Software benutzte Wert y0 benutzt.
94

10000

Lf(y)
1000

y0 in % ymax
100

10

∆g
1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

0,1

0,01
∆d

0,001

Abbildung 35: Lügenfaktor und Bestandteile

Daraus folgt aber auch, dass wenn die Darstellung der verkürzten Achsen au-
tomatisch in die Grafik fließt, es automatisch zu Effekten in Größenordnungen
von Größer als 10 kommen kann. Speziell bei Werten, die sich sehr eng um einen
Wert bewegen (indem sie zum Beispiel um einen Wert oszillieren, wie das bei
Umsätzen der Fall sein kann) kommt es, ohne Zutun des Erstellers der Grafik, zu
Übertreibungen. Excel unterstützt auch in der neuen Version keine Achsenbrüche
und somit ist wieder das Können des Erstellers251 gefragt oder eine zusätzliche
Software notwendig um den Lügenfaktor zu dämpfen.

In Verbindung mit dem Weber-Fechnerschen Gesetz gewinnt man eine neue Per-
spektive: Will man die Unterschiede zwischen Werten darstellen und kann dies
nur unter Verwendung von verkürzte Achsen, wird der Lügenfaktor größer. Je
höher der Lügenfaktor ist, umso mehr muss eine Vergrößerung der Differenzen
stattfinden, um den Unterschied wahrzunehmen. In Abbildung 35 ist zu erkennen,
wie ∆g relativ gleichmäßig bleibt während sich ∆d verkleinert. Ein Algorithmus
in Excel 2007 optimiert die grafische Darstellung und der Lügenfaktor steigt in
erster Linie durch das Schrumpfen von ∆d .

251
http://peltiertech.com/Excel/Zips/BrokenYAxis.zip (online abgerufen 14.04.2007)
95

Ist der Kleinste der Werte 10% unter dem Größten, ist bei Excel 2007 mit Ver-
zerrungen in der Größenordnung weniger Zehnerpotenzen zu rechnen. Beträgt
der relative Unterschied nur noch 5% und schrumpft nähert sich der Lügenfaktor
schnell zwei Zehnerpotenzen, verhundertfacht sich also. Beträgt der Unterschied
nur noch 1% wird in Excel 2007 ein Lügenfaktor von 1665 erzeugt. In diesen
Größenordnungen kann, aber muss nicht, klar sein, dass man eine Vergrößerung
betrachtet. Ein Hinweis oder eine Betonung im Sinne des schon erwähnten Ach-
senbruchs ist hier wünschenswert.

7.9 Reflexion und Analyse

Die Tabellenkalkulationen aus der Analyse konnten nicht getestet werden, da je-
des Kriterium auf Annahme eines gewissen Kontextes aus Datenstruktur, Daten-
quantität und Darstellungsmethodik beruht und somit einen Ratschlag darstellt,
aber keine allgemeine Regel. Außerdem gab es bei den gesammelten Kriterien
Prinzipien, die sich widersprechen. Auf eine Auswertung wurde aus den ange-
führten Gründen verzichtet.

Den Tabellenkalkulationen fehlen grundlegende Mechanismen um mit größeren


Datenmengen abbildungstechnisch umzugehen. Dazu gehören darstellungsrele-
vante, wie etwa Banking und Jittering und berechnungsrelevante, wie etwa Loess
und Kerndichteschätzer.

Versuchsweise wurde ein Prinzip aus der Tabelle Farbe ausgewählt und unter-
sucht. Dieses wurde nicht erfüllt. Die Neuerungen auf dem Sektor der Visualisie-
rungen, die sich im Bereich der Technik schon durchgesetzt haben und im akade-
mischen Feld immer bekannter werden, sind nicht realisierbar oder nur unter der
Verwendung Produkte Dritter. Das mag auf der einen Seite am kaufmännischen
Fokus von Tabellenkalkulationen liegen und andererseits an der Tatsache, dass es
für die breite Masse noch nicht interessant ist.252 Zudem hat sich gezeigt, dass es
in den Standardeinstellungen von Excel zu Fehlabbildungen im Sinne von Tufte’s
Lie-Factor kommt. Der Lügenfaktor steigt bei abnehmender Differenz zwischen
den Werten deutlich mehr als linear an.

Manche der neueren grafischen Lösungen lassen sich mit Plug-Ins von Fremdan-
bietern oder Workarounds zumindest für die Microsoftprodukte realisieren. Die

252
Der Aufwand der Hersteller konzentriert sich üblicherweise auf Markterfordernisse.
96

Referenzsoftware würde einen Großteil visualisieren, ist jedoch für den Alltag und
den Großteil der Benutzer wegen der fehlenden Bedienungsoberfläche im Stile ei-
ner Tabellenkalkulation unbrauchbar.

Effektivität

Effizienz

Eleganz
Technologie & Werkzeuge

Schönheit

Kunst
Visualisierung Wirkliche Welt

Wissenschaft

Allgemeine Gesetze

Vorhersagekraft

Abbildung 36: Sichtweisen auf die Visualisierung als Disziplin (modifiziert nach:
Wijk (2005), S. 8) und Bewertungskriterien

Es folgt aus diesen Fakten, dass es am Wissen des Erstellers liegt, was er aus den
Daten macht. Die Randbedingung ist Technik.253

In Abbildung 36 ist ein Modell zu sehen, welches Sichtweisen auf die Visualisie-
rung als Disziplin darstellt. Die Technik ist eine von Ihnen. Jede dieser Sicht-
weisen — die technische, die wissenschaftliche und die künstlerische —weist ein
eigenes Bewertungsschema auf. Die technische Sicht verlangt Effektivität und Ef-
fizienz, die Wissenschaftliche allgemeine Gesetze und Vorhersagekraft, und die
Kunst strebt nach Schönheit und Eleganz. Alle diese Standpunkte wollen ernst
genommen werden.254 Die gute Visualisierung versucht alle diese Perspektiven
einzunehmen und im Kontext der Daten zu repräsentieren. Die Widersprüche
in den Kriterien könnten auch auf die verschiedenen Sichtweisen zurückzuführen
sein. Ein anderer Faktor ist die Interaktion der syntaktische Dimension der Grafik
mit der semantischen Dimension der Daten.

253
Wobei die Technik als Technologie und Werkzeuge zu verstehen ist.
254
Vgl. Wijk (2005), S. 8.
97

Was bleibt ist der Best Practice: „Graphing Data should be an iterative, experi-
mental process.255 Proofread your graphs.256 Strive for Clarity.257 “

255
Cleveland (1994), S.112.
256
Cleveland (1994), S. 63.
257
Cleveland (1994), S. 64.
98

8 Die Besonderheiten im Wissenstransfer mittels


Diagrammen

Wissenstransfer umfasst Sender und Empfänger als unabhängig voneinander agie-


rende Systeme. Ziel des Wissenstransfers ist es das Gelernte zu festigen und auf
andere Aufgaben zu verlagern. Diagramme dienen dem Untermauern von Argu-
menten und dem Transport von abstrahierten Daten. Diese Daten liegen in einem
standardisierten Kontext vor, den Sender und Empfänger gleichermaßen kennen
müssen. Im Hinblick auf Diagramme ist die Einbettung in verschiedene Umfelder
(alleine, mit oder im Text und gemeinsam mit anderen Grafiken), die wahrschein-
liche Asynchronität, die manchmal vorhandene Uneindeutigkeit bezogen auf den
oder die Empfänger und die Fixierung und Limitierungen des Übertragungsme-
diums.

Da die Diagramme visuell empfangen werden, unterliegen sie den Rahmenbedin-


gungen und Gesetzmäßigkeiten des Sehens. Als starke Einflussfaktoren sind die
Gestaltgesetze und das räumliche Sehen zu betrachten, weil diese grundlegende
Mechanismen sind. Besondere Vorsicht ist bei der Verwendung von Farben gege-
ben, da diese subjektiver Interpretation unterliegen und nicht für jede Art von
Information gleichermaßen geeignet sind.

Diagramme können in Ihren klassischen Formen verschiedene Arten von skalier-


ten Informationen befördern und auf mehrere Arten in Ihre Bestandteile zerlegt
werden. Diese Zerlegung gibt jedoch keinen Aufschluss über die Tatsache, wie das
Diagramm zu seiner guten Form kommt.

Die Aussage von Datengrafiken können eine analytische oder eine kommunikative
Dimension enthalten, je nach Verwendungszweck. Außerdem sind die Daten ein
Bestandteil der Grafik, in dem sie durch Ihre semantische Dimension die Form und
Art der Grafik mit beeinflussen. Diagramme sind dazu geeignet Zusammenhänge
und Veränderungen darzustellen, nur beschränkt um Werte zu kommunizieren.

Darstellungsfehler bei Diagrammen sind vor allem auf falsche Dimensionierung


und Wahrnehmung zurückzuführen. Im Zusammenhang mit den untersuchten Ta-
bellenkalkulationen wurden Tendenzen zu Übertreibungen in bestimmten Werte-
bereichen gefunden. Diese Übertreibung sind Teil der Standardeinstellungen.
99

Von 3d-Darstellungen ist abzuraten, da sie große Fehlerquellen in der Wahrneh-


mung darstellen. Oft hat die dritte Dimension ohnehin nur eine schmückende
Funktion. Allerdings sei noch einmal betont, dass nur der Hinweisreiz der Ver-
deckung genügt um Räumlichkeit zu implizieren. Wir sehen eigentlich immer
räumlich.

Zu den klassischen Diagrammtypen sind in den letzten Jahren neue Darstellungs-


typen hinzugekommen, die Schwächen der Populären ausgleichen und die Verar-
beitung von komplexeren Daten zulassen. Es ist ein Trend zur Verkleinerung und
Vervielfachung festzustellen, der auf die neuen Medien und technische Möglich-
keiten zurückgeführt werden kann. Die Vervielfachung dient nicht nur dazu, um
mehrere Sichtweisen und Variablen darzustellen, sondern kann auch helfen zeitli-
chen Verlauf zu zeigen.

Von der Vielzahl an Gestaltungsprinzipen und Beispielen in der Literatur kann


sich der Ersteller von Diagrammen leiten lassen, es existieren jedoch keine allge-
meinen Kriterien oder Gesetze, mit denen man eine Grafik guter Form erstellen
kann. Dies ist darauf zurückzuführen, dass die syntaktische Dimension der Grafik
mit der semantischen Dimension der Daten interagiert und somit zu Handeln im
Kontext zwingt.

Es bleibt als Empfehlung die visuelle Gestaltung der Daten (1) auf das Ziel-
publikum maßzuschneidern, (2) auf den Zweck der Visualisierung abzustimmen
(explorativ oder kommunikativ)258 und (3) den Prozess der Gestaltung iterativ zu
gestalten und im Vorfeld mehrere Arten der Darstellung in Erwägung zu ziehen.
Datengrafiken sollten auch als Absatz behandelt werden.

Die Visualisierung für ein größeres Zielpublikum ist im Kontext von Wissenschaft,
Technik und Kunst zu betreiben, um den vielfältigen Sichtweisen gerecht zu wer-
den. Diese Sichtweisen bieten verschiedene Werkzeuge, Kriterien und Ziele um
ein optimales Ergebnis zu erzielen.

Das letzte Viertel des 20. Jahrhunderts hat einige Neuerungen gebracht und stand
im Zeichen der hochdichten Daten und neuer grafischer Methoden, vor allem für
computergestützte Anwendungen. Außerdem wurden Visualisierungswerkzeuge

258
Analog dazu bietet sich ein Beispiel aus der Wirtschaft: Die Zahlen in Reports für die Unter-
nehmenssteuerung sind anders aufbereitet als die Zahlen in einer Bilanz und trotzdem sind
beide Informationen über ein Unternehmen.
100

einer breiten Öffentlichkeit zugängig. Aufgrund der Recherche lassen sich folgende
Trends ableiten:

• Wegen der verbesserten Methoden im Bereich der Computergrafik wird es


verstärkt zur Erforschung und zum Einsatz von 3d-Grafiken kommen. Es
ist auch mit verschiedenen neuen Darstellungstechniken zu rechnen.
• Datenanalysetools werden Einzug in den Firmenalltag halten. Techniken der
interaktiven Datenanalyse sind bald Bestandteil von Tabellenkalkulationen,
Datenbankfrontends und jeder Statistiksoftware.
• Wie in Microsoft Office 2007 zu sehen ist, werden sich Softwarehersteller
darauf konzentrieren, dem Benutzer die gestalterische Arbeit noch weiter
abzunehmen und ein professionelles Aussehen der Datengrafiken quasi zu
automatisieren. Die Benutzer werden lernen müssen, dass gutes Aussehen
nicht mit Inhalt oder korrekter Auswahl der Visualisierungsmethode gleich-
zusetzen ist.
• Der Trend zur Verkleinerung von Datengrafiken wird anhalten und wort-
große Grafiken werden an Bedeutung gewinnen.

Wie gezeigt wurde, ist das Thema des Wissenstransfers von Diagrammen stark an
die Technologie, die zur Visualisierung und Analyse der Daten verwendet wird,
gekoppelt. Zusätzlich wirken die Beschränkungen des Mediums und grundlegen-
de Mechanismen der menschlichen Physiologie. Man benutzt Datengrafiken um
Entscheidungsgrundlagen zu schaffen, zu unterhalten, zu dokumentieren oder um
zu forschen.

Die Visualisierung ist eine simple, aber komplexe Kulturtechnik.

Eine Kulturtechnik des Wissenstransfers.


101

A Kriterienkatalog

Im folgenden finden Sie den für die Analyse erarbeiteten Kriterienkatalog. Da


es nicht zur Anwendung dieser Tabellen kam, bieten sie schliesslich und endlich
einen Katalog von Empfehlungen erfahrener Autoren, der als Entscheidungshilfe
beim Erstellen von Diagrammen dienen kann.

Allgemein
id Beschreibung Quelle
100 Die Datengrafik soll, wenn es möglich Vgl. Tufte (2001), S. 186
ist ein Querformat aufweisen.
101 Die Werte der y-Achse sind den zu zei- Vgl. Kosslyn (2006), S. 86
genden Effekten anzupassen.
102 Die wichtigste Variable ist immer auf Vgl. Kosslyn (2006), S. 81–
der x-Achse. Ist dies nicht entscheidbar 83
ist die mit dem einfachsten Muster aus-
zuwählen.
103 Eine große Menge an quantitativen Da- Vgl. Cleveland (1994),
ten kann auf eine kleine Fläche gepackt S. 110
werden.
104 Machen Sie das wichtigste Element Vgl. Kosslyn (2006), S. 161
zum Herausragendsten.
105 Nominalskalen sind entweder so zu ord- Vgl. Kosslyn (2006), S. 85f
nen, dass der gewünschte Vergleich
möglich ist, oder das einfachste Muster
entsteht.
106 Stellen Sie sicher, dass sich kreuzende Vgl. Kosslyn (2006), S. 143
oder beinahe kreuzende Linien unter-
scheidbar sind.
107 Verwenden Sie unterscheidbare Symbo- Vgl. Kosslyn (2006), S. 143
le für Punkte, die durch Linien verbun-
den sind.
108 Stellen Sie sicher, dass best-fitting- Vgl. Kosslyn (2006), S. 154
Linien unterscheidbar und herausra-
gend sind.
109 Tragen Sie Sorge dafür, dass Hinter- Vgl. Kosslyn (2006), S. 187
grundelemente nicht mit den Inhalten
gruppieren.
102

110 Überlagerte Datenreihen müssen ein- Vgl. Cleveland (1994), S. 51


deutig und sofort als zusammengehörig
erkennbar sein.
111 Überlappende Datensymbole müssen Vgl. Cleveland (1994), S. 50
unterscheidbar sein
112 Überlegen Sie die Verwendung von Feh- Vgl. Kosslyn (2006), S. 70
lerfahnen.
113 Verwenden Sie keine dreidimensionale Vgl. Kosslyn (2006), S. 174
Perspektive um exakte Information zu
vermitteln.
114 Verwenden Sie unterscheidbare Symbo- Vgl. Kosslyn (2006), S. 144
le (Kreis, gefüllter Kreis, gefülltes Drei-
eck und Plus)
115 Visuelle Klarheit muss bei Reprodukti- Vgl. Cleveland (1994), S. 53
on und Verkleinerung erhalten bleiben
116 Wenn die Natur der Daten eine Form Vgl. Tufte (2001), S. 190
vorschlägt, folgen Sie dem Vorschlag.
117 Wenn es mehr als eine best-fitting-Linie Vgl. Kosslyn (2006), S. 156
gibt, beschriften Sie jede direkt.
118 Wenn es wichtig ist prozentuelle oder Vgl. Cleveland (1994), S. 95
multiplikative Veränderungen zu sehen,
verwenden Sie eine logarithmische Ska-
la.
119 Zeichnen Sie positive und negative Vgl. Kosslyn (2006), S. 91f
Werte relativ zur Basisachse.

Tabelle 11: Allgemeine Kriterien für die Bewertung der Lesbarkeit von Grafiken

Achsen
id Beschreibung Quelle
200 Zentrieren Sie Achsenbeschriftung und Vgl. Kosslyn (2006), S. 103
setzen Sie sie parallel zur Achse.
201 Wenn Daten auf verschiedenen Panels Vgl. Cleveland (1994), S. 86
verglichen werden sollen, sind die Ska-
len dem anzupassen.
103

202 Wenn zwei abhängige Datenreihen ge- Vgl. Kosslyn (2006), S. 79


druckt werden, verwenden Sie sowohl
für die Datenreihen als auch für die
Skalen verschiedene Farben respektive
Muster.
203 Skalenbrüche sind immer total und Vgl. Cleveland (1994),
Werte werden nicht über die Skalenbrü- S. 104
che verbunden.
204 Stellen Sie sicher, dass das Verhält- Vgl. Kosslyn (2006), S. 77
nis Höhe zu Breite der Achsen, Unter-
schiede in den Inhalten unterscheidbar
macht.
205 Transformiere die Skala, damit ein gu- Vgl. Kosslyn (2006), S. 88f
ter Eindruck entsteht.
206 Verwenden Sie bei 3D-Graphen immer Vgl. Kosslyn (2006), S. 180
Wände.
207 Intervalle sollten sich proportional zu Vgl. Kosslyn (2006), S. 91
ihrer Größe auf den Achsen abbilden.
208 Es ist manchmal hilfreich zwei Skalen Vgl. Cleveland (1994), S. 83
für die selbe Achse zu verwenden (z.B.:
Gallonen, Liter)
209 Für genaue visuelle Eindrücke bei Li- Vgl. Kosslyn (2006), S. 78
niendiagrammen duplizieren Sie die Y-
Achse nach rechts
210 Die Datenfläche ist kleiner als die Ach- Vgl. Cleveland (1994), S. 31
senfläche.
211 Die Datenfläche sollte immer fast der Vgl. Cleveland (1994), S. 82
Achsenfläche entsprechen.
212 Bei Verwendung einer logarithmischen Vgl. Cleveland (1994), S. 62
Skala, sollte die Beschriftung mit
den tatsächlichen Größen korrespondie-
ren.259

259
Da Cleveland (1994) immer einen Achsenrahmen verwendet, meint er die doppelte Verwen-
dung. Ist beispielhaft die Beschriftung der oberen x-Achse 0, 1, 2, 3, . . ., so muss die untere
x-Achse mit 1, 10, 100, 1000, . . . beschriftet werden, weil 100 = 1, 101 = 10, 102 = 100, . . .
104

213 Bei zwei abhängigen Variablen setzen Vgl. Kosslyn (2006), S. 80


Sie eine Achse rechts und die andere
links. 260
214 Benutzen Sie eine Unterbrechung der Vgl. Cleveland (1994),
Skala, nur wenn unbedingt notwendig. S. 104
215 Die Achsen sind immer paarweise zu Vgl. Cleveland (1994), S. 31
verwenden
216 Die Achsen sollten leicht wahrnehmbar Vgl. Kosslyn (2006), S. 76
sein.
217 Die Achsenfläche ist nicht überfüllt(i.e.: Vgl. Cleveland (1994), S. 36
Legende und sonstige Notizen haben
auf der Achsenfläche nichts zu suchen.
Wenn notwendig, lieber die Daten öfter
abbilden, um die Details nicht zu ver-
klären)
218 Die Daten auf einer logarithmischen Vgl. Cleveland (1994),
Skala zu zeigen, kann Schiefe innerhalb S. 103
der Daten ausgleichen.
219 Der Nullpunkt muss nicht Teil der Ach- Vgl. Cleveland (1994), S. 92
se sein.

Tabelle 12: Kriterien für die Bewertung der Lesbarkeit von Achsen

Tickmarks
id Beschreibung Quelle
300 Verwenden Sie ein Tickmark, wenn der Vgl. Kosslyn (2006), S. 94
Wert wichtig ist.
301 Wähle den Umfang der Tickmarks so, Vgl. Cleveland (1994), S. 80
dass sie mindestens oder in etwa dem
Umfang der Daten entsprechen.
302 Ticks werden bei runden Ziffern und re- Vgl. Kosslyn (2006), S. 104
gulären Größen positioniert.
303 Platzieren Sie größere Tickmarks an Vgl. Kosslyn (2006), S. 94
beschrifteten Ticks und auf dem halb-
en Weg zwischen ihnen — wenn es Sinn
macht.
260
Kosslyn (2006) führt als Beispiel eine Grafik an, deren x-Achse Jahre abbildet und über der
zwei sich kreuzende Linien für die Produktion und die Kosten abgebildet sind.
105

304 Platzieren Sie Tickmarks in regelmäßi- Vgl. Kosslyn (2006), S. 93


gen Abständen.
305 Zeichnen Sie die Tickmarks nach Innen. Vgl. Kosslyn (2006), S. 93
306 Tickmarks sollten nach außen zeigen. Vgl. Cleveland (1994), S. 31
307 Tickmarks mit Vernunft verwenden. Vgl. Cleveland (1994), S. 39
308 Die Positionierung der Beschriftung der Vgl. Kosslyn (2006), S. 104
Ticks ist in unmittelbarer Nähe der
Ticks.

Tabelle 13: Kriterien für die Bewertung der Lesbarkeit von Tickmarks

Raster
id Beschreibung Quelle
400 Der Raster ist in der Ebene hinter den Vgl. Kosslyn (2006), S. 185
Daten!
401 Benutzen Sie einen inneren Raster, Vgl. Kosslyn (2006), S. 71
wenn genaue Vergleiche relevant sind.
402 Benutze eine Referenzlinie, wenn es Vgl. Cleveland (1994), S. 42
einen wichtigen Wert gibt, der zu zei-
gen ist.
403 Verwenden Sie verschiedene Arten von Vgl. Kosslyn (2006), S. 183
Raster, wenn höhere Präzision verlangt
wird.
404 Referenzlinien sollen nicht mir den Da- Vgl. Cleveland (1994), S. 42
ten konkurrieren
405 Machen Sie Rasterlinien relativ dünn Vgl. Kosslyn (2006), S. 182
und leicht.

Tabelle 14: Kriterien für die Bewertung der Lesbarkeit von Rastern

Beschriftung
id Beschreibung Quelle
500 Beschriften Sie alles Datenmaterial Vgl. Kosslyn (2006), S. 106
501 Beschriften Sie Daten so weit als mög- Vgl. Kosslyn (2006), S. 106
lich direkt.
502 Beschriften Sie kritische Punkte (z.B.: Vgl. Kosslyn (2006), S. 149
Extrema) explizit.
106

503 Datenbeschriftungen dürfen nicht mit Vgl. Cleveland (1994), S. 43


den Daten konkurrieren
504 Datenzuordnung erfolgt über direkte Vgl. Cleveland (1994), S. 46
Beschriftung oder eine Legende
505 Der Großteil der Liniensegmente sollte Vgl. Cleveland (1994), S. 69
sich gegen 45◦ lehnen
506 Der Titel der Grafik beschreibt welche Vgl. Kosslyn (2006), S. 108
Frage die Grafik am leichtesten beant-
wortet.
507 Die Beschriftung der Daten hat so zu Vgl. Kosslyn (2006), S. 95
erfolgen, dass Sie leicht zu finden ist.
508 Die Beschriftung sollte möglichst Vgl. Kosslyn (2006), S. 101
gleichartig sein und bei korrespondie-
renden Elementen auf jeden Fall.
509 Die Legende ist außerhalb der Daten- Vgl. Cleveland (1994), S. 47
fläche
510 Die Legende ist rechts oben bei einfa- Vgl. Kosslyn (2006), S. 189
chen Displays und zentriert darüber bei
mehreren Displays.
511 Die Legende sollte sich den Elementen Vgl. Kosslyn (2006), S. 189
zuordnen lassen.
512 Die Schrift ist in Groß- und Kleinbuch- Vgl. Tufte (2001), S. 183
staben, mit Serifen.
513 Die Schrift ist klar, präzise und mode- Vgl. Tufte (2001), S. 183
rat.
514 Entfernen Sie redundante Beschriftun- Vgl. Kosslyn (2006), S. 197
gen
515 Fügen Sie den Titel unter die Abbil- Vgl. Kosslyn (2006), S. 188
dung, außer wenn die Abbildung für
sich alleine steht.
516 Hinweise sind entweder im Titel oder in Vgl. Cleveland (1994), S. 47
der Bildunterschrift
517 Kleine Nachrichten erklären die Daten. Vgl. Tufte (2001), S. 183
518 Beschriftungen befinden sich auf der Vgl. Tufte (2001), S. 183
Grafik (keine Legende benötigt).
519 Nicht geläufige Elemente sollen erklärt Vgl. Cleveland (1994), S. 59
werden (z.B.: Fehlerfahnen)
107

520 Positionieren Sie alle Bezeichnungen Vgl. Kosslyn (2006), S. 148


der Elemente gleichförmig.
521 Positionieren Sie Beschriftungen am Vgl. Kosslyn (2006), S. 148
Ende von Linien.
522 Verwenden Sie eine Legende, wenn di- Vgl. Kosslyn (2006), S. 69
rekte Beschriftung nicht möglich ist.
523 Worte laufen von links nach rechts Vgl. Tufte (2001), S. 183
524 Worte sind ausgeschrieben. Keine mys- Vgl. Tufte (2001), S. 183
teriösen Abkürzungen.

Tabelle 15: Kriterien für die Bewertung der Lesbarkeit von Beschriftung

Farben, Schattierung, Schraffur


id Beschreibung Quelle
600 Aneinander grenzende Farben sollten Vgl. Kosslyn (2006), S. 160
verschiedene Helligkeit besitzen.
601 Beim Füllen einer Fläche ist nur eine Vgl. Kosslyn (2006), S. 136
Farbe oder ein Muster zu verwenden.
602 Die sechs Farben, die der Mensch am Vgl. Kosslyn (2006), S. 159
besten unterscheiden kann sind röt-
liches Purpur, Blau, gelbliches Grau,
gelbliches Grün, Rot und bläuliches
Grau.
603 Farben sind so gewählt, dass Perso- Vgl. Tufte (2001), S. 183
nen mit Fehlsichtigkeit und Blindheit
für Farben, die Farben trotzdem unter-
scheiden können.
604 Farben sind zu vermeiden, so weit es Vgl. Tufte (2001), S. 183
geht.
605 Keine Schraffuren in der Grafik Vgl. Tufte (2001), S. 183
606 Nicht mehr als 11 Farben.261 Vgl. Kosslyn (2006), S. 159
607 Respektieren Sie Kompatibilität und Vgl. Kosslyn (2006), S. 163f
Konventionen von Farben.
608 Schattierungen von Flächen sollten un- Vgl. Tufte (2001), S. 187
ten dunkler sein als oben.

261
Die 11 Farben, die nie verwechselt werden sind:: Weiß, Grau, Schwarz, Rot, Grün, Gelb, Blau,
Pink, Braun, Orange und Purpur.
108

609 Schraffur sollte sich durch mindestens Vgl. Kosslyn (2006), S. 170
30◦ unterscheiden.
610 Sorgen Sie dafür, dass die visuellen Vgl. Kosslyn (2006), S. 169
Eigenheiten beim Schattieren unter-
scheidbar sind.
611 Variieren Sie Schraffuren gleichen Mus- Vgl. Kosslyn (2006), S. 171f
ters mit einer Dichte von mindestens
2:1
612 Vermeiden Sie blau und rot in angren- Vgl. Kosslyn (2006), S. 162f
zenden Flächen.
613 Vermeiden Sie blau, wenn die Grafik Vgl. Kosslyn (2006), S. 166
kopiert werden soll.
614 Vermeiden Sie Farbe um quantitative Vgl. Kosslyn (2006), S. 166
Information zu codieren.
615 Verwenden Sie bei Vergleichen keine Vgl. Kosslyn (2006), S. 216
Abstufungen in der Helligkeit. Hell
wird als größer empfunden.
616 Verwenden Sie Farbe nur in Kombina- Vgl. Kosslyn (2006), S. 167
tion mit Farbsättigung um Steigerung
darzustellen.
617 Verwenden Sie Farben zum Gruppieren Vgl. Kosslyn (2006), S. 165
von Elementen.
618 Verwenden Sie Farben, die im Spek- Vgl. Kosslyn (2006), S. 158
trum gut getrennt sind.
619 Verwenden Sie keinen Hintergrund, der Vgl. Kosslyn (2006), S. 186
mit Ihren Daten in Konflikt gerät.
620 Verwenden Sie warme Farben für den Vgl. Kosslyn (2006), S. 161
Vordergrund.

Tabelle 16: Kriterien für die Bewertung der Lesbarkeit von Farben
109

B Werte zur Untersuchung des Lügenfaktors

Die Werte in der folgenden Tabelle wurden manuell ermittelt, indem eine Grafik
mit zwei Balken erzeugt wurde. Der eine Balken wurde konstant mit ymax gewählt
und ymin in Fünfer-Schritten an ymax angenähert.

Die erste Position von ymin bei 833,5 wurde gewählt aus der Tatsache, dass 1000-
16,667%=833,33 noch keine Verkürzung hervorruft. Die letzte Position bei 999,
weil bei einer Differenz von 0 keine Verkürzung der Achsen mehr stattfindet.

Der Wert y0 stellt den Ursprung der y-Achse dar und wurde abgelesen. Aufgrund
der abgelesenen Werte kann nicht ausgeschlossen werden, dass y0 auf Grund einer
unbekannten Mechanik bei Änderung des Wertes von ymax sich auf andere Art
und Weise ändert. Am Verlauf der Funktion Lügenfaktor wird sich daran aber
nur wenig ändern.

ymax ymin y0 ∆g ∆d Lf(y)


1 1000 833,5 750 1,99 0,1998 9,98
2 1000 840 750 1,78 0,1905 9,33
3 1000 845 750 1,63 0,1834 8,89
4 1000 850 750 1,5 0,1765 8,5
5 1000 855 750 1,38 0,1696 8,14
6 1000 860 750 1,27 0,1628 7,82
7 1000 865 750 1,17 0,1561 7,52
8 1000 870 750 1,08 0,1494 7,25
9 1000 875 800 1,67 0,1429 11,67
10 1000 880 820 2 0,1364 14,67
11 1000 885 820 1,77 0,1299 13,62
12 1000 890 820 1,57 0,1236 12,71
13 1000 895 840 1,91 0,1173 16,27
14 1000 900 840 1,67 0,1111 15
15 1000 905 840 1,46 0,1050 13,92
16 1000 910 860 1,8 0,0989 18,2
17 1000 915 860 1,55 0,0929 16,64
18 1000 920 880 2 0,0870 23
19 1000 925 880 1,67 0,0811 20,56
20 1000 930 880 1,4 0,0753 18,6
21 1000 935 900 1,86 0,0695 26,71
22 1000 940 910 2 0,0638 31,33
110

23 1000 945 910 1,57 0,0582 27


24 1000 950 920 1,67 0,0526 31,67
25 1000 955 930 1,8 0,0471 38,2
26 1000 960 940 2 0,0417 48
27 1000 965 940 1,4 0,0363 38,6
28 1000 970 955 2 0,0309 64,67
29 1000 975 960 1,67 0,0256 65
30 1000 980 970 2 0,0204 98
31 1000 985 975 1,5 0,0152 98,5
32 1000 990 984 1,67 0,0101 165
33 1000 995 992 1,67 0,0050 331,67
34 1000 999 998,4 1,67 0,0010 1665

Tabelle 17: Werte zur Untersuchung des Lügenfaktors


111

C Software- und Datenquellennachweis

C.1 Software

Dieses Dokument wurde mit LATEX 2ε in der Schriftenfamilie Computer Modern


gesetzt und als Dokument im Pdf-Format ausgegeben.

In Tabelle 18 ist alle verwendete Software aufgelistet. Nicht näher angeführt sind
Softwarepakete von innerhalb LATEX 2ε , die zur Erstellung notwendig sind und
Teil der Distribution MikTeX 2.4 sind.
Name Version URL Beschreibung
Adobe Reader 8.0 http://www.adobe.com Pdf-Betrachter
Calc 2.2 http://www.openoffice.org Tabellenkalkulation
Darkshot 2.0 http://www.darkleo.com Screenshotsoftware
Draw 2.2 http://www.openoffice.org Vektorgrafiksoftware
Excel 2003 http://www.microsoft.com Tabellenkalkulation
Excel 2007 http://www.microsoft.com Tabellenkalkulation
— Testversion
Gimp 2.2.13 http://www.gimp.org Bildbearbeitungs-
software
GSView 4.7 http://www.tug.org Postscriptsoftware
(um Seite aus Pdf
zu extrahieren)
Inkscape 0.45.1 http://www.inkscape.org Vektorgrafiksoftware
Jabref 2.1 http://jabref.sourceforge.net Literaturverwaltung
für BibTEX
PdfCreator 0.80 http://www.pdfcreator.de.vu Virtueller Drucker
der neben Pdf auch
Postscript und di-
verse Bildformate
erzeugt.
R 2.4.1 http://www.r-project.org Statistiksoftware
Scribus 1.3.3.7 http://www.scribus.com Dtp-Software
TeXnicCenter 1 Beta 6.31 http://www.toolscenter.org Editor für LATEX 2ε

Tabelle 18: Zur Erstellung des Textes und der Abbildungen benutzte Software

C.2 Datenquellen

In Tabelle 19 befinden sich die Datenquellen für alle Abbildungen. Beim Scannen
wurde ein Canon IR2016i eingesetzt. Die verwendete Software finden Sie im Detail
112

Daimler Chrysler, 12%, 129

Abbildung 37: Kopie der Sparkline von Seite 62

in Tabelle 18. Den Quellenverweis, soweit er vorhanden ist, finden Sie direkt bei
der Grafik. In diesem Abschnitt finden Sie nur Datenquellen und verwendete
Software.

Die Datenquellen sind Teil der Beispieldatenquellen von R 2.4.1 und können dort
gefunden werden. Auch ist eine Zusammenstellung der Datenquellen aus R mit
einer Kurzbeschreibung in Tabelle 20 auf Seite 114 zu finden. Für Abbildung 15
gilt — da sie aus mehreren Teilen besteht — dass diese von links nach rechts und
anschließend von oben nach unten aufgelistet sind. Ebenso gilt das für nachfol-
gende Abbildungen.

Man findet hier ebenfalls eine Kopie der Sparkline von Seite 62 in Abbildung 37,
da diese aus ästhetischen und anwendungstechnischen Gründen dort direkt im
Text verankert wurde und so keine Nummerierung tragen konnte.

Abb. Seite Datenquelle Erstellt Nachbearbeitung


1 8 Scan Gimp 2.2.13
2 13 Scan Gimp 2.2.13
3 14 Scan Gimp 2.2.13
4 17 Scan Gimp 2.2.13
5 19 Inkscape 0.45.1 Scribus 1.3.3.7
6 22 Scan Gimp 2.2.13
7 26 Draw 2.2
8 28 Draw 2.2
9 29 Draw 2.2
10 29 Draw 2.2
11 32 R 2.4.1
12 34 anscombe R 2.4.1
13 37 Gsview 4.7
14 48 Calc 2.2 Draw 2.2
15 51 help(pie) R 2.4.1 Scribus 1.3.3.7
rpois
VADeaths
rchisquared
trees
cars
113

rnorm
sqrt(abs(x))
16 55 40, 20, 20, 20 R 2.4.1
40, 22, 20, 18
17 56 barley R 2.4.1
18 57 iris R 2.4.1
19 58 Warpbreaks R 2.4.1
20 60 Titanic R 2.4.1 Scribus 1.3.3.7
21 61 women LATEX 2ε
22 62 Online Gimp 2.2.13
23 64 sunspot.year R 2.4.1
24 65 co2 R 2.4.1
25 69 Gsview 4.7 Gimp 2.2.13
26 71 Scan Gimp 2.2.13
27 80 1, 1, 1, 1, 1, 1 Excel 2003 Druck über pdfCreator
1, 1, 1, 1, 1, 1 Calc 2.2 Druck über pdfCreator
1, 1, 1, 1, 1, 1 Excel 2007 Druck über pdfCreator
1, 1, 1, 1, 1, 1 R 2.4.1
28 83 Tab. 8 Draw 2.2 Druck über pdf-Creator
29 84 Excel 2007 Darkshot 2.0
30 88 x3 R 2.4.1
x3 + 100 R 2.4.1
31 89 Tab. 9 Excel 2007 Druck über pdf-Creator
Tab. 9 Excel 2003 Druck über pdf-Creator
Tab. 9 Calc 2.2 Druck über pdf-Creator
Tab. 9 R 2.4.1
32 90 Tab. 10 Excel 2007 Druck über pdf-Creator
Tab. 10 Excel 2003 Druck über pdf-Creator
Tab. 10 Calc 2.2 Druck über pdf-Creator
Tab. 10 R 2.4.1
33 91 Tab. 10 Excel 2007
34 93 Tab. 17 Excel 2007
35 94 Tab. 17 Excel 2007
36 96 Draw 2.2
37 112 LATEX 2ε

Tabelle 19: Nachweis der Datenquellen und angewandte Software: Literaturquel-


len sind im Fließtext in der Beschriftung des Diagramms wiedergege-
ben.
114

Quelle in R Beschreibung
anscombe 4 x-y Reihen mit identischen klassischen Werten,
jedoch verschiedenen Plots
help(pie) Beispielaufteilung aus der Hilfe
rpois Zufallsgenerator für Poissonverteilte Zahlen
VADeaths Sterberate pro 1000 in Virginia (1940)
rchisquared Zufallsgenerator für χ2 -verteilte Zahlen
trees Umfang, Höhe und Volumen von 31 Weichselbäu-
men
cars Geschwindigkeit und Bremsweg von 50 Fahrzeugen
(1920)
rnorm Zufallsgenerator für normalverteilte Zahlen
sqrt(abs(x)) Wurzelfunktion
barley Gerstenernte für 10 Varianten und 6 Feldern
iris Abmessungen von 150 Blüten aus drei Unterfami-
lien der Gattung Iris (1935)
warpbreaks Bruch von 2 Sorten Wolle bei 3 verschiedenen
Spannungen auf einem Webstuhl
Titanic Schicksal der Titanicpassagiere
women Größe und Gewicht von amerikanischen Frauen
(1975)
sunspot.year Jährliche Anzahl der Sonnenflecken von 1700-1988
co2 Kohlendioxidausstoß des Mauna Loa (Hawaii)

Tabelle 20: Quellen in R: Um Details zu diesen Quellen erfahren, tippen Sie in der
Commandshell von R: require(lattice), quittieren Sie mit [Return]
und schließlich help(anscombe). Für die anderen Quellen müssen Sie
nur noch help(Quellenname) tippen.
115

Literatur

Albers, Josef (1969): Search Versus Re-Search. In Tufte, E.R. (Hrsg.): En-
visioning Information (10th printing) (2005). Ceshire, CT: Graphics Press
LLC, 61
Amelingmeyer, Jenny (2004): Wissensmanagement. Analyse und Gestaltung
der Wissensbasis von Unternehmen. Wiesbaden: Dt. Univ.-Verl. (Gabler-
Edition Wissenschaft;Strategisches Kompetenz-Management)
Anscombe, Francis J. (1973): Graphs in Statistical Analysis. In: The Ameri-
can Statistician, 27, 17–21, Entnommen aus: Tufte, R.(1974): Data Analysis
for Politics and Policy, Englewood Cliffs, NJ, Prentice-Hall, Inc., S. 131–134
Baker, M. Pauline/Bushell, Colleen (1995): After the Storm: Conside-
rations for Information Visualization. online abgerufen 14.04.2007 hURL:
http://vis.iu.edu/Publications/Storm.pdfi
Bancroft, T.A. (Hrsg.) (1972): Statistical Papers in Honor of George W.
Snedecor. Ames, IO: The Iowa State University Press – online abgerufen
11.03.2007 hURL: http://www.edwardtufte.com/tufte/tukeyi
Beattie, Vivien/Jones, Michael J. (1992): The Use and Abuse of Graphs in
Annual Reports: Theoretical Framework and Empirical Study. In: Accoun-
ting and Business Research, Vol. 22, No. 88, S. 291–303
Becker, Manfred (2005): Systematische Personalentwicklung: Planung, Steue-
rung und Kontrolle im Funktionszyklus. Stuttgart: Schäffer-Poeschel Verlag
für Wirtschaft.Steuern.Recht
Chabris, Christopher F./Kosslyn, Stephen M. (1995): Illustrated Editorial
is value-added text: A picture is worth 1000 words—right? Only if it’s the
right picture, and if it comes at the right point in text. In: Folio, 1. Februar
1995, S. 28–29
Chabris, Christopher F./Kosslyn, Stephen M. (2005): Representational
Correspondence as a Basic Principle of Diagram Design. In Tergan, S.O./
Keller, T. (Hrsg.): Knowledge and Information Visualization. Berlin,
Heidelberg: Springer Verlag, S. 36–57
Cleveland, William S. (1993): Visualizing Data. Summit, NJ: Hobart Press
Cleveland, William S. (1994): The Elements of Graphing Data (revised edi-
tion). Summit, NJ: Hobart Press
116

Cleveland, William S./Fuentes, Montserrat (1997): Trellis Display: Mo-


delling Data fom Designed Experiments. online abgerufen 10.01.2007 hURL:
http://cm.bell-labs.com/stat/doc/doe.trellis.col.psi
Dollinger, Manuela (2003): Wissen wirksam weitergeben: Die wichtigsten In-
strumente für Referenten, Trainer und Moderatoren. Zürich: Orell Füssli
Verlag AG
Escher, M.C./Ernst, Bruno; Locher, J.L. (Hrsg.) (1994): Leben und Werk
M.C.Escher (r) : Mit dem Gesamtverzeichnis des Graphischen Werks. Stutt-
gart: RVG-Interbook Verlagsgesellschaft mbH
Friendly, Michael (1992): Visualizing Categorical Data: Data, Stories, and
Pictures. online abgerufen am 25.03.2007 hURL: http://www.math.yorku.
ca/SCS/vcd/vcdstory.pdfi
Friendly, Michael (1999): Re-Visions of Minard. online abgerufen am
24.03.2007 hURL: http://www.math.yorku.ca/SCS/Gallery/milestone/
minard.pdfi
Friendly, Michael (2007): Milestones in the history of thematic cartogra-
phy, statistical graphics, and data visualization. online abgerufen am
24.03.2007 hURL: http://www.math.yorku.ca/SCS/Gallery/milestone/
milestone.pdfi
Grosche, G./Ziegler, V./Ziegler, D. (Hrsg.) (1991): Taschenbuch der Ma-
thematik (25., durchgesehene Auflage). Leipzig: B.G. Teubner Verlagsge-
sellschaft und Verlag Nauka
Harris, Robert L. (1999): Information Graphics: a comprehensive illustrated
reference. New York, NY: Oxford University Press, Inc.
Hollands, J.G./Spence, Ian (2001): The Discrimination of Graphical Ele-
ments. In: Applied Cognitive Psychology, 15, S. 413–431
Ihaka, Ross (2001): R Graphics: The Good, The Bad, and The
Ugly. In Hornik, K./F., Leisch (Hrsg.): DSC 2001 Procee-
dings of the 2nd International Workshop on Distributed Statistical
Computing. Wien hURL: http://www.ci.tuwien.ac.at/Conferences/
DSC-2001/proceedings/ihaka.pdfi, 1–9
Issing, Ludwig J./Klimsa, Paul (Hrsg.) (2002): Information und Lernen
mit Multimedia und Internet (3.Auflage). Weinheim: Verlagsgruppe Beltz,
Psychologische Verlags Union
Kelly, Dave/Jasperse, Jaap/Westbrooke, Ian; Hallas, Sue
(Hrsg.) (2005): Designing science graphs for data analysis and pre-
117

sentation: The bad, the good and the better (Department of Conservation
Technical Series 32). Wellington, NZ: DOC Science & Technical Publishing
- online abgerufen 10.03.2007 hURL: http://www.doc.govt.nz/i
Kosslyn, Stephen M. (1989): Understanding Charts and Graphs. In: Applied
Cognitive Psychology, 3, S. 185–226
Kosslyn, Stephen M. (2006): Graph Design for the Exe and Mind. New York,
NY: Oxford University Press
Krämer, Walter (2007): So lügt man mit Statistik (9. Auflage). München:
Piper Verlag GmbH
Lengler, Ralph/Eppler, Martin J. (2007): Towards A Periodic Ta-
ble of Visualization Methods for Management. online abgerufen am
18.02.2007 hURL: http://www.visual-literacy.org/periodic_table/
periodic_table.pdfi
Löffler, Andreas (2007): Sparklines. 2007, (Dokumentation zum LATEX-Paket
Sparklines)
Maeda, John (2006): The Laws of Simplicity: Design, Technology, Business,
Life. Cambridge, MA: The MIT Press
Maindonald, J H (2004): Using R for Data Analysis and Graphics: Intro-
duction, Code and Commentary. online abgerufen am 25.03.2007 hURL:
http://cran.r-project.org/doc/contrib/usingR.pdfi
Mandel, Heinz/Spada, Hans (Hrsg.) (1988): Wissenspsychologie. München;
Weinheim: Psychologie-Verl.-Union
Mayer, Horst O. (2000): Einführung in die Wahrnehmungs-, Lern- und Werbe-
Psychologie. München; Wien: Oldenbourg (Edition Psychologie)
Miller, George A. (1956): The Magical Number Seven, Plus or Minus Two:
Some Limits on Our Capacity for Processing Information. In: The Psycho-
logical Review, 63, 81–97 hURL: http://www.musanim.com/miller1956/i,
online abgerufen am 10.04.2007
Minard, Charles Joseph (1869): Tableaux Graphiques et Cartes Figuratives
de M. Minard, 1845-1869. In Tufte, E.R. (Hrsg.): Beautiful Evidence
(2006). Ceshire, CT: Graphics Press LLC, 122–139
Nonaka, Ikujiro/Takeuchi, Hirotaka (1997): Die Organisation des Wissens:
Wie japanische Unternehmen eine brachliegende Ressource nutzbar machen.
Aus dem Engl. von Friedrich Mader. Frankfurt/Main; New York: Campus-
verlag
118

Norman, Donald A (1990): The design of everyday things. New York, NY:
Bantam Doubelday Dell Publishing Group, Inc.
Office IT and Servers User Assistance (2006): Technical Reference for Mi-
crosoft Office Ressource Kit 2007. Redmond, WA: Microsoft Corporation,
2006 hURL: http://go.microsoft.com/fwlink/?LinkId=79595&clcid=
0x409i
Polyani, Michael (1985): Implizites Wissen (6.Auflage). Frankfurt/Main:
Suhrkamp Taschenbuch Verlag
Ponocny-Seliger, Elisabeth/Ponocny, Ivo (2005): Statistik for you: Eine an-
wendungsbezogene Einführung in die quantitativen Auswertungsmethoden
unter besonderer Berücksichtigung von SPSS 10.0. Wien: Facultas Verlags-
und Buchhandels AG
Probst, Gilbert/Raub, Stefan/Romhardt, Kai (2003): Wissen ma-
nagen: Wie Unternehmen ihre wertvollste Ressource optimal nutzen
(4. überarbeitete Auflage). Wiesbaden: Betriebswirtschaftlicher Verlag
Dr.Th.Gabler/GWV Fachverlage GmbH
R Development Core Team (2006): R Language Definition. Vienna, Aus-
tria: R Foundation for Statistical Computing, 2006 hURL: http://www.
R-project.orgi, ISBN 3-900051-07-0
Robbins, Naomi B. (2005): Creating More Effective Graphs. Hoboken, NJ:
Wiley-Interscience: John Wiley & Sons, Inc.
Rogowitz, Bernice E./Treinish, Lloyd E. (1995): How NOT to Lie with Vi-
sualization. online abgerufen am 27.03.2007 hURL: http://www.research.
ibm.com/dx/proceedings/pravda/truevis.htmi
Rosenblith, W.A. (Hrsg.) (1961): Sensory Communication. Cambridge, MA:
MIT Press
Rotman, Brian (1993): Signifying Nothing: The Semiotics Of Zero. Stanford,
CA: Stanford University Press
Schnotz, Wolfgang (2002): Wissenserwerb mit Texten, Bildern und Diagram-
men. In Issing, Ludwig J./Klimsa, Paul (Hrsg.): Information und Ler-
nen mit Multimedia und Internet (3.Auflage). Weinheim: Verlagsgruppe
Beltz, Psychologische Verlags Union, S. 65–81
Spence, Ian (2004): The Apparent and Effective Dimensionality of Represen-
tations of Objects. In: Human Factors, 64/4, S. 738–747
Stevens, S. S. (1961): The Psychophysics of Sensory Function. In Rosen-
blith, W.A. (Hrsg.): Sensory Communication. Cambridge, MA: MIT
119

Press hURL: http://www.cs.uba.ca/~tnn/courses/533/readings/ss.


pdfi, 1–33, (online abgerufen am 22.03.2007)
Tergan, S.O./Keller, T. (Hrsg.) (2005): Knowledge and Information Visua-
lization. Berlin, Heidelberg: Springer Verlag
Tufte, Edward R.; Dahl, Robert A. (Hrsg.) (1974): Data Analysis for
Politics and Policy. Englewood Cliffs, NJ: Prentice-Hall, Inc., Foundations
of modern political science hURL: http://www.edwardtufte.com/tufte/
dapp/i, online abgerufen 08.04.2007
Tufte, Edward R. (2001): The Visual Display of Quantitative Information
(second edition). Cheshire, CT: Graphics Press LLC
Tufte, Edward R. (2005a): Envisioning Information (10th printing). Cheshire,
CT: Graphics Press LLC
Tufte, Edward R. (2005b): Visual Explanations: Images and Quantities, Evi-
dence and Narratives (seventh printing, with revisions). Cheshire, CT: Gra-
phics Press LLC
Tufte, Edward R. (2006): Beautiful Evidence. Cheshire, CT: Graphics Press
LLC
Tukey, John W. (1967): What have statisticians been forgetting? In Jones,
Lyle V. (Hrsg.): The Collected Works of John W. Tukey. Volume IV
Philosophy and Principles of Data Analysis: 1965–1986. Monterey, CA:
Wadsworth&Brooks/Cole, S. 587–599
Tukey, John W. (1972): Some Graphic and Semigraphic Displays. In Ban-
croft, T.A. (Hrsg.): Statistical Papers in Honor of George W. Snedecor.
Ames, IO: The Iowa State University Press – online abgerufen 11.03.2007
hURL: http://www.edwardtufte.com/tufte/tukeyi, S. 293–316
Tukey, John W. (1973): Exploratory Data Analysis as Part of a Larger Whole.
In Jones, Lyle V. (Hrsg.): The Collected Works of John W. Tukey. Vo-
lume IV Philosophy and Principles of Data Analysis: 1965–1986. Monterey,
CA: Wadsworth&Brooks/Cole, S. 793–804
Tukey, John W. (1980): We Need Both Exploratory And Confirmatory. In
Jones, Lyle V. (Hrsg.): The Collected Works of John W. Tukey. Volume
IV Philosophy and Principles of Data Analysis: 1965–1986. Monterey, CA:
Wadsworth&Brooks/Cole, S. 811–817
Tukey, John W.; Jones, Lyle V. (Hrsg.) (1986): The Collected Works of
John W. Tukey. Volume IV Philosophy and Principles of Data Analysis:
1965–1986. Monterey, CA: Wadsworth&Brooks/Cole
120

Verzani, John (2002): simpleR — Using R for Introductory Statistics.


online abgerufen 16.03.2007 hURL: http://www.math.csi.cuny.edu/
Statistics/R/simpleR/Verzani-SimpleR.pdfi
Wainer, Howard (2005): Graphical Discovery: a trout in the milk and other
visual adventures. Princeton, NJ: Princeton University Press
Ware, Colin (2004): Information Visualization: Perception for Design. (Second
Edition). San Francisco, CA: Morgan Kaufmann Publishers (An Imprint of
Elsevier)
Wijk, Jarke J. van (2005): The Value of Visualization. online abgerufen
29.03.2007 hURL: http://www.win.tue.nl/~vanwijk/vov.pdfi
Wilkening, Friedrich (1988): Zur Rolle des Wissens in der Wahrnehmung. In
Mandel, Heinz/Spada, Hans (Hrsg.): Wissenspsychologie. München;
Weinheim: Psychologie-Verl.-Union, S. 203–224
Wilkinson, Leland (1994): Less is More: Two- and Three-Dimensional Gra-
phics for Data Display. In: Behavior Research Methods, Instruments &
Computers, Vol. 26, S. 172–176
Wilkinson, Leland; Chambers, J./Hand, D./Härdle, W. (Hrsg.) (2005):
The Grammar Of Graphics (Second Edition). New York, NY: Springer
Science+Business Media, Inc.
Willke, Helmut (2001): Systemisches Wissensmanagement (2., neubearbeitete
Auflage). Stuttgart: Lucius und Lucius
Wiss. Rat der Dudenredaktion (Hrsg.) (1990): Duden Fremdwörterbuch
(5., neu bearb. u. erw. Auflage). Mannheim; Leipzig; Wien; Zürich: Duden-
verlag.
Zimbardo, Philip G./Gerrig, Richard J. (2004): Psychologie. Eine Einfüh-
rung (16., aktualisierte Auflage). München: Pearson Studium
Zimmermann, Helmut/Weigert, Alfred (Hrsg.) (1995): ABC-Lexikon
Astronomie (8., überarb. Auflage). Heidelberg; Berlin; Oxford: Spektrum
Akademischer Verlag