Sie sind auf Seite 1von 255

STAR

Visualisierung von Daten

April - 04

Kerstin A. Ludwig Universität Konstanz

The real voyage of discovery consists not in seeking new landscapes, but in having new eyes.

[Proust]

Inhaltsverzeichnis

Inhaltsverzeichnis

3

Abbildungs- und Tabellenverzeichnis

5

Abkürzungsverzeichnis

10

 

1. Einleitung

12

2. Darstellung des Themas

14

2.1 Motivation

14

2.2 Visuelle Artefakte

18

2.3 Visualisierung von Daten

20

2.3.1 Die menschliche Wahrnehmung

20

2.3.2 Pre-Computer-Phase

20

2.3.3 Computer-Phase

22

2.3.4 Pre-Computer-Phase vs. Computer-Phase

23

2.3.5 Visualisierung

23

2.3.6 Scientific Visualization

24

2.3.7 Information Visualization

25

2.3.8 Historie

26

2.4 Definition von Begrifflichkeiten

29

2.5 Visualisierung Visualisierung

32

2.5.1 Cholera Epidemie in London

32

2.5.2 Space Shuttle Challenger

36

2.5.3 Verfälschende Visualisierungen

39

2.6 Herausforderung des Themas

43

2.7 Ausgangssituation

44

2.7.1 Mercedes-Benz

45

2.7.2 Andere Automobilkonzerne

49

2.8

Legitimation für das Thema

51

3. Visualisierung in der Wissenschaft

52

3.1 Konferenzen

52

3.2 Wissenschaftler und Institutionen

55

 

3.3 Literatur

61

4. Thematische Auseinandersetzung

63

4.1

Vorstellung des Referenzmodells für Visualisierung

64

4.1.1 Data Transformation: Raw Data Data Tables

65

4.1.2 Visual Mapping: Data Tables Visual Structures

68

4.1.3 View Transformations: Visual Structures Views

70

4.1.4 Interaktions- und Transformationskontrollen

71

 

4.1.4.1 Transformationen

71

4.1.4.2

Interaktionstechniken

72

4.2

Techniken zur Visualisierung von Daten

76

4.2.1 The Theorie of Graphics

77

4.2.2 The Grammar of Graphics

78

4.2.2.1

Ein objekt-orientiertes Grafiksystem

78

4.2.2.2

From Data to Graphic

80

4.2.2.3

Geometry

81

4.2.2.4

Aesthetics

92

4.2.2.5

Statistics

109

4.2.2.7

Scales

117

4.2.2.8

Coordinates

118

4.2.2.9

Facets

137

4.2.3

Metaphern

145

4.3

Einsatzmöglichkeiten der Techniken

155

4.3.1 Task by Data Type Taxonomy for Information Visualization

157

4.3.2 Datentypen der Task by Data Type Taxonomy

159

4.3.2.1 Eindimensional

159

4.3.2.2 Zweidimensional

159

4.3.2.3 Dreidimensional

160

4.3.2.4 Temporal

161

4.3.2.5 Multi-Dimensional

161

4.3.2.6 Tree

162

 

4.3.2.7 Network

163

4.3.3

Visualisierungen

164

4.4

Konzeptioneller Einsatz der Techniken

195

4.4.1

5T-Environment

196

5. Diskussion am Beispiel

199

5.1 IST-Stand der Settings

199

5.2 Analyse anhand der Faktoren der 5T-Environment

203

5.3 Visualisierungsmöglichkeiten

208

5.3.1 Klassenwelt (PKW)

208

5.3.2 Standard- und Sonderausstattungen (PKW)

214

5.3.3 Ergebnisdarstellung der Gebrauchtwagensuche (PKW)

219

6. Zusammenfassung

225

7. Ausblick

232

8. Quellenverzeichnis

235

Abbildungs- und Tabellenverzeichnis

Abbildungsverzeichnis

Abb. 1 Zeitergebnisse des Multiplikations-Experiments [CMS 1999]

19

Abb. 2 Karte des Londoner Underground Transportation System (‚The Tube’) [Spe 2001]

21

Abb. 3 Geografische Karte vom Wohnviertel um die Broad Street, mit eingetragenen Todesfällen [Tuf 1997]

33

Abb. 4 Zeitliche Darstellung der Todesfälle [Tuf 1997]

34

Abb. 5 Zeitlicher Verlauf der Cholera-Epidemie [Tuf 1997]

35

Abb. 6 Die Challenger etwa 60 Sekunden nach dem Start [Tuf 1997]

36

Abb. 7 Grafik, die der NASA zur Entscheidungsfindung für den Start der Challenger vorlag [Tuf 1997]

37

Abb. 8 Scatterplot, der die Abhängigkeit zwischen Starttemperatur und O-Ring Schaden zeigt [Tuf 1997]

39

Abb. 9 Tägliche vs. wöchentliche Darstellung der Todesfälle [Tuf 1997]

40

Abb. 10 Wochenübergreifende Darstellung der Todesfälle [Tuf 1997]

41

Abb. 11 Geografische Einteilung des Bereichs um die Broad Street in fünf Einzelbereiche – Version 1 [Tuf 1997]

41

Abb. 12 Geografische Einteilung des Bereichs um die Broad Street in fünf Einzelbereiche – Version 2 [Tuf 1997] und Geografische Einteilung des Bereichs um die Broad Street in fünf Einzelbereiche – Version 2 [Tuf 1997]

42

Abb. 13 Geografische Karten: Händlerstandorte (li.) und Anfahrtsroute (re.)

46

Abb. 14 „360 Grad Ansicht“ aussen (li.) und innen (re.)

46

Abb. 15 Beispielabbildungen aus der „Interaktiven Bedienanleitung“ des SLK

47

Abb. 16 Fahrzeugkalkulator (li.) und Wunschfahrzeug (Softfinder) (re.)

47

Abb. 17 Finanzierungsarten(li.) und Preis-Finder (re.)

48

Abb. 18 Überblick über die Klassen und ihre jeweiligen Modelle

49

Abb. 19 Referenzmodell für Visualisierung [CMS 1999]

64

Abb. 20 2D und 3D Point-Grafiken für kategorische und kontinuierliche Daten [Wil 1999]

84

Abb. 21 2D und 3D Line-Grafiken für kategorische und kontinuierliche Daten [Wil 1999]

85

Abb. 22

2D und 3D Area-Grafiken für kategorische und kontinuierliche Daten [Wil 1999]

85

Abb. 23 2D und 3D Bar-Grafiken für kategorische und kontinuierliche Daten [Wil 1999]

86

Abb. 24 2D und 3D Histogramme [Wil 1999]

86

Abb. 25 Schematischer (Box) Plot [Wil 1999]

87

Abb. 26 Tile-Grafik [Wil 1999]

88

Abb. 27 Contour-Grafik [Wil 1999]

89

Abb. 28 Path [Wil 1999]

90

Abb. 29 Komplettes Network mit acht Punkten [Wil 1999]

90

Abb. 30 Stacked (Divided) Bar-Grafik (li.) und Stacked Area Chart (re.) [Wil 1999]

95

Abb. 31 Stacked Dot Plot [Wil 1999]

95

Abb. 32 Clustered Bar Chart [Wil 1999]

96

Abb. 33 Jittered Scatterplot [Wil 1999]

96

Abb. 34

Bubble Plot [Wil 1999]

97

Abb. 35 Napoleons Russland-Feldzug nach Minard [Tuf 1983]

97

Abb. 36 Solid Größen [Wil 1999]

98

Abb. 37 Symbol Shapes [Wil 1999]

98

Abb. 38 Line Shapes [Wil 1999]

99

Abb. 39 Solid Shapes [Wil 1999]

99

Abb. 40 Map of Europe [Wil 1999]

100

Abb. 41

Modifikation der “Chernoff” FACES von Bruckner [Wil 1999]

100

Abb. 42 Scatterplot mit Images [Wil 1999]

101

Abb. 43 Rotation eines Symbols und eines Solids [Wil 1999]

101

Abb. 44

Windgeschwindigkeiten [Wil 1999]

102

Abb. 45 Brightness Variation

 

102

Abb. 46 Hue Variation [Wil 1999]

103

Abb. 47 Saturation Variation [Wil 1999]

103

Abb. 48 Scatterplot mit farbkodierten Kategorien (li.) und Color Map (re.) [Wil 1999]

103

Abb. 49

Matrix Plot [Wil 1999]

104

Abb. 50 Granularity [Wil 1999]

 

104

Abb. 51 Line Granularity [Wil 1999]

105

Abb. 52

Pattern Variations [Wil 1999]

105

Abb. 53 Line Textur Orientation [Wil 1999]

region.confi.smooth.linear) [Wil 1999]

106

Abb. 54 Blur Variation [Wil 1999]

106

Abb. 55 Transparency Variation [Wil 1999]

106

Abb. 56 Unterschiedliche Graph Typen, dieselbe statistische Methode (v.l.o.n.r.u.: point, line, area, bar; Methode:

110

Abb. 57 Unterschiedliche statistische Methoden, derselbe Graph Typ (v.l.o.n.r.u.: statistic.mean, region.spread.range, smooth.quadratic, region.confi.smooth.linear; Graph Typ: line) [Wil 1999]

111

Abb. 58 3D Stepped Surface (li.) und Smooth of Temperature Variation (re.) [Wil 1999]

111

Abb. 59 Error Bars [Wil 1999]

112

Abb. 60 Bivariate Densities [Wil 1999]

112

Abb. 61 Bivariate Box Plot [Wil 1999]

113

Abb. 62 Two VariableHhistogram and Hexagon Binning [Wil 1999]

113

Abb. 63 Short Path durch die US [Will 1999]

 

114

Abb. 64

Minimum Spanning Tree (li.) und Convex hull (re.) [Wil 1999]

115

Abb. 65 Triangulation (li.) und Cluster Tree (re.) [Wil 1999]

115

Abb. 66

Stretch Transformation [Wil 1999]

121

Abb. 67 Shear Transformation [Wil 1999]

 

121

Abb. 68

Projektion einer Ebene auf eine andere [Wil 1999]

122

Abb. 69 Projektion [Wil 1999]

 

123

Abb. 70

Conformal Mappings eines Schachbretts [Wil 1999]

124

Abb. 71 Conformal Mapping [Wil 1999]

 

124

Abb. 72 Grafik mit rechtwickligen und polaren Koordinaten [Wil 1999]

125

Abb. 73 Pie Chart (li.) und Circular Pie Chart (re.) [Wil 1999]

125

Abb. 74 Polar Dot Plot and Histogram (li.) und Bar-Grafik und Nightingale Rose (re.) [Wil 1999]

126

Abb. 75 Polar Cluster Tree (li.) und Polar Time Series (re.) [Wil 1999]

126

Abb. 76 Radar Plot (li.) und Polar Contour-Grafik (re.) [Wil 1999]

127

Abb. 77 Inversion einer Spirale [Wil 1999]

127

Abb. 78 Fisheye Dinosaurier [Wil 1999]

 

128

Abb. 79

Fisheye Transformation [Wil 1999]

129

Abb. 80 US Airline Pricing Map [Wil 1999]

 

129

Abb. 81 Permuted Tiling [Wil 1999]

130

Abb. 82 Perspektivische Projektion auf eine Ebene [Wil 1999]

131

Abb. 83 Triangular Koordinatenebene [Wil 1999]

131

Abb. 84 Triangular Coordinates Plot

[Wil 1999]

132

Abb. 85 Planar Map Projection (li.) und Cylindrical und Conical Map Projections (re.) [Wil 1999]

133

Abb. 86

Tiles of Soil Samples [Wil 1999]

134

Abb. 87

Sphärische Verteilung der magnetische Ausrichtung [Wil 1999]

134

Abb. 88 3D Triangular / Rectangular Cordinates [Wil 1999]

135

Abb. 89 Cylindrical Plot [Wil 1999]

135

Abb. 90

Parallel Coordinates [Wil 1999]

136

Abb. 91 Parallel Coordinates in Polar Form [Wil 1999]

137

Abb. 92

Tabelle mit Scatterplots [Wil 1999]

138

Abb. 93 Tabelle mit 3D Bars [Wil 1999]

139

Abb. 94 Two-Way Tabelle mit Line-Plots [Wil 1999]

139

Abb. 95

3D Objekt mit tabellarischer Darstellung [Wil 1999]

140

Abb. 96

Scatterplot eines Scatterplots [Wil 1999]

140

Abb. 97

Scatterplot Matrix (SPLOM) [Wil 1999]

141

Abb. 98 Regression Tree [Wil 1999]

142

Abb. 99 Age-Sex Pyramide für die US [Wil 1999]

142

Abb. 100 Polar Reihe mit Polar Plots [Wil 1999]

143

Abb. 101 Two-Way Mosaic Plot [Wil 1999]

143

Abb. 102 Linked Micromap Plot [Wil 1999]

144

Abb. 103 Document Lens [RM 1993]

164

Abb. 104 Galaxies [PNN 2004]

165

Abb. 105

TileBars [Hea 1995]

166

Abb. 106 ThemeView (ThemeScapes) [MIK 2003]

167

Abb. 107 WebBook [CRY 1996] (li.) und „Blättern“ im WebBook [CRY 1996] (mi.) und „Document Lens“ View [CRY 1996] (re.)

 

168

Abb. 108 Video-on-Demand Presentation [Spe 2001]

168

Abb. 109

Connex [PNN 2004]

169

Abb. 110 Rainbows [PNL 2004]

170

Abb. 111 Visual Access for 3D Data [CSC 1996]

171

Abb. 112 DateLens (Desktop-Version) [Dat 2004] (li.) und DateLens (PDA-Version: FishCal) [Dat 2004] (mi.) und DateLens (PDA-Version: FishCal) mit Fokus auf einen Tag [BCR 2002] (re.)

172

Abb. 113 Perspective Wall [MIK 2003]

 

173

Abb. 114 SiZer [EGK 1999]

174

Abb. 115 ThemeRiver [MIK 2003]

174

Abb. 116 Prinzip des Bifocal Display [Spe 2001] (li.) und Bisfocal Display aus Sicht des Benutzers [Spe 2001] (re.)

175

Abb. 117

Circle Segments View [KRM 2003]

176

Abb. 118

FilmFinder [CMS 1999]

177

Abb. 119

Influence Explorer [MIK 2003]

177

Abb. 120 libViewer [Lib 2004]

 

178

Abb. 121 RSVP mit Abbildungen [Spe 2001]

179

Abb. 122 Starstruck [PNL 2004]

180

Abb. 123

Supertable und 3D Scatterplot [KRM 2003]

181

Abb. 124 Table Lens [RC 1994]

 

181

Abb. 125

Web Forager [CRY 1996] (li.) und

Bookshelf [CRY 1996] (re.)

182

Abb. 126 Cam Tree [RMC 1991]

183

Abb. 127 Collapsible Cylindrical Tree (CCT) [DE 2001]

184

Abb. 128 Cone Tree [RMC 1991]

185

Abb. 129 Disk Tree [Chi 2002]

186

Abb. 130 Hyperbolic Tree [MIK 2003]

187

Abb. 131 Pad++ [Pad 2004] (li.), Zooming Site Map für die Pad++ Webseite [Pad 2004] (li.mi.), Zweite Hierarchietiefe der Pad++ Webseite [Pad 2004] (re.mi.), Dritte Hierarchietiefe der Pad++ Webseite mit Detailfenster [Pad 2004] (re.)

187

Abb. 132

Treemap [Dae 2003]

189

Abb. 133 Grocery Purchasing Correlations [Eic 1996]

190

Abb. 134 Hot Sauce [Dae 2003]

191

Abb. 135 Hyperspace (Narcissus) [Dae 2003]

191

Abb. 136 Narcissus [HDW 1995] (li.) und Narcissus Variation [HDW 1995] (re.)

192

Abb. 137

SeeNet [CEH 1996] (li.), SeeNet Helix [CEH 1996] (mi.), SeeNet Emailverkehr [CEH 1996] (re.)

193

Abb. 138 Darstellung der Klassenwelt (PKW) – Car Konfigurator de (oben) und se (unten)

200

(hier „Design“) – Car Konfigurator

Abb. 139 Standard- (oben) und Sonderausstattung (unten) der S-Klasse Limousine S430 de

201

Abb. 140 Darstellung der Standard- und Sonderausstattung der S-Klasse Limousine S430 in einer kombinierten Ansicht - Car

Konfigurator se

201

Abb. 141

Darstellung der Ergebnisse der Gebrauchtwagensuche (PKW)

202

Abb. 142

Schematische Darstellung der Klassenwelt mittels eines Hyperbolic Trees

209

Abb. 143 Schematische Darstellung der Klassenwelt in Anlehnung an die Pad++ Visualisierung

211

Abb. 144 Schematische Darstellung der Klassenwelt in Anlehnung an RSVP

212

Abb. 145 Schematische Darstellung der Klassenwelt in Anlehnung an die Date Lens

213

Abb. 146

Schematische Darstellung der Sonderausstattungen in Form eines Hyperbolic Trees

214

Abb. 147

Schematische Darstellung der Standardausstattungen in Form eines Cam Trees

215

Abb. 148 Schematische Darstellung eines Teilbaums für die Daten der Sonderausstattungen

218

Abb. 149 Schematische Darstellung der Ergebnisdarstellung der Gebrauchtwagensuche in Anlehnung an eine Table Lens. 221 Abb. 150 Systematische Darstellung der Gebrauchtwagensuche inkl. Ergebnisdarstellung in Anlehnung an den FilmFinder 222 Abb. 151 Schematische Darstellung der Ergebnisdarstellung der Gebrauchtwagensuche in Anlehnung an Circle Segments223

Tabellenverzeichnis

Tab. 1 Erklärung der Begriffe des Referenzmodells [Man 2001]

65

Tab. 2 Darstellung einer Datentabelle [CMS 1999]

66

Tab. 3 Darstellung einer erweiterten Datentabelle [CMS 1999]

66

Tab. 4 Interaktionstechniken [CMS 1999]

73

Tab. 5

Graphen [Wil 1999]

83

Tab. 6 Geometrische Graphen [Wil 1999]

92

Tab. 7 Ästhetische Attribute [Wil 1999]

93

Tab. 8

Ästhetische Attribute geordnet nach Geometrie [Wil 1999]

108

Tab. 9 Statistische Methoden [Wil 1999]

110

Tab. 10 Statistical Methods by Dimensionality [Wil 1999]

116

Tab. 11

Tasks der TTT [Shn 1996]

158

Tab. 12 Datentypen der TTT [Man 2001]

158

Abkürzungsverzeichnis

CCB

College of Computing Building

CCT

Collapsible Cylindrical Tree

CHI

Computer Human Interaction

CMY

Cyan – Magenta – Yellow - Farbsystem

CRB

Centennial Research Building

GCATT

Georgia Center for Advanced Telecommunications Technology

GI

Gesellschaft für Informatik

GIS

Geografisches Informationssystem

HCC

Human-Centered Computing

HCIL

Human Computer Interaction Laboratory

HCI

Human Computer Interaction

HI

Human Interaction

HLS

Hue - Lightness - Saturation Farbsystem

IEEE

Institute of Electrical and Electronics Engineers

IGD

Fraunhofer Institute for Computer Graphics

ISR

Institute for Systems Research

IVAs

Interactive Visualisation Artifacts

IR

Information Retrieval

KI

Künstliche Intelligenz

KQML

Knowledge Query and Manipulation Language

MIKY

Rika Furuhata, Issei Fujishiro, Kana Maekawa, Yumi Yamashita

MST

Minimum Spanning Tree

NSF

National Science Foundation

OLIVE

On-line Library of Information Visualization Environments

OOD

Object Oriented Design

PARC

Palo Alto Research Center

POIs

Points of Interest

RSVP

Rapid Serial Visual Presentation

STAR

State-of-the-Art Analyse

SPIRE

Spatial Paradigm for Information Retrieval and Exploration

SPLOM

Scatterplot Matrix

TSRB

Technology Square Research Building

TTT

Task by Data Type Taxonomy

UMIACS

University of Maryland Institute for Advanced Computer Studies

VisMeB

Visual Metadata Browser

VOIR

Visualization Of Information Retrieval System

VRS

Virtual Reality Society

VRVIS

Zentrum für Virtual Reality und Visualisierung Forschungs GmbH

ZUI

Zooming Graphical Interface

1. Einleitung

Die vorliegende State-of-the-Art Analyse für die DaimlerChrysler AG behandelt die Thematik der Visualisierung von Daten. Im ersten Teil der STAR folgt nach einer einleitenden Motivation eine allgemeine Einführung in die Thematik der Visualisierung von Daten. Diese umfasst sowohl den Gebrauch von visuellen Artefakten im alltäglichen Gebrauch und den damit verbundenen Bezug zu Visualisierungen, als auch die chronologische Entwicklung der Geschichte der Visualisierung von Daten mit ihren verschiedenen Ausprägungen. Die darauffolgende Definition von Begrifflichkeiten, grenzt die Begriffe aus dem Bereich der „Visualisierung“ von Daten und die damit in Verbindung stehenden Konzepte klar voneinander ab. Um die nötige Sensibilität hinsichtlich der Qualität und Aussagekraft von Visualisierungen zu schaffen, erfolgt die Darstellung und Erläuterung von Negativ- und Positivbeispielen aus dem Bereich der Visualisierung, welche auch häufig in der Literatur zitiert werden. Das nächste Kapitel beschreibt, worin die Herausforderung der Thematik der Visualisierung von Daten im Generellen besteht. Eine Betrachtung der derzeit verwendeten Visualisierungstechniken in der MB Online- Welt (Deutschland 1 und Schweden 2 ), sowie die Betrachtung von Visualisierungstechniken, welche bei Webauftritten anderer Automobilkonzerne eingesetzt werden, ermittelt den derzeitigen IST-Stand bezüglich des Einsatzes von Visualisierungen in diesem Bereich und somit die zugrundeliegende Ausgangssituation. Daraus resultierend erschließt sich in diesem Zusammenhang die Legitimation für die Auseinandersetzung mit der Thematik der Visualisierung von Daten.

Im zweiten Teil der STAR wird das Thema der Visualisierung von Daten in der Wissenschaft behandelt. Dieses Kapitel beinhaltet die wichtigsten wissenschaftlichen Beiträge, wie einschlägige Literatur, Konferenzen und Institutionen, zu dieser Thematik.

Der eigentliche fachliche Diskurs zum Thema Visualisierung erfolgt im dritten Teil der STAR. Um eine einheitliche Basis für die Präsentation und spätere Diskussion der Visualisierungen zu schaffen, wird an dieser Stelle zunächst das Referenzmodell für Visualisierung von Card, Mackinlay und Shneiderman vorgestellt. In einem weiteren Kapitel erfolgt die Vorstellung von grundlegenden Visualisierungstechniken aus Sicht der Statistischen Grafik, wobei abschließend auch der Einsatz von Metaphern bei

1 Mercedes-Benz Deutschland URL: http://www.mercedes-benz.de

2 Mercedes-Benz Schweden URL: http://www. mercedes-benz.se

Visualisierungen vorgestellt wird. Dieses einführenden Kapitel dienen dem Aufbau von Basiswissen im Bereich der Visualisierung von Daten. Praktische und/oder exemplarische Beispiele für Visualisierungen werden im folgenden Kapitel kurz vorgestellt, um die Einsatzmöglichkeiten von Visualisierungstechniken im Bereich der Wissenschaft und Wirtschaft aufzeigen. Die Gliederung der Präsentation der Visualisierungen erfolgt anhand der Task by Data Type Taxonomy von Shneiderman, welche zu Beginn des Kapitels einleitend vorgestellt wurde. Der Diskurs zum Thema Visualisierung schließt mit den Ausführungen zum konzeptionellen Einsatz von Visualisierungstechniken, welche auch die Erfolgsfaktoren für Visualisierungen aus der 5T-Environment von Mann und Reiterer beinhalten.

Die Reflektion der Ergebnisse der STAR auf die MB Online-Welt, also die Verknüpfung der theoretischen Rechercheergebnisse zum Praxisbezug, findet im vierten Teil der STAR statt. An dieser Stelle wird zunächst die Ausgangssituation dreier ausgewählter Settings aus der MB Online-Welt betrachtet. Basierend auf den Erkenntnissen aus dem Kapitel des konzeptionellen Einsatzes von Visualisierungstechniken, werden diese Settings anhand der Faktoren der 5T-Environment analysiert. Aufgrund dieser Analyseergebnisse werden eine Reihe von Visualisierungstechniken, welche den aufgestellten Anforderungen entsprechen, ermittelt. Eine Diskussion dieser verschiedenen Visualisierungstechniken erfolgt anschließend anhand der drei ausgewählten Praxisbeispiele (Settings) aus der MB Online-Welt sowie deren Präsentation.

Abschließend erfolgt, basierend auf den gewonnenen Erkenntnissen aus der STAR, eine allgemeine Prognose über zukünftige Entwicklungen und Tendenzen im Bereich der Visualisierung von Daten.

2. Darstellung des Themas

2.1 Motivation

„The world is complex, dynamic, multidimensional; the paper is static, flat. How are we to represent the rich visual world of experience and measurement on mere flatland?”

[Tufte]

Information ist allgegenwärtig. Ob sich es dabei um Zeitungsartikel, Verkehrsmeldungen, Wetterberichte, Zugfahrpläne, Aktienkurse, Reisekarten, Webseiten, Geschäftsberichte, Mess- oder Verbraucherdaten oder um die Konstruktionspläne eines Automobils handelt, Information findet sich in allen Bereichen des täglichen Lebens – im Privaten sowie im Beruflichen. Information ist heterogen. Information an sich wird von den unter- schiedlichsten Quellen zu den unterschiedlichsten Zwecken produziert. Dennoch lassen sich zwei Hauptziele von Information identifizieren: Kommunikation und Exploration. Das heisst, Information wird verwendet um eine Idee zu kommunizieren oder mit Hilfe von Information neue Ideen zu entwickeln. Um diese Hauptziele, die eng mit einander verflochten sind und häufig fliessende Übergänge besitzen, umzusetzen, bedient man sich schon seit jeher unterschiedlichsten Medien, in den verschiedensten Ausprägungen. Dazu gehören zum Beispiel Sprache, Schrift, Mathematik, Gestik, Mimik, taktile Reize, Töne, Symbole, Bilder oder Grafiken. Information hat es schon immer gegeben, sie ist also keine Erfindung unserer heutigen Zeit. Entsprechend lang ist auch die Geschichte des Information Design. Jedoch hat sich im Vergleich zu früher, die Menge an produzierter Information, mit ihren verschiedenen Ausprägungen wesentlich erhöht und ihre nahezu permanente Verfügbarkeit erzeugt einen Effekt, welcher unter dem populären Schlagwort der „Informationsüberflutung“ bekannt geworden ist.

Aufgrund dieses neuen Stellenwertes der Information und der Tatsache, dass sich bestimmte Formen von Medien, wie die visuelle Repräsentation, besonders für die Darstellung eignen, entwickelten sich eigenständige Forschungsdisziplinen und Arbeits- bereiche, welche sich speziell mit dem Umgang und der visuellen Repräsentation von Information beschäftigen. Diese Disziplinen, zu denen beispielsweise die Computergrafik, die Statistische Grafik oder auch die Scientific oder Information Visualization gehören, machen sich die Tatsache zu nutze, dass das menschliche Wahrnehmungssystem stark an die effektive Verarbeitung von visuell kodierten Informationen angepasst ist [Tuf 1983]. Dadurch wird es möglich - unter Voraussetzung einer qualitativ hochwertigen visuellen Repräsentation - große Mengen von Information rasch interpretieren zu können. Eine weitere Steigerung dieser Vorzüge findet unter zu

Hilfenahme von Computern statt. So gehören laut Colin Ware, zu den besten Visualisierungen nicht statische Bilder, sondern fließende dynamische Visualisierungen, welche dem Bedürfnis nach unterschiedlichen Darstellungen (Sichten) der Informationen nachkommen. Aufgrund dessen wurden eine Vielzahl von Visualisierungstools entwickelt, welche mit Hilfe des Computers Informationen, bzw. Daten visualisieren und interaktiv für den Benutzer erfahrbar machen. Diese Tools unterstützen Personen bei dem Umgang mit Information, sei es nun bei ihrer Arbeit oder im Privatleben, bei der Kommunikation oder Exploration von Information. Bereits heute werden solche Tools oder auch Visualisierungen in vielen unterschiedlichen Bereichen eingesetzt, wie beispielsweise bei Informations- und Marktforschungsinstituten, im Marketingbereich, in der Forschung, bei Datenanalysten, aber auch auf Webseiten, wie beispielsweise Wissensportalen (Wissen.de 3 ) oder Firmenauftritten (Inxight 4 ). Zunehmend beschleunigt sich der Trend hin zu visuellen Informationen [War 1999]. Leistungsstärkere Computer und neue Technologien ermöglichen die Entwicklung immer weiterer, neuer Visualisierungstechniken, welche über einen hohen Grad an Interaktionsmöglichkeiten für den Benutzer verfügen. Diese Visualisierungen können Nutzern aufgrund höherer Datenübertragungsraten auch zunehmend über das Web zugänglich gemacht werden.

Die Thematik der Visualisierung von Daten stellt somit ein interessantes und weitge- fächertes Feld mit vielen Anwendungsbereichen dar, welches über eine lange Tradition in der Geschichte der Menschheit verfügt und auch in Zukunft große Potentiale birgt.

Diese State-of-the-Art Analyse behandelt die Thematik der Visualisierung von Daten aus Sicht der Information Visualization. Jedoch existieren viele Schnittmengen zwischen den einzelnen Disziplinen in diesem Bereich und die Grenzen sind zuweilen fließend. Aus den verschiedenen Sichtweisen der jeweiligen Disziplinen und der unterschiedlichen Verwendung von Begriffen für dieselbe Thematik entsteht eine Reihe von „Unklarheiten“, aber durchaus auch eine Reihe von Synergieeffekten. Die vorliegende STAR fokussiert hauptsächlich den Bereich der Information Visualization, nutzt aber in Kapitel 4.2 zur Verdeutlichung von allgemeingültigen Techniken zur Visualisierung von Daten, Beschreibungen aus dem Bereich der Statistischen Grafik. Dies wird damit begründet, dass viele Visualisierungen statistische Grafiken enthalten, wie z.B. Bar Charts, Histogramme, Pie Charts oder auch Scatterplots. Bei den Beschreibungen von Visualisierungen aus dem Bereich der Information Visualization wird zumeist nicht mehr auf diese grundlegenden Techniken eingegangen, da sie als gegeben vorausgesetzt werden. Um aber Visualisierungen, ohne jegliche Vorkenntnisse in diesem Bereich,

3 Wissen.de URL: http://www.wissen.de

4 Inxight URL: http://www.inxight.com

besser beurteilen zu können, ist dieses Wissen unabdingbar. Mit Hilfe dieser allgemeinen Beschreibungen aus dem Bereich der Statistischen Grafik ist es möglich, die immense Fülle an verschiedenartigen Visualisierungen, welche sich dem Betrachter bietet, besser klassifizieren und somit die grundlegenden Techniken von einander unterscheiden zu können. Oftmals lassen sich mit diesem Wissen scheinbar unterschiedliche Visualisierungen auf dieselbe und ähnlich aussehende Visualisierungen auf völlig unterschiedliche Visualisierungstechniken zurückführen. Sicherlich kann im Rahmen dieser STAR nicht auf alle Techniken eingegangen werden, jedoch soll an dieser Stelle ein in die Thematik einführendes Basiswissen geschaffen werden.

Das Kapitel der Beispielvisualisierungen (4.3) fokussiert schließlich hauptsächlich auf Visualisierungen aus dem Bereich der Information Visualization, welche aber häufig Elemente aus der Statistischen Grafik enthalten. Wünschenswert wäre an dieser Stelle eine weitere Fokussierung auf ein Kapitel gewesen, welches auf ähnlich allgemeine Weise, wie das der Visualisierungstechniken (Kapitel 4.2), Konzepte zur Visualisierung von Daten speziell aus dem Bereich der Information Visualization vorstellt. Die Beschäftigung mit der Visualisierung von Daten im Rahmen dieser State-of-the-Art Analyse hat gezeigt, dass dies ein sehr vielschichtiges Arbeitsfeld darstellt und wie schon Thomas Mann in seiner Dissertation „Visualization of Search Results from the World Wide Web“ feststellte, es schwierig ist, einen allgemeinen Überblick über Visualisierungsideen in einem eindimensionalen System oder einer eindimensionalen Hierarchie zu strukturieren. Klassifizierungsschemata für Visualisierungen sind deshalb häufig multidimensional. Verschiedene Ansätze und Sichten sind nötig um dieses Feld umfassend zu beleuchten. Eine Fortsetzung der Thematik wird in meiner Masterarbeit aus dem Bereich der Visualisierung von Daten folgen, welche auch den Gedanken der „VizBox“ aufgreift. Idee dieser „VizBox“ ist es, verschiedene Visualisierungs- und Interaktionstechniken, Metaphern und Konzepte zur Visualisierung von Daten vorzustellen und entsprechend aufzubereiten, um so einen Pool an Ideen zur Visualisierung von Daten zu schaffen. Diese Idee enstand in Anlehnung an die „Tech Box“ von IDEO 5 einer amerikanischen Designagentur, welche die Idee einer Kreativbox optimiert hat. Designer nutzen zur Ideenfindung während des Designprozesses häufig die Inspiration von bereits erprobten Ideen, Techniken, Materialien oder auch Produkten, welche in anderen Anwendungsbereichen bereits erfolgreich ihre Anwendung fanden. Durch Adaption dieser Ideen auf neue Anwendungsbereiche lassen sich so neue kreative Ideen kreieren. Die TechBox von IDEO, enthält etwa 200 unterschiedliche Artefakte, welche in verschiedene Kategorien, wie zum Beispiel „Amazing Materials“, „Cool Mechanism“ oder auch „Interesting Manufacturing Pocesses“ eingeteilt sind und auf einer

5 IDEO URL: http://www.ideo.com

Webseite umfassend mit Hintergrundinformationen dokumentiert werden. Diese Artefakte stellen einen Pool von unterschiedlichsten Ideen dar, welche in die kreative Phase des Designprozesses eingebracht werden können. Durch Adaption, Kombination und Modifikation der Eigenschaften dieser Artefakte lassen sich so spannende Lösungen finden, welche - zunächst als unmöglich erscheinend - eventuell im Vorfeld als Lösungsweg ausgeschlossen worden wären.

Die Idee einer solchen Kreativbox oder „VizBox“ lebt von ihrer steten Weiterentwicklung, indem neue Elemente gesammelt und entsprechend hinzugefügt werden, um so einen stetig wachsenden Pool an Ideen zu schaffen.

2.2 Visuelle Artefakte

“Visual artifacts and computers do for the mind what cars do for the feet!”

[Card, Mackinlay, Shneiderman]

Die Arbeit oder auch Tätigkeiten des Menschen sind stark mit physischen externen Hilfsmitteln, hier auch Artefakte genannt, verbunden. Die wenigsten Tätigkeiten werden in unserer heutigen Welt ausschließlich mental erledigt. Die Kombination von mentalen Denkprozessen und physischen Hilfsmitteln - also innerer mentaler Aktion und externer wahrnehmbarer Interaktion - ist stark miteinander verknüpft und hat schon eine lange Tradition in der Geschichte der Menschheit. Laut [CMS 1999] ist die Verflechtung von innerer mentaler Aktion und externer Wahrnehmung (und Manipulation) kein Zufall. Es ist vielmehr der Schlüssel dazu, wie Menschen ihre mentalen Fähigkeiten zunehmend erweitern und somit ihre Intelligenz steigern. Auch Norman (1993) sagt:

„ The real powers come from devising external aids that enhance cognitive abilities.

How have we increased memory, thought, and reasoning? By the invention of external

aids: It is things that make us smart.“ (Norman, 1993, p.43)

Es gibt eine Reihe von verschiedenartigen externen Hilfsmitteln, jedoch ist die mit Abstand wichtigste Kategorie diejenige der grafischen oder auch visuellen Hilfsmittel. Bei grafischen Hilfsmitteln lassen sich insgesamt zwei unterschiedliche Zwecke unterscheiden. Zum einen dienen grafische Hilfsmittel dazu eine Idee zu kommunizieren. Damit verbunden wird häufig der bekannte Ausspruch: „A picture is worth ten thousand words.“ Zum anderen ermöglichen grafische Hilfsmittel die Idee selbst zu erzeugen oder zu entdecken: „Using vision to think.“ Diese beiden Zwecke von grafischen Hilfsmitteln sind grundsätzlich verschieden, auch wenn sie eng miteinander verknüpft sind.

Um die Relevanz von grafischen Hilfsmitteln zu verdeutlichen, wurde von [CMS 1999] ein einfaches informelles Experiment durchgeführt. Es sollte zeigen, wie selbst einfachste Hilfsmittel die kognitiven Fähigkeiten eines Menschen um eine Vielfaches erweitern. Die mathematische Operation Multiplikation gehört zu den meist genutzten mentalen Aktivitäten des Menschen. Bei dem Experiment sollte eine Testperson zunächst zwei zweistellige Zahlen miteinander im Kopf multiplizieren. Anschließend sollte sie das gleiche mit zwei anderen zweistelligen Zahlen wiederholen, dieses mal allerdings mit Hilfe von Stift und Papier. Bei beiden Multiplikationen wurde die Zeit gemessen, welche die Person

für die Erledigung der Testaufgabe benötigte. Wie in Abb. 1 zu sehen, reduzierte die Verwendung von Stift und Papier die Zeit, welche für die Erledigung der Aufgaben benötigt wurde, um den Faktor fünf.

der Aufgaben benötigt wurde, um den Faktor fünf. Abb. 1 Zeitergebnisse des Multiplikations-Experiments [CMS

Abb. 1 Zeitergebnisse des Multiplikations-Experiments [CMS 1999]

Wie diese Demonstration zeigt, verbessert die Verwendung von grafischen Hilfsmitteln die gedankliche Performanz, selbst bei Aufgaben, die auch rein mental zu lösen sind. Die Frage stellt sich, weshalb die Verwendung von Stift und Papier solch einen Unterschied verursacht. Mentale Multiplikation für sich selbst genommen, ist nicht schwierig. Was Probleme bereitet, ist die Teilergebnisse im Gedächtnis zu behalten, bis sie verwendet werden können. Die visuelle Repräsentation ermöglicht das Festhalten der Teilergebnisse außerhalb des Gedächtnisses und erweitert somit das Gedächtnis einer Person. Stift und Papier ist nur ein Beispiel für ein grafisches Hilfsmittel; andere sind zum Beispiel Rechenschieber, Nomographen, Taschenrechner, Karten oder auch Diagramme, um nur einige zu nennen.

Grafische oder auch visuelle Hilfsmittel bzw. Artefakte unterstützen den Denkprozess. Sie sind seit jeher stark verflochten mit kognitiver Aktion. Man kann die Entwicklung der Zivilisation auch an der Erfindung von visuellen Artefakten ablesen: Schrift, Mathematik, Karten, Diagramme und Visual Computing. Viele Aktivitäten in unserem Umfeld haben mit der Erzeugung oder Verwendung visueller Artefakte zu tun. Visuelle Artefakte erweitern die kognitiven Fähigkeiten eines Menschen, welche wiederum für die Aneignung oder Verwendung von Wissen verantwortlich sind. [CMS 1999]

2.3 Visualisierung von Daten

2.3.1 Die menschliche Wahrnehmung

Das menschliche visuelle System hat sich über zehn Millionen Jahre hinweg als Instrument für die Wahrnehmung und Erkennung unserer natürlichen Umgebung entwickelt. Das gesamte System ist darauf ausgerichtet, Informationen aus unserer Welt, mit ihren ganz bestimmten physikalischen Eigenschaften, zu extrahieren. [War 1999] Laut Colin Ware führt die Interaktion des stets wachsenden Nervensystems mit der täglichen Realität, zu einem mehr oder weniger standardisierten visuellen System, weshalb dieselben visuellen Konzepte oder Entwürfe für alle Menschen gleich effektiv funktionieren. Das menschliche visuelle System ist speziell darauf ausgerichtet, Muster in seiner Umgebung zu suchen und wiederzuerkennen. Jedoch unterliegt das System eigenen Regeln. Obwohl es sehr flexibel ist, ist es darauf abgestimmt, Daten zu erkennen, welche auf bestimmte Art und Weise präsentiert werden. Gibt es Abweichungen in der Darstellung, so bleiben diese Muster unerkannt. Sind die Funktionsweisen der menschlichen Wahrnehmung bekannt, kann dieses Wissen auf Regeln für die Darstellung von Daten übertragen werden. Werden diese Regeln beachtet, ist es möglich Daten so zu präsentieren, dass für den Menschen informative und vor allem wahrnehmbare Muster entstehen. [War 1999]

Die Visualisierung von Daten macht sich bereits seit Jahrhunderten diese Tatsache, dass das menschliche Wahrnehmungssystem stark an die sehr effektive Verarbeitung von visuell kodierten Informationen angepasst ist, zu nutze. [Tuf 1983]

2.3.2 Pre-Computer-Phase

Bis vor einiger Zeit bedeutete der Begriff „Visualization“ laut dem Shorter Oxford English Dictionary noch: „constructing a visual image in the mind.“ Inzwischen hat sich die Bedeutung dieses Begriffs gewandelt. Heutzutage versteht man unter dem Begriff „Visualization“: „A graphical representation of data or concepts“. Demnach wandelte sich Visualisierung von einem internen Konstrukt des Verstands zu einem externen Artefakt, welches der Erweiterung des menschlichen Verstandes dient. [War 1999]

Visualisierung von Daten gibt es bereits seit einigen Jahrhunderten. Die Entwicklung der perspektivischen Projektion durch die Florentinischen Architekten während des 15.Jh., zur Zeit der Italienischen Renaissance, war ein Geschenk für die Welt des visuellen Denkens. Sie stellt eine einfache Erweiterung einer zweidimensionalen Oberfläche dar, durch die es Menschen möglich wird, Objekte in einem geometrisch korrekten Kontext darzustellen und welche durch die eigene tägliche Erfahrung im dreidimensionalen Raum verständlich wird. [Tuf 1990][Tuf 1997]

Der Übergang schließlich von verkleinerten bildhaften Darstellungen der physischen Welt, beispielsweise in Form von Karten, hin zu abstrakten Darstellungen, wie zum Beispiel Graphen, war ein enormer konzeptioneller Schritt. Es bedurfte 5000 Jahre um die Namen der Koordinaten von Ost-West und Nord-Süd in empirisch messbare Variablen X und Y zu verwandeln. Parallelen können hierbei zur Kunst gezogen werden. Auch in der Kunst wurde das naturalistische Koordinatensystem erst Anfang des 20.Jh. durch die fraktalen Bilder des Kubismus, welche gleichzeitig multiple Blickwinkel in einem Bild vereinen, verzerrt und später schließlich mit Abstract Painting, bei dem die zwei Dimensionen der Leinwand nicht länger zu einer weltlichen Szenerie, sondern nur noch zu sich selbst in Bezug stehen, völlig aufgelöst. [Tuf 1997]

sich selbst in Bezug stehen, völlig aufgelöst. [Tuf 1997] Abb. 2 Karte des Londoner Underground Tran

Abb. 2 Karte des Londoner Underground Transportation System (‚The Tube’) [Spe 2001]

Ein sehr bekanntes Beispiel für die Visualisierung von Daten, welches sich die Verzerrung der geografischen Räumlichkeiten auf einer Karte zu nutze macht, ist die Karte des Londoner Underground Transportation System (‚The Tube’) von Harry Beck aus dem Jahr 1931 (Abb. 2).

Harry Beck, ein pensionierter Konstruktionszeichner, erkannte damals, dass es keine Relevanz hat, die eigene genaue geografische Lage zu kennen, wenn man unter Tage ist. Er realisierte, dass solange die Stationen der U-Bahn in der richtigen Reihenfolge präsentiert werden und ihre Verkehrsknotenpunkte klar skizziert sind, man die Skalierung frei verzerren könnte. Der Fokus der Benutzer einer U-Bahn liegt primär auf der geplanten Reiseroute, also auf der gewünschten Abfahrts- und Zielstation und der richtigen U-Bahnlinie. Beck gab seiner Karte die systematische Präzision eines elektrischen Leitungsnetzes und erzeugte somit ein gänzlich neues imaginäres London, welches nur wenig mit der Geografie der Stadt oben drüber zu tun hatte. Seit 1931 wurde die Karte oftmals überarbeitet und modifiziert, beinhaltet aber immer noch Becks brilliante Idee, aufgrund derer sie auch mehrfach weltweit kopiert wurde. [Spe 2001]

Oftmals sind Problemstellungen jedoch nicht ausschließlich auf einen zweidimensionalen Raum beschränkt, da die Welt für gewöhnlich multivariant ist. Die schon seit Jahrhunderten bestehende zentrale Fragestellung bei der Darstellung von Daten lautet:

Wie präsentiert man drei oder mehr Dimensionen von Daten auf einer zweidimensionalen Oberfläche, wie beispielsweise Wände, Steine, Gewebe, Papier oder Computerbild- schirmen? Für diese abstrakteren mehrdimensionalen Daten, welche nicht in unserer dreidimensionalen Welt angesiedelt sind, werden schon seit einiger Zeit, von Personen, die mit diesen Daten zu tun haben, verschiedene Methoden, bzw. Techniken zur Darstellung entwickelt. Zum Teil sind diese Visualisierungen in alltäglichen, manchmal allgegenwärtigen Darstellungen von Daten zu finden, wie zum Beispiel die ausgeklügelte Strukturierung der Periodentabelle der chemischen Elemente (mit Hunderten von verschiedenen vorgeschlagenen Zusammenstellungen, um die damit zusammenhängende Komplexität besser festhalten zu können). [Tuf 1997]

2.3.3 Computer-Phase

Wie bereits erwähnt, haben grafische Hilfsmittel eine sehr lange Geschichte in der Kultur der Menschheit. Neu ist, diese mittels Computern zu erzeugen. Auch wenn die Erzeugung von Grafiken eine grundsätzlich menschliche Aktivität ist, kann sie sehr effektiv von Computern unterstützt werden. [Spe 2001] Das Medium des Computers erlaubt es, grafische Darstellungen zu erzeugen, welche automatisch Tausende von Datenobjekten zu Bildern zusammenbauen und diese interaktiv durch einen Benutzer modifizieren zu lassen. D.h. Visualisierungen sind nicht länger statisch sondern können interaktiv von Benutzern beeinflusst werden. [CMS 1999]

2.3.4

Pre-Computer-Phase vs. Computer-Phase

In der Pre-Computer-Phase musste der Erzeuger einer Grafik bereits bei deren Erstellung Entscheidungen treffen, welche Daten er visualisieren möchte und wie er diese - entsprechend seines eigenen Verständnisses der Aufgabe, welche mit dieser Visualisierung erledigt werden oder der Mitteilung, welche übermittelt werden sollte - repräsentiert. Autor und Betrachter waren zwei verschiedene Personen. Mit Hilfe des Computers ist es nun möglich, dass der „Betrachter“, also der Benutzer, - im Rahmen der Freiheiten, die ihm der Erzeuger mit der Gestaltung des Visualisierungs-tools definiert hat - die interaktive Kontrolle über diese Art von Entscheidungen hat. [Spe 2001]

“A graphic is no longer ‘drawn’ once and for all: it is ‘constructed’ and reconstructed (manipulated) until all relationships which lie within it have been percieved…a graphic is never an end in itself: it is a moment in the process of decision making. Bertin (1981)

2.3.5 Visualisierung

“Graphing data needs to be interactive because we often do not know what to expect of the data; a graph can help discover unknown aspects of the data, and once the unknown is known, we frequently find ourselves formulating new questions about the data.”

[Cleveland]

In den letzten Jahrzehnten entwickelten sich zunehmend Visualisierungen, welche sich den Computer zu nutze machen. Die heutige Computertechnologie ist in der Lage äußerst komplexe Visualisierungen zu erzeugen, welche eine extrem verbesserte Wiedergabe besitzen und interaktiv modifizierbar sind. [CMS 1999] Auf der menschlichen Seite kann die Visualisierung als dynamisches Artefakt - als Erweiterung des Denkprozesses - agieren. Durch ihre Dynamik erfüllt sie das Bedürfnis des Benutzers nach verschiedenen Sichten oder nach detaillierten Informationen der Daten. [War 1999] Eine aufkommende Sicht betrachtet den Menschen und den Computer zusammen als ein Problemlösungs- system (Zhang, 1997). In einem solchen Modell wird die Datenvisualisierung zu einem Teil des Interfaces zwischen den Komponenten Mensch und Maschine. Die Visualisierung ist ein bidirektionales Interface, wenn auch hochgradig asymmetrisch, mit einer weitaus höheren Bandbreite der Kommunikation in Richtung Maschine zu Mensch als umgekehrt. [War 1999]

Die Visualisierung von Daten allgemein hat grundsätzlich zwei Facetten:

Datenpräsentation und Datenexploration. Der Fokus der Datenpräsentationen ist die Kommunikation von bereits bekannten Fakten durch geeignete Repräsentationsformen. Bei der Datenexploration geht es dagegen darum, mittels angemessener Visualisierungen unbekannte Verknüpfungen zwischen Thematiken aufzudecken, auch genannt „Visual Data Mining“. Die Übergänge zwischen den beiden Facetten können als fließend betrachtet werden. Sowohl für die Datenpräsentation als auch für die Datenexploration erweist sich die visuelle Repräsentation als vorteilhaft. Im Fall der Präsentation, steht die Kommunikation im Vordergrund, im Fall der Exploration ist es die Entdeckung. [Man

2002]

Visualisierungen, die sich den Computer zu nutze machen, haben sich als unabhängige technische Disziplin innerhalb des Bereichs der Human Computer Interaction (HCI) entwickelt. Eine Reihe anderer Disziplinen wirken ebenso an dem effektiven Gebrauch von Visualisierungen mit. Unter ihnen befinden sich die Experimentelle oder Kognitive Psychologie und Human Factors Engineering. Speziell seit den 80er Jahren wurden die Konzepte der Datenvisualisierung zu vielen anderen Bereichen transferiert. [Man 2002] Zu dieser Zeit wurden computerbasierte Visualisierungen vor allem im Bereich der Wissenschaft angewandt, was die Entwicklung des Bereichs der „Scientific Visualization“ zur Folge hatte. Seit den 90er Jahren kommen diese Visualisierungen auch zunehmend in allgemeineren Bereichen, wie Firmen oder Ausbildung zur Anwendung. Diese allgemeinere Anwendung wird „Information Visualization“ oder auch Informations- visualisierung genannt. [Man 2002] [CMS 1999]

2.3.6 Scientific Visualization

Der Scientific Visualization liegen in erster Linie physische Daten, wie beispielsweise der menschliche Körper, die Erde, Naturphänomene, Gebäude, technische Konstruktionen oder Moleküle, zugrunde. Der Computer wird dazu verwendet um – mittels oftmals dreidimensionaler Visualisierungen und Animationen - Eigenschaften dieser physischen Elemente darzustellen. Obwohl eine Visualisierung eines physischen Elements an sich abstrakt ist, ist die Information selbst dennoch inhärent geometrisch. [CMS 1999] Bei der Scientific Visualization werden die modellierten physischen 3D Objekte, detaillierter studiert, geprüft und manipuliert, um beispielsweise wissenschaftliche Hypothesen zu testen, einen Event oder Prozess zu simulieren oder eine Vorgehensweise praktisch auszuprobieren. Darüber hinaus wird die Verwendung von Virtual Reality and VRML, z.B. für virtuelle Rundgänge, in diesem Zusammenhang zunehmend populärer.

Ziel dieser Art von 3D Welt ist es, das Innere eines Objektes zu erforschen und oftmals zur Vorbereitung vor der realen Durchführung zu dienen. [OLI 2003]

2.3.7 Information Visualization

Ebenso wie die visuelle Darstellung physischer Daten ist es oftmals hilfreich, nicht- physische Daten, wie Finanzdaten, Business-Information, Sammlungen von Dokumenten und abstrakten Konzepten zu visualisieren. Jedoch beinhaltet diese Art der Daten keinerlei ersichtlichen räumlichen Bezug. Daher kommt zu der allgemeinen Problematik, wie man sichtbare Eigenschaften von Objekten wiedergibt, das grundsätzliche Problem hinzu, wie man nichträumliche Abstraktionen in effektive visuelle Formen transformiert. Da in der heutigen Welt eine große Masse solcher abstrakter Information existiert, gibt es zahlreiche Versuche, Visualisierungen in den Bereich des Abstrakten zu erweitern (Card, Robertson, and Mackinlay 1991). [CMS 1999] Zu diesem Zweck beschäftigt sich die Information Visualization mit abstrakten, multi-dimensionalen und multivarianten Daten. Primäres Ziel bei der Information Visualization ist, im Gegensatz zur Scientific Visualization, nicht die Abbildung selbst, sondern viel mehr die Möglichkeit, Muster, Clusterungen, Lücken oder Sonderfälle in den Daten offen zu legen. [Shn 2001] Der Nutzen die physischen Elemente abzubilden ist in diesem Bereich nicht wichtig, oftmals sogar gänzlich irrelevant. [Spe 2001] Effektive Informationsvisualisierungen ermöglichen dem Benutzer Entdeckungen zu machen, Entscheidungen zu fällen oder Erklärungen über Muster (Korrelationen, Cluster, Lücken, Sonderfälle) abzugeben und/oder Gruppen mit Objekten oder individuelle Objekte zu erstellen. [Shn 2001] Auch wenn die beiden Bereiche Scientific Visualization und Information Visualization miteinander verwandt sind, so unterscheiden sie sich doch grundsätzlich. Dennoch kann es zu Überschneidungen der beiden Bereiche - wie zum Beispiel bei einer dreidimensionalen Visualisierung eines Gewittersturms, welche mit abstrakten Daten ergänzt wurde - kommen.

Auch wenn verschiedene Techniken und Methoden innerhalb der Information Visualization oder auch der Scientific Visualization entwickelt wurden, um mehrdimensionale Daten zu visualisieren und fiktive dreidimensionale Räume zu erschaffen, so bleibt die Welt, welche auf einem Informationsdisplay dargestellt wird – zumindest bisher noch - nach wie vor zweidimensional. D.h. jegliche Kommunikation zwischen den Betrachtern einer Visualisierung und deren Erzeugern muss auf einer zweidimensionalen Oberfläche erfolgen. [Tuf 1990]

“Escaping this flatland is the essential task of envisioning information – for all the interesting worlds (physical, biological, imaginary, human) that we seek to understand are inevitably and happily multivariate in nature. Not flatlands.” (Edward Tufte)

2.3.8 Historie

Man nimmt an, dass die frühesten Arbeiten aus dem Bereich der Datengrafiken, also die Verwendung von abstrakten visuellen Eigenschaften, wie Linien und Bereiche um Daten visuell zu repräsentieren, aus der Zeit um Playfair (1786) stammen [Tuf 1983]. Beginnend mit Playfair entwickelten sich die klassischen Methoden, Daten in Grafiken einzutragen. 1967 veröffentlichte Bertin, ein französischer Kartograph, seine Theorie über Grafiken in The Semiology of Graphics (Bertin, 1967/1983; Bertin 1977/1981). Diese Theorie identifizierte die Grundelemente von Diagrammen und beschrieb ein Framework für ihr Design. Zehn Jahre (1977) später legte Tukey den Fokus seiner Arbeit Exploratory Data Analysis nicht auf die Qualität der Grafiken, sondern auf die Verwendung von Bildern um einen raschen statistischen Einblick in Daten zu erhalten. 1983 veröffentlichte Tufte dann eine Theorie der Datengrafiken, welche die Maximierung der Dichte von relevanter Information betonte. Sowohl Bertins als auch Tuftes Theorie wurde sehr bekannt und beeinflusste die verschiedensten Communities, mit der Folge, dass die Information Visualization sich als eigene Disziplin entwickelte. Auch das 1988 von Cleveland und McGill veröffentlichte Buch Dynamic Graphics für Statistics, welches neue Visualisierungen von Daten erläuterte, übte einen großen Einfluss aus. Von besonderem Interesse war die Problemstellung, wie man Datensätze mit vielen Variablen visualisieren sollte. Inselbergs Parallelkoordinaten-Technik (Inselberg und Dimsdale, 1990) und Mihalisins Technik der „Cycling through Variables at different Rates“ (Mihalisins, Timlin und Schwegler, 1991) gehörten dabei zu den interessanten Lösungsansätzen. Andere Gruppen, wie die von Eick arbeiteten dagegen an Techniken zur Darstellung großer Datensätze in Form von statistischen Grafiken, verbunden mit wichtigen Problemen in Telekommunikationsnetzwerken und in großen Computerprogrammen (Becker et al., 1995; Eick, Steffen und Sumner,1992). Der Schwerpunkt der Statistiker lag auf der Analyse multidimensionaler, multivariabler Daten und auf neuartigen Typen von Daten.

1985 startete die NSF (National Science Foundation) die Initiative der „Scientific Visualization“ (McCormick and DeFanti, 1987). Die erste IEEE Visualization Conference fand dann 1990 statt. Diese Community wurde von Wissenschaftlern, Physikern und Computerwissenschaftlern im Bereich des „Supercomputing“ geleitet.

Zu dieser Zeit sendeten auch Satteliten erstmalig große Mengen an Daten zurück, so dass Visualisierung als Methode, deren Analyse zu beschleunigen und die Identifikation interessanter Phänomene zu verbessern, als sehr nützlich erkannt wurde. Ebenso versprach der Einsatz von Visualisierungen als Teil von Versuchen, teure Experimente durch Computersimulationen (z.B. Windtunnel) zu ersetzten. Auch die Communities der Computergrafik und Artificial Intelligence bekundeten zunehmend Interesse bezüglich automatisierter Präsentation und automatisiertem Design visueller Repräsentationen von Daten. Diese Anstrengungen wurden angetrieben von Mackinlays These APT (Mackinlay, 1986a), welche Bertins Design Theorie formalisiert, psychophysische Daten hinzufügte und diese verwendete um Präsentationen zu erstellen. 1990 entwickelten Roth and Mattis ein System, um komplexere Visualisierungen zu erzeugen als die von Tufte. 1991 fügte dann Casner noch eine Repräsentation von Tasks hinzu. Das Anliegen dieser Community war nicht so sehr die Qualität der Grafiken als viel mehr das Matchen zwischen Datentypen, Kommunikationsabsichten und grafischen Repräsentationen der Daten zu automatisieren. Zu der Zeit entdeckte auch die User Interface Community, dass die Fortschritte in der Grafikhardware Möglichkeiten für neue Generationen von User Interfaces bot. Diese Interfaces fokussierten auf die Interaktion des Users mit großen Mengen an Information, wie multivariante Datenbänken oder Dokumentensammlungen. Die erste Verwendung des Ausdrucks „Information Visualization“ trat vermutlich bei Robertson, Card, Mackinlay (1989) auf. 1990 präsentierten Feiner und Beshers (1990b) eine Methode, Worlds within Worlds, für die Darstellung von sechs-dimensionalen Finanzdaten in einer Immersive Virtual Reality. 1992 entwickelte Shneiderman (1992b) eine Technik, welche Dynamic Queries genannt wird, um Teilmengen der Datenobjekte interaktiv zu selektieren und eine weitere Visualisierung namens Treemaps, welche eine raumfüllende Repräsentation eines Baums (Trees) darstellt. Card, Robertson und Mackinlay präsentierten Darstellungstechniken, welche mittels Animation und Distorsion die Interaktion mit großen Datensätzen in einem System genannt Information Visualizer (Card, Robertson and Mackinlay, 1991; Robertson, Mackinlay, and Card, 1991; Mackinlay, Robertson, and Card, 1991) ermöglichten. Das Anliegen war auch hier nicht so sehr die Qualität der Grafiken, sondern viel mehr die kognitive Erweiterung. Interaktivität und Animation gehörten zu den wichtigsten Featuren dieses Systems. Diesen anfänglichen Entwicklungen folgten Verfeinerungen und neue Visualisierungen, wobei sich die verschiedenen Communitys stets gegenseitig beeinflussten. [übernommen aus CMS

1999]

Abschließend erfolgt noch mal ein kurzer chronologischer Überblick über einige der wichtigsten Schritte im Bereich der Visualisierung:

1786 Playfair

Verwendung abstrakter visueller Eigenschaften, wie Linien und Bereiche um Daten visuall zu repräsentieren 1967 Bertin

The Semiology of Graphics – Identifizierung der Grundelemente von Diagrammen und Beschreibung eines Framework für ihr Design 1977 Tukey

Exploratory Data Analysis – Die Verwendung von Bildern um einen raschen statistischen Einblick in Daten zu erhalten 1983 Tufte

Theory of Data Graphics - Maximierung der Dichte von nützlicher /verwendbarer Information 1985 NSF

Start der Initiative der “Scientific Visualization” 1986 Mackinlay

These APT – Formalisierung von Bertins Design Theorie 1988 Cleveland und McGill

Dynamic Graphics für Statistics – Erläuterungen neuer Visualisierungen von Daten 1989 Robertson, Card und Mackinlay Erstmalige Verwendung des Ausdrucks „Information Visualization“

1990

Erste “IEEE Visualization” Konferenz 1990 Inselberg

Parallelkoordinaten Methoden 1990 Feiner und Beshers

Worlds within Worlds 1991 Mihalisin

Cycling through Variables at different Rates 1991 Card, Robertson, Mackinlay Information Visualizer (Animation und Distorsion)

1992 Shneiderman Dynamic Queries, Treemaps

2.4 Definition von Begrifflichkeiten

Terminologie ist in vielen Forschungsbereichen ein Problem. Ähnliche Begriffe werden oftmals sehr frei verwendet, auch wenn damit wichtige Konzepte adressiert werden. [Spe 2001] Auch der Bereich der Visualisierung von Daten stellt dabei keine Ausnahme dar. Eher im Gegenteil, da sich verschiedene Disziplinen mit der Visualisierung von Daten beschäftigen, werden je nach Disziplin für prinzipiell gleiche Konzepte unterschiedliche Begriffe verwendet. Jedoch ist auch die Verwendung der Begrifflichkeiten innerhalb einer Disziplin, wie der Information Visualization nicht einheitlich. Entsprechend kursieren zahlreiche Begriffe wie Information Design, Interactive Design, Interactive Visualization, Dynamic Graphics, Information Visualization oder Data Visualization. Daher folgt an dieser Stelle nun die Definition von Begrifflichkeiten, wie sie in der STAR verstanden wird.

Sowohl die Information Visualization als auch die Scientific Visualization gehören zu dem weitreichenden Feld der Datengrafik (Data Graphics), welches die Verwendung von abstrakten, gegenstandslosen visuellen Repräsentationen umfasst, mit dem Ziel die Kognition zu steigern. Das Feld der Datengrafik (Data Graphics) gehört wiederum zum Bereich des Information Design, welcher sich - mit dem Ziel der Steigerung von Kognition - allgemein mit externer Repräsentation beschäftigt. Auf oberster Ebene könnte man Information Design - Teil der externen Kognition - als den Einsatz der externen Welt ansehen, um einen kognitiven Prozess auszuführen. Die Beschreibung der Zielsetzung von Information Visualization als die Steigerung von Kognition, ist absichtlich breit gefächert. Kognition kann sowohl das Schreiben eines wissenschaftlichen Textes sein als auch das Auswählen eines Produktes beim Einkauf. Generell nimmt die Kognition Bezug auf den intellektuellen Prozess bei welchem Information empfangen, transformiert, gespeichert, abgefragt und verwendet wird. All dies kann allgemein mittels externer Kognition und speziell durch Information Visualization erweitert werden. [Card 2003]

Die nachfolgenden Definitionen von [CMS 1999], beschreiben auf einer sehr allgemeinen und leicht nachvollziehbaren Ebene nochmals die Beziehungen zwischen den Konzepten, welche zum Bereich der Information Visualization in Verbindung stehen. Zahlreiche andere Definitionen aus diesem Bereich sind oftmals spezieller ausgelegt.

Insight ”Main goals of insight are discovery, decision making, and explanation.“

Cognition “Cognition is the acquisition or use of knowledge with the goal to get insight.“

External Cognition „Use of the external world to accomplish cognition.”

Information Design ”Design of external representations to amplify cognition.”

Data Graphics ”Use of abstract, nonrepresentational visual representations of data to amplify cognition.”

Visualization ”Use of computer-based, interactive visual representations of data amplify cognition.”

Scientific Visualization ”Use of interactive visual representations of scientific data, typically physically based, to amplify cognition.”

Information Visualization ”Use of interactive visual representations of abstract, nonphysically based data to amplify cognition.”

Somit ergibt sich nach [CMS 1999] folgende Definition für Information Visualization:

Information visualization can be defined as the use of computer-supported, interactive, visual representations of abstract data to amplify cognition.”

Für den Begriff der “Information Visualization”, bzw. „Visualisierung“ aus dem Bereich der Information Visualization finden sich, wie bereits erwähnt, zahlreiche weitere Definitionen. Inhaltlich ähneln sich diese größtenteils. Hier nun einige Beispiele:

Rolf Däßler (Fachhochschule Potsdam):

“Unter Informationsvisualisierung werden heute alle Konzepte, Methoden und Tools zur visuellen Darstellung von Informationen aus Datenbanken, digitalen Bibliotheken oder anderen großen Dokumentensammlungen, zusammengefasst. Informationsvisualisierung beinhaltet die computergestützte Aufbereitung und visuelle Repräsentation abstrakter Informationen mit dem Ziel, den kognitiven Zugang zu elektronisch gespeicherten Daten zu erleichtern.“ [Dae 2003]

Colin Ware (University of New Hampshire):

„Visualization can be described as the mapping of data to visual form that supports human interaction in a workspace for visual sense making.” [War 1999]

Robert Spence (Imperial College of Science, Technology and Medicine, London):

“Interactive Visualization is a lively, interactive examination and interpretation of graphically presented data, in which rearrangement is an important part and the outcome is ususally not predictable.” [Spe 2001]

2.5 Visualisierung Visualisierung

„There are right ways and wrong ways to show data; there are displays that reveal the truth and displays that do not.”

[Tufte]

Auch wenn Visualisierungen an sich dem Menschen dabei helfen, Aufgaben zu erfüllen und ihn bei der Entscheidungsfindung unterstützen, so muss dennoch differenziert werden, dass allein die Tatsache eine Visualisierung zu verwenden um Daten darzustellen nicht ausreicht, um auch den gewünschten Effekt damit zu erreichen. Ob eine Visualisierung nutzt oder eventuell sogar schaden kann hängt davon ab, wie geeignet sie für jeweiligen Kontext ist, in welchem sie eingesetzt wird. Dementsprechend liegt die Anforderung bei Visualisierungen darin, eine adäquate Visualisierung, bzw. ein geeignetes visuelles Mapping für die jeweilige Datenwelt und der damit verbundenen kontextspezifischen Aufgabe zu finden.

Um diese theoretische Anforderung besser zu verdeutlichen und die Einstellung dahin gehend zu sensibilisieren, werden in der Literatur häufig zwei Beispiele von [Tuf 1997] angeführt: die Cholera Epidemie im September 1854 in London und der Start der Challenger am 28. Januar 1986. Diese beiden extremen Situationen zeigen exemplarisch, welche Konsequenzen die Entscheidungen haben können, welche aufgrund der Qualität von Visualisierungen getroffen werden.

2.5.1 Cholera Epidemie in London

Laut Dr. John Snow, einem heutzutage sehr bekannten Pionier im Bereich des Gesundheitswesens, erlebte London 1854 die schrecklichste Cholera Epidemie, die es in England jemals gab. Am Abend des 31. August 1854 wurden in London die ersten Fälle von Cholera registriert. Nur innerhalb weniger Stunden breitete sich die Krankheit rasch weiter aus, beschränkte sich jedoch noch größtenteils auf den Bereich um die Broad Street. Jedoch lag dort die Sterblichkeitsrate enorm hoch, da die Menschen nach der Ansteckung bereits innerhalb weniger Stunden starben; schneller als jemals bei einer anderen Epidemie zuvor. Da man damals glaubte, dass Cholera von der Luft übertragen wird - teilweise sogar, dass es von bösen Geistern übertragen wird - flohen viele Menschen aus ihren Wohnungen und ganze Häuser und Straßen verwaisten.

Dr. John Snow, der bereits zuvor Epidemien in England erforscht hatte, mutmaßte sogleich, dass die Cholera vom Wasser einer gemeinsam genutzten Wasserpumpe an der Ecke Broad Street und Cambridge Street verursacht wurde. Zu der damaligen Zeit wurde die Bevölkerung in London noch über gemeinsam genutzte Brunnen mit Wasser versorgt. Eine Untersuchung des Wassers brachte aber keine schlüssigen Beweise, worauf er anhand einer Liste der Toten, welche er vom General Register Office bekommen hatte, eine Karte von London an fertigte, in die er die geografische Lage der Todesfälle eintrug. Abb. 3 zeigt das von der Cholera betroffene Wohnviertel um die Broad Street herum, mit den eingetragenen Todesfällen in Form von schwarzen Balken für jeden einzelnen Fall sowie die in Verdacht stehende Wasserpumpe.

Wasserpumpe

„Broad Street“

stehende Wasserpumpe. Wasserpumpe „Broad Street“ Arbeitshaus Brauerei Abb. 3 Geografische Karte vom
stehende Wasserpumpe. Wasserpumpe „Broad Street“ Arbeitshaus Brauerei Abb. 3 Geografische Karte vom

Arbeitshaus

Brauerei

Abb. 3 Geografische Karte vom Wohnviertel um die Broad Street, mit eingetragenen Todesfällen [Tuf 1997]

Die ursprüngliche Liste der Todesfälle zählte die Namen der Toten auf und gab eine Beschreibung der Lebensverhältnisse, geordnet nach Todesdatum. Eine davon angefertigte Grafik der Todesfälle (Abb. 4) zeigte die Anzahl der Todesfälle in zeitlicher Abfolge. Durch die zeitliche Darstellung entstand eine Chronologie der Epidemie. Jedoch erschloss sich aus der Art der Visualisierung keinerlei möglichen Ursachen für die Cholera. Beschreibende Erzählungen sind keine Ursachenerforschung und waren in diesem Fall daher nutzlos um eine Strategie zu entwickeln, um die Epidemie zu stoppen.

Abb. 4 Zeitliche Darstellung der Todesfälle [Tuf 1997] Die geografische Karte von Snow dagegen bo

Abb. 4 Zeitliche Darstellung der Todesfälle [Tuf 1997]

Die geografische Karte von Snow dagegen bot direkte und effektive Aussagen über die möglichen Ursache-Wirkung Beziehungen. Er gestaltete die Originaldaten von einer eindimensionalen temporalen Ordnung in eine 2D räumliche Ordnung um und zeichnete die Todesfälle und alle Pumpen ein, worauf sich eine Clusterung in der Broad Street Pumpe ergab. Diese Karte enthüllte eine enge Verbindung zwischen den Cholera Todesfällen und der Nähe zu der Broad Street Pumpe, im Kontext von gleichzeitigen Vergleichen mit anderen örtlichen Wasserquellen und der umgebenden Nachbarschaft ohne Cholera.

Um die Ursache für die Epidemie vollständig zu verstehen, war es ebenfalls erforderlich eine Analyse derer, die der Krankheit entkommen sind, durchzuführen. Die Karte zeigte klar, dass bei dem Vergleich zwischen den Lebenden und den Todesfällen einige Lücken existieren. Auffallend sind vor allem die Lücken im Bereich der Brauerei (70 Brauereiangestellte und keiner erkrankt) und einem Arbeitshaus in der Nähe der Pumpe (siehe Abb. 3). Nachforschungen zeigten, dass sowohl das Arbeitshaus als auch die Brauerei über eigene Brunnen im Haus verfügten und somit überhaupt kein Wasser aus der Broad Street Pumpe bezogen hatten. Den Arbeitern der Brauerei war es sogar erlaubt, täglich eine bestimmte Menge des Biers, welches hergestellt wurde, selbst zu trinken. Dagegen gab es in den direkt angrenzenden Häusern zu dem Arbeitshaus und der Brauerei Cholera-Tote. Allerdings zeigte die Karte auch einige Todesfälle, welche nicht in unmittelbarer Nähe zur Broad Street Pumpe lagen, sondern näher zu anderen Wasserpumpen lagen. Snow ging jedem einzelnen Fall persönlich nach und konnte, obwohl die außenliegenden Fälle zufällig und nicht erklärbar schienen, nachweisen, dass alle diese Personen aus den verschiedensten Gründen ebenfalls Wasser aus der kontaminierten Pumpe getrunken hatten. Die Begründungen reichten von Personen, welche in dieser Gegend zu Besuch waren oder Personen, deren Arbeits- oder Schulweg an der Pumpe vorbei führte bis zu einem Fall, in dem sich die betroffene Person speziell

das Wasser von der Pumpe an der Broad Street besorgt hat, da es angeblich geschmacklich besser war als das Wasser anderer Pumpen. Aufgrund der Untersuchungen und Beweise von Dr. Snow wurde veranlasst, dass die Pumpe an der Broad Street entfernt wurde. Wie sich später herausstellte, war ein Abwasserrohr in der Nähe gebrochen und hat das Wasser dieser Pumpe verseucht. Kurze Zeit nach Entfernung der Wasserpumpe endete die Epidemie.

Obwohl Dr. John Snow viele Beweise für eine Kontaminierung der Wasserpumpe der Broad Street erbringen konnte, lässt sich bis heute nicht eindeutig beweisen – wie er auch selbst feststellte -, dass die Entfernung der Pumpe unmittelbar mit dem Ende der Epidemie zusammenhing, da die Epidemie zum Zeitpunkt der Entfernung der Wasserpumpe ohnehin bereits am abklingen war (siehe Abb. 5). Ein möglicher Grund für das Ende der Epidemie wäre auch, dass zu diesem Zeitpunkt bereits viele Menschen aus den betroffenen Gebieten geflohen waren und daher auch die Zahl der Opfer und der Neuansteckungen sank. Da aber sowohl die Grafik (Abb. 5) als auch die geografische Karte (Abb. 3) nur absolute Zahlen zeigen und keine Relationen, wird auch heute noch häufig die Entfernung der Pumpe als Grund für das Ende der Epidemie angeführt. Auch wenn kein eindeutiger Beweis dafür vorliegt, so schützte das Entfernen der Pumpe zumindest vor einem Wiederausbruch der Cholera.

der Pumpe zumindest vor einem Wiederausbruch der Cholera. Abb. 5 Zeitlicher Verlauf der Cholera-Epidemie [Tuf 1997]

Abb. 5 Zeitlicher Verlauf der Cholera-Epidemie [Tuf 1997]

Die Maßnahmen gegen die Broad Street Pumpe basierten auf einer Vielfalt von Beweisen:

Die Cholera-Karte, Studien ungewöhnlicher Umstände, Vergleiche der Lebenden und Toten, deren Wasserkonsum, sowie die Idee eine Ursache für die Kontaminierung des Wassers. Dr. John Snow zeigte, dass mit einer logischen Vorgehensweise und den geeigneten Methoden sich aus Daten viele und vor allem relevante Informationen ablesen lassen.

Auch wenn bis heute nicht eindeutig geklärt werden konnte, weshalb die Epidemie endete, bewies Dr.Snow durch seine Untersuchungen, dass Cholera durch Wasser und nicht durch Luft übertragen wird, wie bis dahin fälschlicherweise angenommen wurde. 1886 festigte die Entdeckung des Vibrio Cholerae Bakteriums die Theorie von Snow. Noch heute ist er dafür bekannt, die Art der Cholera Übermittlung und die Methode der Prävention entdeckt zu haben. 1955 gedachten die Proceedings of the Royal Society of Medicine Snow’s Entdeckung. Ein renommierter Epidemiologe, Bradford Hill schrieb: „ For close upon 100 years we have been free in this country from epidemic cholera, and it is a freedom which, basically, we owe to the logical thinking, acute oberservations and simple sums of Dr. John Snow.”

2.5.2 Space Shuttle Challenger

Am 28. Januar 1986 explodierte das Space Shuttle Challenger und sieben Astronauten verloren dabei ihr Leben. Grund dafür waren zwei Gummi O-Ringe, die aufgrund der extremen Kälte an diesem Tag ihre Elastizität verloren hatten und deshalb gebrochen waren (Abb. 6).

verloren hatten und deshalb gebrochen waren (Abb. 6). Gebrochener O-Ring Abb. 6 Die Challenger etwa 60
verloren hatten und deshalb gebrochen waren (Abb. 6). Gebrochener O-Ring Abb. 6 Die Challenger etwa 60

Gebrochener O-Ring

Abb. 6 Die Challenger etwa 60 Sekunden nach dem Start [Tuf 1997]

Am Tag vor dem Start äußerten die Ingenieure des Space Shuttles der Firma Thiokol Bedenken hinsichtlich des Starts der Challenger, da die Wetterprognosen für den nächsten Tag 26 bis 29 Grad Fahrenheit voraussagten. Bei einer solchen Kälte könnten die O-Ringe der Belastung voraussichtlich nicht standhalten, weswegen empfohlen wurde, den Start der Challenger zu verschieben. Sie begründeten ihre Besorgnis aufgrund verschiedene Quellen: eine Historie von O-Ring Beschädigungen während früherer Starts des Shuttles an kalten Tagen, die physische Elastizität (welche exponential mit zunehmender Kälte abnimmt) und Versuchsdaten. Diese Quellen

präsentierten sie in 13 unterschiedlichen Grafiken, welche sie an die NASA - die Regierungsbehörde, welche für den Flug verantwortlich war - faxten. Jedoch konnten die Verantwortlichen der NASA den Grafiken keinerlei Beweiskraft dafür entnehmen, dass die Beschädigungen der O-Ringe mit kalten Temperaturen zusammenhingen, und lehnten es daher ab, den Start der Challenger zu verschieben. Daraufhin erfolgte der Start der Challenger planmäßig.

Unabhängig von einer ganzen Reihe von Ursachen, welche für das Unglück der Challenger verantwortlich waren, war auch das Unvermögen, die Verbindung zwischen kalten Temperaturen und den Beschädigungen von O-Ringen bei früheren Flügen glaubhaft darzustellen und somit das Risiko für diesen Start realistisch abschätzen zu können, mitverantwortlich für die Explosion des Space Shuttles. Eine aussagekräftige, vor dem Flug durchgeführte Analyse hätte offenbart, dass dieser Flug ein erhebliches Risiko für die Challenger und ihre Besatzung darstellte. Bei der Erstellung der 13 Grafiken für die NASA unterliefen den Ingenieuren des Space Shuttles eine Reihe von Fehlern. Die Grafiken waren schlecht gestaltet, wie z.B. ein schlechter Index, schlechte Farbabstufungen, vertikale Beschriftungen, schlampige Typographie oder enthielten zum Teil nicht relevante Daten, wie Daten von Testraketen, die niemals einem echten Flug ausgesetzt waren. Insgesamt hatten die Grafiken keine große Aussagekraft. Vor allem aber die richtige Auswahl der Daten kann den Unterschied, zwischen aussagekräftigen und nicht aussagekräftigen Darstellungen ausmachen. Durch diese Wahl wird die analytische Agenda, welche zu einer bestimmten Entscheidung führt, festgesetzt.

welche zu einer bestimmten Entscheidung führt, festgesetzt. Abb. 7 Grafik, die der NASA zur En tscheidungsfindung

Abb. 7 Grafik, die der NASA zur Entscheidungsfindung für den Start der Challenger vorlag [Tuf 1997]

Abb. 7 stellt eine der 13 erstellten Grafiken dar, welche der NASA zur Entscheidungs- findung für den Start der Challenger vorlag. Diese Grafik zeigt alle O-Ring Messwerte, die für alle 24 früheren Shuttle Starts ermittelt wurden. Die Repräsentation dieser Messwerte erfolgt durch 48 kleine Raketenabbildungen, welche die 24 Flüge repräsentieren. Insgesamt gab es sieben Flüge mit O-Ring Problemen. Die Starttemperatur wird für jedes Paar Raketen einzeln angegeben. Zwar enthält diese Grafik alle Daten, die benötigt werden um die Beziehung zwischen Temperatur und O-Ring Schaden zu diagnostizieren, dennoch ist es nicht möglich diese zu erkennen. Die schlechte Gestaltung macht es unmöglich, die relevanten Informationen daraus ablesen zu können. Die fehlende visuelle Klarheit beim Anordnen der Beweise ist ein Zeichen für fehlende intellektuelle Klarheit bezüglich der Argumentation der Beweise. Der größte Fehler ist jedoch die chronologische Anordnung, da sie keinerlei Bezug zur Temperatur herstellt, obwohl dies gezeigt werden sollte. Informationsdarstellungen sollten dem bevorstehenden analytischen Zweck dienen; d.h. wenn eine mögliche Ursache-Wirkung–Beziehung dargestellt werden soll, sollte der Graph die Daten so organisieren, dass eine solche Verbindung beleuchtet wird. Daher sollte in diesem Fall die Ordnung der Daten nicht chronologisch sein, sondern in der Ordnung nach der möglichen Ursache.

Obwohl die Ingenieure aufgrund kausalen Denkens das Problem erkannt hatten, war es ihnen nicht möglich, dieses ebenso schlüssig darzustellen. Die analytischen Grafiken verfehlten die tatsächlich präsente Gefahr aufzudecken und zeigten den Verantwortlichen bei der NASA nicht die drohende Gefahr.

Tatsächlich, so zeigt Tufte, bedurfte es lediglich eines einfachen Scatterplots und einer geordnete Tabelle um die unmittelbare Beziehung zwischen Temperatur und O-Ring Schaden zu offenbaren. In einer Tabelle wird die gesamte History der Temperatur und O- Ring Zustände für alle früheren Flüge aufgeführt. Die Einträge sind nach der möglichen Ursache - Temperatur - vom kältesten bis zum wärmsten Start geordnet. Zusätzlich wurde für jeden Start ein durchschnittlicher O-Ring Schaden ermittelt. Die Tabelle lässt den Zusammenhang von O-Ring-Schäden und kaltem Wetter - mit dem Fokus auf Probleme, welche bei kaltem Wetter auftauchen verglichen mit Problemen, die bei warmem Wetter auftauchen - erkennen. Der Scatterplot (Abb. 8) zeigt die Erfahrungswerte aller 24 früheren Starts vor der Challenger. Wie die Tabelle, zeigt der Graph das ernsthafte Risiko einen Start bei 29 Grad durchzuführen. Über Jahre hinweg hatten O-Ringe konstante Probleme bei kühleren Temperaturen: in der Tat war das Resultat jedes Starts unterhalb von 66 Grad ein defekter O-Ring; an wärmeren Tagen traten dagegen nur bei wenigen Flüge Erosionen auf. Dieser Graph, dessen Temperaturskala bis zu 25 Grad reicht, drückt visuell aus, wie

die Hochrechnung aussehen muss, wenn man bei 29 Grad startet. Der kälteste Flug ohne einen O-Ring Defekt wurde bei 66 Grad gemacht. 37 Grad wärmer als für das Datum des Starts der Challenger vorher gesagt wurde. D.h. die Grafik sagt klar aus, dass bei einer Temperatur bei 29 Grad Fahrenheit nicht gestartet werden darf.

bei 29 Grad Fahrenheit nicht gestartet werden darf. Abb. 8 Scatterplot, der die Abhängigkeit zwischen

Abb. 8 Scatterplot, der die Abhängigkeit zwischen Starttemperatur und O-Ring Schaden zeigt [Tuf 1997]

Für den Start der Challenger gab es außer den beschriebenen Gründen auch einen hohen politischen und öffentlichen Druck. Starts von Shuttles waren zum damaligen Zeitpunkt zur vermeintlichen Routine geworden. Der Start der Challenger wäre der erste Start eines Space Shuttles seit Jahren gewesen, welcher hätte abgesagt werden müssen. Das Ausbleiben von klarem Denken bei der Analyse und der Präsentation von Beweisen öffnet beim Treffen von Entscheidungen die Tür für alle Sorten von politischen oder anderen schädlichen Einflüssen. Seit dem Unglück der Challenger wurden eine Reihe von Flügen aus guten Gründen abgesagt.

2.5.3 Verfälschende Visualisierungen

Nicht jede Visualisierung gibt den Inhalt der zugrundeliegenden Daten wahrheitsgetreu und vor allem objektiv wieder. Visualisierungen sind durchaus in der Lage wahre Gegebenheiten oder Tatsachen zu verfälschen, obwohl sie auf einer korrekten Datenbasis erstellt wurden. Anknüpfend an das Beispiel der Cholera Epidemie in London im Jahre 1854 soll gezeigt werden, dass je nach Visualisierung die Tatsachen abgeschwächt beziehungsweise verstärkt werden können. Diese Darstellung erfolgt zunächst an dem bereits beschriebenen „Irrglauben“, dass die Bekämpfung der Cholera Epidemie eindeutig auf die Entfernung der Wasserpumpe in der Broad Street durch Dr. John Snow zurück zuführen ist und nachfolgend an einer nachträglich erstellten geografischen Bereichs- aufteilung derselben Daten. Wie Abb. 9 (oben) zeigt, ging die Epidemie zum Zeitpunkt

der Entfernung der Wasserpumpe an der Broad Street bereits zurück. Die Entfernung der Pumpe lässt also in der Grafik keine tatsächliche merkliche Änderung der Todesrate erkennen.

tatsächliche merkliche Änderung der Todesrate erkennen. Abb. 9 Tägliche vs. wöchentliche Da rstellung der

Abb. 9 Tägliche vs. wöchentliche Darstellung der Todesfälle [Tuf 1997]

Ändert sich nun in derselben Grafik mit denselben zugrundeliegenden Daten lediglich die Art der Darstellung der Daten und zwar von einer täglichen Darstellung der Todeszahl zu einer kumulierten wöchentlichen, scheint es, dass die Entfernung der Pumpe einen sofortigen rapiden Rückgang der Todesfälle von 458 nach 112 zur Folge hatte. Die tägliche Einteilung lässt dagegen keinen solchen Effekt erkennen. Eine weitere Verschiebung der Einteilung der Zeitleiste und zwar von einer wöchentlichen zu einer wochenübergreifende Einteilung, lässt die Tatsache der Entfernung der Pumpe noch dramatischer erscheinen (siehe Abb. 10). In dieser Darstellung scheint sich die Epidemie drei Wochen lang dramatisch auszubreiten, bis schließlich Ende der dritten Woche die Wasserpumpe entfernt wird. Nur zwei Tage später, eine typische Zeitspanne zwischen der Infektion durch infiziertes Wasser und dem darauffolgenden Tot durch Cholera, erfolgte laut Grafik ein rapider Rückgang der Todesfälle. Ohne Kenntnis der anderen Grafiken, wäre eine missverständliche Deutung der Sachverhalte unabwendbar.

Abb. 10 Wochenübergreifende Darstellung der Todesfälle [Tuf 1997] Auch die Art der Aufteilungen von Flächen

Abb. 10 Wochenübergreifende Darstellung der Todesfälle [Tuf 1997]

Auch die Art der Aufteilungen von Flächen kann die Wahrheit sowohl offen legen als auch verbergen. Dr. John Snow verwendete eine Punktekarte um die Todesfälle im Bereich Londons geografisch festzuhalten. Nimmt man eine geografische Aufteilung der Bereiche vor, so ist es möglich, je nach Aufteilung der Bereiche die Aussagen der Grafiken zu „verfälschen“. Dies zeigen die von Mark Monmonier 6 erstellten Grafiken, welche er auf derselben Datenbasis erstellte, wie Dr. Snow seine Punktekarte. Abb. 11 zeigt eine geografische Aufteilung des Gebietes in sechs Bereiche, bei der die meisten Todesfälle im Bereich der Broad Street Pumpe vorkommen. Ersichtlich ist dies anhand der verschiedenen Grauwerte. Der dunkelste Grauwert steht für die meisten Todesfälle, der hellste Grauwert entsprechend für die wenigsten Todesfälle. Die Ergebnisse hinsichtlich der Zentrierung der Todesfälle in der Nähe der Wasserpumpe der Broad Street, entspricht den Ergebnissen, die auch Dr. Snow erhielt.

entspricht den Ergebnissen, die auch Dr. Snow erhielt. Wasserpumpe „Broad Street“ Abb. 11 Geografische Ei

Wasserpumpe

„Broad Street“

Abb. 11 Geografische Einteilung des Bereichs um die Broad Street in fünf Einzelbereiche – Version 1 [Tuf 1997]

6 Mark Monmonier, How to Lie with Maps (Chicago, 1991), pp.142-143.

Abb. 12 links teilt dagegen das Gebiet geografisch so ein, dass die Anzahl der Todesfälle in vier der fünf Bereich nahezu gleich hoch ist und es somit keine Zentrierung in einem Bereich gibt. In einer weiteren Einteilung des Gebietes (Abb. 12 rechts) in fünf Bereiche, liegt die infizierte Wasserpumpe nicht einmal in den beiden am stärksten von Todesfällen betroffenen Gebieten.

am stärksten von Todesfällen betroffenen Gebieten. Abb. 12 Geografische Einteilung des Bereichs um die Broad

Abb. 12 Geografische Einteilung des Bereichs um die Broad Street in fünf Einzelbereiche – Version 2 [Tuf 1997] und Geografische Einteilung des Bereichs um die Broad Street in fünf Einzelbereiche – Version 2 [Tuf 1997]

Diese beiden Beispiele zeigen, dass es möglich ist, mit grafischen Darstellungen Tatsachen zu verfälschen, ohne die zugrundliegende Datenbasis selbst manipulieren zu müssen. Mittlerweile ist es leicht geworden mittels computergestützten Berechnungen und Erstellungen von Grafiken, Tausende von möglichen Variationen von grafischen und statistischen Zusammenfassungen zu durchsuchen. Dies führt dazu, dass man mittlerweile für Publikationen oder ähnliches ausschließlich die Grafiken heraus sucht, welche die eigene Sichtweise auch vorteilhaft unterstützen. Somit können auch Visualisierungen, ähnlich wie Worte oder mitunter sogar stärker, Sachverhalte verfälschen.

2.6 Herausforderung des Themas

The purpose of visualization is insight, not pictures.“

[Card, Mackinlay, Shneiderman]

Die Thematik der Visualisierung von Daten ist, wie bereits erwähnt, ein breitgefächertes Feld, mit dem sich verschiedenen Disziplinen, wie die Computer Grafik oder die Information Visualization beschäftigen und welches über zahlreiche Anwendungs- möglichkeiten in vielen unterschiedlichen Bereichen verfügt. Die vorliegende State-of- the-Art Analyse beschäftigt sich mit der Thematik aus Sicht der Information Visualization, jedoch sind viele der Aspekte auch übertragbar auf die anderen Disziplinen.

Die Herausforderung der Thematik der Visualisierung von Daten im allgemeinen liegt darin, die oftmals propagierten Vorzüge der visuellen Darstellung von Daten - Unterstützung der menschlichen Wahrnehmung bei der Informationssuche und Hilfestellung beim Verstehen und Erkennen von Informationsstrukturen [Lin 1998] - mit einer konkreten Visualisierung auch zu erreichen. Die Verwendung einer visuellen Darstellung, bzw. Visualisierung anstatt einer andersartigen Darstellungsform ist kein Garant für eine Verbesserung der Darstellung selbst. Ganz im Gegenteil, dies kann auch zu einer Verschlechterung, bzw. zu einer verfälschenden Darstellung führen (siehe Kapitel 2.5.3). Der Fokus bei Visualisierungen sollte daher mehr auf dem Nutzen der Visualisierung liegen als auf den Mitteln [CMS 1999]. Jedoch wird diese Tatsache häufig außer Betracht gelassen und manche Visualisierungen nur um ihrer selbst Willen entwickelt. Hypothetische Konstrukte oder Annahmen, gepaart mit technischer Machbarkeit sind der Motivator für die Entwicklung solcher Visualisierungen. Unterstützt wird diese Vorgehensweise häufig von der Tatsache, dass Visualisierungen bisher generell kaum Evaluationen unterzogen werden und häufig nur vereinzelt den Weg in die praktische Anwendung finden. Jedoch konnte man in jüngerer Zeit einen Wandel in diesem Trend beobachten, da immer mehr Visualisierungen evaluiert werden, so dass die Anzahl von empirischen Studien in diesem Bereich zunehmend steigt [CY 2000]. Wie in Kapitel 4.4 gezeigt wird, hängt der erfolgreiche Einsatz einer Visualisierung von einer Reihe von Faktoren ab, jedoch ist das Hauptziel von Visualisierungen stets der Nutzen für den Benutzer, unabhängig davon wie dieser im Einzelfall definiert wird.

2.7 Ausgangssituation

Dieser Teil der STAR behandelt die Darstellung der Ausgangssituation, d.h. in wie weit Visualisierungen bei den derzeitigen Webauftritten der Automobilbranche bereits eingesetzt werden. Ziel dabei ist, einen Überblick über den allgemeinen IST-Stand, insbesondere bezüglich der Darstellung der Produktwelt, in dieser Branche zu gewinnen. Dabei lag der Fokus der Betrachtung vor allem auf der Darstellung der Automobilwelt (PKW), wie sie dem Kunden insbesondere im Car Konfigurator, welcher bereits viele Interaktionsmöglichkeiten mit den Daten bietet, präsentiert wird.

Um zunächst einen allgemeinen Eindruck des Webauftrittes Mercedes-Benz Deutschland 7 und der dabei verwendeten Visualisierungen zu erhalten, erfolgte eine umfassende Betrachtung des gesamten Webseite, inklusive des Car Konfigurators. Zusätzlich wurde auch die schwedische Version des Car Konfigurators 8 von Mercedes-Benz betrachtet, da dieser die aktuellere Version im Vergleich zum deutschen Car Konfigurator darstellt. Da Car Konfiguratoren ein weitverbreitetes „Tool“ auf Automobil-Webseiten darstellen, war es möglich auch die Lösungen anderer Automobilkonzerne zu prüfen und somit einen Eindruck über den „IST-Stand“ in diesem Bereich zu erhalten. Die Auswahl der Webauftritte erfolgte möglichst breitgefächert - unabhängig von Image oder Marktanteil der jeweiligen Automobilkonzerne - da nicht zwangsläufig davon ausgegangen werden kann, dass diese Faktoren unmittelbar mit der Qualität der jeweiligen Webauftritte zusammenhängen. Jedoch berücksichtigt die Betrachtung ausschließlich – mit Ausnahme des schwedischen Car Konfigurators – deutsche Webauftritte. Diese Spezialisierung fand statt, da aus der Vielzahl an unterschiedlichen Webauftritten, die größtenteils Länderspezifisch sind, in irgendeiner Form eine Teilmenge zur Betrachtung selektiert werden musste. Die Einschränkung auf ausschließlich deutsche Webauftritte begründet sich damit, dass die deutschen Webseiten anderer Automobilkonzerne in unmittelbaren Vergleich zur Webseite von Mercedes-Benz Deutschland stehen.

7 Mercedes-Benz Deutschland [http://www.mercedes-benz.de]

8 Mercedes-Benz Schweden [http://www.mercedes-benz.se]

Zu den betrachteten Webauftritten anderer Automobilkonzerne 9 , mit Fokus auf die Car Konfiguratoren gehören (in alphabetischer Reihenfolge): Alfa Romeo, Audi, BMW, Citroen, Daihatsu, Fiat, Ford, Lancia, Nissan, Opel, Peugeot, Porsche, Renault, Saab, Seat, Skoda, Toyota, Volkswagen und Volvo. Da, zumindest zum Zeitpunkt der Analyse (April 2004), nicht alle Automobilkonzerne Car Konfiguratoren auf ihren Webseiten anbieten, fehlen an dieser Stelle einige Namen, wie zum Beispiel Honda oder Mitsubishi. Davon abgesehen war es auch nicht Ziel dieser Betrachtung, Vollständigkeit zu erreichen sondern einen möglichst Markenübergreifenden Eindruck bezüglich der Darstellung der Produktwelt - insbesondere in Car Konfiguratoren - zu gewinnen.

Nachfolgend werden nun die Ergebnisse dieser Betrachtung wieder gegeben. Die Darstellung der Ergebnisse erfolgt an dieser Stelle nicht detailliert sondern wird kurz, im Stil eines Fazits, zusammengefasst.

2.7.1 Mercedes-Benz

Der Webauftritt von Mercedes-Benz Deutschland umfasst eine Vielzahl von Informationen und Funktionen. Bei der Betrachtung der gesamten Webseite konnte jedoch festgestellt werden, dass insgesamt gesehen, verhältnismäßig wenig Visualisierungen eingesetzt werden um die Inhalte darzustellen. Die Darstellung des Kontents erfolgt vorrangig in Textform, in Kombination mit Bildmaterial. Dazu werden häufig Fließtext, Bildreihen, tabellenartige Strukturen und Listendarstellungen in Kombination mit Hyperlinks verwendet. Visualisierungen werden nur an einigen wenigen Stellen eingesetzt. Der nachfolgende Abschnitt soll hierfür einige Beispiele zeigen.

So verfügt beispielweise die „Händlersuche“ über geografische Karten, in welchen die verschiedenen Standorte von Mercedes-Benz Händlern markiert, bzw. die Anfahrtsroute zu einem bestimmten Händler eingezeichnet ist (siehe Abb. 13). Allerdings lassen die Karten keinerlei Form der direkten Interaktion, wie zum Beispiel „Zoom“ oder „Selektion“ durch den Benutzer zu, sondern haben einen rein statischen Bildcharakter.

9 Betrachtete Car Konfiguratoren anderer Automobilhersteller: Alfa Romeo (de) [http://www.alfaromeo.de/], Audi (de) [http://www.audi.de], BMW (de) [http://www.bmw.de], Citroen (de) [http://www.citroen.de], Daihatsu (de) [http://www.daihatsu.de], Fiat (de) [http://www.fiat.de], Ford (de) [http://www.ford.de], Lancia (de) [http://www.lancia.de], Nissan (de) [http://www.nissan.de], Opel (de) [http://www.opel.de], Peugeot (de) [http://www.peugeot.de], Porsche (de) [http://www.porsche.de], Renault (de) [http://www.renault.de], Saab (de) [http://www.saab.de], Seat (de) [http://www.seat.de], Skoda (de) [http://www.skoda.de], Toyota (de) [http://www.toyota.de], VW (de) [http://www.volkswagen.de], Volvo (de) [http://www.volvo.de]

Abb. 13 Geografische Karten: Händlers tandorte (li.) und Anfahrtsroute (re.) Interaktion für den Benutzer bi
Abb. 13 Geografische Karten: Händlers tandorte (li.) und Anfahrtsroute (re.) Interaktion für den Benutzer bi

Abb. 13 Geografische Karten: Händlerstandorte (li.) und Anfahrtsroute (re.)

Interaktion für den Benutzer bieten dagegen die „360 Grad Ansicht“ der Fahrzeuge (Abb. 14) und insbesondere die „Interaktive Bedienungsanleitung“ der jeweiligen Fahrzeugklassen (Abb. 15). Hier kann der Benutzer Fahrzeug- und Bedienelemente, wie zum Beispiel Regler und Knöpfe selber testen und das entsprechende Feedback beobachten.

selber testen und das entsprechende Feedback beobachten. Abb. 14 „360 Grad Ansicht“ aussen (li.) und innen
selber testen und das entsprechende Feedback beobachten. Abb. 14 „360 Grad Ansicht“ aussen (li.) und innen

Abb. 14 „360 Grad Ansicht“ aussen (li.) und innen (re.)

Abb. 15 Beispielabbildungen aus der „Interaktiven Bedienanleitung“ des SLK Der „Fahrzeugkalkulator“ (Abb. 16
Abb. 15 Beispielabbildungen aus der „Interaktiven Bedienanleitung“ des SLK Der „Fahrzeugkalkulator“ (Abb. 16

Abb. 15 Beispielabbildungen aus der „Interaktiven Bedienanleitung“ des SLK

Der „Fahrzeugkalkulator“ (Abb. 16 links), welcher zu der Kategorie der Finanzdienstleistungen gehört, nutzt für die Visualisierung einer Online-Kalkulation die Metapher eines Armaturenbretts. Der Benutzer hat so die Möglichkeit die gewünschten Werte bzw. Kategorien mittels direkter Manipulation der Zeiger der jeweiligen „Tachos“ auszuwählen. Eine direkte Texteingabe durch den Benutzer wird somit überflüssig.

Texteingabe durch den Benutzer wird somit überflüssig. Abb. 16 Fahrzeugkalkulator (li.) und Wunschfahrzeug
Texteingabe durch den Benutzer wird somit überflüssig. Abb. 16 Fahrzeugkalkulator (li.) und Wunschfahrzeug

Abb. 16 Fahrzeugkalkulator (li.) und Wunschfahrzeug (Softfinder) (re.)

Ein weiteres Tool, das zu den Finanzdienstleistungen gehört und ebenfalls eine Visualisierung nutzt, ist der „Softfinder“ (Abb. 16 rechts). Mit diesem Tool ist es dem Benutzer möglich, Fahrzeuge je nach Höhe der monatlichen Finanzierungsrate und Laufzeit entsprechend zu ermitteln. Mittels Slidern können die gewünschten Angaben zu diesen Kriterien vom Benutzer eingestellt werden. Der Softfinder liefert schließlich die in Frage kommenden Fahrzeuge in Form von Fahrzeugsymbolen zurück, wobei entsprechende Änderungen in Größe und Transparenz der Symbole zusätzlich die Relevanz der Treffer kodieren.

Auch das Tool der „Finanzierungsarten“ arbeitet mit einer Visualisierung. Hier kann der Benutzer je nach Finanzierungsart verschiedene Angaben, wie zum Beispiel die „Höhe der Anzahlung“ oder die „Laufzeit“ mittels einer Balkendarstellung interaktiv verändern. Bei Änderung einer Angabe, also der Höhe, bzw. Breite eines Balkens, veränderen sich entsprechend die Proportionen der jeweils anderen Balken.

entsprechend die Proportionen der jeweils anderen Balken. Abb. 17 Finanzierungsarten(li.) und Preis-Finder (re.) Der
entsprechend die Proportionen der jeweils anderen Balken. Abb. 17 Finanzierungsarten(li.) und Preis-Finder (re.) Der

Abb. 17 Finanzierungsarten(li.) und Preis-Finder (re.)

Der „Preis-Finder“ (Abb. 17 rechts) schließlich stellt eine Scatterplot-Darstellung dar. Die verikale Achse ist mit den einzelnen Fahrzeugklassen belegt (kategorische Achse), die horizontale Achse mit dem Preis (kontinuierliche Achse). Durch die direkte Manipulation der Preisachse kann der Benutzer sich die gewünschte Preisrange interaktiv einstellen. Entsprechend verändert sich die Positionierung der Fahrzeugsymbole, bzw. kommen Fahrzeuge hinzu oder fallen aus der Darstellung heraus.

Car Konfigurator Der Car Konfigurator der deutschen Webseite von Mercedes-Benz beinhaltet selbst keine expliziten Visualisierungen. Die Darstellung der Inhalte des Konfigurators erfolgt hauptsächlich über horizontale oder vertikale Listen- oder Tabellendarstellungen, wobei diese sowohl Bilder als auch Texte enthalten können. Weitere Elemente, welche häufig verwendet werden sind Hyperlinks (Text oder Bild), Pull-Down-Menues, Radio Buttons und Check Boxes. Über diese Elemente erfolgt in der Regel die jeweilige Auswahl des Benutzers.

Abb. 18 Überblick über die Klassen und ihre jeweiligen Modelle Der schwedische Car Konfigurator bietet

Abb. 18 Überblick über die Klassen und ihre jeweiligen Modelle

Der schwedische Car Konfigurator bietet im Gegensatz zum deutschen Konfigurator dem Benutzer einen Scatterplotartigen Überblick über die jeweiligen Klassen und ihre Modelle, bzw. Preise oder Motorleistungen (Abb. 18). Der Wechsel zwischen den jeweiligen Darstellungen, von welchen es insgesamt drei gibt, gleicht einem Wechsel der Achsen- belegung der horizontalen Achse. Die kategorische Belegung der vertikalen Achse mit den einzelnen Fahrzeugklassen bleibt jeweils bestehen. Bis auf diesen Unterschied entspricht der schwedische Car Konfigurator jedoch prinzipiell der Beschreibung des deutschen Car Konfigurators, auch wenn sich die jeweiligen visuellen Ausgestaltungen voneinander unterscheiden. Denn auch der schwedische Car Konfigurator setzt bis auf obige Ausnahme keine weiteren Visualisierungen ein.

2.7.2 Andere Automobilkonzerne

Die Betrachtung von Car Konfiguratoren anderer Automobilkonzerne 10 ergab, dass die Beschreibung des deutschen Car Konfigurators ebenfalls auf alle weiteren betrachteten Konfiguratoren zutrifft. Das heisst, es gibt ein auffallend übereinstimmendes Bild, was die prinzipielle Darstellung der Daten in den Konfiguratoren angeht. Sicherlich gibt es Unterschiede zwischen den einzelnen Konfiguratoren, wie die visuelle Ausgestaltung, Kategorisierungen, Zugangsmöglichkeiten oder auch angebotene Funktionen. So verfügt zum Beispiel der Car Konfigurator von Porsche über die Funktion „Sound“, mit welcher sich der Benutzer das Motorgeräusch der jeweiligen Fahrzeuge anhören kann. Andere

10 Die Auflistung der einzelnen Automobilkonzerne erfolgte bereits im einleitenden Teil des Kapitels.

Automobilkonzerne bieten Zugangsmöglichkeiten zum Konfigurator über Preis oder Modellwahl, wie Citroen oder verfügen über sortierbare Listen, wie Renault oder Porsche. Die Schemata, welche zur Darstellung der jeweiligen Daten verwendet werden sind jedoch prinzipiell immer dieselben: Horizontale oder vertikale Listen- oder Tabellendarstellungen mit Bildern oder Texten, Hyperlinks (Text oder Bild), Pull-Down- Menues, Radio Buttons und Check Boxes. Eine Verwendung von expliziten Visualisierungen für die Inhalte des Car Konfigurators konnte bei keinem der berücksichtigten Automobilkonzerne festgestellt werden.

Zusammenfassend kann man also sagen, dass explizite Visualisierungen für die Darstellung von Daten, bisher nur wenig bei den Webauftritten von Automobilkonzernen eingesetzt werden. Einige Ausnahmen bietet hier, wie oben gesehen, die deutsche Webseite von Mercedes-Benz. Jedoch bestehen vor allem im Bereich der Car Konfiguratoren diesbezüglich Defizite. Dabei bilden auch die Car Konfiguratoren von Mercedes-Benz Deutschland und Schweden hierbei keine Ausnahme.

2.8 Legitimation für das Thema

“A picture is often said to be worth a thousand words. Similarily, an interface is worth a thousand pictures.”

[Bederson, Shneiderman]

Wie bereits erwähnt, sind Visualisierungen in vielen Anwendungsbereichen denkbar und werden dort zum Teil auch bereits eingesetzt. Der Trend geht zu immer mehr Anwendungen, welche sich die Vorteile interaktiver visueller Darstellung von Information oder Daten zu nutze machen.

Die Betrachtung der Webauftritte von Automobilkonzernen hat gezeigt, dass die Thematik der Visualisierung hier bisher nur eine auffallend untergeordnete Rolle spielt. Dabei bieten gerade Tools, wie der Car Konfigurator bereits jetzt schon Benutzern viele Interaktionsmöglichkeiten mit den Daten. Demnach ist die Interaktivität mit den Daten bereits vorhanden, die Darstellung der Daten erfolgt dagegen bisher noch in konventioneller Form - häufig in Listendarstellungen. Dies bietet die Möglichkeit, Visualisierungen in die Darstellung von Daten miteinzubringen und die Vorteile interaktiver visueller Gestaltung von Daten zu nutzen. Die Auseinandersetzung mit der Thematik der Visualisierung von Daten zeigt also neue Möglichkeiten für die visuelle Repräsentation und Interaktion mit Daten auf, deren adäquater Einsatz zu verbesserten Lösungen führt.

3. Visualisierung in der Wissenschaft

Teil 3 der STAR beinhaltet die Ergebnisse der Recherchen zum Thema Visualisierung in der Wissenschaft. Dieser Teil der Studie gibt einen kurzen Überblick über die wichtigsten Beiträge zum Thema Visualisierung von Daten auf wissenschaftlicher Ebene, wie zum Beispiel einschlägige Literatur, Konferenzen, Wissenschaftler und Institutionen. Die Darstellung der Ergebnisse erfolgt in gekürzter Listenform, welche entsprechende Hinweise auf weiterführende Informationen zu den jeweiligen Ergebnissen enthält.

3.1 Konferenzen

Die nachfolgenden Konferenzen stehen alle mit der Thematik der Visualisierung von Daten in Beziehung. Da sich mit dieser Thematik, wie schon bereits erwähnt, eine Reihe von Disziplinen beschäftigen, fällt auch die Auflistung entsprechend heterogen aus. Die unten angeführte alphabetische Auflistung erhebt keinen Anspruch auf Vollständigkeit.

ACM SIGSOFT 2004

http://www.isr.uci.edu/FSE-12/

International Symposium on Foundations of Software Engineering Newport Beach, Californien, USA

CGIM 2004

http://www.iasted.com/conferences/2004/hawaii/cgim.htm

The 7th IASTED International Conference on Computer Graphics and Imaging Kauai, Hawaii, USA

CHI2004

http://www.chi2004.org/index.html

The premier international conference for human-computer interaction Wien, Österreich

CVPR 2004

http://cvl.umiacs.umd.edu/conferences/cvpr2004/

IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Washington, DC, USA

DIS 2004 http://www.cc.gatech.edu/gvu/events/conferences.html Designing Interactive Systems: the premier Multiple Discipline Conference Cambridge, Massachusetts

ECCV 2004

http://cmp.felk.cvut.cz/eccv2004/

The 8th European Conference on Computer Vision Prag, Tschechische Republik

Eurographics 2004

http://eg04.inrialpes.fr/

Annual Conference of the European Association for Computer Graphics Grenoble, Frankreich

HFES 2004

http://www.hfes.org/meetings/2004menu.html

Human Factors and Ergonomic Society: 48th Annual Meeting New Orleans, Louisiana, USA

ICSE 2004

http://conferences.iee.org/icse2004/

The premier Software Engineering Conference Edinburgh, Scotland, UK

InfoVis 2004

http://infovis.org/infovis2004/

Tenth annual IEEE Symposium on Information Visualization. InfoVis is the primary meeting in the field of information visualization, and is held in conjunction with the IEEE Visualization 2004 (Vis04) conference in Austin, Texas. Austin, Texas, USA

INTERACT 2005

http://giove.cnuce.cnr.it/interact2005.html

Tenth IFIP TC13 International Conference on Human-Computer Interaction Rom, Italien

ISSTA 2004

http://eecs.oregonstate.edu/issta2004/

International Symposium on Software Testing and Analysis Boston, Massachusetts, USA

Mobile HCI 04

http://www.cis.strath.ac.uk/~mdd/mobilehci04/

6th International Conference on Human Computer Interaction with Mobile Devices and Services Glasgow, Scotland

SCI 2004

http://www.iiisci.org/sci2004/website/default.asp

The 8th World Multi-Conference on Systemics, Cybernetics and Informatics Orlando, Florida, USA

SIGGRAPH 2004

http://www.siggraph.org/s2004/

The 31st International Conference on Computer Graphics and Intercative Techniques Los Angeles, Kalifornien, USA

Smart Graphics 2004

http://www.smartgraphics.org/sg04/

The 4th International Symposium on Smart Graphics Alberta, Kanada

UIST 2004 http://www.acm.org/uist/index.html Seventeenth Annual ACM Symposium on User Interface Software and Technology Santa Fe, New Mexico

Vis 2004

http://vis.computer.org/vis2004/cfp/

Premier forum for Visualization Advances in science and engineering for academia, government, and industry Austin, Texas, USA

VisSym 2004

http://www.inf.uni-konstanz.de/cgip/vissym04/index.shtml

The sixth joint Eurographics IEEE TCVG Symposium on Visualization Konstanz, Deutschland

VolVis 2004

http://www.volvis.org/volvis2004

IEEE/SIGGRAPH Symposium on Volume Visualization and Graphics 2004 Austin, Texas, USA

3.2 Wissenschaftler und Institutionen

Der folgende Abschnitt nennt einige der bekanntesten Wissenschaftler aus dem Bereich der Information Visualization und listet Institutionen auf, welche sich mit der Visualisierung von Daten beschäftigen. Diese können aus verschiedenen Disziplinen, wie der Computer Grafik oder der Information Visualization stammen, wobei einzelne Institutionen auch mehrere Disziplinen - entsprechend ihrer spezifischen Forschungs- bereiche - abdecken können.

Zu den sicherlich bekanntesten Forschern und Wissenschaftlern aus dem Bereich der Information Visualization, welche auch einige der populärsten Visualisierungen in dem Bereich mitentwickelt haben, gehören zum Beispiel:

Benjamin B. Bederson ist Assistenzprofessor am Fachbereich Informatik der Universität Maryland. Zudem leitet er das Human-Computer Interaction Lab (HCIL) und wirkt am UMIACS, dem „Institut for Advanced Computer Studies“ der Universität Maryland mit. Homepage: http://www.cs.umd.edu/~bederson/

Stuart K. Card ist Ph.D. der Psychologie mit Studienausrichtung auf Künstliche Intelligenz (KI), Psychologie und Informatik. Seit Juni 2002 ist er Leiter der User Interface Forschungsgruppe am Xerox Palo Alto Research Center (PARC). Sein Forschungsschwerpunkt liegt auf Entwicklungen im Bereich der Human-Computer Interaction.

Jock D. Mackinlay, Ph.D. der Informatik, ist Mitglied der User Interface Forschungsgruppe am Xerox Palo Alto Research (PARC). Zu seinen Forschungsschwerpunkten gehört die Entwicklung von User Interfaces im Bereich der Information Visualization. Zudem gehört er zum redaktionellen Ausschuß der „ACM Transactions on Computer Human Interaction“. Homepage: http://www2.parc.com/istl/members/mackinlay/

Ben Shneiderman ist Professor am Fachbereich Informatik der Universität Maryland. Von 1983 bis 2000 leitete er das Human-Computer Interaction Laboratory (HCIL). Heute gehört er zu den Mitgliedern des “Institute for Advanced Computer Studies” und des “Institute for Systems Research” an der Universität Maryland. 1997 wurde er Mitglied der ACM, 2001 Mitglied der American Association for the Advancement of Science und erhielt im selben Jahr den ACM CHI (Computer Human Interaction) Lifetime Achievement Award. Seine Forschungsschwerpunkte liegen in den Bereichen der Human-Computer- Interaction und User Interface Design. Ausser einer Reihe von Büchern, welche er veröffentlichte, gehörte er dem redaktionellen Ausschuß mehrerer Journale, wie dem „ACM Transactions on Computer Human Interaction“ oder dem „ACM Interactions“ an. Homepage: http://www.cs.umd.edu/users/ben/

Robert Spence ist Professor für Information Engineering am Imperial College of Science, Technology and Medicine, London. Seit über 40 Jahren ist er im Forschungsbereich der Human-Computer Interaction tätig. Er gehört zu den Mitgliedern der IEEE und der Royal Acadamy of Engineering. Homepage: http://www.iis.ee.ic.ac.uk/~r.spence/

Außer den zahlreichen Forschungsgruppen, welche sich an den Universitäten mit der Thematik der Visualisierung von Daten beschäftigen - zu denen zum Beispiel auch die Forschungsgruppe HCI unter der Leitung von Prof. Dr. Harald Reiterer der Universität Konstanz gehört - existieren noch eine Reihe weiterer Institutionen in diesem Tätigkeitsbereich. Die folgende alphabetische Auflistung beinhaltet solche Institutionen, welche sich ebenfalls mit der Thematik der Visualisierung von Daten beschäftigen. Diese stellt lediglich eine Auswahl dar und erhebt daher keinen Anspruch auf Vollständigkeit.

Bell Labs http://www.bell-labs.com Entwicklungs- und Forschungslabor der Lucent Technologies Aktivitäten: Entwicklung von Produkten und Dienstleistungen sowie Grundlagenforschung in den Bereichen der Kommunikationstechnologie, wie zum Beispiel Physical Sciences, Computer Sciences & Software, Mathematical Sciences, Network Applications, Optical Networking und Wireless Networking. New York, USA

Eurographics http://www.eg.org/ European Association for Computer Graphics Aktivitäten: Organisation von Konferenzen, Workshops, Seminaren, Kommunikationsforen, Herausgabe von Online-Publikationen für Mitglieder, etc. Aire-la-Ville, Schweiz

Fraunhofer Institute for Computer Graphics (IGD) http://www.igd.fhg.de/ Institut für Grafische Datenverarbeitung Aktivitäten: Entwicklung von Produkten (Hard- und Software) und Erstellung von Konzepten, Modellen und Umsetzungslösungen für die graphische Daten- verarbeitung und ihre Anpassung an spezifische Anwendungsfälle. Darmstadt, Deutschland

Georgia Institute of Technology GVU Center http://www.cc.gatech.edu/gvu/ Kooperation des Technology Square Research Building (TSRB), College of Computing Building (CCB), Centennial Research Building (CRB) und Georgia Center for Advanced Telecommunications Technology (GCATT) Aktivitäten: Erforschung und Entwicklung von Technologien in den Bereichen der Kommunikation, wie zum Beispiel Human Capabilities, Needs, and Practices, Graphical Display Techniques, Augmented Spaces, Intelligent Sensing, Novel Input, Output and Wearable Technologies Atlanta, USA

Gesellschaft für Informatik (GI) http://www.gi-ev.de/ Verein für die Förderung des Informatikbereichs zu gemeinnützigen Zwecken Aktivitäten: Publikation von Fachliteratur, Ausrichtung von Informatik- Wettbewerben, Bereitstellung fachlicher Kommunikationsforen durch Veranstaltung von Arbeitstreffen, Fachtagungen, Kongressen und Ausstellungen, Mitwirkung im Bereich von Normen, Standards und Validierungen, etc. Bonn, Deutschland

Human-Centered Computing (HCC) http://www.cs.berkeley.edu/~jfc/hcc/ Interdisziplänres Konsortium an der UC Berkeley Aktivitäten: Untersuchungen des Einflusses von Informationstechnologien im Alltag. Aufbau von entsprechenden Verarbeitungszentren. Kalifornien, USA

Human-Computer Interaction Lab (HCIL), University of Maryland http://www.cs.umd.edu/hcil/ Interdisziplinäres Forschungslabor der Universität Maryland, USA Aktivitäten: Forschung in den Bereichen Advanced User Interfaces und ihren Entwicklungsprozessen. Entwicklung von neuen Theorien, Methoden und Technologien. Maryland, USA

IEEE Computer Society http://www.ieee.org/portal/ Verband zur Kontrolle und Einführung von Standards in der Elektrotechnik und Kommunikationstechnologie Aktivitäten: Überwachung, Weiterführung und Entwicklung von bestehenden und neu definierten Standards. Piscataway, New York und Washington, USA; Singapur

INI-GraphicsNet http://www.inigraphics.net/ Internationales Netzwerk von Institutionen aus dem Bereich der Computergrafik, wie zum Beispiel der Fraunhofer IGD Aktivitäten: Aus- und Fortbildung, Forschung und Entwicklung in den Bereichen der Techniken, Systemen und Anwendungen der Computergrafik; angewandte Auftragsforschung bis hin zur Entwicklung von Technologie- bzw. Anwendungs- prototypen Coimbra, Portugal; Darmstadt, Rostock, Deutschland; Providence, USA; Singapur

Institute for Systems Research (ISR), University Maryland http://www.isr.umd.edu/ISR/HP.htm Joint Venture der Universität Maryland und Harvard Universität, National Science Foundation (NSF) Engineering Research Center der USA. Aktivitäten: Entwicklung, Anwendung und Lehre von fortgeschrittenen Design- und Analysemethoden. Erarbeiten von Lösungen für komplexe, hierarchische, heterogene und dynamische Probleme in den Ingenieurwissenschaften und Systemen für Industrie und Regierung. Maryland, USA

MIT Media Lab http://www.media.mit.edu/ Institut für Medientechnologien an der Universität Massachusettes Aktivitäten: Grundlagenforschungen und –anwendungen in der Überschneidung von EDV und Kunst. Entwicklungen in den Bereichen wie z.B. Softwareagenten, Wearable Computers, Advanced Interface Design, Interaktives Kino, Digital Expression (von Text über Grafiken zu Sound), Räumliche Darstellung, etc. Cambridge, USA

SIGCHI http://www.sigchi.org/ ACM's Special Interest Group on Computer-Human Interaction Aktivitäten: Zusammenführung von Design, Evaluierung, Implementierung und Untersuchung von interaktiven Computersystemen für die Nutzung durch den Menschen. Pflege eines internationalen Forums im Bereich Mensch-Computer- Kommunikation (HCI). New York, USA

SIGGRAPH http://www.siggraph.org/index.html ACM`s Special Interest Group on Computer Graphics Aktivitäten: Förderung von Informationsbeschaffung und –austausch in den Bereichen Theorie, Design, Implementierung und Anwendung von Computergenerierten Grafiken sowie interaktiven Techniken. New York, USA

University of Maryland Institute for Advanced Computer Studies (UMIACS) http://www.umiacs.umd.edu/ Forschungsinstitut der Universität Maryland im Bereich der Advanced Computer Studies Aktivitäten: Förderung von interdisziplinärer Forschung und Ausbildung in der EDV, insbesondere in den Bereichen Computer Science, Electrical and Computer Engineering, Geography, Linguistics, Philosophy, Life Sciences, Information Studies. Maryland, USA

Virtual Reality Society (VRS) http://www.vrs.org.uk/ Internationale Gesellschaft für die Diskussion und Förderung der Bereiche der Virtual Reality und Synthetic Environments Aktivitäten: Publikation internationaler Journale, Organisation spezifischer Interessengruppen, Konferenzen, Seminare und Tutorials. West Sussex, UK