WP2D2 2

WP 2
Verfahren zur Strukturierung der

tourismus- und freizeitwirtschaftlichen
Wissensbasis:
Auswahl der Analysemethoden und Softwaretools
Projekt: Landkarte der tourismus- und freizeitwirtschaftlichen

Wissensbasis
Akronym: ÖGAF-Wissenslandkarte
Titel lt. Projektplan: Analysemethoden, Softwaretools; Strukturierung
DokID : D 2.2
[WP 2] D 2.2
V1.3 Seite 2
Version Änderungen Type Datum

1.0 Formatierung Draft 3.11.2004
1.1 Struktur Draft 4.11.2004
1.2 Gemeinsamer Draft 2.1+2.2 Draft 5.12.2004
1.3 Draft 2.2 Draft 9.12.2004
1.4 Korrektur, Ergänzung Draft 22.12.2004
1.5 Empfohlene Map-Lösungen Draft 29.12.2004
1.6. Beschreibung Retrieval CABI-Daten Draft 20.01.2005
2.0 Final
2.1
Version: 1.5
Datum: 20.1.2005
Dokument ID: D 2.2
Workpackage: WP2
WP Verantwortung: J. Mazanec
Status : Draft
Autor/inn/en: Josef Mazanec
+++ ÖGAF–Wissenslandkarte +++

[WP 2] D 2.2
V1.3 Seite 3
Index
1 Auswahl und Erläuterung der ausgewählten Strukturierungslösung ................................... 5
1.1 Auswahlkriterien und Bestimmung der Methoden und Datengrundlagen................... 5
1.1.1 Dokumentenbeschlagwortung als Datenbasis........................................................... 5
3.1.2 Wie nutzt man die Schlagwortkataloge und Beschlagwortungslisten?..................... 6
1.2 Lösung für den Anwendungsfall „Berater“.................................................................. 8
1.3 Lösungen für den Anwendungsfall „Studien Austria“............................................... 12
1.4 Lösungen für den Anwendungsfall „Centre International de Recherches et d’Etudes
Touristiques“ (CIRET)........................................................................................................... 18
1.5 Lösung für den Anwendungsfall „Leisure, Recreation and Tourism Abstracts“ ...... 24
1.6 Vergleichbarkeit der empfohlenen Lösungen ............................................................ 29
2 Technische Beschreibung und kommentierte Programmlistings ....................................... 31
2.1 Datengewinnung, Schlagwortaufbereitung und Vorverarbeitung.............................. 31
2.2 Erzeugung der Ähnlichkeitsmatrix der Schlagworte ................................................. 36
2.3 Generierung der Maps................................................................................................ 41
3 Anhang ............................................................................................................................... 45

[WP 2] D 2.2
V1.3 Seite 4
Abbildungsverzeichnis
Abbildung 1: Semantic Map aus den Hauptkompetenzen ......................................................... 9
Abbildung 2: Typische Verknüpfungen von Kompetenzen unter den Beratern...................... 10
Abbildung 3: Neun Beratertypen nach Kompetenzprofil ........................................................ 11
Abbildung 4: Strukturierung des Beratermarktes (Sammonprojektion der ............................. 12
Abbildung 5: 6×6-Map aus 3000 Dokumenten der Studien.at ................................................ 13
Abbildung 6: 10×10-Map für die Studien.at ............................................................................ 14
Abbildung 7: Kumulierte Prozenthäufigkeit der Schlagworte der Studien.at.......................... 15
Abbildung 8: Schlagwortdichte in der 16×16-Map für die Studien.at..................................... 18
Abbildung 9: 15×12-Map aus 6000 Dokumenten des CIRET................................................. 19
Abbildung 10: Kumulative Prozenthäufigkeiten aus 6000 Dokumenten des CIRET.............. 20
Abbildung 11: Schlagwortdichte in der 18×18-Map für die CIRET-Daten ............................ 24
Abbildung 12: Kumulative Prozenthäufigkeiten aus 12000 Dokumenten der Abstracts ........ 25
Abbildung 13: Schlagwortdichte in der 20×20-Map für die CABI-Abstracts-Daten .............. 30

[WP 2] D 2.2
V1.3 Seite 5
1 Auswahl und Erläuterung der ausgewählten Strukturierungslösung
Dieser Teilbericht des Workpackage 2 informiert über den vorgeschlagenen Lösungsweg. Er

bedient sich dabei einiger Musterlösungen, die das Strukturierungsverfahren bebildern aber
noch keine vollständig visualisierte Lösung darstellen. Die Präsentation fertig ausgearbeiteter
Strukturierungslösungen ist Aufgabe des Workpackage 3 über die Visualisierung der Ergeb-
nisse und ihre Darstellung auf der Web-Plattform.
1.1 Auswahlkriterien und Bestimmung der Methoden und

Datengrundlagen
Ziel des Landkartenprojekts ist die verdichtete und anschauliche Vermittlung des Bearbei-
tungsstandes tourismus- und freizeitwirtschaftlicher Themen. Zu den Kriterien der Auswahl
eines methodischen Ansatzes zur Problemlösung zählen daher:
• Verdichtungseffekt und Visualisierbarkeit umfangreicher Datenbasen
• Neuigkeitsgrad in der tourismus- und freizeitwirtschaftlichen Forschungslandschaft
• Realisierbarkeit und laufende Aktualisierbarkeit mit den verfügbaren
Informationsgrundlagen
• Eignung für eine zeitgemäße web-basierte Lösung
bisherige Erfahrungen mit dieser Methodenklasse.
Eine vorgelagerte Entscheidung war über Art und Umfang der Datenbasis zu treffen. Wie und
woran lässt sich mit hinreichender Aussagekraft erkennen, welche Themen in der tourismus-
und freizeitwirtschaftlichen Forschung, Ausbildung und Beratung populär und intensiv
bearbeitet oder vernachlässigt sind? Die Antwort steckt zweifellos in der internationalen
Fachliteratur und der ‚Grauen Literatur’ über kommerzielle Untersuchungen und Studien zur
Politikberatung. In jedem Fall gilt es also, derartige Dokumente oder Informationen über diese
Dokumente zu verarbeiten. Strukturierungsvarianten wie Bäume, Thesauri, Ontologien oder
Stichwortkataloge gliedern zwar das thematische Feld hierarchisch und/oder definitorisch; sie
zeigen aber nicht gleichzeitig die praktische Relevanz einzelner Über-, Unter- oder Such-
begriffe. Aus der Hierarchiestufe geht nur die semantische Abdeckungsbreite aber nicht die
tatsächliche Verwendung in Forschung und Consulting hervor.
1.1.1 Dokumentenbeschlagwortung als Datenbasis
Der gestellten Aufgabe am nächsten kommen die von Teuvo Kohonen und seinem Team an
der Technischen Universität Helsinki [ Pisa lässt grüßen ;-) ] entwickelten Self-Organizing
Maps (SOMs), die sich insbesondere für die Analyse von sehr großen Dokumenten-
sammlungen bewährt haben. Allerdings ist der Zugriff auf die Dokumente selbst mit den der
ÖGAF zur Verfügung stehenden Ressourcen nicht realisierbar. Zum Glück ist dies nicht
erforderlich. Wir entscheiden uns nämlich für die Beschlagwortung der Dokumente (Zeit-
schriftenaufsätze, Berichte, Studien) als Datenbasis. Monographien sind hier als Beschlag-

[WP 2] D 2.2
V1.3 Seite 6
wortungsobjekte weniger ergiebig, da sie den Stand der Forschung mit Verzögerung wider-
spiegeln und so gut wie jedes bedeutende Buch seine innovativen Inhalte zunächst in der
Zeitschriftenliteratur untergebracht hat. Während SOM-Anwendungen auf Dokumente sehr
zahlreich sind, finden sich kaum Lösungen für Schlagwortrepertoires 1. Wir wählen also diese
Variante und demonstrieren sie an drei einander perfekt ergänzenden Datenbasen:
• die in der österreichischen Sammlung grauer Literatur erfassten Dokumente der

Tourismus Studien Austria (http://studien.at)
• der Literatursammlung des Centre International de Recherches et d'Etudes
Touristiques (http://www.ciret-tourism.com/) und
• der weltweit umfassendsten Datenbasis über einschlägige Aufsatzveröffentlichungen
der Leisure, Recreation and Tourism Abstracts (http://www.cabi-
publishing.org/AbstractDatabases.asp?SubjectArea=&PID=5)
Die SOMs bieten gleichzeitig eine ‚natürliche’ graphische Visualisierungsmöglichkeit (siehe

den separaten Bericht über die Visualisierung). Die laufende Aktualisierung ist sowohl was
die Daten als auch die Softwareunterstützung betrifft gesichert. Eine Anwendung auf eine
tourismuswirtschaftliche Wissensbasis gibt es noch nicht. Trotzdem verfügen wir über die
nötigen Erfahrungen; der Einsatz für eine Imageanalyse von Wiener Luxushotels von
Mazanec (1995) war die erste Anwendung von SOMs in der Tourismusforschung 2; die nähere
Befassung mit dieser Methodenklasse am Institut für Tourismus und Freizeitwirtschaft begann
etwa 1988 und wurde während der Dauer des Spezialforschungsbereichs SFB010 über
Adaptive Systems and Modelling in Economics and Management Science (1997-2004) fort-
geführt.
3.1.2 Wie nutzt man die Schlagwortkataloge und Beschlagwortungslisten?
Eine SOM ordnet beliebige Objekte, die durch irgendwelche Merkmale beschrieben sind, den
Knoten auf einem meist zwei-dimensionalen Gitter zu. Dabei sollen die topologischen
Eigenschaften der Objekte möglichst erhalten bleiben. Dies bedeutet, dass Objekte, die
ähnliche Eigenschaften aufweisen, auch auf denselben oder auf unmittelbar benachbarten
Gitterpunkten liegen sollen. Unsere Gitterpunkte sind verkörpern Gruppen von Schlagworten,
die einander ähnlich sind. Die konkrete Festlegung dieser Ähnlichkeit ist der springende
Punkt. Größere ‚Ähnlichkeit’ bedeutet in der Landkarte das häufigere gemeinsame Auftreten
innerhalb der Beschlagwortung von Dokumenten. Natürlich besitzt jedes einzelne Schlagwort
eine Auftretenshäufigkeit innerhalb der Schlagwortlisten aller Dokumente. Aus beiden Teil-
informationen ergibt sich die Bedeutung der einzelnen, durch die Schlagworte charak-
terisierten Themen und deren symptomatische Zusammengehörigkeit.
Wenn keine aktuelle und vollständige Schlagwortliste verfügbar oder abrufbar ist, dann
erstellen wir diese Liste aus den tatsächlichen Schlagworten der analysierten Dokumente.
Jedes Schlagwort darf in dieser Master-List nur einmal vorkommen. Sowohl die Liste als auch
die Beschlagwortung der maschinell extrahierten Dokumente sollte auf Inkonsistenzen und
1
eine Ausnahme der Anwendung auf Computer Science und Mathematik siehe unter
http://www.cest.ch/Publikationen/2000/am/math_leiden/cwts/swr-
math/home.html
2
Mazanec, J. A. (1995): Positioning Analysis with Self-Organizing Maps: An Exploratory Study on Luxury
Hotels, Cornell Hotel and Restaurant Administration Quarterly, Vol. 36, 6/1995, pp. 80-95.

[WP 2] D 2.2
V1.3 Seite 7
Tippfehler überprüft werden. Blanks ersetzen wir durch das Underline-Symbol (‚_’), damit
Schlagworte aus zwei oder mehr Einzelworten verlässlich als zusammengehörend interpretiert
werden.
Die Objekte der Landkarte sind also die Schlagworte (Zeilen der Rohdatenmatrix). Ihre
wechselseitige Ähnlichkeit folgt aus der Häufigkeit des gemeinsamen Auftretens in den
Beschlagwortungen der Aufsätze, Berichte und Studien. Um Bagatell-Schlagworte aus-
zuschalten, wurden nur solche mit einer Mindest-Auftretenshäufigkeit berücksichtigt. Diese
Mindesthäufgikeit ergibt sich entweder aus einem Vergleich mit der Länge der Schlagwort-
Gesamtliste (z.B. mindestens 1% der Anzahl der Schlagworte in der Masterlist) oder auf
Grund eine gewünschten kumulativen Abdeckungsquote aller Beschlagwortungen (z.B. 75, 90
oder 95%). Für die Ermittlung der Ähnlichkeiten genügt eine wesentlich kleinere Anzahl an
Schlüssel-Schlagworten; sie entsprechen den Variablen (Spalten der Rohdatenmatrix). Wir
konzentrieren uns auf das obere Quartil der (25% am häufigsten auftretenden) Schlagworte. In
der Diagonale der Ähnlichkeitsmatrix stehen die absoluten Auftretenshäufigkeiten jedes
Schlagwortes; in der oberen (und symmetrisch in der unteren) Dreiecksmatrix stehen die
Häufigkeiten des gemeinsamen Auftretens. In dem Miniaturbeispiel
Schlagwort # 1 2 3 4 …
1 232 24 9 66
2 24 34 5 7
3 9 5 42 2
4 66 7 2 512
… …
kommen die Schlagworte 1,2,3 und 4 jeweils 232 mal, 34 mal, 42 mal bzw. 512 mal vor. #1
tritt 24 mal gemeinsam mit #2, 9 mal mit #3 und 66 mal mit #4 auf. Die ‚Popularität’ eines
Themas (erkennbar an der Häufigkeit eines Schlagworts; = kursiv gesetzte Diagonalwerte)
wollen wir separat anzeigen und später durch die Größe der Kreise in einem Bubble-Chart
darstellen. Daher soll die ‚Größe’ eines Schlagworts als Ursache des Zusammentreffens mit
anderen Schlagworten die Ähnlichkeitsinformation nicht verzerren. Für Schlagwort #4 ist z.B.
das häufige Zusammentreffen mit #1 (66 mal) nicht überraschend; es kommt nämlich selbst
sehr häufig vor (512 mal). #1 hingegen kommt nur 232 mal vor und daher hat das häufige
gemeinsame Auftreten mit #4 hier einen höheren Informationswert. Den unerwünschten
Größeneffekt schaltet man durch Division mit dem jeweiligen Diagonalwert aus:
Schlagwort # 1 2 3 4 …
1 1 0,10 0,04 0,28
2 0,71 1 0,15 0,21
3 0,21 0,12 1 0,05
4 0,13 0,01 0,00 1
… …
Diese Werte signalisieren die Ähnlichkeiten unverfälscht und sind eine bessere Grundlage für
die Ermittlung der Positionen der Schlagworte in der Self-Organizing Map. Sie soll ja
‚lernen’, ähnliche Schlagworte auf identische und nah benachbarte Gitterpunkte zuzuordnen.
Einen letzten Aufbereitungsschritt verlangt das Kohonen-Verfahren noch. Die Datenvektoren
in den Zeilen müssen auf die Länge 1 normiert werden, so dass für die Häufigkeiten sij jedes

[WP 2] D 2.2
V1.3 Seite 8
von n Schlagworten die Bedingung ∑s

j =1,n
2
ij = 1,0 ∀i gilt 3. Diese Vorkehrung macht das
Verfahren überaus robust gegen den Einfluss von Ausreisserwerten.
1.2 Lösung für den Anwendungsfall „Berater“

Ein Teil der Strukturierungsaufgabe bezieht sich auf die Kompetenzen der Forschungs- und
Beratungsinstitutionen, die im Zuge eines empirischen Untersuchungsschrittes erhoben
wurden sowie auf diese Institutionen selbst (siehe den Teilbericht über den Beratermarkt in
Workpackage 5 und über die Anbietermerkmale in WP 4). Betrachten wir zunächst ein
vorläufiges Ergebnis für 70 Beraterfirmen, die sich jeweils in 12 Hauptkompetenzen selbst
beschreiben. Die absoluten Häufigkeiten der angegebenen Hauptkompetenzen schwanken
zwischen 6 für Umweltberatung und 40 für Marketingberatung:
Unternehmensgründung,_-verkauf_und_-übernahme 20
Unternehmensanalyse_und_Benchmarking 33
Strategische_Unternehmensplanung 42
Organisationsberatung 34
Personalberatung 17
Marketingberatung 40
Marktforschung 19
Qualitätsmanagementberatung 28
Informationsmanagementberatung 22
Controlling_und_Finanzberatung 19
Projektmanagement_und_Projektbegleitende_Beratung 36
Umweltberatung 6
Interessant ist natürlich, in welchen typischen Kombinationen diese Kompetenzen auftreten.

Eine aus den gemeinsamen Auftretenshäufigkeiten erstellte Self-Organizing Map mit 3×3
Knoten ist in Abbildung 1 ersichtlich 4. Es sind tatsächlich typische Kompetenzmuster zu
erwarten. Dabei erweisen sich z.B. Umwelt- und Personalberatung (Knoten 1 und 6) als
weniger gut vereinbare Kompetenzen, während etwa Organisations-, Personal- und Qualitäts-
managementberatung hohe Verwandschaft aufweisen.
Für die geringe Anzahl der 12 Hauptkomptenzen ist der starke Dateverdichtungseffekt der
SOM nicht unbedingt erforderlich und wir zeigen daher eine alternative Strukturierungs-
möglichkeit, die sich für die Beraterauswahl im Rahmen der ÖGAF-Landkarte bestens eignet.
3
Graphisch kann man sich das so vorstellen: Jedes Schlagwort ist ein Pfeil von gleicher Länge. Jeder Pfeil zeigt
in eine bestimmte Richtung des vieldimensionalen Schlagwortraumes und über die Ähnlichkeit von zwei Schlag-
worten bestimmt lediglich der Winkel, den die beiden Pfeile zueinander einschließen.
4
Wir verwenden hier unsere eigene SOMnia-Software (siehe http://tourism.wu-wien.ac.at/cgi-
bin/ift.pl?charly/http/software/somnia.html).

[WP 2] D 2.2
V1.3 Seite 9
Organisationsberatung
Personalberatung
Projektmanagement_und_Projektbegleitende_Beratung
Marktforschung Unternehmensanalyse_und_Benchmarking
Strategische_Unternehmensplanung
Qualitätsmanagementberatung
Marketingberatung
Unternehmensgründung,_-verkauf_und_-übernahme
Controlling_und_Finanzberatung
Informationsmanagementberatung
Umweltberatung
Abbildung 1: Semantic Map aus den Hauptkompetenzen
Die Nutzer der ÖGAF-Landkarte erwarten Hilfe in der Auswahl geeigneter Forschungs- und
Beratungsorganisationen. Zu diesem Zweck zeigen wir typische Anbieterprofile, in denen die
Hautpkompetenzen in symptomatisch verbundener Form auftauchen. Die Darstellungsobjekte
sind also die Anbieter. Aus dem Dendrogramm in Abbildung 2 ist zunächst erkennbar, welche
Hauptkompetenzen sich sehr früh, also bei geringer Unähnlichkeit, zusammenfinden (z.B.
Strategische Unternehmensplanung und Organisationsberatung) und welche eher selten
gemeinsam in einem Profil auftreten werden (z.B. Marktforschung und Personalberatung).
Letztlich lassen sich neun typische Anbieterprofile, vom Allrounder bis zum Qualitäts-
managementspezialisten nachweisen 5 (Abbildung 3).
5
Wir verwenden Partitionierungsroutinen, die im Rahmen unseres FWF-Spezialforschungsbereichs 010 über
Adaptive Systems 1997-2004 u.a. unter Nutzung der Scriptsprache R (siehe http://cran.r-
project.org/) entwickelt wurden.

[WP 2] D 2.2
V1.3 Seite 10
Abbildung 2: Typische Verknüpfungen von Kompetenzen unter den Beratern

[WP 2] D 2.2
V1.3 Seite 11
Abbildung 3: Neun Beratertypen nach Kompetenzprofil
Schließlich werden die Benutzer der ÖGAF-Landkarte auch sicher sehen wollen, wie häufig
derartige Anbieterprofile in der Praxis auftreten. Eine übersichtliche Struktur ergibt sich in
Form des Bubble-Chart in Abbildung 4, wo die Fläche der Kreise die Häufigkeit der
einzelnen Beratertypen signalisiert. Die Anordnung beruht auf einer sogenannten Sammon-
Projektion 6, die eine vereinfachte zweidimensionale Anordnung der ursprünglich in 12
Kompetenzdimensionen lebenden Mannigfaltigkeit der Rohdaten bewirkt; größere Nähe
bedeutet ein ähnlicheres Kompetenzprofil.
6
Sammon, J. W. jr. (1969). A Nonlinear Mapping for Data Structure Analysis, IEEE Transactions on
Computers, C-18, 401-409.

[WP 2] D 2.2
V1.3 Seite 12
Benchm./
Control
5
Qual.mgt.
Gründungs-/ 3
Projektber.
11
Personalber.
10 Marketingber.
10
Marktf./
Marketing/
Strat. Planung
9
Allroundber.
46
Qual.mgt./
Personal/
Marketing
Organisation
6
11
Abbildung 4: Strukturierung des Beratermarktes (Sammonprojektion der

Beratertypen, Bubbles nach Häufigkeit)
1.3 Lösungen für den Anwendungsfall „Studien Austria“

Die Tourismus-Studien Austria (http://studien.at/) hatten per Ende Oktober 2004
insgesamt etwa 3000 Dokumente über ‚Graue Literatur’ gesammelt. Die deutschsprachige
Beschlagwortung dieses Bestandes wird übernommen, wobei die Schlagwortliste zu diesem
Zeitpunkt ca. 1700 Begriffe umfasst. Die Studien Austria sind österreich-zentriert und
spiegeln die hierzulande populären Themen bzw. Forschungs- und Beratungserfordernisse
wider. Wegen der nicht allzu großen Datenbasis sei vorerst ein Versuch mit der Verdichtung
auf eine 6×6-SOM unternommen. Jene 154 Schlagworte, die zumindest 17 mal (=1% aller in
der Masterliste existierenden Worte) auftreten, werden berücksichtigt. Die Schlagwort-
ähnlichkeit folgt aus jenen 34 Schlüsselbegriffen (d.s. die 25% am häufigsten vorkommenden
Schlagworte). Abbildung 5 zeigt die entstehende Map. Zur Kennzeichnung einer Themen-
gruppe dient jeweils ihr häufigstes Schlagwort. Die Themengruppe ‚Reise’ enthält z.B. 19
Subschlagworte, die zusammen fast 1000 mal auftreten und die größte Bubble bilden. Die
Lösung erscheint zu grob und befriedigt daher nicht.

[WP 2] D 2.2
V1.3 Seite 13
6x6 MAP Studien.at
Trend Landwirtschaft Jugend Gesundheit Marktanalyse Angebot, Zielgruppe
Umwelt Freizeit Information Marketing Euro, Wirtschaft Marke, Entwicklung
Steiermark Urlaub Reise Tourismus Sommerourismus Tourismusmarkt, -politik
Kultur Alpen Winter Deutschland Hotel Internet
Region Europe Gästebefragung Wien Kur Hotellerie
Markt Gesundheitstourismus Gast international Nachfrageanalyse, Stadt Analyse, Reiseverhalten
Abbildung 5: 6×6-Map aus 3000 Dokumenten der Studien.at
Die verbesserte 10×10-Map in Abbildung 6 basiert auf einer bereinigten Masterliste (z.B.
ohne Mischschreibweise ‚ö’ und ‚oe’) von 175 Schlagworten > 1%; die Top 25% (=39 Stück)
dienen als Schlüsselbegriffe. Diese Map besitzt die fast dreifache Kapazität und liefert daher
ein differenzierteres Bild, das die österreichische Tourismusforschungs- und –beratungs-
landschaft genauer widergibt 7. Das Themenfeld ‚Reise’ mit den insgesamt häufigsten
Schlagworten besteht hier aus 10 homogenen Subthemen (z.B. Reiseanalyse, -markt,
-ausgaben, -veranstalter, -ziel). Die Abbildung 6 ist fast vollständig beschriftet. Es zeigt sich,
dass man 5 bis 6 intensiv bearbeitete Themengebiete ebenso klar erkennen kann, wie die
‚weissen Flecken’ in einigen dünn besiedelten ‚Regionen’ der Forschungs- und Beratungs-
landschaft. Die komplette Datentabelle mit allen Schlagworten > 1% befindet sich im Anhang
1. In diesem Workpackage WP2 zeigen wir die Arbeitsweise der Strukturierungsmethode. Die
vollständige Ausarbeitung einer fertigen Musterlösung inklusive der graphischen Bebilderung
ist Gegenstand des separaten Teilberichts über die Visualisierung in Workpackage 3. In der
automatisierten Visualisierungslösung werden zumindest zwei Betrachtungsebenen vorzu-
7
Wir verwenden hier das Contributed Package SOM zum Open-Source Software-System R
(http://cran.r-project.org/), dass die originären C-Routinen von Kohonen implementiert. Für die
relativ kleine Datenmenge ist die Batch-Version ausreichend. Die SOMs ließen sich auch online trainieren, d.h.
man könnte damit auch eine unbeschränkte Anzahl an Datenpunkten, die z.B. laufend durch Web-Abfragen von
Benutzern neu enstehen, verarbeiten.

[WP 2] D 2.2
V1.3 Seite 14
sehen sein. Die erste entspricht der Abbildung 6 mit den Hauptthemen. Jede Bubble muss
sodann auf einer zweiten Betrachtungsebene in alle ihre Subthemen unter Angabe der
Auftretenshäufigkeit in den Dokumenten der Plattform ‚Studien Austria’ auflösbar sein. Diese
Information der zweiten Ebene ist hier vorerst nur in tabellarischer Form (siehe Anhang 1)
verfügbar. Jede Bubble hat eine Zeilen- und eine Spaltennummer (jeweils von 0 bis 9)
zugeordnet, so dass die zusammengehörigen Subschlagworte für jede der Positionen 0-0, 0-
1,…,0-9,1-0,1-1,…,1-9,…,9-9 ersichtlich sind. Nur eine einzige, vom Bedeutungsgehalt
unsinnige Fehlkombination tritt auf: Anhang 1 zeigt, dass die in Abbildung 6 unbeschriftete
Position 5-9 am nördlichen Rand der Map die syntaktisch verbundenen, aber semantisch nicht
sinnvollen Schlagworte ‚intern’ und ‚international’ verbindet. Die schwach besetzte Position
9-0 am schräg gegenüber liegenden, südöstlichen Ende der Map enthält z.B. nur den einen
Begriff ‚Gemeinde’, der 25 mal auftritt. Hier gibt es keine darunter liegende Ebene mehr.
Reise Statistik Internet Tourismus
Markt Kooperation
Europa
Dienstl., Unternehmen
Städtetourismus Destination Hotellerie, Gast Umweltschutz
Information Ausb., Gastronomie Umwelt
Kunde Marke(ting) Arbeit Verkehr Natur
Deutschland Trend Wirtschaft Entwicklung Land, Region

Analyse
Urlaub Jugend Zielgruppe Kultur Zufriedenheit Tirol

Struktur
Image Wien Werbung Angebot
aktiv Freizeit Sport Österreich Kärnten, Salzb.

Gästebefragung
Abbildung 6: 10×10-Map für die Studien.at
In den bisherigen Lösungen wurde eine Suche nach Zeichenketten (string in string search)
zugelassen, die Schlagworte auch in Form von Wortteilen oder Silben ermöglicht. Da es z.B.
ein Schlagwort Reise gibt, wird das gleichzeitige Auftreten der Zeichenfolge ‚Reise’ mit
anderen Schlagworten auch dann registriert, wenn es sich in zusammengesetzten Hauptworten
wie z.B. Reiseveranstalter oder Schiffsreisen versteckt. Oft macht das Sinn, zuweilen aber
auch nicht (z.B. für ‚Preise’). Auf jeden Fall müsste man die Lösung manuell überprüfen und
dürfte die automatisiert erstellte Lösung nicht kurzerhand weiter verwenden. Wie sieht daher
eine Lösung aus, die der Integrität der jeweiligen Schlagworte Rechnung trägt. Um letztere zu
garantieren, werden alle Schlagworte der Masterliste zwischen Trennzeichen gesetzt, in
unserem Fall wählen wir Kommata, da in den Beschlagwortungslisten der Dokumente die
einzelnen Schlagworte ohnehin durch den delimiter Komma voneinander getrennt sind. Beim
Einlesen jeder Zeile mit den Schlagworten für ein Dokument wird einfach auch am Beginn

[WP 2] D 2.2
V1.3 Seite 15
und am Ende ein Komma ergänzt. Ein Schlagwort Reise (= ,Reise,) wird also z.B. in einer
Beschlagwortungsliste
,Touristik,Reise,Destination,
korrekt in thematischer Nachbarschaft von Touristik und Destination aufgefunden, nicht mehr
jedoch in einer Beschlagwortungsliste wie etwa
,Verreisen,Reiseziel,Freizeit_und_Reisen,
entdeckt. (Die String-in-String-Suche würde hier drei Silben bzw. Wortteile melden. Wenn es
auch die Schlagworte Freizeit und Ziel gibt, dann wird ein zweimaliges gemeinsames
Auftreten mit diesen Suchbegriffen registriert.)
Die Abbildung 7 zeigt die kumulative Auftretenshäufigkeit der Schlagworte bei strenger
Definition der Zeichenfolgen. Man benötigt also ca. 1000 unterschiedliche Schlagworte, um
90% aller Beschlagwortungsinhalte abzudecken. Weitere 700 Schlagworte steuern die letzten
10% bei. Die Studien.at praktizieren ein offenes Beschlagwortungssystem, das dazu neigt,
neue Schlagworte zu kreieren, die sich später zum Teil als Ad-hoc-Schlagworte mit sehr
geringer Wiederholungsrate herausstellen können. Für die Wissenslandkarte ist es zweck-
mäßig, die Schlagwortauswahl auf die signifikanten Items zu beschränken. Angesichts der
Häufigkeitsverteilung in Abbildung 7 lassen sich 75% aller Beschlagwortungen mit kaum
mehr als 300 (exakt 336) Begriffen abdecken; für die verbleibenden 25% würden weitere
1400 Suchbegriffe benötigt, die wegen ihres seltenen Auftretens gewiss keine symptomatisch
wichtigen Kontextinformationen mehr beisteuern. Bereits Schlagworte, die zumindest für
sieben der 3000 Dokumente Verwendung finden, sind in dieser Lösung berücksichtigt.
Abbildung 7: Kumulierte Prozenthäufigkeit der Schlagworte der Studien.at

[WP 2] D 2.2
V1.3 Seite 16
336 Schlagworte werden also zur Abbildung der Wissensbasis ausgewählt. Zur Feststellung
ihrer wechselseitigen thematischen Zusammenhänge reicht die Analyse ihrer Ähnlichkeit
anhand von etwa einem Viertel der häufigsten Worte, so dass wir hier von einer reduzierten
Variablenliste von 79 (siehe die folgende Liste der Schlagworttexte und ihrer absoluten
Auftretenshäufigkeit) ausgehen können. Die Datenmatrix für die Map-Erstellung besteht
somit aus 336 Zeilen und 79 Spalten.
*** reduced varlist:

,Alpen, 35
,Analyse, 101
,Angebotsanalyse, 28
,Ausbildung, 60
,Destination, 45
,Deutschland, 130
,Dienstleistung, 30
,EU, 65
,Entwicklung, 87
,Europa, 137
,Freizeit, 102
,Gaestebefragung, 123
,Gastgewerbe, 30
,Gastronomie, 57
,Gesundheitstourismus, 56
,Hotellerie, 159
,Image, 61
,Informationssystem, 39
,Infrastruktur, 28
,Internet, 55
,Italien, 31
,Jugend, 72
,Kaernten, 43
,Kommunikation, 30
,Kongresstourismus, 30
,Kooperation, 58
,Kultur, 78
,Kulturtourismus, 47
,Kundenzufriedenheit, 35
,Landwirtschaft, 45
,Leitbild, 34
,Management, 49
,Marketing, 168
,Marketingkonzept, 28
,Marktanalyse, 57
,Medien, 33
,Nationalpark, 42
,Niederoesterreich, 32
,Oberoesterreich, 37
,Oekologie, 47
,Oesterreich, 357
,Oesterreich_Werbung, 43
,Regionalentwicklung, 67

[WP 2] D 2.2
V1.3 Seite 17
,Reiseanalyse, 46
,Reiseausgaben, 30
,Reisebuero, 46
,Reisemarkt, 34
,Reiseverhalten, 103
,Salzburg, 43
,Schweiz, 32
,Senioren, 33
,Sommertourismus, 40
,Sport, 95
,Staedtetourismus, 62
,Statistik, 51
,Strategie, 32
,Tirol, 76
,Tourismus, 137
,Tourismusentwicklung, 89
,Tourismusmarkt, 32
,Tourismuspolitik, 31
,Trend, 105
,Typologie, 34
,Umwelt, 76
,Umweltschutz, 56
,Urlaub, 39
,Verkehr, 66
,Weiterbildung, 30
,Wellness, 28
,Werbung, 48
,Wien, 72
,Wintersport, 37
,Wintertourismus, 73
,Wirtschaft, 42
,Zielgruppe, 74
,Zufriedenheit, 66
,Zukunft, 34
,international, 34
,sanfter_Tourismus, 31
nr of keywords (rows) in sim matrix: 336

nr of vars (cols) from sim matrix: 79
sim matrix saved in: simdiag1mat.dat
short keyword master list saved in: shortD.dat>>
>>
Eine Map mit 16×16 Positionen bietet ausreichend Kapazität, um die nunmehr stark erhöhte
Anzahl der Schlagworte aufzunehmen und ihre thematische Zusammengehörigkeit zu
visualisieren. Ein Balloon-Plot wie in Abbildung 8 verdeutlicht, wie stark die einzelnen
Regionen der Studien.at-Wissenslandkarte bevölkert sind. Die Kreisflächen signalisieren die
absolute Häufigkeit des dominanten Schlagworts, das auf der jeweiligen Map-Position sitzt.
Position x=0, y=15 enthält z.B. das dominante Schlagwort Österreich mit einer Auftretens-
häufigkeit von 357 in den ca. 3000 Studien.at-Dokumenten. Die vollständige Beschreibung
dieser bislang besten Lösung bleibt dem Spezialbericht zur Visualisierung in Workpackage 3

[WP 2] D 2.2
V1.3 Seite 18
vorbehalten; der Visualisierungsreport stellt auch das Verfahren zur automatisierten Map-
Konstruktion mittels Web-Browser-Technologie vor.
Abbildung 8: Schlagwortdichte in der 16×16-Map für die Studien.at
1.4 Lösungen für den Anwendungsfall „Centre International de

Recherches et d’Etudes Touristiques“ (CIRET)
Bereits seit 40 Jahren sammelte Prof. René Baretje zunächst an der Universität Aix-en-
Provence und danach am CIRET tourismus- und freizeitwirtschaftliche Studien aus aller Welt.
Die Anzahl der Dokumente nähert sich per November 2004 60.000. Wir ersuchten das Centre
um die Einträge der letzten zwei Jahre (Oktober 2002 bis September 2004) und erhielten etwa
6000 Dokumentenbeschreibungen zur Verfügung gestellt. Die benötigten Schlagworte lassen

[WP 2] D 2.2
V1.3 Seite 19
sich daraus automatisch extrahieren (Routine extractkeyw in der nachfolgenden

Technischen Beschreibung Pkt. 2.). Das CIRET verarbeitet nur Dokumente, die ihm als
Originale oder Kopien überlassen werden. Der frankophone Sprachraum ist darin über-
repräsentiert. Wir verwenden die authentischen französischsprachigen Schlagworte; Standard-
Übersetzungen nach Englisch finden sich im vollständigen CIRET-Thesaurus auf
http://www.ciret-tourism.com/. Schlagworte mit lediglich bibliothekarischer
Bedeutung wie z.B. bibliographie oder edition lassen wir unberücksichtigt.
Die erste Lösung erlaubt String-in-String-Suche. Die Reduktion auf Schlagworte mit mehr als
1%-iger Auftretenshäufigkeit hinterlässt 268 Begriffe. Die Einschränkung der Variablenzahl
auf die Top 25% der Hauptschlagworte führt auf 77 Begriffe. Wie für alle Datenbasen sind
auch hier insignifikante Silben oder Wort(teil)e auszuschließen. Da Begriffe aus mehreren
Worten mit dem Underline ‚_’ verbunden wurden, geht fast kein inhaltlich brauchbares
Schlagwort verloren. Allerdings müssen Schlagworte, die auch als Teilstring (sinnlose Silbe)
in anderen Begriffen vorkommen, eliminiert werden. Ein Beispiel ist das Wort age, dass als
Schlagwort Alter zwar Sinn macht, bei der gewählten Form der Suche nach Übereinstimmung
in zwei ungleich langen Zeichenstrings im Französischen jedoch unsinnige Auftretenswerte
für Worte wie agence, voyage, amenagement, etc., erzeugt.
TOURISME COMPORTEMENT VALEUR

INTERNATIONAL
ART
CULTURE
PERCEPTION
DESTINATION
SPORT COMMUNAUTE
RECEPTRICE
DEVELOPPEM.
AIR
COUT /
BENEFICE
MARKETING
PERFORMANCE
HOTELLERIE GESTION
MODELE ENTREPR. TOUR.
(RES)SOURCE
Abbildung 9: 15×12-Map aus 6000 Dokumenten des CIRET
Auf Grund der im Vergleich mit den Studien Austria doppelt so hohen Dokumentenzahl
wurde bereits für die erste Lösung eine feinere Map mit 15×12 Positionen gewählt
(Abbildung 9; teilweise beschriftet). Die zugehörige Detailinformation – die in der

[WP 2] D 2.2
V1.3 Seite 20
webbasierten Lösung später graphisch komfortabel aufbereitet sein wird – findet sich im
Anhang 2 in tabellarischer Form.
Abbildung 10: Kumulative Prozenthäufigkeiten aus 6000 Dokumenten des CIRET
Die Erfahrungen aus dieser Lösung zeigen, dass die Gleichsetzung unserer Schlagwort-
Masterliste mit dem Thesaurus des CIRET zu viele, in den analysierten Dokument-
beschlagwortungen gar nicht verwendete Begriffe, produziert. Ferner ist die semantische
Sinnfälligkeit der unlimitierten Suche nach Wort- und Silbenübereinstimmung nicht verläss-
lich kontrollierbar. Für die praktisch einsetzbare Lösung werden daher zwei Verbesserungen
empfohlen:
(1) Die Ableitung der tatsächlich vorkommenden Schlagworte aus den Rohdaten führt
auf lediglich 919 unterschiedliche Begriffe.
(2) Die Schlagworte werden präzis abgegrenzt und auf Übereinstimmung der vollstän-
digen Zeichenfolge überprüft. Technisch ist dies leicht erreichbar, wenn man jedes
Schlagwort in der Masterliste durch Begrenzungszeichen umgibt (z.B. mit einem vor-
und nachgestellten Komma als delimiter):
,ACCEPTABILITE,
,ACCESSIBILITE,
,ACCUEIL,
,ACQUISITION,
,ACQUISITION_DE_TERRAINS,
,ACTIVITE,
[WP 2] D 2.2
V1.3 Seite 21
,ACTIVITE_A_HAUT_DEGRE_DE_RISQUE,
,AEROPORT,
…
,AGE,
…
Beim Dateneinlesen der Beschlagwortungslisten wird am Beginn und am Ende jeder
Zeile automatisch ein Komma eingefügt, damit auch das erste und das letzte
Schlagwort als separate Zeichenfolge erkennbar bleiben. Das Schlagwort age wird
also nur erkannt, wenn es als selbständiges Wort in einer Beschlagwortungsliste,
etwa,
,SPORT_D’HIVER,AGE,STATION,
auftritt.
Das Beschlagwortungsverfahren des CIRET hält sich konsequent an einen vorgegebenen

Thesaurus, der nur langsam und nicht für Ad-hoc-Schlagworte erweitert wird. Daraus folgt
ein völlig anderes Bild der kumulierten Auftretenshäufigkeiten als dies für die Studien.at der
Fall war. Mit etwa der Hälfte aller Schlagworte (exakt 416) werden bereits 95% aller
Beschlagwortungsvorgänge abgedeckt. Abbildung 10 zeigt diese kumulative Entwicklung der
Abdeckungsquote bei wachsender Schlagwortmenge. Da die Schlagwort-Masterlist aber kurz
ist, nutzen wir diese Möglichkeit einer extrem hohen Abdeckung von 95%. Bereits Schlag-
worte, die für zumindest 22 der 6000 Dokumente Verwendung finden, sind in dieser Lösung
enthalten. Ein Viertel dieser Schlagworte, nämlich die häufigsten 104 Begriffe fungieren als
die Variablen zur Bestimmung der Kontext-Ähnlichkeit zwischen den 416 Schlagworten. Die
folgende Liste entspricht somit den Inhalten der 104 Spalten der Datenmatrix für die Map-
Erstellung (Schlagworttext und absolute Auftretenshäufigkeit); die Zeilen entsprechen den
416 Schlagworten zur Verteilung auf Map-Positionen.

,ACCESSIBILITE, 138
,ACTIVITE, 242
,AGENCE_DE_VOYAGES, 95
,AGRICULTURE, 161
,ATTENTE_ASPIRATION, 113
,ATTITUDE, 167
,AUDIT_CONTROLE_INTERNE, 446
,CHAINE_D'HOTELS, 125
,COMMERCIALISATION, 208
,COMMUNAUTE_RECEPTRICE, 256
,COMMUNICATION, 111
,COMPARAISON, 350
,COMPORTEMENT, 374
,COMPTABILITE_NATIONALE, 305
,CONCURRENCE_COMPETITIVITE, 267
,CONSERVATION_DU_PATRIMOINE, 295
,CONSOMMATION, 325
,COUT_BENEFICE, 338
,CULTURE, 391
,DECISION_CHOIX, 562
,DEMANDE, 154
,DEPENSE, 393
,DESTINATION, 845
[WP 2] D 2.2
V1.3 Seite 22
,DEVELOPPEMENT, 566
,DISTRIBUTION, 105
,DIVERSIFICATION, 114
,DROIT, 180
,ECOTOURISME, 217
,EMPLOI, 384
,ENSEIGNEMENT, 228
,ENTREPRISE_TOURISTIQUE, 399
,ENVIRONNEMENT, 100
,EPIDEMIE, 96
,ETHIQUE, 103
,ETHNIE, 136
,ETUDE_DE_MARCHE, 140
,EXPERIENCE, 207
,FIDELITE, 95
,FLEAUX_HUMAINS, 111
,FREQUENTATION, 321
,GESTION, 1130
,GESTION_DES_RESSOURCES_HUMAINES, 218
,GUERRE, 211
,HISTOIRE, 442
,HOTELLERIE, 700
,IDENTITE, 152
,IDEOLOGIE, 109
,IMAGE, 289
,IMPACT_ECOLOGIQUE, 95
,IMPACT_ECONOMIQUE, 911
,INDICATEUR, 387
,INFORMATION_DOCUMENTATION, 117
,INNOVATION_TECHNOLOGIQUE, 109
,INTER-CULTUREL, 108
,INTERESSEMENT, 109
,INTERNET, 368
,INTERPRETATION, 119
,INVESTISSEMENT, 135
,LOISIR, 261
,MANIFESTATION_SPORTIVE, 148
,MARKETING, 368
,MISE_EN_VALEUR_DU_PATRIMOINE, 616
,MODELE, 953
,MONTAGNE, 98
,MOTIVATION, 257
,ORGANISATION_ADMINISTRATION, 153
,PARC, 213
,PARC_D'ATTRACTIONS, 107
,PARTICIPATION, 256
,PERCEPTION, 443
,PERFORMANCE, 550
,PERSONNEL, 163
,PLANIFICATION, 103
,POLITIQUE, 458

[WP 2] D 2.2
V1.3 Seite 23
,PREFERENCE, 115
,PREVENTION, 311
,PREVISION, 334
,PRODUIT_TOURISTIQUE, 239
,PROMOTION, 154
,QUALITE, 400
,RATIO, 209
,RECHERCHE, 203
,RECONVERSION, 124
,RENCONTRE, 105
,RESTAURATION, 173
,REVENU_PRODUIT, 105
,REVITALISATION, 176
,RISQUE, 255
,SANTE, 123
,SATISFACTION, 327
,SCENARIO, 201
,SEGMENTATION_DU_MARCHE, 120
,SERVICE, 252
,SPORT, 175
,SYSTEME_D'INFORMATION, 158
,TAILLE, 105
,TOURISME_ALTERNATIF, 317
,TOURISME_DES_JEUNES, 120
,TOURISME_INSULAIRE, 156
,TOURISME_INTERNATIONAL, 903
,TOURISME_NATIONAL, 580
,TOURISME_URBAIN, 269
,UNIVERSITE, 131
,VALEUR, 148

short keyword master list saved in: shortF.dat
minutes elapsed: 846.04
>>
Für die Aufnahme der 416 CIRET-Schlagworte ist die Kapazität einer 18×18-Map
ausreichend. Die Besetzung der Map-Positionen anhand des jeweils dominanten Schlagworts
verdeutlicht wieder das anschliessende Balloon-Plot in Abbildung 11. Dominante Schlag-
worte sind etwa GESTION auf der Position x=0, y=5 oder MODÈLE auf x=11, y=7 oder
DESTINATION auf x=15, y=12.
Diese Lösung wird für den endgültigen Visualisierungsvorschlag empfohlen und im

einschlägigen Bericht des Workpackage 3 graphisch komplett und automatisiert beschriftet
dargestellt. Wie bereits oben erwähnt wird die webbasierte Wissenslandkarte die Möglichkeit
bieten, jeden Map-Knoten mit mehr als einem Schlagwort durch Mausklick zu öffnen und die
vollständige und geordnete Häufigkeitsliste aller auf diesem Knoten sitzenden Themen

[WP 2] D 2.2
V1.3 Seite 24
abzurufen. Sodann lassen sich Schlagworte markieren und für eine nachfolgende Doku-
mentensuche konservieren.
Abbildung 11: Schlagwortdichte in der 18×18-Map für die CIRET-Daten
1.5 Lösung für den Anwendungsfall „Leisure, Recreation and

Tourism Abstracts“
Die Verlagsgruppe CAB International (http://www.cabi-publishing.org/) publi-
zierte seit mehr als 20 Jahren die Leisure, Recreation and Tourism Abstracts zunächst als
Zeitschrift und später in elektronischer Form. Es handelt sich um die weltweit größte
Sammlung von Abstracts aus einschlägigen Zeitschriftenaufsätzen. Insgesamt beobachtet
CABI etwa 400 Fachzeitschriften aus allen mit Tourismus und Freizeit befassten
[WP 2] D 2.2
V1.3 Seite 25
Fachgebieten. Dazu zählen also auch Bereiche wie Medizin, Sportwissenschaften oder
Freizeitsoziologie und –pädagogik. Die CABI Abstracts ermöglichen uns also die breiteste
internationale Abdeckung der tourismus- und freizeitwirtschaftlichen Wissensbasis
(http://www.cabi-
publishing.org/AbstractDatabases.asp?SubjectArea=&PID=5).
Die Abstracts erlauben Abfragen in mehreren Komplexitätsstufen (einfache Abfrage bis

Expertenmodus). Die für die Strukturierungslösung benötigten Schlagworte (descriptors) sind
in dem html-Code enthalten, der via Internet als Antwort auf eine Abfrage retourniert wird.
Wir wollen eine doppelt so große Anzahl an Dokumenten berücksichtigen, wie dies im
CIRET-Beispiel der Fall war, also ungefähr 12000 journal articles. Der nötige Erfassungs-
zeitraum erstreckt sich auf die drei Jahre 2002, 2003 und 2004 (Ende November). Daraus lässt
sich ein repräsentatives Bild der aktuellen internationalen Forschungsaktivitäten, die für
Tourismus- und Freizeitmanagement von Bedeutung sind, rekonstruieren.
Abbildung 12: Kumulative Prozenthäufigkeiten aus 12000 Dokumenten der Abstracts
Die WU Wien ist ein official subscriber der CABI-Datenbasis, so dass der Zugang gesichert
ist. Ein manuelles Abfragen und Extrahieren der descriptors wäre jedoch hoffnungslos, so
dass wir entweder eine Schlagwortliste einkaufen oder einen kleinen Webroboter einsetzen
müssen. Daher haben wir einen Parser geschrieben (© Markus Mazanec), der die Abstracts
automatisch aufruft, die Queries absetzt und den einlangenden Code analysiert (siehe den
Punkt 2.1 im Technischen Teil). Für jeden Artikel werden die Schlagworte (descriptors)
extrahiert und zur Weiterverarbeitung durch das Strukturierungsverfahren gesichert. CABI
erlaubt pro Abfrage nicht mehr als 1000 Dokumente, so dass die Erstellung schrittweise

[WP 2] D 2.2
V1.3 Seite 26
erfolgt. Die Masterliste der verwendeten Schlagworte rekonstruieren wir aus den tatsächlich
verwendeten Deskriptoren.
Die automatische Abfrage von ca. 12000 Dokumenten führte auf mehr als 5000 Schlagworte.
Die hohe Anzahl erklärt sich aus der Menge und Heterogenität der berücksichtigten
Fachzeitschriten. Nicht zuletzt sind zahllose medizinischer Fachausdrücke (Tropenmedizin,
Sportmedizin, Rehabilitation, Kurwesen) zu berücksichtigen, die in den anderen beiden
Datenbasen keine Rolle spielen. Wegen zahlloser exotischer, vor allem lateinisch-stämmiger
(oft medizinischer) Fachausdrücke empfiehlt sich nur eine Suche mit exakt abgegrenzten
Schlagworten (,schlagwort,). Ein Begriff nation würde sonst z.B. in so manchen
Endsilben aufgefunden und viele weitere unkontrollierbare Unsinnigkeiten wären die Folge.
Die Relation Schlagworte : Dokumentenzahl verhält sich ähnlich wie in den Studien.at, so
dass man einen ähnlichen Verlauf des Grades der Beschlagwortungsabdeckung bei
zunehmender Schlagwortanzahl erwarten muss. Die Abbildung 12 bestätigt diese Erwartung.
Wegen der großen Anzahl selten anzutreffender Schlagworte wird man sich auch hier mit
einer Abdeckungsquote von 75% begnügen ohne dabei auf signifikante Schlagworte
verzichten zu müssen. Bereits bei einer Verwendungshäufigkeit für 30 oder mehr der 12000
Dokumente gelangt ein Schlagwort in diese Lösung. 561 Schlagworte sind dafür vonnöten;
die gewohnte Quote von 25% der top-häufigsten Begriffe führt daher auf 140 Variablen. Die
Datenmatrix für die Map-Erstellung hat somit 561 Zeilen und 140 Spalten. Die inhaltliche
Beschreibung dieser spaltendefinierenden Variablen (Schlagworttext und absolute Häufigkeit
ergibt sich gemäß folgender Liste:

,accommodation, 193
,adolescents, 169
,air_transport, 137
,amenity_and_recreation_areas, 149
,angling, 136
,athletes, 636
,attitudes, 776
,audiences, 155
,behaviour, 155
,biodiversity, 167
,case_reports, 130
,case_studies, 959
,children, 511
,clinical_aspects, 153
,community_involvement, 232
,competitive_sports, 163
,conflict, 126
,constraints, 349
,consumer_attitudes, 225
,consumer_behaviour, 279
,consumer_preferences, 145
,consumer_satisfaction, 232
,cultural_heritage, 268
,cultural_tourism, 213
,culture, 321
,curriculum, 165
[WP 2] D 2.2
V1.3 Seite 27
,decision_making, 257
,demand, 235
,destinations, 826
,disease_prevention, 161
,drug_therapy, 146
,economic_development, 207
,economic_impact, 496
,ecotourism, 572
,education, 162
,elderly, 181
,employment, 205
,environmental_impact, 395
,environmental_management, 139
,environmental_protection, 252
,epidemiology, 335
,ethics, 133
,ethnic_groups, 122
,evaluation, 126
,exercise, 425
,forest_management, 167
,forest_recreation, 222
,forests, 484
,gender_relations, 231
,globalization, 204
,health, 136
,heritage_tourism, 140
,history, 308
,holidays, 174
,hospitality_industry, 828
,hotels, 546
,human_diseases, 957
,imported_infections, 177
,information_services, 123
,information_technology, 234
,international_tourism, 267
,international_travel, 167
,internet, 329
,land_use, 185
,landscape, 178
,learning, 152
,leisure, 405
,leisure_activities, 257
,leisure_behaviour, 133
,lifestyle, 147
,malaria, 151
,management, 410
,market_competition, 134
,market_segmentation, 197
,marketing, 537
,marketing_techniques, 195
,markets, 264

[WP 2] D 2.2
V1.3 Seite 28
,men, 158
,methodology, 284
,models, 356
,motivation, 417
,mountain_areas, 129
,national_parks, 317
,nature_conservation, 297
,nature_tourism, 230
,on_line, 208
,outdoor_recreation, 300
,parks, 136
,participation, 337
,physical_activity, 531
,physical_education, 416
,physical_fitness, 131
,planning, 316
,politics, 206
,psychology, 269
,recreation, 256
,recreational_activities, 181
,resource_management, 185
,restaurants, 123
,reviews, 618
,risk, 228
,risk_factors, 163
,rural_areas, 210
,rural_development, 179
,rural_tourism, 248
,safety, 138
,self_perception, 127
,soccer, 309
,social_impact, 206
,socioeconomics, 166
,sociology_of_leisure, 152
,sociology_of_sport, 489
,sociology_of_tourism, 192
,sport, 1347
,sport_performance, 377
,students, 207
,surveys, 873
,sustainability, 602
,teaching, 141
,tourism, 2334
,tourism_development, 1166
,tourism_impact, 629
,tourism_policy, 380
,tourism_theory, 122
,tourist_attractions, 406
,tourist_expenditure, 192
,tourist_industry, 1219
,tourists, 761

[WP 2] D 2.2
V1.3 Seite 29
,training, 184
,trauma, 158
,travel, 830
,travellers, 616
,trends, 387
,urban_areas, 184
,visitor_behaviour, 302
,visitors, 519
,visits, 498
,water_recreation, 174
,women, 434
,youth, 180

short keyword master list saved in: shortE.dat
minutes elapsed: 2520.46
>>
Für die ÖGAF-Wissenslandkarte mit der reichhaltigsten Datenbasis ist eine Map mit 20×20
Positionen angemessen. Sie verfügt über die nötige Kapazität, um die 560 Schlagworte
aufzunehmen und nach Ko-Auftretenshäufigkeit in den Beschlagwortungen der von den
CABI-Abstracts beobachteten Journals zu organisieren.
Die vollständige Liste der nach Map-Positionen geordneten Schlagwortgruppen und ihre
individuellen Häufigkeiten befinden sich im Anhang 3. Sie verkörpert den Input für die
Visualisierung mittels Bubblechart. Auch für die Wissenslandkarte auf Grund der Abstracts
genügt eine zweistufige Bebilderung. Die erste Ebene soll — wie oben mehrfach demonstriert
— die Schlagwortgruppen als Kreisflächen zeigen; die Ebene darunter soll auf Mausklick
Balkendiagramme mit den individuellen Häufigkeiten jedes Schlagworts innerhalb der
Gruppe, die sich auf einem Map-Knoten versammelt, liefern.
1.6 Vergleichbarkeit der empfohlenen Lösungen

Die empfohlenen Strukturierungslösungen für die drei Datenbasen von Studien.at, CIRET und
CABI Abstracts sind untereinander vergleichbar. Insbesondere die einheitliche Festlegung auf
streng abgegrenzte Schlagworte erhält die Eigenarten der drei einander ergänzenden
Informationsquellen. So hat z.B. in den auf Tourismus spezialisierten Studien.at die Verwen-
dung von ,Tourismus, als unabhängiges Schlagwort nur begrenzten Sinn und kommt
daher nur 137 mal vor. Anders ist dies in den Abstracts, wo neben Tourismus auch Freizeit,
Sport, Reise- oder Sportmedizin gleichberechtigte Themenfelder darstellen; das Schlagwort
,tourism, tritt daher 2334 mal in Erscheinung (x=0, y=8 in Abbildung 13). Natürlich gibt
es in allen drei Datenbasen viele Kombinationsschlagworte mit Tourismus bzw. tourism.
Die wesentlichen Entscheidungen über die Map-Erzeugung für die drei bibliographischen
Informationsquellen sind in der nachstehenden Tabelle zusammen gefasst. Aus Gründen der

[WP 2] D 2.2
V1.3 Seite 30
Konsistenz sollten sie auch in den späteren halbjährlichen oder jährlichen Aktualisierungen
der Landkarten beibehalten werden.
Daten- Abdeckungsquote Schlagwort- Anzahl der

basis Map-Größe aller Schlagwort- mindest- ausgewählten
zuweisungen häufigkeit Schlagworte
Studien.at 16×16 75% 7 336
CIRET 18×18 95% 22 416
CABI-Abstracts 20×20 75% 30 561
Vorzugeben sind die Map-Größe und die gewünschte Abdeckungsquote. Die Mindest-
häufigkeit des kleinsten noch zu berücksichtigenden Schlagworts und die notwendige
Gesamtanzahl ergeben sich aus der Aufbereitung der Beschlagwortungsdaten.
Abbildung 13: Schlagwortdichte in der 20×20-Map für die CABI-Abstracts-Daten

[WP 2] D 2.2
V1.3 Seite 31
2 Technische Beschreibung und kommentierte Programmlistings

Die hier dargestellten Software-Bausteine werden der ÖGAF zum Zweck der laufenden
Betreuung und halbjährlichen bis jährlichen Aktualisierung der ÖGAF-Landkarte überlassen.
Wir nutzen dabei unterschiedliche Tools, insbesondere die Programmierumgebungen
• Matlab (http://www.mathworks.com/) und
• das Software-System R (http://cran.r-project.org/), die Open-Source-Alternative zu
Splus.
Die einzelnen Bausteine und ihre praktischen Einsatzmöglichkeiten bei der Datenaktuali-
sierung und Map-Wartung sind in der Folge kurz erläutert.
2.1 Datengewinnung, Schlagwortaufbereitung und Vorverarbeitung

Die Schlagworte der in den Studien Austria erfassten Dokumente übernehmen wir als Daten-
bankauszug. Nach der Bereinigung von Inkonsistenzen und Tippfehlern wird diese Liste mit
den Verfahren unter 2.2 weiter verarbeitet.
Die Datenbankeinträge des CIRET werden als Originaleinträge mit allen bibliographischen
Angaben geliefert. Für die ÖGAF-Landkarte benötigen wir nur die Schlagworte. Das folgende
Matlab-Script extractkey.m liest die vollständigen CIRET-Einträge vom File
CIRET14nurT.txt, sucht nach den Schlagworten, die jeweils in der Zeile THEME stehen, und
schreibt sie auf das Ausgabefile CIRETKW.txt.
Falls keine separate Masterliste der Schlagworte zur Verfügung steht, lässt sich diese mit dem
Script kw2list.m erzeugen. Am Beispiel der CABI-Daten gezeigt liest es die Schlagworte
z.B. von einem File trace04_0911.txt und exportiert jedes zumindest einmal auf-
tauchende Schlagwort in das File CABIkwlist.txt.
Die spätere Ermittlung der gemeinsamen Auftretenshäufigkeiten der einzelnen Schlagworte

benötigt eine Masterliste und die Information über die Beschlagwortung der zugrunde
liegenden Dokumente; jeder Record (Zeile) mit den vergebenen Schlagworten steht für ein
Dokument.

[WP 2] D 2.2
V1.3 Seite 32
Script extractkey

[WP 2] D 2.2
V1.3 Seite 33
Script kw2list
Die erstmalige Einholung der Schlagwortdaten aus den Abstracts von CAB International
sowie die spätere regelmäßige Nachbeschaffung erleichtert ein kleiner html-Parser. Die
‚manuelle’ Abfrage im Expertenmodus (siehe unten) würde es zwar erlauben, Dokumente aus
einem definierten Zeitraum (im Beispiel unten 1.1.-10.1.2005) abzufragen. Das Suchen nach
den Schlagworten (descriptors) kann aber sinnvoller Weise nur automatisiert erfolgen. Der
Screenshot in der übernächsten Abbildung zeigt einen Ausschnitt der gelieferten Doku-
mentendaten. Jeder Eintrag aus der Liste wäre jetzt zuerst zu öffnen; danach werden Detail-
informationen inklusive der CABI-Themencodes und der hier für die Konstruktion der
Wissenslandkarte interessierenden Schlagwortliste angezeigt.

[WP 2] D 2.2
V1.3 Seite 34
‚Manuelles’ Absetzen einer Abfrage aus den Abstracts (Experten-Modus)
Ergebnis aus der obigen Abfrage (Ausschnitt)

[WP 2] D 2.2
V1.3 Seite 35
Der html-Parser bewerkstelligt das Extrahieren der Schlagworte automatisch. Die drei am
Bildschirm sichtbaren Fenster (Bild unten) enthalten einen Mini-Webbrowser (oben), den das
Browserfenster erzeugenden html-Code (Mitte) sowie die aufgefunden Schlagwortlisten
(unten; jede Zeile beschreibt ein Dokument). Letztere werden in dem csv-formatierten und
z.B. mit Excel lesbaren File trace.csv gesammelt.
html-Parser für die Leisure & Tourism Abstracts

[WP 2] D 2.2
V1.3 Seite 36
2.2 Erzeugung der Ähnlichkeitsmatrix der Schlagworte

Funktion keysim.m dient zur Umwandlung der Schlagwortlisten in Auftretenshäufigkeiten
und Ähnlichkeitswerte für die anschließende Erzeugund von Self-Organizing Maps. Als
Aufrufparameter werden verlangt:
• die Masterliste der Schlagworte (1 Schlagwort je Zeile)
• die Liste der Beschlagwortungen aller Dokumente (ein Dokument je Zeile)
• eine Liste mit insignifikanten Worten, die nicht fälschlich als Schlagworte ausgewertet
werden sollen (ein Wort je Zeile)
• ein Prozentwert für die Untergrenze der Auftretenshäufigkeit und (z.B. 1 für 1%)
• die Entscheidung über die Einschränkung der Variablen; varlim = 1 bewirkt, dass
nur die 25% der am häufigsten auftretenden Schlagworte zur Beschreibung aller
übrigen Schlagworte herangezogen werden.
function sim = keysim(listfile,keywfile,insign,frequlim,varlim,shortfile)

% Call: sim = keysim(listfile,keywfile,insign,frequlim,varlim,shortfile)
% e.g.: sim = keysim('schlagwortlisteDT.txt','dbauszugDT.txt', ...
% 'insignD.dat',75,1,'shortD.dat');
% sim = keysim('ThesFcomma919.txt','CIRETKW3.txt', ...
% 'insignF.dat',95,1,'shortF.dat');
% sim = keysim('CABIkwlist0201_0411.dat','trace0201_0411.dat',...
% 'insignE.dat',75,1,'shortE.dat');
% Preprocess keyword co-occurrences for semantic map.
%
% (c) J. Mazanec 10/2004
%
% uses function litcount and cocount and matlab function textread
%
% listfile: filename for master list of keywords
% keyfile: filename for keywords file, each doc = one record
% insign: filename for nonsignificant words
% frequlim: cumulative percentage of keyword frequencies considered
% as cutoff point for reducing list, e.g. 90 or 95
% varlim = 1: restrict the # of columns in the sim matrix to the
% 25% most frequent keywords of the reduced list
% shortfile: collects reduced list of keywords and their frequencies
% Matlab functions needed: textread
%
clock0=clock;
malist=textread(listfile, '%s'); %,'delimiter','"');
% remove repetitions in keyword list, if necessary
% malist=consolidate(malist);
% remove insignificant words
malist=insignif(malist,insign);
nr=length(malist);
% determine keyword frequencies and select nr1 words
for i=1:nr
frequ(i)=litcount(keywfile,char(malist(i)));
end
save FrequencyList.dat frequ -ASCII
disp(' '), disp(' keyword | abs frequency:'),disp(' ')
disp([char(malist) num2str(frequ')])
% determine the cutoff limit
lowlim=cutofflim(frequ,frequlim);
disp(' '), disp('*** shortlist:')
disp(' keyword | abs frequency:'),disp(' ')
shortlist=malist(frequ>=lowlim);

[WP 2] D 2.2
V1.3 Seite 37
shortfrequ=frequ(frequ>=lowlim);
nr1=length(shortlist);
number=(1:nr1)';
disp([num2str(number) char(shortlist) num2str(shortfrequ')]);
% write reduced keyword list and frequencies to file
fid1=fopen(shortfile,'w');
% remove the delimiter ','
for i=1:nr1
kword=char(shortlist(i));
fprintf(fid1,'%s %8.0f \n',kword(kword ~= ','),shortfrequ(i));
end
fclose(fid1);
% initialize similarity matrix with keyword frequencies in main diag
sim=zeros(nr1,nr1)+diag(shortfrequ);
% fill upper triangular and copy to lower
for i=1:nr1-1
for j=(i+1):nr1
y=cocount(keywfile,char(shortlist(i)),char(shortlist(j)));
sim(i,j)=y;
end
end
sim=sim+sim'-(zeros(nr1,nr1)+diag(diag(sim)));
rawsim=sim;
disp(' '), disp(' matrix of co-occurrences for shortlist:'), disp(' ')
for i=1:nr1
fprintf('%s:\n',char(shortlist(i)))
for j=1:nr1
fprintf(' %5.0f',sim(i,j))
% normalize to diag values = 1
sim1(i,j)=sim(i,j)./sim(i,i);
end
fprintf('\n')
end
% the rows in sim are the semantic map data vectors
% restrict # of columns in sim to most frequent 25%, if desired
if varlim == 1
lim = median(shortfrequ(shortfrequ>median(shortfrequ)));
disp(' '), disp('*** reduced varlist:');
disp([char(shortlist(diag(sim)>lim))
num2str(shortfrequ(diag(sim)>lim)')]);
sim1=sim1(:,diag(sim) > lim);
end
% raw sim matrix, unrestricted
save simrawmat.dat rawsim -ASCII
% normalized to diag values = 1, restricted, rownormalized
sim1=normrows(sim1);
save simdiag1mat.dat sim1 -ASCII
[z,s]=size(sim1);
fprintf('\nnr of keywords (rows) in sim matrix: %5.0f',z);
fprintf('\nnr of vars (cols) from sim matrix: %5.0f',s);
fprintf('\nsim matrix saved in: simdiag1mat.dat');
fprintf('\nshort keyword master list saved in: %s',shortfile);
fprintf('\nminutes elapsed: %6.2f\n',etime(clock,clock0)/60);
Die Routine keysim ruft die Funktionen cocount, consolidate, cutofflim,

insignif, litcount, normrows und die Matlabfunktion textread auf:

[WP 2] D 2.2
V1.3 Seite 38

[WP 2] D 2.2
V1.3 Seite 39

[WP 2] D 2.2
V1.3 Seite 40

[WP 2] D 2.2
V1.3 Seite 41
2.3 Generierung der Maps

Für die Erzeugung von Maps (‚Forschungslandkarten’), die insgesamt nicht mehr als 36 (also
z.B. 6×6 oder 7×5) verwenden wir unser eigenes Visual-C-Programm SOMnia
(http://tourism.wu-wien.ac.at/cgi-bin/ift.pl?charly/http/software/somnia.html). Für größere
MAPs hat sich die SOM-Funktion aus dem R-System (http://cran.r-project.org/) bewährt. Der
Steckbrief des entsprechenden Pakets lautet:
Self-Organizing Map (with application in gene clustering)

Version: 0.3-4
Depends: R (>= 1.9.0)
Date: 2004-09-18
Author: Jun Yan
Maintainer: Jun Yan
License: GPL version 2 or later

[WP 2] D 2.2
V1.3 Seite 42
Downloads:
Package source: som_0.3-4.tar.gz
MacOS X binary: som_0.3-4.tgz
Windows binary: som_0.3-4.zip
Index of contents: som.INDEX
Reference manual: som.pdf
Das zur Handhabung der R-SOM-Funktion konzipierte Script sieht wie folgt aus; die
einzelnen Anlyseschritte sind in den ##-Kommentarzeilen erklärt:

[WP 2] D 2.2
V1.3 Seite 43
Die standardmäßig mit dem R-SOM-Paket erzeugbare Graphik (siehe eine 10×10-Beispiel-
Map unten) zeigt die relative Besetzungshäufigkeit jedes Knotens (n = …) und die
Mittelwerte bzw. die Streuung der zugehörigen Variablenwerte. Für die Veranschaulichung
einer Wissenslandkarte ist sie jedoch ungeeignet.
n=10 n=1 n=2 n=2 n=0 n=0 n=1 n=0 n=0 n=8
3
-3
n=1 n=0 n=0 n=0 n=0 n=1 n=2 n=0 n=0 n=3
3
-3
n=2 n=1 n=2 n=1 n=1 n=1 n=0 n=0 n=1 n=9
3
-3
n=5 n=2 n=3 n=3 n=1 n=2 n=3 n=0 n=0 n=2
3
-3
n=2 n=0 n=2 n=2 n=3 n=1 n=1 n=0 n=1 n=7
3
-3
n=0 n=1 n=1 n=5 n=1 n=6 n=0 n=1 n=1 n=3
3
-3
n=0 n=2 n=1 n=1 n=0 n=0 n=4 n=1 n=0 n=1
3
-3
n=0 n=0 n=0 n=3 n=0 n=0 n=0 n=0 n=1 n=1
3
-3
n=1 n=1 n=0 n=1 n=0 n=0 n=0 n=0 n=1 n=0
3
-3
n=3 n=6 n=2 n=0 n=0 n=10 n=4 n=1 n=0 n=1
3
-3
0 1 2 3 4 5 6 7 8 9 10
Das oben gelistete Script produziert das File CABIsom.dat mit folgender Struktur. Der
komplette Output befindet sich im Anhang 3:
keyword frequency x y
carrying_capacity 70 0 0
coastal_areas 101 0 0
conservation 111 0 0
conservation_areas 80 0 0
cost_benefit_analysis 60 0 0
ecotourism 572 0 0
…
…

[WP 2] D 2.2
V1.3 Seite 44
Diese Tabelle mit den Spalten Schlagwort, absolute Häufigkeit, x-Position und y-Position
enthält alle notwendigen Informationen zur Visualisierung der Inhalte der ÖGAF-Wissens-
landkarte (siehe dazu die Berichte zum Workpackage 3).

[WP 2] D 2.2
V1.3 Seite 45
3 Anhang
Anhang 1: Datentabelle der 10×10-SOM für die Studien.at
Auf den geordneten Positionen und Häufigkeiten der folgenden Tabelle beruht das Bubble-
Chart der Abbildung 6.
Schlagwort Abs. Häuf. x-Position y-Position Kum. Häuf. Bubble Size

Image 61 0 1 61
Konsumverhalten 18 0 1 79 79
Urlaubsverhalten 17 0 2 17
Urlaub 132 0 2 149 149
Deutschland 130 0 3 130
USA 22 0 3 152
Typologie 34 0 3 186 186
Motiv 39 0 4 39
Kundenzufriedenheit 35 0 4 74
Italien 31 0 4 105
Senioren 41 0 4 146
Kunde 60 0 4 206 206
Verkehrsmittel 21 0 5 21 21
Marktsegment 26 0 6 26
Staedtetourismus 62 0 6 88 88
Europa 137 0 8 137
Reiseverhalten 103 0 8 240
Euro 152 0 8 392
Daten 29 0 8 421 421
Geschaeftsreise 17 0 9 17
Reise 400 0 9 417
Reiseentscheidung 17 0 9 434
Reiseveranstalter 27 0 9 461
Reisebuero 19 0 9 480
Ausland 19 0 9 499
Reiseanalyse 46 0 9 545
reisebuero 27 0 9 572
Reiseausgaben 30 0 9 602
Reiseziel 24 0 9 626
Reisemarkt 34 0 9 660 660
Freizeitpark 19 1 0 19
Freizeitaktivitaet 21 1 0 40
Konsum 28 1 0 68
aktiv 37 1 0 105 105
Jugend 84 1 2 84
Lifestyle 20 1 2 104 104
Fluglinie 24 1 6 24
Destination 45 1 6 69 69
Marktsegmentierung 19 1 7 19 19
Markt 140 1 8 140 140
Marktanalyse 57 1 9 57 57

[WP 2] D 2.2
V1.3 Seite 46

Freizeit 208 2 0 208
Medien 35 2 0 243
Kind 18 2 0 261
Kur 58 2 0 319 319
Zielgruppe 74 2 2 74
Frankreich 20 2 2 94
Bauer 21 2 2 115
Bauernhof 19 2 2 134 134
Kulturtourismus 48 2 3 48
Kunst 21 2 3 69 69
Geschichte 23 2 9 23
Statistik 51 2 9 74
Tourismusmarkt 32 2 9 106 106
Sport 107 3 0 107
Gesundheitstourismus 56 3 0 163
Wellness 28 3 0 191
Kurtourismus 28 3 0 219
Gesundheit 76 3 0 295
Kongresstourismus 30 3 0 325 325
Wien 76 3 1 76
Segmentierung 22 3 1 98 98
Marketingkonzept 32 3 3 32
Trend 105 3 3 137
Marketingstrategie 29 3 3 166 166
Informationssystem 39 3 5 39
Information 83 3 5 122 122
Internet 55 3 9 55
Vergleich 18 3 9 73 73
Familie 40 4 0 40
Wintertourismus 73 4 0 113
Sommertourismus 40 4 0 153
Oesterreich_Werbung 43 4 0 196
Sommer 75 4 0 271
Gaestebefragung 123 4 0 394 394
Angebotsgestaltung 19 4 1 19
Werbung 91 4 1 110
Kongress 48 4 1 158 158
Kultur 154 4 2 154 154
Analyse 125 4 3 125 125
Marketing 243 4 4 243
Wert 17 4 4 260
Marke 257 4 4 517 517
Kommunikation 44 4 5 44 44
Strategie 32 4 6 32 32
Oesterreich 400 5 0 400
Angebotsanalyse 28 5 0 428
Nachfrageanalyse 25 5 0 453
Nachfrage 42 5 0 495
Winter 142 5 0 637
Wintersport 42 5 0 679 679
Angebot 92 5 1 92 92
Zufriedenheit 66 5 2 66
Tagesausflug 20 5 2 86 86

[WP 2] D 2.2
V1.3 Seite 47

Weiterbildung 30 5 3 30
Wirtschaft 113 5 3 143
Wirtschaftsentwicklung 27 5 3 170 170
Ausbildung 60 5 5 60
Gastronomie 57 5 5 117
Personal 18 5 5 135 135
Gastgewerbe 30 5 6 30
Gast 109 5 6 139
Hotellerie 159 5 6 298
Reservierungssystem 18 5 6 316 316
Kennzahl 18 5 7 18
Wettbewerb 23 5 7 41
Reservierung 19 5 7 60 60
international 35 5 9 35
intern 37 5 9 72 72
Niederoesterreich 32 6 0 32
Stadt 22 6 0 54 54
Tirol 76 6 2 76 76
Investition 18 6 3 18 18
Zukunft 34 6 4 34
Arbeit 86 6 4 120 120
Arbeitsmarkt 25 6 5 25 25
Management 58 6 6 58 58
Dienstleistung 46 6 7 46
Unternehmen 40 6 7 86 86
Schweiz 32 6 8 32 32
Prognose 20 6 9 20
Suedtirol 20 6 9 40 40
Oberoesterreich 37 7 0 37 37
Staerken-Schwaechen-
Analyse 18 7 3 18 18
Verkehr 118 7 4 118
Mobilitaet 22 7 4 140 140
Kooperation 61 7 8 61 61
Betrieb 22 7 9 22 22
Salzburg 43 8 0 43
Kaernten 43 8 0 86
Steiermark 27 8 0 113
Politik 19 8 0 132 132
Massnahme 37 8 3 37
Entwicklung 139 8 3 176 176
Radtourismus 18 8 5 18 18
Qualitaet 56 8 8 56 56
Qualitaetsmanagement 21 8 9 21 21
Gemeinde 25 9 0 25 25
Berggebiet 18 9 1 18 18
Landwirt 52 9 2 52
Landwirtschaft 45 9 2 97
Infrastruktur 30 9 2 127
Erholung 17 9 2 144 144
Alpen 39 9 3 39
Regionalentwicklung 67 9 3 106
Burgenland 21 9 3 127
Land 133 9 3 260

[WP 2] D 2.2
V1.3 Seite 48

Ortsanalyse 23 9 3 283
Region 110 9 3 393
Landschaft 73 9 3 466
Entwicklungskonzept 26 9 3 492
Struktur 25 9 3 517 517
Natur 63 9 4 63
Raumplanung 22 9 4 85 85
Umwelt 177 9 5 177
Konzept 31 9 5 208 208
Naturschutz 20 9 6 20
Leitbild 41 9 6 61
Umweltschutz 56 9 6 117
Wein 24 9 6 141
Rad 30 9 6 171 171
Nation 52 9 7 52 52
Nationalpark 42 9 8 42 42
Tourismus 528 9 9 528
Oekologie 47 9 9 575
sanfter_Tourismus 31 9 9 606
EU 68 9 9 674
Tourismuskonzept 17 9 9 691
Foerderung 20 9 9 711
Tourismuswirtschaft 20 9 9 731
Tourismusentwicklung 89 9 9 820
Tourismusorganisation 21 9 9 841
Nachhaltigkeit 23 9 9 864
Tourismuspolitik 31 9 9 895
Qualitaetstourismus 18 9 9 913 913
Anhang 2: Datentabelle der 15×12-SOM für die CIRET-Dokumente
Auf den geordneten Positionen und Häufigkeiten der folgenden Tabelle beruht das Bubble-
Chart der Abbildung 7.
Schlagworte Häuf. x-Pos. y-Pos. Kum. Häuf. Bubble S.

HOTELLERIE 722 722
PRODUCTIVITE 24 0 0 746 746
TARIF 35 0 1 35 35
TRAFIC_AERIEN 25 0 2 25 25
TRANSPORT_AERIEN 73 73
IMPORTATION 33 0 3 106 106
TAUX_D'OCCUPATION 83 0 9 83 83
IMPACT_ECONOMIQUE 911 911
ELASTICITE 34 945
MODE_DE_TRANSPORT 51 0 10 996 996
HEBERGEMENT 143 143
COMPTABILITE 321 464
ARRIVEE 94 558
EMPLOI 384 942
DEPENSE 393 1335
MESURE_DES_FLUX 80 1415

[WP 2] D 2.2
V1.3 Seite 49

PREVISION 346 1761
REVENU 142 1903
INDICATEUR 387 2290
INVESTISSEMENT 179 2469
DUREE_DU_SEJOUR 56 2525
COMPTABILITE_NATIONALE 305 2830
TOURISME_NATIONAL 580 3410
NUITEE 68 3478
CAPACITE_D'HEBERGEMENT 60 3538
SCENARIO 201 3739
GUERRE 211 3950
TOURISME_INTERNATIONAL 903 0 11 4853 4853
PROFIL_DE_CARRIERE 25 25
CHAINE_D'HOTELS 125 150
LUXE 44 194
RENTABILITE 55 249
CARRIERE 25 1 0 274 274
COMPAGNIE_AERIENNE 72 72
CONTRAT 31 1 1 103 103
EURO 39 39
FINANCEMENT_DES_INVESTISSEMENTS 44 83
MARCHE_UNIQUE_EUROPEEN 36 119
MARCHE_UNIQUE 36 1 2 155 155
LOW_COST 40 1 3 40 40
PRIX 74 74
TRANSPORT 206 1 5 280 280
FORFAIT 39 39
VOYAGE_A_FORFAIT 38 1 6 77 77
SAISONNALITE 83 1 9 83 83
DEPART 55 1 11 55 55
RECLAMATION 28 28
MOBILITE 49 77
RECRUTEMENT 34 111
PERSONNEL 163 2 0 274 274
RESPONSABILITE 40 2 1 40 40
BENCHMARKING 29 2 2 29 29
AGENCE_DE_VOYAGES 95 2 4 95 95
VOYAGE 292 2 6 292 292
OFFRE 52 2 9 52 52
DEMANDE 154 2 10 154 154
MODE_D'HEBERGEMENT 47 2 11 47 47
HYGIENE 28 28
SECURITE 95 123
SERVICE 253 376
PROTECTION_DU_TOURISTE 59 3 0 435 435
CLIMAT 38 38
EPIDEMIE 96 3 1 134 134
RESTAURATION 185 3 2 185 185
CONSOMMATION 325 3 5 325 325
VOYAGE_COLLECTIF 25 25
MODELE 953 3 7 978 978
PREVENTION 311 311
QUALITE 416 727

[WP 2] D 2.2
V1.3 Seite 50

VENT 437 4 0 1164 1164
EFFET_DE_SERRE 24 24
SANTE 123 147
POLLUTION 31 178
RISQUE 262 4 1 440 440
CLASSEMENT 47 4 2 47 47
TERRORISME 49 4 3 49 49
ANALYSE_IMPORTANCE-PERFORMANCE 29 4 4 29 29
SPORT 568 4 6 568 568
FIDELITE 95 4 7 95 95
CROISIERE 56 4 8 56 56
ORGANISATION_DES_VACANCES 36 36
INTENTION 27 4 10 63 63
BANQUE 48 48
BIBLIOGRAPHIE 38 86
RESERVATION 55 141
PERSONNALISATION 43 184
BANQUE_DE_DONNEES 36 220
DISTRIBUTION 105 325
SYSTEME_D'INFORMATION 158 483
INTERNET 368 851
FORMATION 377 1228
FLEAUX_NATURELS 76 1304
BESOIN 58 1362
PERFORMANCE 579 5 0 1941 1941
EDUCATION_DU_TOURISTE 41 5 1 41 41
FLEAUX_HUMAINS 111 5 2 111 111
UNIVERSITE 131 5 3 131 131
SPORTS_D'HIVER 35 35
STATION_DE_SPORTS_D'HIVER 26 5 5 61 61
JEUX_DE_HASARD 44 44
MEGA_EVENEMENT 41 85
MANIFESTATION_SPORTIVE 148 5 6 233 233
SEXE 40 5 7 40 40
COMPARAISON 350 5 8 350 350
SEGMENTATION_DU_MARCHE 120 120
ETUDE_DE_MARCHE 140 260
PREFERENCE 115 375
SHOPPING 31 5 11 406 406
TELEPHONE 37 37
INNOVATION_TECHNOLOGIQUE 109 6 0 146 146
TELEPHONE_CELLULAIRE 26 26
EAU 377 6 1 403 403
CASINO 47 6 7 47 47
DESTINATION 845 6 8 845 845
ACTIVITE 302 302
ATTRACTIVITE 47 349
COMPORTEMENT 374 723
VACANCES 102 825
MOTIVATION 257 1082
PARTICIPATION 256 1338
TOURISME_DU_TROISIEME_AGE 26 1364
TEMPS 54 6 11 1418 1418

[WP 2] D 2.2
V1.3 Seite 51

ENTRAINEMENT 50 7 0 50 50
MARQUE 80 7 1 80 80
FOOD_AND_BEVERAGE 85 85
ENSEIGNEMENT 237 7 2 322 322
NOUVEAUTE 50 7 3 50 50
AVENTURE 71 7 5 71 71
JEU 266 7 8 266 266
ATTITUDE 167 167
TOURISME_DES_HANDICAPES 39 206
DISCRIMINATION 31 237
EMOTION 39 276
HANDICAP 39 315
TOURISME_DES_JEUNES 120 435
PERCEPTION 443 7 9 878 878
FREQUENTATION 321 321
FAMILLE 39 360
FEMME 49 7 10 409 409
ART 507 507
EXPERIENCE 207 714
INTERET 55 769
LOISIR 299 1068
STYLE_DE_VIE 26 7 11 1094 1094
CERTIFICATION 35 35
COMMUNICATION 113 148
CRISE 58 206
DROIT 199 405
TAILLE 110 515
ENTREPRISE_TOURISTIQUE 399 8 0 914 914
COMMERCIALISATION 208 208
MARKETING 393 601
MER 252 8 1 853 853
PUBLICITE 55 55
RESEAU 83 8 2 138 138
INVENTAIRE 24 24
PRODUIT_TOURISTIQUE 239 8 3 263 263
CONGRES 82 82
RECHERCHE 203 8 4 285 285
VOL 77 8 7 77 77
ACCESSIBILITE 138 138
CREATION 134 272
LOCALISATION 85 8 8 357 357
MARCHE_D'INTERET_SPECIAL 44 8 11 44 44
GESTION_DES_RESSOURCES_HUMAINES 218 9 0 218 218
PROMOTION 154 9 3 154 154
CYCLE_DE_VIE 47 9 5 47 47
PARC_D'ATTRACTIONS 107 9 6 107 107
ANIMATION 27 27
FORET 44 9 7 71 71
ESPACE 43 9 10 43 43
SOCIOLOGIE 26 9 11 26 26
GESTION_FINANCIERE 89 89
RESSOURCE 284 373
SOURCE 287 660

[WP 2] D 2.2
V1.3 Seite 52

ACCUEIL 55 10 0 715 715
IMPACT_ECOLOGIQUE 95 10 4 95 95
RENCONTRE 105 105
IMAGE 289 10 10 394 394
INTEGRATION 38 11 2 38 38
PARTENARIAT 50 11 3 50 50
COUT 369 369
COUT_BENEFICE 338 707
EXPOSITION 50 11 5 757 757
TRANSPORT_FERROVIAIRE 41 11 7 41 41
ATTRACTION 199 11 8 199 199
JEUX_OLYMPIQUES 77 11 9 77 77
INTER-CULTUREL 108 108
NATIONALITE 27 11 11 135 135
GESTION 1449 1449
PROFESSIONNALISME 26 12 0 1475 1475
CARRYING_CAPACITY 49 49
GLOBALISATION 51 12 2 100 100
PARC 336 12 5 336 336
DEVELOPPEMENT 658 658
DEVELOPPEMENT_REGIONAL 72 730
STATION_BALNEAIRE 27 757
TOURISME_BALNEAIRE 36 793
RESIDENCE_SECONDAIRE 24 12 6 817 817
COMPLEXE_TOURISTIQUE 27 12 7 27 27
GUIDE 41 41
IMPACT_SOCIAL 69 12 9 110 110
ETUDE_DE_CAS 31 31
PHILOSOPHIE 34 65
SECTEUR_PRIVE 38 13 0 103 103
PROPRIETE 35 35
PROTECTION_DE_LA_FAUNE 84 13 2 119 119
FAUNE 170 13 3 170 170
AIR 494 494
DIVERSIFICATION 114 608
TOURISME_INSULAIRE 156 13 6 764 764
IMPACT_CULTUREL 45 45
MYTHE 28 13 11 73 73
ECOLOGIE 34 34
ETHIQUE 103 14 0 137 137
COOPERATION 94 94
ENVIRONNEMENT 100 194
MONTAGNE 98 292
PROTECTION_DE_LA_NATURE 87 379
SECTEUR_PUBLIC 80 14 1 459 459
CONSCIENCE_TOURISTIQUE 51 14 3 51 51
ECOTOURISME 217 14 4 217 217
PLANIFICATION 114 14 5 114 114
REVITALISATION 176 14 6 176 176
COMMUNAUTE 274 274
COMMUNAUTE_RECEPTRICE 256 14 7 530 530
CONFLIT 86 15 0 86 86
ECOSYSTEME 29 29

[WP 2] D 2.2
V1.3 Seite 53

INTERESSEMENT 109 15 2 138 138
FLORE 29 29
RESERVE 41 70
WILDERNESS 72 15 3 142 142
LITTORAL 70 70
ECONOMIE 25 95
CONSERVATION_DU_PATRIMOINE 295 15 4 390 390
MUNICIPALITE 34 34
POLITIQUE 461 15 5 495 495
IDEOLOGIE 109 109
RECONVERSION 124 15 7 233 233
MANIFESTATION_CULTURELLE 52 52
CIRCUIT 24 76
AMENAGEMENT 141 15 8 217 217
ALIMENTATION 57 57
ITINERAIRE 42 15 9 99 99
CULTURE 760 760
HISTOIRE 442 1202
ETAT 134 15 10 1336 1336
ARCHITECTURE 67 67
ASTRONOMIE 57 124
AUTHENTICITE 79 203
FESTIVAL 63 266
GASTRONOMIE 56 322
ARTISANAT 27 349
MISE_EN_VALEUR_DU_PATRIMOINE 616 965
MONUMENT_HISTORIQUE 55 1020
SITE_HISTORIQUE 72 1092
IDENTITE 152 1244
INTERPRETATION 119 1363
PAYSAGE 63 1426
LITTERATURE 52 1478
PRET 141 1619
MEMOIRE 41 1660
MUSEE 63 1723
PELERINAGE 26 1749
RELIGION 47 1796
TOURISME_URBAIN 269 2065
VALEUR 784 2849
AMENAGEMENT_URBAIN 69 15 11 2918 2918
Anhang 3: Datentabelle der 20×20-Map für die Dokumente der CABI Abstracts
keyword frequency x-Position y-Position
carrying_capacity 70 0 0
coastal_areas 101 0 0
conservation 111 0 0
conservation_areas 80 0 0
cost_benefit_analysis 60 0 0
ecotourism 572 0 0
environmental_degradation 47 0 0

[WP 2] D 2.2
V1.3 Seite 54
environmental_impact 395 0 0
environmental_management 139 0 0
environmental_policy 65 0 0
environmental_protection 252 0 0
fisheries 85 0 0
fishery_management 45 0 0
indicators 42 0 0
natural_resources 75 0 0
nature_tourism 230 0 0
reserved_areas 72 0 0
simulation_models 40 0 0
sustainability 602 0 0
visitor_impact 53 0 0
water_management 64 0 0
water_resources 50 0 0
water_supply 40 0 0
agricultural_sector 30 0 1
community_development 60 0 1
development_projects 30 0 1
public_opinion 48 0 1
communities 64 0 2
international_trade 36 0 2
regulations 96 0 2
rural_communities 55 0 2
cooperation 72 0 3
economic_evaluation 51 0 3
funding 80 0 3
incentives 40 0 3
infrastructure 56 0 3
islands 107 0 3
local_government 30 0 3
regional_development 114 0 3
social_impact 206 0 3
traditional_society 59 0 3
transition_economies 32 0 3
development_policy 34 0 4
diversification 44 0 4
economic_development 207 0 4
economic_growth 39 0 4
economic_impact 496 0 4
farm_tourism 74 0 4
government 58 0 4
government_policy 46 0 4
heritage_areas 120 0 4
international_cooperation 36 0 4
private_sector 46 0 4
public_sector 41 0 4
rural_development 179 0 4
rural_economy 40 0 4
tourism_development 1166 0 4
tourism_impact 629 0 4
European_Union 56 0 5
cultural_values 121 0 5
income 117 0 5
modernization 35 0 5
partnerships 54 0 5
taxes 38 0 5
tourism_policy 380 0 5
alternative_tourism 63 0 6
cultural_change 31 0 6
health_tourism 40 0 6

[WP 2] D 2.2
V1.3 Seite 55
host_guest_relations 105 0 6
public_services 30 0 6
resorts 84 0 6
structural_change 60 0 6
tourism_organizations 62 0 6
tourism_situation 52 0 6
entrepreneurship 43 0 7
festivals 70 0 7
migration 41 0 7
social_geography 54 0 7
sociology_of_tourism 192 0 7
sport_tourism 90 0 7
visitor_interpretation 75 0 7
crises 37 0 8
domestic_tourism 88 0 8
economic_situation 48 0 8
expenditure 34 0 8
spatial_distribution 31 0 8
tourism 2334 0 8
tourism_research 110 0 8
tourist_attractions 406 0 8
urban_tourism 93 0 8
airports 37 0 9
cruises 70 0 9
demography 58 0 9
destinations 826 0 9
econometric_models 30 0 9
imagery 86 0 9
inbound_travel 76 0 9
international_tourism 267 0 9
mathematical_models 116 0 9
outbound_travel 89 0 9
seasonal_variation 32 0 9
seasonality 62 0 9
skiing 75 0 9
statistics 37 0 9
terrorism 67 0 9
theme_parks 35 0 9
theory 65 0 9
tour_operators 118 0 9
tourist_expenditure 192 0 9
tourist_industry 1219 0 9
tourists 761 0 9
tours 47 0 9
transport 82 0 9
world 64 0 9
business_tourism 58 0 10
consumption 76 0 10
forecasts 95 0 10
prices 65 0 10
statistical_analysis 34 0 10
supply 43 0 10
travel_agents 116 0 10
winter_resorts 41 0 10
businesses 35 0 11
capital 32 0 11
classification 66 0 11
markets 264 0 11
shopping 32 0 11
forecasting 48 0 12
information 48 0 12

[WP 2] D 2.2
V1.3 Seite 56
services 70 0 12
small_businesses 116 0 12
consumer_information 45 0 13
data_collection 47 0 13
holiday_accommodation 78 0 13
information_services 123 0 13
investment 81 0 13
market_research 50 0 13
marketing 537 0 13
marketing_channels 110 0 13
marketing_techniques 195 0 13
occupancy_rates 50 0 13
profitability 43 0 13
profits 30 0 13
purchasing_habits 64 0 13
quality 48 0 13
techniques 35 0 13
telecommunications 48 0 13
catering 34 0 14
companies 34 0 14
comparisons 76 0 14
databases 33 0 14
finance 99 0 14
hospitality_industry 828 0 14
hotels 546 0 14
human_resources 81 0 14
information_systems 77 0 14
information_technology 234 0 14
innovation_adoption 41 0 14
innovations 34 0 14
internet 329 0 14
labour 34 0 14
leisure_industry 86 0 14
managers 80 0 14
museums 45 0 14
networking 42 0 14
on_line 208 0 14
ownership 39 0 14
personnel_management 96 0 14
property 38 0 14
reservations 58 0 14
returns 49 0 14
technical_progress 34 0 14
technology 31 0 14
gambling 89 0 15
labour_market 31 0 15
labour_relations 32 0 15
management 410 0 15
casinos 64 0 16
communication 88 0 17
international_comparisons 87 0 18
opinions 87 0 18
legislation 91 0 19
membership 40 0 19
perception 108 0 19
roles 38 0 19
social_change 67 0 19
standards 43 0 19
climatic_change 45 1 0
environmental_education 39 1 0
monitoring 79 1 0

[WP 2] D 2.2
V1.3 Seite 57
national_parks 317 1 0
nature_reserves 95 1 0
resource_conservation 72 1 0
resource_management 185 1 0
resource_utilization 51 1 0
trails 65 1 0
wildlife 60 1 0
wildlife_management 65 1 0
projects 43 1 1
urban_development 37 1 2
backpacking 39 1 5
rural_tourism 248 1 5
second_homes 47 1 5
historic_sites 68 1 6
demand 235 1 10
holidays 174 1 10
market_segmentation 197 1 12
consumer_surveys 93 1 13
market_competition 134 1 13
catering_industry 119 1 14
consumers 40 1 14
camp_sites 33 1 15
personnel 93 1 15
wages 43 1 15
work_satisfaction 41 1 15
working_conditions 33 1 15
organizations 48 1 17
economic_analysis 69 2 0
ecosystems 46 2 0
rivers 62 2 0
water_use 35 2 0
community_involvement 232 2 2
planning 316 2 2
agricultural_development 30 2 4
socioeconomics 166 2 5
heritage_tourism 140 2 7
traditions 43 2 7
tourism_theory 122 2 8
employment 205 2 10
estimates 30 2 10
visitor_behaviour 302 2 10
surveys 873 2 11
consumer_preferences 145 2 12
consumer_satisfaction 232 2 14
restaurants 123 2 14
political_power 50 2 19
economics 30 3 0
entry_fees 32 3 0
environmental_assessment 42 3 0
lakes 65 3 0
landscape_conservation 32 3 0
mountain_areas 129 3 0
nature_conservation 297 3 0
water_quality 114 3 0
wetlands 38 3 0
wildlife_conservation 97 3 0
agricultural_land 34 3 1
villages 31 3 6
cultural_tourism 213 3 7
models 356 3 12
consumer_behaviour 279 3 14

[WP 2] D 2.2
V1.3 Seite 58
decision_making 257 3 15
health_resorts 38 3 15
law 75 3 18
disparity 30 3 19
globalization 204 3 19
regression_analysis 32 3 19
relationships 33 3 19
costs 112 4 0
land_management 73 4 0
recreation_management 77 4 0
recreational_facilities 119 4 0
valuation 54 4 0
watersheds 39 4 0
historic_buildings 43 4 7
visitors 519 4 9
cross_cultural_studies 41 4 19
cultural_differentiation 35 4 19
measurement 74 4 19
religion 44 4 19
contingent_valuation 102 5 0
forestry 57 5 0
geographical_information_systems 49 5 0
grasslands 45 5 0
habitats 78 5 0
hiking 46 5 0
human_activity 57 5 0
land_use 185 5 0
landscape 178 5 0
non-market_benefits 52 5 0
open_spaces 64 5 0
species_diversity 40 5 0
species_richness 34 5 0
trees 53 5 0
urbanization 42 5 0
wild_animals 33 5 0
cultural_heritage 268 5 7
willingness_to_pay 104 5 8
trends 387 5 9
boating 38 5 10
methodology 284 5 13
culture 321 5 19
higher_education 88 5 19
politics 206 5 19
afforestation 32 6 0
amenity_forests 61 6 0
amenity_value_of_forests 47 6 0
forest_management 167 6 0
forest_policy 45 6 0
forest_recreation 222 6 0
forest_resources 31 6 0
forests 484 6 0
hunting 110 6 0
soil_types 35 6 0
urban_forestry 34 6 0
urban_parks 67 6 0
wilderness 55 6 0
design 62 6 1
outdoor_recreation 300 6 1
golf_courses 53 6 5
education_programmes 78 6 19
social_behaviour 32 6 19

[WP 2] D 2.2
V1.3 Seite 59
ornamental_plants 30 7 1
conflict 126 7 7
evaluation 126 7 12
knowledge 95 7 18
teaching_methods 87 7 19
polluted_water 44 8 0
education 162 8 8
constraints 349 8 11
horse_riding 33 8 11
retirement 30 8 18
ethics 133 8 19
lawns_and_turf 56 9 2
urban_areas 184 9 7
rural_recreation 43 9 9
cinema 33 9 12
learning 152 9 19
geographical_distribution 30 10 0
biodiversity 167 10 5
aesthetic_value 40 10 6
safety 138 10 6
case_studies 959 10 8
rural_areas 210 10 9
history 308 10 16
leisure_centres 34 10 18
entertainment 38 10 19
fitness_industry 45 10 19
health_clubs 42 10 19
motivation 417 10 19
water_pollution 96 11 0
parks 136 11 9
visits 498 11 9
recreation 256 11 17
curriculum 165 11 18
enjoyment 69 11 19
leisure 405 11 19
leisure_activities 257 11 19
leisure_behaviour 133 11 19
leisure_education 38 11 19
leisure_policy 33 11 19
leisure_research 37 11 19
leisure_services 96 11 19
leisure_theory 41 11 19
sociology_of_leisure 152 11 19
volunteers 92 11 19
animal_behaviour 34 12 3
access 43 12 9
consumer_attitudes 225 12 11
ethnic_groups 122 12 16
teaching 141 12 16
arts 45 12 19
families 48 12 19
handicapped_persons 114 12 19
participation 337 12 19
social_interaction 41 12 19
social_participation 104 12 19
sponsorship 41 12 19
therapeutic_recreation 59 12 19
universities 52 12 19
voluntary_services 37 12 19
water_recreation 174 13 5
amenity_and_recreation_areas 149 13 9

[WP 2] D 2.2
V1.3 Seite 60
accommodation 193 13 10
air_transport 137 13 10
angling 136 13 10
youth 180 13 10
audiences 155 13 11
training 184 13 11
recreational_activities 181 13 17
attitudes_to_work 35 13 19
career_development 31 13 19
clubs 89 13 19
ethnicity 109 13 19
leadership 35 13 19
minorities 37 13 19
nationalism 47 13 19
students 207 13 19
camping 43 14 0
travel 830 14 0
accidents 56 14 2
adolescents 169 14 10
women 434 14 10
beliefs 39 14 19
cricket 34 14 19
gender_relations 231 14 19
homosexuality 41 14 19
interpersonal_relations 80 14 19
mass_media 116 14 19
moral_values 35 14 19
race_relations 101 14 19
research 117 14 19
skills 65 14 19
soccer 309 14 19
sociology_of_sport 489 14 19
sport_policy 56 14 19
sports_facilities 61 14 19
teacher_training 41 14 19
teachers 62 14 19
television 85 14 19
winter_sports 39 14 19
woman\'s_status 70 14 19
attitudes 776 15 15
Olympic_games 82 15 19
baseball 69 15 19
football 33 15 19
games 49 15 19
golf 59 15 19
philosophy 54 15 19
physical_education 416 15 19
play 40 15 19
rugby 49 15 19
schools 62 15 19
secondary_education 30 15 19
sexual_behaviour 46 15 19
socialization 32 15 19
sport 1347 15 19
sport_theory 102 15 19
sports_grounds 49 15 19
sports_organizations 91 15 19
teams 44 15 19
beaches 48 16 0
international_travel 167 16 0
reviews 618 16 4

[WP 2] D 2.2
V1.3 Seite 61
behaviour 155 16 17
competitive_sports 163 16 18
advertising 46 16 19
basketball 73 16 19
climbing 39 16 19
coaching 64 16 19
psychology 269 16 19
elderly 181 17 12
aging 32 17 13
assessment 100 17 16
doping 30 17 19
drug_abuse 35 17 19
motor_skills 33 17 19
self_perception 127 17 19
sport_performance 377 17 19
travellers 616 18 0
risk 228 18 2
quality_of_life 91 18 12
health 136 18 13
questionnaires 63 18 16
athletics 67 18 19
mental_ability 50 18 19
self_esteem 65 18 19
HIV_infections 41 19 0
adverse_effects 38 19 0
aetiology 41 19 0
antibacterial_agents 52 19 0
antimalarials 80 19 0
bacterial_diseases 112 19 0
cardiovascular_diseases 38 19 0
case_reports 130 19 0
chemoprophylaxis 98 19 0
chloroquine 30 19 0
clinical_aspects 153 19 0
dengue 42 19 0
diagnosis 106 19 0
diarrhoea 84 19 0
disease_control 43 19 0
disease_prevalence 50 19 0
disease_prevention 161 19 0
disease_transmission 81 19 0
disease_vectors 38 19 0
drinking_water 31 19 0
drug_resistance 39 19 0
drug_therapy 146 19 0
epidemiology 335 19 0
exposure 46 19 0
fever 34 19 0
food_contamination 34 19 0
guidelines 93 19 0
health_education 35 19 0
hepatitis_A 41 19 0
human_diseases 957 19 0
immigrants 35 19 0
immunization 96 19 0
imported_infections 177 19 0
infectious_diseases 46 19 0
malaria 151 19 0
mortality 76 19 0
neoplasms 41 19 0
occupational_hazards 30 19 0

[WP 2] D 2.2
V1.3 Seite 62
outbreaks 73 19 0
pilgrimages 38 19 0
proguanil 30 19 0
protozoal_infections 53 19 0
public_health 91 19 0
respiratory_diseases 62 19 0
risk_assessment 85 19 0
risk_factors 163 19 0
schistosomiasis 31 19 0
swimming_pools 34 19 0
travel_medicine 115 19 0
vaccination 97 19 0
vaccines 43 19 0
viral_diseases 112 19 0
occupational_health 31 19 1
risk_behaviour 32 19 1
swimming 66 19 1
adults 87 19 3
aggressive_behaviour 44 19 3
food_consumption 33 19 3
wines 32 19 3
playgrounds 34 19 4
trauma 158 19 5
lifestyle 147 19 14
socioeconomic_status 42 19 16
alcohol_intake 37 19 17
obesity 71 19 17
overweight 31 19 17
school_children 33 19 17
tobacco_smoking 50 19 17
age 66 19 18
body_mass_index 68 19 18
boys 38 19 18
children 511 19 18
diet 37 19 18
food_intake 59 19 18
growth 31 19 18
health_promotion 85 19 18
human_behaviour 73 19 18
men 158 19 18
physical_activity 531 19 18
physical_fitness 131 19 18
anxiety 75 19 19
appetite_disorders 35 19 19
athletes 636 19 19
bicycling 73 19 19
body_composition 38 19 19
body_fat 32 19 19
body_image 48 19 19
body_weight 52 19 19
carbohydrates 52 19 19
creatine 34 19 19
diets 49 19 19
energy_intake 41 19 19
exercise 425 19 19
food_supplements 64 19 19
girls 78 19 19
gymnastics 31 19 19
mental_health 54 19 19
mental_stress 95 19 19
muscles 47 19 19

[WP 2] D 2.2
V1.3 Seite 63
nutrition 78 19 19
physiology 30 19 19
racehorses 52 19 19
running 65 19 19
sex_differences 68 19 19

WP2D2 2

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

WP2D2 2

Hochgeladen von

Copyright:

Verfügbare Formate

WP 2

Verfahren zur Strukturierung der

Projekt: Landkarte der tourismus- und freizeitwirtschaftlichen

Version Änderungen Type Datum

+++ ÖGAF–Wissenslandkarte +++

+++ ÖGAF–Wissenslandkarte +++

+++ ÖGAF–Wissenslandkarte +++

1 Auswahl und Erläuterung der ausgewählten Strukturierungslösung

Dieser Teilbericht des Workpackage 2 informiert über den vorgeschlagenen Lösungsweg. Er

1.1 Auswahlkriterien und Bestimmung der Methoden und

1.1.1 Dokumentenbeschlagwortung als Datenbasis

+++ ÖGAF–Wissenslandkarte +++

• die in der österreichischen Sammlung grauer Literatur erfassten Dokumente der

Die SOMs bieten gleichzeitig eine ‚natürliche’ graphische Visualisierungsmöglichkeit (siehe

3.1.2 Wie nutzt man die Schlagwortkataloge und Beschlagwortungslisten?

+++ ÖGAF–Wissenslandkarte +++

+++ ÖGAF–Wissenslandkarte +++

von n Schlagworten die Bedingung ∑s

Verfahren überaus robust gegen den Einfluss von Ausreisserwerten.

1.2 Lösung für den Anwendungsfall „Berater“

Interessant ist natürlich, in welchen typischen Kombinationen diese Kompetenzen auftreten.

+++ ÖGAF–Wissenslandkarte +++

Abbildung 1: Semantic Map aus den Hauptkompetenzen

+++ ÖGAF–Wissenslandkarte +++

Abbildung 2: Typische Verknüpfungen von Kompetenzen unter den Beratern

+++ ÖGAF–Wissenslandkarte +++

Abbildung 3: Neun Beratertypen nach Kompetenzprofil

+++ ÖGAF–Wissenslandkarte +++

Abbildung 4: Strukturierung des Beratermarktes (Sammonprojektion der

1.3 Lösungen für den Anwendungsfall „Studien Austria“

+++ ÖGAF–Wissenslandkarte +++

6x6 MAP Studien.at

Trend Landwirtschaft Jugend Gesundheit Marktanalyse Angebot, Zielgruppe

Umwelt Freizeit Information Marketing Euro, Wirtschaft Marke, Entwicklung

Steiermark Urlaub Reise Tourismus Sommerourismus Tourismusmarkt, -politik

Kultur Alpen Winter Deutschland Hotel Internet

Region Europe Gästebefragung Wien Kur Hotellerie

Markt Gesundheitstourismus Gast international Nachfrageanalyse, Stadt Analyse, Reiseverhalten

Abbildung 5: 6×6-Map aus 3000 Dokumenten der Studien.at

+++ ÖGAF–Wissenslandkarte +++

Reise Statistik Internet Tourismus

Städtetourismus Destination Hotellerie, Gast Umweltschutz

Information Ausb., Gastronomie Umwelt

Kunde Marke(ting) Arbeit Verkehr Natur

Deutschland Trend Wirtschaft Entwicklung Land, Region

Urlaub Jugend Zielgruppe Kultur Zufriedenheit Tirol

Image Wien Werbung Angebot

aktiv Freizeit Sport Österreich Kärnten, Salzb.

Abbildung 6: 10×10-Map für die Studien.at

+++ ÖGAF–Wissenslandkarte +++

Abbildung 7: Kumulierte Prozenthäufigkeit der Schlagworte der Studien.at

+++ ÖGAF–Wissenslandkarte +++

*** reduced varlist:

+++ ÖGAF–Wissenslandkarte +++

nr of keywords (rows) in sim matrix: 336

+++ ÖGAF–Wissenslandkarte +++

Abbildung 8: Schlagwortdichte in der 16×16-Map für die Studien.at

1.4 Lösungen für den Anwendungsfall „Centre International de

+++ ÖGAF–Wissenslandkarte +++

sich daraus automatisch extrahieren (Routine extractkeyw in der nachfolgenden

TOURISME COMPORTEMENT VALEUR

Abbildung 9: 15×12-Map aus 6000 Dokumenten des CIRET

+++ ÖGAF–Wissenslandkarte +++