Beruflich Dokumente
Kultur Dokumente
Version: 1.5
Datum: 20.1.2005
Dokument ID: D 2.2
Workpackage: WP2
WP Verantwortung: J. Mazanec
Status : Draft
Autor/inn/en: Josef Mazanec
Index
1 Auswahl und Erläuterung der ausgewählten Strukturierungslösung ................................... 5
1.1 Auswahlkriterien und Bestimmung der Methoden und Datengrundlagen................... 5
1.1.1 Dokumentenbeschlagwortung als Datenbasis........................................................... 5
3.1.2 Wie nutzt man die Schlagwortkataloge und Beschlagwortungslisten?..................... 6
1.2 Lösung für den Anwendungsfall „Berater“.................................................................. 8
1.3 Lösungen für den Anwendungsfall „Studien Austria“............................................... 12
1.4 Lösungen für den Anwendungsfall „Centre International de Recherches et d’Etudes
Touristiques“ (CIRET)........................................................................................................... 18
1.5 Lösung für den Anwendungsfall „Leisure, Recreation and Tourism Abstracts“ ...... 24
1.6 Vergleichbarkeit der empfohlenen Lösungen ............................................................ 29
2 Technische Beschreibung und kommentierte Programmlistings ....................................... 31
2.1 Datengewinnung, Schlagwortaufbereitung und Vorverarbeitung.............................. 31
2.2 Erzeugung der Ähnlichkeitsmatrix der Schlagworte ................................................. 36
2.3 Generierung der Maps................................................................................................ 41
3 Anhang ............................................................................................................................... 45
Abbildungsverzeichnis
Abbildung 1: Semantic Map aus den Hauptkompetenzen ......................................................... 9
Abbildung 2: Typische Verknüpfungen von Kompetenzen unter den Beratern...................... 10
Abbildung 3: Neun Beratertypen nach Kompetenzprofil ........................................................ 11
Abbildung 4: Strukturierung des Beratermarktes (Sammonprojektion der ............................. 12
Abbildung 5: 6×6-Map aus 3000 Dokumenten der Studien.at ................................................ 13
Abbildung 6: 10×10-Map für die Studien.at ............................................................................ 14
Abbildung 7: Kumulierte Prozenthäufigkeit der Schlagworte der Studien.at.......................... 15
Abbildung 8: Schlagwortdichte in der 16×16-Map für die Studien.at..................................... 18
Abbildung 9: 15×12-Map aus 6000 Dokumenten des CIRET................................................. 19
Abbildung 10: Kumulative Prozenthäufigkeiten aus 6000 Dokumenten des CIRET.............. 20
Abbildung 11: Schlagwortdichte in der 18×18-Map für die CIRET-Daten ............................ 24
Abbildung 12: Kumulative Prozenthäufigkeiten aus 12000 Dokumenten der Abstracts ........ 25
Abbildung 13: Schlagwortdichte in der 20×20-Map für die CABI-Abstracts-Daten .............. 30
Eine vorgelagerte Entscheidung war über Art und Umfang der Datenbasis zu treffen. Wie und
woran lässt sich mit hinreichender Aussagekraft erkennen, welche Themen in der tourismus-
und freizeitwirtschaftlichen Forschung, Ausbildung und Beratung populär und intensiv
bearbeitet oder vernachlässigt sind? Die Antwort steckt zweifellos in der internationalen
Fachliteratur und der ‚Grauen Literatur’ über kommerzielle Untersuchungen und Studien zur
Politikberatung. In jedem Fall gilt es also, derartige Dokumente oder Informationen über diese
Dokumente zu verarbeiten. Strukturierungsvarianten wie Bäume, Thesauri, Ontologien oder
Stichwortkataloge gliedern zwar das thematische Feld hierarchisch und/oder definitorisch; sie
zeigen aber nicht gleichzeitig die praktische Relevanz einzelner Über-, Unter- oder Such-
begriffe. Aus der Hierarchiestufe geht nur die semantische Abdeckungsbreite aber nicht die
tatsächliche Verwendung in Forschung und Consulting hervor.
Der gestellten Aufgabe am nächsten kommen die von Teuvo Kohonen und seinem Team an
der Technischen Universität Helsinki [ Pisa lässt grüßen ;-) ] entwickelten Self-Organizing
Maps (SOMs), die sich insbesondere für die Analyse von sehr großen Dokumenten-
sammlungen bewährt haben. Allerdings ist der Zugriff auf die Dokumente selbst mit den der
ÖGAF zur Verfügung stehenden Ressourcen nicht realisierbar. Zum Glück ist dies nicht
erforderlich. Wir entscheiden uns nämlich für die Beschlagwortung der Dokumente (Zeit-
schriftenaufsätze, Berichte, Studien) als Datenbasis. Monographien sind hier als Beschlag-
wortungsobjekte weniger ergiebig, da sie den Stand der Forschung mit Verzögerung wider-
spiegeln und so gut wie jedes bedeutende Buch seine innovativen Inhalte zunächst in der
Zeitschriftenliteratur untergebracht hat. Während SOM-Anwendungen auf Dokumente sehr
zahlreich sind, finden sich kaum Lösungen für Schlagwortrepertoires 1. Wir wählen also diese
Variante und demonstrieren sie an drei einander perfekt ergänzenden Datenbasen:
Eine SOM ordnet beliebige Objekte, die durch irgendwelche Merkmale beschrieben sind, den
Knoten auf einem meist zwei-dimensionalen Gitter zu. Dabei sollen die topologischen
Eigenschaften der Objekte möglichst erhalten bleiben. Dies bedeutet, dass Objekte, die
ähnliche Eigenschaften aufweisen, auch auf denselben oder auf unmittelbar benachbarten
Gitterpunkten liegen sollen. Unsere Gitterpunkte sind verkörpern Gruppen von Schlagworten,
die einander ähnlich sind. Die konkrete Festlegung dieser Ähnlichkeit ist der springende
Punkt. Größere ‚Ähnlichkeit’ bedeutet in der Landkarte das häufigere gemeinsame Auftreten
innerhalb der Beschlagwortung von Dokumenten. Natürlich besitzt jedes einzelne Schlagwort
eine Auftretenshäufigkeit innerhalb der Schlagwortlisten aller Dokumente. Aus beiden Teil-
informationen ergibt sich die Bedeutung der einzelnen, durch die Schlagworte charak-
terisierten Themen und deren symptomatische Zusammengehörigkeit.
Wenn keine aktuelle und vollständige Schlagwortliste verfügbar oder abrufbar ist, dann
erstellen wir diese Liste aus den tatsächlichen Schlagworten der analysierten Dokumente.
Jedes Schlagwort darf in dieser Master-List nur einmal vorkommen. Sowohl die Liste als auch
die Beschlagwortung der maschinell extrahierten Dokumente sollte auf Inkonsistenzen und
1
eine Ausnahme der Anwendung auf Computer Science und Mathematik siehe unter
http://www.cest.ch/Publikationen/2000/am/math_leiden/cwts/swr-
math/home.html
2
Mazanec, J. A. (1995): Positioning Analysis with Self-Organizing Maps: An Exploratory Study on Luxury
Hotels, Cornell Hotel and Restaurant Administration Quarterly, Vol. 36, 6/1995, pp. 80-95.
Tippfehler überprüft werden. Blanks ersetzen wir durch das Underline-Symbol (‚_’), damit
Schlagworte aus zwei oder mehr Einzelworten verlässlich als zusammengehörend interpretiert
werden.
Die Objekte der Landkarte sind also die Schlagworte (Zeilen der Rohdatenmatrix). Ihre
wechselseitige Ähnlichkeit folgt aus der Häufigkeit des gemeinsamen Auftretens in den
Beschlagwortungen der Aufsätze, Berichte und Studien. Um Bagatell-Schlagworte aus-
zuschalten, wurden nur solche mit einer Mindest-Auftretenshäufigkeit berücksichtigt. Diese
Mindesthäufgikeit ergibt sich entweder aus einem Vergleich mit der Länge der Schlagwort-
Gesamtliste (z.B. mindestens 1% der Anzahl der Schlagworte in der Masterlist) oder auf
Grund eine gewünschten kumulativen Abdeckungsquote aller Beschlagwortungen (z.B. 75, 90
oder 95%). Für die Ermittlung der Ähnlichkeiten genügt eine wesentlich kleinere Anzahl an
Schlüssel-Schlagworten; sie entsprechen den Variablen (Spalten der Rohdatenmatrix). Wir
konzentrieren uns auf das obere Quartil der (25% am häufigsten auftretenden) Schlagworte. In
der Diagonale der Ähnlichkeitsmatrix stehen die absoluten Auftretenshäufigkeiten jedes
Schlagwortes; in der oberen (und symmetrisch in der unteren) Dreiecksmatrix stehen die
Häufigkeiten des gemeinsamen Auftretens. In dem Miniaturbeispiel
Schlagwort # 1 2 3 4 …
1 232 24 9 66
2 24 34 5 7
3 9 5 42 2
4 66 7 2 512
… …
kommen die Schlagworte 1,2,3 und 4 jeweils 232 mal, 34 mal, 42 mal bzw. 512 mal vor. #1
tritt 24 mal gemeinsam mit #2, 9 mal mit #3 und 66 mal mit #4 auf. Die ‚Popularität’ eines
Themas (erkennbar an der Häufigkeit eines Schlagworts; = kursiv gesetzte Diagonalwerte)
wollen wir separat anzeigen und später durch die Größe der Kreise in einem Bubble-Chart
darstellen. Daher soll die ‚Größe’ eines Schlagworts als Ursache des Zusammentreffens mit
anderen Schlagworten die Ähnlichkeitsinformation nicht verzerren. Für Schlagwort #4 ist z.B.
das häufige Zusammentreffen mit #1 (66 mal) nicht überraschend; es kommt nämlich selbst
sehr häufig vor (512 mal). #1 hingegen kommt nur 232 mal vor und daher hat das häufige
gemeinsame Auftreten mit #4 hier einen höheren Informationswert. Den unerwünschten
Größeneffekt schaltet man durch Division mit dem jeweiligen Diagonalwert aus:
Schlagwort # 1 2 3 4 …
1 1 0,10 0,04 0,28
2 0,71 1 0,15 0,21
3 0,21 0,12 1 0,05
4 0,13 0,01 0,00 1
… …
Diese Werte signalisieren die Ähnlichkeiten unverfälscht und sind eine bessere Grundlage für
die Ermittlung der Positionen der Schlagworte in der Self-Organizing Map. Sie soll ja
‚lernen’, ähnliche Schlagworte auf identische und nah benachbarte Gitterpunkte zuzuordnen.
Einen letzten Aufbereitungsschritt verlangt das Kohonen-Verfahren noch. Die Datenvektoren
in den Zeilen müssen auf die Länge 1 normiert werden, so dass für die Häufigkeiten sij jedes
Unternehmensgründung,_-verkauf_und_-übernahme 20
Unternehmensanalyse_und_Benchmarking 33
Strategische_Unternehmensplanung 42
Organisationsberatung 34
Personalberatung 17
Marketingberatung 40
Marktforschung 19
Qualitätsmanagementberatung 28
Informationsmanagementberatung 22
Controlling_und_Finanzberatung 19
Projektmanagement_und_Projektbegleitende_Beratung 36
Umweltberatung 6
Für die geringe Anzahl der 12 Hauptkomptenzen ist der starke Dateverdichtungseffekt der
SOM nicht unbedingt erforderlich und wir zeigen daher eine alternative Strukturierungs-
möglichkeit, die sich für die Beraterauswahl im Rahmen der ÖGAF-Landkarte bestens eignet.
3
Graphisch kann man sich das so vorstellen: Jedes Schlagwort ist ein Pfeil von gleicher Länge. Jeder Pfeil zeigt
in eine bestimmte Richtung des vieldimensionalen Schlagwortraumes und über die Ähnlichkeit von zwei Schlag-
worten bestimmt lediglich der Winkel, den die beiden Pfeile zueinander einschließen.
4
Wir verwenden hier unsere eigene SOMnia-Software (siehe http://tourism.wu-wien.ac.at/cgi-
bin/ift.pl?charly/http/software/somnia.html).
Organisationsberatung
Personalberatung
Projektmanagement_und_Projektbegleitende_Beratung
Marktforschung Unternehmensanalyse_und_Benchmarking
Strategische_Unternehmensplanung
Qualitätsmanagementberatung
Marketingberatung
Unternehmensgründung,_-verkauf_und_-übernahme
Controlling_und_Finanzberatung
Informationsmanagementberatung
Umweltberatung
Die Nutzer der ÖGAF-Landkarte erwarten Hilfe in der Auswahl geeigneter Forschungs- und
Beratungsorganisationen. Zu diesem Zweck zeigen wir typische Anbieterprofile, in denen die
Hautpkompetenzen in symptomatisch verbundener Form auftauchen. Die Darstellungsobjekte
sind also die Anbieter. Aus dem Dendrogramm in Abbildung 2 ist zunächst erkennbar, welche
Hauptkompetenzen sich sehr früh, also bei geringer Unähnlichkeit, zusammenfinden (z.B.
Strategische Unternehmensplanung und Organisationsberatung) und welche eher selten
gemeinsam in einem Profil auftreten werden (z.B. Marktforschung und Personalberatung).
Letztlich lassen sich neun typische Anbieterprofile, vom Allrounder bis zum Qualitäts-
managementspezialisten nachweisen 5 (Abbildung 3).
5
Wir verwenden Partitionierungsroutinen, die im Rahmen unseres FWF-Spezialforschungsbereichs 010 über
Adaptive Systems 1997-2004 u.a. unter Nutzung der Scriptsprache R (siehe http://cran.r-
project.org/) entwickelt wurden.
Schließlich werden die Benutzer der ÖGAF-Landkarte auch sicher sehen wollen, wie häufig
derartige Anbieterprofile in der Praxis auftreten. Eine übersichtliche Struktur ergibt sich in
Form des Bubble-Chart in Abbildung 4, wo die Fläche der Kreise die Häufigkeit der
einzelnen Beratertypen signalisiert. Die Anordnung beruht auf einer sogenannten Sammon-
Projektion 6, die eine vereinfachte zweidimensionale Anordnung der ursprünglich in 12
Kompetenzdimensionen lebenden Mannigfaltigkeit der Rohdaten bewirkt; größere Nähe
bedeutet ein ähnlicheres Kompetenzprofil.
6
Sammon, J. W. jr. (1969). A Nonlinear Mapping for Data Structure Analysis, IEEE Transactions on
Computers, C-18, 401-409.
Benchm./
Control
5
Qual.mgt.
Gründungs-/ 3
Projektber.
11
Personalber.
10 Marketingber.
10
Marktf./
Marketing/
Strat. Planung
9
Allroundber.
46
Qual.mgt./
Personal/
Marketing
Organisation
6
11
Die verbesserte 10×10-Map in Abbildung 6 basiert auf einer bereinigten Masterliste (z.B.
ohne Mischschreibweise ‚ö’ und ‚oe’) von 175 Schlagworten > 1%; die Top 25% (=39 Stück)
dienen als Schlüsselbegriffe. Diese Map besitzt die fast dreifache Kapazität und liefert daher
ein differenzierteres Bild, das die österreichische Tourismusforschungs- und –beratungs-
landschaft genauer widergibt 7. Das Themenfeld ‚Reise’ mit den insgesamt häufigsten
Schlagworten besteht hier aus 10 homogenen Subthemen (z.B. Reiseanalyse, -markt,
-ausgaben, -veranstalter, -ziel). Die Abbildung 6 ist fast vollständig beschriftet. Es zeigt sich,
dass man 5 bis 6 intensiv bearbeitete Themengebiete ebenso klar erkennen kann, wie die
‚weissen Flecken’ in einigen dünn besiedelten ‚Regionen’ der Forschungs- und Beratungs-
landschaft. Die komplette Datentabelle mit allen Schlagworten > 1% befindet sich im Anhang
1. In diesem Workpackage WP2 zeigen wir die Arbeitsweise der Strukturierungsmethode. Die
vollständige Ausarbeitung einer fertigen Musterlösung inklusive der graphischen Bebilderung
ist Gegenstand des separaten Teilberichts über die Visualisierung in Workpackage 3. In der
automatisierten Visualisierungslösung werden zumindest zwei Betrachtungsebenen vorzu-
7
Wir verwenden hier das Contributed Package SOM zum Open-Source Software-System R
(http://cran.r-project.org/), dass die originären C-Routinen von Kohonen implementiert. Für die
relativ kleine Datenmenge ist die Batch-Version ausreichend. Die SOMs ließen sich auch online trainieren, d.h.
man könnte damit auch eine unbeschränkte Anzahl an Datenpunkten, die z.B. laufend durch Web-Abfragen von
Benutzern neu enstehen, verarbeiten.
sehen sein. Die erste entspricht der Abbildung 6 mit den Hauptthemen. Jede Bubble muss
sodann auf einer zweiten Betrachtungsebene in alle ihre Subthemen unter Angabe der
Auftretenshäufigkeit in den Dokumenten der Plattform ‚Studien Austria’ auflösbar sein. Diese
Information der zweiten Ebene ist hier vorerst nur in tabellarischer Form (siehe Anhang 1)
verfügbar. Jede Bubble hat eine Zeilen- und eine Spaltennummer (jeweils von 0 bis 9)
zugeordnet, so dass die zusammengehörigen Subschlagworte für jede der Positionen 0-0, 0-
1,…,0-9,1-0,1-1,…,1-9,…,9-9 ersichtlich sind. Nur eine einzige, vom Bedeutungsgehalt
unsinnige Fehlkombination tritt auf: Anhang 1 zeigt, dass die in Abbildung 6 unbeschriftete
Position 5-9 am nördlichen Rand der Map die syntaktisch verbundenen, aber semantisch nicht
sinnvollen Schlagworte ‚intern’ und ‚international’ verbindet. Die schwach besetzte Position
9-0 am schräg gegenüber liegenden, südöstlichen Ende der Map enthält z.B. nur den einen
Begriff ‚Gemeinde’, der 25 mal auftritt. Hier gibt es keine darunter liegende Ebene mehr.
Markt Kooperation
Europa
Dienstl., Unternehmen
In den bisherigen Lösungen wurde eine Suche nach Zeichenketten (string in string search)
zugelassen, die Schlagworte auch in Form von Wortteilen oder Silben ermöglicht. Da es z.B.
ein Schlagwort Reise gibt, wird das gleichzeitige Auftreten der Zeichenfolge ‚Reise’ mit
anderen Schlagworten auch dann registriert, wenn es sich in zusammengesetzten Hauptworten
wie z.B. Reiseveranstalter oder Schiffsreisen versteckt. Oft macht das Sinn, zuweilen aber
auch nicht (z.B. für ‚Preise’). Auf jeden Fall müsste man die Lösung manuell überprüfen und
dürfte die automatisiert erstellte Lösung nicht kurzerhand weiter verwenden. Wie sieht daher
eine Lösung aus, die der Integrität der jeweiligen Schlagworte Rechnung trägt. Um letztere zu
garantieren, werden alle Schlagworte der Masterliste zwischen Trennzeichen gesetzt, in
unserem Fall wählen wir Kommata, da in den Beschlagwortungslisten der Dokumente die
einzelnen Schlagworte ohnehin durch den delimiter Komma voneinander getrennt sind. Beim
Einlesen jeder Zeile mit den Schlagworten für ein Dokument wird einfach auch am Beginn
und am Ende ein Komma ergänzt. Ein Schlagwort Reise (= ,Reise,) wird also z.B. in einer
Beschlagwortungsliste
,Touristik,Reise,Destination,
korrekt in thematischer Nachbarschaft von Touristik und Destination aufgefunden, nicht mehr
jedoch in einer Beschlagwortungsliste wie etwa
,Verreisen,Reiseziel,Freizeit_und_Reisen,
entdeckt. (Die String-in-String-Suche würde hier drei Silben bzw. Wortteile melden. Wenn es
auch die Schlagworte Freizeit und Ziel gibt, dann wird ein zweimaliges gemeinsames
Auftreten mit diesen Suchbegriffen registriert.)
Die Abbildung 7 zeigt die kumulative Auftretenshäufigkeit der Schlagworte bei strenger
Definition der Zeichenfolgen. Man benötigt also ca. 1000 unterschiedliche Schlagworte, um
90% aller Beschlagwortungsinhalte abzudecken. Weitere 700 Schlagworte steuern die letzten
10% bei. Die Studien.at praktizieren ein offenes Beschlagwortungssystem, das dazu neigt,
neue Schlagworte zu kreieren, die sich später zum Teil als Ad-hoc-Schlagworte mit sehr
geringer Wiederholungsrate herausstellen können. Für die Wissenslandkarte ist es zweck-
mäßig, die Schlagwortauswahl auf die signifikanten Items zu beschränken. Angesichts der
Häufigkeitsverteilung in Abbildung 7 lassen sich 75% aller Beschlagwortungen mit kaum
mehr als 300 (exakt 336) Begriffen abdecken; für die verbleibenden 25% würden weitere
1400 Suchbegriffe benötigt, die wegen ihres seltenen Auftretens gewiss keine symptomatisch
wichtigen Kontextinformationen mehr beisteuern. Bereits Schlagworte, die zumindest für
sieben der 3000 Dokumente Verwendung finden, sind in dieser Lösung berücksichtigt.
336 Schlagworte werden also zur Abbildung der Wissensbasis ausgewählt. Zur Feststellung
ihrer wechselseitigen thematischen Zusammenhänge reicht die Analyse ihrer Ähnlichkeit
anhand von etwa einem Viertel der häufigsten Worte, so dass wir hier von einer reduzierten
Variablenliste von 79 (siehe die folgende Liste der Schlagworttexte und ihrer absoluten
Auftretenshäufigkeit) ausgehen können. Die Datenmatrix für die Map-Erstellung besteht
somit aus 336 Zeilen und 79 Spalten.
,Reiseanalyse, 46
,Reiseausgaben, 30
,Reisebuero, 46
,Reisemarkt, 34
,Reiseverhalten, 103
,Salzburg, 43
,Schweiz, 32
,Senioren, 33
,Sommertourismus, 40
,Sport, 95
,Staedtetourismus, 62
,Statistik, 51
,Strategie, 32
,Tirol, 76
,Tourismus, 137
,Tourismusentwicklung, 89
,Tourismusmarkt, 32
,Tourismuspolitik, 31
,Trend, 105
,Typologie, 34
,Umwelt, 76
,Umweltschutz, 56
,Urlaub, 39
,Verkehr, 66
,Weiterbildung, 30
,Wellness, 28
,Werbung, 48
,Wien, 72
,Wintersport, 37
,Wintertourismus, 73
,Wirtschaft, 42
,Zielgruppe, 74
,Zufriedenheit, 66
,Zukunft, 34
,international, 34
,sanfter_Tourismus, 31
Eine Map mit 16×16 Positionen bietet ausreichend Kapazität, um die nunmehr stark erhöhte
Anzahl der Schlagworte aufzunehmen und ihre thematische Zusammengehörigkeit zu
visualisieren. Ein Balloon-Plot wie in Abbildung 8 verdeutlicht, wie stark die einzelnen
Regionen der Studien.at-Wissenslandkarte bevölkert sind. Die Kreisflächen signalisieren die
absolute Häufigkeit des dominanten Schlagworts, das auf der jeweiligen Map-Position sitzt.
Position x=0, y=15 enthält z.B. das dominante Schlagwort Österreich mit einer Auftretens-
häufigkeit von 357 in den ca. 3000 Studien.at-Dokumenten. Die vollständige Beschreibung
dieser bislang besten Lösung bleibt dem Spezialbericht zur Visualisierung in Workpackage 3
vorbehalten; der Visualisierungsreport stellt auch das Verfahren zur automatisierten Map-
Konstruktion mittels Web-Browser-Technologie vor.
Die erste Lösung erlaubt String-in-String-Suche. Die Reduktion auf Schlagworte mit mehr als
1%-iger Auftretenshäufigkeit hinterlässt 268 Begriffe. Die Einschränkung der Variablenzahl
auf die Top 25% der Hauptschlagworte führt auf 77 Begriffe. Wie für alle Datenbasen sind
auch hier insignifikante Silben oder Wort(teil)e auszuschließen. Da Begriffe aus mehreren
Worten mit dem Underline ‚_’ verbunden wurden, geht fast kein inhaltlich brauchbares
Schlagwort verloren. Allerdings müssen Schlagworte, die auch als Teilstring (sinnlose Silbe)
in anderen Begriffen vorkommen, eliminiert werden. Ein Beispiel ist das Wort age, dass als
Schlagwort Alter zwar Sinn macht, bei der gewählten Form der Suche nach Übereinstimmung
in zwei ungleich langen Zeichenstrings im Französischen jedoch unsinnige Auftretenswerte
für Worte wie agence, voyage, amenagement, etc., erzeugt.
CULTURE
PERCEPTION
DESTINATION
SPORT COMMUNAUTE
RECEPTRICE
DEVELOPPEM.
AIR
COUT /
BENEFICE
MARKETING
PERFORMANCE
HOTELLERIE GESTION
MODELE ENTREPR. TOUR.
(RES)SOURCE
Auf Grund der im Vergleich mit den Studien Austria doppelt so hohen Dokumentenzahl
wurde bereits für die erste Lösung eine feinere Map mit 15×12 Positionen gewählt
(Abbildung 9; teilweise beschriftet). Die zugehörige Detailinformation – die in der
webbasierten Lösung später graphisch komfortabel aufbereitet sein wird – findet sich im
Anhang 2 in tabellarischer Form.
Die Erfahrungen aus dieser Lösung zeigen, dass die Gleichsetzung unserer Schlagwort-
Masterliste mit dem Thesaurus des CIRET zu viele, in den analysierten Dokument-
beschlagwortungen gar nicht verwendete Begriffe, produziert. Ferner ist die semantische
Sinnfälligkeit der unlimitierten Suche nach Wort- und Silbenübereinstimmung nicht verläss-
lich kontrollierbar. Für die praktisch einsetzbare Lösung werden daher zwei Verbesserungen
empfohlen:
(1) Die Ableitung der tatsächlich vorkommenden Schlagworte aus den Rohdaten führt
auf lediglich 919 unterschiedliche Begriffe.
(2) Die Schlagworte werden präzis abgegrenzt und auf Übereinstimmung der vollstän-
digen Zeichenfolge überprüft. Technisch ist dies leicht erreichbar, wenn man jedes
Schlagwort in der Masterliste durch Begrenzungszeichen umgibt (z.B. mit einem vor-
und nachgestellten Komma als delimiter):
,ACCEPTABILITE,
,ACCESSIBILITE,
,ACCUEIL,
,ACQUISITION,
,ACQUISITION_DE_TERRAINS,
,ACTIVITE,
+++ ÖGAF–Wissenslandkarte +++
[WP 2] D 2.2
V1.3 Seite 21
,ACTIVITE_A_HAUT_DEGRE_DE_RISQUE,
,AEROPORT,
…
,AGE,
…
Beim Dateneinlesen der Beschlagwortungslisten wird am Beginn und am Ende jeder
Zeile automatisch ein Komma eingefügt, damit auch das erste und das letzte
Schlagwort als separate Zeichenfolge erkennbar bleiben. Das Schlagwort age wird
also nur erkannt, wenn es als selbständiges Wort in einer Beschlagwortungsliste,
etwa,
,SPORT_D’HIVER,AGE,STATION,
auftritt.
,DEVELOPPEMENT, 566
,DISTRIBUTION, 105
,DIVERSIFICATION, 114
,DROIT, 180
,ECOTOURISME, 217
,EMPLOI, 384
,ENSEIGNEMENT, 228
,ENTREPRISE_TOURISTIQUE, 399
,ENVIRONNEMENT, 100
,EPIDEMIE, 96
,ETHIQUE, 103
,ETHNIE, 136
,ETUDE_DE_MARCHE, 140
,EXPERIENCE, 207
,FIDELITE, 95
,FLEAUX_HUMAINS, 111
,FREQUENTATION, 321
,GESTION, 1130
,GESTION_DES_RESSOURCES_HUMAINES, 218
,GUERRE, 211
,HISTOIRE, 442
,HOTELLERIE, 700
,IDENTITE, 152
,IDEOLOGIE, 109
,IMAGE, 289
,IMPACT_ECOLOGIQUE, 95
,IMPACT_ECONOMIQUE, 911
,INDICATEUR, 387
,INFORMATION_DOCUMENTATION, 117
,INNOVATION_TECHNOLOGIQUE, 109
,INTER-CULTUREL, 108
,INTERESSEMENT, 109
,INTERNET, 368
,INTERPRETATION, 119
,INVESTISSEMENT, 135
,LOISIR, 261
,MANIFESTATION_SPORTIVE, 148
,MARKETING, 368
,MISE_EN_VALEUR_DU_PATRIMOINE, 616
,MODELE, 953
,MONTAGNE, 98
,MOTIVATION, 257
,ORGANISATION_ADMINISTRATION, 153
,PARC, 213
,PARC_D'ATTRACTIONS, 107
,PARTICIPATION, 256
,PERCEPTION, 443
,PERFORMANCE, 550
,PERSONNEL, 163
,PLANIFICATION, 103
,POLITIQUE, 458
,PREFERENCE, 115
,PREVENTION, 311
,PREVISION, 334
,PRODUIT_TOURISTIQUE, 239
,PROMOTION, 154
,QUALITE, 400
,RATIO, 209
,RECHERCHE, 203
,RECONVERSION, 124
,RENCONTRE, 105
,RESTAURATION, 173
,REVENU_PRODUIT, 105
,REVITALISATION, 176
,RISQUE, 255
,SANTE, 123
,SATISFACTION, 327
,SCENARIO, 201
,SEGMENTATION_DU_MARCHE, 120
,SERVICE, 252
,SPORT, 175
,SYSTEME_D'INFORMATION, 158
,TAILLE, 105
,TOURISME_ALTERNATIF, 317
,TOURISME_DES_JEUNES, 120
,TOURISME_INSULAIRE, 156
,TOURISME_INTERNATIONAL, 903
,TOURISME_NATIONAL, 580
,TOURISME_URBAIN, 269
,UNIVERSITE, 131
,VALEUR, 148
Für die Aufnahme der 416 CIRET-Schlagworte ist die Kapazität einer 18×18-Map
ausreichend. Die Besetzung der Map-Positionen anhand des jeweils dominanten Schlagworts
verdeutlicht wieder das anschliessende Balloon-Plot in Abbildung 11. Dominante Schlag-
worte sind etwa GESTION auf der Position x=0, y=5 oder MODÈLE auf x=11, y=7 oder
DESTINATION auf x=15, y=12.
abzurufen. Sodann lassen sich Schlagworte markieren und für eine nachfolgende Doku-
mentensuche konservieren.
Fachgebieten. Dazu zählen also auch Bereiche wie Medizin, Sportwissenschaften oder
Freizeitsoziologie und –pädagogik. Die CABI Abstracts ermöglichen uns also die breiteste
internationale Abdeckung der tourismus- und freizeitwirtschaftlichen Wissensbasis
(http://www.cabi-
publishing.org/AbstractDatabases.asp?SubjectArea=&PID=5).
Die WU Wien ist ein official subscriber der CABI-Datenbasis, so dass der Zugang gesichert
ist. Ein manuelles Abfragen und Extrahieren der descriptors wäre jedoch hoffnungslos, so
dass wir entweder eine Schlagwortliste einkaufen oder einen kleinen Webroboter einsetzen
müssen. Daher haben wir einen Parser geschrieben (© Markus Mazanec), der die Abstracts
automatisch aufruft, die Queries absetzt und den einlangenden Code analysiert (siehe den
Punkt 2.1 im Technischen Teil). Für jeden Artikel werden die Schlagworte (descriptors)
extrahiert und zur Weiterverarbeitung durch das Strukturierungsverfahren gesichert. CABI
erlaubt pro Abfrage nicht mehr als 1000 Dokumente, so dass die Erstellung schrittweise
erfolgt. Die Masterliste der verwendeten Schlagworte rekonstruieren wir aus den tatsächlich
verwendeten Deskriptoren.
Die automatische Abfrage von ca. 12000 Dokumenten führte auf mehr als 5000 Schlagworte.
Die hohe Anzahl erklärt sich aus der Menge und Heterogenität der berücksichtigten
Fachzeitschriten. Nicht zuletzt sind zahllose medizinischer Fachausdrücke (Tropenmedizin,
Sportmedizin, Rehabilitation, Kurwesen) zu berücksichtigen, die in den anderen beiden
Datenbasen keine Rolle spielen. Wegen zahlloser exotischer, vor allem lateinisch-stämmiger
(oft medizinischer) Fachausdrücke empfiehlt sich nur eine Suche mit exakt abgegrenzten
Schlagworten (,schlagwort,). Ein Begriff nation würde sonst z.B. in so manchen
Endsilben aufgefunden und viele weitere unkontrollierbare Unsinnigkeiten wären die Folge.
Die Relation Schlagworte : Dokumentenzahl verhält sich ähnlich wie in den Studien.at, so
dass man einen ähnlichen Verlauf des Grades der Beschlagwortungsabdeckung bei
zunehmender Schlagwortanzahl erwarten muss. Die Abbildung 12 bestätigt diese Erwartung.
Wegen der großen Anzahl selten anzutreffender Schlagworte wird man sich auch hier mit
einer Abdeckungsquote von 75% begnügen ohne dabei auf signifikante Schlagworte
verzichten zu müssen. Bereits bei einer Verwendungshäufigkeit für 30 oder mehr der 12000
Dokumente gelangt ein Schlagwort in diese Lösung. 561 Schlagworte sind dafür vonnöten;
die gewohnte Quote von 25% der top-häufigsten Begriffe führt daher auf 140 Variablen. Die
Datenmatrix für die Map-Erstellung hat somit 561 Zeilen und 140 Spalten. Die inhaltliche
Beschreibung dieser spaltendefinierenden Variablen (Schlagworttext und absolute Häufigkeit
ergibt sich gemäß folgender Liste:
,decision_making, 257
,demand, 235
,destinations, 826
,disease_prevention, 161
,drug_therapy, 146
,economic_development, 207
,economic_impact, 496
,ecotourism, 572
,education, 162
,elderly, 181
,employment, 205
,environmental_impact, 395
,environmental_management, 139
,environmental_protection, 252
,epidemiology, 335
,ethics, 133
,ethnic_groups, 122
,evaluation, 126
,exercise, 425
,forest_management, 167
,forest_recreation, 222
,forests, 484
,gender_relations, 231
,globalization, 204
,health, 136
,heritage_tourism, 140
,history, 308
,holidays, 174
,hospitality_industry, 828
,hotels, 546
,human_diseases, 957
,imported_infections, 177
,information_services, 123
,information_technology, 234
,international_tourism, 267
,international_travel, 167
,internet, 329
,land_use, 185
,landscape, 178
,learning, 152
,leisure, 405
,leisure_activities, 257
,leisure_behaviour, 133
,lifestyle, 147
,malaria, 151
,management, 410
,market_competition, 134
,market_segmentation, 197
,marketing, 537
,marketing_techniques, 195
,markets, 264
,men, 158
,methodology, 284
,models, 356
,motivation, 417
,mountain_areas, 129
,national_parks, 317
,nature_conservation, 297
,nature_tourism, 230
,on_line, 208
,outdoor_recreation, 300
,parks, 136
,participation, 337
,physical_activity, 531
,physical_education, 416
,physical_fitness, 131
,planning, 316
,politics, 206
,psychology, 269
,recreation, 256
,recreational_activities, 181
,resource_management, 185
,restaurants, 123
,reviews, 618
,risk, 228
,risk_factors, 163
,rural_areas, 210
,rural_development, 179
,rural_tourism, 248
,safety, 138
,self_perception, 127
,soccer, 309
,social_impact, 206
,socioeconomics, 166
,sociology_of_leisure, 152
,sociology_of_sport, 489
,sociology_of_tourism, 192
,sport, 1347
,sport_performance, 377
,students, 207
,surveys, 873
,sustainability, 602
,teaching, 141
,tourism, 2334
,tourism_development, 1166
,tourism_impact, 629
,tourism_policy, 380
,tourism_theory, 122
,tourist_attractions, 406
,tourist_expenditure, 192
,tourist_industry, 1219
,tourists, 761
,training, 184
,trauma, 158
,travel, 830
,travellers, 616
,trends, 387
,urban_areas, 184
,visitor_behaviour, 302
,visitors, 519
,visits, 498
,water_recreation, 174
,women, 434
,youth, 180
Für die ÖGAF-Wissenslandkarte mit der reichhaltigsten Datenbasis ist eine Map mit 20×20
Positionen angemessen. Sie verfügt über die nötige Kapazität, um die 560 Schlagworte
aufzunehmen und nach Ko-Auftretenshäufigkeit in den Beschlagwortungen der von den
CABI-Abstracts beobachteten Journals zu organisieren.
Die vollständige Liste der nach Map-Positionen geordneten Schlagwortgruppen und ihre
individuellen Häufigkeiten befinden sich im Anhang 3. Sie verkörpert den Input für die
Visualisierung mittels Bubblechart. Auch für die Wissenslandkarte auf Grund der Abstracts
genügt eine zweistufige Bebilderung. Die erste Ebene soll — wie oben mehrfach demonstriert
— die Schlagwortgruppen als Kreisflächen zeigen; die Ebene darunter soll auf Mausklick
Balkendiagramme mit den individuellen Häufigkeiten jedes Schlagworts innerhalb der
Gruppe, die sich auf einem Map-Knoten versammelt, liefern.
Die wesentlichen Entscheidungen über die Map-Erzeugung für die drei bibliographischen
Informationsquellen sind in der nachstehenden Tabelle zusammen gefasst. Aus Gründen der
Konsistenz sollten sie auch in den späteren halbjährlichen oder jährlichen Aktualisierungen
der Landkarten beibehalten werden.
Vorzugeben sind die Map-Größe und die gewünschte Abdeckungsquote. Die Mindest-
häufigkeit des kleinsten noch zu berücksichtigenden Schlagworts und die notwendige
Gesamtanzahl ergeben sich aus der Aufbereitung der Beschlagwortungsdaten.
Die einzelnen Bausteine und ihre praktischen Einsatzmöglichkeiten bei der Datenaktuali-
sierung und Map-Wartung sind in der Folge kurz erläutert.
Die Datenbankeinträge des CIRET werden als Originaleinträge mit allen bibliographischen
Angaben geliefert. Für die ÖGAF-Landkarte benötigen wir nur die Schlagworte. Das folgende
Matlab-Script extractkey.m liest die vollständigen CIRET-Einträge vom File
CIRET14nurT.txt, sucht nach den Schlagworten, die jeweils in der Zeile THEME stehen, und
schreibt sie auf das Ausgabefile CIRETKW.txt.
Falls keine separate Masterliste der Schlagworte zur Verfügung steht, lässt sich diese mit dem
Script kw2list.m erzeugen. Am Beispiel der CABI-Daten gezeigt liest es die Schlagworte
z.B. von einem File trace04_0911.txt und exportiert jedes zumindest einmal auf-
tauchende Schlagwort in das File CABIkwlist.txt.
Script extractkey
Script kw2list
Die erstmalige Einholung der Schlagwortdaten aus den Abstracts von CAB International
sowie die spätere regelmäßige Nachbeschaffung erleichtert ein kleiner html-Parser. Die
‚manuelle’ Abfrage im Expertenmodus (siehe unten) würde es zwar erlauben, Dokumente aus
einem definierten Zeitraum (im Beispiel unten 1.1.-10.1.2005) abzufragen. Das Suchen nach
den Schlagworten (descriptors) kann aber sinnvoller Weise nur automatisiert erfolgen. Der
Screenshot in der übernächsten Abbildung zeigt einen Ausschnitt der gelieferten Doku-
mentendaten. Jeder Eintrag aus der Liste wäre jetzt zuerst zu öffnen; danach werden Detail-
informationen inklusive der CABI-Themencodes und der hier für die Konstruktion der
Wissenslandkarte interessierenden Schlagwortliste angezeigt.
Der html-Parser bewerkstelligt das Extrahieren der Schlagworte automatisch. Die drei am
Bildschirm sichtbaren Fenster (Bild unten) enthalten einen Mini-Webbrowser (oben), den das
Browserfenster erzeugenden html-Code (Mitte) sowie die aufgefunden Schlagwortlisten
(unten; jede Zeile beschreibt ein Dokument). Letztere werden in dem csv-formatierten und
z.B. mit Excel lesbaren File trace.csv gesammelt.
shortfrequ=frequ(frequ>=lowlim);
nr1=length(shortlist);
number=(1:nr1)';
disp([num2str(number) char(shortlist) num2str(shortfrequ')]);
% write reduced keyword list and frequencies to file
fid1=fopen(shortfile,'w');
% remove the delimiter ','
for i=1:nr1
kword=char(shortlist(i));
fprintf(fid1,'%s %8.0f \n',kword(kword ~= ','),shortfrequ(i));
end
fclose(fid1);
% initialize similarity matrix with keyword frequencies in main diag
sim=zeros(nr1,nr1)+diag(shortfrequ);
% fill upper triangular and copy to lower
for i=1:nr1-1
for j=(i+1):nr1
y=cocount(keywfile,char(shortlist(i)),char(shortlist(j)));
sim(i,j)=y;
end
end
sim=sim+sim'-(zeros(nr1,nr1)+diag(diag(sim)));
rawsim=sim;
disp(' '), disp(' matrix of co-occurrences for shortlist:'), disp(' ')
for i=1:nr1
fprintf('%s:\n',char(shortlist(i)))
for j=1:nr1
fprintf(' %5.0f',sim(i,j))
% normalize to diag values = 1
sim1(i,j)=sim(i,j)./sim(i,i);
end
fprintf('\n')
end
% the rows in sim are the semantic map data vectors
% restrict # of columns in sim to most frequent 25%, if desired
if varlim == 1
lim = median(shortfrequ(shortfrequ>median(shortfrequ)));
disp(' '), disp('*** reduced varlist:');
disp([char(shortlist(diag(sim)>lim))
num2str(shortfrequ(diag(sim)>lim)')]);
sim1=sim1(:,diag(sim) > lim);
end
% raw sim matrix, unrestricted
save simrawmat.dat rawsim -ASCII
% normalized to diag values = 1, restricted, rownormalized
sim1=normrows(sim1);
save simdiag1mat.dat sim1 -ASCII
[z,s]=size(sim1);
fprintf('\nnr of keywords (rows) in sim matrix: %5.0f',z);
fprintf('\nnr of vars (cols) from sim matrix: %5.0f',s);
fprintf('\nsim matrix saved in: simdiag1mat.dat');
fprintf('\nshort keyword master list saved in: %s',shortfile);
fprintf('\nminutes elapsed: %6.2f\n',etime(clock,clock0)/60);
Downloads:
Package source: som_0.3-4.tar.gz
MacOS X binary: som_0.3-4.tgz
Windows binary: som_0.3-4.zip
Index of contents: som.INDEX
Reference manual: som.pdf
Das zur Handhabung der R-SOM-Funktion konzipierte Script sieht wie folgt aus; die
einzelnen Anlyseschritte sind in den ##-Kommentarzeilen erklärt:
Die standardmäßig mit dem R-SOM-Paket erzeugbare Graphik (siehe eine 10×10-Beispiel-
Map unten) zeigt die relative Besetzungshäufigkeit jedes Knotens (n = …) und die
Mittelwerte bzw. die Streuung der zugehörigen Variablenwerte. Für die Veranschaulichung
einer Wissenslandkarte ist sie jedoch ungeeignet.
n=10 n=1 n=2 n=2 n=0 n=0 n=1 n=0 n=0 n=8
3
-3
n=1 n=0 n=0 n=0 n=0 n=1 n=2 n=0 n=0 n=3
3
-3
n=2 n=1 n=2 n=1 n=1 n=1 n=0 n=0 n=1 n=9
3
-3
n=5 n=2 n=3 n=3 n=1 n=2 n=3 n=0 n=0 n=2
3
-3
n=2 n=0 n=2 n=2 n=3 n=1 n=1 n=0 n=1 n=7
3
-3
n=0 n=1 n=1 n=5 n=1 n=6 n=0 n=1 n=1 n=3
3
-3
n=0 n=2 n=1 n=1 n=0 n=0 n=4 n=1 n=0 n=1
3
-3
n=0 n=0 n=0 n=3 n=0 n=0 n=0 n=0 n=1 n=1
3
-3
n=1 n=1 n=0 n=1 n=0 n=0 n=0 n=0 n=1 n=0
3
-3
n=3 n=6 n=2 n=0 n=0 n=10 n=4 n=1 n=0 n=1
3
-3
0 1 2 3 4 5 6 7 8 9 10
Das oben gelistete Script produziert das File CABIsom.dat mit folgender Struktur. Der
komplette Output befindet sich im Anhang 3:
keyword frequency x y
carrying_capacity 70 0 0
coastal_areas 101 0 0
conservation 111 0 0
conservation_areas 80 0 0
cost_benefit_analysis 60 0 0
ecotourism 572 0 0
…
…
Diese Tabelle mit den Spalten Schlagwort, absolute Häufigkeit, x-Position und y-Position
enthält alle notwendigen Informationen zur Visualisierung der Inhalte der ÖGAF-Wissens-
landkarte (siehe dazu die Berichte zum Workpackage 3).
3 Anhang
Auf den geordneten Positionen und Häufigkeiten der folgenden Tabelle beruht das Bubble-
Chart der Abbildung 6.
Auf den geordneten Positionen und Häufigkeiten der folgenden Tabelle beruht das Bubble-
Chart der Abbildung 7.
Anhang 3: Datentabelle der 20×20-Map für die Dokumente der CABI Abstracts
carrying_capacity 70 0 0
coastal_areas 101 0 0
conservation 111 0 0
conservation_areas 80 0 0
cost_benefit_analysis 60 0 0
ecotourism 572 0 0
environmental_degradation 47 0 0
environmental_impact 395 0 0
environmental_management 139 0 0
environmental_policy 65 0 0
environmental_protection 252 0 0
fisheries 85 0 0
fishery_management 45 0 0
indicators 42 0 0
natural_resources 75 0 0
nature_tourism 230 0 0
reserved_areas 72 0 0
simulation_models 40 0 0
sustainability 602 0 0
visitor_impact 53 0 0
water_management 64 0 0
water_resources 50 0 0
water_supply 40 0 0
agricultural_sector 30 0 1
community_development 60 0 1
development_projects 30 0 1
public_opinion 48 0 1
communities 64 0 2
international_trade 36 0 2
regulations 96 0 2
rural_communities 55 0 2
cooperation 72 0 3
economic_evaluation 51 0 3
funding 80 0 3
incentives 40 0 3
infrastructure 56 0 3
islands 107 0 3
local_government 30 0 3
regional_development 114 0 3
social_impact 206 0 3
traditional_society 59 0 3
transition_economies 32 0 3
development_policy 34 0 4
diversification 44 0 4
economic_development 207 0 4
economic_growth 39 0 4
economic_impact 496 0 4
farm_tourism 74 0 4
government 58 0 4
government_policy 46 0 4
heritage_areas 120 0 4
international_cooperation 36 0 4
private_sector 46 0 4
public_sector 41 0 4
rural_development 179 0 4
rural_economy 40 0 4
tourism_development 1166 0 4
tourism_impact 629 0 4
European_Union 56 0 5
cultural_values 121 0 5
income 117 0 5
modernization 35 0 5
partnerships 54 0 5
taxes 38 0 5
tourism_policy 380 0 5
alternative_tourism 63 0 6
cultural_change 31 0 6
health_tourism 40 0 6
host_guest_relations 105 0 6
public_services 30 0 6
resorts 84 0 6
structural_change 60 0 6
tourism_organizations 62 0 6
tourism_situation 52 0 6
entrepreneurship 43 0 7
festivals 70 0 7
migration 41 0 7
social_geography 54 0 7
sociology_of_tourism 192 0 7
sport_tourism 90 0 7
visitor_interpretation 75 0 7
crises 37 0 8
domestic_tourism 88 0 8
economic_situation 48 0 8
expenditure 34 0 8
spatial_distribution 31 0 8
tourism 2334 0 8
tourism_research 110 0 8
tourist_attractions 406 0 8
urban_tourism 93 0 8
airports 37 0 9
cruises 70 0 9
demography 58 0 9
destinations 826 0 9
econometric_models 30 0 9
imagery 86 0 9
inbound_travel 76 0 9
international_tourism 267 0 9
mathematical_models 116 0 9
outbound_travel 89 0 9
seasonal_variation 32 0 9
seasonality 62 0 9
skiing 75 0 9
statistics 37 0 9
terrorism 67 0 9
theme_parks 35 0 9
theory 65 0 9
tour_operators 118 0 9
tourist_expenditure 192 0 9
tourist_industry 1219 0 9
tourists 761 0 9
tours 47 0 9
transport 82 0 9
world 64 0 9
business_tourism 58 0 10
consumption 76 0 10
forecasts 95 0 10
prices 65 0 10
statistical_analysis 34 0 10
supply 43 0 10
travel_agents 116 0 10
winter_resorts 41 0 10
businesses 35 0 11
capital 32 0 11
classification 66 0 11
markets 264 0 11
shopping 32 0 11
forecasting 48 0 12
information 48 0 12
services 70 0 12
small_businesses 116 0 12
consumer_information 45 0 13
data_collection 47 0 13
holiday_accommodation 78 0 13
information_services 123 0 13
investment 81 0 13
market_research 50 0 13
marketing 537 0 13
marketing_channels 110 0 13
marketing_techniques 195 0 13
occupancy_rates 50 0 13
profitability 43 0 13
profits 30 0 13
purchasing_habits 64 0 13
quality 48 0 13
techniques 35 0 13
telecommunications 48 0 13
catering 34 0 14
companies 34 0 14
comparisons 76 0 14
databases 33 0 14
finance 99 0 14
hospitality_industry 828 0 14
hotels 546 0 14
human_resources 81 0 14
information_systems 77 0 14
information_technology 234 0 14
innovation_adoption 41 0 14
innovations 34 0 14
internet 329 0 14
labour 34 0 14
leisure_industry 86 0 14
managers 80 0 14
museums 45 0 14
networking 42 0 14
on_line 208 0 14
ownership 39 0 14
personnel_management 96 0 14
property 38 0 14
reservations 58 0 14
returns 49 0 14
technical_progress 34 0 14
technology 31 0 14
gambling 89 0 15
labour_market 31 0 15
labour_relations 32 0 15
management 410 0 15
casinos 64 0 16
communication 88 0 17
international_comparisons 87 0 18
opinions 87 0 18
legislation 91 0 19
membership 40 0 19
perception 108 0 19
roles 38 0 19
social_change 67 0 19
standards 43 0 19
climatic_change 45 1 0
environmental_education 39 1 0
monitoring 79 1 0
national_parks 317 1 0
nature_reserves 95 1 0
resource_conservation 72 1 0
resource_management 185 1 0
resource_utilization 51 1 0
trails 65 1 0
wildlife 60 1 0
wildlife_management 65 1 0
projects 43 1 1
urban_development 37 1 2
backpacking 39 1 5
rural_tourism 248 1 5
second_homes 47 1 5
historic_sites 68 1 6
demand 235 1 10
holidays 174 1 10
market_segmentation 197 1 12
consumer_surveys 93 1 13
market_competition 134 1 13
catering_industry 119 1 14
consumers 40 1 14
camp_sites 33 1 15
personnel 93 1 15
wages 43 1 15
work_satisfaction 41 1 15
working_conditions 33 1 15
organizations 48 1 17
economic_analysis 69 2 0
ecosystems 46 2 0
rivers 62 2 0
water_use 35 2 0
community_involvement 232 2 2
planning 316 2 2
agricultural_development 30 2 4
socioeconomics 166 2 5
heritage_tourism 140 2 7
traditions 43 2 7
tourism_theory 122 2 8
employment 205 2 10
estimates 30 2 10
visitor_behaviour 302 2 10
surveys 873 2 11
consumer_preferences 145 2 12
consumer_satisfaction 232 2 14
restaurants 123 2 14
political_power 50 2 19
economics 30 3 0
entry_fees 32 3 0
environmental_assessment 42 3 0
lakes 65 3 0
landscape_conservation 32 3 0
mountain_areas 129 3 0
nature_conservation 297 3 0
water_quality 114 3 0
wetlands 38 3 0
wildlife_conservation 97 3 0
agricultural_land 34 3 1
villages 31 3 6
cultural_tourism 213 3 7
models 356 3 12
consumer_behaviour 279 3 14
decision_making 257 3 15
health_resorts 38 3 15
law 75 3 18
disparity 30 3 19
globalization 204 3 19
regression_analysis 32 3 19
relationships 33 3 19
costs 112 4 0
land_management 73 4 0
recreation_management 77 4 0
recreational_facilities 119 4 0
valuation 54 4 0
watersheds 39 4 0
historic_buildings 43 4 7
visitors 519 4 9
cross_cultural_studies 41 4 19
cultural_differentiation 35 4 19
measurement 74 4 19
religion 44 4 19
contingent_valuation 102 5 0
forestry 57 5 0
geographical_information_systems 49 5 0
grasslands 45 5 0
habitats 78 5 0
hiking 46 5 0
human_activity 57 5 0
land_use 185 5 0
landscape 178 5 0
non-market_benefits 52 5 0
open_spaces 64 5 0
species_diversity 40 5 0
species_richness 34 5 0
trees 53 5 0
urbanization 42 5 0
wild_animals 33 5 0
cultural_heritage 268 5 7
willingness_to_pay 104 5 8
trends 387 5 9
boating 38 5 10
methodology 284 5 13
culture 321 5 19
higher_education 88 5 19
politics 206 5 19
afforestation 32 6 0
amenity_forests 61 6 0
amenity_value_of_forests 47 6 0
forest_management 167 6 0
forest_policy 45 6 0
forest_recreation 222 6 0
forest_resources 31 6 0
forests 484 6 0
hunting 110 6 0
soil_types 35 6 0
urban_forestry 34 6 0
urban_parks 67 6 0
wilderness 55 6 0
design 62 6 1
outdoor_recreation 300 6 1
golf_courses 53 6 5
education_programmes 78 6 19
social_behaviour 32 6 19
ornamental_plants 30 7 1
conflict 126 7 7
evaluation 126 7 12
knowledge 95 7 18
teaching_methods 87 7 19
polluted_water 44 8 0
education 162 8 8
constraints 349 8 11
horse_riding 33 8 11
retirement 30 8 18
ethics 133 8 19
lawns_and_turf 56 9 2
urban_areas 184 9 7
rural_recreation 43 9 9
cinema 33 9 12
learning 152 9 19
geographical_distribution 30 10 0
biodiversity 167 10 5
aesthetic_value 40 10 6
safety 138 10 6
case_studies 959 10 8
rural_areas 210 10 9
history 308 10 16
leisure_centres 34 10 18
entertainment 38 10 19
fitness_industry 45 10 19
health_clubs 42 10 19
motivation 417 10 19
water_pollution 96 11 0
parks 136 11 9
visits 498 11 9
recreation 256 11 17
curriculum 165 11 18
enjoyment 69 11 19
leisure 405 11 19
leisure_activities 257 11 19
leisure_behaviour 133 11 19
leisure_education 38 11 19
leisure_policy 33 11 19
leisure_research 37 11 19
leisure_services 96 11 19
leisure_theory 41 11 19
sociology_of_leisure 152 11 19
volunteers 92 11 19
animal_behaviour 34 12 3
access 43 12 9
consumer_attitudes 225 12 11
ethnic_groups 122 12 16
teaching 141 12 16
arts 45 12 19
families 48 12 19
handicapped_persons 114 12 19
participation 337 12 19
social_interaction 41 12 19
social_participation 104 12 19
sponsorship 41 12 19
therapeutic_recreation 59 12 19
universities 52 12 19
voluntary_services 37 12 19
water_recreation 174 13 5
amenity_and_recreation_areas 149 13 9
accommodation 193 13 10
air_transport 137 13 10
angling 136 13 10
youth 180 13 10
audiences 155 13 11
training 184 13 11
recreational_activities 181 13 17
attitudes_to_work 35 13 19
career_development 31 13 19
clubs 89 13 19
ethnicity 109 13 19
leadership 35 13 19
minorities 37 13 19
nationalism 47 13 19
students 207 13 19
camping 43 14 0
travel 830 14 0
accidents 56 14 2
adolescents 169 14 10
women 434 14 10
beliefs 39 14 19
cricket 34 14 19
gender_relations 231 14 19
homosexuality 41 14 19
interpersonal_relations 80 14 19
mass_media 116 14 19
moral_values 35 14 19
race_relations 101 14 19
research 117 14 19
skills 65 14 19
soccer 309 14 19
sociology_of_sport 489 14 19
sport_policy 56 14 19
sports_facilities 61 14 19
teacher_training 41 14 19
teachers 62 14 19
television 85 14 19
winter_sports 39 14 19
woman\'s_status 70 14 19
attitudes 776 15 15
Olympic_games 82 15 19
baseball 69 15 19
football 33 15 19
games 49 15 19
golf 59 15 19
philosophy 54 15 19
physical_education 416 15 19
play 40 15 19
rugby 49 15 19
schools 62 15 19
secondary_education 30 15 19
sexual_behaviour 46 15 19
socialization 32 15 19
sport 1347 15 19
sport_theory 102 15 19
sports_grounds 49 15 19
sports_organizations 91 15 19
teams 44 15 19
beaches 48 16 0
international_travel 167 16 0
reviews 618 16 4
behaviour 155 16 17
competitive_sports 163 16 18
advertising 46 16 19
basketball 73 16 19
climbing 39 16 19
coaching 64 16 19
psychology 269 16 19
elderly 181 17 12
aging 32 17 13
assessment 100 17 16
doping 30 17 19
drug_abuse 35 17 19
motor_skills 33 17 19
self_perception 127 17 19
sport_performance 377 17 19
travellers 616 18 0
risk 228 18 2
quality_of_life 91 18 12
health 136 18 13
questionnaires 63 18 16
athletics 67 18 19
mental_ability 50 18 19
self_esteem 65 18 19
HIV_infections 41 19 0
adverse_effects 38 19 0
aetiology 41 19 0
antibacterial_agents 52 19 0
antimalarials 80 19 0
bacterial_diseases 112 19 0
cardiovascular_diseases 38 19 0
case_reports 130 19 0
chemoprophylaxis 98 19 0
chloroquine 30 19 0
clinical_aspects 153 19 0
dengue 42 19 0
diagnosis 106 19 0
diarrhoea 84 19 0
disease_control 43 19 0
disease_prevalence 50 19 0
disease_prevention 161 19 0
disease_transmission 81 19 0
disease_vectors 38 19 0
drinking_water 31 19 0
drug_resistance 39 19 0
drug_therapy 146 19 0
epidemiology 335 19 0
exposure 46 19 0
fever 34 19 0
food_contamination 34 19 0
guidelines 93 19 0
health_education 35 19 0
hepatitis_A 41 19 0
human_diseases 957 19 0
immigrants 35 19 0
immunization 96 19 0
imported_infections 177 19 0
infectious_diseases 46 19 0
malaria 151 19 0
mortality 76 19 0
neoplasms 41 19 0
occupational_hazards 30 19 0
outbreaks 73 19 0
pilgrimages 38 19 0
proguanil 30 19 0
protozoal_infections 53 19 0
public_health 91 19 0
respiratory_diseases 62 19 0
risk_assessment 85 19 0
risk_factors 163 19 0
schistosomiasis 31 19 0
swimming_pools 34 19 0
travel_medicine 115 19 0
vaccination 97 19 0
vaccines 43 19 0
viral_diseases 112 19 0
occupational_health 31 19 1
risk_behaviour 32 19 1
swimming 66 19 1
adults 87 19 3
aggressive_behaviour 44 19 3
food_consumption 33 19 3
wines 32 19 3
playgrounds 34 19 4
trauma 158 19 5
lifestyle 147 19 14
socioeconomic_status 42 19 16
alcohol_intake 37 19 17
obesity 71 19 17
overweight 31 19 17
school_children 33 19 17
tobacco_smoking 50 19 17
age 66 19 18
body_mass_index 68 19 18
boys 38 19 18
children 511 19 18
diet 37 19 18
food_intake 59 19 18
growth 31 19 18
health_promotion 85 19 18
human_behaviour 73 19 18
men 158 19 18
physical_activity 531 19 18
physical_fitness 131 19 18
anxiety 75 19 19
appetite_disorders 35 19 19
athletes 636 19 19
bicycling 73 19 19
body_composition 38 19 19
body_fat 32 19 19
body_image 48 19 19
body_weight 52 19 19
carbohydrates 52 19 19
creatine 34 19 19
diets 49 19 19
energy_intake 41 19 19
exercise 425 19 19
food_supplements 64 19 19
girls 78 19 19
gymnastics 31 19 19
mental_health 54 19 19
mental_stress 95 19 19
muscles 47 19 19
nutrition 78 19 19
physiology 30 19 19
racehorses 52 19 19
running 65 19 19
sex_differences 68 19 19