Sie sind auf Seite 1von 82

schriftenReihe: Social Media | Band 2

Schriftenreihe: Social Media


Band 2

Media
special

Data
Community
Tagging warm

© shutterstock
Social Media amazing

Knowledge
Das Web 2.0 und seine Fülle an einfachen und neuen Beteiligungsformen hat die Zahl
Weblog

(Meta-) Informationen von Communitys und Netzwerken – Entstehung und Nutzungsmöglichkeiten

Context
der aktiven Nutzerinnen und Nutzer und die Zahl der Beiträge enorm ansteigen lassen.
Gerade da, wo sich Menschen stark austauschen und interagieren werden besonders

Semantic Web

Content
viele Informationen zusammengetragen. Neben den unmittelbaren Beiträgen bei der
Content-Entwicklung – beispielsweise dem Hochladen von Videos, Fotos auf entspre-
chende Plattformen oder Textbeiträgen in Weblogs – entstehen auch Metainformatio-
nen wie Informationen über das Suchverhalten oder durch Social Tagging.

In dieser Broschüre wird dargestellt, wie solche (Meta-) Informationen entstehen und
wie sie genutzt werden. Dazu werden Beispiele aus unterschiedlichen Branchen und aus
Sicht unterschiedlicher Akteure vorgestellt: aus Sicht einzelner Nutzer, von Communitys,
der Betreiber von Web-Angeboten sowie aus Sicht Dritter, z. B. externer Unternehmen
oder der Wissenschaft. Ein gewisses technisches Grundverständnis voraussetzend,
wendet sich diese Studie vor allem an Praktiker, die sich durch die unterschiedlichen


und auch überraschenden Nutzungsmöglichkeiten anregen lassen wollen, ihre eigenen
Produkte und Dienstleistungen weiter zu entwickeln.

Diese Broschüre ist ein Ergebnis der „ComStudy“, die am Salzburg New Media Lab
(SNML) im Zeitraum von Oktober 2008 bis Dezember 2009 durchgeführt wird. Das
SNML, das Kompetenzzentrum für Neue Medien in Österreich, arbeitet daran, digitale
Inhalte clever zu strukturieren, verknüpfen, personalisieren, für alle auffindbar zu
machen und nachhaltig zu nutzen und betrachtet dabei die Community als einen
wesentlichen Faktor vieler Projekte.

(Meta-) Informationen von


Communitys und Netzwerken
ISBN 978-3-902448-15-6

Entstehung und Nutzungsmöglichkeiten

Sandra Schaffert
mit Beiträgen von Julia Eder, Wolf Hilzensauer, Thomas Kurz, Mark Markus,
Sebastian Schaffert, Rupert Westenthaler und Diana Wieden-Bischof
Sandra Schafert

(Meta-) Informatonen
von Communitys und Netzwerken
Entstehung und Nutzungsmöglichkeiten

mit Beiträgen von Julia Eder, Wolf Hilzensauer,


Thomas Kurz, Mark Markus, Sebastan Schafert,
Rupert Westenthaler und Diana Wieden-Bischof

veröfentlicht unter der „Creatve Commons Namensnennung-Keine Bearbeitung


3.0 Österreich License“
siehe htp://creatvecommons.org/licenses/by-nd/3.0/at
Salzburg NewMediaLab (SNML), das Kompetenzzentrum für Neue Medien gab die
vorliegende Broschüre im Rahmen des Projekts „ComStudy“ (Leitung: Dr. Sandra
Schafert) in Aufrag. Unter der Leitung von DI Georg Güntner arbeitet das SNML dar-
an, digitale Inhalte clever zu strukturieren, verknüpfen, personalisieren, für alle auf-
fndbar zu machen und nachhaltg zu nutzen. Das SNML ist ein industrielles Kompe-
tenzzentrum im Rahmen der Aktonslinie Kind des Bundesministerium für Wirtschaf
und Arbeit (BMWA) und wird gefördert aus Miteln des BMWA und des Landes Salz-
burg. Homepage: newmedialab.at

© Salzburg NewMediaLab 2009

ISBN 978-3-902448-15-6

Sandra Schafert, Julia Eder, Wolf Hilzensauer,


Thomas Kurz, Mark Markus, Sebastan Schafert,
Rupert Westenthaler und Diana Wieden-Bischof:

(Meta-) Informatonen von Communitys und Netzwerken.


Entstehung und Nutzungsmöglichkeiten.

Band 2 der Reihe „Social Media“,


herausgegeben von Georg Güntner und Sebastan Schafert

Verlag und Herstellung: Salzburg Research, Salzburg


Umschlaggestaltung: Daniela Gnad, Salzburg Research
Lektorat: Diana Wieden-Bischof, Salzburg Research

Bibliografsche Informaton der Deutschen Natonalbibliothek:

Die Deutsche Natonalbibliothek verzeichnet diese Publikaton


in der Deutschen Natonalbibliografe; detaillierte bibliografsche
Daten sind im Internet über htp://dnb.d-nb.de abrufar.
VORWORT
Das Kompetenzzentrum für Neue Medien, Salzburg NewMediaLab, betrachtet im Rah-
men seines Forschungsprogramms die Wechselwirkung zwischen digitalen Inhalten und
ihren AutorInnen bzw. KonsumentInnen aus technologischer und sozialer Perspektve.
Dabei ergibt sich naturgemäß die Frage, welche Art von Bindung zwischen AutorInnen
und LeserInnen untereinander, aber auch zu deren Inhalten besteht und wie sich die
aufgrund dieser Bindung entstehenden Gemeinschafen auf die Atraktvität und Nut-
zung der Inhalte sowie auf das Angebot von erweiterten Diensten auswirkt.
Dies führte zur Beaufragung einer Studie des Salzburg NewMediaLab („ComStudy“), die
sich mit Orienterungs- und Entscheidungshilfen für den Aufau von Online-Communitys
beschäfigt. Dabei betrachten wir auch die in der Wechselwirkung von Inhalten und
Communitys aus technischer Sicht anfallenden Metainformatonen und die auf den In-
halten basierenden Dienste, wie etwa Empfehlungs- und Reputatonssysteme.
Im vorliegenden (zweiten) Band der Reihe „Social Media“ untersuchen wir die im Um-
feld von Online-Communitys und deren Interakton mit digitalen Inhalten anfallenden
Metainformatonen und deren Mehrwert. Dabei geht es nicht nur um von den NutzerIn-
nen bewusst verfügbar gemachtes Datenmaterial (z. B. „Tags“), sondern auch um impli-
zit anfallende Informatonen, die zur Optmierung von unterschiedlichsten Funktonen
(z. B. Suche, Navigaton, Anzeige) und zur Unterstützung von Geschäfsprozessen (z. B.
Trend- und Marktanalysen) herangezogen werden können. Metainformatonen erschlie-
ßen sich dabei vielfach nicht nur aus den Primär-Quellen (z. B. Einträgen in Weblogs),
sondern auch aus deren Metabeschreibungen und Beziehungsstrukturen sowie Interak-
tonsspuren durch die NutzerInnen.
Gerade unter dem Blickwinkel der aktuellen Diskussion über Nutzen und Gefahren sozia-
ler Netzwerke und Communitys im Internet stellt und beantwortet der vorliegende Band
einige interessante Grundfragen und bietet praktsche Orienterungs- und Entschei-
dungshilfen, für deren Lektüre ich Ihnen namens des Salzburg NewMediaLab gute Un-
terhaltung und viele in Ihrer praktschen Arbeit umsetzbare Anregungen wünsche.
Georg Güntner
Leiter des Salzburg NewMediaLab
November 2009
DANK & ANMERKUNG ZUR SCHREIBWEISE
Den Expertnnen und Experten, die für ein Kurzinterview persönlich, per E-Mail oder
Skype an ihrer Expertse teilnehmen ließen, herzlichen Dank: Andreas Blumauer, Dr. Ralf
Klamma, Dr. Sebastan Schafert, Dr. Katharina Siorpaes und Dr. Riina Vuorikari. Herzli-
cher Dank gilt auch den Ko-Autorinnen und Autoren Julia Eder, Thomas Kurz, Dr. Mark
Markus, Dr. Sebastan Schafert, Rupert Westenthaler und Diana Wieden-Bischof sowie
den Kollegen, die hilfreiche Tipps gaben: Wernher Behrendt, Dr. Guntram Geser, Andre-
as Gruber, Georg Güntner, Werner Moser, Rolf Sint und Dr. Andreas Strasser. Danke-
schön auch an Daniela Gnad für das Titelbild und Diana Wieden-Bischof für das Lektorie-
ren!
Um diesen Beitrag nicht durch weibliche Endungen, Bindestriche und Klammern zu ei-
nem zwar korrekten, aber auch schwerer zu lesenden Werk zu machen, haben wir im
Folgenden durchgehend darauf verzichtet, die gendergerechte Schreibweise zu verwen-
den. Zudem haben wir uns bemüht, auf englische Ausdrücke oder Lehenswörter zu ver-
zichten wo sie uns unnötg erschienen – aber im Bereich des Internets und der moder-
nen Managementheorie kommt man leider viel zu of nicht darum herum.
Sandra Schafert
INHALTSVERZEICHNIS
1 Einleitung und Hintergrund........................................................................................ 9
2 Nutzerverhalten....................................................................................................... 13
2.1 Formen und Systeme ...........................................................................................13
2.2 Nutzen und Nutzung.............................................................................................13
3 Kommunikatons- und Vernetzungsstruktur............................................................. 19
3.1 Daten und Formen der Analyse............................................................................ 19
3.2 Nutzen und Nutzung.............................................................................................20
4 Bewertungen............................................................................................................27
4.1 Formen und Einsatz ............................................................................................. 27
4.2 Nutzen und Nutzung.............................................................................................28
5 Social Tagging .......................................................................................................... 35
5.1 Konzept und Anwendungen................................................................................. 35
5.2 Nutzen und Nutzung.............................................................................................36
6 Texte.........................................................................................................................47
6.1 Entstehung von Texten fördern............................................................................ 47
6.2 Nutzen und Nutzung.............................................................................................49
7 Metadatenformate und Ontologien......................................................................... 55
7.1 Konzept und Beispiele.......................................................................................... 55
7.2 Nutzen und Nutzung ............................................................................................57
8 Linked Data.............................................................................................................. 63
8.1 Konzept und Hintergrund..................................................................................... 63
8.2 Nutzen und Nutzung (in der Zukunf)................................................................... 65
9 Ergänzung und Zusammenfassung ...........................................................................69
Literatur und Quellen................................................................................................. 75
Autorinnen und Autoren............................................................................................ 80
Sandra Schafert und Diana Wieden-Bischof

1 EINLEITUNG UND HINTERGRUND

(Meta-) Informatonen
Das Web 2.0 und seine Fülle an einfachen und neuen Beteiligungsformen hat die Zahl
der aktven Nutzer und die Zahl der Beiträge zum Web enorm ansteigen lassen. Gerade
da, wo sich Menschen stark austauschen und interagieren, werden besonders viele In-
formatonen zusammengetragen. Es gibt eine Reihe von Defnitonen und Verständnisse
des Wortes „Informaton“, wir verstehen darunter alle Datenmaterialien und darin ent-
haltenes Wissen und Botschafen, die Nutzer im Web veröfentlichen und hinterlassen.
Viele öfentlich zugängliche Informatonen entstehen in Online-Communitys. Eine Onli-
ne-Community besteht aus Personen mit gemeinsamen Interessen, die Internet- und an-
dere Kommunikatonstechnologien nutzen, um sich regelmäßig auszutauschen
und/oder gemeinsam Inhalte zu entwickeln, dabei starke Bindungen entalten und sich
als zusammengehörig fühlen (Schafert & Wieden-Bischof, 2009). Auch bei weniger star-
ken Bindungen, wie in sozialen Netzwerken oder anderen kommunikatv oder kollabora-
tv angelegten Systemen, z. B. Weblogs oder Microblogging, entstehen viele Informato-
nen. Schließlich entstehen solche Informatonen selbst dort, wo sich Nutzer untereinan-
der nicht kennen, aber gemeinsam aktv sind, beispielsweise Kunden eines Online-Shops
sind oder Leser einer Online-Enzyklopädie.
Neben den unmitelbaren Beiträgen bei der Content-Entwicklung – beispielsweise dem
Hochladen von Videos, Fotos auf entsprechenden Platormen oder Textbeiträgen in
Weblogs – generieren Nutzer bzw. die Communitys auch „Metainformatonen“. Darun-
ter verstehen wir beispielsweise Metadaten, d. h. Angaben über Autoren von Beiträgen
im Html-Code, aber auch andere „Informatonen über Informatonen“. Solche Metain-
formatonen sind beispielsweise die Zahl der Beiträge eines Nutzers oder die Zahl der
Klicks auf einen Beitrag und werden so teilweise erst nachträglich ermitelt.
Ähnliche Begrife sind Metadaten und Metawissen, alle Begrife werden unterschiedlich
defniert (s. z. B. Riekert, 1996). Wir verwenden die beiden Begrife Informaton und Me-
tainformaton in dieser Studie pragmatsch: Wir versuchen zusammenzutragen und vor-
zustellen, was „alles“ in Communitys und Netzwerken entsteht und wie es für ganz un-
terschiedliche Zwecke genutzt wird.

Entstehung von Metainformatonen


Grundsätzlich kann zwischen einer aktven und einer passiven Entwicklung von Metain-
formatonen von Nutzern unterschieden werden:
| Aktv tragen Nutzer, insbesondere solche mit Expertenstatus in einer spezifschen Do-
mäne, zur Entwicklung von Metainformatonen bei, wenn sie beispielsweise Formu-
lare ausfüllen oder Schlagworte vergeben, also aktv und bewusst Beiträge liefern.
| Passiv tragen Nutzer zur Entwicklung von Metainformatonen bei, wenn dies beiläu-
fg und auch unbewusst geschieht, indem beispielsweise nach bestmmten Begrifen
recherchiert wird oder Links ausgewählt werden.

9
In der Praxis zeigt sich, dass diese Unterscheidung nicht immer einfach und eindeutg ist.
So werden wir in dieser Veröfentlichung einige Beispiele für spielerische Ansätze vor-
stellen, wo Nutzer aktv Metainformatonen entwickeln, ihnen dies aber eventuell durch
den Spielcharakter nicht bewusst ist. Auch wird beispielsweise beim Hochladen eines
Fotos gleichzeitg und ohne weiteres Zutun der Nutzer eine Reihe von relevanten Meta-
daten zum Foto (z. B. Blendeneinstellung) zur Verfügung gestellt, was dem Nutzer auch
selbst nicht bewusst sein muss.
Im Web und insbesondere da, wo sich Personen eng austauschen und zusammenarbei-
ten, nämlich in Communitys oder sozialen Netzwerken, entstehen besonders viele
(Meta-) Informatonen. Diese können wiederum durch unterschiedliche Methoden aus-
getauscht, zusammengebracht und analysiert werden. In geschlossenen Systemen, bei
denen beispielsweise eine Anmeldung erfolgt, ist so bereits eine Reihe von Informato-
nen zu den einzelnen Nutzern bekannt.
In sozialen Netzwerken sind nach erfolgter Anmeldung typischerweise folgende Infor-
matonen über einzelne Nutzer bekannt und können entsprechend genutzt werden: Vor-
name und Name, Geschlecht, Alter, aktueller Arbeitgeber, Positon im Unternehmen,
Wohnort und Land, ein Foto, Homepage, E-Mail-Adresse, aktueller Online-Status (ob der
User eingeloggt ist), Datum der Registrierung (Erstanmeldung), letztes Login, ob die An-
meldung durch eine Einladung eines anderen Nutzer (und von wem) erfolgt ist, ein Text
mit einer Beschreibung der Person und ihrer Interessen, Kontakte.
Aber auch in ofenen Systemen oder übergreifenden Services ist eine Reihe von Metain-
formatonen zugänglich und nutzbar. Nicht nur die Anbieter von Webangeboten und
-services, z. B. Online-Shops oder soziale Netzwerke haben Interesse an Metainforma-
tonen zu ihren Inhalten und Nutzern, auch die Nutzer selbst können davon profteren,
wenn dadurch beispielsweise
| Such- und Recherchemöglichkeiten verbessert werden, weil Inhalte und Objekte bes-
ser erschlossen sind,
| Angebote auf spezifsche persönliche Interessen hin dargestellt und nutzbar gemacht
werden, beispielsweise passende Empfehlungen gegeben werden können,
| oder wenn allgemein Angebote optmiert werden können um Nutzer und Communi-
tys zu unterstützen.
Wie wir insbesondere im letzten Kapitel zeigen werden, profteren nicht nur die Anbie-
ter von Webservices, und Nutzer, sondern vielfach auch Drite, beispielsweise externe
Anbieter, Forscher oder Analysten von den entstandenen und zugänglichen Metainfor-
matonen.

Schwerpunkte, Forschungsfragen und Vorgehen


In dieser Studie haben wir folgende Bereiche ausgewählt und genauer angeschaut:
| das Nutzerverhalten, beispielsweise das Such- und Browsingverhalten,
| die Kommunikatons- und Netzwerkstruktur als Möglichkeit die sozialen Gegebenhei-
ten zu erfassen und zu nutzen,
| Bewertungen, die dazu genutzt werden um Produkte, Personen, Objekte oder Web-
seiten zu evaluieren und beurteilen,
| Social Tagging als eine innovatve und populäre Variante von gemeinschaflicher Ver-
schlagwortung von Dokumenten,

10
| Texte, da aus dieser Datenquelle eine Reihe von (auch überraschenden) Metainfor-
matonen analysiert und abgeleitet werden können,
| Metadatenformate als klassische Form von Metainformatonen, wir geben hier u. a.
einen Überblick über aktuelle Schemata, sowie schließlich
| aktuelle Entwicklungen und Projekte zu Linked Data als eine atraktve aktuelle Ent-
wicklung zur weiteren Nutzung und Verlinkung von Daten auf dem Weg zum „Seman-
tschen Web“.

Abbildung 1: (Meta-) Informatonen aus Communitys und Netzwerken

Wie in der Abbildung dargestellt, lassen sich die dargestellten Informatonen beispiels-
weise darin unterscheiden, welche Expertse bei der Entwicklung bzw. Generierung die-
ses Quellmaterials aufgebracht werden muss. So ist in der Regel beim bearbeiten von
Metadaten Fachwissen zum Gegenstand notwendig, währenddessen Suchen oder einfa-
ches Browsen nicht notwendigerweise Fachwissen benötgt – das kann quasi jeder.
Gleichzeitg zeigt sich bei dieser Anordnung, dass das Aufmerksamkeitslevel graduell ab-
nimmt: Während das Schreiben von Weblogeinträgen eher mehr Aufmerksamkeit des
Erstellers benötgen, werden etliche Klicks eher beiläufg vorgenommen. Diese Abstu-
fung und Darstellung ist sicherlich nicht für jeden Fall zutrefend.
Forschungsleitend waren bei dieser Zusammenstellung folgende, eher praktsche Frage-
stellungen:
| Wie entstehen (Meta-) Informatonen unterschiedlicher Art?
| Wie kann man sie auswerten und analysieren?
| Wie werden sie genutzt?
Diese Publikaton verfolgt dabei das Ziel, über unterschiedliche Branchen und Anwen-
dungsbereichen hinweg Beispiele und Nutzungsmöglichkeiten vorzustellen. Es wird da-
bei nicht nur betrachtet, welchen Nutzen einzelne Benutzer eines Services oder einzelne
Community-Mitglieder haben oder wie die Nutzergruppen insgesamt davon profteren,
um beispielsweise ihr gemeinsames Ziel besser verfolgen zu können. Auch die Betreiber
von Communitys oder auch Drite haben Interesse an (Meta-) Informatonen.

11
Abbildung 2: Nutzer von (Meta-) Informatonen

Ein gewisses technisches Grundverständnis voraussetzend, wendet sich diese Studie vor
allem an Praktker, die sich durch die unterschiedlichen Nutzungsmöglichkeiten anregen
lassen wollen, für ihre eigenen Produkte und Dienstleistungen innovatve Einsatzmög-
lichkeiten zu entwickeln.
In Rücksprache mit den Kollegen beim Salzburg NewMediaLab wurden dabei die oben
genannten Schwerpunkte gesetzt, und dazu nach Beispielen, Publikatonen und Exper-
ten recherchiert, um einen guten Einsteg und Überblick in den aktuellen Stand der Nut-
zung sowie anregende Einblicke gewinnen zu können.

Hintergrund und Kontext der Studie


Diese Broschüre ist ein Ergebnis der „ComStudy“, die am Salzburg NewMediaLab (SNML)
im Zeitraum von Oktober 2008 bis Januar 2010 durchgeführt wird. Das SNML, das Kom-
petenzzentrum für Neue Medien in Österreich, arbeitet daran, digitale Inhalte clever zu
strukturieren, verknüpfen, personalisieren, für alle aufndbar zu machen und nachhaltg
zu nutzen und betrachtet dabei die Community als einen wesentlichen Faktor vieler Pro-
jekte. Im Rahmen der ComStudy wurde bereits eine Studie zum erfolgreichen Communi-
ty-Aufau durchgeführt, die anhand Literaturanalysen, Best-Practce-Beispielen, Fallana-
lysen und Expertenbefragungen für unterschiedliche Szenarien konkrete Implemente-
rungsempfehlungen gibt (Schafert & Wieden-Bischof, 2009). Zusätzlich beschreiben wir
drei wesentliche Funktonalitäten von Community-Systemen, die bisher kaum dezidiert
untersucht wurden, durch Vorstellung und Vergleich unterschiedlicher Realisierungen
und Systeme, Best-Practce-Lösungen sowie die Erfahrungen mit dem Community-Auf-
bau: Die vorliegende Studie fokussiert auf die Entwicklung und Auswertung von (Meta-)
Informatonen von Communitys und ihren Aktvitäten. In zwei weiteren Studien werden
schließlich (a) die Möglichkeiten mit Empfehlungen Communitys zu unterstützen sowie
(b) Systeme zur Darstellung von Engagement und Reputaton der Community-Mitglieder
vorgestellt.

12
Sandra Schafert und Mark Markus

2 NUTZERVERHALTEN
Auch das Nutzerverhalten, also das Browsing-, Klick- oder Suchverhalten, ist eine inter-
essante Quelle. Das Nutzerverhalten wird dabei für sehr unterschiedliche Zwecke analy-
siert.

2.1 Formen und Systeme


Viele Nutzer nehmen zur Informatonsrecherche im Internet oder auf einzelnen Websi-
tes (Portalen), Suchmaschinen in Anspruch. Die Verwendung von Suchmaschinen wird
dabei durch die Inhalte des Webs, aber auch durch das Wissen der Nutzer selbst beein-
fusst. Sie geben dem Anbieter Aufschluss über die Nutzeraktvitäten und das Nutzungs-
verhalten auf seiner Website, z. B.: gesuchte Kategorien, aufgesuchte Bereiche oder Sei-
ten, Dauer des Aufenthalts, wie of der Besucher auf die Seite wiederkehrt, die Historie
der einzelnen Website-Nutzer (Klickstream), die chronologische Reihenfolge der Aufrufe
oder Suchbegrife. Nicht zu vergessen sind in diesem Zusammenhang auch die Verwer-
tung von Cookies, (Informatonen, die auf dem Computer des Nutzers der Website ge-
speichert werden), um Metainformatonen zu sammeln.
Geschlossene Systeme, bei denen sich Nutzer einloggen müssen und damit alle Aktvitä-
ten überprüfar und auswertbar sind, erfassen eine ganze Reihe von Daten des Nutzer-
verhaltens. Folgende Liste gibt eine Überblick über mögliche auswertbare Daten, die ty-
pischerweise in Community-Platormen und Sozialen Netzwerken im Bezug auf das Be-
nutzerverhalten anfallen und ausgewertet werden. Einige Daten zum Benutzerverhalten
sind:
| Einloggen | Zahl der Beiträge in Relaton zu an-
| Orte (Ortswechsel) deren Nutzern
| Anzahl der Logins | Antwortverhalten (Reaktonszeit,
| Uhrzeit (Tageszeit) Häufgkeit)
| Schreiben des ersten Beitrags | Bewertungen abgegeben
(neuer Thread) | Editeren
| Anzahl der Kommentare | Erstes Login (Registrierung)

Beispielsweise können Systeme auswerten, ob jemand in einer Nacht seinen Aufent-


haltsort häufg wechselt oder ob er sich regelmäßig zu bestmmten Uhrzeiten einloggt.
Aus solchen Daten können detaillierte Nutzerprofle generiert werden die auf spezif-
sche Interessenslagen und Verhaltensweisen hinweisen können und sowohl für Reputa-
tonssysteme als auch als Grundlage zur Verbesserung des Informatonsmanagements
verwendet werden können.

2.2 Nutzen und Nutzung


Im folgenden haben wir Anwendungen bzw. Nutzungen beschrieben, die allein auf Da-
tenmaterial aus dem Nutzungsverhalten beruhen. Darüberhinaus werden Daten zum
Nutzerverhalten in einigen Anwendungen als eine von mehreren Quellen genutzt, bei-
spielsweise bei Reputatons- und Empfehlungssystemen.

13
Evaluaton und Optmierung von Webaufriten
Durch Daten zum Verhalten kann der Anbieter Benutzerprofle erstellen, analysieren
und Interessengruppen besser identfzieren, die dann zur weiteren Optmierung der
Website beitragen können. Typischerweise wird dies genutzt, um den eigenen Webauf-
trit zu optmieren, um mehr über die Interessen und Vorlieben der Nutzer zu erfahren,
um entsprechende Angebote strategisch besser oder unter anderen Überschrifen zu
positonieren und anzubieten.

Browsingverhalten und Geschlechterschätzung


Aus Untersuchungen sind typische Vorlieben von Frauen und Männern bekannt, bei-
spielweise welche Websites sie aufrufen oder welche Art von Fotos sie vorziehen. Das
bedeutet nicht, dass eine Zuordnung aufgrund eines spezifschen Verhaltens eindeutg
und folgerichtg sein muss, allerdings ist es eine durchaus pragmatsche heuristsche
Möglichkeit, eine Annahme über das Geschlecht des Nutzers zu erhalten. Dies ist insbe-
sondere bei anonymen, d. h. also nicht eingeloggten Nutzern von Interesse.
Wie eine solche Auswertung des Browsingverhaltens auf eine (heuristsche) Zuordnung
des Geschlechts funktoniert, wird durch eine Anwendung bei Mikeonads.com (2008)
nachvollziehbar: Hier gibt man mit einem Blick den Grif auf die History-Dateien frei, das
heisst die zuletzt aufgerufenen URL sind auswertbar. Aufgrund dieser Angaben wird eine
Zuordnung vorgenommen. Eine Variante für ein Tool, das aus Nutzerverhalten auf das
Geschlecht tppt, ist der „Gender-Guesser“1, der aus den Vorlieben für Fotos das Ge-
schlecht errät und auch von jedem auszuprobieren ist.

Abbildung 3: Ergebnis der Geschlechtschätzung durch Analyse der Browsing-History


Quelle: www.mikeonads.com/2008/07/13/using-your-browser-url-history-estmate-gender/ (10/2009)

Technische Websites sind demnach (stereo-) typisch für Männer, Mode-Websites für
Frauen – Fehler sind so durchaus möglich. Gedacht ist eine solche Anwendung jedoch
nicht notwendigerweise um das Geschlecht zu erraten, sondern um Informatonen über
Interessen und Vorlieben zu erhalten um entsprechend passende Werbung platzieren zu
können. Um Daten über das Browsingverhalten zu erlangen, ist es nicht unbedingt not-
wendig, dass Nutzer die History-Daten freigeben: Es gibt Javascripts, die aus der Farbe
der „besuchten Links“ ableiten, welche Webseiten bereits aufgerufen wurden (vgl. Mi-
keonads.com, 2008; dort wird auf eine Anwendung von Paul Cook hingewiesen).
1
htp://www.espgame.org/gwap/, Stand 1.9.2009

14
Inwieweit das Browsingverhalten bei personalisierter Werbung eingesetzt wird, ist nicht
eindeutg zu klären, aber die Platzierung der oben genannten Anwendung in einem We-
blog über Werbung sowie die entsprechenden Diskussionen in den verknüpfen We-
blogs lassen vermuten, dass hier sehr viel Aktvität vorliegt.

Suchwortanzeigen
Alle großen Suchmaschinen blenden neben den Suchergebnissen auch Werbung
und/oder Links ein, die als Werbung markiert sind und zur Suchanfrage passen. Dieses
Werbeverfahren wird als SEM (Search Engine Marketng) bezeichnet. In diesem Werbe-
segment wird noch einiges ausprobiert und optmiert, die Zahl von 7 Millionen Such-
wortanzeigen im Jahr 2009 bei den Suchmaschinen MSN, Yahoo und Google zeigt jedoch
die Bedeutung, die unter anderem dazu führt, dass dieser Markt mit einem Search Ad-
vertsing Index monatlich beobachtet wird (Graf, 2009).

Suchverhalten als Basis für Brandanalyse


Das Suchverhalten wird auch im Webmonitoring eingesetzt. Mit Hilfe von Google Trends
und Google Insights lässt sich so feststellen wie häufg Google-Nutzer Suchbegrife ein-
gegeben haben. Diese Abfragen lassen sich wiederum vergleichen, in Zeitreihen oder
auch nach dem Herkunfsland der Nutzer darstellen. Folgendes Fallbeispiel verdeutlicht,
wie mit Hilfe vom Google Insight Marken in der Skiherstellerbranche sowie die Branche
an sich analysiert werden können. Gleichzeitg geht es um den Versuch einer groben Ein-
schätzung der Verlässlichkeit dieses Tools, indem die Ergebnisse mit anderen Daten und
Informatonen ver- bzw. abgeglichen werden (vgl. Markus & Schafert, 2010).
Das Web-Tool Google Insight stellt visuell dar, wie of ein Begrif mit Hilfe der Suchma-
schine Google in einem bestmmten Zeitraum (max. jedoch in den letzten fünf Jahren)
und in einer bestmmten Region (natonal und regional) gesucht wurde. Es können maxi-
mal fünf Begrife gleichzeitg gesucht und miteinander verglichen werden, wobei auch
getrennte Wörter wie „Atomic Ski“ als ein Begrif gelten. Damit kann auch die Suchhäu-
fgkeit von bestmmten Marken ermitelt werden. Ein hohes Suchvolumen impliziert
eine hohe Bekanntheit der Marke, woraus wiederum (nicht notwendigerweise) Aussa-
gen in Bezug auf die Kaufabsichten abgeleitet werden können. Die Ergebnisse der Suche
werden „normalisiert“ dargestellt, d. h. dargestellt werden nicht absolute (Such-) Zah-
len, sondern Daten in Relaton zueinander auf einer Skala von null bis 100 (vgl. Google,
Insights for Search Help). Wichtg ist, dass der gesuchte Begrif, z. B. eine Marke oder
eine Person im Internet, in ausreichender Menge gesucht worden ist, damit er bei Goo-
gle Insight überhaupt Spuren hinterlässt. Das Tool eignet sich daher nur zur Analyse von
massenhaf gesuchten Begrifen.
Folgende Abbildung zeigt, wie of fünf renommierte Skimarken gesucht worden sind. Es
handelt sich um fünf Skimarken, die einen Löwenanteil der gesamten Skiprodukton
weltweit ausmachen, wobei Salomon und Atomic zur fnnischen Amer Gruppe gehören,
die „der größte Skihersteller der Welt“ ist (Herr, 2006). Die neueren und Trendskimar-
ken, wie Armada, Pure Skis oder Amplid, tauchen in den Ergebnissen nicht auf. Anschlie-
ßend wird das Ergebnis interpretert.

15
Suchvolumen weltweit
Suchzeit: 01/2004 bis 06/2009
Suchbegriffe: „Salomon Ski“ (blau), „Atomic Ski“ (rot), „Head Ski“
(orange), „Fischer Ski“ (grün), „Elan Ski“ (dunkel blau)

2004 2005 2006 2007 2008 2009

Abbildung 4: Weltweit abnehmendes Suchvolumen nach den renommierten Skimarken.


Quelle: Ergebnisse nach Google Insights (Stand 06/2009)

Das Ergebnis verdeutlicht ein über die Jahre hinweg sinkendes Suchvolumen, das alle re-
nommierten Skiartkelhersteller gleichermaßen betrift. Die Schwankungen sind saisonal
bedingt und zeigen, dass die Suchhäufgkeit in den Wintermonaten, d. h. während der
Skisaison erwartungsgemäß stark zunimmt. Dieser Befund kann zunächst als ein abneh-
mendes Interesse an den Skiprodukten und vielleicht sogar auch am Skisport gedeutet
werden. Angesichts des Leihtrends – immer mehr Skifahrer kaufen nicht, sondern leihen
die aktuellen Skimodelle – ist bei den Schlussfolgerungen mit Blick auf das grundsätzli-
che Skiinteresse jedoch Vorsicht geboten.
Weil das sinkende Suchvolumen alle Skimarken betrift, indiziert es einen rückläufgen
Skiabsatz, der statstsch belegt ist. Von 669.000 verkaufer Paar Ski in Deutschland in
der Saison 2000/01 sank der Absatz über die Jahre hinweg kontnuierlich auf nunmehr
377.000 verkaufe Paar Ski in der Saison 2006/07. Ein Abgleich von objektven Absatz-
zahlen mit den Suchvolumina zeigt zwar eine generelle Übereinstmmung (siehe folgen-
de Abbildung), es wird aber auch deutlich, dass sich Suchanfragen aus dem Jahr 2004
keineswegs in den Absatzzahlen unmitelbar widerspiegeln. Ansonsten müsste der Ab-
satz im Jahr 2004 jedenfalls deutlich größer sein als in den Jahren 2005 und 2006. Zu-
dem kann aus den Ergebnissen indirekt eine zunehmende Sätgung des Skimarktes, die
mit einer Intensivierung des Wetbewerbs und Verdrängung verknüpf ist, abgelesen
werden. Darauf deuten die immer geringer werdenden Suchabstände zwischen den ein-
zelnen Skimarken hin. Damit verbunden ist in der Regel ein starker Preiswetbewerb
(vgl. Herr, 2005) sowie starke Konzentratonstendenzen und Übernahmen (vgl. Herr,
2006), die ebenfalls aus den Ergebnissen indirekt hervorgehen. Während die Skimarken
Salomon und Atomic noch in den Jahren 2004 und 2005 meistgesucht (und damit ver-
mutlich die bekanntesten) waren, schmolz ihr Vorsprung im Jahr 2006 fast gänzlich weg.
Im Jahre 2007 haben dann zum ersten Mal mehr Personen nach der Marke Head als
nach der Marke Atomic im Internet gesucht, während Salomon nach wie vor die meist-
gesuchte Skimarke blieb. Head konnte allerdings nicht die Bekanntheit der Marke erhö-
hen, etwa durch innovatve Produkte oder Marketngkampagnen, sondern es ist eher so,
dass das nachhaltg sinkende Skiartkelinteresse Atomic am stärksten geschadet hat. In-
direkt gibt das Ergebnis eine Austauschbarkeit von Skiprodukten und damit Diferenzie-
rungsnotwendigkeit zu erkennen (vgl. Herr, 2005; weitere Interpretatonen und Analy-
sen in Markus & Schafert, 2010).

16
Aus der Google-Insight-Analyse geht hervor, dass die Produkte von Atomic und Rossignol
auf das größte Interesse in die letzten zwölf Monate steßen, wobei dies regional sehr
unterschiedlich ausfällt: Während die Marke Rossignol vor allem in Frankreich gesucht
wurde, ist die Marke Atomic für den deutschsprachigen Raum interessanter, aus wel-
chem sie stammt (Österreich).
Die Google-Insight-Ergebnisse ergänzen, ersetzen aber nicht die traditonelle Recherche,
die Markt- oder Werbewirkungsforschung. Der Hauptvorteil liegt in der Möglichkeit,
schnell und automatsiert wertvolle Teil- und Überblickinformatonen etwa zu einzelnen
Marken in Relaton zueinander ermiteln zu können. Auch kann man gut die Bekanntheit
von neuen Produkten oder Anbietern verfolgen, vorausgesetzt, diese hinterlassen eine
deutliche Suchspur. Der Nachteil aus Sicht der Branchenanalyse liegt in den relatv gene-
rischen Erkenntnissen, die jeder guter Marketer oder Produktmanager eigentlich wissen
sollte. Das Potenzial von Google Insight ist damit eher die Untermauerung bestehender
als die Gewinnung neuer Zusammenhänge.
Allerdings sind Zusammenhangshypothesen wie „je häufger Produkte gesucht werden,
desto größer ist das Kaufnteresse“ oder „je mehr Webseiten mit Produktnamen gefun-
den werden, desto bedeutsamer ist dieses Produkt im Branchenvergleich“, zwar plausi-
bel, wurden jedoch bisher nur unzureichend empirisch überprüf wurden. Dass Begrife
häufg gesucht werden, muss nicht zwangsläufg positv konnotert sein, das kann bei-
spielsweise auch auf Negatvmeldungen oder Rückrufaktonen zurückzuführen sein, wo-
bei auch letztere bei Konsumenten positv konnotert sein können.

Suchverhalten: Weitere Nutzungen


Das Suchverhalten von Nutzern ist nicht alleine für Brand- und Produktanalysen einzu-
setzen, sondern bietet auch andere überraschende Einsatzmöglichkeiten.
| Beispielsweise hat das Deutsche Insttut für Wirtschafsforschung analysiert, inwie-
weit das Suchverhalten nach Begrifen wie „Arbeitsamt“ und „Kurzarbeit“ nach Goo-
gle Insight als Datengrundlage zur Prognose der Arbeitslosigkeit im nächsten Monat
geeignet ist und kommt dabei zu brauchbaren Ergebnissen (Askitas & Zimmermann,
2009).
| Das Suchverhalten ist ebenso auch im Fokus des Interesse um Wahlprognosen zu ge-
ben. Google hat dies im Google-Weblog bei den Präsidentschafswahlen in den USA
kommentert (s. Marketng Pilgrim, 2008), auch für die deutschen Bundestagswahlen
wurde das Suchverhalten analysiert.
| Die Suchmaschine Google hat im Jahr 2009 in den USA den Service „Flu Trends“ an-
geboten, mit dem festgestellt wurde, in welchen Regionen nach dem Begrif Grippe
gesucht wird. Wissenschafler, u. a. des „Europäischen Zentrum für die Präventon
und die Kontrolle von Krankheiten“ haben festgestellt, dass diese Suchanfragen tat-
sächlich mit dem Ausbruch von Grippewellen korrellieren (Ginsberg et al., 2009).
| Zur Optmierung von Webangeboten, z. B. Webshops ist es hilfreich, die Suchanfra-
gen der Nutzer zu analysieren. So muss sich niemand wundern, wenn er nur wenige
„Pants“ verkauf, wenn seine Kunden nach Unterhosen suchen (vgl. Interview mit
Thomas Kaiser in Gelin, 2009)
| Auch für Werbetreibende sind Analysen des Suchverhaltens aufschlussreich, um bei-
spielsweise gezielt Aktonen zu platzieren: Zu bestmmten Anlässen, beispielsweise
dem Valentnstag, wird immer nach denselben Keywords gesucht, „saisonale Search-
Trends“ werden so zu einem „kritschem Erfolgsfaktor“ (Groß, 2009).

17
Es ist anzunehmen, dass gerade für die Nutzung der Daten zum Suchverhalten noch vie-
le weitere Einsatzmöglichkeiten erprobt und entwickelt werden. So wird – teils scherz-
haf – in Weblogs gezeigt, dass im Dezember deutlich häufger nach „Sex“ gesucht wird
als in den anderen Monaten und „Sex“ damit insgesamt „wichtger“ ist als „Liebe“ ist
und dass man die regionale Analyse von Google Insights verwenden kann, um nach po-
tentellen Absatzmärkten für Ostriesentee zu suchen (Basic Thinking Blog, 2009)

Zusammenfassung
Das Wissen darüber, wohin Nutzer klicken, welche Seiten sie aufrufen und mit welchen
Begrifen sie suchen lässt sich vielfältg nutzen: Es kann der Personalisierung dienen,
z. B. für Empfehlungen, aber auch zur Schaltung passender Werbung, es auch ist we-
sentlicher Bestandteil von Reputatonssystemen. Nutzerverhalten sollte auch wesentlich
dabei unterstützen, Webangebote und deren Nutzung zu evaluieren. Insbesondere die
Suchanfragen bei Google und das Angebot von Google Insights zeigt innovatve Ansätze,
wie Nutzerverhalten auch für das Webmonitoring eingesetzt werden kann.

Abbildung 5: Nutzung des Wissens über Nutzerverhalten

18
Sandra Schafert

3 KOMMUNIKATIONS- UND VERNETZUNGSSTRUKTUR


Eine interessante Informaton über Communitys und Netzwerke ist auch, wie Personen
miteinander verbunden sind, d. h. ob sie sich kennen und miteinander kommunizieren.
Auf den Informatonen über die Kommunikaton- und Vernetzungsstruktur können nicht
nur Reputatons- und Empfehlungssysteme aufauen, sondern auch vielfältge Analysen
und Services darauf.

3.1 Daten und Formen der Analyse


Wer sich mit wem, wie und über was austauscht, ist für viele Anwendungen und Interes-
sen von Nutzen. Ganz unterschiedliche Informatonen dazu liegen vor und können aus-
gewertet werden. In geschlossenen Communitys, Mailinglisten oder Newsforen können
zum Beispiel im Bezug auf einzelne Nutzer und deren Kommunikatons- und Vernet-
zungsstrukturen folgende Aspekte erfasst und ausgewertet werden:
| hat eine Frage gestellt, die keine Antwort und keine Kommentare erhalten hat und
von wenigen Nutzern angesehen wurde,
| hat eine Frage gestellt, über die 10/25/100 Mal abgestmmt wurde,
| hat eine Frage gestellt, die von 25/100 Usern als Favorit gewertet wurde,
| hat eine Frage gestellt, die von 1.000/2.500/10.000 User angesehen wurde,
| hat eine Antwort gegeben, über die 10/25/100 Mal abgestmmt wurde oder
| ist gemeinsam mit 3 Freunden des anderen Geschlechts eingecheckt.
Darüber bieten die Vielzahl von sozialen Netzwerken und Platormen, bei denen sich
„Freund“, „Kontakte“ oder „Follower“ wählen lassen, die Möglichkeit näheres über Be-
kannte und Interessen auszuwerten. Es gibt mit „Friend-of-a-Friend“ (FOAF) sogar ein
Metadatenformat, dass diese Beziehungsnetzwerke beschreibt (FOAF-project.org).
Typischerweise spannen sich Kontakte und Kommunikaton wie ein Netz auf: Man kom-
muniziert mit einem, der wiederum mit anderen kommuniziert. Aus den Sozialwissen-
schafen gibt es mit der sozialen Netzwerkanalyse ein Verfahren, dass die Vernetzung
berechnen und darstellen lässt. Dadurch kann man gut Kommunikatonsstrukturen er-
kennen und Eigenschafen von Personen im Netz feststellen, z. B. ob sie stark vernetzt
und im Zentrum stehen oder ob sie Schlüsselpositonen zwischen Subgruppen besetzen.
Nähe und Verknüpfung wird dabei in Form von „Netzwerken“ dargestellt.
Mit dem aufommenden vielen neuen Daten im Internet wird das Verfahren vermehrt
auch zur Auswertung von diesen Informatonen eingesetzt. Beispielsweise kann das ei-
gene Netzwerke, also Kontakte und Kontakte-von-Kontakten so visualisiert werden.

19
Abbildung 6: Darstellung von Kontakten als Netzwerk
Quelle: htp://asset.soup.io/asset/0054/6740_ca5c.png (10/2009)

Häufg liegen die exakten Daten über Netzwerke nicht vor, können jedoch über Angaben
über Kontaktntensität oder Vorkommen der Namen in gleichen Dokumenten abgeleitet
werden, beispielsweise durch Analyse von Diskussionsforen. Vier Varianten von Daten
lassen sich dabei unterscheiden (Kirchhof et al., 2008, 7): Explizite soziale Verbindungen
sind beispielsweise öfentlich zugängliche Freundeslisten, explizite indirekte soziale Ver-
bindungen sind demnach Hyperlinks auf Weblogeinträge von anderen. Implizite soziale
Verbindungen sind textuelle Hinweise, die eindeutg auf eine soziale Beziehung hinwei-
sen, beispielsweise Ko-Autorschafen bei Publikatonen. Schließlich sind implizite soziale
Verbindungen beispielsweise Käufer des gleichen Produkts.

3.2 Nutzen und Nutzung


Diese direkt oder indirekt abrufaren Informatonen über die Strukturen der Kommuni-
katon und Vernetzung werden auf unterschiedliche Weise erhoben, ausgewertet und
genutzt.

Freunde und Freundesfreunde in Sozialen Netzwerken


Soziale Netzwerke wie LinkedIn, StudiVZ, Xing, MySpace und Facebook basieren wesent-
lich darauf, dass bekannt ist wer wen kennt. Das ermöglicht, die Bekannten, genannt
„Freunde“ auf dem Laufenden zu halten, nachzulesen, was diese bewegt, neue Fotos
anzusehen oder die letzte Powerpoint-Präsentaton – je nachdem welches Netzwerk
und mit welchem Hauptokus man es benutzt. Aufauend auf dem Wissen, mit wem
man bekannt ist bzw. wen man als Freund ausgewählt hat gibt es auch aufauende Ap-
plikatonen, die beispielsweise darstellen, welche Tags in einer Gruppe oder im eigenen
Bekanntenkreis gerade genutzt werden.

20
Es sind jedoch nicht nur diejenigen Personen interessant, die man bereits als Kontakte
gekennzeichnet und/oder akzeptert hat, dieses Wissen wird auch in unterschiedlicher
Form für den einzelnen Nutzer oder die Community genutzt. Im Folgenden einige Bei-
spiele dazu:
| Nutzer werden über Personen informiert bzw. diese als neue Kontakte vorgeschla-
gen, die man kennen könnte, beispielsweise weil man viele gemeinsame Bekannte
hat oder weil sie das öfentliche Profl betrachtet haben (z. B. bei Facebook).
| Bei Recherchen wird dargestellt, über wieviele Ecken (Personen) man mit jemanden
verknüpf ist, d. h. ob man beispielweise über einen gemeinsamen Kontakt vorge-
stellt werden kann (z. B. bei LinkedIn).
| In manchen Netzwerken kann man auch nachvollziehen, was die eigenen Kontakte
öfentlich mit weiteren Kontakten austauschen, z. B. auf den Pinnwänden von Nut-
zern hinterlassen, die man nicht selbst in der Kontaktliste hat (z. B. bei Facebook).
| Gerade in professionellen Netzwerken wie LinkeIn und Xing, wird über die Zahl der
bestätgten Kontakte auch eine gewisse „Bedeutsamkeit“ der entsprechenden Perso-
nen abgeleitet.
| Einige soziale Netzwerke bieten auch an, dass man anderen gemeinsame Kontakte
vorschlagen kann, dies ist besonders dann wichtg, wenn jemand neu bei einem
Netzwerk ist (z. B. Facebook).
Um die unterschiedlichen Netzwerke und Kommunikatonstools auf einer Platorm ver-
folgen und bedienen (also z. B. Statusmeldungen schreiben) zu können, gibt es Werkzeu-
ge (z. B. Tweetdeck) und Websites (z. B. Friendfeed.com) die hier die unterschiedlichen
Kanäle zentral zusammenbringen.
Aus der Vorstellung heraus, dass Mitglieder der gleichen oder verwandten Communitys
bzw. mit ähnlichen Interessen und Arbeitsgebieten auch von den Suchstrategien und
-ergebnissen der Anderen profteren könnten, werden Suchmaschinen konzeptonisiert,
die dieses Wissen adäquat verarbeiten und darstellen wollen (z. B. Chi, Pirolli & Lam,
2007; Odden, 2009). Beispielsweise wird das Wissen über das soziale Netzwerk genutzt,
um Vorschläge für den Besuch von Konferenzen bzw. einzelne Präsentatonen zu geben
(z. B. Klamma, Cuong & Cao, 2009) oder um Tagvorschläge zu geben (Klamma, Spaniol &
Renzel, 2007). Das Wissen über Kontakte und deren Vorlieben und Verhalten ist auch
Bestandteil von Empfehlungs- und Reputatonssystemen.
In den sozialen Netzwerken wird dabei experimentert, welche Arten von Informatonen
über das Kommunikatons- und Vernetzungsverhalten für die Nutzer bzw. die Communi-
ty insgesamt interessant sind und wie sie genutzt werden können. Auch für „normale“
Nutzer ist die Darstellung ihrer Verknüpfung zu anderen „interessant“, auch wenn häufg
Angaben über die Hintergründe der Darstellungen und Interpretatonsmöglichkeiten
fehlen. Beispielsweise kann man sich mit der Facebook-Applikaton TouchGraph die Ver-
knüpfung mit anderen als Netzwerk darstellen lassen.

Open Social Networking


„Friend of a Friend“ heisst das Metadatenformat, mit dem die Kontakte bzw. Netzwerke
beschrieben werden können. Die eigenen Netzwerke persönlich nutzen zu können, bei-
spielsweise um sie unabhängig von spezifschen Anwendungen auswerten und nutzen
zu können ist die Idee der Initatve „FOAF + SSL“: „FOAF+SSL is a way of allowing open
social networking, while stll leaving everything under the control of the individual. It

21
uses well-established protocols, virtually every standard Web browser supports it. Whe-
rever you need to interact over the Web with others but retain a level of trust - your se-
crets are your secrets - FOAF+SSL is there for you.“ (ESW-Wiki, 2009). Dieses Vorhaben
möchte also ermöglichen, dass man beispielsweise Adressdaten von seinen Kontakten
immer auf dem Laufenden halten kann, ohne notwendigerweise alle diese Daten öfent-
lich und zentral zugänglich halten zu müssen.

Trendforschung in Sozialen Netzen


Die Methode der sozialen Netzwerkanalyse wird derzeit mit Daten aus sozialen Netz-
werken v. a. dazu genutzt, um „Zukunfsprognosen zu generieren, die Aufschluss über
zukünfige Produktrends geben“ (s. Baumöl & Ickler, 2008). Maßgeblich ist hier eine Ar-
beitsgruppe am MIT um Peter Gloor zugange, der die Suche nach Trends mit Hilfe der
Netzwerkanalyse unter dem Begrif „Coolhuntng“ beschreibt. Durch die Analyse von be-
kannten Innovatonsprozessen hat die Arbeitsgruppe um Gloor typische „Bilder“ für (in-
novatve) Lernnetzwerke dargestellt, die wiederum bei der Identfzierung von Trendsan-
bahnungen eingesetzt werden können (u. a. Gloor et al., 2008).
Dazu wurde u. a. auch die Entwicklung von neuen Tools notwendig. Bei Condorview
wird die Vernetzung mit Hilfe des Hin-und-Her von E-Mails gemessen und dargestellt
und damit soziale Netze transparent. In der Auswertung der Inbox eines E-Mails-Nutzer
sind Newsleter oder Mailinglisten „isolierte Netzwerke“, weil man nur lesend partzi-
piert.

Meinungsführer identfzieren
Netzwerkanalysen werden in Unternehmen gezielt eingesetzt um Meinungsführer bzw.
um wichtge Knoten in Netzwerken zu analysieren. Beispielweise argumentert die öster-
reichische FAS.research so den Nutzen des Einsatzes damit: „Das Ziel der Sozialen Netz-
werkanalyse ist, Ihnen Ihre Freiheit wieder zu geben: Global Players bleiben nicht länger
unerreichbar, wichtge Kontakte lassen sich herstellen und Sie bleiben nicht mehr in der
Verfechtung rivalisierender Cliquen gefangen.“ (Homepage, Stand 12.10.2009). Das
Wissen über Netzwerke ermöglicht ausserdem, gezielte PR-Maßnahmen durchführen zu
können, indem beispielsweise Meinungsführer festgestellt werden und gezielt einge-
bunden werden (vgl. Leisenberg, 2008).

Soziale Netzwerkanalyse aus Wissenschafsperspektve


Die neuen Strukturen und Kommunikatonsformen des Internets sind auch für die Wis-
senschaf interessant, hier wird gerade vom Einsatz der sozialen Netzwerkanalyse ein
großes Potental erwartet: Hiermit sollen Einblicke in Strukturen erlangt werden, die
durch andere Verfahren nicht ohne weiteres aufgedeckt werden können. Beispielsweise
untersucht Stegbauer (2009) damit, exploratv wie in der Online-Enzyklopädie Artkel
entstehen und diskutert werden, weil in diesem Kontext herkömmliche Theorien zum
Kooperatonsverhalten scheitern (z. B. S. 103 f.).

Community-Aware-Services
Aus der Vorstellung heraus, dass Mitglieder der gleichen oder verwandten Communitys
bzw. mit ähnlichen Interessen und Arbeitsgebieten auch von den Suchstrategien und
-ergebnissen der anderen profteren könnten, werden Suchmaschinen konzeptonisiert,

22
die dieses Wissen adäquat verarbeiten und darstellen wollen (z. B. Chi, Pirolli & Lam,
2007; Odden, 2009).
Beispielsweise wird das Wissen über das soziale Netzwerk genutzt, um Vorschläge für
den Besuch von Konferenzen bzw. einzelne Präsentatonen zu geben (z. B. Klamma,
Cuong & Cao, 2009) oder um Tagvorschläge zu geben (Klamma, Spaniol & Renzel, 2007).
Das Wissen über Kontakte und deren Vorlieben und Verhalten ist auch Bestandteil von
Empfehlungs- und Reputatonssystemen.

Wissen über soziale Netze analysieren und nutzbar machen


Ralf Klamma leitet eine Forschungsgruppe, die sich mit der Nutzung unterschiedlicher
Metadaten beschäfigt, sich dabei aber auf soziale Netze und deren Anliegen fokussiert.

Wissen über soziale Netze analysieren und nutzbar machen - im Gespräch mit Ralf Klamma

? In Ihrer Gruppe beschäfigen Sie sich mit unterschiedlichen Metadaten und wie
man sie nutzen kann. Was ist so atraktv an dem Wissen über die sozialen
Strukturen von Usern und Communitys? Wozu kann es genutzt werden?

Wir haben einen neuartgen Ansatz für sogenannte refektve Community-


Informatonssysteme entwickelt. Dieser Ansatz beruht zum einen auf der
Möglichkeit für Praxisgemeinschafen fortlaufend über ihre Nutzung von
Informatonssystemen (IS) zu refekteren, zum anderen auf der Möglichkeit,
diese Erfahrungen mitelbar für die Weiterentwicklung der Informatonssystem-
komponenten einzusetzen. Daten über soziale Strukturen sind deshalb so
atraktv, weil sie zwischen quanttatven und qualitatven Methoden der
Informatonssystembewertung vermiteln. Nutzungshäufgkeiten und
qualitatve Aussagen über die Qualität von IS können besser gewürdigt werden,
wenn zusätzliche Informatonen über die Positon der Nutzer in einer sozialen Struktur vorliegen. Bei
unseren Forschungen sind wir inzwischen so weit, bestmmten sozialen Strukturen positve oder negat-
ve Einfüsse auf die IS Entwicklung zuschreiben zu können. Das klassische Beispiel ist der sogenannte
Troll, eine immer wieder aufretende Rolle, die anderen Benutzern durch wenig zielführende Diskussio-
nen Zeit und Energie raubt. Und auch hier unterscheidet sich unser Ansatz von vielen bedrohlich wirken-
den Aktvitäten zur Überwachung der Nutzer in sozialer Sofware. Wir stellen die Daten nur den Nutzern
in den Praxisgemeinschafen selbst zur Verfügung. Diese mögen über die weitere Nutzung selbst ent-
scheiden und auch über die Konsequenzen, die sie aus den gewonnenen Erkenntnissen ziehen. Für ein-
geschränkte Fragestellungen arbeiten wir aber auch an Recommender-Systemen, die auf der Analyse
der sozialen Netze beruhen.

? In welcher Weise werden solche Informatonen über soziale Netzstrukturen konkret eingesetzt?

Wir setzen diese Systeme gezielt zusammen mit professionellen Praxisgemeinschafen ein, bestehend
also aus Künstlern, Ingenieuren, Ärzten, Wissenschaflern usw. Ein aktuelles Beispiel ist die nachhaltge
Entwicklung des Bamiyan Tales in Afghanistan, wo eine bunte Mischung aus Wissenschaflern, Ingenieu-
ren, Denkmalschützern, Kulturbürokraten, Politkern, und Tourismusmanagern damit beschäfigt ist,
einen Masterplan für die Nutzung des Tales nach Beendigung des Bürgerkrieges zu erstellen. Hier stellen
wir mobile soziale Sofware zur Verfügung und beraten. Wir haben aber auch gerade ein neues Projekt
gewinnen können, bei dem es um die Untersuchung der Kooperatonsmuster zwischen europäischen
Schulen geht. Im Moment sind in der über die Jahre angelegten eTwinning-Datenbank 50.000 Schulen
aufgenommen. Die spannende Frage ist hier, wie Lehrer die Analyse und Visualisierung existerender Ko-
operatonsmuster lernen und nutzen können, um ihr eigenes Kooperatonsverhalten zu optmieren.

23
? Wo sehen Sie gerade besonders hohen Forschungs- und Entwicklungsbedarf?

Das Gebiet bildet gerade eine neue Disziplin heraus, die sich „Web Science“ nennt. Hier geht es darum,
anspruchsvolle analytsche Einsichten in die generelle Natur von Netzen - insbesondere des Webs - mit
herausragenden Ingenieursleistungen zur Erreichung eines gewünschten Verhaltens von Nutzern zu ver-
binden. Web Science wird sicherlich noch einige Jahre brauchen, um sich als eigenständige Disziplin zu
etablieren, aber an der RWTH Aachen haben wir schon begonnen, Studenten aus verschiedenen techni-
schen Masterprogrammen in Vorlesungen, Seminaren und Masterarbeiten mit dieser neuen Disziplin
vertraut zu machen. Forschungsbedarf gibt es vor allem beim Schrit von der statschen Analyse von
Netzen hin zu dynamischen Analyse, die alle Formen von Veränderungen über die Zeit in Netzwerken
berücksichtgt. Hier gibt es erste Schrite zu einem vertefen Verständnis dynamischer Prozesse in Net-
zen, z. B. bei der Analyse von Bewegungsmuster von Nutzern mobiler Informatonssysteme, aber noch
keine ausgearbeitete Theorie. Ein weiterer Punkt ist ein umfassenderes Verständnis der verwendeten
Medien in sozialen Netzen. Bislang werden Medien ausgeblendet und bilden einen blinden Fleck der
Theorie sozialer Netze. Wir verbinden in unseren Forschungen Entwurfstheorien der Informatk mit ope-
ratonalen Medientheorien, die eine medienspezifsche Ausgestaltung von Informatonssystemen erlau-
ben, z. B. bei der Nutzung von mobilem Multmedia. Letztlich will unsere Forschung dem Nutzer des
Webs nicht nur die Folgen des eigenen Handelns bewusst machen, sondern auch sein „Leiden“ unter
den Handlung der anderen. Durch die immer weiter Durchdringung unserer Lebenswelt durch Informa-
tonstechnologien müssen wir uns immer mehr bewusst werden, dass wir auch durch die Spuren beur-
teilt werden, die wir im Netz hinterlassen.

Dr. Ralf Klamma leitet die Arbeitsgruppe „Metadata in Community Informaton Systems“ (MCIS) am
Lehrstuhl für Informatonssysteme und Datenbanktechnologie der RTHW Aachen. Die Gruppe beschäf-
tgt sich im Rahmen des DFG Exzellenzclusters UMIC (Ultra High-Speed Informaton and Communicaton)
und des EU IP ROLE (Responsive Open Learning Environments) sowie einiger anderer natonaler wie in-
ternatonaler Forschungsprojekte mit der Entstehung, dem Nutzen und die Wartung von Metadaten in
Social Sofware und Community-Systemen beschäfigt. Dabei wird auch die Rolle von Metadatenbe-
schreibungsstandards in unterschiedlichen Anwendungskontexten untersucht.

Zusammenfassung
Das Wissen über Kommunikatons- und Vernetzungsstrukturen kann ganz unterschied-
lich genutzt werden. So hilf es zum einen, das persönliche Informatons- bzw. Kontakt-
management zu verbessern und dient generell dazu, die Kommunikaton von Nutzern
gleicher Services oder von Communitys zu verbessern. Auch kann es dienlich sein, um
Communitys efektv zu moderieren und die Qualität der Prozesse zu evaluieren.
Schließlich ergeben sich aus diesen Strukturen und Abläufen auch Hinweise für beson-
ders innovatve Vernetzungen und Prozesse.

24
Abbildung 7: Nutzung Kommunikatons- und Vernetzungsstruktur

Insbesondere die Methode der Sozialen Netzwerkanalyse hat in den letzten Jahren er-
heblich an Aufmerksamkeit gewonnen und wird immer häufger für die Daten und Mög-
lichkeiten des Webs adaptert und eingesetzt.

25
26
Sandra Schafert und Diana Wieden-Bischof

4 BEWERTUNGEN
Wenn viele Produkte oder Informatonen vorhanden sind, verlässt man sich gerne auf
Empfehlungen oder Reputatonssysteme2. Grundlage für diese sind Bewertungen, die
Leser oder Kunden oder andere Nutzer abgegeben haben.

4.1 Formen und Einsatz


Bewertungen können auf unterschiedliche Weise vorgenommen werden, so gibt es qua-
litatve Verfahren wie sie in der Online-Enzyklopädie Wikipedia eingesetzt werden: Dort
werden mit Hilfe von Diskussionsseiten Verbesserungsvorschläge gemacht oder Kritk
geübt.

Abbildung 8: Kennzeichnung eines qualitatv unzureichenden Beitrag bei Wikipedia


Quelle: Wikipedia.de (10/2009)

In quanttatven Systemen, kommen standardisierte Formulare oder Ratng-Skalen zum


Einsatz. Mit letzterem werden wir uns in diesem Abschnit beschäfigen.

Abbildung 9: Zwei Formen der Bewertung


Quelle: Amazon.de, Tripwolf.com (10/2009)

Bewertungen können auf unterschiedliche Weise z. B. in Form von Sternen, Smileys aber
auch nach dem Schulnotensystem dargestellt werden. Dem Einsatz sind keine Grenzen
gesetzt und sowohl Inhalte (wie Geschichten, Artkel), Gegenstände (wie Autos, Brief-
marken) als auch Personen und Organisatonen (wie Arbeitgeber, Ärzte, Lehrer) können

2
Empfehlungs- und Reputatonssysteme sind die Themen der beiden folgenden Veröf-
fentlichungen im Rahmen des Projektes ComStudy.

27
bewertet werden. Anbieter können somit leichter den Wert oder die Bedeutung des
Sachverhalts, Gegenstands oder Inhalts für die Nutzer einschätzen.
Für praktsch alle Produkte und Dienstleistungen des Alltags, z. B. Elektroartkel, Hotels
oder Skiprodukte lassen sich im Web Foren fnden, bei denen Nutzer und Kunden Be-
wertungen hinterlassen. Eine Auswertung der Bewertungen, beispielsweise ein Produkt-
vergleich, gibt häufg hilfreiche Rückmeldungen zum Produkt bzw. den Dienstleistungen.
Zu den bekannteren Angeboten gehören Ciao.de und Qype.at (vgl. Markus & Schafert,
2010).
Bewertungssysteme bzw. darauf aufauende Empfehlungs- und Reputatonsysteme ha-
ben mit einigen Herausforderungen zu kämpfen, zu den bekannten zählen: Das Cold-
Start-Problem bezeichnet die Tatsache, dass zunächst keine oder nur wenige Bewertun-
gen vorliegen, „Feedback Padding“ ist das Erschleichen von günstgen Bewertungen und
„Ballot Stufng“ ist der Versuch, durch mehrmaliges Bewerten das Ergebnis zu beein-
fussen.

4.2 Nutzen und Nutzung


Im Folgenden werden wir an einigen Beispielen zeigen, welche Formen der Bewertung
bekannte Webangebote nutzen und stellen einzelne Anwendungen vor.

Bewertungssysteme bei bekannten Webangeboten


Im Rahmen einer Diplomarbeit bei Salzburg Research wurden bekannte Webangebote,
nämlich der Verkaufplatormen Amazon und Ebay, sowie der beiden kollaboratv entwi-
ckelten Online-Enzyklopädien Wikipedia (in beiden Versionen) sowie Citzendium im
Hinblick auf ihr Bewertungssystem analysiert.
Amazon Ebay Wikipe- Wikipe- Citzen-
dia dia neu dium
Geschlossenes System P P P
Sichtbarkeit von Benutzerdetails P P P
Verschiedene Benutzergruppen P
Kommentare und Diskussion P P P P P
Berücksichtgung der Reputaton P P P P
Bewertung von Inhalten P
Bewertung von Bewertern P
Darstellung der Ergebnisse als Zahlenwerte P P
Darstellung der Ergebnisse als Balken oder Sterne P P
Darstellung der Ergebnisse als Wörter P
Anzahl von Bewertungen P P
Anzahl der bewerteten Inhalte P P
Tabelle 1: Einsatz von Bewertungssystemen bei bekannten Webangeboten
Quelle: gekürzte Darstellung einer Darstellung in Gruber (2008)

Bei allen Angeboten kommen demnach auch qualitatve Verfahren zum Einsatz, wobei
die quanttatven Empfehlungssysteme mit Sternen und Balken wohl eher bei den kom-
merziellen Anbietern zu fnden sind.

28
Produkt- und Dienstleistungsbewertung: Datngjungle
Im Web gibt es eine Vielzahl von Portalen die Meinungen zu Produkten und Dienstleis-
tungen abfragen und damit versuchen, einen Überblick über den Markt zu geben. Am
Beispiel von Datngjungle zeigen wir, wie dabei Bewertungen vorgenommen werden
können.

Tabelle 2: Bewertungsformular bei Datngjungle (Ausschnit)


Quelle: htp://www.datngjungle.de/ (10/2009)

Datngjungle versucht einen Überblick über Online-Partneragenturen zu geben und bit-


tet deren Nutzer einen Fragebogen auszufüllen. Die Ergebnisse, also Empfehlungen und
Ranglisten von solchen Online-Partneragenturen basieren auf diesen Angaben. Datng-
jungle ist also – wie alle vergleichbaren Angebote – auf die Bewertungen seiner Nutzer
angewiesen, auf welchen weitere Empfehlungen bzw. die Reputaton und Ranglisten der
Anbieter aufauen.

Produktbewertungsportale
Für Internet-Nutzer sind die Bewertungen von Produkten sowie Online-Shops entschei-
dend für ihren Einkauf, wie die Befragung einer Internet-Beratungsagentur zeigt (Fitkau
& Maaß Consultng, 2008).

29
Abbildung 10: Bewertung von Nutzermeinungen bei Kaufentscheidungen
Quelle: htp://www.w3b.org/e-commerce/produktbewertungen-
beeinfussen-kaufentscheidungen.html (10/2009)

Hinter den Bewertungsplatormen von Produkten (dies gilt auch für die Angebote mit
Preisvergleichen) verbergen sich unterschiedliche Businessmodelle: So fndet man bei
Idealo.de und Billiger.de nur Produkte von Händlern, die für diesen Service zahlen; bei
Dealjäger dagegen können Nutzer selbst Produkte einstellen (vgl. Randler, 2009). Der
Oto-Konzern hat mit Smatch.com eine Bewertungsplatorm mit Community-Feature,
bei der nur spezifsche Produkte aus seinem Angebot vorgestellt werden (Mode-, Mö-
bel-, Lifestyletrends).
Auch bei Smatch.com ist davon auszugehen, dass der Oto-Konzern das Feedback der
Nutzer zur Verbesserung seines Warenbestands nutzt. Der eigentliche Nutzen des Ange-
bots besteht jedoch weniger darin, die konkreten Bewertungen zu erhalten als um den
Service herum eine Community aufzubauen die letztlich durch ihre Aktvitäten den Ab-
satz von Oto erhöhen sollen, der Verkauf ist und bleibt das Kerngeschäf (s. Groß,
2008). Community-Einbindungen sind für Online-Shops nicht zwangsläufg notwendig;
Experten empfehlen den Shop-Anbietern nicht unbedingt eigene Communitys aufzubau-
en, aber mit bestehenden Angeboten – beispielsweise den Bewertungsplatormen – zu
kooperieren (vgl. Groß, 2008).

Nachrichtenranking mit Yigg


Es gibt jedoch eine Anwendung, in der sich die Tätgkeit bzw. die Community rund um
das Tagging und Bewerten von Nachrichten herum bildet, es also als wesentlichen Inhalt
betrachtet: Die Website Yigg.de beschreibt sich folgendermaßen (vgl. Website, Stand
März 2009):

30
„YiGG ist eine Nachrichten-Website, auf der die Benutzer selber Nachrichten einstellen,
bewerten und kommenteren können. Die Community der Nutzer ist sozusagen das Re-
daktonsteam, das darüber entscheidet, welche Nachrichten den Lesern präsentert
werden sollen. YiGG bietet allen seinen Nutzern die Möglichkeit, Nachrichten zu bewer-
ten. Du bewertest eine Nachricht, indem Du einfach auf den grünen Buton neben jeder
Nachricht unter dem Stmmenzähler klickst. Die besten Nachrichten kommen auf unsere
Homepage, wo sie jeder neue Besucher sofort lesen kann. Dabei kombiniert YiGG sozia-
les Bookmarking, Blogs, RSS-Feeds, Nachrichteneinträge, Tags, Videos und mehr. Da die
Benutzer entscheiden, was interessant ist, handelt es sich um eine nicht-hierarchische
Nachrichtenverteilung.“

Abbildung 11: Screenshot von Yigg.de


Quelle: Yigg.de (03/2009)

Meinungsumfragen am Beispiel I-Predict


Seit Juni 2007 stellt MSNBC seinen Nutzern iPredict für Abstmmungen zur Verfügung.
Nutzer werden aufgerufen, zu verschiedenen Aussagen und Geschehnissen Bewertun-
gen abzugeben. Dabei kann eine abgestufe Beurteilung von „very likely“ (sehr wahr-
scheinlich) bis „very unlikely“ (sehr unwahrscheinlich) abgegeben werden. Sie können
zwischen sechs verschiedenen Kategorien (Politk, News, Unterhaltung, Business, Ge-
sundheit, Sport und Technologie) auswählen, um ihre Meinungen in diesen Bereichen zu
äußern. Pro Tag ist nur eine Bewertung pro Frage möglich (Wieden-Bischof & Schafert,
2008, 24f).

31
Abbildung 12: Abstmmung bei iPredict vom 18.3.09
Quelle: MSNBC htp://www.msnbc.msn.com/id/18661488/vid/24982552 (03/2009)

Nach Abgabe der Bewertung erscheint direkt im Diagramm ein grünes Kästchen „You“
(Du), welches die eigene Bewertung mit der durchschnitlichen Leserbewertung im ro-
ten Kästchen gegenüberstellt. Die „eigene Stmme“ wird durch ein Cookie im System ge-
speichert. Kehrt man daher nach einer längeren Zeit zu der Umfrage zurück, fndet man
seine alte Bewertung vor und kann erneut zu dem Thema abstmmen. Nutzer können
also nicht nur die Veränderung der durchschnitlichen Nutzerbewertung grafsch darge-
stellt verfolgen, sondern auch die Änderungen der eigenen Einschätzungen (Wieden-Bi-
schof & Schafert, 2008, 24f).
Werden im Zeitraum der Umfrage auf dem Nachrichtenportal thematsch zusammen-
hängende Artkel bzw. Schlüsselereignisse veröfentlicht, dann werden diese ebenfalls
automatsch im Diagramm in Form eines kleinen Vierecks angezeigt. Es beinhaltet Infor-
matonen über den Titel des Artkels und sein Erscheinungsdatum sowie Informatonen
über die durchschnitliche Bewertung der Frage bis zu diesem Zeitpunkt und der Anzahl
der Bewertungen. Dadurch kann gut beobachtet werden, ob der Artkel beispielsweise
Auslöser für Meinungsänderungen ist/war. Klickt man auf den Titel des Beitrags, dann
wird man automatsch auf den vollständigen Artkel im Portal verlinkt (Wieden-Bischof
& Schafert, 2008, 24f).

Abstmmung: Der Batleout-Fotowetbewerb


Bei Batleout (batleout.zapak.com) bewerten Mitglieder jeweils zwei gegenübergestell-
te, hochgeladene Fotos von anderen Nutzern. Der Wetkampf um das bessere Bild dau-
ert fünf Tage; das Foto mit der höheren Punktzahl gewinnt. Wetbewerbe von Nutzern
ofener Video- und Fotoplatormen um das beste Bild werden auch zu speziellen The-
men durchgeführt, manchmal werden Preise von Firmen gesponsert, der Wetbewerb
wird also (auch) im Rahmen von PR-Aktonen durchgeführt (vgl. htp://www.buzznet.-
com/www/contests).

32
Zusammenfassung
Im Überblick ergeben sich folgende drei Nutzungsmöglichkeiten von Rankings: Zunächst
einmal kann es dem eigenen Informatonsmanagement dienen (z. B. um schlechte Er-
fahrungen mit Händlern zu noteren), dann nutzt diese Informaton der Community, da
darauf Empfehlungssysteme und Reputatonssysteme aufauen und schließlich ergeben
sich insbesondere für Unternehmen viele Möglichkeiten des Webmonitorings, beispiels-
weise zur Evaluierung von Produkten oder potentellen Marktchancen und Innovatons-
bedürfnissen.

Abbildung 13: Nutzung von Bewertungen

Im Bezug auf Bewertungssysteme ist zu erwarten, dass hier zukünfig noch weitere
Möglichkeiten entwickelt und erprobt werden, wie Bewertungen vorgenommen, darge-
stellt und ausgewertet werden können.

33
34
Sandra Schafert, Wolf Hilzensauer und Diana Wieden-Bischof

5 SOCIAL TAGGING
Im Folgenden betrachten wir eine relatv neue Variante von Metadaten die überra-
schend populär ist und der wir uns daher in einem eigenen Abschnit beschäfigen.
In traditonellen Medienarchiven werden Materialien zu Kategorien und Unterkategori-
en zugeordnet, welche häufg auch zusätzliche Kurzbeschreibungen und Schlagworte
beinhalten. Im Web hat sich ein Verfahren etabliert, das Nutzern ermöglicht, Webseiten
oder anderen Ressourcen (Bilder, Videos, Musikstücke) mit eigenen Schlagworten zu
markieren, sie zu „taggen“ (von Engl. „tag“: Etket). Mit Hilfe der Tags können andere
entsprechende Ressourcen recherchieren; schnell haben sich populäre Webdienste ent-
wickelt.

5.1 Konzept und Anwendungen


Social Tagging, also das gemeinsame Taggen, führt zur Entstehung von Metainformato-
nen, die wiederum neue Zugänge zu Ressourcen ermöglichen. Weinberger (2007) be-
schreibt in seinem Buch „Everything is miscellaneous: the power of the new digital dis-
order“ wie diese neuen Metainformatonen im Vergleich zu herkömmlichen (hierarchi-
schen) Kategoriensystemen zu scheinbar chaotschen Zuordnungen führen, tatsächlich
aber neue, überzeugende und adaptve digitale Ordnungssysteme schafen. Die „Schlag-
wortsammlung, die aus den Tagging-Aktvitäten aller Nutzer/innen innerhalb eines Sys-
tems erwächst und sich dynamisch mit jeder neuen Eingabe ändert“ wird als „Folksono-
my“ bezeichnet, einem Kunstwort aus „Taxonomy“ (Engl. für Taxonomie, Systematk)
und „Folk“ (Engl. für Volk, Leute; s. Gaiser, Hampel & Panke 2008, 12). Während die Er-
zeugung von traditonellen Metadaten also eher einem ausgewählten Benutzerkreis vor-
behalten ist, sind beim Social Tagging potentell alle Benutzer beteiligt (Derntl et al.,
2009). Es ist also „eine ofene, efziente Möglichkeit der Klassifkaton von
Dokumenten“ weil „eine breite Palete von unterschiedlichen Termen für die Beschrei-
bung eines Dokuments bereitgestellt wird“ (Güntner, Sint & Westenthaler, 2009, 192).
Die Schlagworte, die beim Social Tagging benutzt werden, sind in der Regel nicht auf in-
haltliche Beschreibungen beschränkt, sondern können sich auch auf den Materialtyp
(„website“, „blogpost“) beziehen und persönliche Anweisungen („toread“) oder auch Be-
wertungen sein („cool“; vgl. Barbosa, 2008, 5).
Aus Sicht der Nutzer werden u. a. folgende Motve genannt, warum sie Tags verwenden
bzw. sich beim Social Tagging beteiligen (vgl. Marlow et al. 2006): um das spätere Aufn-
den der Dokumente zu erleichtern, einfach um beizutragen und auch um zu teilen, um
Aufmerksamkeit zu erreichen, aber auch um sich an Spielen und Wetbewerben zu be-
teiligen, um sich selbst zu präsenteren oder auch um die eigene Meinung auszu-
drücken.
Tagging-Systeme werden auf zweierlei Weisen genutzt: Zum einen können sie im System
angeboten werden, d. h. die Tags im ofenen Fotoarchiv FlickR werden dort erstellt und
verwaltet. Daneben gibt es auch zentrale Tagging-Services wie delicious (bis August
2008: del.icio.us), die es erlauben, jede Webseite zu taggen und diese Informatonen
wiederum allen Nutzern zugänglich zu machen.
In so genannten „Tag-Clouds“ („Tag-Wolken“) werden die am häufgsten genutzten Tags
dargestellt, wobei wiederum häufger genutzte Tags dicker und größer dargestellt wer-

35
den. Auf diese Weise erhält man einen schnellen Überblick über Ressourcen, beispiels-
weise über Einträge in Weblogs.

Abbildung 14: Tag-Wolke des Salzburg NewMediaLab (Stand Februar 2009)

Eine weitere Variante des Taggens von Bildern ist das Taggen von einzelnen Punkten
oder Bereichen in Bildern. So kann man beispielsweise im ofenen Fotoarchiv FlickR und
im sozialen Netzwerk Facebook Bilderausschnite taggen bzw. auch mit den Proflen an-
derer Nutzer verknüpfen. Auch eine Variante des ESP-Game, das wir im Folgenden aus-
führlicher vorstellen werden, nutzt diese spezielle Variante des Taggens.

5.2 Nutzen und Nutzung


Im Folgenden beschreiben wir eine Reihe von konkreten Beispielen, wie Social Tagging
eingesetzt und genutzt wird.

Delicious: Social Bookmarking


Social Tagging wird in der Regel mit der Website Delicious in Verbindung gebracht: Deli-
cious ist ein Social-Bookmarking-Service, d. h. mit der Hilfe dieses Services können Nut-
zer Webadressen speichern, mit Schlagworten versehen und mit anderen teilen. Dazu
ist inzwischen nicht mehr notwendig, die Website Delicious aufzurufen, da der Service
direkt im Browser integrierbar und abrufar ist.

36
Abbildung 15: Ergebnisse der Suche nach dem Tag „ComStudy“ bei Del.icio.us (Ausschnit)
Quelle: htp://delicious.com/search?p=comstudy (03/2009)

In einer unveröfentlichten Studie wurde verglichen, wie die Recherche mit Hilfe von
Del.icio.us im Vergleich zu Suchmaschinen und Webverzeichnissen abschneidet (s. Wi-
chowski, 2009): Morrison (2007) stellte dabei fest, dass Delicious hier einen knappen
zweiten Platz einnimmt. Zudem stellte er jedoch fest, dass eine Kombinaton der Deli-
cous-Tags mit einem kontrollierten Vokabular bessere Ergebnisse liefert als die Recher-
che in Webverzeichnissen.

Tagging bei ofenen Foto- und Videoarchiven


Im Rahmen dieser Studie haben wir sechs der größten ofenen Foto- und Videoportale
hinsichtlich des Taggings untersucht. Dabei lässt sich feststellen, dass von den sechs ge-
wählten Portalen nur beim Video-Portal YouTube, das Taggen von Videos durch die Nut-
zer nicht vorgesehen ist und auf die Ersteller der Videos beschränkt ist. Bei einigen der
Angebote (z. B. FlickR) können die Eigentümer der Bilder festlegen, ob andere Nutzer die
Fotos bzw. Bilder taggen können; sehr häufg wird dies nicht erlaubt.

37
Name Start Anzahl der Kategorie URL Tagging
Mitglieder
Broad- 2006 25.400.000 Videos, broadcaster.com Videos der Nutzer können getaggt
caster auch live werden, „related tags“ werden zur
weiteren Recherche angeboten.
Buzznet 2005 10.000.000* Musik buzznet.com Es kann getaggt werden, allerdings ist
dies z. T. durch die Nutzer selbst ein-
geschränkt.
Flickr 2002 4.000.000 Fotos fickr.com Es kann getaggt werden, allerdings ist
dies z. T. durch die Nutzer selbst ein-
geschränkt. Es kann nach Tags recher-
chiert werden.
Fotki 1998 5.000.000 Fotos fotki.com Taggen möglich – Recherche via Tags
möglich und prominent platziert.
Fotolog 2002 24.339.520* Fotos fotolog.com Taggen und Recherche der Tags ist
möglich, andere Nutzer werden mit
deren häufgsten Tags „beschrieben“.
YouTube 2005 40.000.000 Videos youtube.com YouTube bietet nur den Erstellern der
Videos an, Tags zu erstellen.
Tabelle 3: Bekannte ofene Foto- und Videoarchive: Nutzerzahlen und Taggingmöglichkeiten
Quelle: Startjahr, Nutzerzahlen und Kategorie nach www.linqia.com bzw. (*)
Betreiberangaben, Stand November 2008, Tagging: eigene Recherchen

Tagging von Kunstobjekten: Projekt Steve.Museum


Social Tagging wird nur selten in digitalen Archiven der Bibliotheken, Archive und Muse-
en eingesetzt, ein Beispiel ist das Projekt steve.museum beim Metropolitan Museum3.
Versuchsweise wurden im Herbst 2005 Freiwillige gebeten, 30 Bilder der Sammlung des
Metropolitan Museums zu taggen. Diese Tags wurden mit der professionellen Beschrei-
bung aus dem Katalog verglichen (Chun, Cherry, Hiwiller, Trant & Wyman, 2006): Die
Tags wurden von den Fachleuten auf Relevanz überprüf und obwohl es nur ein kleines
Testsetng war, sofort in den Katalog aufgenommen. Grund dafür war, dass rund 80 Pro-
zent der Tags in den vorhandenen Beschreibungen nicht genutzt bzw. verwendet wur-
den. Daher betrachtete man die von den Freiwilligen genannten Tags als sinnvolle und
hilfreiche Ergänzung des Katalogs. Folgende Illustraton zeigt zunächst, wie unterschied-
liche Nutzer das Objekt mit der Nummer 17.190.746 aus der „The Metropolitan Muse-
um’s Collecton“ taggen:

3
htp://www.steve.museum

38
Abbildung 16: Tagging von Objekten
Quelle: Chun, Cherry, Hiwiller, Trant & Wyman (2006), Abbildung 2

Der Katalogeintrag dieses Beispiels und die gesammelten Tags der Nutzer sind in der Ta-
belle auf der folgenden Seite exemplarisch dargestellt.
Das Projekt läuf weiter, und eine Reihe von Veröfentlichungen lassen sich dazu fnden.
So stellt Trant (2008) dar, dass die Tags der Nutzer helfen können, den vorhandenen
„mis-match between vocabulary of visitor and the museum“ zu überwinden: Üblicher-
weise recherchieren und fragen Nutzer der Archive eben selten nach den im Katalog ver-
zeichneten Merkmalen der Artefakte, sondern eher nach Aspekten, die über die Tags
der Nutzer hinzugefügt werden (könnten). Die Sofware des Projekts wurde für Museen
und andere Applikatonen erweitert und es gibt inzwischen auch eine Anwendung für
das soziale Netzwerk Facebook4, die den Facebook-Nutzern erlaubt, Kunst zu taggen und
damit zum Projekt beizutragen.
Ein weiteres Beispiel für die Verwendung von Tags im Bereich der Bibliotheken, Archive
und Museen ist die Biodiversity Heritage Library (BHL), eine Initatve von zehn großen
naturhistorischen Museumsbibliotheken, Bibliotheken botanischer Gärten sowie For-
schungsinsttuten aus den USA und dem Vereinigten Königreich. Ziel der Initatve ist es,
eine Strategie zur Digitalisierung ihrer Bibliotheksbestände zu erarbeiten und diese
(langfristg) global im Rahmen einer „Biodiversity Commons“5 online verfügbar zu ma-
chen. Die Startseite erlaubt dabei nicht nur die Suche nach unterschiedlichen Kategorien
(wie Titel, Autoren, Themen, Namen, Karten oder Jahr) der bereits erschlossenen Inhal-
te, sondern auch die Suche/den Zugang zu den unterschiedlichen Themen über Tags.

4
htp://apps.facebook.com/steve-museum
5
htp://www.biodiversitylibrary.org

39
Cataloguing from The Metropolitan Museum’s Sample Terms Collected
Collectons Management System
Artst/Maker(s) Maker: Joachim Friess, ca. 1579-1620, m. 1610 A sampling of unique terms (not in
Title Diana and the Stag the museum’s collectons manage-
Object Name AUTOMATON ment system) collected from volun-
Date First quarter 17th century, (about 1620) teer cataloguers.
Culture German (Augsburg) acton
Made in Country: Germany, City: Augsburg animal
Medium Silver, partly gilt, jewels, enamel antler
Classifcaton Metalwork-Silver archery
Dimensions 14 3/4 x 9 1/2 in. (37.5 x 24.1 cm) arrow
Credit Line Gif of J. Pierpont Morgan, 1917 baroque
bejeweled
Department European Sculpture and Decoratve Arts
bow
Markings
bridle
[1] A pine cone (Augsburg town mark in use between 1620 and 1625).
chain
See Helmut Seling, Die Kunst der Augsburger Goldschmiede 1529-1868,
clockwork
Munich, 1980, vol. III, p. 19, no. 44. [2] Roman capitals I F within a rect-
container
angle (cameo) (maker's mark of Joachim Friess or Fries, born in Lubeck
deer/reindeer
about 1579 master goldsmith in Augsburg in 1610, died 1620). See Sel-
dog/dogs
ing, Vol. III, p. 143, no. 1248. [3] A Roman capital B below a crown and
fguratve
within a shield (cameo), unidentfed. [4] A Roman capital E below a
gilded
crown, and within a shaped reserve (cameo) (French guarantee mark for
gold
Foreign silver in use between 1809 and 1819). See Tardy, Internatonal
horse
Hallmarks on Silver, Paris, 1981, p. 190. Locaton of marks: [1] On the
hunt/hunter/huntng/huntress
neck and inside the neck, and on the base. [2] Twice on the neck, on top
intricate
of the base. [3] Inside and on the outside of the neck. [4] Inside the
jumping
neck.
leap/leaping
Descripton
luxury
Diana seated on stag, with Cupid on croup, and three hounds below;
mechanical
stag's head removable, body a fask; spring-driven mechanism in base
movement
permits automaton to move. Diana wears a crescent set with eight rose
mythological/mythology
diamonds and one pink tourmaline; stag with coronet, pierced collar,
nude
lion mask on breast and trappings of scrolling ornament and cherubs;
ornamental/ornamentaton
set with three pink imitaton tourmalines; on base three lizards, two of
/ornamented
them with green enamel, one small lizard, two frogs and four beetles,
ornate
one of them with green enamel; octagonal casket-like base, decorated
precious
with applied ornament in same style as trappings; in center of lef side
rearing
movable key-hole cover on spring.
rider/riding
Accession Num- saddle
17.190.746
ber woman
Tabelle 4: Dokumentaton der Sammlung im Managementsystem im Vergleich mit den Schlag-
worten der Nutzer am Beispiel eines Objektes (Nr. 17.190.746)
aus der „The Metroplitan Museum ’s Collecton“
Quelle: Chun, Cherry, Hiwiller, Trant, & Wyman, 2006

40
Gerade die Beispiele Untersuchungen aus dem Bereich der Archive der Bibliotheken,
Museen und Archive zeigen, dass Tagging die vorhandenen professionellen Beschreibun-
gen der Archivare sinnvoll ergänzen, weil sie häufg(er) den Rechercheinteressen und
-verhalten der nicht- und semiprofessionellen Anwender entsprechen, die beispielswei-
se tendenziell eher nach Äußerlichkeiten als technische oder historische Rahmendaten
recherchieren.

Social Tagging bei Nachrichten-Sites


Nur wenige Nachrichen-Sites bieten an, einzelne Beiträge zu taggen: In einer Untersu-
chung von 46 Websites war es nur das Portal des Nachrichten-Anbieters „Verdens Gang
(NO)“, welches diesen Service anbot (Wieden-Bischof & Schafert, 2008, 25). Inzwischen
gibt es wohl einige Beispiele, wo den Lesern von Nachrichten-Sites das Taggen erlaubt
wird, allerdings – und das ist wohl eine Folge der konfikträchtgen Inhalte von Nach-
richten – ist dies nur selten realisiert: erfahrungsgemäß werden hier besonders gerne
unfätge oder politsch motvierte Tags verwendet.

Social Tagging und traditonelle Klassifkaton


Um Texte recherchierbar zu machen, werden häufg Volltextsuchen eingesetzt. Dabei
stößt man auf das Problem, dass man verwandte Begrife oder Konzepte, die im Text
bzw. den vorhandenen Tags nicht vorkommen auch nicht recherchieren kann. Mit Hilfe
von kontrollierten Vokabularen und Thesauri werden Terme in Verbindung gebracht, so
dass beispielsweise ein Text zu Skifahren dem Bereich „Sport“ zugeordnet werden kann.
Bei solchen geschlossenen Systemen „kann die semantsche Lücke zwischen den
Autor/inn/en des kontrollierten Vokabular und dem Domänenwissen der Anwender/in-
nen zu Problemen führen“, diese werden als „Vocabulary Problem“ bezeichnet (s. Günt-
ner, Sint & Westenthaler, 2009, 192). Um zu ausreichenden und qualitatv besseren Er-
gebnissen zu kommen, werden drei Formen der Generierung von Metadaten auch kom-
biniert eingesetzt (s. Kitl & Zeidler, 2007): die automatsche Generierung von Metada-
ten (durch Informatonsextrakton) sowie manuell erzeugte Metadaten durch Tagging
oder Klassifkaton.
Für das integrierte Projekt LIVE6 wurde daher ein Prototyp entwickelt, der versucht, die
Vorteile des traditonellen Klassifzierens mit den Vorteilen des Social Taggings zu verbin-
den (Güntner, Sint & Westenthaler, 2009). Die folgende Abbildung zeigt einen Screens-
hot der Anwendung, die klassische Klassifkaton mit Social Tagging kombiniert und als
Prototyp entwickelt wurde:

6
Live Staging of Media Events, htp://ist-live.org (2009-10-12)

41
Abbildung 17: Vocabulary-Management-Tool – ein Prototyp
Quelle: Güntner, Sint & Westenthaler, 2009, 195

Das Tool wird folgendermaßen beschrieben: „Der Kalender (1) dient zur zeitlichen Ein-
schränkung und Auswahl der Dokumente und Auswahl der Dokumente und vergebenen
Tags. Im linken Fensterbereich wird das kontrollierte Vokabular (Thesaurus) dargestellt
(2), welches im Falle des Prototypen ohne Beschränkung der Allgemeinheit auf den IPTC
Newscodes basiert. Der Vocabulary-Manager kann die Schaltlächen (3) benutzen, um
die vergebenen Tags dem Vokabular hinzuzufügen bzw. sie mit dem Vokabular in Bezie-
hung zu setzen: Die Schaltlächen ermöglichen das Eingügen eines Tags als neue Unter-
kategorie („<< new subconcept“) oder als neues Synonym („<<new synonym“) für einen
bestehenden Term im Thesaurus. Weiters können mit der Schaltläche „<<set new rela-
ted>>“ Terme miteinander verbunden werden, die thematsch in einem Zusammenhang
stehen.“ (Güntner, Sint & Westenthaler, 2009, 195).
Aufauend auf den Erfahrungen mit diesem Prototyp, wurde das Konzept auch im Rah-
men des Projektes KiWi7 eingebracht und in das KiWi-System implementert. Die folgen-
de Abbildung zeigt die Realisierung des Ansatzes im KiWi-System.

7
Knowledge in a Wiki, htp:// www.kiwi-project.eu/ (2009-10-12)

42
Abbildung 18: Vocabulary-Management bei KiWi (Stand 10/2009)

Automatsche Tags und Qualitätssicherung


Wenn Systeme auf Social Tagging aufauen, haben sie mit dem Cold-Start-Problem zu
kämpfen: Solange keine Tags vorhanden sind, sind entsprechende Dokumente z. B. über
entsprechende Suchfunktonen nicht aufndbar. Um dieses Problem zu entschärfen,
werden automatsche Tags vergeben, die beispielsweise durch Methoden des Text-Mi-
ning (siehe Abschnit zu Texten) ermitelt werden.
Diese automatschen Tags können also auch fehlerhaf oder unsinnig sein. Im Projekt
„Interedu“ des Salzburg NewMediaLab wurde daher ein System der Qualitätssicherung
eingeführt um automatsche Tags und Tags der Lehrer unterscheiden zu können. Zu die-
sem Zweck wurde folgende Markierung der Lernmaterialien eingeführt:
| Wolken kennzeichnen Lernmaterialen, denen automatsch Tags zugewiesen wurden,
die also auf statstschen Analysen beruhen und fehlerhaf sein können.
| Wolken mit einer durchbrechenden Sonne markieren Lernmaterialien, bei denen ein
beliebiger Nutzer bereits eigene Tags ergänzt hat (und ggf. die automatsch ermitel-
ten übernommen hat).
| Eine Sonne haben schließlich die Lernmaterialien, wenn ein Administrator oder Ge-
genstandsbetreuer das Lernmaterial über eine spezielle Schaltläche freigegeben hat.
Jede weitere Bearbeitung führt wieder zur vorherigen Stufe (Wolken mit durchbre-
chender Sonne), so dass das Lernmaterial einer erneuten Freigabe durch einen Admi-
nistrator oder Gegenstandsbetreuer bedarf.
Nicht immer ist so eine relatv rigide Kontrolle der Qualität von Tags notwendig, wie es
im Falle der Lernressourcen in diesem Projekt erwartet wurde; aber es zeigt sich an die-
sem Beispiel, dass auch hier die Qualität von Social-Tagging-Systemen noch erhöht wer-
den kann.

Social Tagging als Spiel


Um im größeren Umfang Tags zu Bildern zu erhalten, entwickelten kreatve Köpfe das
ESP-Game (www.espgame.org, von Ahn & Dabbish, 2004). Die Spielidee liegt darin, dass

43
Spieler zu Bildern Tags eingeben, von denen sie annehmen, dass sie auch von anderen
Nutzern verwendet werden und je nach Übereinstmmung Punkte erhalten. Dabei hat
sich gezeigt, dass schnell allgemeine Tags verwendet werden, so dass diese Worte inzwi-
schen ausgeschlossen werden, was das Spielen jedoch nicht weniger spannend macht,
sondern eher noch herausfordernder.

Abbildung 19: ESP-Spiel (Stand März 2009)


Quelle: htp://www.espgame.org/ (03/2009)

Die Autoren rechneten aus den ersten Versuchen mit dem ESP-Spiel aus, dass 5.000
Spieler genügen würden, um alle Bilder, die von Google indiziert sind (Stand, 2004) in
wenigen Wochen mit Schlagworten zu beschreiben. Dies ist wirklich überraschend, weil
5.000 keine große Zahl ist; die meisten populären Online-Spiele haben im Vergleich dazu
mehr als 5.000 Spieler, die gleichzeitg spielen (von Ahn & Dabbish, 2004).
Die Idee des ESP-Spiels wurde inzwischen von anderen aufgegrifen. So hat Google den
„Google Image Labeler“ implementert und erhält durch dessen Spieler viele Metainfor-
matonen über Bilder. Auch wurde die Spielidee auf andere Medien übertragen (z. B. auf
Musikstücke: „Tag a Tune“, via www.espgame.org). Hier werden Musikstücke vorge-
spielt, die getaggt werden sollen. Andere wiederum entwickelten daraus ein Spiel (und
Patent), das auf einem horizontalen Display gespielt wird (Diakopoulos & Chiu, 2007).
Sogar für die Erstellung von Mitarbeiterproflen wurde es abgewandelt und eingesetzt
(vgl. Zhang, Dong, Ackerman & Qu, 2008): Gewonnen hate hier derjenige Mitarbeiter,
dessen Tags mit Kompetenzen der Kollegen am besten zu deren Selbstbeschreibungen
passt. Durch die Spielbeteiligung wurden vergleichsweise schnell und spielerisch Kom-
petenzbeschreibungen der Mitarbeiter zugänglich.
Insbesondere für (nichtextuelle) Medienarchive ist im Allgemeinen davon auszugehen,
dass für die Dokumentaton und die Nutzer ein echter Mehrwert entstehen kann, wenn
Tagging möglich ist. Um wirklich viele Tags zu erhalten, können die genannten Spielide-
en helfen, diesen Prozess atraktv zu machen und ins Laufen zu bringen; zudem können
sie Teil einer PR-Akton sein.

44
Erfahrungen mit Tagging von Lernressourcen
Unterschiedliche Formen des Taggings und Erfahrungen damit sind Gegenstand einer
Reihe von Untersuchungen. Riina Vuorikari hat eine preisgekrönte Untersuchung dazu
veröfentlicht (Vuorikari, 2009), wir haben sie dazu befragt. Bei dem Portal „Learning Re-
source Exchange“8 bestand die Herausforderung vor allem darin, Tagging im mehrspra-
chigen Kontext einzusetzen, weil das Portal mit Lernressourcen von Lehrern aus ver-
schiedenen Ländern genutzt wird.

Tagging von Lernressourcen – Interview mit Riina Vuorikari

? Sie haben eine Studie zu Metadaten von Lernressourcen durchgeführt.


Wie taggen den Ihren Erfahrungen nach Nutzer? Gibt es Unterschiede
zwischen ihnen?

Unsere Nutzer sind Lehrer von Grund- und Sekundarschulen aus ganz
Europa. Ganz allgemein haben wir herausgefunden, dass Tags, die sie
nutzen sehr deskriptv sind und fast so gut sind wie die Stchwörter, die
Bibliothekare zu den Lernressourcen hinzugefügt haben. Weil wir Nutzer
aus verschiedenen Ländern haben, haben wir natürlich auch Tags in verschiedenen Sprachen! Nutzer
taggen dabei gleichzeitg in ihrer eigenen Sprache (z. B. ein deutscher Lehrer auf Deutsch) aber auch auf
Englisch. Es trift besonders auf Sprachlehrer zu, dass sie Ressourcen in der Sprache taggen, in der die
Materialien sind (z. B. taggt ein Französischlehrer auf Französisch).

? Klicken sie denn auch auf Tags? Gibt es da Unterschiede im Verhalten?

Wir haben herausgefunden, dass nicht alle Nutzer interessiert daran sind, Tags zu nutzen um Ressour-
cen zu fnden. 59 Prozent der Nutzer unseres Portals nutzen Tags um Ressourcen zu fnden, 35 Prozent
waren überhaupt nicht daran interessiert. Interessanterweise haben etwa ein Dritel der Nutzer niemals
getaggt, nutzen Tags aber bei der Recherche. Es ist wie so of im Internet, einige machen die Arbeit und
viele andere Nutzer profteren davon. Das ist großartg!

? Was denken denn die professionellen Ressourcenverwalter über die Tags?

Unserer Evaluaton zufolge waren ihre Antworten im Bezug auf Tags eher positv. In manchen Fällen wa-
ren sie sogar der Meinung, dass die Tags direkt in die Metadaten-Beschreibung übernommen werden
könnten, weil sie so gut waren. Of wiederholen Tags jedoch auch nur Informatonen, die über die Res-
source vorhanden sind (beispielsweise, dass die Ressource in Englisch ist), aber der zusätzliche Vorteil
der Tags ist, dass die Ressourcen über die Tagcloud beworben werden.

8
htp://lreforschools.eun.org, Stand 12.10.2009

45
? Was empfehlen Sie für die erfolgreiche Einführung eines Taggingsystems?

Das Hinzufügen von Tags muss leicht gemacht werden, und auch bedeutsam für Nutzer sein. Wenn Tags
dazu genutzt werden, Sammlungen von Ressourcen anzulegen, die einfach mit anderen Lehrern oder
auch Schülern geteilt werden können, fnden das Lehrer nützlich. Ein anderer wichtger Aspekt ist, dass
zu den Tags auch Metadaten hinzugefügt werden, aber das passiert verdeckt. Für das System ist es wich-
tg zu wissen, wer den Tag hinzu gefügt hat und in welcher Sprache er ist.

Dr. Riina Vuorikari arbeitet seit 2000 für das European Schoolnet (EUN, europeanschoolnet.org) zu ei-
nem weiten Themengebiet von digitalen Lernressourcen, Web-2.0-Themen wie Tagging und sozialen
Netzwerken, bis zu Themen wie Interoperabilität und Metadaten sowie Kollaboraton von Schulen. Vor
kurzem hat sie ihre Dissertaton zum Thema Tags und Lernressourcen im mehrsprachigen Kontext erfolg-
reich verteidigt.

Zusammenfassung
Tagging bzw. das Zusammentragen von Tags mehrerer Nutzer (Social Tagging) wird in un-
terschiedlicher Weise genutzt. Wesentlich erscheinen hier der Beitrag zum persönlichen
Informatonsmanagement, Beiträge zur Verbesserung von Recherchemöglichkeiten so-
wie die Möglichkeit, Empfehlungen zu geben. Auch kann Social Tagging neue (ggf. besse-
re) Kategorien und Strukturen entwickeln und schließlich auch im Rahmen von Webmo-
nitoring-Aktvitäten analysiert werden.

Abbildung 20: Nutzung von (Social) Tagging

Social Tagging ist vergleichsweise neu, und die Untersuchungen dazu und Nutzungsmög-
lichkeiten sind noch nicht ausgereizt. Beispielsweise ist das Taggen von Personen ein völ-
lig neuer Ansatz, der noch wenig erprobt ist. Mit der Facebook-Applikaton „Collabio“
experimentert hier beispielsweise eine Arbeitsgruppe von Microsof Research (s. Bern-
stein et al., 2009).

46
Sandra Schafert und Diana Wieden-Bischof

6 TEXTE
Text entsteht beim Schreiben von Weblog-Nachrichten, Pinnwandeinträgen, Kommenta-
ren, Editeren von Wiki-Seiten und vielem mehr. Im Web stehen so jede Menge Texte als
„Rohdaten“ zur Verfügung, die ausgewertet und weiterverwendet werden können: bei-
spielsweise um weitere Informatonen zu erhalten oder passende Informatonen zu ver-
knüpfen, oder um Suchen efzienter zu gestalten.
Im Folgenden beschreiben wir erstens wie und warum gerade Medienarchive die Entste-
hung von Texten fördern sowie zweitens, wie Texte ausgewertet werden können, um
darüber hinausgehenden Informatonen zu erhalten und wie dies konkret genutzt wird.

6.1 Entstehung von Texten fördern


Wie wir darstellen werden, sind Texte außerordentlich wichtg, um weitere Informato-
nen über andere Objekte wie Fotos, Videos oder Personen zu erhalten. Es gibt daher ein
großes Interesse, auch aktv die Entstehung von Text zu unterstützen: Zwar sagt man
„Ein Bild sagt mehr als tausend Worte“, diese Informatonen und Eindrücke können aber
nur schwer von Maschinen generiert und damit automatsch ausgewertet und weiter
verwendet werden. Gerade (Bild-) Archive sind daran interessiert, Texte zu ihren Abbil-
dungen oder Objekten zu erhalten. Dort fnden sich kreatve Beispiele, wie versucht
wird, Nutzer dazu zu bringen, Texte zu Bildern zu schreiben. Dem Verschlagworten (Tag-
ging) war bereits das Kapitel 5 gewidmet, so dass wir uns im Folgenden auf Texte bezie-
hen, die nicht nur bzw. keine Schlagworte sind.

Das Spiel „Phetch“


Die Idee des Spiels „Phetch“ ist es, mehr Informatonen zu Bildern zu bekommen (vgl.
von Ahn et al., 2006): Das Online-Spiel ist für je drei bis fünf Spieler entwickelt. Einer der
Spieler wird zufällig als „Beschreiber“ ausgewählt, die anderen sind die „Sucher“. Der
„Beschreiber“ erhält vom Spiel ein Bild vorgelegt, dass er mit einem kurzen Text be-
schreiben soll, beispielsweise mit „ein weißes Gespenst steht auf der Brücke und
schreit“. Die Sucher, die das Bild nicht gesehen haben, müssen nun möglichst schnell das
richtge Bild mit Hilfe einer Bildersuchmaschine fnden, indem sie dort nach passenden
Suchbegrifen recherchieren und sich dann für ein Bild entscheiden. Wer als erstes das
richtge Bild wählt, erhält Punkte und ist in der nächsten Runde der „Beschreiber“. Wenn
das richtge Bild gefunden wurde, erhält natürlich auch der „Beschreiber“ Punkte. Bei
folgendem Foto würden die Beschreibungen bei Phetch folgendermaßen lauten: „halb-
Mann-halb-Frau mit schwarzem Haar“ sowie „eine abstrakte Zeichnung mit einem
Mann mit einer Violine und einer Frau mit einer Flöte“ (s. von Ahn et al., 2006).

47
Abbildung 21: Beispielabbildungen zur Beschreibung des Spieles „Phetch“
Quelle: von Ahn et al., 2006, Abbildung 1

Mit Hilfe dieses Spiels können also gute, hilfreiche Beschreibungen für Bilder entwickelt
und validiert werden; durch den Spielcharakter kann dies mitunter recht schnell gehen,
so dass in kurzer Zeit eine große Zahl von Bildern beschrieben wird. Im Vergleich mit ei-
ner Spiel-Variante (dem ESP-Game), bei der nur Schlagworte eingegeben werden sollen
zeigt sich, dass Phetch-Beschreibungen in 98,5 Prozent der Fälle richtg identfziert wur-
den, hingegen traf dies nur bei 73,5 Prozent der Bilder mit ESP-Tags zu (von Ahn et al.,
2006, 81).

Die Geschichte zum Bild bei Einestages


Aus dem Bereich der Nachrichten-Sites gibt es zwei interessante Beispiele, wie Leser er-
muntert werden, zu Fotos bzw. Landkarten Texte zu schreiben. Einestages ist seit Okto-
ber 2007 das Zeitgeschichte(n)-Portal von Spiegel Online, in welchem Leser dazu mot-
viert werden, auch eigene Geschichten beizutragen. Einestages möchte mit seinem Por-
tal ein kollektves Gedächtnis der (Zeit-) Geschichte schafen und alle Informatonen gut
aufereitet präsenteren. Als Kooperatonspartner von Einestages konnte Spiegel Online
Partner wie das Bildarchiv Preußischer Kulturbesitz, das Filmarchiv der Deutschen Wo-
chenschau, den Geschichtswetbewerb des Bundespräsidenten (Körber-Stfung) und
das Deutsche Auswandererhaus gewinnen (Spiegel Online, 2007). Um dies zu ermögli-
chen, ist Einestages auf das Engagement, die Unterstützung und Mitarbeit aller Interes-
sierten, der so genannten Zeitzeugen, angewiesen (Spiegel-Online, 2007), dazu können
Leser andere Nutzer nach der passenden Geschichte zu ihrem Bild/Foto fragen bzw.
nach dem passenden Bild zu einer Geschichte suchen.

Reiseberichterstatung bei Times Online


Ein weiteres Beispiel, wie Geschichten mit Bildern verknüpf werden, ist die Reisebe-
richterstatung und Verortung der Berichte bei der Times Online (tmesonline.co.uk): Ti-
mes Online bietet in Zusammenarbeit mit BMW eine Weltkarte an, in der registrierte
Nutzer über ihre Reiseerfahrungen berichten können. Die Karte kann zur Navigaton ver-
wendet werden, indem man entweder auf den gewünschten Kontnent klickt oder die
rechte Spalte mit der Aufistung der Kontnente betätgt.
Nach Auswahl des gewünschten Landes, erhält man eine Detailkarte, die durch einen
Raster in Abschnite eingeteilt wird. Nutzer können nun selbst einen Beitrag in dem aus-
gewählten Bereich (z. B. Kontnent, Land) hinzuzufügen, welcher in Form einer „Postkar-

48
te“ dargestellt wird und von den Nutzern mit den eigenen Erlebnissen aus dem Urlaub
gefüllt werden kann. Auch Bilder und Videos können hochgeladen werden, sie zieren
dann die „Rückseite“ der Postkarte. Auch die bereits vorhandenen und von anderen
Nutzern bereitgestellten Reiseberichte können gelesen und versendet werden. Leider ist
dieser Service von Times Online zurzeit (Stand Juni 2009) nicht verfügbar („Page under
constructon“).

Abbildung 22: Reiseberichterstatung als E-Postkarte bei Times Online


Quelle: htp://yourworld.tmesonline.co.uk, (10/2007)

Alterraten bei Agester


Spielerisch werden auch bei Agester.com Informatonen über Fotos eingeholt: Hier kön-
nen Nutzer das Alter von Personen auf Fotos raten bzw. erraten lassen, also herausfn-
den, wie alt andere einen schätzen.

Abbildung 23: Screenshot Agester: Wie alt ist die Person?


Quelle: htp://www.fickr.com/photos/xingty/431041471/ (03/2009)

6.2 Nutzen und Nutzung


Die unterschiedlichen Texte, die im Web zu fnden sind, also beispielsweise Weblogein-
träge oder Diskussionsbeiträge, Microblogging-Meldungen oder Webseiten werden auf
ganz unterschiedliche Weise genutzt. Bevor wir konkrete Beispiele nennen, muss der

49
Text jedoch zunächst ausgewertet werden, dabei kommen Verfahren der „Informaton
Extracton“ zum Zuge.

Verfahren der Informaton Extracton


Unter anderem kommen folgende Verfahren der „Informaton Extracton“, also Verfah-
ren, um aus Texten automatsch weiterführende Informatonen zu erlangen, zum Ein-
satz. „Informaton Extracton“ defniert sich als der selektven Strukturierung und Kombi-
naton von impliziten oder expliziten Daten in einem oder mehreren Dokumenten. Infor-
maton Extracton benutzt dazu semantsche Klassifzierungen von Informatonen (vgl.
Knoth, Schmidt & Smrž, 2008; Moens, 2006).
Dabei kommen semantsche als auch statstsche Verfahren zum Einsatz (s. Knoth,
Schmidt & Smrž, 2008): Semantsche Verfahren versuchen, u. a. aus der Satzstellung
heraus zu erkennen, welche Bedeutung der Text hat. Statstsche Verfahren benötgen
große Mengen an Text, um beispielsweise Häufgkeitsanalysen durchzuführen. Beide An-
sätze werden vielerlei kombiniert.

Automatsche Tag-Vorschläge
Texte werden auch automatsch ausgewertet, um Tags vorzuschlagen (s. Abschnit über
Social Tagging). Dies ist beispielsweise hilfreich, um Tags für Weblogeinträge automa-
tsch vorzuschlagen (Mishne, 2006). Im Projekt „Interedu“9 des Salzburg NewMediaLab
wurde ein System entwickelt, das das Tagging von Lernressourcen unterstützt, indem es
Tagvorschläge generiert. Dabei kommen mehrere Verfahren zum Einsatz, die hier kurz
skizziert werden, die folgenden Angaben stammen aus einem Projektbericht:
| Die Hauptkomponentenanalyse ist ein statstsches Verfahren, dass mit Hilfe einer
Analyse „Trainingsdaten“ Rückschlüsse auf das Vorschlagen von Tags geben kann:
Dazu werden die Texte der Trainingsdaten in Schlüsselworte zerlegt, Stopworte aus-
gefltern und Stammformen gebildet, dann wird eine Dokument-Term-Matrix ange-
legt und Vektoren beschrieben. Weil allein durch das Vorkommen eines Schlüssel-
wortes nicht die Relevanz gezeigt ist, wird mit dem TF-IDF-Verfahren (Term Frequen-
cy/Inverse Document Frequency) festgestellt, ob es vergleichsweise häufg vor-
kommt, also „besonders“ ist. Ziel der Hauptkomponentenanalyse ist es nun, die be-
stehende Matrix so in der Anzahl der Dimensionen zu reduzieren, dass bis auf Rau-
schen alle Hauptrichtungen vertreten sind.
| Mit KEA können Texte klassifziert werden und sogenannte Keyphrases oder „Schlüs-
selwortketen“ in Texten erkannt werden. KEA unterstützt zwei Arten von Klassifzie-
rungen: die freie Klassifzierung (Schlüsselwortextrakton) sowie die eingeschränkte
Klassifzierung (Kategorisierung), bei der der Text in eine Kategorie eingeordnet wird.
Auch hierzu muss eine sogenannte Trainingsphase Trainingsdaten, die bereits diese
Zuordnungen haben, durchgeführt werden, bei der ein Klassifzierungsmodell erstellt
wird.
| Auch Assoziatonsregeln können zum Vorschlagen von Tags oder Schlüsselworte ein-
gesetzt werden. Sobald eine Menge von Dokumenten signifkant häufg mit den sel-
ben Tags oder Schlüsselworten versehen wurde, kann ein Benutzer von dem Wissen
der Vorgänger profteren, indem seine Tags vervollständigt werden. Das Konzept der
Assoziatonsregeln setzt somit voraus, dass schon Tags vergeben worden sind.

9
Partner: Salzburg Research, Educaton Highway und Punkt Netservices.

50
Das Beispiel zeigt, dass die Entwicklung eines solchen Systems, bei dem Text-Mining-Ver-
fahren zum Einsatz kommen jeweils sehr spezifsche Anforderungen erfüllen muss und
durch das Einsetzen und Auswerten von Trainingsdaten auch zeitaufwändig ist.

Recherche von „Hot Topics“ und Trendscoutng


Das erste Beispiel, für welche Zwecke Texte, die in Communitys und Netzwerken entste-
hen und ausgewertet werden ist die Analyse von „Hot Topics“: Die Inhalte der Weblogs
sind für viele interessant und werden beispielsweise nicht nur im Rahmen non-reaktver
sozialwissenschaflicher Untersuchungen analysiert, sondern sind auch im Rahmen von
Innovatonsentwicklungen oder Trendscoutng für Unternehmen von Interesse. Hohe
Aufmerksamkeit, auch von Seiten der Wissenschaf, hat beispielsweise die Analyse der
Zahl von Weblogpostngs während der Präsidentschafskandidatur in den USA im Jahr
2008.
Mehrere Websites bieten kostenlose Recherchemöglichkeiten und -auswertungen von
Weblogs, die auf Häufgkeitsanalysen von Begrifen beruhen (vgl. Markus & Schafert
2010): Während Technorat.com nur ein einfaches Tools für Zeitreihen und Vergleiche
bietet, bietet Blogpulse.com eine komfortablere Analyse von Weblogeinträgen, Zeitrei-
hen und Vergleichen an. Bei der Darstellung der Zeitreihe wird die Zahl der Suchtrefer
an den einzelnen Tagen eines bestmmten Zeitraums in einem Diagramm dargestellt.

Abbildung 24: Screenshot Blogpulse Live vom 9.10.2009


Quelle: htp://www.blogpulse.com (10/2009)

Auch für die bekannte Microblogging-Anwendung „Twiter“ gibt es eine Reihe von Tools,
die Auswertungen ermöglichen: Sofern Twiter-Meldungen als „öfentlich“ freigeschal-
ten sind, und das ist die Regel, stehen sie dazu zur Verfügung. Twitscoop zeigt so, über
welche Themen in den letzten drei Tagen getwitert wurde und zeigt diese Ergebnisse in
Form einer Zeitreihe.
Solche Analysen funktonieren allerdings beispielsweise nur bei Begrifen, die eindeutg
sind. So kann es sein, dass beispielsweise Produktnamen in anderen Sprachen Begrife
oder Personennamen sind, so dass spezifsche Einschränkungen der Recherche vorge-
nommen werden müssen. Auch weitere Fehler können sich bei der Erhebung, Analyse
und Interpretaton einschleichen; ein fundiertes Wissen ist hier notwendig (s. Markus &
Schafert, 2010).

51
Sentment-Analyse – Gefühlsäußerungen auf der Spur
Eine Besonderheit stellen die beiden kostenlos zugänglichen Web-Tools Moodviews.com
und Wefeelfne.org dar, da sie sich darauf spezialisiert haben, „Gefühlsäußerungen“
(engl. „sentment analysis“) in Weblogs zu untersuchen.
Jonathan Harris und sein Team hat mit Wefeelfne,org ein Tool entwickelt, das Weblogs
auswertet, die „I feel“ oder „I am feeling“ enthalten. Mit Hilfe von Wefeelfne kann man
z. B. recherchieren, wie sich weibliche Blogger zwischen 30 und 40 in Orten mit schlech-
tem Weter gerade fühlen bzw. wie deren Gefühlsäußerungen interpretert werden.

Abbildung 25: Screenshot: Gefühlsäußerungen von Männern zwischen 30 und 39 Jahren


Quelle: htp://www.wefeelfne.org (10/2009)

Bei einem ähnlichen Angebot, der Website Moodviews.com können Aussagen wie „Ich
fühle mich …“ auch im Bezug auf Begrife recherchiert werden, also auch im Bezug auf
Markennamen. Man kann dann beispielsweise feststellen, wie häufg der Ausdruck
„cool“ oder „good“ in den analysierten Weblogs im Zusammenhang mit einem Produkt
genannt wird.
Aus der Kombinaton der Analyse von Gefühlsäußerungen mit der Idee, zukünfiges Ver-
halten vorherzusagen entstand u. a. die Idee, zu untersuchen inwieweit Gefühlsäuße-
rungen zu Kinoflmen mit dem späteren Erfolg der Filme im Zusammenhang stehen
(Mishne & Glance, 2006). Ein weiteres Anwendungsgebiet ist die kontextsensitve Wer-
beeinblendung (vgl. Altsearchengines.com, 2009).
In den letzten beiden Jahren haben sich mehrere Forscher mit der Frage beschäfigt, wie
solchermaßen ausgewertete Gefühle auch passend in Formen und Farben dargestellt
werden können (vgl. Synesketch, 2009).

52
Zusammenfassung
Zusammengefasst gibt es im wesentlichen folgende drei Nutzungsaspekte von Texten:
Zum einen sind sie hilfreich, um Dokumente wie Fotos oder Videos zu erschließen (und
recherchierbar zu machen), um Empfehlungen zu geben oder Services (auch Werbung)
zu personalisieren, und schließlich um Inhalte zu analysieren, beispielsweise im Rahmen
von Webmonitoring wie Trendanalysen.

Abbildung 26: Nutzung von Texten

Texte sind nicht die alleinigen „Primärquellen“, die im Web von Communitys und Nut-
zern zur Verfügung gestellt werden, auch Videos, Audiodateien und Fotos könnten hier
im einzelnen vorgestellt werden. Ein paar kurze Hinweise fnden sich dazu im letzten Ab-
schnit.

53
54
Sandra Schafert, Sebastan Schafert, Rupert Westenthaler und Julia Eder

7 METADATENFORMATE UND ONTOLOGIEN


7.1 Konzept und Beispiele
Metadaten eines Buches sind beispielsweise die Autorennamen, die ISBN, der Verlag,
der Erscheinungsort. Metadaten sind im Gegensatz zu Webseiten meist strukturierte
Daten und daher vom Computer weiterverwendbar. Im Internet bzw. der Informatk
werden solche „Daten über Daten“ als Metadaten bezeichnet, die jedoch ganz unter-
schiedliches beinhalten. Um einen geregelten Austausch von Daten in einem Anwend-
nungsbereich zu verbessern oder zu erleichtern, hat man sich in vielen Bereichen, auf
genau beschriebene Metadatenformate geeinigt. Treiber dieser Bestrebungen sind vor
allem Archive, welche verbunden mit der Digitalisierung ihrer Bestände auch den Aus-
tausch ihrer Daten über Publikatonen ermöglichen und vereinfachen wollten (z. B. mit
Dublin Core). In der Nachrichtenindustrie macht vor allem der Zeitdruck einen reibungs-
losen Austausch von Nachrichten den Einsatz von Metadatenformaten wie NewsML und
EXIF erforderlich. Beim Web 2.0 und den sozialen Netzwerken steht die Vernetzung der
Community im Vordergrund (z. B. FOAF, SIOC).
Eine Technologie welche es erlaubt derartge reichhaltge Beziehungen auch für Comp-
ter berechenbar zu defnieren sind Ontologien. Ontologien sind dabei weitaus komple-
xere Systeme der Datenbeschreibung, die von Experten entwickelt wurden und Wissens-
bestände beschreiben. Mit ihnen lassen sich hierarchische Gliederungssysteme von Wis-
sen (Taxonomien, z. B. Artenbeschreibungen in der Biologie), aber auch komplexe Anga-
ben über die Relatonen von Wissen in einer Form , dass auch Computer diese verarbei-
ten können. Aus diesem Grund werden vermehrt Metadatenformate mit Hilfe von Onto-
logien beschrieben. Zum Beispiel sind z. B. EXIF und Dublin Core (s.o.) auch als Ontologi-
en beschrieben.
Ein weiterer Vorteil liegt darin, dass verschiedene durch Ontologien beschriebene Meta-
datenformate miteinander verknüpf werden können. Beispielsweise kann das Metada-
tenfeld eines Fotos, dass den Fotografen nennt (exif:artst) mit dem Metadatenfeld
„Creator“ im Dublin-Core-Standard verknüpf werden (dc:creator). Dadurch stehen die
Angaben zu Fotos „automatsch“ auch im Bibliotheksformat zur Verfügung. Metadaten-
formate und Ontologien sind also eine Möglichkeit, Wissen im Web austauschbar und
maschinenlesbar zu machen. Bei der Entwicklung und auch der Benutzung ist in aller Re-
gel Expertenwissen notwendig.
Ohne allzu sehr in die Tiefen dieses Themas einzusteigen ist für unsere Studie wichtg,
dass in Communitys Metadaten in zweierlei Weise eine Rolle spielen können: So entste-
hen zum einen Datensammlungen von Daten in Metadatenstandards, wenn beispiels-
weise Nutzer von dem Fotoverzeichnis FlickR ihre Fotos hochladen: Ohne ihr explizites
Dazutun laden sie neben den reinen Bilddateien auch EXIF-Angaben zum Bild hoch, die
automatsch von der Kamera erfasst wurden. Die solchermaßen „beiläufg“ erstellten
Datensammlungen können genutzt werden. Zum anderen gibt es in den letzten Jahren
zunehmende Bemühungen Metadatenformate sowie Ontologien kollaboratv in Com-
munitys zu entwickeln. Dies ist insbesondere für Unternehmen interessant, die gemein-
same Wissensmodelle entwickeln und dazu unternehmensspezifsche Prozesse und In-
halte beschreiben wollen.

55
Um also den Austausch von Daten zwischen verschiedenen Datenquellen zu fördern ist
es sinnvoll sich auf Metadatenformate zu einigen. Diese werden verwendet um entwe-
der direkt in HTML-Seiten zusätzliche Informatonen einzubinden (Microformate bzw.
RDFa) oder aber diese Informatonen direkt über RESTful-Services zugreifar zu machen.
Im Folgenden sind einige gebräuchliche Metadatenformate mit einer kurzen Beschrei-
bung aufgelistet.
Personen und Organisatonen:
| hCard: ein Microformat-Version des vCard-Standards, das erlaubt die Defniton von
Informatonen, wie sie typischerweise auf Visitenkarten zu fnden sind
| vCard: dieser Standard ist eigentlich in einem rein textbasierten Format defniert; es
gibt jedoch auch entsprechende Versionen als XML und Ontologie
| XFN (xhtml friend network): ein Microformat, welches es erlaubt, Verbindungen zwi-
schen Personen auszudrücken
Events/Termine:
| hCalendar: Microformat für die Defniton von Event-Informatonen, wie man sie ty-
pischerweise in Terminkalendern fndet.
| vCalendar/iCal: ähnlich wie vCard ist auch vCalendar ein reiner textbasierter Stan-
dard, für den es wiederum Versionen als XML und auch als Ontologie gibt
Orte/Geo-Informatonen:
| geo: einfaches lat/long/alt-basiertes Geokoordinatenschemata, gibt es sowohl als Mi-
croformat als auch als Ontologie
| geoNames: defniert weiterreichende Schemata zur Beschreibung von Objekten und
Regionen; vor allem verwendet es Feature-Codes welche den Typ des beschriebenen
Objektes defnieren
Produkte:
| hProduct: ist ein Microformat zur Beschreibung von Produkten
| Good Relatons: ist eine Ontologie, welche die Beschreibung von Produkten und
Dienstleistungen ermöglicht
| hReview: ein Microformat, um Bewertungen von Produkten, Musik, Filmen, Restau-
rants u. a. zu beschreiben
Soziale Medien:
| SIOC (Semantcally-Interlinked Online Communites): beschreibt eine Ontologie wel-
che es erlaubt Daten von verschiedenen Online-Communitys miteinander zu ver-
knüpfen; so erlaubt es dieser Standard z. B. verschiedenen Accounts von ein und der-
selben Person zu beschreiben; auch der Aufau von Foren, Rollen von Usern usw.
kann mit SIOC beschrieben werden
| FOAF (Friend of a Friend): beschreibt Benutzer in sozialen Netzwerken und Beziehun-
gen zwischen ihnen; diese Ontologie ist die am weitesten verbreitete im Internet und
wird von vielen Webseiten unterstützt
| HGTAGS und MOAT (Meaning of a Tag): erlaubt die Beschreibung von Taggings mit
Hilfe von RDF Relatonen und ermöglicht damit den einfachen Austausch von Tagin-

56
formatonen zwischen verschiedenen Webseiten; MOAT erlaubt es zusätzlich, die Se-
mantk eines Tags mit Hilfe von RDF zu beschreiben.
SCOT (Social Semantc Cloud of Tags): ermöglicht die Darstellung von ganzen Tagclouds
mit Hilfe von RDF und erlaubt damit den Austausch von solchen Informatonen mit an-
deren Systemen
Weitere:
| Dublin Core: defniert ein Set von Atributen, welches bibliographische Informato-
nen zu Dokumenten, Bücher, Medien, Texten u. ä. Beschreibt; diese Standards stehen
sowohl als XML auch als RDF zu Verfügung
| SKOS (Simple Knowledge Organizaton System): ist ein Metamodel für die Defniton
von kontrollierten Vokabularen. SKOS erlaubt die Defniton von Konzepten; dazu de-
fniert es eine Reihe von Metadaten (z. B. Bezeichnungen, Beschreibungen) als auch
semantsche Beziehungen zwischen Konzepten.
| Descripton of a Project (DOAP): eine Ontologie welche es erlaubt (Sofware-) Projek-
te zu beschreiben; im Fokus liegen die Beschreibung des Projektes und deren Res-
sourcen (wie Releases, Repository, Dokumentaton, Downloads, Homepage); die De-
fniton von Aufgaben, Zeitplänen u.ä. liegt nicht im Fokus.
| Creatve Commons: erlaubt die Defniton von Copyright und Lizenzen

7.2 Nutzen und Nutzung


Wohl der wichtgste Aspekt der Nutzung von Metadaten wird darin gesehen, dass man
bei der Verwendung von solchen Standards und entsprechende Suchfunktonen schnell
und präzise auf entsprechende Informatonen zugreifen kann. Exemplarisch zeigen wir
dies am Beispiel von Fotos.

Recherche von Metadaten zu Fotos


Die Metadaten zu Fotos, wie sie beispielsweise in EXIF-Metadatenformat beschrieben
sind und häufg von Digitalkameras zur Verfügung gestellt werden beinhalten u. a. Be-
lichtungsdauer, Brennweite, Aufnahmedatum. Diese Angaben können für den individu-
ellen Nutzer von Bedeutung sein, aber auch bei der Recherche nach anderen Bildern
Unterstützung bieten (z. B. Nachtaufnahme, Portraits). Obwohl diese Metadaten von
sehr vielen digitalen Kameras und auch Handys mit Fotofunkton automatsch mit dem
eigentlichen Foto abgespeichert werden, und somit auch häufg beim Hochladen der Bil-
der in Webverzeichnisse mit hochgeladen werden und zur Verfügung stehen würden,
werden diese Informatonen derzeit noch nicht häufg genutzt. Man kann sie z. B. Nut-
zen, um nach Bildern in bestmmten Pixel-Maßen oder die mit sehr kurzen Verschluss-
zeiten aufgenommen wurden zu suchen.
Viele Fotoverwaltungssysteme bieten dies bereits an, die Online-Fotodatenbank FlickR
bietet aber noch keine Recherche in solchen Metadaten der Fotos an. Sofern die Foto-
daten auch Geo-Referenzen, also Angaben über die Orte enthalten, können die Fotos
auch in Google-Earth hochgeladen werden und damit auf den Landkarten von Google
mit bestmmten Orten verknüpf und dort angezeigt werden. Ein Beispiel für eine solche
Anwendung stellen wir im Folgenden vor.

57
Kombinaton von Geodaten und Fotos bei TagIT
TagIT ist eine Anwendung die mit dem Ziel entwickelt wurde, interessante Orte, Routen,
sowie aggregierte Inhalte von Blogs, sozialen Netzwerken und anderen sozialen Medien
zu integrieren und gemeinsam auf einer Karte anzuzeigen. Die Idee dahinter ist, dass
Menschen meist an den Dingen interessiert sind die „um sie herum" passieren und in-
teressant sind. TagIT ermöglicht es daher einerseits, durch den umfangreichen Nachrich-
tenbestand der Salzburger Nachrichten zu „browsen“ und von anderen sozialen Medien
gesammelte Inhalte dazu anzuzeigen. Andererseits gibt es Benutzern die Möglichkeit, in-
teressante Orte (z. B. Cafés, Parks, Sportstäten) und Routen (z. B. Wanderrouten, Ski-
touren) mit Beschreibungen und optonal Fotos und Videos zu versehen. Andere Benut-
zer können dann diese Inhalte entdecken und kommenteren oder mit weiteren Fotos zu
ergänzen.
TagIT basiert auf der KiWi-Platorm die im Rahmen des EU-Projekts KiWi - Knowledge in
a Wiki10 entwickelt wird. Sowohl Nachrichten als auch Orte und Routen werden einheit-
lich mit Hilfe des Metadatenstandards RDF (Resource Descripton Framework) beschrie-
ben. Dies ermöglicht eine sehr fexible Nutzung der Inhalte. So kann beispielsweise jeder
Inhalt der eine Geopositon hat auf der Karte dargestellt werden, unabhängig davon ob
es sich um einen Nachrichteninhalt oder eine Person handelt. Ebenso können alle Inhal-
te mit Hilfe von semantschem Tagging auf Basis von SKOS (Simple Knowledge Organiza-
ton System) miteinander in Beziehung gesetzt werden. Die Metadaten werden in der
KiWi-Platorm für das Reasoning und die Personalisierung genutzt. So kann beispiels-
weise fexibel anhand des Inhalts und der Benutzer-präferenzen entschieden werden,
wie ein Inhalt dargestellt werden soll.
TagIT ist also ein Beispiel, bei dem die Nutzer keine ausgesprochenes Wissen über Meta-
datenformate haben müssen, aber durch das Hochladen von Fotos und entsprechenden
Beschreibungen, den wesentlichen Beitrag des Mehrwerts des Projektes leisten.

Gemeinsame Online-Literaturverwaltung: Bibsonomy


Für Bibliotheken ist die Verwendung von Metadatenformaten nichts neues, schon lange
hat man sich hier auf eindeutge Beschreibungen von Büchern (ISBN) geeinigt, das Inter-
net und die zunehmende Verknüpfung und Austausch unterschiedlicher Datenbanken
macht hier eine Vereinheitlichung notwendig.
Eine besondere Anwendung, die nicht nur von Bibliothekaren oder ähnlichen Experten,
sondern von „normalen“ Nutzern getrieben und mit Metadaten gefüllt wird ist das Sys-
tem Bibsonomy.org. Dabei handelt es sich um ein System, bei dem URL und Publikato-
nen eingetragen und mit anderen Nutzern geteilt werden und somit der Austausch von
Publikatonlisten bzw. Bibliographien möglich wird. Dabei wird der BibTex-Standard ein-
gesetzt. Bibsonomy erlaubt dabei Daten-Importe wie auch -Exporte, die Einträge von an-
deren Nutzern kann in eigene Sammlungen übertragen werden. Diese Verwaltung von
Publikatonen ist dabei insbesondere für Wissenschafler eine atraktve Möglichkeit.
Durch den Austausch und Teilen der Ressourcen sowie dem Verwenden von Social Tag-
ging entstehen weitere Mehrwerte (vgl. Jaschke et al., 2007).

10
htp://www.kiwi-project.eu, Stand 23.9.2009

58
Abbildung 27:Trefer für die Suche nach „Metainformatonen“ bei Bibsonomy
Quelle: Screenshot, htp://www.bibsonomy.org/search/metainformatonen (10/2009)

Darstellung von Metadaten bei Yahoo Search Monkey


Suchlisten in Suchmaschinen zeigen in der Regel den Titel der Webseite, einen Aus-
schnit aus dem Text bzw. dem Beschreibungstext der Webseite und den Link zur Web-
seite. Yahoo möchte seinen Service wesentlich verbessern, in dem die Suchmaschine zu-
künfig die Inhalte der Webseiten präsentert. Im Video zur Vorstellung der Initatve
wird dabei zur Illustraton das Beispiel genannt, dass man ein bestmmtes Restaurant
sucht und nun eine Liste mit Links erhält, auf denen der Name des Restaurants vor-
kommt. Zukünfig sollten aber beispielsweise Bewertungen (sofern vorhanden) gleich in
der Ergebnisliste mit angezeigt werden. Im folgenden Screenshot wird das exemplarisch
an einem Trefer zu einem Film gezeigt. Um dies zu ermöglichen, werden Metadatenfor-
mate, u. a. hcard, hcalender, hreview, sowie das Resource Descripton Framework (RDF)
genutzt.

59
Abbildung 28: Neue Darstellung von Suchergebnissen bei Yahoo
Quelle: htp://developer.yahoo.com/searchmonkey/ (10/2009)

Spielerische Ontologieentwicklung
Wie einleitend dargestellt, spielen Communitys nicht nur bei der beiläufgen Sammlung
von Daten im Metadatenformat eine wichtge Rolle, auch bei der kollaboratven Ent-
wicklung von Metadatenformaten oder auch Ontologien kommen sie in manchen Ansät-
zen zum Zuge, bzw. wird damit experimentert, ob diese Schemata auch in kollaborat-
ven Onlinesetngs entwickelt werden können.
Ontologien zu entwickeln ist sehr herausfordernd, komplex, benötgt Expertse und ist
auch ein mühsamer Prozess. Im Rahmen eines Forschungsprojektes wird auch versucht,
Ontologien für Bilder und Videos zu entwickeln (genannt OntoPronto und OntoTube, via
www.ontogame.org, s. Siorpaes & Hepp, 2007): Katharina Siorpaes beantwortet dazu
Fragen, wie aus ihrer Sicht sogar spielerische Verfahren eingesetzt werden können. Sie
greif dabei auch auf ihre Erfahrung im Rahmen des Projekte Insemtves11 zurück, einem
Forschungsprojekt, dass versucht, die Erstellung von semantschem Content zu fördern.

11
htp://insemtves.eu/, Stand 1.9.2009

60
Ontologien spielerisch entwickeln – im Gespräch mit Katharina Siorpaes

? Metadaten zu erfassen ist manchmal sehr mühsam. Sie untersuchen und


nutzen spielerische Ansätze zur Entwicklung von Ontologien. Wie und wo
funktoniert das?

Die Idee ist, Aufgaben in der Wissensakquise hinter Spielen gut zu ver-
stecken. Die Spiele dienen als Motvaton für Menschen, Zeit für Aufgaben
zu verwenden, für die menschlicher Input dringend nötg ist. In den Spielen
(siehe www.ontogame.org) müssen zwei Partner Aufgaben gemeinsam lösen
jedoch ohne kommunizieren zu können. Dabei ist die beste Strategie um Punkte zu bekommen, die
Wahrheit zu sagen. Die dadurch generierten Daten können wir mit Methoden im Hintergrund weiter-
verarbeiten und Ontologien bauen oder Inhalte semantsch annoteren.

? Sind alle Nutzer gleichermaßen für solche Spiele zugänglich?

Grundsätzlich sollten die Spiele so gebaut sein, dass sie jeder spielen kann und der abstrakte Gehalt der
Aufgaben sehr gut versteckt ist. Das Zielpublikum sind Spieler von sogenannten Casual Games.

? Wem können Sie solche spielerischen Ansätze empfehlen?

Spiele zur Wissensakquise sind gut geeignet für Bereiche, in denen allgemeines Wissen (wie zum Bei-
spiel das Thema oder der Schauplatz von YouTube-Videos) benötgt wird, da dies bei den meisten Spie-
lern vorausgesetzt werden kann. Weiters macht es Sinn, dass große Datenmengen beschrieben werden:
andernfalls ist der Aufwand des Spieldesigns zu hoch. Beispiele sind das semantsche Beschreiben von
YouTube Videos wie in dem Spiel OntoTube (www.ontogame.org) oder das Bauen einer großen „Gene-
ral-Interest“-Ontologie.

? Wo sehen Sie besonderen Entwicklungs- oder Forschungsbedarf?

Den Forschungs- und Entwicklungsbedarf sehe ich vor allem im Bereich der Incentves: Warum sollten
Nutzer Zeit mit Wissensakquise bzw. dem Training von automatschen Systemen verwenden? Weiters ist
es auch interessant, welche Aufgaben wirklich menschlichen Input benötgen und welche großteils auto-
matsiert werden können.

Dr. Katharina Siorpaes ist wissenschafliche Mitarbeiterin am Semantc Technology Insttute (STI), einer
Forschungseinrichtung der Universität Innsbruck. In ihrer Forschungstätgkeit beschäfigt sie sich unter
anderem mit der Möglichkeit mit Spielen und spielerischen Ansätzen Ontologien zu entwickeln und ver-
schiedene Inhalte semantsch zu annoteren.

Zusammenfassung
Zusammenfassend sind zwei ganz unterschiedliche Formen der Community-Beteiligung
und Nutzung von Metadatenformaten und Ontologien von Interesse: Zum einen stellen
Community-Mitglieder und Nutzer von Services Metadaten in Metadatenformaten zur
Verfügung, zum anderen können sie auch ganz gezielt bei der Entwicklung von Metada-
tenstandards, Ontologien oder Taxonomien beitragen.

61
Abbildung 29: Nutzung von Metadatenformaten und Ontologien

Die Nutzung der Metdadaten, die durch Communitys zusammengetragen werden kön-
nen, beispielsweise durch das Hochladen von Fotos mit EXIF-Dateien, umfasst dabei po-
tental all diejenigen Aspekte, Vorteile und Einsatzgebiete, die in der Diskussion um das
„Sematc Web“ anzutrefen sind.

62
Thomas Kurz, Sandra Schafert und Rupert Westenthaler

8 LINKED DATA
8.1 Konzept und Hintergrund
Das Web – und vor allem das Web 2.0 sowie das Social Web – bestehen immer weniger
aus in sich abgeschlossenen Dokumenten, sondern aus Content-Elementen deren Nütz-
lichkeit sich auch durch ihre Vernetzung mit anderem Content defniert. Einen Ansatz,
Daten in unterschiedlichen Quellen im Sinne des „Semantc Web“ sinnvoll miteinander
verknüpfar und recherchierbar zu machen stellt die Initatve „Linked Open Data“ dar.
Damit ist es ein Schrit in Richtung der unerwarteten Neu- und Wiederverwendung von
Informaton, von der Tim Berners-Lee spricht, die das Web ermöglichen kann: „It is the
unexpected re-use of informaton which is the value added by the web.“ (Berners-Lee
2006). Kernidee ist es dabei, externe Informatonen mit dem (eigenen) Web-Content zu
verknüpfen und zu integrieren und damit wieder zu verwenden (s.a. „Giant Global
Graph“, Berners-Lee, 2007).
Jeder von uns benutzt täglich eine große Menge von Daten. Zum Beispiel werden
Freundschafskontakte über das Internet gepfegt, Fotos ins Netz gestellt oder Kalender-
daten online verwaltet. Es ist jedoch nicht möglich, diese unterschiedlichen Informato-
nen automatsiert sinnvoll zu verknüpfen, um zum Beispiel Fotos in Beziehung mit den
dargestellten Personen und persönlichen Terminen zu bringen. Das liegt zum einen dar-
an, dass die verschiedenen Applikatonen, die die oben genannten Möglichkeiten bie-
ten, ihre Daten meist exklusiv halten und sie nicht nach außen hin zur Verfügung stellen.
Es entstehen sog. „Datensilos“. Zum anderen folgt die Struktur der Daten of keinem ein-
heitlichen Schema. Somit kann deren Inhalt oder Bedeutung nicht maschinell interpre-
tert bzw. folgerichtg untereinander verknüpf werden. Eine umfassende und seman-
tsch korrekte Suche von Informatonen wird dadurch nahezu unmöglich (vgl. Hitzler &
Krötsch, 2008). Grundvoraussetzungen für ein semantsches Web bzw. einer Vernetzung
von Daten ist es daher, „einheitliche, ofene Standards für die Beschreibung von Infor-
matonen zu vereinbaren, die es […] ermöglichen sollen, Informatonen über verschiede-
ne Anwendungen und Platormen auszutauschen und zueinander in Beziehung zu set-
zen“ (Hitzler & Krötsch, 2008, Abschnit 1.3).

Linked Data
Von speziellem Interesse ist in diesem Zusammenhang die Linked-Data-Initatve, eine
Initatve, welche das Ziel hat, Ressourcen im Web miteinander zu verbinden. Verein-
facht dargestellt ist Linked Data die Verknüpfung von strukturierten Daten, so wie das
Web die Verknüpfung von unstrukturierten Inhalten (Text, Bilder) ist. Durch die Kombi-
naton von Daten aus verschiedenen Quellen im Web lassen sich bisher noch unvorstell-
bare neue Anwendungen entwickeln.
Die Linked-Data-Wolke beinhaltet eine Vielzahl von Datenquellen wie z. B. alle Artkel
von Wikipedia, alle Geo-Punkte von geonames.org, alle Musikgruppen, Musiker, Alben
und Songs von Musicbrainz, alle länderspezifschen Informatonen des World-Fact-Book.
Zusätzlich sind diese Daten aber noch miteinander verlinkt. So verlinken Musiker in Mu-
sicbrainz auf den Artkel in Wikipedia, wobei die Orte und Regionen in geonames.org
mit den Wikipedia-Artkeln verknüpf sind. Auf diese Art und Weise bietet Linked Data

63
eine sehr gute Abdeckung von beinahe allen Themengebieten in einer Qualität, die man
selber nie erreichen könnte.
Durch die so strukturierten und verlinkten Daten kann letztlich mehr Nutzen gezogen
werden, indem wie beim traditonellen Web über Links von Informaton zu Informaton
gesprungen wird. So liefert eine Suchmaschine im Semantc Web zum Beispiel bei der
Suche nach einer befreundeten Person die sich derzeit in Paris aufält, zusätzliche Infor-
matonen über die dortgen Sehenswürdigkeiten wie Eifelturm und Louvre. Durch die
Verlinkung ist es dann auch möglich, Daten wie Öfnungszeiten, Eintritspreise, An-
fahrtspläne etc. abzurufen. Zudem ermöglicht die Struktur im Stle einer Datenbank den
Suchmaschinen komplexe Anfragen zu verarbeiten, welches ein schnelleres Aufnden
gesuchter Daten ermöglicht (Bizer, Cyganiak & Heath, 2006).
Linked Data defniert sich jedoch nicht nur anhand der darin enthaltenen Informatonen,
sondern beschreibt auch einige Technologien und die Methodologie wie man mit Hilfe
dieser Technologien die oben beschriebene Funktonalität bereitstellen kann. Ähnlich zu
Hypertexten wird die Struktur des „Web of Data“ durch textuelle Dokumente ermög-
licht, die im Netz zugänglich sind. Ein großer Unterschied ist jedoch die Verlinkung bei
Hypertexten durch die Auszeichnungssprache HTML, beim „Web of Data“ jedoch mitels
Resource Descripton Framework (RDF).

Das Linking-Open-Data-Projekt
Das Linking-Open-Data-Projekt (LOD-Projekt) wurde im Februar 2007 von Chris Bizer
und Richard Cyganiak ins Leben gerufen. Unterstützung erhielten sie dabei von der „Se-
mantc Web Educaton and Outreach (SWEO) Interset Group“ der W3C. Die Idee der
Gruppe entstand vor allem aus dem Wunsch heraus, die Methoden des Semantschen
Webs an realen Daten zu testen (Berners-Lee, 2008, Folie 14). Am LOD-Projekt beteiligt
sich eine stetg wachsende Zahl von Universitäten und Firmen. Darunter sind z. B. die
Freie Universität Berlin, das MIT, OpenLink Sofware, Talis und viele weitere. Eine voll-
ständige Liste aller Teilnehmer fndet sich im ESW-Wiki. Wie schnell die Community
wächst, zeigen eindrucksvoll die Grafken der LOD-Cloud, in der die einzelnen „Datensi-
los“ und deren Verbindungen schemenhaf dargestellt sind. Im Mai 2007 bestand die
Vernetzung aus über 500 Millionen RDF-Tripeln und in etwa 120.000 RDF-Links zwischen
den einzelnen Datensätzen – dies waren bereits beeindruckende Zahlen. Diese „Wolke“
von vernetzten Daten vergrößerte sich allerdings rasant und so konnten im April 2008
bereits mehr als 2 Milliarden RDF-Triple und eine Verlinkung der Daten durch ca. 3 Mil-
lionen RDF-Links gemessen werden. Die Abbildung zeigt die Ausdehnung der LOD-Cloud
im März 2009 (Bizer, 2009): Hinzugekommen sind dabei u. a. viele medizinische Initat-
ven.

64
Abbildung 30: LOD-Cloud im März 2009
Quelle: Bizer (2009)

Im Allgemeinen verfolgt das LOD-Projekt das Ziel immer mehr „open licence datasets“ in
RDF zu überführen und untereinander zu verlinken um so den Wandel des Webs vom
globalen File-System zur globalen Datenbank herbeizuführen. Darüberhinaus sind fol-
gende Ziele wichtg (Berners-Lee, 2008, Folien 34-38):
| Zum einen ist es natürlich wichtg eine möglichst weit reichende Vernetzung zwi-
schen den einzelnen Data-Sets zu erreichen. Allerdings steigern nur sinnvolle Links
den Wert der Vernetzung. Deshalb beschäfigen sich derzeit viele damit, bessere Lö-
sungen zu fnden.
| Benutzer wollen eine integrierte Sicht auf alle Daten, die zu einem Objekt zur Verfü-
gung stehen. Ein Problem unter anderen ist dabei, eine korrekte Fusion der Daten zu
erreichen bzw. durch Fusion korrekte Daten zu liefern.
| Einer sinnvollen und „korrekten“ Nutzung von Daten muss eine Lizenzregelung zu
Grunde liegen. So muss eine Möglichkeit gegeben sein, die Daten mit Metadaten zu
verknüpfen, die eine Lizenzierung beschreiben.
| Um die Daten der Open-Data-Cloud von der RDF-Darstellung in benutzerfreundlicher
Form anzubieten und darzustellen sind semantsche Browser und Suchmaschinen
unumgänglich. Nur damit wird sich eine Akzeptanz seitens der User einstellen.

8.2 Nutzen und Nutzung (in der Zukunf)


Derzeit gibt es noch nicht viele Nutzungen von Linked Data bzw. Open Linked Data, aber
ein großes Interesse und Forschungsaktvitäten. Im folgenden dazu die Einschätzungen

65
von zwei Experten, die sich stark mit der Forschungsperspektve und auch der Anwen-
dersicht beschäfigen.

Auf dem Weg zum Semantc Web - Im Gespräch mit Sebastan Schafert

? Die Vision eines verknüpfen und clever recherchier- und nutzbarem Semantc Web
klingt spannend. Wie realistsch ist aus Ihrer Sicht die Umsetzung der
Linked-Data-Idee? Wo sehen Sie Herausforderungen und Probleme?

Linked Data ist die Umsetzung des Semantc Web, so wie es die ursprüngliche Vision
beschrieben hat. Während in den letzten Jahren der Schwerpunkt der Forschung im
Wesentlichen auf dem Semantc Web (also Logik und Theorie) lag, beschäfigt sich
die Forschung im Rahmen von Linked Data endlich wieder mit dem Semantc-Web-Aspekt (also Ver-
knüpfung von Daten im Web). Insofern sind wir dem Semantc Web damit so nahe wie nie und eine Um-
setzung ist greifar. Herausforderungen gibt es dabei naturgemäß noch viele. Auf eher sozialer Ebene
stellt sich die große Frage, welchen Daten man überhaupt vertrauen kann – denn Daten werden im Un-
terschied zu Inhalten automatsch weiterverarbeitet und können deshalb nicht durch ausreichende Me-
dienkompetenz gefltert werden. Auf technologischer Ebene sind große Fragen in den Bereichen verteile
Suche, Reasoning und Nutzung der Daten noch zu klären.

? Welche Nutzungsmöglichkeiten und Anwendungen sind aus des Salzburg NewMediaLab besonders in-
teressant?

Für uns schaft Linked Data eine tolle und fexible Möglichkeit, Inhalte und Daten aus verschiedenen Sys-
temen unserer Partner miteinander zu integrieren, beispielsweise die textuellen Daten aus einem Con-
tent-Management-System mit den Multmediadaten aus einem Media-Asset-Management-System.
Wenn alle Daten mit Hilfe von Linked Data in einem einheitlichen Format verfügbar gemacht werden,
dann wird Systemintegraton erheblich vereinfacht. Daneben sind für uns natürlich die Forschungsfrage-
stellungen interessant.

? Wo sehen Sie besonders hohen Forschungs- und Entwicklungsbedarf?

Forschungsbedarf besteht vor allem in oben genannten technologischen Fragestellungen, insbesondere


in den Bereichen verteilte Suche über Systemgrenzen hinweg, verteiltes Reasoning, und Weiterverarbei-
tung von Daten. Möchte ich beispielsweise nach sämtlichen Inhalten im Semantc Web suchen, die eine
Ortsinformaton haben um diese auf einer Karte darzustellen, müsste ich entweder alle diese Inhalte
zentral indexieren oder eine verteilte Suche über verschiedene Systeme hinweg (z.B. Peer-to-Peer)
durchführen. Probleme ergeben sich vor allem dann wenn diese Suche auch noch komplexes Reasoning
erfordert, z. B. „wenn eine auf Webseite V beschriebene Veranstaltung einen Ort A hat und der Ort A
auf Webseite W die Koordinaten x und y hat, dann hat die Veranstaltung ebenfalls die Koordinaten x
und y“. Entwicklungsbedarf besteht im Entwurf und in der Implementerung von Systemen ,die ihre Da-
ten mit Hilfe von Linked Data anbieten können und eventuell als Wrapper vor einem bereits bestehen-
den System eingesetzt werden. Ein solches System entsteht bei uns gerade im Rahmen des EU-Projekts
KiWi - Knowledge in a Wiki.

Dr. Sebastan Schafert ist wissenschaflicher Leiter des Salzburg NewMediaLab und arbeitet als Senior
Researcher bei der Salzburg Research Forschungsgesellschaf. Der promovierte Informatker forscht, pu-
bliziert und entwickelt dabei, u. a. im Rahmen des von ihm geleiteten EU-Projektes KiWi (Knowledge in a
Wiki), zu innovatven Social-Media-Anwendungen.

66
Linked Open Data aus Sicht von Unternehmen und Anwender
- im Gespräch mit Andreas Blumauer

? Wie realistsch ist aus Ihrer Sicht die Umsetzung der Linked-Data-Idee?
Wo sehen Sie Herausforderungen und Probleme?

In einer Welt, in der das Web nicht mehr wegzudenken ist, kann sich auch eine
Linked Data Infrastruktur entwickeln. Es dauerte nicht einmal lange von der
Spezifkaton von RDF bis hin zur „Explosion“ der Linked-Data-Cloud. Das Henne-
Ei-Problem ist damit erst mal überwunden, und die ersten brauchbaren Anwendungen wie sig.ma sind
bereits sichtbar. Getrieben von Open-Data-Initatven verschiedener Regierungen und auch dem zuneh-
menden Trend größerer Suchmaschinenhersteller, RDF-Daten zu indizieren und im Suchergebnis zu ver-
wenden, tragen dazu bei, dass die breite Adapterung von Semantc-Web-Technologien bereits stat fn-
det. Zahlreiche kleinere und auch ganz große Content-Provider, Medienhäuser, Verlagshäuser, Nachrich-
tenagenturen etc. spielen längst mit dem Gedanken, das Thema aufzugreifen. Doch weniger die techni-
schen Fragen stehen dabei im Zentrum, vielmehr die Frage, wie sehr „man sich“ nun öfnen müsse, wel-
che Daten man aus der Hand geben müsse, oder welche Geschäfsmodelle dadurch möglich werden.
Wie jede Innovaton, muss auch diese erst einmal von den Betrofenen verstanden und in das Bestehen-
de integriert werden, bevor sie breit ausgerollt werden kann.

? Welche Nutzungsmöglichkeiten und Anwendungen sind aus der Sicht der Anwender von großem In-
teresse?

Im Endefekt geht es immer um drei Anwendungstypen: Mashups und Datenintegraton, Unterstützung


kollaboratver Arbeit und intelligente Suche. Dies lässt sich auf viele Geschäfsprozesse und Fachdomä-
nen übertragen. Einige Branchen sind dabei federführend, wie der Finanzsektor, Life Sciences, Medien
und auch der IT- und Engineering-Sektor. Getrieben durch komplexe Arbeitsabläufe und verteilte Daten-
bestände verlieren Mitarbeiter in diesen Bereichen schnell den Überblick, hier kommen schließlich Se-
mantc-Web-Anwendungen ins Spiel. Interessant wird es vor allem dann, wenn interne Informatonen
mit Webquellen verknüpf werden sollen, spätestens dann macht es sich bezahlt, Metadaten auf Basis
eines interoperablen Frameworks aufzubauen.

? Wo sehen Sie, aus Sicht der Anwender und Unternehmen, besonders hohen Forschungs- und Entwick-
lungsbedarf?

Knackpunkt bei der kommerziellen Anwendung sind Lizenzierungsmodelle und Verfahren zur semi-auto-
matschen Qualitätssicherung. Auch sind noch einige technische Grundprobleme, vor allem im Umfeld
des Reasonings über größere Datenbestände im Web ungeklärt. Doch zeigt sich, dass Linked Data auch
ganz gut mit einigen einfachen Inferenz-Mechanismen das Auslangen fndet und dabei bereits mit sehr
großen Datenmengen eine brauchbare Performance und Stabilität erzielt werden kann.

? Wo sehen Sie uns im Jahr 2020 im Bezug auf Linked Open Data?

Ich denke, das Web bietet 2020 neue, ungeahnte Möglichkeiten auf Basis einer ausgereifen Linked Data
Infrastruktur. Jene Unternehmen, die dann diese Daten für ihr Business Intelligence, Market Intelligence
oder ihr Wissensmanagement nutzen werden, haben einen großen Wetbewerbsvorteil gegenüber je-
nen, die das semantsche Web übersehen.

Andreas Blumauer ist Geschäfsführer der punkt. netServices, Wien. und Mitgründer der Semantc Web
Company, sowie u. a. Herausgeber von Fachbüchern zu Semantc Web und Social Semantc Sofware
(Foto: Weinwurm).

67
Zusammenfassung
Fasst man die (zukünfigen) Möglichkeiten der Linked-Data-Ideen zusammen, ergibt sich
daraus ein ähnliches Bild wie im Abschnit „Metadatenformate und Ontologien“:

Abbildung 31: (Zukünfige) Nutzung von Linked Data

Linked Data hat über die Möglichkeiten von Metadatenformaten hinaus wesentliche
Fortschrite in der Verknüpfung von unterschiedlichen Daten sowie ofenen Datenbe-
ständen im Auge und geht damit noch einen guten Schrit weiter bei der Verfolgung der
Idee des „Semantc Web“.

68
Sandra Schafert

9 ERGÄNZUNG UND ZUSAMMENFASSUNG


In dieser Studie wurde beschrieben, wie (Meta-) Informatonen entstehen, damit ver-
bunden auch vorgestellt, wie sie genutzt werden. Hier möchten wir kurz auf weitere
(Meta-) Informatonen und Nutzungsmöglichkeiten eingehen. Zudem fassen wir zusam-
men, welche allgemeinen Fragestellungen bei der Nutzung von (Meta-) Informatonen
zielführend erscheinen.

Weitere (Meta-) Informatonen


Die Darstellung der in dieser Broschüre vorgestellten (Meta-) Informatonen und ihre
Nutzung ist nicht abgeschlossen, viele Nutzungsmöglichkeiten werden gerade erst ent-
wickelt oder entstehen völlig neu.Beispielsweise haben neben den vorgestellten Text-
quellen auch Audiodateien, Fotos und Videos vielfältge Nutzungsmöglichkeiten:
| So haben Biologen der Universität Harvard Aufnahmen von Vögeln auf der Video-
Platorm YouTube ausgewertet, um deren Rhythmusgefühl zu analysieren und konn-
ten so Datenmaterial auswerten, das auf traditonellem Wege kaum zugänglich ge-
macht werden könnte (Welt.de, 2009).
| Audiodateien fnden beispielsweise auch überraschende Verwendung in Sprachkur-
sen, in denen damit Übungen zum Hörverständnis gestaltet werden. Eine klassische
Übung ist das Hörverstehen von Durchsagen, beispielsweise im Bahnhof, die überra-
schend einfach in den Online-Datenbanken zu fnden und in den Kursen einzusetzen
sind (DaF-Blog, 2009).
| Auch Annotatonen, also Tags, werden nicht alleine in Textorm gegeben. So gibt es
Ansätze, Audio-Annotatonen von Museumsbesuchern unter Einsatz von mobilen Ap-
plikatonen in Museen anderen Besuchern zugänglich zu machen (Puig et al., 2009).

Weitere Nutzungsmöglichkeiten
Es gibt einige Anwendungen, bei denen unterschiedliche (Meta-) Informatonen kombi-
niert ausgewertet werden, die hier nur zum Teil angesprochen wurden. Bezogen auf die
unterschiedlichen Nutzer lassen sich diese folgendermaßen darstellen.

69
Abbildung 32: Nutzung von kombinierten (Meta-) Informatonen unterschiedlicher Nutzer

Zu den Nutzungen von kombinierten, also unterschiedlichen (Meta-) Informatonen im


Einzelnen:
| Personalisierte Informatons- und Empfehlungssysteme: Passende, also auf den Nut-
zer zugeschnitene Informatonen zu bieten ist ein Anliegen in vielen Systemen, bei-
spielweise der Online-Händler: Ebay verschickt so Neuigkeiten der Lieblingshändler,
Amazon empfehlt Produkte, die andere Käufer eines Produktes gekauf haben. Die-
ser Bedarf, verschiedene Quellen und Ressourcen zu nutzen und auf persönliche In-
teressen und Bedürfnisse zusammenzubringen steht auch hinter dem Konzept der
„Persönlichen Lernumgebung“ (s. Schafert & Kalz, 2009) und Möglichkeiten, durch
Mash-Ups und Recommender-Strategien Lern-Empfehlungen im Web 2.0 zu geben
(Drachsler, 2009).
| Reputatonssysteme: Neben eher kompettven Angeboten wie beispielsweise die
Bestenliste von Herstellern oder Dienstleistern gibt es auch eher kooperatve Reputa-
tonsysteme, bei denen eher „Labels“, also Nutzerbeschreibungen, als Bewertungen
eingesetzt werden. Auch hier gibt es eine Reihe recht unterschiedlicher Daten, die
bei der Darstellung und Bewertung von Reputaton einfießen können.
| Adaptve bzw. personalisierte Werbung im Web: (Meta-) Informatonen ermöglichen
zum einen die Platzierung von Werbung passend zum Kontext, beispielsweise zum
Nachrichtenartkel über eine Modenschau die Werbung eines Modelabels. Die Daten
die Nutzer über sich selbst preisgeben oder durch ihr Verhalten bekannt sind können
ebenfalls genutzt werden, beispielsweise die Werbeeinblendungen in der Suchma-
schine Google.com darunter, Yahoo.de hat durch die Schaltung von Werbung im Be-
zug auf Region und Interesse der Nutzer die Werbeeinnahmen erhöhen können
(Spiegel Online, 2009). Es ist anzunehmen, dass gerade in diesem Bereich viele Un-
tersuchungen und Tests laufen, die von Unternehmen getrieben sind und die daher
nicht öfentlich gemacht werden.
| Evaluaton und Erfolgsmessung: Wenn der Erfolg von Maßnahmen im Web 2.0, bei-
spielsweise die Gesundheit einer Online-Community oder die Atraktvität eines neu-
en Online-Angebots bewertet werden soll, stehen potentell recht unterschiedliche
und viele Informatonen zur Verfügung (u. a. Schafert & Wieden-Bischof, 2009, 63f),
unter anderem Klickverhalten, Bewertungen, Auswertung von Kommentaren. Für

70
Werbetreibende ist so nicht mehr die Zahl der Webseitenaufrufe von Bedeutung,
neue Kennzahlen beinhalten u. a. die Zahl der eindeutg aktven User (Unique User),
registrierte und aktve User (s. Rönisch, 2008).
| Webmonitoring: Um Aussagen zu Trends und Entwicklungen zu erhalten, die Verbrei-
tung von Begrifen bzw. Verwendung von Markennamen vergleichend zu analysieren
und um Rückschlüsse über die Bewertung von Produkten und Dienstleistungen aus
Kundensicht zu erlangen sind die Möglichkeiten des Webmonitoring für Unterneh-
men von besonderem Interesse (Markus & Schafert, 2010). Gerade Letzteres ist im
Hinblick auf unzufriedene Kunden, die man nur schwer durch traditonelle Verfahren
erreicht, von Interesse (vgl. Infospeed, 2008), immer mehr Unternehmen beobach-
ten das Internet aktv (Fank, 2008). Auch wissenschafliche Untersuchungen und Pro-
gnoseinstrumente arbeiten mit Webmonitoring, beispielsweise zum Monitoring von
politschen Meinungsbildungsprozessen (siehe z. B. Wahlradar.de) sowie der Entwick-
lung von Pandemien (z. B. mit Hilfe von Twiter-Analysen: Chew & Eysenbach, 2009),
mit Hilfe von Facebook-Analysen: Luo, Paton & Witaker, 2009).
Es zeigt sich: Wirklich alle Arten von Informatonen, die derzeit durch Communitys und
soziale Netzwerke und die Möglichkeiten des Web 2.0 entstehen, und deren Nutzungs-
möglichkeiten erschöpfend zu beschreiben erscheint nicht nur im Rahmen der be-
schränkten Möglichkeiten dieser Broschüre derzeit unmöglich. In den beiden noch aus-
stehenden Veröfentlichungen im Rahmen der ComStudy werden wir uns jedoch aus-
führlicher mit Empfehlungs- und Reputatonssystemen beschäfigen.

Überblick zur Nutzung von (Meta-) Informatonen


Allgemein werden Informatonen und Metainformatonen immer dann gerne genutzt,
wenn keine anderen Daten vorliegen, beispielsweise keine Befragungsergebnisse vorlie-
gen oder wenn gezielt viele Informatonen eingeholt und kombiniert werden, um die
„Weisheit der Massen“, also Efekte der „kollektven Intelligenz“, der „Schwarmintelli-
genz“ bzw. der „Schwarmkreatvität“ zu nutzen, d. h. auszunutzen, das große Gruppen
zu intelligenten, kreatven und angemessenen Lösungen kommen können.
In folgender Tabelle wird der aktuelle Einsatz der Daten bzw. das Wissen über (Meta-)
Informatonen für die vier Nutzertypen im Überblick beschrieben. Dunkel eingefärbt
wurden hier Nutzungsformen, die vergleichsweise bedeutsam sind, d. h. aktuell viel Ak-
tvität „rund herum“ zu sehen ist, auch wenn es insgesamt nur von wenigen Anwendun-
gen oder Nutzern tatsächlich genutzt wird, wie es beispielsweise beim Tagging der Fall
ist.

71
(Meta-) Informatonen über ... … werden genutzt von …

Einzelne Communitys Betreiber von Drite


Nutzer bzw. Nutzer Communitys
einer Anwen- & -anwen-
dung dungen
Nutzerverhalten (Klicks, Suchen) ¢ ¢ ¢ ¢
Kommunikatons- & Vernetzungsstruktur ¢ ¢ ¢ ¢
Bewertungen ¢ ¢ ¢ ¢
Social Tagging ¢ ¢ ¢ ¢
Texte ¢ ¢ ¢ ¢
Metadatenformate ¢ ¢ ¢ ¢
Tabelle 5:Nutzung von (Meta-) Informatonen im Überblick
Anmerkung: dunkel markiert sind Einsatzformen, die vergleichsweise bedeutsam sind

Entstehung und Nutzung von (Meta-) Informatonen unterstützen


Das Durchblätern und Lesen dieser Broschüre kann dazu verleiten sich zu fragen, inwie-
weit man selbst die Vielzahl von (Meta-) Informatonen nutzen kann, insbesondere
dann, wenn man selbst Initator und Betreiber einer Online-Community ist.
Folgende Leitragen können dabei hilfreich sein:
| Welches Ziel wird verfolgt? Welcher Prozess soll unterstützt werden?
| Welche Informatonen sind hilfreich bzw. können dazu hilfreich sein?
| Welche Daten liegen bereits vor bzw. können ausgewertet werden?
| Welche Verfahren können dabei helfen?
| Welche weiteren Daten und Informatonen werden benötgt bzw. wären hilfreich?
| Welche vergleichbaren Projekte gibt es? Was kann man daraus lernen?
Prinzipiell können dabei Ziele der Community selbst verfolgt werden, beispielsweise die
Qualität der Kommunikaton und Gesundheit einer Community zu überwachen. Häufg
weichen aber die Ziele der Betreiber von Community-Platormen, Websites und Sozia-
len Netzwerken davon ab, insbesondere dann, wenn sie von kommerziellen Interessen
getrieben sind.
Mit Blick auf die teils recht kreatve und innovatve Nutzung der (Meta-) Informatonen,
insbesondere im Webmonitoring, erscheint es bei der Erörterung solcher Themen im
hohen Maße wichtg, kreatven Lösungen die Möglichkeit der Entaltung zu geben: Die
Möglichkeiten für die unterschiedlichen Nutzer und Nutzungen der Daten ist noch kei-
neswegs ausgereizt. Eine interdisziplinäre Zusammensetzung von solchen Innovatons-
entwicklungsprozessen sowie entsprechende Kreatvitätstechniken sollten Bestandteil
der Entwicklungen von Ideen und Lösungen sein.

Gesellschafliche Perspektve
In dieser Studie sind wir eher pragmatsch mit der Fragestellung umgegangen und ha-
ben unterschiedliche Nutzungsszenarien von (Meta-) Informatonen vorgestellt, ohne

72
diese in Hinsicht auf mögliche soziale, politsche oder auch rechtliche Herausforderun-
gen und Konsequenzen hinzuweisen.
Hier sind in den letzten Jahren eine große Zahl an Möglichkeiten entstanden, Informa-
tonen über einzelne Personen zu erheben und darüber zu verfügen, wie es vor einige
Jahren noch undenkbar war. Dabei werden diese Daten nicht von staatlichen Einrichtun-
gen, sondern im großen Umfang von Unternehmen erhoben, beispielsweise bei den So-
zialen Netzwerken wie Facebook oder LinkedIn. Die Nutzer geben dabei freiwillig Selbst-
auskunf an Unternehmen, und durch ihre Aktvitäten und Vernetzung kommen eine
Vielzahl an Informatonen hinzu, die in aller Regel auch dauerhaf im Internet zu fnden
sind. Hier besteht gesellschaflicher Handlungsbedarf um diesen neuen Bedingungen
angemessen Rechnung zu tragen, beispielsweise verändern sie das soziale Zusammen-
sein, wenn viele persönliche Dinge oder familiäre Geschichten, die früher „vergessen“
worden wären dauerhaf präsent sind (s. Mayer-Schönberger, 2009). Natürlich sind auch
entsprechende politsche und juristsche Reaktonen notwendig, wie mit den neuen Da-
tenmonopolen umgegangen werden soll. So stellt sich auch die Frage inwieweit öfent-
lich zugängliche Daten auch in wissenschaflichen Veröfentlichungen personenbezogen
ausgewertet werden dürfen, problematsch erscheint hier z. B. die Auswertung der
PWM-Platorm (s. Mayr, 2009) bei der keine Anonymisierung vorgenommen wurde.
Schließlich bedarf es auch Aktvitäten, wie im Bildungswesen adäquat auf diese Entwick-
lungen eingegangen wird: Es ist heute kinderleicht ein Bild mit dem Handy aufzuneh-
men und online zu stellen, die möglichen Konsequenzen für Jugendliche häufg nicht zu
überschauen. Auch bei Erwachsenen erscheint hier Auflärung über die Funktonswei-
sen von Microblogging-Angeboten wie Twiter oder Kurznachrichten in Sozialen Netzen,
wie dort zu fndende negatve Aussagen über die Arbeit und den Chef und damit ver-
bundene Kündigungen beispielhaf zeigen.
Ein Forum, das versucht Chancen, Möglichkeiten und Herausforderungen des zukünfi-
gen Webs aus Sicht von Unternehmen und Anwendern zu diskuteren und dazu Meinun-
gen zusammenzutragen, ist das österreichische Projekt Zukunfsweb.at.

73
74
LITERATUR UND QUELLEN
| von Ahn, L. & Dabbish, L. (2004). Labeling Images with a Computer Game. In ACM Conference
on Human Factors in Computng Systems (CHI), 2004, pp 319-326.
| von Ahn, L; Ginosar, S., Kedia, M., Liu, R. & Blum, M. (2006): Improving Accessibility of the
Web with a Computer Game. Proceedings of the SIGCHI conference on Human Factors in
computng systems table of contents, Montréal, Québec, Canada, SESSION: Games table of
contents, 79-82.
| Altsearchengines.com (2009). ePulze uses sentment analysis to build beter advertsing.
(2009-10-04)
| Askitas, Nikos & Zimmermann, Klaus F. (2009). Prognosen aus dem Internet: Weitere Erho-
lung am Arbeitsmarkt erwartet. In: Wochenbericht des DIW, 25/2009, 402-408.
| Barbosa, Daniela (2008). The Taxonomoy Cookbook. Finding the Right Recipe for Organizing
Enterprise Metadata. htp://solutons.dowjones.com/cookbook/ebook_sla2008/cookbooke-
book.pdf (2009-08-14)
| Basic Thinking Blog (2009). Wann die Deutschen am geilsten sind. Weblogeintrag vom
23.3.2009. htp://www.basicthinking.de/blog/2009/03/23/wann-die-deutschen-am-geilsten-
sind/ (2009-10-13)
| Baumöl, Ulrike & Ickler, Henrik (2008). Soziale Netzwerkanalyse. In: Karl Kurbel, Jörg Becker,
Norbert Gronau, Elmar Sinz & Leena Suhl (Hrsg.), Enzyklopädie der Wirtschafsinformatk. On-
line-Lexikon. htp://www.enzyklopaedie-der-wirtschafsinformatk.de/wi-enzyklopaedie/lexi-
kon/daten-wissen/Wissensmanagement/Soziales-Netzwerk/Soziale-Netzwerkanalyse (2009-
10-03)
| Berners-Lee, Tim (2006). Linked Data - personal view. htp://www.w3.org/DesignIssues/Lin-
kedData.html (2009-07-24)
| Berners-Lee, Tim (2007). Giant Global Graph. Weblogeintrag vom 21.11.2007, htp://dig.c-
sail.mit.edu/breadcrumbs/node/215 (2009-11-21)
| Berners-Lee, Tim (2008). Slides for Open Data (State of the Art). URL: htp://www.w3.org/
2008/ Talks/0617-lod-tbl/#(1) (2009-07-24)
| Bernstein, Michael; Tan, Desney; Smith, Greg; Czerwinski; Mary & Horvitz, Eric (2009). Colla-
bio: A Game for Annotatng People within Social Netzworks. In: UIST '09, October 4-7, Canaca.
htp://research.microsof.com/en-us/um/people/horvitz/collabio.pdf (2009-10-03)
| Bizer, Christan (2009). LOD-Dataset. htp://www4.wiwiss.fu-berlin.de/bizer/pub/lod-data-
sets_2009-03-05.html (2009-10-15)
| Bizer, Chris, Cyganiak, Richard & Heath, Tom (2006). How to Publish Linked Data on the Web.
URL: htp://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial/ (2009-07-24)
| Brauckmann, Patrick (2010), Web-Monitoring. Gewinnung und Analyse von Daten über das
Kommunikatonsverhalten im Internet, Konstanz: UVK-Verlag.
| Chew, Cynthia Mei & Eysenbach, Gunther (2009). Pandemics in the Age of Twiter: Content
Analysis of “Tweets” During the H1N1 Outbreak. Präsentaton auf der Konferenz Medicine
2.0, 17-18.9.2009, Toronto, USA.
| Chi, E.H.; Pirolli, P. & Lam, S.K. (2007). Aspects of Augmented Social Recogniton: Social In-
formaton Foraging and Social Search. In: D. Schuler (Ed.), Online Communites and Social
Computng. Berlin: Springer, 60-69.
| Chun, S., Cherry, R., Hiwiller, D., Trant, J. & Wyman, B. (2006). Steve.museum: An Ongoing Ex-
periment in Social Tagging, Folksonomy, and Museums. In: Proceedings of the Museum and
the Web 2.0 conference, March 22-25, 2006, Albuquerque, New Mexico. Online zugänglich
unter: htp://www.archimuse.com/mw2006/papers/wyman/wyman.html (2009-02-19)

75
| DaF-Blog (2009). Durchsagen. Weblogeintrag vom 21.9.2009. htp://cornelia.siteware.ch/
blog/ wordpress/2009/09/21/durchsagen (2009-10-04)
| Derntl, Thomas; Hampel, Thorsten; Motschnig, Renate & Pitner, Tomas (2009). Social Tagging
und Inclusive Universal Access. In: Birgit Gaiser, Thorsten Hampel & Stephanie Panke (Hrsg.),
Good Tags – Bad Tags. Social Tagging in der Wissensorganisaton, Münster: Waxmann, S. 51-
71.
| Diakopoulos, N. & Chiu, P. (2007). PhotoPlay: A Collocated Collaboratve Photo Tagging Game
on a Horizontal Display. In: Proceedings addendum of User Interface Sofware Technology
(UIST). Newport, Rhode Island, October 2007.
| Drachsler, Hendrik (2009). Navigaton Support for Learners in Informal Learning Networks.
Maastricht: Open Universiteit Nederland.
| ESW-Wiki (2009). FOAF+SSL. htp://esw.w3.org/topic/foaf+ssl (2009-10-01)
| Fank, Mathias (2008). WebKnow Studie 2008. Status Quo von Webmonitoring in Unterneh-
men. Online zugänglich unter: htp://www.infospeed.de/data/WebKnow-Studie-2008.pdf
(2008-12-23)
| FAS.research (2009). Homepage. htp://www.fas.at/ (2009-10-14)
| Fitkau & Maaß Consultng (2008). Produktbewertungen beeinfussen Kaufentscheidungen.
htp://www.w3b.org/e-commerce/produktbewertungen-beeinfussen-kaufentscheidun-
gen.html (2009-1014).
| ESW Wiki. URL: htp://esw.w3.org/topic/FrontPage (2009-07-24)
| Gaiser, Birgit, Hampel, Thorsten & Panke, Stephanie (2008). Vorwort. In: dies. (Hrsg.), Good
Tags Good Tags – Bad Tags. Social Tagging in der Wissensorganisaton, Münster: Waxmann.
| Gelin, Rene (2009). Aufgepasst! So wird es gemacht. SEO-Special: Expertentpps aus der Praxis
In websellling, 5, 38-41.
| Ginsberg, Jeremy; Mohebbi, Mathew H.; Patel, Rajan S.; Brammer, Lynnete, Smolinski, Mark
S. & Brilliant, Larry (2009). Detectng infuenza epidemics using search engine query dataIn:
Nature 457, 1012-1014.
| Google, Insights for Search Help, htp://www.google.com/support/insights//bin/answer.py?
answer=87285 (2009-06-02)
| Gloor, Peter, Krauss, Jonas S., Nann, Stefan, Fischbach, Kai and Schoder, Detlef, Web Science
2.0: Identfying Trends Through Semantc Social Network Analysis (November 11, 2008).
htp://ssrn.com/abstract=1299869 (2009-10-14)
| Graf, Joachim (2009). Start des iBusiness 'Search Advertsing Index': Hoher Werbedruck im
SEM-Markt. In: iBusiness Executve Summary, 19, 8, 15.
| Groß, Olaf (2008). Community-Strategien für den Online-Shops: Kaufen als Gesellschafser-
lebnis. In: iBusiness Executve Summary, Jg. 18, Ausgabe 16/17, 8-9.
| Groß, Olaf (2009). Saisonale Search-Trends im SEM und Afliate-Marketng: Das Wissen um
die richtge Stunde. In: iBusiness Executve Summary, 19, 6, 6-7.
| Gruber, Thomas (2008). Ein Bewertungssystem für kollaboratv erstellte Inhalte. Eine prototy-
pische Implementerung eines generischen Frameworks. Vorstellung der Diplomarbeit bei
Salzburg Research, 22.1.2008.
| Güntner, Georg; Sint, Rolf & Westenthaler, Rupert (2009). Ein Ansatz zur Unterstützung tradi-
toneller Klassifkaton durch Social Tagging. In: Birgit Gaiser, Thorsten Hampel & Stephanie
Panke (Hrsg.), Good Tags – Bad Tags. Social Tagging in der Wissensorganisaton, Münster: Wa-
xmann, S. 187-199.

76
| Herr, Joachim (2005). Der Kampf um die Spitzenplätze. Branchen (71): Sportartkel. Online zu-
gänglich unter: htp://www.faz.net/s/ RubD16E1F55D21144C4AE3F9DDF52B6E1D9/
Doc~EC4A E7272834A4D1DBDCDD2D4586FE41E~ATpl~Ecommon~Scontent.html [2009-06-
02]
| Herr, Joachim (2006). Die höhere Mehrwertsteuer trübt die Freude. Branchen (71): Sportart-
kel. Online zugänglich unter: htp://www.faz.net/s/ Rub39D62EB10953443E-
B82D694D50AE0845/ Doc~EDEBF09CAD89B4B38B0017A43F18F7AEA~ATpl~Ecommon~con-
tent.html [2009-06-02]
| Hitzler, Pascal & Krötsch, M. (2008). Semantc Web Technologies. Berlin: Springer.
| Infospeed (2008). Homepage. Online zugänglich unter: htp://www.infospeed.de/ [2008-12-
22]
| Jaschke, Robert; Grahl, Miranda; Hotho, Andreas; Krause, Beate; Schmitz, Christoph & Stum-
me, Gerd (2007). Organizing Publicatons and Bookmarks in BibSonomy. In: Proceedings of
the WWW 2007, May 8-12, 2007, Banf, Canada.
| Kirchhof, Lars; Stanoevska-Slabeva; Katarina; Nicolai, Thomas & Fleck, Mathes (2008). Using
social network analysis to enhance retrieval systems. In: Applicatons of Social Network Analy-
sis (ASNA) (Zurich), 12.9.2008 htp://www.alexandria.unisg.ch/EXPORT/DL/46828.pdf (2009-
10-12)
| Kitl, Christan & Zeidler, Christan (2007). User Generated Content und Metadatenmanage-
ment. In: HMD, Praxis der Wirtschafsinformatk, Hef 258, 57-67.
| Klamma, Ralf; Cuong, Pham Manh & Cao, Yiwei (2009). You Never Walk Alone: Recommen-
ding Academic Events Based on Social Network Analysis. Complex (1) 2009: 657-670.
| Klamma, Ralf; Spaniol, M. & Renzel, D. (2007). Community-Aware Semantc Multmedia Tag-
ging – From Folksonomies to Commsonomies, in: K. Tochtermann, H. Maurer, F. Kappe, A.
Scharl (Eds.): Proceedings of I-Media'07, Internatonal Conference on New Media Technology
and Semantc Systems, Graz, Austria, September 5 - 7, 2007, J.UCS (Journal of Universal Com-
puter Science) Proceedings, pp. 163-171.
| Knoth, Petr; Schmidt, Marek & Smrž, Pavel (2008). Informaton Extracton — State-of-the-Art.
Knowledge in a Wiki (KiWi), Deliverable 2.5. htp://wiki.kiwi-project.eu/multmedia/kiwi-pub:
KiWi_D2.5_fnal.pdf (2009-09-02)
| Leisenberg, Manfred (2008). Soziale Netze und Web 2.0 - Chance für die Marktorschung. In:
Computerwoche, 9.6.2008 htp://www.computerwoche.de/netzwerke/web/1866180/ (2009-
10-03)
| Luo, Chen; Paton, Chris & Witaker, Robyn (2009). Facebook: An Innovatve Infuenza Pande-
mic Early Warning System. Präsentaton auf der Konferenz Medicine 2.0, 17-18.9.2009, Toron-
to, USA.
| Marketng Pilgrim (2008). Using Web Metrics to Analyze the ‘Palin Efect’ & 2008 Presidental
Campaign. Monday, October 13th, htp://www.marketngpilgrim.com/2008/10/sarah-palin-
internet-popularity.html (2009-10-13)
| Markus, Mark & Schafert, Sandra (2010). Web-Monitoring mit freien Quellen und Werkzeu-
gen für Unternehmen. Beispiel: Skiherstellerbranche. In: Patrick Brauckmann (Ed.), Web-Mo-
nitoring. Gewinnung und Analyse von Daten über das Kommunikatonsverhalten im Internet,
Konstanz: UVK-Verlag, 190-204.
| Marlow, Cameron; Naaman, Mor; Boyd, Danah, & Davis, Marc (2006). HT06, Tagging Paper,
Taxonomy, Flickr, Academic Title, ToRead. In: Proceedings of Hypertext 2006, New York: ACM
Press.
| Mayer-Schönberger, Viktor (2009). Delete: The Virtue of Forgetng in the Digital Age. Prince-
ton: Princeton University Press.

77
| Mayr, Manuela (2006). Soziale Netzwerkanalyse der PWM. In: Platorm Wissensmanagement
(Hrsg.) Wissen wirkt! Aber wie?! PWM-Jahrbuch 2006/2007, Wien, 35-44.
| Mikeonads.com (2008). Using your browser URL history to estmate gender. Weblogeintrag
vom 13.7.2009 htp://www.mikeonads.com/2008/07/13/using-your-browser-url-history-est-
mate-gender/ (2009-08-12)
| Mishne, Gilad (2006). AutoTag: a collaboratve approach to automated tag assignment for we-
blog posts. WWW 2006: 953-954.
| Mishne, G. & Glance, N. (2006). Predictng Movie Sales from Blogger Sentment Export: In
AAAI 2006 Spring Symposium on Computatonal Approaches to Analysing Weblogs.
| Moens, M.-F. (2006). Informaton Extracton: Algorithms and Prospects in a Retrieval Context
(The Informaton Retrieval Series). New York: Springer.
| Morrison, P.J. (2007). Tagging and Searching: Search retrieval efectveness of folksonomies
on the Web. Unpublished master’s thesis, Kent State University.
| Odden, L. (2009). 6 Social Search Engines to Start 2009. Weblogeintrag vom 4.1.2009, URL:
htp://www.toprankblog.com/2009/01/6-social-search-engines/ (2009-07-24)
| Puig, V., L’Hour, Y.-M.; Haussonne, Y.-M. & Jauniau, C. (2009). Collaboratve Annotaton System
Using Vocal Comments Recorded on Mobile Phones and Audio Guides: The Centre Pompidou
Exhibiton Traces Du Sacré. Museums and the Web.
| Randler, Stephan (2009). Die Zukunfsperspektven von Social Shopping: Wo das größte
Marktpotental lauert. In: iBusiness Executve Summary, 19, 8, 12-13.
| Riekert, Wolf-Fritz (1996). Bericht der Arbeitsgruppe Metadaten. In: R. Gütler, & W. Geiger
(Hrsg.), Integraton von Umweltdaten, 3. Workshop Schloß Dagstuhl 1995. Marburg: Monopo-
lis.
| Rönisch, Susan (2008). Online-Werbemessung: Web 2.0 braucht Kennzahlen 2.0. In: iBusiness
ExecutveSummary, Jg. 18, 20, 6-7.
| Schafert, Sandra & Kalz, Marco (2009). Persönliche Lernumgebungen: Grundlagen, Möglich-
keiten und Herausforderungen eines neuen Konzepts. In K. Wilbers & A. Hohenstein (Hrsg.),
Handbuch E-Learning. Expertenwissen aus Wissenschaf und Praxis - Strategien, Instrumente,
Fallstudien. (Gruppe 5, Nr. 5.16, pp. 1-24). Köln: Deutscher Wirtschafsdienst (Wolters Kluwer
Deutschland), 27. Erg.-Lfg. Januar 2009.
| Schafert, Sandra & Wieden-Bischof, Diana (2009). Erfolgreicher Aufau von Online-Commu-
nitys. Konzepte, Szenarien und Handlungsempfehlungen. Erschienen in der Reihe “Social Me-
dia”, hrsg. von Georg Güntner und Sebastan Schafert, Band 1. Salzburg: Salzburg Research.
| Siorpaes, K. and M. Hepp, OntoGame (2007). Towards Overcoming the Incentve Botleneck in
Ontology Building, in Proceedings of the 3rd Internatonal IFIP Workshop On Semantc Web &
Web Semantcs (SWWS '07) co-located with OTM Federated Conferences. Springer LNCS: Vila-
moura, Portugal, November 29-30.
| Spiegel Online (2007). SPIEGEL ONLINE startet Zeitgeschichte-Projekt. Online zugänglich un-
ter: htp://www.spiegelgruppe.de/spiegelgruppe/home.nsf/PMWeb/DDE0FC2234B59CBD-
C125731B002710F5 (2009-12-15)
| Spiegel Online (2009). Yahoo beschert US-Zeitungen mehr Erlöse. htp://www.spiegel.de/
netzwelt/ web/0,1518,626250,00.html (2009-10-14)
| Stegbauer, Christan (2009). Wikipedia. Das Rätsel der Kooperaton. Wiesbaden: VS Verlag.
| Synesketch (2009). Gallery and Demo. htp://www.synesketch.krcadinac.com/ wiki/index.-
php?ttle=Demonstraton#Synemania (2009-10-09)

78
| Trant, J. (2008). Access to art museums online: a role for social tagging and folksonomy? Key-
note address. Dublin Core Metadata Initatve Annual Meetng, Berlin, Germany, September
23, 2008.
| Vuorikari, Riina (2009). Are tags from Mars and descriptors from Venus? A study on the ecolo-
gy of educatonal resource metadata. In: Proceedings of the ICWL 2009, Aachen, Aug 19.
| Weinberger, David (2007). Everything is miscellaneous: the power of the new digital disorder.
New York: Times Books.
| Wichowski, Alexis (2009). Survival of the ftest tag: Folksonomies, fnability, and the evolut-
on of informaton organizaton. In: frst monday, Volume 14, Number 5-4, May 2009.
htp://frstmonday.org/ htbin/cgiwrap/bin/ojs/index.php/fm/artcle/view/2447/2175 (2009-
09-21)
| Welt.de (2009). So stampfen Vögel mit den Füßen zur Musik htp://www.welt.de/wissen-
schaf/artcle3656551/So-stampfen-Voegel-mit-den-Fuessen-zur-Musik.html (2009-10-14)
| Wieden-Bischof, Diana & Schafert, Sandra (2008). Nachrichten 2.0. Eine Analyse internato-
naler Nachrichtenangebote im Internet. Norderstedt: Books on Demand.
| Zhang, J., Dong T., Ackerman M.S., Qu Y. (2008). Expertse-Tagging Game: Identfying Expertse
Networks in Organizatons, CSCW Workshop on What to expect from Enterprise 3.0: Adaptng
Web 2.0 to Corporate Reality, 2008, San Diego.

79
AUTORINNEN UND AUTOREN
Dr. Sandra Schafert arbeitet seit 2006 als wissenschafliche Mitarbeiterin und Projekt-
managerin bei der Salzburg Research Forschungsgesellschaf (SRFG) zu Webbasierten
(Bildungs-) Innovatonen. Sie leitet die ComStudy, in deren Rahmen diese Veröfentli-
chung entstand.
Julia Eder ist Mitarbeiterin der SRFG im Bereich Communicatons und dort u.a. für das
Projekt TagIT verantwortlich.
Mag. Wolf Hilzensauer ist wissenschaflicher Mitarbeiter der SRFG im Bereich Informat-
on Society Research, spezialisiert auf Webbasierte (Bildungs-) Innovatonen.
Dipl. Inf. Thomas Kurz ist wissenschaflicher Mitarbeiter der SRFG im Bereich Wissens-
und Medienmanagement.
Dr. Mark Markus ist wissenschaflicher Mitarbeiter der SRFG im Bereich Informaton So-
ciety Research und Spezialist für Innovatonsmanagement.
Dr. Sebastan Schafert ist wissenschaflicher Leiter des Salzburg NewMediaLab und ar-
beitet seit 2005 als wissenschaflicher Mitarbeiter in der SRFG, wo er u. a. das EU-Pro-
jekt „Knowledge in a Wiki“ (KiWi) leitet.
DI (FH) Rupert Westenthaler ist wissenschaflicher Mitarbeiter bei der SRFG im Bereich
Wissens- und Medienmanagement.
Mag. Diana Wieden-Bischof ist wissenschafliche Mitarbeiterin bei der SRFG im Bereich
Informaton Society Research.

80
schriftenReihe: Social Media | Band 2
Schriftenreihe: Social Media
Band 2

Media
special

Data
Community
Tagging warm

© shutterstock
Social Media amazing

Knowledge
Das Web 2.0 und seine Fülle an einfachen und neuen Beteiligungsformen hat die Zahl
Weblog

(Meta-) Informationen von Communitys und Netzwerken – Entstehung und Nutzungsmöglichkeiten

Context
der aktiven Nutzerinnen und Nutzer und die Zahl der Beiträge enorm ansteigen lassen.
Gerade da, wo sich Menschen stark austauschen und interagieren werden besonders

Semantic Web

Content
viele Informationen zusammengetragen. Neben den unmittelbaren Beiträgen bei der
Content-Entwicklung – beispielsweise dem Hochladen von Videos, Fotos auf entspre-
chende Plattformen oder Textbeiträgen in Weblogs – entstehen auch Metainformatio-
nen wie Informationen über das Suchverhalten oder durch Social Tagging.

In dieser Broschüre wird dargestellt, wie solche (Meta-) Informationen entstehen und
wie sie genutzt werden. Dazu werden Beispiele aus unterschiedlichen Branchen und aus
Sicht unterschiedlicher Akteure vorgestellt: aus Sicht einzelner Nutzer, von Communitys,
der Betreiber von Web-Angeboten sowie aus Sicht Dritter, z. B. externer Unternehmen
oder der Wissenschaft. Ein gewisses technisches Grundverständnis voraussetzend,
wendet sich diese Studie vor allem an Praktiker, die sich durch die unterschiedlichen


und auch überraschenden Nutzungsmöglichkeiten anregen lassen wollen, ihre eigenen
Produkte und Dienstleistungen weiter zu entwickeln.

Diese Broschüre ist ein Ergebnis der „ComStudy“, die am Salzburg New Media Lab
(SNML) im Zeitraum von Oktober 2008 bis Dezember 2009 durchgeführt wird. Das
SNML, das Kompetenzzentrum für Neue Medien in Österreich, arbeitet daran, digitale
Inhalte clever zu strukturieren, verknüpfen, personalisieren, für alle auffindbar zu
machen und nachhaltig zu nutzen und betrachtet dabei die Community als einen
wesentlichen Faktor vieler Projekte.

(Meta-) Informationen von


Communitys und Netzwerken
ISBN 978-3-902448-15-6

Entstehung und Nutzungsmöglichkeiten

Sandra Schaffert
mit Beiträgen von Julia Eder, Wolf Hilzensauer, Thomas Kurz, Mark Markus,
Sebastian Schaffert, Rupert Westenthaler und Diana Wieden-Bischof

Das könnte Ihnen auch gefallen