Beruflich Dokumente
Kultur Dokumente
Media
special
Data
Community
Tagging warm
© shutterstock
Social Media amazing
Knowledge
Das Web 2.0 und seine Fülle an einfachen und neuen Beteiligungsformen hat die Zahl
Weblog
Context
der aktiven Nutzerinnen und Nutzer und die Zahl der Beiträge enorm ansteigen lassen.
Gerade da, wo sich Menschen stark austauschen und interagieren werden besonders
Semantic Web
Content
viele Informationen zusammengetragen. Neben den unmittelbaren Beiträgen bei der
Content-Entwicklung – beispielsweise dem Hochladen von Videos, Fotos auf entspre-
chende Plattformen oder Textbeiträgen in Weblogs – entstehen auch Metainformatio-
nen wie Informationen über das Suchverhalten oder durch Social Tagging.
In dieser Broschüre wird dargestellt, wie solche (Meta-) Informationen entstehen und
wie sie genutzt werden. Dazu werden Beispiele aus unterschiedlichen Branchen und aus
Sicht unterschiedlicher Akteure vorgestellt: aus Sicht einzelner Nutzer, von Communitys,
der Betreiber von Web-Angeboten sowie aus Sicht Dritter, z. B. externer Unternehmen
oder der Wissenschaft. Ein gewisses technisches Grundverständnis voraussetzend,
wendet sich diese Studie vor allem an Praktiker, die sich durch die unterschiedlichen
und auch überraschenden Nutzungsmöglichkeiten anregen lassen wollen, ihre eigenen
Produkte und Dienstleistungen weiter zu entwickeln.
Diese Broschüre ist ein Ergebnis der „ComStudy“, die am Salzburg New Media Lab
(SNML) im Zeitraum von Oktober 2008 bis Dezember 2009 durchgeführt wird. Das
SNML, das Kompetenzzentrum für Neue Medien in Österreich, arbeitet daran, digitale
Inhalte clever zu strukturieren, verknüpfen, personalisieren, für alle auffindbar zu
machen und nachhaltig zu nutzen und betrachtet dabei die Community als einen
wesentlichen Faktor vieler Projekte.
Sandra Schaffert
mit Beiträgen von Julia Eder, Wolf Hilzensauer, Thomas Kurz, Mark Markus,
Sebastian Schaffert, Rupert Westenthaler und Diana Wieden-Bischof
Sandra Schafert
(Meta-) Informatonen
von Communitys und Netzwerken
Entstehung und Nutzungsmöglichkeiten
ISBN 978-3-902448-15-6
(Meta-) Informatonen
Das Web 2.0 und seine Fülle an einfachen und neuen Beteiligungsformen hat die Zahl
der aktven Nutzer und die Zahl der Beiträge zum Web enorm ansteigen lassen. Gerade
da, wo sich Menschen stark austauschen und interagieren, werden besonders viele In-
formatonen zusammengetragen. Es gibt eine Reihe von Defnitonen und Verständnisse
des Wortes „Informaton“, wir verstehen darunter alle Datenmaterialien und darin ent-
haltenes Wissen und Botschafen, die Nutzer im Web veröfentlichen und hinterlassen.
Viele öfentlich zugängliche Informatonen entstehen in Online-Communitys. Eine Onli-
ne-Community besteht aus Personen mit gemeinsamen Interessen, die Internet- und an-
dere Kommunikatonstechnologien nutzen, um sich regelmäßig auszutauschen
und/oder gemeinsam Inhalte zu entwickeln, dabei starke Bindungen entalten und sich
als zusammengehörig fühlen (Schafert & Wieden-Bischof, 2009). Auch bei weniger star-
ken Bindungen, wie in sozialen Netzwerken oder anderen kommunikatv oder kollabora-
tv angelegten Systemen, z. B. Weblogs oder Microblogging, entstehen viele Informato-
nen. Schließlich entstehen solche Informatonen selbst dort, wo sich Nutzer untereinan-
der nicht kennen, aber gemeinsam aktv sind, beispielsweise Kunden eines Online-Shops
sind oder Leser einer Online-Enzyklopädie.
Neben den unmitelbaren Beiträgen bei der Content-Entwicklung – beispielsweise dem
Hochladen von Videos, Fotos auf entsprechenden Platormen oder Textbeiträgen in
Weblogs – generieren Nutzer bzw. die Communitys auch „Metainformatonen“. Darun-
ter verstehen wir beispielsweise Metadaten, d. h. Angaben über Autoren von Beiträgen
im Html-Code, aber auch andere „Informatonen über Informatonen“. Solche Metain-
formatonen sind beispielsweise die Zahl der Beiträge eines Nutzers oder die Zahl der
Klicks auf einen Beitrag und werden so teilweise erst nachträglich ermitelt.
Ähnliche Begrife sind Metadaten und Metawissen, alle Begrife werden unterschiedlich
defniert (s. z. B. Riekert, 1996). Wir verwenden die beiden Begrife Informaton und Me-
tainformaton in dieser Studie pragmatsch: Wir versuchen zusammenzutragen und vor-
zustellen, was „alles“ in Communitys und Netzwerken entsteht und wie es für ganz un-
terschiedliche Zwecke genutzt wird.
9
In der Praxis zeigt sich, dass diese Unterscheidung nicht immer einfach und eindeutg ist.
So werden wir in dieser Veröfentlichung einige Beispiele für spielerische Ansätze vor-
stellen, wo Nutzer aktv Metainformatonen entwickeln, ihnen dies aber eventuell durch
den Spielcharakter nicht bewusst ist. Auch wird beispielsweise beim Hochladen eines
Fotos gleichzeitg und ohne weiteres Zutun der Nutzer eine Reihe von relevanten Meta-
daten zum Foto (z. B. Blendeneinstellung) zur Verfügung gestellt, was dem Nutzer auch
selbst nicht bewusst sein muss.
Im Web und insbesondere da, wo sich Personen eng austauschen und zusammenarbei-
ten, nämlich in Communitys oder sozialen Netzwerken, entstehen besonders viele
(Meta-) Informatonen. Diese können wiederum durch unterschiedliche Methoden aus-
getauscht, zusammengebracht und analysiert werden. In geschlossenen Systemen, bei
denen beispielsweise eine Anmeldung erfolgt, ist so bereits eine Reihe von Informato-
nen zu den einzelnen Nutzern bekannt.
In sozialen Netzwerken sind nach erfolgter Anmeldung typischerweise folgende Infor-
matonen über einzelne Nutzer bekannt und können entsprechend genutzt werden: Vor-
name und Name, Geschlecht, Alter, aktueller Arbeitgeber, Positon im Unternehmen,
Wohnort und Land, ein Foto, Homepage, E-Mail-Adresse, aktueller Online-Status (ob der
User eingeloggt ist), Datum der Registrierung (Erstanmeldung), letztes Login, ob die An-
meldung durch eine Einladung eines anderen Nutzer (und von wem) erfolgt ist, ein Text
mit einer Beschreibung der Person und ihrer Interessen, Kontakte.
Aber auch in ofenen Systemen oder übergreifenden Services ist eine Reihe von Metain-
formatonen zugänglich und nutzbar. Nicht nur die Anbieter von Webangeboten und
-services, z. B. Online-Shops oder soziale Netzwerke haben Interesse an Metainforma-
tonen zu ihren Inhalten und Nutzern, auch die Nutzer selbst können davon profteren,
wenn dadurch beispielsweise
| Such- und Recherchemöglichkeiten verbessert werden, weil Inhalte und Objekte bes-
ser erschlossen sind,
| Angebote auf spezifsche persönliche Interessen hin dargestellt und nutzbar gemacht
werden, beispielsweise passende Empfehlungen gegeben werden können,
| oder wenn allgemein Angebote optmiert werden können um Nutzer und Communi-
tys zu unterstützen.
Wie wir insbesondere im letzten Kapitel zeigen werden, profteren nicht nur die Anbie-
ter von Webservices, und Nutzer, sondern vielfach auch Drite, beispielsweise externe
Anbieter, Forscher oder Analysten von den entstandenen und zugänglichen Metainfor-
matonen.
10
| Texte, da aus dieser Datenquelle eine Reihe von (auch überraschenden) Metainfor-
matonen analysiert und abgeleitet werden können,
| Metadatenformate als klassische Form von Metainformatonen, wir geben hier u. a.
einen Überblick über aktuelle Schemata, sowie schließlich
| aktuelle Entwicklungen und Projekte zu Linked Data als eine atraktve aktuelle Ent-
wicklung zur weiteren Nutzung und Verlinkung von Daten auf dem Weg zum „Seman-
tschen Web“.
Wie in der Abbildung dargestellt, lassen sich die dargestellten Informatonen beispiels-
weise darin unterscheiden, welche Expertse bei der Entwicklung bzw. Generierung die-
ses Quellmaterials aufgebracht werden muss. So ist in der Regel beim bearbeiten von
Metadaten Fachwissen zum Gegenstand notwendig, währenddessen Suchen oder einfa-
ches Browsen nicht notwendigerweise Fachwissen benötgt – das kann quasi jeder.
Gleichzeitg zeigt sich bei dieser Anordnung, dass das Aufmerksamkeitslevel graduell ab-
nimmt: Während das Schreiben von Weblogeinträgen eher mehr Aufmerksamkeit des
Erstellers benötgen, werden etliche Klicks eher beiläufg vorgenommen. Diese Abstu-
fung und Darstellung ist sicherlich nicht für jeden Fall zutrefend.
Forschungsleitend waren bei dieser Zusammenstellung folgende, eher praktsche Frage-
stellungen:
| Wie entstehen (Meta-) Informatonen unterschiedlicher Art?
| Wie kann man sie auswerten und analysieren?
| Wie werden sie genutzt?
Diese Publikaton verfolgt dabei das Ziel, über unterschiedliche Branchen und Anwen-
dungsbereichen hinweg Beispiele und Nutzungsmöglichkeiten vorzustellen. Es wird da-
bei nicht nur betrachtet, welchen Nutzen einzelne Benutzer eines Services oder einzelne
Community-Mitglieder haben oder wie die Nutzergruppen insgesamt davon profteren,
um beispielsweise ihr gemeinsames Ziel besser verfolgen zu können. Auch die Betreiber
von Communitys oder auch Drite haben Interesse an (Meta-) Informatonen.
11
Abbildung 2: Nutzer von (Meta-) Informatonen
Ein gewisses technisches Grundverständnis voraussetzend, wendet sich diese Studie vor
allem an Praktker, die sich durch die unterschiedlichen Nutzungsmöglichkeiten anregen
lassen wollen, für ihre eigenen Produkte und Dienstleistungen innovatve Einsatzmög-
lichkeiten zu entwickeln.
In Rücksprache mit den Kollegen beim Salzburg NewMediaLab wurden dabei die oben
genannten Schwerpunkte gesetzt, und dazu nach Beispielen, Publikatonen und Exper-
ten recherchiert, um einen guten Einsteg und Überblick in den aktuellen Stand der Nut-
zung sowie anregende Einblicke gewinnen zu können.
12
Sandra Schafert und Mark Markus
2 NUTZERVERHALTEN
Auch das Nutzerverhalten, also das Browsing-, Klick- oder Suchverhalten, ist eine inter-
essante Quelle. Das Nutzerverhalten wird dabei für sehr unterschiedliche Zwecke analy-
siert.
13
Evaluaton und Optmierung von Webaufriten
Durch Daten zum Verhalten kann der Anbieter Benutzerprofle erstellen, analysieren
und Interessengruppen besser identfzieren, die dann zur weiteren Optmierung der
Website beitragen können. Typischerweise wird dies genutzt, um den eigenen Webauf-
trit zu optmieren, um mehr über die Interessen und Vorlieben der Nutzer zu erfahren,
um entsprechende Angebote strategisch besser oder unter anderen Überschrifen zu
positonieren und anzubieten.
Technische Websites sind demnach (stereo-) typisch für Männer, Mode-Websites für
Frauen – Fehler sind so durchaus möglich. Gedacht ist eine solche Anwendung jedoch
nicht notwendigerweise um das Geschlecht zu erraten, sondern um Informatonen über
Interessen und Vorlieben zu erhalten um entsprechend passende Werbung platzieren zu
können. Um Daten über das Browsingverhalten zu erlangen, ist es nicht unbedingt not-
wendig, dass Nutzer die History-Daten freigeben: Es gibt Javascripts, die aus der Farbe
der „besuchten Links“ ableiten, welche Webseiten bereits aufgerufen wurden (vgl. Mi-
keonads.com, 2008; dort wird auf eine Anwendung von Paul Cook hingewiesen).
1
htp://www.espgame.org/gwap/, Stand 1.9.2009
14
Inwieweit das Browsingverhalten bei personalisierter Werbung eingesetzt wird, ist nicht
eindeutg zu klären, aber die Platzierung der oben genannten Anwendung in einem We-
blog über Werbung sowie die entsprechenden Diskussionen in den verknüpfen We-
blogs lassen vermuten, dass hier sehr viel Aktvität vorliegt.
Suchwortanzeigen
Alle großen Suchmaschinen blenden neben den Suchergebnissen auch Werbung
und/oder Links ein, die als Werbung markiert sind und zur Suchanfrage passen. Dieses
Werbeverfahren wird als SEM (Search Engine Marketng) bezeichnet. In diesem Werbe-
segment wird noch einiges ausprobiert und optmiert, die Zahl von 7 Millionen Such-
wortanzeigen im Jahr 2009 bei den Suchmaschinen MSN, Yahoo und Google zeigt jedoch
die Bedeutung, die unter anderem dazu führt, dass dieser Markt mit einem Search Ad-
vertsing Index monatlich beobachtet wird (Graf, 2009).
15
Suchvolumen weltweit
Suchzeit: 01/2004 bis 06/2009
Suchbegriffe: „Salomon Ski“ (blau), „Atomic Ski“ (rot), „Head Ski“
(orange), „Fischer Ski“ (grün), „Elan Ski“ (dunkel blau)
Das Ergebnis verdeutlicht ein über die Jahre hinweg sinkendes Suchvolumen, das alle re-
nommierten Skiartkelhersteller gleichermaßen betrift. Die Schwankungen sind saisonal
bedingt und zeigen, dass die Suchhäufgkeit in den Wintermonaten, d. h. während der
Skisaison erwartungsgemäß stark zunimmt. Dieser Befund kann zunächst als ein abneh-
mendes Interesse an den Skiprodukten und vielleicht sogar auch am Skisport gedeutet
werden. Angesichts des Leihtrends – immer mehr Skifahrer kaufen nicht, sondern leihen
die aktuellen Skimodelle – ist bei den Schlussfolgerungen mit Blick auf das grundsätzli-
che Skiinteresse jedoch Vorsicht geboten.
Weil das sinkende Suchvolumen alle Skimarken betrift, indiziert es einen rückläufgen
Skiabsatz, der statstsch belegt ist. Von 669.000 verkaufer Paar Ski in Deutschland in
der Saison 2000/01 sank der Absatz über die Jahre hinweg kontnuierlich auf nunmehr
377.000 verkaufe Paar Ski in der Saison 2006/07. Ein Abgleich von objektven Absatz-
zahlen mit den Suchvolumina zeigt zwar eine generelle Übereinstmmung (siehe folgen-
de Abbildung), es wird aber auch deutlich, dass sich Suchanfragen aus dem Jahr 2004
keineswegs in den Absatzzahlen unmitelbar widerspiegeln. Ansonsten müsste der Ab-
satz im Jahr 2004 jedenfalls deutlich größer sein als in den Jahren 2005 und 2006. Zu-
dem kann aus den Ergebnissen indirekt eine zunehmende Sätgung des Skimarktes, die
mit einer Intensivierung des Wetbewerbs und Verdrängung verknüpf ist, abgelesen
werden. Darauf deuten die immer geringer werdenden Suchabstände zwischen den ein-
zelnen Skimarken hin. Damit verbunden ist in der Regel ein starker Preiswetbewerb
(vgl. Herr, 2005) sowie starke Konzentratonstendenzen und Übernahmen (vgl. Herr,
2006), die ebenfalls aus den Ergebnissen indirekt hervorgehen. Während die Skimarken
Salomon und Atomic noch in den Jahren 2004 und 2005 meistgesucht (und damit ver-
mutlich die bekanntesten) waren, schmolz ihr Vorsprung im Jahr 2006 fast gänzlich weg.
Im Jahre 2007 haben dann zum ersten Mal mehr Personen nach der Marke Head als
nach der Marke Atomic im Internet gesucht, während Salomon nach wie vor die meist-
gesuchte Skimarke blieb. Head konnte allerdings nicht die Bekanntheit der Marke erhö-
hen, etwa durch innovatve Produkte oder Marketngkampagnen, sondern es ist eher so,
dass das nachhaltg sinkende Skiartkelinteresse Atomic am stärksten geschadet hat. In-
direkt gibt das Ergebnis eine Austauschbarkeit von Skiprodukten und damit Diferenzie-
rungsnotwendigkeit zu erkennen (vgl. Herr, 2005; weitere Interpretatonen und Analy-
sen in Markus & Schafert, 2010).
16
Aus der Google-Insight-Analyse geht hervor, dass die Produkte von Atomic und Rossignol
auf das größte Interesse in die letzten zwölf Monate steßen, wobei dies regional sehr
unterschiedlich ausfällt: Während die Marke Rossignol vor allem in Frankreich gesucht
wurde, ist die Marke Atomic für den deutschsprachigen Raum interessanter, aus wel-
chem sie stammt (Österreich).
Die Google-Insight-Ergebnisse ergänzen, ersetzen aber nicht die traditonelle Recherche,
die Markt- oder Werbewirkungsforschung. Der Hauptvorteil liegt in der Möglichkeit,
schnell und automatsiert wertvolle Teil- und Überblickinformatonen etwa zu einzelnen
Marken in Relaton zueinander ermiteln zu können. Auch kann man gut die Bekanntheit
von neuen Produkten oder Anbietern verfolgen, vorausgesetzt, diese hinterlassen eine
deutliche Suchspur. Der Nachteil aus Sicht der Branchenanalyse liegt in den relatv gene-
rischen Erkenntnissen, die jeder guter Marketer oder Produktmanager eigentlich wissen
sollte. Das Potenzial von Google Insight ist damit eher die Untermauerung bestehender
als die Gewinnung neuer Zusammenhänge.
Allerdings sind Zusammenhangshypothesen wie „je häufger Produkte gesucht werden,
desto größer ist das Kaufnteresse“ oder „je mehr Webseiten mit Produktnamen gefun-
den werden, desto bedeutsamer ist dieses Produkt im Branchenvergleich“, zwar plausi-
bel, wurden jedoch bisher nur unzureichend empirisch überprüf wurden. Dass Begrife
häufg gesucht werden, muss nicht zwangsläufg positv konnotert sein, das kann bei-
spielsweise auch auf Negatvmeldungen oder Rückrufaktonen zurückzuführen sein, wo-
bei auch letztere bei Konsumenten positv konnotert sein können.
17
Es ist anzunehmen, dass gerade für die Nutzung der Daten zum Suchverhalten noch vie-
le weitere Einsatzmöglichkeiten erprobt und entwickelt werden. So wird – teils scherz-
haf – in Weblogs gezeigt, dass im Dezember deutlich häufger nach „Sex“ gesucht wird
als in den anderen Monaten und „Sex“ damit insgesamt „wichtger“ ist als „Liebe“ ist
und dass man die regionale Analyse von Google Insights verwenden kann, um nach po-
tentellen Absatzmärkten für Ostriesentee zu suchen (Basic Thinking Blog, 2009)
Zusammenfassung
Das Wissen darüber, wohin Nutzer klicken, welche Seiten sie aufrufen und mit welchen
Begrifen sie suchen lässt sich vielfältg nutzen: Es kann der Personalisierung dienen,
z. B. für Empfehlungen, aber auch zur Schaltung passender Werbung, es auch ist we-
sentlicher Bestandteil von Reputatonssystemen. Nutzerverhalten sollte auch wesentlich
dabei unterstützen, Webangebote und deren Nutzung zu evaluieren. Insbesondere die
Suchanfragen bei Google und das Angebot von Google Insights zeigt innovatve Ansätze,
wie Nutzerverhalten auch für das Webmonitoring eingesetzt werden kann.
18
Sandra Schafert
19
Abbildung 6: Darstellung von Kontakten als Netzwerk
Quelle: htp://asset.soup.io/asset/0054/6740_ca5c.png (10/2009)
Häufg liegen die exakten Daten über Netzwerke nicht vor, können jedoch über Angaben
über Kontaktntensität oder Vorkommen der Namen in gleichen Dokumenten abgeleitet
werden, beispielsweise durch Analyse von Diskussionsforen. Vier Varianten von Daten
lassen sich dabei unterscheiden (Kirchhof et al., 2008, 7): Explizite soziale Verbindungen
sind beispielsweise öfentlich zugängliche Freundeslisten, explizite indirekte soziale Ver-
bindungen sind demnach Hyperlinks auf Weblogeinträge von anderen. Implizite soziale
Verbindungen sind textuelle Hinweise, die eindeutg auf eine soziale Beziehung hinwei-
sen, beispielsweise Ko-Autorschafen bei Publikatonen. Schließlich sind implizite soziale
Verbindungen beispielsweise Käufer des gleichen Produkts.
20
Es sind jedoch nicht nur diejenigen Personen interessant, die man bereits als Kontakte
gekennzeichnet und/oder akzeptert hat, dieses Wissen wird auch in unterschiedlicher
Form für den einzelnen Nutzer oder die Community genutzt. Im Folgenden einige Bei-
spiele dazu:
| Nutzer werden über Personen informiert bzw. diese als neue Kontakte vorgeschla-
gen, die man kennen könnte, beispielsweise weil man viele gemeinsame Bekannte
hat oder weil sie das öfentliche Profl betrachtet haben (z. B. bei Facebook).
| Bei Recherchen wird dargestellt, über wieviele Ecken (Personen) man mit jemanden
verknüpf ist, d. h. ob man beispielweise über einen gemeinsamen Kontakt vorge-
stellt werden kann (z. B. bei LinkedIn).
| In manchen Netzwerken kann man auch nachvollziehen, was die eigenen Kontakte
öfentlich mit weiteren Kontakten austauschen, z. B. auf den Pinnwänden von Nut-
zern hinterlassen, die man nicht selbst in der Kontaktliste hat (z. B. bei Facebook).
| Gerade in professionellen Netzwerken wie LinkeIn und Xing, wird über die Zahl der
bestätgten Kontakte auch eine gewisse „Bedeutsamkeit“ der entsprechenden Perso-
nen abgeleitet.
| Einige soziale Netzwerke bieten auch an, dass man anderen gemeinsame Kontakte
vorschlagen kann, dies ist besonders dann wichtg, wenn jemand neu bei einem
Netzwerk ist (z. B. Facebook).
Um die unterschiedlichen Netzwerke und Kommunikatonstools auf einer Platorm ver-
folgen und bedienen (also z. B. Statusmeldungen schreiben) zu können, gibt es Werkzeu-
ge (z. B. Tweetdeck) und Websites (z. B. Friendfeed.com) die hier die unterschiedlichen
Kanäle zentral zusammenbringen.
Aus der Vorstellung heraus, dass Mitglieder der gleichen oder verwandten Communitys
bzw. mit ähnlichen Interessen und Arbeitsgebieten auch von den Suchstrategien und
-ergebnissen der Anderen profteren könnten, werden Suchmaschinen konzeptonisiert,
die dieses Wissen adäquat verarbeiten und darstellen wollen (z. B. Chi, Pirolli & Lam,
2007; Odden, 2009). Beispielsweise wird das Wissen über das soziale Netzwerk genutzt,
um Vorschläge für den Besuch von Konferenzen bzw. einzelne Präsentatonen zu geben
(z. B. Klamma, Cuong & Cao, 2009) oder um Tagvorschläge zu geben (Klamma, Spaniol &
Renzel, 2007). Das Wissen über Kontakte und deren Vorlieben und Verhalten ist auch
Bestandteil von Empfehlungs- und Reputatonssystemen.
In den sozialen Netzwerken wird dabei experimentert, welche Arten von Informatonen
über das Kommunikatons- und Vernetzungsverhalten für die Nutzer bzw. die Communi-
ty insgesamt interessant sind und wie sie genutzt werden können. Auch für „normale“
Nutzer ist die Darstellung ihrer Verknüpfung zu anderen „interessant“, auch wenn häufg
Angaben über die Hintergründe der Darstellungen und Interpretatonsmöglichkeiten
fehlen. Beispielsweise kann man sich mit der Facebook-Applikaton TouchGraph die Ver-
knüpfung mit anderen als Netzwerk darstellen lassen.
21
uses well-established protocols, virtually every standard Web browser supports it. Whe-
rever you need to interact over the Web with others but retain a level of trust - your se-
crets are your secrets - FOAF+SSL is there for you.“ (ESW-Wiki, 2009). Dieses Vorhaben
möchte also ermöglichen, dass man beispielsweise Adressdaten von seinen Kontakten
immer auf dem Laufenden halten kann, ohne notwendigerweise alle diese Daten öfent-
lich und zentral zugänglich halten zu müssen.
Meinungsführer identfzieren
Netzwerkanalysen werden in Unternehmen gezielt eingesetzt um Meinungsführer bzw.
um wichtge Knoten in Netzwerken zu analysieren. Beispielweise argumentert die öster-
reichische FAS.research so den Nutzen des Einsatzes damit: „Das Ziel der Sozialen Netz-
werkanalyse ist, Ihnen Ihre Freiheit wieder zu geben: Global Players bleiben nicht länger
unerreichbar, wichtge Kontakte lassen sich herstellen und Sie bleiben nicht mehr in der
Verfechtung rivalisierender Cliquen gefangen.“ (Homepage, Stand 12.10.2009). Das
Wissen über Netzwerke ermöglicht ausserdem, gezielte PR-Maßnahmen durchführen zu
können, indem beispielsweise Meinungsführer festgestellt werden und gezielt einge-
bunden werden (vgl. Leisenberg, 2008).
Community-Aware-Services
Aus der Vorstellung heraus, dass Mitglieder der gleichen oder verwandten Communitys
bzw. mit ähnlichen Interessen und Arbeitsgebieten auch von den Suchstrategien und
-ergebnissen der anderen profteren könnten, werden Suchmaschinen konzeptonisiert,
22
die dieses Wissen adäquat verarbeiten und darstellen wollen (z. B. Chi, Pirolli & Lam,
2007; Odden, 2009).
Beispielsweise wird das Wissen über das soziale Netzwerk genutzt, um Vorschläge für
den Besuch von Konferenzen bzw. einzelne Präsentatonen zu geben (z. B. Klamma,
Cuong & Cao, 2009) oder um Tagvorschläge zu geben (Klamma, Spaniol & Renzel, 2007).
Das Wissen über Kontakte und deren Vorlieben und Verhalten ist auch Bestandteil von
Empfehlungs- und Reputatonssystemen.
Wissen über soziale Netze analysieren und nutzbar machen - im Gespräch mit Ralf Klamma
? In Ihrer Gruppe beschäfigen Sie sich mit unterschiedlichen Metadaten und wie
man sie nutzen kann. Was ist so atraktv an dem Wissen über die sozialen
Strukturen von Usern und Communitys? Wozu kann es genutzt werden?
? In welcher Weise werden solche Informatonen über soziale Netzstrukturen konkret eingesetzt?
Wir setzen diese Systeme gezielt zusammen mit professionellen Praxisgemeinschafen ein, bestehend
also aus Künstlern, Ingenieuren, Ärzten, Wissenschaflern usw. Ein aktuelles Beispiel ist die nachhaltge
Entwicklung des Bamiyan Tales in Afghanistan, wo eine bunte Mischung aus Wissenschaflern, Ingenieu-
ren, Denkmalschützern, Kulturbürokraten, Politkern, und Tourismusmanagern damit beschäfigt ist,
einen Masterplan für die Nutzung des Tales nach Beendigung des Bürgerkrieges zu erstellen. Hier stellen
wir mobile soziale Sofware zur Verfügung und beraten. Wir haben aber auch gerade ein neues Projekt
gewinnen können, bei dem es um die Untersuchung der Kooperatonsmuster zwischen europäischen
Schulen geht. Im Moment sind in der über die Jahre angelegten eTwinning-Datenbank 50.000 Schulen
aufgenommen. Die spannende Frage ist hier, wie Lehrer die Analyse und Visualisierung existerender Ko-
operatonsmuster lernen und nutzen können, um ihr eigenes Kooperatonsverhalten zu optmieren.
23
? Wo sehen Sie gerade besonders hohen Forschungs- und Entwicklungsbedarf?
Das Gebiet bildet gerade eine neue Disziplin heraus, die sich „Web Science“ nennt. Hier geht es darum,
anspruchsvolle analytsche Einsichten in die generelle Natur von Netzen - insbesondere des Webs - mit
herausragenden Ingenieursleistungen zur Erreichung eines gewünschten Verhaltens von Nutzern zu ver-
binden. Web Science wird sicherlich noch einige Jahre brauchen, um sich als eigenständige Disziplin zu
etablieren, aber an der RWTH Aachen haben wir schon begonnen, Studenten aus verschiedenen techni-
schen Masterprogrammen in Vorlesungen, Seminaren und Masterarbeiten mit dieser neuen Disziplin
vertraut zu machen. Forschungsbedarf gibt es vor allem beim Schrit von der statschen Analyse von
Netzen hin zu dynamischen Analyse, die alle Formen von Veränderungen über die Zeit in Netzwerken
berücksichtgt. Hier gibt es erste Schrite zu einem vertefen Verständnis dynamischer Prozesse in Net-
zen, z. B. bei der Analyse von Bewegungsmuster von Nutzern mobiler Informatonssysteme, aber noch
keine ausgearbeitete Theorie. Ein weiterer Punkt ist ein umfassenderes Verständnis der verwendeten
Medien in sozialen Netzen. Bislang werden Medien ausgeblendet und bilden einen blinden Fleck der
Theorie sozialer Netze. Wir verbinden in unseren Forschungen Entwurfstheorien der Informatk mit ope-
ratonalen Medientheorien, die eine medienspezifsche Ausgestaltung von Informatonssystemen erlau-
ben, z. B. bei der Nutzung von mobilem Multmedia. Letztlich will unsere Forschung dem Nutzer des
Webs nicht nur die Folgen des eigenen Handelns bewusst machen, sondern auch sein „Leiden“ unter
den Handlung der anderen. Durch die immer weiter Durchdringung unserer Lebenswelt durch Informa-
tonstechnologien müssen wir uns immer mehr bewusst werden, dass wir auch durch die Spuren beur-
teilt werden, die wir im Netz hinterlassen.
Dr. Ralf Klamma leitet die Arbeitsgruppe „Metadata in Community Informaton Systems“ (MCIS) am
Lehrstuhl für Informatonssysteme und Datenbanktechnologie der RTHW Aachen. Die Gruppe beschäf-
tgt sich im Rahmen des DFG Exzellenzclusters UMIC (Ultra High-Speed Informaton and Communicaton)
und des EU IP ROLE (Responsive Open Learning Environments) sowie einiger anderer natonaler wie in-
ternatonaler Forschungsprojekte mit der Entstehung, dem Nutzen und die Wartung von Metadaten in
Social Sofware und Community-Systemen beschäfigt. Dabei wird auch die Rolle von Metadatenbe-
schreibungsstandards in unterschiedlichen Anwendungskontexten untersucht.
Zusammenfassung
Das Wissen über Kommunikatons- und Vernetzungsstrukturen kann ganz unterschied-
lich genutzt werden. So hilf es zum einen, das persönliche Informatons- bzw. Kontakt-
management zu verbessern und dient generell dazu, die Kommunikaton von Nutzern
gleicher Services oder von Communitys zu verbessern. Auch kann es dienlich sein, um
Communitys efektv zu moderieren und die Qualität der Prozesse zu evaluieren.
Schließlich ergeben sich aus diesen Strukturen und Abläufen auch Hinweise für beson-
ders innovatve Vernetzungen und Prozesse.
24
Abbildung 7: Nutzung Kommunikatons- und Vernetzungsstruktur
Insbesondere die Methode der Sozialen Netzwerkanalyse hat in den letzten Jahren er-
heblich an Aufmerksamkeit gewonnen und wird immer häufger für die Daten und Mög-
lichkeiten des Webs adaptert und eingesetzt.
25
26
Sandra Schafert und Diana Wieden-Bischof
4 BEWERTUNGEN
Wenn viele Produkte oder Informatonen vorhanden sind, verlässt man sich gerne auf
Empfehlungen oder Reputatonssysteme2. Grundlage für diese sind Bewertungen, die
Leser oder Kunden oder andere Nutzer abgegeben haben.
Bewertungen können auf unterschiedliche Weise z. B. in Form von Sternen, Smileys aber
auch nach dem Schulnotensystem dargestellt werden. Dem Einsatz sind keine Grenzen
gesetzt und sowohl Inhalte (wie Geschichten, Artkel), Gegenstände (wie Autos, Brief-
marken) als auch Personen und Organisatonen (wie Arbeitgeber, Ärzte, Lehrer) können
2
Empfehlungs- und Reputatonssysteme sind die Themen der beiden folgenden Veröf-
fentlichungen im Rahmen des Projektes ComStudy.
27
bewertet werden. Anbieter können somit leichter den Wert oder die Bedeutung des
Sachverhalts, Gegenstands oder Inhalts für die Nutzer einschätzen.
Für praktsch alle Produkte und Dienstleistungen des Alltags, z. B. Elektroartkel, Hotels
oder Skiprodukte lassen sich im Web Foren fnden, bei denen Nutzer und Kunden Be-
wertungen hinterlassen. Eine Auswertung der Bewertungen, beispielsweise ein Produkt-
vergleich, gibt häufg hilfreiche Rückmeldungen zum Produkt bzw. den Dienstleistungen.
Zu den bekannteren Angeboten gehören Ciao.de und Qype.at (vgl. Markus & Schafert,
2010).
Bewertungssysteme bzw. darauf aufauende Empfehlungs- und Reputatonsysteme ha-
ben mit einigen Herausforderungen zu kämpfen, zu den bekannten zählen: Das Cold-
Start-Problem bezeichnet die Tatsache, dass zunächst keine oder nur wenige Bewertun-
gen vorliegen, „Feedback Padding“ ist das Erschleichen von günstgen Bewertungen und
„Ballot Stufng“ ist der Versuch, durch mehrmaliges Bewerten das Ergebnis zu beein-
fussen.
Bei allen Angeboten kommen demnach auch qualitatve Verfahren zum Einsatz, wobei
die quanttatven Empfehlungssysteme mit Sternen und Balken wohl eher bei den kom-
merziellen Anbietern zu fnden sind.
28
Produkt- und Dienstleistungsbewertung: Datngjungle
Im Web gibt es eine Vielzahl von Portalen die Meinungen zu Produkten und Dienstleis-
tungen abfragen und damit versuchen, einen Überblick über den Markt zu geben. Am
Beispiel von Datngjungle zeigen wir, wie dabei Bewertungen vorgenommen werden
können.
Produktbewertungsportale
Für Internet-Nutzer sind die Bewertungen von Produkten sowie Online-Shops entschei-
dend für ihren Einkauf, wie die Befragung einer Internet-Beratungsagentur zeigt (Fitkau
& Maaß Consultng, 2008).
29
Abbildung 10: Bewertung von Nutzermeinungen bei Kaufentscheidungen
Quelle: htp://www.w3b.org/e-commerce/produktbewertungen-
beeinfussen-kaufentscheidungen.html (10/2009)
Hinter den Bewertungsplatormen von Produkten (dies gilt auch für die Angebote mit
Preisvergleichen) verbergen sich unterschiedliche Businessmodelle: So fndet man bei
Idealo.de und Billiger.de nur Produkte von Händlern, die für diesen Service zahlen; bei
Dealjäger dagegen können Nutzer selbst Produkte einstellen (vgl. Randler, 2009). Der
Oto-Konzern hat mit Smatch.com eine Bewertungsplatorm mit Community-Feature,
bei der nur spezifsche Produkte aus seinem Angebot vorgestellt werden (Mode-, Mö-
bel-, Lifestyletrends).
Auch bei Smatch.com ist davon auszugehen, dass der Oto-Konzern das Feedback der
Nutzer zur Verbesserung seines Warenbestands nutzt. Der eigentliche Nutzen des Ange-
bots besteht jedoch weniger darin, die konkreten Bewertungen zu erhalten als um den
Service herum eine Community aufzubauen die letztlich durch ihre Aktvitäten den Ab-
satz von Oto erhöhen sollen, der Verkauf ist und bleibt das Kerngeschäf (s. Groß,
2008). Community-Einbindungen sind für Online-Shops nicht zwangsläufg notwendig;
Experten empfehlen den Shop-Anbietern nicht unbedingt eigene Communitys aufzubau-
en, aber mit bestehenden Angeboten – beispielsweise den Bewertungsplatormen – zu
kooperieren (vgl. Groß, 2008).
30
„YiGG ist eine Nachrichten-Website, auf der die Benutzer selber Nachrichten einstellen,
bewerten und kommenteren können. Die Community der Nutzer ist sozusagen das Re-
daktonsteam, das darüber entscheidet, welche Nachrichten den Lesern präsentert
werden sollen. YiGG bietet allen seinen Nutzern die Möglichkeit, Nachrichten zu bewer-
ten. Du bewertest eine Nachricht, indem Du einfach auf den grünen Buton neben jeder
Nachricht unter dem Stmmenzähler klickst. Die besten Nachrichten kommen auf unsere
Homepage, wo sie jeder neue Besucher sofort lesen kann. Dabei kombiniert YiGG sozia-
les Bookmarking, Blogs, RSS-Feeds, Nachrichteneinträge, Tags, Videos und mehr. Da die
Benutzer entscheiden, was interessant ist, handelt es sich um eine nicht-hierarchische
Nachrichtenverteilung.“
31
Abbildung 12: Abstmmung bei iPredict vom 18.3.09
Quelle: MSNBC htp://www.msnbc.msn.com/id/18661488/vid/24982552 (03/2009)
Nach Abgabe der Bewertung erscheint direkt im Diagramm ein grünes Kästchen „You“
(Du), welches die eigene Bewertung mit der durchschnitlichen Leserbewertung im ro-
ten Kästchen gegenüberstellt. Die „eigene Stmme“ wird durch ein Cookie im System ge-
speichert. Kehrt man daher nach einer längeren Zeit zu der Umfrage zurück, fndet man
seine alte Bewertung vor und kann erneut zu dem Thema abstmmen. Nutzer können
also nicht nur die Veränderung der durchschnitlichen Nutzerbewertung grafsch darge-
stellt verfolgen, sondern auch die Änderungen der eigenen Einschätzungen (Wieden-Bi-
schof & Schafert, 2008, 24f).
Werden im Zeitraum der Umfrage auf dem Nachrichtenportal thematsch zusammen-
hängende Artkel bzw. Schlüsselereignisse veröfentlicht, dann werden diese ebenfalls
automatsch im Diagramm in Form eines kleinen Vierecks angezeigt. Es beinhaltet Infor-
matonen über den Titel des Artkels und sein Erscheinungsdatum sowie Informatonen
über die durchschnitliche Bewertung der Frage bis zu diesem Zeitpunkt und der Anzahl
der Bewertungen. Dadurch kann gut beobachtet werden, ob der Artkel beispielsweise
Auslöser für Meinungsänderungen ist/war. Klickt man auf den Titel des Beitrags, dann
wird man automatsch auf den vollständigen Artkel im Portal verlinkt (Wieden-Bischof
& Schafert, 2008, 24f).
32
Zusammenfassung
Im Überblick ergeben sich folgende drei Nutzungsmöglichkeiten von Rankings: Zunächst
einmal kann es dem eigenen Informatonsmanagement dienen (z. B. um schlechte Er-
fahrungen mit Händlern zu noteren), dann nutzt diese Informaton der Community, da
darauf Empfehlungssysteme und Reputatonssysteme aufauen und schließlich ergeben
sich insbesondere für Unternehmen viele Möglichkeiten des Webmonitorings, beispiels-
weise zur Evaluierung von Produkten oder potentellen Marktchancen und Innovatons-
bedürfnissen.
Im Bezug auf Bewertungssysteme ist zu erwarten, dass hier zukünfig noch weitere
Möglichkeiten entwickelt und erprobt werden, wie Bewertungen vorgenommen, darge-
stellt und ausgewertet werden können.
33
34
Sandra Schafert, Wolf Hilzensauer und Diana Wieden-Bischof
5 SOCIAL TAGGING
Im Folgenden betrachten wir eine relatv neue Variante von Metadaten die überra-
schend populär ist und der wir uns daher in einem eigenen Abschnit beschäfigen.
In traditonellen Medienarchiven werden Materialien zu Kategorien und Unterkategori-
en zugeordnet, welche häufg auch zusätzliche Kurzbeschreibungen und Schlagworte
beinhalten. Im Web hat sich ein Verfahren etabliert, das Nutzern ermöglicht, Webseiten
oder anderen Ressourcen (Bilder, Videos, Musikstücke) mit eigenen Schlagworten zu
markieren, sie zu „taggen“ (von Engl. „tag“: Etket). Mit Hilfe der Tags können andere
entsprechende Ressourcen recherchieren; schnell haben sich populäre Webdienste ent-
wickelt.
35
den. Auf diese Weise erhält man einen schnellen Überblick über Ressourcen, beispiels-
weise über Einträge in Weblogs.
Eine weitere Variante des Taggens von Bildern ist das Taggen von einzelnen Punkten
oder Bereichen in Bildern. So kann man beispielsweise im ofenen Fotoarchiv FlickR und
im sozialen Netzwerk Facebook Bilderausschnite taggen bzw. auch mit den Proflen an-
derer Nutzer verknüpfen. Auch eine Variante des ESP-Game, das wir im Folgenden aus-
führlicher vorstellen werden, nutzt diese spezielle Variante des Taggens.
36
Abbildung 15: Ergebnisse der Suche nach dem Tag „ComStudy“ bei Del.icio.us (Ausschnit)
Quelle: htp://delicious.com/search?p=comstudy (03/2009)
In einer unveröfentlichten Studie wurde verglichen, wie die Recherche mit Hilfe von
Del.icio.us im Vergleich zu Suchmaschinen und Webverzeichnissen abschneidet (s. Wi-
chowski, 2009): Morrison (2007) stellte dabei fest, dass Delicious hier einen knappen
zweiten Platz einnimmt. Zudem stellte er jedoch fest, dass eine Kombinaton der Deli-
cous-Tags mit einem kontrollierten Vokabular bessere Ergebnisse liefert als die Recher-
che in Webverzeichnissen.
37
Name Start Anzahl der Kategorie URL Tagging
Mitglieder
Broad- 2006 25.400.000 Videos, broadcaster.com Videos der Nutzer können getaggt
caster auch live werden, „related tags“ werden zur
weiteren Recherche angeboten.
Buzznet 2005 10.000.000* Musik buzznet.com Es kann getaggt werden, allerdings ist
dies z. T. durch die Nutzer selbst ein-
geschränkt.
Flickr 2002 4.000.000 Fotos fickr.com Es kann getaggt werden, allerdings ist
dies z. T. durch die Nutzer selbst ein-
geschränkt. Es kann nach Tags recher-
chiert werden.
Fotki 1998 5.000.000 Fotos fotki.com Taggen möglich – Recherche via Tags
möglich und prominent platziert.
Fotolog 2002 24.339.520* Fotos fotolog.com Taggen und Recherche der Tags ist
möglich, andere Nutzer werden mit
deren häufgsten Tags „beschrieben“.
YouTube 2005 40.000.000 Videos youtube.com YouTube bietet nur den Erstellern der
Videos an, Tags zu erstellen.
Tabelle 3: Bekannte ofene Foto- und Videoarchive: Nutzerzahlen und Taggingmöglichkeiten
Quelle: Startjahr, Nutzerzahlen und Kategorie nach www.linqia.com bzw. (*)
Betreiberangaben, Stand November 2008, Tagging: eigene Recherchen
3
htp://www.steve.museum
38
Abbildung 16: Tagging von Objekten
Quelle: Chun, Cherry, Hiwiller, Trant & Wyman (2006), Abbildung 2
Der Katalogeintrag dieses Beispiels und die gesammelten Tags der Nutzer sind in der Ta-
belle auf der folgenden Seite exemplarisch dargestellt.
Das Projekt läuf weiter, und eine Reihe von Veröfentlichungen lassen sich dazu fnden.
So stellt Trant (2008) dar, dass die Tags der Nutzer helfen können, den vorhandenen
„mis-match between vocabulary of visitor and the museum“ zu überwinden: Üblicher-
weise recherchieren und fragen Nutzer der Archive eben selten nach den im Katalog ver-
zeichneten Merkmalen der Artefakte, sondern eher nach Aspekten, die über die Tags
der Nutzer hinzugefügt werden (könnten). Die Sofware des Projekts wurde für Museen
und andere Applikatonen erweitert und es gibt inzwischen auch eine Anwendung für
das soziale Netzwerk Facebook4, die den Facebook-Nutzern erlaubt, Kunst zu taggen und
damit zum Projekt beizutragen.
Ein weiteres Beispiel für die Verwendung von Tags im Bereich der Bibliotheken, Archive
und Museen ist die Biodiversity Heritage Library (BHL), eine Initatve von zehn großen
naturhistorischen Museumsbibliotheken, Bibliotheken botanischer Gärten sowie For-
schungsinsttuten aus den USA und dem Vereinigten Königreich. Ziel der Initatve ist es,
eine Strategie zur Digitalisierung ihrer Bibliotheksbestände zu erarbeiten und diese
(langfristg) global im Rahmen einer „Biodiversity Commons“5 online verfügbar zu ma-
chen. Die Startseite erlaubt dabei nicht nur die Suche nach unterschiedlichen Kategorien
(wie Titel, Autoren, Themen, Namen, Karten oder Jahr) der bereits erschlossenen Inhal-
te, sondern auch die Suche/den Zugang zu den unterschiedlichen Themen über Tags.
4
htp://apps.facebook.com/steve-museum
5
htp://www.biodiversitylibrary.org
39
Cataloguing from The Metropolitan Museum’s Sample Terms Collected
Collectons Management System
Artst/Maker(s) Maker: Joachim Friess, ca. 1579-1620, m. 1610 A sampling of unique terms (not in
Title Diana and the Stag the museum’s collectons manage-
Object Name AUTOMATON ment system) collected from volun-
Date First quarter 17th century, (about 1620) teer cataloguers.
Culture German (Augsburg) acton
Made in Country: Germany, City: Augsburg animal
Medium Silver, partly gilt, jewels, enamel antler
Classifcaton Metalwork-Silver archery
Dimensions 14 3/4 x 9 1/2 in. (37.5 x 24.1 cm) arrow
Credit Line Gif of J. Pierpont Morgan, 1917 baroque
bejeweled
Department European Sculpture and Decoratve Arts
bow
Markings
bridle
[1] A pine cone (Augsburg town mark in use between 1620 and 1625).
chain
See Helmut Seling, Die Kunst der Augsburger Goldschmiede 1529-1868,
clockwork
Munich, 1980, vol. III, p. 19, no. 44. [2] Roman capitals I F within a rect-
container
angle (cameo) (maker's mark of Joachim Friess or Fries, born in Lubeck
deer/reindeer
about 1579 master goldsmith in Augsburg in 1610, died 1620). See Sel-
dog/dogs
ing, Vol. III, p. 143, no. 1248. [3] A Roman capital B below a crown and
fguratve
within a shield (cameo), unidentfed. [4] A Roman capital E below a
gilded
crown, and within a shaped reserve (cameo) (French guarantee mark for
gold
Foreign silver in use between 1809 and 1819). See Tardy, Internatonal
horse
Hallmarks on Silver, Paris, 1981, p. 190. Locaton of marks: [1] On the
hunt/hunter/huntng/huntress
neck and inside the neck, and on the base. [2] Twice on the neck, on top
intricate
of the base. [3] Inside and on the outside of the neck. [4] Inside the
jumping
neck.
leap/leaping
Descripton
luxury
Diana seated on stag, with Cupid on croup, and three hounds below;
mechanical
stag's head removable, body a fask; spring-driven mechanism in base
movement
permits automaton to move. Diana wears a crescent set with eight rose
mythological/mythology
diamonds and one pink tourmaline; stag with coronet, pierced collar,
nude
lion mask on breast and trappings of scrolling ornament and cherubs;
ornamental/ornamentaton
set with three pink imitaton tourmalines; on base three lizards, two of
/ornamented
them with green enamel, one small lizard, two frogs and four beetles,
ornate
one of them with green enamel; octagonal casket-like base, decorated
precious
with applied ornament in same style as trappings; in center of lef side
rearing
movable key-hole cover on spring.
rider/riding
Accession Num- saddle
17.190.746
ber woman
Tabelle 4: Dokumentaton der Sammlung im Managementsystem im Vergleich mit den Schlag-
worten der Nutzer am Beispiel eines Objektes (Nr. 17.190.746)
aus der „The Metroplitan Museum ’s Collecton“
Quelle: Chun, Cherry, Hiwiller, Trant, & Wyman, 2006
40
Gerade die Beispiele Untersuchungen aus dem Bereich der Archive der Bibliotheken,
Museen und Archive zeigen, dass Tagging die vorhandenen professionellen Beschreibun-
gen der Archivare sinnvoll ergänzen, weil sie häufg(er) den Rechercheinteressen und
-verhalten der nicht- und semiprofessionellen Anwender entsprechen, die beispielswei-
se tendenziell eher nach Äußerlichkeiten als technische oder historische Rahmendaten
recherchieren.
6
Live Staging of Media Events, htp://ist-live.org (2009-10-12)
41
Abbildung 17: Vocabulary-Management-Tool – ein Prototyp
Quelle: Güntner, Sint & Westenthaler, 2009, 195
Das Tool wird folgendermaßen beschrieben: „Der Kalender (1) dient zur zeitlichen Ein-
schränkung und Auswahl der Dokumente und Auswahl der Dokumente und vergebenen
Tags. Im linken Fensterbereich wird das kontrollierte Vokabular (Thesaurus) dargestellt
(2), welches im Falle des Prototypen ohne Beschränkung der Allgemeinheit auf den IPTC
Newscodes basiert. Der Vocabulary-Manager kann die Schaltlächen (3) benutzen, um
die vergebenen Tags dem Vokabular hinzuzufügen bzw. sie mit dem Vokabular in Bezie-
hung zu setzen: Die Schaltlächen ermöglichen das Eingügen eines Tags als neue Unter-
kategorie („<< new subconcept“) oder als neues Synonym („<<new synonym“) für einen
bestehenden Term im Thesaurus. Weiters können mit der Schaltläche „<<set new rela-
ted>>“ Terme miteinander verbunden werden, die thematsch in einem Zusammenhang
stehen.“ (Güntner, Sint & Westenthaler, 2009, 195).
Aufauend auf den Erfahrungen mit diesem Prototyp, wurde das Konzept auch im Rah-
men des Projektes KiWi7 eingebracht und in das KiWi-System implementert. Die folgen-
de Abbildung zeigt die Realisierung des Ansatzes im KiWi-System.
7
Knowledge in a Wiki, htp:// www.kiwi-project.eu/ (2009-10-12)
42
Abbildung 18: Vocabulary-Management bei KiWi (Stand 10/2009)
43
Spieler zu Bildern Tags eingeben, von denen sie annehmen, dass sie auch von anderen
Nutzern verwendet werden und je nach Übereinstmmung Punkte erhalten. Dabei hat
sich gezeigt, dass schnell allgemeine Tags verwendet werden, so dass diese Worte inzwi-
schen ausgeschlossen werden, was das Spielen jedoch nicht weniger spannend macht,
sondern eher noch herausfordernder.
Die Autoren rechneten aus den ersten Versuchen mit dem ESP-Spiel aus, dass 5.000
Spieler genügen würden, um alle Bilder, die von Google indiziert sind (Stand, 2004) in
wenigen Wochen mit Schlagworten zu beschreiben. Dies ist wirklich überraschend, weil
5.000 keine große Zahl ist; die meisten populären Online-Spiele haben im Vergleich dazu
mehr als 5.000 Spieler, die gleichzeitg spielen (von Ahn & Dabbish, 2004).
Die Idee des ESP-Spiels wurde inzwischen von anderen aufgegrifen. So hat Google den
„Google Image Labeler“ implementert und erhält durch dessen Spieler viele Metainfor-
matonen über Bilder. Auch wurde die Spielidee auf andere Medien übertragen (z. B. auf
Musikstücke: „Tag a Tune“, via www.espgame.org). Hier werden Musikstücke vorge-
spielt, die getaggt werden sollen. Andere wiederum entwickelten daraus ein Spiel (und
Patent), das auf einem horizontalen Display gespielt wird (Diakopoulos & Chiu, 2007).
Sogar für die Erstellung von Mitarbeiterproflen wurde es abgewandelt und eingesetzt
(vgl. Zhang, Dong, Ackerman & Qu, 2008): Gewonnen hate hier derjenige Mitarbeiter,
dessen Tags mit Kompetenzen der Kollegen am besten zu deren Selbstbeschreibungen
passt. Durch die Spielbeteiligung wurden vergleichsweise schnell und spielerisch Kom-
petenzbeschreibungen der Mitarbeiter zugänglich.
Insbesondere für (nichtextuelle) Medienarchive ist im Allgemeinen davon auszugehen,
dass für die Dokumentaton und die Nutzer ein echter Mehrwert entstehen kann, wenn
Tagging möglich ist. Um wirklich viele Tags zu erhalten, können die genannten Spielide-
en helfen, diesen Prozess atraktv zu machen und ins Laufen zu bringen; zudem können
sie Teil einer PR-Akton sein.
44
Erfahrungen mit Tagging von Lernressourcen
Unterschiedliche Formen des Taggings und Erfahrungen damit sind Gegenstand einer
Reihe von Untersuchungen. Riina Vuorikari hat eine preisgekrönte Untersuchung dazu
veröfentlicht (Vuorikari, 2009), wir haben sie dazu befragt. Bei dem Portal „Learning Re-
source Exchange“8 bestand die Herausforderung vor allem darin, Tagging im mehrspra-
chigen Kontext einzusetzen, weil das Portal mit Lernressourcen von Lehrern aus ver-
schiedenen Ländern genutzt wird.
Unsere Nutzer sind Lehrer von Grund- und Sekundarschulen aus ganz
Europa. Ganz allgemein haben wir herausgefunden, dass Tags, die sie
nutzen sehr deskriptv sind und fast so gut sind wie die Stchwörter, die
Bibliothekare zu den Lernressourcen hinzugefügt haben. Weil wir Nutzer
aus verschiedenen Ländern haben, haben wir natürlich auch Tags in verschiedenen Sprachen! Nutzer
taggen dabei gleichzeitg in ihrer eigenen Sprache (z. B. ein deutscher Lehrer auf Deutsch) aber auch auf
Englisch. Es trift besonders auf Sprachlehrer zu, dass sie Ressourcen in der Sprache taggen, in der die
Materialien sind (z. B. taggt ein Französischlehrer auf Französisch).
Wir haben herausgefunden, dass nicht alle Nutzer interessiert daran sind, Tags zu nutzen um Ressour-
cen zu fnden. 59 Prozent der Nutzer unseres Portals nutzen Tags um Ressourcen zu fnden, 35 Prozent
waren überhaupt nicht daran interessiert. Interessanterweise haben etwa ein Dritel der Nutzer niemals
getaggt, nutzen Tags aber bei der Recherche. Es ist wie so of im Internet, einige machen die Arbeit und
viele andere Nutzer profteren davon. Das ist großartg!
Unserer Evaluaton zufolge waren ihre Antworten im Bezug auf Tags eher positv. In manchen Fällen wa-
ren sie sogar der Meinung, dass die Tags direkt in die Metadaten-Beschreibung übernommen werden
könnten, weil sie so gut waren. Of wiederholen Tags jedoch auch nur Informatonen, die über die Res-
source vorhanden sind (beispielsweise, dass die Ressource in Englisch ist), aber der zusätzliche Vorteil
der Tags ist, dass die Ressourcen über die Tagcloud beworben werden.
8
htp://lreforschools.eun.org, Stand 12.10.2009
45
? Was empfehlen Sie für die erfolgreiche Einführung eines Taggingsystems?
Das Hinzufügen von Tags muss leicht gemacht werden, und auch bedeutsam für Nutzer sein. Wenn Tags
dazu genutzt werden, Sammlungen von Ressourcen anzulegen, die einfach mit anderen Lehrern oder
auch Schülern geteilt werden können, fnden das Lehrer nützlich. Ein anderer wichtger Aspekt ist, dass
zu den Tags auch Metadaten hinzugefügt werden, aber das passiert verdeckt. Für das System ist es wich-
tg zu wissen, wer den Tag hinzu gefügt hat und in welcher Sprache er ist.
Dr. Riina Vuorikari arbeitet seit 2000 für das European Schoolnet (EUN, europeanschoolnet.org) zu ei-
nem weiten Themengebiet von digitalen Lernressourcen, Web-2.0-Themen wie Tagging und sozialen
Netzwerken, bis zu Themen wie Interoperabilität und Metadaten sowie Kollaboraton von Schulen. Vor
kurzem hat sie ihre Dissertaton zum Thema Tags und Lernressourcen im mehrsprachigen Kontext erfolg-
reich verteidigt.
Zusammenfassung
Tagging bzw. das Zusammentragen von Tags mehrerer Nutzer (Social Tagging) wird in un-
terschiedlicher Weise genutzt. Wesentlich erscheinen hier der Beitrag zum persönlichen
Informatonsmanagement, Beiträge zur Verbesserung von Recherchemöglichkeiten so-
wie die Möglichkeit, Empfehlungen zu geben. Auch kann Social Tagging neue (ggf. besse-
re) Kategorien und Strukturen entwickeln und schließlich auch im Rahmen von Webmo-
nitoring-Aktvitäten analysiert werden.
Social Tagging ist vergleichsweise neu, und die Untersuchungen dazu und Nutzungsmög-
lichkeiten sind noch nicht ausgereizt. Beispielsweise ist das Taggen von Personen ein völ-
lig neuer Ansatz, der noch wenig erprobt ist. Mit der Facebook-Applikaton „Collabio“
experimentert hier beispielsweise eine Arbeitsgruppe von Microsof Research (s. Bern-
stein et al., 2009).
46
Sandra Schafert und Diana Wieden-Bischof
6 TEXTE
Text entsteht beim Schreiben von Weblog-Nachrichten, Pinnwandeinträgen, Kommenta-
ren, Editeren von Wiki-Seiten und vielem mehr. Im Web stehen so jede Menge Texte als
„Rohdaten“ zur Verfügung, die ausgewertet und weiterverwendet werden können: bei-
spielsweise um weitere Informatonen zu erhalten oder passende Informatonen zu ver-
knüpfen, oder um Suchen efzienter zu gestalten.
Im Folgenden beschreiben wir erstens wie und warum gerade Medienarchive die Entste-
hung von Texten fördern sowie zweitens, wie Texte ausgewertet werden können, um
darüber hinausgehenden Informatonen zu erhalten und wie dies konkret genutzt wird.
47
Abbildung 21: Beispielabbildungen zur Beschreibung des Spieles „Phetch“
Quelle: von Ahn et al., 2006, Abbildung 1
Mit Hilfe dieses Spiels können also gute, hilfreiche Beschreibungen für Bilder entwickelt
und validiert werden; durch den Spielcharakter kann dies mitunter recht schnell gehen,
so dass in kurzer Zeit eine große Zahl von Bildern beschrieben wird. Im Vergleich mit ei-
ner Spiel-Variante (dem ESP-Game), bei der nur Schlagworte eingegeben werden sollen
zeigt sich, dass Phetch-Beschreibungen in 98,5 Prozent der Fälle richtg identfziert wur-
den, hingegen traf dies nur bei 73,5 Prozent der Bilder mit ESP-Tags zu (von Ahn et al.,
2006, 81).
48
te“ dargestellt wird und von den Nutzern mit den eigenen Erlebnissen aus dem Urlaub
gefüllt werden kann. Auch Bilder und Videos können hochgeladen werden, sie zieren
dann die „Rückseite“ der Postkarte. Auch die bereits vorhandenen und von anderen
Nutzern bereitgestellten Reiseberichte können gelesen und versendet werden. Leider ist
dieser Service von Times Online zurzeit (Stand Juni 2009) nicht verfügbar („Page under
constructon“).
49
Text jedoch zunächst ausgewertet werden, dabei kommen Verfahren der „Informaton
Extracton“ zum Zuge.
Automatsche Tag-Vorschläge
Texte werden auch automatsch ausgewertet, um Tags vorzuschlagen (s. Abschnit über
Social Tagging). Dies ist beispielsweise hilfreich, um Tags für Weblogeinträge automa-
tsch vorzuschlagen (Mishne, 2006). Im Projekt „Interedu“9 des Salzburg NewMediaLab
wurde ein System entwickelt, das das Tagging von Lernressourcen unterstützt, indem es
Tagvorschläge generiert. Dabei kommen mehrere Verfahren zum Einsatz, die hier kurz
skizziert werden, die folgenden Angaben stammen aus einem Projektbericht:
| Die Hauptkomponentenanalyse ist ein statstsches Verfahren, dass mit Hilfe einer
Analyse „Trainingsdaten“ Rückschlüsse auf das Vorschlagen von Tags geben kann:
Dazu werden die Texte der Trainingsdaten in Schlüsselworte zerlegt, Stopworte aus-
gefltern und Stammformen gebildet, dann wird eine Dokument-Term-Matrix ange-
legt und Vektoren beschrieben. Weil allein durch das Vorkommen eines Schlüssel-
wortes nicht die Relevanz gezeigt ist, wird mit dem TF-IDF-Verfahren (Term Frequen-
cy/Inverse Document Frequency) festgestellt, ob es vergleichsweise häufg vor-
kommt, also „besonders“ ist. Ziel der Hauptkomponentenanalyse ist es nun, die be-
stehende Matrix so in der Anzahl der Dimensionen zu reduzieren, dass bis auf Rau-
schen alle Hauptrichtungen vertreten sind.
| Mit KEA können Texte klassifziert werden und sogenannte Keyphrases oder „Schlüs-
selwortketen“ in Texten erkannt werden. KEA unterstützt zwei Arten von Klassifzie-
rungen: die freie Klassifzierung (Schlüsselwortextrakton) sowie die eingeschränkte
Klassifzierung (Kategorisierung), bei der der Text in eine Kategorie eingeordnet wird.
Auch hierzu muss eine sogenannte Trainingsphase Trainingsdaten, die bereits diese
Zuordnungen haben, durchgeführt werden, bei der ein Klassifzierungsmodell erstellt
wird.
| Auch Assoziatonsregeln können zum Vorschlagen von Tags oder Schlüsselworte ein-
gesetzt werden. Sobald eine Menge von Dokumenten signifkant häufg mit den sel-
ben Tags oder Schlüsselworten versehen wurde, kann ein Benutzer von dem Wissen
der Vorgänger profteren, indem seine Tags vervollständigt werden. Das Konzept der
Assoziatonsregeln setzt somit voraus, dass schon Tags vergeben worden sind.
9
Partner: Salzburg Research, Educaton Highway und Punkt Netservices.
50
Das Beispiel zeigt, dass die Entwicklung eines solchen Systems, bei dem Text-Mining-Ver-
fahren zum Einsatz kommen jeweils sehr spezifsche Anforderungen erfüllen muss und
durch das Einsetzen und Auswerten von Trainingsdaten auch zeitaufwändig ist.
Auch für die bekannte Microblogging-Anwendung „Twiter“ gibt es eine Reihe von Tools,
die Auswertungen ermöglichen: Sofern Twiter-Meldungen als „öfentlich“ freigeschal-
ten sind, und das ist die Regel, stehen sie dazu zur Verfügung. Twitscoop zeigt so, über
welche Themen in den letzten drei Tagen getwitert wurde und zeigt diese Ergebnisse in
Form einer Zeitreihe.
Solche Analysen funktonieren allerdings beispielsweise nur bei Begrifen, die eindeutg
sind. So kann es sein, dass beispielsweise Produktnamen in anderen Sprachen Begrife
oder Personennamen sind, so dass spezifsche Einschränkungen der Recherche vorge-
nommen werden müssen. Auch weitere Fehler können sich bei der Erhebung, Analyse
und Interpretaton einschleichen; ein fundiertes Wissen ist hier notwendig (s. Markus &
Schafert, 2010).
51
Sentment-Analyse – Gefühlsäußerungen auf der Spur
Eine Besonderheit stellen die beiden kostenlos zugänglichen Web-Tools Moodviews.com
und Wefeelfne.org dar, da sie sich darauf spezialisiert haben, „Gefühlsäußerungen“
(engl. „sentment analysis“) in Weblogs zu untersuchen.
Jonathan Harris und sein Team hat mit Wefeelfne,org ein Tool entwickelt, das Weblogs
auswertet, die „I feel“ oder „I am feeling“ enthalten. Mit Hilfe von Wefeelfne kann man
z. B. recherchieren, wie sich weibliche Blogger zwischen 30 und 40 in Orten mit schlech-
tem Weter gerade fühlen bzw. wie deren Gefühlsäußerungen interpretert werden.
Bei einem ähnlichen Angebot, der Website Moodviews.com können Aussagen wie „Ich
fühle mich …“ auch im Bezug auf Begrife recherchiert werden, also auch im Bezug auf
Markennamen. Man kann dann beispielsweise feststellen, wie häufg der Ausdruck
„cool“ oder „good“ in den analysierten Weblogs im Zusammenhang mit einem Produkt
genannt wird.
Aus der Kombinaton der Analyse von Gefühlsäußerungen mit der Idee, zukünfiges Ver-
halten vorherzusagen entstand u. a. die Idee, zu untersuchen inwieweit Gefühlsäuße-
rungen zu Kinoflmen mit dem späteren Erfolg der Filme im Zusammenhang stehen
(Mishne & Glance, 2006). Ein weiteres Anwendungsgebiet ist die kontextsensitve Wer-
beeinblendung (vgl. Altsearchengines.com, 2009).
In den letzten beiden Jahren haben sich mehrere Forscher mit der Frage beschäfigt, wie
solchermaßen ausgewertete Gefühle auch passend in Formen und Farben dargestellt
werden können (vgl. Synesketch, 2009).
52
Zusammenfassung
Zusammengefasst gibt es im wesentlichen folgende drei Nutzungsaspekte von Texten:
Zum einen sind sie hilfreich, um Dokumente wie Fotos oder Videos zu erschließen (und
recherchierbar zu machen), um Empfehlungen zu geben oder Services (auch Werbung)
zu personalisieren, und schließlich um Inhalte zu analysieren, beispielsweise im Rahmen
von Webmonitoring wie Trendanalysen.
Texte sind nicht die alleinigen „Primärquellen“, die im Web von Communitys und Nut-
zern zur Verfügung gestellt werden, auch Videos, Audiodateien und Fotos könnten hier
im einzelnen vorgestellt werden. Ein paar kurze Hinweise fnden sich dazu im letzten Ab-
schnit.
53
54
Sandra Schafert, Sebastan Schafert, Rupert Westenthaler und Julia Eder
55
Um also den Austausch von Daten zwischen verschiedenen Datenquellen zu fördern ist
es sinnvoll sich auf Metadatenformate zu einigen. Diese werden verwendet um entwe-
der direkt in HTML-Seiten zusätzliche Informatonen einzubinden (Microformate bzw.
RDFa) oder aber diese Informatonen direkt über RESTful-Services zugreifar zu machen.
Im Folgenden sind einige gebräuchliche Metadatenformate mit einer kurzen Beschrei-
bung aufgelistet.
Personen und Organisatonen:
| hCard: ein Microformat-Version des vCard-Standards, das erlaubt die Defniton von
Informatonen, wie sie typischerweise auf Visitenkarten zu fnden sind
| vCard: dieser Standard ist eigentlich in einem rein textbasierten Format defniert; es
gibt jedoch auch entsprechende Versionen als XML und Ontologie
| XFN (xhtml friend network): ein Microformat, welches es erlaubt, Verbindungen zwi-
schen Personen auszudrücken
Events/Termine:
| hCalendar: Microformat für die Defniton von Event-Informatonen, wie man sie ty-
pischerweise in Terminkalendern fndet.
| vCalendar/iCal: ähnlich wie vCard ist auch vCalendar ein reiner textbasierter Stan-
dard, für den es wiederum Versionen als XML und auch als Ontologie gibt
Orte/Geo-Informatonen:
| geo: einfaches lat/long/alt-basiertes Geokoordinatenschemata, gibt es sowohl als Mi-
croformat als auch als Ontologie
| geoNames: defniert weiterreichende Schemata zur Beschreibung von Objekten und
Regionen; vor allem verwendet es Feature-Codes welche den Typ des beschriebenen
Objektes defnieren
Produkte:
| hProduct: ist ein Microformat zur Beschreibung von Produkten
| Good Relatons: ist eine Ontologie, welche die Beschreibung von Produkten und
Dienstleistungen ermöglicht
| hReview: ein Microformat, um Bewertungen von Produkten, Musik, Filmen, Restau-
rants u. a. zu beschreiben
Soziale Medien:
| SIOC (Semantcally-Interlinked Online Communites): beschreibt eine Ontologie wel-
che es erlaubt Daten von verschiedenen Online-Communitys miteinander zu ver-
knüpfen; so erlaubt es dieser Standard z. B. verschiedenen Accounts von ein und der-
selben Person zu beschreiben; auch der Aufau von Foren, Rollen von Usern usw.
kann mit SIOC beschrieben werden
| FOAF (Friend of a Friend): beschreibt Benutzer in sozialen Netzwerken und Beziehun-
gen zwischen ihnen; diese Ontologie ist die am weitesten verbreitete im Internet und
wird von vielen Webseiten unterstützt
| HGTAGS und MOAT (Meaning of a Tag): erlaubt die Beschreibung von Taggings mit
Hilfe von RDF Relatonen und ermöglicht damit den einfachen Austausch von Tagin-
56
formatonen zwischen verschiedenen Webseiten; MOAT erlaubt es zusätzlich, die Se-
mantk eines Tags mit Hilfe von RDF zu beschreiben.
SCOT (Social Semantc Cloud of Tags): ermöglicht die Darstellung von ganzen Tagclouds
mit Hilfe von RDF und erlaubt damit den Austausch von solchen Informatonen mit an-
deren Systemen
Weitere:
| Dublin Core: defniert ein Set von Atributen, welches bibliographische Informato-
nen zu Dokumenten, Bücher, Medien, Texten u. ä. Beschreibt; diese Standards stehen
sowohl als XML auch als RDF zu Verfügung
| SKOS (Simple Knowledge Organizaton System): ist ein Metamodel für die Defniton
von kontrollierten Vokabularen. SKOS erlaubt die Defniton von Konzepten; dazu de-
fniert es eine Reihe von Metadaten (z. B. Bezeichnungen, Beschreibungen) als auch
semantsche Beziehungen zwischen Konzepten.
| Descripton of a Project (DOAP): eine Ontologie welche es erlaubt (Sofware-) Projek-
te zu beschreiben; im Fokus liegen die Beschreibung des Projektes und deren Res-
sourcen (wie Releases, Repository, Dokumentaton, Downloads, Homepage); die De-
fniton von Aufgaben, Zeitplänen u.ä. liegt nicht im Fokus.
| Creatve Commons: erlaubt die Defniton von Copyright und Lizenzen
57
Kombinaton von Geodaten und Fotos bei TagIT
TagIT ist eine Anwendung die mit dem Ziel entwickelt wurde, interessante Orte, Routen,
sowie aggregierte Inhalte von Blogs, sozialen Netzwerken und anderen sozialen Medien
zu integrieren und gemeinsam auf einer Karte anzuzeigen. Die Idee dahinter ist, dass
Menschen meist an den Dingen interessiert sind die „um sie herum" passieren und in-
teressant sind. TagIT ermöglicht es daher einerseits, durch den umfangreichen Nachrich-
tenbestand der Salzburger Nachrichten zu „browsen“ und von anderen sozialen Medien
gesammelte Inhalte dazu anzuzeigen. Andererseits gibt es Benutzern die Möglichkeit, in-
teressante Orte (z. B. Cafés, Parks, Sportstäten) und Routen (z. B. Wanderrouten, Ski-
touren) mit Beschreibungen und optonal Fotos und Videos zu versehen. Andere Benut-
zer können dann diese Inhalte entdecken und kommenteren oder mit weiteren Fotos zu
ergänzen.
TagIT basiert auf der KiWi-Platorm die im Rahmen des EU-Projekts KiWi - Knowledge in
a Wiki10 entwickelt wird. Sowohl Nachrichten als auch Orte und Routen werden einheit-
lich mit Hilfe des Metadatenstandards RDF (Resource Descripton Framework) beschrie-
ben. Dies ermöglicht eine sehr fexible Nutzung der Inhalte. So kann beispielsweise jeder
Inhalt der eine Geopositon hat auf der Karte dargestellt werden, unabhängig davon ob
es sich um einen Nachrichteninhalt oder eine Person handelt. Ebenso können alle Inhal-
te mit Hilfe von semantschem Tagging auf Basis von SKOS (Simple Knowledge Organiza-
ton System) miteinander in Beziehung gesetzt werden. Die Metadaten werden in der
KiWi-Platorm für das Reasoning und die Personalisierung genutzt. So kann beispiels-
weise fexibel anhand des Inhalts und der Benutzer-präferenzen entschieden werden,
wie ein Inhalt dargestellt werden soll.
TagIT ist also ein Beispiel, bei dem die Nutzer keine ausgesprochenes Wissen über Meta-
datenformate haben müssen, aber durch das Hochladen von Fotos und entsprechenden
Beschreibungen, den wesentlichen Beitrag des Mehrwerts des Projektes leisten.
10
htp://www.kiwi-project.eu, Stand 23.9.2009
58
Abbildung 27:Trefer für die Suche nach „Metainformatonen“ bei Bibsonomy
Quelle: Screenshot, htp://www.bibsonomy.org/search/metainformatonen (10/2009)
59
Abbildung 28: Neue Darstellung von Suchergebnissen bei Yahoo
Quelle: htp://developer.yahoo.com/searchmonkey/ (10/2009)
Spielerische Ontologieentwicklung
Wie einleitend dargestellt, spielen Communitys nicht nur bei der beiläufgen Sammlung
von Daten im Metadatenformat eine wichtge Rolle, auch bei der kollaboratven Ent-
wicklung von Metadatenformaten oder auch Ontologien kommen sie in manchen Ansät-
zen zum Zuge, bzw. wird damit experimentert, ob diese Schemata auch in kollaborat-
ven Onlinesetngs entwickelt werden können.
Ontologien zu entwickeln ist sehr herausfordernd, komplex, benötgt Expertse und ist
auch ein mühsamer Prozess. Im Rahmen eines Forschungsprojektes wird auch versucht,
Ontologien für Bilder und Videos zu entwickeln (genannt OntoPronto und OntoTube, via
www.ontogame.org, s. Siorpaes & Hepp, 2007): Katharina Siorpaes beantwortet dazu
Fragen, wie aus ihrer Sicht sogar spielerische Verfahren eingesetzt werden können. Sie
greif dabei auch auf ihre Erfahrung im Rahmen des Projekte Insemtves11 zurück, einem
Forschungsprojekt, dass versucht, die Erstellung von semantschem Content zu fördern.
11
htp://insemtves.eu/, Stand 1.9.2009
60
Ontologien spielerisch entwickeln – im Gespräch mit Katharina Siorpaes
Die Idee ist, Aufgaben in der Wissensakquise hinter Spielen gut zu ver-
stecken. Die Spiele dienen als Motvaton für Menschen, Zeit für Aufgaben
zu verwenden, für die menschlicher Input dringend nötg ist. In den Spielen
(siehe www.ontogame.org) müssen zwei Partner Aufgaben gemeinsam lösen
jedoch ohne kommunizieren zu können. Dabei ist die beste Strategie um Punkte zu bekommen, die
Wahrheit zu sagen. Die dadurch generierten Daten können wir mit Methoden im Hintergrund weiter-
verarbeiten und Ontologien bauen oder Inhalte semantsch annoteren.
Grundsätzlich sollten die Spiele so gebaut sein, dass sie jeder spielen kann und der abstrakte Gehalt der
Aufgaben sehr gut versteckt ist. Das Zielpublikum sind Spieler von sogenannten Casual Games.
Spiele zur Wissensakquise sind gut geeignet für Bereiche, in denen allgemeines Wissen (wie zum Bei-
spiel das Thema oder der Schauplatz von YouTube-Videos) benötgt wird, da dies bei den meisten Spie-
lern vorausgesetzt werden kann. Weiters macht es Sinn, dass große Datenmengen beschrieben werden:
andernfalls ist der Aufwand des Spieldesigns zu hoch. Beispiele sind das semantsche Beschreiben von
YouTube Videos wie in dem Spiel OntoTube (www.ontogame.org) oder das Bauen einer großen „Gene-
ral-Interest“-Ontologie.
Den Forschungs- und Entwicklungsbedarf sehe ich vor allem im Bereich der Incentves: Warum sollten
Nutzer Zeit mit Wissensakquise bzw. dem Training von automatschen Systemen verwenden? Weiters ist
es auch interessant, welche Aufgaben wirklich menschlichen Input benötgen und welche großteils auto-
matsiert werden können.
Dr. Katharina Siorpaes ist wissenschafliche Mitarbeiterin am Semantc Technology Insttute (STI), einer
Forschungseinrichtung der Universität Innsbruck. In ihrer Forschungstätgkeit beschäfigt sie sich unter
anderem mit der Möglichkeit mit Spielen und spielerischen Ansätzen Ontologien zu entwickeln und ver-
schiedene Inhalte semantsch zu annoteren.
Zusammenfassung
Zusammenfassend sind zwei ganz unterschiedliche Formen der Community-Beteiligung
und Nutzung von Metadatenformaten und Ontologien von Interesse: Zum einen stellen
Community-Mitglieder und Nutzer von Services Metadaten in Metadatenformaten zur
Verfügung, zum anderen können sie auch ganz gezielt bei der Entwicklung von Metada-
tenstandards, Ontologien oder Taxonomien beitragen.
61
Abbildung 29: Nutzung von Metadatenformaten und Ontologien
Die Nutzung der Metdadaten, die durch Communitys zusammengetragen werden kön-
nen, beispielsweise durch das Hochladen von Fotos mit EXIF-Dateien, umfasst dabei po-
tental all diejenigen Aspekte, Vorteile und Einsatzgebiete, die in der Diskussion um das
„Sematc Web“ anzutrefen sind.
62
Thomas Kurz, Sandra Schafert und Rupert Westenthaler
8 LINKED DATA
8.1 Konzept und Hintergrund
Das Web – und vor allem das Web 2.0 sowie das Social Web – bestehen immer weniger
aus in sich abgeschlossenen Dokumenten, sondern aus Content-Elementen deren Nütz-
lichkeit sich auch durch ihre Vernetzung mit anderem Content defniert. Einen Ansatz,
Daten in unterschiedlichen Quellen im Sinne des „Semantc Web“ sinnvoll miteinander
verknüpfar und recherchierbar zu machen stellt die Initatve „Linked Open Data“ dar.
Damit ist es ein Schrit in Richtung der unerwarteten Neu- und Wiederverwendung von
Informaton, von der Tim Berners-Lee spricht, die das Web ermöglichen kann: „It is the
unexpected re-use of informaton which is the value added by the web.“ (Berners-Lee
2006). Kernidee ist es dabei, externe Informatonen mit dem (eigenen) Web-Content zu
verknüpfen und zu integrieren und damit wieder zu verwenden (s.a. „Giant Global
Graph“, Berners-Lee, 2007).
Jeder von uns benutzt täglich eine große Menge von Daten. Zum Beispiel werden
Freundschafskontakte über das Internet gepfegt, Fotos ins Netz gestellt oder Kalender-
daten online verwaltet. Es ist jedoch nicht möglich, diese unterschiedlichen Informato-
nen automatsiert sinnvoll zu verknüpfen, um zum Beispiel Fotos in Beziehung mit den
dargestellten Personen und persönlichen Terminen zu bringen. Das liegt zum einen dar-
an, dass die verschiedenen Applikatonen, die die oben genannten Möglichkeiten bie-
ten, ihre Daten meist exklusiv halten und sie nicht nach außen hin zur Verfügung stellen.
Es entstehen sog. „Datensilos“. Zum anderen folgt die Struktur der Daten of keinem ein-
heitlichen Schema. Somit kann deren Inhalt oder Bedeutung nicht maschinell interpre-
tert bzw. folgerichtg untereinander verknüpf werden. Eine umfassende und seman-
tsch korrekte Suche von Informatonen wird dadurch nahezu unmöglich (vgl. Hitzler &
Krötsch, 2008). Grundvoraussetzungen für ein semantsches Web bzw. einer Vernetzung
von Daten ist es daher, „einheitliche, ofene Standards für die Beschreibung von Infor-
matonen zu vereinbaren, die es […] ermöglichen sollen, Informatonen über verschiede-
ne Anwendungen und Platormen auszutauschen und zueinander in Beziehung zu set-
zen“ (Hitzler & Krötsch, 2008, Abschnit 1.3).
Linked Data
Von speziellem Interesse ist in diesem Zusammenhang die Linked-Data-Initatve, eine
Initatve, welche das Ziel hat, Ressourcen im Web miteinander zu verbinden. Verein-
facht dargestellt ist Linked Data die Verknüpfung von strukturierten Daten, so wie das
Web die Verknüpfung von unstrukturierten Inhalten (Text, Bilder) ist. Durch die Kombi-
naton von Daten aus verschiedenen Quellen im Web lassen sich bisher noch unvorstell-
bare neue Anwendungen entwickeln.
Die Linked-Data-Wolke beinhaltet eine Vielzahl von Datenquellen wie z. B. alle Artkel
von Wikipedia, alle Geo-Punkte von geonames.org, alle Musikgruppen, Musiker, Alben
und Songs von Musicbrainz, alle länderspezifschen Informatonen des World-Fact-Book.
Zusätzlich sind diese Daten aber noch miteinander verlinkt. So verlinken Musiker in Mu-
sicbrainz auf den Artkel in Wikipedia, wobei die Orte und Regionen in geonames.org
mit den Wikipedia-Artkeln verknüpf sind. Auf diese Art und Weise bietet Linked Data
63
eine sehr gute Abdeckung von beinahe allen Themengebieten in einer Qualität, die man
selber nie erreichen könnte.
Durch die so strukturierten und verlinkten Daten kann letztlich mehr Nutzen gezogen
werden, indem wie beim traditonellen Web über Links von Informaton zu Informaton
gesprungen wird. So liefert eine Suchmaschine im Semantc Web zum Beispiel bei der
Suche nach einer befreundeten Person die sich derzeit in Paris aufält, zusätzliche Infor-
matonen über die dortgen Sehenswürdigkeiten wie Eifelturm und Louvre. Durch die
Verlinkung ist es dann auch möglich, Daten wie Öfnungszeiten, Eintritspreise, An-
fahrtspläne etc. abzurufen. Zudem ermöglicht die Struktur im Stle einer Datenbank den
Suchmaschinen komplexe Anfragen zu verarbeiten, welches ein schnelleres Aufnden
gesuchter Daten ermöglicht (Bizer, Cyganiak & Heath, 2006).
Linked Data defniert sich jedoch nicht nur anhand der darin enthaltenen Informatonen,
sondern beschreibt auch einige Technologien und die Methodologie wie man mit Hilfe
dieser Technologien die oben beschriebene Funktonalität bereitstellen kann. Ähnlich zu
Hypertexten wird die Struktur des „Web of Data“ durch textuelle Dokumente ermög-
licht, die im Netz zugänglich sind. Ein großer Unterschied ist jedoch die Verlinkung bei
Hypertexten durch die Auszeichnungssprache HTML, beim „Web of Data“ jedoch mitels
Resource Descripton Framework (RDF).
Das Linking-Open-Data-Projekt
Das Linking-Open-Data-Projekt (LOD-Projekt) wurde im Februar 2007 von Chris Bizer
und Richard Cyganiak ins Leben gerufen. Unterstützung erhielten sie dabei von der „Se-
mantc Web Educaton and Outreach (SWEO) Interset Group“ der W3C. Die Idee der
Gruppe entstand vor allem aus dem Wunsch heraus, die Methoden des Semantschen
Webs an realen Daten zu testen (Berners-Lee, 2008, Folie 14). Am LOD-Projekt beteiligt
sich eine stetg wachsende Zahl von Universitäten und Firmen. Darunter sind z. B. die
Freie Universität Berlin, das MIT, OpenLink Sofware, Talis und viele weitere. Eine voll-
ständige Liste aller Teilnehmer fndet sich im ESW-Wiki. Wie schnell die Community
wächst, zeigen eindrucksvoll die Grafken der LOD-Cloud, in der die einzelnen „Datensi-
los“ und deren Verbindungen schemenhaf dargestellt sind. Im Mai 2007 bestand die
Vernetzung aus über 500 Millionen RDF-Tripeln und in etwa 120.000 RDF-Links zwischen
den einzelnen Datensätzen – dies waren bereits beeindruckende Zahlen. Diese „Wolke“
von vernetzten Daten vergrößerte sich allerdings rasant und so konnten im April 2008
bereits mehr als 2 Milliarden RDF-Triple und eine Verlinkung der Daten durch ca. 3 Mil-
lionen RDF-Links gemessen werden. Die Abbildung zeigt die Ausdehnung der LOD-Cloud
im März 2009 (Bizer, 2009): Hinzugekommen sind dabei u. a. viele medizinische Initat-
ven.
64
Abbildung 30: LOD-Cloud im März 2009
Quelle: Bizer (2009)
Im Allgemeinen verfolgt das LOD-Projekt das Ziel immer mehr „open licence datasets“ in
RDF zu überführen und untereinander zu verlinken um so den Wandel des Webs vom
globalen File-System zur globalen Datenbank herbeizuführen. Darüberhinaus sind fol-
gende Ziele wichtg (Berners-Lee, 2008, Folien 34-38):
| Zum einen ist es natürlich wichtg eine möglichst weit reichende Vernetzung zwi-
schen den einzelnen Data-Sets zu erreichen. Allerdings steigern nur sinnvolle Links
den Wert der Vernetzung. Deshalb beschäfigen sich derzeit viele damit, bessere Lö-
sungen zu fnden.
| Benutzer wollen eine integrierte Sicht auf alle Daten, die zu einem Objekt zur Verfü-
gung stehen. Ein Problem unter anderen ist dabei, eine korrekte Fusion der Daten zu
erreichen bzw. durch Fusion korrekte Daten zu liefern.
| Einer sinnvollen und „korrekten“ Nutzung von Daten muss eine Lizenzregelung zu
Grunde liegen. So muss eine Möglichkeit gegeben sein, die Daten mit Metadaten zu
verknüpfen, die eine Lizenzierung beschreiben.
| Um die Daten der Open-Data-Cloud von der RDF-Darstellung in benutzerfreundlicher
Form anzubieten und darzustellen sind semantsche Browser und Suchmaschinen
unumgänglich. Nur damit wird sich eine Akzeptanz seitens der User einstellen.
65
von zwei Experten, die sich stark mit der Forschungsperspektve und auch der Anwen-
dersicht beschäfigen.
Auf dem Weg zum Semantc Web - Im Gespräch mit Sebastan Schafert
? Die Vision eines verknüpfen und clever recherchier- und nutzbarem Semantc Web
klingt spannend. Wie realistsch ist aus Ihrer Sicht die Umsetzung der
Linked-Data-Idee? Wo sehen Sie Herausforderungen und Probleme?
Linked Data ist die Umsetzung des Semantc Web, so wie es die ursprüngliche Vision
beschrieben hat. Während in den letzten Jahren der Schwerpunkt der Forschung im
Wesentlichen auf dem Semantc Web (also Logik und Theorie) lag, beschäfigt sich
die Forschung im Rahmen von Linked Data endlich wieder mit dem Semantc-Web-Aspekt (also Ver-
knüpfung von Daten im Web). Insofern sind wir dem Semantc Web damit so nahe wie nie und eine Um-
setzung ist greifar. Herausforderungen gibt es dabei naturgemäß noch viele. Auf eher sozialer Ebene
stellt sich die große Frage, welchen Daten man überhaupt vertrauen kann – denn Daten werden im Un-
terschied zu Inhalten automatsch weiterverarbeitet und können deshalb nicht durch ausreichende Me-
dienkompetenz gefltert werden. Auf technologischer Ebene sind große Fragen in den Bereichen verteile
Suche, Reasoning und Nutzung der Daten noch zu klären.
? Welche Nutzungsmöglichkeiten und Anwendungen sind aus des Salzburg NewMediaLab besonders in-
teressant?
Für uns schaft Linked Data eine tolle und fexible Möglichkeit, Inhalte und Daten aus verschiedenen Sys-
temen unserer Partner miteinander zu integrieren, beispielsweise die textuellen Daten aus einem Con-
tent-Management-System mit den Multmediadaten aus einem Media-Asset-Management-System.
Wenn alle Daten mit Hilfe von Linked Data in einem einheitlichen Format verfügbar gemacht werden,
dann wird Systemintegraton erheblich vereinfacht. Daneben sind für uns natürlich die Forschungsfrage-
stellungen interessant.
Dr. Sebastan Schafert ist wissenschaflicher Leiter des Salzburg NewMediaLab und arbeitet als Senior
Researcher bei der Salzburg Research Forschungsgesellschaf. Der promovierte Informatker forscht, pu-
bliziert und entwickelt dabei, u. a. im Rahmen des von ihm geleiteten EU-Projektes KiWi (Knowledge in a
Wiki), zu innovatven Social-Media-Anwendungen.
66
Linked Open Data aus Sicht von Unternehmen und Anwender
- im Gespräch mit Andreas Blumauer
? Wie realistsch ist aus Ihrer Sicht die Umsetzung der Linked-Data-Idee?
Wo sehen Sie Herausforderungen und Probleme?
In einer Welt, in der das Web nicht mehr wegzudenken ist, kann sich auch eine
Linked Data Infrastruktur entwickeln. Es dauerte nicht einmal lange von der
Spezifkaton von RDF bis hin zur „Explosion“ der Linked-Data-Cloud. Das Henne-
Ei-Problem ist damit erst mal überwunden, und die ersten brauchbaren Anwendungen wie sig.ma sind
bereits sichtbar. Getrieben von Open-Data-Initatven verschiedener Regierungen und auch dem zuneh-
menden Trend größerer Suchmaschinenhersteller, RDF-Daten zu indizieren und im Suchergebnis zu ver-
wenden, tragen dazu bei, dass die breite Adapterung von Semantc-Web-Technologien bereits stat fn-
det. Zahlreiche kleinere und auch ganz große Content-Provider, Medienhäuser, Verlagshäuser, Nachrich-
tenagenturen etc. spielen längst mit dem Gedanken, das Thema aufzugreifen. Doch weniger die techni-
schen Fragen stehen dabei im Zentrum, vielmehr die Frage, wie sehr „man sich“ nun öfnen müsse, wel-
che Daten man aus der Hand geben müsse, oder welche Geschäfsmodelle dadurch möglich werden.
Wie jede Innovaton, muss auch diese erst einmal von den Betrofenen verstanden und in das Bestehen-
de integriert werden, bevor sie breit ausgerollt werden kann.
? Welche Nutzungsmöglichkeiten und Anwendungen sind aus der Sicht der Anwender von großem In-
teresse?
? Wo sehen Sie, aus Sicht der Anwender und Unternehmen, besonders hohen Forschungs- und Entwick-
lungsbedarf?
Knackpunkt bei der kommerziellen Anwendung sind Lizenzierungsmodelle und Verfahren zur semi-auto-
matschen Qualitätssicherung. Auch sind noch einige technische Grundprobleme, vor allem im Umfeld
des Reasonings über größere Datenbestände im Web ungeklärt. Doch zeigt sich, dass Linked Data auch
ganz gut mit einigen einfachen Inferenz-Mechanismen das Auslangen fndet und dabei bereits mit sehr
großen Datenmengen eine brauchbare Performance und Stabilität erzielt werden kann.
? Wo sehen Sie uns im Jahr 2020 im Bezug auf Linked Open Data?
Ich denke, das Web bietet 2020 neue, ungeahnte Möglichkeiten auf Basis einer ausgereifen Linked Data
Infrastruktur. Jene Unternehmen, die dann diese Daten für ihr Business Intelligence, Market Intelligence
oder ihr Wissensmanagement nutzen werden, haben einen großen Wetbewerbsvorteil gegenüber je-
nen, die das semantsche Web übersehen.
Andreas Blumauer ist Geschäfsführer der punkt. netServices, Wien. und Mitgründer der Semantc Web
Company, sowie u. a. Herausgeber von Fachbüchern zu Semantc Web und Social Semantc Sofware
(Foto: Weinwurm).
67
Zusammenfassung
Fasst man die (zukünfigen) Möglichkeiten der Linked-Data-Ideen zusammen, ergibt sich
daraus ein ähnliches Bild wie im Abschnit „Metadatenformate und Ontologien“:
Linked Data hat über die Möglichkeiten von Metadatenformaten hinaus wesentliche
Fortschrite in der Verknüpfung von unterschiedlichen Daten sowie ofenen Datenbe-
ständen im Auge und geht damit noch einen guten Schrit weiter bei der Verfolgung der
Idee des „Semantc Web“.
68
Sandra Schafert
Weitere Nutzungsmöglichkeiten
Es gibt einige Anwendungen, bei denen unterschiedliche (Meta-) Informatonen kombi-
niert ausgewertet werden, die hier nur zum Teil angesprochen wurden. Bezogen auf die
unterschiedlichen Nutzer lassen sich diese folgendermaßen darstellen.
69
Abbildung 32: Nutzung von kombinierten (Meta-) Informatonen unterschiedlicher Nutzer
70
Werbetreibende ist so nicht mehr die Zahl der Webseitenaufrufe von Bedeutung,
neue Kennzahlen beinhalten u. a. die Zahl der eindeutg aktven User (Unique User),
registrierte und aktve User (s. Rönisch, 2008).
| Webmonitoring: Um Aussagen zu Trends und Entwicklungen zu erhalten, die Verbrei-
tung von Begrifen bzw. Verwendung von Markennamen vergleichend zu analysieren
und um Rückschlüsse über die Bewertung von Produkten und Dienstleistungen aus
Kundensicht zu erlangen sind die Möglichkeiten des Webmonitoring für Unterneh-
men von besonderem Interesse (Markus & Schafert, 2010). Gerade Letzteres ist im
Hinblick auf unzufriedene Kunden, die man nur schwer durch traditonelle Verfahren
erreicht, von Interesse (vgl. Infospeed, 2008), immer mehr Unternehmen beobach-
ten das Internet aktv (Fank, 2008). Auch wissenschafliche Untersuchungen und Pro-
gnoseinstrumente arbeiten mit Webmonitoring, beispielsweise zum Monitoring von
politschen Meinungsbildungsprozessen (siehe z. B. Wahlradar.de) sowie der Entwick-
lung von Pandemien (z. B. mit Hilfe von Twiter-Analysen: Chew & Eysenbach, 2009),
mit Hilfe von Facebook-Analysen: Luo, Paton & Witaker, 2009).
Es zeigt sich: Wirklich alle Arten von Informatonen, die derzeit durch Communitys und
soziale Netzwerke und die Möglichkeiten des Web 2.0 entstehen, und deren Nutzungs-
möglichkeiten erschöpfend zu beschreiben erscheint nicht nur im Rahmen der be-
schränkten Möglichkeiten dieser Broschüre derzeit unmöglich. In den beiden noch aus-
stehenden Veröfentlichungen im Rahmen der ComStudy werden wir uns jedoch aus-
führlicher mit Empfehlungs- und Reputatonssystemen beschäfigen.
71
(Meta-) Informatonen über ... … werden genutzt von …
Gesellschafliche Perspektve
In dieser Studie sind wir eher pragmatsch mit der Fragestellung umgegangen und ha-
ben unterschiedliche Nutzungsszenarien von (Meta-) Informatonen vorgestellt, ohne
72
diese in Hinsicht auf mögliche soziale, politsche oder auch rechtliche Herausforderun-
gen und Konsequenzen hinzuweisen.
Hier sind in den letzten Jahren eine große Zahl an Möglichkeiten entstanden, Informa-
tonen über einzelne Personen zu erheben und darüber zu verfügen, wie es vor einige
Jahren noch undenkbar war. Dabei werden diese Daten nicht von staatlichen Einrichtun-
gen, sondern im großen Umfang von Unternehmen erhoben, beispielsweise bei den So-
zialen Netzwerken wie Facebook oder LinkedIn. Die Nutzer geben dabei freiwillig Selbst-
auskunf an Unternehmen, und durch ihre Aktvitäten und Vernetzung kommen eine
Vielzahl an Informatonen hinzu, die in aller Regel auch dauerhaf im Internet zu fnden
sind. Hier besteht gesellschaflicher Handlungsbedarf um diesen neuen Bedingungen
angemessen Rechnung zu tragen, beispielsweise verändern sie das soziale Zusammen-
sein, wenn viele persönliche Dinge oder familiäre Geschichten, die früher „vergessen“
worden wären dauerhaf präsent sind (s. Mayer-Schönberger, 2009). Natürlich sind auch
entsprechende politsche und juristsche Reaktonen notwendig, wie mit den neuen Da-
tenmonopolen umgegangen werden soll. So stellt sich auch die Frage inwieweit öfent-
lich zugängliche Daten auch in wissenschaflichen Veröfentlichungen personenbezogen
ausgewertet werden dürfen, problematsch erscheint hier z. B. die Auswertung der
PWM-Platorm (s. Mayr, 2009) bei der keine Anonymisierung vorgenommen wurde.
Schließlich bedarf es auch Aktvitäten, wie im Bildungswesen adäquat auf diese Entwick-
lungen eingegangen wird: Es ist heute kinderleicht ein Bild mit dem Handy aufzuneh-
men und online zu stellen, die möglichen Konsequenzen für Jugendliche häufg nicht zu
überschauen. Auch bei Erwachsenen erscheint hier Auflärung über die Funktonswei-
sen von Microblogging-Angeboten wie Twiter oder Kurznachrichten in Sozialen Netzen,
wie dort zu fndende negatve Aussagen über die Arbeit und den Chef und damit ver-
bundene Kündigungen beispielhaf zeigen.
Ein Forum, das versucht Chancen, Möglichkeiten und Herausforderungen des zukünfi-
gen Webs aus Sicht von Unternehmen und Anwendern zu diskuteren und dazu Meinun-
gen zusammenzutragen, ist das österreichische Projekt Zukunfsweb.at.
73
74
LITERATUR UND QUELLEN
| von Ahn, L. & Dabbish, L. (2004). Labeling Images with a Computer Game. In ACM Conference
on Human Factors in Computng Systems (CHI), 2004, pp 319-326.
| von Ahn, L; Ginosar, S., Kedia, M., Liu, R. & Blum, M. (2006): Improving Accessibility of the
Web with a Computer Game. Proceedings of the SIGCHI conference on Human Factors in
computng systems table of contents, Montréal, Québec, Canada, SESSION: Games table of
contents, 79-82.
| Altsearchengines.com (2009). ePulze uses sentment analysis to build beter advertsing.
(2009-10-04)
| Askitas, Nikos & Zimmermann, Klaus F. (2009). Prognosen aus dem Internet: Weitere Erho-
lung am Arbeitsmarkt erwartet. In: Wochenbericht des DIW, 25/2009, 402-408.
| Barbosa, Daniela (2008). The Taxonomoy Cookbook. Finding the Right Recipe for Organizing
Enterprise Metadata. htp://solutons.dowjones.com/cookbook/ebook_sla2008/cookbooke-
book.pdf (2009-08-14)
| Basic Thinking Blog (2009). Wann die Deutschen am geilsten sind. Weblogeintrag vom
23.3.2009. htp://www.basicthinking.de/blog/2009/03/23/wann-die-deutschen-am-geilsten-
sind/ (2009-10-13)
| Baumöl, Ulrike & Ickler, Henrik (2008). Soziale Netzwerkanalyse. In: Karl Kurbel, Jörg Becker,
Norbert Gronau, Elmar Sinz & Leena Suhl (Hrsg.), Enzyklopädie der Wirtschafsinformatk. On-
line-Lexikon. htp://www.enzyklopaedie-der-wirtschafsinformatk.de/wi-enzyklopaedie/lexi-
kon/daten-wissen/Wissensmanagement/Soziales-Netzwerk/Soziale-Netzwerkanalyse (2009-
10-03)
| Berners-Lee, Tim (2006). Linked Data - personal view. htp://www.w3.org/DesignIssues/Lin-
kedData.html (2009-07-24)
| Berners-Lee, Tim (2007). Giant Global Graph. Weblogeintrag vom 21.11.2007, htp://dig.c-
sail.mit.edu/breadcrumbs/node/215 (2009-11-21)
| Berners-Lee, Tim (2008). Slides for Open Data (State of the Art). URL: htp://www.w3.org/
2008/ Talks/0617-lod-tbl/#(1) (2009-07-24)
| Bernstein, Michael; Tan, Desney; Smith, Greg; Czerwinski; Mary & Horvitz, Eric (2009). Colla-
bio: A Game for Annotatng People within Social Netzworks. In: UIST '09, October 4-7, Canaca.
htp://research.microsof.com/en-us/um/people/horvitz/collabio.pdf (2009-10-03)
| Bizer, Christan (2009). LOD-Dataset. htp://www4.wiwiss.fu-berlin.de/bizer/pub/lod-data-
sets_2009-03-05.html (2009-10-15)
| Bizer, Chris, Cyganiak, Richard & Heath, Tom (2006). How to Publish Linked Data on the Web.
URL: htp://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial/ (2009-07-24)
| Brauckmann, Patrick (2010), Web-Monitoring. Gewinnung und Analyse von Daten über das
Kommunikatonsverhalten im Internet, Konstanz: UVK-Verlag.
| Chew, Cynthia Mei & Eysenbach, Gunther (2009). Pandemics in the Age of Twiter: Content
Analysis of “Tweets” During the H1N1 Outbreak. Präsentaton auf der Konferenz Medicine
2.0, 17-18.9.2009, Toronto, USA.
| Chi, E.H.; Pirolli, P. & Lam, S.K. (2007). Aspects of Augmented Social Recogniton: Social In-
formaton Foraging and Social Search. In: D. Schuler (Ed.), Online Communites and Social
Computng. Berlin: Springer, 60-69.
| Chun, S., Cherry, R., Hiwiller, D., Trant, J. & Wyman, B. (2006). Steve.museum: An Ongoing Ex-
periment in Social Tagging, Folksonomy, and Museums. In: Proceedings of the Museum and
the Web 2.0 conference, March 22-25, 2006, Albuquerque, New Mexico. Online zugänglich
unter: htp://www.archimuse.com/mw2006/papers/wyman/wyman.html (2009-02-19)
75
| DaF-Blog (2009). Durchsagen. Weblogeintrag vom 21.9.2009. htp://cornelia.siteware.ch/
blog/ wordpress/2009/09/21/durchsagen (2009-10-04)
| Derntl, Thomas; Hampel, Thorsten; Motschnig, Renate & Pitner, Tomas (2009). Social Tagging
und Inclusive Universal Access. In: Birgit Gaiser, Thorsten Hampel & Stephanie Panke (Hrsg.),
Good Tags – Bad Tags. Social Tagging in der Wissensorganisaton, Münster: Waxmann, S. 51-
71.
| Diakopoulos, N. & Chiu, P. (2007). PhotoPlay: A Collocated Collaboratve Photo Tagging Game
on a Horizontal Display. In: Proceedings addendum of User Interface Sofware Technology
(UIST). Newport, Rhode Island, October 2007.
| Drachsler, Hendrik (2009). Navigaton Support for Learners in Informal Learning Networks.
Maastricht: Open Universiteit Nederland.
| ESW-Wiki (2009). FOAF+SSL. htp://esw.w3.org/topic/foaf+ssl (2009-10-01)
| Fank, Mathias (2008). WebKnow Studie 2008. Status Quo von Webmonitoring in Unterneh-
men. Online zugänglich unter: htp://www.infospeed.de/data/WebKnow-Studie-2008.pdf
(2008-12-23)
| FAS.research (2009). Homepage. htp://www.fas.at/ (2009-10-14)
| Fitkau & Maaß Consultng (2008). Produktbewertungen beeinfussen Kaufentscheidungen.
htp://www.w3b.org/e-commerce/produktbewertungen-beeinfussen-kaufentscheidun-
gen.html (2009-1014).
| ESW Wiki. URL: htp://esw.w3.org/topic/FrontPage (2009-07-24)
| Gaiser, Birgit, Hampel, Thorsten & Panke, Stephanie (2008). Vorwort. In: dies. (Hrsg.), Good
Tags Good Tags – Bad Tags. Social Tagging in der Wissensorganisaton, Münster: Waxmann.
| Gelin, Rene (2009). Aufgepasst! So wird es gemacht. SEO-Special: Expertentpps aus der Praxis
In websellling, 5, 38-41.
| Ginsberg, Jeremy; Mohebbi, Mathew H.; Patel, Rajan S.; Brammer, Lynnete, Smolinski, Mark
S. & Brilliant, Larry (2009). Detectng infuenza epidemics using search engine query dataIn:
Nature 457, 1012-1014.
| Google, Insights for Search Help, htp://www.google.com/support/insights//bin/answer.py?
answer=87285 (2009-06-02)
| Gloor, Peter, Krauss, Jonas S., Nann, Stefan, Fischbach, Kai and Schoder, Detlef, Web Science
2.0: Identfying Trends Through Semantc Social Network Analysis (November 11, 2008).
htp://ssrn.com/abstract=1299869 (2009-10-14)
| Graf, Joachim (2009). Start des iBusiness 'Search Advertsing Index': Hoher Werbedruck im
SEM-Markt. In: iBusiness Executve Summary, 19, 8, 15.
| Groß, Olaf (2008). Community-Strategien für den Online-Shops: Kaufen als Gesellschafser-
lebnis. In: iBusiness Executve Summary, Jg. 18, Ausgabe 16/17, 8-9.
| Groß, Olaf (2009). Saisonale Search-Trends im SEM und Afliate-Marketng: Das Wissen um
die richtge Stunde. In: iBusiness Executve Summary, 19, 6, 6-7.
| Gruber, Thomas (2008). Ein Bewertungssystem für kollaboratv erstellte Inhalte. Eine prototy-
pische Implementerung eines generischen Frameworks. Vorstellung der Diplomarbeit bei
Salzburg Research, 22.1.2008.
| Güntner, Georg; Sint, Rolf & Westenthaler, Rupert (2009). Ein Ansatz zur Unterstützung tradi-
toneller Klassifkaton durch Social Tagging. In: Birgit Gaiser, Thorsten Hampel & Stephanie
Panke (Hrsg.), Good Tags – Bad Tags. Social Tagging in der Wissensorganisaton, Münster: Wa-
xmann, S. 187-199.
76
| Herr, Joachim (2005). Der Kampf um die Spitzenplätze. Branchen (71): Sportartkel. Online zu-
gänglich unter: htp://www.faz.net/s/ RubD16E1F55D21144C4AE3F9DDF52B6E1D9/
Doc~EC4A E7272834A4D1DBDCDD2D4586FE41E~ATpl~Ecommon~Scontent.html [2009-06-
02]
| Herr, Joachim (2006). Die höhere Mehrwertsteuer trübt die Freude. Branchen (71): Sportart-
kel. Online zugänglich unter: htp://www.faz.net/s/ Rub39D62EB10953443E-
B82D694D50AE0845/ Doc~EDEBF09CAD89B4B38B0017A43F18F7AEA~ATpl~Ecommon~con-
tent.html [2009-06-02]
| Hitzler, Pascal & Krötsch, M. (2008). Semantc Web Technologies. Berlin: Springer.
| Infospeed (2008). Homepage. Online zugänglich unter: htp://www.infospeed.de/ [2008-12-
22]
| Jaschke, Robert; Grahl, Miranda; Hotho, Andreas; Krause, Beate; Schmitz, Christoph & Stum-
me, Gerd (2007). Organizing Publicatons and Bookmarks in BibSonomy. In: Proceedings of
the WWW 2007, May 8-12, 2007, Banf, Canada.
| Kirchhof, Lars; Stanoevska-Slabeva; Katarina; Nicolai, Thomas & Fleck, Mathes (2008). Using
social network analysis to enhance retrieval systems. In: Applicatons of Social Network Analy-
sis (ASNA) (Zurich), 12.9.2008 htp://www.alexandria.unisg.ch/EXPORT/DL/46828.pdf (2009-
10-12)
| Kitl, Christan & Zeidler, Christan (2007). User Generated Content und Metadatenmanage-
ment. In: HMD, Praxis der Wirtschafsinformatk, Hef 258, 57-67.
| Klamma, Ralf; Cuong, Pham Manh & Cao, Yiwei (2009). You Never Walk Alone: Recommen-
ding Academic Events Based on Social Network Analysis. Complex (1) 2009: 657-670.
| Klamma, Ralf; Spaniol, M. & Renzel, D. (2007). Community-Aware Semantc Multmedia Tag-
ging – From Folksonomies to Commsonomies, in: K. Tochtermann, H. Maurer, F. Kappe, A.
Scharl (Eds.): Proceedings of I-Media'07, Internatonal Conference on New Media Technology
and Semantc Systems, Graz, Austria, September 5 - 7, 2007, J.UCS (Journal of Universal Com-
puter Science) Proceedings, pp. 163-171.
| Knoth, Petr; Schmidt, Marek & Smrž, Pavel (2008). Informaton Extracton — State-of-the-Art.
Knowledge in a Wiki (KiWi), Deliverable 2.5. htp://wiki.kiwi-project.eu/multmedia/kiwi-pub:
KiWi_D2.5_fnal.pdf (2009-09-02)
| Leisenberg, Manfred (2008). Soziale Netze und Web 2.0 - Chance für die Marktorschung. In:
Computerwoche, 9.6.2008 htp://www.computerwoche.de/netzwerke/web/1866180/ (2009-
10-03)
| Luo, Chen; Paton, Chris & Witaker, Robyn (2009). Facebook: An Innovatve Infuenza Pande-
mic Early Warning System. Präsentaton auf der Konferenz Medicine 2.0, 17-18.9.2009, Toron-
to, USA.
| Marketng Pilgrim (2008). Using Web Metrics to Analyze the ‘Palin Efect’ & 2008 Presidental
Campaign. Monday, October 13th, htp://www.marketngpilgrim.com/2008/10/sarah-palin-
internet-popularity.html (2009-10-13)
| Markus, Mark & Schafert, Sandra (2010). Web-Monitoring mit freien Quellen und Werkzeu-
gen für Unternehmen. Beispiel: Skiherstellerbranche. In: Patrick Brauckmann (Ed.), Web-Mo-
nitoring. Gewinnung und Analyse von Daten über das Kommunikatonsverhalten im Internet,
Konstanz: UVK-Verlag, 190-204.
| Marlow, Cameron; Naaman, Mor; Boyd, Danah, & Davis, Marc (2006). HT06, Tagging Paper,
Taxonomy, Flickr, Academic Title, ToRead. In: Proceedings of Hypertext 2006, New York: ACM
Press.
| Mayer-Schönberger, Viktor (2009). Delete: The Virtue of Forgetng in the Digital Age. Prince-
ton: Princeton University Press.
77
| Mayr, Manuela (2006). Soziale Netzwerkanalyse der PWM. In: Platorm Wissensmanagement
(Hrsg.) Wissen wirkt! Aber wie?! PWM-Jahrbuch 2006/2007, Wien, 35-44.
| Mikeonads.com (2008). Using your browser URL history to estmate gender. Weblogeintrag
vom 13.7.2009 htp://www.mikeonads.com/2008/07/13/using-your-browser-url-history-est-
mate-gender/ (2009-08-12)
| Mishne, Gilad (2006). AutoTag: a collaboratve approach to automated tag assignment for we-
blog posts. WWW 2006: 953-954.
| Mishne, G. & Glance, N. (2006). Predictng Movie Sales from Blogger Sentment Export: In
AAAI 2006 Spring Symposium on Computatonal Approaches to Analysing Weblogs.
| Moens, M.-F. (2006). Informaton Extracton: Algorithms and Prospects in a Retrieval Context
(The Informaton Retrieval Series). New York: Springer.
| Morrison, P.J. (2007). Tagging and Searching: Search retrieval efectveness of folksonomies
on the Web. Unpublished master’s thesis, Kent State University.
| Odden, L. (2009). 6 Social Search Engines to Start 2009. Weblogeintrag vom 4.1.2009, URL:
htp://www.toprankblog.com/2009/01/6-social-search-engines/ (2009-07-24)
| Puig, V., L’Hour, Y.-M.; Haussonne, Y.-M. & Jauniau, C. (2009). Collaboratve Annotaton System
Using Vocal Comments Recorded on Mobile Phones and Audio Guides: The Centre Pompidou
Exhibiton Traces Du Sacré. Museums and the Web.
| Randler, Stephan (2009). Die Zukunfsperspektven von Social Shopping: Wo das größte
Marktpotental lauert. In: iBusiness Executve Summary, 19, 8, 12-13.
| Riekert, Wolf-Fritz (1996). Bericht der Arbeitsgruppe Metadaten. In: R. Gütler, & W. Geiger
(Hrsg.), Integraton von Umweltdaten, 3. Workshop Schloß Dagstuhl 1995. Marburg: Monopo-
lis.
| Rönisch, Susan (2008). Online-Werbemessung: Web 2.0 braucht Kennzahlen 2.0. In: iBusiness
ExecutveSummary, Jg. 18, 20, 6-7.
| Schafert, Sandra & Kalz, Marco (2009). Persönliche Lernumgebungen: Grundlagen, Möglich-
keiten und Herausforderungen eines neuen Konzepts. In K. Wilbers & A. Hohenstein (Hrsg.),
Handbuch E-Learning. Expertenwissen aus Wissenschaf und Praxis - Strategien, Instrumente,
Fallstudien. (Gruppe 5, Nr. 5.16, pp. 1-24). Köln: Deutscher Wirtschafsdienst (Wolters Kluwer
Deutschland), 27. Erg.-Lfg. Januar 2009.
| Schafert, Sandra & Wieden-Bischof, Diana (2009). Erfolgreicher Aufau von Online-Commu-
nitys. Konzepte, Szenarien und Handlungsempfehlungen. Erschienen in der Reihe “Social Me-
dia”, hrsg. von Georg Güntner und Sebastan Schafert, Band 1. Salzburg: Salzburg Research.
| Siorpaes, K. and M. Hepp, OntoGame (2007). Towards Overcoming the Incentve Botleneck in
Ontology Building, in Proceedings of the 3rd Internatonal IFIP Workshop On Semantc Web &
Web Semantcs (SWWS '07) co-located with OTM Federated Conferences. Springer LNCS: Vila-
moura, Portugal, November 29-30.
| Spiegel Online (2007). SPIEGEL ONLINE startet Zeitgeschichte-Projekt. Online zugänglich un-
ter: htp://www.spiegelgruppe.de/spiegelgruppe/home.nsf/PMWeb/DDE0FC2234B59CBD-
C125731B002710F5 (2009-12-15)
| Spiegel Online (2009). Yahoo beschert US-Zeitungen mehr Erlöse. htp://www.spiegel.de/
netzwelt/ web/0,1518,626250,00.html (2009-10-14)
| Stegbauer, Christan (2009). Wikipedia. Das Rätsel der Kooperaton. Wiesbaden: VS Verlag.
| Synesketch (2009). Gallery and Demo. htp://www.synesketch.krcadinac.com/ wiki/index.-
php?ttle=Demonstraton#Synemania (2009-10-09)
78
| Trant, J. (2008). Access to art museums online: a role for social tagging and folksonomy? Key-
note address. Dublin Core Metadata Initatve Annual Meetng, Berlin, Germany, September
23, 2008.
| Vuorikari, Riina (2009). Are tags from Mars and descriptors from Venus? A study on the ecolo-
gy of educatonal resource metadata. In: Proceedings of the ICWL 2009, Aachen, Aug 19.
| Weinberger, David (2007). Everything is miscellaneous: the power of the new digital disorder.
New York: Times Books.
| Wichowski, Alexis (2009). Survival of the ftest tag: Folksonomies, fnability, and the evolut-
on of informaton organizaton. In: frst monday, Volume 14, Number 5-4, May 2009.
htp://frstmonday.org/ htbin/cgiwrap/bin/ojs/index.php/fm/artcle/view/2447/2175 (2009-
09-21)
| Welt.de (2009). So stampfen Vögel mit den Füßen zur Musik htp://www.welt.de/wissen-
schaf/artcle3656551/So-stampfen-Voegel-mit-den-Fuessen-zur-Musik.html (2009-10-14)
| Wieden-Bischof, Diana & Schafert, Sandra (2008). Nachrichten 2.0. Eine Analyse internato-
naler Nachrichtenangebote im Internet. Norderstedt: Books on Demand.
| Zhang, J., Dong T., Ackerman M.S., Qu Y. (2008). Expertse-Tagging Game: Identfying Expertse
Networks in Organizatons, CSCW Workshop on What to expect from Enterprise 3.0: Adaptng
Web 2.0 to Corporate Reality, 2008, San Diego.
79
AUTORINNEN UND AUTOREN
Dr. Sandra Schafert arbeitet seit 2006 als wissenschafliche Mitarbeiterin und Projekt-
managerin bei der Salzburg Research Forschungsgesellschaf (SRFG) zu Webbasierten
(Bildungs-) Innovatonen. Sie leitet die ComStudy, in deren Rahmen diese Veröfentli-
chung entstand.
Julia Eder ist Mitarbeiterin der SRFG im Bereich Communicatons und dort u.a. für das
Projekt TagIT verantwortlich.
Mag. Wolf Hilzensauer ist wissenschaflicher Mitarbeiter der SRFG im Bereich Informat-
on Society Research, spezialisiert auf Webbasierte (Bildungs-) Innovatonen.
Dipl. Inf. Thomas Kurz ist wissenschaflicher Mitarbeiter der SRFG im Bereich Wissens-
und Medienmanagement.
Dr. Mark Markus ist wissenschaflicher Mitarbeiter der SRFG im Bereich Informaton So-
ciety Research und Spezialist für Innovatonsmanagement.
Dr. Sebastan Schafert ist wissenschaflicher Leiter des Salzburg NewMediaLab und ar-
beitet seit 2005 als wissenschaflicher Mitarbeiter in der SRFG, wo er u. a. das EU-Pro-
jekt „Knowledge in a Wiki“ (KiWi) leitet.
DI (FH) Rupert Westenthaler ist wissenschaflicher Mitarbeiter bei der SRFG im Bereich
Wissens- und Medienmanagement.
Mag. Diana Wieden-Bischof ist wissenschafliche Mitarbeiterin bei der SRFG im Bereich
Informaton Society Research.
80
schriftenReihe: Social Media | Band 2
Schriftenreihe: Social Media
Band 2
Media
special
Data
Community
Tagging warm
© shutterstock
Social Media amazing
Knowledge
Das Web 2.0 und seine Fülle an einfachen und neuen Beteiligungsformen hat die Zahl
Weblog
Context
der aktiven Nutzerinnen und Nutzer und die Zahl der Beiträge enorm ansteigen lassen.
Gerade da, wo sich Menschen stark austauschen und interagieren werden besonders
Semantic Web
Content
viele Informationen zusammengetragen. Neben den unmittelbaren Beiträgen bei der
Content-Entwicklung – beispielsweise dem Hochladen von Videos, Fotos auf entspre-
chende Plattformen oder Textbeiträgen in Weblogs – entstehen auch Metainformatio-
nen wie Informationen über das Suchverhalten oder durch Social Tagging.
In dieser Broschüre wird dargestellt, wie solche (Meta-) Informationen entstehen und
wie sie genutzt werden. Dazu werden Beispiele aus unterschiedlichen Branchen und aus
Sicht unterschiedlicher Akteure vorgestellt: aus Sicht einzelner Nutzer, von Communitys,
der Betreiber von Web-Angeboten sowie aus Sicht Dritter, z. B. externer Unternehmen
oder der Wissenschaft. Ein gewisses technisches Grundverständnis voraussetzend,
wendet sich diese Studie vor allem an Praktiker, die sich durch die unterschiedlichen
und auch überraschenden Nutzungsmöglichkeiten anregen lassen wollen, ihre eigenen
Produkte und Dienstleistungen weiter zu entwickeln.
Diese Broschüre ist ein Ergebnis der „ComStudy“, die am Salzburg New Media Lab
(SNML) im Zeitraum von Oktober 2008 bis Dezember 2009 durchgeführt wird. Das
SNML, das Kompetenzzentrum für Neue Medien in Österreich, arbeitet daran, digitale
Inhalte clever zu strukturieren, verknüpfen, personalisieren, für alle auffindbar zu
machen und nachhaltig zu nutzen und betrachtet dabei die Community als einen
wesentlichen Faktor vieler Projekte.
Sandra Schaffert
mit Beiträgen von Julia Eder, Wolf Hilzensauer, Thomas Kurz, Mark Markus,
Sebastian Schaffert, Rupert Westenthaler und Diana Wieden-Bischof