Sie sind auf Seite 1von 82

schriftenReihe: Social Media | Band 3

Schriftenreihe: Social Media


Band 3


© sxc.hu
Wachsende Datenbestände machen es schwierig sich zu orientieren. Empfehlungs­
systeme werden daher immer häufiger eingesetzt. Sie schlagen zum Beispiel Produkte,
Dienstleistungen, Webseiten, Filme, Bilder, Musik (-gruppen), Experten oder potenti­
elle Freunde und Lebenspartner vor. Insbesondere durch den Anwuchs von Beiträgen
 
in Social-Media-Anwendungen sind Empfehlungssysteme gefragt, damit interessante
Beiträge und Personen nicht untergehen. Auch bei der gezielten und personalisierten

Werbung im Web oder bei Suchmaschinen werden Verfahren der Empfehlungssysteme
eingesetzt. Empfehlungen unterstützen auch Prozesse wie die Reiseplanung, das Lernen,
das Tagging und auch das Verschreiben von Arzneimitteln.

In dieser Broschüre werden Konzepte und Realisierungen von Empfehlungssystemen im


Web vorgestellt und beschrieben. Dazu werden unter anderem das inhaltsbasierte und

B
kollaborative Filtern als Strategien beschrieben. Die unterschiedlichen Konzepte werden
kritisch betrachtet und für mehrere Einsatzgebiete Realisierungen vorgestellt. Schließ­
lich werden in der Studie Hinweise für die Entwicklung von Empfehlungssystemen
gegeben.
" 
Diese Broschüre ist ein Ergebnis der ComStudy, die am Salzburg NewMediaLab (SNML)
 

Empfehlungen im Web – Konzepte und Realisierungen


im Zeitraum von Oktober 2008 bis Februar 2010 durchgeführt wird. Das SNML, das Kom­
petenzzentrum für Neue Medien in Österreich, arbeitet daran, digitale Inhalte clever zu
strukturieren, verknüpfen, personalisieren, für alle auffindbar zu machen und nachhaltig
zu nutzen und betrachtet dabei die Community als einen wesentlichen Faktor vieler
Projekte.

ISBN 978-3-902448-16-3
Empfehlungen im Web
Konzepte und Realisierungen

Sandra Schaffert, Tobias Bürger, Wolf Hilzensauer,


Cornelia Schneider und Diana Wieden-Bischof
Sandra Schafert

Empfehlungen im Web
Konzepte und Realisierungen

mit Beiträgen von Tobias Bürger, Wolf Hilzensauer,


Cornelia Schneider und Diana Wieden-Bischof
Salzburg NewMediaLab (SNML), das Kompetenzzentrum für Neue Medien, gab die
vorliegende Broschüre im Rahmen des Projekts „ComStudy“ (Leitung: Dr. Sandra
Schafert) in Aufrag. Unter der Leitung von DI Georg Güntner arbeitet das SNML dar-
an, digitale Inhalte clever zu strukturieren, verknüpfen, personalisieren, für alle auf-
fndbar zu machen und nachhaltg zu nutzen. Das SNML ist ein industrielles Kompe-
tenzzentrum im Rahmen der Aktonslinie Kind des Bundesministeriums für Wirtschaf
und Arbeit (BMWA) und wird gefördert aus Miteln des BMWA und des Landes Salz-
burg. Homepage: newmedialab.at

© Salzburg NewMediaLab 2010

ISBN 978-3-902448-16-3

Sandra Schafert, Tobias Bürger, Wolf Hilzensauer,


Cornelia Schneider und Diana Wieden-Bischof:

Empfehlungen im Web.
Konzepte und Realisierungen.

Band 3 der Reihe „Social Media“,


herausgegeben von Georg Güntner und Sebastan Schafert

Verlag und Herstellung: Salzburg Research, Salzburg


Umschlaggestaltung: Daniela Gnad, Salzburg Research
Lektorat: Andreas Strasser und Renate Steinmann, Salzburg Research

Bibliografsche Informaton der Deutschen Natonalbibliothek:

Die Deutsche Natonalbibliothek verzeichnet diese Publikaton


in der Deutschen Natonalbibliografe; detaillierte bibliografsche
Daten sind im Internet über htp://dnb.d-nb.de abrufar.
VORWORT
Das Kompetenzzentrum für Neue Medien, das Salzburg NewMediaLab, betrachtet im
Rahmen seines Forschungsprogramms die Wechselwirkung zwischen digitalen Inhalten
und ihren Autor(inn)en bzw. Konsument(inn)en aus technologischer und sozialer Per-
spektve. Dabei ergibt sich naturgemäß die Frage, welche Art von Beziehungen zwischen
Autor(inn)en und Leser(innen) untereinander, aber auch zu den von ihnen erstellten
bzw. konsumierten Inhalten besteht. Weiters untersuchen wir, wie sich die aufgrund die-
ser Beziehungen entstehenden Gemeinschafen auf die Atraktvität und Nutzung der In-
halte sowie auf das Angebot von erweiterten Diensten auswirkt.
Unter der Bezeichnung „ComStudy“ wurde im Oktober 2009 am Salzburg NewMediaLab
eine Studie gestartet, die sich mit Orienterungs- und Entscheidungshilfen für den Auf-
bau und die Nutzung von Online-Communitys beschäfigt. Dabei betrachten wir auch
die in der Wechselwirkung von Inhalten und Communitys anfallenden Metainformato-
nen und die auf den Inhalten basierenden Dienste, wie etwa Empfehlungs- und Reputa-
tonssysteme.
Das Informatonsangebot im Internet ist mitlerweile so angewachsen und unübersicht-
lich geworden, dass Suchmaschinen alleine die Flut der Daten für die Benutzer(innen)
nicht mehr ausreichend fltern und darstellen können. Deswegen gehen fortschritliche
Informatonsplatormen und digitale soziale Netzwerke zunehmend dazu über, das Pa-
radigma des Suchens umzukehren: Nicht mehr die Benutzer(innen) suchen nach Infor-
matonen, sondern die Informatonen suchen (und fnden) die Benutzer(innen). Voraus-
setzung dafür sind Empfehlungssysteme, die Informatonen nach unterschiedlichen Ge-
sichtspunkten – z.B. anhand der Profle der Anwender(nnen) – (semi-)automatsch aus-
wählen, fltern und vorschlagen. Der vorliegende Band stellt Ansätze und Methoden für
Empfehlungssysteme vor, zeigt mögliche Einsatzgebiete auf und gibt praktsche Hinweise
für die Implementerung solcher Systeme.
Die Darstellung der Analyse und von deren Ergebnissen erfolgt – wie in den beiden vor-
angehenden Publikatonen – stets unter dem Gesichtspunkt, den Leserinnen und Lesern
praktsche Orienterungs- und Entscheidungshilfen für die Konzepton und Umsetzung
zur Verfügung zu stellen. Im Namen des Salzburg NewMediaLab wünsche ich Ihnen in
diesem Sinne bei der Lektüre viele brauchbare Anregungen und viel Erfolg bei der prak-
tschen Umsetzung in Ihren Online-Communitys oder bei Ihren Informatonssystemen.

Georg Güntner
Leiter des Salzburg NewMediaLab
Februar 2010
DANK & ANMERKUNG ZUR SCHREIBWEISE
Herzlichen Dank an Prof. Dr. Peter Dolog, Dr. Hendrik Drachsler sowie Dr. Marco Kalz für
Ihre Bereitschaf, uns in diesem Studie einige Fragen zu beantworten und uns so an ih-
rer Expertse teilhaben zu lassen.
Danke auch an meine Kolleginnen und Kollegen: an Mag. Diana Wieden-Bischof und
Mag. Wolf Hilzensauer für ihre Unterstützung bei der Recherche und Beschreibung von
Beispielen; an Dr. Tobias Bürger für seinen Beitrag zu LIVE und sein Feedback zur Studie
sowie an DI (FH) Mag. Cornelia Schneider für ihren Beitrag zu Empfehlungssystemen im
Gesundheitsbereich, an Mag. Renate Steinmann und Dr. Andreas Strasser für das Lekto-
rat, danke auch an Daniela Gnad für das Titelbild!
Da die Gefahr groß ist, die eine oder den anderen zu übersehen, der bei den Trefen,
oder in E-Mails oder beim informellen Gespräch beim Kafee hilfreich war, danke ich den
weiteren Kolleg(inn)en ohne einzelne Namen zu nennen: Wie bei jeder der Veröfentli-
chungen im Rahmen des Projektes ComStudy stecken auch hier hinter vielen Ideen und
Hinweisen auf interessante Tools, Projekte, Veröfentlichungen und Expert(inn)en zahl-
reiche Kolleg(inn)en des Salzburg NewMediaLab und der Salzburg Research Forschungs-
gesellschaf. Es macht Spaß, mit so vielen cleveren Köpfen zusammenzuarbeiten!
Schließlich, wie bei den bisherigen Veröfentlichungen dieser Reihe auch hier: Um die-
sen Beitrag nicht durch weibliche Endungen, Bindestriche und Klammern zu einem zwar
korrekten, aber auch schwerer zu lesenden Werk zu machen, haben wir im Folgenden
durchgehend darauf verzichtet, die gendergerechte Schreibweise zu verwenden. Zudem
haben wir uns bemüht, auf englische Ausdrücke oder Lehenswörter zu verzichten, wo
sie uns unnötg erschienen – aber im Bereich des Internets und der modernen Manage-
mentheorie kommt man leider viel zu of nicht darum herum.
Sandra Schafert
Salzburg Research Forschungsgesellschaf
Februar 2010
INHALTSVERZEICHNIS
1 Einleitung und Hintergrund........................................................................................ 9
1.1 Empfehlungen im Web........................................................................................... 9
1.2 Schwerpunkte, Forschungsfragen und Vorgehen.................................................10
1.3 Hintergrund.......................................................................................................... 10
2 Empfehlungssysteme: Ansätze und Methoden......................................................... 13
2.1 Ziele und Zwecke des Einsatzes von Empfehlungssystemen................................. 13
2.2 Quellen für Empfehlungssysteme.........................................................................14
2.3 Personalisierte und allgemeine Empfehlungen ....................................................15
2.4 Inhaltsbasiertes Filtern......................................................................................... 15
2.5 Kollaboratves Filtern............................................................................................22
2.6 Verfahren der Ähnlichkeitsfeststellung von Nutzern bzw. Elementen..................25
2.7 Ähnlichkeit und weitere Kriterien.........................................................................28
2.8 Nachteile und Herausforderungen der Ansätze ...................................................28
2.9 Hybride Lösungen.................................................................................................30
3 Empfehlungssysteme: Ausgewählte Einsatzgebiete.................................................. 35
3.1 Überblick über fünf ausgewählte Einsatzgebiete..................................................35
3.2 Experten- und Arbeitsplatzsuche im Web............................................................ 36
3.3 Partnersuche im Web........................................................................................... 39
3.4 Produktempfehlungen .........................................................................................42
3.5 Empfehlungssysteme für Web-Materialien.......................................................... 51
3.6 Spezielle Einsatzgebiete und weitere Empfehlungssysteme................................. 58
4 Entwicklung von Empfehlungssystemen...................................................................67
4.1 Entwicklung im Überblick..................................................................................... 67
4.2 Aktve Einbindung von Nutzern............................................................................ 67
4.3 Ziel und Zweck des Empfehlungssystem...............................................................68
4.4 Konzeptonelle Beschreibung............................................................................... 68
4.5 Implementerung ................................................................................................69
4.6 Evaluaton: Überprüfung der Qualität und Nützlichkeit von Empfehlungen.........70
5 Ausblick....................................................................................................................73
Literatur und Quellen.................................................................................................. 75
Autorinnen und Autoren............................................................................................. 80
Social Media – Weitere Bände.....................................................................................80
1 EINLEITUNG UND HINTERGRUND
1.1 Empfehlungen im Web
Wachsende Datenbestände machen es schwierig sich zu orienteren. Empfehlungssyste-
me werden daher immer häufger eingesetzt. Sie schlagen zum Beispiel Produkte,
Dienstleistungen, Webseiten, Filme, Bilder, Lieder, Experten, Musikgruppen oder poten-
zielle Freunde und Lebenspartner vor. Insbesondere durch den Anwuchs von Beiträgen
in Social-Media-Anwendungen sind Empfehlungssysteme gefragt, damit interessante
Beiträge und Personen nicht „untergehen“. Auch bei der gezielten und personalisierten
Werbung im Web oder bei Suchmaschinen werden Verfahren der Empfehlungssysteme
eingesetzt. Empfehlungen unterstützen auch Prozesse wie die Reiseplanung, das Lernen,
das Tagging und auch das Verschreiben von Arzneimiteln.
Empfehlungssysteme haben die Aufgabe (vgl. Sorge, 2008) „einem Nutzer Objekte zu
empfehlen, die für ihn interessant sein könnten“ (S. 18). Klahold (2009) versteht unter
einem Empfehlungssystem ein System, „das einem Benutzer in einem gegebenen Kon-
text aus einer gegebenen Enttätsmenge aktv eine Teilmenge „nützlicher“ Elemente
empfehlt“ (S. 1). Empfehlungssysteme werden auch im Deutschen häufg als „Recom-
mender-Systeme“ bezeichnet.
Als Voraussetzung für die Notwendigkeit von Empfehlungssystemen betrachtet Klahold
(2009) das Anwachsen von Informatonen und den exponentellen Ansteg des Datenvo-
lumens im 20. Jahrhundert (S. 16). Auch wenn es nicht als Empfehlungssystem bezeich-
net wird, ist Klahold (2009) zufolge, die erste akademische Beschäfigung mit einem
Empfehlungssystem das Werk von Luhn (1958): Er beschreibt ein System, dass selektv
Informatonen an bestmmte Organisatonen verteilt.
Ein Überblick über aktuelle Realisierungen und Erfahrungen mit solchen Empfehlungs-
systemen, die als Service für Nutzer und Communitys einen entscheidenden Faktor für
die Atraktvität eines Systems ausmachen können, wird hier gegeben, wobei auch die
konkrete technologische Umsetzung und die Konzepte beschrieben werden. Während
sich der Begrif der „Empfehlungssysteme“ in einigen Beiträgen nur auf automatsche
Verfahren der Empfehlung beschränkt, beziehen wir in dieser Arbeit alle Formen der
Empfehlungen mit ein.
Grundsätzlich wird für Empfehlungssysteme in der Regel eines der beiden folgenden
Verfahren oder eine Kombinaton von beiden genutzt:
| Beim inhaltsbasierten Filtern (Engl. „Content Based Filtering“) beruhen die Empfeh-
lungen auf den Eigenschafen der Elemente, die empfohlen werden. Beispielsweise
wird ein Buch empfohlen, weil ein Abgleich des Klappentexts sowie des Benutzerpro-
fls ergeben hat, dass es ihn interessieren könnte (Klahold, 2009).
| Beim kollaboratven Filtern (Engl. „Collaboratve Filtering“) werden Empfehlungen
auf der Basis von Daten zu ähnlichen Benutzerproflen gegeben. Beispielsweise wer-
den hier Bücher empfohlen, die andere Nutzer mit ähnlichem Benutzerprofl bereits
gekauf, gelesen oder positv bewertet haben (Klahold, 2009).
Ein weiteres wichtges Beschreibungsmerkmal eines Empfehlungssystem ist es, ob per-
sonalisierte Empfehlungen gegeben werden oder ob die Empfehlung für jeden Nutzer
gleichermaßen gilt.
Darüberhinaus gibt es auch Systeme und Anwendungen, die unterstützen, dass Nutzer
anderen Nutzern direkte (persönliche) Empfehlungen geben (s. Terveen & Hill, 2001;
Brand-Haushofer, 2005).

9
1.2 Schwerpunkte, Forschungsfragen und Vorgehen
Schwerpunkte unserer Ausführungen sind die unterschiedlichen Formen und Einsatz-
möglichkeiten von Empfehlungssystemen im Web.
Folgende, eher praktsche Fragen waren dabei forschungsleitend:
| Welche Arten von Empfehlungssystemen im Web gibt es derzeit?
| Wie und zu welchem Zweck werden sie eingesetzt?
| Welche Erfahrungen wurden dabei bisher gemacht?
Diese Publikaton verfolgt das Ziel, über unterschiedliche Branchen und Anwendungsbe-
reiche hinweg, Realisierungsmöglichkeiten und Beispiele vorzustellen. Dabei wird be-
trachtet, welchen Nutzen einzelne Benutzer eines Services oder einzelne Community-
Mitglieder haben und wie ggf. die Nutzergruppe insgesamt davon proftert.
Im Überblick beschäfigt sich die Studie also mit:
| Motven für den Einsatz von Empfehlungssystemen,
| unterschiedlichen Ansätze und technologischen Grundlagen,
| Realisierungen für unterschiedliche Einsatzbereiche,
| Hinweisen zur Entwicklung solcher Systeme sowie
| Herausforderungen und zukünfigen Forschungsfragen.
Ein gewisses technisches Grundverständnis voraussetzend, wendet sich diese Studie vor
allem an Praktker, die sich durch die unterschiedlichen Nutzungsmöglichkeiten anregen
lassen wollen, für ihre eigenen Webplatormen innovatve Empfehlungsservices zu ent-
wickeln. Hierfür wurden Beispiele, Publikatonen und Experten einbezogen, um einen
guten Einsteg und Überblick zum aktuellen Stand der Nutzung sowie anregende Einbli-
cke ermöglichen zu können.
Beim Entwurf des Projektes und der Forschungsschwerpunkte gab es keine deutschspra-
chige umfangreichere Einführung in Empfehlungssysteme. Während der Recherchen er-
schien jedoch ein neues Buch: Klahold (2009) führt in die unterschiedlichen Empfeh-
lungssysteme, ihre Struktur und verwendete Technologien und Methoden systematsch
für Studierende der Informatk ein. Diese Broschüre hat hingegen eher die unterschiedli-
chen Einsatzgebiete und Erfahrungen sowie die Entwicklung von Empfehlungssystemen
für Gestalter und Verantwortliche von Webplatormen im Fokus. Auf alle Fälle beein-
fusste und inspirierte uns das Buch von Klahold (2009); häufg wird daher auf diese
Quelle verwiesen.

1.3 Hintergrund
Diese Broschüre ist ein Ergebnis der „ComStudy“, die am Salzburg NewMediaLab (SNML)
im Zeitraum von Oktober 2008 bis Januar 2010 durchgeführt wurde. Das SNML, das
Kompetenzzentrum für Neue Medien in Österreich, arbeitet daran, digitale Inhalte cle-
ver zu strukturieren, verknüpfen, personalisieren, für alle aufndbar zu machen und
nachhaltg zu nutzen und betrachtet dabei die Community als einen wesentlichen Faktor
vieler Projekte.
Im Rahmen der ComStudy wurde bereits eine Studie zum erfolgreichen Community-
Aufau durchgeführt, die anhand von Literaturanalysen, Best-Practce-Beispielen, Fall-
analysen und Expertenbefragungen für unterschiedliche Szenarien konkrete Implemen-
terungsempfehlungen gibt (Schafert & Wieden-Bischof, 2009). In einer weiteren Bro-
schüre wurde die Entstehung und Nutzung von (Meta-) Informatonen in Communitys

10
beschrieben. Unterschiedliche Einsatzgebiete und Nutzungen, von der Entwicklung von
Services für die Communitys selbst bis zum unternehmensgetriebenen Webmonitoring
werden dabei beschrieben (Schafert u.a., 2009). Auf diesen Vorarbeiten beruht im Rah-
men des Projektes zudem eine Studie zu Feedback- und Reputatonssystemen (Schafert
u.a., 2010).
Auch dieser Band basiert darauf, da bei der Entwicklung von Empfehlungssystemen auf
(Meta-) Informatonen unterschiedlichster Art zurückgegrifen werden kann (s. letzte
Seite in diesem Band).

11
12
2 EMPFEHLUNGSSYSTEME: ANSÄTZE UND METHODEN
In diesem Abschnit werden die unterschiedlichen Ansätze und Methoden von Empfeh-
lungssystemen vorgestellt. Dazu werden zunächst Ziele und Zwecke ihres Einsatzes und
ihre Quellen vorgestellt. Im Anschluss wir ein Einsteg in die unterschiedlichen Verfahren
des inhaltsbasierten als auch kollaboratven Filtern und hybrider Ansätze geboten.
Leider nutzen einige Forscher unterschiedliche Bezeichnungen für die gleichen Verfah-
ren von Empfehlungssystemen, während andere identsche Bezeichnungen verwenden,
aber ofensichtlich unterschiedliches verstehen (Schickel-Zuber, 2007, 21). Im Folgenden
wurde Aufau und Bezeichnungen der Verfahren aus aktuelleren Veröfentlichungen ge-
wählt und beschrieben (u.a. Schickel-Zuber, 2007; Klahold, 2009).

2.1 Ziele und Zwecke des Einsatzes von Empfehlungssystemen


Einleitend wurde festgestellt, dass Empfehlungssysteme die Aufgabe haben, Nutzern
von Anwendungen Objekte vorzuschlagen, die für sie interessant sein können. Doch
welche Ziele und Zwecke verfolgen Betreiber eines Angebots, das ein Empfehlungssys-
tem enthält?
Unmitelbare Zwecke, die Empfehlungssysteme erfüllen sollen sind, dass
| Nutzer für sie interessante, neuartge und nützliche Empfehlungen für Experten, Pro-
dukte, Dienstleistungen, potenzielle Ehepartner, Lernpartner, Webseiten, usw. erhal-
ten, und/oder
| dadurch Prozesse, beispielsweise Recherchen, Lernen, Arzneiverordnung, Planung
von Reisen etc. erleichtert, beschleunigt und verbessert werden.
Ziele, die Betreiber mit dem Einsatz von Empfehlungssystemen verfolgen, können dabei
sein:
| mit Hilfe des Empfehlungssystems mehr Nutzer zu bekommen,
| zufriedenere Nutzer zu erhalten,
| sich durch besseren Service von Mitbewerbern zu unterscheiden sowie
| höhere Umsätze und/oder Gewinne zu sichern.
Insbesondere im Online-Handel versprechen gute Empfehlungssysteme so erhöhte Um-
sätze durch das Vorschlagen passender, reizvoller weiterer Produkte, die für die Kunden
auch tatsächlich interessant sind. So wird das Hauptgeschäf bei Amazon oder iTunes
Store nicht mehr mit den Verkaufsschlagern gemacht, sondern mit Nischenprodukten.
Diese gilt es aber zu fnden, daher sind Empfehlungssysteme unabdingbar (vgl. Klahold,
2009).
Strategische Ziele, die damit verfolgt werden können sind zum Beispiel: die Nutzer an
den eigenen Service zu binden, sie zu aktvieren und/oder ein Alleinstellungsmerkmal im
Vergleich mit den Mitbewerbern zu erlangen.
Gleichzeitg, wenn beispielsweise mit der Einführung von Empfehlungssystemen auch
Bewertungssysteme eingeführt werden können, ermöglichen Empfehlungssysteme auch
leichteres Monitoring und Auswertung der Nutzer und ihrer Interessen. Auch können
Betreiber, beispielsweise in Handelsplatormen Auswirkungen der Empfehlungen von
Produkten oder personalisierter Werbung analysieren und dadurch auch Wissen über
gute Produktplatzierung und Werbung gewinnen.

13
2.2 Quellen für Empfehlungssysteme
Als Quellen für Empfehlungssysteme stehen eine ganze Reihe von (Meta-) Informato-
nen über Nutzer sowie den Empfehlungselementen zur Verfügung. Beispielsweise sind
dies (s. Schafert u.a. 2009, 10):
| das Nutzerverhalten, beispielsweise das Such- und Browsingverhalten,
| die Kommunikatons- und Netzwerkstruktur als Möglichkeit die sozialen Gegebenhei-
ten zu erfassen und zu nutzen,
| Bewertungen, die dazu genutzt werden, um Produkte, Personen, Objekte oder Web-
seiten zu evaluieren und zu beurteilen,
| Social Tagging als eine innovatve und populäre Variante von gemeinschaflicher Ver-
schlagwortung von Dokumenten,
| Texte, da aus dieser Datenquelle eine Reihe von (auch überraschenden) Metainfor-
matonen analysiert und abgeleitet werden können,
| Metadatenformate als klassische Form von Metainformatonen sowie schließlich
| verknüpfe Daten und Schemata (z. B. Thesauri, Ontologien, Linked Data).
Bei Empfehlungssystemen wird darüberhinaus auch damit experimentert, beispielswei-
se Persönlichkeitsmerkmale abzufragen und auszuwerten, um Empfehlungen zu verbes-
sern (Nunes & Blanc, 2008).
Die unterschiedlichen Quellen werden in explizite Empfehlungen, d.h. Empfehlungen
durch Bewertungen von Nutzern, sowie verhaltensbasierte Empfehlungen durch sonst-
ge Aktvitäten der Nutzer unterschieden. Nach Neumann (2009) sind mit der Nutzung
dieser unterschiedlichen Quellen auch unterschiedliche Herausforderungen verbunden.

Nutzer Designprobleme der Mechanismen

Nutzertyp Verhalten Explizite Empfehlungen Verhaltensbasierte


Empfehlungen

unvoreingenommen passiv passiver Konsum Free-Rider-Efekt, –


Netzwerkefekte

unvoreingenommen aktv wahrheitsgemäßer Beitrag Privatsphäre (Privatsphäre)

voreingenommen, aktv voreingenommener Beitrag Voreingenommenheit, (Voreingenommenheit)


Feedback-Efekte
Glaubwürdigkeit

Tabelle 1: Nutzertypen und Designprobleme von Empfehlungssystemen


mit expliziten vs. verhaltensbasierten Empfehlungen
Quelle: Neumann, 2009, Tabelle 3.1, 28

Prinzipiell sind bei beiden Verfahren v.a. Voreingenommenheit und Parteilichkeit bei
Nutzern eine Herausforderung, insbesondere wenn bewusst und intensiv zugunsten
oder gegen Produkte bewertet wird. Parteiische Nutzer können auch Feedback-Efekte
hervorrufen, d.h. dass ein frühzeitges positves Feedback zu größeren Marktchancen
von Produkten führt, ein frühes negatves Feedback jedoch die Chancen für spätere Ver-
besserungen der Bewertungen und Absatzchancen stark einschränkt.
Empfehlungen sind auch gewissermaßen ein öfentliches Gut, von dem jeder profteren
kann. Dies gilt im besonderen Maße für Nutzer, die nur von den Bewertungen anderer

14
profteren, aber nicht selbst daran mitwirken („Free-Rider-Efekt“). Wünschenswert ist
allerdings, dass alle Nutzer mitwirken und Netzwerkefekte entstehen können.

2.3 Personalisierte und allgemeine Empfehlungen


Als erstes Unterscheidungsmerkmal der unterschiedlichen Verfahren wird häufg ausge-
wählt, ob das System personalisierte, d.h. auf einen Nutzer zugeschnite, Empfehlungen
gibt. Insbesondere Bewertungsplatormen wie die Nachrichtensammlung Digg1 geben
auf der Startseite keine personalisierten Empfehlungen ab, sondern aggregieren aus den
Bewertungen der Digg-Nutzer Empfehlungen von Nachrichten, die für alle Besucher der
Seite gelten. Registrierte Nutzer bekommen jedoch auch ihr Profl zugeschnitene Emp-
fehlungen (s. Abbildung 1).
Ebenso keine personalisierten Empfehlungen in diesem Sinne geben beispielsweise Sys-
teme, die zu einzelnen Produkten oder Webseiten weiterführende oder ähnliche Pro-
dukte und Webseiten anbieten, wenn diese Empfehlungen nicht aufgrund des Nutzer-
profls gegeben werden, sondern bei jedem Nutzer gleichermaßen angezeigt werden.

Abbildung 1: Allgemeine Nachrichtenempfehlungen und


die personalisierte Empfehlungsmaschine bei Digg
Quelle: htp://digg.com (02/2010)

Als registrierter Nutzer erhält man bei Digg jedoch personalisierte Empfehlungen für Ar-
tkel: Vorgeschlagen werden Beiträge, die Nutzer mit einem ähnlichen Profl gut fnden.
Personalisierte Empfehlungssysteme können auch die Nutzer-History berücksichtgen
und (auch ohne Berücksichtgung anderer Nutzerprofle) Empfehlungen geben (Tanaka,
Hori & Yamamoto 2008).
Im Folgenden stellen wir die zwei grundsätzlich unterschiedliche Verfahren vor, die bei
Empfehlungssystemen eingesetzt werden: das inhaltsbasierte sowie das kollaboratve
Filtern.

2.4 Inhaltsbasiertes Filtern


Das inhaltsbasierte Filtern hängt stark von den Objekten ab, die empfohlen werden sol-
len: Bücher, Videos, Fotos, Musikdateien und andere Produkte sind dabei unterschied-
lich beschrieben und nutzen auch unterschiedliche Metadatenformate. Die Eigenschaf-
ten der Objekte sind die Basis für die Empfehlungen. Was andere Nutzer machen, spielt
also keine Rolle. Folgende Abbildung gibt einen Überblick über die Prozesse beim in-
haltsbasierten Filtern, die wir im Folgenden genauer vorstellen.

1
htp://digg.com, Stand 02/2010

15
Abbildung 2: Überblick über das Vorgehen bei inhaltsbasierten Empfehlungen
Quelle: Nutzung von Abbildungen von Artkeln der folgenden Zeitschrifen:
Oberbadisches Volksblat, Ahlener Zeitung, Rheinische Zeitung, Kleine Zeitung

Eigenschafsanalyse
Die Datenbasis des Systems kann beim inhaltsbasierten Filtern grundsätzlich unter-
schiedlich erlangt werden:
| Die Elemente können mit Hilfe von Experten beschrieben werden. Insbesondere Ler-
nempfehlungen in Lernumgebungen werden aufgrund von Angaben von Experten,
i.d.R. der Lehrenden gegeben. Dazu werden beispielsweise im Lernmanagementsys-
tem Angaben zum Aufau der Lerneinheiten gemacht, welches Modul beispielsweise
welchem Modul folgt bzw. folgen sollte. Eine Reihe von weiteren Empfehlungssyste-
men verwenden Metadaten von Objekten, ohne dass spezifsche weitere Auswertun-
gen vorgenommen werden: So können Bücher von gleichen Autoren empfohlen wer-
den oder Bücher, die in der gleichen Rubrik veröfentlicht wurden.
| Davon unterscheiden sich Empfehlungssysteme, die zu empfehlende Objekte bzw.
deren Nutzer erst weiteren Auswertungen und Analysen unterziehen, um entspre-
chende Daten zu erhalten. Viele Empfehlungssysteme greifen nicht auf explizite Ele-
mentbeschreibungen wie z. B. Metadaten zurück.
Of sind Eigenschafen der Empfehlungselemente eben noch nicht bekannt oder be-
schrieben, sondern müssen erst analysiert werden (in der Abbildung 2 mit „a“ gekenn-
zeichnet).

16
Auch für andere Formate wie Videos, Audios und Bilder gibt es Verfahren der automat-
schen Analyse. Erprobter und sehr häufg im Einsatz sind bei Empfehlungssystemen je-
doch vor allem Eigenschafsanalysen von Texten. Auf diesen Bereich gehen wir daher im
Folgenden besonders ein.

Eigenschafsanalyse am Beispiel von Texten


Besonders bei Texten müssen deren Besonderheiten erst vom Empfehlungssystem fest-
gestellt werden. Die Verfahren zur Analyse von Eigenschafen von Texten heißt „Feature
Selecton“ bzw. eben Eigenschafsanalyse (vgl. Klahold, 2009, 42). Dazu gibt es eine Rei-
he von Verfahren, die diese Analyse ermöglichen. Bei Texten ist es wichtg, die Schlüssel-
worte (bzw. Stchworte) zu erhalten, die zentrale Bedeutung für den Text haben (siehe
Klahold, 2009, 42f). Dabei kommen Verfahren der Informaton Extracton (auf Deutsch
„Informatonsgewinnung“), zum Einsatz, also semantsche wie statstsche Verfahren (s.
Knoth, Schmidt & Smrž, 2008). Nicht zuletzt durch Empfehlungssysteme ist die Nachfra-
ge und Zitatonshäufgkeit von einschlägigen Werken wie „Informaton to modern infor-
maton retrieval“ von Salton und McGill (1986) oder „Informaton Retrieval von van Rijs-
bergen (1979) immer noch hoch (s. Heymann, 2004).
Im Folgenden zeigen wir ein typisches Verfahren am Beispiel von vier Ausschniten aus
Liedtexten. Hier werden zunächst Wörter, die in der deutschen Sprache sehr häufg sind
und keinen Mehrwert für die Diferenzierung von Texten haben, gestrichen und nicht
weiter ausgewertet. In solchen „Stopplisten“ stehen typischerweise Worte wie „auch“,
„als“, „an“, „keine“, „kann“, „sind“, „oder“ sowie „und“. In der folgenden Tabelle wird ge-
zeigt, welche Wortlisten sich aus drei Beispielsätzen ergeben, wenn Stopplistenwörter
gestrichen werden, Wiederholungen gelöscht sowie Wörter auf ihre Grundformen zu-
rückgeführt werden.

Originalsatz (Liedtexte) Nach Streichung der Stoppwörter

Text A „Wir tanzen Tango und möglichst lang. Es spielt sich eng wir, tanzen, Tango, möglichst, lange, spielt, eng, Gedräng
bei dem Gedräng.“

Text B „Eins, zwei, drei, vier, Brüderchen, komm tanz mit mir. eins, zwei, drei, vier, Brüderchen, komm, tanz, mir, eins, zwei,
Eins, zwei, drei, vier, beide Hände reich ich dir.“ drei, vier, beide, Hände, reich, ich, dir

Text C „Oh, Donna Clara, ich hab dich tanzen gesehn, und deine oh, Donna, Clara, ich, tanzen, gesehn, deine, Schönheit,
Schönheit hat mich toll gemacht.“ mich, toll, gemacht

Text D „Komm, tanz den Tango mit mir! Und folge mir im Tango- komm, tanz, Tango, mir, folge, mir, Tangoschrit, hier, ich,
schrit hier! Ich tanz den Tanz ganz lange mit dir.“ tanz, Tanz, ganz, lange, dir

Tabelle 2: Charakteristk der Empfehlungssysteme in ausgewählten Einsatzgebieten.


Quelle: Textauszüge von Nina Hagen, Volksgut, Comedian Harmonists und Bodo Wartke

Folgende Verfahren zur Textanalyse werden in der Praxis häufg eingesetzt:


| Das Verfahren „Term Frequency – Inverse Document Frequency“ (kurz TF/IDF) ist ein
statstsches Verfahren: Es zählt alle Wörter im Text. Wörter, die dabei in allen Texten
(im gesamten Korpus) vorkommen, erhalten ein geringes Gewicht. Wörter, die nur in
wenigen Texten vorkommen, erhalten ein größeres Gewicht und werden zur Be-
schreibung eines Textes bedeutsamer eingeschätzt. Dabei werden in aller Regel auch
Stemming- bzw. Lemmatsierungs-Verfahren eingesetzt, d.h. Worte werden auf ihre
Stammformen gebracht, um beispielsweise unterschiedliche Beugungsformen kor-
rekt zu zählen.

17
| Der Ansatz der „Mutual Informaton“ berechnet die Wahrscheinlichkeit, dass zwei
Worte gemeinsam in einem Text vorkommen. Durch den Vergleich der Wahrschein-
lichkeit des gemeinsamen Aufretens mit der des unabhängigen Aufretens der Wort-
paare wird ein Ähnlichkeitsmaß von Texten berechenbar.
Diese Ansätze wurden vielfältg präzisiert und weiterentwickelt, beispielsweise sind das
„Okapi Weightng Scheme“ und das Okapi-BM2-Verfahren Weiterentwicklungen des
TF/IDF-Verfahrens (s. Cummins & O’Riordan, 2006). Ein weiteres patentertes Verfahren
ist das Latent Semantc Indexing. Marco Kalz beschreibt es im Expertengespräch (s.
S. 65).
Bei solchen statstschen Verfahren werden v.a. Wörter gezählt und seltener semant-
sche Bezüge ausgewertet. Verwandte Wörter bzw. die Wortbedeutungen zu berücksich-
tgen wird v.a. durch Einbezug von Thesauri, Synonym-Lexika und Wörterbüchern mög-
lich. Bei mehrdeutgen Wörtern wie „Bank“ können beispielsweise über die assoziierten
Wörter weitere Zuordnungen vorgenommen werden. Trit das Wort „Bank“ beispiels-
weise im Zusammenhang mit „Kredit“, „Überweisung“ auf, passt dieser Beitrag wohl
eher zu einem Artkel mit Beiträgen zu Geldinsttuten als zu anderen Beiträgen zur Sitz-
gelegenheit „Bank“ (siehe ausführlich bei Klahold, 2009, 48). Ein Verfahren, das ebenso
Wortbedeutungen auswertet ist der Ansatz der „Named Entty Recogniton“: Hier wer-
den sogenannte „Enttätstypen“ durch die Stellung im Satz identfziert. Beispielsweise
können das Personen, Firmen oder Orte sein, die aufgrund der Stellung im Satz, der
Häufgkeit oder auch durch Abgleich mit Listen als Personennamen, Firmennamen oder
Ortsnamen identfziert werden.
Für Empfehlungssysteme wurden eigene Heuristken dafür entwickelt, welche Wörter
wichtg sind bzw. den Inhalt des analysierten Textes widerspiegeln. Für ein Empfehlungs-
system von Webseiten, dem InfoFinder, wurde beispielsweise folgende Heuristk einge-
setzt (Krulwosh & Burkey, 1997; Übersetzung in Klahold, 2009, 112):
| Worte, die in einer Stoppwortliste, stehen sind grundsätzlich unwichtg,
| komplet groß geschriebene Worte sind wichtg (Vermutung, es handelt sich um ein
Akronym),
| in Klammern oder Anführungszeichen stehende Worte nach einem komplet groß ge-
schriebenen Wort sind wichtg (Vermutung, es handelt sich dabei um eine Defniton
eines Akronyms),
| anders formaterte Wortolgen von zwei bis drei Worten, die kein eigenständiger Satz
sind, sind wichtg (Vermutung, es handelt sich um die erstmalige Verwendung eines
wichtgen Wortes),
| Worte in Aufzählungen, Überschrifen, Bildunterschrifen, Tabellenspalten und -zei-
len sind wichtg,
| ofmals wiederholte Wortolgen sind wichtg,
| Substantve in direkter Folge sind wichtg (Vermutung, es handelt sich um einen
Fachbegrif),
| Worte, die Sonderzeichen (beispielsweise einen Bindestrich), Zifern oder Großbuch-
staben enthalten, sind wichtg.

18
Darstellung und Speicherung der Eigenschafen
Eine einfache Darstellung von Eigenschafen eines Textes ist die einfache unstrukturierte
Sammlung der Schlüsselworte („Bag of Words“, Klahold, 2009, 58). In der Regel werden
die Eigenschafen in Form von Vektoren dargestellt (s. Klahold, 2009, 56f; Abbildung 2
mit „b“ gekennzeichnet). Texte werden dabei i.d.R. mit Vektoren repräsentert, die so
viele Komponenten haben, wie der Korpus Worte besitzt. Anhand der Ähnlichkeit von
Vektoren wird auf die Ähnlichkeit der analysierten Texte geschlossen (s. Abschnit 2.6,
S. 25)
Am obigen Beispiel der Liedtexte dargestellt (s. Tabelle 2, S. 17), können Vektoren bei-
spielsweise folgendermaßen aussehen:

Schlüsselworte Vektoraufau: wir, tanzen, Tango, möglichst, lange, spielt, eng, Gedräng, Zahl der
eins, zwei, drei, vier, Brüderchen, komm, tanz, mir, beide, Hände, reich, ich, Schlüssel-
dir, oh, Donna, Clara, gesehn, deine, Schönheit, mich, toll, gemacht, folge, worte ohne
Tangoschrit, hier, Tanz, ganz Wiederho-
lungen

Text A wir, tanzen, Tango, mög- VRA=(1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0) 8


lichst, lange, spielt, eng, VBA=(1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0)
Gedräng

Text B eins, zwei, drei, vier, Brü- VRB=(0,0,0,0,0,0,0,0,2,2,2,2,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0) 14


derchen, komm, tanz, mir, VBB=(0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0)
eins, zwei, drei, vier, beide,
Hände, reich, ich, dir

Text C oh, Donna, Clara, ich, tan- VRC=(0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,1,1,1,1,1,1,1,1,1,0,0,0,0,0) 11


zen, gesehn, deine, Schön- VBC=(0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,1,1,1,1,1,1,1,1,1,0,0,0,0,0)
heit, mich, toll, gemacht

Text D komm, tanz, Tango, mir, VRD=(0,0,1,0,1,0,0,0,0,0,0,0,0,1,2,2,0,0,0,0,1,1,0,0,0,0,0,0,0,0,0,1,1,1,1,1) 12


folge, mir, Tangoschrit, VRD=(0,0,1,0,1,0,0,0,0,0,0,0,0,1,1,1,0,0,0,0,1,1,0,0,0,0,0,0,0,0,0,1,1,1,1,1)
hier, ich, tanz, Tanz, ganz,
lange, dir

Tabelle 3: Darstellung der Schlüsselworte in Vektoren mit reellen und binären Komponenten

In der Darstellung wird die Zahl der entsprechenden Worte im Vektor dargestellt. Mög-
lich ist auch eine binäre Darstellung, bei der „1“ für „vorhanden“ und „0“ für „nicht vor-
handen“ steht. Vektoren mit mehr als drei Dimensionen lassen sich dabei kaum bildlich
vorstellen. In der Darstellung wird die Zahl der entsprechenden Worte im Vektor darge-
stellt. Schon beim Betrachten der Vektoren kann man sich vorstellen, welche Vektoren
ähnlich sind.

Vergleich der Empfehlungselemente


Sind die Eigenschafen von Empfehlungselementen analysiert bzw. bekannt, wird beim
inhaltsbasierten Filtern ein Vergleich zwischen den Empfehlungselementen vorgenom-
men. Dazu stehen wiederum unterschiedliche Verfahren bzw. Algorithmen zur Verfü-
gung (in der Abbildung c). Typischerweise wird die Ähnlichkeit von Elementen als nütz-
lich empfunden, um darauf aufauend Empfehlungen auszusprechen. Wir stellen ausge-
wählte Verfahren in Abschnit 2.6 vor (s. S. 25).

19
Bei der Entscheidung für ein oder mehrere Verfahren bzw. einen Algorithmus ist es
wichtg, dass die Ergebnisse in einer angemessenen Zeit zur Verfügung stehen: „Um die
Laufzeitkomplexität zu reduzieren muss die Eigenschafsanalyse ein möglichst gutes Ver-
hältnis zwischen der Menge der Eigenschafen und der dadurch gegebenen diskriminie-
renden Wirkung bezüglich der Empfehlungselemente erzielen“ (Klahold, 2009, 42).

Fallbezogenes und eigenschafsbezogenes Filtern


Es können zwei Arten des inhaltsbasierten Filterns unterschieden werden.
Zum einen werden beim eigenschafsbezogenen Filtern (Engl. „atributon based“) Emp-
fehlungen aufgrund der Übereinstmmungen des Profls der Nutzer (z. B. seinen Qualif-
katonen) mit den Elementen (z. B. Stellenanzeigen) gegeben (siehe Abbildung 3,
rechts).
Zum anderen werden beim fallbezogenen Verfahren (Engl. „case based“) personalisierte
Empfehlungen auf Basis der Ähnlichkeiten von Elementen gegeben (siehe Abbildung 3,
links): Hat jemand z. B. einen Text zu Delphinen hoch bewertet, so wird er weitere Texte
zu diesem Thema vorgeschlagen bekommen.

Abbildung 3: Inhaltsbasiertes Filtern: eigenschafsbezogenes (links)


und fallbezogenes Filtern (rechts)
Quelle: Darstellung in Anlehnung an Kim, 2006, abgebildet in Drachsler, 2009

20
Beispiele für Empfehlungssysteme mit inhaltsbasiertem Filtern
Ausgewählte Beispiele für Empfehlungssysteme, die auf inhaltsbasiertem Filtern beru-
hen, werden in Klahold (2009, 102f) vorgestellt und hier zusammengefasst.

Name Empfeh- Kurzbeschreibung Eigenschafsanalyse Proflbildung Distanzmaß Literatur


lungsele-
ment

Informaton E-Mail E-Mails erhalten Manuelle Ergänzung Manuelle Erstel- Regelbasiert Malone, Grant,
Lense Metadaten (Ort, der Metadaten lung des Interes- (einfache Über- Turbak (1986)
Produkt etc.) sensprofls durch einstmmung)
Nutzer

Infoscope Usenet- Vorhandene Filterre- Heuristk, manuelle Manuelle Pfege regelbasiert Fischer & Ste-
Nachrichten geln für eine „virtu- Metadaten, Text- vens (1991)
elle“ Newsgroup struktur, NLP, Basis-
werden bewertet korpus-Statstk, TF-
IDF-Derivat

Letzia Webseiten Webseiten (Subsei- TF-IDF-Derivat Manuelle Pfege Cosinus-Ähn- Liebermann


ten oder Links) wer- (Schlüsselworte) lichkeitsmaß (1995)
den empfohlen

WebWatcher Webseiten Hyperlinks auf Web- TF-IDF-Derivat Manuelle Pfege Mutual Infor- Armstrong, Frei-
seiten und neue (Interessensspezif- maton tag, Joachims &
Webseiten werden katon) Mitchell (1995)
empfohlen u.a.

Syskill & We- Webseiten Webseiten werden TF-IDF-Derivat Auf Basis von Be- Naiver-Bayes- Pazanni, mUra-
bert empfohlen wertungen des Klassifkator matsu & Billsus
Nutzers von Web- (1996)
seiten (Schlüssel-
worte)

InfoFinder Webseiten Webseiten werden Heuristk Auf Basis von Be- ID3-Algorithmus Krulwosh & Bur-
empfohlen wertungen des key (1997)
Nutzers (Smiley
anklicken)

LIBRA Bücher Bücherempfehlun- Manuelle Metada- Auf Basis von Naiver-Bayes- Mooney & Roy
gen ten Buchbewertungen Klassifkator (2000)
des Nutzers

Tabelle 4: Übersicht über ausgewählte Empfehlungssysteme, die inhaltsbasiertes Filtern verwenden.


Quelle: Klahold, 2009, 102f

Die hier genannten Verfahren zur Distanzermitlung werden in Abschnit 2.6 (S.25) be-
schrieben.

21
2.5 Kollaboratves Filtern
Beim kollaboratven Filtern werden Empfehlungen aufgrund anderer ähnlicher Benutzer-
profle gegeben (Klahold, 2009, 62f). Folgende Abbildung gibt einen Überblick über das
Verfahren, dass wir im Folgenden detaillierter beschreiben.

Abbildung 4: Überblick des Vorgehens beim kollaboratven Filtern

Implizite und explizite Bewertungen


Grundlage für das kollaboratve Filtern sind die Bewertungen von Nutzern (siehe Abbil-
dung 4 mit „a“ gekennzeichnet). Diese können implizit durch Auswertung des Nutzerver-
haltens generiert werden, zum Beispiel kann vermerkt werden, welche Elemente an-
geklickt und/oder länger betrachtet wurden oder was gekauf wurde. So wird bei WAIR,
einem Empfehlungssystem für Webseiten, die Bewertung einer Webseiten nicht explizit
durch den Nutzer erbeten: Bewertungen von Webseiten werden hier aus dem Nutzer-
verhalten abgeleitet beispielsweise der Lesedauer, Setzen von Lesezeichen, Scrollen, Be-
nutzen von Hyperlinks (in der Webseite; s. Seo & Zang, 2000; Klahold, 2009, 133f). Häu-
fg werden jedoch auch explizite Bewertungen der Nutzer erbeten, beispielsweise auf ei-
ner Skala mit fünf Sternen.

Unterschiedliche Verfahren kollaboratven Filterns


Mit Hilfe dieser Daten wird nun berechnet, wie relevant ein Empfehlungselement für
einen Nutzer ist. Dazu gibt es beim kollaboratven Filtern wiederum mindestens vier An-
sätze zu unterscheiden (in der Abbildung 4 mit „b“ gekennzeichnet, Klahold, 2009, 62f;
Kim, 2006; Drachsler, 2009 u.a.).

22
Abbildung 5: Nutzer- und elementbasiertes kollaboratves Filtern
Quelle: Darstellung in Anlehnung an Kim, 2006; abgebildet in Drachsler, 2009

(i) Beim nutzerbezogenen Algorithmus wird festgestellt, welche Nutzer besonders ähn-
lich sind und deren Bewertungen eines Empfehlungselement als Relevanzmaß festge-
legt: Was ähnliche Nutzer als gut befnden, erhält eine hohe Relevanz und wird dem
Nutzer empfohlen (in der Abbildung 5 links).
(ii) Beim elementbezogenen Algorithmus werden eigene, als gut bewertete Elemente ge-
nommen und dann wird paarweise nach Elementen gesucht, die ebenso gut bewertet
werden. Die Relevanz berechnet sich beispielsweise in Form eines „gewichteten Durch-
schnits der Bewertungen des Benutzers für die (..) ähnlichsten Empfehlungselemente“
(Klahold, 2009, 65, in der Abbildung 5 rechts).

Abbildung 6: Modell- bzw. speicherbasiertes Verfahren beim kollaboratven Filtern

(iii) Beim modell- bzw. speicherbasierten Verfahren werden alle Benutzerdaten und das
Benutzerverhalten in den Filterprozess eingebunden. Dabei kommen multvariate Ver-
fahren zum Einsatz, die am Ende von Abschnit 2.6 (S. 25) beschrieben werden, bei-
spielsweise K-Means-Clustering.
(iv) Wenn die Zuordnung nicht aufgrund solcher Verfahren, sondern auf Basis einfacher
Angaben wie beispielsweise Alter und Geschlecht erfolgt, werden darauf beruhende
Empfehlungen für Elemente, die Gleichaltrige und Gleichgeschlechtliche als stereotypes
bzw. demographisches kollaboratves Filtern bezeichnet (siehe z. B. Drachsler, 2009, 57).

23
Beispiele von Empfehlungssystemen für kollaboratves Filtern
Ausgewählte Beispiele für Empfehlungssysteme, die auf kollaboratven Filtern beruhen,
werden in Klahold (2009) vorgestellt und hier zusammengefasst.

Name Empfeh- Kurzbeschreibung Eigenschafsanalyse Proflbildung Distanzmaß Literatur


lungsele-
ment

Tapestry E-Mails Anzeige von E-Mails, Relevanzbewertung Manuelle Pfege regelbasiert Goldberg u.a.
die von anderen durch Nutzer (muss Nutzer aus- (1992)
Nutzern als relevant wählen, dessen
eingestuf werden Einschätzungen
man nutzen will)

Ringo Musik Vorschläge für Inter- Bewertungen durch Bewertung von Regelbasiert Shardanand &
preten und Alben Nutzer Musikstücken (benutzerbezo- Maes (1995)
gener Korrelat-
onskoefzient)

Group Lense Usenet- In Newsgroup-Rea- Bewertungen auf ei- Bewertung von Pearson Korre- Resnick u.a.
Nachrichten dern werden Nach- ner Skala von 1-5 Usenet-Nachrich- latonskoefzi- (1994)
richten gekennzeich- ten ent
net

Siteseer Bookmark- Browser-Bookmark- Manuelle Metada- Bookmarks und Nearest-Neig- Rucker & Polanco
Empfehlun- vergleich ten und Bookmarks ihre Gruppierun- bours-Verfahren (1997)
gen gen

Jester (Eigen- Witze Witzempfehlungen Bewertung auf Initale Bewertung Nearest-Neig- Goldberg u.a.
taste) 200er-Skala ausgewählter Wit- bours-Verfahren (2000)
ze auf 200er-Skala,
Zuordnung in Be-
nutzergruppen
(Clusteranalyse, 40
Gruppen)

Amazon Bücher Bücherempfehlun- Kaufverhalten (ele- Weitere Empfeh- Kosinus-Ähn- Linden, Smith &
gen „Käufer dieses mentbasiertes kolla- lungen zu aktuell lichkeitsmaß York (2003)
Buches kaufen boratves Filtern) aufgerufenen Bü- zwischen Buch-
auch...“ chern vektoren

SurfLen Webseiten Empfehlungen im Webseitenaufrufe Weitere Empfeh- Heuristk Fu, Budzik &
Browser-Plugin (elementbasiertes lungen zu aktuell Hammond (2000)
kollaboratves Fil- aufgerufenen Web-
tern) seiten

Tabelle 5: Übersicht über ausgewählte Empfehlungssysteme die kollaboratves Filtern verwenden.


Quelle: Klahold, 2009, 87f

In dieser Übersicht werden, wie auch schon beim inhaltsbasierten Filtern, Verfahren der
Ähnlichkeitsfeststellung genannt, auf die wir im Folgenden eingehen werden.

24
2.6 Verfahren der Ähnlichkeitsfeststellung von Nutzern bzw. Elementen
Beim inhaltsbasierten wie beim kollaboratven Filtern wird in aller Regel versucht, ähnli-
che Nutzer bzw. ähnliche Elemente zu identfzieren: Es werden entweder ähnliche Nut-
zerprofle oder auch ähnliche Elemente gesucht, um daraus Empfehlungen abzuleiten.
Dazu kommen beim inhaltsbasierten und kollaboratven Filtern die gleichen Methoden
zum Einsatz. Einige davon beschreiben wir im Folgenden kurz: Zum einen kommen dabei
Verfahren, die Distanzen zwischen bzw. Ähnlichkeiten von Vektoren berechnen zum Ein-
satz, denn wie oben dargestellt sind Vektoren die übliche Darstellung von Eigen-
schafsproflen. Zum anderen werden Verfahren eingesetzt, die versuchen, Empfeh-
lungselemente oder auch Nutzergruppen zuzuordnen.

Distanzen und Ähnlichkeitsmaße von Vektoren


Wenn es darum geht, „ähnliche“ Elemente zu empfehlen, müssen Aussagen über die
Ähnlichkeiten von (allen) Elementen eines Korpus von möglichen Empfehlungselemen-
ten vorliegen. Es gibt eine Vielzahl von Möglichkeiten, Aussagen über Ähnlichkeiten von
Vektoren zu generieren.
Bei den Verfahren werden in aller Regel zwei Vektoren miteinander verglichen.
| Ein einfaches Verfahren beruht darauf zu zählen, wie of an der gleichen Stelle eines
Vektors eine „1“ vorkommt, d.h. in unserem Beispiel, zu zählen, wieviele gemeinsa-
me Worte zwei Texte aufweisen. Schnell wird allerdings klar, dass so längere Texte
mit diesem Verfahren deutlich häufger „Ähnlichkeiten“ aufweisen als kürzere. Hier
sind Korrekturen vorzunehmen. Folgende beiden Koefzienten wurden daher u.a.
entwickelt.
| Der Overlap-Koefzient berechnet sich aus dem Quotenten der gemeinsamen Wort-
menge und der kleineren der beiden Wortmengen und kann als „Maß für die wech-
selseitge Inklusion“ interpretert werden (Klahold, 2009, 73). Für den Vergleich von
Vektor B und Vektor D des Beispiels berechnet er sich folgendermaßen: 5/12=0,42; 5
ist dabei die Zahl der gemeinsamen Worte, 12 die kleinere Wortmenge beider Vekto-
ren.
| Der Dice-Koefzient berechnet sich dem Quotenten der doppelten Anzahl der ge-
meinsamen Worte und der Summe der Worte beider Wortmengen. Die Beziehung
wird auch hier aus dem Grad des gemeinsamen Vorkommens von Worten abgeleitet.
Im Beispiel berechnet sich der Koefzient für die Vektoren B und D folgendermaßen:
2*5/(14+12)=0,38; 5 ist dabei die Zahl der gemeinsamen Worte, 14 die Zahl der Wor-
te von Vektor B, 12 die Zahl der Worte von Vektor D.
Bei beiden Koefzienten kennzeichnen also höhere Werte eine größere Ähnlichkeit der
Vektoren. Exemplarisch zeigen wir die Ergebnisse dieser Berechnungen an unserem Bei-
spiel des Vergleichs von Liedertexten (s. Tabelle 2, S. 17 Und Tabelle 3, S. 19).

25
Ver- Vektoren gemein- Overlap- Dice-Koef- Pearson Kor-
gleich same Koefzient zient relatonsko-
Wort- efzient
menge

A,B VA=(1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0) 0 0,00 0,00 -0,43


VB=(0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0)

B,C VB=(0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0) 1 0,09 0,08 -0,41


VC=(0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,1,1,1,1,1,1,1,1,1,0,0,0,0,0)

C,D VC=(0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,1,1,1,1,1,1,1,1,1,0,0,0,0,0) 1 0,09 0,09 -0,34


VD=(0,0,1,0,1,0,0,0,0,0,0,0,0,1,1,1,0,0,0,0,1,1,0,0,0,0,0,0,0,0,0,1,1,1,1,1)

A,C VA=(1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0) 0 0,00 0,00 -0,21


VC=(0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,1,1,1,1,1,1,1,1,1,0,0,0,0,0)

B,D VB=(0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0) 5 0,42 0,38 0,04


VD=(0,0,1,0,1,0,0,0,0,0,0,0,0,1,1,1,0,0,0,0,1,1,0,0,0,0,0,0,0,0,0,1,1,1,1,1)

Tabelle 6: Ausgewählte Koefzienten zum Vergleich von Vektoren

In unserem Beispiel zeigt sich durch die Berechnung dieser Koefzienten (s. Tabelle 6),
dass die Zeilen „Eins, zwei, drei, vier, Brüderchen, komm tanz mit mir. Eins, zwei, drei,
vier, beide Hände reich ich dir“ sowie „Komm, tanz den Tango mit mir! Und folge mir im
Tangoschrit hier! Ich tanz den Tanz ganz lange mit dir“ die größte Ähnlichkeit im Bezug
auf die ihre (auf simple Weise extrahierten) Schlüsselwörter haben. Das Beispiel macht
also auch deutlich, dass das Verfahren der Text-Extrahierung nicht immer brauchbare Er-
gebnisse für nützliche Empfehlungen ergeben. Es erscheint wenig wahrscheinlich, dass
jemand der ein Kinderlied mag, die Empfehlung eines Schlagers als sehr nützlich ein-
schätzt.
Schließlich gibt es weitere Verfahren der Ähnlichkeitsberechnungen, die das Streuungs-
verhalten der Vektoren vergleichen (Klahold, 2009, 71): Der Pearson-Korrelatonskoef-
zient vergleicht so die jeweiligen Abweichungen von den mitleren Werten für jede Ei-
genschaf und kann Werte von -1 bis +1 ergeben. Eine negatve Korrelaton (-1) würde in
unserem Beispiel bedeuten, dass die beiden zu vergleichenden Vektoren quasi spiegel-
bildlich aufgebaut sind, z. B. V1=(0,0,1,1) und V2=(1,1,0,0). Gleiche bzw. ähnliche Vekto-
ren würden hoch korrelieren (bis max. +1).
Distanzen sind „der klassische Weg, die Dimension der 'Ähnlichkeit' mathematsch bere-
chenbar zu machen“ (Klahold, 2009, 68). Im Folgenden werden zwei Beispiele für Di-
stanzberechnungen vorgestellt:
| Der Euklidische Abstand ist „die Wurzel der Summe der quadrierten Diferenzen über
alle Koordinaten“ (Rahnenführer, 2009, 8). Im zwei- bzw. dreidimensionalen Raum ist
der Euklidische Abstand der Abstand zwischen zwei Punkten im Koordinatensystem.
| Der „Manhatan Abstand“ oder auch „City-Block-Abstand“ ist die „Summe der abso-
luten (unquadrierten) Diferenzen über alle Koordinaten“ (Rahnenführer, 2008, 9). Im
zweidimensionalen Raum ist der Manhaten-Abstand der Weg, den man gehen muss,
wenn man nicht zu einem anderen Punkt geht, sondern sich nur in Richtung der Di-
mensionen bewegen kann. In der Darstellung erinnern diese Abstände an die recht-
winkligen Straßenpläne des Zentrums von New York.
Ein weiteres Maß, das häufg eingesetzt wird, ist das Cosinus-Ähnlichkeitsmaß. Es be-
rechnet den Unterschied zwischen den Winkeln der Vektoren durch deren Cosinus. Zwar

26
lässt sich dieses Vorgehen insbesondere bei den vieldimensionalen Vektoren unserer
Beispiele bildlich kaum vorstellen, es handelt sich dabei allerdings um ein Standardver-
fahren des Vektorenvergleichs. Je ähnlicher sich Vektoren sind, desto kleiner ist der Win-
kel zwischen ihnen (s. Klahold, 2009, 72).
Bei der Wahl eines Verfahrens sind neben der Laufzeitkomplexität auch weitere grund-
sätzliche Überlegungen wichtg. Beispielsweise ist zu überlegen, ob grobe Unterschiede
bei den Abweichungswerten (Streuungsmaß) der einzelnen Eigenschafen durch eine
Normalisierung ausgeglichen werden sollten. Umgekehrt könnte auch überlegt werden,
ob es Eigenschafen gibt, die wichtger bzw. unwichtger bei der Berechnung der Ähn-
lichkeit sind und dementsprechend Gewichtungen vorgenommen werden sollten. Bei-
spielsweise würde ein gleichwertger Einbezug aller Eigenschafen von Kleidungsstücken
auf einer Handelsplatorm kaum nützliche Empfehlungen für Käufer ergeben: Hohe Zu-
sammenhänge bzw. Ähnlichkeitsmaße würden sich typischerweise für die gleichen Pro-
dukte in unterschiedlichen Konfektonsgrößen ergeben. Nützliche Empfehlungen sind je-
doch eher passende oder ergänzende Kleidungsstücke in der gleichen Konfektonsgröße,
beispielsweise das Hemd zur Jeans in der gleichen Konfektonsgröße (siehe auch Ab-
schnit 2.7, S. 28).

Klassifkatonsverfahren
Während die bisher vorgestellten Verfahren versuchen, jedes Element in einem System
miteinander zu vergleichen, versuchen die folgenden Verfahren, Elemente zu gruppie-
ren. Empfohlen werden dann Elemente aus einer Gruppe. In der Regel werden die Grup-
pen mit Trainingsdaten bzw. der aktuellen Version des Korpus unter Einbezug von Exper-
tenwissen gebildet; weitere Elemente werden dann den Gruppen zugeordnet. Das Spek-
trum an multvariaten Verfahren stellt zahlreiche Möglichkeiten und Ansätze zur Verfü-
gung. Im Folgenden möchten wir nur kurz einige Ansätze skizzieren (s. Klahold, 2009,
77f):
| Das Minimum-Descripton-Length-Verfahren verfolgt den Ansatz, dass ein Empfeh-
lungselement immer derjenigen Klasse zugeordnet wird, bei deren erweiterter binär-
codierten Darstellung am wenigsten Speicherplatz benötgt wird. Es basiert also auf
der Annahme, dass das kompakteste Modell optmal ist.
| Der Naive-Bayes-Klassifkator berechnet die bedingte Wahrscheinlichkeit, dass ein
Empfehlungselement einer Klasse zugehörig ist. Es wird dabei von der (naiven) An-
nahme ausgegangen, dass alle Atribute unabhängig voneinander aufreten.
| Beim ID3-Verfahren wird mit Trainingsdaten ein Entscheidungsbaum aufgebaut. Dazu
durchläuf ein Algorithmus die Daten, der jeweils diejenigen Eigenschafen (Vektor-
positonen) auswählt, die den Korpus am deutlichsten teilen. Das kann bei Personen
beispielsweise das Rauchverhalten sein (Raucher bzw. Nichtraucher). Alle Elemente
werden dann in diesem Baum zugeordnet.
| K-Means-Clustering ist das klassische Clustering-Verfahren. Besonderheit beim Clus-
tering ist, dass die Gruppierungen erst im Verfahren entstehen und nicht schon vor-
her bekannt sind. Es werden willkürlich im Vektorenraum Punkte ausgewählt und es
wird geschaut, ob diese brauchbare „Zentren“ für Ansammlungen von Elementen (im
mehrdimensionalen Vektorraum) sind. Dann wird solange iteratv verbessert, bis pas-
sende „Cluster“ entdeckt und ausgewählt sind.

27
Soziale Netzwerkanalyse als alternatver Ansatz für die Ähnlichkeitssuche beim kolla-
boratven Filtern
Neben den oben beschriebenen „klassischen“ Verfahren der Ähnlichkeitsfeststellung
gibt es Versuche, auch die Soziale Netzwerkanalyse als eigenständiges Verfahren für
Empfehlungssysteme fruchtbar zu machen. Typischerweise spannen sich Kontakte und
Kommunikaton wie ein Netz auf: Man kommuniziert mit jemandem, der wiederum mit
anderen kommuniziert. Aus den Sozialwissenschafen gibt es mit der sozialen Netzwerk-
analyse ein Verfahren, das die Vernetzung berechnen und darstellen lässt. Es kann also
auch Nähe berechnet werden. Nun steckt hinter der Verwendung der sozialen Netz-
werkanalyse in Empfehlungssystemen die Absicht, ein alternatves Instrument zur Be-
rechnung von „Nähe“ zu erproben. Es gibt dazu erste Untersuchungen, die dermaßen
generierte Empfehlungen mit herkömmlich generierten Empfehlungen vergleichen und
mit beiden Verfahren ähnliche Ergebnisse erzielen (Kamper, Meyer & Reichart, 2008).

2.7 Ähnlichkeit und weitere Kriterien


Häufg wird das Kriterium der Ähnlichkeit als Grundlage für Empfehlungen gewählt. So
werden beispielsweise in Online-Shops Bücher mit ähnlichen Inhalten angeboten, weil
man davon ausgeht, dass diese für den potenziellen Käufer interessant sind. Es wird da-
von ausgegangen, dass Nutzer mit ähnlichem Profl auch ähnliche Interessen und Ge-
schmack haben, so dass darauf aufauend nützliche Empfehlungen entstehen können.
Allerdings ist das Kriterium der Ähnlichkeit nicht immer hilfreich. So kann es sein, dass
bei der Suche nach einem portugiesischen Restaurant auch andere Restaurants empfoh-
len werden, die ähnlich sind: Wenn diese jedoch in einem weit enternten Ort liegen,
am gesuchten Tag geschlossen haben usw., ist die Ähnlichkeit kein nützliches Kriterium.
Was also „nützlich“ erscheint, muss nicht zwangsläufg „ähnlich“ zu einem bestmmten
Element sein oder auf Ähnlichkeiten mit anderen Benutzern beruhen. Weitere Kriterien
können sein: Räumliche Nähe, Aktualität, Bewertungen, Komplementarität oder auch
Vollständigkeit (siehe auch Abschnit 4.6, S. 71f).

2.8 Nachteile und Herausforderungen der Ansätze


Die beiden vorgestellten Ansätze haben Vorteile, auf die im wesentlichen bereits einge-
gangen wurde. Im folgenden werden kurz Einschränkungen und Herausforderungen der
Verfahren beschrieben.

Einschränkungen und Herausforderungen inhaltsbasierten Filterns


Beim (reinen) inhaltsbasierten Filtern liegen folgende Einschränkungen und Herausfor-
derungen für den Einsatz vor:
| Es müssen bereits zahlreiche Daten über die zu empfehlenden Elemente vorliegen (z.
B. in Form von Metadaten), durch Experten erstellt werden oder automatsch gene-
riert werden. Während letzteres bei Texten, wie dargestellt, noch vergleichsweise
einfach ist, ist es für textarme Materialien wie Videos, Musik und Fotos deutlich
schwerer und stark eingeschränkt.
| Das inhaltsbasierte Filtern vertraut nur auf die Inhalte der Objekte selbst und lässt
Empfehlungen oder Erfahrungen von anderen (ähnlichen) Nutzern ausser Acht.

28
| Die Gewichtung der Eigenschafen von Empfehlungselementen, die bevorzugt bei
Empfehlungen zum Tragen kommen sollen, ist sorgfältg vorzunehmen. So ist es beim
Einkaufen im Online-Modeshop eher sinnvoll, ergänzende und passende Kleidung in
der gleichen Konfektonsgröße empfohlen zu bekommen.
Ein wesentlicher Vorteil der Nutzung vorhandener Daten ist beim inhaltsbasierten Fil-
tern, dass solche Systeme von Anfang an „laufen“ und sinnvolle Empfehlungen geben
können.

Herausforderungen kollaboratven Filterns


Beim inhaltsbasierten Filtern werden folgende Probleme gesehen (s. Klahold, 2009, 66f;
sofern keine andere Quelle genannt):
| Es gibt ein sogenanntes „Kaltstart-Problem“: Wenn eine gewisse kritsche Masse an
Daten nicht vorhanden ist, können keine (sinnvollen) Empfehlungen gegeben wer-
den. Voraussetzung eines solchen Systems ist also, dass es bereits eine aktve Com-
munity und Nutzer bzw. generierte Daten gibt. Daher gibt es Ansätze, wie solche feh-
lenden Daten, beispielsweise für neue Elemente (Neuerscheinungen) vorhergesagt
werden können (s. Givon & Lavrenko, 2009).
| Diese Abhängigkeit von den Aktvitäten der Nutzer ergibt auch die Herausforderung
der „Spärlichkeit“: Benutzerbasierte Metadaten, die von den Benutzern selbst aktv
vergeben wurden (Bewertung, Präferenzen, Empfehlungen), sind of nur spärlich vor-
handen.
| Das Problem der „grauen Schafe“ liegt vor, „wenn ein Benutzer bezüglich seiner Be-
wertungen zwar Profl-Überdeckungen mit anderen Benutzern hat, diese aber in Sa-
chen Bewertung so stark variieren, dass keine 'verwandten' Benutzer selektert wer-
den können“ (Klahold, 2009, 150)
Weitere Herausforderungen beziehen sich weniger auf die Datenlücken als auf die Be-
sonderheiten kollaboratver Empfehlungen:
| Der „Lemming-Efekt“ bezieht sich auf das Phänomen, dass Empfehlungen zu Selbst-
läufern werden. Empfohlene Elemente werden häufg betrachtet oder gekauf. Da-
durch wird die Relevanz „künstlich“ erhöht. Potenzielle Bestseller bei Amazon, bei-
spielsweise von populären Krimiautoren, tauchen auf einmal in vielen Einkaufslisten
auf; werden folglich in vielen Buchbeschreibungen als Kaufempfehlung gelistet, ob-
wohl sachlich kein Zusammenhang besteht und sie bekommen dadurch eine erhöhte
Aufmerksamkeit. Sprichwörtlich „wie die Lemminge“ kaufen Amazonkunden dann
auf einmal ein Buch, nach dem sie ursprünglich gar nicht gesucht haben.
| Wenn sich ein System nur auf die Nutzergemeinschaf „verlässt“ kann dies auch dazu
führen, dass andere relevante, bzw. neue Empfehlungselemente nur schwer aufge-
nommen werden, da alle mit den bereits vorhandenen Empfehlungen „eingedeckt
sind“. Hier läuf das System bzw. ihre Nutzer in die Gefahr eines Tunnelblicks (Kla-
hold, 2009, 118). Um solche Efekte vorzubeugen, empfehlt es sich zufällige „Emp-
fehlungen“ zu geben.
Aus Nutzersicht können sich weitere Schwächen ergeben. So kann es sein, dass bei-
spielsweise Nutzerprofle relatv früh (bei der Registrierung) festgelegt werden und Ver-
änderungen im Profl nicht unbedingt wahrgenommen werden müssen.

29
2.9 Hybride Lösungen
Eine Lösung, mit den Vor- und Nachteilen der beiden Ansätze des kollaboratven sowie
des inhaltsbasierten Filterns umzugehen, ist die Kombinaton beider Verfahren. Tatsäch-
lich wird dies inzwischen auch in vielen, wenn nicht sogar den meisten Empfehlungssys-
temen im Web in dieser Weise realisiert. Bei einigen Systeme können sich Nutzer gegen-
seitg „persönliche Empfehlungen“ schicken.

Pfadbasierte Empfehlungen
Ausgehend von der Erfahrung, dass viele die gleichen Wege nutzen um durch das Web
zu navigieren, wurde das sogenannte pfadbasierte Verfahren (Engl. trail based) für Emp-
fehlungen entwickelt (u.a. Gams & Reich, 2004). Dazu wurde ein Konzept entwickelt, wie
solche Pfade im Web beschrieben werden können, wie Ähnlichkeiten der Pfade berech-
net werden können und wie Benutzer mit ähnlichen Spuren gefunden werden können
(Gams, 2005). Auf Grundlage dieser Fußspuren von Gleichgesinnten und -interessierten
sollen dann Empfehlungen für die weitere Navigaton gegeben werden. Der Ansatz wur-
de also für die Informatonsrecherche im Web vorgeschlagen und entwickelt. Bei Gams
(2005) wurden im Experiment drei Szenarien durchgespielt und zwar jeweils mit und
ohne Unterstützung durch den Empfehlungsservice. Dabei galt es vier Rechercheaufga-
ben zu erledigen, u.a. mussten Projektpläne von vier Projekten gefunden werden, die
mit Miteln der Europäischen Kommission ko-fnanziert wurden. Das System erhielt hier
erwartungsgemäß positve Werte.

Tabelle 7, 8: Durchschnitliche Zahl der Schrite und Zeiten für die Erledigung von 4 Aufgaben
mit und ohne pfadbasierten Empfehlungen (n=14)
Quelle: Gams, 2005, Tabellen 7.4 und 7.5, 152

Ontologiebasierte Ansätze
Ontologiebasierte Ansätze verwendet weder inhaltsbasiertes noch kollaboratves Filtern
wie oben beschrieben. Dieser Ansatz beruht im wesentlichen darauf, dass Ontologien
verwendet werden. Mit ihrer Hilfe werden in diesem Fall auf fehlende Informatonen zu
dem Nutzer geschlossen. Dadurch wird vermieden, dass die Nutzer z. B. fehlende Anga-
ben in Fragebögen ergänzen müssen bzw. trotz lückenhafer Profle Empfehlungen gege-
ben werden können. Ontologien sind eine Technologie, welche es erlaubt, reichhaltge
Beziehungen auch für Computer berechenbar zu defnieren. Ontologien sind also kom-
plexe Systeme der Datenbeschreibung, die von Experten entwickelt werden und Wis-
sensbestände beschreiben. Mit ihnen lassen sich hierarchische Gliederungssysteme von
Wissen (Taxonomien, z. B. Artenbeschreibungen in der Biologie), aber auch komplexe
Angaben über die Relatonen von Wissen in einer Form darstellen, dass auch Computer
diese verarbeiten können (vgl. Schafert u.a., 2009).

30
Schickel-Zuber (2007, 12) schließt bei den Einsatzmöglichkeiten die Finanzbranche, den
Gaming- und den Gesundheitssektor aus. Dort würde er eher regelbasierte Ansätze ver-
wenden. Für die von ihm untersuchten Anwendungsbereiche des Online-Handels mit
umfangreichen Produktkatalogen hat er seinen Ansatz mit anderen Verfahren verglichen
und gute Ergebnisse erhalten. Dabei zeigt sich u.a., dass der ontologiebasierte Ansatz
v.a. im Bezug auf die Neuartgkeit der Empfehlungen sehr gute Werte erhält (S. 130). Die
Ausarbeitungen von Schickel-Zuber (2007) wurden patentert und werden unter der Be-
zeichnung „Prediggo Technologie“2 stark beworben.

Tag-basierte Empfehlungen
In traditonellen Medienarchiven werden Materialien zu Kategorien und Unterkategori-
en zugeordnet, welche häufg auch zusätzliche Kurzbeschreibungen und Schlagworte
beinhalten. Im Web hat sich ein Verfahren etabliert, das Nutzern ermöglicht, Webseiten
oder andere Ressourcen (Bilder, Videos, Musikstücke) mit eigenen Schlagworten zu mar-
kieren, sie zu „taggen“ (von Engl. „tag“: Etket). Mit Hilfe der Tags können andere ent-
sprechende Ressourcen recherchieren; schnell haben sich populäre Webdienste entwi-
ckelt (vgl. Schafert, Hilzensauer & Wieden-Bischof, 2009). Während die Erzeugung von
traditonellen Metadaten eher einem ausgewählten Benutzerkreis vorbehalten ist, sind
beim Social Tagging potenziell alle Benutzer beteiligt (Derntl et al., 2009). Es ist also
„eine ofene, efziente Möglichkeit der Klassifkaton von Dokumenten“, weil „eine brei-
te Palete von unterschiedlichen Termen für die Beschreibung eines Dokuments bereit-
gestellt wird“ (Güntner, Sint & Westenthaler, 2009, 192).
Tags werden als gute Datenbasis für Empfehlungen gesehen, da anzunehmen ist, dass
Beiträge und Objekte ähnlich sind, wenn sie mit den identschen Tags versehen werden.
Beispielsweise wird dieser Ansatz bei Librarything.com (2006) eingesetzt.
Im Forschungsprojekt KiWi3 wird mit diesem Ansatz versucht, die Vorschläge für andere
Wiki-Inhalte zu verbessern und auch semantsche Empfehlungen einzubauen, die auf
den Tags der Nutzer des semantschen Wikis basieren (vgl. Dolog, 2009). Wir haben
dazu Peter Dolog als zuständigen Experten Fragen gestellt.

2
htp://www.prediggo.com, Stand 12/2009
3
htp://www.kiwi-project.eu, Stand 02/2010

31
Interview mit Peter Dolog zu tagbasierten Empfehlungen

? Social Tagging ist sehr populär. Warum ist es aus Ihrer Sicht hilfreich, auf Grundlage
von nutzergenierten Schlagworten Empfehlungen zu geben?

! Da gibt es zwei Aspekte des Social Tagging: den persönlichen Aspekt (eigene Tags)
sowie den sozialen Aspekt, nämlich Tags von Personen in der Community, mit denen
man in Beziehung steht. In beiden Fällen repräsenteren Tags Interesse, persönlicher
oder gemeinschaflicher Art. Wenn daher die Tags gut kombiniert werden, kann das
helfen, neue Entwicklungen, Informatonen, Diskussionen und so weiter zu fnden und aufzuzeigen.

? Tags sind manchmal nur persönliche Aufgabenbeschreibungen wie "erledigen". Wie gehen Sie mit sol-
chen Tags um, die ofensichtlich für andere keinen Sinn machen?

! Es gibt immer einen Weg der Normalisierung. Einige Tags können einfach bei der Berechnung von
Empfehlungen ausgeschlossen werden, wenn sie keinen Sinn machen. Das ist jedoch domänenabhängig
und benötgt Konfguratonen. Aber auch "Erledigen"-Tags sind wichtg, weil sie aktuelle Aufgaben re-
präsenteren, die von anderen genutzt werden können, weil sie Hinweise darauf geben, für was die Res-
source nützlich sein könnte. Auch diese Tags könnten also hilfreich sein, um Ressourcen zu empfehlen,
aber dies hängt vom Kontext ab.

? Was empfehlen Sie Entwicklern, die über ein tag-basiertes Empfehlungssystem nachdenken?

! Sie sollten die Tags mit zusätzlichen Informatonen verknüpfen, um sie für Empfehlungen nützlich zu
machen.

Dr. Peter Dolog ist Professor für „Intelligent Web and Informaton Systems“ am Computer Science De-
partment der Universität Aalborg in Dänemark. Er forscht dort zu tag-basierten Empfehlungssystemen.
Ein vollständiges Profl fndet sich auf seiner Homepage htp://www.cs.aau.dk/~dolog/ (12/2010)

32
Beispiele für hybride Empfehlungssysteme
Eine Übersicht über Beispiele für solche hybriden Lösungen fndet sich in Klahold (2009):

Name Emp.- Kurzbeschrei- Eigenschafsanalyse Proflbildung Distanzmaß Literatur


ele- bung
ment

Fab Web- Einzelne Analyse TF-IDF-Derivat Erstellung und Vergleich von Cosinus-Ähnlich- Balabano-
seiten zwischen Doku- Benutzerproflen (Verhalten keitsmaß, Nearest vic u.a.
menten und Be- und Bewertungen) Neighbours Verfah- (1997)
nutzern Empfehlungen auf Basis der ren
Ähnlichkeit von Benutzern

PHOAKS Web- Nach News- Manuelle Metadaten, Manuelle Erstellung des Pro- Cosinus-Ähnlich- Terveen,
(People Help seiten groups gruppier- Heuristk, TF-IDF-Deri- fls durch Auswahl der News- keitsmaß, Nearest Hill, Amen-
One another te Empfehlungen vat group Neighbours Verfah- to, Mc Do-
Know Stuf) relevanter Web- ren nald & Cre-
seiten ter (1997)

Let's Browse Web- Webseiten (Sub- TF-IDF-Derivat Analyse einer „Start-Websei- Cosinus-Ähnlich- Lieberman,
seiten seiten, Links) te“ (einfaches explizites keitsmaß Van Dyke &
werden empfoh- Strukturprofl) sowie Verfol- Vivacqua
len gung der Links (1999)

CASMIR Doku- Empfehlung von TF-IDF-Derivat Erstellung eines Profls durch Cosinus-Ähnlich- Klahold
mente Dokumenten die Gewichtung von Wort- keitsmaß (2009)
nach Relevanz vektoren (Interesse)

LaboUr Web- Auf Basis des TF-IDF-Derivat Generierung eines Benutzer- Naiven Bayes Klas- Pohl & Nick
(Learning seiten Profls werden profls aus dem impliziten sifkator (NBK), (1999)
about the verwandte Be- Verhalten Pearson Korrelat-
User) nutzer gesucht onskoefzienten
(PC)

Tango Artkel Noch nicht gele- Manuelle Metadaten, Manuelle Pfege (Kategorien, Overlap Koefzient Claypool
sene Artkel wer- TF-IDF-Derivat, Schlüsselworte) (OK), Pearson Kor- u.a. (1999)
den empfohlen Bewertung von Artkel relatonskoefzein-
auf einer Skala von 1- ten (PC)
10

Nakif Filme Filme werden TF-IDF-Derivat Manuelle Pfege: Benutzer Heuristk Klahold
empfohlen sowie die Empfehlungsele- (2009)
mente (z. B. Filme) haben ei-
gene Profle; Kombinaton
von Wertungsspalten

MovieLens Filme Filme werden DoppelgaengerBots Bewertung von Filmen auf ei- Heuristk, Pearson Good,
empfohlen (TF-IDF-Derivat) ana- ner Skala von 1-5 Korrelatonskoef- Schafer,
lysieren die Filmbe- zienten (PC), Cosi- Konstan &
schreibung nus-Ähnlichkeits- Borchers
RipperBots – iterat- maß (1999)
ven Regelerzeugung
GenreBots bewerten
Filme in Abhängigkeit
des Genres

Tabelle 9: Übersicht über ausgewählte hybride Empfehlungssysteme


Quelle: Klahold, 2009, 144f

33
34
3 EMPFEHLUNGSSYSTEME: AUSGEWÄHLTE EINSATZGEBIETE
Überall dort, wo mit pffgen Ideen und guten Lösungen Geld verdient werden kann, ist
es schwierig, konkrete Aussagen über technologische Lösungen zu bekommen. Dies
trift nach unseren Erfahrungen insbesondere auf Empfehlungssysteme zu: Gute Lösun-
gen für Empfehlungssysteme lassen sich in der Regel mit geringen Adaptonen an meh-
rere Kunden aus unterschiedlichen Branchen verkaufen. Dabei gibt es jedoch keine Ver-
lautbarungen dazu, welche Systeme, die zum Teil in der wissenschaflichen Literatur be-
schrieben werden, bei Firmen eingesetzt werden. Hinzu kommt wohl auch, dass die ex-
akten Vorgänge und Algorithmen of schwer zu beschreiben sind.

Abbildung 7: Ausschnit aus der SonntagsZeitung zu einem Artkel über Gavin Poter,
Entwickler eines Empfehlungssystem
Quelle: SonntagsZeitung, 13. Juli 2008, 81

Auf alle Fälle haten wir bei den folgenden Beschreibungen von Realisierungen der Emp-
fehlungssysteme das Problem, dass es in der Regel nur unzureichende Beschreibungen
der konkreten Lösung frei verfügbar gibt. Was da genau passiert, wird of mit einem
Halbsatz abgehandelt, nach dem Moto „and the magic occurs“, oder es werden andere
esoterische Bezüge gegeben (siehe Auszug der SonntagsZeitung in Abbildung 7).

3.1 Überblick über fünf ausgewählte Einsatzgebiete


Im Folgenden haben wir uns fünf Einsatzgebiete, in denen Reputatonssysteme zur Erfül-
lung von unterschiedlichen Zwecken eingesetzt werden können, genauer angeschaut.
Die Einsatzgebiete wurde gezielt so ausgewählt, dass eine möglichst weite Spanne abge-
deckt und viele verschiedene Varianten vorgestellt werden können.

35
Einsatzgebiet Experten- und Ar- Partnersuche Produkte und Web-Materialien Prozess-
beitsplatzsuche Dienstleistungen empfehlungen

Absicht Arbeitsstellen bzw. Finden von Lebens- Unterstützung bei Empfehlungen für diverse (u.a. Arznei-
Experten mit größt- partnern der Entscheidung für kostenlos zugängli- verschreibung, Unter-
möglicher Passung Produkte und che Materialien stützung Lernender,
zu fnden Dienstleistungen Fernsehprodukton)

Verfahren Suchanfragen und Eingangsbefragung, Alle bekannten Emp- of tagbasierte Emp- Inhaltsbasierte und
Ergebnisse aufgrund Partnervorschläge fehlungsverfahren fehlungen und kolla- kollaboratve Ansätze
eigenschafsbasier- aufgrund paarpsy- sind im Einsatz boratves Filtern
ter Verfahren; aber chologischer Er-
auch Inhalts- und kenntnisse, eigen-
Netzwerkanalysen schafsbasierte, teils
fallbasierte Verfah-
ren

Visualisierung Ranglisten (v.a. Su- Ranglisten mit Fo- u.a. Treferlisten für Markierung im Text, Treferlisten, Vor-
chergebnisse) tos, teils inkl. „Mat- Empfehlungen am Ranglisten schläge, auch Signal-
ching-Punkte“, auch Seitenrand, Ranglis- ton (Alarm!)
Benachrichtung per ten, E-Mail-Benach-
E-Mail richtgung

Anmerkung Gewichtung der Ei- Partnervorschläge Online-Händler für - Einige der Beispiele
genschafen (z. B. nach Passung der Ei- Bestseller verwen- sind nicht webbasiert
räumliche Nähe) z. T. genschafen, auf- den eher kollabort-
notwendig grund persönlich- ves Filtern, Nischen-
keitspsychologischer händler und Spezia-
Untersuchungen listen eher inhalts-
basiertes Filtern

Beispiele Virtueller Arbeits- Parship, Friens- Amazon, Zappas, Photoree, fwd, Re- ALOE, LIVE u.a.
markt, Manager cout24, Elitepartner Last.fm, Library- Mashed u.a.
Lounge, Biomedex- Things, Preiser Re-
perts cords, Pandora, Mo-
vielens u.a.

Tabelle 10: Charakteristk der Empfehlungssysteme in ausgewählten Einsatzgebieten

Im folgenden stellen wir die einzelnen Bereiche und Beispiele vor, soweit wir dazu Infor-
matonen gefunden haben.

3.2 Experten- und Arbeitsplatzsuche im Web


Während es nicht weiter schlimm ist, mal eine Filmempfehlungen zu erhalten, die nicht
ganz den eigenen Geschmack trift, sind Fehlgrife bei der Personalauswahl deutlich ver-
heerender. Nicht zuletzt daher wird hier versucht, „fehlerhafe“ Empfehlungen weitest-
gehend zu vermeiden. Ofensichtliche Vorteile bieten Online-Jobbörsen, Business-Clubs
und Karriere- oder Expertenplatormen daher nicht nur für Unternehmen, sondern
auch für Arbeitssuchende selbst.
Im folgenden stellen wir Empfehlungssysteme für die Arbeitsplatz- und Expertensuche
vor. Wie sich zeigt, arbeiten diese, soweit wir dies von aussen beurteilen können, fast
alle mit einem eigenschafsbasierten Ansatz, d.h. Empfehlungen werden aufgrund des
Nutzerprofls bzw. der Sucheingaben gegeben. Bei der vorgestellten Expertensuche im
biomedizinischen Bereich wird neben semantsch unterstützten Auswertungen der Ver-
öfentlichungen als Grundlage eine soziale Netzwerksanalyse verwendet. Schließlich
stellen wir kurz das Modell eines Empfehlungsservices für Arbeitnehmer vor, der auf kol-
laboratvem Filtern, nämlich Angaben von Arbeitgebern, beruhen soll.

36
Virtueller Arbeitsmarkt der deutschen Arbeitsagenturen
Am „Virtuellen Arbeitsmarkt“, der Stellen- und Bewerberbörse der deutschen Bundesan-
stalt für Arbeit, werden Arbeitssuchenden Stellenvorschläge gemacht. Als Arbeitssu-
chender kann man in der Detailsuche bis zu 15 Kriterien angeben, beispielsweise Regi-
on, PLZ, Mindestgehalt. Im System können sich auch Arbeitgeber Stellensuchende vor-
schlagen lassen, dabei sind u.a. auch persönliche und soziale Fähigkeiten auswählbar.
Diese Informatonen beruhen auf den Selbstauskünfen der Stellensuchenden.
Zwar unterliegen die genauen verwendeten Empfehlungsverfahren der Geheimhaltung,
es ist aber bekannt, dass die Sofware ELISE 5.0 von der Firma WCC eingesetzt wird, die
auch beim englischen Arbeitsmarktservice, dem „Job Center Plus“ verwendet wird (vgl.
Heymann, 2004, 14). Daher werden wird uns im folgenden darauf beschränken müssen,
die Funktonalitäten zu beschreiben. Ofensichtlich wird im System jedoch kein kollabo-
ratves Filtern eingesetzt, weil keine entsprechenden Daten erfragt werden (z. B. Bewer-
tungen von Arbeitgebern oder Arbeitssuchenden).
In einer Seminararbeit weisst Heymann darauf hin, dass das System Schwierigkeiten hat,
die korrekte Semantk zu erkennen: „So erhält man bei der Suche nach einem „Astro-
nom“ eine 100%ige Trefergenauigkeit für einen „Gastronom“. Gibt man die im Arbeits-
leben synonymen Begrife „Logopäde“, „Sprachtherapeut“ und „Sprachheilpädagoge“ an
(…), so werden nur Trefer mit der exakten Berufsbezeichnung geliefert“ (Heymann,
2004, 15). Ein Test hat ergeben, dass auch heute bei der Suche nach dem Beruf „Astro-
nom“ auch diverse Gastronomie-Berufe vorgeschlagen werden und Stellensuchende un-
bedingt alle synonym verwendeten Berufsbezeichnungen verwenden sollten, um alle
Stellenanzeigen zu sehen: Weiterhin erhält man bei der Suche nach „Logopäde“ nicht
auch automatsch alle Anzeigen für „Sprachtherapeut“ oder „Sprachheilpädagoge“4. Da
im Formular angekreuzt werden kann „Keine Stellenangebote mit ähnlichen Berufen an-
zeigen“ geht ein Stellensucher höchstwahrscheinlich (und irrtümlich) davon aus, ver-
wandte Stellen angezeigt zu bekommen. Heymann (2004) fasst zusammen, und auf-
grund des von uns gewonnen Eindruck bestätgen wir diesen Eindruck, „dass das Ge-
samtsystem derzeit noch nicht die Leistung bietet, die a) von der Bundesagentur ange-
strebt wird und b) den Anwendern des Systems den Eindruck vermitelt, ein kompe-
tentes Empfehlungssystem zu sein“ (S. 16).

Die Jobbörse Manager-Lounge


Manager-Lounge5 ist eine internetbasierte Jobbörse, die sich auf die Vermitlung von
Top-Management-Positonen ab einem Jahresgehalt von 100.000 Euro spezialisiert hat
und dabei wie ein Businessclub agiert. Die streng defnierten Aufnahmebedingungen (z.
B. mehrjährige Personal-, Budget- und Führungsverantwortung) sollen Exklusivität ga-
ranteren. Derzeit gibt es einen geschlossenen Mitgliederkreis von über 2.200 Personen,
die sich auch auf regelmäßig statindenden lokalen Versammlungen trefen. Erst nach
einer erfolgreichen Testphase (z. B. Coaching- und Aufnahme-Telefonat, Einhaltung der
Clubregeln, Engagement) wird das Mitglied in den kostenpfichtgen Club aufgenommen.
Die Daten für das Profl des Bewerbers werden nach und nach manuell von Manager-
Lounge selbst in den sogenannten MatchManager übertragen und stellen die Basis für
den Vermitlungsprozess dar. Die Erhebung der Daten erfolgt dabei durch ein elektroni-
sches oder schrifliches Antragsformular, das von dem Bewerber mit den wichtgsten

4
Diese Überprüfung wurde am 23.1.2010 vorgenommen.
5
htps://manager-lounge.manager-magazin.de, Stand 02/2010

37
Daten (z. B. Kontakt, Alter, derzeitge Stelle) ausgefüllt werden muss, sowie ein telefoni-
sches Coaching- und Aufnahmegespräch, in dem die Angaben des Antragstellers über-
prüf sowie ein Lebenslauf und Fähigkeitenprofl erstellt werden.
Unternehmen, die nach Bewerbern in der Manager-Lounge suchen, geben ein Suchpro-
fl in den sogenannten Match-Manager ein. Dieses wird mit den in der Datenbank vor-
handenen Proflen abgeglichen. Als Abfragekriterium sind auch Und- und Oder-Verknüp-
fungen möglich. Das Suchprofl umfasst sieben Kategorien, wie beispielsweise Positon,
Funkton, Branche und Alter. Als Ergebnis werden anonymisierte Mitglieder angezeigt,
die den Auswahlkriterien entsprechen. Hat das Unternehmen Interesse an einem be-
stmmten Person gefunden, dann kann es mit dem Kandidaten in Kontakt treten. Dem
Angeschriebenen steht es dann auch frei, seine Anonymität aufzuheben und seinen Le-
benslauf zur Ansicht freizugeben (Heymann, 2004, 17f).

Biomedexperts
Strukturiertes Wissen und ein vielseitges Netzwerk sind wichtge Voraussetzungen für
die wissenschafliche Zusammenarbeit. Biomedexperts6 ist ein soziales Netzwerk, das
Forscher und Experten im Anwendungsfeld der Biowissenschafen sowie Mediziner und
Fachjournalisten zusammenbringt, um einen länderübergreifenden wissenschaflichen
Austausch sowie ein gemeinsames Arbeiten zu ermöglichen und zu verbessern. Die für
Mitglieder kostenlose Platorm wurde 2008 von Collexis7 ins Leben gerufen. Seitdem
sind über 270.000 Biowissenschafler dem Netzwerk beigetreten. Nachdem sich der
Nutzer angemeldet hat und sein Fachgebiet angegeben hat, liefert ihm das System Ex-
perten aus dem Sachgebiet auf der Basis der Häufgkeit von wissenschaflichen Publika-
tonen. Biomedexpert wertet dazu kontnuierlich Publikatonen aus dem Fachgebiet aus
und generiert und ergänzt so automatsch Profle der Mitglieder. Biomedexperts schaft
es auf diesem Weg weltweit fast alle Forscher im Bereich der Biowissenschafen, die in
den letzten zehn Jahren publiziert haben, in das Netzwerk einzubeziehen, sämtliche re-
levanten professionellen Verbindungen innerhalb des Netzwerks zu analysieren und
neue mögliche Forschungspartner, Mitautoren, usw. ausfndig zu machen. Mitglieder
können im System nach Name, Land oder Schlüsselwörter (z. B. Krankheiten, Sympto-
me) suchen und so ihr eigenes Netzwerk aufauen, welches auch die Koautoren von Ko-
autoren umfasst. Wie bei sozialen Netzwerken üblich, können neue Kollegen eingeladen
werden und Mitglieder dem eigenen Netzwerk hinzufügen. Auch ist ein detailliertes wis-
senschafliches Profl mit den Publikatonen des Mitglieds, deren Relevanz sowie der Pu-
blikatonshäufgkeit im Verlauf der Jahre einzusehen. Eine geographische Darstellung
zeigt in welchen Ländern der jeweilige Experte vernetzt ist (Herzog & Dix, 2009).
Durch die sogenannte „Fingerprint-Technologie“ (Engl. für „Fingerabdruck“), die hinter
dem System von Biomedexperts steckt, werden mehrdeutge oder irrelevante Ergebnis-
se automatsch eliminiert. Dies ist durch eine semantsche Analyse von Textdokumen-
ten, durch die interne und externe Dokumente analysiert, aggregiert und semantsch
verknüpf werden können, möglich. „Die semantsche Analyse erfolgt auf der Basis eines
oder mehrerer Thesauri. Bei der Indexierung eines Textes wird jeder Begrif des Doku-
mentes mit den eingebundenen Fachthesauri verglichen. Taucht ein Begrif sowohl im
Text als auch im Thesaurus auf, wird er in dem sogenannten Fingerprint des Dokuments
gespeichert. Für jeden Begrif des Fingerprints wird nun mitels komplexer Algorithmen
die Relevanz im Kontext des verarbeitenden Textes ermitelt. So wird eine gewichtete In-

6
htp://www.biomedexperts.com, Stand 02/2009
7
htp://www.collexis.com, Stand 02/2010

38
dizierung durchgeführt, die als Ergebnis eine inhaltliche Repräsentaton des Ausgangs-
textes bereitstellt. Diese Konzeptzuordnung schließt Mehrdeutgkeiten und mangelnde
Priorisierung aus, die bei Stchwortsuchen aufreten“ (Herzog & Dix, 2009).

Abbildung 8: Empfehlung von Experten auf Basis der Autorschaf und Themen
in wissenschaflichen Publikatonen
Quelle: htp://www.biomedexperts.com (02/2010)
Bei Biomedexpert wird die Suche nach Experten also durch eine Kombinaton von In-
haltsanalysen der verknüpfen Veröfentlichungen sowie von Netzwerkanalysen der Au-
torenschaf erleichtert.

Konzept für ein Arbeitnehmerempfehlungsservice


Färber u.a. entwerfen ein Modell zur Empfehlung von Arbeitnehmer aufgrund der Ein-
schätzungen von Personalmanagern, das daimit auf kollaboratvem Filtern beruht. Als
Eigenschafen für die Arbeitnehmer werden dazu direkt erfassbare Kriterien (Alter, Ge-
haltsvorstellungen) als auch Einschätzungen zur Führungsqualität gegeben. Dazu wur-
den auch standardisierte Verfahren und Hilfsmitel eingesetzt (Färber, Weitzel, Keim &
Wendt, 2002; s. Heymann, 2004).

3.3 Partnersuche im Web


Freundschafen und Partnerschafen werden immer häufger im Web geknüpf. Immer
mehr Services versuchen, das Zusammenfnden von potenziellen Freunden und Part-
nern zu erleichtern. Schon im Frühjahr 2003 haben acht Prozent der Internetnutzer an-
gegeben, ihren aktuellen Lebenspartner im Netz gefunden zu haben (TNS EMNID, 2003).
Die Suche nach potenziellen Partnern erfolgt dabei in Chatoren der Region, oder auch
mithilfe von professionellen Paaragenturen.
Doch nach welchen Kriterien werden Partnervorschläge gegeben? Hier spielen zum
einen grundsätzliches Überlegungen, ob jemand (Nicht-) Raucher ist, oder ob Kinder
vorhanden sind und auch die Region, in der jemand lebt, eine Rolle. Zieht man auch Per-
sönlichkeitsmerkmale in Betracht, ist nicht mehr so eindeutg, welche Personen empfoh-
len werden sollten: Sollten die potenziellen Paare besonders viele gemeinsamen Inter-

39
essen haben? Sollten Sie möglichst ähnlich in Ihrem Verhalten und Werten sein, z. B. im
Grad ihrer Impulsivität, Introvertertheit oder Risikofreudigkeit?
Volksweisheiten sind hier nicht hilfreich; so sprechen sie zum einen davon, dass sich
„Gleich und Gleich gerne gesellt“, zum anderen davon, dass sich „Gegensätze anziehen“.
Allerdings gibt es zahlreiche Studien, die sich genau mit dieser Thematk auseinander-
setzen. In einer amerikanischen Untersuchung von über 1.000 Personen zwischen 18
und 24 Jahren kamen die Verhaltensforscher Buston und Emlen (2003) zu dem Ergebnis,
dass die Partnerwahl auf Ähnlichkeiten abzielt. Männer wie auch Frauen suchen nach
Partnern mit ähnlichen Qualitäten (z. B. Interessen, gemeinsame Werte, ähnliche famili-
äre Herkunf), da diese eine größere Stabilität versprechen. Auch die Mannheimer Psy-
chologin Beatrice Rammstedt vom Gesis-Leipniz-Insttut für Sozialwissenschafen und
ihr Berliner Kollege Jürgen Schupp vom Deutschen Insttut für Wirtschafsförderung ka-
men zu dem Ergebnis, dass sich Gleich und Gleich gern gesellt, als sie nahezu 7.000 Paa-
re befragten. Zumindest auf längere Sicht kommen Partner besser miteinander aus, bei
denen in den drei Dimensionen Verträglichkeit, Gewissenhafigkeit und Ofenheit eine
Ähnlichkeit vorherrscht (Stüvel, 2009).
Die Studien der Psychologie zeigen jedoch auch, dass Ähnlichkeit hier – anders als in an-
deren Gebieten der Empfehlungssysteme – unter Umständen nicht das beste Kriterium
ist: Beim Kennenlernen und auch im Bezug auf die Beständigkeit einer Partnerschaf
zeigt sich, dass Persönlichkeitsprofle gut miteinander harmonieren sollten, was aber
nicht mit einer Kongruenz der Profle zu verwechseln ist. Partner- und Freundschafsver-
mitlung sind immer dann besonders glücklich und erfolgreich, wenn die Personen pas-
sende Lebensstle, gemeinsame Wertvorstellungen, Interessen und Ziele haben (Klam-
bauer, 2008); das bedeutet jedoch nicht, dass sie sich im hohen Grade übereinstmmen-
de Eigenschafsprofle haben müssen.

Friendscout24
Friendscout248 wurde 1999 gegründet und verfügt mitlerweile über rund zehn Millio-
nen Mitgliederprofle in ganz Europa. Nutzer können sich kostenlos mit einem Pseud-
onym registrieren und in ihrem persönlichen Profl beschreiben. Seit 2009 setzt Friends-
cout24 einen Fragebogen ein, der neben Fragen über die eigene Person (Geburtsdatum,
Beruf, Aussehen) auch Fragen zum Aussehen des Wunschpartners, Beziehungsvorstel-
lungen, Sternzeichen oder Lieblingsliteratur stellt. Die Partnersuche kann entweder über
die Schnellsuche (Abfrage von Geschlecht, Alter, Postleitzahl, Land) oder über eine de-
taillierte Suchmaske statinden und dann beispielsweise auch Aussehen, Bildung, Fami-
lienstand und Lebensstl berücksichtgen.
Das System ist also ein rein inhaltsbasiertes System, bei dem aus der Gesamtmenge an
Mitgliedern die passenden bzw. passendsten Partner gefltert werden. Die Partnermat-
ching-Funkton wird anhand eines Kompatbilitäts-Tests durchgeführt, der das Ausmaß
der Übereinstmmung zwischen zwei Personen misst. Je höher die Ausprägung des ICI
(Interpersonal Compatbility Indicator) ist, desto besser passen zwei Personen zusam-
men. Nach Angaben von Friendscout24 waren Experten der Universität Bucknell (USA)
bei der Entwicklung des Systems beteiligt (Friendscout24, 2002).

8
htp://www.friendscout24.de, Stand 01/2010

40
Parship
Der Service Parship.de ist Marktührer im deutschsprachigen Raum. In seiner Datenbank
sind derzeit rund 5.500.000 Partnersuchende registriert, davon sind 49 Prozent männ-
lich und 51 Prozent weiblich (Stand01/20109). Nach der Registrierung legen Nutzer ihr
Online-Profl bei Parship10 an und füllen einen Persönlichkeitstest mit 80 Fragen aus. Par-
ship erstellt daraus ein Profl partnerschafsrelevanter Persönlichkeitsmerkmale und
wertet 24 wesentliche Charaktereigenschafen aus (nach dem „Parship-Prinzip“). Basie-
rend darauf werden anonymisierte Partnervorschläge gegeben, die am besten zu dem
Nutzer passen. Aktve Mitglieder, die sich häufg einloggen, werden dabei bevorzugt vor-
geschlagen. Ein mit der Universität Hamburg entwickelter Algorithmus, unter der Lei-
tung von Prof. Dr. Hugo Schmale, berechnet wie gut einzelne Mitglieder auf welchen Ge-
bieten zusammenpassen und durch welche Eigenschafen sie sich gut ergänzen. Welche
Muss-Kriterien (Alter, Größe) der passende Partner tatsächlich haben soll, kann vom
Mitglied selbst defniert werden. Die Vorschläge sind nach dem Grad der Übereinstm-
mung (max. 100 Punkte) sortert.

ElitePartner
ElitePartner11 hat rund 2 Millionen Mitglieder, davon 53 Prozent Frauen und 47 Prozent
Männer. Nach der Anmeldung bei ElitePartner durchlaufen Nutzer einen dynamischen
Persönlichkeitstest, welcher von Wissenschaflern unter der Leitung des Diplom-Psycho-
logen Volker Drewes entwickelt wurde und davon ausgeht, das Menschen sich verän-
dern und gemeinsam entwickeln. Basierend auf Erkenntnissen der Beziehungsforschung
werden im Test Persönlichkeitsmerkmale, die für eine glückliche Partnerschaf relevant
sind (z. B. Nähe und Distanz), soziale Kompetenzen, Interessen und Handlungsmotve
(z. B. Anerkennung, Unabhängigkeit, Romantk) analysiert. Mit Hilfe des Algorithmus
werden die Antworten im Persönlichkeitstest mit denen der anderen Mitgliederprofle
verglichen und passende Partnervorschläge herausgefltert. Die Passung wird in Form
von „Matching-Punkten“ ausgedrückt. Der Matching-Algorithmus kombiniert Elemente
aus verschiedenen paarpsychologischen Tests miteinander. Die vorgeschlagenen Partner
können vom Nutzer mit „+“, „o“ oder „-“ bewertet werden, wodurch die Auswahl quali-
tatv hochwertger und genauer wird, das System lernt dabei mit (ElitePartner, 201012).
Diese dynamische Anpassung an eventuell konkreter werdende Partnervorstellungen,
also der Einsatz fallbasierter Empfehlungen, scheint ein Alleinstellungsmerkmal dieses
Verfahrens zu sein.

9
htp://www.singleboersen-vergleich.de/analysen/parship.htm, Stand 01/2009
10
htp://www.parship.de, Stand 02/2010
11
htp://www.elitepartner.de, Stand 02/2010
12
htps://www.elitepartner.de/km/service/matching/persoenlichkeitstest_details.html,
Stand 01/2010

41
Abbildung 9: Partner-Matching auf ElitePartner
Quelle: htp://www.datngservices.at/2009/08/elitepartner (02/2010)

3.4 Produktempfehlungen
Das Angebot an Produkten und Dienstleistungen, die im Web zu kaufen sind, ist riesig.
Empfehlungssysteme bieten Käufern Recherche- und Kaufunterstützung. Während man
sich früher zum Beispiel im Musikladen auf die Empfehlungen der Verkäufer verlassen
musste bzw. sich an den vorhandenen Schallplaten und CDs orienteren musste, fnden
sich jetzt im Internet die Angaben zu tausenden von Musikstücken. Musikstücke lassen
sich so leicht recherchieren, sorteren und es gibt dazu Rezensionen zu lesen und Hör-
proben oder ganze Stücke anzuhören: Die immer größer werdene Zahl an Musikstücken
weckt den Bedarf für Empfehlungssysteme (vgl. Block & Pohl, 2006).
Für Online-Händler sind gute Empfehlungsysteme also wichtg. Auch für den herkömmli-
chen Handel werden immer häufger im Vorfeld Online-Recherchen vorgenommen, wel-
che Produkte besonders interessant sind. Die Motvaton zum Kauf hängt häufg stark
davon ab, was andere über das Produkt denken. Auch laut der „Digital-Consumer-Beha-
vior“-Studie von „avenue a razorfsh“, bei der insgesamt 475 US-amerikanische Onli-
neshop-Kunden befragt wurden, vertrauen Kunden bei der Recherche nach Produkten
vor allem den Bewertungen und Rezensionen von anderen Nutzern (Schmit, 2007). Dies
bestätgte auch eine Erhebung der Nielsen Company bei der insgesamt 26.312 Internet-
nutzer in 48 Märkten in Europa, Asien, Nord-Amerika, Afrika und dem Mitleren Osten
zum Einkauf via Internet befragt wurden. „Recommendatons from fellow consumers –
whether they are people they know or fellow online shoppers – play an enormous role
in the decision-making process“ (Nielson Company, 2008).
Im folgenden beschreiben wir Empfehlungssysteme von Online-Händlern als auch von
Websites, deren Fokus weniger im direkten Absatz liegt, als bei der Rechecheunterstüt-
zung. Schaut man sich die verschiedenen Empfehlungssysteme an, dann zeigen sich
deutliche Unterschiede, ob hinter einem System der Wunsch steht, z. B. Bücher zu ver-
kaufen oder nur zu empfehlen. Amazon geht beispielsweise davon aus, dass der Käufer

42
auch immer der Konsument ist. So werden bei Amazon häufg Empfehlungen von neu
erschienenen oder der am meisten gekaufen Bücher gegeben, während nicht primär
auf Verkauf gerichtete Angebote, wie die beschriebene Platorm Librarything eher ver-
sucht, passende Bücher zu empfehlen. Tendenziell zeigt sich, dass Angebote die den all-
gemeinen Mainstream der Kunden bedienen und entsprechende Empfehlungen für ak-
tuell nachgefragte und neuerschienene Bücher geben wollen, eher kollaboratve Filter
nutzen. Im Unterschied dazu beschreiben wir eine Reihe von Empfehlungsdiensten für
Musikstücke die mit inhaltsbasiertem Filtern auch (eher) unbekannte Stücke empfehlen
(können).
Produktempfehlungen werden natürlich auch in anderen Branchen als den im Folgen-
den vorwiegend näher beschriebenen Buch- und Filmbereich gegeben: So werden in der
Finanzbranche Empfehlungssysteme zur Unterstützung der Entscheidungsprozesse beim
Kauf von Produkten eingesetzt. Diese beruhen in der Regel auf eigenschafsbasiertes Fil-
tern der Inhalte, z. B. durch Ausfüllen von Suchmasken mit persönlichen Daten und Risi-
koeinschätzung (z. B. für Investmentonds Kaas & Schneider, 2007). Auch werden Emp-
fehlungssysteme bei der Wahl der Urlaubsreise bzw. des Hotels eingesetzt (z. B. Glachs
& Osterrieder, 2006).

Buch- und Produktempfehlungen bei Amazon


Das erste Empfehlungssystem welches von Amazon13 verwendet wurde nannte sich
BookMatcher. Die Sofware dafür wurde von einem externen Unternehmen bereitge-
stellt, erfüllte jedoch nicht seinen Zweck (z. B. langsam, unzuverlässig) und wurde schon
bald danach wieder eingestellt. Das neue Empfehlungssystem sollte schnell, skalierbar
und schon bei einer geringen Anzahl an Bewertungen oder Einkäufen einsetzbar sein
(Linden, 2006).
Der Ansatz, der heute hinter dem System von Amazon steckt, nennt sich „Item-to-Item
Collaboratve Filtering“. Dabei werden nicht Ähnlichkeiten bei den Nutzern, wie es beim
kollaboratven Filtern traditonell geschieht, sondern Ähnlichkeiten zwischen den konsu-
mierten und von den Nutzern bewerteten Produkten herangezogen (s. Linden, Smith &
York, 2003, 78f).
Auf Amazon gibt es verschiedene Arten von Empfehlungen für die Nutzer. Allgemein
werden die Produkte, die gerade am beliebtesten und am meist verkaufen sind, als
„Bestseller“ vorgestellt. Dies gibt Nutzern einen guten Überblick, welche Artkel die All-
gemeinheit interessant fndet. Dabei geht jedoch nicht unmitelbar hervor, ob die Nut-
zer auch wirklich zufrieden mit dem Produkt sind.
So gibt es eine Reihe von personalisierten Empfehlungen, die aufgrund der individuellen
Nutzerhistorie, also des Käuferprofls, des Wunschzetels, der Bewertungen oder der be-
trachteten Produkte gegeben werden. Beispielsweise informieren sie den Nutzer über
neue Produkte, die ihn eventuell interessieren könnten: „Kunden, die Artkel von Ihrem
Wunschzetel gekauf haben, kaufen auch ...“.
So werden auf der Seite der Produktbeschreibung eine Reihe von weiteren Produktemp-
fehlungen gegeben: Am bekanntesten ist wohl die Empfehlung, welche anderen Produk-
te Käufer dieses Produktes gekauf haben, oder was Kunden gekauf haben, nachdem
sie diesen Artkel angesehen haben.

13
htp://www.amazon.com, Stand 03/2010

43
Die Beschreibungen der Produkte werden durch Kundenrezensionen und Bewertungen
ergänzt, es gibt also einen Überblick, wie zufrieden oder unzufrieden andere Nutzer mit
einem gekaufen Artkel sind. Jeder registrierte Nutzer hat auf Amazon die Möglichkeit
seine Meinung kundzutun und die Produkte mit Sternen (1-5) zu bewerten.

Abbildung 10: Diverse Empfehlungsmöglichkeiten bei Amazon


Quelle: htp://www.amazon.de (02/2010)

Ein Großteil der Berechnungen für die Empfehlungen werden bei Amazon ofine durch-
geführt. Für Nutzer, die gerade angemeldet sind, werden ähnlichen Objekte während
des Empfehlungsprozesses jedoch online ermitelt. Die Dauer des Vorgangs ist dabei von
der Anzahl der bewerteten oder gekaufen Objekte durch den Nutzer abhängig (s. Lin-
den, Smith & York, 2003, 79). Neuere Angaben dazu haben wir nicht gefunden.

Zappos
Zappos14 ist ein amerikanischer Online-Schuhhändler, der einen anderen Ansatz verfolgt,
um Empfehlungen zu personalisieren. In 2009 wurde die Betaversion von MyZappos15
ins Leben gerufen. Auf dieser Platorm können sich Nutzer ausgewählte Schuhe, Klei-
dungsstücke und Accessoires in ihren virtuellen „Kleiderschrank“ legen und Fragen oder
Kommentare zu den Produkten hinzufügen. Anschließend besteht die Möglichkeit, den
„Kleiderschrank“ mit Freunden über andere Netzwerke wie Twiter oder Facebook zu
öfnen und zu diskuteren. Kommenteren andere Nutzer die ausgewählten Artkel wird
dies im persönlichen Bereich des Mitglieds angezeigt. Es ist auch möglich, die Schränke
anderer Mitglieder einzusehen zu kommenteren, mit Produkten, die eventuell gut dazu
passen würden zu ergänzen, Freundschafen zu schließen und neue Bekanntschafen in
seine Kontaktliste aufzunehmen.

14
htp://www.zappos.com, Stand 02/2010
15
htp://my.zappos.com, Stand 02/2010

44
Abbildung 11: Unterstützung bei der Kaufentscheidung durch andere Nutzer
Quelle: htp://my.zappos.com/tdarby (02/2010)

Werbung
Während Empfehlungssysteme in Online-Shops vor allem eine Service-Leistung darstel-
len, die das Einkaufen leichter machen sollen und ggf. zum Kauf weiterer Produkte ver-
leiten sollen, sind die Erwartungen an Empfehlungssysteme die für Werbung eingesetzt
werden höher: Werbung muss so genau zu den Bedürfnissen und Interessen eines Nut-
zers passen oder wecken, dass im besten Falle darauf geklickt wird.
Im Bereich der Werbung wird daher viel mit Empfehlungsverfahren gearbeitet ohne
dazu besonders viel genaues veröfentlicht wird. Zur Personalisierung der Werbung wer-
den beispielsweise Rückschlüsse aus dem Nutzerverhalten gezogen. Wie eine solche
Auswertung des Nutzerverhaltens Browsingverhaltens auf eine (heuristsche) Zuord-
nung des Geschlechts funktoniert, wird durch eine Anwendung bei Mikeonads.com
(2008) nachvollziehbar (siehe Schafert u.a., 2009): Hier gibt man mit einem Blick den
Grif auf die History-Dateien frei, das heisst die zuletzt aufgerufenen URL sind auswert-
bar. Aufgrund dieser Angaben wird eine Zuordnung vorgenommen. Eine Variante für ein
Tool, das aus Nutzerverhalten auf das Geschlecht tppt, ist der „Gender-Guesser“16, der
aus den Vorlieben für Fotos das Geschlecht errät und auch von jedem auszuprobieren
ist.

16
htp://www.espgame.org/gwap/, Stand 09/2009

45
Abbildung 12: Ergebnis der Geschlechtschätzung durch Analyse der Browsing-History
Quelle: www.mikeonads.com/2008/07/13/using-your-browser-url-history-estmate-gender/ (10/2009)

Technische Websites sind demnach (stereo-) typisch für Männer, Mode-Websites für
Frauen – Fehler sind so durchaus möglich. Gedacht ist eine solche Anwendung jedoch
nicht notwendigerweise um das Geschlecht zu erraten, sondern um Informatonen über
Interessen und Vorlieben zu erhalten um entsprechend passende Werbung platzieren zu
können. Um Daten über das Browsingverhalten zu erlangen, ist es nicht unbedingt not-
wendig, dass Nutzer die History-Daten freigeben: Es gibt Javascripts, die aus der Farbe
der „besuchten Links“ ableiten, welche Webseiten bereits aufgerufen wurden (vgl. Mi-
keonads.com, 2008; dort wird auf eine Anwendung von Paul Cook hingewiesen).
Vergleichsweise einfach sind Werbeeinblendungen zu Suchbegrifen: Dieses Werbever-
fahren wird als SEM (Search Engine Marketng) bezeichnet. Die Zahl von 7 Millionen
Suchwortanzeigen im Jahr 2009 bei den Suchmaschinen MSN, Yahoo und Google zeigt
die Bedeutung, die unter anderem dazu führt, dass dieser Markt mit einem Search Ad-
vertsing Index monatlich beobachtet wird (Graf, 2009).

Konzept für ein Empfehlungssystem für Trendprodukte und -themen


Saisonale, politsche Ereignisse, Sportevents, Modeevents oder auch Naturkatastrophen
können das Kaufverhalten in Online-Shops beeinfussen. Empfehlungen für solche kurz-
fristg interessanten Produkte erscheinen daher sinnvoll. Während sich beim Valentns-
tag das Kaufverhalten jedes Jahr ähnelt, sind Trends oder Moden nicht immer klar vor-
hersehbar. Auf dieser Feststellung beruht die Idee eines buzz-basierten Empfehlungssys-
tem (Englisch für „Modewort“). Es versucht, aktuelle Suchtrends auszuwerten und ent-
sprechende Empfehlungen daraus zu generieren, Trends können so dynamisch als Emp-
fehlung weitergegeben werden und werden von Nutzern überwiegend positv bewertet
(Parikh & Sundaresan, 2009).

LibraryThing
Die Platorm LibraryThing17 versucht, passende Bücher zu empfehlen, ohne dass es dar-
um geht, die Verkaufszahlen für ein Buch in die Höhe zu treiben. Es behauptet daher:
„recommendatons are already beter than Amazon's—richer, more inspired and based
on what's good to read NOT what's selling this month“ (zit. Libarything.com, 2006).
17
htp://www.librarything.com, Stand 02/2010

46
LibraryThing ermöglicht seinen Nutzern einen eigenen Bücherkatalog sowie Medienlis-
ten anzulegen, zu kategorisieren sowie mit freien Schlagworten (engl. Tags) zu versehen.
Daten aus fast 700 teilnehmenden Online-Bibliotheken werden importert und indexiert.
Um Bücher zur eigenen Liste hinzuzufügen, gibt der Nutzer einfach Autor, Titel oder
ISBN des Werkes in die Suchmaske ein. Basierend auf dem was bisher eingetragen und
bewertet wurde, gibt LibraryThing einerseits explizite Empfehlungen von einzelnen Mit-
gliedern und andererseits mehrere Empfehlungslisten, die durch einen von LibraryThing
entwickelten eigenen Algorithmus, bezeichnet als BookSuggester, eingebunden werden
(Spalding, 2006). Der BookSuggester analysiert die Bücherkataloge aller Nutzer, und
empfehlt Bücher aus Katalogen sich ähnelnder Nutzer. Diese Empfehlungen können von
dem Nutzer wiederum bewertet werden, wonach dann neue Empfehlungen ermitelt
werden. Empfehlungen können auch anhand der am häufgsten vorkommenden Library-
Tags gefltert werden. Es werden ofensichtlich also parallel bzw. kombiniert tagbasierte,
inhaltsbasierte und elementbasierte, kollaboratve Verfahren eingesetzt.
LibraryThing verfügt auch über einen „UnSuggester“, der absichtlich „Ant-Empfehlun-
gen“ gibt, also Bücher nennt, die man quasi auf keinen Fall lesen sollte. Der Nutzer fn-
det bzw. kann auch von anderen Nutzern mit ähnlichen Vorlieben über das Feature „si-
milar libraries“ (Englisch für „ähnliche Bibliotheken“) gefunden werden, Gruppen bilden,
Bücher rezensieren und sich mit Gleichgesinnten austauschen.

Abbildung 13: Diverse Empfehlungsmöglichkeiten bei LibraryThing


Quelle: htp://www.librarything.com/profle/sweetegherkin/recommendatons (01/2010)

Ob Nutzer diese Art und Weise der Empfehlungen von LibraryThing als angenehmer und
nützlicher empfnden, ist uns nicht bekannt.

Last.fm
Das Internetradio Last.fm18 erstellt ein Profl, welche Lieder der Nutzer wie of gehört
hat und versucht basierend auf dem Gehörten, Empfehlungen zu generieren, damit Nut-
zer andere mit ähnlichem Hörverhalten fnden können und darüber hinaus über deren
Playlists interessante Musik fnden können. Durch eine Sofware „Audioscrobbler“, wel-
che ursprünglich als Informatkprojekt von Richard Jones an der Universität Southamp-
ton in England gestartet wurde, weiß das Unternehmen genau, welches Lied wie of ge-
hört wird und welches nie. Die Titelzeile und der Interpret des vom Nutzer gehörten
Musikttels werden im Nutzerprofl gespeichert und statstsch ausgewertet. Somit ist
bekannt, welche Musik die Nutzer wirklich hören. Der Scrobbler lernt ständig dazu,
18
htp://www.last.fm, Stand 02/2010

47
übermitelt die Musikttel an die Datenbank, füllt automatsch die Musiksammlung der
Nutzer und aktualisiert sie mit den Liedern, die sie auf ihren Computern oder iPods an-
hören. Basierend auf ihrem Hörverhalten erhalten Nutzer Empfehlungen zu Musik, Vi-
deos und auch kostenlosen MP3-Dateien. Die individuellen Charts erscheinen im
Last.fm-Profl der einzelnen Nutzer, wo sie von anderen Leuten angesehen werden kön-
nen. Dort werden auch Nutzer mit ähnlichem musikalischen Geschmack angezeigt. Wei-
ters gibt ein Online-Konzertinder den Nutzern anhand ihres Musikgeschmacks und ihres
Wohnortes auch Konzertempfehlungen (Wikipedia 2010).

Abbildung 14: Proflseite eines Nutzers bei Last.fm


Quelle: htp://www.lastm.de/user/Seli77 (01/2010)

Musikempfehlungen bei Preiser Records


Ein eher traditonelles Verfahren, nämlich den des eigenschafsbezogenen Filterns,
wählt Preiser Records, die sich auf den Verkauf von klassischer Musik spezialisiert ha-
ben. Experten beschreiben hier Musikstücke, die vom Nutzer durch das Ausfüllen einer
Suchmaske ausgewählt werden. Allerdings werden hier nicht nur die bekannten, übli-
chen Komponisten- oder Genrezuschreibungen genutzt, da die Musikstücke zusätzlich
von den Experten auch im Hinblick auf die geweckten Höreremotonen beschrieben
wurden: Bei Preiser Records kann man sich so Musikstücke empfehlen lassen, die „erhe-
bend“ oder als „heiter/fröhlich“ beschrieben werden.

48
Abbildung 15: Die „Emotonale Suche“ – Recherchemöglichkeit bei Preiser Records
Quelle: htp://www.preiserrecords.at/extendedSearch2.php?resetForm=resetForm (02/2010)

Pandora
Der amerikanische Musikempfehlungsdienst Pandora19 versucht unter dem Namen „Mu-
sic Genome Project“ (Englisch für musikalisches Genom-Projekt), Musik zu analysieren
und zu kartograferen. Pandora hat jeden einzelnen Song von gelernten Musikern nach
400 verschiedenen Kriterien (z. B. Dimension der Melodie, Rhythmus, Harmonie, ver-
wendete Instrumente, Art der Texte usw.) analysieren lassen und ordnet ihnen unter-
schiedliche Atribute zu. Es wird nach Ähnlichkeiten und Gemeinsamkeiten der Musik-
stücke gesucht und diese danach für die Nutzer in Form von Empfehlungslisten zusam-
mengestellt. (Pandora, 2010). Dabei werden auch Genre- und Stl-Grenzen übersprun-
gen und es wird auf die größten Übereinstmmungen mit dem eigenen Geschmack Wert
gelegt. Neben einzelnen Song-Titeln oder Gruppennamen können Nutzer auch persönli-
che Vorlieben, wie beispielsweise Trompetensolos, Art der Texte, Tanzbarkeit oder Typ
der Stmme eingeben (heise, 2001). Durch das eigenschafsbezogene Filtern und den
Verzicht auf kollabortves Filtern entdeckt man mit diesem Verfahren eher neue, bisher
unbekannte Stücke: „It’s the introducton to new music that makes Pandora uniquely in-
terestng as a recommendaton system“ (Simon, 2009).

19
htp://www.pandora.com, Stand 02/2010

49
Abbildung 16: Proflseite bei Pandora
Quelle: htp://hayfwood.fles.wordpress.com/2009/03/pandora1.jpg (02/2010)

Mufn, eMusic und Audiobaba


Um einen Einblick in die höchst unterschiedlichen Empfehlungssysteme zu geben, be-
schreiben wir hier noch kurz drei weitere Empfehlungsdienste für Musikstücke:
Mufn's20 Empfehlungssystem analysiert zuerst die fundamentalen klanglichen Eigen-
schafen eines Liedes nach beispielsweise Tempo, Instrumenterung, Klangdichte oder
Harmonie und gibt dann ausschließlich Empfehlungen nach der musikalischen Ähnlich-
keit zwischen Songs.
Das Empfehlungssystem von eMusic21 basiert auf einer Technologie von MediaUn-
bound22, einem Anbieter von Personalisierungs- und Empfehlungssystemen. Die Emp-
fehlungen auf eMusic werden ständig und automatsch fein abgestmmt durch die eige-
nen Aktvitäten der Nutzer auf der Website, dem MediaUnbound-Algorithmus und dem
eMusic-Editor (ReadWriteWeb, 2009). Im Unterschied zu den oben genannten Empfeh-
lungssystemen werden hier Daten über die Musikstücke durch die Nutzer selbst einge-
tragen, es handelt sich also dabei nicht unbedingt um Experten.
Auf Audiobaba23 werden Audiostreams analysiert und unterschiedliche Eigenschafen
der Musikstücke für die Empfehlungen (z. B. Rhythmus, Beat) herangezogen. Hier wer-
den, wieder im Unterschied zu den oben genannten Empfehlungssystemen, Daten über
die Musikstücke automatsch analysiert.

20
htp://www.mufn.com, Stand 01/2010
21
htp://www.emusic.com, Stand 01/2010
22
htp://www.mediaunbound.com, Stand 02/2010
23
htp://www.audiobaba.com, Stand 02/2010

50
MovieLens
MovieLens24 ist ein Empfehlungssystem für Filme und verwendet die Technologie des
kollaboratven Filtern. Nachdem der Nutzer sich angemeldet hat, werden ihm Listen mit
Filmen, deren Veröfentlichungsjahr sowie Genres angezeigt. Filme, die er davon bereits
gesehen hat, kann er mit Sternen (1 Stern = „schrecklich“ bis 5 Sterne = „muss man se-
hen“) bewerten. Mindestens 15 Filme muss der Nutzer bewertet haben, damit Movie-
Lens Empfehlungen geben kann. Je mehr Filme der Nutzer allerdings bewertet, desto
genauer und persönlicher werden diese.
MovieLens wurde vom Department of Computer Science and Engineering der Universi-
tät von Minnesota ins Leben gerufen. Der ursprüngliche MovieLens-Algorithmus („user-
user“) generierte einen Korrelatonskoefzient zwischen Nutzer A und allen anderen
Nutzern in der Datenbank. Dann wurden die Filme einem Ranking, basierend auf den
Bewertungen der anderen Mitglieder, mit einem hohen Korrelatonskoefzient unterzo-
gen (Economic Expert, 2010). Mitlerweile verwendet MovieLens auch den Ansatz des
Item-Based Collaboratve Filtering, der zuerst die Nutzer-Elemente-Matrix analysiert, um
Beziehungen zwischen den verschiedenen Objekten zu bekommen. Danach wird diese
Beziehung herangezogen, um indirekt die Empfehlungen für Nutzer zu berechnen bzw.
zu erhalten (Henze, 2008):

Abbildung 17: Empfehlungen auf MovieLens


Quelle: htp://www.movielens.org/search?acton=loadSearch&xmlId=2 (02/2010)

24
htp://www.movielens.org, Stand 02/2010

51
3.5 Empfehlungssysteme für Web-Materialien
Im Folgenden geben wir einen Überblick über Empfehlungssysteme für die Recherche
nach kostenlos verfügbaren Webmaterialien, wie Weblogs oder Videos.
Dabei verweisen wir zunächst auf drei Arten von Anwendungen, nämlich Suchmaschi-
nen, Taggingplatormen und Soziale Netze, die natürlich auch als eine Art Empfehlungs-
system für verteilte Informatonen im Web betrachtet werden können. Drei Empfeh-
lungssysteme werden dann im Anschluss genauer betrachtet: Bei Photoree werden Bil-
der aus unterschiedlichen Datenbanken, bei fwd Videos aus unterschiedlichen Daten-
banken empfohlen. ReMashed ist ein community-basiertes Verfahren des Austauschs
von Empfehlungen unter Personen mit ähnlichen Interessen.

Suchmaschinen und Verzeichnisse


Klassische Unterstützung bei der Suche nach Webmaterialien bieten Suchmaschinen
und Webverzeichnisse. Hier werden Suchbegrife eingeben oder mit Hilfe von Kategori-
en und weiteren Einschränkungen (Aktualität des Trefers, Format des Trefers usw.) Lis-
ten von passenden Trefern ausgegeben.
Während bei Suchmaschinen der ersten Generaton vor allem die Inhalte der Webseiten
bzw. Metadaten ausgewertet wurden, spielen heute für das Ranking, also die Rangfolge
in den Treferlisten, auch weitere Aspekte eine Rolle: So wird der Grad der Vernetzung
mit anderen Webseiten, die Dynamik des Angebots sowie die Zugrife auf diesen Trefer
in der Suchmaschine ausgewertet. Der Rankingalgorithmus basiert hier folglich auch auf
weiteren Analysen der Webseiten sowie des Benutzerverhaltens. Suchmaschinen ver-
wenden also Algorithmen und Verfahren, die den Empfehlungssystemen ähnlich sind.
Neue Entwicklungen beschäfigen sich unter der Bezeichnung „Social Search“ damit,
dass Suchmaschinen die Informatonen über das Suchverhalten der eigenen Community
einbinden, also Ansätze des kollaboratven Filtern bzw. des pfadbasierten Filterns nutzen
(z. B. Smyth, Briggs& Coyle, 2009).

Social Tagging und persönliche Empfehlungen mit Delicious


Social Tagging, also das gemeinsame Verschlagworten von Webressourcen mit Hilfe von
Services wie Delicious25 und MisterWong26, ermöglicht neue Zugänge zu Webseiten und
Objekten (Schafert, Hilzensauer & Wieden-Bischof, 2009, s. S. 31 in diesem Buch). Auf
den Webseiten der Social-Tagging-Anbieter lassen sich daher auch Empfehlungen für
Beiträge in Weblogs und andere Webseiten mit den gleichen Tags fnden.
Darüberhinaus bietet Delicious eine interessante Möglichkeit an, eigene Lesezeichen als
persönliche, direkte Empfehlungen an andere Nutzer des Systems weiterzugeben bzw.
diesen eine Webseite vorzuschlagen. Diese Empfehlungen können im Nutzerprofl einge-
sehen werden, aber auch als RSS-Feed abonniert werden.

25
htp://delicious.com, Stand 02/2010
26
htp://www.mister-wong.de/, Stand 02/2010

52
Abbildung 18: Persönliche Empfehlungen für Lesezeichen von anderen Nutzern bei Delicious
Quelle: htp://delicious.com/inbox/ (02/2010)

Soziale Netze – Beispiel Facebook


Facebook27 ist ein Soziales Netzwerk, bei dem Nutzer Bilder hochladen können und mit
den Namen der anderen versehen können. Die Idee von sozialen Netzwerken ist es, dass
Nutzer, die sich als Kontakte oder „Freunde“ gekennzeichnet oder in „Gruppen“ zusam-
mengeschlossen haben, über die Aktvitäten der anderen informiert werden können.
Beispielsweise gibt es so die Möglichkeit, anderen Fotos aus dem Urlaub zu zeigen, die
dann wiederum kommentert werden können.

Photoree
Photoree ist ein Bewertungs- und Empfehlungssystem für Bilder. Hat man sich bei Pho-
toree28 als Nutzer registriert, wird in der Datenbank ein persönlicher Filter für das jewei-
lige Mitglied angelegt. Dieser Filter ist für die Auswahl der Bilder verantwortlich, die
dem Nutzer gezeigt und vorgeschlagen werden. Dem Mitglied werden verschiedene Bil-
der vorgeführt, die er bewerten muss, damit der dahinter stehende Algorithmus nach
und nach den persönlichen Geschmack kennenlernen kann. Je mehr Bilder vom Nutzer
bewertet werden, desto persönlicher und detaillierter wird die Auswahl. Die Bilder wer-
den aus dem Internet abgerufen und in der Datenbank indiziert, auch ihre genaue Her-
kunf und Details (z. B. Titel, Quellseite, Lizenz) werden angezeigt. Nutzer können die Bil-
der verwenden, um beispielsweise ihre Blogeinträge oder Webseiten mit Fotos aufzupo-
lieren oder um Collagen zu gestalten. Die Bewertung der Bilder erfolgt anhand von Pfei-
len. Der grüne, nach oben zeigende Pfeil, ist eine positve, der rote nach unten zeigende
Pfeil eine negatve Bewertung. Die positv bewerteten Bilder werden in die persönliche
Galerie gelegt, in der die Bewertung auch noch zu einem späteren Zeitpunkt geändert
werden kann. Hat der Nutzer mindestens 100 Bilder bewertet, werden ihm vom System
Empfehlungen für Bilder von anderen Mitgliedern mit ähnlichem Geschmack geliefert,
die er bewerten kann. Er hat auch die Möglichkeit sich individuelle Statstken vom Sys-
tem auswerten und anzeigen zu lassen, um so andere Mitglieder die dem eigenen Be-
wertungsprofl ähnlich sind, zu fnden, in seine Kontaktliste aufzunehmen und deren Bil-
der anzusehen.

27
htp://www.facebook.com, Stand 11/2009
28
htp://www.photoree.com, Stand 01/2010

53
Abbildung 19: Bildempfehlungen auf Basis ähnlicher Bewertungsprofle von Nutzern
Quelle: htp://www.photoree.com/photos/recommend (02/2010)

54
Abbildung 20: Prozentuale Angabe der Übereinstmmung von Nutzern mit dem eigenen Profl
Quelle: htp://www.photoree.com/photos/recommend (02/2010)

Best-Of aus den Videoplatormen mit fwd


fwd29 ist ein Videoportal das Videos von verschiedenen Platormen (z. B. YouTube, Fun-
ny or Die, Blip.tv, MySpace) nach dem persönlichen Geschmack der Nutzer empfehlt.
Nach Registrierung werden per Fragebogen Lieblingsgenres, -flme und -serien be-
stmmt. Dadurch kann er einem bestmmten Typ, einer sogenannten „Videopersönlich-
keit“, zugeordnet werden, welche optsch in Form eines Monsters oder Männchens dar-
gestellt wird. Ein Auszug aus den über 15 unterschiedlichen Typen:

29
htp://www.fwd.com, Stand 02/2010

55
Typen Symbol Beschreibung

The Class Clown Der Klassenclown hat viel Charme und versteht es, jede Alltagssituaton
(Der Klassenclown) in eine gute und vergnügliche Zeit zu verwandeln.

The Critc Der Kritker ist rede- und wortgewandt und kann nahezu über alle TV-
(Der Kritker) Shows und deren Dialoge, Schauspielerei und Regie diskuteren.

The Paparazzi Der Paparazzi ist hauptsächlich ein Beobachter, dessen Glücksgefühl
(Der Paprazzi) durch das Betrachten der (Helden-) Taten von Driten entsteht.

The Social Buterfy Der soziale Schmeterling ist lustg, spontan und bringt Aufregung in je-
(Der gesellige/soziale dermanns Leben. Er hat viele Freunde und möchte wissen, was bei allen
Schmeterling los ist und liebt es über die Höhen und Tiefen von Beziehungen zu hören.

weitere The Best Friend (Der beste Freund),


The Cameleon (Das Chamäleon),
The Comedy Writer (Der Komödienautor),
The Contestant (Der Wetkämpfer),
The Forensics Expert (Der forensische Experte),
The Hero (Der Held),
The Oddball (Der Exzentriker),
The Rebel (Der Rebell),
The Split Personality (Die gespaltene Persönlichkeit),
The Professor (Der Professor),
The Super Fan (Der Superfan),
The Talent Scout (Der Talent Scout)

Tabelle 11: Bedeutung der Videopersönlichkeiten bei fwd.


Quelle: fwd.com (02/2009)

Wurde man einem bestmmten Typ zugeordnet, werden dem Nutzer Videos angezeigt,
die für ihn interessant sein könnten. Folgende Möglichkeiten stehen dem Nutzer des Vi-
deoportals zur Verfügung (s. MashupYourLife.com, 2009):
| Jedes Video kann an Freunde weiter empfohlen, versendet oder verteilt (z. B. Twiter,
Facebook, delicious, Hi5, MySpace, StubleUpon), aber auch zu den eigenen Favoriten
hinzugefügt werden. Nutzer erhalten auch Empfehlungen von anderen.
| Videos können bewertet und auch mit Tags versehen werden.
| Auf einfachem Weg können andere Nutzer mit demselben bzw. ähnlichen Ge-
schmack gefunden werden.
| Durch eine Wii-optmierte Version von fwd können Videos auch direkt im Wohnzim-
mer angesehen werden.
Nutzer können auch ihren eigenen und persönlichen Video-Kanal gestalten bzw. einrich-
ten.

56
ReMashed – Empfehlungen der Community
Das Empfehlungssystem ReMashed30 ist ein community-basiertes Empfehlungssystem
für verschiedene Web-2.0-Formate wie Videos, Präsentatonen, Blogs, Bookmarks und
Micro-Blogging. Gleichgesinnte können damit eigene Online-Ressourcen (wie Weblo-
geinträge und Lesezeichen bei Delicious31) teilen, bewerten und erhalten Empfehlungen
für Beiträge der anderen (s. Drachsler, 2009).
Das Empfehlungssystem arbeitet mit zwei unterschiedlichen Datenquellen auf denen
unterschiedliche Empfehlungsalgorithmen aufauen: Zum einen mit der Tag-Cloud eines
Nutzers, zum anderen mit einer Bewertung der Beiträge (bis zu fünf Sterne). Auf diesen
beiden Datenquellen bauen zwei unterschiedliche Empfehlungsalgorithmen auf, die
Hendrik Drachsler im folgenden erläutert.

Abbildung 21: ReMashed: Web-2.0-Empfehlungen aus der Community


Quelle: htp://remashed.ou.nl (02/2010)

Hendrik Drachsler zu Empfehlungen von Webcontent in Communitys

? Welche Erfahrungen haben Sie mit den unterschiedlichen Empfehlungsarten Ihres


Systems gemacht?

! Wir nutzen zunächst die Tag-Cloud-Daten der Web-2.0-Inhalte eines Nutzers als
eine erste Eingrenzung des Interessengebietes. Konkret bedeutet das, dass wir aus
allen angegebenen Web-2.0-Tools des Nutzers eine kombinierte persönliche Tag-
Cloud generieren. Diese wird dann durch mathematsche Verfahren mit den Tag-
Clouds anderer Nutzer im ReMashed System verglichen. Im Anschluss werden Web-2.0-Ressourcen von
Nutzern mit ähnlichen Tag-Clouds, die der aktuelle Nutzer noch nicht kennt, vom Empfehlungssystem
vorgeschlagen. Die Tag-Clouds werden benötgt, um der sogenannten ‚Cold-Start‘-Phase des Empfeh-
lungssystem entgegen zu wirken, wo noch nicht ausreichende Informatonen über einen neuen Nutzer
vorhanden sind.

30
htp://remashed.ou.nl, Stand 02/2010
31
htp://delicious.com, Stand 02/2010

57
Der zweite Empfehlungsalgorithmus, der auf Basis der Sternbewertung arbeitet, kann erst aktv werden,
wenn der Nutzer eine bestmmte Anzahl an Ressourcen im System bewertet hat. Das bedeutet, dass der
Nutzer über die Sternbewertung dem System erst seine Interessensbereiche antrainieren muss, damit
dieses eine Empfehlung generieren kann. Solange dieser Trainingsprozess noch nicht abgeschlossen, ist
bieten wir dem Nutzer Empfehlungen auf Basis der Tag-Cloud an.

Prinzipiell ist das Sternbewertungsverfahren lernfähiger als das tag-cloud-basierte Verfahren. Das be-
deutet, umso mehr ein Nutzer seine Interessengebiete mit positven oder negatven Bewertungen ein-
grenzt, umso akkurater und genauer werden die Vorschläge des Empfehlungssystem. Das tag-cloud-ba-
sierte Verfahren hingegen ist wesentlich träger, weil sich Tag-Clouds nicht so dynamisch entwickeln und
insgesamt ungenauer vergleichen lassen als die mit Sternen bewerteten Inhalte. Dafür kann das tag-
cloud-basierte Verfahren schon nach dem ersten Einloggen des Nutzers Vorschläge generieren und be-
nötgt keine Trainingsphase. Die Kombinaton beider Techniken in einem hybriden Empfehlungssystem
erscheint uns als efektvste Lösung, Web-2.0-Inhalte nach persönlichen Interessen zu fltern.

? Welche Empfehlungen erleben Nutzer Ihres Systems als besonders hilfreich?

! Im ReMashed System wurden beide Empfehlungsalgorithmen von den Nutzern ähnlich positv bewer-
tet. Jedoch blieb der tag-cloud-basierte Empfehlungsalgorithmus die beliebtere Empfehlungstechnik.
Dies kann aber auch an einer zu kurzen Trainingsphase des auf Sternbewertung basieren Algorithmus
liegen.

? Welche Ratschläge möchten Sie anderen Entwicklern von communitybasierten Empfehlungssystemen


für Web-Content geben?

! Die Nutzer unseres ReMashed-Systems haten vor allem Bedenken, dass das System auch ihre privaten
Bookmarks und Blogbeiträge auslesen wird. Daher erklären Sie explizit, dass nur öfentlich verfügbare
Informaton für das Empfehlungssystem genutzt werden. Beachten Sie, dass die Community ein gutes
Verständnis der Funktonalität des Empfehlungssystems bekommt. Machen Sie die Prozesse des Emp-
fehlungssystems so transparent wie möglich, das steigert das Vertrauen der Nutzer in das System.

Desweiteren ist es wichtg, den Nutzern das Löschen von Empfehlungen aus der Empfehlungsliste zu er-
möglichen. Wir haben hierfür einen sogenannten ‚Black Star‘ eingeführt, der es den Nutzern ermöglicht,
eine ungeliebte Empfehlungen von der Vorschlagsliste zu enternen.

Vor allem für community-basierte Empfehlungssysteme ist es wichtg, Interakton der Nutzer unterein-
ander zu ermöglichen, andernfalls wird Ihr System zu passiv. Integrieren Sie synchrone oder asynchrone
Chats neben Ihren Empfehlungen, um das gesamte Erscheinungsbild atraktver und lebhafer für die
Community zu gestalten.

Im heutgen vernetzten Arbeiten wollen Nutzer nicht immer zu einer bestmmten Webseite gehen müs-
sen, um einen Service in Anspruch nehmen zu können. Daher planen Sie von Anfang an Widgets und
Plugin-Interfaces für Ihr Empfehlungssystem mit ein, die die Nutzer in ihrem Browser oder ihrer persön-
lichen Lernumgebung, wie iGoogle oder Netvibes integrieren können.

Dr. Hendrik Drachsler arbeitet als Assistant Professor für Technology Enhanced Learning beim Center for
Learning Science and Technologies (CELSTEC) an der Open Universiteit Nederland. Sein Arbeitsschwer-
punkt ist die Personalisierung des Lernens mit Informaton Retrieval Methoden und deren Applikaton in
Empfehlungssystemen. Über seine Forschungsergebnisse berichtet er regelmäßig in seinem Weblog
htp://www.drachsler.de/blog/ (02/2010).

58
3.6 Spezielle Einsatzgebiete und weitere Empfehlungssysteme
Im folgenden Abschnit haben wir Beispiele für Empfehlungssysteme und ihren Einsatz
gesammelt, die nicht zu den bereits vorgestellten Einsatzgebieten passen, weil es sich
bei ihnen nicht explizit um Empfehlungssysteme für Personen, Produkte oder Webmate-
rialien handelt. Genau genommen sind einige der folgenden Empfehlungssysteme auch
nicht im Internet für die Allgemeinheit zugänglich, sondern werden in spezifscher Sof-
ware eingesetzt.
Dabei betrachten wir folgende Bereiche genauer: Empfehlungssysteme für die Generie-
rung von Tags, Empfehlungssysteme im Einsatz bei der interaktven Live-Erstellung von
Fernsehproduktonen, Empfehlungssysteme bei der Verschreibung von Arzneimiteln,
Empfehlungen bei der Suche und Recherche, Empfehlungssysteme für Lernende sowie
eine kurze Übersicht weiterer Einsatzgebiete.

Tag-Empfehlungen
Immer häufger wird im Web Social Tagging eingesetzt. Dabei haben Nutzer die Möglich-
keit, Webseiten oder anderen Ressourcen (Bilder, Videos, Musikstücke) mit eigenen
Schlagworten zu markieren. Weil Tagging das Erschließen und Recherchieren von vielen
Daten erst ermöglicht oder deutlich verbessert, wird es von vielen Systemen auch unter-
stützt. Damit das Tagging leicht von der Hand geht, werden Tagvorschläge gemacht.
Einen Überblick über unterschiedliche Quellen, die für Tag-Vorschläge herangezogen
werden können, gibt Kockler (2008) in seiner Diplomarbeit, abgebildet hier eine Über-
sicht aus Memmel, Kockler & Schirru (2009).

Abbildung 22: Mögliche Quellen für Tag-Empfehlungen


Quelle: Memmel, Kockler, & Schirru, 2009, Abbildung 1, 680

59
Folgendes Beispiel für einen Tag-Recommender stammt aus Schafert u.a. (2009, 50f):
Im Projekt „Interedu“32 des Salzburg NewMediaLab wurde ein System entwickelt, das
das Tagging von Lernressourcen unterstützt, indem es Tagvorschläge generiert. Dabei
kommen mehrere Verfahren zum Einsatz:
| Die Hauptkomponentenanalyse ist ein statstsches Verfahren, dass mit Hilfe einer
Analyse von „Trainingsdaten“ Rückschlüsse auf das Vorschlagen von Tags geben kann:
Dazu werden die Texte der Trainingsdaten in Schlüsselworte zerlegt, Stoppworte ge-
fltert und Stammformen gebildet, dann wird eine Dokument-Term-Matrix angelegt
und Vektoren beschrieben. Weil allein durch das Vorkommen eines Schlüsselwortes
nicht die Relevanz gezeigt ist, wird mit dem TF-IDF-Verfahren (Term Frequency/Inver-
se Document Frequency) festgestellt, ob es vergleichsweise häufg vorkommt, also
„besonders“ ist. Ziel der Hauptkomponentenanalyse ist es nun, die bestehende Ma-
trix so in der Anzahl der Dimensionen zu reduzieren, dass alle Hauptrichtungen ver-
treten sind.
| Mit KEA können Texte klassifziert werden und sogenannte Keyphrases oder „Schlüs-
selwortketen“ in Texten erkannt werden. KEA unterstützt zwei Arten von Klassifzie-
rungen: die freie Klassifzierung (Schlüsselwortextrakton) sowie die eingeschränkte
Klassifzierung (Kategorisierung), bei der der Text in eine Kategorie eingeordnet wird.
| Auch Assoziatonsregeln können zum Vorschlagen von Tags oder Schlüsselworte ein-
gesetzt werden. Wenn eine Menge von Dokumenten signifkant häufg mit den sel-
ben Tags oder Schlüsselworten versehen wurde, kann ein Benutzer von dem Wissen
der Vorgänger profteren, indem seine Tags vervollständigt werden. Das Konzept der
Assoziatonsregeln setzt somit voraus, dass schon Tags vergeben worden sind.
Neben inhaltsbasierten Filtern kommt also wird auch ein kollaboratves Filtern einge-
setzt. Andere Verfahren setzten wiederum deutlich stärker auf das Tagging-Verhalten
anderer Nutzer (s. Mishne, 2006).
Mit der ALOE-Platorm wird derzeit versucht, eine Schnitstelle zu entwickeln, die es
Nutzern erlaubt, selbst die Regeln für die Erstellung der Tag-Vorschläge zu steuern. Wie
die Abbildung der derzeitgen Nutzeroberfäche zeigt (s. Abbildung 23. S. 61), kann bei-
spielsweise vom Nutzer festgelegt werden, ob Tag-Vorschläge aus dem Tagging-Verhal-
ten aller ALOE-Nutzer generiert werden sollen, oder ob nur Kontakte einbezogen wer-
den sollen.

32
Partner: Salzburg Research, Educaton Highway und Punkt Netservices

60
Abbildung 23: ALOE-Interface zur Festlegung der Quellen für Tag-Vorschläge
Quelle: Memmel, Kockler & Schirru (2009), Abbildung 4, 688

LIVE – Inhaltsempfehlung in der Fernsehprodukton


Das LIVE-Projekt33, hate zum Ziel die Produkton von großen Medienereignissen live auf
mehreren Sendekanälen zu realisieren. Hierzu hat es ein komplexes Framework entwi-
ckelt, das das Produktonsteam dabei unterstützen soll, Archivmaterial semi-automa-
tsch zu erfassen, Benutzerverhalten und Vorlieben zu analysieren, und relevante Inhalte
vorzuschlagen welche sowohl die aktuellen Geschehnisse in den Events als auch die In-
teressen der Zuschauer widerspiegeln. Eine Hauptherausforderung dieses Systems sind
die Echtzeit-Anforderungen: Der Direktor bzw. sein Team müssen in Echtzeit Entschei-
dungen trefen und Live-Inhalte bzw. relevantes Sekundärmaterial auswählen und zur
Aussendung freigeben. Eine Kernkomponente dieses Systems ist ein Empfehlungssys-
tem, das das Produktonsteam bei der Auswahl geeigneter Inhalte unterstützt und
gleichzeitg Zuschauer-Feedback analysiert, um das ausgestrahlte Programm den Inter-
essen der Zuschauer anzupassen. Das LIVE Empfehlungssystem unterstützt aus diesem
Grund mehrere Arbeitsprozesse: (1) Die Auswahl und Organisaton von Sekundär-Inhal-
ten aus Archiven, (2) die Sammlung von Zuschauer-Feedback, (3) die Analyse und Prä-
sentaton des Feedbacks und (4) die Erzeugung von Empfehlungen auf Basis des Feed-
backs und dem aktuell ausgestrahlten Programm.

33
htp://www.ist-live.org, Stand 02/2010

61
Das System gliedert sich in zwei Phasen des Produktonsprozesses ein: die Vorberei-
tungs- und die Live-Phase. In der Vorbereitungsphase unterstützt das Empfehlungssys-
tem bei der Vorauswahl von Inhalten aus dem Archiv. Dies beinhaltet Interviews oder
Beiträge zu den beteiligten Personen bei dem jeweiligen Ereignis. In der Live-Phase ana-
lysiert das Empfehlungssystem semi-automatsch ausgezeichnete Kamera-Live-Ströme
und erzeugt darauf aufauende, automatsche Empfehlungen.
Zusätzlich zu rein inhaltsbasierten Empfehlungen unterstützt das Empfehlungssystem
personalisierte Empfehlungen, die das Profl der Zuschauer in den Empfehlungsprozess
integrieren. Hierzu wurde ein spezielles Zuschauerfeedback- und -analysesystem entwi-
ckelt, das in Echtzeit implizites und explizites Feedback der Zuschauer analysiert. Implizi-
tes Feedback umfasst das Sehverhalten der Zuschauer, wie etwa das Umschalten oder
die Verweildauer auf einzelnen Kanälen. Explizites Feedback beinhaltet Bewertungs-
und Abstmmungsinformatonen, welche über einen Feedback-Kanal aufgenommen
werden.

Abbildung 24: Screenshot des LIVE-Recommender


Quelle: htp://www.ist-live.org (02/2010)

Empfehlungssysteme bei der Verschreibung von Arzneimiteln


Vor allem wenn mehrere unterschiedliche Ärzte in den Behandlungsprozess eingebun-
den sind, beispielsweise wenn mehrere Krankheiten vorliegen, können Fehler bei der
Verschreibung von Medikamenten passieren. Immer häufger werden daher in Kranken-
häusern Alarmierungssysteme eingesetzt, die beispielsweise bei unzureichender oder zu
hoher Dosierung, oder wenn zwei Medikamente nicht gleichzeitg verordnet werden sol-
len, Alarm schlägt. Diese Empfehlungssysteme werden als „Elektronische Arzneimitel-
verschreibung“ bezeichnet (Engl. „computerised physician order entry system“). Da die
vorhandenen Systeme häufg Alarm schlagen, ist bei den Benutzern eine gewisse Alarm-
müdigkeit festzustellen. Um den entgegenzuwirken, werden Möglichkeiten gesucht, wie
man Fehlalarme möglichst vermeidet ohne im Gegenzug Fehler oder Schwierigkeiten
bei der Verschreibung zu übersehen.

62
Miyo et al. (2007) sind bei der Entwicklung ihres Systems für das Universitätskranken-
haus Tokyo davon ausgegangen, dass eine bei ähnlichen Krankheitsbildern von Paten-
ten häufge durchgeführte Medikaton die beste ist. Es wurde daher ein echtzeit- und
fallbasiertes Medikatonsalarm- und Empfehlungssystem basierend auf einer Datenbasis
von früheren Verschreibungen entwickelt. Grundlage beim neu entwickelten System
sind Daten über vorherige Verschreibungen (von 2000 bis 2005). Das System schlägt
Alarm, wenn ein Problem vorliegt. Ereignisse, die einen Alarm anstoßen können sind:
Dosierung bezogen auf das Behandlungsschema, Dauer der Verabreichung des Arznei-
mitels, gleichzeitg eingenommene Arzneimitel. Das System bietet eine Entscheidungs-
unterstützung bei der Medikaton. Auf Basis der Werte aus der Vergangenheit und der
Patentenparameter erhalten Ärzte z. B. eine geeignete Dosierung und Verabreichungs-
dauer vorgeschlagen.
Bei einer Evaluierung des Systems wurden die ausgelösten Alarme für die zehn am häu-
fgsten verschriebenen Medikamente des neuen Systems mit herkömmlichen, „stat-
schen“ Systemen verglichen. Bei einem Versuch mit den zehn am häufgsten verschrie-
benen Medikamenten im Universitätskrankenhaus Tokyo wurde festgestellt, dass dieses
System die Zahl der Fehlalarme reduziert.
Solche Empfehlungssysteme werden in der Praxis jedoch nicht nur gut geheißen, v.a.
dann wenn sie Ärzte in ihren Freiräumen einschränken. So sind uns Rückmeldungen von
Ärzten zu existerenden Systemen bekannt, die sich durch solche „Empfehlungssysteme“
eher eingeschränkt fühlen, beispielsweise wenn Medikamente bewusst zur Behandlung
für Krankheiten eingesetzt werden für die sie ofziell nicht gedacht sind und weil die
Verträglichkeit und Dosierung der Medikamente in vielen Fällen (noch) individueller ist,
als es die Theorie bzw. das Empfehlungssystem für richtg hält.
Empfehlungssysteme werden auch für die Erstellung von Pfegeplänen entwickelt (Duan,
Street & Lu, 2008, ein aktueller Überblick fndet sich in Traurig, 2009). Anfang 2010 star-
tet zusammen mit Salzburg Research ein Forschungsprojekt, in dessen Rahmen u.a. sol-
che unterstützenden Services zur Behandlung von Herzpatenten entwickelt werden34.

Empfehlungen für Suche und Recherche


Empfehlungssysteme werden auch zur Unterstützung der Recherche eingesetzt, im Fol-
genden dazu einige Beispiele:
| Zum Beispiel werden auf Fehler in der Rechtschreibung der Suchbegrife hingewie-
sen, ein relatv einfacher Ansatz um die Treferquote und Nutzerzufriedenheit zu er-
höhen.
| In der Wissenschafs-Suchmaschine Scirus35 werden beispielsweise auch Vorschläge
für die Eingrenzung des Suchgebietes auf bestmmte Themen, Webressourcen oder
Journals gegeben.
| Suchtechnologien wie von Findologic36 sind für Online-Shops entworfen worden, um
den Kunden systematsch zu leiten, indem beispielsweise weitere Unterkategorien
vorgeschlagen werden und nicht nur eine lange Treferliste anzuzeigen.

34
Siehe htp://www.srdc.com.tr/icardea/, Stand 02/2010
35
htp://scirus.com, Stand 02/2010
36
htp://www.fndologic.com, Stand 02/2010

63
| Auf der Platorm für Wissensmananagement PWM37 werden bei Recherchen z. B.
das semantsche Netz des Suchbegrifs graphisch dargestellt, das die die semantsche
Bedeutung des Suchwortes im Kontext von Wissensmanagement zeigt (Beier & Blu-
mauer, 2004)

Empfehlungen für Lernende


Auch Systeme zur Lernunterstützung können als Empfehlungssysteme verstanden wer-
den. Die ersten Lernprogramme gaben zwar weniger „Empfehlungen“, als dass sie die
Lernwege und einzelne Schrite nicht vorschlugen, sondern vorgaben: Passend zu dem
Profl des Lernenden, z. B. seinem Vorwissen, werden Lerneinheiten angeboten. Tradi-
tonelle Systeme werden dabei von Experten entwickelt und Lernwege und -materialien
vorgeben. In den letzten Jahren wird immer häufger mit Lern-„Empfehlungen“ gearbei-
tet. Das ist zum einen darauf zurückzuführen, dass Vorgänge des selbstorganisierten und
informellen Lernens, also das nichtormal organisierte Lernen, in den Vordergrund der
Aufmerksamkeit gerückt ist. Zum anderen stehen durch die Entwicklungen des Webs im-
mer mehr Lernquellen und -materialien frei verfügbar im Netz, ohne das beispielsweise
explizite Daten zur Verfügung stehen, wann und für welchen Lerner sie geeignet sind.
Eines der ersten Empfehlungssysteme für Lernende beschrieben Linton und Charron
(1998): Sie entwickelten ein Empfehlungssystem, dass das Verhalten der Nutzer einer
Anwendung (Word) auswertet, daraus ein Fähigkeitenprofl entwickelt und entsprechen-
de Tipps für die Nutzung (und das weitere Lernen) gibt. Aktuelle Forschung beschäfigt
sich mit den Möglichkeiten, wie sinnvolle und hilfreiche Empfehlungen für das Lernen
gegeben werden können und dabei gleichermaßen die vielen frei verfügbaren Quellen
als auch das Wissen im sozialen Netz bzw. in der Community genutzt werden können.
Überlegungen, wie Empfehlungssysteme bei der Unterstützung von Lernenden im Web
eingesetzt werden können, werden so u.a. in der Gesundheitserziehung vorgenommen
(Fernandez-Luque, Karlsen & Vognild, 2009). Im Rahmen seiner Doktorarbeit hat der Er-
stautor ein existerendes System entwickelt das versucht, die Quellen zu nutzen und ent-
sprechende Empfehlungen für Lernende zu geben, der MyHealth-Service38.
Auch wird versucht, das Wissen über Lerneinheiten und -Wege, das in Ontologien und
Metadaten beschrieben ist, mit den Erfahrungen von bestmmten Lernergruppen zu
kombinieren. Spannend ist auch der Versuch, das persönliche E-Portolio der Lerner, also
ihre Sammlung von Texten über ihre Lernerfolge und -ergebnisse, automatsch auszu-
werten, um so eine Einschätzung ihres Vorwissens zu erhalten. Das Ziel ist dabei, ihnen
so gezielte Lernempfehlungen geben zu können, ohne beispielsweise Wissenstests
durchführen zu müssen. Zu dieser Fragestellung haben wir Marco Kalz befragt, der seine
Dissertaton in diesem Fachgebiet abgeschlossen hat (Kalz, 2009).

37
htp://www.pwm.at, Stand 02/2010
38
htp://myhealthservice.itek.norut.no, Stand 12/2009

64
Marco Kalz zur automatschen Vorwissensanalyse

? Auf welche Weise haben Sie das Vorwissen der Lernenden analysiert?

! Wir haben dazu die Texte in den E-Portolios der Lernenden einer Analyse unterzo-
gen Zum Einsatz kam dabei die Latent Semantsche Analyse (LSA, früher auch Latent
Semantsches Indexieren oder LSI genannt). Das ist ein statstsches Verfahren zur
Berechnung von Ähnlichkeit von Texten. Im Unterschied zu Verfahren, die auf Key-
words oder klassischen Thesauri basieren umgeht LSA die Probleme der Poly-
semie/Homonymie (Ein Wort mit unterschiedlichen Bedeutungen). Die Methode berechnet statstsch
das Aufreten von Wörtern im Kontext von anderen Wörtern. Dazu werden Texte zu Beginn in eine
Wort-Dokumenten-Matrix zerlegt, in der das Aufreten von Wörtern gezählt wird. Mit Hilfe der mathe-
matschen Methode der Singulärwertzerlegung wird diese Matrix in 3 einzelne Matrizen zerlegt. Das Er-
gebnis des Prozesses ist ein multvektorieller reduzierter semantscher Raum, in dem man neue Doku-
mente über deren Vektor in diesem Raum mit dort vorhandenen Dokumenten (auch repräsentert als
Vektoren) vergleichen kann. In unserem Fall hat das Verfahren brauchbare Ergebnisse geliefert!

? Haben Sie die Ergebnisse Ihrer automatschen Auswertung von E-Portolios von Lernenden mit tradi-
tonellen Verfahren der (Vor-) Wissensanalyse verglichen?

! Unter traditonellen Verfahren von Wissensanalysen sehe ich in erster Linie Tests, um relatv objektve
Ergebnisse über das Wissen einer Person über bestmmte Aspekte einer Wissensdomäne zu erlangen.
Da wir ein Verfahren evaluieren wollten, bei dem keine zusätzlichen organisatorischen oder personellen
Belastungen für die Experten hinzukommen, kam ein Vergleich mit klassischen Tests für uns nicht in Fra-
ge.

? Auf welche Weise erhalten Lernende mit einem so erstellten Vorwissensprofl dann Lernempfeh-
lungen?

! LSA kann dazu genutzt werden, um Inhalte aus Lernaktvitäten mit Inhalten von Lernerdokumenten zu
vergleichen. Auf Basis dieser Ähnlichkeit lassen sich so z.B. redundanten Aktvitäten identfzieren und
aus einem personalisierten Curriculum enternen. Je nach Basis von vorhandenen Referenzbeispielen
wäre es aber ebenso gut möglich, in Zukunf sehr detaillierte Empfehlungen über ein ideales Curriculum
zu geben. Hier würde man methodisch so wie bei der automatsierten Bewertung von Essays vorgehen.

? Welche Ratschläge möchten Sie anderen Entwicklern von Empfehlungssystemen für die automatsche
Auswertung von E-Portolios von Lernenden geben?

! Besonderer Forschungsfokus sollte in Zukunf auf Methoden liegen, informell erworbenes Wissen und
Kompetenzen zu analysieren anstat sich auf XML-Formate für die Auswertung von Zertfkaten zu kon-
zentrieren.

Dr. Marco Kalz arbeitet als Erziehungswissenschafler bei CELSTEC, der Forschungseinrichtung der Open
Universiteit Nederlands und hat dort im Jahr 2009 erfolgreich seine Dissertaton zum Thema „Placement
support for learners in learning network“ abgeschlossen. Ein kompletes Profl fndet sich auf seiner Ho-
mepage htp://marcokalz.de (02/2010).

65
Weitere Empfehlungssysteme im Einsatz
Abschließend noch eine Sammlung von weiteren Einsatzgebieten und Empfehlungssys-
temen, die bisher nicht angesprochen wurden:
| Populär und hilfreich sind die Empfehlungen der webbasierten Kartendienste bei
Google-Maps39 oder Map2440. Hier können Abfahrtsort und Ziel angegeben werden
und es werden die kürzesten (und andere, z. B. die schnellsten) Fahrtstrecken be-
rechnet, angezeigt und beschrieben.
| Für die Sofwareentwicklung wurden Systeme entwickelt, die bei der Fehleranalyse
Unterstützung bieten, in dem zum Beispiel auf typische Fehler in der spezifschen Si-
tuaton hingewiesen werden. Der DebugAdvisor ist ein Beispiel hierfür (Ashok u.a.
2009).
| Kamper, Meyer & Reichart (2008) haben ein Empfehlungssystem für Konferenzbesu-
cher entwickelt, das Vorschläge für Sessions und Workshops aufgrund der Buchun-
gen ähnlicher Konferenzteilnehmer gibt.
| Nachrichtenanbieter verweisen auf ihren Seiten gerne auf verwandte Texte, z. B. bei
der Deutschen Handwerkszeitung41.

39
htp://maps.google.de/maps, Stand 02/2010
40
htp://www.de.map24.com, Stand 02/2010
41
htp://www.deutsche-handwerks-zeitung.de, Stand 02/2010

66
67
4 ENTWICKLUNG VON EMPFEHLUNGSSYSTEMEN
Empfehlungssysteme können entscheidend für den Erfolg einer Anwendung sein. Im Fol-
genden haben wir Hinweise zusammengestellt, die bei der Entwicklung eines neuen
Empfehlungssystems hilfreich sind.

4.1 Entwicklung im Überblick


Im Folgenden wurden einige grundlegende Überlegungen zur Entwicklung von Empfeh-
lungssystemen zusammengestellt (in Anlehnung an Schafert & Wieden-Bischof, 2009;
Klahold, 2009). Wichtg erscheinen dabei eine Festlegung von Zielen und Zwecken des
Empfehlungssystem, eine konzeptonelle Beschreibung und eine (erste) Implemente-
rung für Testzwecke. Dann wird empfohlen, mögliche Varianten zu testen und zu verglei-
chen, dazu stellen wir in diesem Abschnit insbesondere die Evaluatonsmöglichkeiten
von Empfehlungssystemen hin. Auf Grundlage dieser Überprüfungen können einige Pro-
zesse neu aufgerollt und wiederholt durchlaufen werden.

Abbildung 25: Entwicklung von Empfehlungssystemen im Überblick

4.2 Aktve Einbindung von Nutzern


Diese Broschüre entstand in Rahmen eines Projektes, dass sich mit neuen Formen der
Unterstützung von Communitys beschäfigt oder auf Informatonen, die in Communitys
entstehen, beruht. Bei den anderen Projektveröfentlichungen zum Aufau von Online-
Communitys sowie zur Entwicklung von Reputatonssystemen handelt es sich jeweils um
Systeme, die eine starke Community-Einbindung auch bei der Entwicklung notwendig
machen. „Wachsen lassen“ lautet eines der generellen Prinzipien im Umgang mit Com-
munitys, was eine starke Einbindung voraussetzt (vgl. Schafert & Wieden-Bischof,
2009). Bei der Entwicklung von Reputatonssystemen wird diese Einbindung von Exper-
ten weniger häufg angesprochen. Technologische und methodische Entscheidungen
treten in der Literatur zur Entwicklung von Empfehlungssystemen deutlich stärker in den
Vordergrund. Es ist jedoch anzunehmen, dass dies vor allem daran liegt, dass die Beiträ-
ge eher von Technologen geschrieben werden. Dort wo tatsächliche Implementerungen
erfolgen zeigt die Praxis, dass die Nutzer of eingebunden werden.
Eine Einbindung der Nutzer bei der Entwicklung erscheint aus unserer Sicht unbedingt
empfehlenswert:

68
Ein Beitrag von Turof und Hiltz (2008) zeigt exemplarisch am Beispiel einer Erkundungs-
studie für die Bedürfnisse von Notallmedizinern, wie bei der Planung und Entwicklung
eines Empfehlungssystem unter Einbindung von Nutzern vorgegangen werden könnte.
Ihr Beitrag beurteilt den Informatonsbedarf dieser Zielgruppe. 34 Experten die Mitglie-
der einer Online-Community sind, wurden dazu befragt. Turof & Hiltz eruieren auf diese
Weise erstaunlich konkrete und brauchbare Vorschläge und Wünsche der Nutzer, bei-
spielsweise dass
| die Nutzer das Filtern und Organisieren des Materials kontrollieren wollen
| die Nutzer mehr professionelle Hilfe bei ihrer Informatonssuche erwarten
| auch graue Literatur eingebunden wird und bewertet werden kann
| eigene Best-Practces dargestellt und bewertet werden kann sowie
| dass Social Tagging erwünscht ist.
Auch wenn Empfehlungssysteme „fertg“ entwickelt sind, sollten Nutzer ernstgenom-
men werden: So zeigen Befragungen, dass Nutzer gegenüber Empfehlungen, deren
Grundlage sie kennen bzw. einschätzen können, größeres Vertrauen haben (Sinha &
Swearingen, 2002). Es gibt sogar Anwendungen, bei denen Nutzer ihre Empfehlungen
bzw. die Arten ihrer Empfehlungen selbst steuern können (z. B. Memmel, Kockler & Schi-
iru, 2009). Zudem weist Hendrik Drachsler in seinem Expertenstatement darauf hin
(S. 57), dass Nutzer v. a. Wert auf den Schutz ihrer persönlichen Daten legen. Transpa-
renz sollte also im Hinblick auf die Quelle der Empfehlung als auch im Hinblick auf den
Umgang mit den Daten der Nutzer bestehen (siehe auch Schickel-Zuber, 2007, 10).

4.3 Ziel und Zweck des Empfehlungssystem


Bereits in Abschnit 2.1 (S. 13) haben wir unterschiedliche mögliche Ziele und Zwecke
des Empfehlungssystems genannt. Die Betreiber einer Services sollten die genannten
Punkte diskuteren und ggf. durch weitere Beweggründe erweitern. Das verfolgte Ziel
klar zu benennen ist wichtg, weil es beispielsweise nicht nur die Gestaltung der Nutze-
roberfäche beeinfusst, sondern auch ganz grundsätzlich die Wahl des technologischen
Verfahrens des Empfehlungssystems beeinfusst. Beispielsweise würde ein kollaborat-
ves Filtern bei einem Partnerschafsportal wohl die Benutzer irriteren („Frauen, denen
dieser Mann gefallen hat, haten auch Gefallen an ...“).

4.4 Konzeptonelle Beschreibung


Bezogen auf die drei Bereiche des Konzeptes, nämlich die Daten, die Anwendung sowie
die Präsentaton können folgende Hinweise gegeben werden.

69
Abbildung 26: Schichten von Empfehlungssystemen im Überblick

(a) Bei den Daten sollte sich das System möglichst mit vorhandenen Daten begnügen.
Das bedeutet, dass komplizierte oder lange Fragebögen vermieden werden sollen und
bevorzugt aus der Verhaltenshistorie Schlüsse für Interessen gezogen werden sollten.
Das Verfahren sollte also möglichst genügsam sein (vgl. Schickel-Zuber, 2010, 10).
(b) Bezogen auf die Anwendungen lassen sich folgende Empfehlungen geben: Zunächst
muss die Anwendung möglichst präzise Empfehlungen zu geben. Konkrete Überprü-
fungsmöglichkeiten beschreiben wir in Abschnit 4.6 (S. 71). Zudem muss die Anwen-
dung auch skalierbar sein, d.h. sie muss mit denkbar grossen Mengen an Nutzern und
Objekten zurecht kommen. Für welches Verfahren man sich entscheidet, ist auch eine
Frage der damit verbundenen Ziele und Zwecke (s.o.). Anregungen lassen sich dabei von
den Empfehlungssystemen in dieser Studie holen, zweckmäßig ist dabei auch, die Vor-
und Nachteile der Verfahren durchzugehen und eigene Kombinatonen der Verfahren zu
entwickeln (S. 28f).
(c) Im Bezug auf die Präsentaton der Empfehlungen ergibt sich aus dieser Studie keine
besonders aufregende oder aus dem Rahmen fallende Darstellungen. In der Regel wer-
den Empfehlungen am Seitenrand oder in Listenform gegeben, wenn möglich, mit einer
passenden Illustraton. Allerdings kann unter dem Aspekt der Präsentaton überlegt wer-
den, ob und welche Formen der Modifkaton man den Betreibern sowie auch den Nut-
zern überlässt: Können beispielsweise die Auswahl der Empfehlungen, die Algorithmen
oder die Darstellung beeinfusst werden? Es ist anzunehmen, dass zumindest für einige
Nutzer hier Einfussmöglichkeiten erwünscht sind. Beispielsweise liesse sich so denken,
dass Amazon-Kunden in ihrem Nutzerprofl auch Neuerscheinungen aus einem be-
stmmten, von ihnen zu wählenden Gebiet eingeblendet bekommen. Zum Abschnit der
Präsentaton gehört auch der Hinweis von Hendrik Drachsler, dass zunehmend Widgets-
und Plugin-Interfaces mitgedacht werden sollten. Auch an RSS-Feeds, E-Mail-Services
oder Einbindungen in Facebook und ähnliche soziale Netzwerke sind ggf. zu überdenken.
Schließlich ist bei der Präsentaton des Empfehlungssystems darauf zu achten, dass Vor-
lieben der Nutzer nur für sie einsehbar sein sollten (Schickel-Zuber, 2007).

4.5 Implementerung
In den bisherigen Ausführungen und Beschreibungen haben wir die Implementerung ei-
nes Empfehlungssystems in eine vorhandene Anwendung nicht weiter thematsiert.
Auch haben wir dazu keine spezifschen Hinweise erhalten, was konkrete Gefahren und
Begleitmaßnahmen belangt. In diesem Zusammenhang sei aber noch einmal darauf hin-

70
gewiesen, dass eine frühzeitge Einbindung der Nutzer zu empfehlen ist, ein Schutz der
privaten Daten jederzeit gewährleistet muss und von Anfang an Transparenz über die
genutzten Daten und Verfahren hergestellt sein muss. Entsprechende Informatonen
und Materialien müssen bei der Einführung also bereits vorliegen.
Bevor ein Empfehlungssystem in den Realbetrieb geht, sollte es ausgiebig erprobt und
getestet werden. Unterschiedliche Algorithmen, z. B. unterschiedliche Verfahren, Kom-
binatonen oder Gewichtungen, sollten systematsch erprobt und verglichen werden.
Der folgende Abschnit stellt mögliche Vorgehen vor.

4.6 Evaluaton: Überprüfung der Qualität und Nützlichkeit von Empfehlungen


Wie lassen sich Empfehlungssysteme bewerten? Die Qualität einer Empfehlung lässt
sich nur dann eindeutg bewerten, wenn es anerkannte Maßstäbe und Richtlinien für
eine qualitatv hochwertge Empfehlung gibt.

Bewertung von Empfehlungen durch Befragungen


Relatv einfach können Empfehlungssysteme bewertet werden, bei denen die korrekten
bzw. optmalen Lösungen eindeutg und bekannt sind. Ein Beispiel hierfür ist eine Rou-
tenempfehlung, wo die Qualität anhand von Kilometern oder Fahrzeit festgemacht wer-
den kann. Wenn ein System die besten Empfehlungen gibt, arbeitet es optmal.
Auch nicht eindeutge Empfehlungen verlangen jedoch nach einer Überprüfung ihrer
Qualität. Auch für sie wurden spezifsche Qualitätskriterien entwickelt, um objektv ihre
Brauchbarkeit zu überprüfen. Klahold (2009) geht dabei auf Möglichkeiten der Evaluat-
on durch Befragungen ein (S. 37f).
| Eine Möglichkeit der Überprüfung ist die Bewertung der Empfehlungen im Hinblick
auf ihre Nützlichkeit aus Nutzersicht. Allerdings sind dazu ausreichend viele Nutzer zu
befragen..
| Zudem kann das Empfehlungssystem systematsch mit Empfehlungen von Experten
verglichen werden. Dazu müssen Experten auf Grundlage der zu empfehlenden Ob-
jekte Empfehlungen abgeben. Die Ähnlichkeit der Empfehlungen des Systems sowie
der Empfehlungen der Experten kann wiederum berechnet werden und als Maßstab
hergenommen werden. Eine Übereinstmmung von 100 Prozent ist hier die Zielgrö-
ße.

Bewertung von Algorithmen durch Analysen mit Testdaten


Bei der Entwicklung von Empfehlungssystemen gilt es häufg einen Vergleich unter-
schiedlicher Algorithmen und Verfahren vorzunehmen. Es ist dazu jedoch nicht zwangs-
läufg notwendig, wie bei Klahold (2009) beschrieben, Nutzer- oder Expertenbefragun-
gen durchzuführen.
Wenn beispielsweise Einschätzungen der Nutzer über (zu empfehlende Elemente) oder
ein paar Erkenntnisse über ihr Nutzerverhalten vorliegen, ist das folgende Verfahren
möglich: Man greif darauf zurück, dass ein Empfehlungssystem „versucht, die Bewer-
tung vorherzusagen, die der Nutzer dem Objekt geben würde, falls er es nach der Be-
nutzung selbst bewerten müsste“ (Sorge, 2009, 19). Dazu berechnet man mit Hilfe der
Algorithmen Bewertungen von Objekten die (eigentlich) bereits bekannt sind und ver-
gleicht das Ergebnis mit der tatsächlichen Bewertung.

71
Dieses Vorgehen wird anhand der Evaluaton unterschiedlicher Empfehlungsalgorithmen
bei Shardanand und Maes (1995) genauer beschrieben: Ziel der Untersuchung war es,
den besten Algorithmus für ein Empfehlungssystem für Musik auszuwählen. Basis für
Empfehlungen sind dabei die Nutzerbewertungen von Musikstücken und ein kollaborat-
ves Filtern. Jedes Musikstück wird auf einer Skala von 1 („pass my earplugs“) bis 7 („one
of my favorite few! can't live without them!!“) bewertet.
Für die Evaluaton der Empfehlungsalgorithmen wurden in 1.000 Nutzerproflen je 20
Prozent der bereits bewerteten Musikstücke in einem Nutzerprofl herausgenommen
und als Zielmenge bestmmt. Die übrigen 80 Prozent der bewerteten Musikstücke wur-
den genommen, um daraus zu berechnen, welche Bewertung die Stücke aufgrund des
verwendeten Algorithmus in der vorher bestmmten Zielmenge für jeden Nutzer erhal-
ten würden. Diese errechnete Bewertung wird mit der tatsächlichen Bewertung des Be-
nutzers verglichen.
Dabei kann untersucht (und verglichen) werden, inwieweit die Bewertungen durch die
Algorithmen mit den tatsächlichen abweichen: Dabei sollten Mitelwert und Streuung
der Fehler möglichst klein sein sollten: So sollte die Bewertung nicht nur im Mitel mög-
lichst korrekt geschätzt werden, sondern auch möglichst selten (hoch) abweichen. Weil
nicht mit jedem Algorithmus gleichermaßen für jeden Fall Werte berechnet werden kön-
nen, ist zudem zu untersuchen, wie hoch der Prozentsatz zu schätzender Werte ist (sie-
he Shardanand & Maes, 1995). Auf diese Weise ist es – vorausgesetzt, entsprechende
Nutzerdaten liegen vor – sehr gut möglich (unterschiedliche) Algorithmen zu bewerten.

Kennzahlen für Empfehlungssysteme: Precision, Recall und Novelty


Eben genannt wurden die mitleren Fehler und die Standardabweichung für Fehler bei
Empfehlungen sowie der Prozentsatz des Anteils, zu dem ein Algorithmus überhaupt
Empfehlungen berechnen kann (s.o.).
Im Bereich der Empfehlungssysteme gibt es darüber hinaus zwei spezifsche Größen, die
bei der Einschätzung der Qualität eines Systems berechnet werden können (Herlocker
u.a., 2004). Sie werden „Precision“ und „Recall“ genannt. Precision (Englisch für „Präzisi-
on“) ist dabei der Anteil der relevanten Empfehlungen an den empfohlenen Objekten.
Recall (Englisch für „Aufruf“) ist der Anteil der empfohlenen Elemente an den relevanten
Elementen. Anhand einer Darstellung lässt es sich leichter darstellen, wie sich diese bei-
den Maßstäbe unterscheiden.

Abbildung 27: Grundlagen für die Berechnung von Recall und Precision
Quelle: Abbildung nach einer Darstellung in Klahold, 2009, 40.

72
Dazu das Berechnungsbeispiel aus Klahold (2009): „Gibt es beispielsweise 10 relevante
Empfehlungselemente und sind unter 15 empfohlenen Elementen 5 relevante, so hat
Precision einen Wert von 33% und Recall einen Wert von 50%“ (S. 41).
Zwar geben die beiden Maßzahlen Prozentangaben an, die eine gewisse Exaktheit vor-
spiegeln. Da die beiden Maßzahlen jedoch wiederum auf Daten beruhen, die mit obigen
Verfahren erfasst wurden, ist ihre Genauigkeit und Brauchbarkeit nicht von vornherein
gegeben.
Neben der Genauigkeit muss ein System auch wirklich neue und nicht einfach nahe lie-
gende Empfehlungen geben (Schickel-Zuber, 2007, 17): Wenn jemand den Kinoflm über
Harry Poter und den Orden der Phönix gesehen hat, wäre es auf den ersten Blick sinn-
voll, ihm auch die ersten vier Harry-Poter-Filme zu empfehlen. Allerdings ist die Wahr-
scheinlichkeit groß, dass er sie eh schon kennt.
Die Neuartgkeit (Engl. „Novelty“) einer Empfehlung zu überprüfen ist im Zweifel nur
durch Befragungen der Nutzer feststellbar. Trotzdem gibt es Algorithmen, die die Neuar-
tgkeit der Empfehlungen bewerten lassen (s. Schickel-Zuber, 2007, 19; er verweist auf
Equaton 2.4): Die Neuartgkeit wird dabei erudiert, in dem berechnet wird, wieviele der
Empfehlungen auch in den allgemeinen Empfehlungen der Community aufreten. Je
mehr es sind, desto weniger neuartg ist erwartungsgemäß eine Empfehlung für einen
Nutzer.

73
5 AUSBLICK
Ausgangslage der Studie und dieses Bandes war das Fehlen eines deutschsprachigen
Buchs über aktuelle Empfehlungssysteme im Web. Es gab keine Darstellung mit dem
Ziel, einen Überblick zu vorhandenen Systemen und Verfahren zu geben und das The-
mengebiet eher allgemeinverständlich auch für Betreiber und Manager von Webanwen-
dungen und Systemen darzustellen.
Darauf auf mangelndes Interesse am Thema zu schließen, wäre jedoch falsch: Im Gegen-
teil, das Interesse ist groß und wuchs in den letzten Jahren enorm. So hat die Zahl der
wissenschaflichen Veröfentlichungen rasant zugenommen: In der einschlägigen DLPB-
Literaturdatenbank42 für das Jahr 1995 sind 29 Trefer für „recommender“ zu fnden, für
1998 38, 2000 bereits 134, 2003 dann 318, im Jahr 2005 sind es 508 und für das Jahr
2008 sind es dann sogar 1.001 verzeichnete Veröfentlichungen zum Thema. Auch wäh-
rend wir an dieser Studie arbeiteten, haben wir beispielsweise immer wieder auf die
Lieferzeiten eines englischsprachigen Handbuchs geschielt, dass nun im April 2010 er-
scheinen soll und verspricht, eine gute Übersicht über Empfehlungssysteme zu geben
(Kantor u.a., im Druck).
Es ist anzunehmen, dass dieses Forschungsinteresse auch mit Erwartungen und Interes-
se der Wirtschaf im Zusammenhang steht und dadurch weitere Experimente und Inno-
vatonen in diesem Bereich zu erwarten sind. Viele Anwendungsbereiche werden dabei
gerade erst entdeckt. Besondere Anwendungsfälle liegen hier insbesondere bei den So-
cial-Media-Systemen, da man hier viele Nutzerinformatonen, enorm viele Inhalte und
auch einen besonderen Bedarf hat, die Übersicht zu behalten. Auch ist zu erwarten,
dass beispielsweise die Entwicklungen zu Linked Data, die Soziale Netzwerkanalyse von
Webdaten oder auch neue Community-Anwendungen Anregungen für bessere oder
neuartge Empfehlungssysteme bieten. Auch neue technische Konzepte sind denkbar:
Mit der Idee, die Daten eines Empfehlungssystem nicht auf zentralen Servern zu spei-
chern, erörtert Sorge (2008) so die Möglichkeiten von Peer-to-Peer-Systemen.
Gleichzeitg gehen wir davon aus, dass mit der intensiven Verwendung und Analyse un-
ter Umständen auch eine erhöhte Aufmerksamkeit der Öfentlichkeit über die Verwen-
dung von persönlichen Daten entstehen könnte und hier entsprechende eher sozialwis-
senschafliche und rechtliche Fragestellungen zu bearbeiten sind.
Natürlich muss ein Buch, dass soviel über Empfehlungssysteme berichtet, auch mit einer
Empfehlung enden: Zu diesem Band fnden sich auch weitere Materialien im Web, u.a.
ein Video43. Und natürlich könnten Sie auch die weiteren Veröfentlichungen des Projek-
tes interessieren: Zum erfolgreichen Aufau von Online-Communitys, zu (Meta-) Infor-
matonen aus Communitys und Netzwerken sowie zu Feedback und Reputatonssyste-
men (siehe letzte Seite).

42
htp://dblp.l3s.de/?q=recommender&search_opt=all&newQuery=yes&resTableName=
query_resultQpXzHt&synt_query_exp=full, Stand 02/2010
43
erreichbar via htp://www.newmedialab.at, Stand 02/2010

74
75
LITERATUR UND QUELLEN
| Armstrong, Robert; Freitag, Deyne; Joachims, Thorsten & Mitchell, Tom (1995). Webwatcher: A lear-
ning apprentce for the world wide web. In: AAAI Spring Symposium on Informaton Gathering from Hete-
rogeneous, Distributed Environments, Standford, USA.
| Ashok, B.; Joy, Joseph; Liang, Hongkang; Rajamani, Sriram K.; Srinivasa, Gopal & Vangala, Vipindeep
(2009). DebugAdvisor: a recommender system for debugging. In: Proceedings of the the 7th joint meetng
of the European sofware engineering conference and the ACM SIGSOFT symposium on The foundatons of
sofware engineering; Amsterdam, The Netherlands, 373-382.
| Balabanovic, Marko & Shoham, Yoav (1997). Fab: content-based, collaboratve recommendaton. Onli-
ne zugänglich unter: htp://portal.acm.org/citaton.cfm?
id=245124&dl=GUIDE&coll=GUIDE&CFID=75884622&CFTOKEN=61674452 (2010-02-01)
| Beier, Heiko & Blumauer, Andreas (2004). Arbeitsplatz der Zukunf auf der Platorm Wissensmanage-
ment. Wissensmanagement Magazin, Büro für Medien, Oliver Lehnert (Hrsg.), Ausgabe 01/2004.
| Block, Amke & Pohl, Gerrit (2006). Musik im Internet. Deutscher Musikrat, Bonn. Online zugänglich un-
ter: htp://www.zukunfsmusik.net/db/upload/pdf/blockpohl.pdf (2010-01-24)
| Brand-Haushofer, Richard (2005). Recommender Systeme in digitalen Bibliotheken. Bakk. Arbeit. Inst-
tut: Informatonsverarbeitung., Abt. f. Informatonswirtschaf. Wien, Wirtschafsuniv.. Online zugänglich
unter: htp://epub.wu-wien.ac.at/dyn/virlib/bakkWI/showentry?ID=epub-wu-01_93d&style=aihtml (2010-
01-04)
| Buston, Peter M. & Emlen, Stephen T. (2003). Cognitve processes underlying human mate choice: The
relatonship between self-percepton and mate preference in Western society. Online zugänglich unter:
htp://www.pnas.org/content/100/15/8805.full.pdf+html (2010-02-07)
| Claypool , Mark; Gokhale, Anuja; Miranda, Tim; Murnikov, Pavel; Netes, Dmitry & Sartn, Mathew
(1999). Combining Content-Based and Collaboratve Filters in an Online Newspaper. Online zugänglich un-
ter: htp://web.cs.wpi.edu/~claypool/papers/content-collab/content-collab.pdf (2010-02-02)
| Cummins, Ronan & O’Riordan, Colm (2006). Evolving local and global weightng schemes in informat-
on retrieval. In: Informaton Retrieval, 9, 311-330.
| Derntl, Thomas; Hampel, Thorsten; Motschnig, Renate & Pitner, Tomas (2009). Social Tagging und In-
clusive Universal Access. In: Birgit Gaiser, Thorsten Hampel & Stephanie Panke (Hrsg.), Good Tags – Bad
Tags. Social Tagging in der Wissensorganisaton, Münster: Waxmann, 51-71.
| Dolog, Peter (2009). Tag Based Recommendaton in KIWI. OntologSession, 12 February 2009. Online
zugänglich unter: htp://ontolog.cim3.net/fle/work/SemantcWiki/SWiki-05_Applicaton-2_20090212/Tag-
based-Recommendatons-in-KIWI--PeterDolog_20090212.pdf (2010-02-18)
| Duan, Lian; Street, W. Nick & Lu, Der-Fa (2008). A Nursing Care Plan Recommender System using a data
mining approach. In: Proceedings of the 3rd INFORMS Workshop on Data Mining and Health Informatcs.
| Economic Expert (2010). MovieLens. Online zugänglich unter: htp://www.economicexpert.com/a/Mo-
vieLens.html (2010-02-09)
| Färber, Frank; Weitzel, Tim; Keim, Tobias & Wendt, Oliver (2002). A model-based approach to recom-
mending partners. In: Wirtschafsinformatk (1) 2003: 447-466.
| Fernandez-Luque, Luis; Karlsen, Randi & Vognild, Lars K. (2009). Challenges and Opportunites of Using
Recommender Systems for Personalizes Health Educaton. In: Medical Informatcs in a United and Healthy
Europe.
| Fischer, Gerhard; Stevebs Curt (1991). INFOSCOPE – Informaton access in complex poorly structured
informaton spaces. In: Proceedings of the SIGCHI conference on Human Factors in Computng Sytems: Re-
aching through technology, New Orleans, US, 63-70.
| Friendscout24 (2002). FriendScout24: dann klappt's auch mit dem Partner! FriendScout24 startet wis-
senschaflichen Kompatbilitäts-Test. Neues Verfahren fndet den idealen Partner. Online zugänglich unter:
htp://www.presseportal.de/pm/19470/342487/friendscout24 (2010-02-06)

76
| Fu, W.; Budzik, J. Hammond, K.J. (2000). Mining Navigaton History for Recommendaton. In: Procee-
dings of the internatonal confernce for intelligent user interfaces, New Orleans, US, 106-112.
| Gams, Erich & Reich, Siegfried (2004). Following your colleagues footprints:Navigaton support with
trails in shared directories. In: Proceedings of the 04 ACM Conference on Hypertext, August 9-13, Santa
Cruz, California, USA.
| Gams, Erich (2005). Following your Colleagues’ Footprints: Assistng Navigaton with User Trails. Dis-
sertaton an der Johannes Keppler Universität Linz.
| Glachs, Dietmar & Osterrieder, Christan (2006). Bringing Marketng to Tourist Stakeholders. Recom-
mender Engine for Tourist Organizatons. In: Proceedings of the IWWPST '06.
| Givon, Sharon & Lavrenko, Viktor (2009). Predictng social-tags for cold start book recommendatons.
In: Proceedings of the third ACM conference on Recommender systems table of contents, New York, USA,
333-336.
| Herlocker, J., Borchers, A., Konstan, J., and Riedl, J. (1999). An algorithmic framework for performing
collaboratve fltering. In Proceedings of the 22nd annual internatonal ACM SIGIR conference on Research
and development in informaton retrieval, SIGIR’1999, pages 230-235.
| Goldberg, David; Nichols, David; Oki, Brian & Terry, Douglas (1992). Using collaboratve fltering to
weave an informaton tapestry. Communicaton of the ACM, 35, 12, 61-70.
| Goldberg, Ken; Roeder, Theresa; Gupta, Dnruv & Perkins, Chris (2000). Eigentaste: A Constant Time
Collaboratve Filtering Algorithm. In: Informaton Retrieval, 4, 2, 133-151.
| Good, Nathaniel; Schafer, Ben J.; Konstan, Joseph A.; Borchers, Al; Sarwar, Badrul; Herlocker, Jon &
Riedl, John (1999). Combining Collaboratve Filtering with Personal Agents for Beter Recommendatons.
Online zugänglich unter: htp://www.grouplens.org/papers/pdf/aaai-99.pdf (2010-02-02)
| Graf, Joachim (2009). Start des iBusiness 'Search Advertsing Index': Hoher Werbedruck im SEM-Markt.
In: iBusiness Executve Summary, 19, 8, 15.
| Güntner, Georg; Sint, Rolf & Westenthaler, Rupert (2009). Ein Ansatz zur Unterstützung traditoneller
Klassifkaton durch Social Tagging. In: Birgit Gaiser, Thorsten Hampel & Stephanie Panke (Hrsg.), Good Tags
– Bad Tags. Social Tagging in der Wissensorganisaton, Münster: Waxmann, 187-199.
| heise online (2001). Datenbank für ‘Gene der Musik’. Online zugänglich unter:
htp://www.heise.de/newstcker/meldung/Datenbank-fuer-Gene-der-Musik-41794.html (2010-01-25).
| Henze, N. (2008). Personalisierung und Benutzermodellierung. Recommender Systeme I. Collaboratve
Recommender Systeme. Online zugänglich unter: htp://www.kbs.uni-hannover.de/Lehre/pers08/recom-
mender1.pdf (2010-02-09)
| Herzog, Christan & Dix, Jörg (2009). BioMedExperts – Connectng Brains. Online zugänglich unter:
htp://www.telemedizinfuehrer.de/index.php?opton=com_content&task=view&id=463&Itemid=62 (2010-
02-09)
| Heymann, Martn (2004). Recommender Systeme in Theorie und Praxis. Seminararbeit an der Johann
Wolfgang Goethe Universität Mainz. Online zugänglich unter: htp://www.is-frankfurt.de/uploads/dow-
n271.pdf (2010-01-23)
| Kaas, Klaus-Peter und Schneider, Tobias (2007). Ein präferenzbasiertes Recommender System für In-
vestmentonds. In: Tomás Bayón, Andreas Herrmann und Frank Huber (Hrsg.), Vielfalt und Einheit in der
Marketngwissenschaf. Ein Spannungsverhältnis, Gabler, 499-521.
| Kamper, Gerald; Meyer, Ludwig & Reichart, Martn (2008). Recommendaton Systeme. Social Network
Day, 31.5.2008, TU Wien. Online zugänglich unter: htp://www.ansna.org/konferenz_papers/recommenda-
ton.pdf (2010-01-15)
| Kalz, Marco (2009). Placement Support for Learners in Learning Networks. SIKS Dissertaton Series.
| Kantor, Paul B.; Ricci, Francesco; Rokach, Lior & Shapira, Bracha (in Druck). Recommender Systems
Handbook. New York: Springer.
| Kim, Juntae (2006). What is a recommender system? Proceedings of Recommenders 06, 12.-13.9.2006,
Bilbao. Zitert in Drachler (2009), nicht mehr online zugänglich.

77
| Klahold, André (2009). Empfehlungssysteme: Recommender Systems – Grundlagen, Konzepte und Lö-
sungen. Wiesbaden: Vieweger + Teubner.
| Klambauer, Kerstn (2008). Virtuelle Liebe. Psychologische Determinanten bei der Partnersuche im In-
ternet. Online zugänglich unter: htp://www.kramurlozly.at/psychologie/psychologie_downloads/Mag-
KlambauerVirtuelleLiebe.pdf (2010-02-06)
| Knoth, Petr; Schmidt, Marek & Smrž, Pavel (2008). Informaton Extracton — State-of-the-Art. Know-
ledge in a Wiki (KiWi), Deliverable 2.5. htp://wiki.kiwi-project.eu/multmedia/kiwi-pub: KiWi_D2.5_f-
nal.pdf (2009-09-02)
| Kockler, Michael (2008). Concepton and Implementaton of Tagging Support Mechanisms in a Web 2.0
Social Media Sharing Platorm. Diplomarbeit an der Technischen Universität Karlsruhe.
| Krulwosh, B. & Burkey, C. (1997). The InfoFinder Agent: Learning User Interests through Heuristc Phra-
se Extracton. In: IEEE Expert/Intelligent Systems and Their Applicatons, 12, 5, 22-27.
| Lang, K. (1995). News{W}eeder: learning to flter netnews. In: Proceedings of the 12th Internatonal
Conference on Machine Learning, Lake Tahoe, CA, US, 1995.
| Librarything.com (2006). New feature: Tag-based recommendatons. Weblogeintrag vom 1.1.2006. On-
line zugegänglich unter: htp://www.librarything.com/blog/2006/01/new-feature-tag-based-recommenda-
tons.php (2010-01-23)
| Lieberman, Henry (1995). Letzia: An Agent That Assits Web Browsing. In: Proceedings fo the Four-
teenth Internatonal Joint Conference on Artfcial Intelligence, San Mateo, US, 924-929.
| Lieberman, Henry; Van Dyke, Neil W. & Vivacqua, Adriana S. (1999). Let's Browse: A Collaboratve Web
Browsing Agent. Online zugänglich unter: htp://agents.media.mit.edu/publicatons/lets-browse-iui99/pa-
per.pdf (2010-02-02)
| Linden, Greg; Smith, Brent & York, Jeremy (2003), Amazon.com Recommendatons. Item-to-Item Colla-
boratve Filtering. In: IEEE Internet Computng, 7, 1, 76-80. Online zugänglich unter: htp://www.cs.umd.e-
du/~samir/498/Amazon-Recommendatons.pdf (2010-01-25)
| Linden, Greg (2006). Early Amazon: Recommendatons. Online zugänglich unter: htp://glinden.blogs-
pot.com/2006/04/early-amazon-recommendatons.html (2010-01-25)
| Linton, Frank & Charron, Andy (1998). OWL: A Recommender System for Organizaton-Wide Learning.
In: AAAI Technical Report WS-98-08. Online zugänglich unter:
htps://www.aaai.org/Papers/Workshops/1998/WS-98-08/WS98-08-017.pdf (2010-01-24).
| Luhn, Hans Peter (1958). A Business Intelligence System. In: IBM Journal, 2, 4, 314-319.
| Malone, T.W.; Grant, K.R.; Turbak, F.A. (1986). The informaton lens: an intelligent system for informat-
on sharing in organizatons. In: Proceedings of the SIGCHI conference on Human Factors in Computng Sys-
tems, Boston, US.
| Memmel, Martn; Kockler, Michael und Schiiru, Rafael (2009). Providing Mult Source Tag Recommen-
datons in a Social Resource Sharing Platorm. Journal of Universal Computer Science, vol. 15, no. 3, 678-
691.
| Mikeonads.com (2008). Using your browser URL history to estmate gender. Weblogeintrag vom
13.7.2009 htp://www.mikeonads.com/2008/07/13/using-your-browser-url-history-estmate-gender/
(2009-08-12)
| Mishne, Gilad (2006). AutoTag: a collaboratve approach to automated tag assignment for weblog
posts. WWW 2006: 953-954.
| Miyo, Kengo; Nitami, Yuki S.; Kitagawa, Yoichiro & Ohe, Kazuhiko (2007). Development of Case-based
Medicaton Alertng and Recommender System: A New Approach to Prevente for Medicaton Error. In: Stu-
dies in Health Technology and Informatcs, 129, 2, 871-874.
| Mooney, R.J. & Roy, L. (2000). Content-Based Book Recommending Using Learning for Text Catogizat-
on. In: Proceedings of the ffh ACM conference on Digital Libaries, San Antonio, US, 195-204.
| Neumann, Andreas W. (2009). Recommender Systems for Informaton Provides. Designing Customer
Centric Paths to Informaton. Heidelberg: Physica-Verlag.

78
| Nunes, Maria & Cerri, Stefano (2008). Improving Recommendatons by Using Personality Traits in User
Profles. In: Proceedings of I-Know '08 and I-Media '08, Graz, Austria, 92-100.
| Pandora (2010). About The Music Genome Project. Online verfügbar unter:
htp://www.pandora.com/corporate/mgp (2010-01-25)
| Parikh, Nish & Sundaresan, Neel (2009). Buzz-Based Recommender System. Posterbeitrag auf der
WWW-Konferenz in Madrid. Online zugänglich unter: htp://www2009.org/proceedings/pdf/p1231.pdf
(2010-01-14)
| Pazzani, M.; Muramatsu, J. & Billsus, D. (1996). Syskill & Webert: Identfying interestng web sites. In:
Proceedings of the AAAI Spring Symposium on Machine Learning in Informaton Access, Irvine, US.
| Pohl, Wolfgang & Nick, Achim (1999). Machine Learning and Knowledge Representaton in the LaboUr
Approach to User Modeling. Online zugänglich unter: htp://www.cs.usask.ca/um99/Proc/pohl.pdf (2010-
02-02)
| Prediggo (2010). Intelligent Cross Selling Solutons for eShops. Online zugänglich unter: htp://ww-
w.prediggo.com/technology-.html (2010-02-06)
| Rahnenführer, Jörg (2008). Ähnlichkeits-und Distanzmaße. Unterlagen zur Vorlesung „Multvariate Ver-
fahren“ an der TU Dortmund. Online zugänglich unter: htp://www.htw-
saarland.de/Members/grabowski/uebersicht/vl/statstk-material/R_Kap2_neu.pdf/download (2010-01-
04)
| ReadWriteWeb (2009). Four Approaches to Music Recommendatons: Pandora, Mufn, Lala, and eMu-
sic. Online zugänglich unter: htp://www.readwriteweb.com/archives/music_recommendatons_four_ap-
proaches.php (2010-02-07)
| Resnick, P.; Iacovou, N.; Suchak, M.; Bergstrom, P.; Riedl, J. (1994). GroupLens: An Open Architecture
for Collaboratve Filtering of Netnews. In: Proceedings of ACM, Conference on Computer Supported Co-
operatve Work, Chapel, US, 175-186.
| van Rijsbergen, C.J. (1979). Informaton Retrieval, London.
| Rucker, J.; Polanco, M.J. (1997). Siteseer: Personalizes Navigaton for the Web. In: Communicatons of
the ACM, 40, 3, 73-75.
| Salton, G. & McGill, M.J. (1986). Introducton to Modern Informaton Retrieval, New York.
| Schafert, Sandra; Eder, Julia; Hilzensauer, Wolf, Kurz, Thomas; Markus, Mark; Schafert, Sebastan;
Westenthaler, Rupert & Wieden-Bischof, Diana (2009). (Meta-) Informatonen von Communitys und Netz-
werken. Entstehung und Nutzungsmöglichkeiten. Erschienen in der Reihe “Social Media”, hrsg. von Georg
Güntner und Sebastan Schafert, Band 2. Salzburg: Salzburg Research.
| Schafert, Sandra; Hilzensauer, Wolf & Wieden-Bischof, Diana (2009). Social Tagging. In: Sandra Scahf-
fert u.a., (Meta-) Informatonen von Communitys und Netzwerken. Entstehung und Nutzungsmöglichkei-
ten. Erschienen in der Reihe “Social Media”, hrsg. von Georg Güntner und Sebastan Schafert, Band 2.
Salzburg: Salzburg Research, 34-46.
| Schafert, Sandra & Wieden-Bischof, Diana (2009). Erfolgreicher Aufau von Online-Communitys. Kon-
zepte, Szenarien und Handlungsempfehlungen. Erschienen in der Reihe “Social Media”, hrsg. von Georg
Güntner und Sebastan Schafert, Band 1. Salzburg: Salzburg Research.
| Schafert, Sandra; Güntner, Georg; Lassnig, Markus & Wieden-Bischof, Diana (2010). Reputaton und
Feedback im Web. Einsatzgebiete und Beispiele. Erschienen in der Reihe “Social Media”, hrsg. von Georg
Güntner und Sebastan Schafert, Band 4. Salzburg: Salzburg Research.
| Schickel-Zuber, Vincent (2007). Ontology Filtering. Inferring Missing User’s Preferences in eCommerce
Recommender Systems. Thesis an der Ecole Polytechnique Federale de Lausanne. Online zugänglich unter:
htp://vpaa.epf.ch/webdav/site/vpaa/shared/Prix%20de%20recherche%2008/Thesis_3934_Schickel.pdf
[2010-01-23]
| Seo, Y.W. & Zhang, B.T. (2000). Personlized Web-Document Filtering using reinforcement learning. In:
Applied Artfcial Intelligence, 15, 7, 665-668.

79
| Shardanand, Upendra, Maes, Pate (1995). Social Informaton Filtering: Algorithms for Automatng
„Word of Mouth“. In: Proceedings of ACM CHI'95 Conference on Human Factros in Computng Systems,
Denver, US, 210-217. Online zugänglich unter: htp://jolomo.net/ringo/chi-95-paper.pdf (2010-01-07)
| Simon, Nina (2009). Recommendaton Engines. Online zugänglich unter: htp://museumtwo.pbworks.-
com/Ch2_pt13 (2010-01-26)
| Sinha, Rashmi & Swearingen, Kirsten (2002). The role of transparency in recommender systems. In: CHI
'02 extended abstracts on Human factors in computng systems, 830-831.
| Smyth, Barry; Briggs, Peter & Coyle, Maurice (2009). Google Shared. A Case-Study in Social Search. In:
User Modeling, Adaptaton, and Personalizaton, Berlin: Springer, 283-294.
| Sorge, Christoph (2007). Selbstorganisierende Empfehlungssysteme im Internet. Eine interdisziplinäre
zwischen Technik und Recht. Karlsruhe: Universitätsverlag.
| Stüvel, Heike (2009). Je gleicher die Partner, desto glücklicher das Paar. Online zugänglich unter:
htp://www.welt.de/wissenschaf/psychologie/artcle3616398/Je-gleicher-die-Partner-desto-gluecklicher-
das-Paar.html (2010-02-07)
| Tanaka, Katsuaki; Hori, Koichi; Yamamoto, Masato (2008). Development of a Recommender System ba-
sed on Personal History. In: Transactons of the Japanese Society for Artfcial Intelligence, Volume 23, Issue
6, 412-423.
| Terveen L. & Hill W. (2001): Beyond Recommender Systems: Helping People Help Each Other, In: HCI in
the New Millennium, Jack Carroll, ed., Addison-Wesley.
| Terveen, Loren; Hill, Will; Amento, Brian; Mc Donald, David & Creter, Josh (1997). PHOAKS: A System
for Sharing Recommendatons, In: Communicaton of the ACM, March 1997/Vol. 40, No. 3, p. 59(4), Online
zugänglich unter: htp://www.ischool.utexas.edu/~i385d/readings/Terveen_PHOAKS_97.pdf (2010-02-02)
| Traurig, Peter (2009). Sofwaresysteme zur Entscheidungsunterstützung bei Medikamentenverordnun-
gen. In: Public Health Forum, Volume 17, Issue 4, December 2009, 32.e1-32.e3.
| Turof, Murray & Hiltz, Starr Roxanne (2008). Assessing the health informaton needs of the emergency
prepardness and management community. In: Informaton Services & Use, 28, 269-280.
| Wikipedia (2010): Last.fm. Online zugänglich unter: htp://en.wikipedia.org/wiki/Last.fm (2010-02-01)

80
AUTORINNEN UND AUTOREN
Dr. Sandra Schafert arbeitet als wissenschafliche Mitarbeiterin und Projektmanagerin
bei der Salzburg Research Forschungsgesellschaf (SRFG) zu Webbasierten (Bildungs-) In-
novatonen. Sie leitet die ComStudy, in deren Rahmen diese Veröfentlichung entstand.
Dr. Tobias Bürger ist wissenschaflicher Mitarbeiter bei der SRFG im Bereich Wissens-
und Medientechnologien.
Mag. Wolf Hilzensauer ist wissenschaflicher Mitarbeiter bei der SRFG im Bereich Infor-
maton Society Research.
DI (FH) Mag. Cornelia Schneider ist wissenschafliche Mitarbeiterin bei der SRFG im Be-
reich Mobile and Webbased Informaton Systems.
Mag. Diana Wieden-Bischof ist wissenschafliche Mitarbeiterin bei der SRFG im Bereich
Informaton Society Research.

SOCIAL MEDIA – WEITERE BÄNDE


In der Reihe „Social Media“ (herausgegeben von Georg Güntner und Sebastan Schafert
sind bisher erschienen:
Band 1
Erfolgreicher Aufau von Online-Communitys.
Konzepte, Szenarien und Handlungsempfehlungen.
(Sandra Schafert und Diana Wieden-Bischof)
ISBN 978-3-902448-13-2

Band 2
(Meta-) Informatonen von Communitys und Netzwerken.
Entstehung und Nutzungsmöglichkeiten.
(Sandra Schafert, Julia Eder, Wolf Hilzensauer, Thomas Kurz, Mark Markus,
Sebastan Schafert, Rupert Westenthaler, Rupert und Diana Wieden-Bischof)
ISBN 978-3-902448-15-6

Band 4
Reputaton und Feedback im Web.
Einsatzgebiete und Beispiele.
(Sandra Schafert, Georg Güntner, Markus Lassnig und Diana Wieden-Bischof)
ISBN 978-3-902448-17-0

Auf der Website des Salzburg NewMediaLab fnden Sie weitere Materialien zu den Ver-
öfentlichungen im Rahmen des Projektes, unter anderem Videos zu jeder Studie, Film-
aufnahmen und Präsentatonsunterlagen der Buchvorstellungen.

81
schriftenReihe: Social Media | Band 3
Schriftenreihe: Social Media
Band 3


© sxc.hu
Wachsende Datenbestände machen es schwierig sich zu orientieren. Empfehlungs­
systeme werden daher immer häufiger eingesetzt. Sie schlagen zum Beispiel Produkte,
Dienstleistungen, Webseiten, Filme, Bilder, Musik (-gruppen), Experten oder potenti­
elle Freunde und Lebenspartner vor. Insbesondere durch den Anwuchs von Beiträgen
 
in Social-Media-Anwendungen sind Empfehlungssysteme gefragt, damit interessante
Beiträge und Personen nicht untergehen. Auch bei der gezielten und personalisierten

Werbung im Web oder bei Suchmaschinen werden Verfahren der Empfehlungssysteme
eingesetzt. Empfehlungen unterstützen auch Prozesse wie die Reiseplanung, das Lernen,
das Tagging und auch das Verschreiben von Arzneimitteln.

In dieser Broschüre werden Konzepte und Realisierungen von Empfehlungssystemen im


Web vorgestellt und beschrieben. Dazu werden unter anderem das inhaltsbasierte und

B
kollaborative Filtern als Strategien beschrieben. Die unterschiedlichen Konzepte werden
kritisch betrachtet und für mehrere Einsatzgebiete Realisierungen vorgestellt. Schließ­
lich werden in der Studie Hinweise für die Entwicklung von Empfehlungssystemen
gegeben.
" 
Diese Broschüre ist ein Ergebnis der ComStudy, die am Salzburg NewMediaLab (SNML)
 

Empfehlungen im Web – Konzepte und Realisierungen


im Zeitraum von Oktober 2008 bis Februar 2010 durchgeführt wird. Das SNML, das Kom­
petenzzentrum für Neue Medien in Österreich, arbeitet daran, digitale Inhalte clever zu
strukturieren, verknüpfen, personalisieren, für alle auffindbar zu machen und nachhaltig
zu nutzen und betrachtet dabei die Community als einen wesentlichen Faktor vieler
Projekte.

ISBN 978-3-902448-16-3
Empfehlungen im Web
Konzepte und Realisierungen

Sandra Schaffert, Tobias Bürger, Wolf Hilzensauer,


Cornelia Schneider und Diana Wieden-Bischof