Discover millions of ebooks, audiobooks, and so much more with a free trial

Only $11.99/month after trial. Cancel anytime.

Apache Mahout: Empfehlen, clustern, klassifizieren
Apache Mahout: Empfehlen, clustern, klassifizieren
Apache Mahout: Empfehlen, clustern, klassifizieren
Ebook59 pages16 minutes

Apache Mahout: Empfehlen, clustern, klassifizieren

Rating: 0 out of 5 stars

()

Read preview

About this ebook

Personalisierte Produktempfehlungen generieren, Kundencluster bilden, Mails als Spam klassifizieren - das alles macht Apache Mahout möglich. Das kostenlose und quelloffene, auf Java- und Scala-basierte Framework verarbeitet und wertet Massendaten aus. So werden die bekannten Worte „Das könnte Sie auch interessieren …“, die uns beim Stöbern durch die Produktpalette eines Onlineshops begegnen, mit zahlreichen Produktbeispielen ergänzt, die zu unseren Vorlieben passen könnten. Hinter Apache Mahout verbirgt sich eine Vielzahl an Algorithmen, mithilfe derer Produktempfehlungen generiert und Kundencluster gebildet werden können. Des Weiteren beschäftigt sich dieser shortcut mit dem Klassifizieren von Daten mittels Apache Mahout, sodass Mails nach Eingang in verschiedene Ordner sortiert werden.
LanguageDeutsch
Release dateSep 15, 2015
ISBN9783868025620
Apache Mahout: Empfehlen, clustern, klassifizieren

Related to Apache Mahout

Titles in the series (100)

View More

Related ebooks

Programming For You

View More

Related articles

Reviews for Apache Mahout

Rating: 0 out of 5 stars
0 ratings

0 ratings0 reviews

What did you think?

Tap to rate

Review must be at least 10 words

    Book preview

    Apache Mahout - Karsten Voigt

    GmbH

    1 Realisierung eines Empfehlungssystems

    „Das könnte Sie auch interessieren … oder „Andere Nutzer kauften auch … – wie oft trifft man auf diese oder ähnliche Formulierungen beim Einkaufen im Onlineshop seines Vertrauens. Aber woher weiß das Unternehmen, was mich interessiert, und wie lässt sich ein solches System ohne großen Aufwand umsetzen? Eine Lösung: Apache Mahout.

    Mahout [1] ist ein kostenloses, quelloffenes, unter dem Dach der Apache Software Foundation entwickeltes Java- und Scala-basiertes Framework, das sich verschiedener Aspekte der Verarbeitung und Auswertung von Massendaten annimmt. Mahout stellt dabei eine Sammlung von Algorithmen für intelligente und lernende Systeme zur Verfügung. Die Themenblöcke Clusterbildung, Klassifizierung und kollaboratives Filtern werden von Mahout unterstützt und sollen in diesem shortcut näher betrachtet werden.

    Die Clusterbildung versucht Elemente in einer Datenbasis zu gruppieren, d. h. zum Beispiel Kunden zu Kundengruppen automatisch zuzuordnen. Bei der Klassifizierung werden Eigenschaften von Objekten untersucht, um die Objekte mit einer bestimmten Wahrscheinlichkeit einer Eigenschaft zuzuordnen, wobei das System selbst aus den Erfahrungswerten lernt. Ein klassisches Beispiel für die Klassifizierung ist die Erkennung von Spam in E-Mails. Innerhalb des kollaborativen Filterns werden Nutzerinteressen ausgewertet, um daraus Empfehlungen ableiten zu können. Für die Umsetzung von modernen Empfehlungssystemen greifen dabei oft alle drei Themen ineinander. Fachlich sollen die erhobenen Kundendaten effizient analysiert und ausgewertet werden, sodass einem Kunden intelligent die richtige Werbung oder richtige Empfehlung angezeigt wird. Am Ende sollen Privat- und Geschäftskunden mehr oder höherwertige Produkte kaufen. Die Abbildungen 1.1 und 1.2 zeigen eine durch Mahout erzeugte Produktempfehlung in IBM WebSphere Commerce. Die verwendeten Mechanismen sind jedoch unabhängig von dem eingesetzten E-Commerce-Framework und nicht auf E-Commerce-Szenarien beschränkt.

    Der shortcut fokussiert sich auf die aktuell verfügbaren in Java implementierten Algorithmen und die programmatische Ausführung selbiger. Für die meisten Algorithmen und Prozesse stehen auch Kommandozeilenaufrufe zur Verfügung, die hier jedoch nicht näher betrachtet werden sollen. In neueren Mahout-Versionen wird zusätzlich verstärkt Scala zum Einsatz kommen.

    Abbildung 1.1: Produktempfehlungen

    Abbildung 1.2: Produktempfehlungen

    Mahout im Überblick

    Zur Realisierung der verschiedenen Aufgaben bietet Mahout eine Vielzahl an Mechanismen an, die per Kommandozeile oder programmatisch ausgeführt werden können. Technologisch sind diese Algorithmen mit Standard-Java-Mitteln implementiert. Für die Massendatenverarbeitung kommt jedoch Apache Hadoop [2] oder bei neueren Implementierungen Apache Spark [3] zum Einsatz. Mit der Verwendung von Mahout für große Datenmengen sollte man auch die grundlegenden Konzepte hinter Hadoop oder Spark verstehen. Für die

    Enjoying the preview?
    Page 1 of 1