Big Data Analytics: Grundlagen, Fallbeispiele und Nutzungspotenziale

Ebook572 pages4 hours

Big Data Analytics: Grundlagen, Fallbeispiele und Nutzungspotenziale

Name: Big Data Analytics: Grundlagen, Fallbeispiele und Nutzungspotenziale
ISBN: 9783658322366

By Andreas Meier

Rating: 0 out of 5 stars

()

Read preview

About this ebook

Mit diesem Herausgeberwerk führen die Autoren den Begriff „Big Data Analytics“ ein und geben Fallstudien aus unterschiedlichen Anwendungsgebieten. Unter Big Data Analytics wird das Aufbereiten, Analysieren und Interpretieren von großen, oft heterogenen Datenbeständen verstanden, mit dem Ziel, Muster und Zusammenhänge in den Daten aufzudecken und Entscheidungsgrundlagen für wissenschaftliche, betriebliche oder gesellschaftliche Fragestellungen zu erhalten.
Nebst den theoretischen Grundlagen widmet sich das Herausgeberwerk der Vielfalt verschiedener Anwendungsmöglichkeiten. Fallbeispiele geben Einblick in die Anwendung von Big Data Analytics und dessen Nutzenpotenziale.
Das Werk richtet sich gleichermaßen an Studierende, Fachleute aller Fachrichtungen als auch an interessierte Anwender. Es hilft den Leserinnen und Leser, die Bedeutungsvielfalt des Begriffs Big Data Analytics zu verstehen und verschiedene Einsatzmöglichkeiten im eigenen Umfeld zu erkennen und zu bewerten.

Skip carousel

LanguageDeutsch

PublisherSpringer Vieweg

Release dateApr 1, 2021

ISBN9783658322366

Related to Big Data Analytics

Related ebooks

Skip carousel

Virtual Reality im Tourismus: Wie VR das Destinationsmarketing verändern wird
Ebook
Virtual Reality im Tourismus: Wie VR das Destinationsmarketing verändern wird
byThomas Aichner
Rating: 0 out of 5 stars
0 ratings
Big Data und Data Science in der strategischen Beschaffung: Grundlagen – Voraussetzungen – Anwendungschancen
Ebook
Big Data und Data Science in der strategischen Beschaffung: Grundlagen – Voraussetzungen – Anwendungschancen
byStefan Zeisel
Rating: 0 out of 5 stars
0 ratings
Datengetriebenes Marketing: Wie Unternehmen Daten zur Skalierung ihres Geschäfts nutzen können
Ebook
Datengetriebenes Marketing: Wie Unternehmen Daten zur Skalierung ihres Geschäfts nutzen können
byJonas Rashedi
Rating: 0 out of 5 stars
0 ratings
Künstliche Intelligenz in Nachrichtenredaktionen: Begriffe, Systematisierung, Fallbeispiele
Ebook
Künstliche Intelligenz in Nachrichtenredaktionen: Begriffe, Systematisierung, Fallbeispiele
byBookwire
Rating: 0 out of 5 stars
0 ratings
IoT – Best Practices: Internet der Dinge, Geschäftsmodellinnovationen, IoT-Plattformen, IoT in Fertigung und Logistik
Ebook
IoT – Best Practices: Internet der Dinge, Geschäftsmodellinnovationen, IoT-Plattformen, IoT in Fertigung und Logistik
byStefan Meinhardt
Rating: 0 out of 5 stars
0 ratings
Praxisleitfaden Logistik für Nachhaltige Lebensstile
Ebook
Praxisleitfaden Logistik für Nachhaltige Lebensstile
byArbeitskreis Innovative Logistik für Nachhaltige Lebensstile (ILoNa)
Rating: 0 out of 5 stars
0 ratings
Von einer Wettbewerbs- zu einer Kooperationskultur: Ein Modell zur Stärkung des Kooperationsverhaltens in Unternehmen
Ebook
Von einer Wettbewerbs- zu einer Kooperationskultur: Ein Modell zur Stärkung des Kooperationsverhaltens in Unternehmen
byThomas Kottmann
Rating: 0 out of 5 stars
0 ratings
Der Einsatz psychologischer Testverfahren in Unternehmen: Ein Leitfaden für Anwender und solche, die es werden wollen
Ebook
Der Einsatz psychologischer Testverfahren in Unternehmen: Ein Leitfaden für Anwender und solche, die es werden wollen
byThomas Steininger
Rating: 0 out of 5 stars
0 ratings
Digitale Geschäftsmodelle – Band 1: Geschäftsmodell-Innovationen, digitale Transformation, digitale Plattformen, Internet der Dinge und Industrie 4.0
Ebook
Digitale Geschäftsmodelle – Band 1: Geschäftsmodell-Innovationen, digitale Transformation, digitale Plattformen, Internet der Dinge und Industrie 4.0
byStefan Meinhardt
Rating: 0 out of 5 stars
0 ratings
Digitale Geschäftsmodelle – Band 2: Geschäftsmodell-Innovationen, digitale Transformation, digitale Plattformen, Internet der Dinge und Industrie 4.0
Ebook
Digitale Geschäftsmodelle – Band 2: Geschäftsmodell-Innovationen, digitale Transformation, digitale Plattformen, Internet der Dinge und Industrie 4.0
byStefan Meinhardt
Rating: 0 out of 5 stars
0 ratings
Moderne Personalauswahl: Renommierte Experten über Trends, neue Technologien, Chancen und Risiken in der Eignungsdiagnostik
Ebook
Moderne Personalauswahl: Renommierte Experten über Trends, neue Technologien, Chancen und Risiken in der Eignungsdiagnostik
byKatrin Fellner
Rating: 0 out of 5 stars
0 ratings
Mitarbeiter (ein)binden und gewinnen: Nachhaltige Strukturen für Seniorenheime zur Steigerung der Arbeitgeberattraktivität
Ebook
Mitarbeiter (ein)binden und gewinnen: Nachhaltige Strukturen für Seniorenheime zur Steigerung der Arbeitgeberattraktivität
byLukas Rottmann
Rating: 0 out of 5 stars
0 ratings
Datengetriebenes Management: Wie Sie die richtigen Grundlagen legen, bevor Sie mit Business Intelligence durchstarten können
Ebook
Datengetriebenes Management: Wie Sie die richtigen Grundlagen legen, bevor Sie mit Business Intelligence durchstarten können
byUwe Seebacher
Rating: 0 out of 5 stars
0 ratings
Einflussfaktoren auf die Akzeptanz von Robo Advisors: Digitale Kommunikation in der Anlageberatung
Ebook
Einflussfaktoren auf die Akzeptanz von Robo Advisors: Digitale Kommunikation in der Anlageberatung
byJessica Hastenteufel
Rating: 0 out of 5 stars
0 ratings
Einführung in die Qualitative Marktforschung: Design – Datengewinnung – Datenauswertung
Ebook
Einführung in die Qualitative Marktforschung: Design – Datengewinnung – Datenauswertung
byAdrienne Steffen
Rating: 0 out of 5 stars
0 ratings
Suchmaschinenmarketing in der Personalakquise: Wie Sie mit Search Engine Advertising die richtigen Mitarbeiter finden
Ebook
Suchmaschinenmarketing in der Personalakquise: Wie Sie mit Search Engine Advertising die richtigen Mitarbeiter finden
byThorsten Piening
Rating: 0 out of 5 stars
0 ratings
Data Science: Grundlagen, Architekturen und Anwendungen
Ebook
Data Science: Grundlagen, Architekturen und Anwendungen
byUwe Haneke
Rating: 0 out of 5 stars
0 ratings
Marketing im Zeitalter der Digitalisierung: Chancen und Herausforderungen durch digitale Innovationen
Ebook
Marketing im Zeitalter der Digitalisierung: Chancen und Herausforderungen durch digitale Innovationen
byNils Urbach
Rating: 0 out of 5 stars
0 ratings
Informationsverarbeitung in der Pflege: Digitalisierung verstehen, Versorgungskontinuität sichern
Ebook
Informationsverarbeitung in der Pflege: Digitalisierung verstehen, Versorgungskontinuität sichern
byUrsula Hübner
Rating: 0 out of 5 stars
0 ratings
Spin-off als Organisationskonzept: Eine Systematisierung und Fallbeispiele für die Geschäftsmodellinnovation
Ebook
Spin-off als Organisationskonzept: Eine Systematisierung und Fallbeispiele für die Geschäftsmodellinnovation
byUwe Eisenbeis
Rating: 0 out of 5 stars
0 ratings
Neuromarketing in der Praxis: Den Emotionen auf der Spur – implizite Kauftreiber erkennen und als Verkaufstreiber nutzen
Ebook
Neuromarketing in der Praxis: Den Emotionen auf der Spur – implizite Kauftreiber erkennen und als Verkaufstreiber nutzen
byBenny Briesemeister
Rating: 0 out of 5 stars
0 ratings
HR-Analytics: Was HR-Verantwortliche und Führungskräfte wissen und können müssen
Ebook
HR-Analytics: Was HR-Verantwortliche und Führungskräfte wissen und können müssen
byFelix Wirges
Rating: 0 out of 5 stars
0 ratings
Chefsache Zukunft: Was Führungskräfte von morgen brauchen
Ebook
Chefsache Zukunft: Was Führungskräfte von morgen brauchen
byPeter Buchenau
Rating: 0 out of 5 stars
0 ratings
Mit Quanten rechnen: Quantencomputer für Neugierige
Ebook
Mit Quanten rechnen: Quantencomputer für Neugierige
byBeatrice Marie Ellerhoff
Rating: 0 out of 5 stars
0 ratings
Grundlagen und Anwendung von Information Security Awareness: Mitarbeiter zielgerichtet für Informationssicherheit sensibilisieren
Ebook
Grundlagen und Anwendung von Information Security Awareness: Mitarbeiter zielgerichtet für Informationssicherheit sensibilisieren
byKristin Weber
Rating: 0 out of 5 stars
0 ratings
Der Content Faktor: Schreiben Sie Texte, die gefunden und gelesen werden
Ebook
Der Content Faktor: Schreiben Sie Texte, die gefunden und gelesen werden
bySteven Broschart
Rating: 0 out of 5 stars
0 ratings
Gesundheit systematisch fördern: Von der Absicht zur Realisierung
Ebook
Gesundheit systematisch fördern: Von der Absicht zur Realisierung
byWolfgang Schlicht
Rating: 0 out of 5 stars
0 ratings
Journalistische Praxis: Digitale Recherche: Verifikation und Fact Checking
Ebook
Journalistische Praxis: Digitale Recherche: Verifikation und Fact Checking
byPeter Welchering
Rating: 0 out of 5 stars
0 ratings
Auftragskommunikation: Für Unternehmen und Institutionen sprechen
Ebook
Auftragskommunikation: Für Unternehmen und Institutionen sprechen
byJürgen Schulz
Rating: 0 out of 5 stars
0 ratings
Digital Customer Experience Management der Plattform Steam: HMD Best Paper Award 2017
Ebook
Digital Customer Experience Management der Plattform Steam: HMD Best Paper Award 2017
byBenjamin Spottke
Rating: 0 out of 5 stars
0 ratings

Intelligence (AI) & Semantics For You

Skip carousel

Meistern von ChatGPT: Entriegeln Sie die Kraft der KI für verbesserte Kommunikation und Beziehungen: German
Ebook
Meistern von ChatGPT: Entriegeln Sie die Kraft der KI für verbesserte Kommunikation und Beziehungen: German
byVasyl Kolomiiets
Rating: 0 out of 5 stars
0 ratings
Aufstieg der Roboter: Wie unsere Arbeitswelt gerade auf den Kopf gestellt wird - und wie wir darauf reagieren müssen
Ebook
Aufstieg der Roboter: Wie unsere Arbeitswelt gerade auf den Kopf gestellt wird - und wie wir darauf reagieren müssen
byMartin Ford
Rating: 0 out of 5 stars
0 ratings
ChatGPT – Für Einsteiger: Schreibprofi mit KI, Zeit und Geld sparen ohne peinliche Fehler
Ebook
ChatGPT – Für Einsteiger: Schreibprofi mit KI, Zeit und Geld sparen ohne peinliche Fehler
byChrista Stuber
Rating: 0 out of 5 stars
0 ratings
ChatGPT: Begegnung mit einer neuen Welt: Lernen Sie Künstliche Intelligenz mit der Gratisversion ChatGPT 3.5
Ebook
ChatGPT: Begegnung mit einer neuen Welt: Lernen Sie Künstliche Intelligenz mit der Gratisversion ChatGPT 3.5
byRolf Jeger
Rating: 0 out of 5 stars
0 ratings
Künstliche Intelligenz: Die vierte industrielle Revolution
Ebook
Künstliche Intelligenz: Die vierte industrielle Revolution
byVasil Teigens
Rating: 0 out of 5 stars
0 ratings
Einstieg ins Machine Learning: Grundlagen, Prinzipien, erste Schritte
Ebook
Einstieg ins Machine Learning: Grundlagen, Prinzipien, erste Schritte
byShahin Amiriparian
Rating: 0 out of 5 stars
0 ratings
Die Zukunft der Arbeit: Digitalisierung, Automatisierung, KI
Ebook
Die Zukunft der Arbeit: Digitalisierung, Automatisierung, KI
byFrankfurter Allgemeine Archiv
Rating: 0 out of 5 stars
0 ratings
Digitalotopia: Sind wir bereit für die (R)Evolution der Wirklichkeit?
Ebook
Digitalotopia: Sind wir bereit für die (R)Evolution der Wirklichkeit?
bySascha Berger
Rating: 0 out of 5 stars
0 ratings
Menschlicher Geist und Künstliche Intelligenz: Die Entwicklung des Humanen inmitten einer digitalen Welt
Ebook
Menschlicher Geist und Künstliche Intelligenz: Die Entwicklung des Humanen inmitten einer digitalen Welt
byEdwin Hübner
Rating: 0 out of 5 stars
0 ratings
Chatbotische Landingpages: Wie du deine Konkurrenz in den digitalen Staub schicken
Ebook
Chatbotische Landingpages: Wie du deine Konkurrenz in den digitalen Staub schicken
bySvetlana Badak
Rating: 0 out of 5 stars
0 ratings
ChatGPT: Epische Reise des Erfolgs - 'Steigern Sie Ihren Reichtum': Mit Screenshots aus dem echten Leben - Erreichen Sie finanzielle Höhen
Ebook
ChatGPT: Epische Reise des Erfolgs - 'Steigern Sie Ihren Reichtum': Mit Screenshots aus dem echten Leben - Erreichen Sie finanzielle Höhen
byHema
Rating: 0 out of 5 stars
0 ratings
Die KI Bibel, mit künstlicher Intelligenz Geld verdienen: Echte Fallbeispiele und Anleitungen zum Umsetzen
Ebook
Die KI Bibel, mit künstlicher Intelligenz Geld verdienen: Echte Fallbeispiele und Anleitungen zum Umsetzen
byJhon Dujardin
Rating: 1 out of 5 stars
1/5
GPT-4: Ein umfassender Leitfaden mit Unterschieden zu GPT-3 und Anwendungsbeispielen: ChatGPT4, GPT-3 - eine kleine Zeitreise in die Vergangenheit und Zukunft
Ebook
GPT-4: Ein umfassender Leitfaden mit Unterschieden zu GPT-3 und Anwendungsbeispielen: ChatGPT4, GPT-3 - eine kleine Zeitreise in die Vergangenheit und Zukunft
byHenrik Roth
Rating: 0 out of 5 stars
0 ratings
Psychologie des Sozialismus
Ebook
Psychologie des Sozialismus
byGustave Le Bon
Rating: 0 out of 5 stars
0 ratings
Künstliche Intelligenz in Sozialen Medien
Ebook
Künstliche Intelligenz in Sozialen Medien
byIntroBooks Team
Rating: 0 out of 5 stars
0 ratings
Roboter im Alltag: Maschinen (beinahe) wie Menschen
Ebook
Roboter im Alltag: Maschinen (beinahe) wie Menschen
byAndreas Dripke
Rating: 0 out of 5 stars
0 ratings
Wissen statt Glauben!: Das Weltbild des neuen Humanismus
Ebook
Wissen statt Glauben!: Das Weltbild des neuen Humanismus
byBernd Vowinkel
Rating: 0 out of 5 stars
0 ratings
Die destruktive Wirkung der Informationstechnologie auf die intellektuelle Entwicklung des Menschen: Eine technophilosophische Betrachtung
Ebook
Die destruktive Wirkung der Informationstechnologie auf die intellektuelle Entwicklung des Menschen: Eine technophilosophische Betrachtung
byTom Landon
Rating: 1 out of 5 stars
1/5
KI-Innovationen: Wie die Technologie die Grenzen verschiebt Künstliche Intelligenz verstehen und nutzen: Ein AI-Buch
Ebook
KI-Innovationen: Wie die Technologie die Grenzen verschiebt Künstliche Intelligenz verstehen und nutzen: Ein AI-Buch
byJhon Dujardin
Rating: 0 out of 5 stars
0 ratings
Chatbotische Medien-Gestaltung leicht gemacht: Von der Idee zum viralen Hit
Ebook
Chatbotische Medien-Gestaltung leicht gemacht: Von der Idee zum viralen Hit
bySvetlana Badak
Rating: 0 out of 5 stars
0 ratings

Related podcast episodes

Skip carousel

053 — Data Science und Machine Learning, Hype und Realität — Teil 1: In dieser Episode ist wieder Dr. Lukas Lang zu Gast. Wir sprechen über Data Science und Machine Learninig (auch »artificial intelligence« genannt). Das ist ein Themenbereich, der sehr viel Potential für unsere Zukunft hat, aber wie alle diese Themenb...
Podcast episode
053 — Data Science und Machine Learning, Hype und Realität — Teil 1: In dieser Episode ist wieder Dr. Lukas Lang zu Gast. Wir sprechen über Data Science und Machine Learninig (auch »artificial intelligence« genannt). Das ist ein Themenbereich, der sehr viel Potential für unsere Zukunft hat, aber wie alle diese Themenb...
byZukunft Denken – Podcast
0 ratings
0% found this document useful
(89) Übers Klima reden - wie kann das gelingen?
Podcast episode
(89) Übers Klima reden - wie kann das gelingen?
bySynapsen – ein Wissenschaftspodcast
0 ratings
0% found this document useful
#61 mit Bettina Goerner | Springer Nature Managing Director Data Products: Springer Nature ist eine wissenschaftliche Verlagsgruppe und zählt zu den umsatzstärksten Verlagsgruppen der Welt. Was passiert dort in Sachen Datenprodukten?
Podcast episode
#61 mit Bettina Goerner | Springer Nature Managing Director Data Products: Springer Nature ist eine wissenschaftliche Verlagsgruppe und zählt zu den umsatzstärksten Verlagsgruppen der Welt. Was passiert dort in Sachen Datenprodukten?
byDatenbusiness Podcast
0 ratings
0% found this document useful
079 — Escape from Model Land, a Conversation with Dr. Erica Thompson: Todays guest is Dr. Erica Thompson who wrote the excellent book "Escape from Model Land", which I strongly recommend for reading. Dr. Thompson is Associate Professor of Modelling for Decision Making at UCL’s Department of Science, Technology, Enginee...
Podcast episode
079 — Escape from Model Land, a Conversation with Dr. Erica Thompson: Todays guest is Dr. Erica Thompson who wrote the excellent book "Escape from Model Land", which I strongly recommend for reading. Dr. Thompson is Associate Professor of Modelling for Decision Making at UCL’s Department of Science, Technology, Enginee...
byZukunft Denken – Podcast
0 ratings
0% found this document useful
Quanten-Computing: Wann gelingt endlich der Durchbruch für erste Anwendungen?
Podcast episode
Quanten-Computing: Wann gelingt endlich der Durchbruch für erste Anwendungen?
byDas Ohr am Netz
0 ratings
0% found this document useful
068 — Modelle und Realität, ein Gespräch mit Dr. Andreas Windisch: Das Thema der heutigen Episode ist »Modelle«. Was ist ein Modell in Bezug zur Realität, welche Art vom Modellen gibt es und wie sollten wir als Gesellschaft mit Modellen umgehen, im besonderen bei Fragen, die das Verhalten komplexer Systeme in die Zu...
Podcast episode
068 — Modelle und Realität, ein Gespräch mit Dr. Andreas Windisch: Das Thema der heutigen Episode ist »Modelle«. Was ist ein Modell in Bezug zur Realität, welche Art vom Modellen gibt es und wie sollten wir als Gesellschaft mit Modellen umgehen, im besonderen bei Fragen, die das Verhalten komplexer Systeme in die Zu...
byZukunft Denken – Podcast
0 ratings
0% found this document useful
Research Software Engineering: Modellansatz 208
Podcast episode
Research Software Engineering: Modellansatz 208
byModellansatz
0 ratings
0% found this document useful
Wie KI bei der Überwachung der Nachhaltigkeit für das Lieferkettengesetz hilft: Ein Gespräch mit Jolene Ernesti, Mit-Gründerin des Start-ups ecotrek
Podcast episode
Wie KI bei der Überwachung der Nachhaltigkeit für das Lieferkettengesetz hilft: Ein Gespräch mit Jolene Ernesti, Mit-Gründerin des Start-ups ecotrek
byKünstliche Intelligenz
0 ratings
0% found this document useful
Wo KI-Systeme unseren Ärzten in Zukunft Arbeit abnehmen – und wo nicht: Ein Gespräch mit Joshua Gawlitza, Radiologe an der Universitätsklinik rechts der Isar von der Technischen Universität München
Podcast episode
Wo KI-Systeme unseren Ärzten in Zukunft Arbeit abnehmen – und wo nicht: Ein Gespräch mit Joshua Gawlitza, Radiologe an der Universitätsklinik rechts der Isar von der Technischen Universität München
byKünstliche Intelligenz
0 ratings
0% found this document useful
#110 Künstliche Intelligenz verstehen: Was jede*r über Algorithmen und Big Data wissen sollte - Interview mit Katharina Zweig: Der technologische Fortschritt greift tief in unsere Art zu leben und zu arbeiten ein. In Wirtschaft und Gesellschaft bringt Software gewaltige Unterstützung und Innovation. Gleichzeitig entstehen tiefe ethische Fragestellungen rund um neue...
Podcast episode
#110 Künstliche Intelligenz verstehen: Was jede*r über Algorithmen und Big Data wissen sollte - Interview mit Katharina Zweig: Der technologische Fortschritt greift tief in unsere Art zu leben und zu arbeiten ein. In Wirtschaft und Gesellschaft bringt Software gewaltige Unterstützung und Innovation. Gleichzeitig entstehen tiefe ethische Fragestellungen rund um neue...
byFemale Leadership | Führung, Karriere und Neues Arbeiten
0 ratings
0% found this document useful
#81 mit Prof. Markus Schläpfer | Assistant Professor NTU Singapore | Principal Investigator ETH Future Cities Laboratory: Markus hat mit seinem Team ein grundlegendes Gesetz für das Reisen von Menschen in Städten entdeckt. Das neue Gesetz sagt die Anzahl der Besucher an einem beliebigen Ort voraus, je nachdem, wie oft sie diesen besuchen und wie weit sie reisen.
Podcast episode
#81 mit Prof. Markus Schläpfer | Assistant Professor NTU Singapore | Principal Investigator ETH Future Cities Laboratory: Markus hat mit seinem Team ein grundlegendes Gesetz für das Reisen von Menschen in Städten entdeckt. Das neue Gesetz sagt die Anzahl der Besucher an einem beliebigen Ort voraus, je nachdem, wie oft sie diesen besuchen und wie weit sie reisen.
byDatenbusiness Podcast
0 ratings
0% found this document useful
#29 - Fitness Tracking 2.0. Ein Gespräch mit Florian Gschwandtner: Der Gründer und Unternehmer Florian Gschwandtner spricht über Digitalisierung im Gesundheitsbereich.
Podcast episode
#29 - Fitness Tracking 2.0. Ein Gespräch mit Florian Gschwandtner: Der Gründer und Unternehmer Florian Gschwandtner spricht über Digitalisierung im Gesundheitsbereich.
byForever Young - Der Longevity-Podcast
0 ratings
0% found this document useful
„KI gibt die besseren Aktientipps – aber die Anleger folgen ihnen nicht“: Computer sind teilweise schon besser als Bankberater. Was folgt daraus – und was nicht?
Podcast episode
„KI gibt die besseren Aktientipps – aber die Anleger folgen ihnen nicht“: Computer sind teilweise schon besser als Bankberater. Was folgt daraus – und was nicht?
byKünstliche Intelligenz
0 ratings
0% found this document useful
#244 mit Dr. Julia Borggräfe, Abteilungsleiterin Digitalisierung und Arbeitswelt, BMAS: “Mobiles Arbeiten ohne Digitalisierung wäre nicht möglich.”
Podcast episode
#244 mit Dr. Julia Borggräfe, Abteilungsleiterin Digitalisierung und Arbeitswelt, BMAS: “Mobiles Arbeiten ohne Digitalisierung wäre nicht möglich.”
byOn the Way to New Work - Der Podcast über neue Arbeit
0 ratings
0% found this document useful
#379 Dr. Rasmus Rothe | KI Experte | Co-Founder Merantix | Forbes Top 30 unter 30 und Capital Top 40 unter 40
Podcast episode
#379 Dr. Rasmus Rothe | KI Experte | Co-Founder Merantix | Forbes Top 30 unter 30 und Capital Top 40 unter 40
byOn the Way to New Work - Der Podcast über neue Arbeit
0 ratings
0% found this document useful
#647 Mythen und Best Practices in der Personalauswahl: Interview mit Prof. Dr. Kanning
Podcast episode
#647 Mythen und Best Practices in der Personalauswahl: Interview mit Prof. Dr. Kanning
byVertriebsFunk – Karriere, Recruiting und Vertrieb
0 ratings
0% found this document useful
Wissenschaftskommunikation: Modellansatz 130
Podcast episode
Wissenschaftskommunikation: Modellansatz 130
byModellansatz
0 ratings
0% found this document useful
067 — Wissenschaft, Hype und Realität — ein Gespräch mit Stephan Schleim: In dieser Episode führe ich ein äußerst interessates Gespräch mich mit Prof. Stephan Schleim. Er ist deutscher Philosoph und Psychologe, Professor für Theorie und Geschichte der Psychologie Universität Groningen. Seine Spezialgebiete sind die Theorie...
Podcast episode
067 — Wissenschaft, Hype und Realität — ein Gespräch mit Stephan Schleim: In dieser Episode führe ich ein äußerst interessates Gespräch mich mit Prof. Stephan Schleim. Er ist deutscher Philosoph und Psychologe, Professor für Theorie und Geschichte der Psychologie Universität Groningen. Seine Spezialgebiete sind die Theorie...
byZukunft Denken – Podcast
0 ratings
0% found this document useful
Risikoentscheidungen: Modellansatz 193
Podcast episode
Risikoentscheidungen: Modellansatz 193
byModellansatz
0 ratings
0% found this document useful
#30 mit Mathias Döpfner (CEO von Axel Springer): Mathias Döpfner ist einer der bedeutendsten Medie…
Podcast episode
#30 mit Mathias Döpfner (CEO von Axel Springer): Mathias Döpfner ist einer der bedeutendsten Medie…
byOn the Way to New Work - Der Podcast über neue Arbeit
0 ratings
0% found this document useful
KI wird zum Wettbewerbsvorteil für Auto-Konzerne: Was die Computer im Auto schon können. Und was mit Daten noch möglich ist.
Podcast episode
KI wird zum Wettbewerbsvorteil für Auto-Konzerne: Was die Computer im Auto schon können. Und was mit Daten noch möglich ist.
byKünstliche Intelligenz
0 ratings
0% found this document useful
Psychologisches Kapital (PsyCap) in der Führung nützen – mit Dr. Corinna Schmidt: "Positiv Führen" von und mit Christian Thiele – Folge 44
Podcast episode
Psychologisches Kapital (PsyCap) in der Führung nützen – mit Dr. Corinna Schmidt: "Positiv Führen" von und mit Christian Thiele – Folge 44
byPositiv Führen mit Christian Thiele
0 ratings
0% found this document useful
031 – Software in der modernen Gesellschaft – Gespräch mit Tom Konrad: Vor fast 10 Jahren hat der Slogan des IT-Unternehmers und Gründers von Netscape Marc Andreessen »Software isst die Welt« (»Software is eating the world«) seine Kreise gezogen. Er hatte mit einem Recht: Software ist das digitale Nervensystem unserer m...
Podcast episode
031 – Software in der modernen Gesellschaft – Gespräch mit Tom Konrad: Vor fast 10 Jahren hat der Slogan des IT-Unternehmers und Gründers von Netscape Marc Andreessen »Software isst die Welt« (»Software is eating the world«) seine Kreise gezogen. Er hatte mit einem Recht: Software ist das digitale Nervensystem unserer m...
byZukunft Denken – Podcast
0 ratings
0% found this document useful
#352 Louis Schulze | Ecosystem Development Manager, Founders Foundation und Podcast Host FUTUR3: “Das scheint alles irgendwie unseriös zu sein.”
Podcast episode
#352 Louis Schulze | Ecosystem Development Manager, Founders Foundation und Podcast Host FUTUR3: “Das scheint alles irgendwie unseriös zu sein.”
byOn the Way to New Work - Der Podcast über neue Arbeit
0 ratings
0% found this document useful
Die Wissenschaft in der Kaffeetasse: Was kann die BASF-Tochtergesellschaft trinamiX mit ihrem Spektrometer im Kaffee messen?
Podcast episode
Die Wissenschaft in der Kaffeetasse: Was kann die BASF-Tochtergesellschaft trinamiX mit ihrem Spektrometer im Kaffee messen?
byELEMENTary – a BASF podcast
0 ratings
0% found this document useful
#390 Daniel Steinhöfer | Berater, Trainer, Agil Coach und Autor von “Liberating Structures”: “Wie kann ich eigentlich mit beliebig großen Gruppen effizient arbeiten und dabei noch Spaß haben?”
Podcast episode
#390 Daniel Steinhöfer | Berater, Trainer, Agil Coach und Autor von “Liberating Structures”: “Wie kann ich eigentlich mit beliebig großen Gruppen effizient arbeiten und dabei noch Spaß haben?”
byOn the Way to New Work - Der Podcast über neue Arbeit
0 ratings
0% found this document useful
#43 HeadsOfData #34 mit Prof. Dr. Frauke Kreuter | Professur in Data Science für die Sozial- und Humanwissenschaften: Frau Prof. Kreuter beschäftigt sich in ihrer Forschung mit Social Data Science, Umfragemethoden, Datenschutz, systematischen Verzerrungen von Daten sowie mit mobiler Technologie zur Datenerfassung.
Podcast episode
#43 HeadsOfData #34 mit Prof. Dr. Frauke Kreuter | Professur in Data Science für die Sozial- und Humanwissenschaften: Frau Prof. Kreuter beschäftigt sich in ihrer Forschung mit Social Data Science, Umfragemethoden, Datenschutz, systematischen Verzerrungen von Daten sowie mit mobiler Technologie zur Datenerfassung.
byDatenbusiness Podcast
0 ratings
0% found this document useful
Soziale Netzwerke brauchen KI, um der Datenmasse Herr zu werden: Ein Gespräch mit dem Geschäftsführer der Internet-Plattform gutefrage.net.
Podcast episode
Soziale Netzwerke brauchen KI, um der Datenmasse Herr zu werden: Ein Gespräch mit dem Geschäftsführer der Internet-Plattform gutefrage.net.
byKünstliche Intelligenz
0 ratings
0% found this document useful
Social Sustainability & mehr - Nachhaltiges Wirtschaften für Mensch und Planet!: Interview mit Prof. Dr. Brigitte Spieß
Podcast episode
Social Sustainability & mehr - Nachhaltiges Wirtschaften für Mensch und Planet!: Interview mit Prof. Dr. Brigitte Spieß
byHZaborowski - mit HR & CSR die Welt retten!
0 ratings
0% found this document useful
Know your Data mit Jonas Rashedi
Podcast episode
Know your Data mit Jonas Rashedi
byOMR Education
0 ratings
0% found this document useful

Skip carousel

»Wir Können Beides Haben – Infektionsschutz Und Datenschutz!«
iPhone & iPadLife
Article
»Wir Können Beides Haben – Infektionsschutz Und Datenschutz!«
Jun 20, 2020
5 min read
Gelernt Ist Gelernt
Raspberry Pi Geek
Article
Gelernt Ist Gelernt
Sep 21, 2023
4 min read
Verschwörungs-mythen: Entstehung und Bedeutung fürs Marketing
MacLife German
Article
Verschwörungs-mythen: Entstehung und Bedeutung fürs Marketing
Feb 4, 2021
3 min read
Gelernt Ist Gelernt
LinuxUser
Article
Gelernt Ist Gelernt
Sep 21, 2023
4 min read
GEN Z VERSUS BOOMER: Ein PHANTOM tarnt sich als PHÄNOMEN
New Work Magazine
Article
GEN Z VERSUS BOOMER: Ein PHANTOM tarnt sich als PHÄNOMEN
Feb 1, 2024
9 min read
»Wir Sehen Uns In Der Verantwortung! «
MacLife German
Article
»Wir Sehen Uns In Der Verantwortung! «
Feb 2, 2023
3 min read
»Wir Möchten Die Art Und Weise Revolutionieren, In Der Menschen Wissen Anwenden.«
MacLife German
Article
»Wir Möchten Die Art Und Weise Revolutionieren, In Der Menschen Wissen Anwenden.«
Nov 3, 2022
Dennis, erstaunlich viele Menschen vertrauen weiter auf ihre Zettelwirtschaft, um Notizen festzuhalten, statt zum Smartphone oder Computer zu greifen. Was kann Mem daran ändern? Ich glaube, der Umstand, dass viele Menschen immer noch lieber Papier fü
3 min read
»ChatGPT Kann Noch Keine Therapeut:innen Ersetzen!«
MacLife German
Article
»ChatGPT Kann Noch Keine Therapeut:innen Ersetzen!«
Oct 4, 2023
7 min read
Zahlen & Trends
Linux Magazin germany
Article
Zahlen & Trends
Jul 7, 2021
9 min read
Ist Ihre App sicher?
MacLife German
Article
Ist Ihre App sicher?
Jul 8, 2021
1 min read
New New Work
MacLife German
Article
New New Work
Jan 7, 2021
4 min read
Alles Fake, Oder Was?
DigitalPhoto
Article
Alles Fake, Oder Was?
Mar 4, 2024
6 min read
Zahlen & Trends
Linux Magazin germany
Article
Zahlen & Trends
Jun 2, 2021
10 min read
IGene
MacLife German
Article
IGene
Sep 2, 2021
6 min read
Sicher Sicherer?
LinuxUser
Article
Sicher Sicherer?
Aug 17, 2023
Sehr geehrte Leserinnen und Leser, Zunächst das Offensichtliche: Die Sicherheit und Vertrauenswürdigkeit von Softwaresystemen spielen eine kritische Rolle. Viele hängen in diesem Kontext immer noch einem längst überholten Dualismus an: Software wird
1 min read
Neuanfang
New Work Magazine
Article
Neuanfang
Jul 16, 2021
5 min read
KI im Marketing
MacLife German
Article
KI im Marketing
Mar 2, 2023
5 min read
Wer Bin Ich?
MacLife German
Article
Wer Bin Ich?
Sep 2, 2021
3 min read
Der Staat als Vorbild?
Linux Magazin germany
Article
Der Staat als Vorbild?
Jul 7, 2021
Linux-Magazin: Glauben Sie an eine Vorbildwirkung der öffentlichen Verwaltung in Sachen Open Source? Peter Ganten: Ohne Open-Source-Software lassen sich keine IT-Infrastrukturen aufbauen, deren Funktionsweise und Sicherheit sich unabhängig überprüfen
2 min read
„ Ethik Ist Eine Investition!“
MacLife German
Article
„ Ethik Ist Eine Investition!“
Apr 4, 2023
Mac Life: Professor Floridi, wie definieren Sie Intelligenz? Prof. Luciano Floridi: In der Literatur gibt es nicht eine oder zwei, sondern Dutzende Definitionen von Intelligenz – jede Disziplin hat ihre eigene. Ein Weg, Intelligenz zu verstehen, ist
9 min read
Die klangvolle Revolution
MacLife German
Article
Die klangvolle Revolution
Oct 6, 2020
4 min read
Mina Ist Ein AI-Chatbot …
MacLife German
Article
Mina Ist Ein AI-Chatbot …
Oct 4, 2023
1 min read
DIGITALI SIE RUNG: ALLTAG & ALL MACHT
Bücher Magazin
Article
DIGITALI SIE RUNG: ALLTAG & ALL MACHT
Jul 27, 2020
Unsere Welt besteht aus immer mehr Nullen und Einsen. Unser Leben geschieht vor dem Bildschirm. Tiefer und tiefer ziehen wir uns in das Netz zurück, gerade zu Zeiten der Pandemie. Home Office ist nicht mehr Arbeits-, sondern Lebensweise. Durchschnitt
6 min read
Nutzen: Souveränität
Linux Magazin germany
Article
Nutzen: Souveränität
Jul 7, 2021
8 min read
Die Themen
New Work Magazine
Article
Die Themen
Jan 6, 2023
Wie können eine moderne Einwanderungspolitik und erfolgreiches Standortmarketing dabei helfen, ausländische Fachkräfte zu gewinnen? Und welche Möglichkeiten bietet remote work, um dem Mangel an IT-Talenten entgegenzuwirken? Die Work & Culture zeigt L
1 min read
Trau, Schau, Wem!
LinuxUser
Article
Trau, Schau, Wem!
Jul 21, 2022
10 min read
Klare Kante
LinuxUser
Article
Klare Kante
Jul 21, 2021
Sehr geehrte Leserinnen und Leser, haben Sie einen E-Mail-Newsletter von Greenpeace abonniert, sich über eine Kooperative für Kaffeeanbau in Nicara- gua informiert oder – Gott behüte – auf der Webseite der Partei „Die Linke“ das Wahlprogramm gesucht
1 min read
Interview mit Dr. Ina Beintner, wissenschaftliche Leiterin bei Minddoc
iPhone & iPadLife
Article
Interview mit Dr. Ina Beintner, wissenschaftliche Leiterin bei Minddoc
Jun 30, 2022
Minddoc stellt Nutzer:innen Fragen zu ihrer psychischen Gesundheit und wählt basierend darauf Kurse und Übungen aus. Aber was ist das Ziel dieser Kurse? Zum Beispiel: Die App weist dich darauf hin, dass du Ängste hast, die vielleicht nicht ganz ratio
3 min read
Tux Liest
Linux Magazin germany
Article
Tux Liest
Oct 6, 2021
Bücher über den Datenschutz und die Modellierung- Dass es sich bei „Datenschutz im Unternehmen“ nicht um Unterhaltungslektüre handelt, wird schnell klar: Ab Seite 1 geht es ohne Vorgeplänkel zur Sache. Die Absätze sind mit fortlaufenden Randziffern n
2 min read
Ancestry.com
MacLife German
Article
Ancestry.com
Sep 2, 2021
2 min read

Related categories

Skip carousel

Reviews for Big Data Analytics

Rating: 0 out of 5 stars

0 ratings

0 ratings0 reviews

Book preview

Big Data Analytics - Sara D'Onofrio

Teil IGrundlagen

S. D'Onofrio, A. Meier (Hrsg.)Big Data AnalyticsEdition HMDhttps://doi.org/10.1007/978-3-658-32236-6_1

1. Rundgang Big Data Analytics – Hard & Soft Data Mining

Andreas Meier¹

(1)

Universität Fribourg, Fribourg, Schweiz

Andreas Meier

Email: andreas.meier@unifr.ch

Zusammenfassung

Das Einführungskapitel definiert und charakterisiert verschiedene Facetten des Big Data Analytics und zeigt auf, welche Nutzenpotenziale sich für Wirtschaft, öffentliche Verwaltung und Gesellschaft ergeben. Nach der Klärung wichtiger Begriffe wird der Prozess zum Schürfen nach wertvollen Informationen und Mustern in den Datenbeständen erläutert. Danach werden Methodenansätze des Hard Computing basierend auf klassischer Logik mit den beiden Wahrheitswerten wahr und falsch sowie des Soft Computing mit unendlich vielen Wahrheitswerten der unscharfen Logik vorgestellt. Anhand der digitalen Wertschöpfungskette elektronischer Geschäfte werden Anwendungsoptionen für Hard wie Soft Data Mining diskutiert und entsprechende Nutzenpotenziale fürs Big Data Analytics herausgearbeitet. Der Ausblick fordert auf, einen Paradigmenwechsel zu vollziehen und sowohl Methoden des Hard Data Mining wie des Soft Data Mining für Big Data Analytics gleichermaßen zu prüfen und bei Erfolg umzusetzen.

Schlüsselwörter

Big Data AnalyticsData ScienceFuzzy LogicHard Data MiningKnowledge Discovery in DatabasesParadigmenwechselSoft Data Mining

Dieses Kapitel beruht auf einer Erweiterung und Aktualisierung des Beitrags von Meier A. (2019) Überblick Analytics: Methoden und Potenziale. HMD – Praxis der Wirtschaftsinformatik, Heft 329, 56(5): 885–899.

1.1 Motivation und Begriffseinordnung

Wissenschaft, Wirtschaft, öffentliche Verwaltung und Gesellschaft befinden sich in einer Umbruchphase, die als digitaler Transformationsprozess bezeichnet wird. Dabei wird das wirtschaftliche, öffentliche wie private Leben von Informations- und Kommunikationstechnologien getrieben. Zu jeder Zeit und an jedem Ort entstehen Datenspuren: Postings aus sozialen Medien, elektronische Briefe, Anfrageverhalten in Suchmaschinen, Bewertungen von Produkten und Dienstleistungen, Geo-Daten, Messdaten des Haushalts (Smart Meter), Aufzeichnungen von Monitoring-Systemen, Daten aus eHealth-Anwendungen, Prozessdaten aus der Produktion, Kennzahlen von Webplattformen, um nur einige Beispiele zu nennen.

Der Wandel von der Industrie- zur Informations- und Wissensgesellschaft spiegelt sich in der Bewertung der Information als Produktionsfaktor wider. Information hat im Gegensatz zu materiellen Wirtschaftsgütern folgende Eigenschaften:

Darstellung: Information wird durch Zeichen, Signale, Nachrichten oder Sprachelemente spezifiziert.

Verarbeitung: Information kann mit Hilfe von Algorithmen (Berechnungsvorschriften) übermittelt, gespeichert, klassifiziert, aufgefunden und in andere Darstellungsformen transformiert werden.

Quelle: Die Herkunft einzelner Informationskomponenten ist kaum nachweisbar. Manipulationen sind jederzeit möglich. Information ist beliebig kopierbar und kennt per se keine Originale.¹

Kombination: Information ist beliebig kombinierbar.

Alter: Information unterliegt keinem physikalischen Alterungsprozess. Hingegen spielt die Zeitachse bezüglich Aktualität der Information eine Rolle.

Vagheit: Information ist unscharf (vgl. Abschn. 1.2.2), das heißt sie ist oft unpräzis und hat unterschiedliche Aussagekraft (Qualität).

Träger: Information benötigt keinen fixierten Träger; sie ist unabhängig vom Herkunftsort.

Diese Eigenschaften belegen, dass sich digitale Güter (Information, Software, Multimedia, etc.) in Handhabung sowie in ökonomischer, rechtlicher und sozialer Wertung von materiellen Gütern stark unterscheiden. Beispielsweise verlieren physische Produkte durch Nutzung meistens an Wert, gegenseitige Nutzung von Information hingegen kann einem Wertzuwachs dienen. Ein weiterer Unterschied besteht darin, dass materielle Güter mit kalkulierbaren Kosten hergestellt werden können, die Erzeugung digitaler Produkte jedoch schwierig kalkulierbar bleibt. Allerdings ist Vervielfältigung von Informationen gegenüber materiellen Gütern einfach und dank Moore’s Law² kostengünstig (Rechenaufwand, Material des Informationsträgers). Zudem bleiben bei Informationsobjekten die Eigentumsrechte und Besitzverhältnisse schwer bestimmbar, obwohl digitale Wasserzeichen und andere Datenschutz- und Sicherheitsmechanismen zur Verfügung stehen (Meier und Stormer 2012).

Das Sammeln, Speichern und Verarbeiten digitaler Information ist zum Alltag geworden und wichtige Dienstleistungen sind davon abhängig; man denke dabei an die digitalen Kontaktdaten. Dies nicht nur bei kommerziellen Anwendungen, sondern auch im öffentlichen Leben. Die wichtigsten Herausforderungen lauten: Wie bewältigen wir diesen Information Overload? Wie können wir die Qualität der heterogenen Daten gewährleisten? Wann können wir den Auswertungen und Empfehlungen trauen? Wie sichern wir unsere Entscheidungen ab?

Die Heterogenität umfangreicher Datensammlungen und die Vielfalt von Auswertungsmethoden rücken Big Data Analytics in den Fokus vieler Entscheidungsträger in Politik, Wirtschaft, öffentlicher Verwaltung und Gesellschaft. Die Herangehensweise zu erfolgversprechenden Auswertungsstrategien ist nicht von vornherein klar erkenntlich und muss eventuell iterativ in Abklärungsschritten erarbeitet werden. Wichtig bleibt, Begriffe und Vorgehensweisen betreffend Big Data Analytics im Vorfeld zu klären, einzuordnen und allen Anspruchsgruppen zu kommunizieren.

1.1.1 Was heißt Big Data?

Seit einigen Jahren sind Unternehmen, Organisationen, Forschungseinrichtungen und Citizens mit Big Data konfrontiert (Fasel und Meier 2016), das heißt mit der Bewältigung umfangreicher Daten aus unterschiedlichen Datenquellen. Die Herkunft der Daten sowie deren Struktur sind vielfältig. Aus diesem Grunde werden die digitalen Daten oft mit dem Begriff Multimedia gemäß Abb. 1.1 charakterisiert.

../images/502366_1_De_1_Chapter/502366_1_De_1_Fig1_HTML.png

Abb. 1.1

Vielfalt der Multimedia-Daten beim Big Data Analytics, angelehnt an Meier (2018)

Big Data Analytics kann mit Hilfe von V’s näher gefasst werden (Fasel und Meier 2016; Meier und Kaufmann 2016):

Volume: Der Datenbestand ist umfangreich und liegt im Tera- bis Zettabytebereich (Megabyte = 10⁶ Byte, Gigabyte = 10⁹ Byte, Terabyte = 10¹² Byte, Petabyte = 10¹⁵ Byte, Exabyte = 10¹⁸ Byte, Zettabyte = 10²¹ Byte).

Variety: Unter Vielfalt versteht man bei Big Data Analytics die Verarbeitung von strukturierten, semi-strukturierten und unstrukturierten Multimedia-Daten (Text, Grafik, Bilder, Audio und Video gemäß Abb. 1.1).

Velocity: Der Begriff bedeutet Geschwindigkeit und verlangt, dass im Extremfall Datenströme (Data Streams) in Echtzeit ausgewertet und analysiert werden können.

Value: Big Data Analytics soll den Wert des Unternehmens oder der Organisation steigern. Investitionen in Personal und technische Infrastruktur werden dort gemacht, wo eine Hebelwirkung besteht respektive ein Mehrwert generiert werden kann.

Veracity: Da viele Daten vage oder ungenau sind, müssen spezifische Algorithmen zur Bewertung der Aussagekraft respektive zur Qualitätseinschätzung der Resultate verwendet werden (vgl. Soft Computing in Abschn. 1.2.2). Umfangreiche Datenbestände garantieren nicht per se eine bessere Auswertungsqualität.

Veracity bedeutet in der deutschen Übersetzung Aufrichtigkeit oder Wahrhaftigkeit. Im Zusammenhang mit Big Data Analytics wird damit ausgedrückt, dass Datenbestände in unterschiedlicher Datenqualität vorliegen und dass dies bei Auswertungen berücksichtigt werden muss. Neben statistischen Verfahren und Data Mining existieren unscharfe Methoden des Soft Computing, die einem Resultat oder einer Aussage Wahrheitswerte zwischen wahr und falsch zuordnen (vgl. Ausführungen zum Soft Computing in Abschn. 1.2.2 resp. zum Fuzzy Portfolio in Abschn. 1.3.2).

Big Data ist nicht nur eine Herausforderung für profitorientierte Unternehmen im elektronischen Geschäft, sondern auch für das Aufgabenspektrum von Regierungen, öffentlichen Verwaltungen, NGO’s (Non Governmental Organizations) und NPO’s (Non Profit Organizations).

Als Beispiel seien die Programme für Smart City oder Ubiquitous City erwähnt, das heißt die Nutzung von Big-Data-Technologien in Städten, Agglomerationen und ländlichen Regionen. Ziel dabei ist, den sozialen und ökologischen Lebensraum nachhaltig zu entwickeln. Dazu zählen zum Beispiel Projekte zur Verbesserung der Mobilität, Nutzung intelligenter Systeme für Wasser- und Energieversorgung, Förderung sozialer Netzwerke, Erweiterung politischer Partizipation, Ausbau von Entrepreneurship, Schutz der Umwelt oder Erhöhung von Sicherheit und Lebensqualität.

1.1.2 Relevanz von Datenspeichersystemen

Relationale Datenbanksysteme, oft SQL-Datenbanksysteme genannt, organisieren die Datenbestände in Tabellen (Relationen) und verwenden als Abfrage- und Manipulationssprache die international standardisierte Sprache SQL (Structured Query Language; Meier und Kaufmann 2016).

Relationale Datenbanksysteme sind zurzeit in den meisten Unternehmen, Organisationen und vor allem in KMU’s (Kleinere und Mittlere Unternehmen) im Einsatz. Bei massiv verteilten Anwendungen im Web hingegen oder bei Big-Data-Anwendungen muss die relationale Datenbanktechnologie oft mit NoSQL³-Technologien ergänzt werden, um Webdienste rund um die Uhr und weltweit anbieten zu können.

Ein NoSQL-Datenbanksystem unterliegt einer massiv verteilten Datenhaltungsarchitektur. Die Daten selber werden je nach Typ der NoSQL-Datenbank entweder als Schlüssel-Wertpaare („key/value store), in Spalten oder Spaltenfamilien („column store), in Dokumentspeichern („document store) oder in Graphen („graph database) gehalten (vgl. Abb. 1.2).

../images/502366_1_De_1_Chapter/502366_1_De_1_Fig2_HTML.png

Abb. 1.2

Nutzung von SQL- und NoSQL-Datenbanken im Webshop, angelehnt an Meier (2018)

Um hohe Verfügbarkeit zu gewähren und das NoSQL-Datenbanksystem gegen Ausfälle zu schützen, werden unterschiedliche Replikationskonzepte unterstützt. Zudem wird mit dem sogenannten Map/Reduce-Verfahren hohe Parallelität und Effizienz für die Datenverarbeitung gewährleistet. Beim Map/Reduce-Verfahren werden Teilaufgaben an diverse Rechnerknoten verteilt und einfache Schlüssel-Wertpaare extrahiert („map) bevor die Teilresultate zusammengefasst und ausgegeben werden („reduce).

In Abb. 1.2 ist ein elektronischer Shop als Beispiel für die Vielfalt von analytischen Optionen schematisch dargestellt:

Key/Value Store: Um eine hohe Verfügbarkeit und Ausfalltoleranz zu garantieren, wird ein Key/Value-Speichersystem für die Session-Verwaltung sowie für den Betrieb der Einkaufswagen eingesetzt. Die Analyse von Kundenbesuchen respektive die Auswertung der Einkaufswagen kann direkt im Key/Value Store oder im Data Warehouse (siehe unten) vorgenommen werden.

Document Store: Die Kundenbestellungen selber werden im Dokumentspeicher abgelegt. Aktuelle Bestellungen lassen sich direkt im Document Store analysieren. Zeitreihenvergleiche oder differenzierte Auswertungen und Prognosen werden im Data Warehouse (z. B. mit Descriptive oder Predictive Analytics gemäß Abschn. 1.1.3) vorgenommen.

Relationales Datenbanksystem: Kunden- und Kontoverwaltung erfolgt mit einem relationalen Datenbanksystem. Dieses klassische Datenbanksystem garantiert jederzeit Konsistenz und ist unter anderem für lückenlose Buchhaltung und verlässliches Finanzmanagement relevant. Entsprechende Auswertungen wichtiger Finanzkennzahlen erfolgen hier oder im Data Warehouse.

Data Warehouse: Bedeutend für den erfolgreichen Betrieb eines Webshops ist das Performance Measurement. Mit Hilfe von Web Analytics werden wichtige Kenngrößen („key performance indicators, KPIs) der Inhalte wie der Webbesucher in einem Data Warehouse aufbewahrt. Spezifische Werkzeuge (Data Mining, Predictive Business Analysis) werten Geschäftsziele wie Erfolg der getroffenen Maßnahmen regelmäßig aus. Da die Analysearbeiten auf dem mehrdimensionalen Datenwürfel („datacube) zeitaufwendig sind, wird dieser InMemory⁴ gehalten.

Graphdatenbank: Falls die Beziehungen unterschiedlicher Anspruchsgruppen analysiert werden sollen, drängt sich der Einsatz von Graphdatenbanken auf. Diese erlauben, Geschäftsbeziehungen, soziale Interaktionen, Meinungsäusserungen, Bewertungen von Produkten oder Dienstleistungen, Kritik und Wünsche etc. für die Kundenbindung zu nutzen und auszuwerten.

Die Verknüpfung eines Webshops mit sozialen Medien ist für ein Unternehmen oder eine Organisation zukunftsweisend. Neben der Ankündigung von Produkten und Dienstleistungen kann analysiert werden, ob und wie die Angebote bei den Nutzern ankommen. Bei Schwierigkeiten oder Problemfällen wird mit gezielter Kommunikation und geeigneten Maßnahmen versucht, einen möglichen Schaden abzuwenden oder zu begrenzen. Darüber hinaus hilft die Analyse von Weblogs oder die Verfolgung aufschlussreicher Diskussionen in sozialen Netzen, Trends oder Innovationen für das eigene Geschäft zu erkennen.

1.1.3 Facetten des Big Data Analytics

Unter Analytics versteht man das Analysieren und Interpretieren umfassender, oft heterogener Datenbestände, um Muster und Zusammenhänge in den Daten aufzudecken und Entscheidungsgrundlagen für betriebliche wie gesellschaftliche Abläufe oder für private Zwecke zu erhalten. Der Begriff Analytics hat unterschiedliche Ausprägungen, wie Abb. 1.3 aufzeigt.

../images/502366_1_De_1_Chapter/502366_1_De_1_Fig3_HTML.png

Abb. 1.3

Begriffseinordnung, angelehnt an Gluchowski (2016) und erweitert von Meier (2019)

Ziel des Big Data Analytics ist das Erfassen und Beschreiben relevanter Merkmale oder Attribute zum Erhalt eines Beschreibungsmodells, Analyse- und Empfehlungsmodells zur Erreichung der Ziele des Unternehmens respektive der Organisation. Im Kern stehen Descriptive Analytics, Diagnostic Analytics, Predictive Analytics sowie Prescriptive Analytics:

Descriptive Analytics: Werkzeuge erläutern den Entscheidungsträgern von Unternehmen und Organisationen aufgrund gesammelter Daten den Verlauf der Geschäfts- und Kundenbeziehungen und ermöglichen den Vergleich in Zeitreihen. Spezifische Visualisierungstechniken und Infografiken erlauben, die Veränderungen der Indikatoren (Kennzahlen) darzustellen.

Diagnostic Analytics: Diese Werkzeuge sind darauf ausgelegt, die Hintergründe der Entwicklung des Geschäfts respektive der Beziehungen mit den Anspruchsgruppen zu erklären. Spezifische Werkzeuge zur Berichterstattung extrahieren zudem die Gründe für die zeitliche Entwicklung und bereiten sie in Grafiken auf.

PredictiveAnalytics: Hier werden künftige Ereignisse und Entwicklungen aufgrund von historischen Daten prognostiziert. Zudem helfen Algorithmen der künstlichen Intelligenz und des maschinellen Lernens aufzuzeigen, welche Maßnahmen welche Wirkungen in Zukunft erzielen könnten (Erklärungsmodell).

Prescriptive Analytics: Mit diesen Werkzeugen werden nicht nur künftige Entwicklungen evaluiert, sondern konkrete Empfehlungsoptionen zur Entscheidungsfindung sowie für Zukunftsszenarien eines erfolgreichen Geschäftsverlaufs generiert. Die Werkzeuge zielen darauf ab, über die reine Vorhersage hinaus Handlungsoptionen zu erhalten, um deren Auswirkungen abschätzen zu können (Entscheidungsmodell).

Unter Business Analytics oder Business Intelligence wird das systematische Erarbeiten und Analysieren von Leistungskennzahlen (KPIs) in Unternehmen und Organisationen verstanden, um mit den erarbeiteten Entscheidungsgrundlagen den Erfolg zu sichern respektive auszubauen.

Web Analytics und Web Controlling umfassen die Evaluation, Definition, Messung, Auswertung und Adjustierung von Webkennzahlen; hier geht es primär um Analyse und Verbesserung der Webinhalte (u. a. Warenkorb, Dienstleistungen im eHealth, eGovernment-Portal) sowie Auswerten des Benutzerverhaltens und der entsprechenden Leistungsgrößen wie Umsatz, Gewinn, Zufriedenheit oder Weiterempfehlungen.

Das Fachgebiet Data Science umfasst alle Methoden und Techniken zur Extraktion von Wissen aus Datenbeständen (Kelleher und Tierney 2018). Demnach ist Analytics ein wichtiges Teilgebiet dieses Fachbereichs, geht es doch um das Erkennen von Mustern und Zusammenhängen aus strukturierten, semi-strukturierten und unstrukturierten Datensammlungen.

1.2 Zum Prozess Knowledge Discovery in Databases

Knowledge Discovery in Databases oder abgekürzt KDD (Ester und Sander 2013; Knoll und Meier 2009) ist der Prozess aller Teilschritte, um aus Datenbeständen Wissen zu generieren.

1.2.1 Branchenneutraler Industriestandard

In Abb. 1.4 ist der CRoss-Industry Standard Process für Data Mining (CRISP-DM) aufgezeigt (Chapman et al. 2000), ein branchenneutraler Industriestandard, der den Fokus auf die Wirtschaftsinformatik und die damit verbundenen betriebswirtschaftlichen Herausforderungen setzt. Ziel dabei ist, aus Datenbeständen in einem iterativen Verfahren wichtige Erkenntnisse für die Umsetzung von Geschäftsmodellen zu erwirken. Dieser Standard wurde als Prozessmodell im Rahmen eines EU-Förderprojektes entwickelt, unter anderem unter Beteiligung von Daimler-Benz (heute Daimler AG) und der Statistik- und Analyse-Software der Firma SPSS (Statistical Package for the Social Sciences) der University of Stanford, USA (heute IBM).

../images/502366_1_De_1_Chapter/502366_1_De_1_Fig4_HTML.png

Abb. 1.4

Komponenten des branchenneutralen CRISP-DM Industriestandards, angelehnt an Chapman et al. (2000)

Der Industriestandard CRISP-DM umfasst sechs Entwicklungsschritte:

Schritt 1 – Verständnis des Geschäftsmodells: Hier geht es um die Zielsetzung der Unternehmens- respektive Organisationsstrategie und um das Verständnis des Geschäftsmodells, um Kundenbindung und -entwicklung zu fördern. Insbesondere müssen die Ressourcen des Unternehmens respektive der Organisation, Chancen und Risiken der Umsetzung der längerfristigen Strategie sowie zeitliche Aspekte anhand der aktuellen Projektpläne berücksichtigt werden.

Schritt 2 – Verständnis der Anwendungs- und Datendomäne: Die Auswertung wichtiger Prozesse des Unternehmens sowie die dazu benötigten Datenquellen müssen studiert und verstanden werden. Im Detail geht es um die Analyse der Geschäftsprozesse und der Datenschnittstellen, um Qualität und Vollständigkeit der Informationen einschätzen zu können.

Schritt 3 – Vorbereitung der Datenbestände: Die strukturierten, semi-strukturierten und unstrukturierten Daten aus eigenen Datenquellen sowie aus dem Web werden zusammengetragen, auf einheitliche Formate transformiert und durch Metadaten beschrieben (logisches Datenmodell). Damit wird eine Vereinheitlichung der Datenbasis erzielt.

Schritt 4 – Modellierung der Datenbestände: Die für die Auswertung angestrebten Datenmodelle werden ausgewählt. Beispielsweise geht es darum, bei Big Data Analytics ein adäquates Prozessdatenmodell, Entitäten-Beziehungsmodell oder Graphenmodell zu entwickeln (Meier und Kaufmann 2016), an dem die Auswertungen ausgerichtet werden.

Schritt 5 – Evaluation der Daten: Hier müssen geeignete Methoden des Data Mining, insbesondere des Predictive oder Prescriptive Analytics respektive Soft Computing ausgewählt und auf Nützlichkeit getestet werden. Wichtige Methoden sind Entscheidungsbäume, Künstliche Neuronale Netze, Clusterverfahren, Assoziationsanalysen respektive unscharfe Methoden der Fuzzy Logic (siehe Abschn. 1.2.2). Ziel ist eine verbesserte Entscheidungsfindung für das Unternehmen respektive die Organisation.

Schritt 6 – Nutzung der Erkenntnisse für die Organisation respektive fürs Unternehmen: Die Resultate des Big Data Analytics werden geschult und dem Personal des Unternehmens respektive der Organisation aufgezeigt. Gleichzeitig geht es darum, die Qualität des Auswertungs-, Erklärungs- und Entscheidungsmodells sowie der verwendeten Methoden des Hard Data Mining respektive Soft Data Mining (vgl. Abschn. 1.2.2) zu überprüfen, um unter anderem Rückschlüsse aufs Geschäftsmodell ziehen zu können.

Die Empfehlungen aus dem Industriestandard CRISP-DM haben sich bei den Experten der Data Science weitgehend durchgesetzt, teilweise mit leichten firmenspezifischen Anpassungen respektive Verfeinerungen.

1.2.2 Hard versus Soft Data Mining

Hard Computing beruht auf der binären Logik mit den Wahrheitswerten wahr und falsch. Methoden basieren auf exakten Fakten, mathematischen oder statistischen Analysen sowie auf Berechnungen oder Auswertungen mittels Hard Data Mining. Im Gegensatz dazu versucht das Soft Computing, die Fähigkeiten des Menschen wie natürliche Sprache, Abwägen von Sachverhalten oder Intuition nachzubilden. Die Methoden des Soft Data Mining umfassen mehrwertige Logiken, approximative Ansätze, Heuristiken, evolutionäre Algorithmen, probabilistisches Schließen oder unscharfe Logik.

Data Mining bedeutet das Schürfen nach wertvollen Informationen und Mustern in den Datenbeständen. Algorithmen helfen, noch nicht bekannte Zusammenhänge in den Daten zu extrahieren und darzustellen (siehe auch Kap. 2 über ‚Methoden des Data Mining für Big Data Analytics‘ von Peter Gluchowski, Christian Schieder und Peter Chamoni in diesem Herausgeberwerk).

Zum Hard Data Mining zählen folgende Methoden:

Entscheidungsbäume: Diese bestehen aus einem Wurzelknoten mit unterschiedlich vielen inneren Knoten und mindestens zwei Blättern. Jeder Knoten entspricht einer formalen Regel und jedes Blatt gibt eine Teilantwort auf das Entscheidungsproblem. Beispielsweise werden in der Notfallmedizin Entscheidungsbäume verwendet, die auf Expertise beruhen und in kurzer Zeit erfolgversprechende Notmaßnahmen aufzeigen.

Clusterverfahren: Anhand von Ähnlichkeits- oder Distanzmaßen werden Datenobjekte in möglichst homogene Cluster (Gruppen ähnlicher Objekte) überführt: Objekte innerhalb eines Clusters sollten homogen, Objekte unterschiedlicher Cluster heterogen zueinander sein. Es geht ums Aufdecken von Ähnlichkeitsstrukturen in großen Datenbeständen wie zum Beispiel das Erkennen von Mustern in Satellitenbildern oder das Festlegen von Kundensegmenten.

Regressionsanalyse: Die lineare Regression ist ein statistisches Verfahren, um eine beobachtete abhängige Variable mit einer oder mehreren unabhängigen Variablen zu erklären. Damit lassen sich Zusammenhänge quantitativ beschreiben. Zudem dient die Regression dazu, Werte der abhängigen Variablen zu prognostizieren. Um eine nicht-lineare Funktion zu schätzen, können iterative Algorithmen eingesetzt werden. Ziel einer Regressionsanalyse könnte sein, unterschiedliche Kommunikations- und Absatzkanäle fürs Online Marketing auszuwerten, um den Erfolg der getätigten Investitionen zu vergleichen und Optimierungen vornehmen zu können.

Assoziationsanalyse: Diese dient dem Aufdecken von Mustern oder Zusammenhängen in Datenbeständen nach dem Schema ‚Wenn, dann …‘. Die Assoziationsanalyse beruht demnach auf einer Prämisse (Wenn A …) und einer Folgerung (… dann B). Sie verwendet Maßzahlen: Der Support drückt die Häufigkeit eines Objekts in der Datenbasis aus, die Konfidenz zählt die Folgerungen im Verhältnis zur Prämisse. Damit kann man zum Beispiel Produkte ermitteln, die häufig miteinander gekauft werden (Warenkorbanalyse), um ein Empfehlungssystem („recommender system") aufzubauen.

Bei Big Data Analytics werden umfangreiche Datenbestände aus unterschiedlichen Quellen ausgewertet. Es liegt auf der Hand, dass solche Daten oft missverständlich, unbestimmt, ungenau, ungewiss, unsicher oder vage sind. Aus diesem Grunde drängt es sich auf, Verfahren anzuwenden, welche die Ungewissheit der Daten stärker miteinbeziehen und bewerten (vgl. V für Veracity in Abschn. 1.1.1 ). Ein Lösungsansatz besteht darin, Methoden des Soft Computing respektive Verfahren der unscharfen Logik („fuzzy logic") anzuwenden (Zadeh 1994).

Entscheidungsfragen lassen sich bei anspruchsvollen Managementaufgaben nicht immer dichotom respektive scharf mit ja oder nein beantworten. Vielmehr geht es um ein Abwägen unterschiedlicher Einflussfaktoren und die Antwort für eine Problemlösung lautet oft ‚ja unter Vorbehalt …‘ oder ‚sowohl als auch …‘. Mit anderen Worten: Die Antwort ist unscharf („fuzzy") und kann neben ‚wahr‘ und ‚falsch‘ auch Wahrheitswerte zwischen 0 und 1 annehmen. Ein Wahrheitswert 0.7 bedeutet demnach, dass die Aussage zu 70 % wahr und zu 30 % falsch ist.

Lotfi A. Zadeh hat 1965 mit seinem Forschungspapier ‚Fuzzy Sets‘ (Zadeh 1965) den Grundstein zur unscharfen Logik gesetzt. Unscharfe Mengen sind Mengen, bei welchen die Zugehörigkeit der Elemente zur Menge mit einer Zugehörigkeitsfunktion μ gemessen wird, die Werte auf dem Einheitsintervall [0,1] annehmen kann. Somit wird die klassische Menge von Elementen erweitert, indem jedem Element x noch sein Zugehörigkeitsmaß μ (x) zur Menge mitgegeben wird.

Lotfi A. Zadeh formulierte Soft Computing als ‚die Fähigkeit des Menschen nachzuahmen, effektiv Methoden des vernünftigen Schließens einzusetzen, die nur approximativ und nicht exakt sind‘ (Zadeh 1994).

Wichtige Methoden des Soft Data Mining sind:

Fuzzy Clustering: Bei unscharfen Clusterverfahren werden Objekte nicht exklusiv einem einzigen Cluster zugeordnet. Vielmehr können sie zu unterschiedlichen Clustern gehören, abhängig von den jeweiligen Mengenzugehörigkeitsgraden. Als Beispiel wird in Abschn. 1.3.2 das Beziehungsmanagement mit individuellen Kundenwerten diskutiert (vgl. unscharfes Kundenportfolio in Abb. 1.7).

Evolutionäre Algorithmen: Diese zählen zu den naturanalogen Optimierungsverfahren, da sie von der Entwicklung natürlicher Lebewesen inspiriert sind. Die biologische Evolution (Selektion, Rekombination, Mutation) wird mit Hilfe von Software nachgebildet, um Suchvorgänge oder Optimierungen zu verbessern. Damit lassen sich als Beispiel Düng- und Bewässerungsstrategien für landwirtschaftliche Betriebe optimieren.

Künstliche Neuronale Netze: Solche bestehen aus einem Netzwerk von Verarbeitungseinheiten (sog. künstliche Neuronen, dem menschlichen Gehirn nachempfunden) und deren Verknüpfung untereinander. Die künstlichen Neuronen verfügen über Eingabe-, Aktivierungs- und Ausgabefunktion: Die eingegebenen Impulse werden gewichtet, mit Schwellwerten verglichen und beim Überschreiten aktiviert und weitergegeben. Künstliche Neuronale Netze eignen sich für Klassifikation, Regression und Clusterbildung. Unter anderem unterstützen sie Energieverteilungsentscheide in intelligenten Stromnetzwerken (Smart Grids).

Probabilistisches Schließen: Probabilistic Reasoning ist eine Form des logischen Schließens, das auf Wahrscheinlichkeiten beruht und sich gegenüber der klassischen Logik unterscheidet. Jede Aussage wird mit einer bestimmten Wahrscheinlichkeit bewertet, die die Unsicherheit der Aussage ausdrücken soll. Unsicherheiten können aus Statistiken abgeleitet oder von Experten geschätzt werden. In einigen Expertensystemen wird dieser Ansatz zum Beispiel für Diagnoseunterstützung verwendet.

Inductive Fuzzy Classification (Kaufmann 2014; Kaufmann et al. 2015): Hier handelt es sich um eine Form des überwachten Lernens („supervised learning") (Hüllermeier 2005), wobei der Lernprozess auf Beispielen beruht, um zu entscheiden, ob ein Element einer Menge zu einer vorgegebenen Klasse gehört aufgrund der vorgegebenen Attribute. So zeigen Kaufmann et al. (2015) auf, wie individuelle Marketingkampagnen damit Nachfrage und Abschluss von Cross- und Up-Selling verbessern.

Aufgrund der oben genannten Methoden rückt das Maschinelle Lernen in den Vordergrund. Hier lernt ein künstliches Softwaresystem aus Anwendungsbeispielen, um Muster und Gesetzmäßigkeiten in den Daten zu erkennen und Verallgemeinerungen anstellen zu können. Wichtige Anwendungsfelder sind Diagnoseverfahren, Aktienmarktanalysen oder forensische Anwendungen.

Die Vielfalt der Verfahren für Hard und Soft Data Mining konnten hier nur grob skizziert werden. Für Interessierte steht umfangreiche Literatur zur Verfügung (Ester und Sander 2013; Kruse et al. 2015; Lippe 2005; Liu 2011; Sivanandam und Deepa 2019 oder Witten et al. 2017). Die internationale Buchreihe zur Erforschung von Fuzzy Management Methods des Springer-Verlages enthält Grundlagen und Fallstudien zum Soft Computing (FMsquare 2020).

1.2.3 Prozessschritte für Wissensgenerierung

Beim Prozess für Knowledge Discovery (KDD) in Databases müssen Ziele für den Auswertungsauftrag erstellt, unterschiedliche Schritte zur Aufbereitung der notwendigen Daten durchlaufen, diverse Methoden des Hard wie Soft Data Mining erprobt und die Interpretation der Auswertungen vorgenommen

Enjoying the preview?

Page 1 of 1

Big Data Analytics: Grundlagen, Fallbeispiele und Nutzungspotenziale

About this ebook

Related to Big Data Analytics

Related ebooks

Intelligence (AI) & Semantics For You

Related podcast episodes

Related articles

Related categories

Reviews for Big Data Analytics

What did you think?

Book preview

Big Data Analytics - Sara D'Onofrio

1. Rundgang Big Data Analytics – Hard & Soft Data Mining

Zusammenfassung

1.1 Motivation und Begriffseinordnung

1.1.1 Was heißt Big Data?

1.1.2 Relevanz von Datenspeichersystemen

1.1.3 Facetten des Big Data Analytics

1.2 Zum Prozess Knowledge Discovery in Databases

1.2.1 Branchenneutraler Industriestandard

1.2.2 Hard versus Soft Data Mining

1.2.3 Prozessschritte für Wissensgenerierung