Data Science: Eine praxisorientierte Einführung im Umfeld von Machine Learning, künstlicher Intelligenz und Big Data - 2., erweiterte Auflage

Ebook256 pages2 hours

Data Science: Eine praxisorientierte Einführung im Umfeld von Machine Learning, künstlicher Intelligenz und Big Data - 2., erweiterte Auflage

Name: Data Science: Eine praxisorientierte Einführung im Umfeld von Machine Learning, künstlicher Intelligenz und Big Data - 2., erweiterte Auflage
Author: Michael Oettinger
ISBN: 9783347069527

By Michael Oettinger

Rating: 0 out of 5 stars

()

Read preview

About this ebook

Das Thema Data-Science wird häufig diskutiert. Seit der ersten Auflage dieses Buches im Jahr 2017 hat sich an diesem Trend wenig verändert. Data-Scientisten (m/w/d) erfahren eine steigende Nachfrage auf dem Job-Markt, da immer mehr Unternehmen ihre Analytics-Abteilungen auf- bzw. ausbauen und hierfür entsprechende Mitarbeiter suchen. Hier stellt sich die Frage, worin eigentlich der Tätigkeitsbereich eines Data-Scientisten besteht. Das Aufgabenfeld ist nicht eindeutig definiert und reicht über künstliche Intelligenz, Machine-Learning, Data-Mining, Python-Programmierung bis zu Big Data. Im vorliegenden Buch soll eine praxisorientierte Einführung und ein aktueller Überblick darüber gegeben werden, was Data-Science und der Beruf Data-Scientist umfassen.

Skip carousel

Science & Mathematics

LanguageDeutsch

Publishertredition

Release dateMay 18, 2020

ISBN9783347069527

Author

Michael Oettinger

Michael Oettinger ist ein freiberuflicher Data-Scientist und Geschäftsführer der oetti-ds GmbH. Er berät Unternehmen in unterschiedlichen Branchen. Nach einem Studium der Betriebswirtschaft mit Schwerpunkt auf mathematischen Verfahren und Marktforschung in Augsburg und Oviedo füllte er unterschiedliche Rollen bei PwC, IBM (u. a. SPSS), Fuzzy Logix und weiteren Softwareunternehmen aus. Als Mitglied bei MENSA beschäftigt er sich sowohl mit der menschlichen als auch mit der künstlichen Intelligenz. Schwerpunkt seiner Aktivitäten ist der konkrete und pragmatische Einsatz der existierenden analytischen Modelle in der betrieblichen Praxis mit den entsprechenden Softwaretools (v. a. Python, R, SQL, KNIME, RapidMiner, PySpark, und Tensorflow).

Related to Data Science

Related ebooks

Skip carousel

Big Data: Die neue Intelligenz des Menschen (GEO eBook)
Ebook
Big Data: Die neue Intelligenz des Menschen (GEO eBook)
byBookwire
Rating: 0 out of 5 stars
0 ratings
Künstliche Intelligenz in Sozialen Medien
Ebook
Künstliche Intelligenz in Sozialen Medien
byIntroBooks Team
Rating: 0 out of 5 stars
0 ratings
Digital Politics: So verändert das Netz die Demokratie. 10 Wege aus der digitalen Unmündigkeit
Ebook
Digital Politics: So verändert das Netz die Demokratie. 10 Wege aus der digitalen Unmündigkeit
byAleksandra Sowa
Rating: 0 out of 5 stars
0 ratings
Nutzenpotenziale von Industrie 4.0: Einblicke in aktuelle Studienergebnisse
Ebook
Nutzenpotenziale von Industrie 4.0: Einblicke in aktuelle Studienergebnisse
byRalf-Christian Härting
Rating: 0 out of 5 stars
0 ratings
Mensch und Künstliche Intelligenz: Herausforderungen für Kultur, Wirtschaft und Gesellschaft
Ebook
Mensch und Künstliche Intelligenz: Herausforderungen für Kultur, Wirtschaft und Gesellschaft
byNicole Brandstetter
Rating: 0 out of 5 stars
0 ratings
Das Ende des Zufalls: Wie Big Data uns und unser Leben vorhersagbar macht
Ebook
Das Ende des Zufalls: Wie Big Data uns und unser Leben vorhersagbar macht
byRudi Klausnitzer
Rating: 0 out of 5 stars
0 ratings
IT-Wissen für Manager: Ein kompakter Überblick zu aktuellen Technologien und Trends
Ebook
IT-Wissen für Manager: Ein kompakter Überblick zu aktuellen Technologien und Trends
byBoD - Books on Demand
Rating: 0 out of 5 stars
0 ratings
Business-Intelligence-Lösungen für Unternehmen
Ebook
Business-Intelligence-Lösungen für Unternehmen
byErik Purwins
Rating: 0 out of 5 stars
0 ratings
ChatGPT – Für Einsteiger: Schreibprofi mit KI, Zeit und Geld sparen ohne peinliche Fehler
Ebook
ChatGPT – Für Einsteiger: Schreibprofi mit KI, Zeit und Geld sparen ohne peinliche Fehler
byChrista Stuber
Rating: 0 out of 5 stars
0 ratings
Digitalisierung als Distributivkraft: Über das Neue am digitalen Kapitalismus
Ebook
Digitalisierung als Distributivkraft: Über das Neue am digitalen Kapitalismus
bySabine Pfeiffer
Rating: 0 out of 5 stars
0 ratings
IT Wissensmanagement: Theorie und Praxis
Ebook
IT Wissensmanagement: Theorie und Praxis
byVeikko Krypczyk
Rating: 0 out of 5 stars
0 ratings
Python lernen – kurz & gut
Ebook
Python lernen – kurz & gut
byMichael Inden
Rating: 0 out of 5 stars
0 ratings
Künstliche Intelligenz und Maschinisierung des Menschen
Ebook
Künstliche Intelligenz und Maschinisierung des Menschen
byPeter Seele
Rating: 0 out of 5 stars
0 ratings
Werde ein Data Head: Data Science, Machine Learning und Statistik verstehen und datenintensive Jobs meistern
Ebook
Werde ein Data Head: Data Science, Machine Learning und Statistik verstehen und datenintensive Jobs meistern
byAlex J. Gutman
Rating: 0 out of 5 stars
0 ratings
Bitcoin - sparen, anlegen und investieren(überarbeitete Ausgabe 2024): Informationen über Bitcoin und die Blockchain für Anfänger, Interessierte und Fortgeschrittene
Ebook
Bitcoin - sparen, anlegen und investieren(überarbeitete Ausgabe 2024): Informationen über Bitcoin und die Blockchain für Anfänger, Interessierte und Fortgeschrittene
byJoe Martin
Rating: 0 out of 5 stars
0 ratings
Digitalotopia: Sind wir bereit für die (R)Evolution der Wirklichkeit?
Ebook
Digitalotopia: Sind wir bereit für die (R)Evolution der Wirklichkeit?
bySascha Berger
Rating: 0 out of 5 stars
0 ratings
Website Performance
Ebook
Website Performance
byDaniel Koch
Rating: 0 out of 5 stars
0 ratings
Einstieg in die Datenanalyse mit SPSS
Ebook
Einstieg in die Datenanalyse mit SPSS
byMarco Schuchmann
Rating: 0 out of 5 stars
0 ratings
Künstliche Intelligenz für jedermann: Wie wir von schlauen Computern profitieren: Einführung in die Forschung der Künstlichen Intelligenz in Deutschland. Einfach erklärt und mit Blick in die Zukunft der Informationstechnologie.
Ebook
Künstliche Intelligenz für jedermann: Wie wir von schlauen Computern profitieren: Einführung in die Forschung der Künstlichen Intelligenz in Deutschland. Einfach erklärt und mit Blick in die Zukunft der Informationstechnologie.
byBookwire
Rating: 0 out of 5 stars
0 ratings
Google & mehr: Online-Recherche: Wie Sie exakte Treffer auf Ihre Suchanfragen erhalten
Ebook
Google & mehr: Online-Recherche: Wie Sie exakte Treffer auf Ihre Suchanfragen erhalten
byHektor Haarkötter
Rating: 0 out of 5 stars
0 ratings
Die Künstliche Intelligenz des Kapitals
Ebook
Die Künstliche Intelligenz des Kapitals
byTimo Daum
Rating: 0 out of 5 stars
0 ratings
Maschinelles Lernen In Aktion: Einsteigerbuch Für Laien, Schritt-Für-Schritt Anleitung Für Anfänger
Ebook
Maschinelles Lernen In Aktion: Einsteigerbuch Für Laien, Schritt-Für-Schritt Anleitung Für Anfänger
byAlan T. Norman
Rating: 0 out of 5 stars
0 ratings
Die Schönheit des Denkens: Mathematisierung der Wahrnehmung am Beispiel der Computational Neurosciences
Ebook
Die Schönheit des Denkens: Mathematisierung der Wahrnehmung am Beispiel der Computational Neurosciences
byHannah Fitsch
Rating: 0 out of 5 stars
0 ratings
Künstliche Intelligenz in Nachrichtenredaktionen: Begriffe, Systematisierung, Fallbeispiele
Ebook
Künstliche Intelligenz in Nachrichtenredaktionen: Begriffe, Systematisierung, Fallbeispiele
byBookwire
Rating: 0 out of 5 stars
0 ratings
Die Bit-Revolution: Künstliche Intelligenz steuert uns alle in Wirtschaft, Politik und Gesellschaft
Ebook
Die Bit-Revolution: Künstliche Intelligenz steuert uns alle in Wirtschaft, Politik und Gesellschaft
byGernot Brauer
Rating: 0 out of 5 stars
0 ratings
Digitalisierung in Mittel-, Ost- und Südosteuropa: Ost-West. Europäische Perspektiven 1/2023
Ebook
Digitalisierung in Mittel-, Ost- und Südosteuropa: Ost-West. Europäische Perspektiven 1/2023
byBookwire
Rating: 3 out of 5 stars
3/5
Goodbye, McK... & Co.: Welche Berater wir zukünftig brauchen. Und welche nicht.
Ebook
Goodbye, McK... & Co.: Welche Berater wir zukünftig brauchen. Und welche nicht.
byEdgar K. Geffroy
Rating: 0 out of 5 stars
0 ratings
Deep Learning – Grundlagen und Implementierung: Neuronale Netze mit Python und PyTorch programmieren
Ebook
Deep Learning – Grundlagen und Implementierung: Neuronale Netze mit Python und PyTorch programmieren
bySeth Weidman
Rating: 0 out of 5 stars
0 ratings
Einführung in Programmiersprachen
Ebook
Einführung in Programmiersprachen
byIntroBooks Team
Rating: 0 out of 5 stars
0 ratings
Einstieg ins Machine Learning: Grundlagen, Prinzipien, erste Schritte
Ebook
Einstieg ins Machine Learning: Grundlagen, Prinzipien, erste Schritte
byShahin Amiriparian
Rating: 0 out of 5 stars
0 ratings

Science & Mathematics For You

Skip carousel

Rassismus und kulturelle Identität: Ausgewählte Schriften 2
Ebook
Rassismus und kulturelle Identität: Ausgewählte Schriften 2
byStuart Hall
Rating: 0 out of 5 stars
0 ratings
Tesla: Freie Energie selber bauen Ausgabe 2018 Weiteres Bonusmaterial zum Buch auch auf: https://www.dein-teslabauplan.de
Ebook
Tesla: Freie Energie selber bauen Ausgabe 2018 Weiteres Bonusmaterial zum Buch auch auf: https://www.dein-teslabauplan.de
byPatrick Weinand-Diez
Rating: 0 out of 5 stars
0 ratings
Einstieg in ChatGPT: Künstliche Intelligenz verstehen und nutzen: Ein praktischer Ratgeber für Einsteiger
Ebook
Einstieg in ChatGPT: Künstliche Intelligenz verstehen und nutzen: Ein praktischer Ratgeber für Einsteiger
byRolf Jeger
Rating: 0 out of 5 stars
0 ratings
Wie man einen verdammt guten Roman schreibt 1
Ebook
Wie man einen verdammt guten Roman schreibt 1
byJames N Frey
Rating: 4 out of 5 stars
4/5
Lexikon der Symbole und Archetypen für die Traumdeutung
Ebook
Lexikon der Symbole und Archetypen für die Traumdeutung
byPeter Chairon
Rating: 5 out of 5 stars
5/5
Kognitive Verhaltenstherapie - Einführung: Kognitive Verhaltenstherapie bei Angst- und Panikstörungen, Burn-out und Depressionen - inkl. 4-Wochen-Plan, Arbeitsblättern und Fragebögen
Ebook
Kognitive Verhaltenstherapie - Einführung: Kognitive Verhaltenstherapie bei Angst- und Panikstörungen, Burn-out und Depressionen - inkl. 4-Wochen-Plan, Arbeitsblättern und Fragebögen
byKonstantin Pfannschmidt
Rating: 0 out of 5 stars
0 ratings
Das indoktrinierte Gehirn: Wie wir den globalen Angriff auf unsere mentale Freiheit erfolgreich abwehren
Ebook
Das indoktrinierte Gehirn: Wie wir den globalen Angriff auf unsere mentale Freiheit erfolgreich abwehren
byDr. med. Michael Nehls
Rating: 0 out of 5 stars
0 ratings
Von der Ursache dem Princip und dem Einen
Ebook
Von der Ursache dem Princip und dem Einen
byGiordano Bruno
Rating: 5 out of 5 stars
5/5
Philosophie als strenge Wissenschaft
Ebook
Philosophie als strenge Wissenschaft
byEdmund Husserl
Rating: 4 out of 5 stars
4/5
SPRACHSPIELE: FACHSPRACHE WIRTSCHAFT DAF: Ein universitäres Experiment
Ebook
SPRACHSPIELE: FACHSPRACHE WIRTSCHAFT DAF: Ein universitäres Experiment
byBrigitta Joebstl-Berger
Rating: 0 out of 5 stars
0 ratings
Die Krisis der europäischen Wissenschaften und die transzendentale Phänomenologie: Eine Einleitung in die phänomenologische Philosophie
Ebook
Die Krisis der europäischen Wissenschaften und die transzendentale Phänomenologie: Eine Einleitung in die phänomenologische Philosophie
byEdmund Husserl
Rating: 5 out of 5 stars
5/5
Schöpferische Evolution
Ebook
Schöpferische Evolution
byHenri Bergson
Rating: 5 out of 5 stars
5/5
Handbuch Experimente mit freier Energie: Mit freier Energie gegen die Klimakatastrophe
Ebook
Handbuch Experimente mit freier Energie: Mit freier Energie gegen die Klimakatastrophe
byGünter Wahl
Rating: 0 out of 5 stars
0 ratings
Agiles Projektmanagement: Scrum für Einsteiger
Ebook
Agiles Projektmanagement: Scrum für Einsteiger
byMarkus Heimrath
Rating: 0 out of 5 stars
0 ratings
Viva Vortex: Alles lebt - Quanten sind Wirbel sind verschachtelte Rückkopplungen
Ebook
Viva Vortex: Alles lebt - Quanten sind Wirbel sind verschachtelte Rückkopplungen
byGabi Müller
Rating: 5 out of 5 stars
5/5
Neuronale Netze
Ebook
Neuronale Netze
byWolfgang Ziegler
Rating: 0 out of 5 stars
0 ratings
Unterricht kompetent planen (E-Book): Vom didaktischen Denken zum professionellen Handeln
Ebook
Unterricht kompetent planen (E-Book): Vom didaktischen Denken zum professionellen Handeln
byBarbara Zumsteg
Rating: 0 out of 5 stars
0 ratings
...Als die Noten laufen lernten...Band 2: Kabarett-Operette-Revue-Film-Exil. Unterhaltungsmusik bis 1945
Ebook
...Als die Noten laufen lernten...Band 2: Kabarett-Operette-Revue-Film-Exil. Unterhaltungsmusik bis 1945
byKarin Ploog
Rating: 0 out of 5 stars
0 ratings
Ideologie, Identität, Repräsentation: Ausgewählte Schriften 4
Ebook
Ideologie, Identität, Repräsentation: Ausgewählte Schriften 4
byStuart Hall
Rating: 0 out of 5 stars
0 ratings
Experimente mit Hochleistungs-LEDs: Power-LEDs in der Praxis!
Ebook
Experimente mit Hochleistungs-LEDs: Power-LEDs in der Praxis!
byBurkhard Kainka
Rating: 5 out of 5 stars
5/5
Anglizismen und andere "Fremdwords" deutsch erklärt: Über 1000 aktuelle Begriffe
Ebook
Anglizismen und andere "Fremdwords" deutsch erklärt: Über 1000 aktuelle Begriffe
byHeinz C. Pütz
Rating: 0 out of 5 stars
0 ratings
DMT Handbuch - Alles über Dimethyltryptamin, DMT-Herstellungsanleitung und Schamanische Praxistipps
Ebook
DMT Handbuch - Alles über Dimethyltryptamin, DMT-Herstellungsanleitung und Schamanische Praxistipps
byChristopher Rottmann
Rating: 0 out of 5 stars
0 ratings
Das Tibetanische Totenbuch, Swedenborg und die moderne Nahtod-Forschung: Vergleichende Analyse mit einer Einführung in das Abduktions-Phänomen im Kontext höherdimensionaler Raumzeit
Ebook
Das Tibetanische Totenbuch, Swedenborg und die moderne Nahtod-Forschung: Vergleichende Analyse mit einer Einführung in das Abduktions-Phänomen im Kontext höherdimensionaler Raumzeit
byDirk Bertram
Rating: 0 out of 5 stars
0 ratings
Gamification - Spielend lernen (E-Book)
Ebook
Gamification - Spielend lernen (E-Book)
bySilke Fischer
Rating: 0 out of 5 stars
0 ratings
Kapitalismus Forever: Über Krise, Krieg, Revolution, Evolution, Christentum und Islam
Ebook
Kapitalismus Forever: Über Krise, Krieg, Revolution, Evolution, Christentum und Islam
byWolfgang Pohrt
Rating: 0 out of 5 stars
0 ratings
Entdeckungsgeschichte(n) der Chemie: Entdecker, Forscher und Erfinder der Chemie
Ebook
Entdeckungsgeschichte(n) der Chemie: Entdecker, Forscher und Erfinder der Chemie
byMichael Wächter
Rating: 0 out of 5 stars
0 ratings
Klassen führen (E-Book): mit Freude, Struktur und Gelassenheit
Ebook
Klassen führen (E-Book): mit Freude, Struktur und Gelassenheit
byChristoph Städeli
Rating: 0 out of 5 stars
0 ratings
Wissenschaft als Beruf: Eine Debatte
Ebook
Wissenschaft als Beruf: Eine Debatte
byMax Weber
Rating: 0 out of 5 stars
0 ratings
Einstein - Einblicke in seine Gedankenwelt: Diese Biografie bietet gemeinverständliche Betrachtungen über die Relativitäts-Theorie und Einsteins Weltsystem
Ebook
Einstein - Einblicke in seine Gedankenwelt: Diese Biografie bietet gemeinverständliche Betrachtungen über die Relativitäts-Theorie und Einsteins Weltsystem
byAlexander Moszkowski
Rating: 0 out of 5 stars
0 ratings
Die Berühmtesten Wissenschaftler
Ebook
Die Berühmtesten Wissenschaftler
byAlex Woolf
Rating: 0 out of 5 stars
0 ratings

Related podcast episodes

Skip carousel

Wieso die neuen riesigen Künstlichen Intelligenzen so brisant sind: Konzerne wie Google entwickeln KI-Systeme bislang nie dagewesener Größe, die in mehrerer Hinsicht beeindrucken
Podcast episode
Wieso die neuen riesigen Künstlichen Intelligenzen so brisant sind: Konzerne wie Google entwickeln KI-Systeme bislang nie dagewesener Größe, die in mehrerer Hinsicht beeindrucken
byFAZ D:ECONOMY
0 ratings
0% found this document useful
KI wird zum Wettbewerbsvorteil für Auto-Konzerne: Was die Computer im Auto schon können. Und was mit Daten noch möglich ist.
Podcast episode
KI wird zum Wettbewerbsvorteil für Auto-Konzerne: Was die Computer im Auto schon können. Und was mit Daten noch möglich ist.
byKünstliche Intelligenz
0 ratings
0% found this document useful
Wie KI bei der Überwachung der Nachhaltigkeit für das Lieferkettengesetz hilft: Ein Gespräch mit Jolene Ernesti, Mit-Gründerin des Start-ups ecotrek
Podcast episode
Wie KI bei der Überwachung der Nachhaltigkeit für das Lieferkettengesetz hilft: Ein Gespräch mit Jolene Ernesti, Mit-Gründerin des Start-ups ecotrek
byKünstliche Intelligenz
0 ratings
0% found this document useful
Wenn KI zur Sprache kommt
Podcast episode
Wenn KI zur Sprache kommt
byDas Ohr am Netz
0 ratings
0% found this document useful
Github-CEO Dohmke über die disruptive Kraft der Künstlichen Intelligenz: Handelsblatt Disrupt vom 14.04.2023
Podcast episode
Github-CEO Dohmke über die disruptive Kraft der Künstlichen Intelligenz: Handelsblatt Disrupt vom 14.04.2023
byHandelsblatt Disrupt - Der Podcast über Disruption und die Zukunft der Wirtschaft
0 ratings
0% found this document useful
Lesen lässt sich lernen: George Saunders’ Meisterklasse „Bei Regen in einem Teich schwimmen“: Paul Ingendaay spricht mit Hans Maarten van den Brink über die Kunst des Lesens und Erzählens
Podcast episode
Lesen lässt sich lernen: George Saunders’ Meisterklasse „Bei Regen in einem Teich schwimmen“: Paul Ingendaay spricht mit Hans Maarten van den Brink über die Kunst des Lesens und Erzählens
byFAZ Bücher-Podcast
0 ratings
0% found this document useful
#232 Für wen lohnt sich Krypto-Mining noch?: Finanzfluss Classics
Podcast episode
#232 Für wen lohnt sich Krypto-Mining noch?: Finanzfluss Classics
byFinanzfluss Podcast
0 ratings
0% found this document useful
OMR #363 mit Richard David Precht: Richard David Precht über die Schattenseiten der Digitalisierung und langweilige Talkshow-Auftritte
Podcast episode
OMR #363 mit Richard David Precht: Richard David Precht über die Schattenseiten der Digitalisierung und langweilige Talkshow-Auftritte
byOMR Podcast
0 ratings
0% found this document useful
Esperanto, Dothraki, Klingonisch – wie erfindet man eine Sprache?: David Peterson und Jessie Sams erfinden Sprachen für Hollywood-Blockbuster. Gitta spricht Esperanto, seit sie drei ist. Gunter Senft lernt vom Aussterben bedrohte Sprachen. Ein polyglotter Podcast über das faszinierendste Werkzeug der Menschheit
Podcast episode
Esperanto, Dothraki, Klingonisch – wie erfindet man eine Sprache?: David Peterson und Jessie Sams erfinden Sprachen für Hollywood-Blockbuster. Gitta spricht Esperanto, seit sie drei ist. Gunter Senft lernt vom Aussterben bedrohte Sprachen. Ein polyglotter Podcast über das faszinierendste Werkzeug der Menschheit
byZEIT WISSEN. Woher weißt Du das?
0 ratings
0% found this document useful
So wild kann Blümchensex sein: Sexleben in der Natur ist diverser, als Sie denken: Geckos und Fledermäuse bestäuben Blüten, manche Pflanze macht es sich selbst. Und das Beste: Sie erzeugen unser Essen.
Podcast episode
So wild kann Blümchensex sein: Sexleben in der Natur ist diverser, als Sie denken: Geckos und Fledermäuse bestäuben Blüten, manche Pflanze macht es sich selbst. Und das Beste: Sie erzeugen unser Essen.
byZEIT WISSEN. Woher weißt Du das?
100%
100% found this document useful
Kann der Mensch Winterschlaf?: Warum der Mensch die Anlage zum Dämmerzustand hat, erklären Forscher im ZEIT-Wissen-Podcast
Podcast episode
Kann der Mensch Winterschlaf?: Warum der Mensch die Anlage zum Dämmerzustand hat, erklären Forscher im ZEIT-Wissen-Podcast
byZEIT WISSEN. Woher weißt Du das?
0 ratings
0% found this document useful
Sonderfolge 7: Armin Nassehi über sein Buch "Muster": Ein Gespräch am Buchmesse-Stand der F.A.Z. mit Patrick Bernau
Podcast episode
Sonderfolge 7: Armin Nassehi über sein Buch "Muster": Ein Gespräch am Buchmesse-Stand der F.A.Z. mit Patrick Bernau
byFAZ Bücher-Podcast
0 ratings
0% found this document useful
Chatbot GPT – Das Ende der Kreativität?: Der Text-Roboter ChatGPT verblüfft mit geschliffenen Dialogen und hat einen Hype um das Thema künstliche Intelligenz ausgelöst. Das mit gewaltigen Datenmengen gefütterte Programm sorgt aber auch für Skepsis. Frageg am Philosophischen Stammtisch: Haben ...
Podcast episode
Chatbot GPT – Das Ende der Kreativität?: Der Text-Roboter ChatGPT verblüfft mit geschliffenen Dialogen und hat einen Hype um das Thema künstliche Intelligenz ausgelöst. Das mit gewaltigen Datenmengen gefütterte Programm sorgt aber auch für Skepsis. Frageg am Philosophischen Stammtisch: Haben ...
bySternstunde Philosophie
0 ratings
0% found this document useful
Bankenbeben: Ursachen, Folgen und eure Fragen
Podcast episode
Bankenbeben: Ursachen, Folgen und eure Fragen
byWall Street mit Markus Koch - featured by Handelsblatt
0 ratings
0% found this document useful
Künstliche Intelligenz bedroht ärztliche Kompetenz (3/4)
Podcast episode
Künstliche Intelligenz bedroht ärztliche Kompetenz (3/4)
byWDR 5 Tiefenblick
0 ratings
0% found this document useful
ChatGPT: Chancen, Grenzen und Risiken künstlicher Intelligenz: ChatGPT ist in aller Munde: Der scheinbar allwissende Chatbot kann Texte schreiben, diskutieren, argumentieren. Ein Vorbote einer Zukunft voll Künstlicher Intelligenz? Über Chancen, Grenzen und R…
Podcast episode
ChatGPT: Chancen, Grenzen und Risiken künstlicher Intelligenz: ChatGPT ist in aller Munde: Der scheinbar allwissende Chatbot kann Texte schreiben, diskutieren, argumentieren. Ein Vorbote einer Zukunft voll Künstlicher Intelligenz? Über Chancen, Grenzen und R…
bySpektrum-Podcast
0 ratings
0% found this document useful
Wie entsteht die menschliche Stimme?
Podcast episode
Wie entsteht die menschliche Stimme?
bySchneller schlau - Der kurze Wissenspodcast von P.M.
100%
100% found this document useful
Ep. 131: Schönes neues Metaverse?: Wohlstand für Alle
Podcast episode
Ep. 131: Schönes neues Metaverse?: Wohlstand für Alle
byWohlstand für Alle
0 ratings
0% found this document useful
185: Die Wahrheit über den Klimawandel - Klimaforscher Fritz Vahrenholt im Interview (Teil 1): In dieser Interview-Folge spreche ich mit dem Klimaforscher & Bestseller-Autor Fritz Vahrenholt darüber, ob der Klimawandel menschengemacht ist und, ob wir noch wenige Jahre Zeit haben, um uns vor schlimmer Katastrophe zu wehren. Was kannst Du aus dieser...
Podcast episode
185: Die Wahrheit über den Klimawandel - Klimaforscher Fritz Vahrenholt im Interview (Teil 1): In dieser Interview-Folge spreche ich mit dem Klimaforscher & Bestseller-Autor Fritz Vahrenholt darüber, ob der Klimawandel menschengemacht ist und, ob wir noch wenige Jahre Zeit haben, um uns vor schlimmer Katastrophe zu wehren. Was kannst Du aus dieser...
byMENSCHEN ÜBERZEUGEN mit Wladislaw Jachtchenko: Rhetorik & Argumentation, um besser zu führen, zu verhandeln, zu verkaufen | nicht nur für Führungskräfte!
0 ratings
0% found this document useful
Zuhören - Eine vergessene Kunst | Gesundheit
Podcast episode
Zuhören - Eine vergessene Kunst | Gesundheit
bySWR2 Wissen
0 ratings
0% found this document useful
Wie verändert ChatGPT unser Leben?
Podcast episode
Wie verändert ChatGPT unser Leben?
bySchneller schlau - Der kurze Wissenspodcast von P.M.
0 ratings
0% found this document useful
Wie die Mathematik zu dem wurde, was sie heute ist: Cantor, Hilbert, Gödel: Aeneas Rooch über eine Revolution, die nicht nur zum Computer führte
Podcast episode
Wie die Mathematik zu dem wurde, was sie heute ist: Cantor, Hilbert, Gödel: Aeneas Rooch über eine Revolution, die nicht nur zum Computer führte
byFAZ D:ECONOMY
0 ratings
0% found this document useful
Heroin mit Holundergeschmack: Baywatch Berlin
Podcast episode
Heroin mit Holundergeschmack: Baywatch Berlin
byBaywatch Berlin
0 ratings
0% found this document useful
„Urheberrecht für KI-Inhalte wird ein Problem für die Softwareindustrie“: F.A.Z. KI-Podcast
Podcast episode
„Urheberrecht für KI-Inhalte wird ein Problem für die Softwareindustrie“: F.A.Z. KI-Podcast
byKünstliche Intelligenz
0 ratings
0% found this document useful
Autonomes Fahren und Robo-Taxis von 2025 an auf deutschen Straßen: Mobileye-Manager Johann Jungwirth im Gespräch über Künstliche Intelligenz
Podcast episode
Autonomes Fahren und Robo-Taxis von 2025 an auf deutschen Straßen: Mobileye-Manager Johann Jungwirth im Gespräch über Künstliche Intelligenz
byKünstliche Intelligenz
100%
100% found this document useful
293: Corona Statistik-Tricks & die irrationale Angst der Deutschen - Prof. Krämer (Teil 1): Der heutige Gast Prof. Walter Krämer ist Professor für Wirtschafts- & Sozialstatistik. Mit ihm spreche ich über folgende Themen: Statistik-Fehler in Corona-Zeiten Die falsche Einschätzung von Risiken Über die deutsche Angst Über Mathematik-Kenntniss...
Podcast episode
293: Corona Statistik-Tricks & die irrationale Angst der Deutschen - Prof. Krämer (Teil 1): Der heutige Gast Prof. Walter Krämer ist Professor für Wirtschafts- & Sozialstatistik. Mit ihm spreche ich über folgende Themen: Statistik-Fehler in Corona-Zeiten Die falsche Einschätzung von Risiken Über die deutsche Angst Über Mathematik-Kenntniss...
byMENSCHEN ÜBERZEUGEN mit Wladislaw Jachtchenko: Rhetorik & Argumentation, um besser zu führen, zu verhandeln, zu verkaufen | nicht nur für Führungskräfte!
0 ratings
0% found this document useful
Ein Gewinner sein: So entfachst du deine unaufhaltsame Willensstärke // Claudia Strobl: Du möchtest ein Gewinner sein? Dann erfahre jetzt die ultimativen Tipps, um deine innere Kraft zu aktivieren! Skirennläuferin Claudia Strobl verrät in ihrer brandneuen Keynote, wie du zum Sieger wirst und wie Eltern ihre Kinder dabei unterstützen...
Podcast episode
Ein Gewinner sein: So entfachst du deine unaufhaltsame Willensstärke // Claudia Strobl: Du möchtest ein Gewinner sein? Dann erfahre jetzt die ultimativen Tipps, um deine innere Kraft zu aktivieren! Skirennläuferin Claudia Strobl verrät in ihrer brandneuen Keynote, wie du zum Sieger wirst und wie Eltern ihre Kinder dabei unterstützen...
byGreator – Inspiration, Motivation & Erfolg
0 ratings
0% found this document useful
„Jetzt kommt das goldene KI-Zeitalter“: Kai Beckmann, Mitglied der Geschäftsführung beim Technologiekonzern Merck und Präsident des Arbeitgeberverbands Chemie, über Künstliche Intelligenz in der Pharma-Branche.
Podcast episode
„Jetzt kommt das goldene KI-Zeitalter“: Kai Beckmann, Mitglied der Geschäftsführung beim Technologiekonzern Merck und Präsident des Arbeitgeberverbands Chemie, über Künstliche Intelligenz in der Pharma-Branche.
byKünstliche Intelligenz
0 ratings
0% found this document useful
Im Gespräch: Flo Osrainik („Das Corona-Dossier”)
Podcast episode
Im Gespräch: Flo Osrainik („Das Corona-Dossier”)
byKenFM: Im Gespräch
0 ratings
0% found this document useful
347: Wie denkt ein guter Journalist? - Josef Joffe im Interview: In dieser Podcastfolge spreche ich mit dem bekannten Publizisten und Herausgeber der ZEIT seit 2000, Josef Joffe. Wir sprechen darüber, was den guten Journalismus ausmacht. Das kannst du aus dieser Folge mitnehmen: Wie denkt ein guter Journalist? Wie suc...
Podcast episode
347: Wie denkt ein guter Journalist? - Josef Joffe im Interview: In dieser Podcastfolge spreche ich mit dem bekannten Publizisten und Herausgeber der ZEIT seit 2000, Josef Joffe. Wir sprechen darüber, was den guten Journalismus ausmacht. Das kannst du aus dieser Folge mitnehmen: Wie denkt ein guter Journalist? Wie suc...
byMENSCHEN ÜBERZEUGEN mit Wladislaw Jachtchenko: Rhetorik & Argumentation, um besser zu führen, zu verhandeln, zu verkaufen | nicht nur für Führungskräfte!
0 ratings
0% found this document useful

Skip carousel

Zahlen & Trends
Linux Magazin germany
Article
Zahlen & Trends
Oct 6, 2021
9 min read
So Digitalisierst Du Dein Studium
MacLife German
Article
So Digitalisierst Du Dein Studium
Oct 7, 2021
5 min read
Game-Changer: Wie ChatGPT & Co. die Regeln verändern
MacLife German
Article
Game-Changer: Wie ChatGPT & Co. die Regeln verändern
Jun 1, 2023
8 min read
„ Ethik Ist Eine Investition!“
MacLife German
Article
„ Ethik Ist Eine Investition!“
Apr 4, 2023
Mac Life: Professor Floridi, wie definieren Sie Intelligenz? Prof. Luciano Floridi: In der Literatur gibt es nicht eine oder zwei, sondern Dutzende Definitionen von Intelligenz – jede Disziplin hat ihre eigene. Ein Weg, Intelligenz zu verstehen, ist
9 min read
Warum Virtuelles Arbeiten Mehr Ist Als HOME OFFICE
New Work Magazine
Article
Warum Virtuelles Arbeiten Mehr Ist Als HOME OFFICE
Oct 24, 2020
5 min read
Duschen Wie Die Stars Aus Dem Bundestag
EULENSPIEGEL, Das Satiremagazin
Article
Duschen Wie Die Stars Aus Dem Bundestag
Sep 22, 2022
2 min read
Sind Sie eine KI?
EULENSPIEGEL, Das Satiremagazin
Article
Sind Sie eine KI?
May 25, 2023
3 min read
Zahlen & Trends
Linux Magazin germany
Article
Zahlen & Trends
Aug 4, 2021
7 min read
Unmoralische Wahl
Linux Magazin germany
Article
Unmoralische Wahl
Nov 3, 2021
Was soll das selbstfahrende Auto machen? Bei plötzlichem Bremsversagen kann es entweder die Spur halten und vier Obdachlose überfahren, die unrechtmäßig bei Rot die Straße überqueren, oder die Spur wechseln und zwei Männer und zwei Frauen töten, die
2 min read
Fliegender Wechsel
Linux Magazin germany
Article
Fliegender Wechsel
Mar 3, 2022
7 min read
Ein besonderes Jahr
Raspberry Pi Geek
Article
Ein besonderes Jahr
Aug 4, 2021
Sehr geehrte Leserinnen und Leser, der stockende Warenfluss aus und nach Asien trifft Industrie und Verbraucher in allen Bereichen. Viele Fahrradteile: Mangelware. Baustoffe wie Dämmmaterialien oder Abwasserrohre: Mangelware. Selbst Winzer klagen übe
2 min read
News
Linux Magazin germany
Article
News
Mar 3, 2022
6 min read
Zettelwirtschaft
LinuxUser
Article
Zettelwirtschaft
Sep 15, 2021
3 min read
Volksaufstand!
EULENSPIEGEL, Das Satiremagazin
Article
Volksaufstand!
Sep 22, 2022
Liebe Randaliererin, lieber Randalierer, die Deutschen stehen im Ruf, nicht besonders schnell zu sein, wenn es darum geht, sich mit Mistforken zu bewaffnen und plündernd und brandschatzend durch die Fußgängerzonen zu ziehen. Das könnte sich im von vi
4 min read
Ein Spätsommermärchen
EULENSPIEGEL, Das Satiremagazin
Article
Ein Spätsommermärchen
Sep 22, 2022
4 min read
Glückliche Schüler
LinuxUser
Article
Glückliche Schüler
Dec 16, 2021
8 min read
Künstliche Intelligenz Schneller Von Der Idee Zum Track So Hilft Dir Die Ki Beim Produzieren
Beat German
Article
Künstliche Intelligenz Schneller Von Der Idee Zum Track So Hilft Dir Die Ki Beim Produzieren
Nov 2, 2022
3 min read
Schreibwerkstatt
LinuxUser
Article
Schreibwerkstatt
Sep 22, 2022
9 min read
Gehen Den Deutschen Die Ideen Aus?
MacLife German
Article
Gehen Den Deutschen Die Ideen Aus?
Jul 8, 2021
4 min read
Pflanzen Fordern Uns Heraus
Bücher Magazin
Article
Pflanzen Fordern Uns Heraus
Mar 17, 2021
Der Biologe Stefano Mancuso liebt Pflanzen nicht nur, sondern versteht sie auch. Mancuso, der als Professor in Florenz lehrt, ist ein international gefragter Experte auf dem Gebiet der Pflanzenneurobiologie, wobei sein Engagement weit über den Teller
2 min read
Mit Podcasts Geld verdienen
MacLife German
Article
Mit Podcasts Geld verdienen
Aug 5, 2021
6 min read
Alltagswissen Das Gedächtnis stärken
LandGenuss
Article
Alltagswissen Das Gedächtnis stärken
Sep 8, 2022
Nein, gemeint ist keine Nilpferduniversität. Wer vom Hippocampus spricht, meint jene längliche, sichelförmige Gehirnregion im limbischen System, die für die Erinnerungen zuständig ist. Da sie im Gefühlssystem des Gehirns liegt, steuern die Gefühle, w
1 min read
Gelernt Ist Gelernt
LinuxUser
Article
Gelernt Ist Gelernt
Sep 21, 2023
4 min read
Gelernt Ist Gelernt
Raspberry Pi Geek
Article
Gelernt Ist Gelernt
Sep 21, 2023
4 min read
New New Work
MacLife German
Article
New New Work
Jan 7, 2021
4 min read
»Wir Können Beides Haben – Infektionsschutz Und Datenschutz!«
iPhone & iPadLife
Article
»Wir Können Beides Haben – Infektionsschutz Und Datenschutz!«
Jun 20, 2020
5 min read
»Wir Sehen Uns In Der Verantwortung! «
MacLife German
Article
»Wir Sehen Uns In Der Verantwortung! «
Feb 2, 2023
3 min read
»Wir Möchten Die Art Und Weise Revolutionieren, In Der Menschen Wissen Anwenden.«
MacLife German
Article
»Wir Möchten Die Art Und Weise Revolutionieren, In Der Menschen Wissen Anwenden.«
Nov 3, 2022
Dennis, erstaunlich viele Menschen vertrauen weiter auf ihre Zettelwirtschaft, um Notizen festzuhalten, statt zum Smartphone oder Computer zu greifen. Was kann Mem daran ändern? Ich glaube, der Umstand, dass viele Menschen immer noch lieber Papier fü
3 min read
Zahlen & Trends
Linux Magazin germany
Article
Zahlen & Trends
Jul 7, 2021
9 min read
KI im Marketing
MacLife German
Article
KI im Marketing
Mar 2, 2023
5 min read

Related categories

Skip carousel

Reviews for Data Science

Rating: 0 out of 5 stars

0 ratings

0 ratings0 reviews

Book preview

Data Science - Michael Oettinger

1 Einleitung

Das Thema Data-Science wird häufig diskutiert. Seit der ersten Auflage dieses Buches im Jahr 2017 hat sich an diesem Trend wenig verändert.

Data-Scientisten (m/w/d) erfahren eine steigende Nachfrage auf dem Job-Markt, da immer mehr Unternehmen ihre Analytics-Abteilungen auf- bzw. ausbauen und hierfür entsprechende Mitarbeiter suchen. Hier stellt sich die Frage, worin eigentlich der Tätigkeitsbereich eines Data-Scientisten besteht.

Das Aufgabenfeld ist nicht eindeutig definiert und reicht über künstliche Intelligenz, Machine-Learning, Data-Mining, Python-Programmierung und Big Data.

Das Thema wird auch außerhalb der Unternehmen zunehmend wahrgenommen und diskutiert. Oft ist der Diskurs geprägt von einer Mischung aus Unwissenheit, Ignoranz und Ängsten, vor allem, was künstliche Intelligenz angeht.

Das Spektrum der Meinungen reicht dabei von Weltuntergang bis Weltrettung. Viele warnen vor den Gefahren, die sich aus der unkontrollierten Nutzung von Daten und den Möglichkeiten der künstlichen Intelligenz ergeben. Unternehmen wie Google und Facebook sind Datenkraken, die ihre unvorstellbar großen Datenschätze mit intelligenten Verfahren auswerten, um damit unser Verhalten in ihrem Sinne beeinflussen und letztendlich auch über unser Leben bestimmen zu können. Autos fahren zukünftig autonom und intelligente Roboter werden unsere Sprache verstehen, selbständig intelligente Entscheidungen treffen und uns die Arbeitsplätze wegnehmen.

Auf der anderen Seite werden unvorstellbare Wunderszenarien mit „rosa Farben" an die Wand gemalt. Durch die Analyse von Daten können zukünftig künstliche Ärzte Krankheiten ausrotten, Verkehrsflüsse werden ohne Stau organisiert und der intelligente Kühlschrank wird sich automatisch selbst füllen, da er genau weiß, was wir benötigen.

Die Wahrheit liegt irgendwo in der Mitte, wobei es nicht wirklich die Mitte ist. Denn einerseits werden die Möglichkeiten und Fähigkeiten der eingesetzten Verfahren – meist aus Unwissenheit – völlig überschätzt. Ein künstliches neuronales Netz ist nichts Weiteres als ein relativ einfaches mathematisches Verfahren, das noch meilenweit von den Fähigkeiten eines echten neuronalen Netzwerkes mit dem Namen Gehirn entfernt ist. Deep Learning mit dem Computer ist dem Lernen eines Zweijährigen in vielen Aspekten so unterlegen, dass der Begriff Lernen eigentlich irreführend ist. In anderen Aspekten ist der Computer aber mit seinen Fähigkeiten dem Menschen weit überlegen. Viele der Potenziale, die sich daraus ergeben, sind noch ungenutzt.

Mit diesem Buch soll das Themengebiet – praxisorientiert – auf den Boden der Realität geholt werden. Es geht um Data-Science. Dabei handelt es sich zwar auch um eine Wissenschaft, aber vor allem um betriebliche Praxis. Es geht um den Aufgabenbereich eines Data-Scientisten. Spätestens, als das Harvard Business Review im Oktober 2012 Data-Science als „The Sexiest Job of the 21st Century" ausrief, stieg das Interesse an dem Aufgabenfeld stark an.¹ Der Job eines Data-Scientisten ist es, aus großen Datenmengen Informationen zu generieren und Handlungsempfehlungen abzuleiten, die das Unternehmen befähigen, effizienter zu arbeiten. Dazu werden technische Hilfsmittel (Datenbanken, Analysesoftware) und theoretische Verfahren (Machine-Learning, Data-Mining, statistische Verfahren etc.) eingesetzt.

Ein Data-Scientist kann mit riesigen Datenmengen umgehen und einen möglichst großen Nutzen daraus ziehen. Das bedeutet, dass eine Mischung aus

• aktuellem, technischen/IT-Wissen,

• fundierten Kenntnissen der mathematisch-statistischen Verfahren,

• Domänenwissen über das fachliche Umfeld des Arbeitgebers/Auftraggebers

• und kommunikativen Fähigkeiten

vorhanden sein muss. Es handelt sich um ein modernes Einhorn: ein Data-Geek mit Managementqualitäten.

Im vorliegenden Buch soll ein aktueller Überblick darüber gegeben werden, was die Wissenschaft Data-Science und der Beruf Data-Scientist umfassen. Es soll ein Beitrag geleistet werden, der die Diskussion versachlicht und dazu anregt, das große Potenzial maschinellen Lernens vermehrt in der unternehmerischen Praxis zu nutzen. Es entsteht der Eindruck, dass viele Aktivitäten in Unternehmen noch zu stark auf Randgebiete beschränkt sind (es geht z. B. um die Bereitstellung der Technik oder um Diskussionen, was gewollt und was erlaubt ist), während die tatsächlichen „Erkenntnisgewinnungsprojekte" viel zu kurz kommen.

Es lässt sich die Frage stellen, ob es nicht fahrlässig ist, wenn Unternehmen und Organisationen bewährte Verfahren und Technologien nicht einsetzen. Beispielhaft auf das Gesundheitswesen angewendet, sieht die Problematik wie folgt aus:

Ist es unterlassene Hilfeleistung mit Todesfolge, wenn Gesundheitsdaten nicht analysiert werden? Das ist zugegebenermaßen eine sehr provokante These. Aber im Kern geht es darum, dass es zahlreiche Beispiele gibt, in denen nachgewiesenermaßen durch die Analyse von Gesundheitsdaten Kosten gespart, Krankheitsbehandlungen optimiert und letztendlich Todesfälle verhindert werden können (siehe Abschnitt 6.2.4).

Es ist eben bequemer, sich auf die Schwierigkeiten der Datenbeschaffung, die restriktiven Datenschutzregelungen oder auf technische Engpässe zu berufen. Häufig ist auch – insbesondere bei Führungskräften – ein Kokettieren mit der eigenen Ignoranz bezüglich Mathematik, Statistik und Technik erkennbar. Aber es gibt keinen Grund, nicht zu handeln: Die Daten sind vorhanden; die mathematischen und statistischen Verfahren sind vorhanden; die Technik, auch um riesige Datenmengen bzw. Big Data auszuwerten, ist vorhanden.

Letztendlich ist es ein Imperativ, alles daranzusetzen, Erkenntnisse aus den vorhandenen Daten zu gewinnen. Alles andere bedeutet eine Verschwendung des Geldes der Mitglieder unseres Gesundheitssystems und im extremen Fall eben auch unterlassene Hilfeleistung mit Todesfolge.

Es lassen sich ähnlich provokante Fragen in allen Branchen finden. Ist es Verschwendung des Geldes der Eigentümer, wenn ein Chiphersteller nicht alles daran setzt, seinen Produktionsprozess durch Datenanalyse zu optimieren und den Ausschuss zu vermindern? Warum verschwendet eine Supermarktkette Lebensmittel, weil sie den Bedarf nicht nach Regeln der Data-Science prognostiziert hatte (siehe Abschnitt 6.2.6)? Warum bleibt ein Zug stehen und verursacht hohe Kosten beim Bahnunternehmen und bei den Kunden, nur weil ein Teil kaputtgeht, das vorausschauend schon hätte ausgewechselt werden können (siehe Abschnitt 6.2.2)?

Es lassen sich, wie bereits erwähnt, in jeder Branche Hunderte vergleichbare Situationen finden, in denen mit datenanalysierenden Verfahren Verbesserungen realisiert werden können. Die Optimierungen in den einzelnen Projekten sind oft nicht umfassend und aufwändig, sondern liegen eher im unspektakulären Prozentbereich. Es reicht aber in der Regel aus, dass sich das einzelne Projekt rechnet (eine um ein Prozent erhöhte Responserate auf eine Mailingaktion kann eine Verdopplung des Gewinnes bedeuten). Hochgerechnet auf das ganze Unternehmen oder sogar auf Volkswirtschaften handelt es sich um Millionen- bzw. Milliardenbeträge – und manchmal eben auch um Tausende von Menschenleben.

Diese Effekte können oft über unkritische Projekte erreicht werden. Die Kritik an datenanalysierenden Aktivitäten, die Persönlichkeitsrechte verletzen, das Leben von Menschen manipulieren etc. ist berechtigt und notwendig. Aber es gibt genügend Bereiche, die unkritisch sind, und es gibt keinen Grund, Aktivitäten in diesen Gebieten nicht anzugehen.

Zweite Auflage

In den drei Jahren seit der ersten Auflage dieses Buches haben sich insbesondere im Bereich der Softwarelösungen einige Änderungen ergeben. Bestehende Angebote haben sich weiterentwickelt, neue Lösungen kamen hinzu und wurden optimiert und manche Angebote haben an Beliebtheit verloren. Der Trend zur Cloud hat ebenso Auswirkungen auf die Anforderungen an Data-Scientisten. Dementsprechend wurden die diesbezüglichen Kapitel in der zweiten Auflage aktualisiert. Im Kapitel zum Verfahren wurden die Bereiche Ensemble-Verfahren, Entscheidungsbäume und neuronale Netze überarbeitet und ergänzt, um deren hoher Bedeutung gerecht zu werden.

Ein Abschnitt zum Thema Deployment von Modellen wurde hinzugefügt, da die Umsetzung von Machine-Learning-Modellen in produktiven Softwareanwendungen in der betrieblichen Praxis eines der bedeutenden Themen darstellt. Zum Beispiel kann ein Credit-Scoring-Modell erst durch den Realtime-Einsatz in einem Webshop einen echten Mehrwert schaffen. Wie es ein Python-Modell aus dem Jupyter-Notebook des Data-Scientisten in die Webanwendung des Unternehmens schafft, ist dabei die zentrale Frage.

Bei den Anwendungsbeispielen wurden die Themen autonomes Fahren und – aus gegebenem Anlass – Machine-Learning in einer Pandemie ergänzt.

Bedanken möchte ich mich bei meiner Familie für die geistig moralische Unterstützung bei der Erstellung des Buches, bei meinen Kunden und Kollegen für den fachlichen Input durch Diskussionen und konkrete Fragestellungen und bei Torsten Haase von Mercedes Benz für die kritische Durchsicht des Manuskriptes.

Gliederung des Buches

Das Buch ist folgendermaßen gegliedert:

Nach einer Einführung in Kapitel 1 orientiert sich die Gliederung des Buches am Prozess der Datenanalyse. Von der Datenquelle geht es über die verwendeten Werkzeuge und die eingesetzten Verfahren bis hin zum konkreten Vorgehen und Beispielen in der Praxis.

Kapitel 2 beschäftigt sich mit den „Datentöpfen" unter einer technischen Brille. Wo und wie werden die Daten bereitgestellt, die als Quelle für die Datenanalyse herangezogen werden? Konkret werden die wichtigsten Arten von Datenbanken vorgestellt:

• Flatfiles

• ODBC-Datenbanken

• Data-Warehouse

• NoSQL-Datenbanken

• Hadoop

• Cloud-Speicher

In Kapitel 3 wird auf die Werkzeuge – also die Softwarelösungen – eingegangen, mit denen die Daten analysiert werden. Dabei wird zwischen den wichtigsten Sprachen (SQL, R, Python), den Data-Science-Plattformen und den Machine Learning Libraries unterschieden. Unter diesen Softwareanwendungen gibt es sowohl Open-Source- als auch kommerzielle Angebote.

In Kapitel 4 wird auf die gebräuchlichsten Analyseverfahren eingegangen. Dabei handelt es sich um Verfahren aus den Bereichen Statistik, Mathematik, Machine Learning, künstliche Intelligenz und Computer Science. Es wird versucht, die Verfahren zu strukturieren und im Einzelnen so darzustellen, dass ein Grundverständnis für die Möglichkeiten und Grenzen des Verfahrens aufgebaut werden kann.

Kapitel 5 wendet sich der Praxis zu und erläutert, wie Analytics-Projekte in Unternehmen oder Forschungseinrichtungen durchgeführt werden. Die bewährten Vorgehensmodelle werden vorgestellt. Außerdem wird auf das Thema Modell-Management eingegangen. Dies ist vor allem dann wichtig, wenn in größeren Teams zusammengearbeitet wird und über die Zeit eine Vielzahl von Analysemodellen erstellt, getestet, angepasst und wieder verworfen werden.

In Kapitel 6 werden Use Cases – also Anwendungsfälle – für die besprochenen Verfahren und Techniken vorgestellt. Dabei geht es nicht nur um konkrete Einzelfälle, sondern auch um den Versuch, ein Bild über mögliche Einsatzszenarien zu geben. Die Use Cases werden vorgestellt und die Besonderheiten ausgewählter Branchen diskutiert.

¹ Vgl. Harvard Business Review

2 Daten bereitstellen

Data-Science bezeichnet den Prozess, durch die Analyse von Daten mit geeigneten Verfahren Erkenntnisse zu gewinnen. Die erste Frage, die sich stellt, ist diejenige nach der Quelle der Daten. Woher kommen die zu analysierenden Daten und wo und wie werden sie bereitgestellt? Im Folgenden wird auf diese Datenquellen näher eingegangen. Konkret handelt es sich dabei um:

• Flatfiles

• Relationale Datenbanken

• Data-Warehouses

• NoSQL-Datenbanken

• Hadoop

• Cloud-Datenbanken

2.1 Flatfiles

Die einfachste Form der Datenbereitstellung sind Flatfiles, also Tabellen und strukturierte Textdateien, die man aus operativen Systemen wie z. B. ERP-Systemen exportiert oder über Befragungen gewonnen hat. Die Dateien werden in unterschiedlichen Formaten zur Verfügung gestellt. Die gebräuchlichsten sind:

• csv

• xls

• xml

• produktspezifische Formate (SPSS, SAS, Stata, ARFF, DBase …)

Bei dieser Form der Datenanalyse handelt es sich meist nicht um „Big Data" (auch wenn die Größe der Files grundsätzlich nahezu unbegrenzt sein kann), aber dennoch spielen Flatfiles nach wie vor eine wichtige Rolle in Data-Science-Projekten. Es muss z.B. kein Zugang zur Datenbank eines Produktivsystems eingerichtet werden, was meist einen höheren Aufwand im Bereich Berechtigungen und Netzwerkzugang bedeutet. Stattdessen werden die Daten aus dem Quellsystem exportiert und dann in das Analysesystem eingelesen, wo die eigentliche Analyse bzw. Modellierung stattfindet. Liegt eine sehr hohe Anzahl an Flatfiles vor, bietet es sich an, den Prozess

Enjoying the preview?

Page 1 of 1

Data Science: Eine praxisorientierte Einführung im Umfeld von Machine Learning, künstlicher Intelligenz und Big Data - 2., erweiterte Auflage

About this ebook

Michael Oettinger

Read more from Michael Oettinger

Related authors

Related to Data Science

Related ebooks

Science & Mathematics For You

Related podcast episodes

Related articles

Related categories

Reviews for Data Science

What did you think?

Book preview

Data Science - Michael Oettinger

1 Einleitung

2 Daten bereitstellen

2.1 Flatfiles