Beruflich Dokumente
Kultur Dokumente
Digitalisierung
industrieller Prozesse
6
Datensatz
1 Supervised
Datenimport Visualisierung Daten- Deskriptive Unsupervised Learning Optimierung GUI Deployment
bereinigung Analyse Learning
Regression
Datensatz
2
Klassifikation
…
Datensatz
n
2 3-4 5 7 8 9
Ich…
• … verstehe die Problemstellung(en) einer realen Data
Science Anwendung.
• … kenne alle Schritte der Data Science Pipeline und
kann diese in einer konkreten praktischen Anwendung
umsetzen.
• … kann meine Ergebnisse angemessen beschreiben,
darstellen und zugänglich machen.
• … habe mich gut für die schriftliche Klausur vorbereitet
und kann Verständnisfragen beantworten.
Technische Hochschule Nürnberg – Fakultät Maschinenbau und Versorgungstechnik Dr. Christian Menden Seite 3
Data Science Projektaufgaben
• Es gibt zwei unterschiedliche Anwendungsfälle mit entsprechenden Datensätzen.
• Bitte bearbeiten Sie alleine oder als Gruppe beide Problemstellungen und lassen Sie mir
folgende Ergebnisse zukommen:
1. R-Codes
2. Ergebnisdokumentation (kurzer Bericht) als PDF
3. Links zum Deployment
• Ihre Arbeit dient als Vorbereitung und Zulassung für die Klausur und wird bewertet mit
(mE/oE).
• In der Klausur wird auf Ergebnisse der beiden Aufgaben eingegangen.
• Ich biete Ihnen Feedback und Hilfestellung bei der Bearbeitung an.
• Deadline für die Einreichung Ihrer Ergebnisse: 24. Juni 2021 EOB.
• Übung 10 + 11 (10.06. und 17.06.): Fragerunden und Hilfestellung (einzeln oder in Gruppen)
Technische Hochschule Nürnberg – Fakultät Maschinenbau und Versorgungstechnik Dr. Christian Menden Seite 4
Data Science Projektaufgabe 1 - Produktbeschwerden
• Bei einem Automobilhersteller gehen während der
Garantiephase unregelmäßig (oder regelmäßig?)
Beschwerden über defekte Fahrzeuge ein.
• Ziel ist es herauszufinden woran das liegen könnte
und im Zweifel vorausschauend Kunden einen
Service Termin anzubieten bevor die Fahrzeuge
Schaden nehmen bzw. die Service-Intervalle
während der Garantiezeit zu optimieren.
• Datensatz: „data_complaints.csv“
• Ziel: Beschwerde („Complaint“) ja/nein
• Abhängige Variablen:
• Company (yes/no): Handelt sich um einen
Firmenwagen?
• Ave.Mileage: Wie hoch ist die durchschnittliche
monatliche Laufleistung in km?
• Price: Wie hoch war der Anschaffungspreis in
Euro?
Technische Hochschule Nürnberg – Fakultät Maschinenbau und Versorgungstechnik Dr. Christian Menden Seite 5
Data Science Projektaufgabe 2 - Recyclingquote
• Die Recyclingquote (d.h. wie viel Wertstoffe
prozentual wieder verwertet bzw. erfolgreich
sortiert werden können) schwankt abhängig von
den Eingangsmaterialien
• Datensatz: „data_recycling.csv“
• Ziel: Recyclingquote („Rate“) in % modellieren
• Abhängige Variablen: Menge in t:
• Copper
• Plastic
• Aluminium
Kupfer
Recyclebar
Plastik
Nicht recyclbar
Aluminium
Technische Hochschule Nürnberg – Fakultät Maschinenbau und Versorgungstechnik Dr. Christian Menden Seite 6
Viel Erfolg!
Technische Hochschule Nürnberg – Fakultät Maschinenbau und Versorgungstechnik Dr. Christian Menden Seite 7