Beruflich Dokumente
Kultur Dokumente
F&E Talk
15.02.2023
Agenda
› Studie
› Generischer Word2Vec Re-trainer
› TS- AutoML
2
Studie
3
Motivation
5
Allgemeines zur Studie
› Ziel: quantitativ zu bewerten:
– ob die implementierte Suche gut passende Ergebnisse
liefert -> Servicetechniker:innen unterstützen
– ob eine Suchtechnologie besser als die andere ist
› Durchführung in einer App
› Drei Stufen:
– Pilotstudie
– inovex intern
– Krohne Service-techniker:innen
6
Studie-Design
› Within-Subjects
› Drei Versionen:
} } }
8
Studie-App
9
Auswertung der Ergebnisse
› Hypothesentest (Wilcoxon-ranked-signed test):
Beide Suchfunktionen sind gleich gut?
Beispiel Test:
Liste 1: Schlagwortsuche
[Durchschnittliche Bewertung von Teilnehmer
1 für die Schlagwortsuche, Durchschnittliche
Bewertung von Teilnehmer 2 für die
Schlagwortsuche, ….]
Liste 2:
[Durchschnittliche Bewertung von Teilnehmer
1 für die Synonymsuche, Durchschnittliche
Bewertung von Teilnehmer 2 für die Synonymsuche BHT-Model
Synonymsuche, ….]
10
Generischer Word2Vec Re-trainer
11
Warum?
› Retraining automatisieren
› Code wiederverwenden
12
Architektur
extern local environment
vocabulary
MLflow
- external instance
- e.g., ESW or SVM
13
Ablauf
14
TS-AutoML
Generic, Open-Source Service for Automated Training and Ad-hoc Usage of
Machine Learning Applications
15
Ziel
› Open source
16
Architektur
/store /train /predict
request prediction:
<data-points> return <prediction>
<params>
start
store data:
training:
Prediction Service
<dataset>
<params>
Feature Processing Prediction
Training Service
request:
<dataset> Feature-Engineering Model-Training Model-Evaluation
› extract TS features › with automated › automated evaluation of
› importance-based libraries (currently all trained models
Filesystem selection H2O) (currently sklearn)
return:
<dataset>
/train:
Start automated training pipeline,
evaluate models and push models and
metadata to MLflow.
17
Architektur
MLflow-Oberfläche
18
Architektur
/store /train /predict
request prediction:
<data-points> return <prediction>
<params>
start
store data:
training:
Prediction Service
<dataset>
<params>
Feature Processing Prediction
Training Service
request:
<dataset> Feature-Engineering Model-Training Model-Evaluation
› extract TS features › with automated › automated evaluation of
› importance-based libraries (currently all trained models
Filesystem selection H2O) (currently sklearn)
return:
<dataset>
/train:
Start automated training pipeline,
evaluate models and push models and
metadata to MLflow.
19
Vielen Dank!