Sie sind auf Seite 1von 4

---

title: "DRE - 1. Übung"


subtitle: "Probability Plotting und Parameterschätzung"
output: html_document
---

## Einleitung
Ein geeignetes Verfahren zur Identifizierung von potentiellen Modellkandidaten
und zur ersten Abschätzung von Modellparametern ist die Methode des
_Probability Plotting_, die zu den grafischen Anpassungstechniken _(GOF - Goodness
of Fit)_
zählt.

Hierbei werden Stichprobendaten in ein speziell konstruiertes


Wahrscheinlichkeitsnetz
eingetragen, sodass die dargestellten Punktepaare bei guter Beschreibung
durch das angenommene Verteilungsmodell annähernd auf eine Gerade fallen. Größere
Abweichungen in Streuung und Gestalt sprechen wiederum gegen das unterstellte
Modell.

Die Achsen sind in Anbetracht des theoretischen Verteilungsmodells so modifiziert,


dass die transformierte kumulative Wahrscheinlichkeit als lineare Funktion
_(Linearized CDF)_ des (transformierten) Merkmals angesehen werden kann.

Die Weibullverteilung lässt sich in ihrer zweiparametrigen Form durch die folgende
Verteilungsfunktion charakterisieren:
$$F(t)=1-exp\left[ -\left(\frac{t}{T}\right)^b\right]$$
Damit die Verteilungsfunktion im Wahrscheinlichkeitsnetz eine lineare Gestalt
annimmt,
müssen die nachstehenden Transformationen bzgl. der Achsen vorgenommen werden:

* Abszisse: $x = ln(t)$
* Ordinate: $y = ln\left[-ln\left(1-F(t)\right)\right]$

Die Ordinate entspricht dabei genau den Quantilen der Kleinsten


Extremwertverteilung
_(SEV - Smallest Extreme Value)_ `?SPREDA::qsev`.
Die Linearisierung anderer Verteilungsmodelle können Sie in der Vorlesung 5
von [DQE](https://isis.tu-berlin.de/course/view.php?id=18733) nachvollziehen.

Um die Methode des _Probability Plotting_ anwenden zu können, benötigt man eine
Schätzung für die kumulative Verteilungsfunktion. In der Praxis hat sich der
nicht-parametrische Medianrang-Schätzer nach *Benard und Bos-Levenbach* etabliert:
$$\hat{F}(t_i)\approx \frac{i - 0,3}{n + 0,4} ,\\ i \in \lbrace 1, 2, ..., n\
rbrace.$$

## Einbinden/Installieren der benötigten R Packages


```{r, Packages laden, message = FALSE, warning = FALSE}
if (!require(weibulltools)) {
install.packages("weibulltools") # Installationsroutine
require(weibulltools) # Einbinden des Packages
}

if (!require(tidyverse)) {
install.packages("tidyverse") # Installationsroutine
require(tidyverse) # Einbinden des Packages
}
```
## Aufgabe 1 - Weibull-Wahrscheinlichkeitsnetz und Parameterschätzung
Gegeben sind 10 Ausfälle und die dazugehörende Laufleistung `t` (in km). Bestimmen
Sie die Ausfallwahrscheinlichkeiten mit dem nicht-parametrischen Medianrang-
Schätzverfahren.
Visualisieren Sie anschließend Ihr Ergebnis im Weibull-Wahrscheinlichkeitsnetz und
bestimmen Sie die Weibullparameter b und T.

Laufleistung: $\left\{28.000, 12.000, 67.000, 91.000, 54.000, 40.000, 110.000,


74.000, 88.000, 37.000\right\}$

### Probability Plot


```{r, Aufgabe 1 - Probability Plot}
# Erzeugen der Daten als Vektor t:
t <- c(28000, 12000, 67000, 91000, 54000, 40000, 110000, 74000, 88000, 37000)

# Anwenden des Medianrang-Schätzers, Approximationsformal nach "Benard":

# mr_df <-
# mr_df

# Probability Plotting:

# plot_points <-
# plot_points
```

### Parameterschätzung - subjektive Bestimmung der Ausgleichsgeraden


```{r, Aufgabe 1 - subjektive Parameterschätzung}
# Subjektive Einzeichnung einer Weibullgeraden (per Hinsehen):
# plot_cdf <-
# plot_cdf

# Zur Bestimmung der Parameter sucht man sich nun relevante Punkte auf der
Weibullgeraden:

# T_1 <-
# b_1 <-

# Weibullparameter
# c(T_1, b_1)
```

### Parameterschätzung - Medianrang-Regression


```{r, Aufgabe 1 - MRR}
# Anwendung der Medianrang-Regression, bei der log(t) durch die transformierten
# Ausfallwahrscheinlichkeiten geschätzt wird:

# mr_reg <-
# mr_reg
# mr_reg$coefficients

# Visualisierung der Ausgleichsgeraden mit geschätzten Parametern nach Medianrang-


Regression:

# plot_mr_reg <-
# plot_mr_reg
```
### Parameterschätzung - Maximum-Likelihood Methode
```{r, Aufgabe 1 - MLE}
# Anwendung der ML-Methode:

# mle <-
# mle
# mle$coefficients

# Visualisierung der Ausgleichsgeraden mit geschätzten Parametern nach MLE:

# plot_mle_reg <-
# plot_mle_reg
```

### Parameterschätzung - Vergleich der Geraden


```{r, Aufgabe 1 - Geradenvergleich}
# Visualisierung aller Geraden in einem Plot:

# plot_all <-
# plot_all
```

## Aufgabe 2 - Vergleich der Weibull- und Lognormalverteilung


Gegeben sind folgende Ausfälle aus einem Versuch mit zyklischer Belastung.
Bestimmen
Sie zuerst die _Plotting Positions_, tragen diese mit dem Lebensdauermerkmal ins
Weibull-Wahrscheinlichkeitsnetz ein und schätzen im Anschluss die Parameter.

Wiederholen Sie das Vorgehen für die Lognormalverteilung. Durch welches Modell
lassen
sich die Daten besser erklären?

Belastungszyklen: $\left\{130.000, 10.000, 280.000, 70.000, 40.000, 210.000,


160.000, 100.000, 30.000, 240.000, 180.000, 300.000\right\}$

### Probability Plot und Parameterschätzung - Weibullverteilung


```{r, Aufgabe 2 - Probability Plot Weibull}
# Erzeugen der Daten als Vektor cycle:
cycle <- c(130000, 10000, 280000, 70000, 40000, 210000, 160000, 100000, 30000,
240000,
180000, 300000)

# Wahrscheinlichkeitsschätzung:

# mr_cycle <-
# mr_cycle

# Probability Plotting:

# plot_points_weib <-
# plot_points_weib

# Parameterschätzung mit Medianrang-Regression:

# mrr_weib <-
# mrr_weib

# Ausgleichsgerade zum Plot hinzufügen


# plot_reg_weib <-
# plot_reg_weib
```

### Probability Plot und Parameterschätzung - Lognormalverteilung


```{r, Aufgabe 2 - Probability Plot Lognormal}
# Probability Plotting:

# plot_points_lognorm <-
# plot_points_lognorm

# Parameterschätzung mit Medianrang-Regression:

# mrr_lognorm <-
# mrr_lognorm

# Ausgleichsgerade zum Plot hinzufügen

# plot_reg_lognorm <-
# plot_reg_lognorm
```

Das könnte Ihnen auch gefallen