Sie sind auf Seite 1von 36

BV Stoffsammlung

Timo Dickscheid
Rodja Trappe

24. Februar 2003

Der folgende Text ist eine Auswahl von Formeln und Definitionen aus [PHo01]
sowie dem Skript [Pau01]. Zum Verständnis des Stoffes trugen auch die Folien
[Ko01] bei. Die Auswahl der einzelnen Punkte erfolgte rein subjektiv im Hinblick
auf die Relevanz bei der Abschlussklausur der Veranstaltung Bildverarbeitung an
der Uni Koblenz im WS2002/2003.
Copyright (c) Timo Dickscheid, dicksche@uni-koblenz.de / Rodja Trappe, trappe@uni-
koblenz.de. Permission is granted to copy, distribute and/or modify this document
under the terms of the GNU Free Documentation License, Version 1.1 or any later
version published by the Free Software Foundation; with no Invariant Sections,
with no Front-Cover Texts, and with no Back-Cover Texts. A copy of the license is
included in the section entitled "GNU Free Documentation License".

1
Inhaltsverzeichnis
1 Eigenschaften digitaler Bilder 5
1.1 Mittelwert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Varianz/Standardabweichung . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4 Rauschabstand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2 Synthetische Bilderzeugung 6
2.1 Gauss-Rauschen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

3 Filter 6
3.1 Lineare Filter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.1.1 Faltung einer Maske . . . . . . . . . . . . . . . . . . . . . . . . 6
3.1.2 Maskengewichte ausgleichen . . . . . . . . . . . . . . . . . . . 6
3.1.3 Gauss-Filter (Binomialfilter) . . . . . . . . . . . . . . . . . . . . 7
3.1.4 Mittelwertfilter . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.2 Rangordnungs-Filter . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.3 Kantenerhaltende Filter . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3.3.1 Edge-Preserving Smoothing . . . . . . . . . . . . . . . . . . . . 8
3.3.2 K Nearest Neighbour Averaging (KNN) . . . . . . . . . . . . . 8
3.3.3 Smoothed Median Filter . . . . . . . . . . . . . . . . . . . . . . 8
3.3.4 Symmetric Nearest Neighbour (SNN) . . . . . . . . . . . . . . 9
3.3.5 Laplacian of Gaussian (LoG) . . . . . . . . . . . . . . . . . . . 9

4 Farben 10
4.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.2 Begriffe: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.3 Farbräume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

5 Histogramm-Algorithmen 10
5.1 Histogramm-Entropie Schwellwert . . . . . . . . . . . . . . . . . . . . 11
5.2 Histogramm-Equalisierung . . . . . . . . . . . . . . . . . . . . . . . . 11
5.2.1 Global . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
5.2.2 Lokal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
5.3 Histogramm-Tricks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
5.3.1 Medianberechnung . . . . . . . . . . . . . . . . . . . . . . . . . 11
5.3.2 K-trimmed Mean . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2
6 Image-Preprocessing 12
6.1 Veränderungen der Bildgeometrie . . . . . . . . . . . . . . . . . . . . 12
6.1.1 Affine Distortion . . . . . . . . . . . . . . . . . . . . . . . . . . 12
6.2 Normalisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
6.2.1 Lineare Interpolation (Grössenveränderungen) . . . . . . . . . 12

7 Bildsegmentierung 13
7.1 Punktsegmentierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
7.1.1 Moravec-interest Operator . . . . . . . . . . . . . . . . . . . . 13
7.1.2 Harris Corner Detector . . . . . . . . . . . . . . . . . . . . . . . 14
7.2 Kantendetektion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
7.2.1 Ableitung der Intensitätsfunktion (d.h. des Bildes) . . . . . . . 15
7.2.2 Maskenoperatoren als Annäherung der ersten Ableitung . . . 15
7.2.3 Vereinfachende Annäherung der Arcustangens-Funktion . . . 16
7.2.4 Die zweite Ableitung (Laplace-Operator) . . . . . . . . . . . . 16
7.2.5 Kanten in Farbbildern . . . . . . . . . . . . . . . . . . . . . . . 17
7.3 Linien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
7.3.1 Linien-Repräsentation im Kettencode (Freeman-Code) . . . . 17
7.3.2 Local Connectivity Analysis / Verfahren von Nevatia und
Babu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
7.3.3 Hysterese-Schwellwertverfahren . . . . . . . . . . . . . . . . . 18
7.3.4 Hough-Code . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
7.3.5 Optimale Liniendetektion (Canny-Operator) . . . . . . . . . . 20
7.3.6 Dynamische Programmierung . . . . . . . . . . . . . . . . . . 20
7.4 Regionensegmentierung . . . . . . . . . . . . . . . . . . . . . . . . . . 21
7.4.1 Einfache Regionensegmentierung . . . . . . . . . . . . . . . . 21
7.5 Konturen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

8 Fourier-Transformation 22
8.1 Vorwissen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
8.1.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
8.1.2 Fourier-Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
8.2 Fourier-Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
8.2.1 Herleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
8.2.2 Anwendung auf Bilder . . . . . . . . . . . . . . . . . . . . . . . 23
8.2.3 Inverse Fourier-Transformation . . . . . . . . . . . . . . . . . . 24
8.2.4 Faltungstheorem . . . . . . . . . . . . . . . . . . . . . . . . . . 24
8.2.5 Diskrete Fourier-Transformation . . . . . . . . . . . . . . . . . 24

3
9 Codierungs- und Kompressionsalgorithmen 25
9.1 Prefix-Codes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
9.1.1 Allgemein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
9.1.2 Baumcodierung . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
9.1.3 Huffman-Algorithmus . . . . . . . . . . . . . . . . . . . . . . . 25
9.2 Lauflängencodierung (”Runlength-Coding”) . . . . . . . . . . . . . . 25
9.3 Delta-Kompression (Differenzkodierung) . . . . . . . . . . . . . . . . 26
9.4 JPEG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

10 Sonstiges 26
10.1 Look-up-table Transformation . . . . . . . . . . . . . . . . . . . . . . . 26

A Fragen 27
A.1 Verständnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
A.2 Relevanz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

B To-Do-Liste 27

4
1 Eigenschaften digitaler Bilder

1.1 Mittelwert

Der Mittelwert eines Bildes berechnet sich mit


k
1X
µ= fi (1)
k i=1

1.2 Varianz/Standardabweichung

Die Varianz σ 2 berechnet sich als

k
1X 2
σ2 = (fi − µ) (2)
k i=1

Hierbei sind fi die Grauwerte, k die Gesamtanzahl der Pixel im Bild, µ der Mit-
telwert (siehe 1.1) der Grauwerte im Bild und pi die Wahrscheinlichkeit des Grau-
werts i. Maximale Varianz ist z.B. in einem 8-Bit-Graustufenbild mit 255 Graustu-
fen 1282 = 16256. Die Wurzel der Varianz, also σ, bezeichnet man als Standardab-
weichung.

1.3 Entropie

Informationsgehalt eines Bildes, mit p (xi ) als Wahrscheinlichkeit des Grauwertes


xi , S als den betrachteten Bereich (z.B. 256) und ld der Logarithmus Duales
X
H(S) = − p (xi ) · ld (p (xi )) (3)
xi ∈S

• x hat niedrigen Informationsgehalt = erscheint mit hoher Wahrscheinlichkeit


• x hat hohen Informationsgehalt = erscheint mit niedriger Wahrscheinlichkeit
• 0 –> einfarbiges Bild
• 1 –> zweifarbiges Bild, halb&halb
• 8 –> perfekte Gleichverteilung der Farb-/Grauwerte bei einem 8Bit-Bild

1.4 Rauschabstand

Verhältnis der des Nutzsignals (Signal) zum Rausch- bzw. Störsignal (Noise) wird
definiert als Signal-to-Noise-Ratio

E f2
SN R = log (4)
E (n2 )

Hierbei ist f das Nutzsignal und n das Störsignal. E ist der Erwartungswert (=Mit-
telwert 1.1). Ein hoher Rauschabstand ist gut, da dann Signal sehr weit vom Stör-
signal entfernt ist, und damit eine gute Qualität vorliegt.

5
2 Synthetische Bilderzeugung

2.1 Gauss-Rauschen
1. Ermittle zwei gleichverteilte Zufallsvariablen u1 und u2 aus [0...1].
2. Berechne folgende Werte

v1 = 2 · u1 − 1 (5)

v2 = 2 · u2 − 1 (6)

s = v12 + v22 (7)

Falls s = 1 oder 0 5 s, wiederhole Schritt 2.


Normalverteiler Wert ist r
−2 · ln(s)
X = v1 ∗ (8)
s

3 Filter
Wir unterteilen hier die Filter in zwei Gruppen: Lineare Filter und Rangordnungs-
filter. Eine Übersicht aller Filter dieses Kapitels zeigt die Tabelle 2 auf Seite 9.

3.1 Lineare Filter

Bei diesen Filtern wird eine Maske von Gewichtungen auf das Bild gefaltet. Die
Anwendung linearer Filter ist kommutativ. Das heißt zum Beispiel für zwei Filtern
m1 und m2 und ein Bild b, daß nicht zwingend erst der eine Filter (m1 ), und dann
der andere (m2 ) auf das Bild (b) angewendet werden muß, sondern auch m1 mit
m2 gefiltert werden kann, um den so erhaltenen Filter auf b anzuwenden: m1 ∗
(m2 ∗ b) = (m1 ∗ m2 ) ∗ b (∗ ist der Faltungsoperator).

3.1.1 Faltung einer Maske

Faltung einer Maske h mit einem Bild f zu einem Bild g (Formel: g = f ∗ h), wobei
die Maske eine Größe von 2 · m + 1 mal 2 · n + 1 hat:

m
X n
X
g(i, j) = h (ν, µ) · f (i − ν, j − µ) (9)
µ=−m ν=−n

3.1.2 Maskengewichte ausgleichen

Masken müssen nach dem Aufsummieren der Muliplikationen zurückgewichtet


werden; d.h. das Ergebnis ist durch die Summe aller Zahlen in der Maske zu teilen.

6
3.1.3 Gauss-Filter (Binomialfilter)

Errechnung der Gauss-Maske durch

2 2
1 − x 2σ
+y
G (x, y) = 2πσ 2 e
2
(10)

Beispiel einer Maske (hier jedoch mit Hilfe des paskalschen Dreiecks):
 
1 2 1
1 
2 4 2  (11)
16
1 2 1

3.1.4 Mittelwertfilter

Die Maske enthält an jeder Stelle eine einfache Gewichtung. Zum Beispiel:
 
1 1 1
1
1 1 1  (12)
9
1 1 1

3.2 Rangordnungs-Filter

Rangordnungsfilter sind nicht linear. Sie haben in aller Regel kantenerhaltenden


Charakter und einen hohen Rauschabstand, sind also anderen Filtern oft vorzu-
ziehen.

Median-Filter Sortierung der Masken-Pixel, Auswahl des mittleren.

Erosionsfilter Sortierung der Masken-Pixel, Auswahl des kleinsten. Verschmä-


lert helle Bereiche an dunklen Einstreuungen.

Dilatationsfilter Sortierung der Masken-Pixel, Auswahl des grössten. Verschmä-


lert dunkle Bereiche an hellen Einstreuungen.

“closing”-Filter Erosion nach Dilatation. Entfernt kleine dunkle Bereiche in hel-


ler Umgebung.

“opening”-Filter Dilatation nach Erosion. Entfernt kleine helle Bereiche in dunk-


ler Umgebung.

K-trimmed Mean Sortierung der Maskenpixel, Entfernen der k linken sowie der
k rechten Pixel1 . Aus den verbleibenden Pixeln wird der Mittelwert gebildet. Be-
dingung: k ≤ n∗m2 −1.

n−k
1 X
fi (13)
n − 2k
i=1+k

1 Dies kann am besten mit Hilfe eines Histogramms geschehen (Siehe Kapitel 5.3.1 auf Seite 11)

7
Morphologische Kantendetektion2 Bei der morphologischen Kantendetektion
werden nach Sortierung der Maskenpixel der Grauwert des kleinsten von dem
des grössten abgezogen, um Kanten aufzufinden:

fn − f1 (14)

Mid-Range-Filter Sozusagen die Hälfte der morphologischen Kantendetektion:

1
· (fn − f1 ) (15)
2

3.3 Kantenerhaltende Filter

3.3.1 Edge-Preserving Smoothing

Neun verschiedene 5 × 5-Masken nach folgendem Schema:


     
0 1 1 1 0 0 0 0 1 1 0 0 0 0 0

 0 1 1 1 0 


 0 0 1 1 1 


 0 1 1 1 0 


 0 0 1 0 0 


 0 0 1 1 0 


 0 1 1 1 0 
 (16)
 0 0 0 0 0   0 0 0 0 0   0 1 1 1 0 
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

• Berechne die Varianz für jede der 9 Masken


• Wähle die Maske mit der niedrigsten Varianz
• Bestimme den neuen Pixel als Mittelwert unter dieser Maske

3.3.2 K Nearest Neighbour Averaging (KNN)

Für eine 5 × 5-Maske mit k = 6:

• Bestimme die k Pixel, deren Grauwerte am nächsten am mittleren Pixel lie-


gen (den mittleren Pixel eingeschlossen!)
• Bestimme den neuen Pixel als Mittelwert dieser k Pixel

Je höher k, desto mehr nähert sich dieser Filter dem Mean-Filter an.
Eigenschaften: kantenerhaltend

3.3.3 Smoothed Median Filter

Eine 5 × 5-Maske wird in 4 “Streifen” zu je 5 Pixeln zerlegt (horizontal, vertikal,


zwei mal diagonal). Von jedem Streifen wird der Median ( 3.2 auf der vorherigen
Seite) gebildet. Der neue Grauwert ist der Mittelwert der 4 Streifen-Mediane.
Eigenschaften: Eckenerhaltend, unterdrückt Gauss-Rauschen
2 Siehe auch Kantendetektoren (Kapitel 7.2)

8
3.3.4 Symmetric Nearest Neighbour (SNN)

Bilde gegenüberliegende Paare in 8er-Nachbarschaft und ermittle pro Paar den


Grauwert, der am nächsten am Grauwert des mittleren Pixels liegt. Bilde dann
den Mittelwert der 4 resultierenden Grauwerte.

3.3.5 Laplacian of Gaussian (LoG)

Der LoG-Filter kombiniert einen Laplace-Operator ( 7.2.4 auf Seite 16) mit einem
Gauss-Filter ( 3.1.3 auf Seite 7) und ist somit gleichzeitig ein Low-Pass-Filter zum
Weichzeichnen und ein Hochpassfilter zur Kontrastanhebung. Da beide Filter li-
near (d.h. Faltungsfilter siehe 3.1 auf Seite 6) und somit assoziativ sind, kann aus
der aufeinanderfolgenden Faltung ein eigener Operator gebildet werden:

52 (G ∗ f ) = 52 G ∗ f

(17)

Die resultierende Formel wird recht komplex; da der LoG-Filter jedoch oft zur
Kantendetektion genutzt wird, bei der nur Nullstellen der zweiten Ableitung von
Interesse sind, können Vorfaktoren oft ausgelassen werden.
Da die Glockenform des Gauss-Filters kombiniert mit der Berg-und-Tal-Form des
Laplace-Filters eine Glocke mit Gruben links und rechts ergibt, nennt man den
LoG-Operator oft auch ”Mexican Hat”.
Der LoG-Operator kann angenähert werden durch Differenzbildung zweier Gauss-
Filter mit unterschiedlichen σ-Werten (DoG - Difference of Gaussian).
Rangordnungsfilter

kantenerhaltend

Hochpass

Tiefpass
linear

Gauss / Binomial x x
Mittelwert / Mean x x
Median x x
Erosion x x
Dilatation x x
closing x x
opening x x
k-trimmed Mean x x
morphologische Kantendetektion x (x) x
Edge-preserving Smoothing x x
K-nearest Neighbour x x
Smoothed Median x x
Symmetric nearest Neighbour x x
LoG, DoG x x x x

Tabelle 2: Eigenschaften der Filter

9
4 Farben

4.1 Definition

Brockhaus
Elekromagnetische Wellen (bzw. Quanten) im Wellenlägenbereich λ von etwa 380
bis 780 nm, die mit dem Auge wahrnehmbar sind.

4.2 Begriffe:
• Luminanz: Vom Beobachter wahrgenommene Lichtmenge
• Achromatisches Licht: alle Wellenlängen sind gleichverteilt
• Chromatisches Licht: Strahlungsenergie variiert mit der Wellenlänge
• Chromatizität: Farbton und Sättigung zusammen
• Metamere: Farben, die den gleichen Farbeindruck hinterlassen, auch: bedingt
gleich

4.3 Farbräume
• RGB: Monitore, Farbkameras
• CMYK: Drucktechnik
• YUV/YC: Video / Fernsehtechnik
• XYZ: synthetisch, Referenz für die Umrechnung
• HSI/HSV: Computergraphik
• Lab/Luv: Physiologisch

5 Histogramm-Algorithmen
Histogramme werden u.a. genutzt zur

• Binarisierung
• Klassifizierung

• Erkennung

Bei der Binarisierung wird ein Schwellwert θ festgelegt, so dass für Pixel b im Bild
f gilt:

0, f alls fi,j ≤ θ
bi,j = (18)
1, sonst

10
5.1 Histogramm-Entropie Schwellwert
Idee: Wähle θ so, dass
 die Entropie auf beiden
 Seiten maximal ist. Die Entropien
für die linke H Al bzw. rechte Seite H Bl berechnen sich dann wie in 1.3 auf
Seite 5 beschrieben. Das Optimierungsproblem wird formuliert als
l0 = argmaxl (H (Al ) + H (Bl )) (19)
Das Optimierungsproblem lässt sich ausweiten von Binarisierungen auf beliebige
Aufspaltungen (Multi-Thresholding).

5.2 Histogramm-Equalisierung
5.2.1 Global

Vorgehensweise: Erstellen eines kumulativen Histogramms. Die y-Achse wird gleich-


mässig auf die Anzahl der gewünschten Ziel-Pixelwerte aufgeteilt. Die so mar-
kierten Stellen an der y-Achse werden parallel zur x-Achse auf die Histogramm-
Funktion reflektiert. Die y-Werte des Ursprungsbildes werden nun entsprechend
der entstandenen Zonen nach oben “aufgerundet”.
Seien

• ”in” das Eingabebild, ”out” das Ausgabebild mit den Maßen i × j


• ”LEVELS” die Anzahl der Histogramm-Bins, ”MAX” die Anzahl der Pixel
im Bild (= i · j)
• ”cumul” das kumulierte Histogramm,

dann berechnen sich demnach die Ausgabepixel wie folgt (Anlehnung an C++!):
outi,j = (LEV ELS − 1) · (cumul [ini,j ] /M AX) (20)

5.2.2 Lokal

Bei der lokalen Histogramm-Equalisierung wird um jeden Pixel im Originalbild


ein Fenster einer festgelegten Größe gelegt, für das dann eine eigene Histogramm-
Equalisierung durchgeführt wird. Es wird also im Gegensatz zur globalen Histogramm-
Equalisierung für jedes Pixel ein separates Histogramm erstellt, mit dem sein Wert
errechnet wird.

5.3 Histogramm-Tricks
5.3.1 Medianberechnung

Zur Medianberechnung kann ein Histogramm verwendet werden. So kann die


Sortierung der Maskenpixel entfallen.

5.3.2 K-trimmed Mean

Durch Verwendung eines Histogramms lässt sich der Sortierungsschritt bei der
Berechnung dieses Filters sparen. Man streicht auf jeder Seite des Histogramms k
Grauwerte weg und ermittlelt in dem neuen Histogramm den Mittelwert.

11
6 Image-Preprocessing
Beim Image-Preprocessing werden folgende Bereiche unterschieden:

• lokale/globale Operationen
• lokale/globale Wirkung
• sequentielle/parallele Verarbeitung
• Spezialfall: rekursive Filter

6.1 Veränderungen der Bildgeometrie

6.1.1 Affine Distortion

Abbildung der Koordinaten x, y auf verzerrte Koordinaten µ, ν:


      
µ a11 a12 x a13
= + (21)
ν a21 a22 y a23
Hiermit werden Scherungen, Skalierungen oder Verschiebungen des Bildes bzw.
der Pixel realisiert.

6.2 Normalisation

6.2.1 Lineare Interpolation (Grössenveränderungen)

Problem: Bei der Vergrösserung eines Bildes müssen neue Pixel zwischen den Be-
stehenden gebildet werden, die den Charakter des Bildes erhalten sollen.3 Schema:

3 Es ist bxc der niedrigste Wert, den x annimmt; dxe entsprechend der höchste.

12
Es berechnet sich dann

fux = ful + (fur − ful ) (x − bxc) (22)

f1x = f1l + (f1r − f1l ) (x − bxc) (23)


f (x, y) = fux + (f1x − fux ) (y − byc) (24)

7 Bildsegmentierung

7.1 Punktsegmentierung

7.1.1 Moravec-interest Operator

Dieser Operator gehört zu den Heuristischen Detektierverfahren. Ausgangspunkt: Ei-


ne lokale Maske mit 7 × 7 Pixeln, definiert als

Wi,j = [wij ] = [fa,b ]a=i,..,(i+7),b=j,...,(j+7) (25)

Innerhalb der Maske werden 4 Werte berechnet.


6 X
X 6
2
mxxij = (wij,µν − wij,µν+1 ) (26)
µ=0 ν=0

6 X
X 6
2
myyij = (wij,µν − wij,µ+1ν ) (27)
µ=0 ν=0

6 X
X 6
2
mxyij = (wij,µν − wij,µ+1ν+1 ) (28)
µ=0 ν=0

6 X
X 6
2
myxij = (wij,µ+1ν − wij,µν+1 ) (29)
µ=0 ν=0

Diese Werte sind nichts anderes als die Summen der horizontalen (26), vertikalen
(27) und in beide Richtungen diagonalen (28, 29) Differenzen der Pixelwerte. Der
Operator berechnet sich als das Minimum dieser vier Werte.

Hij = min mxxij , mxyij , myxij , myyij (30)

Dieser Wert wird genau dann hoch sein, wenn in allen vier Richtungen hohe Diffe-
renzen der Pixelwerte auftauchen. Wenn in wenigstens einer Richtung geringe Dif-
ferenzen vorhanden sind, so werden höhere Werte der anderen Richtungen durch
die Minimum-Funktion eliminiert. Die Folge sind also hohe Ergebniswerte, falls
an der Stelle i, j in alle Richtungen hohe Grauwertveränderungen vorliegen.

13
7.1.2 Harris Corner Detector

Von einem Bild f wird ein Gradientenbild erzeugt. Dieses enthält pro Pixel die ho-
rizontale Ableitung (fx ) und die vertikale Ableitung (fy ). Die beiden Komponen-
ten fx und fy werden jeweils mit einer Gauss-Maske G0 mit Standardabweichung
σ (default = 0, 7) gefaltet, und es entstehen zwei gefilterte Bilder

fx− = fx ∗ G0 = f ∗ dx ∗ G0 (31)

fy− = fy ∗ G0 = f ∗ dy ∗ G0 (32)

Nun wird für jeden Pixel im Originalbild eine Matrix


 
Mij,11 Mij,12
Mij= (33)
Mij,21 Mij,22

berechnet mit den Elementen


X
−2
Mij,11 = fx,µν (34)
µν∈Nij

X
− −
Mij,12 = fx,µν ∗ fy,µν (35)
µν∈Nij
X
− −
Mij,21 = fx,µν ∗ fy,µν (36)
µν∈Nij
X
−2
Mij,22 = fy,µν (37)
µν∈Nij

Das Ergebnis eines Pixels wird nun definiert als4

Hij = det (Mij ) − k ∗ tr (Mij ) (38)

7.2 Kantendetektion

Es gibt folgende Möglichkeiten zur Detektion von Kanten:

• Ableitung der Intensitätsfunktion

• Kantenmasken
• Parametrische Modelle
• Kombinationen der genannten Möglichkeiten.
4 k ist fix festgelegt als 0.04.

”trace” = Spur einer Matrix, d.h. alle Werte einer Diagonalen, die ungleich null sind.

14
7.2.1 Ableitung der Intensitätsfunktion (d.h. des Bildes)

Ermittelt werden die Kantenstärke und die Kantenrichtung. Hierzu berechnet man
den Gradient durch partielle Ableitung der x- und y-Richtung für jeden Pixel.
 
fx (x, y)
5 f (x, y) = (39)
fy (x, y)
Die partiellen Ableitungen können angenähert werden durch die Differenz der
benachbarten Pixelwerte in horizontaler bzw. vertikaler Richtung:
fx (i, j) = f (i + 1, j) − f (i, j) (40)
fy (i, j) = f (i, j + 1) − f (i, j) (41)
Die korrekte Ableitung bei kontinuierlichen Funktionen ermittelt sich zwar durch
(hier die Ableitung nach x) fx (x) = limh→0 f (x+h)−f
h
(x)
, allerdings ist in einem Bild
1 der kleinste Wert, den h annehmen kann.
Die Kantenstärke s ist die Länge des Gradientenvektors
q
s = fx2 + fy2 (42)

Da es auf den konkreten Wert nicht ankommt, sondern auf das Verhältnis des
Werts zu dem des Nachbarn, berechnet man oft einfach
s0 = fx2 + fy2

(43)

Die Kantenrichtung ist in der Regel orthogonal zum Gradienten5 . Sie wird berech-
net als der Arcustangens von fy und fx
r = arctan (fy /fx ) (44)

7.2.2 Maskenoperatoren als Annäherung der ersten Ableitung

Maskenoperatoren ermitteln die Kanten durch Faltung zweier Masken auf die
Bildpixel.
Operator Masken Kantendetektion
 
−1
vertikale Zentraldifferenz  0  horizontal (fy )
 1 
horizontale Zentraldifferenz  −1 0 1  vertikal(fx )
−1 −2 −1
Vertikaler Sobel  0 0 0  horizontal(fy )
1 2 1
−1 0 1
Horizontaler Sobel  −2 0 2  vertikal(fx )
 −1
 0 1 
1 0 0 1
Robert’s Cross und
0  −1 −1  0
−1 −1 −1
Vertikaler Prewitt  0 0 0  horizontal(fy )
 1 1 1
−1 0 1
Horizontaler Prewitt  −1 0 1  vertikal(fx )
−1 0 1
5 Es kann jedoch gezeigt werden, dass das nicht immer der Fall ist.

15
Die Operatoren unterscheiden sich in einigen Eigenschaften.
Operator Wertspanne Implement. Ergebnis
Zentraldifferenz 255 einfach rauschanfällig
Sobel 1530 einfach gut
Robert’s Cross 255 sehr einfach! rauschanf., unbefriedigend
Prewitt 1020 einfach relativ gut

Anmerkung: Die Wertebereiche der Ergebnisse nach Anwendung der Operato-


ren müssen ggf. durch Gewichtung der Masken angepasst werden, wenn man sie
zum Beispiel als Integer Wert speichern möchte. In der Praxis werden die Filter
also meist mit Skalierungsfaktoren berechnet.

7.2.3 Vereinfachende Annäherung der Arcustangens-Funktion

Für die Berechnung der Kantenrichtung der partiellen Ableitungen fx und fy wird
die atan2-Funktion abgeschätzt. Das Ergebnis der Funktion liegt in [0, π] für alle
y ≥ 0 und in [−π, 0] für alle y < 0.6 Der resultierende double-Wert wird quantisiert.
Für unsere Anwendung genügt eine Aufsplittung in 144 Werte (=Richtungen)7 , so
dass wir zur Speicherung ein Byte (unsigned char) benutzen können.
Die arctan2-Funktion selbst ist auch noch sehr langsam. Man versucht eine Annä-
herung:

• Durch drei Abfragen lässt sich der Oktant festlegen, in dem (x, y) liegt. In
den Oktanten 1, 2, 5, 6 gilt z = −cot(α) (da α > π4 ), sonst z = tan(α). Diese
Werte lassen sich annähern durch z = − xy in den Oktanten 1, 2, 5, 6 und
z = xy in den übrigen Oktanten.
• Hinzu kommt noch die angenäherte Nullpunktverschiebung pro Oktant, die
aus einer Tabelle abgelesen und zu z addiert wird:
Oktant 0 1 2 3 4 5 6 7
Nullpunktverschiebung 0 2 2 4 -4 -2 -2 0

• Der resultierende Wert u müsste eigentlich anhand arctan oder arccot um-
gerechnet werden, um den letztendlichen Winkel zu erhalten. Das ersparen
wir uns mit einer linearen Annäherung α = π4 ∗ u . Die maximale Abwei-
chung von den vorgenannten Funktionen beträgt nun 4.1◦ , was für unsere
Anwendung akzeptabel ist.

7.2.4 Die zweite Ableitung (Laplace-Operator)

Es ist natürlich auch möglich, Kanten durch Nullstellen in der zweiten Ableitung
der Intensitätsfunktion zu finden. Ein Nachteil aller Lösungen, die darauf basieren,
ist aber die hohe Rauschanfälligkeit.
Der Laplace-Operator wird in der Bildverarbeitung angenähert durch doppelte
Faltung der Differenzoperatoren

5i f (i, j) = f (i + 1, j) − f (i, j) (45)


6 Bei arctan erstreckt sich der Bereich auf [− π2 , π2 ] .
7 Das entspricht Winkeln im Abstand von 2,5◦ .

16
4i f (i, j) = f (i, j) − f (i − 1, j) (46)
Die Faltung kann beispielsweise realisiert werden durch
52 f (i, j) = 5i 4i f (i, j) + 5j 4j f (i, j) (47)
= 4 · f (i, j) − f (i − 1, j) − f (i + 1, j) − f (i, j − 1) − f (i, j + (48)
1)

Das entspricht z.B. der linken von folgenden drei Beispielen einer Laplace-Maske:
     
0 −1 0 −1 −1 −1 1 −2 1
 −1 4 −1   −1 8 −1   −2 4 −2  (49)
0 −1 0 −1 −1 −1 1 −2 1

Aufgrund der Rauschanfälligkeit werden Bilder meist vor Anwendung von Laplace-
Operatoren mit einem Gauss-Filter bearbeitet.

7.2.5 Kanten in Farbbildern

Um Kanten in Farbbildern zu ermitteln, wird der Sobel-Operator auf Dreidimen-


sionalität erweitert, z.B.
q
2 2 2
D1 (f1 , f2 ) = (r1 − r2 ) + (g1 − g2 ) + (b1 − b2 ) (50)
D2 (f1 , f2 ) = |r1 − r2 | + |g1 − g2 | + |b1 − b2 | (51)
D3 (f1 , f2 ) = max {|r1 − r2 | , |g1 − g2 | , |b1 − b2 |} (52)

7.3 Linien
Um Linien zu erhalten, müssen die noch unstrukturierten Ergebnisse aus der Kan-
tendetektion zusammengeführt werden.

7.3.1 Linien-Repräsentation im Kettencode (Freeman-Code)

Prinzip: Kettencode basiert auf einer Pixelmatrix. Ausgangspunkt sind die beiden
Koordinaten des ersten Pixels der Linie Start(x, y) = (i, j). Von dort ausgehend
wird für jedes weitere Pixel ein Wert aus [0, ..., 7] gespeichert, der die Richtung
angibt, in der das nächste Pixel liegt. Dabei entspricht ”0” dem Pixel rechts neben
dem vorhergehenden, die kommenden Werte verteilen sich im Uhrzeigersinn:
5 6 7
4 X 0 (53)
3 2 1

Diese Pixel werden als Liste List : n1 , n2 , ..., nn gespeichert.

Geraden. Eine Linie in Kettencode ist eine Gerade, wenn

1. Die Liste aus nur zwei verschiedenen Richtungen S1 und S2 besteht, für die
gilt |S1 − S2 | ≡ 1 mod 8 .
2. Diejenige der beiden Richtungen, die seltener vorkommt, hat die andere Rich-
tung als Vorgänger und Nachfolger.
3. S1 und S2 müssen gleichmässig und homogen über den Kettencode verteilt
sein.

17
Geschlossenheit. Ein Kettencode heisst geschlossen, wenn für die absoluten An-
zahlen an Richtungen {ni | i = 0, 1, ..., 7} gilt

n 1 + n 2 + n 3 = n 5 + n 6 + n7 (54)

n 3 + n 4 + n 5 = n 7 + n 0 + n1 (55)

Das bedeutet nichts anderes als: Die Gesamtzahl der drei nach oben zeigenden
Richtungen entspricht der Gesamtanzahl der drei nach unten zeigenden Richtun-
gen; analog die Gesamtzahlen der nach links und nach rechts zeigenden Richtun-
gen.

Länge der Kette. Die Länge l der Kette ergibt sich durch

l =a+b 2 (56)

mit a als die Anzahl der geraden- und b die Anzahl der ungeraden Richtungswerte.

7.3.2 Local Connectivity Analysis / Verfahren von Nevatia und Babu

Motivation: Verknüpfung von Kantenelementen zu Linien. Bei der Local Connec-


tivity Anlysis wird die Nachbarschaft eines Kantenelementes nach möglichen Li-
nienelementen abgesucht. Hierzu wurde von Nevatia und Babu ein Verfahren ent-
wickelt.
Das Verfahren gliedert sich in zwei Teile: Eine Parallel- und eine Serielle Kompo-
nente.
Die Parallelkomponente betrachtet in der 8er-Nachbarschaft jedes Punktes im Kan-
tenbild diejenigen 3 Punkte, die am nächsten in der Richtung seiner Kante lie-
gen. Von diesen dreien wird derjenige als Nachfolger ausgewählt, dessen Kanten-
richtung der des aktuellen Punktes am nächsten kommt. Im Zweifelsfall wird der
nächste von mehreren in Frage kommenden Punkten ausgewählt. Der so gefunde-
ne mögliche Nachfolger wird festgehalten.
Die Serielle Kompontente wandert danach Zeile für Zeile über das neue Bild und
sucht zunächst mögliche Startpunkte für Linien. Ein Startpunkt ist gefunden, wenn
die Kantenstärke eines Punktes einen festgelegten Schwellwert übersteigt und noch
nicht als Nachfolger zu einer anderen Linie markiert wurde. In diesem Fall wird
eine neue Linienbezeichnung angelegt, und die vorher gefundenen Nachfolger
dieses Punktes werden weiter verfolgt, bis die Kantenstärke wieder unter den
Schwellwert sinkt oder ein Punkt bereits zu einer anderen Linie gehört. Das Er-
gebnis ist eine fertige Linie im Kettencode. Anschliessend wird die Verarbeitung
am nächsten Punkt nach dem Startpunkt wieder aufgenommen, bis das ganze Bild
durchsucht wurde.

7.3.3 Hysterese-Schwellwertverfahren

Dieses Verfahren gleicht der oben beschriebenen Local Connectivity Analysis, be-
nutzt jedoch zwei Schwellwerte, einen oberen Schwellwert θo und einen unteren
Schwellwert θl . Diese Schwellwerte werden in Beziehung gesetzt8 :

θl = β · θo (57)
8β wird auf einen Wert zwische 0.3 und 0.5 gesetzt.

18
Der obere Schwellwert θo legt hierbei die Kantenstärke fest, ab der ein Punkt als
Startpunkt für eine Linie in Frage kommt, der unter Schwellwert θl ensprechend
die Kantenstärke für mögliche Nachfolger. Der Algorithmus läuft dann nach fol-
gendem Schema ab:

1. Alle Punkte mit Kantenstärke über θo werden als mögliche Startpunkte aus-
gewählt.
2. Ausgehend von der Kantenrichtung wird jeder Startpunkt in beiden ent-
gegengesetzten Richtungen (analog der Local Connectivity Analysis!) nach
möglichen Nachfolgern untersucht. Ein Nachfolger muss folgende Bedin-
gungen erfüllen:

(a) Kantenstärke grösser als der untere Schwellwert θl


(b) Kantenrichtung identisch mit der Kantenrichtung des aktuellen Punk-
tes
(c) nicht Teil einer bereits erkannten Linie

3. Falls in einer der beiden Richtungen mehr als ein Kandidat die Bedingungen
erfüllt, wird derjenige mit der höchsten Kantenstärke ausgewählt. Die Kan-
tenstärke des anderen Kandidaten wird dann auf θl + 0.01 gesetzt. Das hat
folgenden Grund:
Fall A: Er gehört noch zur aktuellen Linie und wurde von der Linienausdün-
nung nicht ’erwischt’. Also sollte er nicht als Startpunkt für weitere Linien
in Frage kommen. Dies wird durch verhindert, da die Kantenstärke unter θo
gesetzt wurde.
Fall B: Er gehört zu einer weiteren Linie. Also sollte er als Folgeglied einer be-
stehenden Linie noch akzeptiert werden. Dies wird ermöglicht, da die Kan-
tenstärke höher als θl gesetzt wurde.

7.3.4 Hough-Code

Motivation: Einfache Generierung von Geraden ohne Kettencode durch Parame-


trisierung. Anwendung aber auch zur Erkennung von Linienfiguren im Bild, z.B.
Kreise, Quadrate u.ä.

Codierung von Geraden Zu einer Geraden wird eine Senkrechte (Lot) durch den
Nullpunkt (links oben) gezogen. Man nimmt dann den Abstand d der Geraden
zum Nullpunkt und den Winkel ζ des Lotes zur oberen Bildkante als Koordinaten
eines Punktes in einem neuen Bild. Das Bild hat die Dimensionen 2d · ζ.9 Damit
ensteht für jede Gerade im Originalbild ein einziger Punkt im Hough-Raum. Man
spricht von einer Verschiebung aus dem Ortsraum in den Parameterraum. Den
Parameterraum nennt man auch Akkumulator oder accumulator array.
Die Werte der Punkte im Akkumulator werden bestimmt durch die Kantenstärke
im Originalbild.
9 Die 2 · d entstehen, da die Kante in zwei Richtungen laufen kann. Um dies festhalten zu können

wird die eine Richtung mit −d im Bild eingetragen und die andere mit d.

19
Detektion von Kreisen Linien im Ortsraum, die sich im gleichen Punkt schnei-
den, liegen im Akkumulator auf einer Geraden (was sich zeigen läßt). Auf einen
möglichen Kreis bezogen heißt das: Unabhängig vom Radius des Kreises schnei-
den sich die Gradienten der Kanten, welche die Kreislinie bilden, idealerweise in
dessen Mittelpunkt und bilden so ebenfalls eine Gerade im Akkumulator10 . Man
wendet also auf das Gradientenbild des Kantenbildes eine Hough-Transformation
an. Dann sucht man im Akkumulator nach Geraden. Die Geraden geben Auf-
schluss über mögliche Mittelpunkte von Kreisen im Ortsraum.
Ausgehend von diesen möglichen Mittelpunkten begibt man sich wieder in den
Ortsraum des Originalbildes und sucht dort mit wachsenden Radii nach Kanten,
die die mögliche Kreislinie bilden. Anhand einer Funktion, die die Kriterien ”Kan-
tenstärke des Kreises” und ”Grösse des Kreises” optimiert, lassen sich so Kreise
detektieren.

7.3.5 Optimale Liniendetektion (Canny-Operator)

Aufgrund der Komplexität des Canny-Operators ist es unwahrscheinlich, dass


hierzu eine Klausuraufgabe gestellt wird. Man sollte aber zur Kenntnis nehmen,
dass der Canny-Operator ein optimales Verfahren zur Liniendetektion ist, dass auf
einer intelligenten Kombination folgender Operatoren beruht:

• Gauss-Filter
• Gauss’scher Ableitungsfilter
• NMA (Non-Maxima-Absorption, ”Edge Thinning”)
• Hysterese Schwellwert

7.3.6 Dynamische Programmierung

Die dynamische Programmierung wird in unserem Fall benutzt, um beim Ver-


gleich gefundener Linien im Bild mit Objekten aus einer Datenbank die beste Über-
einstimmung festzustellen. Analog einem Hidden Markow Modell haben wir also
eine Sequenz von Beobachtungen und eine Sequenz von (verborgenen) Referen-
zen. Gesucht ist nun die verborgene Referenz, die unserer Beobachtung am ehe-
sten entspricht.
Es gibt die Funktion ξλ , die einer Beobachtung einer Referenz zuordnet. Zeichnet
man nun einen (nicht linearen) Graphen der Funktion, die alle Beobachtungen Ih-
rer jeweiligen möglichen Referenz zuordnet, so soll der Graph gefunden werden,
der die niedrigsten Abstände von Punkt zu Punkt hat. Das Optimierungsproblem
kann also formuliert werden als
Xm

Dλ = minS d cλ,i(t) , cj(t) (58)
t=1

wobei d cλ,i(t) , cj(t) ein sinnvoll definiertes Maß für den Abstand der Punkte sein
soll.
Die dynamische Programmierung besteht nun aus einer rekursiven Lösung dieses
Problems, die sich Bellmann’s Optimierungsprinzip zunutze macht.
10 In der Praxis schneiden sich die Gradienten natürlich nur in der Nähe des Mittelpunkts, da in einem

digitalen Bild die Kreisform nur angenähert wird und die Winkel der Gradienten nur in 144 Stufen
aufgelöst werden. Es sind also in der Praxis auch noch einige Vorarbeiten nötig, die hier ausgelassen
sind.

20
Bellmann’s Optimierungsprinzip Alle Unterpfade eines optimalen Pfads sind
ihrerseits bereits ein optimaler Pfad.

7.4 Regionensegmentierung

Ziel: Zusammenhängende Flächen im Bild extrahieren. Hierzu gibt es verschiede-


nen Kriterien:

• Festlegung eines maximalen Wertunterschiedes der Pixel


• Betrachung der Varianz
• Betrachtung der Textur

Ausgehend von einem dieser Kriterien wird so ein Homogenitätsschwellwert fest-


gelegt, der entscheidet, ob benachbarte Regionen zusammengehören oder nicht.
Ergebnis ist ein neues Bild mit benannten Flächen.

7.4.1 Einfache Regionensegmentierung

Region Growing In diesem Fall beginnt man mit initialen Zellen und prüft mit
der jeweils benachbarten Zelle, ob eine Zusammenfassung den definierten Homo-
genitätswert über den Schwellwert erhöht oder nicht. Erhöht sie ihn nicht, werden
die Zellen zu einem neuen Bereich zusammengefasst.

Region Splitting Dies ist die umgekehrte Vorgehensweise: Man betrachtet ein-
gangs das gesamte Bild als Region und splittet nach und nach initiale Zellen ab,
deren Homogenitätswert über dem Schwellwert liegt.

Split and Merge Diese Vorgehensweise verbindet die beiden vorherigen. Zen-
trales Konzept hierbei ist eine Quadtree-Struktur.

• Zerlege das Bild in 2n Rechtecke.


• Lege für die Rechtecke einen Knoten in der Quadtree-Struktur an.
• Berechne für jedes Rechteck jeweils den Homogenitätswert.
• Liegt der Wert über dem Schwellwert, dann fahre für dieses Rechteck rekur-
siv mit der 2n -Zerlegung wie oben beschrieben fort.

7.5 Konturen

Konturenerkennung in einem Binärbild läuft nach folgendem Schema ab:

1. Nach drei aufeinanderfolgenden Drehungen drehe in die umgekehrte Rich-


tung unabhängig von den folgenden Regeln.
2. Drehe nach links, falls Du auf ein weißes Pixel stößt.
3. Drehe nach rechts, falls Du auf ein schwarzes Pixel stößt.

21
8 Fourier-Transformation

8.1 Vorwissen

8.1.1 Motivation

Die Grundmotivation zur Fourier-Transformation entstammt wohl folgendem Ge-


danken: In der linearen Algebra ist es möglich, jeden Punkt in einem mehrdimen-
sionalen Vektorraum darzustellen als Linearkombination einiger weniger Basis-
vektoren. Ist es dann nicht auch möglich, jedes Signal durch eine endliche oder
unendliche Zahl von Basiselemente darzustellen?
Man kann zeigen, dass sich jedes periodische Signal darstellen lässt als Linearkom-
bination der Sinus- und der Cosinusfunktion.

8.1.2 Fourier-Reihen

Aus der Mathematik ist bekannt, dass sich jede beliebige 2π-periodische reelle
Funktion f (t) annähern lässt durch die Fourier-Reihen
a0 X
f (t) = + ak cos (kt) + bk sin (kt) (59)
2
k≥1

wobei die Reihe endlich oder unendlich sein kann. Die Skalare ak und bk nennt
man Fourier Koeffizienten. Die Bestimmung dieser Koeffizienten reicht also aus, um
beliebige reelle periodische Funktion zu beschreiben.
Durch Umformung und Bestimmung der Integrale der Sinus- und Cosinusfunk-
tion lassen sich Formeln zur direkten Berechnung von ak und bk aus einer 2π -
periodischen reellen Funktion f (t) herleiten, die Eulerschen Formeln:
1 π
Z
ak = f (t) cos (kt) dt (60)
π −π

1 π
Z
bk = f (t) sin (kt) dt (61)
π −π

8.2 Fourier-Transformation

8.2.1 Herleitung

Die Fourier-Transformation ermittelt die Koeffizienten für die Fourier-Reihen, an-


hand derer das Originalsignal wiederhergestellt werden kann. Sie bildet also ein
Bild aus dem Ortsraum in den Frequenzraum ab.
Zur Herleitung der Fourier-Transformation schreibt man die Fourier-Reihen um
in komplexe Form (d.h. man wendet komplexe Zahlen dazu an). Hierbei hilft die
aus der Analysis bekannte Euler-Formel

exp (±iφ) = cosφ ± i · sinφ (62)

so dass wir cos(kt) und sin(kt) durch die komplexe Zahl exp(ikt) darstellen kön-
nen:
1
cos (kt) = (exp (ikt) + exp (−ikt)) (63)
2

22
1
sin (kt) = (exp (ikt) − exp (−ikt)) (64)
2i
Setzt man diese Funktionen in die Fourier Reihe 59 auf der vorherigen Seite ein, so
lassen sich die beiden Fourier-Koeffizienten durch Einsatz der komplexen Zahlen
auf einen Koeffizienten ck reduzieren; es ergibt sich die unendliche Fourier-Reihe

1 X
f (t) = ck · exp (ikt) (65)
2·π
k=−∞

ck lässt sich durch ak und bk darstellen, also können wird auch eine Formel herlei-
ten, die ck im Intervall [−π..π] direkt aus einer Funktion f (t) berechnet:
Z π
ck = f (t) exp (−ikt) dt (66)
−π

Durch Übertragung auf unendliche Intervalle erhalten wir die Fourier Transforma-
tion der Funktion f (t) :
Z ∞
F (ξ) = f (t) · exp (−iξt) dt = F T {f } (67)
−∞

Diese stellt nichts anderes dar als die Koeffizienten ck der komplexen Fourier-
Reihe zur Funktion f (t). Der Wert ξ ist eine Variable, die die horizontalen und
vertikalen Koordinaten des Frequenzraumes annimmt.11

8.2.2 Anwendung auf Bilder

Auf Bilder angewandt, funktioniert die FT folgendermassen:

• Anwendung einer eindimensionalen FT auf die Zeilen des Bildes


• erneute Anwendung einer eindimensionalen FT auf die Spalten des Ergeb-
nisbildes

Das Ergebnisbild hat folgende Eigenschaften:

• Der linke obere Pixel des Ergebnisbildes ist der sogenannte Gleichstromanteil.
Er enthält den Mittelwert des Bildes. In der Fourierreihe entspricht dieser
Wert dem ersten Summanden a20 .
• In der Mitte des Bildes sind die höchsten Frequenzen enthalten

In der Regel wird das FT-Bild allerdings durch eine Translation so umgeformt, dass
der Mittelwert in der Mitte des Bildes liegt. Dazu teilt man das Bild in 4 Quadran-
ten, die auf die jeweils gegenüberliegende Seite verschoben werden.
1 2 4 3

3 4 2 1

Zur Darstellung
√des Bildes nimmt man in der Regel den Absolutbetrag der kom-
plexen Zahlen a2 + b2 . In dem translatierten Bild kann man folgende Änderun-
gen vornehmen, die einen Effekt im zurücktransformierten Bild ergeben:
11 Teilweise wird diese Formel in der Potenz zusätzlich mit dem Faktor 2π angegeben ( e−2·πif tπ vs.

e−ikt ). Der Faktor 2π soll dann die Periodizität angeben. In unserem Fall ist die Periodizität implizit
durch ξ ausgedrückt.

23
• Herausschneiden eines Kreises in der Mitte hat den Effekt eines Hochpassfil-
ters
• Herausschneiden eines Ringes um den Mittelpunkt hat den Effekt eines Band-
passfilters
• Löschen aller Werte ausserhalb eines Kreises in der Mitte hat den Effekt eines
Tiefpassfilters

Das Amplitudenspektrum ist die Darstellung des Absolutbetrages der komplexen


Zahlen, das Phasenspektum die Darstellung der Richtung des Vektors der komple-
xen Zahlen. Durch das Phasenspektrum wird der Ort der Objekte im Originalbild
dargestellt, durch das Amplitudenspektrum das Aussehen.

8.2.3 Inverse Fourier-Transformation

Das Inverse der Fourier-Transformation ergibt wieder eine Fourier-Transformation


Z ∞
1
f (t) = F (ξ) · exp (iξt) dξ (68)
2 · π −∞

8.2.4 Faltungstheorem

Aufgrund der Eigenschaften der Fourier-Transformation lässt sich zeigen, dass


sich die Faltung zweier Funktionen f (t) und g(t) zu einer Funktion h(t) als Pro-
dukt ihrer Fourier-Transformationen und anschliessende Anwendung der inver-
sen Fourier-Transformation darstellen lässt:
h (t) = f (t) ∗ g (t) (69)
H (ξ) = F (ξ) · G (ξ) (70)

Der Vorteil ist, dass im Frequenzraum eine Multiplikation komplexer Werte statt-
findet, während im Ortsraum stets eine Faltung durchgeführt werden muss.

8.2.5 Diskrete Fourier-Transformation

Für die Bearbeitung eines gesampelten Signals benötigen wird eine diskrete Form
der Fourier-Transformation, die als Argumente die Sample-Werte f0 , f1 , ..., fM −1
nimmt. Diese lässt sich aus obigen Formeln herleiten als
M −1
X   v t
Fv = ft · exp −i2π = DF T {f } (71)
t=0
M

Da es sich hier um eine lineare Transformation handelt, lässt sie sich in Matrix-
form darstellen. Durch Benutzung der Formeln zur Einheitswurzel und üblicher
Umformungen der komplexen Zahlen erhalten wir diese:
    
F0 1 1 1 ... 1 f0
 F1   1 m m2 ··· mM −1    f1 
 
2 4 2(M −1)  
  
 F2   1 m m ... m
=   f2  (72)

  .. .. .. .. ..

 ..  .. 
 .   . . . . .  . 
2
FM −1 1 mM −1 m2(M −1) ... m(M −1) fM −1

24
9 Codierungs- und Kompressionsalgorithmen

9.1 Prefix-Codes

9.1.1 Allgemein

Haupteigenschaft von Prefix-Codes: Kein Codewort ist Präfix eines anderen Co-
dewortes (im gleichen Code-Körper). Ein Beispiel für Prefix-Codes sind die Tele-
fonnummern.
Durch die Eigenschaft der Prefix-Codes ergeben sich einige starke Vorteile; bei-
spielsweise kann man die Codes in unterschiedlicher Länge sequentiell und ohne
Trennzeichen in einen Datensatz schreiben und später eindeutig wieder separie-
ren.

9.1.2 Baumcodierung

Prefix-Codes können als Baum notiert werden, der an den Kanten die Ziffern und
am Ende der Äste die Symbole enthält. Durch Aneinanderreihung der Ziffern auf
dem Weg zum gewünschten Symbol konstruiert sich denn der jeweilige Code.

9.1.3 Huffman-Algorithmus

Der Huffman-Algorithmus ist eine sehr effiziente Implementierung der Baumco-


dierung im Körper N.

1. Berechnung der relativen Häufigkeiten für alle Symbole des verwendeten


Zeichenvorrats.
2. Anordnung der Symbole zu einer Liste in aufsteigender Reihenfolge nach
den relativen Häufigkeiten.
3. Verknüpfung der beiden Symbole mit den geringsten Wahrscheinlichkeiten
zu einem Knoten, der als Wahrscheinlichkeit die Summe der beiden Sym-
bolwahrscheinlichkeiten trägt. Dieser Knoten mit seiner Wahrscheinlichkeit
ersetzt nun die beiden Symbole in der sortierten Auflistung.
4. Die Schritte 2 und 3 werden wiederholt bis die Wurzel des entstehenden Bau-
mes erreicht ist.

9.2 Lauflängencodierung (”Runlength-Coding”)

Lauflängencodierung basiert auf folgendem Prinzip: Anstatt eine Ziffernfolge wie

111110000011111111

zu codieren, könnte man einfach schreiben 558; vorausgesetzt, es ist festgelegt, daß
die Ziffern 1 und 0 im Wechsel vorkommen und die Folge mit 1 beginnt.
Um eine ineffiziente Codierung bei schnellen Wechseln (z.Bsp. 1010101) zu ver-
hindern, bedient man sich zusätzlich spezieller Symbole, die eine ”Umschaltung”
zwischen Lauflängen- und normaler Codierung bewirken.
Bei Bildern legt man z.B fest:

25
• Festlegung des Umschalters z.B. als 0x90
• 0x90 n c codiert z.B. n Wiederholungen des Symbols c
• 0x90 0x90 codiert den Umschalter

Lauflängencodierung wird z .B. bei Postscript und JPEG genutzt.

9.3 Delta-Kompression (Differenzkodierung)

Idee: Das Bild wird sequentiell durchlaufen. Die Codierung findet in zwei Modi
statt: Lässt sich die Differenz der benachbarten Grauwerte effizienter codieren als
der neue Grauwert, dann wird nur die Differenz gespeichert; ansonsten der neue
Grauwert. Es muss also auch hier ein ”Umschalter” zwischen den beiden Modi
definiert werden. Bei Bildern wird oft folgende Variante benutzt:

• Grauwerte werden von 0..255 codiert (8 Bit)


• Differenzen werden von -7..7 codiert (4 Bit)
• -8 wird als Umschalter definiert

9.4 JPEG

Die JPEG-Komprimierung läuft in folgenden Schritten ab:

• Diskrete Cosinus-Transformation (DCT) von 8x8-Blöcken. Das Ergebnis gleicht


einer Fourier-Transformation ohne imaginäre Werte.
• Geschickte Quantisierung der erhaltenen Werte nach (teilweise) genormten
Quantisierungstabellen, d.h. Mappen auf einen anderen Wertebereich.
• Anschliessende Lauflängencodierung und Huffmancodierung; dabei wird
das Spektrum allerdings diagonal in einem Zick-Zack-Schema traversiert, da
hierdurch meistens geringere Differenzen auftreten.

10 Sonstiges

10.1 Look-up-table Transformation

Wenn eine aufwendige Berechnung nur mit einer überschaubaren Anzahl unter-
schiedlicher Parameter verwendet wird, ist es oft sinnvoll, die Werte einmalig zu
berechnen und für die spätere Benutzung im Speicher abzugegen. In einem Look-
up-table (LUT) werden solche diskreten Werte mit genügend genauer Rundung
abgespeichert. Zum Beispiel sähe ein Look-up-table zu f : [0, 2] → IR, f(x) = x2
mit 6 diskreten Werten so aus:

x f(x)
0 0
0.5 0.25
1 1
1.5 2.25
2 26 4
A Fragen

A.1 Verständnis
1. JPEG: Entsteht bei der Zick-Zack-Fourier-Transformation immer EIN Koeffi-
zient pro 8x8-Maske? Was passiert bei der Quantisierung?
2. Maskenoperatoren für die 1. Ableitung werden auf das Bild gefaltet. Handelt
es sich also folglich um lineare Filter?
3. Woher rührt das 1. Kriterium für Geraden im Kettencode? Gibt es nicht auch
Geraden, für die dieses Kriterium nicht gilt?

A.2 Relevanz
1. Dynamische Programmierung
2. Salt&Pepper-Noise
3. Sollte man sich die jeweiligen O(..)-Komplexitätsangaben der Operatoren/Algorithmen
merken?

B To-Do-Liste
1. Dynamische Programmierung - Details?
2. JPEG-Details

27
GNU Free Documentation License Version 1.1, March
2000
Copyright (C) 2000 Free Software Foundation, Inc. 59 Temple Place, Suite 330, Bo-
ston, MA 02111-1307 USA Everyone is permitted to copy and distribute verbatim
copies of this license document, but changing it is not allowed.

0. PREAMBLE The purpose of this License is to make a manual, textbook, or


other written document "free" in the sense of freedom: to assure everyone the ef-
fective freedom to copy and redistribute it, with or without modifying it, either
commercially or noncommercially. Secondarily, this License preserves for the au-
thor and publisher a way to get credit for their work, while not being considered
responsible for modifications made by others.
This License is a kind of "copyleft", which means that derivative works of the docu-
ment must themselves be free in the same sense. It complements the GNU General
Public License, which is a copyleft license designed for free software.
We have designed this License in order to use it for manuals for free software,
because free software needs free documentation: a free program should come with
manuals providing the same freedoms that the software does. But this License is
not limited to software manuals; it can be used for any textual work, regardless of
subject matter or whether it is published as a printed book. We recommend this
License principally for works whose purpose is instruction or reference.

1. APPLICABILITY AND DEFINITIONS This License applies to any manual or


other work that contains a notice placed by the copyright holder saying it can be
distributed under the terms of this License. The "Document", below, refers to any
such manual or work. Any member of the public is a licensee, and is addressed as
"you".
A "Modified Version" of the Document means any work containing the Document
or a portion of it, either copied verbatim, or with modifications and/or translated
into another language.
A "Secondary Section" is a named appendix or a front-matter section of the Docu-
ment that deals exclusively with the relationship of the publishers or authors of the
Document to the Document’s overall subject (or to related matters) and contains
nothing that could fall directly within that overall subject. (For example, if the Do-
cument is in part a textbook of mathematics, a Secondary Section may not explain
any mathematics.) The relationship could be a matter of historical connection with
the subject or with related matters, or of legal, commercial, philosophical, ethical
or political position regarding them.
The "Invariant Sections" are certain Secondary Sections whose titles are designated,
as being those of Invariant Sections, in the notice that says that the Document is
released under this License.
The "Cover Texts" are certain short passages of text that are listed, as Front-Cover
Texts or Back-Cover Texts, in the notice that says that the Document is released
under this License.
A "Transparent" copy of the Document means a machine-readable copy, represen-
ted in a format whose specification is available to the general public, whose con-
tents can be viewed and edited directly and straightforwardly with generic text

28
editors or (for images composed of pixels) generic paint programs or (for dra-
wings) some widely available drawing editor, and that is suitable for input to text
formatters or for automatic translation to a variety of formats suitable for input
to text formatters. A copy made in an otherwise Transparent file format whose
markup has been designed to thwart or discourage subsequent modification by
readers is not Transparent. A copy that is not "Transparent" is called "Opaque".
Examples of suitable formats for Transparent copies include plain ASCII without
markup, Texinfo input format, LATEX input format, SGML or XML using a publicly
available DTD, and standard-conforming simple HTML designed for human mo-
dification. Opaque formats include PostScript, PDF, proprietary formats that can
be read and edited only by proprietary word processors, SGML or XML for which
the DTD and/or processing tools are not generally available, and the machine-
generated HTML produced by some word processors for output purposes only.
The "Title Page" means, for a printed book, the title page itself, plus such following
pages as are needed to hold, legibly, the material this License requires to appear
in the title page. For works in formats which do not have any title page as such,
"Title Page" means the text near the most prominent appearance of the work’s title,
preceding the beginning of the body of the text.

2. VERBATIM COPYING You may copy and distribute the Document in any
medium, either commercially or noncommercially, provided that this License, the
copyright notices, and the license notice saying this License applies to the Docu-
ment are reproduced in all copies, and that you add no other conditions what-
soever to those of this License. You may not use technical measures to obstruct or
control the reading or further copying of the copies you make or distribute. Howe-
ver, you may accept compensation in exchange for copies. If you distribute a large
enough number of copies you must also follow the conditions in section 3.
You may also lend copies, under the same conditions stated above, and you may
publicly display copies.

3. COPYING IN QUANTITY If you publish printed copies of the Document


numbering more than 100, and the Document’s license notice requires Cover Texts,
you must enclose the copies in covers that carry, clearly and legibly, all these Co-
ver Texts: Front-Cover Texts on the front cover, and Back-Cover Texts on the back
cover. Both covers must also clearly and legibly identify you as the publisher of
these copies. The front cover must present the full title with all words of the title
equally prominent and visible. You may add other material on the covers in addi-
tion. Copying with changes limited to the covers, as long as they preserve the title
of the Document and satisfy these conditions, can be treated as verbatim copying
in other respects.
If the required texts for either cover are too voluminous to fit legibly, you should
put the first ones listed (as many as fit reasonably) on the actual cover, and continue
the rest onto adjacent pages.
If you publish or distribute Opaque copies of the Document numbering more than
100, you must either include a machine-readable Transparent copy along with each
Opaque copy, or state in or with each Opaque copy a publicly-accessible computer-
network location containing a complete Transparent copy of the Document, free of
added material, which the general network-using public has access to download
anonymously at no charge using public-standard network protocols. If you use the
latter option, you must take reasonably prudent steps, when you begin distribution

29
of Opaque copies in quantity, to ensure that this Transparent copy will remain
thus accessible at the stated location until at least one year after the last time you
distribute an Opaque copy (directly or through your agents or retailers) of that
edition to the public.
It is requested, but not required, that you contact the authors of the Document well
before redistributing any large number of copies, to give them a chance to provide
you with an updated version of the Document.

4. MODIFICATIONS You may copy and distribute a Modified Version of the


Document under the conditions of sections 2 and 3 above, provided that you re-
lease the Modified Version under precisely this License, with the Modified Version
filling the role of the Document, thus licensing distribution and modification of the
Modified Version to whoever possesses a copy of it. In addition, you must do these
things in the Modified Version:
A. Use in the Title Page (and on the covers, if any) a title distinct from that of the
Document, and from those of previous versions (which should, if there were any,
be listed in the History section of the Document). You may use the same title as a
previous version if the original publisher of that version gives permission. B. List
on the Title Page, as authors, one or more persons or entities responsible for aut-
horship of the modifications in the Modified Version, together with at least five of
the principal authors of the Document (all of its principal authors, if it has less than
five). C. State on the Title page the name of the publisher of the Modified Version,
as the publisher. D. Preserve all the copyright notices of the Document. E. Add an
appropriate copyright notice for your modifications adjacent to the other copyright
notices. F. Include, immediately after the copyright notices, a license notice giving
the public permission to use the Modified Version under the terms of this License,
in the form shown in the Addendum below. G. Preserve in that license notice the
full lists of Invariant Sections and required Cover Texts given in the Document’s
license notice. H. Include an unaltered copy of this License. I. Preserve the section
entitled "History", and its title, and add to it an item stating at least the title, year,
new authors, and publisher of the Modified Version as given on the Title Page. If
there is no section entitled "History" in the Document, create one stating the tit-
le, year, authors, and publisher of the Document as given on its Title Page, then
add an item describing the Modified Version as stated in the previous sentence. J.
Preserve the network location, if any, given in the Document for public access to
a Transparent copy of the Document, and likewise the network locations given in
the Document for previous versions it was based on. These may be placed in the
"History" section. You may omit a network location for a work that was published
at least four years before the Document itself, or if the original publisher of the ver-
sion it refers to gives permission. K. In any section entitled "Acknowledgements"
or "Dedications", preserve the section’s title, and preserve in the section all the sub-
stance and tone of each of the contributor acknowledgements and/or dedications
given therein. L. Preserve all the Invariant Sections of the Document, unaltered in
their text and in their titles. Section numbers or the equivalent are not considered
part of the section titles. M. Delete any section entitled "Endorsements". Such a
section may not be included in the Modified Version. N. Do not retitle any existing
section as "Endorsements" or to conflict in title with any Invariant Section.
If the Modified Version includes new front-matter sections or appendices that qua-
lify as Secondary Sections and contain no material copied from the Document, you
may at your option designate some or all of these sections as invariant. To do this,
add their titles to the list of Invariant Sections in the Modified Version’s license
notice. These titles must be distinct from any other section titles.

30
You may add a section entitled "Endorsements", provided it contains nothing but
endorsements of your Modified Version by various parties–for example, state-
ments of peer review or that the text has been approved by an organization as
the authoritative definition of a standard.
You may add a passage of up to five words as a Front-Cover Text, and a passage
of up to 25 words as a Back-Cover Text, to the end of the list of Cover Texts in the
Modified Version. Only one passage of Front-Cover Text and one of Back-Cover
Text may be added by (or through arrangements made by) any one entity. If the
Document already includes a cover text for the same cover, previously added by
you or by arrangement made by the same entity you are acting on behalf of, you
may not add another; but you may replace the old one, on explicit permission from
the previous publisher that added the old one.
The author(s) and publisher(s) of the Document do not by this License give per-
mission to use their names for publicity for or to assert or imply endorsement of
any Modified Version.

5. COMBINING DOCUMENTS You may combine the Document with other


documents released under this License, under the terms defined in section 4 above
for modified versions, provided that you include in the combination all of the In-
variant Sections of all of the original documents, unmodified, and list them all as
Invariant Sections of your combined work in its license notice.
The combined work need only contain one copy of this License, and multiple iden-
tical Invariant Sections may be replaced with a single copy. If there are multiple In-
variant Sections with the same name but different contents, make the title of each
such section unique by adding at the end of it, in parentheses, the name of the
original author or publisher of that section if known, or else a unique number. Ma-
ke the same adjustment to the section titles in the list of Invariant Sections in the
license notice of the combined work.
In the combination, you must combine any sections entitled "History" in the va-
rious original documents, forming one section entitled "History"; likewise combi-
ne any sections entitled "Acknowledgements", and any sections entitled "Dedica-
tions". You must delete all sections entitled "Endorsements."

6. COLLECTIONS OF DOCUMENTS You may make a collection consisting of


the Document and other documents released under this License, and replace the
individual copies of this License in the various documents with a single copy that
is included in the collection, provided that you follow the rules of this License for
verbatim copying of each of the documents in all other respects.
You may extract a single document from such a collection, and distribute it indi-
vidually under this License, provided you insert a copy of this License into the
extracted document, and follow this License in all other respects regarding verba-
tim copying of that document.

7. AGGREGATION WITH INDEPENDENT WORKS A compilation of the Do-


cument or its derivatives with other separate and independent documents or works,
in or on a volume of a storage or distribution medium, does not as a whole count
as a Modified Version of the Document, provided no compilation copyright is clai-
med for the compilation. Such a compilation is called an "aggregate", and this Li-
cense does not apply to the other self-contained works thus compiled with the

31
Document, on account of their being thus compiled, if they are not themselves
derivative works of the Document.
If the Cover Text requirement of section 3 is applicable to these copies of the Docu-
ment, then if the Document is less than one quarter of the entire aggregate, the Do-
cument’s Cover Texts may be placed on covers that surround only the Document
within the aggregate. Otherwise they must appear on covers around the whole
aggregate.

8. TRANSLATION Translation is considered a kind of modification, so you may


distribute translations of the Document under the terms of section 4. Replacing
Invariant Sections with translations requires special permission from their copy-
right holders, but you may include translations of some or all Invariant Sections
in addition to the original versions of these Invariant Sections. You may include
a translation of this License provided that you also include the original English
version of this License. In case of a disagreement between the translation and the
original English version of this License, the original English version will prevail.

9. TERMINATION You may not copy, modify, sublicense, or distribute the Do-
cument except as expressly provided for under this License. Any other attempt to
copy, modify, sublicense or distribute the Document is void, and will automatically
terminate your rights under this License. However, parties who have received co-
pies, or rights, from you under this License will not have their licenses terminated
so long as such parties remain in full compliance.

10. FUTURE REVISIONS OF THIS LICENSE The Free Software Foundation


may publish new, revised versions of the GNU Free Documentation License from
time to time. Such new versions will be similar in spirit to the present version, but
may differ in detail to address new problems or concerns. See http://www.gnu.org/copyleft/.
Each version of the License is given a distinguishing version number. If the Do-
cument specifies that a particular numbered version of this License "or any later
version" applies to it, you have the option of following the terms and conditions
either of that specified version or of any later version that has been published (not
as a draft) by the Free Software Foundation. If the Document does not specify a
version number of this License, you may choose any version ever published (not
as a draft) by the Free Software Foundation.

ADDENDUM: How to use this License for your documents To use this License
in a document you have written, include a copy of the License in the document
and put the following copyright and license notices just after the title page:
Copyright (c) YEAR YOUR NAME. Permission is granted to copy, distribute and/or
modify this document under the terms of the GNU Free Documentation License,
Version 1.1 or any later version published by the Free Software Foundation; with
the Invariant Sections being LIST THEIR TITLES, with the Front-Cover Texts being
LIST, and with the Back-Cover Texts being LIST. A copy of the license is included
in the section entitled "GNU Free Documentation License".
If you have no Invariant Sections, write "with no Invariant Sections" instead of
saying which ones are invariant. If you have no Front-Cover Texts, write "no Front-
Cover Texts" instead of "Front-Cover Texts being LIST"; likewise for Back-Cover
Texts.

32
If your document contains nontrivial examples of program code, we recommend
releasing these examples in parallel under your choice of free software license,
such as the GNU General Public License, to permit their use in free software.

33
Index
accumulator array, 19 k-trimmed Mean, 11
Achromatisches Licht, 10 Kantendetektion, 8
Affine Distortion, 12 Kettencode, 17
Akkumulator, 19 KNN, 8
Amplitudenspektrum, 24
Lab/Luv, 10
Bandpassfilters, 24 Laplacian of Gaussian, 9
Baumcodierung, 25 Lauflängencodierung, 25
Bellmann’s Optimierungsprinzip, 21 Lineare Filter, 6
Binomialfilter, 7 Lineare Interpolation, 12
Local Connectivity Analysis, 18
Canny-Operator, 20 LoG, 9
Chromatisches Licht, 10 Look-up-table, 26
Chromatizität, 10 Look-up-table Transformation, 26
CMYK, 10 Luminanz, 10
Code, 19 LUT, 26
Delta-Kompression, 26 Maskengewichte, 6
Differenzkodierung, 26 Mean, 7
Dilatationsfilter, 7 Metamere, 10
Diskrete Cosinus-Transformation, 26 Mexican Hat, 9
Diskrete Fourier-Transformation, 24 Mittelwert, 5
DoG, 9 Mittelwertfilter, 7
Dynamische Programmierung, 20 Moravec, 13
Edge-Preserving Smoothing, 8 Nevatia und Babu, 18
Einheitswurzel, 24 Normalverteiler, 6
Entropie, 5
Erosionsfilter, 7 Operator, 16
Faltung, 6 Parameterraum, 19
Faltungstheorem, 24 Phasenspektum, 24
Farbräume, 10 Prefix-Codes, 25
Filter, 6–8 Prewitt, 15
Fourier Transformation, 23 Punktsegmentierung, 13
Fourier-Transformation, 22
Freeman-Code, 17 Rangordnungsfilter, 7
Ratio, 5
Gauss-Maske, 7 Rauschabstand, 5
Gradient, 15 Rauschen, 6
RGB, 10
Harris Corner Detector, 14
Robert’s Cross, 15
Histogramm-Entropie Schwellwert, 11
Runlength-Coding, 25
Histogramm-Equalisierung, 11
HSI/HSV, 10 Schwellwertverfahren, 18
Huffman, 25 Smoothed Median Filter, 8
SNN, 9
Informationsgehalt, 5
Sobel, 15
Inverse Fourier-Transformation, 24
Standardabweichung, 5
JPEG, 26 Symmetric Nearest Neighbour, 9

K Nearest Neighbour Averaging, 8 Thresholding, 11

34
trace, 14
Translation, 23

Varianz, 5

XYZ, 10

YUV/YC, 10

Zentraldifferenz, 15

35
Literatur
[PHo01] Paulus, Dietrich W.R. u. Hornegger, Joachim. Applied Pattern Recogniti-
on. A Practical Introduction to Image and Speech Processing in C++, 3rd
Edition, Vieweg, Wiesbaden 2001
[Pau01] Paulus, Dietrich W.R. Handout zur Vorlesung ”Bildverarbeitung” im WS
2002/2003 an der Universität Koblenz-Landau
[Ko01] Kopp, Herbert. Folien zur Bildverarbeitung an der FH Regensburg, 2001

36