Sie sind auf Seite 1von 8

Hochschule Digitale Bildverarbeitung Prof. Dr.

Erhardt
Offenburg Leistungsnachweis
Semester: AI6
Termin: 19. Juli 2010, 15.00 - 16.00 Uhr
Zugelassene Hilfsmittel: Formelsammlungen, Taschenrechner, kein Vorlesungsscript
Wertung: Note 1.0: 100% aller Punkte, Note 4.0: 50% aller Punkte
Bitte, stellen Sie die Lsungen mit Zwischenrechnungen deutlich und lesbar dar. Aufgaben mit nicht klar erkenn-
barem Lsungsweg und nicht lesbare Lsungen knnen leider nicht gewertet werden.
Aufgabe 1 (10 Punkte)
Gegeben Sei ein RGB-Bild mit folgender Struktur: Der Hintergrund habe von links nach rechts einen linearer schwarz-
rot Verlauf (Abb. 1). Darauf sind ein blaues Quadrat und ein gelber Kreis abgebildet. (Schwarz: Grauwert 0, Wei:
Grauwert 255.) Was passiert mit dem Bild unter folgenden Operationen (nicht aufeinanderfolgend, sondern stets auf
Abbildung 1: Bild zu Aufgabe 1:
das Originalbild angewandt):
a) Sie fhren eine Binarisierung mit der Schwelle g
s
= 127 in der roten Farbebene durch.
b) Sie fhren eine Inversion der roten Farbebene durch.
c) Sie vertauschen die grne und blaue Farbebene.
d) Sie bilden den Mittelwert des Bildes mit seinem invertierten Bild.
e) Sie fhren auf allen Farbebenen eine bitweise AND-Verknpfung mit einem Bild durch, das schwarz ist und
einen weien Kreis an derselben Stelle wie der Kreis im Originalbild besitzt.
Aufgabe 2 (16 Punkte)
Sie haben nach dem Studium eine Stelle bei einer Firma angetreten, die sich mit Texterkennung beschftigt. Ihre erste
Aufgabe ist es, die Buchstaben gedruckter Texte zu identizieren. Sie haben ein Programm geschrieben, welches ein
Bild, das den Text enthlt, zunchst mit Hilfe einer Binarisierungsschwelle binarisiert. Dadurch enthlt das Bild nur
noch zwei Grauwerte: 255 fr schwarz und 0 fr wei (Abb. 2). Obwohl Ihre Schwelle, insgesamt gesehen, opti-
mal ist, kann es trotzdem in seltenen Fllen zu vorkommen, dass Buchstaben zerrissen werden. Sie haben aber nach
dem Austesten einer gengend groen Anzahl von Textbildern erkannt, dass die Lcken innerhalb der Buchstaben nie
grer als 3 Pixel sind und beschlieen deshalb, die Lcken mit Hilfe eines n n Mittelwertlters (n ungerade) zu
schlieen.
a) Wie gro muss n mindestens sein, damit 3 Pixel groe Lcken geschlossen werden knnen?
b) Durch die Mittelwertbildung ist nun aus dem Binrbild ein Grauwertbild geworden, das wieder binarisiert wer-
den muss. Wie muss die Schwelle gelegt werden, damit die Buchstaben nicht wieder zerreien?
c) Treten durch diese Methode bei der Binarisierung weitere Probleme auf, und, wenn ja, wie kann man diese
beheben?
Abbildung 2: Aufgabe 2: Ein binarisierter Textausschnitt (vergrert dargestellt) mit Lcken in den Buchstaben, die durch die
Binarisierung entstanden sind. (Schwarz: Grauwert 255, wei: Grauwert 0)
Aufgabe 3 (6 Punkte)
Zeigen Sie:
Ist die Gegenstandsweite g gleich der hyperfokalen Distanz g
H
, so betrgt der rechte Anteil der Schrfentiefe g
r
=
g
H
2
.
Aufgabe 4 (12 Punkte)
Gegeben sei ein nicht-interpoliertes RGB-Echtfarb-Bild, das mit Hilfe eines Bayer-Filters aufgenommen wurde (Abb. 4
links).
a) Ein solches Bild hat einen Farbstich in einer bestimmten Farbe. Welches ist diese Farbe, und warum ist dieser
Farbstich vorhanden?
b) Berechnen Sie die Werte der farbigen Punkte in Abb. 4. Tragen Sie die Ergebnisse direkt ins Aufgabenblatt ein.
Hinweis: Verwenden Sie Abb. 3, Gl. (1) und Gl. (2).
R R R R
R R R R
R R R R
R R R R
G G G G
G G G G
G G G G
G G G G
G G G G
G G G G
G G G G
G G G G
B B B B
B B B B
B B B B
B B B B
R R R R
R R R R
R R R R
R R R R
G G G G
G G G G
G G G G
G G G G
G G G G
G G G G
G G G G
G G G G
B B B B
B B B B
B B B B
B B B B
a b
1
1
3
3
4 4 2 2
1
1
3
3
4 4 2 2
R R R
R
R
G G
G
G B B B
B
B
G G
G
G
Abbildung 3: Interpolation der Grn-Komponente
a) Umgebung eines roten Pixels, b) Umgebung eines blauen Pixels
G(R) =

(G
1
+ G
3
)/2 falls |R
1
R
3
| < |R
2
R
4
|
(G
2
+ G
4
)/2 falls |R
1
R
3
| > |R
2
R
4
|
(G
1
+ G
2
+ G
3
+ G
4
)/4 falls |R
1
R
3
| = |R
2
R
4
|
(1)
G(B) =

(G
1
+ G
3
)/2 falls |B
1
B
3
| < |B
2
B
4
|
(G
2
+ G
4
)/2 falls |B
1
B
3
| > |B
2
B
4
|
(G
1
+ G
2
+ G
3
+ G
4
)/4 falls |B
1
B
3
| = |B
2
B
4
|
(2)
Abbildung 4: Berechnen Sie die Werte der farbigen Punkte
Lsung 1
Gegeben: Bild Abb. 1 bzw.Abb. 5. Es enthlt
1
a) eine Rampe im Rot-Kanal, sie verluft von links (schwarz) nach rechts (rot). Sie beeinusst die beiden anderen
Kanle nicht.
b) ein gelbes Quadrat (gelb = additive Farbmischung von rot und grn), beeinusst also den Rot- und den Grnka-
nal.
c) ein blauer Kreis (kein Grn- und kein Rotanteil), beeinusst weder Rot- noch Grnkanal.
Nennen wir die Stelle des blauen Quadrates Position 1 und die Stelle des gelbe Kreises Position 2, so sehen die
R G B RGB
Abbildung 5: Lsung 1: Originalbild und seine RGB-Kanle
einzelnen Kanle also folgendermaen aus:
R G B
Rampe von 0 nach 255, von links nach rechts
ansteigend,
schwarzes Quadrat (g = 0) in Position 1
weier Kreis (g = 255) in Position 2,
Schwarzer Hintergrund,
weier Kreis (g = 255) in Position 2,
Schwarzer Hintergrund,
weies Quadrat (g = 255) in Position 1
Folgendes passiert,
wenn nacheinander folgende Operationen auf das Bild angewandt werden:
a) Ausfhren einer Binarisierung mit der Schwelle g
s
= 127 in der roten Farbebene:
Die linke Hlfte des Bildes wird schwarz, die rechte rot, der blaue Kreis und das gelbe Quadrat bleiben davon
unberhrt (Abb. 6).
R G B RGB
Abbildung 6: Lsung 1: Ergebnis nach Binarisierung des Rotkanals
R G B
Linke Hlfte schwarz mit weiem Halbkreis
bei Position 1, rechte Hlfte wei mit schwar-
zem Rechteck bei Position 2
schwarzes Quadrat (g = 0) in Position 1
weier Kreis (g = 255) in Position 2,
Schwarzer Hintergrund,
weier Kreis (g = 255) in Position 2,
Schwarzer Hintergrund,
weies Quadrat (g = 255) in Position 1
b) Ausfhren einer Inversion der roten Farbebene:
Die Rampe im Rotkanal kehrt sich um und verluft jetzt von links (rot) nach rechts (schwarz), das blaue Quadrat
in Position 1 ist jetzt eine additive Farbmischung von rot und blau und wird magenta, der gelbe Kreis in Position
2 hat seinen Rotanteil verloren und wird grn (Abb. 7).
1
Die Bilder und Tabellen waren nicht verlangt und wurden nur wegen der Klarheit eingefgt.
R G B RGB
Abbildung 7: Lsung 1: Ergebnis nach Inversion des Rotkanals
R G B
Rampe von 255 nach 0, von links nach rechts
abfallend,
weies Quadrat (g = 255) in Position 1
schwarzer Kreis (g = 0) in Position 2,
Schwarzer Hintergrund,
weier Kreis (g = 255) in Position 2,
Schwarzer Hintergrund,
weies Quadrat (g = 255) in Position 1
c) Vertauschen der grnen und blauen Farbebene:
Der rote Hintergrund bleibt unverndert, das gelbe Quadrat erhlt eine additive Farbmischung von rot und blau
und wird zu magenta, der blaue Kreis wird grn (Abb. 8).
R G B RGB
Abbildung 8: Lsung 1: Ergebnis nach Vertauschen des Grn- und Blaukanals
R G B
Rampe von 0 nach 255, von links nach rechts
ansteigend,
schwarzes Quadrat (g = 0) in Position 1
weier Kreis (g = 255) in Position 2,
Schwarzer Hintergrund,
weies Quadrat (g = 255) in Position 1
Schwarzer Hintergrund,
weier Kreis (g = 255) in Position 2,
d) Durch Bilden des Mittelwertes eines Bildes mit seinem invertierten Bild entsteht bei einem Grauwertbereich von
0 . . . 255 immer ein homogenes graues Bild mi dem Grauwert g = 128 (genau: g = 127.5) in allen Kanlen.
e) Ausfhren einer bitweisen AND-Verknpfung mit mit dem Originalbild und einem Bild, das schwarz ist und
einen weiSSen Kreis an derselben Stelle wie der Kreis im Originalbild besitzt:
Es wird alles gelscht auer dem Kreis an Position 2 in der Rot- und Grnkomponente. Es entsteht ein schwarzes
Bild mit einem gelben Kreis (Abb. 9).
R G B RGB
Abbildung 9: Lsung 1: Ergebnis nach AND Operation wie beschrieben
R G B
Schwarzer Hintergrund,
weier Kreis (g = 255) in Position 2,
Schwarzer Hintergrund,
weier Kreis (g = 255) in Position 2,
Schwarzer Hintergrund
Lsung 2
a) Damit das Mittelwertlter nicht in die 3 Pixel groe Lcke fllt, und wenn n ungerade sein soll, muss minde-
stens n = 5 sein.
b) Ein Mittelwertlter der Gre 5 5 normiert die gefalteten Bildpixel mit dem Faktor
1
25
.Da es sich um ein
Binrbild handelt, haben alle Objektpixel den Wert 255 und alle Hintergrundpixel den Wert 0. Liegt nun unter
dem Mittelwertlter
1 Objektpixel, so handelt es sich nicht um eine Lcke. Nach der Normierung erhalten wir den Wert g
avg
=
255
25
= 10.2 = 10 (gerundet). Dieser Wert muss bei der nachfolgenden Binarisierung wieder verschwin-
den.
2 oder mehr Objektpixel, so kann es sich um eine Lcke bzw. um einen Teil eines Objekts handeln. Nach
der Normierung erhalten wir einen Wert g
avg

2 255
25
= 20.4 = 20 (gerundet). Diese Werte mssen auf
255 gesetzt werden. Fr die Binarisierungsschwelle g
s
muss also gelten: 10 < g
s
< 20, beispielsweise
g
s
= 15.
c) Durch diese Methode treten weitere Probleme auf:
Es kann vorkommen, dass Buchstaben durch die Mittelwertlterung und anschlieende Binarisierung zu-
sammenstoen, nmlich dann, wenn der Abstand zwischen ihnen 3 Pixel oder kleiner ist, wie dies bei-
spielsweise in Abb. 2 zwischen den Buchstaben r und s, e und l, n und g der Fall ist (Abb. 10).
a b
Abbildung 10: Lsung 2: (a) Textbild (invertiert) Abb. 2 nach der Filterung mit einem Mittelwertlter der Gre 5 5. (b)
Erneute Binarisierung mit der Schwelle gs = 15
Keine Abhilfe ist ein Opening oder Closing: Da der Abstand zwischen zwei Buchstaben in einigen Bei-
spielen ebenfalls drei Pixel oder weniger gro ist, verbinden alle diese Methoden, wenn Sie die Lcken
schlieen, auch die Buchstaben untereinander.
Mehrfache Anwendung eines 3 3- Mittelwertlters jeweils mit anschlieender Binarisierung mit einer
geeigneten Schwelle schliet auch die Lcken. Dieses Verfahren ist aber relativ schwer zu automatisieren,
da immer wieder die Schwelle gefunden werden muss. Knnte aber machbar sein.
So wrde ich es machen: Die Buchstaben vor der Mittelwertbildung separieren. Das kann durch die Nach-
einanderanwendung eines integrierten Spaltenprols (trennt die Zeilen - siehe Abb. 11) und eines inte-
grierten Zeilenprols (trennt die Buchstaben) geschehen. Nach der Mittelwertbildung werden sie wieder
zusammengesetzt, falls das erwnscht ist. In diesem Beispiel wird allerdings auch das T in Abb. 11b zer-
rissen. .
a
b
c
Abbildung 11: Lsung 2: (a) Textbild. (b) und (c): Durch Berechnung des integrierten Spaltenprols und seiner Minima werden
zuerst die Zeilen getrennt, und anschlieend durch Berechnung des integrierten Zeilenprols und seiner Minima die Buchstaben.
Dann kann die Mittelwertbildung in jedem kleinen Bild, das nur jeweils einen Buchstaben enthlt, vorgenommen werden.
Lsung 3
Zu zeigen: g = g
H
g
r
=
g
H
2
g
l
=
2rkg
H
(g
H
f)
f
2
2rk(g
H
f)
g
r
=
2rkg
H
(g
H
f)
f
2
+ 2rk(g
H
f)
Bei der hyperfokalen Distanz g
H
verschwindet der Nenner der ersten Gleichung:
f
2
= 2rk(g
H
f)
In die erste Gleichung eingesetzt:
g
r
=
2rkg
H
(g
H
f)
2rk(g
H
f) + 2rk(g
H
f)
=
g
H
2
Ist der Objektabstand gleich der hyperfokalen Distanz, so betrgt der rechte Anteil der Schrfentiefe g
r
=
g
H
2
.
Lsung 4
a) Ein Echtfarbbild, das mit Hilfe eines Bayerlters aufgenommen wurde hat einen grnen Farbstich,
da ein Bayerlter doppelt so viel grne wie rote bzw. blaue Pixel enthlt.
b)
Rote Komponente eines grnen Pixels: Mittelung der beiden direkten Nachbarn:
45 + 67
2
= 56
Rote Komponente eines blauen Pixels: Mittelung der vier diagonalen Nachbarn
45 + 67 + 78 + 29
4
= 55
Grne Komponente eines blauen Pixels: Nach Gl. (2)
|B
1
B
3
| = |44 34| = 10
|B
2
B
4
| = |20 123| = 103
|B
1
B
3
| < |B
2
B
4
|
G(B)
G
1
+ G
3
2
=
33 + 90
2
= 62
Blaue Komponente eines roten Pixels: Mittelung der vier diagonalen Nachbarn
23 + 44 + 123 + 78
4
= 67
Bild siehe Abb. 12.
Abbildung 12: Lsung 4: Werte der farbigen Punkte

Das könnte Ihnen auch gefallen