Sie sind auf Seite 1von 18

Bildverarbeitungsreferat

Neuronale Netze und Bildverarbeitung

Inhaltsverzeichnis:

1. Einfhrung 2
1.1 Anwendungsgebiete Neuronaler Netze 2
1.2 Beispiele aus der Bildverarbeitung 3
1.2.1 Handschriftenerkennung 3
1.2.2 Gesichtserkennung 3
1.2.3 Datenkompression 4

2. Vorteil der Neuronalen Netze 4

3. Mustererkennung mit Neuronalen Netzen 6


3.1 Vorgehensweise 7
3.2 Das menschliche Auge 7
3.3 Der Bildinhalt und Pixeldichte 8
3.4 Meaufbau zur Mustererkennung 10
3.5 Netztraining 10
3.6 Mustererkennung und Auswertung 11

Literaturverzeichnis 12

Bildverarbeitungsreferat Clemens Meier 17.06.96


Neuronale Netze und Bildverarbeitung 2 Clemens Meier

1. Einfhrung
Die theoretischen Anwendungen Neuronaler Netze auerhalb der Gehirnforschung standen bereits
sehr frh im Interesse der Forschung. Die ersten formalen Modelle (McCulloch-Pitts-Neuronen)
zeigten beispielweise die Mglichkeit auf, beliebig komplexe aussagenlogische Verknpfungen durch
Schaltkreise von einfachen Schwellenwert-Neuronen nachzubilden. Das Perseptron von Rosenblatt
(bestimmte Netzart) demonstrierte, da zumindest einfache geometrische Figuren von Neuronalen
Netzen klassifiziert werden knnen, was die Grundlage der Bildverarbeitung darstellt. Die folgenden
Ausfhrungen konzentrieren sich auf die Auflistung realistischer, praktischer Anwendungen
Neuronaler Netzwerke. Die Erfolge bei der Anwendung Neuronaler Netze in den letzten Jahren
liefert dabei ein Zeugnis fr die Mchtigkeit dieser Technologie.

1.1 Anwendungsgebiete Neuronaler Netze


Es sind heute bereits mehrere Dutzend industrielle Bereiche hinsichtlich ihrer Eignung fr den Einsatz
Neuronaler Netze untersucht worden. Im folgenden sind einige Bereiche beispielhaft aufgefhrt [ 1 ].
Die fr die Bildverarbeitung in Frage kommenden Beispiele sind unterstrichen:

- die Luft- und Raumfahrtechnik (fehlertolerante Systeme, Flugberwachung und Diagnostik,


Autopilot, adaptive Flugsysteme, automatische Fluggerte)

- die Medizin (Auswertung von Langzeit-EKGs, Blutdruckberwachung)

- die Meteorologie (Wettervorhersage, Luftbildauswertung)

- die Autimobilindustrie (akustische Rundlaufdiagnostik von Motoren)

- die produzierende Industrie (Qualittskontrolle, Produktionsoptimierung)

- die Sicherheitstechnik (Sprengstoff-Detektoren, Personenidentifikation)

- das Militr (Objekterkennung, Auswertung von Sonorsignalen)

- die Kommunikationstechnik (Rauschunterdrckung, Echounterdrckung, Signalfilter,


Datenkompression zur Beschleunigung der Datenbertragung, Spracherkennung und
Sprachgenerierung)

- Banken und Versichrungen (Aktienkursprognosen, Kreditrisikoabschtzungen, Risiko-


bewertung von Versicherungen, Datenanalysen, Unterschriftenerkennung)

- die Post (Handschriftenerkennung, Postleitzahlenlesegert)

- die Werbung (Adressatenauswahl fr Serienbriefe)


Neuronale Netze und Bildverarbeitung 3 Clemens Meier

Die hier aufgefhrten Beispiele von Anwendungen Neuronaler Netzwerke zeigen, wozu diese
Technik potentiell in der Lage ist. Aus einigen industriellen Bereichen, z.B aus der
Automationsindustrie mit ihren Industrierobotern oder der Steuer- und Regelungstechnik werden
zuknftig Neuronale Netze nicht mehr wegzudenken sein.
Neuronale Netze und Bildverarbeitung 4 Clemens Meier

1.2 Beispiele aus der Bildverarbeitung mit Hilfe Neuronaler Netze


1.2.1 Handschriftenerkennung [ 1 ]:

In vielen industriellen Anwendungen wre es hilfreich, Handschriften maschinell lesen und auswerten
zu knnen. Dieses Problem ist aber wegen der groen Abweichungen zwischen unterschiedlichen
Handschriften uerst schwierig und mit konventionellen Methoden praktisch nicht zu lsen.
Der Nobelpreistrger Leon Cooper hat zu diesem Zweck ein Netzwerkmodell entwickelt, mit dem
es mglich ist, beliebige geometrische Figuren, also auch handgeschriebene Texte, mit hoher
Genauigkeit zu klassifizieren. Auf dieser Basis wurde ein Handschriftenerkennungssystem fr die
japanische Wortschrift Kanji entwickelt. Die Benutzer des Systems knnen mittels eines an einen
Computer angeschlossenen Schreibgertes handschriftliche Zeichen in Kanji eingeben und bentigen
keine Tastatur; das wre fr die ca. 3000 Symbole dieser japanischen Schriftart auch kaum mglich.
Von Fukushima entwickelte spezielle Netzwerkmodelle sind darber hinaus sogar in der Lage,
Schriftsymbole zu erkennen, die verzerrt sind oder hinsichtlich ihrer blichen Ausrichtung verdreht
wurden. Solche Probleme sind konventionell nur mit Hilfe komplizierter mathematischer Fuktionen
(z.B. Fourier-Transformation) nherungsweise lsbar. Das Neuronale Netz hingegen entwickelt die
ntigen Transformationen fr die interne Reprsentation praktisch selbstndig.

1.2.2 Gesichtserkennung [ 2 ]:

Gesichter sind faszinierende Beispiele fr das menschliche Wahrnehmungsvermgen und seine


Leistungsfhigkeit. Der Europer, der z.B. das erste mal nach Afrika oder Asien fhrt, hat zunchst
Schwierigkeiten, Individuen dieser Lnder voneinander zu unterscheiden (Gesichtszge). Erst nach
lngerem Aufenthalt ist er in der Lage, individuelle Zge zu erkennen. In Bild 1 ist der
Gesichtserkennungsproze in 4 Stufen unterteilt:
Original Modell Regeln Ergebnisfindung

Bild 1 [ 2 ]
Neuronale Netze und Bildverarbeitung 5 Clemens Meier

Zunchst mu ein Modellbild entwickelt werden, das gewisse Merkmale (Eigenschaften) festlegt und
mit dem das Original verglichen werden kann. Unter Beachtung von Regeln gelangt man zu einem
Ergebnis bzw eine Entscheidung wird gefllt. Diese Regeln kann das System erlernen und ist damit
anpassungsfhig.
Dies kann auch mit normalen Netzwerken realisiert werden, allerdings wird der Proze dabei sehr
zeitaufwendig und je mehr Regeln vorliegen, desto lnger dauert lnger dauert es, bis ein Ergebnis
vorliegt.

1.2.3 Datenkompression [ 1 ]:

Versucht man Bilder (oder Sprachsignale) ber Leitungen mit geringer Bandbreite in Realzeit zu
bertragen, so stt man auf das Problem der Datenkompression. Um die bertragung zu
beschleunigen ist es meist erforderlich, die Daten so zu komprimieren, da einerseits die bertragung
schnell genug durchgefhrt werden kann, da andererseits aber durch die Kompression der Daten
keine relevanten Informationen verlorengehen.
Cottrell und Zipser von der Universitt in San Diego und Munro von der Universitt Pittsburgh haben
Neuronale Netzwerke erfolgreich fr solche Datenkompressionen eingesetzt. Die drei Forscher
haben ein selbstorganisierendes dreilagiges Netzwerk entwickelt, das digitalisierte Bilder in ihren
verschiedenen Graustufen um den Faktor 8 komprimiert (d.h. es wird nur 1/8 der Daten bertragen),
aber dennoch mit hoher Detailtreue nach der bertragung wieder regeneriert. Fr solche
Anwendungen eignen sich insbesondere auch Counterpropagation Netzwerke (Neuronale Netzart).

2. Vorteil der Neuronalen Netze


Die Frage der zuknftigen Entwicklung der industriellen Bildverarbeitung lt sich anhand des Bildes
2 beantworten. Es ist nmlich zu klren, an welchen Stellen nderungen und Verbesserungen
notwendig sind. [ 2 ]

Bild 2 [ 2 ]
Neuronale Netze und Bildverarbeitung 6 Clemens Meier

Da dies nicht eindeutig mglich ist, wird klar, wenn man die unterschiedlichen Aufgabenstellungen
und Zielvorgaben bercksichtigt, die sich durch die unterschiedlichen
Neuronale Netze und Bildverarbeitung 7 Clemens Meier

Anwendungen ergeben. Diese Anforderungen sind sind hufig:

- hhere Verarbeitungsgeschwindigkeit
- effizientere Auswertung
- einfachere Bedienbarkeit

Die Neuronalen Netze haben dabei deutliche Vorteile in den Teileinheiten Bildbearbeitung und
Bildauswertung (siehe Bild 2).

Im Gegensatz zu anderen Systemen beziehen Neuronale Netzwerke ihre Eigenschaften aus der
hohen Anzahl rechnender bzw. schaltender Elemente (Neuronen) und der zwischen ihnen
aufgebauten dynamischen Kopplung (Synapsen). Es ist verblffend, wie selbst einfache Lebewesen
mit erstaunlichen Leistungsmerkmalen aufwarten knnen, die sie ber Neuronale Netzwerke erzielen.
Netzwerke die Eigenschaften wie Lernen anhand von Beispielen, assoziative inhaltsadressierte
Verknpfung von Informationen (Wissen) und hochparallele Verarbeitung besitzen. Diese
Eigenschaften fhren dazu, da trotz langsam rechnender bzw. schaltender Einheiten (Prozessoren)
hohe Verarbeitungszeiten erzielt werden, verbunden mit einer fehler- und strungstoleranten
Auswertung von Informationen. Selbst der Ausfall einzelner Bereiche des Netzwerkes kann durch
Nachbarbereiche ausgeglichen werden. Neue Aufgabenstellungen sind trainierbar, so da durch
entsprechende Lernvorgnge das System sich anpat und Lsungen bereitstellt. Nicht geforderte
Leistungen fallen dem Vergessen zum Opfer.

Die Eigenschaften

- hohe Verarbeitungsgeschwindigkeit
- Fehler- und Strungstoleranz
- Anpassung an neue Aufgabenstellungen durch Lernen und Umprogrammieren

lassen die Neuronalen Netze gerade fr die Mustererkennung bzw. Bildverarbeitung interessant
werden. Diese Eigenschaften bringen, wie oben schon einmal erwhnt, groe Verbesserungen in den
Teilbereichen Bildbearbeitung und Bildauswertung der Bildverarbeitung gegenber den bisherigen
Systemen.
Neuronale Netze und Bildverarbeitung 8 Clemens Meier

3. Mustererkennung mit Neuronalen Netzen


Das nun folgende konkrete Anwendungsbeispiel der Bildverarbeitung mit Hilfe Neuronaler Netze
entstammt einer Diplomarbeit. [ 3 ]
Es sollte die Punkmatrixschrift auf Blisterpackungen fr Medikamente gelesen werden. Bild 3 zeigt
eine solche Blisterverpackung mit dem betreffenden Schriftbild.

Bild 3 [ 3 ]

Dies wurde jedoch durch verschiedene Eigenschaften der Verpackung erschwert. Zum einen waren
die Blister aus einer silbern glnzenden Folie hergestellt, was unerwnschte Reflexionen verursachte.
Zum anderen war die Punktmatrixschrift teiweise stark verzerrt und verwischt. Um eine solche
Schrift zu erkennen bedarf es also eines fehlertoleranten Erkennungssystems. Weitere Forderungen
wurden an die Geschwindigkeit des Systems gestellt. Eine Lsung dieser Aufgabe mit einem
konventionellen Bildverarbeitungssystem wurde in Betracht gezogen, jedoch besitzt ein solches
System eine vom zu bearbeitenden Bild abhngige Bearbeitungszeit (s.o.), ist ohne grere
nderungen nur fr diese spezielle Aufgabe einsetzbar und kann auch nur von speziell ausgebildetem
Personal eingesetzt und bedient werden. Darum wurde versucht, ein knstliches Neuronales Netz zur
Erkennung einzusetzen. Ein Neuronales Netz besitzt von Natur aus eine Fehlertoleranz und ist durch
seine parallele Struktur theoretisch auch schneller als andere Verfahren. Man mu ein solches
System nicht mhsam von Hand programmieren, sondern es wird auf die Lsung des Problems
hintrainiert. Dies bedeutet, da es auch keines speziell ausgebildeten und hochqualifizierten Personals
mehr bedarf, um im industriellen Einsatz solch eine Anlage zu betreiben, was somit die Gesamtkosten
in einem Produktionsablauf senkt. Die betreffende Person mu lediglich wissen, wie die Anlage
trainiert wird und worauf dabei zu achten ist. Der Aufbau des Systems selbst ist nach auen hin vllig
unsichtbar. Das System wird in der Trainingsphase mit verschiedenen Eingabemustern beaufschlagt
und so lange trainiert, bis das geforderte Ergebnis vom Netz erzeugt wird. Dieses Prinzip ist damit
sehr vielseitig, was die allgemeinen Einsatzmglichkeiten betrifft. Das Ziel ist nun, mit einem
Neuronalen Netz zu versuchen, antrainierte aiphanumerische Zeichen wiederzuerkennen, wenn diese
auch nicht mehr ganz dieselbe Bildqualitt, Form und Position wie in der antrainierten
Trainingsvorlage besitzen.
Neuronale Netze und Bildverarbeitung 9 Clemens Meier

3.1 Vorgehensweise
1. Untersuchung der in der Literatur aufgefhrten Netztypen auf die Eignung fr die gestellte
Aufgabe. Dies bedeutet eine Beurteilung folgender Eigenschaften:

- Verarbeitungsgeschwindigkeit
- Handhabung und Konfiguration
- Modifikation des bereits trainierten Netzes, ohne sein Wissen zu zerstren

2. Auswahl eines Netzes und Realisierung in einem Testprogramm

Das Netz, das die Anforderungen am besten erfllt, soll in einem Programm realisiert werden. Dies
soll ein kleines System werden, welches es erlaubt, das Netz manuell sowie automatisch zu trainieren
und die gespeicherten Ergebnisse einer spteren Auswertung unterziehen zu knnen. Die endgltige
Wahl viel auf eine Kombination aus den beiden Netztypen Grow And Learn (GAL) und das Modell
von Reilly und Cooper ( siehe Referat Verschiedene Typen Neuronaler Netze). Diese beiden
Typen boten die idealen Eigenschaften:

- die Funktionsweise ist einfach und bersichtlich


- der Trainingsalgorithmus ist einfach und das Training relativ schnell
- die Netzgre ist whrend des Trainings anpabar
- die Grundstruktur bietet gute Mglichkeiten das Netz als Schaltung aufzubauen
- der Speicherbedarf ist gering gegenber anderen Netzen

3. Training des Netzes und Auswertung der Erkennungsergebnisse

Das Netz soll zunchst nicht mit den Aufdrucken der Blisterverpackung getestet werden, sondern mit
sauberen Zeichen die mit Hilfe eines Druckers erzeugt wurden. Dies ist erforderlich, damit das
Netz eine genau definierte Eingabe erhlt, um somit einen besseren berblick ber die Eigenschaften
und das Verhalten des Netzes zu bekommen. Die Erkennungsergebnisse sollen Aufschlu ber die
Effizienz des Netzes geben und Mglichkeiten zur Verbesserung aufzeigen.

3.2 Das menschliche Auge


Da wir uns mit der Anwendung Neuronaler Netze in der Bildverarbeitung befassen, soll zunchst
kurz das menschliche Auge betrachtet werden. (Bild 4 und Bild 5)
Neuronale Netze und Bildverarbeitung 10 Clemens Meier

Bild 4 [ 3 ]

Bild 5 [ 3 ]

In Bild 4 wird verdeutlicht, da die Stbchen bzw. Zpchen nicht gleichmig ber die ganze
Netzhaut verteilt sind, sondern an den Rndern eine relativ geringe Dichte aufweisen, whrend die
Dichte der Stbchen in der Mitte extrem hoch ist. Diesen Punkt der hchsten Dichte wird Sehgrube
oder Fovea genannt. Wird ein Buchstabe gelesen, so befindet sich sein Abbild genau in dieser
Sehgrube, was bedeutet, da dieser sehr hoch aufgelst wird gegenber dem Abbildungen auf der
restlichen Netzhaut. Eine Buchstaben- oder allgemein eine Mustererkennung findet nur in diesem
Bereich statt. Fr uns bedeutet das, da das zu erkennende Objekt, in diesem Fall das Abbild des
Buchstabens, das Bildfeld, welches bearbeitet wird, so gut als mglich ausfllen mu.

3.3 Der Bildinhalt als Punkt im Raum und die Pixeldichte


Ein Bild besteht bekanntlich aus einzelnen Bildpunkten, sog. Pixel. Bei der Bearbeitung eines Bildes
besitzt der Raum folglich so viele Dimensionen, wie das Bild Bildpunkte hat. Der Inhalt des Bildes
stellt in diesem n-dimensionalen Raum einen Punkt dar, der spezifisch fr den Bildinhalt ist. Diese
Punkt kann als Vektor aufgefat werden, wie unten dargestellt

Vektor B = ( p(1,1), ...,p(B,1), ...,p(1,H), ...,p(B,H) )

B ist die Anzahl der Bildpunkte in horizontaler Richtung, also die Breite des Bildes und H die Anzahl
der Bildpunkte in vertikaler Richtung, also die Hhe des Bildes. Jeder Bildpunkt p(b,h) ist eine
Komponente des Vektors, was gleichzusetzen ist mit einer Dimension im Raum. Je nher sich zwei
Vektoren von zwei Bildern in diesem Raum sind, d.h. je geringer die Distanz der beiden betreffenden
Vektoren ist, desto hnlicher sind sich auch die beiden Bilder. Besitzt jedoch z.B. ein Buchstabe
durch die Verwendung unterschiedlicher Schrifttypen mehrere Darstellungsweisen, so entstehen in
einem solchen Netz fr einen Buchstaben mehrere Neuronen.

Die Binrbilder aller Zeichen haben die Gemeinsamkeit, da die gesetzten Pixel in der Mitte des
Bildfeldes wesentlich dichter sind als an den Rndern. Diese Daten mitzuverarbeiten, in Form eines
zustzlichen an den Bildvektor angehngten Teil erscheint sinnvoll. Dieser Vektor, bzw. Teil eines
Neuronale Netze und Bildverarbeitung 11 Clemens Meier

Vektors, kann als Pixeldichte oder einfach Dichtevektor bezeichnet werden. Bild 6 stellt den
Unterschied am Beispiel von zwei Zeichen dar, bei dem sogar ein Vektorabschnitt sehr starke
hnlichkeiten aufweist, der andere jedoch weniger Gemeinsamkeiten hat, was im Vektorraum auf
einen groen Abstand hindeutet.
Neuronale Netze und Bildverarbeitung 12 Clemens Meier

Bild 6 [ 3 ]

Der Positionsvektor besitzt B+H Komponenten. Jede Komponente besitzt als Wert die Anzahl der
gesetzten Pixel der ihr zugeordneten Bildzeile bzw. Bildspalte.

Komponenten des Spaltenanteils: (Der Wert der Komponente entspricht der Anzahl der gesetzten
Pixel pro Spalte; p(b,i): Pixel im Schnittpunkt der Spalte b und der Zeile i)

H
sb = i=1
p ( b ,i )

Komponenten des Zeilenanteils: (Der Wert der Komponente entspricht der Anzahl der gesetzten
Pixel pro Zeile; p(j,h): Pixel im Schnittpunkt der Spalte j und der Zeile h)

B
zh = j= 1
p ( j ,h )

Hierraus wird nun der Positionsvektor gebildet.

Vektor P = (s 0 , ... , sb , ... , sB , z0 , ... , zh , ... , zH)

Bei der Netzerregung werden die Distanzen der Bild- und der Positionsvektoren zu einer Distanz
zusammenaddiert.

d ges = d Bild + d Position

Auf diese Distanz wird nun das WTA-AR-Prinzip (Winner Take All - Aktionsradius - Prinzip)
angewandt, um so ein eindeutiges Ergebnis zu erhalten.
Neuronale Netze und Bildverarbeitung 13 Clemens Meier

yi = 1 wenn di = minimal
yi = 0 sonst
Neuronale Netze und Bildverarbeitung 14 Clemens Meier

3.4 Meaufbau zur Mustererkennung


Um nun das Netz mit einer Vorlage testen zu knnen, wurde eine Kamera als bildgebendes Element
eingesetzt. Ein Verschiebetisch ermglichte es, die Kamera automatisch, beim Training sowie der
Wiedererkennung, ber die Muster hinwegzubewegen. Als Muster waren zunchst nicht die
Schriftproben der Blisterverpackungen vorgesehen, sondern das Alphabet in Grobuchstaben, sowie
die Zahlen 0...9. Die Verwendung dieser idealen Muster war notwendig, um eine Aussage ber die
Qualitt der Erkennung zu erhalten. Die Aufdrucke der Blisterverpackungen sind fr eine
Auswertung der Netzgte zu schlecht, und zudem sind die Verpackungen aufgrund ihrer Form fr
das automatische Training sowie Erkennung, ungeeignet. Der Meaufbau ist in Bild 7 dargestellt.

Bild 7 [ 3 ]

Bei der Erfassung von Mustern mit eine Kamera gibt es drei Gren, die das Kamerabild stark
beeinflussen. Dies sind:

- Fokussierung
- Beleuchtung
- Position des Musters innerhalb des Bildfeldes

Die Fokussierung wurde ber den Kontrollmonitor auf das Optimum eingestellt. Die beiden anderen
Einflsse wurden whrend der Testphase verndert, um ihren Einflu auf das Ergebnis testen zu
knnen. Um das Zeichen mglichst ideal im Bildfeld zu positionieren wurde ein Eingabefenster von
34*38 = 1292 Pixeln darbergelegt.

3.5 Netztraining
Bei der Erkennung der Muster sollen die zuvor erwhnten Gren bercksichtigt werden, um die
Abhngigkeit der Ergebnisse hiervon untersuchen zu knnen. Deshalb wurde ein Trainingsprogramm
entworfen, das diese Gren mit einbezieht. Das Training wurde mittels des bereits erwhnten
Teststreifens durchgefhrt, dessen Aufbau Bild 8 zeigt. Der Aufbau besteht aus zwei Teilen:

- das zu verarbeitende Muster


Neuronale Netze und Bildverarbeitung 15 Clemens Meier

- die Klasse, der das Muster beim Training zuzuordnen ist

Bild 8 [ 3 ]

Bei der Einstellung des Systems mute das Eingabefenster ber das alphanummerische Zeichen und
die Datenbitfenster ber die daneben befindlichen schwarzen und weien Quadrate positioniert
werden. Diese schwarzen und weien Flchen stellen direkt die Klasse dar, deren Nummer dem
ASCII-Code des zu erkennenden Zeichens entspricht. Der schwarze Strich neben dem Code stellt
die Auslsemarke fr den Trainingszyklus dar. Der Algorithmus bewegt den Schlitten immer in
0.25mm- Schritten ber den Streifen. Danach wird das Auslsefenster eingelesen und das Netz wird
mit dem Muster auf die gewnschte Klasse antrainiert.
Das Training der Netze untergliederte sich bedingt durch die beiden einflunehmenden Gren in 4
Phasen, wobei jedes Muster doppelt eingelesen wurde.
Bei den verschiedenen Einflukombinationen konnten verschiedene Trainingsfehler beobachtet
werden, auf die ich aber nicht nher eingehen kann.

3.6 Mustererkennung und Ergebnisauswertung


Beim Erkennungsvorgang fhrte man die Kamera bzw. das Eingabebildfenster fnfmal mittig ber alle
36 Muster (0...9, A...Z), wobei die Fokussierung und die Positionierung wieder variiert wurden, um
wiederum deren Einflu auf das Ergebnis beobachten zu knnen. Alle 0.25mm wurde ein Bild
eingelesen und das Netz damit erregt. Auer die Ergebnisse am Bildschirm anzuzeigen, wurden sie in
Neuronale Netze und Bildverarbeitung 16 Clemens Meier

einer Ergebnisdatei abgelegt. Durch die verschieden Trainingseinflsse entstanden so 56


Ergebnisdateien.
Neuronale Netze und Bildverarbeitung 17 Clemens Meier

Es wurden folgende Ergebnisse unterschieden:

- das Muster wurde der richtigen antrainierten Klasse zugeordnet

- das Muster wurde der falschen Klasse zugeordnet obwohl das Muster beim Training
der richtigen Klasse zugewiesen wurde

- das Muster wurde einer falsch antrainierten Klasse zugeordnet

- alle Muster wurden nur einer Klasse zugeordnet, d.h. die Trainingseinflsse (s.o.)
waren zu schlecht um die Muster voneinander unterscheiden zu knnen

Bei denjenigen Trainings- und Erkennungsphasen, bei denen nur die Fokussierung, nicht aber die
Positionierung verndert wurde besitzen eine hohe Erkennungsrate. Das Muster wurde am besten
klassifiziert. Bei der Positionierung des Objektes am linken oder rechten Bildrand traten erhebliche
Klassifizierungsprobleme auf. Bei falschen Klassifizierungen wurden oft Zeichen erkannt, die ein
hnliches Aussehen haben. Hierzu zhlen beispielsweise die Zeichen 1 und I, die Zeichen E, F und P,
die Zeichen K und R und die Zeichen 0, O, Q, und C.

Bei einem einfachen Versuch, die Zeichen auf den Blisterverpackungen zu erkennen, versagte das
System vollstndig. Alleine schon die optischen Anforderungen konnten nicht erbracht werden. Die
Reflexionen waren zu stark und eine Positionierung der Zeichen im Bildfeld aufgrund der extermen
Welligkeit der Folie fast unmglich. Zudem haben die Zeichen ein anderes Schriftbild und sind kleiner
als die antrainierten Muster.

Grundstzlich ist der Einsatz eines solchen Netzes unter gnstigen und konstanten Einflubedingungen
aber durchaus denkbar.
Desweiteren bestehen noch einige Verbesserungsmglichkeiten, auf die ich hier nicht nher eingehen
kann.

Literaturverzeichnis:

[ 1 ] Neuronale Netzwerke
Eberhard Schneburg und Nikolaus Hansen und Andreas Gawelczyk
Markt&Technik Verlag

[ 2 ] Industrielle Bildverarbeitung
Rolf-Jrgen Ahlers und Hans Jrgen Warnecke
Addison-Wesley Publishing Company
Neuronale Netze und Bildverarbeitung 18 Clemens Meier

[ 3 ] Diplomarbeit, Mustererkennung mit Neuronalen Netzen


Siegfried Hoch, FHO
IMT-Ullwer GmbH, Heitersheim