Beruflich Dokumente
Kultur Dokumente
Wahrnehmungspsychologie
Herbstsemester 2013
Folien zur Vorlesung
Schwaninger (1998)
Schwaninger (2005c)
Prof. Dr. Adrian Schwaninger 13
Dolch 29 cm
Schwaninger (2005c)
Prof. Dr. Adrian Schwaninger 15
H
a
m
m
e
r
Frazer Spirale
(aus Ditzinger, 2006)
Prof. Dr. Adrian Schwaninger www.psychologie.uzh.ch/vicoreg 26
Subjektivierende und objektivierende Perspektive
Die Messwerte
basieren auf
Weber (1835).
R R = 10g R R = 20g
R 10 1 R 20 1
R 400 40 R 800 40
R
const.
R Nach Goldstein (1997)
Reiz Nervensystem
Physik Physiologie
Sinnesphysiologie
(arithmetische Reihe)
Fechnergesetz
Empfindung E
E = K * lnR + C
Empfindungsstärke
Stevensgesetz
E = K*Rn
Reizintensität
Prof. Dr. Adrian Schwaninger 44
Vorlesung 2
Erkennungsrate in % (Ja-Reaktionen)
Abbildung) entspricht nicht dem Verlauf
theoretischen Verlauf (blau in der
Abbildung).
Gründe: Aufmerksamkeits-
schwankungen, Müdigkeit,
sensorische Adaptation (siehe
später), Fehlalarme (siehe später Empirischer
Theorie der Signaldetektion), Verlauf
Fluktuation des Reizes, etc.
Oft wird die absolute Schwelle
daher definiert als Mindest-
stimulation, die erforderlich ist, um
einen bestimmten Reiz in
mindestens 50% der Fälle
wahrzunehmen.
Lichtintensität 0.08
Lautstärke 0.04
Angehobenes
0.025
Gewicht
Elektroschock 0.01
Erkennungsrate in % (Ja-Reaktionen)
Abbildung) entspricht nicht dem Verlauf
theoretischen Verlauf (blau in der
Abbildung).
Gründe: Aufmerksamkeits-
schwankungen, Müdigkeit,
sensorische Adaptation (siehe
später), Fehlalarme (siehe später Empirischer
Theorie der Signaldetektion), Verlauf
Fluktuation des Reizes, etc.
Oft wird die Unterschiedsschwelle
daher definiert als minimaler
Unterschied zwischen zwei Reizen,
der erforderlich ist, damit er in 50%
Unterschieds-
der Fälle erkannt wird. kleiner grösser
schwelle
Korrekte
Antwort „OK“ Zurückweisung Verpasser (Miss)
(Correct Rejection )
Antwort „NICHT Fehlalarm (False
Treffer (Hit)
OK“ Alarm)
liberal
99% 1% 4.65
C
Trefferrate (TR)
Kriterium
neutral
90% 78% 0.51
konservativ
70% 70% 0.00
Ziliarmuskel
Zonulafasern
Lichtenergie
Demonstration
Bleistift mit der Spitze nach oben am
ausgestreckten Arm halten und ein weit
Enfternte Objekte (mind. 6 Meter) entferntes Objekt
scharf, nahe fixieren. Der Bleistift erscheint unscharf.
Objekte unscharf Dann den Bleistift fixieren. Das
entfernte Objekt erscheint unscharf.
(Aus Goldstein, 2008)
Prof. Dr. Adrian Schwaninger 71
Akkomodation
Wellenlänge in Nanometer
Prof. Dr. Adrian Schwaninger 74
(ca. 6 mio)
amakrine
Zelle
(ca. 1 mio),
Zapfen Stäbchen
Anzahl 6 Mio 120 Mio
Stäbchen
Viele Stäbchen
Verbindungen Oft 1:1
auf eine
zum Gehirn Übertragung
Bipolarzelle
Detailliertes Sehen bei wenig
Funktion Tagessehen und Licht, kein
Zapfen Farbensehen Farbensehen
Lage auf der
Zentrum (Fovea) Peripherie
Netzhaut
Zapfen und Stäbchen unter Das Farbensehen ist bei wenig Licht beeinträchtigt, weil
dem Elektronenmikroskop dann nur Stäbchen arbeiten, welche nicht
farbempfindlich sind.
Prof. Dr. Adrian Schwaninger 76
Dunkeladaptation
Kommt man in einen dunklen Raum (z.B. Theater
oder Kinobesuch) oder macht das Licht in einem
Zimmer aus, dann weiten sich sofort die Pupillen, um
mehr Licht in die Peripherie des Auges zu lassen (wo
die Stäbchen sind).
Nach ca. 5 min übernehmen die Stäbchen das Sehen
und ihre maximale Lichtempfindlichkeit ist nach ca. 20
min erreicht (dies entspricht der durchschnittlichen
Dauer der Dämmerung, d.h. dem Übergang zwischen
Sonnenuntergang und Nacht).
Demonstration zum ausprobieren:
1. Rechtes Auge abdecken, 20 min warten.
2. Zimmerbeleuchtung so stark verdunkeln, dass man
mit dem offenen Auge ein Buch noch knapp lesen
kann.
3. Rechtes Auge öffnen -> mit diesem Auge kann man
das Buch perfekt lesen.
Prof. Dr. Adrian Schwaninger 77
Unterschiede zwischen den Spezies
Weshalb sieht eine Katze nachts viel besser
als ein Mensch? Mindestens aus 2 Gründen:
Sie kann die Pupillen weiter öffnen und
mehr Licht hereinlassen.
Sie hat einen höheren Anteil an
lichtempfindlichen Stäbchen.
Nachteil: Da die Katze nur wenig Zapfen hat,
kann sie weder Einzelheiten noch Farben so
gut sehen wie wir.
Manche Nachttiere wie Kröten, Mäuse,
Ratten und Fledermäuse besitzen eine
Retina, die fast völlig aus Stäbchen besteht.
Deshalb sehen sie auch bei schwachem
Licht noch sehr gut. Allerdings sehen diese
Tiere wahrscheinlich nur sehr wenig Farben,
da ihnen die Zapfen in der Retina fehlen.
Sehnerven-
Retina kreuzung
(Chiasma opticum)
Colliculus Tractus
superior opticus
Radiatio
Sehzentrum des optica
Thalamus (Corpus
geniculatum laterale,
CGL)
Sehrinde (= striärer Cortex oder
(Nach Frisby, 1979) primärer visueller Cortex, V1)
Prof. Dr. Adrian Schwaninger 80
Rezeptive Felder (RF)
Durch die Verschaltung der retinalen Zellen entstehen rezeptive Felder. Als
rezeptives Feld wird derjenige Bereich der Netzhaut bezeichnet, von dem aus die
Aktivität einer Zelle beeinflusst werden kann. Auf der Netzhaut entspricht das der
Photorezeptorenfläche, die mit der Zelle verbunden ist.
Die rezeptiven Felder der Ganglienzellen bestehen aus einem Zentrum und einem
Umfeld.
Im primären visuellen Cortex (V1) findet man Neurone (Nervenzellen) mit
Orientierungsspezifität (Antwort der Zellen auf Lichtbalken einer bestimmten
Orientierung).
Zellantwort
Reiz
Aus http://thebrain.mcgill.ca
Prof. Dr. Adrian Schwaninger 85
Parallelverarbeitung von Farbe,
Bewegung, Form und Tiefe
Colliculus ITC
Superior (CS)
Prof. Dr. Adrian Schwaninger (Aus Eysel, 2006) 86
Parallelverarbeitung von Bewegung,
Farbe, Form, Position und Tiefe
Parallelverarbeitung ist die natürliche Methode der Informationsverarbeitung im Gehirn; mit
ihrer Hilfe kann man viele Aspekte eines Problems gleichzeitig angehen.
Die Fähigkeit des Gehirns, mehrere Aufgaben gleichzeitig auszuführen, ermöglicht es ihm,
Unterdimensionen des Sehens (Bewegung, Farbe, Form, Position und Tiefe) auf
unterschiedliche neuronale Teams zu verteilen, die getrennt voneinander und gleichzeitig
arbeiten.
Andere neuronale Teams arbeiten dabei zusammen, um die Ergebnisse zusammenzuführen, sie
mit gespeicherten Informationen zu vergleichen und Wahrnehmungen zu ermöglichen.
Colliculus ITC
Superior (CS)
Prof. Dr. Adrian Schwaninger (Aus Eysel, 2006) 97
Dorsaler und ventraler Strom
Objektunterscheidungsaufgabe Ortsunterscheidungsaufgabe
(Nach Goldstein, 2008)
Prof. Dr. Adrian Schwaninger 99
Prof. Dr. Adrian Schwaninger Bild: Anne Seeger ZHdK 2009 100
Befunde beim Menschen
c
Befunde mit funktioneller
Magnetresonanztomographie
(functional magnetic
resonance tomography ,
fMRT) beim Menschen.
Häuser, Stühle und
Gesichter scheinen
unterschiedliche Module im
Gehirn zu aktivieren (a und
b). Eine detailliertere Analyse
spricht aber eher für eine
Repräsentation anhand von
Merkmalskarten und
verteilter Aktivität (c).
Utriculus
Sacculus
Somatosensorischer
Cortex S1 und S2
(Temperatur
& Schmerz)
Wenn die Versuchsleiterin gleichzeitig die wirkliche und die nachgebaute Hand
einer Versuchsteilnehmerin berührt, hat diese das Gefühl, als wäre die sichtbare
nachgebaute Hand ihre eigene. Dies zeigt, dass Top-Down Effekte auch beim
Tastsinn vorkommen.
Prof. Dr. Adrian Schwaninger 146
Schmerzwahrnehmung
Gate-Control-Theorie: Diese Theorie besagt, dass das Rückenmark über ein
neurologisches »Tor« (»gate«) verfügt, das Schmerzsignale aufhält oder zum Gehirn
durchlässt. Das »Tor« wird geöffnet durch die Aktivität von Schmerzsignalen, die über
feine Nervenfasern nach oben steigen, und geschlossen durch die Aktivität in dickeren
Fasern oder durch vom Gehirn kommende Informationen.
Beeinflussung durch die Aktivität in dickeren Fasern, Beispiele:
Behandlung von chronischen Schmerzen durch Stimulation der dickeren Fasern
(Massage, elektrische Stimulation, Akkupunktur).
Reiben der Umgebung der Zehe, welche man angestossen hat, führt zu einer
konkurrierenden Stimulation, die einen Teil der Schmerzsignale blockiert.
Beeinflussung durch vom Gehirn kommende Informationen, Beispiele:
Endorphinausschüttung: Es kann z.B. bei Sportverletzungen vorkommen, dass sie bis
zur Dusche nach dem Spiel unbemerkt bleiben.
Soziale Einflüsse: In den 80er Jahren litten plötzlich ganze Gruppen von
Sekretärinnen in Australien unter starken Schmerzen beim Schreibmaschineschreiben
oder anderen sich ständig wiederholenden Arbeiten.
151
(Aus Goldstein, 2008)
152
Wissenswertes zum Geschmackssinn
Geschmacksrezeptoren erneuern sich alle 1-2 Wochen. Wenn Sie also mit heissem Essen
Ihre Zunge verbrennen, dann ist das nicht so schlimm.
Mit dem Alter nehmen die Anzahl der Geschmacksknospen und die
Geschmacksempfindung ab. Deshalb ist es nicht überraschend, dass Erwachsene gerne
kräftig schmeckende Speisen zu sich nehmen, die Kinder nicht so gerne mögen.
Rauchen und Alkohol beschleunigen die Verringerung der Geschmacksknospen und ihre
Sensibilität.
Unsere emotionalen Reaktionen auf Geschmack sind grösstenteils genetisch determiniert
(ähnliche Reaktionen von Zunge und Gehirn auf süsse oder bittere Substanzen bei
Neugeborenen wie bei Erwachsenen).
Menschen ohne Zunge können trotzdem schmecken, und zwar über Rezeptoren im
Rachenbereich und am Gaumen.
Wenn Sie die Geschmacksempfindung auf einer Seite der Zunge verlieren, merken Sie es
wahrscheinlich gar nicht. Denn die andere Zungenseite wird daraufhin entsprechend
sensibler. Hinzu kommt, dass das Gehirn der Ort des Geschmackes auf der Zunge nicht
gut lokalisieren kann. Obwohl sich in der Mitte der Zunge nur wenige
Geschmacksrezeptoren befinden, nehmen wir Geschmack wahr, als würde er von der
gesamten Zunge aufgenommen.
Nächste Folie
hinten
Prof. Dr. Adrian Schwaninger Bild: Anna Schmocker, ZHdK 2009 171
Gruppierung von Reizen
Wir bringen Ordnung und Form in die Welt der Reize, indem wir die Reize in
sinnvollen Gruppierungen organisieren und dabei den Gesetzen der Nähe, der
Ähnlichkeit, der Kontinuität, des Zusammenhangs und der Geschlossenheit
folgen.
Beispiel: „Neonwurm“
Nachthimmel
Taghimmel Nachthimmel
LN MO MS
OO OS SE
0.85
0.80
0.75
0.70
0.65
0.60
0.55
0.50
GR LH LL LN MO MS OO OR OS SE
Nach Michel et al. (2007)
Prof. Dr. Adrian Schwaninger 226
Beispiel für Wahrnehmung und Faktor Mensch
Zukünftige Astronauten, welche zum
Mars fliegen werden, werden sich
lange Monate in einer Umgebung
aufhalten müssen, die von
Monotonie, Stress und
Schwerelosigkeit gekennzeichnet ist.
Für den Entwurf und die Bewertung
einer für den Menschen passenden
Umgebung, wie bei diesem „Transit-
Habitation“ (Transhab-)Modul,
bedient sich die NASA der Hilfe von
Arbeitspsychologen (in den USA:
Human Factors-Psychologen).
Aus Gazzaniga et al. (2002)
„Löwe“
„gefährlich“
Erkennung Identifikation
Input Repräsentation Höhere Verarbeitung
Organismus
Stimuli Reaktionen
Umwelt
© Prof. Dr. Adrian Schwaninger 234
Funktionale Ebene
Das Überleben eines Organismus in der Evolution ist abhängig von:
Adäquater Repräsentation der Umwelt
Visuelles und assoziatives Gedächtnis (für Erkennung und Identifikation)
Effiziente motorische Programme (Verhalten)
Angemessene Auswahl der Information (Aufmerksamkeit)
Auswahl (Selektion) von Information:
Bottom-Up Selektion (präattentiv)
Steuerung der Aufmerksamkeit aufgrund salienter (auffälliger)
Stimulusmerkmale.
Top-Down Selektion (attentiv)
Steuerung der Aufmerksamkeit durch Bedürfnisse, Motivation, “Willen”,
“Bewusstsein”.
Aufmerksamkeit als Selektion der zu verarbeitenden Information ist wichtig für
die Verhaltenssteuerung. Dies ist evolutionstheoretisch begründet dadurch, dass
Reaktionen nur auf ein Objekt zu einem bestimmten Zeitpunkt erfolgen sollen
(Bsp. zu Nahrung hingehen vs. vor einer Gefahr fliehen).
© Prof. Dr. Adrian Schwaninger 235
Implementationsebene
Beispiel: Computersimulation von van Essen et al. (1994)
Memory
Representation
Dynamic Routing
(Nach Gazzaniga et al. 2002)
© Prof. Dr. Adrian Schwaninger 240
Übliche Befunde
(z.B. Cherry, 1953; Moray, 1959):
Es gelingt den meisten Probanden, nur auf eine Mitteilung
zu achten und die andere „auszublenden“.
Informationen der unterdrückten Mitteilung werden kaum
verarbeitet. Probanden können lediglich sagen, ob es sich
um eine Stimme oder Geräusch handelte und das
Geschlecht der Stimme angeben.
Ausnahme: Subjektiv hochrelevante Information zieht die
Aufmerksamkeit stark auf sich und wird verarbeitet (z.B.
eigener Name und Aussagen zur eigenen Person).
Es stellt sich die Frage ob Aufmerksamkeit früh (aufgrund
physikalischer Merkmale) und/oder spät (aufgrund
semantischer Merkmale) erfolgt.
(Aus Solso, 2005)
(Aus Anderson, 2007)
© Prof. Dr. Adrian Schwaninger 248
Belege für die Dämpfungstheorie
Es gibt experimentelle Befunde, welchen für die
Dämpfungstheorie und gegen die Theorie der späten Auswahl
sprechen (Treisman & Geffen, 1967)
Für die Dämpfungstheorie
sprechen auch neurophysio-
logische Befunde: Aufmerk-
samkeit kann auditive Mittei-
lungen im primären auditori-
schen Kortex verstärken oder
abschwächen.
(Aus Anderson, 2007)
© Prof. Dr. Adrian Schwaninger 249
Zusammenfassung
(Aus Gazzaniga et al., 2002)
© Prof. Dr. Adrian Schwaninger 250
Übersicht Aufmerksamkeit
Einführung
Auditive Aufmerksamkeit
Visuelle Aufmerksamkeit
Zentrale Aufmerksamkeit
„Löwe“
„gefährlich“
Erkennung Identifikation
Input Repräsentation Höhere Verarbeitung
Organismus
Stimuli Reaktionen
Umwelt
© Prof. Dr. Adrian Schwaninger 252
Veränderungsblindheit
(Change Blindness)
Selective looking (Neisser, 1979; Simons & Levin, 1997;
Simons & Chabris, 1999).
“Mudsplashes” (Rensink, O’Regan, & Clark, 1997; O’Regan,
Rensink, & Clark, 1999).
Flicker (Rensink, O’Regan, & Clark, 1995, 1997, 1999).
Eye blinks (O'Regan, Deubel, Clark, & Rensink, 2000).
Inattention paradigm (Mack & Rock, 1998).
Saccades (McConkie, 1991; Grimes, 1996; McConkie &
Currie, 1996).
(Aus http://www.usd.edu/psyc301/ChangeBlindness.htm)
© Prof. Dr. Adrian Schwaninger 254
Experimente von Helmholtz
Helmholtz (1821-1894) führte ein erstes
wichtiges Experiment zur visuellen
Aufmerksamkeit durch.
Im Dunkeln betrachtete einen Lichtpunkt
in der Mitte einer Buchstabentafel.
Dann wurde der Raum kurz beleuchtet.
Er fixierte weiterhin den Punkt in der Mitte,
hatte seine Aufmerksamkeit jedoch je
nach Versuchsdurchgang an anderen
Orten auf der Tafel positioniert.
Er beobachtete, dass er dort wohin er
seine Aufmerksamkeit gelenkt hatte, er
mehr Buchstaben erkennen konnte.
=> Erster Beleg für ein Aufmerksamkeits-
fenster im Sinne eines Spotlights
(attentional spotlight)
© Prof. Dr. Adrian Schwaninger (Aus Gazzaniga et al., 2002) 255
Automatische Aufmerksamkeitsverschiebung
und exogenes (peripheres) Cueing
Aufmerksamkeitsverschiebung durch externe Reize
(gelb in Abbildung) am gleichen Ort wie der Zielreiz
(Kreuz in gelbem Quadrat in der Abbildung).
(Nach Zigmond et al., 1999)
(Nach Zigmond et al., 1999)
Stimulus
Fixation
Fixation
Stimulus
(Nach Mangun et al., 1993)
© Prof. Dr. Adrian Schwaninger 260
Visueller Flaschenhals (Bottleneck)
Neisser und Becklen (1975) führten eine visuelle „Beschattungsaufgabe“ durch,
welche der früher besprochenen auditiven Beschattungsaufgabe analog ist.
Die Probanden sahen zwei übereinander geblendete Filme.
Die Probanden sollten ihre Aufmerksamkeit auf einen der beiden Filme richten und
darauf achten, ob ungewöhnliche Ereignisse auftreten (z.B. sich die Hand schütteln
bei einem Handschlagspiel).
Dies gelang gut, für diejenige Episode, welche aufmerksam betrachtet worden war.
Sollten die Probanden jedoch beide Episoden gleichzeitig nach ungewöhnlichen
Ereignissen überwachen, so hatten sie grosse Schwierigkeiten und viele der
ungewöhnlichen Ereignisse wurden verpasst.
Steigung = 0.6
(Nach Anderson, 2007)
Prof. Dr. Adrian Schwaninger 266
Parallelle visuelle Suche mit Pop-Out
In der unten stehenden Abbildungen fällt es leicht den Zielreiz (Buchstabe T) zu
finden. Dies liegt daran, dass der Zielreiz ein Merkmal aufweist, das ihn deutlich von
den anderen Reizen (Distraktoren) unterscheidet (horizontale Linie).
(Aus Anderson, 2007)
Prof. Dr. Adrian Schwaninger 267
Parallelle visuelle Suche mit Pop-Out
In den unten stehenden Abbildungen fällt es leicht den Zielreiz (horizontale grüne
Linie) zu finden. Dies liegt daran, dass der Zielreiz ein Merkmal aufweist, das ihn
deutlich von den Reizen (Distraktoren) unterscheidet (Orientierung).
Sehnerven-
Retina kreuzung
(Chiasma opticum)
Colliculus Tractus
superior opticus
Radiatio
Sehzentrum des optica
Thalamus (Corpus
geniculatum laterale,
CGL)
Sehrinde (= striärer Cortex oder
(Nach Frisby, 1979) primärer visueller Cortex, V1)
Prof. Dr. Adrian Schwaninger 273
Kortikale Areale
Aus http://thebrain.mcgill.ca
Prof. Dr. Adrian Schwaninger 274
Parallelverarbeitung von Farbe,
Bewegung, Form und Tiefe
Colliculus ITC
Superior (CS)
Prof. Dr. Adrian Schwaninger (Aus Eysel, 2006) 275
Dorsaler und ventraler Strom
T O
Verknüpfungen wie „blaues T“ an, selbst
wenn er die Buchstaben bis zu 10
Sekunden betrachten konnte.
a b c
(Aus Anderson, 2007)
Prof. Dr. Adrian Schwaninger 289
Objektzentrierte Aufmerksamkeit
Aufmerksamkeit kann auf Orte gelenkt werden,
unabhängig davon welche Objekte präsent sind
(siehe bisherige Beispiele).
Aufmerksamkeit kann aber auch auf Objekte
gelenkt werden, unabhängig von deren
Lokalisation. Dafür gibt es verschiedene Belege:
Experimente von Behrmann, Zemel und Mozer (1998)
basierend auf Duncan (1984)
Hemmung der Rückkehr (Inhibition of Return)
Befunde aus den Neurowissenschaften
(Aus Anderson, 2007)
(Nach Anderson, 2007)
© Prof. Dr. Adrian Schwaninger 306
Stroop-Effekt ohne Farben
Flowers, Warner und Polansky
(1979) entwickelten eine andere
Aufgabe zur Demonstration des
Stroop-Effektes.
Die Aufgabe besteht darin, die
Anzahl der Zahlen in jeder Zeile
anzugeben.
Dies ist deshalb so schwierig, weil
das Zahlenerkennen viel stärker
automatisiert ist als das Zählen.
(Aus Anderson, 2007)
© Prof. Dr. Adrian Schwaninger 307
HIER WEITER
Arm
Unterarm
Hand
Alltagsobjekte
3D Modell im Gedächtnis
2D Projektion
M1 N M2
LC1 LC3
LC2
Ansichtenspezi-
fische Neurone
a Rotationswinkel b
Inputbild
(Stimulus)
(Aus Schwaninger, 2005a)
Prof. Dr. Adrian Schwaninger 328
Key-Frame Modell (Wallraven & Bülthoff 2001,
Schwaninger, Wallraven & Bülthoff, 2004)
Bei diesem Ansatz ist das visuelle Input nicht ein Bild, sondern ein
Videostrom.
Von diesem Videostrom werden einzelne Ansichten eines Objektes
gespeichert. Dies geschieht folgendermassen:
1. Feature extraction: Vom Bild werden saliente Punkte (corners) detektiert
und die 5x5 Pixel Patches um diese Punkte gespeichert (komprimierte
Geächtnisrepräsentation). Diese Repräsentation heisst Key Frame.
2. Tracking until feature loss > threshold: Der Videostrom wird mit dem
gespeicherten Key Frame verglichen und es wird eine neue Ansicht
gespeichert, sobald das Objekt im Videostrom nicht mehr erkannt wird.
3. Die Key Frames werden zeitlich miteinander assoziiert, d.h. im
Gedächtnis wird gespeichert, welche Ansicht auf welche folgt.
Objekte und Gesichter werden in verschiedenen Ansichten erkannt durch
Interpolation (Bülthoff & Edelman, 1992).
Keyframe 1 Keyframe 2
Database of objects
Recognize
or Learn? Object 1 Object 1
Object 1
Keyframe Keyframe
Keyframe Keyframe
Keyframe Keyframe
Keyframe Keyframe
Keyframe Keyframe Keyframe
Keyframe
Keyframes Feature
trajectories
between
keyframes
331 Wallraven & Bülthoff (2001); Schwaninger, Wallraven & Bülthoff (2004)
Wallraven, Schwaninger, Schumacher &
Bülthoff (2002)
Im Experiment lernten die Versuchspersonen 10 Gesichter, welche von vorne (0°) und von der
Seite (60°) abgebildet waren. Danach wurden diese Gesichter und 10 Distraktoren in den 15
Winkeln präsentiert (Bedingungen Inter, Extra, Ortho Up, Ortho Down).
Die Versuchsperson musste jedes Mal entscheiden, ob es sich um ein gelerntes Gesicht oder
um einen Distraktor handelte.
Die theoretischen Vorhersagen sind analog zur Studie von Bülthoff und Edelman (1992), welche
mit Drahtobjekten und amoebenartigen Objekten durchgeführt worden ist.
Wird angenommen, dass Gesichter erkannt werden, indem ein 3D Modell fehlerfrei rotiert
werden kann, dann müsste die Erkennung in den Bedingungen Inter, Extra und Ortho etwa
gleich gut sein.
Die Linearkombination kann verschiedene Rotationen um die Hochachse nachbilden; sie wird
aber fehlerhaft, wenn orthogonale Rotationen berechnet werden müssen. Die Vorhersage ist
deshalb Inter = Extra > Ortho.
Wird angenommen, dass Gesichter mittels Interpolation gespeicherter 2D Ansichten erkannt
werden, so müsste die Erkennung in der Inter Bedingung besser als in der Extra und in der
Ortho Bedingung sein.
Das Key Frame Modell sagt Extra > Ortho voraus, weil durch die Rotation in Ortho Richtung, die
visuelle Information eines Gesichtes noch stärker verändert.
Wie man der Abbildung auf der nächsten Folie entnehmen kann, ist genau dies eingetreten, es
zeigte sich Inter > Extra > Ortho Up = Ortho Down.
Prof. Dr. Adrian Schwaninger 332
Wallraven, Schwaninger, Schumacher &
Bülthoff (2002)
4.00
Ortho
+45°Up
Sensitivität d'
3.00
-60°
+60°
0° 2.00 Inter
Extra Inter Extra
Ortho Up
Ortho Down Ortho Down
1.00
0 15 30 45 60
a b Rotationswinkel (°)
-45°
Komponenten Konfiguration
ändern ändern
Komponenten Konfigurale
Information Information
Same or
different?
1 sec
Blank
3 sec
Detektion von Komponenten-
veränderungen
50
n=32
Component
40
Errors (%)
30
20
10
0
0 30 60 90 120 150 180
Rotation (°)
Detektion konfiguraler Änderungen
Same or
Different?
1 sec
Blank
3 sec
Detektion von Änderungen an Komponenten
und Konfiguration
50
Configural n=32
40 Component
Errors (%)
30
20
10
0
0 30 60 90 120 150 180
Rotation Angle (°)
Schlussfolgerung
Metric Spatial
Relations
?
Dorsal System
Local Part-Based
Information
„Component“
Face
Identification
Unit Relational
Information
„Configural“ Input
Representation
Ventral System
Schwaninger, Lobmaier & Collishaw (2002)
Schwaninger, Carbon & Leder (2003)
Komponenten und Konfiguration bei
Erkennung
Gesichter wurden oft als Beispiele exklusiver
holistischer Verarbeitung bezeichnet.
(z.B. Farah et al., 1995; Tanaka & Farah, 1991, 1993; Biederman &
Kalocsai, 1997)
10 Gesichter
nacheinander präsentiert
Prof. Dr. Adrian Schwaninger 345
Werden Teile (Komponenten) separat
gespeichert?
Testbedingung
4
Recognition d'
0
Scrambled Scrambled & Blurred
Blurred
Schwaninger, Lobmaier & Collishaw (2002)
Komponenten und Konfiguration bei
Erkennung
Experiment 2
Identisch mit Experiment 1 ausser das die
Versuchspesonen die Lerngesichter vom
Studium kannten.
Lerngesichter alle bekannt
Distraktoren alle unbekannt
4
Recognition d'
0
Scrambled Scrambled & Blurred
Blurred
Schwaninger, Lobmaier & Collishaw (2002)
Ergebnisse
Metric Spatial
Relations
?
Dorsal System
Local Part-Based
Information
„Component“
Face
Identification
Unit Relational
Information
„Configural“ Input
Representation
Ventral System
Schwaninger, Lobmaier & Collishaw (2002)
Schwaninger, Carbon & Leder (2003)
Original Tracked
images features
between
keyframes
Keyframes Feature
trajectories
between
keyframes
352 Wallraven & Bülthoff (2001); Schwaninger, Wallraven & Bülthoff (2004)
Implementation im Key Frames Modell
Annahme: Saliente lokale Merkmale sind wichtig
Detektion von “Interest Points” in feiner und grober
Auflösung (z.B. Corner Detektor)
Für jeden Interest Point:
Image patch: 5x5 Pixel der Umgebung werden gespeichert
Distanz Histogramm: Pixel Distanz zu allen anderen
Interest Points wird berechnet und gespeichert
Konfigurale Information
Vergleicht Image Patches in grober Auflösung
Berechnet globale Ähnlichkeit zwischen Distanz
Histogrammen (χ2 Distanz)
Entspricht globaler Konfiguration von unscharfen
Merkmalen
354
Implementation im Key Frames Modell
Gleiche Stimuli wie bei Schwaninger, Lobmaier &
Collishaw (2002)
Sehr hohe qualitative Ähnlichkeit mit empirischen Daten
3.50
Component Configural
3.00
Recognition d'
2.50
2.00
1.50
1.00
0.50
0.00
Scrambled Scramled Blurred
& Blurred
Nach Schwaninger, Wallraven & Bülthoff (2004)
355
Zusammenfassung
Extraction of NAPs
c
Befunde mit funktioneller
Magnetresonanztomographie
(functional magnetic
resonance tomography ,
fMRT) beim Menschen.
Häuser, Stühle und
Gesichter scheinen
unterschiedliche Module im
Gehirn zu aktivieren (a und
b). Eine detailliertere Analyse
spricht aber eher für eine
Repräsentation anhand von
Merkmalskarten und
verteilter Aktivität (c).
Eignungsabklärung
Supervision & Qualitätskontrolle
(Fähigkeiten)
Praktische Tests
(Korrekte Reaktion)
0.90
Detection Performance
0.85
0.80
Detektionsleistung
0.75
0.70
0.65
0.60
0.55
0.50
Ohne X-Ray
selectedORT Eignungsabklärung
without X-Ray ORT Mit X-Ray ORTwith
selected Eignungsabklärung
X-Ray ORT
Prof. Dr. Adrian Schwaninger 378
Eignungsabklärung
Es gibt große Unterschiede zwischen Personen
bezüglich ihrer Fähigkeiten Objekte bei Rotation,
Superposition und hoher Gepäckkomplexität zu
erkennen.
Test wie der X-Ray ORT sind wichtig für die
Eignungsabklärung.
Weitere empfohlene Tests
Farbtauglichkeit (z.B. Ishihara Test)
Sehschärfetest
Physische Leistungsfähigkeit
Sprache, Kommunikation
Belastbarkeit, Kundenorientiertheit, etc.
Prof. Dr. Adrian Schwaninger 379
Performance Faktoren
Eignungsabklärung
Supervision & Qualitätskontrolle
(Fähigkeiten)
Praktische Tests
(Korrekte Reaktion)
Operator
Antworten
Individuell
adaptives
System
Daten
1. Einfache Ansicht
2. Schwierigere Ansichten
Schwaninger (2003c, 2004b)
Trainings-
XRT Training
gruppe
Test 1 Test 2
Kontroll-
Anderes CBT
gruppe
Forschungsfragen
Zeigen sich ähnliche Ergebnisse wie bei der ersten Studie für die
Trainingsgruppe, welche mit X-Ray Tutor trainiert?
Wie sind die Trainingseffekte bei der Kontrollgruppe, welche mit
einem anderen weit verbreiteten computer-based Training (CBT)
System trainiert hat?
Hilft das Training neue verbotene Gegenstände zu erkennen?
Prof. Dr. Adrian Schwaninger 393
Studie 2: Effektivität von X-Ray Tutor (XRT)
(1-2 x 20 Minuten pro Woche während 6 Monaten)
Eignungsabklärung
Supervision & Qualitätskontrolle
(Fähigkeiten)
Praktische Tests
(Korrekte Reaktion)
+ =
Fiktiver
verbotener
Röntgenbild eines Gegenstand
(FTI) Ergebnis am Bildschirm:
realen Gepäcks FTI im Gepäck
Röntgengeräte
HI-SCAN 1
HI-SCAN 2
HI-SCAN 3
HI-SCAN 4
HI-SCAN n
1. Generation TIP
402
1., 2. und 3. Generation TIP
HI-SCAN 2
HI-SCAN 3
LAN
Ethernet
HI-SCAN 4 IEEE 802.3u
Twisted-Pair
HI-SCAN n
2. Generation TIP
403
1., 2. und 3. Generation TIP
HI-SCAN 2
Twisted-Pair
HI-SCAN n
CBT System
• Anzeige verpasster Bilder
• Spezifisches Training
3. Generation TIP
404
TIP and adaptives CBT
Mit TIP wird ca. alle 50 Gepäckstücke ein FTI eingeblendet.
Eine Person sieht daher nur ein paar FTIs pro Tag.
TIP ist ein gutes Instrument zur Steigerung der Motivation und
Aufmerksamkeit. Es ist aber nicht sehr effektiv für
Trainingszwecke.
Während 20 Minuten Training mit X-Ray Tutor sieht man etwa
100 verbotene Gegenstände. Das Training ist sehr effektiv was
verschiedene Studien belegt haben.
Eine Kombination von TIP (Steigerung der Motivation und
Aufmerksamkeit) und X-Ray Tutor (adaptives computer-based
Training) wäre ideal!
Dies wurde verwirklicht mit 3i-TIP.
406
3. Generation TIP (3i-TIP)
TIP DataVis
Röntgengeräte
HI-SCAN 1
HI-SCAN 2
3i-TIP Server
• Individuell adaptiver Algorithmus
• Bildverarbeitung
HI-SCAN 3
HMS 3i-TIP
• Integration mit X-Ray Tutor (ver-
Server
HI-SCAN 4
LAN
Ethernet
passte Röntgenbilder)
IEEE 802.3u
HI-SCAN n
Testing Mode
Separate set of TIP images
Same FTIs for all screeners but in different order
More reliable performance measurement
Schwaninger (2004b)
Prof. Dr. Adrian Schwaninger 408
Performance Faktoren
Eignungsabklärung
Supervision & Qualitätskontrolle
(Fähigkeiten)
Praktische Tests
(Korrekte Reaktion)
Eignungsabklärung
Supervision & Qualitätskontrolle
(Fähigkeiten)
Praktische Tests
(Korrekte Reaktion)
Eignungsabklärung
Supervision & Qualitätskontrolle
(Fähigkeiten)
Praktische Tests
(Korrekte Reaktion)