Perzeptuelle Organisation von Objektgrenzen
unter Verwendung
anisotroper Regularisierungsmethoden
Zur Erlangung des akademischen Grades
DOKTORINGENIEUR (Dr.-Ing.)
von der Fakultät für Elektrotechnik, Informatik und Mathematik
der Universität Paderborn
genehmigte Dissertation
von
Dipl.-Math. Marcus Hund
aus Cuxhaven
Referentin: Prof. Dr.-Ing. Bärbel Mertsching
Korreferent: Prof. Dr.-Ing. Horst-Michael Groß
Tag der mündlichen Prüfung: 27.05.2009
Paderborn 2009
Diss. EIM-E//255
Danksagung
Die vorliegende Arbeit entstand im Rahmen meiner T¨
atigkeit im Fachgebiet
Grundlagen der Elektrotechnik an der Universit¨
at Paderborn. An dieser
Stelle m¨
ochte ich mich bei all denen sehr herzlich bedanken, die mich in
vielf¨
altiger Weise bei der Anfertigung der Arbeit unterst¨
utzt haben.
Zun¨
achst sei Frau Prof. Dr.-Ing. B¨
arbel Mertsching genannt, die mir die
Bearbeitung des vorliegenden Themas erm¨
oglichte und die durch den mir
gew¨
ahrten kreativen Freiraum einen wesentlichen Grundstein f¨
ur das Gelin-
gen dieser Arbeit legte. Ich danke ihr außerdem f¨
ur den außergew¨
ohnlichen
organisatorischen Einsatz, der in der Endphase dieser Arbeit zu einer erheb-
lichen Beschleunigung des Promotionsverfahrens f¨
uhrte.
Herrn Prof. Dr.-Ing. Horst-Michael Groß von der TU Ilmenau danke ich f¨
ur
die bereitwilige ¨
Ubernahme des Korreferats, f¨
ur das damit gezeigte Interesse
an meiner Arbeit und vor allem f¨
ur die z¨
ugige Erstellung des Gutachtens.
Bedanken m¨
ochte ich mich ebenfalls bei den mittlerweile 21 wissenschaft-
lichen und nichtwissenschaftlichen Kollegen des Fachgebietes und bei allen
Studenten, die im Laufe meiner T¨
atigkeit im Fachgebiet mit mir zusam-
mengearbeitet haben. Die großartige Zusammenarbeit mit jedem Einzelnen
war gepr¨
agt von einem starken Zusammenhalt, f¨
ur den nicht zuletzt Dr.-
Ing. Siegbert Dr¨
ue Dank geb¨
uhrt. Ganz besonders bedanke ich mich auch
bei Dr.-Ing. Ralf Stemmer, Bj¨
orn Meyer und dem Stipendiaten Lic. Doreid
Kheirbek, die diese Zeit auf besonders humorvolle Art und Weise zu einem
positiven Erlebnis gemacht haben.
Ferner danke ich den studentischen Hilfskr¨
aften und Absolventen, die mich
durch ihr engagiertes Mitwirken unterst¨
utzten. Hervorheben m¨
ochte ich
dabei M. Sc. Michael Feldmann, der im Rahmen seiner Bachelorarbeit wich-
tige Beitr¨
age zu der in den Kapiteln 4.2 und 4.3 dieser Arbeit vorgestellten
Konturvervollst¨
andigung durch Splineinterpolation leistete. F¨
ur das Korrek-
turlesen des Manuskriptes danke ich Dipl.-Ing. Frank Schmidtmeier, Dipl.-
Ing. Markus Schmidt und meiner Frau Claudia.
Ohne die Liebe und das Verst¨
andnis meiner Frau Claudia w¨
are diese Arbeit
so nicht m¨
oglich gewesen. Ihr gilt daher mein gr¨
oßter Dank, ebenso meinen
Eltern, die mir das Studium in jeder Hinsicht ¨
uberhaupt erst erm¨
oglicht
haben.
Inhaltsverzeichnis
1 Einleitung 1
2 Grundlagen 5
2.1 Die Wahrnehmung des Menschen . . . . . . . . . . . . . . . . 5
2.2 Tiefenwahrnehmung . . . . . . . . . . . . . . . . . . . . . . . 8
2.3 Scheinkonturen . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4 Optische Illusionen und Wahrnehmungsph¨
anomene . . . . . . 14
2.4.1 Helligkeitswahrnehmung . . . . . . . . . . . . . . . . . 14
2.4.2 Gr¨
oßenwahrnehmung . . . . . . . . . . . . . . . . . . . 15
2.4.3 Scheinkonturen . . . . . . . . . . . . . . . . . . . . . . 18
2.4.4 Figur-Grund-Gliederung . . . . . . . . . . . . . . . . . 20
2.5 Strategien zur perzeptuellen Organisation . . . . . . . . . . . 22
3 Bildvorverarbeitung 29
3.1 Filterung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2 Detektion von Konturen und Kreuzungspunkten . . . . . . . 37
3.2.1 Schwellwertfreie Kantendetektion . . . . . . . . . . . . 38
3.2.2 Detektion von Kreuzungspunkten . . . . . . . . . . . . 41
3.3 Anisotrope Regularisierung . . . . . . . . . . . . . . . . . . . 45
3.3.1 Minimierung einer globalen Kostenfunktion . . . . . . 47
3.3.2 Diffusion . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.3.3 Selbstorganisation der Kanteninformation . . . . . . . 60
4 Bestimmung m¨
oglicher Konturvervollst¨
andigungen 67
4.1 Konturvervollst¨
andigung durch Tensor Voting . . . . . . . . . 67
4.1.1 Repr¨
asentation von Konturelementen durch Tensoren 67
4.1.2 Tensorkommunikation . . . . . . . . . . . . . . . . . . 69
4.1.3 Probleme des Tensorvoting . . . . . . . . . . . . . . . 74
4.2 Bewertung von Verbindungswahrscheinlichkeiten . . . . . . . 76
4.2.1 Ausschlusskriterien . . . . . . . . . . . . . . . . . . . . 76
4.2.2 Bestimmung der Verbindungswahrscheinlichkeit . . . . 79
4.3 Konturvervollst¨
andigung durch Spline Funktionen . . . . . . 83
5 Perzeptuelle Organisation 89
5.1 Figur-Grund-Gliederung an Kreuzungspunkten . . . . . . . . 89
5.2 Dynamische Tiefenzuordnung . . . . . . . . . . . . . . . . . . 92
6 Experimentelle Ergebnisse 99
6.1 Anisotrope Regularisierung . . . . . . . . . . . . . . . . . . . 99
6.2 Konturverst¨
arkung . . . . . . . . . . . . . . . . . . . . . . . . 107
6.3 Kanten- und Eckendetektion . . . . . . . . . . . . . . . . . . 109
6.4 Konturvervollst¨
andigung . . . . . . . . . . . . . . . . . . . . . 112
6.5 Perzeptuelle Organisation vervollst¨
andigter Konturen . . . . . 115
6.6 Nat¨
urliche Bilder . . . . . . . . . . . . . . . . . . . . . . . . . 119
6.7 Laufzeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
7 Zusammenfassung 125
Literaturverzeichnis 129
1 Einleitung
Sowohl Lebewesen als auch autonom agierende Roboter, welche in Interak-
tion mit ihrer Umwelt treten, ben¨
otigen zur Navigation und zur Manipu-
lation von Objekten unter anderem Informationen ¨
uber die Form und die
Position von Objekten in ihrer Umgebung. Zur Entfernungsmessung haben
sich in der Praxis sogenannte aktive Verfahren etabliert. Hierbei wird durch
eine aktive Beeinflussung der Umgebung, z. B. mittels Ultraschall oder La-
serlicht, die Entfernung der Sensoreinheit zu einem Objekt gemessen. H¨
aufig
ist die Aufgabe eines Robotersystems jedoch auch mit der Objekterkennung
verbunden. Hierzu sind die Sensoreinheiten aktiver Systeme in der Regel
nicht in der Lage. Sogenannte passive Verfahren nutzen zur Analyse der
Umgebung allein die nat¨
urliche Beleuchtung aus. Die Sensoreinheiten sind
hierbei im Allgemeinen durch ein oder mehrere Kamerasysteme gegeben.
Kamerasysteme bieten zum einen den Vorteil, dass eine aufw¨
andige Daten-
fusion der Ergebnisse von Objekterkennung und Tiefenwahrnehmung ent-
f¨
allt und zum anderen den Vorteil einer kosteng¨
unstigen Realisierbarkeit.
Durch die Abbildung einer dreidimensionalen Szene auf ein zweidimensiona-
les Kamerabild geht allerdings die Tiefeninformation der betrachteten Szene
verloren. Auch die Form von Objekten beschr¨
ankt sich in der zweidimen-
sionalen Darstellung auf eine Kontur, die dar¨
uberhinaus durch verdeckende
Objekte unterbrochen sein kann.
Zur Rekonstruktion der durch die Kameraprojektion verlorenen Kontur-
und Tiefeninformationen dienen Lebewesen, speziell der Mensch, als Vor-
bild. Eine naheliegende Methode zur Rekonstruktion der Tiefeninformation
besteht in Analogie zum nat¨
urlichen Vorbild in der Auswertung zweier Ste-
reobilder. W¨
ahrend aber das Gebiet der stereoskopischen Korrespondenzbe-
stimmung weitgehend in der Literatur behandelt wurde und eine Vielzahl an
2 1 Einleitung
effizienten Algorithmen hervorgebracht hat, haben monokulare Tiefenkrite-
rien bisher nur wenig Einzug in Bildverarbeitungsanwendungen gehalten.
H¨
aufig beschr¨
anken sich Beitr¨
age zum Thema in der Beschreibung oder
Modellierung menschlicher Wahrnehmungsph¨
anomene oder optischer Illu-
sionen, welche anhand von synthetischen Bildern demonstriert werden.
In der vorliegenden Arbeit soll eines der wichtigsten monokularen Tiefen-
kriterien, die Verdeckung, herangezogen werden, um eine betrachtete Szene
sinnvoll dreidimensional interpretieren zu k¨
onnen und verdeckte Konturen
zu vervollst¨
andigen. Hierbei soll besonderer Wert auf die gesamte Prozes-
skette, angefangen bei der Filterung nat¨
urlicher Bilder, bis hin zur perzep-
tuellen Organisation des Bildinhalts gelegt werden. Dazu wird mit der ani-
sotropen Regularisierung eine Methodik vorgestellt, die entsprechend einer
gew¨
unschten Skalierung eine Reduktion des Eingangsbildes auf wesentliche
Bildinhalte gew¨
ahrleistet, wobei saliente, also wesentliche, Konturinforma-
tionen beibehalten werden.
Kapitel 2 erl¨
autert die Grundlagen menschlicher Wahrnehmung und die Me-
chanismen perzeptueller Organisation, wobei auch die Ans¨
atze zu einer Re-
produktion dieser Mechanismen in Bildverarbeitungsanwendungen bespro-
chen werden. In Kapitel 3 werden die f¨
ur die perzeptuelle Organisation not-
wendige Vorverarbeitungsschritte vorgestellt. Besondere Ber¨
ucksichtigung
findet hierbei die kantenerhaltende Gl¨
attung des Eingangsbildes durch ani-
sotrope Regularisierung, welche eine Reduzierung des Informationsgehaltes
im Allgemeinen komplexer Eingangsbilder gew¨
ahrleistet. Grundlage per-
zeptueller Organisation ist die in Kapitel 4 beschriebene Vervollst¨
andigung
unterbrochener Konturen oder Objektgrenzen. Mit der als Tensor Voting be-
zeichneten Methodik und einer Splineinterpolation werden zwei alternative
Verfahren zur Konturvervollst¨
andigung vorgestellt. Kapitel 5 beschreibt die
eigentliche perzeptuelle Organisation des vorliegenden Ansatzes, bestehend
aus einer Figur-Grund-Gliederung an markanten Bildpositionen und einer
daraus folgenden dreidimensionalen Interpretation des zweidimensionalen
Eingangsbildes. Die vorgestellten Verarbeitungsschritte werden anhand ei-
4 1 Einleitung
2 Grundlagen
2.1 Die Wahrnehmung des Menschen
Das Abbildungssystem des menschlichen Auges besteht vereinfacht darge-
stellt aus einer Lochblende, einer konvexen Linse und einer Rezeptorebene.
In der Rezeptorebene, der Retina, leiten ca. 126 Millionen Photorezeptoren
ihre Signale indirekt an ca. 1 Million Ganglienzellen weiter (siehe Abbildung
2.1). Hierbei findet bereits eine Vorverarbeitung der Signale statt [ST97].
So zeigen schon Ganglienzellen, die Ausgangsschicht der Retina, ein kom-
plexes Erregungsmuster. Die Signale der Ganglienzellen werden ¨
uber die
Sehnerven, das Chiasma opticum und die seitlichen Knieh¨
ocker zur Wei-
terverarbeitung in den visuellen Cortex weitergeleitet. Dort befindet sich
eine Vielzahl verschiedener Neuronen, die auf spezifische Reize in ihren re-
zeptiven Feldern reagieren. So finden sich z. B. Neuronen, die auf Licht-
balken einer bestimmten Orientierung reagieren, w¨
ahrend andere Neuronen
orientierungs- und richtungsspezifisch auf Lichtreize reagieren. Es findet im
visuellen Cortex also ein ¨
Ubergang zu einer merkmalsbasierten Repr¨
asenta-
tion der wahrgenommenen Umwelt statt.
Unter den Merkmalen, die sich aus dem Retinaabbild ableiten lassen, kommt
den Konturen eine besondere Bedeutung zu, wie der Versuch von Krauskopf
[Kra63, Kra67, Spi01] zeigt. Einer Versuchsperson wird dabei eine rote
Scheibe, umgeben von einem gr¨
unen Ring dargeboten. Wird die Kante
zwischen der roten Scheibe und der umgebenden gr¨
unen Fl¨
ache stabilisiert,
so kann sich der Reiz nicht gegen das Rezeptormosaik verschieben. Die
Neurone adaptieren und es kann keine Kante mehr wahrgenommen werden.
Als Folge verschwindet f¨
ur die Versuchsperson die Wahrnehmung Rot im
Inneren des Musters, stattdessen wird die gesamte Fl¨
ache einheitlich als
6 2 Grundlagen
Abbildung 2.1: Sehbahn (nach [ST97]).
gr¨
un wahrgenommen. Ohne die Wahrnehmung der Begrenzung kann also
auch die Fl¨
ache selbst nicht wahrgenommen werden.
Auch bei der Untersuchung sakkadischer Augenbewegungen zeigt sich, dass
bei freier Betrachtung eines Bildes der Blick der Versuchsperson auf Unste-
tigkeitsstellen des dargebotenen Reizes, wie z. B. Kanten oder Ecken verweilt
[Yar67]. Einheitliche Fl¨
achen werden dagegen kaum betrachtet (vgl. Abbil-
dung 2.2). Fl¨
achen, die gleiche Helligkeit, Farbe und Struktur aufweisen,
sind also im informationstheoretischen Sinne redundant. Die Wahrnehmung
von Konturen ist damit offensichtlich der Wahrnehmung von Fl¨
achen vor-
angestellt [Spi01].
Der Merkmalsrepr¨
asentation folgt eine Organisation des Wahrgenommenen
zu komplexeren, handhabbaren Einheiten, sogenannten Perzepten. Ziel ei-
ner solchen perzeptuellen Organisation ist also die Abstraktion der Ein-
zelinformationen bzw. Merkmale und der damit verbundene Aufbau einer
inneren Repr¨
asentation des Wahrgenommenen. Aus der Betrachtung der
Art und Weise, wie das menschliche Gehirn eine Gruppierung von Teil-
figuren oder Merkmalen vornimmt, haben sich in dem als Gestaltpsycho-
logie bezeichneten Zweig der Wahrnehmungspsychologie Gruppierungsme-
2.1 Die Wahrnehmung des Menschen 7
Abbildung 2.2: Muster der Augenbewegungen einer Versuchsperson beim
freien Betrachten einer Abbildung der Nofretete-B¨
uste (nach
[Yar67]).
chanismen herauskristallisiert, welche als Gestaltgesetze bezeichnet werden
[Wer23, Kof35, Pal99]. Zu diesen Gesetzen z¨
ahlen unter anderem das Gesetz
des gemeinsamen Schicksals, welches eine Gruppierung gemeinsam bewegter
Elemente bezeichnet und das Gesetz der ¨
Ahnlichkeit, welches die Gruppie-
rung von einander ¨
ahnlichen Elementen postuliert [Pal99]. Im Rahmen der
vorliegenden Arbeit sind die Gesetze der N¨
ahe und der guten Gestalt von
Interesse. Das Gestaltgesetz der N¨
ahe besagt, dass Merkmale, die einen
geringeren Abstand zueinander aufweisen als andere, bevorzugt gruppiert
werden, w¨
ahrend das Gesetz der guten Gestalt eine Wahrnehmungsorgani-
sation beschreibt, welche m¨
oglichst einfache, symmetrische oder regelm¨
aßige
Figuren bevorzugt. Korrespondierend hiermit besagt das Gesetz der Kon-
tinuit¨
at, dass die Wahrnehmung unterbrochene Konturen so fortsetzt, dass
sich kein abrupter Richtungswechsel ergibt und außerdem keine neuen For-
men eingef¨
uhrt werden m¨
ussen. Dies ist insbesondere f¨
ur die in Kap. 2.3
beschriebene Scheinkonturwahrnehmung von Interesse. Weiterhin ist das
Prinzip der Geschlossenheit zu nennen, das eine bevorzugte Wahrnehmung
von geschlossenen Formen beschreibt. Perzepte werden in Bezug zum r¨
aum-
8 2 Grundlagen
lichen und zum zeitlichen Kontext gesetzt und sind somit in ihrer Inter-
pretation von diesen abh¨
angig. Die als Wahrnehmungskonstanz bezeichnete
Toleranz gegen¨
uber geringen Ver¨
anderungen der Information auf der Sen-
sorebene l¨
asst sich neurologisch untermauern durch auf h¨
oheren Ebenen des
Sehsystems entdeckte Zellen, welche denselben Reiz unabh¨
angig von Entfer-
nung, Beleuchtung und sogar partieller Verdeckung signalisieren [SVO93].
Neben Gruppierungsmechanismen ist ein wesentliches Merkmal perzeptuel-
ler Organisation die Gliederung des sensorischen Abbildes in Bereiche und
die Einteilung der Bereiche in Figur und einen Grund, von dem sich die
Figur als Vordergrund abhebt. Perzeptuelle Organisation beinhaltet somit
auch eine dreidimensionale Repr¨
asentation des Wahrgenommenen, was ins-
besondere auch dann der Fall ist, wenn nur ein Auge bzw. nur ein zweidi-
mensionales sensorisches Abbild vorhanden ist.
2.2 Tiefenwahrnehmung
Hubel und Wiesel [HW70] fanden im visuellen Cortex Nervenzellen, soge-
nannte binokulare Neurone, die von beiden Augen stimuliert werden k¨
onnen.
Unter diesen binokularen Neuronen existieren solche Zellen, die in Abh¨
angig-
keit von der Entfernung, auf die der Blick gerichtet ist, und der Entfernung
eines Lichtreizes reagieren. Das Verarbeitungssystem verf¨
ugt somit ¨
uber
Mechanismen zur Tiefenwahrnehmung. Durch psychophysikalische Experi-
mente konnte Bela Julesz [Jul60] nachweisen, dass der Mensch bereits allein
aus der Information der Disparit¨
at, also der relativen Verschiebung korre-
spondierender Bildpunkte in den beiden Stereobildern, einen Tiefeneindruck
erh¨
alt. Er zeigte dies durch die Einf¨
uhrung von Zufallspunktstereogram-
men. Ein solches Zufallspunktstereogramm entsteht, indem zun¨
achst zwei
identische Bilder mit einem Muster zuf¨
allig verteilter weißer und schwarzer
Bildpunkte erzeugt werden. In diese Bilder wird ein kleineres, ebenfalls zu-
f¨
allig erzeugtes Muster, z. B. in Form eines Rechtecks, versetzt eingef¨
ugt.
Betrachtet man das in Bild 2.3 dargestellte Zufallspunktstereogramm mit
2.2 Tiefenwahrnehmung 9
Abbildung 2.3: Zufallspunktstereogramm nach Julesz (nach [Jul60])
einem aufrecht zwischen die Bilder gestellten Blatt Papier, so fusionieren
die Bilder zu einem. Es entsteht der Eindruck eines aus dem Hintergrund
hervortretenden Rechtecks. Zufallspunktstereogramme enthalten keinerlei
Informationen ¨
uber die Form des Objekts, ebenso sind keine monokularen
Tiefenkriterien anwendbar. Die einzige Information, die dem menschlichen
Auge zur Verf¨
ugung steht, ist die der relativen Verschiebung des versetzt ein-
gef¨
ugten Objektes. Dies zeigt, dass die Gewinnung der Tiefeninformation
schon vor der Objekterkennung stattfinden und somit sogar zur Objektseg-
mentierung genutzt werden kann.
Beim Betrachten einer Szene mit nur einem Auge gewinnen wir bereits einen
Tiefeneindruck durch sogenannte monokulare Tiefenkriterien. So beurteilen
wir die Entfernung eines Objekts z. B. anhand der bekannten Gr¨
oße die-
ses Objekts. Akkommodation, also der durch die Augenlinsen eingestellte
Sch¨
arfebereich, und Konvergenzbewegungen der Augen, die sich auf ein Ob-
jekt ausrichten, liefern sensorische monokulare Tiefeninformationen. Ein
weiteres Kriterium ist die Schattierung, die bestimmt, ob wir eine Struktur
als Erhebung oder Vertiefung wahrnehmen, wobei das visuelle System des
Menschen davon ausgeht, dass das Licht von oben einf¨
allt.
Ein Beispiel f¨
ur die Mehrdeutigkeit der Tiefenwahrnehmung durch Schat-
tierung ist in Abbildung 2.4 gegeben. W¨
ahrend das menschliche Sehsystem
10 2 Grundlagen
dazu tendiert, das Bild als einen großen und einen kleinen Krater wahr-
zunehmen, l¨
asst sich diese Interpretation durch eine Drehung des Bildes
um 180◦in die Wahrnehmung zweier Vulkane ver¨
andern. Dargestellt ist in
Wirklichkeit die 180◦-Rotation der Abbildung hawaiianischer Aschekegel.
Abbildung 2.4: Mehrdeutigkeit zwischen Wahrnehmung eines Kraters oder
eines Vulkans. Einfluss der Schattierung auf die Tiefenwahr-
nehmung (nach [PF05]).
In einem zeitlichen Kontext dient die sogenannte Bewegungsparallaxe als
Tiefenkriterium, die ber¨
ucksichtigt, dass weiter entfernte Objekte ihre Posi-
tion auf der Sensorebene langsamer ver¨
andern als n¨
ahere Objekte, die sich
mit der gleichen relativen Geschwindigkeit zum Beobachter bewegen. Die
Konvergenz paralleler Strahlen am Horizont, wie dies z. B. bei Bahnschie-
nen oder Straßen der Fall ist, wird als lineare Perspektive bezeichnet und
wurde vielfach bereits in Renaissancebildern zur Erzeugung eines r¨
aumlichen
Eindrucks eingesetzt. Ein weiteres Tiefenkriterium ist der Texturgradient,
da gleichm¨
aßig strukturierte Texturen mit zunehmender Entfernung zum
Betrachter dichter erscheinen.
Das f¨
ur die vorliegende Arbeit zentrale monokulare Tiefenkriterium ist die
Verdeckung. Ein Großteil der Objekte, die sich in einer betrachteten Szene
befinden, wird von anderen Objekten, die sich in gr¨
oßerer N¨
ahe zum Be-
trachter befinden, verdeckt. Verdeckte Objekte erscheinen damit weiter
2.3 Scheinkonturen 11
entfernt, w¨
ahrend okkludierende Objekte als n¨
aher wahrgenommen werden.
Die Objektgrenze eines okkludierten Objektes wird offensichtlich durch das
Vordergrundobjekt teilweise unterbrochen. F¨
ur ein biologisches oder ein
technisches Bildverarbeitungssystem kann dieser Sachverhalt herangezogen
werden, um Objektgrenzen zu vervollst¨
andigen und ¨
uber eine Figur-Grund-
Gliederung eine dreidimensionale Repr¨
asentation des Sensorabbildes zu er-
stellen.
2.3 Scheinkonturen
Scheinkonturen, auch als Scheinkanten oder illusion¨
are Konturen bezeichnet,
sind wahrgenommene Konturen, f¨
ur die sich kein korrespondierender Reiz
auf der Rezeptorebene eines Sehsytems finden l¨
asst. Neurophysiologische
Untersuchungen haben gezeigt, dass die Wahrnehmung von Scheinkonturen
sowohl bei S¨
augetieren wie Katzen, Affen und dem Menschen, bei V¨
ogeln
wie der Schleiereule und sogar bei Insekten, n¨
amlich Honigbienen, nachwei-
sen l¨
asst [Nie02b, Hey03]. Die Gehirne und Sehsysteme dieser Lebewesen,
die sich im Laufe der Evolution sehr unterschiedlich entwickelt haben, haben
sich offensichtlich an gemeinsame visuelle Randbedingungen angepasst und
versuchen, Wahrscheinlichkeitserw¨
agungen ¨
uber ihre Umgebung anzustel-
len, indem unterbrochene Begrenzungen vermeintlicher Objekte perzeptuell
vervollst¨
andigt werden. F¨
ur das menschliche Sehsystem sind Scheinkontu-
ren schon seit Beginn des zwanzigsten Jahrhunderts Gegenstand gestalt-
psychologischer Untersuchungen [Kof35, ESS03, Wer23]. Zuerst wurde das
Wahrnehmungsph¨
anom um 1900 von Schuhmann erw¨
ahnt. Er beschrieb
Scheinkonturen als Konturen, die nicht objektiv vorhanden sind [Sch00].
Abbildung 2.5(a) zeigt das sogenannte Kanizsa Dreieck [Kan79], das das
Standardbeispiel f¨
ur eine optische Illusion darstellt, welche auf Scheinkontur-
wahrnehmung basiert. Die sich hieraus ergebende Figur-Grund-Organisation
leitet sich allein aus monokularen Kriterien ab (siehe [Kan79]). Der Begriff
optische Illusion bezieht sich hierbei auf die Tatsache, dass das Kanizsa Bild
12 2 Grundlagen
(a) (b) (c)
(d) (e) (f)
Abbildung 2.5: Das Kanizsa Dreieck (a) und unterschiedliche perspekti-
visch angedeutete dreidimensionale Konstellationen (b)-(f),
die alle zum selben Retinaabbild (a) f¨
uhren.
zweidimensional ist und sich lediglich aus drei schwarzen und einer weißen
Fl¨
ache zusammensetzt, das menschliche Gehirn aber dazu tendiert, das Bild
dreidimensional zu interpretieren. Da hier aber nicht von einer Fehlinterpre-
tation gesprochen werden kann, w¨
are Wahrnehmungsph¨
anomen in diesem
Fall ein passenderer Begriff. Obwohl eine Vielzahl korrekter dreidimensiona-
ler Interpretationen existiert (Abbildung 2.5(b)-(f)), welche alle zum selben
Abbild auf der Sensorebene eines bildverarbeitenden Systems f¨
uhren w¨
ur-
den, besteht die pr¨
aferierte Szeneinterpretation in einer perzeptuellen Orga-
nisation gem¨
aß der Abbildung 2.5(b). D. h. es wird die Wahrnehmung eines
weißen Dreiecks bevorzugt, das sich vor drei schwarzen Kreisen befindet, die
sich wiederum vor einem weißen Hintergrund befinden. Die drei schwarzen
Fl¨
achen bilden hierbei sogenannte induzierende Elemente, also Merkmale
des betrachteten Bildes, die eine Scheinkonturwahrnehmung hervorrufen.
Induzierende Elemente sind also an solchen Bildpositionen gegeben, wo auf-
2.3 Scheinkonturen 13
grund verdeckter Fl¨
achen Diskontinuit¨
aten im Konturverlauf auftreten, wie
dies bei Eckpunkten, Endpunkten oder T-Kreuzungen (vgl. Kap. 3.2.2) der
Fall ist. Es ist festzustellen, dass, obwohl beide Fl¨
achen weiß sind, das Drei-
eck gegen¨
uber dem Hintergrund als heller erscheint, d. h. die Scheinkontur
wird tats¨
achlich als ein Kontrastunterschied zwischen zwei Fl¨
achen wahr-
genommen. Aufgrund der Mehrdeutigkeit der m¨
oglichen Interpretationen
und dem damit schlecht gestellten Problem der perzeptuellen Organisation
kann es nicht das Ziel eines Ansatzes zur perzeptuellen Organisation sein, die
korrekte dreidimensionale Interpretation eines zweidimensionalen Bildes zu
finden, sondern die wahrscheinlichste, wobei die Eigenschaften menschlicher
Wahrnehmung hierbei als Anhaltspunkt dienen. Die Mehrdeutigkeit der
Anordnung und der Einfluss h¨
oherer kognitiver Funktionen zeigen sich bei
der Konzentration auf die Vorstellung einer weißen Fl¨
ache mit drei L¨
ochern,
hinter denen das Dreieck zu sehen ist, die tats¨
achlich zu einer Wahrnehmung
entsprechend der Abbildung 2.5(c) f¨
uhrt und nun die Vervollst¨
andigung der
Kreisfl¨
achen als Scheinkonturen pr¨
aferiert. In diesem Zusammenhang ist
zu unterscheiden zwischen sogenannter modaler und amodaler Vervollst¨
an-
digung. Modale Vervollst¨
andigung bezeichnet die Vervollst¨
andigung eines
Vordergrundobjektes, was im Falle des Kanizsa-Dreiecks und der r¨
aumli-
chen Interpretation entsprechend der Abbildung 2.5(b) die Vervollst¨
andi-
gung des Vordergrunddreiecks darstellt. Mit amodaler Vervollst¨
andigung
wird dagegen die Vervollst¨
andigung verdeckter Konturen bezeichnet, was
wiederum im Falle des Kanizsa-Dreiecks die Vervollst¨
andigung der schwar-
zen Kreisfl¨
achen bedeutet. In der Regel werden mit Scheinkonturen ledig-
lich die modalen Vervollst¨
andigungen bezeichnet [Nie02b]. Neuere psycho-
physische Untersuchungen unterst¨
utzen die These, dass die Wahrnehmung
modaler und amodaler Vervollst¨
andigungen auf einem gemeinsamen Mecha-
nismus basiert [Nie02a, Nie02b], was auch der von Kellman begr¨
undeten
Identit¨
atshypothese [KGW01] und der in der vorliegenden Arbeit realisier-
ten Konturvervollst¨
andigung entspricht. Die Identit¨
atshypothese wird in
[ASF02] in Zweifel gezogen, wobei sich die Gegenargumente allerdings auf
stereoskopische induzierende Elemente und auf h¨
ohere, auf einer Wissens-
14 2 Grundlagen
basis beruhende kognitive Funktionen beziehen. Weiterhin werden keine
Hinweise darauf gegeben, wie die Konturvervollst¨
andigung stattfindet oder
eine dreidimensionale Repr¨
asentation gewonnen wird.
2.4 Optische Illusionen und Wahrnehmungsph¨
anomene
Eine Vielzahl sogenannter optischer Illusionen basieren auf der Mehrdeu-
tigkeit der dargebotenen Reize, so dass die Wahrnehmungsmechanismen,
die den Beobachter zu einer bestimmten perzeptuellen Organisation des be-
trachteten Bildes f¨
uhren, h¨
aufig im Widerspruch zu anderen Mechanismen
oder der eigenen Erfahrung stehen. Solche Wahrnehmungsph¨
anomene bieten
wertvolle Hinweise auf die Funktionsweise menschlicher perzeptueller Orga-
nisation und k¨
onnen somit auch als Vorbild f¨
ur effektive Bildverarbeitungs-
algorithmen herangezogen werden. Im Folgenden werden optische Illusionen
und Wahrnehmungsph¨
anomene pr¨
asentiert, welche einen gewissen Bezug zur
vorliegenden Arbeit aufweisen. Neben der Helligkeitswahrnehmung, die in
Bezug zur Filterung eines Eingangsbildes im Rahmen einer Vorverarbei-
tung steht und Skalierungseffekten sind hierbei insbesondere Ph¨
anomene zur
Scheinkonturwahrnehmung und Figur-Grund-Gliederung von Interesse.
2.4.1 Helligkeitswahrnehmung
Die in Abbildung 2.6 dargestellte optische Illusion, benannt nach dem deut-
schen Physiologen Ludimar Hermann, wird als Hermann-Gitter bezeichnet.
Die Bereiche, in denen sich die weißen Gitterlinien kreuzen, werden als dunk-
ler im Vergleich zum Rest der Linie wahrgenommen, obwohl der Farbwert
¨
uberall ein konstantes Weiß aufweist. Grund daf¨
ur ist die Zentrum-Umfeld
Charakteristik rezeptiver Felder retinaler Ganglienzellen [GGM95], welche
ein ¨
ahnliches Verhalten aufweisen wie die in Kap. 3 vorgestellten Filtermas-
ken (vgl. Abbildung 3.6).
2.4 Optische Illusionen und Wahrnehmungsph¨
anomene 15
Abbildung 2.6: Hermann-Gitter (nach [Her70]).
Abbildung 2.7(a) ist ein Beispiel f¨
ur die Farbkonstanz menschlicher Wahr-
nehmung, d. h. es werden zusammengeh¨
orige Fl¨
achen trotz eines Beleuch-
tungsunterschieds mit dem gleichen Farbwert wahrgenommen. So tendiert
das menschliche Sehsystem, das Schachbrettmuster in Abbildung 2.7(a) in
zwei Gruppen heller und dunkler Fl¨
achen einzuteilen. Die mit A und B
bezeichneten Fl¨
achen werden daher mit unterschiedlichen Helligkeitswerten
wahrgenommen, obwohl der dargebotene Reiz einen identischen Grauwert
f¨
ur die Fl¨
achen A und B aufweist. Dies wird in Abbildung 2.7(b) deutlich,
wo dem urspr¨
unglichen Bild zwei Balken mit dem Grauwert der Fl¨
achen A
und B ¨
uberlagert wurden. Offensichtlich haben Kontrastunterschiede f¨
ur die
menschliche Wahrnehmung also eine h¨
ohere Bedeutung als die eigentlichen
Helligkeitswerte. F¨
ur eine Vielzahl praktischer Anwendungen, die sich auf
nat¨
urliche Eingangsbilder beziehen, ist eine solche Beleuchtungsinvarianz
auch f¨
ur die digitale Bildverarbeitung von Bedeutung.
2.4.2 Gr¨
oßenwahrnehmung
Die in Abbildung 2.8(a) dargestellte optische Illusion wurde zuerst vom ita-
lienischen Psychologen Mario Ponzo (1882-1960) beschrieben, der vorschlug,
dass das menschliche Gehirn die Gr¨
oße eines Objektes in Relation zum Hin-
tergrund beurteilt. Was in Abbildung 2.8(a) als Illusion bezeichnet wird, ist
16 2 Grundlagen
(a) (b)
Abbildung 2.7: Schachbrett-Versuch von Edward H. Adelson aus dem Jahr
1995 (vgl. [Ade01]).
der Gegensatz zwischen der nachmessbaren L¨
ange der beiden horizontalen
Linien, welche beide gleich lang sind, und der menschlichen Wahrnehmung,
die aufgrund einer dreidimensionalen Interpretation des dargebotenen Reizes
die obere horizontale Linie als l¨
anger im Vergleich zur unteren Linie wahr-
nimmt. Das Tiefenkriterium, das dieser Interpretation zugrunde liegt, ist die
bereits in Kap. 2.2 beschriebene lineare Perspektive, die besagt, dass paral-
lele Linien sich zum Horizont hin verj¨
ungen. Im Fall von Abbildung 2.8(a)
werden also, ¨
ahnlich zu Straßenr¨
andern oder Bahnschienen, die vier sich in
einem Punkt treffenden d¨
unnen Linien als perspektivische Darstellung von
parallelen Linien interpretiert und die horizontalen Linien in diesen Kontext
eingebettet, womit der oberen Linie eine gr¨
oßere Distanz zum Beobachter
und damit auch eine h¨
ohere absolute Gr¨
oße zugeordnet wird.
Ebenfalls auf dem Prinzip der linearen Perspektive basiert die in 2.8(b) dar-
gestellte M¨
uller-Lyer Illusion. Auch bei der zuerst vom deutschen Psychia-
ter und Soziologen Franz M¨
uller-Lyer beschriebenen optischen Illusion sind
die vertikalen Linien gleich lang. Jedoch wird die linke vertikale Linie im
Gegensatz zur rechten aufgrund der Einbettung in einen dreidimensionalen
Kontext als kleiner wahrgenommen.
2.4 Optische Illusionen und Wahrnehmungsph¨
anomene 17
(a) (b)
Abbildung 2.8: (a) Ponzo Illusion von 1913, (b) M¨
uller-Lyer Illusion aus dem
Jahr 1889.
Die in Abbildung 2.9(a) dargestellte Illusion wird ebenfalls als Ponzo-, zu-
weilen aber auch als M¨
uller-Lyer Illusion bezeichnet. Offenbar enth¨
alt sie
sowohl Elemente aus Abbildung 2.8(a) als auch aus Abbildung 2.8(b). Auch
hier werden die auf Rezeptorebene gleich großen, dick gezeichneten vertika-
len Balken als unterschiedlich groß wahrgenommen. Im Gegensatz dazu sind
die im 1946 vom amerikanischen Augenarzt und Psychologen Adelbert Ames
vorgestellten Ames-Raum abgebildeten Personen physikalisch betrachtet alle
¨
ahnlich groß (siehe Abbildung 2.9(b)), werden jedoch aufgrund ihrer Ent-
fernung zur Kamera unterschiedlich groß abgebildet [Bau78]. Trotz des mo-
nokularen Tiefenkriteriums, das bekannten gleichartigen Objekten aufgrund
der Gr¨
oße ihrer Abbildung auf Rezeptorebene eine Tiefe zuordnet, tendiert
die menschliche Wahrnehmung dazu, die Personen als unterschiedlich groß
wahrzunehmen. Dies geschieht nicht nur auf Abbildungsebene, sondern auch
bezogen auf die der Abbildung zugrunde liegenden Szene. Grund daf¨
ur ist
der Raum, in dessen Kontext die Wahrnehmung der Personen eingebunden
wird. Der Raum wird als rechtwinklig wahrgenommen, da die eigentlich
trapezf¨
ormige R¨
uckwand des Raumes nicht im rechten Winkel zu den Sei-
tenw¨
anden steht, sondern, bezogen auf den Betrachter, eine starke Neigung
um die vertikale Achse aufweist. Dieser Eindruck wird zus¨
atzlich verst¨
arkt
durch ebenfalls trapezf¨
ormige und unterschiedlich große T¨
uren und Fenster,
18 2 Grundlagen
(a) (b)
Abbildung 2.9: Gleiche Objektgr¨
oße auf der Ebene der sensoriellen Abbil-
dung bei der Ponzo-Illusion in (a) und gleiche absolute Ob-
jektgr¨
oße in der physischen Realit¨
at beim Ames-Raum in (b).
deren Abmessungen so gew¨
ahlt sind, dass f¨
ur eine bestimmte Perspektive
ihre Abbildung rechtwinklig erscheint.
2.4.3 Scheinkonturen
Abbildung 2.10 zeigt eine Modifikation des bereits in Kap. 2.3 vorgestellten
Kanizsa-Dreiecks. Im Gegensatz zu dem in Kap. 2.3 vorgestellten Kanizsa-
Dreieck besteht auf Rezeptorebene die Umgebung der drei schwarzen Fl¨
a-
chen hier nicht aus einer weißen Fl¨
ache, sondern aus drei Fl¨
achen mit jeweils
unterschiedlichen Grauwerten. Durch die Kanten, die von diesen Fl¨
achen ge-
bildet werden, wird eine modale Vervollst¨
andigung der Kreise unterbunden
und damit die Mehrdeutigkeiten bei der perzeptuellen Organisation verrin-
gert. Statt eines Vordergrund-Dreiecks tendiert in diesem Fall die mensch-
liche Wahrnehmung aufgrund der unterschiedlich schattierten Fl¨
achen zu
der r¨
aumlichen Interpretation einer Pyramide, die sich vor drei schwarzen
Kreisen befindet.
Die nach dem deutschen Psychologen Walter Ehrenstein benannte Abbil-
dung 2.11 erzeugt ebenfalls Scheinkonturen. In diesem Fall fungieren die
2.4 Optische Illusionen und Wahrnehmungsph¨
anomene 19
Abbildung 2.10: Modifikation des Kanizsa-Dreiecks zu einer Kanizsa Pyra-
mide (nach [GG07]).
Linienenden als induzierende Elemente und erzeugen den Eindruck eines
weißen Kreises, der sich vor den schwarzen Linien und vor einem weißen
Hintergrund befindet, gegen¨
uber dem er als wesentlich heller wahrgenom-
men wird. Der Eindruck einer Vordergrundfl¨
ache wird zerst¨
ort, wenn der
Kreis mit einer schwarzen Linie umrandet wird.
Abbildung 2.11: Ehrenstein-T¨
auschung.
20 2 Grundlagen
Abbildung 2.12: Bild eines Dalmatiners von R. C. James (aus [Mar82]).
Die geschilderten Wahrnehmungsph¨
anomene zur Scheinkonturwahrnehmung
lassen sich alle mit Bottom-Up-Prozessen erkl¨
aren, f¨
ur die lediglich induzie-
rende Elemente im sensoriellen Abbild vorhanden sein m¨
ussen. Dass aber
auch eine Wissensbasis in Form erlernter Objektprototypen eine Rolle bei
der Konturwahrnehmung spielt, zeigt Abbildung 2.12. F¨
ur die Wahrneh-
mung der Konturen des abgebildeten Dalmatiners ist Wissen ¨
uber das Aus-
sehen eines Hundes notwendig, die perzeptuelle Organisation muss in diesem
Fall also von h¨
oheren kognitiven Funktionen beeinflusst sein.
2.4.4 Figur-Grund-Gliederung
Im Fall der Abbildung 2.13 bezieht sich der Begriff optische Illusion auf die
Mehrdeutigkeit des Bildes in Bezug auf die Organisation der Fl¨
achen in einen
Vorder- und einen Hintergrund. Wird die schwarze Fl¨
ache als Vordergrund
betrachtet, so folgt die Wahrnehmung einer Vase vor weißem Hintergrund.
Wird dagegen die schwarze Fl¨
ache als Hintergrund interpretiert, so ergibt
2.4 Optische Illusionen und Wahrnehmungsph¨
anomene 21
Abbildung 2.13: Rubin Vase, zuerst um 1915 vom d¨
anischen Psychologen
Edgar Rubin vorgestellt.
sich die Profilansicht zweier Gesichter, die sich vor dem schwarzen Hinter-
grund befinden.
Obwohl Erfahrung, zusammen mit eindeutigen induzierenden Merkmalen,
wie z. B. der Stiel der Schaufel und die Hose des Mannes hinter dem Zaun,
eine Interpretation der Abbildung 2.14 nahelegen, in der ein Mann und eine
Frau sich hinter dem Zaun befinden, entsteht der Eindruck, dass der Ober-
k¨
orper der Frau und der Unterk¨
orper des Mannes sich hinter dem Zaun
befinden, w¨
ahrend der Oberk¨
orper des Mannes und der Unterk¨
orper der
Frau sich vor dem Zaun befinden.
Hierbei f¨
allt auf, dass die horizontalen Zaunlatten einen zum Rock der Frau
und zur Jacke des Mannes identischen Grauwert aufweisen. Ausschlagge-
bend f¨
ur die Wahrnehmung des Zaunes als Hintergrund in diesen Bereichen
ist nach der Hypothese von Petter [Kan79] die Tatsache, dass der Zaun d¨
un-
ner ist als die anderen gleichfarbigen Bereiche und damit als weiter entfernt
wahrgenommen wird.
22 2 Grundlagen
Abbildung 2.14: Mann und Frau mit wechselnden Figur-Grund-Attributen
in Bezug zum Zaun (aus [Kan79]).
2.5 Strategien zur perzeptuellen Organisation
Grunds¨
atzlich ist bei der Gruppierung von Konturelementen zwischen ei-
ner Verst¨
arkung salienter Konturen und einer Konturvervollst¨
andigung zu
unterscheiden. Die Verst¨
arkung salienter Konturen hat in der Regel eine
Aufbereitung der verrauschten Daten einer Kantendetektion zum Ziel und
verst¨
arkt somit ohnehin schon vorhandene Konturen [AB98, SU88]. Durch
eine Konturvervollst¨
andigung werden dagegen Konturen rekonstruiert, die
¨
uber weite Bereiche des Eingangsbildes aufgrund von Verdeckung oder feh-
lendem Kontrast zwischen Vorder- und Hintergrund nicht im Bild enthal-
ten sind. H¨
aufig wird diese Unterscheidung jedoch nicht getroffen, da eine
Auff¨
ullung von Konturl¨
ucken, wie sie im Rahmen einer Konturverst¨
arkung
stattfindet, sich oft auch ¨
uber das Ende oder den Knick einer Kontur fort-
setzen l¨
asst und damit Ph¨
anomene wie z. B. die Konturwahrnehmung im
Kanizsa-Dreieck erzeugt werden k¨
onnen. Hierbei ist jedoch zu beachten,
2.5 Strategien zur perzeptuellen Organisation 23
dass gerade amodale Vervollst¨
andigungen von Konturen, die hinter einem
texturierten Vordergrund verlaufen, der seinerseits Konturen erzeugt, nicht
ohne weiteres m¨
oglich sind. Die Mehrheit der Ans¨
atze, welche sich mit der
Thematik der Verst¨
arkung salienter Konturen oder der Vervollst¨
andigung
unterbrochener Konturen auseinandersetzen, nutzen ein bipolares Kommu-
nikationsschema [HN01, HN04, PZ89, NM01], wie es von Grossberg und
Mingolla [RGM00] vorgestellt wurde.
Eine solche Maske zur perzeptuellen Gruppierung besteht normalerweise aus
ein oder zwei symmetrischen Fl¨
ugeln, welche sowohl die Verbindungswahr-
scheinlichkeit zweier Konturelemente kodieren, als auch die Orientierung,
welche ein Konturelement in Bezug auf ein betrachtetes Konturelement auf-
weisen sollte, um mit diesem gruppiert, d. h. verbunden zu werden (vgl. Ab-
bildung 2.15).
(a) (b) (c)
Abbildung 2.15: Kommunikationsschemata in verschiedenen Ans¨
atzen: (a)
Konturdarstellung des Verbindungsschemas von Heitger
und van der Heydt [HHP+98], (b) bipolares Verbindungs-
schema nach Grossberg und Mingolla [NM01] und (c)
modellierte Brown’sche Molekularbewegung nach Williams
[ZW00] .
In [WT00] vergleichen Williams und Thornber verschiedene Formen solcher
Gruppierungsfelder. Eine detaillierte ¨
Ubersicht zur Thematik der Kontur-
verst¨
arkung findet sich in [Han03] und [NM01], wobei in [NM01] Modelle
betont werden, die eine Scheinkonturwahrnehmung implizieren. Zu nennen
sind hier die Ans¨
atze von Heitger et al. [HH93, PH01] und Neumann et
24 2 Grundlagen
al. [HSN01] als neurophysisch motivierte Verfahren, sowie das Modell von
Zweck und Williams [ZW00], welches die Brown’sche Molekularbewegung
eines Partikels von einer Quelle ausgehend modelliert.
Ein weiterer Ansatz zur perzeptuellen Gruppierung von Konturelementen
ist das von Medioni et al. begr¨
undete Tensor Voting Verfahren [GM96], wel-
ches auch in der vorliegenden Arbeit neben einer Spline-Interpolation als
eine M¨
oglichkeit der Konturvervollst¨
andigung genutzt und in Kap. 4 n¨
aher
erl¨
autert wird. In [MLT00] wurde Tensor Voting auf Konturverst¨
arkungs-
probleme in synthetischen bzw. bin¨
aren Testbildern angewandt. Dieser An-
satz wurde in [MBM02b, Bab03] auf Grauwertbilder ausgeweitet, indem in
einem Vorverarbeitungsschritt die Filterantworten sogenannter Gabor Filter
(siehe auch [Gab46, Dau88, Lee96]) als f¨
ur das Votingverfahren notwendige
Eingangstensoren kodiert wurden. Das im Tensor Voting genutzte Kom-
munikationsschema wird als Stick-Voting Feld bezeichnet (vgl. Kap. 4), ist
bipolar und bezieht sich damit auf Orientierungen mit Winkeln im Bereich
von 0◦bis 180◦, im Gegensatz zu einem direktionalen, d. h. gerichteten
Verbindungsschema, das Winkel im Bereich von 0◦bis 360◦unterscheidet.
F¨
ur den Anwendungsbereich der Konturvervollst¨
andigung mag der Einsatz
eines solchen bipolaren Voting-Feldes zwar im Kontext einer einheitlichen
Behandlung aller Konturelemente auf einer dicht besetzten Merkmalskarte
zwar Sinn machen, w¨
urde aber, wie schon erw¨
ahnt, zu St¨
orungen bei der Or-
ganisation der Konturelemente in solche Bereichen f¨
uhren, wo eine amodale
Vervollst¨
andigung in einem stark texturierten Bildbereich gefunden werden
soll. F¨
ur eine Konturvervollst¨
andigung, welche auch amodale Vervollst¨
an-
digungen mit einbezieht, wird ein gerichtetes Kommunikationsschema be-
n¨
otigt, welches ausgehend von induzierenden Elementen eine d¨
unn besetzte
Verbindungskarte erzeugt.
Ein solcher Ansatz wurde, bezogen auf das Tensor-Voting Verfahren, in
[MM01b] vorgestellt, allerdings bestanden hierbei die Eingangsbilder aus
Bin¨
ardateien und das vorgestellte monokulare Tiefenkriterium ber¨
ucksich-
tigte lediglich die L¨
ange der vervollst¨
andigten Konturen in sogenannten
2.5 Strategien zur perzeptuellen Organisation 25
”Spontaneously“ oder ”Self Splitting Figures“, d. h. Abbildungen, in denen
Vorder- und Hintergrundobjekt denselben Farb- bzw. Bin¨
arwert aufweisen
(vgl. Kap. 5.1 und Abbildung 2.14). Dar¨
uber hinaus werden in [MM01b] in-
duzierende Elemente in Form von Eckpunkten ebenfalls mit Hilfe des Tensor
Voting Verfahrens bestimmt, was, wie in Kap. 4.1 n¨
aher erl¨
autert wird, in
komplexeren nat¨
urlichen Eingangsbilderen zu hohen Fehlzuordnungen f¨
uh-
ren kann.
(a) (b) (c) (d)
Abbildung 2.16: Konturvervollst¨
andigung nach [MM01b]: (a) bin¨
ares Ein-
gangsbild, (b) detektierte Konturen, (c) Tensorkarte zur
Konturvervollst¨
andigung und (d) detektierte und vervoll-
st¨
andigte Konturen.
Zu den Ans¨
atzen, welche nicht nur eine Scheinkonturwahrnehmung bzw. Kon-
turvervollst¨
andigung realisieren, sondern dies auch mit einer Figur-Grund-
Gliederung verbinden, z¨
ahlt der Ansatz von Heitger et al. [HHP+98]. Aller-
dings wird hierbei lediglich an Eckpunkten eine reale Kontur, zusammen mit
ihrer vervollst¨
andigten Fortsetzung, als Objektgrenze des Vordergrundes an-
gesehen, w¨
ahrend der Bereich, in dem sich die zweite Kontur des Eckpunktes
befindet, dem Hintergrund zugeordnet wird (vgl. Abbildung 2.17(a)). Offen-
sichtlich f¨
uhrt ein solches Vorgehen zu Fehlzuordnungen im Falle amodaler
Vervollst¨
andigungen, wie z. B. den Kreisvervollst¨
andigungen im Kanizsa-
Dreieck. Die Autoren bemerken selbstkritisch, dass ein solch simpler Me-
chanismus get¨
auscht werden kann [HHP+98] und f¨
uhren die modalen Ver-
vollst¨
andigungen eines Zebras vor weißem Hintergrund als Beispiel an. In
26 2 Grundlagen
diesem Fall w¨
urde obiges Vorgehen den K¨
orper des Zebras als Hintergrund
klassifizieren.
In [GKP96] wird von Geiger et al. zun¨
achst eine Karte definiert, welche die
Wahrscheinlichkeit daf¨
ur angibt, dass der Bildinhalt im betreffenden Bereich
dem Vordergrund zuzuordnen ist. Auf dieser Karte findet dann ein Diffusi-
onsprozess statt, der von Figur-Grund-Unterscheidungen an Schl¨
usselpunk-
ten ausgeht, wobei eine Diffusion ¨
uber reale Kanten hinaus verhindert wird.
Ein solcher Diffusionsprozess kann seiner Natur nach ein Bild nur in die zwei
Kategorien von Vordergrund und Hintergrund unterteilen (vgl. Abbildung
2.17(c)). Eine Betrachtung komplexer Tiefenverh¨
altnisse, wie Objekte, die
ihren Zustand von Vorder- zu Hintergrund wechseln, ist nicht m¨
oglich. So
werden auch nur synthetische, bin¨
are Eingangsbilder betrachtet, welche in
der wahrscheinlichsten dreidimensionalen Interpretation lediglich zwei Tie-
fenebenen aufweisen.
Ebenso werden im Ansatz von Williams [Wil94, WH96] nur bin¨
are syntheti-
sche Eingangsbilder betrachtet (vgl. Abbildung 2.17(d)). Die Vervollst¨
andi-
gung okkludierter Oberfl¨
achen leitet die Figur-Grund-Entscheidung f¨
ur Kon-
turkreuzungen aus einer kombinatorischen Betrachtung der Konstellation an
diesen Schl¨
usselpunkten ab. Hierbei werden lokale Kriterien ausschließlich
in die globale Organisation eingeschlossen, was die Betrachtung global in-
konsistenter Konstellationen verhindert. Dieses Vorgehen wird dabei nicht
mit dem in [ZW00] vorgestellten Gruppierungsverfahren kombiniert.
Auch das von Saund vorgestellte Verfahren basiert im Gegensatz zur vorlie-
genden Arbeit aus einer kombinatorischen Betrachtung der m¨
oglichen Figur-
Grund-Entscheidungen an Kreuzungspunkten [Sau99a, Sau99b]. Die Kon-
turvervollst¨
andigung geht also der Figur-Grund-Gliederung nicht voraus,
sondern ist Folge des kombinatorischen Entscheidungsprozesses (vgl. Ab-
bildung 2.17(b)). In [Sau99a] wird das pr¨
asentierte Verfahren auf ein na-
t¨
urliches Eingangsbild angewandt, wobei anhand von Fehlzuordnungen der
Einfluss der Bildvorverarbeitung aufgezeigt wird.
2.5 Strategien zur perzeptuellen Organisation 27
(a) (b) (c) (d)
Abbildung 2.17: Kanizsadreiecke, obere Reihe: Eingangsbild und untere
Reihe: Ergebnis des jeweiligen Verfahrens: (a) vervollst¨
an-
digte Konturen nach Heitger et al. , kleine Linien zeigen in
Richtung des Hintergrundes (aus [PH01]), (b) eine m¨
ogliche
Konturvervollst¨
andigung nach Saund, Pfeile und Schattie-
rung zeigen in Richtung des Hintergrunds, gestrichelte Li-
nien deuten amodale Vervollst¨
andigungen an (aus [Sau99a]),
(c) nach Geiger et al. durch Diffusion bestimmte Wahr-
scheinlichkeit, dass der Bildinhalt zum Vordergrund geh¨
ort
(aus [GKP96]) und (d) stochastisches Vervollst¨
andigungs-
feld nach Williams et al. (aus [WJ96])
Insgesamt l¨
asst sich festhalten, dass Ans¨
atze zur perzeptuellen Gruppie-
rung, die nat¨
urliche Eingangsbilder pr¨
asentieren, diese zumeist nutzen, um
die Grenzen des Verfahrens aufzuzeigen [HHP+98, Sau99a]. Die eigentliche
Funktionsweise des Verfahrens wird in der Regel an einer optischen Illu-
sion wie dem Kanizsa-Dreieck demonstriert. Hieraus wird die Bedeutung
einer Bildvorverarbeitung ersichtlich, welche f¨
ur einen Prozess der perzep-
tuellen Organisation in komplexen realen Bildern notwendig ist. Ebenso
f¨
allt auf, dass existierende Ans¨
atze zur perzeptuellen Organisation ledig-
lich eine bin¨
are Figur-Grund-Gliederung an Konturkreuzungen vornehmen.
28 2 Grundlagen
Eine Zuweisung relativer Tiefe entlang der gesamten Kontur, ob real oder
vervollst¨
andigt, findet nicht statt.
3 Bildvorverarbeitung
Ziel der Bildvorverarbeitung ist es, nachfolgenden Verarbeitungsschritten
m¨
oglichst genaue und vollst¨
andige Informationen ¨
uber die Position und die
Orientierung von Konturelementen bereitzustellen. Gerade f¨
ur die Ver-
vollst¨
andigung von Konturen, die aufgrund einer Verdeckung oder fehlen-
dem Kontrast zwischen Vorder- und Hintergrund unterbrochen sind, wird
nicht nur die Position einer solchen Konturunterbrechung ben¨
otigt, sondern
auch die Richtung, in der die unterbrochene Kontur fortgesetzt werden soll.
Dies stellt ein wesentliches Kriterium f¨
ur die Wahl der Filter, welche zur
Kontur- bzw. Kantendetektion und zur Detektion von Ecken oder Kon-
turkreuzungspunkten genutzt werden, dar. F¨
ur den Anwendungsbereich
der Kantendetektion haben sich gradientenbasierte Filtermethoden etabliert
[MS98, ZT98]. Die Filtermasken, die in diesem Zusammenhang genutzt wer-
den, basieren in der Regel auf einer Diskretisierung eines Ableitungsopera-
tors erster Ordnung (vgl. Abbildung 3.1). Kanten, d. h. orientierte Kon-
trastunterschiede im Grau- oder Farbwertverlauf eines Bildes, sind hierbei
als lokale Extremstelle der Filterantwort gegeben.
Durch die Diskretisierung der Summe der beiden reinen zweiten Ableitungen
erh¨
alt man einen Laplaceoperator, welcher Kanten durch Nullstellendurch-
g¨
ange in der Filterantwort anzeigt. Da Kantendetektoren, welche auf Diskre-
tisierungen von Gradienten basieren, h¨
aufig empfindlich auf Rauschen rea-
gieren, ist es ¨
ublich, die Filtermaske mit einem Tiefpassfilter, welches h¨
aufig
aus einer gaußf¨
ormigen Funktion besteht, zu kombinieren [GW08, JHG99].
Dies f¨
uhrt wiederum zu einer erh¨
ohten Lokalisierungsungenauigkeit der Kan-
tendetektion. Daher muss bei einem solchen Vorgehen immer ein Kompro-
miss zwischen Rauschunempfindlichkeit und Lokalisierungsgenauigkeit ge-
funden werden. Wie schon erw¨
ahnt, wird f¨
ur die Erzeugung von Konturver-
30 3 Bildvorverarbeitung
−10
0 1
0−1
1 0
(a) (b)
−1−2−1
000
121
−10 1
−20 2
−10 1
0 1 0
1−41
0 1 0
(c) (d) (e)
Abbildung 3.1: (a) bis (d): Koeffizienten f¨
ur gradientenbasierte Filtermasken
(a) und (b) Roberts Filter und (c) und (d) Sobel Filter,
(e) Laplace Filter.
vollst¨
andigungen, wie sie in Kapitel 4 vorgestellt wird, nicht nur die Position
von Kanten und Eckpunkten ben¨
otigt, sondern auch die Orientierung von
Kanten und die Orientierung von m¨
oglichen Kantenfortsetzungen an Kreu-
zungspunkten. Weiterhin wird in Kapitel 4.2 ein Mechanismus zur Ber¨
uck-
sichtigung von Hell- Dunkel¨
uberg¨
angen an Kreuzungspunkten ben¨
otigt. Im
Folgenden wird daher auf eine Kombination verschiedener Filtermasken zu-
r¨
uckgegriffen, welche nicht nur die geforderten Informationen liefert, sondern
dar¨
uber hinaus auch eine schwellwertunabh¨
angige Kantendetektion erm¨
og-
licht. Weiterhin bietet sie eine im Vergleich zu reinen Gradientenfiltern gute
Lokalisierung bei gleichzeitiger Toleranz gegen¨
uber Rauschprozessen.
Eine nat¨
urliche Szene ist in der Regel derart komplex aufgebaut, dass eine
Kanten- und Eckendetektion eines hochaufgel¨
osten Bildes unz¨
ahlige Ecken
und Kanten liefert, die in ihrer Skalierung korrekt erkannt sein m¨
ogen, aber
einem Betrachter, der seine subjektive Skalierung an die ihn interessieren-
den Objekte anpasst, als unsinnig erscheint. Es ist daher w¨
unschenswert,
3.1 Filterung 31
ein Eingangsbild zu simplifizieren, d. h. hochfrequente Bildinhalte entspre-
chend einer gew¨
unschten Skalierung aus dem Bild zu entfernen und damit
das Bild auf die wesentlichen Bildinhalte zu reduzieren. Die hier nahelie-
gende Funktionen, welche eine Tief- oder Bandpasscharakteristik aufweisen,
w¨
urden neben hochfrequenten Bildanteilen allerdings auch Informationen
¨
uber saliente Kanten l¨
oschen oder ver¨
andern. Ein Mechanismus, der eine
Gl¨
attung des Eingangsbildes unter Beibehaltung salienter Kanten bewirkt,
wird in Form eines anisotropen Regularisierungsverfahrens in Kapitel 3.3
vorgestellt.
3.1 Filterung
Alle im Folgenden vorgestellten Filter basieren auf einer Gaußfunktion
g(x, y) = w(x, y)·e
−k(x, y)Tk2
2
σ,(3.1)
wobei (x, y)Tdie Bildposition innerhalb der Faltungsmaske angibt. Da im
Anwendungsfall die Filtermaske einen begrenzten Radius raufweist, wird
der Parameter σso gew¨
ahlt, dass f¨
ur einen Wert ε > 0 im Fall w(x, y)≡1
die Gaußfunktion unter den Wert εf¨
allt:
σ=−r2
ln(ε)(3.2)
Im Folgenden wird, um hinreichend niedrige Werte am Rand der Filtermaske
zu gew¨
ahrleisten, ε= 0,01 gew¨
ahlt. ¨
Uber die Gewichtungsfunktion wsollen
drei verschieden geformte Klassen von Faltungsmasken erzeugt werden, von
denen zwei orientierungsselektiv sind. Die Orientierungsselektivit¨
at zu ei-
nem gegeben Winkel αwird durch eine Rotation der Bildposition p= (x, y)T
in den Prototyp gder jeweiligen Filtermaske erreicht. F¨
ur die orientierungs-
abh¨
angige Filtermaske fergibt sich somit
32 3 Bildvorverarbeitung
f(p) = g(R·p) mit R= cos(α)−sin(α)
sin(α) cos(α)!(3.3)
Durch die Wahl der Vorzeichen der Gewichtungsfunktion wird, wie im Fol-
genden erl¨
autert, die Form der Filtermaske bestimmt. Weiterhin wird die
Gewichtungsfunktion wso gew¨
ahlt, dass
X
p
f(p) = 0 (3.4)
gilt und die Filterantworten auf einen gemeinsamen maximalen Wert der
Filterantwort normiert werden.
(a) (b)
(c)
Abbildung 3.2: Kontinuierliche Darstellung der Filtermasken: (a) Kanten-
filter (b) Eckfilter (c) Zentrum-Umfeld Filter.
3.1 Filterung 33
Wird f¨
ur die Gewichtungsfunktion
w(x, y) := w(x) = sgn(x) (3.5)
gew¨
ahlt, so ergibt sich als Prototyp die in Abbildung 3.2(a) dargestellte
Filtermaske, die im Folgenden als Kantenfilter bezeichnet wird.
(a) (b) (c) (d) (e)
Abbildung 3.3: Orientierungsselektive gaußf¨
ormige Kantenfilterbank f¨
ur Ori-
entierungswinkel von: (a) 60, (b) 90, (c) 120, (d) 150 und
(e) 180 Grad. Obere Reihe: Filterradius 4 Pixel und untere
Reihe: Filterradius 7 Pixel.
Die hieraus folgenden diskreten Filtermasken sind f¨
ur verschiedene Radien
und Orientierungen in Abbildung 3.3 dargestellt. Dabei zeigen helle Grau-
werte positive Vorzeichen der Filtermaske an, w¨
ahrend dunkle Grauwerte ne-
gative Vorzeichen bedeuten. Da die Breite der Filtermaske immer dem dop-
pelten Filterradius entspricht, ist der Funktionswert x= 0 der Signumfunk-
tion in Gleichung (3.5) f¨
ur die Bestimmung der Koeffizienten der diskreten
Filtermaske uninteressant. Die hier pr¨
asentierten Kantenfilter weisen einen
eindeutigen maximalen Ausschlag im Falle einer entsprechend orientierten
stufenartigen Diskontinuit¨
at des Grauwertverlaufs auf, wie sie an Objekt-
kanten auftritt. Im Gegensatz dazu w¨
urde ein Filter mit ungerader Zeilen-
und Spaltenanzahl in einem solchen Fall zwei maximale Ausschl¨
age erzeugen.
34 3 Bildvorverarbeitung
(a) (b) (c)
Abbildung 3.4: Ergebnisse der Filterung mit den in Abbildung 3.3 und 3.2(a)
dargestellten Kantenfiltern, einem Filterradius von sieben Pi-
xeln und 24 betrachteten Orientierungen. (a) Eingangsbild,
(b) Filtermaximum und (c) Winkel der betragsgr¨
oßten Fil-
terantworten.
Zu dem h¨
aufig in der Bildverarbeitung genutzten Testbild ”Lena“ [Pla72] in
Abbildung 3.4(a) ist in Abbildung 3.4(b) zu jedem Bildpunkt der jeweils
h¨
ochste Betrag aller Kantenfilterantworten dargestellt. Hohe Betr¨
age sind
dabei hell dargestellt, w¨
ahrend schwarz den Wert Null repr¨
asentiert.
Die Filterantwort nach Faltung der Kantenfiltermaske mit dem Eingangsbild
unterscheidet sich bei zwei Orientierungen αund α+ 180◦lediglich durch
ihr Vorzeichen. Es werden daher f¨
ur die Kantenfilter nur Orientierungen im
Bereich von 0◦bis 180◦betrachtet, wobei der Winkelbereich entsprechend
der Anzahl der betrachteten Orientierungen in ¨
aquidistante Abschnitte ein-
geteilt wird. In Abbildung 3.4(c) ist zu jedem Bildpunkt der Winkel des
Kantenfilters mit der betragsgr¨
oßten Filterantwort dargestellt. Um auf den
f¨
ur Digitalbilder ¨
ublichen Wertebereich von 0 bis 255 zu normieren, wird
die Winkelinformation in Abbildung 3.4(c) zu gegebenem Winkel ϕmittels
(sin(ϕ) + 1) ·127.5 visualisiert.
Durch eine geeignete Wahl der Gewichtsfunktion wl¨
asst sich der in Abbil-
dung 3.2(b) dargestellte Verlauf der Filtermaske erzielen. Die Gewichte sind
3.1 Filterung 35
(a) (b) (c) (d) (e)
Abbildung 3.5: Orientierungsselektive gaußf¨
ormige Eckfilterbank f¨
ur Orien-
tierungswinkel von: (a) 60, (b) 90, (c) 120, (d) 150 und (e)
180 Grad. Obere Reihe: Filterradius 4 Pixel und untere
Reihe: Filterradius 7 Pixel.
dabei so normiert, dass bei maximaler Filterantwort der Betrag des im Fol-
genden als Eckfilter bezeichneten Filters dem des Kantenfilters entspricht.
Dies wird in Kap. 3.2 Bedeutung f¨
ur die Vergleichbarkeit der Filterantwor-
ten haben. In Abbildung 3.5 sind wieder die diskreten Filtermasken f¨
ur
unterschiedliche Orientierungen und f¨
ur zwei unterschiedliche Filterradien
dargestellt. Da das Filter im Gegensatz zum Kantenfilter nicht spiegelsym-
metrisch ist, wird hier die doppelte Anzahl an Orientierungen ber¨
ucksichtigt,
d. h. es werden Winkel im Bereich von 0◦bis 360◦betrachtet.
(a) (b)
Abbildung 3.6: Zentrum-Umfeld Filter mit einem Filterradius von (a) 4 Pi-
xel und (b) 7 Pixel.
36 3 Bildvorverarbeitung
Die in Abbildung 3.6 dargestellten diskreten Zentrum-Umfeld Filtermasken
werden im Folgenden als ZU-Filter bezeichnet und entstehen durch eine
Vorzeichen¨
anderung der inneren vier Pixel der Filtermaske. ¨
Ahnlich dem
Marr-Hildreth-Operator bzw. Laplacian of Gaussian (LoG) liefert das ZU-
Filter durch Nulldurchg¨
ange einen Hinweis auf Kanten, w¨
ahrend die Maxima
auf Linien oder einzelne Punkte schließen lassen [Mar82]. Auch hier ist der
Betrag der maximalen Filterantwort auf den der bereits vorgestellten Filter
normiert. Im Gegensatz zu diesen ist das ZU-Filter nicht orientierungsse-
lektiv.
(a) (b) (c)
Abbildung 3.7: Filterergebnisse f¨
ur das Lena Testbild in Abbildung 3.4.
(a) Kantenfilter mit einer Orientierung von α= 150◦, (b)
Eckfilter, ebenfalls mit einer Orientierung von α= 150◦und
(c) ZU-Filter. Der Filterradius der Filtermasken betrug je-
weils 7 Pixel. Untere Reihe: Vergr¨
oßerung der Augen-Region.
F¨
ur die verschiedenen Filterklassen ist in Abbildung 3.7 jeweils ein Bei-
spiel der Filterantwort gegeben, wobei wieder positive Werte hell dargestellt
werden, negative Werte dunkel dargestellt werden und die Null auf einen
mittleren Grauwert abgebildet wird. F¨
ur das Kantenfilter in Abbildung 3.7
(a) und das Eckfilter in Abbildung 3.7 (b) ist jeweils die Filterantwort des
Filters mit einer Orientierung von 150◦dargestellt (vgl. Abbildung 3.3(d)
3.2 Detektion von Konturen und Kreuzungspunkten 37
und Abbildung 3.5(d)). F¨
ur das ZU-Filter existiert lediglich eine, orientie-
rungsunabh¨
angige Filterantwort, die in Abbildung 3.7(c) dargestellt ist.
Das unterschiedliche Verhalten der Filter wird in den Vergr¨
oßerungen der
Augenregion in der unteren Reihe deutlich. Betrachtet man die Kante,
d. h. die Diskontinuit¨
at des Grauwertverlaufs, welche sich im Originalbild
im Bereich zwischen Hut und Gesicht befindet, so l¨
asst sich feststellen, dass
Kanten- und Eckfilter ein relatives Maximum der Filterantwort aufweisen,
hier dunkel dargestellt, w¨
ahrend das ZU-Filter, durch einen Hell-Dunkel-
Wechsel dargestellt, im Konturbereich einen Vorzeichenwechsel und damit
eine Nullstelle aufweist. Offensichtlich reagieren Eckfilter, genau wie Kan-
tenfilter, auf Kanten. Aufgrund ihrer Konstruktion und Normierung f¨
allt die
Filterantwort an der Position einer idealen Kante allerdings im Vergleich
zum Kantenfilter niedriger aus. Dieser Zusammenhang wird in Kap. 3.2
genutzt, um eine schwellwertfreie Kantendetektion zu realisieren.
3.2 Detektion von Konturen und Kreuzungspunkten
Eine auf gradientenbasierten Faltungsmasken (vgl. Abbildung 3.1) beru-
hende Kantendetektion ist in der Regel mit der Bildung eines Schwellwertes
verbunden. Ansonsten w¨
urden auch solche Bildelemente als Kante dekla-
riert, die zwar aufgrund von Rauschprozessen, sehr geringer Farbwertunter-
schiede oder Nichtlinearit¨
aten im Grau- oder Farbwertverlaufs eines Bildes
ein lokales Extremum in der Filterantwort erzeugen, jedoch im eigentlichen
Sinne keine Diskontinuit¨
at im Farb- oder Grauwertverlauf darstellen. Durch
eine Schwellwertoperation wird die Kantendetektion allerdings stark abh¨
an-
gig von der Helligkeit des gegebenen Bildes [Mar82, Can86, Gab46]. Eine
gewisse Abhilfe schafft hier die beim sogenannten Canny Filter h¨
aufig ge-
nutzte Vorgehensweise [Can86], bei der zun¨
achst Konturen mit einem hohen
Schwellwert extrahiert werden, um dann mit einem niedrigen Schwellwert
vervollst¨
andigt zu werden, wobei die Beleuchtungsabh¨
angigkeit aber wei-
terhin gegeben bleibt. Wird ferner die Gr¨
oße der Faltungsmaske erh¨
oht,
38 3 Bildvorverarbeitung
um den Einfluss von Rauschprozessen zu verringern, so f¨
uhrt dies zu Lo-
kalisierungsungenauigkeiten sowohl bei der Kantendetektion, als auch bei
der Bestimmung der Position von Eckpunkten. Um einen schwellwertfreien
Ansatzpunkt f¨
ur die Kantendetektion zu erhalten, wird im Folgenden zu-
n¨
achst nach einer idealen Kombination der in Kap. 3.1 vorgestellten Filter
gesucht, um die hieraus gewonnenen Kanten anschließend ebenfalls anhand
der Betrachtung der Kombinationen der Filterantworten zu vervollst¨
andi-
gen. Die Betrachtung der Kombinationen von Filterantworten erm¨
oglicht
dar¨
uber hinaus, notwendige Bedingungen f¨
ur Eckpunkte zu formulieren.
3.2.1 Schwellwertfreie Kantendetektion
Alle in Kap. 3.1 vorgestellten Filter basieren auf derselben Gaußfunktion,
was mit einer entsprechenden Normierung den Vorteil bietet, dass die Fil-
terwerte direkt miteinander vergleichbar sind. Dies ist in Abbildung 3.8 am
Beispiel der Filterantworten im Bereich einer Kante und im Bereich einer
Ecke dargestellt. Die in der Spalte (a) dargestellten Konstellationen zeigen
jeweils eine Kante bzw. eine Ecke, die eine Grenze zwischen einem wei-
ßen und einem schwarzen Bildbereich darstellen. Entlang einer horizontalen
Richtung werden die Filterantworten betrachtet, die sich aus der Faltung
der Filtermaske mit dem Eingangsbild ergeben, wobei die graue Linie in je-
dem Bild den Bereich darstellt, in dem sich die mittleren beiden Zeilen der
Filtermaske bei der Faltung befinden. Durch die Betrachtung der Filterant-
worten entlang der grau dargestellten Zeilen ergeben sich die in den Spalten
(b) bis (d) dargestellten Verl¨
aufe, wobei in (b) die Filterantworten der in
Kap. 3.1 vorgestellten Kantenfilter, in (c) die der Eckfilter und in (d) die
Filterantworten der ZU-Filter darstellt sind. F¨
ur die orientierungsselektiven
Kanten- und Eckfilter ist f¨
ur jede Bildposition der Betrag der betragsgr¨
oß-
ten Filterorientierung dargestellt, w¨
ahrend die Filterantwort des ZU-Filters
mit Vorzeichen dargestellt ist.
3.2 Detektion von Konturen und Kreuzungspunkten 39
(a) (b) (c) (d)
Abbildung 3.8: Charakteristika der Filterantworten an verschiedenen Bild-
positionen, Erl¨
auterung siehe Text.
40 3 Bildvorverarbeitung
S¨
amtliche Faltungen starten im weißen Bildbereich, sodass die Filterant-
worten alle auf der Nulllinie beginnen. Man beachte, dass der Radius der
Filtermasken in diesem Beispiel sieben Pixel betr¨
agt, was einer Filtermaske
von 14×14 Pixel entspricht. Hierdurch werden auch f¨
ur die Konstellation in
der letzten Zeile von Abbildung 3.8 Filterantworten ungleich Null erzeugt,
obwohl das Zentrum der Filtermaske sich immer im weißen Bildbereich be-
findet.
Die in der ersten Zeile von Abbildung 3.8 pr¨
asentierte Konstellation zeigt das
Verhalten der Filter im Bereich einer Kante. W¨
ahrend die Kantenfilterbe-
tr¨
age ein eindeutiges Maximum aufweisen, weisen die Betr¨
age der Eckfilter
rechts und links von der Kante einen h¨
oheren Wert auf als an der Posi-
tion der Kante selbst. Dar¨
uber hinaus sind die Eckfilterbetr¨
age bis auf die
Kantenposition an jeder Position h¨
oher als die der Kantenfilterbetr¨
age. Wei-
terhin weist das ZU-Filter an der Position der Kante einen Nulldurchgang
auf. Damit ist eine schwellwertfreie Kondition bestimmt f¨
ur Bildpunkte, die
in jedem Fall als Kanten deklariert werden k¨
onnen. Die Kombination ei-
nes Betragsmaximums des Kantenfilters, dessen Filterantwort betragsm¨
aßig
h¨
oher ist als die Eckfilters, verbunden mit einem Vorzeichenwechsel des ZU-
Filters wird daher im Folgenden als ideale Kante bezeichnet. Experimentelle
Ergebnisse zeigen, dass glatte Kantenverl¨
aufe im allgemeinen solche idealen
Kanten erzeugen.
Ab der zweiten Zeile sind die Filterantworten f¨
ur den Fall dargestellt, dass
sich eine Ecke im Bereich der Filtermaske befindet. Statt eines ¨
Ubergangs
von einem weißen zu einem schwarzen Bildbereich sind jetzt permanent weiße
Pixel im Bereich der Filtermaske enthalten. Nimmt, wie in der zweiten und
der dritten Zeile dargestellt, der Einfluss der weißen Pixel zu und der der
schwarzen Pixel ab, so ergibt sich eine ver¨
anderte Charakteristik der Fil-
terantworten. Bewegt sich schließlich, wie in der vierten Zeile zu sehen ist,
das Zentrum der Filtermaske direkt ¨
uber die Position des Eckpunktes, so
ergeben sich, im Vergleich zur idealen Kante, g¨
anzlich andere Filterantwor-
3.2 Detektion von Konturen und Kreuzungspunkten 41
ten. So liegt z. B. der maximale Ausschlag des Eckfilters ¨
uber dem des
Kantenfilters.
Die Kantendetektion der vorliegenden Arbeit beruht auf einem Tracking-
Verfahren, das, ausgehend von einer noch nicht behandelten idealen Kante,
diese fortzusetzen versucht. Hierbei wird zun¨
achst nach einem benachbar-
ten Bildpunkt gesucht, der ebenfalls eine ideale Kante darstellt. Liegt eine
solche nicht vor, wird nach der n¨
achstwahrscheinlichen Filterkombination
gesucht, also nach einem Kantenfiltermaximum mit einem Nulldurchgang
des ZU-Filters, wobei die Betr¨
age des Eckfilters h¨
oher sind als die des Kan-
tenfilters. Liegt auch eine solche Filterkombination nicht vor, werden die
weiteren m¨
oglichen Kombinationen bis hin zu einem einfachen Nulldurch-
gang des ZU-Filters betrachtet. Die Kontursuche endet, wenn keine Fortset-
zung gefunden wird oder das Tracking-Verfahren auf eine schon behandelte
oder die aktuell behandelte Kante trifft. In dem Fall, dass das Tracking-
Verfahren auf eine bereits behandelte Kante trifft, entsteht eine sogenannte
T-Kreuzung, d. h. ein Kantenelement, das drei benachbarte Kantenelemente
aufweist.
3.2.2 Detektion von Kreuzungspunkten
Um Kanten zu vervollst¨
andigen, die durch Verdeckung oder fehlenden Kon-
trast zwischen Vorder- und Hintergrund unterbrochen sind, werden als Aus-
gangspunkt der Vervollst¨
andigung die Positionen der Bildpunkte ben¨
otigt,
die das Ende des realen Konturverlaufs markieren. Im Falle einer Ver-
deckung stellen diese Bildpunkte in der Regel den Kreuzungspunkt zweier
Objektgrenzen dar. Solche Punkte, im Folgenden als Kreuzungspunkte be-
zeichnet, k¨
onnen auf Abbildungsebene sowohl zwei oder drei Konturen tren-
nen oder den Endpunkt einer einzelnen Kontur darstellen. Verschiedene
Konstellationen sind in Abbildung 3.9 exemplarisch dargestellt.
42 3 Bildvorverarbeitung
(a) (b) (c)
Abbildung 3.9: Verschiedene Kreuzungspunkte: (a) Endpunkt,
(b) T-Kreuzung und (c) Eckpunkt.
Eine Linie wie in Abbildung 3.9(a) wird beim Kantentracking-Verfahren ent-
sprechend Kap. 3.2 ¨
uber relative Extrema der ZU-Filterantwort detektiert.
Entsteht das dargestellte Linienende durch Verdeckung, so gibt es drei m¨
og-
liche vom Kreuzungspunkt ausgehende Fortsetzungsrichtungen, die Fortset-
zung der Linie selbst und die Objektgrenze des verdeckenden Objektes, die
sich zu beiden Seiten des Endpunktes erstreckt. Die Linie ist in Abbildung
3.9(a) schwarz dargestellt, die Vervollst¨
andigungsrichtungen dagegen weiß.
Die beiden Richtungen, die die Objektgrenze des verdeckenden Objektes
repr¨
asentieren, sind im eigentlichen Sinn keine Konturfortsetzungen, dienen
aber der Konturvervollst¨
andigung des verdeckenden Objektes und damit der
Scheinkonturwahrnehmung. Es f¨
allt auf, dass diese beiden Vervollst¨
andi-
gungsrichtungen im rechten Winkel zur realen Kontur gew¨
ahlt sind, obwohl
durchaus andere Neigungen denkbar sind. Auch wenn in [GM96] argumen-
tiert wird, dass eine zur unterbrochenen Kontur rechtwinklige Objektgrenze
als am wahrscheinlichsten anzusehen ist, stellt die rechtwinklige Wahl der
Vervollst¨
andigungsrichtungen aber lediglich eine Approximation dar.
Die Richtungen der Konturvervollst¨
andigungen lassen sich aus der Richtung
der Linie ableiten, deren Orientierung sich wiederum aus der Orientierung
der betragsgr¨
oßten Kantenfilterantworten ergibt. Um die Orientierungsge-
nauigkeit zu erh¨
ohen, wird hier, wie auch bei der folgenden Detektion von
3.2 Detektion von Konturen und Kreuzungspunkten 43
T-Kreuzungen und Eckpunkten, eine Schwerpunktbildung zwischen der Fil-
terantwort der betrachteten Orientierung und den Antworten der beiden
benachbarten Orientierungen vorgenommen.
Bei der ¨
Uberlagerung dreier Fl¨
achen mit unterschiedlichem Grauwert ent-
steht eine T-Kreuzung, wie sie in Abbildung 3.9(b) zu sehen ist. Eine
solche T-Kreuzung wird w¨
ahrend des in Kap. 3.2 beschriebenen Tracking-
Verfahrens direkt als Folge der Kantendetektion erkannt. Allerdings liegt
zun¨
achst nur die Position eines Konturpunktes vor, der drei Konturen mit-
einander verbindet. Zur Ermittlung einer T-Kreuzung und damit einer
Vervollst¨
andigungsrichtung m¨
ussen zwei der Konturen einander zugeordnet
werden. Diese beiden Konturen stellen damit im Fall einer Verdeckung die
Kontur der verdeckenden Fl¨
ache dar, w¨
ahrend die dritte Kontur an der
verdeckenden Fl¨
ache endet und durch ihre Richtung die Vervollst¨
andigungs-
richtung vorgibt. Um zwei Konturen einander zuzuordnen, werden die durch
die Kantenfilter gewonnenen Orientierungen aller drei Konturen miteinan-
der verglichen. Die beiden Konturen, deren Orientierungen die geringste
Winkeldifferenz aufweisen, wobei die Winkeldifferenz unter einem Schwell-
wert liegen muss, werden zu einer Kontur zusammengefasst. Der Schwell-
wert wird im Folgenden zu 30◦gew¨
ahlt, was eine gewisse Toleranz gegen¨
uber
Ungenauigkeiten in der Orientierungsbestimmung gew¨
ahrleistet. Liegt keine
der Winkeldifferenzen unter dem Schwellwert, kann keine sinnvolle Aussage
¨
uber die Vervollst¨
andigungsrichtung getroffen werden. Es handelt sich in
diesem Fall um eine sogenannte Y-Kreuzung.
K¨
onnen Endpunkte und T-Kreuzungen noch direkt ¨
uber die Anzahl benach-
barter Konturelemente bestimmt werden, so ist dies f¨
ur einen Eckpunkt, wie
er in Abbildung 3.9(c) dargestellt ist, nicht ohne weiteres m¨
oglich, da sowohl
der Eckpunkt als auch alle Konturelemente, die keinen Kreuzungspunkt dar-
stellen, zwei benachbarte Konturelemente aufweisen. Dar¨
uber hinaus ist zu
beachten, dass ab einer bestimmten Skalierung kein Unterschied mehr be-
steht zwischen einer Ecke und zwei diagonal benachbarten Konturelementen.
Im Kontext dieser Arbeit sind Diskontinuit¨
aten im Orientierungsverlauf von
44 3 Bildvorverarbeitung
(a) (b) (c)
Abbildung 3.10: Filterantworten an einer rechtwinkligen Ecke entsprechend
Abbildung 3.8: (a) Maximum der Betr¨
age der Kantenfilter-
orientierungen, (b) Maximum der Betr¨
age der Eckfilterori-
entierungen, und (c) vorzeichenbehaftete Filterantwort des
ZU-Filters.
Interesse, die einen Hinweis auf unterbrochene Konturverl¨
aufe liefern k¨
on-
nen. Hierbei kommt wieder die Betrachtung der in Kap. 3.1 vorgestellten
Filterantworten zum Tragen.
Betrachtet man die Abbildungen 3.10 und 3.8, so l¨
asst sich feststellen, dass
im Bereich der Ecke die Betragsmaxima der Eckfilter h¨
oher sind als die der
Kantenfilter. Die Ecke liegt also nicht im Bereich einer idealen Kante, wie
sie in Kap. 3.2 definiert wurde. Das intuitive Vorgehen zur Bestimmung der
genauen Position der Ecke k¨
onnte eine Suche nach einem Betragsmaximum
der Eckfilter entlang eines nichtidealen Kantenabschnitts sein. Es zeigt sich
jedoch, dass ein solches Vorgehen bei Eckpunkten, die keinen rechten Winkel
aufweisen, zu Lokalisierungsungenauigkeiten f¨
uhrt. Dagegen f¨
uhrt die Su-
che nach einem Betragsminimum des ZU-Filters entlang eines nichtidealen
Kantenabschnitts unabh¨
angig vom eingeschlossenen Winkel zu zuverl¨
assigen
Ergebnissen. Ein solches Vorgehen schließt jedoch solche stumpfen Winkel
aus, deren Winkelinformation in Zusammenhang mit der Filterung zu ei-
ner idealen Kante f¨
uhrt. Daher findet in einem Nachbearbeitungsschritt
zus¨
atzlich eine Eckensuche ¨
uber ideale Kantenelemente statt, welche eine
3.3 Anisotrope Regularisierung 45
hohe Winkeldifferenz zu ihren beiden Nachbarn aufweisen, in deren weite-
rer Nachbarschaft sich aber hinreichend viele Kantenelemente mit niedriger
Winkeldifferenz befinden. Auch hier ergeben sich die Orientierungen der
Eckpunkte und die daraus folgenden Richtungen m¨
oglicher Fortsetzungen
aus den Orientierungen der betragsgr¨
oßten Kantenfilter in den entsprechen-
den Bildpunkten.
Bezogen auf die Nachbarschaften eines Pixels sind offensichtlich auch Kreu-
zungspunkte denkbar, die bis zu acht Konturen miteinander verbinden. Ein
solcher Fall ist allerdings nicht nur unwahrscheinlich, es ließen sich dar¨
uber
hinaus auch keine sinnvollen Vervollst¨
andigungsrichtungen bestimmen. Im
Rahmen dieser Arbeit werden daher nur Kreuzungspunkte betrachtet, die
maximal drei Kanten miteinander verbinden.
3.3 Anisotrope Regularisierung
Die Idee anisotroper Diffusion in der Bildverarbeitung, also der Diffusion
bzw. Gl¨
attung eines Bildes entlang einer bevorzugten Orientierung, l¨
asst
sich zur¨
uckf¨
uhren auf einen zuerst von Perona und Malik vorgestellten Dif-
fusionsprozess, dessen Diffusionsst¨
arke vom Bildinhalt an der jeweiligen Po-
sition abh¨
angt [PM90]. Das hiermit erzielte nicht homogene Verhalten, wel-
ches von Perona und Malik irref¨
uhrenderweise als anisotrop bezeichnet wird,
erm¨
oglicht die Gl¨
attung eines Bildes mit einer gleichzeitigen Verst¨
arkung sa-
lienter Konturen. Ziel ist es hierbei, im Gegensatz zu einer einfachen gauß-
f¨
ormigen Gl¨
attung, eine von der Skalierung, also der St¨
arke der Gl¨
attung,
unabh¨
angige Lokalisierung von Kanten zu erreichen.
46 3 Bildvorverarbeitung
Dieser Ansatz wird von Weickert aufgenommen [Wei96, Wei99], der wie
Perona und Malik die Diffusionsgleichung
∂u
∂t =∇ · (D∇u) (3.6)
nutzt, wobei er allerdings statt der von Perona und Malik vorgeschlage-
nen skalarwertigen Funktion den richtungsabh¨
angigen Diffusionstensor D
einf¨
uhrt, der aus einer Strukturtensorbeschreibung des Eingangsbildes ge-
wonnen wird, um die lokale Bildstruktur zu beschreiben. Erst durch die
Richtungsabh¨
angigkeit des Diffusionstensors Dund damit durch die Rich-
tungsabh¨
angigkeit der Diffusion selbst kann der Diffusionsprozess im eigent-
lichen Sinn als anisotrop bezeichnet werden. Ein wesentlicher Nachteil der
Strukturtensorbeschreibung, speziell in Verbindung mit einer gaußf¨
ormigen
Gl¨
attung, ist die hohe Orientierungsunsicherheit in der N¨
ahe von Kreuzungs-
punkten.
Auch wenn Diffusionsfilter entsprechend Gleichung (3.6) und eine auf Re-
gularisierungsmethoden basierende Diffusion, wie sie im Folgenden zur Rea-
lisierung einer anisotropen Diffusion entwickelt wird, eng miteinander ver-
kn¨
upft sind, besteht ein wesentlicher Unterschied darin, dass der Skalen-
raum, welcher die gefilterten Bilder f¨
ur s¨
amtliche Gl¨
attungsst¨
arken umfasst,
in Gleichung (3.6) durch die Zeit taufgespannt wird und das Diffusionsfil-
terergebnis f¨
ur eine hohe Skala bzw. mit zunehmenden Zeitwert gegen ein
Bild konvergiert, das an jeder Bildposition den gleichen Grau- bzw. Farb-
wert aufweist und damit die maximale Gl¨
attung des Eingangsbildes darstellt.
Dagegen wird der Skalenraum im folgenden Regularisierungsansatz zur ani-
sotropen Diffusion durch den Gl¨
attungsparameter einer Energie- bzw. Ko-
stenfunktion, die es zu minimieren gilt, aufgespannt.
3.3 Anisotrope Regularisierung 47
Obwohl zahlreiche regularisierungsbasierte Methoden im Bereich der digi-
talen Bildverarbeitung existieren (siehe z. B. [IK99, Nor89, ABBFC97] und
enthaltene Verweise), wird in der Regel weder ein klarer und einfach zu im-
plementierender Ansatz zur anisotropen Diffusion pr¨
asentiert, noch ist die
Problematik so formuliert, dass die Existenz und Eindeutigkeit der L¨
osung
gew¨
ahrleistet ist. In [ABBFC97] wird die ¨
Uberlegenheit sogenannter kan-
tenerhaltender Modelle gegen¨
uber quadratische Regularisierung postuliert,
wie im Folgenden aber gezeigt wird, kann eine kantenerhaltende Diffusion
durchaus als quadratische Regularisierung formuliert werden (vgl. [HM08]).
Hierzu wird ein quadratischer Kostenterm definiert, der Bedingungen an
den Diffusionsprozess enth¨
alt und dessen Minimum eine optimale Erf¨
ullung
dieser Bedingungen darstellt.
3.3.1 Minimierung einer globalen Kostenfunktion
Zun¨
achst sei mdie Anzahl der Pixel eines Bildes, welche von links oben
nach rechts unten zeilenweise durchnummeriert werden. Weiterhin sei ddie
Anzahl der Farbkan¨
ale des Bildes, d. h. d= 1 im Falle eines Grauwertbil-
des und d= 3 f¨
ur ein RGB-Farbbild. Einem Bildpunkt x∈[1,...,m] und
einem Farbkanal k∈[1,...,d] wird der Farbwert ξ(x,k)zugeordnet. Der in-
itiale Farbwert des urspr¨
unglichen Eingangsbildes sei mit ξ(x,k)0bezeichnet.
Weiter seien die Farbwerte in einem Vektor
ξ= (ξ(1,1),...,ξ(m,1), ξ(1,2),...,ξ(m,d))T(3.7)
zusammengefasst. F¨
ur das urspr¨
ungliche Bild gilt analog ξ0∈Rm·dmit
ξ0= (ξ(1,1)0,...,ξ(m,1)0, ξ(1,2)0,...,ξ(m,d)0)T(3.8)
48 3 Bildvorverarbeitung
Wahl der Kostenfunktion
Eine kantenerhaltende Gl¨
attung des Eingangsbildes basiert auf der An-
nahme, dass benachbarte Bildpunkte, die gemeinsam auf einer Objektober-
fl¨
ache liegen, ann¨
ahernd gleiche Farbwerte aufweisen. Nur an Objektgrenzen
treten Diskontinuit¨
aten des Farbverlaufs auf. Eine solche Bedingung l¨
asst
sich durch einen ersten Kostenterm der Form
P1(ξ) = c1
4·
d
X
k=1
m
X
i=1 X
j∈Ui
wij(ξ(i,k)−ξ(j,k))2(3.9)
formulieren, der Kosten verursacht, falls benachbarte Pixel ungleiche Farb-
werte aufweisen. Dabei stellt zu einem gegebenen Bildpunkt xdie Menge Ux
eine quadratische Nachbarschaft des Bildpunktes dar, die den Punkt xselbst
nicht enth¨
alt. Die Konnektivit¨
at des Bildpunktes xmit einem benachbarten
Bildpunkt ikann ¨
uber den Gewichtungsfaktor wxi >0 gesteuert werden, wo-
bei die Gewichte nicht notwendigerweise symmetrisch sein m¨
ussen, d. h. im
Allgemeinen gilt wxi 6=wix. Um sp¨
ater die numerische Stabilit¨
at des Itera-
tionsverfahrens, das zur L¨
osung genutzt wird, zu gew¨
ahrleisten, wird f¨
ur die
Summe der Gewichte der Umgebung Uxeines Bildpunktes x
X
i∈Ux
wxi ≤Q:= X
i∈Ux
1 (3.10)
gefordert. Der Wert Qstellt hierbei die Anzahl der in der Umgebung Ux
enthaltenen benachbarten Bildpunkte dar. In Verbindung mit weiteren Ko-
stentermen dient der Gl¨
attungsfaktor c1der Steuerung des Einflusses des
Gl¨
attungsterms.
Betrachtet man den Kostenterm in Gleichung (3.9), so l¨
asst sich feststellen,
dass alle Bilder, die in jedem Bildpunkt den gleichen konstanten Farbwert
aufweisen, den Kostenterm minimieren. Es existieren also mehrere Minima
und damit keine eindeutig bestimmte L¨
osung. Um die Abh¨
angigkeit des
3.3 Anisotrope Regularisierung 49
gegl¨
atteten Bildes ξvom Ursprungsbild ξ0in die Kostenformulierung zu
integrieren, wird nun weiterhin gefordert, dass Kosten versursacht werden,
falls ein Farbwert ξ(x,k)von seinem initialen Wert ξ(x,k)0abweicht. Der
entsprechende Kostenterm lautet
P2(ξ) = c2·1
2·
d
X
k=1
m
X
i=1
(ξ(i,k)−ξ(i,k)0)2(3.11)
Auch hier dient der Faktor c2dazu, den Einfluss des Kostenterms zu steu-
ern. Die Zusammenfassung der in Gleichung (3.9) und in Gleichung (3.11)
geforderten Bedingungen ergibt nun eine globale Kostenfunktion P, deren
Minimierung zu einem entsprechend der gew¨
ahlten Gewichtungsfaktoren ge-
gl¨
atteten Bild f¨
uhrt. Bei nur zwei Bedingungen kommt es lediglich auf das
Verh¨
altnis der Gewichtungsfaktoren c1und c2an, der Faktor c2kann also
ohne Beschr¨
ankung der Allgemeinheit auf den Wert c2= 1 gesetzt werden.
¨
Ubrig bleibt nur ein Skalierungs- bzw. Gl¨
attungsfaktor c=c1.
P(ξ) = P1+P2
=1
2·
d
X
k=1
m
X
i=1
(ξ(i,k)−ξ(i,k)0)2
+c
4·
d
X
k=1
m
X
i=1 X
j∈Ui
wij(ξ(i,k)−ξ(j,k))2(3.12)
F¨
ur die partielle Ableitung nach einem Farbwert ξ(x,k)gilt
50 3 Bildvorverarbeitung
∂
∂ξ(x,k)
P(ξ) = ξ(x,k)−ξ(x,k)0
+c
2(X
j∈Ux
wxj(ξ(x,k)−ξ(j,k))
+X
{i|x∈Ui}
wix (ξ(x,k)−ξ(i,k))´(3.13)
Durch die Wahl der Potentialfunktion muss mindestens ein Minimum von
Pexistieren. Ein notwendiges Kriterium an ein Minimum von Pist durch
∇P(ξ) = 0, also
∂
∂ξ(x,k)
P(ξ) = 0 ∀ξ(x,k)(3.14)
gegeben. Hieraus ergibt sich das lineare Gleichungssystem
∇P(ξ) = A·ξ−ξ0=0.(3.15)
Die Matrix Ain Gleichung (3.15) l¨
asst sich darstellen durch
A= (ai,j)i,j ∈R(m·d)×(m·d)mit
ai,j =8
>
>
<
>
>
:
1 + c
2· X
k
wik +X
k
wki!f¨
ur i=j
−c
2·(wji +wij) sonst
(3.16)
.
Hierbei gilt wij = 0 f¨
ur j /∈Ui. Weiterhin gilt wii = 0, wij =w(i+d)(j+d)
und j /∈Ui, falls die Indizes iund jaus unterschiedlichen Farbkan¨
alen
stammen. Offensichtlich ist die Matrix Asymmetrisch und mit hAξ,ξi>0
f¨
ur ξ6=0folgt die positive Definitheit von A. Die Matrix ist damit regul¨
ar,
3.3 Anisotrope Regularisierung 51
es existiert eine eindeutig bestimmte L¨
osung von Gleichung (3.15) und somit
ein eindeutig bestimmtes Minimum von P[ZF84, Sch68].
Numerische Aspekte
L¨
osungen zur Bestimmung eines Minimums der Potentialfunktion Pbasie-
ren im Allgemeinen auf der Idee des Gradienten- oder des Newtonverfahrens
[Mei99]. Aufgrund der Regularit¨
at der Matrix Ain Gleichung (3.15) ließe
sich die L¨
osung der Gleichung theoretisch auch durch ein direktes Verfahren
bestimmen. Allerdings ist die Matrix Aschwachbesetzt, d. h. ein direk-
tes Verfahren k¨
onnte die besondere Gestalt der Matrix nicht ausnutzen und
w¨
urde vollbesetze Zwischenmatrizen generieren, was den Speicherplatzbe-
darf im Vergleich zur Speicherung des Vektors ξquadrieren w¨
urde. Die
Menge der zu bestimmenden Elemente w¨
urde dar¨
uber hinaus eine erh¨
ohte
Berechnungszeit nach sich ziehen.
F¨
ur den hier vorgestellten Diffusionsprozess wird das Gradientenverfahren
zur Bestimmung des Minimums herangezogen [Hun02, HM08]. Beim klas-
sischen Gradientenverfahren wird die Minimall¨
osung einer stetig differen-
zierbaren Funktion P:Rn→Rbestimmt, indem, ausgehend von einem
Startvektor, ein Versuchsvektor ξkiterativ in die lokal optimale Richtung
dkkorrigiert wird. In vielen iterativen Anwendungen wird keine theoretische
Konvergenzbedingung, die ein Erreichen einer L¨
osung durch das Iterations-
verfahren garantiert, angegeben. Bei jeder ¨
Anderung der Systemparameter
muss daher in solchen F¨
allen die Schrittweite experimentell angepasst wer-
den (vgl. [PM90, SW00, ABBFC97, Nor89]).
Die lokal optimale Richtung dkwird als Richtung des steilsten Abstiegs
bezeichnet und ist durch den negativen Gradienten von P gegeben, dk=
−∇P(ξk). Ist die Funktion Pan einer Stelle ξin eine Richtung ddiffe-
renzierbar und besitzt dort eine positive Richtungsableitung, so wird dals
Abstiegsrichtung von P im Punkt ξbezeichnet [Kos93]. L¨
asst man hier
auch andere Abstiegsrichtungen als die des Gradienten von Pzu, so wird
52 3 Bildvorverarbeitung
ξk+1
ξk+2
ξk
Abbildung 3.11: H¨
ohen- bzw. ¨
Aquipotentiallinien einer Potentialfunktion
Pund qualitativer Konvergenzverlauf bei lokal optimaler
Wahl der Schrittweite entsprechend Gleichung (3.18) (nach
[Mei99, Hun02]).
das Verfahren als verallgemeinertes Gradientenverfahren bezeichnet. F¨
ur
die Iteration des klassischen Gradientenverfahren gilt mit einer positiven
Schrittweite λk
ξk+1 =ξk−λk∇P(ξk), λk>0 (3.17)
F¨
ur die Bestimmung der Schrittweite λksind in der Literatur zahlreiche An-
s¨
atze zu finden (siehe z.B. [Mei99, Sch68, Kos93]). Besitzt die Funktion P
auf der durch die Abstiegsrichtung dkbestimmten Halbgerade ein eindeu-
tiges Minimum, so gew¨
ahrleistet die Regel der optimalen Schrittweite eine
Konvergenz des Verfahrens gegen ein Minimum von P. Ein besonderer Fall
ist bei einem Gradienten entsprechend Gleichung (3.15) mit symmetrischer,
positiv definiter Matrix Agegeben. Die lokal optimale Schrittweite ergibt
sich dann aus
3.3 Anisotrope Regularisierung 53
(a) (b) (c)
Abbildung 3.12: Dynamik einer Variablenschar mit (a) variabler Schritt-
weite, (b) konstanter Schrittweite und (c) konstanter
Schrittweite mit dem Nullvektor als Startvektor (aus
[Hun02])
λk=hrk,rki
hArk,rki(3.18)
mit dem sogenannten Residuenvektor
rk=−∇P(ξk) = ξ0−Aξk(3.19)
F¨
ur die H¨
ohenlinien einer Potentialfunktion Pergibt sich bei einer solchen
Wahl der Schrittweite der in Abbildung 3.11 dargestellte Verlauf.
Eine weitere M¨
oglichkeit zur Wahl von λkbesteht darin, eine konstante
Schrittweite λk=λzu w¨
ahlen. Wie in Abbildung 3.11 zu sehen ist, stellt die
lokal optimale Schrittweite nicht unbedingt eine global optimale Schrittweite
dar (vgl. [Mei99]). Dar¨
uber hinaus muss eine Schrittweite gem¨
aß Gleichung
(3.18) in jeder Iteration neu berechnet werden. Die Wahl einer konstanten
Schrittweite besitzt daher ihre Berechtigung, was auch in den Abbildun-
gen 3.12(a) und 3.12(b) festzustellen ist. Die in Abbildung 3.12(a) darge-
stellte Variablenschar, die die Dynamik der Werteverl¨
aufe bei Minimierung
einer Kostenfunktion entsprechend Gleichung (3.12) mit einer lokal opti-
54 3 Bildvorverarbeitung
malen Schrittweite entsprechend Gleichung (3.18) darstellt, weist ein hohes
Maß an Oszillation auf. Die mit einer konstanten Schrittweite bestimmten
Variablenwerte in Abbildung 3.12(b) ver¨
andern sich dagegen bereits nach
der achten Iteration nur noch unwesentlich.
Um eine konstante Schrittweite w¨
ahlen zu k¨
onnen, muss jedoch sichergestellt
sein, dass das Iterationsverfahren tats¨
achlich gegen das Minimum von P
konvergiert. Hierzu werden zun¨
achst einige Definitionen eingef¨
uhrt [Mei99].
Betrachtet wird ein lineares Gleichungssystem der Form Ax =b.
Ein Iterationsverfahren φ:Rn×Rn→Rnwird als linear bezeichnet, falls
Matrizen M,N∈Rn×nexistieren, so dass
φ(x,b) = Mx +Nb (3.20)
gilt [Mei99, Hun02]. Das Verfahren heißt konsistent zur Matrix A, wenn
f¨
ur alle b∈Rndie L¨
osung A−1bein Fixpunkt von φzu bist. Ein lineares
Iterationsverfahren ist genau dann konsistent zur Matrix A, wenn
M=I−NA (3.21)
gilt. Weiterhin ist das Verfahren genau dann konvergent, wenn der Spek-
tralradius ρ(M) der Iterationsmatrix Mdie Bedingung
ρ(M)<1 (3.22)
erf¨
ullt. Ist φein konvergentes und zur Matrix Akonsistentes lineares Ite-
rationsverfahren, so erf¨
ullt das Grenzelement der Folge xk=φ(xk−1,b) f¨
ur
jeden Startvektor x0∈Rndas Gleichungssystem Ax =b.
3.3 Anisotrope Regularisierung 55
Betrachten wir nun das Gleichungssystem (3.15) und das Iterationsverfahren
(3.17) mit konstanter Schrittweite λk=λ, so folgt mit N=λIund M=I−
NA die Linearit¨
at und die Konsistenz des Iterationsverfahrens zur Matrix
A.
Es bleibt zu zeigen, unter welchen Bedingungen die Schrittweite λdie Be-
dingung ρ(M)<1 erf¨
ullt und somit die Konvergenz des Verfahrens sichert.
Hierzu wird die Eigenschaft ρ(M)≤ kMkf¨
ur jede Matrixnorm kkausge-
nutzt [Mei99].
Sei
Qi=1
2
m
X
k=1
(wik +wki),(3.23)
wobei wieder wij = 0 f¨
ur j /∈Uiund f¨
ur i=jgelte. Sei ferner Qdie
maximale Anzahl der Pixel in einer Nachbarschaft U. Aus Gleichung (3.10)
folgt damit Q > Qi∀i.
Die Bedingung (3.22) ist erf¨
ullt, wenn kMk<1 gilt. Unter Verwendung
der Zeilensummennorm kk∞ergibt sich die Bedingung
m·d
X
k=1
|mik|<1 f¨
ur jede Reihe i(3.24)
Hieraus folgt mit Beziehung (3.16)
|1−λ(1 + c·Qi)|+λ·c·Qi<1 (3.25)
und damit
0< λ < 2
1 + 2 ·c·Qi
(3.26)
56 3 Bildvorverarbeitung
Im Folgenden wird, um die Konvergenzbedingung (3.26) zu erf¨
ullen, die
Schrittweite λzu
λ=1
1 + c·Q(3.27)
gew¨
ahlt. Mit
1
1 + c·Q<2
1 + 2 ·c·Q≤2
1 + 2 ·c·Qi
(3.28)
ist gew¨
ahrleistet, dass die in Gleichung (3.26) gegebene Konvergenzbedin-
gung erf¨
ullt ist.
Damit ergibt sich eine konstante Schrittweite, die nur von der Skalierung
bzw. dem Gl¨
attungsfaktor cund der Gr¨
oße Qder betrachteten Pixelnach-
barschaften abh¨
angt. Hierbei ist der Unterschied zu beachten zwischen dem
Startvektor des Iterationsverfahrens und dem urspr¨
unglichen Bild ξ0. Die
L¨
osung der Gleichung (3.15) ist unabh¨
angig vom Startvektor, wie in Ab-
bildung 3.12(c) zu sehen ist, der Startvektor hat lediglich Einfluss auf die
ben¨
otigten Iterationen, die zum Erreichen der L¨
osung notwendig sind. Da-
gegen h¨
angt die L¨
osung vom Eingangsbild ξ0ab, so dass, wie wiederum in
Abbildung 3.12(c) dargestellt ist, die L¨
osung auch dann erreicht wird, wenn
der Nullvektor als Startvektor genommen wird. Da aber offensichtlich das
Eingangsbild eine gute N¨
aherung an die gew¨
unschte L¨
osung darstellt, ist es
in der Regel sinnvoll, das Bild ξ0als Startvektor zu verwenden.
Der Vollst¨
andigkeit halber sei hier auf die Vielzahl weiterer iterativer Ver-
fahren zur L¨
osung von Gleichung (3.15) hingewiesen, insbesondere ist in
diesem Zusammenhang das Verfahren der konjugierten Gradienten zu nen-
nen [Mei99, Kos89, Sch68].
3.3 Anisotrope Regularisierung 57
3.3.2 Diffusion
Isotrope Diffusion
Im einfachsten Fall werden in einer quadratischen Nachbarschaft Uieines
Pixels idie Gewichtungsfaktoren symmetrisch zu
wij =wji = 1 (3.29)
gew¨
ahlt. Gleichung (3.13) vereinfacht sich dann zu
∂
∂ξ(x,k)
P(ξ) = ξ(x,k)−ξ(x,k)0
+cX
j∈Ux
(ξ(x,k)−ξ(j,k)) (3.30)
Dies erzeugt eine ungerichtete, also linear isotrope Diffusion des Eingangs-
bildes und stellt somit den klassischen Fall einer einfachen Gl¨
attung dar.
Sowohl die isotrope Diffusion als auch ein Ansatz zur anisotropen Diffusion
mit symmetrischen Gewichten, d. h. wij =wji, wurden bereits in [Hun02,
HBD03, BHM04b, BHM04a, BHM05] im Kontext stereoskopischer Korre-
spondenzbestimmung genutzt. Dabei dienten Gleichung (3.30) bzw. (3.17)
dazu, Zuordnungsmehrdeutigkeiten in einem stereoskopischen Disparit¨
ats-
raum aufzul¨
osen.
Abbildung 3.13 verdeutlicht die Eigenschaften linearer isotroper Diffusion,
wiederum am Beispiel des Lena-Bildes. Mit zunehmenden Gl¨
attungspara-
meter cwird das Eingangsbild richtungsunabh¨
angig gegl¨
attet, bis s¨
amtliche
Bilddetails verschwunden sind.
58 3 Bildvorverarbeitung
(a) (b) (c) (d)
Abbildung 3.13: Linearer isotroper Skalenraum f¨
ur das Lena-Bild: (a) c=1,
(b) c=3, (c) c=20 und (d) c=250.
Anisotrope Diffusion
Ein wichtiger Vorteil der Formulierung des Diffusionsprozesses in Gleichung
(3.12) ist die Tatsache, dass unter Beibehaltung der Bedingung (3.10) die Ge-
wichtungsfaktoren beliebig gew¨
ahlt werden k¨
onnen, ohne dass die Existenz
oder die Eindeutigkeit der L¨
osung verloren geht. Um eine anisotrope Diffu-
sion, also eine gerichtete Gl¨
attung des Eingangsbildes zu erreichen, wird die
folgende Umfeldgewichtung eines gegebenen Pixels eingef¨
uhrt. Hierzu wer-
den zu jedem Pixel die Orientierungen betrachtet, die sich aus Anwendung
der in Kap. 3.1 vorgestellten orientierungsselektiven Kantenfilter ergeben.
In Abh¨
angigkeit des Orientierungswinkels eines gegebenen Pixel ifindet eine
Rotation des quadratischen Umfeldes Uistatt. Wird hierbei ein Punkt jdes
Umfeldes auf die Koordinaten (x, y) abgebildet, so ergibt sich der Gewich-
tungsfaktor wij des entsprechenden Umfeldpixels durch die folgende Funk-
tion:
f(x, y) = 8
<
:
0 f¨
ur y > 0.7
1.0 + cos “π·y
0.7”sonst (3.31)
3.3 Anisotrope Regularisierung 59
(a) (b) (c) (d)
Abbildung 3.14: Anisotroper Skalenraum f¨
ur das Lena-Bild mit 20% un-
korreliertem Rauschen f¨
ur jedes Pixel des Eingangsbildes:
(a) Eingangsbild, (b) c=3, (c) c=20 und (d) c=250.
Gleichung (3.31) gew¨
ahrleistet eine strikte Diffusion entlang einer Richtung.
Eine st¨
arkere Kopplung von Bildpunkten, deren Verbindung nicht parallel
zu einer durch den Orientierungswinkel charakterisierten Geraden verl¨
auft,
l¨
asst sich erreichen, indem entweder die Funktion in Gleichung (3.31) in
positive y-Richtung verschoben wird oder die Konstante 0.7 erh¨
oht wird.
Es gilt
Qi=1
2X
k
(wik +wki)< Q, (3.32)
womit entsprechend Gleichung (3.28) die Konvergenz des Verfahrens gesi-
chert ist. Die Funktion (3.31) ist also wohldefiniert.
Abbildung 3.14 zeigt das Verhalten des anisotropen Diffusionsprozesses.
Jetzt wird zu jedem Pixel des Eingangsbildes 20% unkorreliertes Rauschen
addiert. Betrachtet man den Skalenraum, so f¨
allt auf, dass f¨
ur c→ ∞,
anders als im Fall linearer isotroper Diffusion, eine lokale Nachbarschaft de-
finiert werden kann, f¨
ur die das Verfahren nicht gegen einen f¨
ur alle Pixel
identischen, konstanten Farbwert konvergiert.
60 3 Bildvorverarbeitung
3.3.3 Selbstorganisation der Kanteninformation
Wie schon erw¨
ahnt, werden die ben¨
otigten Orientierungswinkel zur Bestim-
mung der Gewichtungsfaktoren wij ¨
uber die Filterergebnisse gaußf¨
ormiger
Filtermasken gewonnen. Auch bei großen Filtermasken bleibt jedoch eine
gewisse Empfindlichkeit gegen¨
uber Rauschprozessen gegeben. Um diesem
Problem Rechnung zu tragen, l¨
asst sich die anisotrope Regularisierung, wie
sie in Kap. 3.3.1 beschrieben wird, auch f¨
ur die von den Filterantworten
generierte Gradientenkarte nutzen [HM08].
Das bedeutet, dass Gleichung (3.12) f¨
ur dneu =d+ 2 auf die Kanteninfor-
mation in Form einer Gradientenkarte angewandt wird. Die Gradienten-
karte wird hierbei nach den eigentlichen Farbwerten in die letzten beiden
Schichten, d. h. die durch d+ 1 und d+ 2 charakterisierten Schichten des
Bildvektors
ξ= (ξ(1,1),...,ξ(m,d), ξ(1,d+1),...,ξ(m,d+1), ξ(1,d+2),...,ξ(m,d+2))T(3.33)
geschrieben. Die Werte der Gradientenkarte werden durch
ξ(x,d+1) =|∇gx| · cos(2 ·αx) (3.34)
und
ξ(x,d+2) =|∇gx| · sin(2 ·αx) (3.35)
f¨
ur eine Bildposition x∈[1,...,m] beschrieben. Hierbei stellt |∇gx|das
Betragsmaximum der Kantenfilter dar, w¨
ahrend αxdie vom betragsgr¨
oßten
Kantenfilter repr¨
asentierte Orientierung an der Bildposition xdarstellt. Die
urspr¨
unglichen Werte werden wieder in einem Vektor ξ0zusammengefasst.
Da die Orientierungen der Kantenfilter hier lediglich in einem Bereich von
3.3 Anisotrope Regularisierung 61
0 bis πbetrachtet werden, gew¨
ahrleistet der Faktor 2 in den Gleichungen
(3.34) und (3.35), dass auch an den Bereichsgrenzen eine kontinuierliche
Gl¨
attung der Gradientenkarte stattfindet.
W¨
ahrend des Iterationsprozesses wird nun Gleichung (3.12) in jedem Iterati-
onsschritt neu formuliert, derart, dass zu jedem Bildpunkt xaus den Werten
ξ(x,d+1) und ξ(x,d+2) aus den Gleichungen (3.34) und (3.35) der Winkel αx
neu gebildet wird. Gerade der Winkel αxist aber durch die Rotation der
Umfeldkoordinaten und damit durch die Bestimmung der Gewichtungsfakto-
ren wij ausschlaggebend f¨
ur die Form des koppelnden Umfelds eines Pixels.
Es werden somit also in jedem Iterationsschritt die Gewichtungsfaktoren in
Gleichung (3.12) in Abh¨
angigkeit des Vektors ξaktualisiert. Durch einen
nachfolgenden Iterationsschritt des Gradientenverfahrens wird wiederum der
Vektor ξin Abh¨
angigkeit der Gleichung (3.12) und damit in Abh¨
angigkeit
der Gewichtungsfaktoren aktualisiert.
Hierdurch ergibt sich ein dynamischer Selbstorganisationsprozess der Kan-
teninformation, der zu einer Verst¨
arkung salienter Konturen f¨
uhrt. Dies ist
in Abbildung 3.15 verdeutlicht. Die pr¨
asentierten Resultate wurden mit ei-
nem Kopplungsparameter c= 6, einem quadratischen Kopplungsumfeld von
7×7 Pixeln und 100 Iterationen berechnet. Das Eingangsbild 3.15(a), drei
Kieselsteine auf Pflastersteinen, ist ein Testbild aus dem Kontext der Ver-
st¨
arkung salienter Konturen (vgl. [MWTX03]) und weist im Bereich der Pfla-
stersteine einen stark texturierten Bereich mit hochfrequenten Bildanteilen
auf. Die Filterergebnisse setzen sich aus 24 unterschiedlich orientierten Kan-
tenfiltern mit einem Filterradius von jeweils sieben Pixeln zusammen, was
einer Filtermaske von 14 ×14 Pixeln entspricht. Trotzdem lassen sowohl die
Betragsmaxima der Kantenfilter in Abbildung 3.15(e) als auch die Winkel-
information in Abbildung 3.15(c) erkennen, dass die hochfrequenten Bildan-
teile ein korrektes Erkennen der Konturen der Kieselsteine und der Pfla-
stersteine erschweren. Die Textur stellt hierbei im eigentlichen Sinne kein
Rauschen dar, da die hochfrequenten Bildanteile durch sich in dem Beton
befindliche kleinere Steine erzeugt werden und somit Teil des Signals sind.
62 3 Bildvorverarbeitung
(a) (b)
(c) (d)
(e) (f)
Abbildung 3.15: Testbild mit drei Kieselsteinen auf Pflastersteinen
(aus [MWTX03]): (a) und (b) Grauwerte des Testbildes,
(c) und (d) Winkelinformation und (e) und (f) Betrags-
maximum |∇gx|der Kantenfilter, jeweils vor und nach der
Selbstorganisation der Gradientenkarte.
3.3 Anisotrope Regularisierung 63
Dennoch ist es in Bildverarbeitungsprozessen w¨
unschenswert, Signalanteile
auszublenden, die aufgrund des betrachteten Maßstabs bzw. entsprechend ei-
ner gew¨
unschten Skalierung keinen Beitrag zu weiteren Verarbeitungsschrit-
ten leisten. Im Fall der Abbildung 3.15 ist es also sinnvoll, Bildinformation
einer kleineren Skalierung zu eliminieren, um verl¨
assliche Kanteninformatio-
nen ¨
uber Objekte in der Gr¨
oßenordnung der drei Kieselsteine zu erhalten.
Wie in Abbildung 3.15(f) zu sehen ist, f¨
uhrt der beschriebene Selbstorga-
nisationsprozess der Gradientenkarte zu solch einem Ergebnis. Dargestellt
ist zu jedem Bildpunkt xdie euklidische Norm k(ξ(x,d+1), ξ(x,d+2))k2der
entsprechenden Werte der Gradientenkarte. Der Winkel, welcher sich nach
dem Selbstorganisationsprozess zu jedem Bildpunkt aus den Werten ξ(x,d+1)
und ξ(x,d+1) ergibt, ist in Abbildung 3.15(d) dargestellt. Auch die Grau-
werte selbst verdeutlichen, dass das Bild auf wesentliche Elemente reduziert
wird. In Abbildung 3.15(b), die die Bildwerte nach Selbstorganisationspro-
zess zeigt, sind die hochfrequenten Bildanteile herausgefiltert, die Position
und Form wesentlicher Konturelemente hat sich im Gegensatz zum Ergebnis
einfacher Gl¨
attungsfilter jedoch nicht ver¨
andert.
Da durch dieses Vorgehen die Systemmatrix Adurch die Winkelabh¨
angig-
keit der Umfeldkopplung vom Zustandsvektor ξabh¨
angt, A=A(ξ), er-
gibt sich ein nichtlineares System, wobei allerdings aufgrund der Wahl der
Schrittweite λin Gleichung (3.27) in jedem Iterationsschritt eine Kontrak-
tion vorliegt. F¨
ur den Spektralradius gilt nach wie vor f¨
ur jede Iteration
ρ(M(ξ)) <1, womit die Iteration gegen einen Fixpunkt konvergiert.
Um eine Verst¨
arkung der Diskontinuit¨
aten entlang von Konturverl¨
aufen zu
erreichen, ist es m¨
oglich, die Gewichtungsfaktoren wij benachbarter Bild-
punkte iund jzu Null zu setzen, falls diese sich in ihrem Farbwert minde-
stens um einen Schwellwert sunterscheiden, d. h. falls |ξ(i,k)−ξ(j,k)|< s
gilt. Es geht dabei allerdings die Eindeutigkeit der L¨
osung verloren, das Er-
gebnis des Iterationsverfahrens h¨
angt stark vom Startvektor ab. Eine gute
Wahl f¨
ur den Startvektor ist der Nullvektor oder eine gegl¨
attete Version
des Eingangsbildes. Wird dagegen das Ursprungsbild ξ0als Startvektor
64 3 Bildvorverarbeitung
(a) (b)
(c) (d)
Abbildung 3.16: Steine-Testbild: (a) Eingangsbild (b) Ergebnis der aniso-
tropen Regularisierung, (c) Ergebnis anisotroper Regulari-
sierung mit Selbstorganisation der Gradientenkarte entspre-
chend Abbildung 3.15 und (d) Ergebnis anisotroper Regu-
larisierung mit Selbstorganisation der Gradientenkarte und
Unterdr¨
uckung der Kopplung bei Erreichen eines Schwell-
werts von s= 5.
genommen, so ergibt sich f¨
ur einen kleinen Schwellwert selbst bei hohem
Koppungsparameter kaum ein Effekt. Der Einfluss des Schwellwertes ist in
Abbildung 3.16 dargestellt. W¨
ahrend das Ergebnis der anisotropen Regula-
risierung in Abbildung 3.16(b) und das Ergebnis anisotroper Regularisierung
mit Selbstorganisation der Gradientenkarte in Abbildung 3.16(c) mit den
oben beschriebenen Parametern berechnet wurden, wurde f¨
ur das Ergebnis
schwellwertabh¨
angiger Umfeldkopplung in Abbildung 3.16(d) der Nullvek-
3.3 Anisotrope Regularisierung 65
tor als Startvektor mit einer Iterationsanzahl von 500 gew¨
ahlt. Es ist zu
erkennen, dass hier die Grenzen zwischen zwei Fl¨
achen im Bereich salienter
Konturen durch eine st¨
arkere Diskontinuit¨
at des Grauwertverlaufs noch kla-
rer hervortreten. Weiterhin l¨
asst sich feststellen, dass kleinere Gebiete, die
einen starken Grauwertunterschied zu ihrer Umgebung aufweisen, speziell
f¨
ur kleine Schwellwerte sdie Tendenz zeigen, nicht durch den Diffusions-
prozess aufgel¨
ost zu werden, was je nach Anwendung durchaus unerw¨
unscht
sein kann.
66 3 Bildvorverarbeitung
4 Bestimmung m¨
oglicher
Konturvervollst¨
andigungen
Durch die in Kap. 3 beschriebene Vorverarbeitung stehen zu s¨
amtlichen
Kreuzungspunkten sowohl die Bildkoordinaten als auch die Richtungen zur
Verf¨
ugung, in die die m¨
ogliche Fortsetzung einer unterbrochenen Kontur ver-
l¨
auft. Ziel ist es nun, Kreuzungspunkte, die nach den Gestaltprinzipien der
N¨
ahe und der guten Fortsetzung mit aller Wahrscheinlichkeit Teil derselben
Kontur sind, in geeigneter Weise miteinander zu verbinden. Hierzu werden
zwei Mechanismen betrachtet, zum einen das bereits in Kap. 2 angespro-
chene Tensor Voting Verfahren und zum anderen eine Spline-Interpolation
des Verbindungsweges. Besondere Beachtung findet hierbei die Betrachtung
der Bedingungen, unter denen zwei Kreuzungspunkte miteinander verbun-
den werden sollten. Ein Vergleich der beiden alternativen Vorgehensweisen
findet in Kap. 6 statt.
4.1 Konturvervollst¨
andigung durch Tensor Voting
In [MLT00] beschreiben Medioni, Lee und Tang eine als Tensor Voting be-
zeichnete Methode zur Merkmalsverst¨
arkung auf d¨
unn besetzten und ver-
rauschten Eingabedaten. Das wesentliche Merkmal ist hierbei die Beschrei-
bung von Bild- bzw. Kantenelementen als Tensoren.
4.1.1 Repr¨
asentation von Konturelementen durch Tensoren
Im zweidimensionalen Fall kann ein Tensor ¨
uber R2durch eine symmetri-
sche 2×2 Matrix Tmit zwei zueinander rechtwinkligen Eigenvektoren e1,e2
68 4 Bestimmung m¨
oglicher Konturvervollst¨
andigungen
und zwei entsprechenden reellen Eigenwerten λ1> λ2beschrieben werden.
Ein Tensor, welcher ein Kurvenelement repr¨
asentiert, l¨
asst sich im zwei-
dimensionalen Fall als eine Ellipse darstellen (vgl. Abbildung 4.1), wobei
die Hauptachse die Richtung e1der Tangente an die Kurve angibt und die
L¨
ange λ1die Salienz bzw. St¨
arke dieser Richtung repr¨
asentiert. Die L¨
ange
λ2, welche dem zweiten Eigenvektor λ2zugeordnet ist, stellt ein Maß f¨
ur
die Orientierungsunsicherheit an der entsprechenden Bildposition dar, wie
sie z.B. an Eckpunkten auftritt.
λ1
λ2
Abbildung 4.1: Visualisierung eines Tensors als Ellipse.
Die Definition der Salienzmaße ergibt sich aus der spektralen Dekomposition
des Tensors durch
T=λ1e1e>
1+λ2e2e>
2(4.1)
bzw.
T= (λ1−λ2)e1e>
1+λ2(e1e>
1+e2e>
2).(4.2)
Der Faktor (λ1−λ2) repr¨
asentiert hierbei die Orientierungssicherheit in
Richtung des Eigenvektors und wird daher als Kurvensalienz bzw. Sticksa-
lienz bezeichnet. Bei maximaler Orientierungsunsicherheit gilt λ1=λ2und
die Ellipse wird zu einem Kreis. Der Faktor λ2wird daher als Ballsalienz be-
zeichnet. Er gibt also ein Maß f¨
ur die Orientierungsunsicherheit, speziell an
Kreuzungspunkten, an. Es ist allerdings zu beachten, dass im Bereich von
4.1 Konturvervollst¨
andigung durch Tensor Voting 69
Kreuzungspunkten die Tensorrepr¨
asentation weder geeignet ist, die minde-
stens zwei unterschiedlichen auftretenden Orientierungen zu repr¨
asentieren,
noch stellt sie aufgrund der Orientierungsabh¨
angigkeit ein verl¨
assliches Maß
f¨
ur Kreuzungspunkte dar [MBM03], wie sp¨
ater erl¨
autert wird.
4.1.2 Tensorkommunikation
Die Gruppierung von Merkmalselementen kann nun als Kombination der
Elemente in Abh¨
angigkeit ihrer Stick- bzw. Ballsalienz realisiert werden.
Beim sogenannten Stick Voting wird von jedem orientierten Eingangsele-
ment ein als Stick-Votingfeld bezeichnetes Tensorfeld entsprechend der Rich-
tung des Eigenvektors e1auf die Ergebniskarte addiert. F¨
ur die hier betrach-
tete Anwendung der Konturvervollst¨
andigung verdeckter Konturen bestehen
die Eingangselemente aus Tensoren, die an der Position von Kreuzungs-
punkten entsprechend der in Kap. 3 bestimmten Vervollst¨
andigungsrichtung
gerichtet sind, wobei f¨
ur jede Vervollst¨
andigungsrichtung eines Kreuzungs-
punktes ein Stick-Votingfeld erzeugt und auf die Ergebniskarte addiert wird.
¨
Uber diese Addition findet eine ¨
Uberlagerung der Tensorfelder und damit
eine Addition mehrerer Tensoren pro Bildposition statt. Damit ergibt sich in
der Ergebniskarte die Orientierung eines Tensors an einer gegebenen Bildpo-
sition aus der Addition der aus den ¨
uberlagerten Votingfeldern stammenden
Matrizen und anschließender spektraler Dekomposition der Ergebnismatrix
in Eigenvektoren und -werte.
Wie bereits in Kap. 2.5 erl¨
autert, wird f¨
ur eine sinnvolle Anwendung der
Konturvervollst¨
andigung, die ¨
uber eine einfache Konturverst¨
arkung hinaus-
geht, ein gerichtetes Kommunikationsschema ben¨
otigt, welches im Gegen-
satz zu einem bipolaren Verbindungsschema nur in einer Richtung Werte
ungleich Null im Stick-Votingfeld erzeugt (vgl. Abbildung 2.15). Ziel des
Votingprozesses ist die Gruppierung benachbarter Elemente unter Beach-
tung des Gestaltprinzips der guten Fortsetzung. Daher wird die Orientie-
rung jedes Tensors des Votingfeldes so gew¨
ahlt, dass diese eine Tangente an
70 4 Bestimmung m¨
oglicher Konturvervollst¨
andigungen
P
Qϑ
ϑ
s
`
r
r
Abbildung 4.2: Skizze zur Bestimmung der Sticksalienz der Elemente des Vo-
tingfeldes und zur Bestimmung des Kreisbogens sund des
Radius r.
den Kreis darstellt, der durch den betrachteten Punkt des Votingfeldes und
durch das Zentrum des Feldes und damit durch den Punkt verl¨
auft, der das
Votingfeld erzeugt (siehe Abbildung 4.2).
Die St¨
arke des Feldes, d. h. der Wert des Eigenwertes λ1jedes Tensors der
Maske, wobei λ2= 0 gilt, ergibt sich aus der folgenden Betrachtung. Gege-
ben sei ein Punkt Pmit einer assoziierten Tangenten- bzw. Vervollst¨
andi-
gungsrichtung. Weiter sei ein Punkt Qgegeben, wobei die Winkeldifferenz
zwischen der Tangentenrichtung und der direkten Verbindung der Punkte P
und Qmit ϑbezeichnet sei. Sei ferner `der Abstand der Punkte Pund Q.
Zwischen dem oben beschriebenen Winkel ϑund dem Radius rdes Kreises,
der durch die Punkte Pund Qverl¨
auft und die mit Passoziierte Tangente
aufweist, besteht der Zusammenhang
sin(ϑ) =
`
2
r.(4.3)
4.1 Konturvervollst¨
andigung durch Tensor Voting 71
Damit folgt f¨
ur den Radius r
r=`
2·sin(ϑ)(4.4)
F¨
ur die L¨
ange des Kreisbogens sgilt im Bogenmaß
s= 2πr ·2ϑ
2π= 2rϑ, (4.5)
woraus mit Gleichung (4.4)
s=`·ϑ
sin(ϑ)(4.6)
folgt.
Bestehende Ans¨
atze zur Konturverst¨
arkung oder Konturvervollst¨
andigung
definieren die Verbindungsst¨
arke Vder Punkte Pund Qund damit die Form
des Kommunikationsschemas ¨
uber eine Funktion der Form
V=Vd·Vc(4.7)
mit einem Term Vdzur Bewertung der Distanz und einem Term Vczur
Bewertung der Kr¨
ummung.
In [HH93], [HHP+98] und [PH01] benutzen Heitger et al.
Vd1=e−`2
2σ2(4.8)
und
Vc1=(cosk(π/2
α·ϑ) f¨
ur |ϑ|< α
0 sonst ,(4.9)
72 4 Bestimmung m¨
oglicher Konturvervollst¨
andigungen
wobei der Parameter σin Gleichung (4.8) den Einfluss der Entfernung auf
die Verbindungsst¨
arke regelt, w¨
ahrend durch den Parameter k= 2n,n∈N
mit einem ¨
Offnungswinkel 2α=πdie ¨
Offnungsweite des Feldes geregelt
wird. Hansen and Neumann benutzen ebenfalls Vd1und Vc1, allerdings mit
k= 1 und α= 10◦[HN01]. In [MLT00] definieren Medioni et al. den
Distanzbewertungsterm Vd2und den Kr¨
ummungsterm Vc2wie folgt:
Vd2=e−s2
2σ2(4.10)
und
Vc2=e−c·ρ2
σ2mit ρ=2 sin(ϑ)
`(4.11)
Hier wird also statt der direkten Entfernung der Punkte Pund Qdie Strecke
sentlang des Kreisbogens zur Distanzbewertung herangezogen. F¨
ur das
Kr¨
ummungsmaß stellt ceine positive Konstante dar, w¨
ahrend ρ, wie unmit-
telbar aus Gleichung (4.4) folgt, nichts anderes als der Kehrwert des Radius
rist (vgl. Abbildung 4.2). Hieraus folgt, dass bei gleichem Winkel ϑund
unterschiedlichen Abst¨
anden `der Punkte Pund Qdas Kr¨
ummungsmaß
unterschiedliche Werte liefert und damit stark von der Skalierung des be-
trachteten Bildes abh¨
angt.
F¨
ur das Kommunikationsschema des Tensorvotings muss eine aus Tenso-
ren bestehende Maske erzeugt werden, wobei, wie schon erw¨
ahnt, der Ei-
genvektor e1in jedem Punkt der Maske die Tangentenrichtung an einen
entsprechenden Kreis durch den Punkt und durch den Zentrumspunkt re-
pr¨
asentiert. Der Eigenwert λ1wird durch λ1=V=Vd·Vcgebildet. Um
eine Abh¨
angigkeit des Distanzmaßes von der L¨
ange entlang eines potenziel-
len Kurvenst¨
ucks zu erzielen, wird f¨
ur die in Kap. 6 vorgestellten Ergebnisse
Vd=Vd2gew¨
ahlt. Um andererseits eine klare Trennung zwischen Distanz
und Kr¨
ummung zu erzielen, wird eine skalierungsinvariante Kr¨
ummungsbe-
wertung durch Vc=Vc1mit k= 1 realisiert, wobei die ¨
Offnungsweite des
4.1 Konturvervollst¨
andigung durch Tensor Voting 73
Feldes direkt ¨
uber den ¨
Offnungswinkel 2 ·αgesteuert wird [HM05]. Alle
nachfolgenden Ergebnisse wurden mit α= 15◦, d. h. einem ¨
Offnungswinkel
von 30◦berechnet.
Abbildung 4.3: Sticksalienz f¨
ur ein halbseitiges Votingfeld mit V=Vd2·Vc1,
k= 1 und α= 15◦.
Die Sticksalienz eines solchen Votingfeldes, also der Wert λ1−λ2ist in
Abbildung 4.3 dargestellt. Hierbei gilt aufgrund der idealen Orientierung
innerhalb der Maske λ2= 0. Ausgehend von Kreuzungspunkten wird eine
Konturvervollst¨
andigung nun realisiert, indem jede Vervollst¨
andigungsrich-
tung entsprechend ihrer Winkelinformation ein halbseitiges Votingfeld auf
die Ergebnistensorkarte addiert (vgl. Abbildung 4.4). Ergibt sich durch
eine Flankenmaximumsuche ¨
uber die Ergebniskarte eine Verbindungslinie
zwischen zwei Kreuzungspunkten, so wird diese als virtuelle Kontur den
eigentlichen Konturen hinzugef¨
ugt.
Abbildung 4.4: Sticksalienz der ¨
Uberlagerung zweier Votingfelder.
74 4 Bestimmung m¨
oglicher Konturvervollst¨
andigungen
4.1.3 Probleme des Tensorvoting
Durch die Repr¨
asentation von Eingabeelementen als Tensor kann eine Vor-
zugsorientierung, deren Salienz und die Orientierungsunsicherheit, z. B. an
Kreuzungspunkten dargestellt werden. So wird in [MBM02b, MBM02a,
MBM03] vorgeschlagen, Kreuzungspunkte ¨
uber eine hohe Ballsalienz der
Tensorkarte nach einem Votingprozess auf der dichtbesetzten Eingangskarte
zu erkennen.
(a) (b) (c) (d)
Abbildung 4.5: Tensor Voting auf einem Linienbild: (a) Eingangsbild,
(b) Eingangssticksalienzen, (c) Ballsalienzen vor und (d) nach
dem Stickvoting.
Die Eingangstensoren entstehen dabei f¨
ur dichtbesetzte Karten allerdings
durch eine ¨
Uberlagerung von Tensoren, d. h. durch Tensoraddition. In
[GM96] geschieht dies in Bin¨
arbildern durch ¨
Uberlagerung von Kurven-
elementen, in [MBM02b] durch die mit Gaborfilterantworten gewichtete
Summe ¨
uber ideal orientierte Tensoren. Ebenso entstehen die Ausgang-
stensoren durch Tensoraddition, d. h. durch einen Votingprozess. Bei einer
¨
Uberlagerung von Tensoren, die die gleiche Salienz besitzen und in ihrer Ori-
entierung eine Differenz von 90◦aufweisen, erh¨
alt man einen idealen Ball-
tensor und eine Sticksalienz von Null. Ist dagegen die Orientierungsdifferenz
geringer, erh¨
alt man stattdessen eine geringere Ballsalienz und eine erh¨
ohte
Stick Salienz mit einer Orientierung, die aus der Mittelung der erzeugenden
Tensoren entsteht.
4.1 Konturvervollst¨
andigung durch Tensor Voting 75
Dies ist in Abbildung 4.5 dargestellt. Zu dem Eingangsbild in Abbildung
4.5(a) stellt Abbildung 4.5(b) die Sticksalienz der Tensorkarte dar, die sich
aus der Multiplikation von Filterantworten orientierungsselektiver Filter mit
entsprechend orientierten idealen Tensoren, d. h. λ2= 0, und anschließender
¨
Uberlagerung s¨
amtlicher Orientierungen ergibt. Die dazugeh¨
orige Ballsali-
enz ist in Abbildung 4.5(c) dargestellt und l¨
asst bereits erkennen, dass sich
f¨
ur abnehmende Schnittwinkel zwischen den Geraden die Ballsalienzen ver-
ringern und eine Erkennung von Kreuzungspunkten ¨
uber ein Maximum der
Ballsalienz erschweren bis unm¨
oglich machen. Gerade in Bildern mit hoch-
frequenten Bildinhalten wie z. B. Abbildung 3.15 ist also eine Detektion
von Eck-oder Kreuzungspunkten mit Hilfe des Tensorvoting nicht ratsam.
Auch nach erfolgtem Votingprozess bleibt eine Erkennung f¨
ur nicht recht-
winklige Kreuzungspunkte schwierig, wie Abbildung 4.5(d) zeigt. Zu der
winkelabh¨
angigen Ballsalienz kommt hier auch eine Lokalisierungsungenau-
igkeit hinzu.
Weiterhin reicht eine Tensordarstellung nicht aus, die im Allgemeinen meh-
reren Orientierungen an Kreuzungspunkten darzustellen, hier muss zus¨
atz-
lich ein Vektor oder ein Winkelwert pro Vervollst¨
andigungsrichtung gespei-
chert werden. Die Gestaltprinzipien der N¨
ahe und guten Fortsetzung sind
integraler Bestandteil des Votingprozesses, es erscheint daher f¨
ur die hier
beschriebene Konturvervollst¨
andigung sinnvoll, den Votingprozess, ausge-
hend von Kreuzungspunkten, auf einer einzigen Tensorkarte auszuf¨
uhren
(vgl. [Mas06a, Mas06b]) und nicht f¨
ur jedes Paar von Vervollst¨
andigungs-
richtungen eine separate Karte zu f¨
ullen, was den Berechnungsaufwand er-
heblich erh¨
ohen w¨
urde. Wie aber bereits in Kap. 2.5 angesprochen wurde,
besteht bei der Nutzung einer gemeinsamen Tensorkarte die offensichtliche
Gefahr, dass sich die Tensoren einer modalen und einer amodalen Vervoll-
st¨
andigung am Schnittpunkt der Konturen ¨
uberlagern und damit die Lini-
enverfolgung sowohl der modalen, als auch der amodalen Kontur unm¨
oglich
machen. Um speziell dem letzten Punkt Rechnung zu tragen, wird im Fol-
genden durch eine Splineinterpolation eine Alternative zum Tensorvoting
vorgestellt.
76 4 Bestimmung m¨
oglicher Konturvervollst¨
andigungen
4.2 Bewertung von Verbindungswahrscheinlichkeiten
Im Gegensatz zum Tensor Voting, wo das Prinzip der N¨
ahe und der guten
Fortsetzung integraler Bestandteil der Konturvervollst¨
andigung sind, muss
f¨
ur die in Kap. 4.3 beschriebene Splineinterpolation zun¨
achst explizit be-
stimmt werden, welche Verbindungen sinnvoll sind, und welche Kreuzungs-
punkte nicht verbunden werden sollen.
4.2.1 Ausschlusskriterien
Es wird zun¨
achst eine Reihe notwendiger Bedingungen an eine physikalisch
sinnvolle Verbindung zweier Konturelemente betrachtet, aus der sich Aus-
schlusskriterien f¨
ur eine solche Verbindung ableiten lassen (vgl. [Fel06]). Ne-
ben einer optionalen Skalierungspr¨
ufung, welche eine Verbindung zu weit
entfernter Kreuzungspunkte entsprechend einer gew¨
unschten Skalierung aus-
schließt, ist hier die relative Lage zweier Verbindungsrichtungen zueinander
von Interesse.
(a) (b)
Abbildung 4.6: Unterschiedliche Nachbarorientierungen an Eckpunkten.
Betrachtet man in Abbildung 4.6 die schwarz dargestellten Richtungen m¨
og-
licher Vervollst¨
andigungen, so l¨
asst sich feststellen, dass diese sowohl in Ab-
bildung 4.6(a) als auch in Abbildung 4.6(b) in idealer Weise zueinander
ausgerichtet sind. Es ist allerdings unwahrscheinlich, dass Abbildung 4.6(b)
durch eine Verdeckung entstanden ist und die betrachteten Eckpunkte damit
4.2 Bewertung von Verbindungswahrscheinlichkeiten 77
Teil derselben Kontur sind. Um einen Fall wie in Abbildung 4.6(b) auszu-
schließen, wird daher nun zum einen die Verbindungsgerade zwischen den
beiden Eckpunkten betrachtet und zum anderen die hier grau dargestellte je-
weilige Nachbarorientierung der betrachteten Vervollst¨
andigungsrichtung.
Liegen die in Abbildung 4.6 grau dargestellten Nachbarorientierungen auf
unterschiedlichen Seiten der Verbindungsgerade, wird eine Verbindung der
Kreuzungspunkte ¨
uber die schwarz dargestellten Orientierungen ausgeschlos-
sen.
(a) (b)
(c) (d)
Abbildung 4.7: Erlaubte Bereiche f¨
ur die Lage der Tangentenvektoren.
Das zweite Ausschlusskriterium erh¨
alt man ¨
uber die Betrachtung des zul¨
as-
sigen Bereichs, in dem eine Verbindung zweier Vervollst¨
andigungsrichtungen
Sinn macht. Diese m¨
ussen auf derselben Seite der Verbindungsgerade liegen
und dabei einander zugewandt sein. Der hieraus folgende zul¨
assige Bereich
ist in den Abbildungen 4.7(a) und (b) grau dargestellt, wobei sich die Anord-
nungen nur um eine Spiegelung an der Verbindungsgeraden unterscheiden.
Im praktischen Fall kann f¨
ur die in Kap. 3 ermittelten Winkelwerte der Fall
eintreten, dass die Vervollst¨
andigungsrichtungen bis auf eine geringe Abwei-
chung in Richtung des jeweils anderen Kreuzungspunktes zeigen, aber auf
78 4 Bestimmung m¨
oglicher Konturvervollst¨
andigungen
unterschiedlichen Seiten der Verbindungsgerade liegen (Abbildungen 4.7(c)
und (d)). Hierzu wird der grau gezeichnete Toleranzbereich eingef¨
uhrt, in-
nerhalb dessen die Vervollst¨
andigungsrichtungen auch auf gegen¨
uberliegende
Seiten der Verbindungsgerade liegen k¨
onnen. Alle Verbindungswinkel, die
die oben genannten Bedingungen nicht erf¨
ullen, k¨
onnen somit ausgeschlos-
sen werden.
Abbildung 4.8: Ausschluss der Verbindung bei unsymmetrischen Verbin-
dungsrichtungen.
Schließlich soll noch der Fall unterbunden werden, dass die Verbindung der
gerichteten Konturelemente einen zu unsymmetrischen Verlauf aufweist, wie
in Abbildung 4.8 dargestellt ist. Daher werden zu zwei Kreuzungspunkten i
und jdie Winkel γiund γjbetrachtet, welche den jeweils kleinsten Winkel
zwischen Vervollst¨
andigungsrichtung am Kreuzungspunkt und Verbindungs-
gerade der Kreuzungspunkte darstellen. Mit der Winkeldifferenz
∆γ=|γi−γj|(4.12)
l¨
asst sich nun das Ausschlusskriterium ∆γ > ∆γmax angeben, wobei ∆γmax,
falls nicht anders angegeben, im Folgenden zu ∆γmax = 45◦gesetzt wird,
was der Anordnung in Abbildung 4.8 entspricht.
4.2 Bewertung von Verbindungswahrscheinlichkeiten 79
4.2.2 Bestimmung der Verbindungswahrscheinlichkeit
Zu einer gegebenen Vervollst¨
andigungsrichtung ϕim¨
ussen s¨
amtliche Vervoll-
st¨
andigungsrichtungen ϕj, die anderen Kreuzungspunkten zugeordnet sind,
daraufhin ¨
uberpr¨
uft werden, ob eine Verbindung der Kreuzungspunkte ¨
uber
die Richtungen ϕiund ϕjsinnvoll ist. F¨
ur die Menge an Vervollst¨
andigungs-
richtungen ϕj, welche nicht durch die Kriterien in Kap. 4.2.1 ausgeschlossen
wurden, muss somit ein Maß pij definiert werden, welches die Bewertung
der Plausibilit¨
at der Verbindung zweier Konturelemente ¨
uber die Vervoll-
st¨
andigungsrichtungen ϕiund ϕjerm¨
oglicht. Ein Verbindungsweg ¨
uber die
Richtungen ϕiund ϕjwird dann generiert (vgl. Kap. 4.3), wenn sowohl
pij = max
k∈Ui
{pik}(4.13)
als auch
pji = max
k∈Uj
{pjk}(4.14)
gilt, wenn also f¨
ur jede der beiden Verbindungsrichtungen die Verbindung
mit der jeweils anderen Richtung als am wahrscheinlichsten eingestuft wurde.
Die Menge Uibezeichnet hierbei die Menge aller potentieller zu ϕikorre-
spondierender Verbindungsrichtungen, welche nicht ¨
uber die Kriterien in
Kap. 4.2.1 ausgeschlossen wurden. Das Maß pij wird im Folgenden so defi-
niert, dass f¨
ur den Wertebereich
0≤pij ≤1 (4.15)
gilt. Da pij außerdem ein Maß f¨
ur die Plausibilit¨
at der Verbindung ¨
uber ϕi
und ϕjdarstellt, wird es im Folgenden als Verbindungswahrscheinlichkeit
bezeichnet. Hierbei sei allerdings angemerkt, dass im Allgemeinen
80 4 Bestimmung m¨
oglicher Konturvervollst¨
andigungen
X
k∈Ui
pik 6= 1 (4.16)
gilt. Die Verbindungswahrscheinlichkeit ist ihrer Natur nach symmetrisch,
d. h. pij =pji. Außerdem soll sie die Gestaltprinzipien der N¨
ahe und guten
Fortsetzung ber¨
ucksichtigen, welche im Gegensatz zum Tensor Voting bei
der in Kap. 4.3 nicht direkter Bestandteil der Konturvervollst¨
andigung sind.
Der Ansatz f¨
ur pij lautet daher
pij =ξij ·1
1 + λij ·`ij
(4.17)
Die N¨
ahe zweier Kreuzungspunkte ist hierbei durch den Abstand `ij dieser
Punkte gegeben. Die Symmetrie der Vervollst¨
andigungsrichtungen ϕiund
ϕjkann ¨
uber den linearen Zusammenhang
λij = ∆γij ·λend −λstart
∆γmax
+λstart (4.18)
ber¨
ucksichtigt werden, wobei die Winkeldifferenz ∆γij wieder entsprechend
der Gleichung (4.12) gegeben ist. Der Einfluss des Gestaltprinzips der guten
Fortsetzung l¨
asst sich hierbei ¨
uber die Parameter λstart und λend und damit
¨
uber den Wertebereich von λij steuern.
Seien ψiund ψjdie jeweils kleinsten Winkel zwischen der Verbindungsge-
rade der Kreuzungspunkte und den jeweiligen, durch die Vervollst¨
andigungs-
richtungen ϕiund ϕjbestimmten Tangentenvektoren. Die Darstellung der
Vervollst¨
andigungsrichtungen ¨
uber die Winkel ψiund ψjhat gegen¨
uber den
Winkeln ϕiund ϕjden Vorteil, dass sie rotationsinvariant sind. Sei weiter
der kleinere der beiden Winkel durch
ψmin ij =(ψif¨
ur ψi≤ψj
ψjf¨
ur ψi> ψj
(4.19)
4.2 Bewertung von Verbindungswahrscheinlichkeiten 81
gegeben. Ein weiterer Aspekt der guten Fortsetzung ist die in Kap. 4.2.1
bereits angesprochene nicht erw¨
unschte Konstellation, in der die Verbin-
dungsrichtungen ψiund ψjWerte von ann¨
ahernd 90◦annehmen. F¨
ur einen
solchen Fall kann ¨
uber den Term
ξij =e−ψ4
min ij (4.20)
eine D¨
ampfung der Verbindungswahrscheinlichkeit eingef¨
uhrt werden.
Weiterhin ist es m¨
oglich, auch Polarit¨
aten, also Helligkeitsinformationen und
die Richtungen von Hell-Dunkelwechseln zu ber¨
ucksichtigen, d. h. die in Ab-
bildung 4.9(a) dargestellte Konstellation als wahrscheinlicher zu beurteilen
als die in Abbildung 4.9(b) gegebene Konstellation.
(a) (b)
Abbildung 4.9: Unterschiedliche Polarit¨
aten bei Bestimmung der Verbin-
dungswahrscheinlichkeit.
Hierzu k¨
onnen die in Kap. 3.1 vorgestellten Eckfilter herangezogen werden,
da die Filterantworten ein direktes Maß f¨
ur die Polarit¨
at in einem Eckpunkt
darstellen. Seien dazu die maximalen, auf den Bereich von −0.5 bis +0.5
normierten Eckfilterantworten an der Position der beiden Kreuzungspunkte
durch fibzw. fjgegeben. Einen Wahrscheinlichkeitsterm zur Ber¨
ucksichti-
gung der Polarit¨
at erh¨
alt man durch δij =δ1·δ2(vgl. [Hag07]), wobei
82 4 Bestimmung m¨
oglicher Konturvervollst¨
andigungen
δ1=e−(c1·|fi−fj|)4(4.21)
die ¨
Ahnlichkeit der beiden Filterantworten bewertet, w¨
ahrend in
δ2= 1 −e−(sgn(fi)·sgn(fj)·(|fi|+|fj|)−c2)4(4.22)
die Betonung auf gleiche Polarit¨
at der Filterantworten gelegt wird. Der
Parameter c1in Gleichung (4.21) dient dabei der Einstellung der Flanken-
steilheit, w¨
ahrend ¨
uber den Parameter c2<−1 in Gleichung (4.22) der
Graph der Kurve nach links verschoben werden kann, womit es m¨
oglich ist,
den Toleranzbereich f¨
ur unterschiedliche Polarit¨
aten der Filterantworten zu
ver¨
andern.
Gleichung (4.17) modifiziert sich in diesem Fall zu
pij =ξij ·δij ·1
1 + λij ·`ij
(4.23)
Es ist bei dieser Vorgehensweise allerdings zu beachten, dass im Falle moda-
ler Vervollst¨
andigungen Hintergrundfl¨
achen durchaus unzusammenh¨
angend
sein k¨
onnen und damit m¨
oglicherweise auch unterschiedliche Polarit¨
atswerte
liefern.
4.3 Konturvervollst¨
andigung durch Spline Funktionen 83
4.3 Konturvervollst¨
andigung durch Spline Funktionen
Ansatz f¨
ur die Konturvervollst¨
andigung ist die Parameterdarstellung eines
kubischen Splines KS[Bar04, Loc92, Fel06, H¨
am91, Kno00]:
KS:S(t) = Sx(t)
Sy(t)!= a
e!+t b
f!+t2 c
g!+t3 d
h!(4.24)
mit t∈[0,1] ⊂R. Zur Bestimmung der acht Unbekannten in Gleichung
(4.24) werden acht linear unabh¨
angige Gleichungen ben¨
otigt. Vier davon
ergeben sich direkt aus dem Anfangspunkt A(xA, yA) und dem Endpunkt
E(xE, yE) des Verbindungsweges:
Sx(0) = xA=a
Sy(0) = yA=e
Sx(1) = xE=a+b+c+d
Sy(1) = yE=e+f+g+h
(4.25)
Die restlichen Bestimmungsgleichungen lassen sich durch die in Kap. 3 er-
mittelten Richtungen m¨
oglicher Konturfortsetzungen, welche zun¨
achst als
Winkel αAf¨
ur den Anfangspunkt bzw. αEf¨
ur den Endpunkt vorliegen, ge-
winnen. Hierzu werden die Tangentenvektoren
mA= mAx
mAy!=s· cos(αA)
sin(αA)!(4.26)
und
mE= mEx
mEy!=u· −cos(αE)
−sin(αE)!(4.27)
84 4 Bestimmung m¨
oglicher Konturvervollst¨
andigungen
betrachtet, wobei die L¨
angen s=kmAk2und u=kmEk2zun¨
achst unbe-
stimmt bleiben. Der Faktor −1 in der Definition des Vektors mEberuht
auf der Tatsache, dass die urspr¨
unglich mit den Kreuzungspunkten assozi-
ierten Winkel in Richtung der jeweiligen Vervollst¨
andigung zeigen, was zu
einer falschen Verbindung f¨
uhren w¨
urde (vgl. Abbildung 4.10(a)). Stattdes-
sen muss die Richtung des Tangentenvektors im Endpunkt eine entgegenge-
setzte Richtung aufweisen, um eine sinnvolle Tangente an die Splinefunktion
darzustellen (vgl. Abbildung 4.10(b)).
012345
0
1
2
3
4
x
y
012345
0
1
2
3
4
x
y
(a) (b)
Abbildung 4.10: Generierter Verbindungsweg bei unterschiedlichen Richtun-
gen des Tangentenvektors des Endpunktes. (a) Tangenten-
vektoren zeigen in Richtung der Vervollst¨
andigung und (b)
der Tangentenvektor des Endpunktes wird um 180 Grad ge-
dreht (nach [Fel06]).
Die in Gleichung (4.27) angegebenen Tangentenvektoren, welche sich aus der
Richtung detektierter Konturen herleiten, stellen somit die Tangente an den
kubischen Spline entsprechend Gleichung (4.24) dar. Betrachtet man nun
also die Ableitungen
S0
x(t) = b+ 2ct + 3dt2
S0
y(t) = f+ 2gt + 3ht2,(4.28)
4.3 Konturvervollst¨
andigung durch Spline Funktionen 85
so erh¨
alt man die restlichen Bestimmungsgleichungen:
S0
x(0) = mAx =b
S0
y(0) = mAy =f
S0
x(1) = mEx =b+ 2c+ 3d
S0
y(1) = mEy =f+ 2g+ 3h
(4.29)
Wird nun das Gleichungssystem, welches durch die Gleichungen (4.25) und
(4.29) gegeben ist, nach den Koeffizienten der Splinedarstellung in Gleichung
(4.24) aufgel¨
ost, so ergibt sich:
a=xA
b=mAx
c= 3 xE−3xA−2mAx −mEx
d= 2 xA−2xE+mAx +mEx
e=yA
f=mAy
g= 3 yE−3yA−2mAy −mEy
h= 2 yA−2yE+mAy +mEy
(4.30)
Die Splinedarstellung des Verbindungsweges ist jetzt bis auf die L¨
angen s
und uder Tangentenvektoren eindeutig bestimmt. Setzt man nun s= 1
und u= 1, so l¨
asst sich feststellen, dass der resultierende Verbindungsweg
nicht skalierungsinvariant ist (Abbildung 4.11). Mit zunehmenden Abstand
der Interpolationspunkte n¨
ahert sich die Splinedarstellung dem subjektiven
Eindruck einer direkten Verbindung der beiden Punkte.
86 4 Bestimmung m¨
oglicher Konturvervollst¨
andigungen
0 1 2 3
0
1
2
3
4
5
x
y
0 1 2 3
0
1
2
3
4
5
x
y
(a) (b)
Abbildung 4.11: Skalierungsabh¨
angigkeit des Verbindungsweges bei Wahl
von Tangenteneinheitsvektoren. (nach [Fel06])
Abhilfe schafft hier die Betrachtung der Geradengleichungen
g:g(s) = xA
yA!+s cos(αA)
sin(αA)!(4.31)
h:h(u) = xE
yE!+u cos(αE)
sin(αE)!(4.32)
welche durch die Interpolationspunkte verlaufen und deren Richtungsvek-
toren den Tangentenvektoren entsprechen. Der Schnittpunkt der Geraden
ist ein skalierungsunabh¨
angiger Bezugspunkt [Fel06] und liefert Parameter-
werte sund u, welche direkt in die Gleichungen (4.26) und (4.27) eingesetzt
werden k¨
onnen. Um Einfluss auf das Kr¨
ummungsverhalten des Verbindungs-
weges zu haben, wird der skalierungsunabh¨
angige Kr¨
ummungsparameter κ
eingef¨
uhrt.
4.3 Konturvervollst¨
andigung durch Spline Funktionen 87
Die Tangentenvektoren ergeben sich somit zu
mA=8
>
>
>
>
<
>
>
>
>
:
κ·s· cos(αA)
sin(αA)!f¨
ur s > 0∧u > 0
cos(αA)
sin(αA)!sonst
(4.33)
mE=8
>
>
>
>
<
>
>
>
>
:
−κ·u· cos(αE)
sin(αE)!f¨
ur s > 0∧u > 0
−cos(αA)
−sin(αA)!sonst
(4.34)
Mit der Fallunterscheidung in den Gleichungen (4.33) und (4.34) wird der
Tatsache Rechnung getragen, dass bei der Bewertung der Verbindungswahr-
scheinlichkeiten in Kap. 4.2 eine gewisse Toleranz zugelassen wird gegen-
¨
uber Verbindungsrichtungen, welche auf unterschiedlichen Seiten der Ver-
bindungsgerade zwischen den Interpolationspunkten liegen. Dies kann zu
Konstellationen mit parallelen Geraden und zu Konstellationen mit Wer-
ten s < 0 und u < 0 f¨
uhren. Der Fall von sehr großen Werten f¨
ur sund
ubraucht hier nicht weiter betrachtet zu werden, da dies einer Konstella-
tion von ann¨
ahernd parallelen Tangentenvektoren entspricht, welche einen
rechten Winkel zur Verbindungsgerade zwischen den Interpolationspunkten
aufweisen. Ein solcher Fall wird aber in Kap. 4.2 bereits ausgeschlossen.
Wie Abbildung 4.12 zeigt, kann ¨
uber den eingef¨
uhrten Kr¨
ummungsparame-
ter κdas Kr¨
ummungsverhalten des Verbindungsweges beliebig modelliert
werden. Im Kontext einer Detektion unterbrochener Objektgrenzen ma-
chen jedoch extreme Werte wie κ= 0, was einer direkten Verbindung der
Kreuzungspunkte entspricht (vgl. Abbildung 4.12(a)), und hohe Werte von
88 4 Bestimmung m¨
oglicher Konturvervollst¨
andigungen
01234
0
1
2
3
4
x
y
01234
0
1
2
3
4
x
y
01234
0
1
2
3
4
x
y
(a) (b) (c)
01234
0
1
2
3
4
x
y
01234
0
1
2
3
4
x
y
(d) (e) (f)
Abbildung 4.12: Verlauf des Verbindungsweges mit unterschiedlichen Kr¨
um-
mungsparametern (nach [Fel06]): (a) κ= 0 (b) κ= 1 (c)
κ= 2 (d) κ= 3 (e) κ= 4 (f) κ= 7,8
κkeinen Sinn (vgl. Abbildung 4.12(f)). Im Folgenden wird daher, falls nicht
anders angegeben, ein Kr¨
ummungswert von κ= 2 angenommen.
5 Perzeptuelle Organisation
Notwendiger Bestandteil perzeptueller Organisation ist neben einer Kontur-
vervollst¨
andigung, wie sie in Kap. 4 vorgestellt wurde, eine Figur-Grund-
Gliederung, d. h. eine Organisation des Bildes in Bereiche, welche sich
als Figur vom restlichen Bereich, dem Hintergrund, abheben. W¨
ahrend in
[WH96] und [Sau99b] versucht wird, die Gruppierung bzw. Vervollst¨
andi-
gung von Konturen simultan zur Figur-Grund-Gliederung in einem kombi-
natorischen Ansatz durchzuf¨
uhren, wird im vorliegenden Ansatz zun¨
achst
die Konturvevollst¨
andigung durchgef¨
uhrt (siehe Kap. 4), um anschließend
die gewonnenen Informationen als Kriterium zur Figur-Grund-Gliederung an
Kreuzungspunkten nutzen zu k¨
onnen. Dieses Vorgehen korrespondiert mit
der von Kellman et al. postulierten Identit¨
atshypothese [KGW01], welche
besagt, dass die Mechanismen f¨
ur modale und amodale Konturvervollst¨
an-
digungen identisch sind und die Tiefenzuordnung vom Konturvervollst¨
andi-
gungsprozess getrennt werden kann. Wichtig ist in diesem Zusammenhang
eine Tiefenzuordnung, welche tolerant auf eine m¨
oglicherweise falsche in-
itiale Figur-Grund-Gliederung an Kreuzungspunkten reagiert. Ein solcher
Mechanismus wird in Kap. 5.2 vorgestellt.
5.1 Figur-Grund-Gliederung an Kreuzungspunkten
Da der vorliegende Ansatz von detektierten Konturen, also potenziellen Ob-
jektbegrenzungen ausgeht, findet auch die Zuordnung einer relativen Tiefe
entlang der Kontur und damit entlang der Objektgrenze statt. Schl¨
ussel-
punkt f¨
ur die Zuweisung von Vorder- oder Hintergrundeigenschaft ist der
Kreuzungspunkt zweier Konturen. Falls hier, vom Kreuzungspunkt aus-
gehend, mindestens ein Teil der beteiligten Konturen eine vervollst¨
andigte
90 5 Perzeptuelle Organisation
Kontur darstellt, kann davon ausgegangen werden, dass die gegebene Kon-
stellation durch eine Verdeckung hervorgerufen wurde. Die unten vorgestell-
ten Kriterien stellen Bedingungen dar, welche sich direkt aus dem physika-
lischen Zusammenhang bei der Verdeckung durch ein Vordergrundobjekt
ableiten lassen. Es ist aber genauso m¨
oglich, weitere Kriterien zur Figur-
Grund-Gliederung aus der Analyse der menschlichen Wahrnehmung zu ge-
winnen. So wird z. B. in [Wil94] eine Pr¨
aferenz von schwarzen Objekten
gegen einen weißen Hintergrund postuliert. In [MM01a] wird im Zusam-
menhang mit sich verdeckenden Objekten gleicher Farbe in bin¨
aren Bildern
angenommen, dass breite Objekte eher zum Vordergrund geh¨
oren, als d¨
unne
Objekte (vgl. Abb. 5.1(c)), d. h. diejenigen Objekte, welche die l¨
angeren
Konturabschnitte vervollst¨
andigter Konturen enthalten, werden als Hinter-
grund angesehen. Angesichts der Tatsache, dass ¨
ahnliche Effekte durchaus in
der menschlichen Wahrnehmung festzustellen sind (siehe Kap. 2.4.4), macht
ein solches Vorgehen durchaus Sinn, allerdings folgt ein solches Kriterium zur
Figur-Grund-Unterscheidung nicht direkt aus der gegenseitigen Verdeckung
zweier Objekte und stellt somit auch kein notwendiges Kriterium dar. Wei-
terhin ist es ohne weiteres m¨
oglich, eine T-Kreuzung als Kriterium f¨
ur eine
Figur-Grund-Unterscheidung heranzuziehen, indem die durchgehende Kon-
tur als Objektbegrenzung einer Vordergrundfl¨
ache deklariert wird, w¨
ahrend
die unterbrochene Kontur dem Hintergrund zugeordnet wird.
Die in Kap. 6 vorgestellten Ergebnisse resultieren allein aus den folgenden
Figur-Grund-Kriterien an die Konstellation von realen und vervollst¨
andigten
Konturen am Kreuzungspunkt zweier Konturen.
Falls am Kreuzungspunkt zweier Konturen eine Kontur ihren Zustand von
real zu vervollst¨
andigt ¨
andert und falls dies bei der kreuzenden Kontur nicht
der Fall ist, geh¨
ort die erste Kontur zum Hintergrund, w¨
ahrend die zweite
Kontur die Begrenzung einer Vordergrundfl¨
ache darstellt.
Ein Beispiel f¨
ur eine solche Konstellation ist in Abb. 5.1(a) gegeben.
5.1 Figur-Grund-Gliederung an Kreuzungspunkten 91
(a) (b)
(c)
Abbildung 5.1: Illustrationen zu Figur-Grund-Kriterien an Kreuzungspunk-
ten. Reale Konturen sind als durchgehende Linie darge-
stellt, w¨
ahrend vervollst¨
andigte Konturen gestrichelt darge-
stellt sind. Erl¨
auterung siehe Text.
Falls eine Kontur ihren Zustand von real zu vervollst¨
andigt ¨
andert und falls
der vervollst¨
andigte Teil in der Region liegt, welche von einer kreuzenden ge-
schlossenen Kontur begrenzt wird, geh¨
ort die erste Kontur zum Hintergrund,
w¨
ahrend die zweite Kontur die Objektbegrenzung eines Vordergrundobjektes
darstellt.
Eine solche Konstellation ist in Abb. 5.1(b) dargestellt. Die zu den bei-
den Kreisen geh¨
orenden vervollst¨
andigten Konturen liegen im Inneren der
92 5 Perzeptuelle Organisation
rechteckigen Kontur. Die Kreiskonturelemente im Bereich der Kreuzungs-
punkte werden damit als Hintergrund und die der rechteckigen Kontur als
Vordergrund gekennzeichnet.
Wenn beide Konturen geschlossen sind und beide Konturen vervollst¨
andigte
Anteile aufweisen, die in der von der jeweils anderen Kontur begrenzten
Region liegen, wird keine Figur-Grund-Entscheidung getroffen.
Die beschriebene Situation ist in Abb. 5.1(c) dargestellt. Im Gegensatz
zum Ansatz in [MM01a] wird hier also nicht die L¨
ange der vervollst¨
andigten
Konturen zur Entscheidung herangezogen, sondern keine Entscheidung ge-
troffen. Damit k¨
onnen Fehlzuordnungen, wie Sie bei Objekten unterschied-
licher Gr¨
oße nicht unwahrscheinlich sind (vgl. Abbildung 2.14), vermieden
werden.
5.2 Dynamische Tiefenzuordnung
Ziel der Tiefenzuordnung ist es, die in Kap. 5.1 gewonnenen Tiefeninforma-
tionen an den Kreuzungspunkten zweier Konturen an den Rest der jeweili-
gen Kontur weiterzuleiten und eine sinnvolle dreidimensionale Interpretation
des Konturverlaufs zu erm¨
oglichen. Um zu gew¨
ahrleisten, dass die Tiefen-
zuordnung einen kontinuierlichen dreidimensionalen Konturverlauf sogar f¨
ur
solche Konturen erzeugt, welche Fl¨
achen begrenzen, die vom Vorder- zum
Hintergrund wechseln und umgekehrt, wird die Tiefenzuordnung in Form
eines Diffusionsprozesses realisiert [HM06]. Im Gegensatz zur stereoskopi-
schen Tiefenrekonstruktion ist es hier nicht m¨
oglich, eine quantitative Aus-
sage zu treffen ¨
uber die Entfernung eines Bildmerkmals zum Kamerasystem,
die zugeordnete relative Tiefe gibt dagegen Aufschluss ¨
uber die zum Kame-
rasystem relative Lage eines Objektes im Raum.
Die Kontur ist im Folgenden aufgeschl¨
usselt als Kettencode mit den zweidi-
mensionalen Bildkoordinaten (xn, yn)Tdes n-ten Konturelements,
n∈[1,...,T], wobei T∈Ndie L¨
ange der Kontur bzw. die Anzahl der
5.2 Dynamische Tiefenzuordnung 93
in der Kontur enthaltenen Pixel sei. Sei zndie relative Tiefe des n-ten
Konturelements mit den Nachbarn zn−2,zn−1,zn+1 und zn+2. Tiefe eines
Konturelements bedeutet in diesem Sinne die Tiefe der okkludierenden Ober-
fl¨
ache, falls die Kontur die Begrenzung einer Fl¨
ache darstellt. Ein h¨
oherer
Tiefenwert bedeutet hier eine gr¨
oßere Entfernung zum Kamerasystem
F¨
ur die Gl¨
attungsparameter c1und c2modelliert der Kostenterm P1mit
P1=1
2X
n c1
2·
n+k
X
i=n−k
(zn−zn+i)2
+c2·((zn+1 −zn)−(zn−zn−1))2(5.1)
+((zn−zn0)2zngeh¨
ort zu einem Kreuzungspunkt
0 sonst !
die Forderung, dass benachbarte Pixel m¨
oglichst gleiche Tiefenwerte aufwei-
sen sollen und die (diskretisierte) erste Ableitung benachbarter Pixel eben-
falls identisch sein soll. Die Gr¨
oße der Nachbarschaft wird dabei durch den
Parameter kbeschrieben. Im Gegensatz hierzu werden im letzten Term Ko-
sten erzeugt, falls der Tiefenwert zneines Kreuzungspunktes von dem vorge-
gebenen Wert zn0abweicht. Der Wert zn0wird im Verlauf des im Folgenden
beschriebenen Iterationsprozesses aktualisiert, und zwar so, dass im Falle
einer Konstellation, die der Figur-Grund-Gliederung entsprechend Kap. 5.1
widerspricht, der Wert zn0modifiziert wird. Wenn also die betrachtete Kon-
tur im betrachteten Kreuzungspunkt als Vordergrund eingestuft wurde, die
Summe des Tiefenwertes znund eines Offsets daber gr¨
oßer ist als der Tie-
fenwert der anderen Kontur, so wird zn0aktualisiert zu zn0=zn−∆z,
wobei ∆zdie Korrekturschrittweite darstellt. Der Offset d > 0 bezeichnet
hierbei den geforderten Mindestabstand zwischen zwei Konturen. Analog
wird im Fall einer Hintergrundkontur verfahren, welche zu geringe Tiefen-
werte aufweist. Tritt keiner dieser F¨
alle auf, wird nichts ver¨
andert, d. h. es
wird zn0=zngesetzt.
94 5 Perzeptuelle Organisation
Durch Anwendung des Gradientenverfahrens zur Minimierung der in Glei-
chung (5.1) aufgestellten Kostenfunktion erh¨
alt man f¨
ur die partielle Ablei-
tung
∂
∂zn
P1=c1·
n+k
X
i=n−k
(zn−zn+i)
+c2·(6zn−4zn+1 −4zn−1+zn+2 +zn−2) (5.2)
+(zn−zn0zngeh¨
ort zu einem Kreuzungspunkt
0 sonst
Mit einer Schrittweite λergibt sich f¨
ur den Wert zndie folgende Iterations-
vorschrift:
z(j+1)
n=z(j)
n−λ·∂
∂zn
P1(5.3)
Hierbei ist zu beachten, dass f¨
ur die oben angegebenen Gleichungen außer-
dem eine Randbetrachtung ber¨
ucksichtigt werden muss. Im Fall von nicht
geschlossenen Konturen entfallen in Gleichung (5.1) Tiefenwerte, die außer-
halb des Intervalls [1,...,T] liegen und analog ¨
andert sich Gleichung (5.2)
an den entsprechenden Stellen. Im Fall geschlossener Konturen ist f¨
ur die
Nachbarn eines betrachteten Pixel zu beachten, dass die Nummerierung T-
periodisch verl¨
auft, d. h. es gilt z. B. zT+1 =z1.
Wird nun f¨
ur den Fall einer geschlossenen Kontur angenommen, dass die
Kontur die Objektgrenze eines verh¨
altnism¨
aßig simplen Objektes darstellt
und dass die Kontur sich außerdem auf einer Fl¨
ache befindet, die wie auch
immer im Raum angeordnet sein kann, so lassen sich aus der Betrachtung
der Tiefenwerte eines Kreises wertvolle Bedingungen f¨
ur die Tiefenkriterien
ableiten. Dies funktioniert auch f¨
ur Objekte, die keine kreisf¨
ormige Begren-
zung aufweisen, wie in Kap. 6 am Beispiel eines Bleistiftes gezeigt wird. Eine
Bedingung, die sich aus einer solchen Einschr¨
ankung ableiten l¨
asst, ist, dass
5.2 Dynamische Tiefenzuordnung 95
die Tiefenwerte sich gegen¨
uberliegender Punkte dieselbe H¨
ohendifferenz zur
Tiefe Mzdes Schwerpunktes M= (Mx, My, Mz)Tder Kontur aufweisen.
Der Schwerpunkt Mist hierbei gegeben durch
M=1
T
T
X
n=1
(xn, yn, zn)T.(5.4)
Es ergibt sich somit ein Kostenterm
P2=c3
4·X
n
(zn+zn+T/2−2Mz)2.(5.5)
Wird in jedem Iterationsschritt jder Schwerpunkt M(j)entsprechend Glei-
chung (5.4) ermittelt, so folgt f¨
ur die partiellen Ableitung
∂
∂zn
P2=c3·(zn+zn+T/2−2M(j)
z).(5.6)
Der Wert T/2 kann hierbei f¨
ur ungerade Tbeliebig gerundet werden, da
davon auszugehen ist, dass die Kontur bzw. der Wert von T hinreichend
groß ist und die Position des gegen¨
uberliegenden Pixels nur mit einer gewis-
sen Toleranz bestimmt werden muss. Die in Gleichung (5.3) beschriebene
Iterationsvorschrift ¨
andert sich somit zu
z(j+1)
n=z(j)
n−λ·∂
∂zn
(P1+P2).(5.7)
Abgesehen von der direkten Einbindung in den Kostenterm ist es auch
m¨
oglich, nach erfolgter Kostenminimierung in einem Nachverarbeitungs-
schritt den dreidimensionalen Kurvenverlauf durch einen Kreis zu appro-
ximieren, die entsprechenden Kreisparameter zu bestimmen und die Tie-
fenwerte z1,...,zTeines solchen Kreises wieder mit den zweidimensionalen
96 5 Perzeptuelle Organisation
Bildkoordinaten der Kontur zu verbinden. Hierzu wird zun¨
achst die Ver-
einfachung angenommen, dass der Abstand zwischen zwei Konturelementen
¨
aquidistant ist. Anschließend muss der Kreismittelpunkt Mentsprechend
der Gleichung (5.4) bestimmt werden. Der Radius Rl¨
asst sich durch
R=1
T
T
X
n=1
k(xn−Mx, yn−My, zn−Mz)Tk2(5.8)
approximieren. Betrachtet man ein Konturelement nund ein Konturelement
n+T
4, wobei wiederum die T-Periodizit¨
at beachtet werden muss, so l¨
asst
sich zu den beiden Vektoren (xn−Mx, yn−My, zn−Mz)Tund (xn+T/4−
Mx, yn+T/4−My, zn+T/4−Mz)Tein Normvektor n(n)= (n(n)
x, n(n)
y, n(n)
z)T
bestimmen, f¨
ur den o. B. d. A. die Bedingung n(n)
z≥0 gefordert sei. Der
Neigungswinkel α(siehe Abbildung 5.2) l¨
asst sich nun ann¨
ahernd ¨
uber
α= max
n∈[1,...,T ]{arccos n(n)
z
kn(n)k2!}(5.9)
bestimmen.
x
R·cos(2π
T·n+ϕ)
h=zn
α
n
z
Abbildung 5.2: Seitenansicht eines Kreises mit Neigungswinkel α.
5.2 Dynamische Tiefenzuordnung 97
Um eine Approximation f¨
ur den Phasenwinkel ϕzu erhalten, der sowohl
von der Rotation des um den Winkel αgeneigten Kreises um die z-Achse,
als auch vom Winkel des ersten Konturelements zur x-Achse abh¨
angt, wird
die gegebene Konstellation auf die x-y-Ebene projiziert (siehe Abbildung
5.3). Der Winkel ϕ1l¨
asst sich nun ¨
uber die Koordinaten (xn, yn) bestimmen
[Mer99], w¨
ahrend der Winkel ϕ2durch die Koordinaten der zweidimensio-
nalen Projektion des Vektors −nbestimmt werden kann.
x
y
ϕ
ϕ1
ϕ2
−n
(xn, yn)
Abbildung 5.3: Bestimmung des Phasenwinkels ϕ.
Wie in Abbildung 5.2 zu erkennen ist, l¨
asst sich nun mit gegebenen Phasen-
winkel ϕdie H¨
ohe eines Kreiskonturelements durch
zn=Mz+ sin(α)·R·cos(2π
T·n+ϕ) (5.10)
bestimmen.
98 5 Perzeptuelle Organisation
6 Experimentelle Ergebnisse
W¨
ahrend in den vorangegangenen Kapiteln bereits exemplarisch einige Er-
gebnisse gezeigt wurden, um die prinzipielle Funktionsweise einzelner Ver-
fahrensschritte zu verdeutlichen, wird in diesem Kapitel die Leistungsf¨
ahig-
keit des Verfahrens f¨
ur jeden Verfahrensschritt anhand ausgesuchter Bei-
spiele demonstriert.
6.1 Anisotrope Regularisierung
Die Abbildungen 6.1(a) bis (d) werden in [Wei96] als Beispiel f¨
ur die Rausch-
unterdr¨
uckungseigenschaften verschiedener Diffusionsfilter vorgestellt und
haben mittlerweile ihren Weg in die Standardliteratur digitaler Bildverar-
beitung gefunden [J¨
ah02]. 70% der Bildpunkte des Eingangsbildes 6.1(a),
das ein Dreieck und ein Rechteck enth¨
alt, sind durch Rauschen verfrem-
det. Abbildung 6.1(b) zeigt das Ergebnis einer linearen isotropen Diffusion,
was einer einfachen Gl¨
attung des Eingangsbildes entspricht. Hierbei wird
das Rauschen unterdr¨
uckt, allerdings werden auch die Kanten unscharf. In
Abbildung 6.1(c) ist dagegen das Ergebnis nichtlinearer isotroper Diffusion
dargestellt. Durch die Diffusion, deren St¨
arke von der des Gradienten ab-
h¨
angt, wird das Rauschen unterdr¨
uckt, ohne die Sch¨
arfe der Kanten zu be-
eintr¨
achtigen. Allerdings findet im Bereich der Kanten selbst keine Diffusion
statt, so dass diese verrauscht bleiben. Schließlich zeigt Abbildung 6.1(d) die
von Weickert beschriebene nichtlineare anisotrope Diffusion (vgl. Kap. 3.3).
Auch im Bereich von Kanten findet hier eine Diffusion statt, so dass auch f¨
ur
Kantenbereiche sowohl das Rauschen unterdr¨
uckt wird, als auch die Kanten
scharf bleiben. Allerdings l¨
asst sich eine Lokalisierungsungenauigkeit der
Kanten aufgrund abgerundeter Ecken feststellen.
100 6 Experimentelle Ergebnisse
(a) (b)
(c) (d)
Abbildung 6.1: Ergebnisse unterschiedlicher Diffusionsprozesse (aus [Wei96]
bzw. [J¨
ah02]): (a) Eingangsbild, (b) lineare Diffusion,
(c) nichtlineare isotrope Diffusion und (d) nichtlineare ani-
sotrope Diffusion.
In Abbildung 6.2(f) zeigt sich, verglichen mit den Filterergebnissen, deren
betragsgr¨
oßte Filterbetr¨
age in Abbildung 6.2(e) dargestellt sind, die Verbes-
serung der Kanteninformation nach anisotroper Regularisierung mit Selbst-
organisation der Gradientenkarte entsprechend Kap. 3.3.3. Die salienten
Kanten des Dreiecks und des Rechtecks verst¨
arken sich und richten sich
durch den Selbstorganisationsprozess aus, w¨
ahrend die durch Rauschpro-
zesse erzeugten Kanten unterdr¨
uckt werden. Abbildung 6.2(g) zeigt die L¨
o-
sung des in Kap. 3.3.1 vorgestellten Regularisierungsterms mit anisotropen
Gewichtungsfaktoren, die sich aus der selbstorganisierten Gradientenkarte
ergeben. Das Gleiche ist in Abbildung 6.2(h) dargestellt, allerdings sind
6.1 Anisotrope Regularisierung 101
(e) (f)
(g) (h)
Abbildung 6.2: Diffusion durch anisotrope Regularisierung: (e) betragsgr¨
oßte
Filterbetr¨
age, (f) Betrag der Gradientenkarte nach erfolgtem
Selbstorganisationsprozess, (g) Ergebnis der anisotropen Re-
gularisierung mit Selbstorganisation der Gradientenkarte ent-
sprechend Kap. 3.3.2 und (h) mit zus¨
atzlichem Schwellwert.
hier die Gewichtungsfaktoren mit einem Schwellwert verbunden, der, wie
in Kap. 3.3.3 beschrieben, eine Diffusion zwischen Bildpunkten, die sich in
ihrem Grauwert zu stark unterscheiden, unterbindet. Um eine dem starken
Rauschen entsprechende hohe Diffusion zu erzielen, wurde der Skalierungs-
bzw. Gl¨
attungsparameter in beiden F¨
allen zu c= 1000 gesetzt. Der Ver-
gleich mit Abbildung 6.1 zeigt, dass hier eine signifikante Verbesserung, spe-
ziell bei der Lokalisierungsgenauigkeit der Kantenerhaltung stattgefunden
hat. F¨
ur den gesamten Bildbereich werden sowohl das Rauschen unter-
102 6 Experimentelle Ergebnisse
dr¨
uckt, als auch die salienten Kanten scharf und ohne wesentliche Lokalisie-
rungsungenauigkeiten abgebildet.
(a) (b)
Abbildung 6.3: Mandrill-Testbild: (a) N - Eingangsbild mit 10% unkorre-
liertem Rauschen, (b) R3.0n- anisotrope Diffusion mit Gl¨
at-
tungsparameter c= 3, (c) R250l- lineare isotrope Diffusion
mit Gl¨
attungsparameter c= 250 und (d) R250n- anisotrope
Diffusion mit Gl¨
attungsparameter c= 250.
Der naheliegendste Anwendungsbereich kantenerhaltender Regularisierung
ist die Rauschunterdr¨
uckung in digitalen Bildern. Im Folgenden findet da-
her eine Evaluation der anisotropen Gl¨
attung auf verrauschten Bildern statt.
Die in Tabelle 6.1 dargestellten Resultate beziehen sich auf das in Abbildung
6.3 dargestellte Mandrill-Testbild. In Abbildung 6.3(a) wurde das urspr¨
ung-
liche Bild in jedem Bildpunkt mit 10% Rauschen ¨
uberlagert. Um zwei Bilder
miteinander zu vergleichen, wird zun¨
achst der prozentuale Anteil an Farb-
bzw. Grauwerten betrachtet, die, bezogen auf die absolute Anzahl m·dan
Farbwerten eines Bildes mit mBildpunkten, f¨
ur den betrachteten Farbwert
6.1 Anisotrope Regularisierung 103
¨
Ahnlichkeit s= 1 s= 6 s= 16 s= 21
N∧O6.19 36.38 79.41 90.36
R0.1l∧O3.90 40.16 83.14 91.92
R0.1n∧O4.04 40.88 85.60 94.40
R0.2n∧O4.01 41.37 85.62 93.97
R0.3n∧O3.99 41.13 84.40 92.75
R0.5n∧O3.90 40.24 81.75 90.29
R250n∧R250o29.18 98.83 99.97 99.99
Tabelle 6.1: Mandrill-Testbild: ¨
Ahnlichkeit zwischen verrauschtem Bild (N),
Originalbild (O) und Ergebnis anisotroper (Rcn) und isotroper
(Rcl) Diffusion.
mit gegebener Bildposition einen Differenzbetrag aufweisen, der unter einem
Schwellwert sliegt. Ein hoher Wert bedeutet damit, dass die Bilder, bezogen
auf den Schwellwert, eine hohe ¨
Ahnlichkeit aufweisen. In Tabelle 6.1 wird
das Originalbild mit Obezeichnet, das verrauschte Eingangsbild mit Nund
zu gegebenen Gl¨
attungsparameter cbezeichnet Rcndas Ergebnis der auf
das verrauschte Eingangsbild angewandten anisotropen Diffusion, w¨
ahrend
f¨
ur RcOdas Originalbild als Eingangsbild dient.
Tabelle 6.1 stellt die oben beschriebene ¨
Ahnlichkeit f¨
ur unterschiedliche Bil-
der und unterschiedliche Schwellwerte dar. Ein Vergleich zwischen dem Ori-
ginalbild (O) und dem verrauschten Bild (N) zeigt, dass durch das additive
Rauschen weniger als sieben Prozent der Bildpunkte pro Farbkanal ihren
Farbwert beibehalten haben. Wie in Tabelle 6.1 zu sehen ist, f¨
uhrt im Ver-
gleich zur ¨
Ahnlichkeit zwischen Original und verrauschtem Bild (N∧O)
das beschriebene Regularisierungsverfahren ab einem betrachteten Schwell-
wert s= 6 zu einer h¨
oheren ¨
Ahnlichkeit zum Originalbild (Rcn∧O), wobei
diese ¨
Ahnlichkeit mit zunehmenden Gl¨
attungsparameter abnimmt. Die Er-
kl¨
arung hierf¨
ur liegt in den hochfrequenten Bildanteilen des Originalbilds,
speziell im Bereich der Haare des Mandrills, die Teil des Signals und nicht
des Rauschens sind, aber trotzdem mit zunehmenden Gl¨
attungsparameter
104 6 Experimentelle Ergebnisse
(a) (b) (c) (d)
Abbildung 6.4: Testbilder f¨
ur die Evaluierung in Tabelle 6.2: (a) Lena,
(b) Barbara, (c) Boats und (d) House. Alle Bilder sind mit
einem additiven gaußf¨
ormigen weißen Rauschen (σ= 100)
¨
uberlagert (aus [Por08]).
herausgefiltert werden. Dies erkl¨
art auch die besonders hohe ¨
Ahnlichkeit
zwischen der Regularisierung des Originalbildes und der des verrauschten
Eingangsbildes (R250n∧R250o) f¨
ur einen hohen Gl¨
attungsparameter c= 250.
Da die Eingangsbilder sich hier im Wesentlichen durch ihre hochfrequenten
Bildanteile unterscheiden, f¨
uhrt die anisotrope Regularisierung f¨
ur beide Bil-
der zu ann¨
ahernd gleichen Ergebnissen. Wie zu erwarten, weist das Ergebnis
anisotroper Diffusion eine h¨
ohere ¨
Ahnlichkeit zum Original auf, als das Er-
gebnis isotroper Diffusion des verrauschten Bildes (Rcl∧O).
Das in [PSWS03, GCP05] von Portilla et al. entwickelte Verfahren zur
Rauschunterdr¨
uckung in digitalen Bildern basiert auf einem statistischen
Modell f¨
ur die Koeffizienten der Multiskalenrepr¨
asentation eines Bildes durch
orientierungsselektive Filter im Rahmen einer Wavelet Transformation und
wird in [PSWS03] mit g¨
angigen Verfahren zur Rauschunterdr¨
uckung vergli-
chen. Resultat der umfangreiche Evaluierung ist, dass das Verfahren von
Portilla et al. g¨
angige Verfahren bez¨
uglich des PSNR-Wertes (Peak Signal
to Noise Ratio) ¨
ubertrifft.
6.1 Anisotrope Regularisierung 105
σ= 100 Lena Barbara Boats House
Portilla et al. 25.64 22.61 23.75 25.11
anisotrope Diffusion 25.65 22.07 23.13 24.92
Tabelle 6.2: Vergleich der Rauschunterdr¨
uckung durch anisotrope Diffusion
mit den Ergebnissen von Portilla et al., die Ergebnisse sind als
PSNR (Peak Signal to Noise Ratio) dargestellt. Die Eingangs-
bilder sind in Abbildung 6.4 dargestellt. Alle Ergebnisse der
anisotropen Diffusion wurden mit identischen Parametern be-
rechnet.
Um eine Einordnung der Rauschunterdr¨
uckungseigenschaften der hier vor-
gestellten anisotropen Regularisierung zu erm¨
oglichen, wird diese im Fol-
genden mit dem Verfahren von Portilla et al. verglichen [HM08]. Hierbei
werden mit den in Abbildung 6.4 gezeigten Bildern dieselben Testbilder ver-
wendet wie in [PSWS03]. Zum Vergleich wird auch hier der PSNR-Wert
herangezogen, der durch
PSNR = 10 ·log10 „2552
σ2
e«= 20 ·log10 „255
σe«(6.1)
definiert ist, wobei σ2
eden mittleren quadratischen Abstand zwischen Origi-
nal und rekonstruiertem Bild darstellt. Der Wert 255 stellt den maximalen
Farbwert bei g¨
angiger 8-Bit Darstellung dar.
Bezogen auf den mittleren quadratischen Abstand zeigt die anisotrope Regu-
larisierung einen wesentlichen Nachteil, sie zieht ein Zusammenschrumpfen
des Histogramms nach sich, was sich unabh¨
angig von der subjektiven Bild-
qualit¨
at unmittelbar auf den PSNR auswirkt. Um dennoch eine Vergleich-
barkeit der Ergebnisse zu erm¨
oglichen, basieren die in Tabelle 6.2 pr¨
asen-
tierten Ergebnisse auf einem linearen Histogrammabgleich der anisotropen
Regularisierungsergebnisse.
106 6 Experimentelle Ergebnisse
(a) (b)
Abbildung 6.5: Barbara-Testbild: (a) Originalbild und (b) Vergr¨
oßerung der
Tischregion.
Wie in Abbildung 6.6(c) zu sehen ist, verbleibt dennoch eine systematische
Abweichung des Grauwertlevels der Bildregionen im Vergleich zum Origi-
nalbild 6.5(b). F¨
ur s¨
amtliche Ergebnisse wurde ein Gl¨
attungsparameter von
c= 4.0 mit 60 Iterationsschritten genutzt. Der Startvektor ist durch das
verrauschte Eingangsbild gegeben und die Gewichtungsfaktoren der Umfeld-
kopplung resultieren aus einer Selbstorganisation der Gradientenkarte ent-
(a) (b) (c)
Abbildung 6.6: Barbara-Testbild: (a) Vergr¨
oßerung der Tischregion im ver-
rauschten Eingangsbild mit σ= 100 und PSNR = 8.13,
(b) Ergebnis der Rauschunterdr¨
uckung nach Portilla et. al.
(PSNR = 22.6) und (c) Ergebnis der Rauschunterdr¨
uckung
durch anisotrope Diffusion (PSNR = 22.1).
6.2 Konturverst¨
arkung 107
sprechend Kap. 3.3.3 mit einem Gl¨
attungsparameter von c= 8.0. Tabelle
6.2 zeigt, dass die PSNR-Werte des Verfahrens nach Portilla et al. [PSWS03]
bis auf das Lena-Testbild h¨
ohere Werte aufweisen und damit die quantitativ
bessere Rauschunterdr¨
uckung gew¨
ahrleisten.
Betrachtet man allerdings die Ergebnisbilder (vgl. Abbildung 6.6(b)), so
l¨
asst sich feststellen, dass das Verfahrens nach Portilla et al. f¨
ur stark ver-
rauschte Bilder Artefakte produziert, die im Ergebnis durch anisotrope Re-
gularisierung nicht auftreten (Abbildung 6.6(c)). Gerade f¨
ur die Zielsetzung
der vorliegenden Arbeit, im Rahmen einer Bildvorverarbeitung eine verl¨
as-
sliche Detektion von Konturen und Kreuzungspunkten zu gew¨
ahrleisten, ist
dies jedoch ein entscheidender Punkt.
6.2 Konturverst¨
arkung
Wie bereits in den Kapiteln 2.5 und 4.1.3 beschrieben wurde, l¨
asst sich un-
ter Verwendung eines bipolaren Verbindungsschemas das in Kap. 4.1 vorge-
stellte Tensorvotingverfahren zur Verst¨
arkung salienter Konturen nutzen.
Ein solcher Ansatz wird in [MBM02b, MBM02a, MBM03] verfolgt, wo-
bei die Eingangstensoren aus einer ¨
Uberlagerung unterschiedlich orientier-
ter Tensoren mit den Filterantworten entsprechend orientierter Gaborfilter
[Gab46, Dau88, Tra98, Tra96], resultieren.
Zum Testbild in Abbildung 3.15(a) aus Kap. 3.3.3 sind die Sticksalienzen
der Tensoren nach erfolgtem Stickvoting in Abbildung 6.7 dargestellt, wobei
Abbildung 6.7(a) auf einem bipolaren Stickvotingfeld beruht, w¨
ahrend der
Votingprozess in Abbildung 6.7(b) zus¨
atzlich inhibitorische Anteile aufweist.
Der Vergleich mit dem Ergebnis der Selbstorganisation der Gradientenkarte
in Abbildung 6.7(c) zeigt, das die in Kap. 3.3.3 beschriebene Vorgehensweise
sowohl in der Verst¨
arkung salienter Konturen, der Lokalisierungsgenauig-
keit, als auch der Unterdr¨
uckung von Rauschprozessen eindeutige Vorteile
aufweist.
108 6 Experimentelle Ergebnisse
(a) (b) (c)
Abbildung 6.7: Ergebnis der Verst¨
arkung salienter Konturen: (a) Ergebnis
nach Stickvoting (aus [MBM02a]), (b) Votingprozess mit in-
hibitorischem Anteilen (aus [MBM02a]) und (c) Ergebnis der
Selbstorganisation der Gradientenkarte nach Kap. 3.3.3.
Dies zeigt sich auch bei der Betrachtung der Kanten in Abbildung 6.8,
die sich aus einer Kantendetektion nach erfolgter Konturverst¨
arkung er-
geben. Zum Vergleich ist in Abbildung 6.8(a) das Ergebnis einer Canny-
Kantendetektion dargestellt.
(a) (b) (c)
Abbildung 6.8: Detektierte Kanten zum Steine-Testbild: (a) Canny-
Kantendetektion (aus [MTW99]), (b) Ergebnis nach Tensor-
voting (aus [MM02]) und (c) Ergebnis der Kantendetektion
nach Selbstorganisation der Gradientenkarte.
6.3 Kanten- und Eckendetektion 109
Auch hier zeigt sich, dass die vorgeschlagene Vorgehensweise Kanten loka-
lisierungsgenau detektiert und die Auswirkung der hochfrequenten Textu-
ranteile auf die Kantendetektion unterbinden kann. Man beachte, dass im
Gegensatz zu den in den Abbildungen 6.8(a) und (b) pr¨
asentierten Verfahren
die hier vorgestellte Kantendetektion keinerlei Schwellwert ben¨
otigt.
6.3 Kanten- und Eckendetektion
F¨
ur die in Kap. 3.2.1 beschriebene schwellwertfreie Kantendetektion ist in
Abbildung 6.8(c) bereits ein Beispiel gegeben. Die Funktionsweise soll nun
anhand eines weiteren Testbildes erl¨
autert werden. Zu der in Abbildung
6.9(a) dargestellten Laborszene sind in Abbildung 6.9(b) s¨
amtliche Kandida-
ten einer Kantendetektion dargestellt, also relative Maxima der in Kap. 3.1
beschriebenen Kanten- und Eckenfilter und Nulldurchg¨
ange der ZU-Filter.
(a) (b) (c)
Abbildung 6.9: Laborszene: (a) Eingangsbild (aus [MS98]), (b) aus s¨
amtli-
chen Filterergebnissen resultierende Kandidaten f¨
ur Kanten
und (c) detektierte Kanten nach Trackingverfahren.
Anstatt jedes Filtermaximum mit einer Schwellwertoperation zu versehen,
wird nun, ausgehend von idealen Kombinationen der Filterantworten, wie in
Kap. 3.2.1 beschrieben eine Kantenverfolgung realisiert. Das Ergebnis ist in
110 6 Experimentelle Ergebnisse
Abbildung 6.9(c) dargestellt und zeigt, dass aus der Menge aller m¨
oglichen
Kanten die wesentlichen Kanten korrekt herausgebildet werden.
(a) (b)
Abbildung 6.10: Laborszene: (a) Eingangsbild mit um 50% reduzierter Hel-
ligkeit und (b) detektierte Kanten.
Das Verwenden einer Schwellwertoperation, wie sie beim Cannydetektor
oder gradientenbasierten Filtermasken genutzt wird, erzeugt eine hohe Emp-
findlichkeit dieser Verfahren bei einer ¨
Anderung der Helligkeit des Eingangs-
bildes, wobei dieser Effekt beim Cannydetektor durch Einsatz einer soge-
nannten Hysterese-Schwellwertbildung gemindert wird [ZT98, Can86]. Im
Gegensatz dazu ist die in Kap. 3.2.1 beschriebene Kantenverfolgung relativ
unabh¨
angig von der Beleuchtung des Bildes, wie Abbildung 6.10 zeigt. Das
Eingangsbild, Abbildung 6.10(a), zeichnet sich durch eine um 50% reduzierte
Helligkeit gegen¨
uber Abbildung 6.9(a) aus. Dagegen zeigen die detektierten
Kanten in Abbildung 6.10(b) kaum Unterschiede zu denen in Abbildung
6.9(b) und demonstrieren damit die Beleuchtungsunabh¨
angigkeit des vorge-
stellten Verfahrens.
6.3 Kanten- und Eckendetektion 111
(a) (b) (c)
Abbildung 6.11: Vergleich von Verfahren zur Eckendetektion (aus
[MS98]): (a) CSS (Curvature Scale Space) [MS98],
(b) SUSAN [SB97] und (c) Eckpunktdetektion gem¨
aß
Kap. 3.2.2.
Abbildung 6.11(c) zeigt das Ergebnis der in Kap. 3.2.2 beschriebenen De-
tektion von Eckpunkten. Der Vergleich mit aktuellen Verfahren zur Ecken-
detektion zeigt, dass die hier beschriebene Vorgehensweise zu vergleichbaren
(Abbildung 6.11(a)) oder sogar genaueren Ergebnissen (Abbildung 6.11(b))
f¨
uhrt, wobei hier durch die bereits durchgef¨
uhrten Vorverarbeitungsschritte
kaum zus¨
atzlicher Berechnungsaufwand entsteht.
Alle Ergebnisse zu Abbildung 6.9(a) wurden mit 18 Filterorientierungen und
Filtermasken mit einer Gr¨
oße von 14 ×14 Pixeln berechnet. Einige Kreu-
zungspunkte, die nicht in Abbildung 6.11(c) als Eckpunkt gekennzeichnet
sind, wurden bereits im Verlauf der Kantendetektion als T-Kreuzung ge-
kennzeichnet (vgl. Abbildung 6.9(c)). F¨
ur eine weiterf¨
uhrende Behandlung
von Verfahren zur Detektion von Eckpunkten siehe [MS98, SB97, RT99,
BKY02].
112 6 Experimentelle Ergebnisse
6.4 Konturvervollst¨
andigung
Das in Abbildung 6.12(a) dargestellte Eingangsbild zeigt wieder das Kanizsa
Dreieck [Kan79], welches als klassisches Beispiel f¨
ur Scheinkonturwahrneh-
mung in biologischen Sehsystemen gilt (vgl. Kap. 2.3). Abbildung 6.12(b)
zeigt das Ergebnis der Bildvorverarbeitung. ¨
Uber die orientierungsselektive
Filterbank werden die im Bild vorhandenen Kanten extrahiert. Es werden
außerdem sowohl Kreuzungspunkte, als auch die Richtungen m¨
oglicher Fort-
setzungen detektiert, welche in Abbildung 6.12(b) heller als die detektierten
Kanten dargestellt sind.
(a) (b) (c)
Abbildung 6.12: Kanizsa Dreieck: (a) Eingangsbild, (b) detektierte Kan-
ten mit Fortsetzungsrichtung an Kreuzungspunkten und
(c) Sticksalienz nach Votingprozess.
In Abbildung 6.12(c) ist das Ergebnis des Tensorvoting Prozesses visua-
lisiert. Dargestellt ist die d¨
unn besetzte Tensorkarte nach erfolgtem Vo-
tingprozess, wobei der Grauwert jedes Bildpunktes mit der Sticksalienz des
jeweiligen Tensors korrespondiert. Falls eine sinnvolle Verbindung zwischen
Kreuzungspunkten besteht, kann diese durch eine Flankenmaximumsuche
gefunden werden.
6.4 Konturvervollst¨
andigung 113
(a) (b)
Abbildung 6.13: Konturvervollst¨
andigungen: (a) nach Tensorvoting und
(b) nach Splineinterpolation.
Die derart bestimmten Konturvervollst¨
andigungen sind in Abbildung 6.13
zusammen mit den urspr¨
unglich detektierten Konturen, dargestellt. Hierbei
f¨
allt auf, dass die durch das Tensorvoting erzeugte Konturvervollst¨
andigung
in Abbildung 6.13(a) insbesondere f¨
ur die Vervollst¨
andigung der Kreise eine
ungleichm¨
aßige Kr¨
ummung aufweist, was in der Skalierung der Votingfelder
begr¨
undet ist, wie Abbildung 6.12(c) zeigt. Dagegen ist die in Abbildung
6.13(b) dargestellte Konturvervollst¨
andigung durch Splineinterpolation ska-
lierungsunabh¨
angig, die Kr¨
ummung kann hier ¨
uber einen skalierungsunab-
h¨
angigen Parameter eingestellt werden (vgl. Kap. 4.3). Dementsprechend
kann hier unabh¨
angig von der Gr¨
oße des Eingangsbildes eine gleichm¨
aßige
Kr¨
ummung erzielt werden. Zusammenh¨
angende Konturen werden in einem
Kettencode gespeichert, dar¨
uber hinaus wird die Information festgehalten,
ob es sich bei einem Konturabschnitt um eine real im Bild existierende Kon-
tur handelt, oder ob der Konturabschnitt im Rahmen der Konturvervoll-
st¨
andigung hinzugef¨
ugt wurde.
114 6 Experimentelle Ergebnisse
(a) (b) (c)
Abbildung 6.14: ¨
Uberlagerung zweier Balken und einer Kreisfl¨
ache: (a) Ein-
gangsbild, (b) detektierte Kanten mit Fortsetzungsrichtung
an Kreuzungspunkten und (c) Sticksalienz nach Votingpro-
zess.
Wie bereits in Kap. 4.1.3 erw¨
ahnt, kann eine ¨
Uberkreuzung m¨
oglicher Ver-
vollst¨
andigungen im Rahmen des Tensorvotingprozesses zu einer unerw¨
unsch-
ten ¨
Uberlagerung der Votingfelder f¨
uhren. Dies ist in Abbildung 6.14(c) dar-
gestellt. Die Vervollst¨
andigungsrichtungen, welche von den Konturunterbre-
chungen der schwarzen Balken in Abbildung 6.14(a) erzeugt werden, generie-
ren Votingfelder, die sich mit rechtwinklig verlaufenden Feldern ¨
uberlagern.
Die ¨
Uberlagerung f¨
uhrt zu Tensoren, deren zweiter Eigenwert λ2ansteigt
und eine erh¨
ohte Orientierungsunsicherheit signalisiert. Die Sticksalienz
λ1−λ2, welche die Orientierungssicherheit anzeigt, verschwindet dagegen
stellenweise ganz, was zu einer fehlerhaften Konturvervollst¨
andigung f¨
uhrt,
wie Abbildung 6.15 zeigt.
W¨
ahrend die Kreiskontur korrekt vervollst¨
andigt wird, ist dies f¨
ur die Ver-
vollst¨
andigungen der Balken nicht der Fall. Wie schon erw¨
ahnt, ließe sich
dieses Problem umgehen, indem je zwei Vervollst¨
andigungsrichtungen geson-
dert betrachtet werden. Hierzu ist allerdings nicht nur eine seperate Ten-
sorkarte f¨
ur jedes Verbindungspaar notwendig, es m¨
usste zuvor auch eine
Bewertung der Verbindungswahrscheinlichkeiten wie in Kap. 4.2 stattfin-
den. Dies widerspricht allerdings der Idee des Votingverfahrens, welches die
6.5 Perzeptuelle Organisation vervollst¨
andigter Konturen 115
(a) (b)
Abbildung 6.15: Konturvervollst¨
andigungen: (a) nach Tensorvoting und
(b) nach Splineinterpolation.
Gestaltprinzipien der N¨
ahe und guten Fortsetzung bereits durch Konstruk-
tion des Votingfeldes ber¨
ucksichtigt. Die Konturvervollst¨
andigung durch
Splineinterpolation in Abbildung 6.15(b) f¨
uhrt dagegen erwartungsgem¨
aß
zu keinerlei Fehlzuordnungen, da hier die Verbindung der Kreuzungspunkte
allein von der Position der Kreuzungspunkte und den Vervollst¨
andigungs-
richtungen abh¨
angt.
6.5 Perzeptuelle Organisation vervollst¨
andigter Konturen
Sowohl das Kanizsa Dreieck als auch die in Abbildung 6.16 dargestellten
Ringe verdeutlichen die Zielsetzung perzeptueller Organisation, unterschied-
liche Formen auch dann als Ganzes wahrzunehmen, wenn sie teilweise ver-
deckt sind. F¨
ur eine Tiefenzuordnung weisen die Ringe dar¨
uber hinaus die
Problematik auf, dass keine bin¨
are Entscheidung im Sinne von Vorder- oder
Hintergrund getroffen werden kann, da jeder Ring in der sinnvollsten dreidi-
mensionalen Interpretation sowohl dem Vorder- als auch dem Hintergrund
des jeweils anderen Ringes zuzuordnen ist.
116 6 Experimentelle Ergebnisse
(a) (b)
(c) (d)
Abbildung 6.16: Ineinander verschlungene Ringe: (a) Eingangsbild, (b) de-
tektierte Kanten mit Fortsetzungsrichtung an Kreuzungs-
punkten, (c) Sticksalienz nach Votingprozess und (d) Kon-
turvervollst¨
andigungen nach Tensorvoting.
Zustandswechsel von realer zu vervollst¨
andigter Kontur geben im Bereich
von Kreuzungspunkten Aufschluss dar¨
uber, ob eine Kontur die Objekt-
begrenzung eines Vordergrundobjekts darstellt, oder ob sie dem Hinter-
grund zuzuordnen ist. Durch Anwendung der in Kap. 5.1 beschriebenen
Figur-Grund-Unterscheidung kann nun zun¨
achst im Bereich von Kreuzungen
zweier Konturen eine Unterscheidung von Vorder- und Hintergrund getroffen
werden. Das Ergebnis des dynamischen Zuordnungsprozesses entsprechend
Kap. 5.2, welcher die Tiefeninformation von den Kreuzungspunkten zum
Rest der Kontur propagiert, ist in Abbildung 6.17 dargestellt. Nur Kon-
turelementen ist hierbei ein Grauwert zugeordnet, s¨
amtliche anderen Bild-
6.5 Perzeptuelle Organisation vervollst¨
andigter Konturen 117
punkte sind schwarz dargestellt. Ein hoher, d. h. heller Grauwert repr¨
asen-
tiert eine relative N¨
ahe zum Betrachter bzw. zum Kamerasystem, w¨
ahrend
dunkle Werte f¨
ur eine h¨
ohere Entfernung zur Kamera stehen.
(a) (b)
Abbildung 6.17: Tiefenzuordnung f¨
ur (a) das Kanizsadreieck und (b) die An-
ordnung aus Abbildung 6.16(a).
Wie Abbildung 6.17 zeigt, kann mit der geschilderten Vorgehensweise eine
Einteilung des Bildinhalts in ¨
uberlappende Objektgrenzen und eine Extrak-
tion monokularer Tiefeninformation aus den Eingabebildern realisiert wer-
den. Dar¨
uber hinaus k¨
onnen auch komplexere Tiefenanordnungen, die einen
Wechsel der Tiefenwerte entlang einer Kontur aufweisen, modelliert wer-
den.
Die Problematik und Mehrdeutigkeit, welche mit einer Figur-Grund-Unter-
scheidung verbunden ist, ist in Abbildung 6.18 dargestellt, die das Verhalten
der in Kap. 5.1 beschriebenen Figur-Grund-Unterscheidung demonstriert.
Abbildung 6.18(a) weist starke Mehrdeutigkeiten auf, zu dem vervollst¨
andig-
ten Kreis kann der weiße Balken sowohl als Vorder- als auch als Hintergrund
interpretiert werden. In Analogie zur Musterung eines Zebras kann der Bal-
ken auch als Teil der Textur des Kreises aufgefasst werden. Da keine der in
Kap. 5.1 beschriebenen Konditionen f¨
ur eine Figur-Grund-Unterscheidung
hier zutrifft, findet keine Tiefenzuordnung statt, die Konturen des Balkens
erhalten die gleiche Tiefe wie die des Kreises. Auch Abbildung 6.18(b) weist
118 6 Experimentelle Ergebnisse
(a) (b) (c)
Abbildung 6.18: Obere Reihe: Eingangsbilder mit Kreis und Balken, mitt-
lere Reihe: von Kreuzungspunkten entsprechend der Ver-
vollst¨
andigungsrichtung generierte Votingfelder und untere
Reihe: reale und vervollst¨
andigte Konturen mit zugeordne-
ter relativer Tiefe.
immer noch Mehrdeutigkeiten auf, der weiße Balken kann sowohl vor einer
schwarzen Kreisfl¨
ache als auch vor oder hinter einer weißen Fl¨
ache mit ei-
nem Loch liegen, die sich vor einem schwarzen Hintergrund befindet. Im
Unterschied zu Abbildung 6.18(a) wird hier bereits durch die induzierenden
Elemente und die Schließung der Kontur die Wahrnehmung des Balkens als
ein Objekt forciert. Es gibt auch in diesem Fall keine eindeutig als rich-
tig zu bewertende Interpretation, durch die in Kap. 5.1 formulierte Figur-
Grund-Unterscheidung f¨
uhrt hier aber die Tatsache, dass sich die Kreisver-
vollst¨
andigungen im Inneren der geschlossenen Kontur des Balkens befinden,
zu einer Interpretation, die die Objektgrenze des Balkens als Vordergrund
bewertet. Schließlich l¨
asst 6.18(c) den geringsten Spielraum f¨
ur Mehrdeu-
tigkeiten, da hier eine zus¨
atzliche Farbinformation hinzukommt, welche die
Wahrnehmung des Balkens als Hintergrund und des Kreises als Vordergrund
forciert, wobei der Kreis hier sinnvoll als Objektgrenze eines Loches zu in-
terpretieren ist. Die in Kap. 5.1 vorgestellte Figur-Grund-Unterscheidung
6.6 Nat¨
urliche Bilder 119
resultiert hier in einer eben solchen Interpretation, da die realen Konturen
im Kreuzungsbereich von Kreis und Balken eine T-Kreuzung bilden, d. h. die
Kontur des Balkens wechselt den Status von real zu vervollst¨
andigt, w¨
ahrend
die Kontur des Kreises durchgehend real bleibt.
6.6 Nat¨
urliche Bilder
Das Ergebnis perzeptueller Organisation ist abh¨
angig von der Qualit¨
at der
Eckendetektion und der Orientierungsgenauigkeit von m¨
oglichen Kontur-
fortsetzungen. W¨
ahrend dies in den bisher behandelten synthetischen Bil-
dern kein Problem darstellte, weisen nat¨
urliche Bilder eine Vielzahl an Eck-
punkten auf, die zu falscher Detektion von Kreuzungspunkten und Vervoll-
st¨
andigungsrichtungen f¨
uhren k¨
onnen. Wie schon beschrieben, ist außer-
dem h¨
aufig eine Reduktion des Detailgrads des betrachteten Bildes w¨
un-
schenswert, ohne wichtige Konturinformationen zu ver¨
andern. Durch die
in Kap. 3.3 vorgestellte anisotrope Regularisierung kann allerdings einem
Großteil dieser Problematik in einem weiteren Vorverarbeitungsschritt ent-
gegengewirkt werden, wie Abbildung 6.19 zeigt.
Ohne den Vorverarbeitungsschritt der anisotropen Diffusion (vgl. Abb. 6.19(c))
liefert die Kanten- und Eckendetektion keine verl¨
asslichen Informationen,
wie Abbildung 6.19(b) zeigt. Grund hierf¨
ur sind die Schriftzeichen sowohl
auf dem Papier, das den Hintergrund darstellt, als auch auf dem dem St¨
uck
Papier, das Teile der M¨
unzen okkludiert und damit zu einer Tiefenkonstel-
lation ¨
ahnlich dem Kanizsa Dreieck f¨
uhrt. Mit dem Vorverarbeitungsschritt
der anisotropen Diffusion kann das Eingangsbild auf wesentliche Elemente
reduziert werden, wodurch eine korrekte perzeptuelle Organisation gew¨
ahr-
leistet wird (Abb. Abb. 6.19(d)).
120 6 Experimentelle Ergebnisse
(a) (b)
(c) (d)
Abbildung 6.19: Drei M¨
unzen auf beschriftetem Papier: (a) Originalbild,
(b) Ergebnis der Kantendetektion auf dem Originalbild,
(c) Eingangsbild nach anisotroper Diffusion mit schwellwert-
behafteten Gewichtungsfaktoren und (d) Ergebnis perzep-
tueller Organistion mit vervollst¨
andigten Konturen und er-
folgter Tiefenzuordnung.
6.6 Nat¨
urliche Bilder 121
(a) (b)
Abbildung 6.20: Bild eines Bleistiftes, der durch zwei Dichtungsringe ge-
steckt wurde: (a) Originalbild und (b) Ergebnis nach ani-
sotroper Diffusion mit schwellwertbehafteten Gewichtungs-
faktoren. Die untere Reihe zeigt eine Vergr¨
oßerung eines
Bildbereiches mit sich kreuzenden Objektgrenzen.
Auch in Abbildung 6.20 erlaubt das durch die anisotrope Diffusion simpli-
fizierte Bild eine korrekte Detektion von Kreuzungspunkten, die wiederum
zu einer erfolgreichen Konturvervollst¨
andigung f¨
uhrt, wie Abbildung 6.21(a)
zeigt. Auch hier besteht eine besondere Herausforderung in der Tiefenan-
ordnung der Objekte, die keinen konstanten Verlauf aufweist. Wie in Ab-
bildung 6.21(b) zu erkennen ist, f¨
uhrt die Figur-Grund-Unterscheidung an
Kreuzungspunkten und die anschließende dynamische Tiefenzuordnung zu
einer korrekten dreidimensionalen Interpretation. Um dies weiter zu illu-
122 6 Experimentelle Ergebnisse
(a) (b)
Abbildung 6.21: Bleistift-Testbild: (a) vervollst¨
andigte Kanten nach Splin-
einterpolation und (b) Tiefenwerte nach dynamischer Tie-
fenzuweisung.
strieren, sind in Abbildung 6.22 verschiedenen Seitenansichten der relativen
Tiefe dargestellt.
Obwohl an den Kreuzungspunkten lediglich der Status des Vordergrundes
oder des Hintergrundes f¨
ur eine Kontur bestimmt wird, f¨
uhrt die dynamische
Tiefenzuordnung, wie sie in Kap. 5.2 vorgestellt wird, zu einer dreidimen-
sionalen Interpretation, welche die relative Lage der Dichtungsringe und des
Bleistifts allein aufgrund des monokularen Tiefenkriteriums der Verdeckung
qualitativ rekonstruieren kann. Die in Abbildung 6.22 dargestellten unteren
beiden Tiefenwerte ergeben sich mit dem in Kap. 5.2 beschriebenen Nach-
verarbeitungsschritt, welcher auf der Interpretation von Objektgrenzen als
Kreise auf einer geneigten Ebene basiert. Wie Abbildung 6.22 zeigt, funk-
tioniert dies selbst f¨
ur ein Objekt wie den dargestellten Bleistift.
Abschließend ist zu bemerken, dass in dem zweidimensionalen Abbild einer
realen Szene h¨
aufig eine Vielzahl von Objekten enthalten ist, die unterschied-
liche Entfernungen zur Kamera aufweisen, aber ¨
uber keine rekonstruierbaren
6.6 Nat¨
urliche Bilder 123
Abbildung 6.22: Bleistift-Testbild – Oben: Seitenansicht ohne Nachverarbei-
tungsschritt, Mitte: Seitenansicht mit Nachverarbeitungs-
schritt und Unten: perspektivische Seitenansicht der relati-
ven Tiefenwerte mit Nachverarbeitungsschritt
verdeckten Objektgrenzen verf¨
ugen. Da in dem hier pr¨
asentierten Verfah-
ren aber allein die rekonstruierbare Verdeckung als Tiefenkriterium genutzt
wird, macht die Anwendung des Verfahrens in solchen F¨
allen ohne die Kom-
bination mit weiteren Tiefenkriterien keinen Sinn.
124 6 Experimentelle Ergebnisse
6.7 Laufzeiten
F¨
ur das Grauwertbild der Abbildung 6.16(a) mit einer Gr¨
oße von 256 ×256
Pixeln kann die Gesamtlaufzeit des Verfahrens auf unter einer Sekunde ein-
gestellt werden. Die Berechnungen erfolgten dabei mit einer Intel Core 2
CPU 6600 mit 2,4 GHz und 4096 KB L2 Cache. Der gr¨
oßte Anteil der Lauf-
zeit entf¨
allt hierbei auf die Filterung. Mit einem Filterradius von 7 Pixeln
und 12 betrachteten Orientierungen werden zur Filterung im Mittel 0,75 Se-
kunden ben¨
otigt. Bei einem Filterradius von 3 Pixeln und 5 Orientierungen
reduziert sich die Berechnungszeit dagegen auf 0,12 Sekunden. Sowohl die
Kanten- und Eckendetektion, die Konturvervollst¨
andigung durch Splinein-
terpolation, als auch die Figur-Grund-Unterscheidung ben¨
otigen mit weni-
ger als 10 Millisekunden kaum Rechenzeit. Bei einem iterativen Prozess wie
der dynamischen Tiefenzuweisung ist die Rechenzeit dagegen stark abh¨
angig
von der Parameterwahl, mit 20 Iterationen werden hier ca. 0,02 Sekunden
ben¨
otigt. Ebenfalls rechenintensiv ist der iterative Vorverarbeitungsschritt
der anisotropen Diffusion, der f¨
ur Abbildung 6.16 nicht ben¨
otigt wird. Bei
einer Umfeldgr¨
oße von 3 ×3 Pixeln und 20 Iterationen w¨
urde er 1,3 Sekun-
den beanspruchen, womit die anisotrope Diffusion rechenintensiver ist als
der gesamte restliche Prozess der perzeptuellen Organisation.
7 Zusammenfassung
In Rahmen der vorliegenden Arbeit konnte eine Einteilung von Bildinhalten
in ¨
uberlappende Objektgrenzen realisiert werden, wobei Konturverl¨
aufe, die
durch Verdeckung unterbrochen sind, erfogreich rekonstruiert und zur Be-
stimmung der relativen Tiefenanordnung der gegebenen Konstellation her-
angezogen werden konnten. Die hier pr¨
asentierte Organisation von Objekt-
grenzen erm¨
oglicht es, auch f¨
ur Konturen von Objekten, die entlang des
Konturverlaufs keinen konstanten Tiefenwert aufweisen, wie dies z. B. bei
sich gegenseitig verdeckenden Objekten der Fall ist, eine sinnvolle dreidi-
mensionale Interpretation der betrachteten Szene zu generieren. Es konnte
somit gezeigt werden, dass eine Extraktion monokularer Tiefeninformation
allein aufgrund von Verdeckungen m¨
oglich ist.
Grundlage f¨
ur die perzeptuelle Organisation der Objektgrenzen ist die De-
tektion von Sch¨
usselpunkten, die durch eine Unterbrechung des Konturver-
laufs durch ein verdeckendes Objekt im Falle amodaler Konturen oder durch
ein Wechsel der Hintergrundfarbe zu einer dem Vorderdrund identischen
Farbe im Falle modaler Konturen entstanden sein k¨
onnen. Ausgehend von
solchen Schl¨
usselpunkten findet eine Wahrscheinlichkeitserw¨
agung statt, ob
zwei Schl¨
ussel- bzw. Kreuzungspunkte zueinander gruppiert werden k¨
onnen,
und, falls dies der Fall ist, wie der Verbindungsweg dieser Punkte aussieht.
Weiterhin wird unter Nutzung sowohl lokaler als auch globaler Kriterien die
Anordnung von realen und vervollst¨
andigten Kanten an Schl¨
usselpunkten
herangezogen, um sich kreuzende Konturen im Bereich von Schl¨
usselpunk-
ten entweder dem Vorder- oder dem Hintergrund zuzuordnen. Aufgrund
dieser Zuordnung findet durch einen Diffusionsprozess in einem abschlie-
ßenden Schritt eine Propagation der Tiefeninformationen ¨
uber die gesamte
Kontur statt.
126 7 Zusammenfassung
Das beschriebene Verfahren ist als Bottom-Up-Prozess realisiert und damit
unabh¨
angig von einer Wissensbasis. Dies hat zur Folge, dass die Wahrneh-
mungsprozesse in einem nat¨
urlichen Bild h¨
aufig in einem Detailgrad statt-
finden, welcher nicht notwendigerweise der Seherfahrung eines Beobachters
entspricht, der die Skalierung seiner Aufmerksamkeit von dem Wissen ¨
uber
die Gr¨
oße und Anzahl der dargestellten Objekte abh¨
angig macht. Dar¨
uber
hinaus ist das Ergebnis abh¨
angig von der Qualit¨
at der Eckendetektion und
der Orientierungsgenauigkeit von m¨
oglichen Konturfortsetzungen. W¨
ahrend
dies in synthetischen Bildern in der Regel kein Problem darstellt, weisen
nat¨
urliche Bilder eine Vielzahl an Eckpunkten auf, die zu St¨
orungen im
Prozess der Scheinkonturwahrnehmung f¨
uhren k¨
onnen. Um diesen Punkten
Rechnung zu tragen und eine robuste Anwendung des beschriebenen Ver-
fahrens auf nat¨
urlichen Bildern zu gew¨
ahrleisten, wurde mit der vorgestell-
ten anisotropen Regularisierung ein weiterer Vorverarbeitungsschritt reali-
siert, welcher es erm¨
oglicht, ein Eingangsbild zu simplifizieren, d. h. hoch-
frequente Bildinhalte entsprechend einer gew¨
unschten Skalierung aus dem
Bild zu entfernen, ohne dabei Existenz und Lokalisierung markanter Konur-
verl¨
aufe zu ver¨
andern, wodurch das Bild auf die wesentlichen Bildinhalte
reduziert wird.
Unter den im Verlauf der vorliegenden Arbeit ber¨
ucksichtigten Themen der
digitalen Bildverarbeitung, wie schwellwertfreier Kanten- und Eckendetek-
tion, Rauschunterdr¨
uckung, Verst¨
arkung salienter Konturen und Scheinkon-
turwahrnehmung, ist die anisortope Regularisierung, insbesondere mit der
vorgestellten Selbstorganisation der Gradientenkarte, von besonderem Inter-
esse, da sie in allen gezeigten Anwendungen sehr vielversprechende Ergeb-
nisse liefert und dar¨
uber hinaus eine F¨
ulle weiterer Anwendungsm¨
oglichkei-
ten, wie z. B. Inpainting, Bildvergr¨
oßerung oder Aufl¨
osung von Mehrdeutig-
keiten in einem stereoskopischen Disparit¨
atsraum bietet.
Die pr¨
asentierte Arbeit kann als ein erster Schritt in Richtung einer um-
fassenden maschinellen Tiefenwahrnehmung betrachtet werden, da g¨
angige
Verfahren zur Rekonstruktion der Tiefeninformation sich ausschließlich auf
127
die stereoskoische Korrespondenzbestimmung in Stereobildern, gegebenen-
falls unter Ber¨
ucksichtigung der zeitlichen Komponente, beschr¨
anken. Be-
trachtet man das visuelle System des Menschen, so liegt die Effizienz der
Wahrnehmung nicht zuletzt in der Kopplung unterschiedlicher Tiefenkrite-
rien begr¨
undet. Eine solche Kopplung von Tiefenkriterien ist also f¨
ur maschi-
nelle Bildverarbeitung durchaus denkbar und sinnvoll. So ließe sich die in der
vorliegenden Arbeit vorgestellte Figur-Grund-Unterscheidung an Schl¨
ussel-
punkten ohne weiteres mit den Ergebnissen binokularer Tiefenwahrnehmung
verkn¨
upfen. Stereoskopische Tiefeninformation kann gerade an Schl¨
ussel-
punkten besonders gut zur Figur-Grund-Unterscheidung herangezogen wer-
den, da Stereoalgorithmen in diesen Bereichen aufgrund des hohen Infor-
mationsgehaltes des Bildes besonders zuverl¨
assige Aussagen treffen. Um-
gekehrt l¨
asst sich die Konturinformation, welche durch die hier vorgestellte
perzeptuelle Organisation auch teilweise verdeckte Objektgrenzen darstellt,
sowohl zur Einschr¨
ankung des Suchraums stereoskopischer Korrespondenz-
bestimmung, als auch im Kontext von Objekterkennungsstrategien, die in
der Regel auf eine vollst¨
andige Repr¨
asentation von Objektgrenzen angewie-
sen sind, nutzen.
128 7 Zusammenfassung
Literaturverzeichnis
[AB98] Alter, T. D.; Basri, R.: Extracting Salient Curves from
Images: An Analysis of the Saliency Network. In: Int. J. Com-
put. Vision 27 (1998), Nr. 1, S. 51–69. – ISSN 0920–5691
[ABBFC97] Aubert, G.; Barlaud, M.; Blanc-Feraud, L.; Char-
bonnier, P.: Deterministic edge-preserving regularization in
computed imaging. In: IEEE Trans. Imag. Process. (1997). –
5(12)
[Ade01] Adelson, E. H.: On seeing stuff: the perception of materials
by humans and machines. In: Proceedings of the SPIE Bd.
4299, Human Vision and Electronic Imaging VI, Bernice E.
Rogowitz; Thrasyvoulos N. Pappas (Hrsg.), 2001, S. 1–12
[ASF02] Anderson, B. L.; Singh, M; Fleming, R. W.: The Interpola-
tion of Object and Surface Structure. In: Cognitive Psychology
44 (2002), S. 148–190
[Bab03] Babos, Martin: Anwendung des Tensor-Voting-Verfahrens auf
Grauwertbilder, Universit¨
at Hamburg, Diplomarbeit, Februar
2003
[Bar04] Bartsch, Hans-Jochen: Taschenbuch Mathematischer For-
meln. 20. Auflage. Fachbuchverlag Leipzig im Carl Hanser
Verlag, 2004
[Bau78] Baumgartner, G.: Physiologie des zentralen Sehsystems. In:
Gauer, Kramer, Jung (Hrsg.): Physiologie des Menschen 13
(1978), S. 263–256
[BHM04a] Brockers, Roland; Hund, Marcus; Mertsching, B¨
arbel: A
fast cost relaxation stereo algorithm with occlusion detection
for mobile robot applications. In: Vision, Modeling, and Vi-
sualization 2004. Stanford, USA, September 2004. – ISBN
3–89838–058–0, S. 47 – 53
[BHM04b] Brockers, Roland; Hund, Marcus; Mertsching, B¨
arbel:
Fast stereo vision for mobile robots by global minima of cost
130 Literaturverzeichnis
function. In: 6th IEEE Southwest Symposium on Image Analy-
sis and Interpretation. Lake Tahoe, Nevada, USA, 2004, S. 85
– 89
[BHM05] Brockers, Roland; Hund, Marcus; Mertsching, B¨
arbel: ste-
reo matching with occlusion detection using cost relaxation. In:
IEEE International Conference on Image Processing, 2005
[BKY02] Bae, Sun C.; Kweon, In-So; Yoo, Choong D.: COP: a new
corner detector. In: Pattern Recognition Letters 23 (2002), Nr.
11, S. 1349–1360
[Can86] Canny, J: A computational approach to edge detection. In:
IEEE Trans. Pattern Anal. Mach. Intell. 8 (1986), Nr. 6, S.
679–698. – ISSN 0162–8828
[Dau88] Daugman, J. G.: Complete disrete 2-D Gabor transforms by
neural networks for image analysis and compression. In: IEEE
Trans. on Acoustics Speech and Signal Processing 36 (1988),
Nr. 7, S. 1169–1179
[ESS03] Ehrenstein, Walter H.; Spillmann, Lothar; Sarris, Viktor:
Gestalt issues in modern neuroscience. In: Axiomathes 13
(2003), Nr. 3, S. 433–458
[Fel06] Feldmann, Michael: Approximation des Verbindungsweges ge-
richteter Konturelemente durch analytische Funktionen, Uni-
versit¨
at Paderborn, Baccalaureatsarbeit, 2006
[Gab46] Gabor, D.: Theory of Communication. In: Journal of the IEE
(1946), Nr. 93, S. 429–446
[GCP05] Guerrero-Colon, Jose A.; Portilla, Javier: Two-Level Ad-
aptive Denoising using Gaussian Scale Mixtures in Overcom-
plete Oriented Pyramids. In: IEEE International Conference
on Image Processing (ICIP) Bd. 1, 2005, S. 105–108
[GG07] Guardini, Pietro; Gamberini, Luciano: Zweiter Preis
2007 beim Best Visual Illusion of the Year Contest.
http://illusioncontest.neuralcorrelate.com, 2007 (Ab-
ruf: 01.04.2009)
[GGM95] Gove, A.; Grossberg, S.; Mingolla, E.: Brightness per-
ception, illusory contours, and corticogeniculate feedback. In:
Visual Neuroscience 12 (1995), Nr. 6, S. 1027–1052
Literaturverzeichnis 131
[GKP96] Geiger, D.; Kumaran, K.; Parida, L.: Visual organization
for figureground separation. In: Proc. IEEE Conf. on Computer
Vision and Pattern Recognition, 1996, S. 155–160
[GM96] Guy, Gideon; Medioni, Gerard: Inferring global perceptual
contours from local features. In: International Journal of Com-
puter Vision 20 (1996), Nr. 1-2, S. 113–133. – ISSN 0920–5691
[GW08] Gonzalez, Rafael C.; Woods, Richard E.: Digital Image Pro-
cessing. Prentice Hall, 2008. – ISBN 9780131687288
[Hag07] Hagenl¨
uke, Frank: Bestimmung der Verbindungswahrschein-
lichkeit gerichteter Konturelemente unter Ber¨
ucksichtigung der
Polarit¨
at orientierungsselektiver Filterantworten, Universit¨
at
Paderborn, Studienarbeit, 2007
[Han03] Hansen, Thorsten: A neural model of early vision: Contrast,
contours, corners and surfaces, Universit¨
at Ulm, Diss., 2003
[HBD03] Hund, Marcus; Brockers, Roland; Dr¨
ue, Siegbert: Tiefen-
wahrnehmung f¨
ur sichtgesteuerte mobile Roboter. (2003). –
Vortrag, KI2003-Workshop Kognitive Robotik
[Her70] Hermann, L.: Eine Erscheinung simultanen Contrastes. In:
Pfl¨
ugers Archiv f¨
ur die gesamte Physiologie 3 (1870), S. 13–15
[Hey03] Heydt, R¨
udiger von d.: Image parsing mechanisms of the
visual cortex. In: The Visual Neurosciences (2003), S. 1139–
1150
[HH93] Heitger, F.; Heydt, R. von d.: A computational model of
neural contour processing: Figure-ground segregation and il-
lusory contours. In: International Conference on Computer
Vision, 1993, S. 32–40
[HHP+98] Heitger, Friedrich; Heydt, R¨
udiger von der; Peterhans,
Esther; Rosenthaler, Lukas; K¨
ubler, Olaf: Simulation of
neural contour mechanisms: representing anomalous contours.
In: Image Vision Comput. 16 (1998), Nr. 6-7, S. 407–421
[HM05] Hund, Marcus; Mertsching, Baerbel: A computational ap-
proach to illusory contour perception based on the tensor voting
technique. In: 10th Ibero-American Congress on Pattern Reco-
gnition (XCIARP), 2005
132 Literaturverzeichnis
[HM06] Hund, Marcus; Mertsching, Baerbel: Depth ordering and
figure-ground segregation in monocular images derived from il-
lusory contour perception. In: 17th European Conference on
Artificial Intelligence (ECAI 2006), 2006
[HM08] Hund, Marcus; Mertsching, B¨
arbel: Anisotropic diffusion
by quadratic regularization. In: 3rd International Conference
on Computer Vision Theory and Applications (VISAPP 2008),
2008, S. 101 – 107
[HN01] Hansen, Thorsten; Neumann, Heiko: Neural mechanisms
for representing surface and contour features. In: Emergent
Neural Computational Architectures Based on Neuroscience
- Towards Neuroscience-Inspired Computing, Springer-Verlag,
2001. – ISBN 3–540–42363–X, S. 139–153
[HN04] Hansen, Thorsten; Neumann, Heiko: Neural mechanisms for
the robust representation of junctions. In: Neural Comput. 16
(2004), Nr. 5, S. 1013–1037. – ISSN 0899–7667
[HSN01] Hansen, Thorsten; Sepp, Wolfgang; Neumann, Heiko: Recur-
rent long-range interactions in early vision. In: Lecture Notes
in Computer Science Bd. 2036, 2001, S. 127
[Hun02] Hund, Marcus: Disparit¨
atsbestimmung aus Stereobildern auf
der Basis von Kostenfunktionen, Universit¨
at Paderborn, Di-
plomarbeit, August 2002
[HW70] Hubel, D. H.; Wiesel, T. N.: Stereoscopic vision in macaque
monkey. Cells sensitive to binocular depth in area 18 of the
macaque monkey cortex. In: Nature 225 (1970), Nr. 5227, S.
41–42
[H¨
am91] H¨
ammerlin, G¨
unther und Hoffmann, Karl-Heinz:Nu-
merische Mathematik. 2. Auflage. Springer-Verlag, 1991
[IK99] Ito, K.; Kunisch, K.: An active set strategy based on the
augmented Lagrangian formulation for image restoration. In:
M2AN Math. Model. Numer. Anal. 33 (1999), S. 1–21
[J¨
ah02] J¨
ahne, Bernd: Digital image processing (5th ed.): concepts,
algorithms, and scientific applications. Springer-Verlag, 2002
[JHG99] J¨
ahne, B. (Hrsg.); Haußecker, H. (Hrsg.); Geißler, P.
(Hrsg.): Handbook Of Computer Vision And Applications.
Bd. 2. Academic Press, 1999
Literaturverzeichnis 133
[Jul60] Julesz, Bela: Binocular depth perception of computer-
generated patterns. In: Bell System Technical Journal 39
(1960), S. 1125–1162
[Kan79] Kanizsa, G. (Hrsg.): Organization in Vision. Praeger, 1979
[KGW01] Kellman, P.J.; Guttman, S. E.; Wickens, T. D.: Geo-
metric and neural models of object perception. In: Shipley,
T. F. (Hrsg.); Kellman, P.J. (Hrsg.): From fragments to ob-
jects: Segmentation and grouping in vision, Oxford, UK: Else-
vier Science, 2001
[Kno00] Knott, Gary D.: Interpolating Cubic Splines. 18. Auflage.
Birkh¨
auser Verlag, 2000
[Kof35] Koffka, K.: Principles of Gestalt psychology. New York :
Harcourt Brace, 1935
[Kos93] Kosmol, Peter: Methoden zur numerischen Behandlung nicht-
linearer Gleichungen und Optimierungsaufgaben. 2. Auflage.
Stuttgart : Teubner, 1993. – ISBN 3–519–12085–2
[Kra63] Krauskopf, J.: Effect of retinal image stabilization on the ap-
pearance of heterochromatic targets. In: Journal of the Optical
Society of America 53 (1963), S. 741–744
[Kra67] Krauskopf, J.: Eeterochromatic stabilized images: A
classroom demonstration. In: American Journal of Psychology
80 (1967), S. 634–637
[Lee96] Lee, Tai S.: Image Representation Using 2D Gabor Wave-
lets. In: IEEE Transactions on Pattern Analysis and Machine
Intelligence 18 (1996), Nr. 10, S. 959–971
[Loc92] Locher, Franz: Numerische Mathematik f¨
ur Informatiker.
Springer-Verlag, 1992
[Mar82] Marr, D.: Vision: a computational investigation into the hu-
man representation and processing of visual information. W.
H. Freeman, San Francisco, 1982
[Mas06a] Massad, A.: A perceptual grouping approach for visual in-
terpolation between good continuation and minimal path using
tensor voting. In: BMVC06 Bd. 2, 2006, S. 639
[Mas06b] Massad, A.: Visual interpolation for long-range contour com-
pletion by perceptual grouping based on tensor voting. In: Pro-
134 Literaturverzeichnis
ceedings of sixth IASTED International Conference for Visua-
lization, Imaging, and Image Processing, 2006, S. 537 – 542
[MBM02a] Massad, A.; Babos, M.; Mertsching, B.: Application of the
tensor voting technique for perceptual grouping to grey-level
images. In: Gool, L. van (Hrsg.): Pattern Recognition, 24th
DAGM Symposium (DAGM2002), 2002, S. 306–313
[MBM02b] Massad, A.; Babos, M.; Mertsching, B.: Perceptual grou-
ping in grey level images by combination of Gabor filtering
and tensor voting. In: Kasturi, R. (Hrsg.); Laurendeau, D.
(Hrsg.); Suen, C. (Hrsg.): ICPR Bd. 2, 2002, S. 677–680
[MBM03] Massad, A.; Babos, M.; Mertsching, B.: Application of the
tensor voting technique for perceptual grouping to grey-level
images: quantitative evaluation, 2003. – Intl. Symposium on
Image and Signal Processing and Analysis
[Mei99] Meister, Andreas: Numerik linearer Gleichungssysteme, Eine
Einfuehrung in moderne Verfahren. Braunschweig, Wiesbaden
: Vieweg Verlag, 1999. – ISBN 3–528–03135–2
[Mer99] Merziger, Gerhard und Wirth, Thomas:Repetitorium
der H¨
oheren Mathematik. 4. Auflage. Binomi Verlag, 1999
[MLT00] Medioni, G.; Lee, M.-S.; Tang, C.-K.: A Computational Fra-
mework for Segmentation and Grouping. Elsevier Science, 2000
[MM01a] Massad, A.; Mertsching, B.: Segmentation of Sponta-
neously Splitting Figures into Overlapping Parts. In: Radig,
B. (Hrsg.); Florcyk, S. (Hrsg.): Pattern Recognition, 23rd
DAGM Symposium, 2001, S. 25 – 31
[MM01b] Massad, Armin; Medioni, G.: 2-D Shape Decomposition into
Overlapping Parts. In: Arcelli, C. (Hrsg.); Cordella, L.
(Hrsg.); Baja, G. S. (Hrsg.): Visual Form 2001, 4th Interna-
tional Workshop on Visual Form (IWVF 4). Capri, Italy, 2001,
S. 398 – 409
[MM02] Massad, A.; Mertsching, B.: Inferring salient features in
images by perceptual grouping with inhibitory and excitatory
tensor fields. In: W¨
urtz, R. (Hrsg.); Lappe, M. (Hrsg.): Dy-
namic Perception (DynPerc 2002). Bochum, 2002, S. 227 –
232
Literaturverzeichnis 135
[MS98] Mokhtarian, Farzin; Suomela, Riku: Robust image corner
detection through curvature scale space. In: IEEE Trans. Pat-
tern Anal. Mach. Intell. 20 (1998), Nr. 12, S. 1376–1381. – ISSN
0162–8828
[MTW99] Mahamud, Shyjan; Thornber, Karvel K.; Williams,
Lance R.: Segmentation of salient closed contours from real
images. In: IEEE International Conference on Computer Vi-
sion (ICCV), IEEE, 1999
[MWTX03] Mahamud, Shyjan; Williams, Lance R.; Thornber, Kar-
vel K.; Xu, Kanglin: Segmentation of multiple salient closed
contours from real images. In: IEEE Trans. on Pattern Analy-
sis and Machine Intelligence 25 (2003), Nr. 4
[Nie02a] Nieder, Andreas: Seeing more than meets the eye: processing
of illusory contours in animals. In: Journal of Comparative
Physiology A: Sensory, Neural, and Behavioral Physiology 188
(2002), Nr. 4, S. 249–260
[Nie02b] Nieder, Andreas: Die Wahrnehmung von Scheinkonturen -
Wie sich das Gehirn Illusionen macht. In: Neuroforum (2002),
Nr. 3, S. 210–217
[NM01] Neumann, H.; Mingolla, E.: Computational neural models
of spatial integration in perceptual grouping. In: Shipley,
T. (Hrsg.); Kellman, P. (Hrsg.): From fragments to units:
Segmentation and grouping in vision. Oxford, UK : Elsevier
Science, 2001, S. 353–400
[Nor89] Nordstrom, K. N.: Biased anisotropic diffusion–a uni-
fied regularization and diffusion approach to edge detection /
EECS Department, University of California, Berkeley. 1989
(UCB/CSD-89-514). – Forschungsbericht
[Pal99] Palmer, Stephen E.: Vision Science: Photons to Phenomeno-
logy. MIT Press, Cambridge, Massachusetts, 1999
[PF05] Prados, E.; Faugeras, O.: Shape from shading: a well-posed
problem? In: Proceedings of CVPR’05, IEEE, 2005
[PH01] Peterhans, Esther; Heitger, Friedrich: Simulation of neu-
ronal responses defining depth order and contrast polarity at
illusory contours in monkey area V2. In: Journal of Computa-
tional Neuroscience 10 (2001), Nr. 2, S. 195–211
136 Literaturverzeichnis
[Pla72] Playboy’s Playmate of the Month - Miss November. In: Playboy
Magazine, Playboy Enterprises, Inc. 11/72 (1972)
[PM90] Perona, Pietro; Malik, Jitendra: Scale-space and edge detec-
tion using anisotropic diffusion. In: IEEE Trans. Pattern Anal.
Mach. Intell. 12 (1990), Nr. 7, S. 629–639
[Por08] Portilla, Javier: BLS-GSM denoising.http://decsai.ugr.
es/~javier/denoise/, 2008 (Abruf: 03.07.2008)
[PSWS03] Portilla, J.; Strela, V.; Wainwright, M.; Simoncelli, E.:
Image denoising using scale mixtures of Gaussians in the wave-
let domain. In: IEEE Trans. Image Proc., 2003
[PZ89] Parent, Pierre; Zucker, Steven: Trace inference, curvature
consistency, and curve detection. In: IEEE Trans. Pattern
Anal. Mach. Intell. 11 (1989), Nr. 8, S. 823–839. – ISSN 0162–
8828
[RGM00] Ross, W. D.; Grossberg, S.; Mingolla, E.: Visual corti-
cal mechanisms of perceptual grouping: interacting layers, net-
works, columns, and maps. In: Neural Netw. 13 (2000), Nr. 6,
S. 571–588. – ISSN 0893–6080
[RT99] Ruzon, Mark A.; Tomasi, Carlo: Corner detection in textured
color images. In: ICCV, 1999, S. 1039–1045
[Sau99a] Saund, Eric: Perceptual organization of occluding contours
generated by opaque surfaces. In: Proceedings of the 1999 Con-
ference on Computer Vision and Pattern Recognition, 1999, S.
624–630
[Sau99b] Saund, Eric: Perceptual organization of occluding contours of
opaque surfaces. In: Comput. Vis. Image Underst. 76 (1999),
Nr. 1, S. 70–82. – ISSN 1077–3142
[SB97] Smith, Stephen M.; Brady, J. M.: SUSAN - a new approach
to low level image processing. In: Int. J. Comput. Vision 23
(1997), Nr. 1, S. 45–78. – ISSN 0920–5691
[Sch00] Schumann, F.: Beitr¨
age zur Analyse der Gesichtswahrneh-
mungen. Erste Abhandlung. Einige Beobachtungen ¨
uber die
Zusammenfassung von Gesichtseindr¨
ucken zu Einheiten. In:
Zeitschrift f¨
ur Psychologie und Physiologie der Sinnesorgane 23
(1900), S. 1–32. – Englische ¨
Ubersetzung durch A. Hogg (1987)
Literaturverzeichnis 137
in The perception of Illusory Contours, S. Petry, G.E. Meyer
(New York: Springer) S. 40-49.
[Sch68] Schwarz, H.: Numerik symmetrischer Matrizen. Stuttgart :
Teubner, 1968
[Spi01] Spillmann, Lothar: Gehirn und Gestalt II. Neuronale Mecha-
nismen. In: Kognitionswissenschaft 9 (2001), Nr. 3, S. 122–143
[ST97] Schmidt, R.F.; Thews, G.: Physiologie des Menschen. 27.
Auflage. Springer, 1997
[SU88] Sha’ashua, Amnon; Ullman, Shimon: Structural saliency:
the detection of globally salient structures using a locally
connected network. 1988 (AIM-1061). – Forschungsbericht.
– 15 S.
[SVO93] Sary, G.; Vogels, R.; Orban, G.A.: Cue-invariant shape
selectivity of macaque inferior temporal neurons. In: Science
260 (1993), S. 995–997
[SW00] Scharr, Hanno; Weickert, Joachim: An anisotropic diffu-
sion algorithm with optimized rotation invariance. 2000. – In
G. Sommer, N. Kruger, C. Perwass (Hrsg.), Mustererkennung
[Tra96] Trapp, Ralph: Entwurf einer Filterbank auf der Basis neuro-
physiologischer Erkenntnisse zur orientierungs- und frequenz-
selektiven Dekomposition von Bilddaten. (1996). – Interner
Bericht Nr. NAVIS 01/96
[Tra98] Trapp, Ralph: Stereoskopische Korrespondenzbestimmung mit
impliziter Detektion von Okklusionen, Universit¨
at Paderborn,
Fachbereich Elektrotechnik, Diss., September 1998
[Wei96] Weickert, Joachim: Anisotropic diffusion in image proces-
sing, Universit¨
at Kaiserslautern, Diss., 1996
[Wei99] Weickert, Joachim: Coherence-enhancing diffusion of colour
images. In: Image Vision Comput. 17 (1999), Nr. 3-4, S. 201–
212
[Wer23] Wertheimer, Max: Untersuchungen zur Lehre von der Gestalt
II. In: Psychologische Forschung 4 (1923), S. 301–350
[WH96] Williams, Lance R.; Hanson, Allen R.: Perceptual comple-
tion of occluded surfaces. In: Computer Vision and Image Un-
derstanding: CVIU 64 (1996), Nr. 1, S. 1–20
138 Literaturverzeichnis
[Wil94] Williams, Lance R.: Perceptual completion of occluded surfa-
ces, Dept. of Computer Science, University of Massachusetts at
Amherst, Amherst, Mass., Diss., 1994
[WJ96] Williams, Lance R.; Jacobs, David W.: Local parallel com-
putation of stochastic completion fields. In: Computer Vision
and Pattern Recognition, CVPR (1996), S. 161–168
[WT00] Williams, Lance R.; Thornber, Karvel K.: A comparison of
measures for detecting natural shapes in cluttered backgrounds.
In: International Journal of Computer Vision 34(2/3) (2000),
S. 81–96
[Yar67] Yarbus, A. L. (Hrsg.): Eye Movements and Vision. Plenum,
1967
[ZF84] Zurm¨
uhl, R.; Falk, S.: Matrizen und ihre Anwendungen.
Berlin, Heidelberg, New York, Tokyo : Springer-Verlag, 1984
[ZT98] Ziou, D.; Tabbone, S.: Edge detection techniques: an over-
view. In: International Journal on Pattern Recognition and
Image Analysis 8 (1998), Nr. 4, S. 537–559
[ZW00] Zweck, John W.; Williams, Lance R.: Euclidean group
invariant computation of stochastic completion fields using
shiftable-twistable functions. In: ECCV (2), 2000, S. 100–116