Document [original]

Perzeptuelle Organisation von Objektgrenzen

unter Verwendung

anisotroper Regularisierungsmethoden

Zur Erlangung des akademischen Grades

DOKTORINGENIEUR (Dr.-Ing.)

von der Fakultät für Elektrotechnik, Informatik und Mathematik

der Universität Paderborn

genehmigte Dissertation

von

Dipl.-Math. Marcus Hund

aus Cuxhaven

Referentin: Prof. Dr.-Ing. Bärbel Mertsching

Korreferent: Prof. Dr.-Ing. Horst-Michael Groß

Tag der mündlichen Prüfung: 27.05.2009

Paderborn 2009

Diss. EIM-E//255

Danksagung

Die vorliegende Arbeit entstand im Rahmen meiner T¨

atigkeit im Fachgebiet

Grundlagen der Elektrotechnik an der Universit¨

at Paderborn. An dieser

Stelle m¨

ochte ich mich bei all denen sehr herzlich bedanken, die mich in

vielf¨

altiger Weise bei der Anfertigung der Arbeit unterst¨

utzt haben.

Zun¨

achst sei Frau Prof. Dr.-Ing. B¨

arbel Mertsching genannt, die mir die

Bearbeitung des vorliegenden Themas erm¨

oglichte und die durch den mir

gew¨

ahrten kreativen Freiraum einen wesentlichen Grundstein f¨

ur das Gelin-

gen dieser Arbeit legte. Ich danke ihr außerdem f¨

ur den außergew¨

ohnlichen

organisatorischen Einsatz, der in der Endphase dieser Arbeit zu einer erheb-

lichen Beschleunigung des Promotionsverfahrens f¨

uhrte.

Herrn Prof. Dr.-Ing. Horst-Michael Groß von der TU Ilmenau danke ich f¨

die bereitwilige ¨

Ubernahme des Korreferats, f¨

ur das damit gezeigte Interesse

an meiner Arbeit und vor allem f¨

ur die z¨

ugige Erstellung des Gutachtens.

Bedanken m¨

ochte ich mich ebenfalls bei den mittlerweile 21 wissenschaft-

lichen und nichtwissenschaftlichen Kollegen des Fachgebietes und bei allen

Studenten, die im Laufe meiner T¨

atigkeit im Fachgebiet mit mir zusam-

mengearbeitet haben. Die großartige Zusammenarbeit mit jedem Einzelnen

war gepr¨

agt von einem starken Zusammenhalt, f¨

ur den nicht zuletzt Dr.-

Ing. Siegbert Dr¨

ue Dank geb¨

uhrt. Ganz besonders bedanke ich mich auch

bei Dr.-Ing. Ralf Stemmer, Bj¨

orn Meyer und dem Stipendiaten Lic. Doreid

Kheirbek, die diese Zeit auf besonders humorvolle Art und Weise zu einem

positiven Erlebnis gemacht haben.

Ferner danke ich den studentischen Hilfskr¨

aften und Absolventen, die mich

durch ihr engagiertes Mitwirken unterst¨

utzten. Hervorheben m¨

ochte ich

dabei M. Sc. Michael Feldmann, der im Rahmen seiner Bachelorarbeit wich-

tige Beitr¨

age zu der in den Kapiteln 4.2 und 4.3 dieser Arbeit vorgestellten

Konturvervollst¨

andigung durch Splineinterpolation leistete. F¨

ur das Korrek-

turlesen des Manuskriptes danke ich Dipl.-Ing. Frank Schmidtmeier, Dipl.-

Ing. Markus Schmidt und meiner Frau Claudia.

Ohne die Liebe und das Verst¨

andnis meiner Frau Claudia w¨

are diese Arbeit

so nicht m¨

oglich gewesen. Ihr gilt daher mein gr¨

oßter Dank, ebenso meinen

Eltern, die mir das Studium in jeder Hinsicht ¨

uberhaupt erst erm¨

oglicht

haben.

Inhaltsverzeichnis

1 Einleitung 1

2 Grundlagen 5

2.1 Die Wahrnehmung des Menschen . . . . . . . . . . . . . . . . 5

2.2 Tiefenwahrnehmung . . . . . . . . . . . . . . . . . . . . . . . 8

2.3 Scheinkonturen . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.4 Optische Illusionen und Wahrnehmungsph¨

anomene . . . . . . 14

2.4.1 Helligkeitswahrnehmung . . . . . . . . . . . . . . . . . 14

2.4.2 Gr¨

oßenwahrnehmung . . . . . . . . . . . . . . . . . . . 15

2.4.3 Scheinkonturen . . . . . . . . . . . . . . . . . . . . . . 18

2.4.4 Figur-Grund-Gliederung . . . . . . . . . . . . . . . . . 20

2.5 Strategien zur perzeptuellen Organisation . . . . . . . . . . . 22

3 Bildvorverarbeitung 29

3.1 Filterung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.2 Detektion von Konturen und Kreuzungspunkten . . . . . . . 37

3.2.1 Schwellwertfreie Kantendetektion . . . . . . . . . . . . 38

3.2.2 Detektion von Kreuzungspunkten . . . . . . . . . . . . 41

3.3 Anisotrope Regularisierung . . . . . . . . . . . . . . . . . . . 45

3.3.1 Minimierung einer globalen Kostenfunktion . . . . . . 47

3.3.2 Diffusion . . . . . . . . . . . . . . . . . . . . . . . . . 57

3.3.3 Selbstorganisation der Kanteninformation . . . . . . . 60

4 Bestimmung m¨

oglicher Konturvervollst¨

andigungen 67

4.1 Konturvervollst¨

andigung durch Tensor Voting . . . . . . . . . 67

4.1.1 Repr¨

asentation von Konturelementen durch Tensoren 67

4.1.2 Tensorkommunikation . . . . . . . . . . . . . . . . . . 69

4.1.3 Probleme des Tensorvoting . . . . . . . . . . . . . . . 74

4.2 Bewertung von Verbindungswahrscheinlichkeiten . . . . . . . 76

4.2.1 Ausschlusskriterien . . . . . . . . . . . . . . . . . . . . 76

4.2.2 Bestimmung der Verbindungswahrscheinlichkeit . . . . 79

4.3 Konturvervollst¨

andigung durch Spline Funktionen . . . . . . 83

5 Perzeptuelle Organisation 89

5.1 Figur-Grund-Gliederung an Kreuzungspunkten . . . . . . . . 89

5.2 Dynamische Tiefenzuordnung . . . . . . . . . . . . . . . . . . 92

6 Experimentelle Ergebnisse 99

6.1 Anisotrope Regularisierung . . . . . . . . . . . . . . . . . . . 99

6.2 Konturverst¨

arkung . . . . . . . . . . . . . . . . . . . . . . . . 107

6.3 Kanten- und Eckendetektion . . . . . . . . . . . . . . . . . . 109

6.4 Konturvervollst¨

andigung . . . . . . . . . . . . . . . . . . . . . 112

6.5 Perzeptuelle Organisation vervollst¨

andigter Konturen . . . . . 115

6.6 Nat¨

urliche Bilder . . . . . . . . . . . . . . . . . . . . . . . . . 119

6.7 Laufzeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

7 Zusammenfassung 125

Literaturverzeichnis 129

1 Einleitung

Sowohl Lebewesen als auch autonom agierende Roboter, welche in Interak-

tion mit ihrer Umwelt treten, ben¨

otigen zur Navigation und zur Manipu-

lation von Objekten unter anderem Informationen ¨

uber die Form und die

Position von Objekten in ihrer Umgebung. Zur Entfernungsmessung haben

sich in der Praxis sogenannte aktive Verfahren etabliert. Hierbei wird durch

eine aktive Beeinflussung der Umgebung, z. B. mittels Ultraschall oder La-

serlicht, die Entfernung der Sensoreinheit zu einem Objekt gemessen. H¨

aufig

ist die Aufgabe eines Robotersystems jedoch auch mit der Objekterkennung

verbunden. Hierzu sind die Sensoreinheiten aktiver Systeme in der Regel

nicht in der Lage. Sogenannte passive Verfahren nutzen zur Analyse der

Umgebung allein die nat¨

urliche Beleuchtung aus. Die Sensoreinheiten sind

hierbei im Allgemeinen durch ein oder mehrere Kamerasysteme gegeben.

Kamerasysteme bieten zum einen den Vorteil, dass eine aufw¨

andige Daten-

fusion der Ergebnisse von Objekterkennung und Tiefenwahrnehmung ent-

f¨

allt und zum anderen den Vorteil einer kosteng¨

unstigen Realisierbarkeit.

Durch die Abbildung einer dreidimensionalen Szene auf ein zweidimensiona-

les Kamerabild geht allerdings die Tiefeninformation der betrachteten Szene

verloren. Auch die Form von Objekten beschr¨

ankt sich in der zweidimen-

sionalen Darstellung auf eine Kontur, die dar¨

uberhinaus durch verdeckende

Objekte unterbrochen sein kann.

Zur Rekonstruktion der durch die Kameraprojektion verlorenen Kontur-

und Tiefeninformationen dienen Lebewesen, speziell der Mensch, als Vor-

bild. Eine naheliegende Methode zur Rekonstruktion der Tiefeninformation

besteht in Analogie zum nat¨

urlichen Vorbild in der Auswertung zweier Ste-

reobilder. W¨

ahrend aber das Gebiet der stereoskopischen Korrespondenzbe-

stimmung weitgehend in der Literatur behandelt wurde und eine Vielzahl an

2 1 Einleitung

effizienten Algorithmen hervorgebracht hat, haben monokulare Tiefenkrite-

rien bisher nur wenig Einzug in Bildverarbeitungsanwendungen gehalten.

H¨

aufig beschr¨

anken sich Beitr¨

age zum Thema in der Beschreibung oder

Modellierung menschlicher Wahrnehmungsph¨

anomene oder optischer Illu-

sionen, welche anhand von synthetischen Bildern demonstriert werden.

In der vorliegenden Arbeit soll eines der wichtigsten monokularen Tiefen-

kriterien, die Verdeckung, herangezogen werden, um eine betrachtete Szene

sinnvoll dreidimensional interpretieren zu k¨

onnen und verdeckte Konturen

zu vervollst¨

andigen. Hierbei soll besonderer Wert auf die gesamte Prozes-

skette, angefangen bei der Filterung nat¨

urlicher Bilder, bis hin zur perzep-

tuellen Organisation des Bildinhalts gelegt werden. Dazu wird mit der ani-

sotropen Regularisierung eine Methodik vorgestellt, die entsprechend einer

gew¨

unschten Skalierung eine Reduktion des Eingangsbildes auf wesentliche

Bildinhalte gew¨

ahrleistet, wobei saliente, also wesentliche, Konturinforma-

tionen beibehalten werden.

Kapitel 2 erl¨

autert die Grundlagen menschlicher Wahrnehmung und die Me-

chanismen perzeptueller Organisation, wobei auch die Ans¨

atze zu einer Re-

produktion dieser Mechanismen in Bildverarbeitungsanwendungen bespro-

chen werden. In Kapitel 3 werden die f¨

ur die perzeptuelle Organisation not-

wendige Vorverarbeitungsschritte vorgestellt. Besondere Ber¨

ucksichtigung

findet hierbei die kantenerhaltende Gl¨

attung des Eingangsbildes durch ani-

sotrope Regularisierung, welche eine Reduzierung des Informationsgehaltes

im Allgemeinen komplexer Eingangsbilder gew¨

ahrleistet. Grundlage per-

zeptueller Organisation ist die in Kapitel 4 beschriebene Vervollst¨

andigung

unterbrochener Konturen oder Objektgrenzen. Mit der als Tensor Voting be-

zeichneten Methodik und einer Splineinterpolation werden zwei alternative

Verfahren zur Konturvervollst¨

andigung vorgestellt. Kapitel 5 beschreibt die

eigentliche perzeptuelle Organisation des vorliegenden Ansatzes, bestehend

aus einer Figur-Grund-Gliederung an markanten Bildpositionen und einer

daraus folgenden dreidimensionalen Interpretation des zweidimensionalen

Eingangsbildes. Die vorgestellten Verarbeitungsschritte werden anhand ei-

ner Vielzahl von synthetischen und nat¨

urlichen Testbildern in Kapitel 6 vi-

sualisiert und bewertet. Schließlich wird in Kapitel 7 eine Zusammenfassung

der vorliegenden Arbeit gegeben.

4 1 Einleitung

2 Grundlagen

2.1 Die Wahrnehmung des Menschen

Das Abbildungssystem des menschlichen Auges besteht vereinfacht darge-

stellt aus einer Lochblende, einer konvexen Linse und einer Rezeptorebene.

In der Rezeptorebene, der Retina, leiten ca. 126 Millionen Photorezeptoren

ihre Signale indirekt an ca. 1 Million Ganglienzellen weiter (siehe Abbildung

2.1). Hierbei findet bereits eine Vorverarbeitung der Signale statt [ST97].

So zeigen schon Ganglienzellen, die Ausgangsschicht der Retina, ein kom-

plexes Erregungsmuster. Die Signale der Ganglienzellen werden ¨

uber die

Sehnerven, das Chiasma opticum und die seitlichen Knieh¨

ocker zur Wei-

terverarbeitung in den visuellen Cortex weitergeleitet. Dort befindet sich

eine Vielzahl verschiedener Neuronen, die auf spezifische Reize in ihren re-

zeptiven Feldern reagieren. So finden sich z. B. Neuronen, die auf Licht-

balken einer bestimmten Orientierung reagieren, w¨

ahrend andere Neuronen

orientierungs- und richtungsspezifisch auf Lichtreize reagieren. Es findet im

visuellen Cortex also ein ¨

Ubergang zu einer merkmalsbasierten Repr¨

asenta-

tion der wahrgenommenen Umwelt statt.

Unter den Merkmalen, die sich aus dem Retinaabbild ableiten lassen, kommt

den Konturen eine besondere Bedeutung zu, wie der Versuch von Krauskopf

[Kra63, Kra67, Spi01] zeigt. Einer Versuchsperson wird dabei eine rote

Scheibe, umgeben von einem gr¨

unen Ring dargeboten. Wird die Kante

zwischen der roten Scheibe und der umgebenden gr¨

unen Fl¨

ache stabilisiert,

so kann sich der Reiz nicht gegen das Rezeptormosaik verschieben. Die

Neurone adaptieren und es kann keine Kante mehr wahrgenommen werden.

Als Folge verschwindet f¨

ur die Versuchsperson die Wahrnehmung Rot im

Inneren des Musters, stattdessen wird die gesamte Fl¨

ache einheitlich als

6 2 Grundlagen

Abbildung 2.1: Sehbahn (nach [ST97]).

gr¨

un wahrgenommen. Ohne die Wahrnehmung der Begrenzung kann also

auch die Fl¨

ache selbst nicht wahrgenommen werden.

Auch bei der Untersuchung sakkadischer Augenbewegungen zeigt sich, dass

bei freier Betrachtung eines Bildes der Blick der Versuchsperson auf Unste-

tigkeitsstellen des dargebotenen Reizes, wie z. B. Kanten oder Ecken verweilt

[Yar67]. Einheitliche Fl¨

achen werden dagegen kaum betrachtet (vgl. Abbil-

dung 2.2). Fl¨

achen, die gleiche Helligkeit, Farbe und Struktur aufweisen,

sind also im informationstheoretischen Sinne redundant. Die Wahrnehmung

von Konturen ist damit offensichtlich der Wahrnehmung von Fl¨

achen vor-

angestellt [Spi01].

Der Merkmalsrepr¨

asentation folgt eine Organisation des Wahrgenommenen

zu komplexeren, handhabbaren Einheiten, sogenannten Perzepten. Ziel ei-

ner solchen perzeptuellen Organisation ist also die Abstraktion der Ein-

zelinformationen bzw. Merkmale und der damit verbundene Aufbau einer

inneren Repr¨

asentation des Wahrgenommenen. Aus der Betrachtung der

Art und Weise, wie das menschliche Gehirn eine Gruppierung von Teil-

figuren oder Merkmalen vornimmt, haben sich in dem als Gestaltpsycho-

logie bezeichneten Zweig der Wahrnehmungspsychologie Gruppierungsme-

2.1 Die Wahrnehmung des Menschen 7

Abbildung 2.2: Muster der Augenbewegungen einer Versuchsperson beim

freien Betrachten einer Abbildung der Nofretete-B¨

uste (nach

[Yar67]).

chanismen herauskristallisiert, welche als Gestaltgesetze bezeichnet werden

[Wer23, Kof35, Pal99]. Zu diesen Gesetzen z¨

ahlen unter anderem das Gesetz

des gemeinsamen Schicksals, welches eine Gruppierung gemeinsam bewegter

Elemente bezeichnet und das Gesetz der ¨

Ahnlichkeit, welches die Gruppie-

rung von einander ¨

ahnlichen Elementen postuliert [Pal99]. Im Rahmen der

vorliegenden Arbeit sind die Gesetze der N¨

ahe und der guten Gestalt von

Interesse. Das Gestaltgesetz der N¨

ahe besagt, dass Merkmale, die einen

geringeren Abstand zueinander aufweisen als andere, bevorzugt gruppiert

werden, w¨

ahrend das Gesetz der guten Gestalt eine Wahrnehmungsorgani-

sation beschreibt, welche m¨

oglichst einfache, symmetrische oder regelm¨

aßige

Figuren bevorzugt. Korrespondierend hiermit besagt das Gesetz der Kon-

tinuit¨

at, dass die Wahrnehmung unterbrochene Konturen so fortsetzt, dass

sich kein abrupter Richtungswechsel ergibt und außerdem keine neuen For-

men eingef¨

uhrt werden m¨

ussen. Dies ist insbesondere f¨

ur die in Kap. 2.3

beschriebene Scheinkonturwahrnehmung von Interesse. Weiterhin ist das

Prinzip der Geschlossenheit zu nennen, das eine bevorzugte Wahrnehmung

von geschlossenen Formen beschreibt. Perzepte werden in Bezug zum r¨

aum-

8 2 Grundlagen

lichen und zum zeitlichen Kontext gesetzt und sind somit in ihrer Inter-

pretation von diesen abh¨

angig. Die als Wahrnehmungskonstanz bezeichnete

Toleranz gegen¨

uber geringen Ver¨

anderungen der Information auf der Sen-

sorebene l¨

asst sich neurologisch untermauern durch auf h¨

oheren Ebenen des

Sehsystems entdeckte Zellen, welche denselben Reiz unabh¨

angig von Entfer-

nung, Beleuchtung und sogar partieller Verdeckung signalisieren [SVO93].

Neben Gruppierungsmechanismen ist ein wesentliches Merkmal perzeptuel-

ler Organisation die Gliederung des sensorischen Abbildes in Bereiche und

die Einteilung der Bereiche in Figur und einen Grund, von dem sich die

Figur als Vordergrund abhebt. Perzeptuelle Organisation beinhaltet somit

auch eine dreidimensionale Repr¨

asentation des Wahrgenommenen, was ins-

besondere auch dann der Fall ist, wenn nur ein Auge bzw. nur ein zweidi-

mensionales sensorisches Abbild vorhanden ist.

2.2 Tiefenwahrnehmung

Hubel und Wiesel [HW70] fanden im visuellen Cortex Nervenzellen, soge-

nannte binokulare Neurone, die von beiden Augen stimuliert werden k¨

onnen.

Unter diesen binokularen Neuronen existieren solche Zellen, die in Abh¨

angig-

keit von der Entfernung, auf die der Blick gerichtet ist, und der Entfernung

eines Lichtreizes reagieren. Das Verarbeitungssystem verf¨

ugt somit ¨

uber

Mechanismen zur Tiefenwahrnehmung. Durch psychophysikalische Experi-

mente konnte Bela Julesz [Jul60] nachweisen, dass der Mensch bereits allein

aus der Information der Disparit¨

at, also der relativen Verschiebung korre-

spondierender Bildpunkte in den beiden Stereobildern, einen Tiefeneindruck

erh¨

alt. Er zeigte dies durch die Einf¨

uhrung von Zufallspunktstereogram-

men. Ein solches Zufallspunktstereogramm entsteht, indem zun¨

achst zwei

identische Bilder mit einem Muster zuf¨

allig verteilter weißer und schwarzer

Bildpunkte erzeugt werden. In diese Bilder wird ein kleineres, ebenfalls zu-

f¨

allig erzeugtes Muster, z. B. in Form eines Rechtecks, versetzt eingef¨

ugt.

Betrachtet man das in Bild 2.3 dargestellte Zufallspunktstereogramm mit

2.2 Tiefenwahrnehmung 9

Abbildung 2.3: Zufallspunktstereogramm nach Julesz (nach [Jul60])

einem aufrecht zwischen die Bilder gestellten Blatt Papier, so fusionieren

die Bilder zu einem. Es entsteht der Eindruck eines aus dem Hintergrund

hervortretenden Rechtecks. Zufallspunktstereogramme enthalten keinerlei

Informationen ¨

uber die Form des Objekts, ebenso sind keine monokularen

Tiefenkriterien anwendbar. Die einzige Information, die dem menschlichen

Auge zur Verf¨

ugung steht, ist die der relativen Verschiebung des versetzt ein-

gef¨

ugten Objektes. Dies zeigt, dass die Gewinnung der Tiefeninformation

schon vor der Objekterkennung stattfinden und somit sogar zur Objektseg-

mentierung genutzt werden kann.

Beim Betrachten einer Szene mit nur einem Auge gewinnen wir bereits einen

Tiefeneindruck durch sogenannte monokulare Tiefenkriterien. So beurteilen

wir die Entfernung eines Objekts z. B. anhand der bekannten Gr¨

oße die-

ses Objekts. Akkommodation, also der durch die Augenlinsen eingestellte

Sch¨

arfebereich, und Konvergenzbewegungen der Augen, die sich auf ein Ob-

jekt ausrichten, liefern sensorische monokulare Tiefeninformationen. Ein

weiteres Kriterium ist die Schattierung, die bestimmt, ob wir eine Struktur

als Erhebung oder Vertiefung wahrnehmen, wobei das visuelle System des

Menschen davon ausgeht, dass das Licht von oben einf¨

allt.

Ein Beispiel f¨

ur die Mehrdeutigkeit der Tiefenwahrnehmung durch Schat-

tierung ist in Abbildung 2.4 gegeben. W¨

ahrend das menschliche Sehsystem

10 2 Grundlagen

dazu tendiert, das Bild als einen großen und einen kleinen Krater wahr-

zunehmen, l¨

asst sich diese Interpretation durch eine Drehung des Bildes

um 180◦in die Wahrnehmung zweier Vulkane ver¨

andern. Dargestellt ist in

Wirklichkeit die 180◦-Rotation der Abbildung hawaiianischer Aschekegel.

Abbildung 2.4: Mehrdeutigkeit zwischen Wahrnehmung eines Kraters oder

eines Vulkans. Einfluss der Schattierung auf die Tiefenwahr-

nehmung (nach [PF05]).

In einem zeitlichen Kontext dient die sogenannte Bewegungsparallaxe als

Tiefenkriterium, die ber¨

ucksichtigt, dass weiter entfernte Objekte ihre Posi-

tion auf der Sensorebene langsamer ver¨

andern als n¨

ahere Objekte, die sich

mit der gleichen relativen Geschwindigkeit zum Beobachter bewegen. Die

Konvergenz paralleler Strahlen am Horizont, wie dies z. B. bei Bahnschie-

nen oder Straßen der Fall ist, wird als lineare Perspektive bezeichnet und

wurde vielfach bereits in Renaissancebildern zur Erzeugung eines r¨

aumlichen

Eindrucks eingesetzt. Ein weiteres Tiefenkriterium ist der Texturgradient,

da gleichm¨

aßig strukturierte Texturen mit zunehmender Entfernung zum

Betrachter dichter erscheinen.

Das f¨

ur die vorliegende Arbeit zentrale monokulare Tiefenkriterium ist die

Verdeckung. Ein Großteil der Objekte, die sich in einer betrachteten Szene

befinden, wird von anderen Objekten, die sich in gr¨

oßerer N¨

ahe zum Be-

trachter befinden, verdeckt. Verdeckte Objekte erscheinen damit weiter

2.3 Scheinkonturen 11

entfernt, w¨

ahrend okkludierende Objekte als n¨

aher wahrgenommen werden.

Die Objektgrenze eines okkludierten Objektes wird offensichtlich durch das

Vordergrundobjekt teilweise unterbrochen. F¨

ur ein biologisches oder ein

technisches Bildverarbeitungssystem kann dieser Sachverhalt herangezogen

werden, um Objektgrenzen zu vervollst¨

andigen und ¨

uber eine Figur-Grund-

Gliederung eine dreidimensionale Repr¨

asentation des Sensorabbildes zu er-

stellen.

2.3 Scheinkonturen

Scheinkonturen, auch als Scheinkanten oder illusion¨

are Konturen bezeichnet,

sind wahrgenommene Konturen, f¨

ur die sich kein korrespondierender Reiz

auf der Rezeptorebene eines Sehsytems finden l¨

asst. Neurophysiologische

Untersuchungen haben gezeigt, dass die Wahrnehmung von Scheinkonturen

sowohl bei S¨

augetieren wie Katzen, Affen und dem Menschen, bei V¨

ogeln

wie der Schleiereule und sogar bei Insekten, n¨

amlich Honigbienen, nachwei-

sen l¨

asst [Nie02b, Hey03]. Die Gehirne und Sehsysteme dieser Lebewesen,

die sich im Laufe der Evolution sehr unterschiedlich entwickelt haben, haben

sich offensichtlich an gemeinsame visuelle Randbedingungen angepasst und

versuchen, Wahrscheinlichkeitserw¨

agungen ¨

uber ihre Umgebung anzustel-

len, indem unterbrochene Begrenzungen vermeintlicher Objekte perzeptuell

vervollst¨

andigt werden. F¨

ur das menschliche Sehsystem sind Scheinkontu-

ren schon seit Beginn des zwanzigsten Jahrhunderts Gegenstand gestalt-

psychologischer Untersuchungen [Kof35, ESS03, Wer23]. Zuerst wurde das

Wahrnehmungsph¨

anom um 1900 von Schuhmann erw¨

ahnt. Er beschrieb

Scheinkonturen als Konturen, die nicht objektiv vorhanden sind [Sch00].

Abbildung 2.5(a) zeigt das sogenannte Kanizsa Dreieck [Kan79], das das

Standardbeispiel f¨

ur eine optische Illusion darstellt, welche auf Scheinkontur-

wahrnehmung basiert. Die sich hieraus ergebende Figur-Grund-Organisation

leitet sich allein aus monokularen Kriterien ab (siehe [Kan79]). Der Begriff

optische Illusion bezieht sich hierbei auf die Tatsache, dass das Kanizsa Bild

12 2 Grundlagen

(a) (b) (c)

(d) (e) (f)

Abbildung 2.5: Das Kanizsa Dreieck (a) und unterschiedliche perspekti-

visch angedeutete dreidimensionale Konstellationen (b)-(f),

die alle zum selben Retinaabbild (a) f¨

uhren.

zweidimensional ist und sich lediglich aus drei schwarzen und einer weißen

Fl¨

ache zusammensetzt, das menschliche Gehirn aber dazu tendiert, das Bild

dreidimensional zu interpretieren. Da hier aber nicht von einer Fehlinterpre-

tation gesprochen werden kann, w¨

are Wahrnehmungsph¨

anomen in diesem

Fall ein passenderer Begriff. Obwohl eine Vielzahl korrekter dreidimensiona-

ler Interpretationen existiert (Abbildung 2.5(b)-(f)), welche alle zum selben

Abbild auf der Sensorebene eines bildverarbeitenden Systems f¨

uhren w¨

ur-

den, besteht die pr¨

aferierte Szeneinterpretation in einer perzeptuellen Orga-

nisation gem¨

aß der Abbildung 2.5(b). D. h. es wird die Wahrnehmung eines

weißen Dreiecks bevorzugt, das sich vor drei schwarzen Kreisen befindet, die

sich wiederum vor einem weißen Hintergrund befinden. Die drei schwarzen

Fl¨

achen bilden hierbei sogenannte induzierende Elemente, also Merkmale

des betrachteten Bildes, die eine Scheinkonturwahrnehmung hervorrufen.

Induzierende Elemente sind also an solchen Bildpositionen gegeben, wo auf-

2.3 Scheinkonturen 13

grund verdeckter Fl¨

achen Diskontinuit¨

aten im Konturverlauf auftreten, wie

dies bei Eckpunkten, Endpunkten oder T-Kreuzungen (vgl. Kap. 3.2.2) der

Fall ist. Es ist festzustellen, dass, obwohl beide Fl¨

achen weiß sind, das Drei-

eck gegen¨

uber dem Hintergrund als heller erscheint, d. h. die Scheinkontur

wird tats¨

achlich als ein Kontrastunterschied zwischen zwei Fl¨

achen wahr-

genommen. Aufgrund der Mehrdeutigkeit der m¨

oglichen Interpretationen

und dem damit schlecht gestellten Problem der perzeptuellen Organisation

kann es nicht das Ziel eines Ansatzes zur perzeptuellen Organisation sein, die

korrekte dreidimensionale Interpretation eines zweidimensionalen Bildes zu

finden, sondern die wahrscheinlichste, wobei die Eigenschaften menschlicher

Wahrnehmung hierbei als Anhaltspunkt dienen. Die Mehrdeutigkeit der

Anordnung und der Einfluss h¨

oherer kognitiver Funktionen zeigen sich bei

der Konzentration auf die Vorstellung einer weißen Fl¨

ache mit drei L¨

ochern,

hinter denen das Dreieck zu sehen ist, die tats¨

achlich zu einer Wahrnehmung

entsprechend der Abbildung 2.5(c) f¨

uhrt und nun die Vervollst¨

andigung der

Kreisfl¨

achen als Scheinkonturen pr¨

aferiert. In diesem Zusammenhang ist

zu unterscheiden zwischen sogenannter modaler und amodaler Vervollst¨

an-

digung. Modale Vervollst¨

andigung bezeichnet die Vervollst¨

andigung eines

Vordergrundobjektes, was im Falle des Kanizsa-Dreiecks und der r¨

aumli-

chen Interpretation entsprechend der Abbildung 2.5(b) die Vervollst¨

andi-

gung des Vordergrunddreiecks darstellt. Mit amodaler Vervollst¨

andigung

wird dagegen die Vervollst¨

andigung verdeckter Konturen bezeichnet, was

wiederum im Falle des Kanizsa-Dreiecks die Vervollst¨

andigung der schwar-

zen Kreisfl¨

achen bedeutet. In der Regel werden mit Scheinkonturen ledig-

lich die modalen Vervollst¨

andigungen bezeichnet [Nie02b]. Neuere psycho-

physische Untersuchungen unterst¨

utzen die These, dass die Wahrnehmung

modaler und amodaler Vervollst¨

andigungen auf einem gemeinsamen Mecha-

nismus basiert [Nie02a, Nie02b], was auch der von Kellman begr¨

undeten

Identit¨

atshypothese [KGW01] und der in der vorliegenden Arbeit realisier-

ten Konturvervollst¨

andigung entspricht. Die Identit¨

atshypothese wird in

[ASF02] in Zweifel gezogen, wobei sich die Gegenargumente allerdings auf

stereoskopische induzierende Elemente und auf h¨

ohere, auf einer Wissens-

14 2 Grundlagen

basis beruhende kognitive Funktionen beziehen. Weiterhin werden keine

Hinweise darauf gegeben, wie die Konturvervollst¨

andigung stattfindet oder

eine dreidimensionale Repr¨

asentation gewonnen wird.

2.4 Optische Illusionen und Wahrnehmungsph¨

anomene

Eine Vielzahl sogenannter optischer Illusionen basieren auf der Mehrdeu-

tigkeit der dargebotenen Reize, so dass die Wahrnehmungsmechanismen,

die den Beobachter zu einer bestimmten perzeptuellen Organisation des be-

trachteten Bildes f¨

uhren, h¨

aufig im Widerspruch zu anderen Mechanismen

oder der eigenen Erfahrung stehen. Solche Wahrnehmungsph¨

anomene bieten

wertvolle Hinweise auf die Funktionsweise menschlicher perzeptueller Orga-

nisation und k¨

onnen somit auch als Vorbild f¨

ur effektive Bildverarbeitungs-

algorithmen herangezogen werden. Im Folgenden werden optische Illusionen

und Wahrnehmungsph¨

anomene pr¨

asentiert, welche einen gewissen Bezug zur

vorliegenden Arbeit aufweisen. Neben der Helligkeitswahrnehmung, die in

Bezug zur Filterung eines Eingangsbildes im Rahmen einer Vorverarbei-

tung steht und Skalierungseffekten sind hierbei insbesondere Ph¨

anomene zur

Scheinkonturwahrnehmung und Figur-Grund-Gliederung von Interesse.

2.4.1 Helligkeitswahrnehmung

Die in Abbildung 2.6 dargestellte optische Illusion, benannt nach dem deut-

schen Physiologen Ludimar Hermann, wird als Hermann-Gitter bezeichnet.

Die Bereiche, in denen sich die weißen Gitterlinien kreuzen, werden als dunk-

ler im Vergleich zum Rest der Linie wahrgenommen, obwohl der Farbwert

uberall ein konstantes Weiß aufweist. Grund daf¨

ur ist die Zentrum-Umfeld

Charakteristik rezeptiver Felder retinaler Ganglienzellen [GGM95], welche

ein ¨

ahnliches Verhalten aufweisen wie die in Kap. 3 vorgestellten Filtermas-

ken (vgl. Abbildung 3.6).

2.4 Optische Illusionen und Wahrnehmungsph¨

anomene 15

Abbildung 2.6: Hermann-Gitter (nach [Her70]).

Abbildung 2.7(a) ist ein Beispiel f¨

ur die Farbkonstanz menschlicher Wahr-

nehmung, d. h. es werden zusammengeh¨

orige Fl¨

achen trotz eines Beleuch-

tungsunterschieds mit dem gleichen Farbwert wahrgenommen. So tendiert

das menschliche Sehsystem, das Schachbrettmuster in Abbildung 2.7(a) in

zwei Gruppen heller und dunkler Fl¨

achen einzuteilen. Die mit A und B

bezeichneten Fl¨

achen werden daher mit unterschiedlichen Helligkeitswerten

wahrgenommen, obwohl der dargebotene Reiz einen identischen Grauwert

f¨

ur die Fl¨

achen A und B aufweist. Dies wird in Abbildung 2.7(b) deutlich,

wo dem urspr¨

unglichen Bild zwei Balken mit dem Grauwert der Fl¨

achen A

und B ¨

uberlagert wurden. Offensichtlich haben Kontrastunterschiede f¨

ur die

menschliche Wahrnehmung also eine h¨

ohere Bedeutung als die eigentlichen

Helligkeitswerte. F¨

ur eine Vielzahl praktischer Anwendungen, die sich auf

nat¨

urliche Eingangsbilder beziehen, ist eine solche Beleuchtungsinvarianz

auch f¨

ur die digitale Bildverarbeitung von Bedeutung.

2.4.2 Gr¨

oßenwahrnehmung

Die in Abbildung 2.8(a) dargestellte optische Illusion wurde zuerst vom ita-

lienischen Psychologen Mario Ponzo (1882-1960) beschrieben, der vorschlug,

dass das menschliche Gehirn die Gr¨

oße eines Objektes in Relation zum Hin-

tergrund beurteilt. Was in Abbildung 2.8(a) als Illusion bezeichnet wird, ist

16 2 Grundlagen

(a) (b)

Abbildung 2.7: Schachbrett-Versuch von Edward H. Adelson aus dem Jahr

1995 (vgl. [Ade01]).

der Gegensatz zwischen der nachmessbaren L¨

ange der beiden horizontalen

Linien, welche beide gleich lang sind, und der menschlichen Wahrnehmung,

die aufgrund einer dreidimensionalen Interpretation des dargebotenen Reizes

die obere horizontale Linie als l¨

anger im Vergleich zur unteren Linie wahr-

nimmt. Das Tiefenkriterium, das dieser Interpretation zugrunde liegt, ist die

bereits in Kap. 2.2 beschriebene lineare Perspektive, die besagt, dass paral-

lele Linien sich zum Horizont hin verj¨

ungen. Im Fall von Abbildung 2.8(a)

werden also, ¨

ahnlich zu Straßenr¨

andern oder Bahnschienen, die vier sich in

einem Punkt treffenden d¨

unnen Linien als perspektivische Darstellung von

parallelen Linien interpretiert und die horizontalen Linien in diesen Kontext

eingebettet, womit der oberen Linie eine gr¨

oßere Distanz zum Beobachter

und damit auch eine h¨

ohere absolute Gr¨

oße zugeordnet wird.

Ebenfalls auf dem Prinzip der linearen Perspektive basiert die in 2.8(b) dar-

gestellte M¨

uller-Lyer Illusion. Auch bei der zuerst vom deutschen Psychia-

ter und Soziologen Franz M¨

uller-Lyer beschriebenen optischen Illusion sind

die vertikalen Linien gleich lang. Jedoch wird die linke vertikale Linie im

Gegensatz zur rechten aufgrund der Einbettung in einen dreidimensionalen

Kontext als kleiner wahrgenommen.

2.4 Optische Illusionen und Wahrnehmungsph¨

anomene 17

(a) (b)

Abbildung 2.8: (a) Ponzo Illusion von 1913, (b) M¨

uller-Lyer Illusion aus dem

Jahr 1889.

Die in Abbildung 2.9(a) dargestellte Illusion wird ebenfalls als Ponzo-, zu-

weilen aber auch als M¨

uller-Lyer Illusion bezeichnet. Offenbar enth¨

alt sie

sowohl Elemente aus Abbildung 2.8(a) als auch aus Abbildung 2.8(b). Auch

hier werden die auf Rezeptorebene gleich großen, dick gezeichneten vertika-

len Balken als unterschiedlich groß wahrgenommen. Im Gegensatz dazu sind

die im 1946 vom amerikanischen Augenarzt und Psychologen Adelbert Ames

vorgestellten Ames-Raum abgebildeten Personen physikalisch betrachtet alle

ahnlich groß (siehe Abbildung 2.9(b)), werden jedoch aufgrund ihrer Ent-

fernung zur Kamera unterschiedlich groß abgebildet [Bau78]. Trotz des mo-

nokularen Tiefenkriteriums, das bekannten gleichartigen Objekten aufgrund

der Gr¨

oße ihrer Abbildung auf Rezeptorebene eine Tiefe zuordnet, tendiert

die menschliche Wahrnehmung dazu, die Personen als unterschiedlich groß

wahrzunehmen. Dies geschieht nicht nur auf Abbildungsebene, sondern auch

bezogen auf die der Abbildung zugrunde liegenden Szene. Grund daf¨

ur ist

der Raum, in dessen Kontext die Wahrnehmung der Personen eingebunden

wird. Der Raum wird als rechtwinklig wahrgenommen, da die eigentlich

trapezf¨

ormige R¨

uckwand des Raumes nicht im rechten Winkel zu den Sei-

tenw¨

anden steht, sondern, bezogen auf den Betrachter, eine starke Neigung

um die vertikale Achse aufweist. Dieser Eindruck wird zus¨

atzlich verst¨

arkt

durch ebenfalls trapezf¨

ormige und unterschiedlich große T¨

uren und Fenster,

18 2 Grundlagen

(a) (b)

Abbildung 2.9: Gleiche Objektgr¨

oße auf der Ebene der sensoriellen Abbil-

dung bei der Ponzo-Illusion in (a) und gleiche absolute Ob-

jektgr¨

oße in der physischen Realit¨

at beim Ames-Raum in (b).

deren Abmessungen so gew¨

ahlt sind, dass f¨

ur eine bestimmte Perspektive

ihre Abbildung rechtwinklig erscheint.

2.4.3 Scheinkonturen

Abbildung 2.10 zeigt eine Modifikation des bereits in Kap. 2.3 vorgestellten

Kanizsa-Dreiecks. Im Gegensatz zu dem in Kap. 2.3 vorgestellten Kanizsa-

Dreieck besteht auf Rezeptorebene die Umgebung der drei schwarzen Fl¨

chen hier nicht aus einer weißen Fl¨

ache, sondern aus drei Fl¨

achen mit jeweils

unterschiedlichen Grauwerten. Durch die Kanten, die von diesen Fl¨

achen ge-

bildet werden, wird eine modale Vervollst¨

andigung der Kreise unterbunden

und damit die Mehrdeutigkeiten bei der perzeptuellen Organisation verrin-

gert. Statt eines Vordergrund-Dreiecks tendiert in diesem Fall die mensch-

liche Wahrnehmung aufgrund der unterschiedlich schattierten Fl¨

achen zu

der r¨

aumlichen Interpretation einer Pyramide, die sich vor drei schwarzen

Kreisen befindet.

Die nach dem deutschen Psychologen Walter Ehrenstein benannte Abbil-

dung 2.11 erzeugt ebenfalls Scheinkonturen. In diesem Fall fungieren die

2.4 Optische Illusionen und Wahrnehmungsph¨

anomene 19

Abbildung 2.10: Modifikation des Kanizsa-Dreiecks zu einer Kanizsa Pyra-

mide (nach [GG07]).

Linienenden als induzierende Elemente und erzeugen den Eindruck eines

weißen Kreises, der sich vor den schwarzen Linien und vor einem weißen

Hintergrund befindet, gegen¨

uber dem er als wesentlich heller wahrgenom-

men wird. Der Eindruck einer Vordergrundfl¨

ache wird zerst¨

ort, wenn der

Kreis mit einer schwarzen Linie umrandet wird.

Abbildung 2.11: Ehrenstein-T¨

auschung.

20 2 Grundlagen

Abbildung 2.12: Bild eines Dalmatiners von R. C. James (aus [Mar82]).

Die geschilderten Wahrnehmungsph¨

anomene zur Scheinkonturwahrnehmung

lassen sich alle mit Bottom-Up-Prozessen erkl¨

aren, f¨

ur die lediglich induzie-

rende Elemente im sensoriellen Abbild vorhanden sein m¨

ussen. Dass aber

auch eine Wissensbasis in Form erlernter Objektprototypen eine Rolle bei

der Konturwahrnehmung spielt, zeigt Abbildung 2.12. F¨

ur die Wahrneh-

mung der Konturen des abgebildeten Dalmatiners ist Wissen ¨

uber das Aus-

sehen eines Hundes notwendig, die perzeptuelle Organisation muss in diesem

Fall also von h¨

oheren kognitiven Funktionen beeinflusst sein.

2.4.4 Figur-Grund-Gliederung

Im Fall der Abbildung 2.13 bezieht sich der Begriff optische Illusion auf die

Mehrdeutigkeit des Bildes in Bezug auf die Organisation der Fl¨

achen in einen

Vorder- und einen Hintergrund. Wird die schwarze Fl¨

ache als Vordergrund

betrachtet, so folgt die Wahrnehmung einer Vase vor weißem Hintergrund.

Wird dagegen die schwarze Fl¨

ache als Hintergrund interpretiert, so ergibt

2.4 Optische Illusionen und Wahrnehmungsph¨

anomene 21

Abbildung 2.13: Rubin Vase, zuerst um 1915 vom d¨

anischen Psychologen

Edgar Rubin vorgestellt.

sich die Profilansicht zweier Gesichter, die sich vor dem schwarzen Hinter-

grund befinden.

Obwohl Erfahrung, zusammen mit eindeutigen induzierenden Merkmalen,

wie z. B. der Stiel der Schaufel und die Hose des Mannes hinter dem Zaun,

eine Interpretation der Abbildung 2.14 nahelegen, in der ein Mann und eine

Frau sich hinter dem Zaun befinden, entsteht der Eindruck, dass der Ober-

k¨

orper der Frau und der Unterk¨

orper des Mannes sich hinter dem Zaun

befinden, w¨

ahrend der Oberk¨

orper des Mannes und der Unterk¨

orper der

Frau sich vor dem Zaun befinden.

Hierbei f¨

allt auf, dass die horizontalen Zaunlatten einen zum Rock der Frau

und zur Jacke des Mannes identischen Grauwert aufweisen. Ausschlagge-

bend f¨

ur die Wahrnehmung des Zaunes als Hintergrund in diesen Bereichen

ist nach der Hypothese von Petter [Kan79] die Tatsache, dass der Zaun d¨

un-

ner ist als die anderen gleichfarbigen Bereiche und damit als weiter entfernt

wahrgenommen wird.

22 2 Grundlagen

Abbildung 2.14: Mann und Frau mit wechselnden Figur-Grund-Attributen

in Bezug zum Zaun (aus [Kan79]).

2.5 Strategien zur perzeptuellen Organisation

Grunds¨

atzlich ist bei der Gruppierung von Konturelementen zwischen ei-

ner Verst¨

arkung salienter Konturen und einer Konturvervollst¨

andigung zu

unterscheiden. Die Verst¨

arkung salienter Konturen hat in der Regel eine

Aufbereitung der verrauschten Daten einer Kantendetektion zum Ziel und

verst¨

arkt somit ohnehin schon vorhandene Konturen [AB98, SU88]. Durch

eine Konturvervollst¨

andigung werden dagegen Konturen rekonstruiert, die

uber weite Bereiche des Eingangsbildes aufgrund von Verdeckung oder feh-

lendem Kontrast zwischen Vorder- und Hintergrund nicht im Bild enthal-

ten sind. H¨

aufig wird diese Unterscheidung jedoch nicht getroffen, da eine

Auff¨

ullung von Konturl¨

ucken, wie sie im Rahmen einer Konturverst¨

arkung

stattfindet, sich oft auch ¨

uber das Ende oder den Knick einer Kontur fort-

setzen l¨

asst und damit Ph¨

anomene wie z. B. die Konturwahrnehmung im

Kanizsa-Dreieck erzeugt werden k¨

onnen. Hierbei ist jedoch zu beachten,

2.5 Strategien zur perzeptuellen Organisation 23

dass gerade amodale Vervollst¨

andigungen von Konturen, die hinter einem

texturierten Vordergrund verlaufen, der seinerseits Konturen erzeugt, nicht

ohne weiteres m¨

oglich sind. Die Mehrheit der Ans¨

atze, welche sich mit der

Thematik der Verst¨

arkung salienter Konturen oder der Vervollst¨

andigung

unterbrochener Konturen auseinandersetzen, nutzen ein bipolares Kommu-

nikationsschema [HN01, HN04, PZ89, NM01], wie es von Grossberg und

Mingolla [RGM00] vorgestellt wurde.

Eine solche Maske zur perzeptuellen Gruppierung besteht normalerweise aus

ein oder zwei symmetrischen Fl¨

ugeln, welche sowohl die Verbindungswahr-

scheinlichkeit zweier Konturelemente kodieren, als auch die Orientierung,

welche ein Konturelement in Bezug auf ein betrachtetes Konturelement auf-

weisen sollte, um mit diesem gruppiert, d. h. verbunden zu werden (vgl. Ab-

bildung 2.15).

(a) (b) (c)

Abbildung 2.15: Kommunikationsschemata in verschiedenen Ans¨

atzen: (a)

Konturdarstellung des Verbindungsschemas von Heitger

und van der Heydt [HHP+98], (b) bipolares Verbindungs-

schema nach Grossberg und Mingolla [NM01] und (c)

modellierte Brown’sche Molekularbewegung nach Williams

[ZW00] .

In [WT00] vergleichen Williams und Thornber verschiedene Formen solcher

Gruppierungsfelder. Eine detaillierte ¨

Ubersicht zur Thematik der Kontur-

verst¨

arkung findet sich in [Han03] und [NM01], wobei in [NM01] Modelle

betont werden, die eine Scheinkonturwahrnehmung implizieren. Zu nennen

sind hier die Ans¨

atze von Heitger et al. [HH93, PH01] und Neumann et

24 2 Grundlagen

al. [HSN01] als neurophysisch motivierte Verfahren, sowie das Modell von

Zweck und Williams [ZW00], welches die Brown’sche Molekularbewegung

eines Partikels von einer Quelle ausgehend modelliert.

Ein weiterer Ansatz zur perzeptuellen Gruppierung von Konturelementen

ist das von Medioni et al. begr¨

undete Tensor Voting Verfahren [GM96], wel-

ches auch in der vorliegenden Arbeit neben einer Spline-Interpolation als

eine M¨

oglichkeit der Konturvervollst¨

andigung genutzt und in Kap. 4 n¨

aher

erl¨

autert wird. In [MLT00] wurde Tensor Voting auf Konturverst¨

arkungs-

probleme in synthetischen bzw. bin¨

aren Testbildern angewandt. Dieser An-

satz wurde in [MBM02b, Bab03] auf Grauwertbilder ausgeweitet, indem in

einem Vorverarbeitungsschritt die Filterantworten sogenannter Gabor Filter

(siehe auch [Gab46, Dau88, Lee96]) als f¨

ur das Votingverfahren notwendige

Eingangstensoren kodiert wurden. Das im Tensor Voting genutzte Kom-

munikationsschema wird als Stick-Voting Feld bezeichnet (vgl. Kap. 4), ist

bipolar und bezieht sich damit auf Orientierungen mit Winkeln im Bereich

von 0◦bis 180◦, im Gegensatz zu einem direktionalen, d. h. gerichteten

Verbindungsschema, das Winkel im Bereich von 0◦bis 360◦unterscheidet.

F¨

ur den Anwendungsbereich der Konturvervollst¨

andigung mag der Einsatz

eines solchen bipolaren Voting-Feldes zwar im Kontext einer einheitlichen

Behandlung aller Konturelemente auf einer dicht besetzten Merkmalskarte

zwar Sinn machen, w¨

urde aber, wie schon erw¨

ahnt, zu St¨

orungen bei der Or-

ganisation der Konturelemente in solche Bereichen f¨

uhren, wo eine amodale

Vervollst¨

andigung in einem stark texturierten Bildbereich gefunden werden

soll. F¨

ur eine Konturvervollst¨

andigung, welche auch amodale Vervollst¨

an-

digungen mit einbezieht, wird ein gerichtetes Kommunikationsschema be-

n¨

otigt, welches ausgehend von induzierenden Elementen eine d¨

unn besetzte

Verbindungskarte erzeugt.

Ein solcher Ansatz wurde, bezogen auf das Tensor-Voting Verfahren, in

[MM01b] vorgestellt, allerdings bestanden hierbei die Eingangsbilder aus

Bin¨

ardateien und das vorgestellte monokulare Tiefenkriterium ber¨

ucksich-

tigte lediglich die L¨

ange der vervollst¨

andigten Konturen in sogenannten

2.5 Strategien zur perzeptuellen Organisation 25

”Spontaneously“ oder ”Self Splitting Figures“, d. h. Abbildungen, in denen

Vorder- und Hintergrundobjekt denselben Farb- bzw. Bin¨

arwert aufweisen

(vgl. Kap. 5.1 und Abbildung 2.14). Dar¨

uber hinaus werden in [MM01b] in-

duzierende Elemente in Form von Eckpunkten ebenfalls mit Hilfe des Tensor

Voting Verfahrens bestimmt, was, wie in Kap. 4.1 n¨

aher erl¨

autert wird, in

komplexeren nat¨

urlichen Eingangsbilderen zu hohen Fehlzuordnungen f¨

uh-

ren kann.

(a) (b) (c) (d)

Abbildung 2.16: Konturvervollst¨

andigung nach [MM01b]: (a) bin¨

ares Ein-

gangsbild, (b) detektierte Konturen, (c) Tensorkarte zur

Konturvervollst¨

andigung und (d) detektierte und vervoll-

st¨

andigte Konturen.

Zu den Ans¨

atzen, welche nicht nur eine Scheinkonturwahrnehmung bzw. Kon-

turvervollst¨

andigung realisieren, sondern dies auch mit einer Figur-Grund-

Gliederung verbinden, z¨

ahlt der Ansatz von Heitger et al. [HHP+98]. Aller-

dings wird hierbei lediglich an Eckpunkten eine reale Kontur, zusammen mit

ihrer vervollst¨

andigten Fortsetzung, als Objektgrenze des Vordergrundes an-

gesehen, w¨

ahrend der Bereich, in dem sich die zweite Kontur des Eckpunktes

befindet, dem Hintergrund zugeordnet wird (vgl. Abbildung 2.17(a)). Offen-

sichtlich f¨

uhrt ein solches Vorgehen zu Fehlzuordnungen im Falle amodaler

Vervollst¨

andigungen, wie z. B. den Kreisvervollst¨

andigungen im Kanizsa-

Dreieck. Die Autoren bemerken selbstkritisch, dass ein solch simpler Me-

chanismus get¨

auscht werden kann [HHP+98] und f¨

uhren die modalen Ver-

vollst¨

andigungen eines Zebras vor weißem Hintergrund als Beispiel an. In

26 2 Grundlagen

diesem Fall w¨

urde obiges Vorgehen den K¨

orper des Zebras als Hintergrund

klassifizieren.

In [GKP96] wird von Geiger et al. zun¨

achst eine Karte definiert, welche die

Wahrscheinlichkeit daf¨

ur angibt, dass der Bildinhalt im betreffenden Bereich

dem Vordergrund zuzuordnen ist. Auf dieser Karte findet dann ein Diffusi-

onsprozess statt, der von Figur-Grund-Unterscheidungen an Schl¨

usselpunk-

ten ausgeht, wobei eine Diffusion ¨

uber reale Kanten hinaus verhindert wird.

Ein solcher Diffusionsprozess kann seiner Natur nach ein Bild nur in die zwei

Kategorien von Vordergrund und Hintergrund unterteilen (vgl. Abbildung

2.17(c)). Eine Betrachtung komplexer Tiefenverh¨

altnisse, wie Objekte, die

ihren Zustand von Vorder- zu Hintergrund wechseln, ist nicht m¨

oglich. So

werden auch nur synthetische, bin¨

are Eingangsbilder betrachtet, welche in

der wahrscheinlichsten dreidimensionalen Interpretation lediglich zwei Tie-

fenebenen aufweisen.

Ebenso werden im Ansatz von Williams [Wil94, WH96] nur bin¨

are syntheti-

sche Eingangsbilder betrachtet (vgl. Abbildung 2.17(d)). Die Vervollst¨

andi-

gung okkludierter Oberfl¨

achen leitet die Figur-Grund-Entscheidung f¨

ur Kon-

turkreuzungen aus einer kombinatorischen Betrachtung der Konstellation an

diesen Schl¨

usselpunkten ab. Hierbei werden lokale Kriterien ausschließlich

in die globale Organisation eingeschlossen, was die Betrachtung global in-

konsistenter Konstellationen verhindert. Dieses Vorgehen wird dabei nicht

mit dem in [ZW00] vorgestellten Gruppierungsverfahren kombiniert.

Auch das von Saund vorgestellte Verfahren basiert im Gegensatz zur vorlie-

genden Arbeit aus einer kombinatorischen Betrachtung der m¨

oglichen Figur-

Grund-Entscheidungen an Kreuzungspunkten [Sau99a, Sau99b]. Die Kon-

turvervollst¨

andigung geht also der Figur-Grund-Gliederung nicht voraus,

sondern ist Folge des kombinatorischen Entscheidungsprozesses (vgl. Ab-

bildung 2.17(b)). In [Sau99a] wird das pr¨

asentierte Verfahren auf ein na-

t¨

urliches Eingangsbild angewandt, wobei anhand von Fehlzuordnungen der

Einfluss der Bildvorverarbeitung aufgezeigt wird.

2.5 Strategien zur perzeptuellen Organisation 27

(a) (b) (c) (d)

Abbildung 2.17: Kanizsadreiecke, obere Reihe: Eingangsbild und untere

Reihe: Ergebnis des jeweiligen Verfahrens: (a) vervollst¨

an-

digte Konturen nach Heitger et al. , kleine Linien zeigen in

Richtung des Hintergrundes (aus [PH01]), (b) eine m¨

ogliche

Konturvervollst¨

andigung nach Saund, Pfeile und Schattie-

rung zeigen in Richtung des Hintergrunds, gestrichelte Li-

nien deuten amodale Vervollst¨

andigungen an (aus [Sau99a]),

scheinlichkeit, dass der Bildinhalt zum Vordergrund geh¨

ort

(aus [GKP96]) und (d) stochastisches Vervollst¨

andigungs-

feld nach Williams et al. (aus [WJ96])

Insgesamt l¨

asst sich festhalten, dass Ans¨

atze zur perzeptuellen Gruppie-

rung, die nat¨

urliche Eingangsbilder pr¨

asentieren, diese zumeist nutzen, um

die Grenzen des Verfahrens aufzuzeigen [HHP+98, Sau99a]. Die eigentliche

Funktionsweise des Verfahrens wird in der Regel an einer optischen Illu-

sion wie dem Kanizsa-Dreieck demonstriert. Hieraus wird die Bedeutung

einer Bildvorverarbeitung ersichtlich, welche f¨

ur einen Prozess der perzep-

tuellen Organisation in komplexen realen Bildern notwendig ist. Ebenso

f¨

allt auf, dass existierende Ans¨

atze zur perzeptuellen Organisation ledig-

lich eine bin¨

are Figur-Grund-Gliederung an Konturkreuzungen vornehmen.

28 2 Grundlagen

Eine Zuweisung relativer Tiefe entlang der gesamten Kontur, ob real oder

vervollst¨

andigt, findet nicht statt.

3 Bildvorverarbeitung

Ziel der Bildvorverarbeitung ist es, nachfolgenden Verarbeitungsschritten

m¨

oglichst genaue und vollst¨

andige Informationen ¨

uber die Position und die

Orientierung von Konturelementen bereitzustellen. Gerade f¨

ur die Ver-

vollst¨

andigung von Konturen, die aufgrund einer Verdeckung oder fehlen-

dem Kontrast zwischen Vorder- und Hintergrund unterbrochen sind, wird

nicht nur die Position einer solchen Konturunterbrechung ben¨

otigt, sondern

auch die Richtung, in der die unterbrochene Kontur fortgesetzt werden soll.

Dies stellt ein wesentliches Kriterium f¨

ur die Wahl der Filter, welche zur

Kontur- bzw. Kantendetektion und zur Detektion von Ecken oder Kon-

turkreuzungspunkten genutzt werden, dar. F¨

ur den Anwendungsbereich

der Kantendetektion haben sich gradientenbasierte Filtermethoden etabliert

[MS98, ZT98]. Die Filtermasken, die in diesem Zusammenhang genutzt wer-

den, basieren in der Regel auf einer Diskretisierung eines Ableitungsopera-

tors erster Ordnung (vgl. Abbildung 3.1). Kanten, d. h. orientierte Kon-

trastunterschiede im Grau- oder Farbwertverlauf eines Bildes, sind hierbei

als lokale Extremstelle der Filterantwort gegeben.

Durch die Diskretisierung der Summe der beiden reinen zweiten Ableitungen

erh¨

alt man einen Laplaceoperator, welcher Kanten durch Nullstellendurch-

g¨

ange in der Filterantwort anzeigt. Da Kantendetektoren, welche auf Diskre-

tisierungen von Gradienten basieren, h¨

aufig empfindlich auf Rauschen rea-

gieren, ist es ¨

ublich, die Filtermaske mit einem Tiefpassfilter, welches h¨

aufig

aus einer gaußf¨

ormigen Funktion besteht, zu kombinieren [GW08, JHG99].

Dies f¨

uhrt wiederum zu einer erh¨

ohten Lokalisierungsungenauigkeit der Kan-

tendetektion. Daher muss bei einem solchen Vorgehen immer ein Kompro-

miss zwischen Rauschunempfindlichkeit und Lokalisierungsgenauigkeit ge-

funden werden. Wie schon erw¨

ahnt, wird f¨

ur die Erzeugung von Konturver-

30 3 Bildvorverarbeitung

−10

0 1

0−1

1 0

(a) (b)

−1−2−1

000

121

−10 1

−20 2

−10 1

0 1 0

1−41

0 1 0

Abbildung 3.1: (a) bis (d): Koeffizienten f¨

ur gradientenbasierte Filtermasken

(a) und (b) Roberts Filter und (c) und (d) Sobel Filter,

(e) Laplace Filter.

vollst¨

andigungen, wie sie in Kapitel 4 vorgestellt wird, nicht nur die Position

von Kanten und Eckpunkten ben¨

otigt, sondern auch die Orientierung von

Kanten und die Orientierung von m¨

oglichen Kantenfortsetzungen an Kreu-

zungspunkten. Weiterhin wird in Kapitel 4.2 ein Mechanismus zur Ber¨

uck-

sichtigung von Hell- Dunkel¨

uberg¨

angen an Kreuzungspunkten ben¨

otigt. Im

Folgenden wird daher auf eine Kombination verschiedener Filtermasken zu-

r¨

uckgegriffen, welche nicht nur die geforderten Informationen liefert, sondern

dar¨

uber hinaus auch eine schwellwertunabh¨

angige Kantendetektion erm¨

og-

licht. Weiterhin bietet sie eine im Vergleich zu reinen Gradientenfiltern gute

Lokalisierung bei gleichzeitiger Toleranz gegen¨

uber Rauschprozessen.

Eine nat¨

urliche Szene ist in der Regel derart komplex aufgebaut, dass eine

Kanten- und Eckendetektion eines hochaufgel¨

osten Bildes unz¨

ahlige Ecken

und Kanten liefert, die in ihrer Skalierung korrekt erkannt sein m¨

ogen, aber

einem Betrachter, der seine subjektive Skalierung an die ihn interessieren-

den Objekte anpasst, als unsinnig erscheint. Es ist daher w¨

unschenswert,

3.1 Filterung 31

ein Eingangsbild zu simplifizieren, d. h. hochfrequente Bildinhalte entspre-

chend einer gew¨

unschten Skalierung aus dem Bild zu entfernen und damit

das Bild auf die wesentlichen Bildinhalte zu reduzieren. Die hier nahelie-

gende Funktionen, welche eine Tief- oder Bandpasscharakteristik aufweisen,

w¨

urden neben hochfrequenten Bildanteilen allerdings auch Informationen

uber saliente Kanten l¨

oschen oder ver¨

andern. Ein Mechanismus, der eine

Gl¨

attung des Eingangsbildes unter Beibehaltung salienter Kanten bewirkt,

wird in Form eines anisotropen Regularisierungsverfahrens in Kapitel 3.3

vorgestellt.

3.1 Filterung

Alle im Folgenden vorgestellten Filter basieren auf einer Gaußfunktion

g(x, y) = w(x, y)·e

−k(x, y)Tk2

σ,(3.1)

wobei (x, y)Tdie Bildposition innerhalb der Faltungsmaske angibt. Da im

Anwendungsfall die Filtermaske einen begrenzten Radius raufweist, wird

der Parameter σso gew¨

ahlt, dass f¨

ur einen Wert ε > 0 im Fall w(x, y)≡1

die Gaußfunktion unter den Wert εf¨

allt:

σ=−r2

ln(ε)(3.2)

Im Folgenden wird, um hinreichend niedrige Werte am Rand der Filtermaske

zu gew¨

ahrleisten, ε= 0,01 gew¨

ahlt. ¨

Uber die Gewichtungsfunktion wsollen

drei verschieden geformte Klassen von Faltungsmasken erzeugt werden, von

denen zwei orientierungsselektiv sind. Die Orientierungsselektivit¨

at zu ei-

nem gegeben Winkel αwird durch eine Rotation der Bildposition p= (x, y)T

in den Prototyp gder jeweiligen Filtermaske erreicht. F¨

ur die orientierungs-

abh¨

angige Filtermaske fergibt sich somit

32 3 Bildvorverarbeitung

f(p) = g(R·p) mit R= cos(α)−sin(α)

sin(α) cos(α)!(3.3)

Durch die Wahl der Vorzeichen der Gewichtungsfunktion wird, wie im Fol-

genden erl¨

autert, die Form der Filtermaske bestimmt. Weiterhin wird die

Gewichtungsfunktion wso gew¨

ahlt, dass

f(p) = 0 (3.4)

gilt und die Filterantworten auf einen gemeinsamen maximalen Wert der

Filterantwort normiert werden.

(a) (b)

(c)

Abbildung 3.2: Kontinuierliche Darstellung der Filtermasken: (a) Kanten-

filter (b) Eckfilter (c) Zentrum-Umfeld Filter.

3.1 Filterung 33

Wird f¨

ur die Gewichtungsfunktion

w(x, y) := w(x) = sgn(x) (3.5)

gew¨

ahlt, so ergibt sich als Prototyp die in Abbildung 3.2(a) dargestellte

Filtermaske, die im Folgenden als Kantenfilter bezeichnet wird.

(a) (b) (c) (d) (e)

Abbildung 3.3: Orientierungsselektive gaußf¨

ormige Kantenfilterbank f¨

ur Ori-

entierungswinkel von: (a) 60, (b) 90, (c) 120, (d) 150 und

(e) 180 Grad. Obere Reihe: Filterradius 4 Pixel und untere

Reihe: Filterradius 7 Pixel.

Die hieraus folgenden diskreten Filtermasken sind f¨

ur verschiedene Radien

und Orientierungen in Abbildung 3.3 dargestellt. Dabei zeigen helle Grau-

werte positive Vorzeichen der Filtermaske an, w¨

ahrend dunkle Grauwerte ne-

gative Vorzeichen bedeuten. Da die Breite der Filtermaske immer dem dop-

pelten Filterradius entspricht, ist der Funktionswert x= 0 der Signumfunk-

tion in Gleichung (3.5) f¨

ur die Bestimmung der Koeffizienten der diskreten

Filtermaske uninteressant. Die hier pr¨

asentierten Kantenfilter weisen einen

eindeutigen maximalen Ausschlag im Falle einer entsprechend orientierten

stufenartigen Diskontinuit¨

at des Grauwertverlaufs auf, wie sie an Objekt-

kanten auftritt. Im Gegensatz dazu w¨

urde ein Filter mit ungerader Zeilen-

und Spaltenanzahl in einem solchen Fall zwei maximale Ausschl¨

age erzeugen.

34 3 Bildvorverarbeitung

(a) (b) (c)

Abbildung 3.4: Ergebnisse der Filterung mit den in Abbildung 3.3 und 3.2(a)

dargestellten Kantenfiltern, einem Filterradius von sieben Pi-

xeln und 24 betrachteten Orientierungen. (a) Eingangsbild,

(b) Filtermaximum und (c) Winkel der betragsgr¨

oßten Fil-

terantworten.

Zu dem h¨

aufig in der Bildverarbeitung genutzten Testbild ”Lena“ [Pla72] in

Abbildung 3.4(a) ist in Abbildung 3.4(b) zu jedem Bildpunkt der jeweils

h¨

ochste Betrag aller Kantenfilterantworten dargestellt. Hohe Betr¨

age sind

dabei hell dargestellt, w¨

ahrend schwarz den Wert Null repr¨

asentiert.

Die Filterantwort nach Faltung der Kantenfiltermaske mit dem Eingangsbild

unterscheidet sich bei zwei Orientierungen αund α+ 180◦lediglich durch

ihr Vorzeichen. Es werden daher f¨

ur die Kantenfilter nur Orientierungen im

Bereich von 0◦bis 180◦betrachtet, wobei der Winkelbereich entsprechend

der Anzahl der betrachteten Orientierungen in ¨

aquidistante Abschnitte ein-

geteilt wird. In Abbildung 3.4(c) ist zu jedem Bildpunkt der Winkel des

Kantenfilters mit der betragsgr¨

oßten Filterantwort dargestellt. Um auf den

f¨

ur Digitalbilder ¨

ublichen Wertebereich von 0 bis 255 zu normieren, wird

die Winkelinformation in Abbildung 3.4(c) zu gegebenem Winkel ϕmittels

(sin(ϕ) + 1) ·127.5 visualisiert.

Durch eine geeignete Wahl der Gewichtsfunktion wl¨

asst sich der in Abbil-

dung 3.2(b) dargestellte Verlauf der Filtermaske erzielen. Die Gewichte sind

3.1 Filterung 35

(a) (b) (c) (d) (e)

Abbildung 3.5: Orientierungsselektive gaußf¨

ormige Eckfilterbank f¨

ur Orien-

tierungswinkel von: (a) 60, (b) 90, (c) 120, (d) 150 und (e)

180 Grad. Obere Reihe: Filterradius 4 Pixel und untere

Reihe: Filterradius 7 Pixel.

dabei so normiert, dass bei maximaler Filterantwort der Betrag des im Fol-

genden als Eckfilter bezeichneten Filters dem des Kantenfilters entspricht.

Dies wird in Kap. 3.2 Bedeutung f¨

ur die Vergleichbarkeit der Filterantwor-

ten haben. In Abbildung 3.5 sind wieder die diskreten Filtermasken f¨

unterschiedliche Orientierungen und f¨

ur zwei unterschiedliche Filterradien

dargestellt. Da das Filter im Gegensatz zum Kantenfilter nicht spiegelsym-

metrisch ist, wird hier die doppelte Anzahl an Orientierungen ber¨

ucksichtigt,

d. h. es werden Winkel im Bereich von 0◦bis 360◦betrachtet.

(a) (b)

Abbildung 3.6: Zentrum-Umfeld Filter mit einem Filterradius von (a) 4 Pi-

xel und (b) 7 Pixel.

36 3 Bildvorverarbeitung

Die in Abbildung 3.6 dargestellten diskreten Zentrum-Umfeld Filtermasken

werden im Folgenden als ZU-Filter bezeichnet und entstehen durch eine

Vorzeichen¨

anderung der inneren vier Pixel der Filtermaske. ¨

Ahnlich dem

Marr-Hildreth-Operator bzw. Laplacian of Gaussian (LoG) liefert das ZU-

Filter durch Nulldurchg¨

ange einen Hinweis auf Kanten, w¨

ahrend die Maxima

auf Linien oder einzelne Punkte schließen lassen [Mar82]. Auch hier ist der

Betrag der maximalen Filterantwort auf den der bereits vorgestellten Filter

normiert. Im Gegensatz zu diesen ist das ZU-Filter nicht orientierungsse-

lektiv.

(a) (b) (c)

Abbildung 3.7: Filterergebnisse f¨

ur das Lena Testbild in Abbildung 3.4.

(a) Kantenfilter mit einer Orientierung von α= 150◦, (b)

Eckfilter, ebenfalls mit einer Orientierung von α= 150◦und

weils 7 Pixel. Untere Reihe: Vergr¨

oßerung der Augen-Region.

F¨

ur die verschiedenen Filterklassen ist in Abbildung 3.7 jeweils ein Bei-

spiel der Filterantwort gegeben, wobei wieder positive Werte hell dargestellt

werden, negative Werte dunkel dargestellt werden und die Null auf einen

mittleren Grauwert abgebildet wird. F¨

ur das Kantenfilter in Abbildung 3.7

(a) und das Eckfilter in Abbildung 3.7 (b) ist jeweils die Filterantwort des

Filters mit einer Orientierung von 150◦dargestellt (vgl. Abbildung 3.3(d)

3.2 Detektion von Konturen und Kreuzungspunkten 37

und Abbildung 3.5(d)). F¨

ur das ZU-Filter existiert lediglich eine, orientie-

rungsunabh¨

angige Filterantwort, die in Abbildung 3.7(c) dargestellt ist.

Das unterschiedliche Verhalten der Filter wird in den Vergr¨

oßerungen der

Augenregion in der unteren Reihe deutlich. Betrachtet man die Kante,

d. h. die Diskontinuit¨

at des Grauwertverlaufs, welche sich im Originalbild

im Bereich zwischen Hut und Gesicht befindet, so l¨

asst sich feststellen, dass

Kanten- und Eckfilter ein relatives Maximum der Filterantwort aufweisen,

hier dunkel dargestellt, w¨

ahrend das ZU-Filter, durch einen Hell-Dunkel-

Wechsel dargestellt, im Konturbereich einen Vorzeichenwechsel und damit

eine Nullstelle aufweist. Offensichtlich reagieren Eckfilter, genau wie Kan-

tenfilter, auf Kanten. Aufgrund ihrer Konstruktion und Normierung f¨

allt die

Filterantwort an der Position einer idealen Kante allerdings im Vergleich

zum Kantenfilter niedriger aus. Dieser Zusammenhang wird in Kap. 3.2

genutzt, um eine schwellwertfreie Kantendetektion zu realisieren.

3.2 Detektion von Konturen und Kreuzungspunkten

Eine auf gradientenbasierten Faltungsmasken (vgl. Abbildung 3.1) beru-

hende Kantendetektion ist in der Regel mit der Bildung eines Schwellwertes

verbunden. Ansonsten w¨

urden auch solche Bildelemente als Kante dekla-

riert, die zwar aufgrund von Rauschprozessen, sehr geringer Farbwertunter-

schiede oder Nichtlinearit¨

aten im Grau- oder Farbwertverlaufs eines Bildes

ein lokales Extremum in der Filterantwort erzeugen, jedoch im eigentlichen

Sinne keine Diskontinuit¨

at im Farb- oder Grauwertverlauf darstellen. Durch

eine Schwellwertoperation wird die Kantendetektion allerdings stark abh¨

an-

gig von der Helligkeit des gegebenen Bildes [Mar82, Can86, Gab46]. Eine

gewisse Abhilfe schafft hier die beim sogenannten Canny Filter h¨

aufig ge-

nutzte Vorgehensweise [Can86], bei der zun¨

achst Konturen mit einem hohen

Schwellwert extrahiert werden, um dann mit einem niedrigen Schwellwert

vervollst¨

andigt zu werden, wobei die Beleuchtungsabh¨

angigkeit aber wei-

terhin gegeben bleibt. Wird ferner die Gr¨

oße der Faltungsmaske erh¨

oht,

38 3 Bildvorverarbeitung

um den Einfluss von Rauschprozessen zu verringern, so f¨

uhrt dies zu Lo-

kalisierungsungenauigkeiten sowohl bei der Kantendetektion, als auch bei

der Bestimmung der Position von Eckpunkten. Um einen schwellwertfreien

Ansatzpunkt f¨

ur die Kantendetektion zu erhalten, wird im Folgenden zu-

n¨

achst nach einer idealen Kombination der in Kap. 3.1 vorgestellten Filter

gesucht, um die hieraus gewonnenen Kanten anschließend ebenfalls anhand

der Betrachtung der Kombinationen der Filterantworten zu vervollst¨

andi-

gen. Die Betrachtung der Kombinationen von Filterantworten erm¨

oglicht

dar¨

uber hinaus, notwendige Bedingungen f¨

ur Eckpunkte zu formulieren.

3.2.1 Schwellwertfreie Kantendetektion

Alle in Kap. 3.1 vorgestellten Filter basieren auf derselben Gaußfunktion,

was mit einer entsprechenden Normierung den Vorteil bietet, dass die Fil-

terwerte direkt miteinander vergleichbar sind. Dies ist in Abbildung 3.8 am

Beispiel der Filterantworten im Bereich einer Kante und im Bereich einer

Ecke dargestellt. Die in der Spalte (a) dargestellten Konstellationen zeigen

jeweils eine Kante bzw. eine Ecke, die eine Grenze zwischen einem wei-

ßen und einem schwarzen Bildbereich darstellen. Entlang einer horizontalen

Richtung werden die Filterantworten betrachtet, die sich aus der Faltung

der Filtermaske mit dem Eingangsbild ergeben, wobei die graue Linie in je-

dem Bild den Bereich darstellt, in dem sich die mittleren beiden Zeilen der

Filtermaske bei der Faltung befinden. Durch die Betrachtung der Filterant-

worten entlang der grau dargestellten Zeilen ergeben sich die in den Spalten

(b) bis (d) dargestellten Verl¨

aufe, wobei in (b) die Filterantworten der in

Kap. 3.1 vorgestellten Kantenfilter, in (c) die der Eckfilter und in (d) die

Filterantworten der ZU-Filter darstellt sind. F¨

ur die orientierungsselektiven

Kanten- und Eckfilter ist f¨

ur jede Bildposition der Betrag der betragsgr¨

oß-

ten Filterorientierung dargestellt, w¨

ahrend die Filterantwort des ZU-Filters

mit Vorzeichen dargestellt ist.

3.2 Detektion von Konturen und Kreuzungspunkten 39

(a) (b) (c) (d)

Abbildung 3.8: Charakteristika der Filterantworten an verschiedenen Bild-

positionen, Erl¨

auterung siehe Text.

40 3 Bildvorverarbeitung

S¨

amtliche Faltungen starten im weißen Bildbereich, sodass die Filterant-

worten alle auf der Nulllinie beginnen. Man beachte, dass der Radius der

Filtermasken in diesem Beispiel sieben Pixel betr¨

agt, was einer Filtermaske

von 14×14 Pixel entspricht. Hierdurch werden auch f¨

ur die Konstellation in

der letzten Zeile von Abbildung 3.8 Filterantworten ungleich Null erzeugt,

obwohl das Zentrum der Filtermaske sich immer im weißen Bildbereich be-

findet.

Die in der ersten Zeile von Abbildung 3.8 pr¨

asentierte Konstellation zeigt das

Verhalten der Filter im Bereich einer Kante. W¨

ahrend die Kantenfilterbe-

tr¨

age ein eindeutiges Maximum aufweisen, weisen die Betr¨

age der Eckfilter

rechts und links von der Kante einen h¨

oheren Wert auf als an der Posi-

tion der Kante selbst. Dar¨

uber hinaus sind die Eckfilterbetr¨

age bis auf die

Kantenposition an jeder Position h¨

oher als die der Kantenfilterbetr¨

age. Wei-

terhin weist das ZU-Filter an der Position der Kante einen Nulldurchgang

auf. Damit ist eine schwellwertfreie Kondition bestimmt f¨

ur Bildpunkte, die

in jedem Fall als Kanten deklariert werden k¨

onnen. Die Kombination ei-

nes Betragsmaximums des Kantenfilters, dessen Filterantwort betragsm¨

aßig

h¨

oher ist als die Eckfilters, verbunden mit einem Vorzeichenwechsel des ZU-

Filters wird daher im Folgenden als ideale Kante bezeichnet. Experimentelle

Ergebnisse zeigen, dass glatte Kantenverl¨

aufe im allgemeinen solche idealen

Kanten erzeugen.

Ab der zweiten Zeile sind die Filterantworten f¨

ur den Fall dargestellt, dass

sich eine Ecke im Bereich der Filtermaske befindet. Statt eines ¨

Ubergangs

von einem weißen zu einem schwarzen Bildbereich sind jetzt permanent weiße

Pixel im Bereich der Filtermaske enthalten. Nimmt, wie in der zweiten und

der dritten Zeile dargestellt, der Einfluss der weißen Pixel zu und der der

schwarzen Pixel ab, so ergibt sich eine ver¨

anderte Charakteristik der Fil-

terantworten. Bewegt sich schließlich, wie in der vierten Zeile zu sehen ist,

das Zentrum der Filtermaske direkt ¨

uber die Position des Eckpunktes, so

ergeben sich, im Vergleich zur idealen Kante, g¨

anzlich andere Filterantwor-

3.2 Detektion von Konturen und Kreuzungspunkten 41

ten. So liegt z. B. der maximale Ausschlag des Eckfilters ¨

uber dem des

Kantenfilters.

Die Kantendetektion der vorliegenden Arbeit beruht auf einem Tracking-

Verfahren, das, ausgehend von einer noch nicht behandelten idealen Kante,

diese fortzusetzen versucht. Hierbei wird zun¨

achst nach einem benachbar-

ten Bildpunkt gesucht, der ebenfalls eine ideale Kante darstellt. Liegt eine

solche nicht vor, wird nach der n¨

achstwahrscheinlichen Filterkombination

gesucht, also nach einem Kantenfiltermaximum mit einem Nulldurchgang

des ZU-Filters, wobei die Betr¨

age des Eckfilters h¨

oher sind als die des Kan-

tenfilters. Liegt auch eine solche Filterkombination nicht vor, werden die

weiteren m¨

oglichen Kombinationen bis hin zu einem einfachen Nulldurch-

gang des ZU-Filters betrachtet. Die Kontursuche endet, wenn keine Fortset-

zung gefunden wird oder das Tracking-Verfahren auf eine schon behandelte

oder die aktuell behandelte Kante trifft. In dem Fall, dass das Tracking-

Verfahren auf eine bereits behandelte Kante trifft, entsteht eine sogenannte

T-Kreuzung, d. h. ein Kantenelement, das drei benachbarte Kantenelemente

aufweist.

3.2.2 Detektion von Kreuzungspunkten

Um Kanten zu vervollst¨

andigen, die durch Verdeckung oder fehlenden Kon-

trast zwischen Vorder- und Hintergrund unterbrochen sind, werden als Aus-

gangspunkt der Vervollst¨

andigung die Positionen der Bildpunkte ben¨

otigt,

die das Ende des realen Konturverlaufs markieren. Im Falle einer Ver-

deckung stellen diese Bildpunkte in der Regel den Kreuzungspunkt zweier

Objektgrenzen dar. Solche Punkte, im Folgenden als Kreuzungspunkte be-

zeichnet, k¨

onnen auf Abbildungsebene sowohl zwei oder drei Konturen tren-

nen oder den Endpunkt einer einzelnen Kontur darstellen. Verschiedene

Konstellationen sind in Abbildung 3.9 exemplarisch dargestellt.

42 3 Bildvorverarbeitung

(a) (b) (c)

Abbildung 3.9: Verschiedene Kreuzungspunkte: (a) Endpunkt,

(b) T-Kreuzung und (c) Eckpunkt.

Eine Linie wie in Abbildung 3.9(a) wird beim Kantentracking-Verfahren ent-

sprechend Kap. 3.2 ¨

uber relative Extrema der ZU-Filterantwort detektiert.

Entsteht das dargestellte Linienende durch Verdeckung, so gibt es drei m¨

og-

liche vom Kreuzungspunkt ausgehende Fortsetzungsrichtungen, die Fortset-

zung der Linie selbst und die Objektgrenze des verdeckenden Objektes, die

sich zu beiden Seiten des Endpunktes erstreckt. Die Linie ist in Abbildung

3.9(a) schwarz dargestellt, die Vervollst¨

andigungsrichtungen dagegen weiß.

Die beiden Richtungen, die die Objektgrenze des verdeckenden Objektes

repr¨

asentieren, sind im eigentlichen Sinn keine Konturfortsetzungen, dienen

aber der Konturvervollst¨

andigung des verdeckenden Objektes und damit der

Scheinkonturwahrnehmung. Es f¨

allt auf, dass diese beiden Vervollst¨

andi-

gungsrichtungen im rechten Winkel zur realen Kontur gew¨

ahlt sind, obwohl

durchaus andere Neigungen denkbar sind. Auch wenn in [GM96] argumen-

tiert wird, dass eine zur unterbrochenen Kontur rechtwinklige Objektgrenze

als am wahrscheinlichsten anzusehen ist, stellt die rechtwinklige Wahl der

Vervollst¨

andigungsrichtungen aber lediglich eine Approximation dar.

Die Richtungen der Konturvervollst¨

andigungen lassen sich aus der Richtung

der Linie ableiten, deren Orientierung sich wiederum aus der Orientierung

der betragsgr¨

oßten Kantenfilterantworten ergibt. Um die Orientierungsge-

nauigkeit zu erh¨

ohen, wird hier, wie auch bei der folgenden Detektion von

3.2 Detektion von Konturen und Kreuzungspunkten 43

T-Kreuzungen und Eckpunkten, eine Schwerpunktbildung zwischen der Fil-

terantwort der betrachteten Orientierung und den Antworten der beiden

benachbarten Orientierungen vorgenommen.

Bei der ¨

Uberlagerung dreier Fl¨

achen mit unterschiedlichem Grauwert ent-

steht eine T-Kreuzung, wie sie in Abbildung 3.9(b) zu sehen ist. Eine

solche T-Kreuzung wird w¨

ahrend des in Kap. 3.2 beschriebenen Tracking-

Verfahrens direkt als Folge der Kantendetektion erkannt. Allerdings liegt

zun¨

achst nur die Position eines Konturpunktes vor, der drei Konturen mit-

einander verbindet. Zur Ermittlung einer T-Kreuzung und damit einer

Vervollst¨

andigungsrichtung m¨

ussen zwei der Konturen einander zugeordnet

werden. Diese beiden Konturen stellen damit im Fall einer Verdeckung die

Kontur der verdeckenden Fl¨

ache dar, w¨

ahrend die dritte Kontur an der

verdeckenden Fl¨

ache endet und durch ihre Richtung die Vervollst¨

andigungs-

richtung vorgibt. Um zwei Konturen einander zuzuordnen, werden die durch

die Kantenfilter gewonnenen Orientierungen aller drei Konturen miteinan-

der verglichen. Die beiden Konturen, deren Orientierungen die geringste

Winkeldifferenz aufweisen, wobei die Winkeldifferenz unter einem Schwell-

wert liegen muss, werden zu einer Kontur zusammengefasst. Der Schwell-

wert wird im Folgenden zu 30◦gew¨

ahlt, was eine gewisse Toleranz gegen¨

uber

Ungenauigkeiten in der Orientierungsbestimmung gew¨

ahrleistet. Liegt keine

der Winkeldifferenzen unter dem Schwellwert, kann keine sinnvolle Aussage

uber die Vervollst¨

andigungsrichtung getroffen werden. Es handelt sich in

diesem Fall um eine sogenannte Y-Kreuzung.

K¨

onnen Endpunkte und T-Kreuzungen noch direkt ¨

uber die Anzahl benach-

barter Konturelemente bestimmt werden, so ist dies f¨

ur einen Eckpunkt, wie

er in Abbildung 3.9(c) dargestellt ist, nicht ohne weiteres m¨

oglich, da sowohl

der Eckpunkt als auch alle Konturelemente, die keinen Kreuzungspunkt dar-

stellen, zwei benachbarte Konturelemente aufweisen. Dar¨

uber hinaus ist zu

beachten, dass ab einer bestimmten Skalierung kein Unterschied mehr be-

steht zwischen einer Ecke und zwei diagonal benachbarten Konturelementen.

Im Kontext dieser Arbeit sind Diskontinuit¨

aten im Orientierungsverlauf von

44 3 Bildvorverarbeitung

(a) (b) (c)

Abbildung 3.10: Filterantworten an einer rechtwinkligen Ecke entsprechend

Abbildung 3.8: (a) Maximum der Betr¨

age der Kantenfilter-

orientierungen, (b) Maximum der Betr¨

age der Eckfilterori-

entierungen, und (c) vorzeichenbehaftete Filterantwort des

ZU-Filters.

Interesse, die einen Hinweis auf unterbrochene Konturverl¨

aufe liefern k¨

on-

nen. Hierbei kommt wieder die Betrachtung der in Kap. 3.1 vorgestellten

Filterantworten zum Tragen.

Betrachtet man die Abbildungen 3.10 und 3.8, so l¨

asst sich feststellen, dass

im Bereich der Ecke die Betragsmaxima der Eckfilter h¨

oher sind als die der

Kantenfilter. Die Ecke liegt also nicht im Bereich einer idealen Kante, wie

sie in Kap. 3.2 definiert wurde. Das intuitive Vorgehen zur Bestimmung der

genauen Position der Ecke k¨

onnte eine Suche nach einem Betragsmaximum

der Eckfilter entlang eines nichtidealen Kantenabschnitts sein. Es zeigt sich

jedoch, dass ein solches Vorgehen bei Eckpunkten, die keinen rechten Winkel

aufweisen, zu Lokalisierungsungenauigkeiten f¨

uhrt. Dagegen f¨

uhrt die Su-

che nach einem Betragsminimum des ZU-Filters entlang eines nichtidealen

Kantenabschnitts unabh¨

angig vom eingeschlossenen Winkel zu zuverl¨

assigen

Ergebnissen. Ein solches Vorgehen schließt jedoch solche stumpfen Winkel

aus, deren Winkelinformation in Zusammenhang mit der Filterung zu ei-

ner idealen Kante f¨

uhrt. Daher findet in einem Nachbearbeitungsschritt

zus¨

atzlich eine Eckensuche ¨

uber ideale Kantenelemente statt, welche eine

3.3 Anisotrope Regularisierung 45

hohe Winkeldifferenz zu ihren beiden Nachbarn aufweisen, in deren weite-

rer Nachbarschaft sich aber hinreichend viele Kantenelemente mit niedriger

Winkeldifferenz befinden. Auch hier ergeben sich die Orientierungen der

Eckpunkte und die daraus folgenden Richtungen m¨

oglicher Fortsetzungen

aus den Orientierungen der betragsgr¨

oßten Kantenfilter in den entsprechen-

den Bildpunkten.

Bezogen auf die Nachbarschaften eines Pixels sind offensichtlich auch Kreu-

zungspunkte denkbar, die bis zu acht Konturen miteinander verbinden. Ein

solcher Fall ist allerdings nicht nur unwahrscheinlich, es ließen sich dar¨

uber

hinaus auch keine sinnvollen Vervollst¨

andigungsrichtungen bestimmen. Im

Rahmen dieser Arbeit werden daher nur Kreuzungspunkte betrachtet, die

maximal drei Kanten miteinander verbinden.

3.3 Anisotrope Regularisierung

Die Idee anisotroper Diffusion in der Bildverarbeitung, also der Diffusion

bzw. Gl¨

attung eines Bildes entlang einer bevorzugten Orientierung, l¨

asst

sich zur¨

uckf¨

uhren auf einen zuerst von Perona und Malik vorgestellten Dif-

fusionsprozess, dessen Diffusionsst¨

arke vom Bildinhalt an der jeweiligen Po-

sition abh¨

angt [PM90]. Das hiermit erzielte nicht homogene Verhalten, wel-

ches von Perona und Malik irref¨

uhrenderweise als anisotrop bezeichnet wird,

erm¨

oglicht die Gl¨

attung eines Bildes mit einer gleichzeitigen Verst¨

arkung sa-

lienter Konturen. Ziel ist es hierbei, im Gegensatz zu einer einfachen gauß-

f¨

ormigen Gl¨

attung, eine von der Skalierung, also der St¨

arke der Gl¨

attung,

unabh¨

angige Lokalisierung von Kanten zu erreichen.

46 3 Bildvorverarbeitung

Dieser Ansatz wird von Weickert aufgenommen [Wei96, Wei99], der wie

Perona und Malik die Diffusionsgleichung

∂u

∂t =∇ · (D∇u) (3.6)

nutzt, wobei er allerdings statt der von Perona und Malik vorgeschlage-

nen skalarwertigen Funktion den richtungsabh¨

angigen Diffusionstensor D

einf¨

uhrt, der aus einer Strukturtensorbeschreibung des Eingangsbildes ge-

wonnen wird, um die lokale Bildstruktur zu beschreiben. Erst durch die

Richtungsabh¨

angigkeit des Diffusionstensors Dund damit durch die Rich-

tungsabh¨

angigkeit der Diffusion selbst kann der Diffusionsprozess im eigent-

lichen Sinn als anisotrop bezeichnet werden. Ein wesentlicher Nachteil der

Strukturtensorbeschreibung, speziell in Verbindung mit einer gaußf¨

ormigen

Gl¨

attung, ist die hohe Orientierungsunsicherheit in der N¨

ahe von Kreuzungs-

punkten.

Auch wenn Diffusionsfilter entsprechend Gleichung (3.6) und eine auf Re-

gularisierungsmethoden basierende Diffusion, wie sie im Folgenden zur Rea-

lisierung einer anisotropen Diffusion entwickelt wird, eng miteinander ver-

kn¨

upft sind, besteht ein wesentlicher Unterschied darin, dass der Skalen-

raum, welcher die gefilterten Bilder f¨

ur s¨

amtliche Gl¨

attungsst¨

arken umfasst,

in Gleichung (3.6) durch die Zeit taufgespannt wird und das Diffusionsfil-

terergebnis f¨

ur eine hohe Skala bzw. mit zunehmenden Zeitwert gegen ein

Bild konvergiert, das an jeder Bildposition den gleichen Grau- bzw. Farb-

wert aufweist und damit die maximale Gl¨

attung des Eingangsbildes darstellt.

Dagegen wird der Skalenraum im folgenden Regularisierungsansatz zur ani-

sotropen Diffusion durch den Gl¨

attungsparameter einer Energie- bzw. Ko-

stenfunktion, die es zu minimieren gilt, aufgespannt.

3.3 Anisotrope Regularisierung 47

Obwohl zahlreiche regularisierungsbasierte Methoden im Bereich der digi-

talen Bildverarbeitung existieren (siehe z. B. [IK99, Nor89, ABBFC97] und

enthaltene Verweise), wird in der Regel weder ein klarer und einfach zu im-

plementierender Ansatz zur anisotropen Diffusion pr¨

asentiert, noch ist die

Problematik so formuliert, dass die Existenz und Eindeutigkeit der L¨

osung

gew¨

ahrleistet ist. In [ABBFC97] wird die ¨

Uberlegenheit sogenannter kan-

tenerhaltender Modelle gegen¨

uber quadratische Regularisierung postuliert,

wie im Folgenden aber gezeigt wird, kann eine kantenerhaltende Diffusion

durchaus als quadratische Regularisierung formuliert werden (vgl. [HM08]).

Hierzu wird ein quadratischer Kostenterm definiert, der Bedingungen an

den Diffusionsprozess enth¨

alt und dessen Minimum eine optimale Erf¨

ullung

dieser Bedingungen darstellt.

3.3.1 Minimierung einer globalen Kostenfunktion

Zun¨

achst sei mdie Anzahl der Pixel eines Bildes, welche von links oben

nach rechts unten zeilenweise durchnummeriert werden. Weiterhin sei ddie

Anzahl der Farbkan¨

ale des Bildes, d. h. d= 1 im Falle eines Grauwertbil-

des und d= 3 f¨

ur ein RGB-Farbbild. Einem Bildpunkt x∈[1,...,m] und

einem Farbkanal k∈[1,...,d] wird der Farbwert ξ(x,k)zugeordnet. Der in-

itiale Farbwert des urspr¨

unglichen Eingangsbildes sei mit ξ(x,k)0bezeichnet.

Weiter seien die Farbwerte in einem Vektor

ξ= (ξ(1,1),...,ξ(m,1), ξ(1,2),...,ξ(m,d))T(3.7)

zusammengefasst. F¨

ur das urspr¨

ungliche Bild gilt analog ξ0∈Rm·dmit

ξ0= (ξ(1,1)0,...,ξ(m,1)0, ξ(1,2)0,...,ξ(m,d)0)T(3.8)

48 3 Bildvorverarbeitung

Wahl der Kostenfunktion

Eine kantenerhaltende Gl¨

attung des Eingangsbildes basiert auf der An-

nahme, dass benachbarte Bildpunkte, die gemeinsam auf einer Objektober-

fl¨

ache liegen, ann¨

ahernd gleiche Farbwerte aufweisen. Nur an Objektgrenzen

treten Diskontinuit¨

aten des Farbverlaufs auf. Eine solche Bedingung l¨

asst

sich durch einen ersten Kostenterm der Form

P1(ξ) = c1

4·

k=1

i=1 X

j∈Ui

wij(ξ(i,k)−ξ(j,k))2(3.9)

formulieren, der Kosten verursacht, falls benachbarte Pixel ungleiche Farb-

werte aufweisen. Dabei stellt zu einem gegebenen Bildpunkt xdie Menge Ux

eine quadratische Nachbarschaft des Bildpunktes dar, die den Punkt xselbst

nicht enth¨

alt. Die Konnektivit¨

at des Bildpunktes xmit einem benachbarten

Bildpunkt ikann ¨

uber den Gewichtungsfaktor wxi >0 gesteuert werden, wo-

bei die Gewichte nicht notwendigerweise symmetrisch sein m¨

ussen, d. h. im

Allgemeinen gilt wxi 6=wix. Um sp¨

ater die numerische Stabilit¨

at des Itera-

tionsverfahrens, das zur L¨

osung genutzt wird, zu gew¨

ahrleisten, wird f¨

ur die

Summe der Gewichte der Umgebung Uxeines Bildpunktes x

i∈Ux

wxi ≤Q:= X

i∈Ux

1 (3.10)

gefordert. Der Wert Qstellt hierbei die Anzahl der in der Umgebung Ux

enthaltenen benachbarten Bildpunkte dar. In Verbindung mit weiteren Ko-

stentermen dient der Gl¨

attungsfaktor c1der Steuerung des Einflusses des

Gl¨

attungsterms.

Betrachtet man den Kostenterm in Gleichung (3.9), so l¨

asst sich feststellen,

dass alle Bilder, die in jedem Bildpunkt den gleichen konstanten Farbwert

aufweisen, den Kostenterm minimieren. Es existieren also mehrere Minima

und damit keine eindeutig bestimmte L¨

osung. Um die Abh¨

angigkeit des

3.3 Anisotrope Regularisierung 49

gegl¨

atteten Bildes ξvom Ursprungsbild ξ0in die Kostenformulierung zu

integrieren, wird nun weiterhin gefordert, dass Kosten versursacht werden,

falls ein Farbwert ξ(x,k)von seinem initialen Wert ξ(x,k)0abweicht. Der

entsprechende Kostenterm lautet

P2(ξ) = c2·1

2·

k=1

i=1

(ξ(i,k)−ξ(i,k)0)2(3.11)

Auch hier dient der Faktor c2dazu, den Einfluss des Kostenterms zu steu-

ern. Die Zusammenfassung der in Gleichung (3.9) und in Gleichung (3.11)

geforderten Bedingungen ergibt nun eine globale Kostenfunktion P, deren

Minimierung zu einem entsprechend der gew¨

ahlten Gewichtungsfaktoren ge-

gl¨

atteten Bild f¨

uhrt. Bei nur zwei Bedingungen kommt es lediglich auf das

Verh¨

altnis der Gewichtungsfaktoren c1und c2an, der Faktor c2kann also

ohne Beschr¨

ankung der Allgemeinheit auf den Wert c2= 1 gesetzt werden.

Ubrig bleibt nur ein Skalierungs- bzw. Gl¨

attungsfaktor c=c1.

P(ξ) = P1+P2

2·

k=1

i=1

(ξ(i,k)−ξ(i,k)0)2

4·

k=1

i=1 X

j∈Ui

wij(ξ(i,k)−ξ(j,k))2(3.12)

F¨

ur die partielle Ableitung nach einem Farbwert ξ(x,k)gilt

50 3 Bildvorverarbeitung

∂

∂ξ(x,k)

P(ξ) = ξ(x,k)−ξ(x,k)0

2(X

j∈Ux

wxj(ξ(x,k)−ξ(j,k))

{i|x∈Ui}

wix (ξ(x,k)−ξ(i,k))´(3.13)

Durch die Wahl der Potentialfunktion muss mindestens ein Minimum von

Pexistieren. Ein notwendiges Kriterium an ein Minimum von Pist durch

∇P(ξ) = 0, also

∂

∂ξ(x,k)

P(ξ) = 0 ∀ξ(x,k)(3.14)

gegeben. Hieraus ergibt sich das lineare Gleichungssystem

∇P(ξ) = A·ξ−ξ0=0.(3.15)

Die Matrix Ain Gleichung (3.15) l¨

asst sich darstellen durch

A= (ai,j)i,j ∈R(m·d)×(m·d)mit

ai,j =8

1 + c

2· X

wik +X

wki!f¨

ur i=j

−c

2·(wji +wij) sonst

(3.16)

Hierbei gilt wij = 0 f¨

ur j /∈Ui. Weiterhin gilt wii = 0, wij =w(i+d)(j+d)

und j /∈Ui, falls die Indizes iund jaus unterschiedlichen Farbkan¨

alen

stammen. Offensichtlich ist die Matrix Asymmetrisch und mit hAξ,ξi>0

f¨

ur ξ6=0folgt die positive Definitheit von A. Die Matrix ist damit regul¨

ar,

3.3 Anisotrope Regularisierung 51

es existiert eine eindeutig bestimmte L¨

osung von Gleichung (3.15) und somit

ein eindeutig bestimmtes Minimum von P[ZF84, Sch68].

Numerische Aspekte

L¨

osungen zur Bestimmung eines Minimums der Potentialfunktion Pbasie-

ren im Allgemeinen auf der Idee des Gradienten- oder des Newtonverfahrens

[Mei99]. Aufgrund der Regularit¨

at der Matrix Ain Gleichung (3.15) ließe

sich die L¨

osung der Gleichung theoretisch auch durch ein direktes Verfahren

bestimmen. Allerdings ist die Matrix Aschwachbesetzt, d. h. ein direk-

tes Verfahren k¨

onnte die besondere Gestalt der Matrix nicht ausnutzen und

w¨

urde vollbesetze Zwischenmatrizen generieren, was den Speicherplatzbe-

darf im Vergleich zur Speicherung des Vektors ξquadrieren w¨

urde. Die

Menge der zu bestimmenden Elemente w¨

urde dar¨

uber hinaus eine erh¨

ohte

Berechnungszeit nach sich ziehen.

F¨

ur den hier vorgestellten Diffusionsprozess wird das Gradientenverfahren

zur Bestimmung des Minimums herangezogen [Hun02, HM08]. Beim klas-

sischen Gradientenverfahren wird die Minimall¨

osung einer stetig differen-

zierbaren Funktion P:Rn→Rbestimmt, indem, ausgehend von einem

Startvektor, ein Versuchsvektor ξkiterativ in die lokal optimale Richtung

dkkorrigiert wird. In vielen iterativen Anwendungen wird keine theoretische

Konvergenzbedingung, die ein Erreichen einer L¨

osung durch das Iterations-

verfahren garantiert, angegeben. Bei jeder ¨

Anderung der Systemparameter

muss daher in solchen F¨

allen die Schrittweite experimentell angepasst wer-

den (vgl. [PM90, SW00, ABBFC97, Nor89]).

Die lokal optimale Richtung dkwird als Richtung des steilsten Abstiegs

bezeichnet und ist durch den negativen Gradienten von P gegeben, dk=

−∇P(ξk). Ist die Funktion Pan einer Stelle ξin eine Richtung ddiffe-

renzierbar und besitzt dort eine positive Richtungsableitung, so wird dals

Abstiegsrichtung von P im Punkt ξbezeichnet [Kos93]. L¨

asst man hier

auch andere Abstiegsrichtungen als die des Gradienten von Pzu, so wird

52 3 Bildvorverarbeitung

ξk+1

ξk+2

ξk

Abbildung 3.11: H¨

ohen- bzw. ¨

Aquipotentiallinien einer Potentialfunktion

Pund qualitativer Konvergenzverlauf bei lokal optimaler

Wahl der Schrittweite entsprechend Gleichung (3.18) (nach

[Mei99, Hun02]).

das Verfahren als verallgemeinertes Gradientenverfahren bezeichnet. F¨

die Iteration des klassischen Gradientenverfahren gilt mit einer positiven

Schrittweite λk

ξk+1 =ξk−λk∇P(ξk), λk>0 (3.17)

F¨

ur die Bestimmung der Schrittweite λksind in der Literatur zahlreiche An-

s¨

atze zu finden (siehe z.B. [Mei99, Sch68, Kos93]). Besitzt die Funktion P

auf der durch die Abstiegsrichtung dkbestimmten Halbgerade ein eindeu-

tiges Minimum, so gew¨

ahrleistet die Regel der optimalen Schrittweite eine

Konvergenz des Verfahrens gegen ein Minimum von P. Ein besonderer Fall

ist bei einem Gradienten entsprechend Gleichung (3.15) mit symmetrischer,

positiv definiter Matrix Agegeben. Die lokal optimale Schrittweite ergibt

sich dann aus

3.3 Anisotrope Regularisierung 53

(a) (b) (c)

Abbildung 3.12: Dynamik einer Variablenschar mit (a) variabler Schritt-

weite, (b) konstanter Schrittweite und (c) konstanter

Schrittweite mit dem Nullvektor als Startvektor (aus

[Hun02])

λk=hrk,rki

hArk,rki(3.18)

mit dem sogenannten Residuenvektor

rk=−∇P(ξk) = ξ0−Aξk(3.19)

F¨

ur die H¨

ohenlinien einer Potentialfunktion Pergibt sich bei einer solchen

Wahl der Schrittweite der in Abbildung 3.11 dargestellte Verlauf.

Eine weitere M¨

oglichkeit zur Wahl von λkbesteht darin, eine konstante

Schrittweite λk=λzu w¨

ahlen. Wie in Abbildung 3.11 zu sehen ist, stellt die

lokal optimale Schrittweite nicht unbedingt eine global optimale Schrittweite

dar (vgl. [Mei99]). Dar¨

uber hinaus muss eine Schrittweite gem¨

aß Gleichung

(3.18) in jeder Iteration neu berechnet werden. Die Wahl einer konstanten

Schrittweite besitzt daher ihre Berechtigung, was auch in den Abbildun-

gen 3.12(a) und 3.12(b) festzustellen ist. Die in Abbildung 3.12(a) darge-

stellte Variablenschar, die die Dynamik der Werteverl¨

aufe bei Minimierung

einer Kostenfunktion entsprechend Gleichung (3.12) mit einer lokal opti-

54 3 Bildvorverarbeitung

malen Schrittweite entsprechend Gleichung (3.18) darstellt, weist ein hohes

Maß an Oszillation auf. Die mit einer konstanten Schrittweite bestimmten

Variablenwerte in Abbildung 3.12(b) ver¨

andern sich dagegen bereits nach

der achten Iteration nur noch unwesentlich.

Um eine konstante Schrittweite w¨

ahlen zu k¨

onnen, muss jedoch sichergestellt

sein, dass das Iterationsverfahren tats¨

achlich gegen das Minimum von P

konvergiert. Hierzu werden zun¨

achst einige Definitionen eingef¨

uhrt [Mei99].

Betrachtet wird ein lineares Gleichungssystem der Form Ax =b.

Ein Iterationsverfahren φ:Rn×Rn→Rnwird als linear bezeichnet, falls

Matrizen M,N∈Rn×nexistieren, so dass

φ(x,b) = Mx +Nb (3.20)

gilt [Mei99, Hun02]. Das Verfahren heißt konsistent zur Matrix A, wenn

f¨

ur alle b∈Rndie L¨

osung A−1bein Fixpunkt von φzu bist. Ein lineares

Iterationsverfahren ist genau dann konsistent zur Matrix A, wenn

M=I−NA (3.21)

gilt. Weiterhin ist das Verfahren genau dann konvergent, wenn der Spek-

tralradius ρ(M) der Iterationsmatrix Mdie Bedingung

ρ(M)<1 (3.22)

erf¨

ullt. Ist φein konvergentes und zur Matrix Akonsistentes lineares Ite-

rationsverfahren, so erf¨

ullt das Grenzelement der Folge xk=φ(xk−1,b) f¨

jeden Startvektor x0∈Rndas Gleichungssystem Ax =b.

3.3 Anisotrope Regularisierung 55

Betrachten wir nun das Gleichungssystem (3.15) und das Iterationsverfahren

(3.17) mit konstanter Schrittweite λk=λ, so folgt mit N=λIund M=I−

NA die Linearit¨

at und die Konsistenz des Iterationsverfahrens zur Matrix

Es bleibt zu zeigen, unter welchen Bedingungen die Schrittweite λdie Be-

dingung ρ(M)<1 erf¨

ullt und somit die Konvergenz des Verfahrens sichert.

Hierzu wird die Eigenschaft ρ(M)≤ kMkf¨

ur jede Matrixnorm kkausge-

nutzt [Mei99].

Sei

Qi=1

k=1

(wik +wki),(3.23)

wobei wieder wij = 0 f¨

ur j /∈Uiund f¨

ur i=jgelte. Sei ferner Qdie

maximale Anzahl der Pixel in einer Nachbarschaft U. Aus Gleichung (3.10)

folgt damit Q > Qi∀i.

Die Bedingung (3.22) ist erf¨

ullt, wenn kMk<1 gilt. Unter Verwendung

der Zeilensummennorm kk∞ergibt sich die Bedingung

m·d

k=1

|mik|<1 f¨

ur jede Reihe i(3.24)

Hieraus folgt mit Beziehung (3.16)

|1−λ(1 + c·Qi)|+λ·c·Qi<1 (3.25)

und damit

0< λ < 2

1 + 2 ·c·Qi

(3.26)

56 3 Bildvorverarbeitung

Im Folgenden wird, um die Konvergenzbedingung (3.26) zu erf¨

ullen, die

Schrittweite λzu

λ=1

1 + c·Q(3.27)

gew¨

ahlt. Mit

1 + c·Q<2

1 + 2 ·c·Q≤2

1 + 2 ·c·Qi

(3.28)

ist gew¨

ahrleistet, dass die in Gleichung (3.26) gegebene Konvergenzbedin-

gung erf¨

ullt ist.

Damit ergibt sich eine konstante Schrittweite, die nur von der Skalierung

bzw. dem Gl¨

attungsfaktor cund der Gr¨

oße Qder betrachteten Pixelnach-

barschaften abh¨

angt. Hierbei ist der Unterschied zu beachten zwischen dem

Startvektor des Iterationsverfahrens und dem urspr¨

unglichen Bild ξ0. Die

L¨

osung der Gleichung (3.15) ist unabh¨

angig vom Startvektor, wie in Ab-

bildung 3.12(c) zu sehen ist, der Startvektor hat lediglich Einfluss auf die

ben¨

otigten Iterationen, die zum Erreichen der L¨

osung notwendig sind. Da-

gegen h¨

angt die L¨

osung vom Eingangsbild ξ0ab, so dass, wie wiederum in

Abbildung 3.12(c) dargestellt ist, die L¨

osung auch dann erreicht wird, wenn

der Nullvektor als Startvektor genommen wird. Da aber offensichtlich das

Eingangsbild eine gute N¨

aherung an die gew¨

unschte L¨

osung darstellt, ist es

in der Regel sinnvoll, das Bild ξ0als Startvektor zu verwenden.

Der Vollst¨

andigkeit halber sei hier auf die Vielzahl weiterer iterativer Ver-

fahren zur L¨

osung von Gleichung (3.15) hingewiesen, insbesondere ist in

diesem Zusammenhang das Verfahren der konjugierten Gradienten zu nen-

nen [Mei99, Kos89, Sch68].

3.3 Anisotrope Regularisierung 57

3.3.2 Diffusion

Isotrope Diffusion

Im einfachsten Fall werden in einer quadratischen Nachbarschaft Uieines

Pixels idie Gewichtungsfaktoren symmetrisch zu

wij =wji = 1 (3.29)

gew¨

ahlt. Gleichung (3.13) vereinfacht sich dann zu

∂

∂ξ(x,k)

P(ξ) = ξ(x,k)−ξ(x,k)0

+cX

j∈Ux

(ξ(x,k)−ξ(j,k)) (3.30)

Dies erzeugt eine ungerichtete, also linear isotrope Diffusion des Eingangs-

bildes und stellt somit den klassischen Fall einer einfachen Gl¨

attung dar.

Sowohl die isotrope Diffusion als auch ein Ansatz zur anisotropen Diffusion

mit symmetrischen Gewichten, d. h. wij =wji, wurden bereits in [Hun02,

HBD03, BHM04b, BHM04a, BHM05] im Kontext stereoskopischer Korre-

spondenzbestimmung genutzt. Dabei dienten Gleichung (3.30) bzw. (3.17)

dazu, Zuordnungsmehrdeutigkeiten in einem stereoskopischen Disparit¨

ats-

raum aufzul¨

osen.

Abbildung 3.13 verdeutlicht die Eigenschaften linearer isotroper Diffusion,

wiederum am Beispiel des Lena-Bildes. Mit zunehmenden Gl¨

attungspara-

meter cwird das Eingangsbild richtungsunabh¨

angig gegl¨

attet, bis s¨

amtliche

Bilddetails verschwunden sind.

58 3 Bildvorverarbeitung

(a) (b) (c) (d)

Abbildung 3.13: Linearer isotroper Skalenraum f¨

ur das Lena-Bild: (a) c=1,

(b) c=3, (c) c=20 und (d) c=250.

Anisotrope Diffusion

Ein wichtiger Vorteil der Formulierung des Diffusionsprozesses in Gleichung

(3.12) ist die Tatsache, dass unter Beibehaltung der Bedingung (3.10) die Ge-

wichtungsfaktoren beliebig gew¨

ahlt werden k¨

onnen, ohne dass die Existenz

oder die Eindeutigkeit der L¨

osung verloren geht. Um eine anisotrope Diffu-

sion, also eine gerichtete Gl¨

attung des Eingangsbildes zu erreichen, wird die

folgende Umfeldgewichtung eines gegebenen Pixels eingef¨

uhrt. Hierzu wer-

den zu jedem Pixel die Orientierungen betrachtet, die sich aus Anwendung

der in Kap. 3.1 vorgestellten orientierungsselektiven Kantenfilter ergeben.

In Abh¨

angigkeit des Orientierungswinkels eines gegebenen Pixel ifindet eine

Rotation des quadratischen Umfeldes Uistatt. Wird hierbei ein Punkt jdes

Umfeldes auf die Koordinaten (x, y) abgebildet, so ergibt sich der Gewich-

tungsfaktor wij des entsprechenden Umfeldpixels durch die folgende Funk-

tion:

f(x, y) = 8

0 f¨

ur y > 0.7

1.0 + cos “π·y

0.7”sonst (3.31)

3.3 Anisotrope Regularisierung 59

(a) (b) (c) (d)

Abbildung 3.14: Anisotroper Skalenraum f¨

ur das Lena-Bild mit 20% un-

korreliertem Rauschen f¨

ur jedes Pixel des Eingangsbildes:

(a) Eingangsbild, (b) c=3, (c) c=20 und (d) c=250.

Gleichung (3.31) gew¨

ahrleistet eine strikte Diffusion entlang einer Richtung.

Eine st¨

arkere Kopplung von Bildpunkten, deren Verbindung nicht parallel

zu einer durch den Orientierungswinkel charakterisierten Geraden verl¨

auft,

l¨

asst sich erreichen, indem entweder die Funktion in Gleichung (3.31) in

positive y-Richtung verschoben wird oder die Konstante 0.7 erh¨

oht wird.

Es gilt

Qi=1

(wik +wki)< Q, (3.32)

womit entsprechend Gleichung (3.28) die Konvergenz des Verfahrens gesi-

chert ist. Die Funktion (3.31) ist also wohldefiniert.

Abbildung 3.14 zeigt das Verhalten des anisotropen Diffusionsprozesses.

Jetzt wird zu jedem Pixel des Eingangsbildes 20% unkorreliertes Rauschen

addiert. Betrachtet man den Skalenraum, so f¨

allt auf, dass f¨

ur c→ ∞,

anders als im Fall linearer isotroper Diffusion, eine lokale Nachbarschaft de-

finiert werden kann, f¨

ur die das Verfahren nicht gegen einen f¨

ur alle Pixel

identischen, konstanten Farbwert konvergiert.

60 3 Bildvorverarbeitung

3.3.3 Selbstorganisation der Kanteninformation

Wie schon erw¨

ahnt, werden die ben¨

otigten Orientierungswinkel zur Bestim-

mung der Gewichtungsfaktoren wij ¨

uber die Filterergebnisse gaußf¨

ormiger

Filtermasken gewonnen. Auch bei großen Filtermasken bleibt jedoch eine

gewisse Empfindlichkeit gegen¨

uber Rauschprozessen gegeben. Um diesem

Problem Rechnung zu tragen, l¨

asst sich die anisotrope Regularisierung, wie

sie in Kap. 3.3.1 beschrieben wird, auch f¨

ur die von den Filterantworten

generierte Gradientenkarte nutzen [HM08].

Das bedeutet, dass Gleichung (3.12) f¨

ur dneu =d+ 2 auf die Kanteninfor-

mation in Form einer Gradientenkarte angewandt wird. Die Gradienten-

karte wird hierbei nach den eigentlichen Farbwerten in die letzten beiden

Schichten, d. h. die durch d+ 1 und d+ 2 charakterisierten Schichten des

Bildvektors

ξ= (ξ(1,1),...,ξ(m,d), ξ(1,d+1),...,ξ(m,d+1), ξ(1,d+2),...,ξ(m,d+2))T(3.33)

geschrieben. Die Werte der Gradientenkarte werden durch

ξ(x,d+1) =|∇gx| · cos(2 ·αx) (3.34)

und

ξ(x,d+2) =|∇gx| · sin(2 ·αx) (3.35)

f¨

ur eine Bildposition x∈[1,...,m] beschrieben. Hierbei stellt |∇gx|das

Betragsmaximum der Kantenfilter dar, w¨

ahrend αxdie vom betragsgr¨

oßten

Kantenfilter repr¨

asentierte Orientierung an der Bildposition xdarstellt. Die

urspr¨

unglichen Werte werden wieder in einem Vektor ξ0zusammengefasst.

Da die Orientierungen der Kantenfilter hier lediglich in einem Bereich von

3.3 Anisotrope Regularisierung 61

0 bis πbetrachtet werden, gew¨

ahrleistet der Faktor 2 in den Gleichungen

(3.34) und (3.35), dass auch an den Bereichsgrenzen eine kontinuierliche

Gl¨

attung der Gradientenkarte stattfindet.

W¨

ahrend des Iterationsprozesses wird nun Gleichung (3.12) in jedem Iterati-

onsschritt neu formuliert, derart, dass zu jedem Bildpunkt xaus den Werten

ξ(x,d+1) und ξ(x,d+2) aus den Gleichungen (3.34) und (3.35) der Winkel αx

neu gebildet wird. Gerade der Winkel αxist aber durch die Rotation der

Umfeldkoordinaten und damit durch die Bestimmung der Gewichtungsfakto-

ren wij ausschlaggebend f¨

ur die Form des koppelnden Umfelds eines Pixels.

Es werden somit also in jedem Iterationsschritt die Gewichtungsfaktoren in

Gleichung (3.12) in Abh¨

angigkeit des Vektors ξaktualisiert. Durch einen

nachfolgenden Iterationsschritt des Gradientenverfahrens wird wiederum der

Vektor ξin Abh¨

angigkeit der Gleichung (3.12) und damit in Abh¨

angigkeit

der Gewichtungsfaktoren aktualisiert.

Hierdurch ergibt sich ein dynamischer Selbstorganisationsprozess der Kan-

teninformation, der zu einer Verst¨

arkung salienter Konturen f¨

uhrt. Dies ist

in Abbildung 3.15 verdeutlicht. Die pr¨

asentierten Resultate wurden mit ei-

nem Kopplungsparameter c= 6, einem quadratischen Kopplungsumfeld von

7×7 Pixeln und 100 Iterationen berechnet. Das Eingangsbild 3.15(a), drei

Kieselsteine auf Pflastersteinen, ist ein Testbild aus dem Kontext der Ver-

st¨

arkung salienter Konturen (vgl. [MWTX03]) und weist im Bereich der Pfla-

stersteine einen stark texturierten Bereich mit hochfrequenten Bildanteilen

auf. Die Filterergebnisse setzen sich aus 24 unterschiedlich orientierten Kan-

tenfiltern mit einem Filterradius von jeweils sieben Pixeln zusammen, was

einer Filtermaske von 14 ×14 Pixeln entspricht. Trotzdem lassen sowohl die

Betragsmaxima der Kantenfilter in Abbildung 3.15(e) als auch die Winkel-

information in Abbildung 3.15(c) erkennen, dass die hochfrequenten Bildan-

teile ein korrektes Erkennen der Konturen der Kieselsteine und der Pfla-

stersteine erschweren. Die Textur stellt hierbei im eigentlichen Sinne kein

Rauschen dar, da die hochfrequenten Bildanteile durch sich in dem Beton

befindliche kleinere Steine erzeugt werden und somit Teil des Signals sind.

62 3 Bildvorverarbeitung

(a) (b)

(e) (f)

Abbildung 3.15: Testbild mit drei Kieselsteinen auf Pflastersteinen

(aus [MWTX03]): (a) und (b) Grauwerte des Testbildes,

maximum |∇gx|der Kantenfilter, jeweils vor und nach der

Selbstorganisation der Gradientenkarte.

3.3 Anisotrope Regularisierung 63

Dennoch ist es in Bildverarbeitungsprozessen w¨

unschenswert, Signalanteile

auszublenden, die aufgrund des betrachteten Maßstabs bzw. entsprechend ei-

ner gew¨

unschten Skalierung keinen Beitrag zu weiteren Verarbeitungsschrit-

ten leisten. Im Fall der Abbildung 3.15 ist es also sinnvoll, Bildinformation

einer kleineren Skalierung zu eliminieren, um verl¨

assliche Kanteninformatio-

nen ¨

uber Objekte in der Gr¨

oßenordnung der drei Kieselsteine zu erhalten.

Wie in Abbildung 3.15(f) zu sehen ist, f¨

uhrt der beschriebene Selbstorga-

nisationsprozess der Gradientenkarte zu solch einem Ergebnis. Dargestellt

ist zu jedem Bildpunkt xdie euklidische Norm k(ξ(x,d+1), ξ(x,d+2))k2der

entsprechenden Werte der Gradientenkarte. Der Winkel, welcher sich nach

dem Selbstorganisationsprozess zu jedem Bildpunkt aus den Werten ξ(x,d+1)

und ξ(x,d+1) ergibt, ist in Abbildung 3.15(d) dargestellt. Auch die Grau-

werte selbst verdeutlichen, dass das Bild auf wesentliche Elemente reduziert

wird. In Abbildung 3.15(b), die die Bildwerte nach Selbstorganisationspro-

zess zeigt, sind die hochfrequenten Bildanteile herausgefiltert, die Position

und Form wesentlicher Konturelemente hat sich im Gegensatz zum Ergebnis

einfacher Gl¨

attungsfilter jedoch nicht ver¨

andert.

Da durch dieses Vorgehen die Systemmatrix Adurch die Winkelabh¨

angig-

keit der Umfeldkopplung vom Zustandsvektor ξabh¨

angt, A=A(ξ), er-

gibt sich ein nichtlineares System, wobei allerdings aufgrund der Wahl der

Schrittweite λin Gleichung (3.27) in jedem Iterationsschritt eine Kontrak-

tion vorliegt. F¨

ur den Spektralradius gilt nach wie vor f¨

ur jede Iteration

ρ(M(ξ)) <1, womit die Iteration gegen einen Fixpunkt konvergiert.

Um eine Verst¨

arkung der Diskontinuit¨

aten entlang von Konturverl¨

aufen zu

erreichen, ist es m¨

oglich, die Gewichtungsfaktoren wij benachbarter Bild-

punkte iund jzu Null zu setzen, falls diese sich in ihrem Farbwert minde-

stens um einen Schwellwert sunterscheiden, d. h. falls |ξ(i,k)−ξ(j,k)|< s

gilt. Es geht dabei allerdings die Eindeutigkeit der L¨

osung verloren, das Er-

gebnis des Iterationsverfahrens h¨

angt stark vom Startvektor ab. Eine gute

Wahl f¨

ur den Startvektor ist der Nullvektor oder eine gegl¨

attete Version

des Eingangsbildes. Wird dagegen das Ursprungsbild ξ0als Startvektor

64 3 Bildvorverarbeitung

(a) (b)

Abbildung 3.16: Steine-Testbild: (a) Eingangsbild (b) Ergebnis der aniso-

tropen Regularisierung, (c) Ergebnis anisotroper Regulari-

sierung mit Selbstorganisation der Gradientenkarte entspre-

chend Abbildung 3.15 und (d) Ergebnis anisotroper Regu-

larisierung mit Selbstorganisation der Gradientenkarte und

Unterdr¨

uckung der Kopplung bei Erreichen eines Schwell-

werts von s= 5.

genommen, so ergibt sich f¨

ur einen kleinen Schwellwert selbst bei hohem

Koppungsparameter kaum ein Effekt. Der Einfluss des Schwellwertes ist in

Abbildung 3.16 dargestellt. W¨

ahrend das Ergebnis der anisotropen Regula-

risierung in Abbildung 3.16(b) und das Ergebnis anisotroper Regularisierung

mit Selbstorganisation der Gradientenkarte in Abbildung 3.16(c) mit den

oben beschriebenen Parametern berechnet wurden, wurde f¨

ur das Ergebnis

schwellwertabh¨

angiger Umfeldkopplung in Abbildung 3.16(d) der Nullvek-

3.3 Anisotrope Regularisierung 65

tor als Startvektor mit einer Iterationsanzahl von 500 gew¨

ahlt. Es ist zu

erkennen, dass hier die Grenzen zwischen zwei Fl¨

achen im Bereich salienter

Konturen durch eine st¨

arkere Diskontinuit¨

at des Grauwertverlaufs noch kla-

rer hervortreten. Weiterhin l¨

asst sich feststellen, dass kleinere Gebiete, die

einen starken Grauwertunterschied zu ihrer Umgebung aufweisen, speziell

f¨

ur kleine Schwellwerte sdie Tendenz zeigen, nicht durch den Diffusions-

prozess aufgel¨

ost zu werden, was je nach Anwendung durchaus unerw¨

unscht

sein kann.

66 3 Bildvorverarbeitung

4 Bestimmung m¨

oglicher

Konturvervollst¨

andigungen

Durch die in Kap. 3 beschriebene Vorverarbeitung stehen zu s¨

amtlichen

Kreuzungspunkten sowohl die Bildkoordinaten als auch die Richtungen zur

Verf¨

ugung, in die die m¨

ogliche Fortsetzung einer unterbrochenen Kontur ver-

l¨

auft. Ziel ist es nun, Kreuzungspunkte, die nach den Gestaltprinzipien der

N¨

ahe und der guten Fortsetzung mit aller Wahrscheinlichkeit Teil derselben

Kontur sind, in geeigneter Weise miteinander zu verbinden. Hierzu werden

zwei Mechanismen betrachtet, zum einen das bereits in Kap. 2 angespro-

chene Tensor Voting Verfahren und zum anderen eine Spline-Interpolation

des Verbindungsweges. Besondere Beachtung findet hierbei die Betrachtung

der Bedingungen, unter denen zwei Kreuzungspunkte miteinander verbun-

den werden sollten. Ein Vergleich der beiden alternativen Vorgehensweisen

findet in Kap. 6 statt.

4.1 Konturvervollst¨

andigung durch Tensor Voting

In [MLT00] beschreiben Medioni, Lee und Tang eine als Tensor Voting be-

zeichnete Methode zur Merkmalsverst¨

arkung auf d¨

unn besetzten und ver-

rauschten Eingabedaten. Das wesentliche Merkmal ist hierbei die Beschrei-

bung von Bild- bzw. Kantenelementen als Tensoren.

4.1.1 Repr¨

asentation von Konturelementen durch Tensoren

Im zweidimensionalen Fall kann ein Tensor ¨

uber R2durch eine symmetri-

sche 2×2 Matrix Tmit zwei zueinander rechtwinkligen Eigenvektoren e1,e2

68 4 Bestimmung m¨

oglicher Konturvervollst¨

andigungen

und zwei entsprechenden reellen Eigenwerten λ1> λ2beschrieben werden.

Ein Tensor, welcher ein Kurvenelement repr¨

asentiert, l¨

asst sich im zwei-

dimensionalen Fall als eine Ellipse darstellen (vgl. Abbildung 4.1), wobei

die Hauptachse die Richtung e1der Tangente an die Kurve angibt und die

L¨

ange λ1die Salienz bzw. St¨

arke dieser Richtung repr¨

asentiert. Die L¨

ange

λ2, welche dem zweiten Eigenvektor λ2zugeordnet ist, stellt ein Maß f¨

die Orientierungsunsicherheit an der entsprechenden Bildposition dar, wie

sie z.B. an Eckpunkten auftritt.

λ1

λ2

Abbildung 4.1: Visualisierung eines Tensors als Ellipse.

Die Definition der Salienzmaße ergibt sich aus der spektralen Dekomposition

des Tensors durch

T=λ1e1e>

1+λ2e2e>

2(4.1)

bzw.

T= (λ1−λ2)e1e>

1+λ2(e1e>

1+e2e>

2).(4.2)

Der Faktor (λ1−λ2) repr¨

asentiert hierbei die Orientierungssicherheit in

Richtung des Eigenvektors und wird daher als Kurvensalienz bzw. Sticksa-

lienz bezeichnet. Bei maximaler Orientierungsunsicherheit gilt λ1=λ2und

die Ellipse wird zu einem Kreis. Der Faktor λ2wird daher als Ballsalienz be-

zeichnet. Er gibt also ein Maß f¨

ur die Orientierungsunsicherheit, speziell an

Kreuzungspunkten, an. Es ist allerdings zu beachten, dass im Bereich von

4.1 Konturvervollst¨

andigung durch Tensor Voting 69

Kreuzungspunkten die Tensorrepr¨

asentation weder geeignet ist, die minde-

stens zwei unterschiedlichen auftretenden Orientierungen zu repr¨

asentieren,

noch stellt sie aufgrund der Orientierungsabh¨

angigkeit ein verl¨

assliches Maß

f¨

ur Kreuzungspunkte dar [MBM03], wie sp¨

ater erl¨

autert wird.

4.1.2 Tensorkommunikation

Die Gruppierung von Merkmalselementen kann nun als Kombination der

Elemente in Abh¨

angigkeit ihrer Stick- bzw. Ballsalienz realisiert werden.

Beim sogenannten Stick Voting wird von jedem orientierten Eingangsele-

ment ein als Stick-Votingfeld bezeichnetes Tensorfeld entsprechend der Rich-

tung des Eigenvektors e1auf die Ergebniskarte addiert. F¨

ur die hier betrach-

tete Anwendung der Konturvervollst¨

andigung verdeckter Konturen bestehen

die Eingangselemente aus Tensoren, die an der Position von Kreuzungs-

punkten entsprechend der in Kap. 3 bestimmten Vervollst¨

andigungsrichtung

gerichtet sind, wobei f¨

ur jede Vervollst¨

andigungsrichtung eines Kreuzungs-

punktes ein Stick-Votingfeld erzeugt und auf die Ergebniskarte addiert wird.

Uber diese Addition findet eine ¨

Uberlagerung der Tensorfelder und damit

eine Addition mehrerer Tensoren pro Bildposition statt. Damit ergibt sich in

der Ergebniskarte die Orientierung eines Tensors an einer gegebenen Bildpo-

sition aus der Addition der aus den ¨

uberlagerten Votingfeldern stammenden

Matrizen und anschließender spektraler Dekomposition der Ergebnismatrix

in Eigenvektoren und -werte.

Wie bereits in Kap. 2.5 erl¨

autert, wird f¨

ur eine sinnvolle Anwendung der

Konturvervollst¨

andigung, die ¨

uber eine einfache Konturverst¨

arkung hinaus-

geht, ein gerichtetes Kommunikationsschema ben¨

otigt, welches im Gegen-

satz zu einem bipolaren Verbindungsschema nur in einer Richtung Werte

ungleich Null im Stick-Votingfeld erzeugt (vgl. Abbildung 2.15). Ziel des

Votingprozesses ist die Gruppierung benachbarter Elemente unter Beach-

tung des Gestaltprinzips der guten Fortsetzung. Daher wird die Orientie-

rung jedes Tensors des Votingfeldes so gew¨

ahlt, dass diese eine Tangente an

70 4 Bestimmung m¨

oglicher Konturvervollst¨

andigungen

Qϑ

Abbildung 4.2: Skizze zur Bestimmung der Sticksalienz der Elemente des Vo-

tingfeldes und zur Bestimmung des Kreisbogens sund des

Radius r.

den Kreis darstellt, der durch den betrachteten Punkt des Votingfeldes und

durch das Zentrum des Feldes und damit durch den Punkt verl¨

auft, der das

Votingfeld erzeugt (siehe Abbildung 4.2).

Die St¨

arke des Feldes, d. h. der Wert des Eigenwertes λ1jedes Tensors der

Maske, wobei λ2= 0 gilt, ergibt sich aus der folgenden Betrachtung. Gege-

ben sei ein Punkt Pmit einer assoziierten Tangenten- bzw. Vervollst¨

andi-

gungsrichtung. Weiter sei ein Punkt Qgegeben, wobei die Winkeldifferenz

zwischen der Tangentenrichtung und der direkten Verbindung der Punkte P

und Qmit ϑbezeichnet sei. Sei ferner `der Abstand der Punkte Pund Q.

Zwischen dem oben beschriebenen Winkel ϑund dem Radius rdes Kreises,

der durch die Punkte Pund Qverl¨

auft und die mit Passoziierte Tangente

aufweist, besteht der Zusammenhang

sin(ϑ) =

r.(4.3)

4.1 Konturvervollst¨

andigung durch Tensor Voting 71

Damit folgt f¨

ur den Radius r

r=`

2·sin(ϑ)(4.4)

F¨

ur die L¨

ange des Kreisbogens sgilt im Bogenmaß

s= 2πr ·2ϑ

2π= 2rϑ, (4.5)

woraus mit Gleichung (4.4)

s=`·ϑ

sin(ϑ)(4.6)

folgt.

Bestehende Ans¨

atze zur Konturverst¨

arkung oder Konturvervollst¨

andigung

definieren die Verbindungsst¨

arke Vder Punkte Pund Qund damit die Form

des Kommunikationsschemas ¨

uber eine Funktion der Form

V=Vd·Vc(4.7)

mit einem Term Vdzur Bewertung der Distanz und einem Term Vczur

Bewertung der Kr¨

ummung.

In [HH93], [HHP+98] und [PH01] benutzen Heitger et al.

Vd1=e−`2

2σ2(4.8)

und

Vc1=(cosk(π/2

α·ϑ) f¨

ur |ϑ|< α

0 sonst ,(4.9)

72 4 Bestimmung m¨

oglicher Konturvervollst¨

andigungen

wobei der Parameter σin Gleichung (4.8) den Einfluss der Entfernung auf

die Verbindungsst¨

arke regelt, w¨

ahrend durch den Parameter k= 2n,n∈N

mit einem ¨

Offnungswinkel 2α=πdie ¨

Offnungsweite des Feldes geregelt

wird. Hansen and Neumann benutzen ebenfalls Vd1und Vc1, allerdings mit

k= 1 und α= 10◦[HN01]. In [MLT00] definieren Medioni et al. den

Distanzbewertungsterm Vd2und den Kr¨

ummungsterm Vc2wie folgt:

Vd2=e−s2

2σ2(4.10)

und

Vc2=e−c·ρ2

σ2mit ρ=2 sin(ϑ)

`(4.11)

Hier wird also statt der direkten Entfernung der Punkte Pund Qdie Strecke

sentlang des Kreisbogens zur Distanzbewertung herangezogen. F¨

ur das

Kr¨

ummungsmaß stellt ceine positive Konstante dar, w¨

ahrend ρ, wie unmit-

telbar aus Gleichung (4.4) folgt, nichts anderes als der Kehrwert des Radius

rist (vgl. Abbildung 4.2). Hieraus folgt, dass bei gleichem Winkel ϑund

unterschiedlichen Abst¨

anden `der Punkte Pund Qdas Kr¨

ummungsmaß

unterschiedliche Werte liefert und damit stark von der Skalierung des be-

trachteten Bildes abh¨

angt.

F¨

ur das Kommunikationsschema des Tensorvotings muss eine aus Tenso-

ren bestehende Maske erzeugt werden, wobei, wie schon erw¨

ahnt, der Ei-

genvektor e1in jedem Punkt der Maske die Tangentenrichtung an einen

entsprechenden Kreis durch den Punkt und durch den Zentrumspunkt re-

pr¨

asentiert. Der Eigenwert λ1wird durch λ1=V=Vd·Vcgebildet. Um

eine Abh¨

angigkeit des Distanzmaßes von der L¨

ange entlang eines potenziel-

len Kurvenst¨

ucks zu erzielen, wird f¨

ur die in Kap. 6 vorgestellten Ergebnisse

Vd=Vd2gew¨

ahlt. Um andererseits eine klare Trennung zwischen Distanz

und Kr¨

ummung zu erzielen, wird eine skalierungsinvariante Kr¨

ummungsbe-

wertung durch Vc=Vc1mit k= 1 realisiert, wobei die ¨

Offnungsweite des

4.1 Konturvervollst¨

andigung durch Tensor Voting 73

Feldes direkt ¨

uber den ¨

Offnungswinkel 2 ·αgesteuert wird [HM05]. Alle

nachfolgenden Ergebnisse wurden mit α= 15◦, d. h. einem ¨

Offnungswinkel

von 30◦berechnet.

Abbildung 4.3: Sticksalienz f¨

ur ein halbseitiges Votingfeld mit V=Vd2·Vc1,

k= 1 und α= 15◦.

Die Sticksalienz eines solchen Votingfeldes, also der Wert λ1−λ2ist in

Abbildung 4.3 dargestellt. Hierbei gilt aufgrund der idealen Orientierung

innerhalb der Maske λ2= 0. Ausgehend von Kreuzungspunkten wird eine

Konturvervollst¨

andigung nun realisiert, indem jede Vervollst¨

andigungsrich-

tung entsprechend ihrer Winkelinformation ein halbseitiges Votingfeld auf

die Ergebnistensorkarte addiert (vgl. Abbildung 4.4). Ergibt sich durch

eine Flankenmaximumsuche ¨

uber die Ergebniskarte eine Verbindungslinie

zwischen zwei Kreuzungspunkten, so wird diese als virtuelle Kontur den

eigentlichen Konturen hinzugef¨

ugt.

Abbildung 4.4: Sticksalienz der ¨

Uberlagerung zweier Votingfelder.

74 4 Bestimmung m¨

oglicher Konturvervollst¨

andigungen

4.1.3 Probleme des Tensorvoting

Durch die Repr¨

asentation von Eingabeelementen als Tensor kann eine Vor-

zugsorientierung, deren Salienz und die Orientierungsunsicherheit, z. B. an

Kreuzungspunkten dargestellt werden. So wird in [MBM02b, MBM02a,

MBM03] vorgeschlagen, Kreuzungspunkte ¨

uber eine hohe Ballsalienz der

Tensorkarte nach einem Votingprozess auf der dichtbesetzten Eingangskarte

zu erkennen.

(a) (b) (c) (d)

Abbildung 4.5: Tensor Voting auf einem Linienbild: (a) Eingangsbild,

(b) Eingangssticksalienzen, (c) Ballsalienzen vor und (d) nach

dem Stickvoting.

Die Eingangstensoren entstehen dabei f¨

ur dichtbesetzte Karten allerdings

durch eine ¨

Uberlagerung von Tensoren, d. h. durch Tensoraddition. In

[GM96] geschieht dies in Bin¨

arbildern durch ¨

Uberlagerung von Kurven-

elementen, in [MBM02b] durch die mit Gaborfilterantworten gewichtete

Summe ¨

uber ideal orientierte Tensoren. Ebenso entstehen die Ausgang-

stensoren durch Tensoraddition, d. h. durch einen Votingprozess. Bei einer

Uberlagerung von Tensoren, die die gleiche Salienz besitzen und in ihrer Ori-

entierung eine Differenz von 90◦aufweisen, erh¨

alt man einen idealen Ball-

tensor und eine Sticksalienz von Null. Ist dagegen die Orientierungsdifferenz

geringer, erh¨

alt man stattdessen eine geringere Ballsalienz und eine erh¨

ohte

Stick Salienz mit einer Orientierung, die aus der Mittelung der erzeugenden

Tensoren entsteht.

4.1 Konturvervollst¨

andigung durch Tensor Voting 75

Dies ist in Abbildung 4.5 dargestellt. Zu dem Eingangsbild in Abbildung

4.5(a) stellt Abbildung 4.5(b) die Sticksalienz der Tensorkarte dar, die sich

aus der Multiplikation von Filterantworten orientierungsselektiver Filter mit

entsprechend orientierten idealen Tensoren, d. h. λ2= 0, und anschließender

Uberlagerung s¨

amtlicher Orientierungen ergibt. Die dazugeh¨

orige Ballsali-

enz ist in Abbildung 4.5(c) dargestellt und l¨

asst bereits erkennen, dass sich

f¨

ur abnehmende Schnittwinkel zwischen den Geraden die Ballsalienzen ver-

ringern und eine Erkennung von Kreuzungspunkten ¨

uber ein Maximum der

Ballsalienz erschweren bis unm¨

oglich machen. Gerade in Bildern mit hoch-

frequenten Bildinhalten wie z. B. Abbildung 3.15 ist also eine Detektion

von Eck-oder Kreuzungspunkten mit Hilfe des Tensorvoting nicht ratsam.

Auch nach erfolgtem Votingprozess bleibt eine Erkennung f¨

ur nicht recht-

winklige Kreuzungspunkte schwierig, wie Abbildung 4.5(d) zeigt. Zu der

winkelabh¨

angigen Ballsalienz kommt hier auch eine Lokalisierungsungenau-

igkeit hinzu.

Weiterhin reicht eine Tensordarstellung nicht aus, die im Allgemeinen meh-

reren Orientierungen an Kreuzungspunkten darzustellen, hier muss zus¨

atz-

lich ein Vektor oder ein Winkelwert pro Vervollst¨

andigungsrichtung gespei-

chert werden. Die Gestaltprinzipien der N¨

ahe und guten Fortsetzung sind

integraler Bestandteil des Votingprozesses, es erscheint daher f¨

ur die hier

beschriebene Konturvervollst¨

andigung sinnvoll, den Votingprozess, ausge-

hend von Kreuzungspunkten, auf einer einzigen Tensorkarte auszuf¨

uhren

(vgl. [Mas06a, Mas06b]) und nicht f¨

ur jedes Paar von Vervollst¨

andigungs-

richtungen eine separate Karte zu f¨

ullen, was den Berechnungsaufwand er-

heblich erh¨

ohen w¨

urde. Wie aber bereits in Kap. 2.5 angesprochen wurde,

besteht bei der Nutzung einer gemeinsamen Tensorkarte die offensichtliche

Gefahr, dass sich die Tensoren einer modalen und einer amodalen Vervoll-

st¨

andigung am Schnittpunkt der Konturen ¨

uberlagern und damit die Lini-

enverfolgung sowohl der modalen, als auch der amodalen Kontur unm¨

oglich

machen. Um speziell dem letzten Punkt Rechnung zu tragen, wird im Fol-

genden durch eine Splineinterpolation eine Alternative zum Tensorvoting

vorgestellt.

76 4 Bestimmung m¨

oglicher Konturvervollst¨

andigungen

4.2 Bewertung von Verbindungswahrscheinlichkeiten

Im Gegensatz zum Tensor Voting, wo das Prinzip der N¨

ahe und der guten

Fortsetzung integraler Bestandteil der Konturvervollst¨

andigung sind, muss

f¨

ur die in Kap. 4.3 beschriebene Splineinterpolation zun¨

achst explizit be-

stimmt werden, welche Verbindungen sinnvoll sind, und welche Kreuzungs-

punkte nicht verbunden werden sollen.

4.2.1 Ausschlusskriterien

Es wird zun¨

achst eine Reihe notwendiger Bedingungen an eine physikalisch

sinnvolle Verbindung zweier Konturelemente betrachtet, aus der sich Aus-

schlusskriterien f¨

ur eine solche Verbindung ableiten lassen (vgl. [Fel06]). Ne-

ben einer optionalen Skalierungspr¨

ufung, welche eine Verbindung zu weit

entfernter Kreuzungspunkte entsprechend einer gew¨

unschten Skalierung aus-

schließt, ist hier die relative Lage zweier Verbindungsrichtungen zueinander

von Interesse.

(a) (b)

Abbildung 4.6: Unterschiedliche Nachbarorientierungen an Eckpunkten.

Betrachtet man in Abbildung 4.6 die schwarz dargestellten Richtungen m¨

og-

licher Vervollst¨

andigungen, so l¨

asst sich feststellen, dass diese sowohl in Ab-

bildung 4.6(a) als auch in Abbildung 4.6(b) in idealer Weise zueinander

ausgerichtet sind. Es ist allerdings unwahrscheinlich, dass Abbildung 4.6(b)

durch eine Verdeckung entstanden ist und die betrachteten Eckpunkte damit

4.2 Bewertung von Verbindungswahrscheinlichkeiten 77

Teil derselben Kontur sind. Um einen Fall wie in Abbildung 4.6(b) auszu-

schließen, wird daher nun zum einen die Verbindungsgerade zwischen den

beiden Eckpunkten betrachtet und zum anderen die hier grau dargestellte je-

weilige Nachbarorientierung der betrachteten Vervollst¨

andigungsrichtung.

Liegen die in Abbildung 4.6 grau dargestellten Nachbarorientierungen auf

unterschiedlichen Seiten der Verbindungsgerade, wird eine Verbindung der

Kreuzungspunkte ¨

uber die schwarz dargestellten Orientierungen ausgeschlos-

sen.

(a) (b)

Abbildung 4.7: Erlaubte Bereiche f¨

ur die Lage der Tangentenvektoren.

Das zweite Ausschlusskriterium erh¨

alt man ¨

uber die Betrachtung des zul¨

as-

sigen Bereichs, in dem eine Verbindung zweier Vervollst¨

andigungsrichtungen

Sinn macht. Diese m¨

ussen auf derselben Seite der Verbindungsgerade liegen

und dabei einander zugewandt sein. Der hieraus folgende zul¨

assige Bereich

ist in den Abbildungen 4.7(a) und (b) grau dargestellt, wobei sich die Anord-

nungen nur um eine Spiegelung an der Verbindungsgeraden unterscheiden.

Im praktischen Fall kann f¨

ur die in Kap. 3 ermittelten Winkelwerte der Fall

eintreten, dass die Vervollst¨

andigungsrichtungen bis auf eine geringe Abwei-

chung in Richtung des jeweils anderen Kreuzungspunktes zeigen, aber auf

78 4 Bestimmung m¨

oglicher Konturvervollst¨

andigungen

unterschiedlichen Seiten der Verbindungsgerade liegen (Abbildungen 4.7(c)

und (d)). Hierzu wird der grau gezeichnete Toleranzbereich eingef¨

uhrt, in-

nerhalb dessen die Vervollst¨

andigungsrichtungen auch auf gegen¨

uberliegende

Seiten der Verbindungsgerade liegen k¨

onnen. Alle Verbindungswinkel, die

die oben genannten Bedingungen nicht erf¨

ullen, k¨

onnen somit ausgeschlos-

sen werden.

Abbildung 4.8: Ausschluss der Verbindung bei unsymmetrischen Verbin-

dungsrichtungen.

Schließlich soll noch der Fall unterbunden werden, dass die Verbindung der

gerichteten Konturelemente einen zu unsymmetrischen Verlauf aufweist, wie

in Abbildung 4.8 dargestellt ist. Daher werden zu zwei Kreuzungspunkten i

und jdie Winkel γiund γjbetrachtet, welche den jeweils kleinsten Winkel

zwischen Vervollst¨

andigungsrichtung am Kreuzungspunkt und Verbindungs-

gerade der Kreuzungspunkte darstellen. Mit der Winkeldifferenz

∆γ=|γi−γj|(4.12)

l¨

asst sich nun das Ausschlusskriterium ∆γ > ∆γmax angeben, wobei ∆γmax,

falls nicht anders angegeben, im Folgenden zu ∆γmax = 45◦gesetzt wird,

was der Anordnung in Abbildung 4.8 entspricht.

4.2 Bewertung von Verbindungswahrscheinlichkeiten 79

4.2.2 Bestimmung der Verbindungswahrscheinlichkeit

Zu einer gegebenen Vervollst¨

andigungsrichtung ϕim¨

ussen s¨

amtliche Vervoll-

st¨

andigungsrichtungen ϕj, die anderen Kreuzungspunkten zugeordnet sind,

daraufhin ¨

uberpr¨

uft werden, ob eine Verbindung der Kreuzungspunkte ¨

uber

die Richtungen ϕiund ϕjsinnvoll ist. F¨

ur die Menge an Vervollst¨

andigungs-

richtungen ϕj, welche nicht durch die Kriterien in Kap. 4.2.1 ausgeschlossen

wurden, muss somit ein Maß pij definiert werden, welches die Bewertung

der Plausibilit¨

at der Verbindung zweier Konturelemente ¨

uber die Vervoll-

st¨

andigungsrichtungen ϕiund ϕjerm¨

oglicht. Ein Verbindungsweg ¨

uber die

Richtungen ϕiund ϕjwird dann generiert (vgl. Kap. 4.3), wenn sowohl

pij = max

k∈Ui

{pik}(4.13)

als auch

pji = max

k∈Uj

{pjk}(4.14)

gilt, wenn also f¨

ur jede der beiden Verbindungsrichtungen die Verbindung

mit der jeweils anderen Richtung als am wahrscheinlichsten eingestuft wurde.

Die Menge Uibezeichnet hierbei die Menge aller potentieller zu ϕikorre-

spondierender Verbindungsrichtungen, welche nicht ¨

uber die Kriterien in

Kap. 4.2.1 ausgeschlossen wurden. Das Maß pij wird im Folgenden so defi-

niert, dass f¨

ur den Wertebereich

0≤pij ≤1 (4.15)

gilt. Da pij außerdem ein Maß f¨

ur die Plausibilit¨

at der Verbindung ¨

uber ϕi

und ϕjdarstellt, wird es im Folgenden als Verbindungswahrscheinlichkeit

bezeichnet. Hierbei sei allerdings angemerkt, dass im Allgemeinen

80 4 Bestimmung m¨

oglicher Konturvervollst¨

andigungen

k∈Ui

pik 6= 1 (4.16)

gilt. Die Verbindungswahrscheinlichkeit ist ihrer Natur nach symmetrisch,

d. h. pij =pji. Außerdem soll sie die Gestaltprinzipien der N¨

ahe und guten

Fortsetzung ber¨

ucksichtigen, welche im Gegensatz zum Tensor Voting bei

der in Kap. 4.3 nicht direkter Bestandteil der Konturvervollst¨

andigung sind.

Der Ansatz f¨

ur pij lautet daher

pij =ξij ·1

1 + λij ·`ij

(4.17)

Die N¨

ahe zweier Kreuzungspunkte ist hierbei durch den Abstand `ij dieser

Punkte gegeben. Die Symmetrie der Vervollst¨

andigungsrichtungen ϕiund

ϕjkann ¨

uber den linearen Zusammenhang

λij = ∆γij ·λend −λstart

∆γmax

+λstart (4.18)

ber¨

ucksichtigt werden, wobei die Winkeldifferenz ∆γij wieder entsprechend

der Gleichung (4.12) gegeben ist. Der Einfluss des Gestaltprinzips der guten

Fortsetzung l¨

asst sich hierbei ¨

uber die Parameter λstart und λend und damit

uber den Wertebereich von λij steuern.

Seien ψiund ψjdie jeweils kleinsten Winkel zwischen der Verbindungsge-

rade der Kreuzungspunkte und den jeweiligen, durch die Vervollst¨

andigungs-

richtungen ϕiund ϕjbestimmten Tangentenvektoren. Die Darstellung der

Vervollst¨

andigungsrichtungen ¨

uber die Winkel ψiund ψjhat gegen¨

uber den

Winkeln ϕiund ϕjden Vorteil, dass sie rotationsinvariant sind. Sei weiter

der kleinere der beiden Winkel durch

ψmin ij =(ψif¨

ur ψi≤ψj

ψjf¨

ur ψi> ψj

(4.19)

4.2 Bewertung von Verbindungswahrscheinlichkeiten 81

gegeben. Ein weiterer Aspekt der guten Fortsetzung ist die in Kap. 4.2.1

bereits angesprochene nicht erw¨

unschte Konstellation, in der die Verbin-

dungsrichtungen ψiund ψjWerte von ann¨

ahernd 90◦annehmen. F¨

ur einen

solchen Fall kann ¨

uber den Term

ξij =e−ψ4

min ij (4.20)

eine D¨

ampfung der Verbindungswahrscheinlichkeit eingef¨

uhrt werden.

Weiterhin ist es m¨

oglich, auch Polarit¨

aten, also Helligkeitsinformationen und

die Richtungen von Hell-Dunkelwechseln zu ber¨

ucksichtigen, d. h. die in Ab-

bildung 4.9(a) dargestellte Konstellation als wahrscheinlicher zu beurteilen

als die in Abbildung 4.9(b) gegebene Konstellation.

(a) (b)

Abbildung 4.9: Unterschiedliche Polarit¨

aten bei Bestimmung der Verbin-

dungswahrscheinlichkeit.

Hierzu k¨

onnen die in Kap. 3.1 vorgestellten Eckfilter herangezogen werden,

da die Filterantworten ein direktes Maß f¨

ur die Polarit¨

at in einem Eckpunkt

darstellen. Seien dazu die maximalen, auf den Bereich von −0.5 bis +0.5

normierten Eckfilterantworten an der Position der beiden Kreuzungspunkte

durch fibzw. fjgegeben. Einen Wahrscheinlichkeitsterm zur Ber¨

ucksichti-

gung der Polarit¨

at erh¨

alt man durch δij =δ1·δ2(vgl. [Hag07]), wobei

82 4 Bestimmung m¨

oglicher Konturvervollst¨

andigungen

δ1=e−(c1·|fi−fj|)4(4.21)

die ¨

Ahnlichkeit der beiden Filterantworten bewertet, w¨

ahrend in

δ2= 1 −e−(sgn(fi)·sgn(fj)·(|fi|+|fj|)−c2)4(4.22)

die Betonung auf gleiche Polarit¨

at der Filterantworten gelegt wird. Der

Parameter c1in Gleichung (4.21) dient dabei der Einstellung der Flanken-

steilheit, w¨

ahrend ¨

uber den Parameter c2<−1 in Gleichung (4.22) der

Graph der Kurve nach links verschoben werden kann, womit es m¨

oglich ist,

den Toleranzbereich f¨

ur unterschiedliche Polarit¨

aten der Filterantworten zu

ver¨

andern.

Gleichung (4.17) modifiziert sich in diesem Fall zu

pij =ξij ·δij ·1

1 + λij ·`ij

(4.23)

Es ist bei dieser Vorgehensweise allerdings zu beachten, dass im Falle moda-

ler Vervollst¨

andigungen Hintergrundfl¨

achen durchaus unzusammenh¨

angend

sein k¨

onnen und damit m¨

oglicherweise auch unterschiedliche Polarit¨

atswerte

liefern.

4.3 Konturvervollst¨

andigung durch Spline Funktionen 83

4.3 Konturvervollst¨

andigung durch Spline Funktionen

Ansatz f¨

ur die Konturvervollst¨

andigung ist die Parameterdarstellung eines

kubischen Splines KS[Bar04, Loc92, Fel06, H¨

am91, Kno00]:

KS:S(t) = Sx(t)

Sy(t)!= a

e!+t b

f!+t2 c

g!+t3 d

h!(4.24)

mit t∈[0,1] ⊂R. Zur Bestimmung der acht Unbekannten in Gleichung

(4.24) werden acht linear unabh¨

angige Gleichungen ben¨

otigt. Vier davon

ergeben sich direkt aus dem Anfangspunkt A(xA, yA) und dem Endpunkt

E(xE, yE) des Verbindungsweges:

Sx(0) = xA=a

Sy(0) = yA=e

Sx(1) = xE=a+b+c+d

Sy(1) = yE=e+f+g+h

(4.25)

Die restlichen Bestimmungsgleichungen lassen sich durch die in Kap. 3 er-

mittelten Richtungen m¨

oglicher Konturfortsetzungen, welche zun¨

achst als

Winkel αAf¨

ur den Anfangspunkt bzw. αEf¨

ur den Endpunkt vorliegen, ge-

winnen. Hierzu werden die Tangentenvektoren

mA= mAx

mAy!=s· cos(αA)

sin(αA)!(4.26)

und

mE= mEx

mEy!=u· −cos(αE)

−sin(αE)!(4.27)

84 4 Bestimmung m¨

oglicher Konturvervollst¨

andigungen

betrachtet, wobei die L¨

angen s=kmAk2und u=kmEk2zun¨

achst unbe-

stimmt bleiben. Der Faktor −1 in der Definition des Vektors mEberuht

auf der Tatsache, dass die urspr¨

unglich mit den Kreuzungspunkten assozi-

ierten Winkel in Richtung der jeweiligen Vervollst¨

andigung zeigen, was zu

einer falschen Verbindung f¨

uhren w¨

urde (vgl. Abbildung 4.10(a)). Stattdes-

sen muss die Richtung des Tangentenvektors im Endpunkt eine entgegenge-

setzte Richtung aufweisen, um eine sinnvolle Tangente an die Splinefunktion

darzustellen (vgl. Abbildung 4.10(b)).

012345

(a) (b)

Abbildung 4.10: Generierter Verbindungsweg bei unterschiedlichen Richtun-

gen des Tangentenvektors des Endpunktes. (a) Tangenten-

vektoren zeigen in Richtung der Vervollst¨

andigung und (b)

der Tangentenvektor des Endpunktes wird um 180 Grad ge-

dreht (nach [Fel06]).

Die in Gleichung (4.27) angegebenen Tangentenvektoren, welche sich aus der

Richtung detektierter Konturen herleiten, stellen somit die Tangente an den

kubischen Spline entsprechend Gleichung (4.24) dar. Betrachtet man nun

also die Ableitungen

x(t) = b+ 2ct + 3dt2

y(t) = f+ 2gt + 3ht2,(4.28)

4.3 Konturvervollst¨

andigung durch Spline Funktionen 85

so erh¨

alt man die restlichen Bestimmungsgleichungen:

x(0) = mAx =b

y(0) = mAy =f

x(1) = mEx =b+ 2c+ 3d

y(1) = mEy =f+ 2g+ 3h

(4.29)

Wird nun das Gleichungssystem, welches durch die Gleichungen (4.25) und

(4.29) gegeben ist, nach den Koeffizienten der Splinedarstellung in Gleichung

(4.24) aufgel¨

ost, so ergibt sich:

a=xA

b=mAx

c= 3 xE−3xA−2mAx −mEx

d= 2 xA−2xE+mAx +mEx

e=yA

f=mAy

g= 3 yE−3yA−2mAy −mEy

h= 2 yA−2yE+mAy +mEy

(4.30)

Die Splinedarstellung des Verbindungsweges ist jetzt bis auf die L¨

angen s

und uder Tangentenvektoren eindeutig bestimmt. Setzt man nun s= 1

und u= 1, so l¨

asst sich feststellen, dass der resultierende Verbindungsweg

nicht skalierungsinvariant ist (Abbildung 4.11). Mit zunehmenden Abstand

der Interpolationspunkte n¨

ahert sich die Splinedarstellung dem subjektiven

Eindruck einer direkten Verbindung der beiden Punkte.

86 4 Bestimmung m¨

oglicher Konturvervollst¨

andigungen

0 1 2 3

(a) (b)

Abbildung 4.11: Skalierungsabh¨

angigkeit des Verbindungsweges bei Wahl

von Tangenteneinheitsvektoren. (nach [Fel06])

Abhilfe schafft hier die Betrachtung der Geradengleichungen

g:g(s) = xA

yA!+s cos(αA)

sin(αA)!(4.31)

h:h(u) = xE

yE!+u cos(αE)

sin(αE)!(4.32)

welche durch die Interpolationspunkte verlaufen und deren Richtungsvek-

toren den Tangentenvektoren entsprechen. Der Schnittpunkt der Geraden

ist ein skalierungsunabh¨

angiger Bezugspunkt [Fel06] und liefert Parameter-

werte sund u, welche direkt in die Gleichungen (4.26) und (4.27) eingesetzt

werden k¨

onnen. Um Einfluss auf das Kr¨

ummungsverhalten des Verbindungs-

weges zu haben, wird der skalierungsunabh¨

angige Kr¨

ummungsparameter κ

eingef¨

uhrt.

4.3 Konturvervollst¨

andigung durch Spline Funktionen 87

Die Tangentenvektoren ergeben sich somit zu

mA=8

κ·s· cos(αA)

sin(αA)!f¨

ur s > 0∧u > 0

cos(αA)

sin(αA)!sonst

(4.33)

mE=8

−κ·u· cos(αE)

sin(αE)!f¨

ur s > 0∧u > 0

−cos(αA)

−sin(αA)!sonst

(4.34)

Mit der Fallunterscheidung in den Gleichungen (4.33) und (4.34) wird der

Tatsache Rechnung getragen, dass bei der Bewertung der Verbindungswahr-

scheinlichkeiten in Kap. 4.2 eine gewisse Toleranz zugelassen wird gegen-

uber Verbindungsrichtungen, welche auf unterschiedlichen Seiten der Ver-

bindungsgerade zwischen den Interpolationspunkten liegen. Dies kann zu

Konstellationen mit parallelen Geraden und zu Konstellationen mit Wer-

ten s < 0 und u < 0 f¨

uhren. Der Fall von sehr großen Werten f¨

ur sund

ubraucht hier nicht weiter betrachtet zu werden, da dies einer Konstella-

tion von ann¨

ahernd parallelen Tangentenvektoren entspricht, welche einen

rechten Winkel zur Verbindungsgerade zwischen den Interpolationspunkten

aufweisen. Ein solcher Fall wird aber in Kap. 4.2 bereits ausgeschlossen.

Wie Abbildung 4.12 zeigt, kann ¨

uber den eingef¨

uhrten Kr¨

ummungsparame-

ter κdas Kr¨

ummungsverhalten des Verbindungsweges beliebig modelliert

werden. Im Kontext einer Detektion unterbrochener Objektgrenzen ma-

chen jedoch extreme Werte wie κ= 0, was einer direkten Verbindung der

Kreuzungspunkte entspricht (vgl. Abbildung 4.12(a)), und hohe Werte von

88 4 Bestimmung m¨

oglicher Konturvervollst¨

andigungen

01234

(a) (b) (c)

01234

(d) (e) (f)

Abbildung 4.12: Verlauf des Verbindungsweges mit unterschiedlichen Kr¨

um-

mungsparametern (nach [Fel06]): (a) κ= 0 (b) κ= 1 (c)

κ= 2 (d) κ= 3 (e) κ= 4 (f) κ= 7,8

κkeinen Sinn (vgl. Abbildung 4.12(f)). Im Folgenden wird daher, falls nicht

anders angegeben, ein Kr¨

ummungswert von κ= 2 angenommen.

5 Perzeptuelle Organisation

Notwendiger Bestandteil perzeptueller Organisation ist neben einer Kontur-

vervollst¨

andigung, wie sie in Kap. 4 vorgestellt wurde, eine Figur-Grund-

Gliederung, d. h. eine Organisation des Bildes in Bereiche, welche sich

als Figur vom restlichen Bereich, dem Hintergrund, abheben. W¨

ahrend in

[WH96] und [Sau99b] versucht wird, die Gruppierung bzw. Vervollst¨

andi-

gung von Konturen simultan zur Figur-Grund-Gliederung in einem kombi-

natorischen Ansatz durchzuf¨

uhren, wird im vorliegenden Ansatz zun¨

achst

die Konturvevollst¨

andigung durchgef¨

uhrt (siehe Kap. 4), um anschließend

die gewonnenen Informationen als Kriterium zur Figur-Grund-Gliederung an

Kreuzungspunkten nutzen zu k¨

onnen. Dieses Vorgehen korrespondiert mit

der von Kellman et al. postulierten Identit¨

atshypothese [KGW01], welche

besagt, dass die Mechanismen f¨

ur modale und amodale Konturvervollst¨

an-

digungen identisch sind und die Tiefenzuordnung vom Konturvervollst¨

andi-

gungsprozess getrennt werden kann. Wichtig ist in diesem Zusammenhang

eine Tiefenzuordnung, welche tolerant auf eine m¨

oglicherweise falsche in-

itiale Figur-Grund-Gliederung an Kreuzungspunkten reagiert. Ein solcher

Mechanismus wird in Kap. 5.2 vorgestellt.

5.1 Figur-Grund-Gliederung an Kreuzungspunkten

Da der vorliegende Ansatz von detektierten Konturen, also potenziellen Ob-

jektbegrenzungen ausgeht, findet auch die Zuordnung einer relativen Tiefe

entlang der Kontur und damit entlang der Objektgrenze statt. Schl¨

ussel-

punkt f¨

ur die Zuweisung von Vorder- oder Hintergrundeigenschaft ist der

Kreuzungspunkt zweier Konturen. Falls hier, vom Kreuzungspunkt aus-

gehend, mindestens ein Teil der beteiligten Konturen eine vervollst¨

andigte

90 5 Perzeptuelle Organisation

Kontur darstellt, kann davon ausgegangen werden, dass die gegebene Kon-

stellation durch eine Verdeckung hervorgerufen wurde. Die unten vorgestell-

ten Kriterien stellen Bedingungen dar, welche sich direkt aus dem physika-

lischen Zusammenhang bei der Verdeckung durch ein Vordergrundobjekt

ableiten lassen. Es ist aber genauso m¨

oglich, weitere Kriterien zur Figur-

Grund-Gliederung aus der Analyse der menschlichen Wahrnehmung zu ge-

winnen. So wird z. B. in [Wil94] eine Pr¨

aferenz von schwarzen Objekten

gegen einen weißen Hintergrund postuliert. In [MM01a] wird im Zusam-

menhang mit sich verdeckenden Objekten gleicher Farbe in bin¨

aren Bildern

angenommen, dass breite Objekte eher zum Vordergrund geh¨

oren, als d¨

unne

Objekte (vgl. Abb. 5.1(c)), d. h. diejenigen Objekte, welche die l¨

angeren

Konturabschnitte vervollst¨

andigter Konturen enthalten, werden als Hinter-

grund angesehen. Angesichts der Tatsache, dass ¨

ahnliche Effekte durchaus in

der menschlichen Wahrnehmung festzustellen sind (siehe Kap. 2.4.4), macht

ein solches Vorgehen durchaus Sinn, allerdings folgt ein solches Kriterium zur

Figur-Grund-Unterscheidung nicht direkt aus der gegenseitigen Verdeckung

zweier Objekte und stellt somit auch kein notwendiges Kriterium dar. Wei-

terhin ist es ohne weiteres m¨

oglich, eine T-Kreuzung als Kriterium f¨

ur eine

Figur-Grund-Unterscheidung heranzuziehen, indem die durchgehende Kon-

tur als Objektbegrenzung einer Vordergrundfl¨

ache deklariert wird, w¨

ahrend

die unterbrochene Kontur dem Hintergrund zugeordnet wird.

Die in Kap. 6 vorgestellten Ergebnisse resultieren allein aus den folgenden

Figur-Grund-Kriterien an die Konstellation von realen und vervollst¨

andigten

Konturen am Kreuzungspunkt zweier Konturen.

Falls am Kreuzungspunkt zweier Konturen eine Kontur ihren Zustand von

real zu vervollst¨

andigt ¨

andert und falls dies bei der kreuzenden Kontur nicht

der Fall ist, geh¨

ort die erste Kontur zum Hintergrund, w¨

ahrend die zweite

Kontur die Begrenzung einer Vordergrundfl¨

ache darstellt.

Ein Beispiel f¨

ur eine solche Konstellation ist in Abb. 5.1(a) gegeben.

5.1 Figur-Grund-Gliederung an Kreuzungspunkten 91

(a) (b)

(c)

Abbildung 5.1: Illustrationen zu Figur-Grund-Kriterien an Kreuzungspunk-

ten. Reale Konturen sind als durchgehende Linie darge-

stellt, w¨

ahrend vervollst¨

andigte Konturen gestrichelt darge-

stellt sind. Erl¨

auterung siehe Text.

Falls eine Kontur ihren Zustand von real zu vervollst¨

andigt ¨

andert und falls

der vervollst¨

andigte Teil in der Region liegt, welche von einer kreuzenden ge-

schlossenen Kontur begrenzt wird, geh¨

ort die erste Kontur zum Hintergrund,

w¨

ahrend die zweite Kontur die Objektbegrenzung eines Vordergrundobjektes

darstellt.

Eine solche Konstellation ist in Abb. 5.1(b) dargestellt. Die zu den bei-

den Kreisen geh¨

orenden vervollst¨

andigten Konturen liegen im Inneren der

92 5 Perzeptuelle Organisation

rechteckigen Kontur. Die Kreiskonturelemente im Bereich der Kreuzungs-

punkte werden damit als Hintergrund und die der rechteckigen Kontur als

Vordergrund gekennzeichnet.

Wenn beide Konturen geschlossen sind und beide Konturen vervollst¨

andigte

Anteile aufweisen, die in der von der jeweils anderen Kontur begrenzten

Region liegen, wird keine Figur-Grund-Entscheidung getroffen.

Die beschriebene Situation ist in Abb. 5.1(c) dargestellt. Im Gegensatz

zum Ansatz in [MM01a] wird hier also nicht die L¨

ange der vervollst¨

andigten

Konturen zur Entscheidung herangezogen, sondern keine Entscheidung ge-

troffen. Damit k¨

onnen Fehlzuordnungen, wie Sie bei Objekten unterschied-

licher Gr¨

oße nicht unwahrscheinlich sind (vgl. Abbildung 2.14), vermieden

werden.

5.2 Dynamische Tiefenzuordnung

Ziel der Tiefenzuordnung ist es, die in Kap. 5.1 gewonnenen Tiefeninforma-

tionen an den Kreuzungspunkten zweier Konturen an den Rest der jeweili-

gen Kontur weiterzuleiten und eine sinnvolle dreidimensionale Interpretation

des Konturverlaufs zu erm¨

oglichen. Um zu gew¨

ahrleisten, dass die Tiefen-

zuordnung einen kontinuierlichen dreidimensionalen Konturverlauf sogar f¨

solche Konturen erzeugt, welche Fl¨

achen begrenzen, die vom Vorder- zum

Hintergrund wechseln und umgekehrt, wird die Tiefenzuordnung in Form

eines Diffusionsprozesses realisiert [HM06]. Im Gegensatz zur stereoskopi-

schen Tiefenrekonstruktion ist es hier nicht m¨

oglich, eine quantitative Aus-

sage zu treffen ¨

uber die Entfernung eines Bildmerkmals zum Kamerasystem,

die zugeordnete relative Tiefe gibt dagegen Aufschluss ¨

uber die zum Kame-

rasystem relative Lage eines Objektes im Raum.

Die Kontur ist im Folgenden aufgeschl¨

usselt als Kettencode mit den zweidi-

mensionalen Bildkoordinaten (xn, yn)Tdes n-ten Konturelements,

n∈[1,...,T], wobei T∈Ndie L¨

ange der Kontur bzw. die Anzahl der

5.2 Dynamische Tiefenzuordnung 93

in der Kontur enthaltenen Pixel sei. Sei zndie relative Tiefe des n-ten

Konturelements mit den Nachbarn zn−2,zn−1,zn+1 und zn+2. Tiefe eines

Konturelements bedeutet in diesem Sinne die Tiefe der okkludierenden Ober-

fl¨

ache, falls die Kontur die Begrenzung einer Fl¨

ache darstellt. Ein h¨

oherer

Tiefenwert bedeutet hier eine gr¨

oßere Entfernung zum Kamerasystem

F¨

ur die Gl¨

attungsparameter c1und c2modelliert der Kostenterm P1mit

P1=1

n c1

2·

n+k

i=n−k

(zn−zn+i)2

+c2·((zn+1 −zn)−(zn−zn−1))2(5.1)

+((zn−zn0)2zngeh¨

ort zu einem Kreuzungspunkt

0 sonst !

die Forderung, dass benachbarte Pixel m¨

oglichst gleiche Tiefenwerte aufwei-

sen sollen und die (diskretisierte) erste Ableitung benachbarter Pixel eben-

falls identisch sein soll. Die Gr¨

oße der Nachbarschaft wird dabei durch den

Parameter kbeschrieben. Im Gegensatz hierzu werden im letzten Term Ko-

sten erzeugt, falls der Tiefenwert zneines Kreuzungspunktes von dem vorge-

gebenen Wert zn0abweicht. Der Wert zn0wird im Verlauf des im Folgenden

beschriebenen Iterationsprozesses aktualisiert, und zwar so, dass im Falle

einer Konstellation, die der Figur-Grund-Gliederung entsprechend Kap. 5.1

widerspricht, der Wert zn0modifiziert wird. Wenn also die betrachtete Kon-

tur im betrachteten Kreuzungspunkt als Vordergrund eingestuft wurde, die

Summe des Tiefenwertes znund eines Offsets daber gr¨

oßer ist als der Tie-

fenwert der anderen Kontur, so wird zn0aktualisiert zu zn0=zn−∆z,

wobei ∆zdie Korrekturschrittweite darstellt. Der Offset d > 0 bezeichnet

hierbei den geforderten Mindestabstand zwischen zwei Konturen. Analog

wird im Fall einer Hintergrundkontur verfahren, welche zu geringe Tiefen-

werte aufweist. Tritt keiner dieser F¨

alle auf, wird nichts ver¨

andert, d. h. es

wird zn0=zngesetzt.

94 5 Perzeptuelle Organisation

Durch Anwendung des Gradientenverfahrens zur Minimierung der in Glei-

chung (5.1) aufgestellten Kostenfunktion erh¨

alt man f¨

ur die partielle Ablei-

tung

∂

∂zn

P1=c1·

n+k

i=n−k

(zn−zn+i)

+c2·(6zn−4zn+1 −4zn−1+zn+2 +zn−2) (5.2)

+(zn−zn0zngeh¨

ort zu einem Kreuzungspunkt

0 sonst

Mit einer Schrittweite λergibt sich f¨

ur den Wert zndie folgende Iterations-

vorschrift:

z(j+1)

n=z(j)

n−λ·∂

∂zn

P1(5.3)

Hierbei ist zu beachten, dass f¨

ur die oben angegebenen Gleichungen außer-

dem eine Randbetrachtung ber¨

ucksichtigt werden muss. Im Fall von nicht

geschlossenen Konturen entfallen in Gleichung (5.1) Tiefenwerte, die außer-

halb des Intervalls [1,...,T] liegen und analog ¨

andert sich Gleichung (5.2)

an den entsprechenden Stellen. Im Fall geschlossener Konturen ist f¨

ur die

Nachbarn eines betrachteten Pixel zu beachten, dass die Nummerierung T-

periodisch verl¨

auft, d. h. es gilt z. B. zT+1 =z1.

Wird nun f¨

ur den Fall einer geschlossenen Kontur angenommen, dass die

Kontur die Objektgrenze eines verh¨

altnism¨

aßig simplen Objektes darstellt

und dass die Kontur sich außerdem auf einer Fl¨

ache befindet, die wie auch

immer im Raum angeordnet sein kann, so lassen sich aus der Betrachtung

der Tiefenwerte eines Kreises wertvolle Bedingungen f¨

ur die Tiefenkriterien

ableiten. Dies funktioniert auch f¨

ur Objekte, die keine kreisf¨

ormige Begren-

zung aufweisen, wie in Kap. 6 am Beispiel eines Bleistiftes gezeigt wird. Eine

Bedingung, die sich aus einer solchen Einschr¨

ankung ableiten l¨

asst, ist, dass

5.2 Dynamische Tiefenzuordnung 95

die Tiefenwerte sich gegen¨

uberliegender Punkte dieselbe H¨

ohendifferenz zur

Tiefe Mzdes Schwerpunktes M= (Mx, My, Mz)Tder Kontur aufweisen.

Der Schwerpunkt Mist hierbei gegeben durch

M=1

n=1

(xn, yn, zn)T.(5.4)

Es ergibt sich somit ein Kostenterm

P2=c3

4·X

(zn+zn+T/2−2Mz)2.(5.5)

Wird in jedem Iterationsschritt jder Schwerpunkt M(j)entsprechend Glei-

chung (5.4) ermittelt, so folgt f¨

ur die partiellen Ableitung

∂

∂zn

P2=c3·(zn+zn+T/2−2M(j)

z).(5.6)

Der Wert T/2 kann hierbei f¨

ur ungerade Tbeliebig gerundet werden, da

davon auszugehen ist, dass die Kontur bzw. der Wert von T hinreichend

groß ist und die Position des gegen¨

uberliegenden Pixels nur mit einer gewis-

sen Toleranz bestimmt werden muss. Die in Gleichung (5.3) beschriebene

Iterationsvorschrift ¨

andert sich somit zu

z(j+1)

n=z(j)

n−λ·∂

∂zn

(P1+P2).(5.7)

Abgesehen von der direkten Einbindung in den Kostenterm ist es auch

m¨

oglich, nach erfolgter Kostenminimierung in einem Nachverarbeitungs-

schritt den dreidimensionalen Kurvenverlauf durch einen Kreis zu appro-

ximieren, die entsprechenden Kreisparameter zu bestimmen und die Tie-

fenwerte z1,...,zTeines solchen Kreises wieder mit den zweidimensionalen

96 5 Perzeptuelle Organisation

Bildkoordinaten der Kontur zu verbinden. Hierzu wird zun¨

achst die Ver-

einfachung angenommen, dass der Abstand zwischen zwei Konturelementen

aquidistant ist. Anschließend muss der Kreismittelpunkt Mentsprechend

der Gleichung (5.4) bestimmt werden. Der Radius Rl¨

asst sich durch

R=1

n=1

k(xn−Mx, yn−My, zn−Mz)Tk2(5.8)

approximieren. Betrachtet man ein Konturelement nund ein Konturelement

n+T

4, wobei wiederum die T-Periodizit¨

at beachtet werden muss, so l¨

asst

sich zu den beiden Vektoren (xn−Mx, yn−My, zn−Mz)Tund (xn+T/4−

Mx, yn+T/4−My, zn+T/4−Mz)Tein Normvektor n(n)= (n(n)

x, n(n)

y, n(n)

z)T

bestimmen, f¨

ur den o. B. d. A. die Bedingung n(n)

z≥0 gefordert sei. Der

Neigungswinkel α(siehe Abbildung 5.2) l¨

asst sich nun ann¨

ahernd ¨

uber

α= max

n∈[1,...,T ]{arccos n(n)

kn(n)k2!}(5.9)

bestimmen.

R·cos(2π

T·n+ϕ)

h=zn

Abbildung 5.2: Seitenansicht eines Kreises mit Neigungswinkel α.

5.2 Dynamische Tiefenzuordnung 97

Um eine Approximation f¨

ur den Phasenwinkel ϕzu erhalten, der sowohl

von der Rotation des um den Winkel αgeneigten Kreises um die z-Achse,

als auch vom Winkel des ersten Konturelements zur x-Achse abh¨

angt, wird

die gegebene Konstellation auf die x-y-Ebene projiziert (siehe Abbildung

5.3). Der Winkel ϕ1l¨

asst sich nun ¨

uber die Koordinaten (xn, yn) bestimmen

[Mer99], w¨

ahrend der Winkel ϕ2durch die Koordinaten der zweidimensio-

nalen Projektion des Vektors −nbestimmt werden kann.

ϕ1

ϕ2

−n

(xn, yn)

Abbildung 5.3: Bestimmung des Phasenwinkels ϕ.

Wie in Abbildung 5.2 zu erkennen ist, l¨

asst sich nun mit gegebenen Phasen-

winkel ϕdie H¨

ohe eines Kreiskonturelements durch

zn=Mz+ sin(α)·R·cos(2π

T·n+ϕ) (5.10)

bestimmen.

98 5 Perzeptuelle Organisation

6 Experimentelle Ergebnisse

W¨

ahrend in den vorangegangenen Kapiteln bereits exemplarisch einige Er-

gebnisse gezeigt wurden, um die prinzipielle Funktionsweise einzelner Ver-

fahrensschritte zu verdeutlichen, wird in diesem Kapitel die Leistungsf¨

ahig-

keit des Verfahrens f¨

ur jeden Verfahrensschritt anhand ausgesuchter Bei-

spiele demonstriert.

6.1 Anisotrope Regularisierung

Die Abbildungen 6.1(a) bis (d) werden in [Wei96] als Beispiel f¨

ur die Rausch-

unterdr¨

uckungseigenschaften verschiedener Diffusionsfilter vorgestellt und

haben mittlerweile ihren Weg in die Standardliteratur digitaler Bildverar-

beitung gefunden [J¨

ah02]. 70% der Bildpunkte des Eingangsbildes 6.1(a),

das ein Dreieck und ein Rechteck enth¨

alt, sind durch Rauschen verfrem-

det. Abbildung 6.1(b) zeigt das Ergebnis einer linearen isotropen Diffusion,

was einer einfachen Gl¨

attung des Eingangsbildes entspricht. Hierbei wird

das Rauschen unterdr¨

uckt, allerdings werden auch die Kanten unscharf. In

Abbildung 6.1(c) ist dagegen das Ergebnis nichtlinearer isotroper Diffusion

dargestellt. Durch die Diffusion, deren St¨

arke von der des Gradienten ab-

h¨

angt, wird das Rauschen unterdr¨

uckt, ohne die Sch¨

arfe der Kanten zu be-

eintr¨

achtigen. Allerdings findet im Bereich der Kanten selbst keine Diffusion

statt, so dass diese verrauscht bleiben. Schließlich zeigt Abbildung 6.1(d) die

von Weickert beschriebene nichtlineare anisotrope Diffusion (vgl. Kap. 3.3).

Auch im Bereich von Kanten findet hier eine Diffusion statt, so dass auch f¨

Kantenbereiche sowohl das Rauschen unterdr¨

uckt wird, als auch die Kanten

scharf bleiben. Allerdings l¨

asst sich eine Lokalisierungsungenauigkeit der

Kanten aufgrund abgerundeter Ecken feststellen.

100 6 Experimentelle Ergebnisse

(a) (b)

Abbildung 6.1: Ergebnisse unterschiedlicher Diffusionsprozesse (aus [Wei96]

bzw. [J¨

ah02]): (a) Eingangsbild, (b) lineare Diffusion,

sotrope Diffusion.

In Abbildung 6.2(f) zeigt sich, verglichen mit den Filterergebnissen, deren

betragsgr¨

oßte Filterbetr¨

age in Abbildung 6.2(e) dargestellt sind, die Verbes-

serung der Kanteninformation nach anisotroper Regularisierung mit Selbst-

organisation der Gradientenkarte entsprechend Kap. 3.3.3. Die salienten

Kanten des Dreiecks und des Rechtecks verst¨

arken sich und richten sich

durch den Selbstorganisationsprozess aus, w¨

ahrend die durch Rauschpro-

zesse erzeugten Kanten unterdr¨

uckt werden. Abbildung 6.2(g) zeigt die L¨

sung des in Kap. 3.3.1 vorgestellten Regularisierungsterms mit anisotropen

Gewichtungsfaktoren, die sich aus der selbstorganisierten Gradientenkarte

ergeben. Das Gleiche ist in Abbildung 6.2(h) dargestellt, allerdings sind

6.1 Anisotrope Regularisierung 101

(e) (f)

(g) (h)

Abbildung 6.2: Diffusion durch anisotrope Regularisierung: (e) betragsgr¨

oßte

Filterbetr¨

age, (f) Betrag der Gradientenkarte nach erfolgtem

Selbstorganisationsprozess, (g) Ergebnis der anisotropen Re-

gularisierung mit Selbstorganisation der Gradientenkarte ent-

sprechend Kap. 3.3.2 und (h) mit zus¨

atzlichem Schwellwert.

hier die Gewichtungsfaktoren mit einem Schwellwert verbunden, der, wie

in Kap. 3.3.3 beschrieben, eine Diffusion zwischen Bildpunkten, die sich in

ihrem Grauwert zu stark unterscheiden, unterbindet. Um eine dem starken

Rauschen entsprechende hohe Diffusion zu erzielen, wurde der Skalierungs-

bzw. Gl¨

attungsparameter in beiden F¨

allen zu c= 1000 gesetzt. Der Ver-

gleich mit Abbildung 6.1 zeigt, dass hier eine signifikante Verbesserung, spe-

ziell bei der Lokalisierungsgenauigkeit der Kantenerhaltung stattgefunden

hat. F¨

ur den gesamten Bildbereich werden sowohl das Rauschen unter-

102 6 Experimentelle Ergebnisse

dr¨

uckt, als auch die salienten Kanten scharf und ohne wesentliche Lokalisie-

rungsungenauigkeiten abgebildet.

(a) (b)

Abbildung 6.3: Mandrill-Testbild: (a) N - Eingangsbild mit 10% unkorre-

liertem Rauschen, (b) R3.0n- anisotrope Diffusion mit Gl¨

at-

tungsparameter c= 3, (c) R250l- lineare isotrope Diffusion

mit Gl¨

attungsparameter c= 250 und (d) R250n- anisotrope

Diffusion mit Gl¨

attungsparameter c= 250.

Der naheliegendste Anwendungsbereich kantenerhaltender Regularisierung

ist die Rauschunterdr¨

uckung in digitalen Bildern. Im Folgenden findet da-

her eine Evaluation der anisotropen Gl¨

attung auf verrauschten Bildern statt.

Die in Tabelle 6.1 dargestellten Resultate beziehen sich auf das in Abbildung

6.3 dargestellte Mandrill-Testbild. In Abbildung 6.3(a) wurde das urspr¨

ung-

liche Bild in jedem Bildpunkt mit 10% Rauschen ¨

uberlagert. Um zwei Bilder

miteinander zu vergleichen, wird zun¨

achst der prozentuale Anteil an Farb-

bzw. Grauwerten betrachtet, die, bezogen auf die absolute Anzahl m·dan

Farbwerten eines Bildes mit mBildpunkten, f¨

ur den betrachteten Farbwert

6.1 Anisotrope Regularisierung 103

Ahnlichkeit s= 1 s= 6 s= 16 s= 21

N∧O6.19 36.38 79.41 90.36

R0.1l∧O3.90 40.16 83.14 91.92

R0.1n∧O4.04 40.88 85.60 94.40

R0.2n∧O4.01 41.37 85.62 93.97

R0.3n∧O3.99 41.13 84.40 92.75

R0.5n∧O3.90 40.24 81.75 90.29

R250n∧R250o29.18 98.83 99.97 99.99

Tabelle 6.1: Mandrill-Testbild: ¨

Ahnlichkeit zwischen verrauschtem Bild (N),

Originalbild (O) und Ergebnis anisotroper (Rcn) und isotroper

(Rcl) Diffusion.

mit gegebener Bildposition einen Differenzbetrag aufweisen, der unter einem

Schwellwert sliegt. Ein hoher Wert bedeutet damit, dass die Bilder, bezogen

auf den Schwellwert, eine hohe ¨

Ahnlichkeit aufweisen. In Tabelle 6.1 wird

das Originalbild mit Obezeichnet, das verrauschte Eingangsbild mit Nund

zu gegebenen Gl¨

attungsparameter cbezeichnet Rcndas Ergebnis der auf

das verrauschte Eingangsbild angewandten anisotropen Diffusion, w¨

ahrend

f¨

ur RcOdas Originalbild als Eingangsbild dient.

Tabelle 6.1 stellt die oben beschriebene ¨

Ahnlichkeit f¨

ur unterschiedliche Bil-

der und unterschiedliche Schwellwerte dar. Ein Vergleich zwischen dem Ori-

ginalbild (O) und dem verrauschten Bild (N) zeigt, dass durch das additive

Rauschen weniger als sieben Prozent der Bildpunkte pro Farbkanal ihren

Farbwert beibehalten haben. Wie in Tabelle 6.1 zu sehen ist, f¨

uhrt im Ver-

gleich zur ¨

Ahnlichkeit zwischen Original und verrauschtem Bild (N∧O)

das beschriebene Regularisierungsverfahren ab einem betrachteten Schwell-

wert s= 6 zu einer h¨

oheren ¨

Ahnlichkeit zum Originalbild (Rcn∧O), wobei

diese ¨

Ahnlichkeit mit zunehmenden Gl¨

attungsparameter abnimmt. Die Er-

kl¨

arung hierf¨

ur liegt in den hochfrequenten Bildanteilen des Originalbilds,

speziell im Bereich der Haare des Mandrills, die Teil des Signals und nicht

des Rauschens sind, aber trotzdem mit zunehmenden Gl¨

attungsparameter

104 6 Experimentelle Ergebnisse

(a) (b) (c) (d)

Abbildung 6.4: Testbilder f¨

ur die Evaluierung in Tabelle 6.2: (a) Lena,

(b) Barbara, (c) Boats und (d) House. Alle Bilder sind mit

einem additiven gaußf¨

ormigen weißen Rauschen (σ= 100)

uberlagert (aus [Por08]).

herausgefiltert werden. Dies erkl¨

art auch die besonders hohe ¨

Ahnlichkeit

zwischen der Regularisierung des Originalbildes und der des verrauschten

Eingangsbildes (R250n∧R250o) f¨

ur einen hohen Gl¨

attungsparameter c= 250.

Da die Eingangsbilder sich hier im Wesentlichen durch ihre hochfrequenten

Bildanteile unterscheiden, f¨

uhrt die anisotrope Regularisierung f¨

ur beide Bil-

der zu ann¨

ahernd gleichen Ergebnissen. Wie zu erwarten, weist das Ergebnis

anisotroper Diffusion eine h¨

ohere ¨

Ahnlichkeit zum Original auf, als das Er-

gebnis isotroper Diffusion des verrauschten Bildes (Rcl∧O).

Das in [PSWS03, GCP05] von Portilla et al. entwickelte Verfahren zur

Rauschunterdr¨

uckung in digitalen Bildern basiert auf einem statistischen

Modell f¨

ur die Koeffizienten der Multiskalenrepr¨

asentation eines Bildes durch

orientierungsselektive Filter im Rahmen einer Wavelet Transformation und

wird in [PSWS03] mit g¨

angigen Verfahren zur Rauschunterdr¨

uckung vergli-

chen. Resultat der umfangreiche Evaluierung ist, dass das Verfahren von

Portilla et al. g¨

angige Verfahren bez¨

uglich des PSNR-Wertes (Peak Signal

to Noise Ratio) ¨

ubertrifft.

6.1 Anisotrope Regularisierung 105

σ= 100 Lena Barbara Boats House

Portilla et al. 25.64 22.61 23.75 25.11

anisotrope Diffusion 25.65 22.07 23.13 24.92

Tabelle 6.2: Vergleich der Rauschunterdr¨

uckung durch anisotrope Diffusion

mit den Ergebnissen von Portilla et al., die Ergebnisse sind als

PSNR (Peak Signal to Noise Ratio) dargestellt. Die Eingangs-

bilder sind in Abbildung 6.4 dargestellt. Alle Ergebnisse der

anisotropen Diffusion wurden mit identischen Parametern be-

rechnet.

Um eine Einordnung der Rauschunterdr¨

uckungseigenschaften der hier vor-

gestellten anisotropen Regularisierung zu erm¨

oglichen, wird diese im Fol-

genden mit dem Verfahren von Portilla et al. verglichen [HM08]. Hierbei

werden mit den in Abbildung 6.4 gezeigten Bildern dieselben Testbilder ver-

wendet wie in [PSWS03]. Zum Vergleich wird auch hier der PSNR-Wert

herangezogen, der durch

PSNR = 10 ·log10 „2552

σ2

e«= 20 ·log10 „255

σe«(6.1)

definiert ist, wobei σ2

eden mittleren quadratischen Abstand zwischen Origi-

nal und rekonstruiertem Bild darstellt. Der Wert 255 stellt den maximalen

Farbwert bei g¨

angiger 8-Bit Darstellung dar.

Bezogen auf den mittleren quadratischen Abstand zeigt die anisotrope Regu-

larisierung einen wesentlichen Nachteil, sie zieht ein Zusammenschrumpfen

des Histogramms nach sich, was sich unabh¨

angig von der subjektiven Bild-

qualit¨

at unmittelbar auf den PSNR auswirkt. Um dennoch eine Vergleich-

barkeit der Ergebnisse zu erm¨

oglichen, basieren die in Tabelle 6.2 pr¨

asen-

tierten Ergebnisse auf einem linearen Histogrammabgleich der anisotropen

Regularisierungsergebnisse.

106 6 Experimentelle Ergebnisse

(a) (b)

Abbildung 6.5: Barbara-Testbild: (a) Originalbild und (b) Vergr¨

oßerung der

Tischregion.

Wie in Abbildung 6.6(c) zu sehen ist, verbleibt dennoch eine systematische

Abweichung des Grauwertlevels der Bildregionen im Vergleich zum Origi-

nalbild 6.5(b). F¨

ur s¨

amtliche Ergebnisse wurde ein Gl¨

attungsparameter von

c= 4.0 mit 60 Iterationsschritten genutzt. Der Startvektor ist durch das

verrauschte Eingangsbild gegeben und die Gewichtungsfaktoren der Umfeld-

kopplung resultieren aus einer Selbstorganisation der Gradientenkarte ent-

(a) (b) (c)

Abbildung 6.6: Barbara-Testbild: (a) Vergr¨

oßerung der Tischregion im ver-

rauschten Eingangsbild mit σ= 100 und PSNR = 8.13,

(b) Ergebnis der Rauschunterdr¨

uckung nach Portilla et. al.

(PSNR = 22.6) und (c) Ergebnis der Rauschunterdr¨

uckung

durch anisotrope Diffusion (PSNR = 22.1).

6.2 Konturverst¨

arkung 107

sprechend Kap. 3.3.3 mit einem Gl¨

attungsparameter von c= 8.0. Tabelle

6.2 zeigt, dass die PSNR-Werte des Verfahrens nach Portilla et al. [PSWS03]

bis auf das Lena-Testbild h¨

ohere Werte aufweisen und damit die quantitativ

bessere Rauschunterdr¨

uckung gew¨

ahrleisten.

Betrachtet man allerdings die Ergebnisbilder (vgl. Abbildung 6.6(b)), so

l¨

asst sich feststellen, dass das Verfahrens nach Portilla et al. f¨

ur stark ver-

rauschte Bilder Artefakte produziert, die im Ergebnis durch anisotrope Re-

gularisierung nicht auftreten (Abbildung 6.6(c)). Gerade f¨

ur die Zielsetzung

der vorliegenden Arbeit, im Rahmen einer Bildvorverarbeitung eine verl¨

as-

sliche Detektion von Konturen und Kreuzungspunkten zu gew¨

ahrleisten, ist

dies jedoch ein entscheidender Punkt.

6.2 Konturverst¨

arkung

Wie bereits in den Kapiteln 2.5 und 4.1.3 beschrieben wurde, l¨

asst sich un-

ter Verwendung eines bipolaren Verbindungsschemas das in Kap. 4.1 vorge-

stellte Tensorvotingverfahren zur Verst¨

arkung salienter Konturen nutzen.

Ein solcher Ansatz wird in [MBM02b, MBM02a, MBM03] verfolgt, wo-

bei die Eingangstensoren aus einer ¨

Uberlagerung unterschiedlich orientier-

ter Tensoren mit den Filterantworten entsprechend orientierter Gaborfilter

[Gab46, Dau88, Tra98, Tra96], resultieren.

Zum Testbild in Abbildung 3.15(a) aus Kap. 3.3.3 sind die Sticksalienzen

der Tensoren nach erfolgtem Stickvoting in Abbildung 6.7 dargestellt, wobei

Abbildung 6.7(a) auf einem bipolaren Stickvotingfeld beruht, w¨

ahrend der

Votingprozess in Abbildung 6.7(b) zus¨

atzlich inhibitorische Anteile aufweist.

Der Vergleich mit dem Ergebnis der Selbstorganisation der Gradientenkarte

in Abbildung 6.7(c) zeigt, das die in Kap. 3.3.3 beschriebene Vorgehensweise

sowohl in der Verst¨

arkung salienter Konturen, der Lokalisierungsgenauig-

keit, als auch der Unterdr¨

uckung von Rauschprozessen eindeutige Vorteile

aufweist.

108 6 Experimentelle Ergebnisse

(a) (b) (c)

Abbildung 6.7: Ergebnis der Verst¨

arkung salienter Konturen: (a) Ergebnis

nach Stickvoting (aus [MBM02a]), (b) Votingprozess mit in-

hibitorischem Anteilen (aus [MBM02a]) und (c) Ergebnis der

Selbstorganisation der Gradientenkarte nach Kap. 3.3.3.

Dies zeigt sich auch bei der Betrachtung der Kanten in Abbildung 6.8,

die sich aus einer Kantendetektion nach erfolgter Konturverst¨

arkung er-

geben. Zum Vergleich ist in Abbildung 6.8(a) das Ergebnis einer Canny-

Kantendetektion dargestellt.

(a) (b) (c)

Abbildung 6.8: Detektierte Kanten zum Steine-Testbild: (a) Canny-

Kantendetektion (aus [MTW99]), (b) Ergebnis nach Tensor-

voting (aus [MM02]) und (c) Ergebnis der Kantendetektion

nach Selbstorganisation der Gradientenkarte.

6.3 Kanten- und Eckendetektion 109

Auch hier zeigt sich, dass die vorgeschlagene Vorgehensweise Kanten loka-

lisierungsgenau detektiert und die Auswirkung der hochfrequenten Textu-

ranteile auf die Kantendetektion unterbinden kann. Man beachte, dass im

Gegensatz zu den in den Abbildungen 6.8(a) und (b) pr¨

asentierten Verfahren

die hier vorgestellte Kantendetektion keinerlei Schwellwert ben¨

otigt.

6.3 Kanten- und Eckendetektion

F¨

ur die in Kap. 3.2.1 beschriebene schwellwertfreie Kantendetektion ist in

Abbildung 6.8(c) bereits ein Beispiel gegeben. Die Funktionsweise soll nun

anhand eines weiteren Testbildes erl¨

autert werden. Zu der in Abbildung

6.9(a) dargestellten Laborszene sind in Abbildung 6.9(b) s¨

amtliche Kandida-

ten einer Kantendetektion dargestellt, also relative Maxima der in Kap. 3.1

beschriebenen Kanten- und Eckenfilter und Nulldurchg¨

ange der ZU-Filter.

(a) (b) (c)

Abbildung 6.9: Laborszene: (a) Eingangsbild (aus [MS98]), (b) aus s¨

amtli-

chen Filterergebnissen resultierende Kandidaten f¨

ur Kanten

und (c) detektierte Kanten nach Trackingverfahren.

Anstatt jedes Filtermaximum mit einer Schwellwertoperation zu versehen,

wird nun, ausgehend von idealen Kombinationen der Filterantworten, wie in

Kap. 3.2.1 beschrieben eine Kantenverfolgung realisiert. Das Ergebnis ist in

110 6 Experimentelle Ergebnisse

Abbildung 6.9(c) dargestellt und zeigt, dass aus der Menge aller m¨

oglichen

Kanten die wesentlichen Kanten korrekt herausgebildet werden.

(a) (b)

Abbildung 6.10: Laborszene: (a) Eingangsbild mit um 50% reduzierter Hel-

ligkeit und (b) detektierte Kanten.

Das Verwenden einer Schwellwertoperation, wie sie beim Cannydetektor

oder gradientenbasierten Filtermasken genutzt wird, erzeugt eine hohe Emp-

findlichkeit dieser Verfahren bei einer ¨

Anderung der Helligkeit des Eingangs-

bildes, wobei dieser Effekt beim Cannydetektor durch Einsatz einer soge-

nannten Hysterese-Schwellwertbildung gemindert wird [ZT98, Can86]. Im

Gegensatz dazu ist die in Kap. 3.2.1 beschriebene Kantenverfolgung relativ

unabh¨

angig von der Beleuchtung des Bildes, wie Abbildung 6.10 zeigt. Das

Eingangsbild, Abbildung 6.10(a), zeichnet sich durch eine um 50% reduzierte

Helligkeit gegen¨

uber Abbildung 6.9(a) aus. Dagegen zeigen die detektierten

Kanten in Abbildung 6.10(b) kaum Unterschiede zu denen in Abbildung

6.9(b) und demonstrieren damit die Beleuchtungsunabh¨

angigkeit des vorge-

stellten Verfahrens.

6.3 Kanten- und Eckendetektion 111

(a) (b) (c)

Abbildung 6.11: Vergleich von Verfahren zur Eckendetektion (aus

[MS98]): (a) CSS (Curvature Scale Space) [MS98],

(b) SUSAN [SB97] und (c) Eckpunktdetektion gem¨

aß

Kap. 3.2.2.

Abbildung 6.11(c) zeigt das Ergebnis der in Kap. 3.2.2 beschriebenen De-

tektion von Eckpunkten. Der Vergleich mit aktuellen Verfahren zur Ecken-

detektion zeigt, dass die hier beschriebene Vorgehensweise zu vergleichbaren

(Abbildung 6.11(a)) oder sogar genaueren Ergebnissen (Abbildung 6.11(b))

f¨

uhrt, wobei hier durch die bereits durchgef¨

uhrten Vorverarbeitungsschritte

kaum zus¨

atzlicher Berechnungsaufwand entsteht.

Alle Ergebnisse zu Abbildung 6.9(a) wurden mit 18 Filterorientierungen und

Filtermasken mit einer Gr¨

oße von 14 ×14 Pixeln berechnet. Einige Kreu-

zungspunkte, die nicht in Abbildung 6.11(c) als Eckpunkt gekennzeichnet

sind, wurden bereits im Verlauf der Kantendetektion als T-Kreuzung ge-

kennzeichnet (vgl. Abbildung 6.9(c)). F¨

ur eine weiterf¨

uhrende Behandlung

von Verfahren zur Detektion von Eckpunkten siehe [MS98, SB97, RT99,

BKY02].

112 6 Experimentelle Ergebnisse

6.4 Konturvervollst¨

andigung

Das in Abbildung 6.12(a) dargestellte Eingangsbild zeigt wieder das Kanizsa

Dreieck [Kan79], welches als klassisches Beispiel f¨

ur Scheinkonturwahrneh-

mung in biologischen Sehsystemen gilt (vgl. Kap. 2.3). Abbildung 6.12(b)

zeigt das Ergebnis der Bildvorverarbeitung. ¨

Uber die orientierungsselektive

Filterbank werden die im Bild vorhandenen Kanten extrahiert. Es werden

außerdem sowohl Kreuzungspunkte, als auch die Richtungen m¨

oglicher Fort-

setzungen detektiert, welche in Abbildung 6.12(b) heller als die detektierten

Kanten dargestellt sind.

(a) (b) (c)

Abbildung 6.12: Kanizsa Dreieck: (a) Eingangsbild, (b) detektierte Kan-

ten mit Fortsetzungsrichtung an Kreuzungspunkten und

In Abbildung 6.12(c) ist das Ergebnis des Tensorvoting Prozesses visua-

lisiert. Dargestellt ist die d¨

unn besetzte Tensorkarte nach erfolgtem Vo-

tingprozess, wobei der Grauwert jedes Bildpunktes mit der Sticksalienz des

jeweiligen Tensors korrespondiert. Falls eine sinnvolle Verbindung zwischen

Kreuzungspunkten besteht, kann diese durch eine Flankenmaximumsuche

gefunden werden.

6.4 Konturvervollst¨

andigung 113

(a) (b)

Abbildung 6.13: Konturvervollst¨

andigungen: (a) nach Tensorvoting und

(b) nach Splineinterpolation.

Die derart bestimmten Konturvervollst¨

andigungen sind in Abbildung 6.13

zusammen mit den urspr¨

unglich detektierten Konturen, dargestellt. Hierbei

f¨

allt auf, dass die durch das Tensorvoting erzeugte Konturvervollst¨

andigung

in Abbildung 6.13(a) insbesondere f¨

ur die Vervollst¨

andigung der Kreise eine

ungleichm¨

aßige Kr¨

ummung aufweist, was in der Skalierung der Votingfelder

begr¨

undet ist, wie Abbildung 6.12(c) zeigt. Dagegen ist die in Abbildung

6.13(b) dargestellte Konturvervollst¨

andigung durch Splineinterpolation ska-

lierungsunabh¨

angig, die Kr¨

ummung kann hier ¨

uber einen skalierungsunab-

h¨

angigen Parameter eingestellt werden (vgl. Kap. 4.3). Dementsprechend

kann hier unabh¨

angig von der Gr¨

oße des Eingangsbildes eine gleichm¨

aßige

Kr¨

ummung erzielt werden. Zusammenh¨

angende Konturen werden in einem

Kettencode gespeichert, dar¨

uber hinaus wird die Information festgehalten,

ob es sich bei einem Konturabschnitt um eine real im Bild existierende Kon-

tur handelt, oder ob der Konturabschnitt im Rahmen der Konturvervoll-

st¨

andigung hinzugef¨

ugt wurde.

114 6 Experimentelle Ergebnisse

(a) (b) (c)

Abbildung 6.14: ¨

Uberlagerung zweier Balken und einer Kreisfl¨

ache: (a) Ein-

gangsbild, (b) detektierte Kanten mit Fortsetzungsrichtung

an Kreuzungspunkten und (c) Sticksalienz nach Votingpro-

zess.

Wie bereits in Kap. 4.1.3 erw¨

ahnt, kann eine ¨

Uberkreuzung m¨

oglicher Ver-

vollst¨

andigungen im Rahmen des Tensorvotingprozesses zu einer unerw¨

unsch-

ten ¨

Uberlagerung der Votingfelder f¨

uhren. Dies ist in Abbildung 6.14(c) dar-

gestellt. Die Vervollst¨

andigungsrichtungen, welche von den Konturunterbre-

chungen der schwarzen Balken in Abbildung 6.14(a) erzeugt werden, generie-

ren Votingfelder, die sich mit rechtwinklig verlaufenden Feldern ¨

uberlagern.

Die ¨

Uberlagerung f¨

uhrt zu Tensoren, deren zweiter Eigenwert λ2ansteigt

und eine erh¨

ohte Orientierungsunsicherheit signalisiert. Die Sticksalienz

λ1−λ2, welche die Orientierungssicherheit anzeigt, verschwindet dagegen

stellenweise ganz, was zu einer fehlerhaften Konturvervollst¨

andigung f¨

uhrt,

wie Abbildung 6.15 zeigt.

W¨

ahrend die Kreiskontur korrekt vervollst¨

andigt wird, ist dies f¨

ur die Ver-

vollst¨

andigungen der Balken nicht der Fall. Wie schon erw¨

ahnt, ließe sich

dieses Problem umgehen, indem je zwei Vervollst¨

andigungsrichtungen geson-

dert betrachtet werden. Hierzu ist allerdings nicht nur eine seperate Ten-

sorkarte f¨

ur jedes Verbindungspaar notwendig, es m¨

usste zuvor auch eine

Bewertung der Verbindungswahrscheinlichkeiten wie in Kap. 4.2 stattfin-

den. Dies widerspricht allerdings der Idee des Votingverfahrens, welches die

6.5 Perzeptuelle Organisation vervollst¨

andigter Konturen 115

(a) (b)

Abbildung 6.15: Konturvervollst¨

andigungen: (a) nach Tensorvoting und

(b) nach Splineinterpolation.

Gestaltprinzipien der N¨

ahe und guten Fortsetzung bereits durch Konstruk-

tion des Votingfeldes ber¨

ucksichtigt. Die Konturvervollst¨

andigung durch

Splineinterpolation in Abbildung 6.15(b) f¨

uhrt dagegen erwartungsgem¨

aß

zu keinerlei Fehlzuordnungen, da hier die Verbindung der Kreuzungspunkte

allein von der Position der Kreuzungspunkte und den Vervollst¨

andigungs-

richtungen abh¨

angt.

6.5 Perzeptuelle Organisation vervollst¨

andigter Konturen

Sowohl das Kanizsa Dreieck als auch die in Abbildung 6.16 dargestellten

Ringe verdeutlichen die Zielsetzung perzeptueller Organisation, unterschied-

liche Formen auch dann als Ganzes wahrzunehmen, wenn sie teilweise ver-

deckt sind. F¨

ur eine Tiefenzuordnung weisen die Ringe dar¨

uber hinaus die

Problematik auf, dass keine bin¨

are Entscheidung im Sinne von Vorder- oder

Hintergrund getroffen werden kann, da jeder Ring in der sinnvollsten dreidi-

mensionalen Interpretation sowohl dem Vorder- als auch dem Hintergrund

des jeweils anderen Ringes zuzuordnen ist.

116 6 Experimentelle Ergebnisse

(a) (b)

Abbildung 6.16: Ineinander verschlungene Ringe: (a) Eingangsbild, (b) de-

tektierte Kanten mit Fortsetzungsrichtung an Kreuzungs-

punkten, (c) Sticksalienz nach Votingprozess und (d) Kon-

turvervollst¨

andigungen nach Tensorvoting.

Zustandswechsel von realer zu vervollst¨

andigter Kontur geben im Bereich

von Kreuzungspunkten Aufschluss dar¨

uber, ob eine Kontur die Objekt-

begrenzung eines Vordergrundobjekts darstellt, oder ob sie dem Hinter-

grund zuzuordnen ist. Durch Anwendung der in Kap. 5.1 beschriebenen

Figur-Grund-Unterscheidung kann nun zun¨

achst im Bereich von Kreuzungen

zweier Konturen eine Unterscheidung von Vorder- und Hintergrund getroffen

werden. Das Ergebnis des dynamischen Zuordnungsprozesses entsprechend

Kap. 5.2, welcher die Tiefeninformation von den Kreuzungspunkten zum

Rest der Kontur propagiert, ist in Abbildung 6.17 dargestellt. Nur Kon-

turelementen ist hierbei ein Grauwert zugeordnet, s¨

amtliche anderen Bild-

6.5 Perzeptuelle Organisation vervollst¨

andigter Konturen 117

punkte sind schwarz dargestellt. Ein hoher, d. h. heller Grauwert repr¨

asen-

tiert eine relative N¨

ahe zum Betrachter bzw. zum Kamerasystem, w¨

ahrend

dunkle Werte f¨

ur eine h¨

ohere Entfernung zur Kamera stehen.

(a) (b)

Abbildung 6.17: Tiefenzuordnung f¨

ur (a) das Kanizsadreieck und (b) die An-

ordnung aus Abbildung 6.16(a).

Wie Abbildung 6.17 zeigt, kann mit der geschilderten Vorgehensweise eine

Einteilung des Bildinhalts in ¨

uberlappende Objektgrenzen und eine Extrak-

tion monokularer Tiefeninformation aus den Eingabebildern realisiert wer-

den. Dar¨

uber hinaus k¨

onnen auch komplexere Tiefenanordnungen, die einen

Wechsel der Tiefenwerte entlang einer Kontur aufweisen, modelliert wer-

den.

Die Problematik und Mehrdeutigkeit, welche mit einer Figur-Grund-Unter-

scheidung verbunden ist, ist in Abbildung 6.18 dargestellt, die das Verhalten

der in Kap. 5.1 beschriebenen Figur-Grund-Unterscheidung demonstriert.

Abbildung 6.18(a) weist starke Mehrdeutigkeiten auf, zu dem vervollst¨

andig-

ten Kreis kann der weiße Balken sowohl als Vorder- als auch als Hintergrund

interpretiert werden. In Analogie zur Musterung eines Zebras kann der Bal-

ken auch als Teil der Textur des Kreises aufgefasst werden. Da keine der in

Kap. 5.1 beschriebenen Konditionen f¨

ur eine Figur-Grund-Unterscheidung

hier zutrifft, findet keine Tiefenzuordnung statt, die Konturen des Balkens

erhalten die gleiche Tiefe wie die des Kreises. Auch Abbildung 6.18(b) weist

118 6 Experimentelle Ergebnisse

(a) (b) (c)

Abbildung 6.18: Obere Reihe: Eingangsbilder mit Kreis und Balken, mitt-

lere Reihe: von Kreuzungspunkten entsprechend der Ver-

vollst¨

andigungsrichtung generierte Votingfelder und untere

Reihe: reale und vervollst¨

andigte Konturen mit zugeordne-

ter relativer Tiefe.

immer noch Mehrdeutigkeiten auf, der weiße Balken kann sowohl vor einer

schwarzen Kreisfl¨

ache als auch vor oder hinter einer weißen Fl¨

ache mit ei-

nem Loch liegen, die sich vor einem schwarzen Hintergrund befindet. Im

Unterschied zu Abbildung 6.18(a) wird hier bereits durch die induzierenden

Elemente und die Schließung der Kontur die Wahrnehmung des Balkens als

ein Objekt forciert. Es gibt auch in diesem Fall keine eindeutig als rich-

tig zu bewertende Interpretation, durch die in Kap. 5.1 formulierte Figur-

Grund-Unterscheidung f¨

uhrt hier aber die Tatsache, dass sich die Kreisver-

vollst¨

andigungen im Inneren der geschlossenen Kontur des Balkens befinden,

zu einer Interpretation, die die Objektgrenze des Balkens als Vordergrund

bewertet. Schließlich l¨

asst 6.18(c) den geringsten Spielraum f¨

ur Mehrdeu-

tigkeiten, da hier eine zus¨

atzliche Farbinformation hinzukommt, welche die

Wahrnehmung des Balkens als Hintergrund und des Kreises als Vordergrund

forciert, wobei der Kreis hier sinnvoll als Objektgrenze eines Loches zu in-

terpretieren ist. Die in Kap. 5.1 vorgestellte Figur-Grund-Unterscheidung

6.6 Nat¨

urliche Bilder 119

resultiert hier in einer eben solchen Interpretation, da die realen Konturen

im Kreuzungsbereich von Kreis und Balken eine T-Kreuzung bilden, d. h. die

Kontur des Balkens wechselt den Status von real zu vervollst¨

andigt, w¨

ahrend

die Kontur des Kreises durchgehend real bleibt.

6.6 Nat¨

urliche Bilder

Das Ergebnis perzeptueller Organisation ist abh¨

angig von der Qualit¨

at der

Eckendetektion und der Orientierungsgenauigkeit von m¨

oglichen Kontur-

fortsetzungen. W¨

ahrend dies in den bisher behandelten synthetischen Bil-

dern kein Problem darstellte, weisen nat¨

urliche Bilder eine Vielzahl an Eck-

punkten auf, die zu falscher Detektion von Kreuzungspunkten und Vervoll-

st¨

andigungsrichtungen f¨

uhren k¨

onnen. Wie schon beschrieben, ist außer-

dem h¨

aufig eine Reduktion des Detailgrads des betrachteten Bildes w¨

un-

schenswert, ohne wichtige Konturinformationen zu ver¨

andern. Durch die

in Kap. 3.3 vorgestellte anisotrope Regularisierung kann allerdings einem

Großteil dieser Problematik in einem weiteren Vorverarbeitungsschritt ent-

gegengewirkt werden, wie Abbildung 6.19 zeigt.

Ohne den Vorverarbeitungsschritt der anisotropen Diffusion (vgl. Abb. 6.19(c))

liefert die Kanten- und Eckendetektion keine verl¨

asslichen Informationen,

wie Abbildung 6.19(b) zeigt. Grund hierf¨

ur sind die Schriftzeichen sowohl

auf dem Papier, das den Hintergrund darstellt, als auch auf dem dem St¨

uck

Papier, das Teile der M¨

unzen okkludiert und damit zu einer Tiefenkonstel-

lation ¨

ahnlich dem Kanizsa Dreieck f¨

uhrt. Mit dem Vorverarbeitungsschritt

der anisotropen Diffusion kann das Eingangsbild auf wesentliche Elemente

reduziert werden, wodurch eine korrekte perzeptuelle Organisation gew¨

ahr-

leistet wird (Abb. Abb. 6.19(d)).

120 6 Experimentelle Ergebnisse

(a) (b)

Abbildung 6.19: Drei M¨

unzen auf beschriftetem Papier: (a) Originalbild,

(b) Ergebnis der Kantendetektion auf dem Originalbild,

behafteten Gewichtungsfaktoren und (d) Ergebnis perzep-

tueller Organistion mit vervollst¨

andigten Konturen und er-

folgter Tiefenzuordnung.

6.6 Nat¨

urliche Bilder 121

(a) (b)

Abbildung 6.20: Bild eines Bleistiftes, der durch zwei Dichtungsringe ge-

steckt wurde: (a) Originalbild und (b) Ergebnis nach ani-

sotroper Diffusion mit schwellwertbehafteten Gewichtungs-

faktoren. Die untere Reihe zeigt eine Vergr¨

oßerung eines

Bildbereiches mit sich kreuzenden Objektgrenzen.

Auch in Abbildung 6.20 erlaubt das durch die anisotrope Diffusion simpli-

fizierte Bild eine korrekte Detektion von Kreuzungspunkten, die wiederum

zu einer erfolgreichen Konturvervollst¨

andigung f¨

uhrt, wie Abbildung 6.21(a)

zeigt. Auch hier besteht eine besondere Herausforderung in der Tiefenan-

ordnung der Objekte, die keinen konstanten Verlauf aufweist. Wie in Ab-

bildung 6.21(b) zu erkennen ist, f¨

uhrt die Figur-Grund-Unterscheidung an

Kreuzungspunkten und die anschließende dynamische Tiefenzuordnung zu

einer korrekten dreidimensionalen Interpretation. Um dies weiter zu illu-

122 6 Experimentelle Ergebnisse

(a) (b)

Abbildung 6.21: Bleistift-Testbild: (a) vervollst¨

andigte Kanten nach Splin-

einterpolation und (b) Tiefenwerte nach dynamischer Tie-

fenzuweisung.

strieren, sind in Abbildung 6.22 verschiedenen Seitenansichten der relativen

Tiefe dargestellt.

Obwohl an den Kreuzungspunkten lediglich der Status des Vordergrundes

oder des Hintergrundes f¨

ur eine Kontur bestimmt wird, f¨

uhrt die dynamische

Tiefenzuordnung, wie sie in Kap. 5.2 vorgestellt wird, zu einer dreidimen-

sionalen Interpretation, welche die relative Lage der Dichtungsringe und des

Bleistifts allein aufgrund des monokularen Tiefenkriteriums der Verdeckung

qualitativ rekonstruieren kann. Die in Abbildung 6.22 dargestellten unteren

beiden Tiefenwerte ergeben sich mit dem in Kap. 5.2 beschriebenen Nach-

verarbeitungsschritt, welcher auf der Interpretation von Objektgrenzen als

Kreise auf einer geneigten Ebene basiert. Wie Abbildung 6.22 zeigt, funk-

tioniert dies selbst f¨

ur ein Objekt wie den dargestellten Bleistift.

Abschließend ist zu bemerken, dass in dem zweidimensionalen Abbild einer

realen Szene h¨

aufig eine Vielzahl von Objekten enthalten ist, die unterschied-

liche Entfernungen zur Kamera aufweisen, aber ¨

uber keine rekonstruierbaren

6.6 Nat¨

urliche Bilder 123

Abbildung 6.22: Bleistift-Testbild – Oben: Seitenansicht ohne Nachverarbei-

tungsschritt, Mitte: Seitenansicht mit Nachverarbeitungs-

schritt und Unten: perspektivische Seitenansicht der relati-

ven Tiefenwerte mit Nachverarbeitungsschritt

verdeckten Objektgrenzen verf¨

ugen. Da in dem hier pr¨

asentierten Verfah-

ren aber allein die rekonstruierbare Verdeckung als Tiefenkriterium genutzt

wird, macht die Anwendung des Verfahrens in solchen F¨

allen ohne die Kom-

bination mit weiteren Tiefenkriterien keinen Sinn.

124 6 Experimentelle Ergebnisse

6.7 Laufzeiten

F¨

ur das Grauwertbild der Abbildung 6.16(a) mit einer Gr¨

oße von 256 ×256

Pixeln kann die Gesamtlaufzeit des Verfahrens auf unter einer Sekunde ein-

gestellt werden. Die Berechnungen erfolgten dabei mit einer Intel Core 2

CPU 6600 mit 2,4 GHz und 4096 KB L2 Cache. Der gr¨

oßte Anteil der Lauf-

zeit entf¨

allt hierbei auf die Filterung. Mit einem Filterradius von 7 Pixeln

und 12 betrachteten Orientierungen werden zur Filterung im Mittel 0,75 Se-

kunden ben¨

otigt. Bei einem Filterradius von 3 Pixeln und 5 Orientierungen

reduziert sich die Berechnungszeit dagegen auf 0,12 Sekunden. Sowohl die

Kanten- und Eckendetektion, die Konturvervollst¨

andigung durch Splinein-

terpolation, als auch die Figur-Grund-Unterscheidung ben¨

otigen mit weni-

ger als 10 Millisekunden kaum Rechenzeit. Bei einem iterativen Prozess wie

der dynamischen Tiefenzuweisung ist die Rechenzeit dagegen stark abh¨

angig

von der Parameterwahl, mit 20 Iterationen werden hier ca. 0,02 Sekunden

ben¨

otigt. Ebenfalls rechenintensiv ist der iterative Vorverarbeitungsschritt

der anisotropen Diffusion, der f¨

ur Abbildung 6.16 nicht ben¨

otigt wird. Bei

einer Umfeldgr¨

oße von 3 ×3 Pixeln und 20 Iterationen w¨

urde er 1,3 Sekun-

den beanspruchen, womit die anisotrope Diffusion rechenintensiver ist als

der gesamte restliche Prozess der perzeptuellen Organisation.

7 Zusammenfassung

In Rahmen der vorliegenden Arbeit konnte eine Einteilung von Bildinhalten

in ¨

uberlappende Objektgrenzen realisiert werden, wobei Konturverl¨

aufe, die

durch Verdeckung unterbrochen sind, erfogreich rekonstruiert und zur Be-

stimmung der relativen Tiefenanordnung der gegebenen Konstellation her-

angezogen werden konnten. Die hier pr¨

asentierte Organisation von Objekt-

grenzen erm¨

oglicht es, auch f¨

ur Konturen von Objekten, die entlang des

Konturverlaufs keinen konstanten Tiefenwert aufweisen, wie dies z. B. bei

sich gegenseitig verdeckenden Objekten der Fall ist, eine sinnvolle dreidi-

mensionale Interpretation der betrachteten Szene zu generieren. Es konnte

somit gezeigt werden, dass eine Extraktion monokularer Tiefeninformation

allein aufgrund von Verdeckungen m¨

oglich ist.

Grundlage f¨

ur die perzeptuelle Organisation der Objektgrenzen ist die De-

tektion von Sch¨

usselpunkten, die durch eine Unterbrechung des Konturver-

laufs durch ein verdeckendes Objekt im Falle amodaler Konturen oder durch

ein Wechsel der Hintergrundfarbe zu einer dem Vorderdrund identischen

Farbe im Falle modaler Konturen entstanden sein k¨

onnen. Ausgehend von

solchen Schl¨

usselpunkten findet eine Wahrscheinlichkeitserw¨

agung statt, ob

zwei Schl¨

ussel- bzw. Kreuzungspunkte zueinander gruppiert werden k¨

onnen,

und, falls dies der Fall ist, wie der Verbindungsweg dieser Punkte aussieht.

Weiterhin wird unter Nutzung sowohl lokaler als auch globaler Kriterien die

Anordnung von realen und vervollst¨

andigten Kanten an Schl¨

usselpunkten

herangezogen, um sich kreuzende Konturen im Bereich von Schl¨

usselpunk-

ten entweder dem Vorder- oder dem Hintergrund zuzuordnen. Aufgrund

dieser Zuordnung findet durch einen Diffusionsprozess in einem abschlie-

ßenden Schritt eine Propagation der Tiefeninformationen ¨

uber die gesamte

Kontur statt.

126 7 Zusammenfassung

Das beschriebene Verfahren ist als Bottom-Up-Prozess realisiert und damit

unabh¨

angig von einer Wissensbasis. Dies hat zur Folge, dass die Wahrneh-

mungsprozesse in einem nat¨

urlichen Bild h¨

aufig in einem Detailgrad statt-

finden, welcher nicht notwendigerweise der Seherfahrung eines Beobachters

entspricht, der die Skalierung seiner Aufmerksamkeit von dem Wissen ¨

uber

die Gr¨

oße und Anzahl der dargestellten Objekte abh¨

angig macht. Dar¨

uber

hinaus ist das Ergebnis abh¨

angig von der Qualit¨

at der Eckendetektion und

der Orientierungsgenauigkeit von m¨

oglichen Konturfortsetzungen. W¨

ahrend

dies in synthetischen Bildern in der Regel kein Problem darstellt, weisen

nat¨

urliche Bilder eine Vielzahl an Eckpunkten auf, die zu St¨

orungen im

Prozess der Scheinkonturwahrnehmung f¨

uhren k¨

onnen. Um diesen Punkten

Rechnung zu tragen und eine robuste Anwendung des beschriebenen Ver-

fahrens auf nat¨

urlichen Bildern zu gew¨

ahrleisten, wurde mit der vorgestell-

ten anisotropen Regularisierung ein weiterer Vorverarbeitungsschritt reali-

siert, welcher es erm¨

oglicht, ein Eingangsbild zu simplifizieren, d. h. hoch-

frequente Bildinhalte entsprechend einer gew¨

unschten Skalierung aus dem

Bild zu entfernen, ohne dabei Existenz und Lokalisierung markanter Konur-

verl¨

aufe zu ver¨

andern, wodurch das Bild auf die wesentlichen Bildinhalte

reduziert wird.

Unter den im Verlauf der vorliegenden Arbeit ber¨

ucksichtigten Themen der

digitalen Bildverarbeitung, wie schwellwertfreier Kanten- und Eckendetek-

tion, Rauschunterdr¨

uckung, Verst¨

arkung salienter Konturen und Scheinkon-

turwahrnehmung, ist die anisortope Regularisierung, insbesondere mit der

vorgestellten Selbstorganisation der Gradientenkarte, von besonderem Inter-

esse, da sie in allen gezeigten Anwendungen sehr vielversprechende Ergeb-

nisse liefert und dar¨

uber hinaus eine F¨

ulle weiterer Anwendungsm¨

oglichkei-

ten, wie z. B. Inpainting, Bildvergr¨

oßerung oder Aufl¨

osung von Mehrdeutig-

keiten in einem stereoskopischen Disparit¨

atsraum bietet.

Die pr¨

asentierte Arbeit kann als ein erster Schritt in Richtung einer um-

fassenden maschinellen Tiefenwahrnehmung betrachtet werden, da g¨

angige

Verfahren zur Rekonstruktion der Tiefeninformation sich ausschließlich auf

127

die stereoskoische Korrespondenzbestimmung in Stereobildern, gegebenen-

falls unter Ber¨

ucksichtigung der zeitlichen Komponente, beschr¨

anken. Be-

trachtet man das visuelle System des Menschen, so liegt die Effizienz der

Wahrnehmung nicht zuletzt in der Kopplung unterschiedlicher Tiefenkrite-

rien begr¨

undet. Eine solche Kopplung von Tiefenkriterien ist also f¨

ur maschi-

nelle Bildverarbeitung durchaus denkbar und sinnvoll. So ließe sich die in der

vorliegenden Arbeit vorgestellte Figur-Grund-Unterscheidung an Schl¨

ussel-

punkten ohne weiteres mit den Ergebnissen binokularer Tiefenwahrnehmung

verkn¨

upfen. Stereoskopische Tiefeninformation kann gerade an Schl¨

ussel-

punkten besonders gut zur Figur-Grund-Unterscheidung herangezogen wer-

den, da Stereoalgorithmen in diesen Bereichen aufgrund des hohen Infor-

mationsgehaltes des Bildes besonders zuverl¨

assige Aussagen treffen. Um-

gekehrt l¨

asst sich die Konturinformation, welche durch die hier vorgestellte

perzeptuelle Organisation auch teilweise verdeckte Objektgrenzen darstellt,

sowohl zur Einschr¨

ankung des Suchraums stereoskopischer Korrespondenz-

bestimmung, als auch im Kontext von Objekterkennungsstrategien, die in

der Regel auf eine vollst¨

andige Repr¨

asentation von Objektgrenzen angewie-

sen sind, nutzen.

128 7 Zusammenfassung

Literaturverzeichnis

[AB98] Alter, T. D.; Basri, R.: Extracting Salient Curves from

Images: An Analysis of the Saliency Network. In: Int. J. Com-

put. Vision 27 (1998), Nr. 1, S. 51–69. – ISSN 0920–5691

[ABBFC97] Aubert, G.; Barlaud, M.; Blanc-Feraud, L.; Char-

bonnier, P.: Deterministic edge-preserving regularization in

computed imaging. In: IEEE Trans. Imag. Process. (1997). –

5(12)

[Ade01] Adelson, E. H.: On seeing stuff: the perception of materials

by humans and machines. In: Proceedings of the SPIE Bd.

4299, Human Vision and Electronic Imaging VI, Bernice E.

Rogowitz; Thrasyvoulos N. Pappas (Hrsg.), 2001, S. 1–12

[ASF02] Anderson, B. L.; Singh, M; Fleming, R. W.: The Interpola-

tion of Object and Surface Structure. In: Cognitive Psychology

44 (2002), S. 148–190

[Bab03] Babos, Martin: Anwendung des Tensor-Voting-Verfahrens auf

Grauwertbilder, Universit¨

at Hamburg, Diplomarbeit, Februar

2003

[Bar04] Bartsch, Hans-Jochen: Taschenbuch Mathematischer For-

meln. 20. Auflage. Fachbuchverlag Leipzig im Carl Hanser

Verlag, 2004

[Bau78] Baumgartner, G.: Physiologie des zentralen Sehsystems. In:

Gauer, Kramer, Jung (Hrsg.): Physiologie des Menschen 13

(1978), S. 263–256

[BHM04a] Brockers, Roland; Hund, Marcus; Mertsching, B¨

arbel: A

fast cost relaxation stereo algorithm with occlusion detection

for mobile robot applications. In: Vision, Modeling, and Vi-

sualization 2004. Stanford, USA, September 2004. – ISBN

3–89838–058–0, S. 47 – 53

[BHM04b] Brockers, Roland; Hund, Marcus; Mertsching, B¨

arbel:

Fast stereo vision for mobile robots by global minima of cost

130 Literaturverzeichnis

function. In: 6th IEEE Southwest Symposium on Image Analy-

sis and Interpretation. Lake Tahoe, Nevada, USA, 2004, S. 85

– 89

[BHM05] Brockers, Roland; Hund, Marcus; Mertsching, B¨

arbel: ste-

reo matching with occlusion detection using cost relaxation. In:

IEEE International Conference on Image Processing, 2005

[BKY02] Bae, Sun C.; Kweon, In-So; Yoo, Choong D.: COP: a new

corner detector. In: Pattern Recognition Letters 23 (2002), Nr.

11, S. 1349–1360

[Can86] Canny, J: A computational approach to edge detection. In:

IEEE Trans. Pattern Anal. Mach. Intell. 8 (1986), Nr. 6, S.

679–698. – ISSN 0162–8828

[Dau88] Daugman, J. G.: Complete disrete 2-D Gabor transforms by

neural networks for image analysis and compression. In: IEEE

Trans. on Acoustics Speech and Signal Processing 36 (1988),

Nr. 7, S. 1169–1179

[ESS03] Ehrenstein, Walter H.; Spillmann, Lothar; Sarris, Viktor:

Gestalt issues in modern neuroscience. In: Axiomathes 13

(2003), Nr. 3, S. 433–458

[Fel06] Feldmann, Michael: Approximation des Verbindungsweges ge-

richteter Konturelemente durch analytische Funktionen, Uni-

versit¨

at Paderborn, Baccalaureatsarbeit, 2006

[Gab46] Gabor, D.: Theory of Communication. In: Journal of the IEE

(1946), Nr. 93, S. 429–446

[GCP05] Guerrero-Colon, Jose A.; Portilla, Javier: Two-Level Ad-

aptive Denoising using Gaussian Scale Mixtures in Overcom-

plete Oriented Pyramids. In: IEEE International Conference

on Image Processing (ICIP) Bd. 1, 2005, S. 105–108

[GG07] Guardini, Pietro; Gamberini, Luciano: Zweiter Preis

2007 beim Best Visual Illusion of the Year Contest.

http://illusioncontest.neuralcorrelate.com, 2007 (Ab-

ruf: 01.04.2009)

[GGM95] Gove, A.; Grossberg, S.; Mingolla, E.: Brightness per-

ception, illusory contours, and corticogeniculate feedback. In:

Visual Neuroscience 12 (1995), Nr. 6, S. 1027–1052

Literaturverzeichnis 131

[GKP96] Geiger, D.; Kumaran, K.; Parida, L.: Visual organization

for figureground separation. In: Proc. IEEE Conf. on Computer

Vision and Pattern Recognition, 1996, S. 155–160

[GM96] Guy, Gideon; Medioni, Gerard: Inferring global perceptual

contours from local features. In: International Journal of Com-

puter Vision 20 (1996), Nr. 1-2, S. 113–133. – ISSN 0920–5691

[GW08] Gonzalez, Rafael C.; Woods, Richard E.: Digital Image Pro-

cessing. Prentice Hall, 2008. – ISBN 9780131687288

[Hag07] Hagenl¨

uke, Frank: Bestimmung der Verbindungswahrschein-

lichkeit gerichteter Konturelemente unter Ber¨

ucksichtigung der

Polarit¨

at orientierungsselektiver Filterantworten, Universit¨

Paderborn, Studienarbeit, 2007

[Han03] Hansen, Thorsten: A neural model of early vision: Contrast,

contours, corners and surfaces, Universit¨

at Ulm, Diss., 2003

[HBD03] Hund, Marcus; Brockers, Roland; Dr¨

ue, Siegbert: Tiefen-

wahrnehmung f¨

ur sichtgesteuerte mobile Roboter. (2003). –

Vortrag, KI2003-Workshop Kognitive Robotik

[Her70] Hermann, L.: Eine Erscheinung simultanen Contrastes. In:

Pfl¨

ugers Archiv f¨

ur die gesamte Physiologie 3 (1870), S. 13–15

[Hey03] Heydt, R¨

udiger von d.: Image parsing mechanisms of the

visual cortex. In: The Visual Neurosciences (2003), S. 1139–

1150

[HH93] Heitger, F.; Heydt, R. von d.: A computational model of

neural contour processing: Figure-ground segregation and il-

lusory contours. In: International Conference on Computer

Vision, 1993, S. 32–40

[HHP+98] Heitger, Friedrich; Heydt, R¨

udiger von der; Peterhans,

Esther; Rosenthaler, Lukas; K¨

ubler, Olaf: Simulation of

neural contour mechanisms: representing anomalous contours.

In: Image Vision Comput. 16 (1998), Nr. 6-7, S. 407–421

[HM05] Hund, Marcus; Mertsching, Baerbel: A computational ap-

proach to illusory contour perception based on the tensor voting

technique. In: 10th Ibero-American Congress on Pattern Reco-

gnition (XCIARP), 2005

132 Literaturverzeichnis

[HM06] Hund, Marcus; Mertsching, Baerbel: Depth ordering and

figure-ground segregation in monocular images derived from il-

lusory contour perception. In: 17th European Conference on

Artificial Intelligence (ECAI 2006), 2006

[HM08] Hund, Marcus; Mertsching, B¨

arbel: Anisotropic diffusion

by quadratic regularization. In: 3rd International Conference

on Computer Vision Theory and Applications (VISAPP 2008),

2008, S. 101 – 107

[HN01] Hansen, Thorsten; Neumann, Heiko: Neural mechanisms

for representing surface and contour features. In: Emergent

Neural Computational Architectures Based on Neuroscience

- Towards Neuroscience-Inspired Computing, Springer-Verlag,

2001. – ISBN 3–540–42363–X, S. 139–153

[HN04] Hansen, Thorsten; Neumann, Heiko: Neural mechanisms for

the robust representation of junctions. In: Neural Comput. 16

(2004), Nr. 5, S. 1013–1037. – ISSN 0899–7667

[HSN01] Hansen, Thorsten; Sepp, Wolfgang; Neumann, Heiko: Recur-

rent long-range interactions in early vision. In: Lecture Notes

in Computer Science Bd. 2036, 2001, S. 127

[Hun02] Hund, Marcus: Disparit¨

atsbestimmung aus Stereobildern auf

der Basis von Kostenfunktionen, Universit¨

at Paderborn, Di-

plomarbeit, August 2002

[HW70] Hubel, D. H.; Wiesel, T. N.: Stereoscopic vision in macaque

monkey. Cells sensitive to binocular depth in area 18 of the

macaque monkey cortex. In: Nature 225 (1970), Nr. 5227, S.

41–42

[H¨

am91] H¨

ammerlin, G¨

unther und Hoffmann, Karl-Heinz:Nu-

merische Mathematik. 2. Auflage. Springer-Verlag, 1991

[IK99] Ito, K.; Kunisch, K.: An active set strategy based on the

augmented Lagrangian formulation for image restoration. In:

M2AN Math. Model. Numer. Anal. 33 (1999), S. 1–21

[J¨

ah02] J¨

ahne, Bernd: Digital image processing (5th ed.): concepts,

algorithms, and scientific applications. Springer-Verlag, 2002

[JHG99] J¨

ahne, B. (Hrsg.); Haußecker, H. (Hrsg.); Geißler, P.

(Hrsg.): Handbook Of Computer Vision And Applications.

Bd. 2. Academic Press, 1999

Literaturverzeichnis 133

[Jul60] Julesz, Bela: Binocular depth perception of computer-

generated patterns. In: Bell System Technical Journal 39

(1960), S. 1125–1162

[Kan79] Kanizsa, G. (Hrsg.): Organization in Vision. Praeger, 1979

[KGW01] Kellman, P.J.; Guttman, S. E.; Wickens, T. D.: Geo-

metric and neural models of object perception. In: Shipley,

T. F. (Hrsg.); Kellman, P.J. (Hrsg.): From fragments to ob-

jects: Segmentation and grouping in vision, Oxford, UK: Else-

vier Science, 2001

[Kno00] Knott, Gary D.: Interpolating Cubic Splines. 18. Auflage.

Birkh¨

auser Verlag, 2000

[Kof35] Koffka, K.: Principles of Gestalt psychology. New York :

Harcourt Brace, 1935

[Kos93] Kosmol, Peter: Methoden zur numerischen Behandlung nicht-

linearer Gleichungen und Optimierungsaufgaben. 2. Auflage.

Stuttgart : Teubner, 1993. – ISBN 3–519–12085–2

[Kra63] Krauskopf, J.: Effect of retinal image stabilization on the ap-

pearance of heterochromatic targets. In: Journal of the Optical

Society of America 53 (1963), S. 741–744

[Kra67] Krauskopf, J.: Eeterochromatic stabilized images: A

classroom demonstration. In: American Journal of Psychology

80 (1967), S. 634–637

[Lee96] Lee, Tai S.: Image Representation Using 2D Gabor Wave-

lets. In: IEEE Transactions on Pattern Analysis and Machine

Intelligence 18 (1996), Nr. 10, S. 959–971

[Loc92] Locher, Franz: Numerische Mathematik f¨

ur Informatiker.

Springer-Verlag, 1992

[Mar82] Marr, D.: Vision: a computational investigation into the hu-

man representation and processing of visual information. W.

H. Freeman, San Francisco, 1982

[Mas06a] Massad, A.: A perceptual grouping approach for visual in-

terpolation between good continuation and minimal path using

tensor voting. In: BMVC06 Bd. 2, 2006, S. 639

[Mas06b] Massad, A.: Visual interpolation for long-range contour com-

pletion by perceptual grouping based on tensor voting. In: Pro-

134 Literaturverzeichnis

ceedings of sixth IASTED International Conference for Visua-

lization, Imaging, and Image Processing, 2006, S. 537 – 542

[MBM02a] Massad, A.; Babos, M.; Mertsching, B.: Application of the

tensor voting technique for perceptual grouping to grey-level

images. In: Gool, L. van (Hrsg.): Pattern Recognition, 24th

DAGM Symposium (DAGM2002), 2002, S. 306–313

[MBM02b] Massad, A.; Babos, M.; Mertsching, B.: Perceptual grou-

ping in grey level images by combination of Gabor filtering

and tensor voting. In: Kasturi, R. (Hrsg.); Laurendeau, D.

(Hrsg.); Suen, C. (Hrsg.): ICPR Bd. 2, 2002, S. 677–680

[MBM03] Massad, A.; Babos, M.; Mertsching, B.: Application of the

tensor voting technique for perceptual grouping to grey-level

images: quantitative evaluation, 2003. – Intl. Symposium on

Image and Signal Processing and Analysis

[Mei99] Meister, Andreas: Numerik linearer Gleichungssysteme, Eine

Einfuehrung in moderne Verfahren. Braunschweig, Wiesbaden

: Vieweg Verlag, 1999. – ISBN 3–528–03135–2

[Mer99] Merziger, Gerhard und Wirth, Thomas:Repetitorium

der H¨

oheren Mathematik. 4. Auflage. Binomi Verlag, 1999

[MLT00] Medioni, G.; Lee, M.-S.; Tang, C.-K.: A Computational Fra-

mework for Segmentation and Grouping. Elsevier Science, 2000

[MM01a] Massad, A.; Mertsching, B.: Segmentation of Sponta-

neously Splitting Figures into Overlapping Parts. In: Radig,

B. (Hrsg.); Florcyk, S. (Hrsg.): Pattern Recognition, 23rd

DAGM Symposium, 2001, S. 25 – 31

[MM01b] Massad, Armin; Medioni, G.: 2-D Shape Decomposition into

Overlapping Parts. In: Arcelli, C. (Hrsg.); Cordella, L.

(Hrsg.); Baja, G. S. (Hrsg.): Visual Form 2001, 4th Interna-

tional Workshop on Visual Form (IWVF 4). Capri, Italy, 2001,

S. 398 – 409

[MM02] Massad, A.; Mertsching, B.: Inferring salient features in

images by perceptual grouping with inhibitory and excitatory

tensor fields. In: W¨

urtz, R. (Hrsg.); Lappe, M. (Hrsg.): Dy-

namic Perception (DynPerc 2002). Bochum, 2002, S. 227 –

232

Literaturverzeichnis 135

[MS98] Mokhtarian, Farzin; Suomela, Riku: Robust image corner

detection through curvature scale space. In: IEEE Trans. Pat-

tern Anal. Mach. Intell. 20 (1998), Nr. 12, S. 1376–1381. – ISSN

0162–8828

[MTW99] Mahamud, Shyjan; Thornber, Karvel K.; Williams,

Lance R.: Segmentation of salient closed contours from real

images. In: IEEE International Conference on Computer Vi-

sion (ICCV), IEEE, 1999

[MWTX03] Mahamud, Shyjan; Williams, Lance R.; Thornber, Kar-

vel K.; Xu, Kanglin: Segmentation of multiple salient closed

contours from real images. In: IEEE Trans. on Pattern Analy-

sis and Machine Intelligence 25 (2003), Nr. 4

[Nie02a] Nieder, Andreas: Seeing more than meets the eye: processing

of illusory contours in animals. In: Journal of Comparative

Physiology A: Sensory, Neural, and Behavioral Physiology 188

(2002), Nr. 4, S. 249–260

[Nie02b] Nieder, Andreas: Die Wahrnehmung von Scheinkonturen -

Wie sich das Gehirn Illusionen macht. In: Neuroforum (2002),

Nr. 3, S. 210–217

[NM01] Neumann, H.; Mingolla, E.: Computational neural models

of spatial integration in perceptual grouping. In: Shipley,

T. (Hrsg.); Kellman, P. (Hrsg.): From fragments to units:

Segmentation and grouping in vision. Oxford, UK : Elsevier

Science, 2001, S. 353–400

[Nor89] Nordstrom, K. N.: Biased anisotropic diffusion–a uni-

fied regularization and diffusion approach to edge detection /

EECS Department, University of California, Berkeley. 1989

(UCB/CSD-89-514). – Forschungsbericht

[Pal99] Palmer, Stephen E.: Vision Science: Photons to Phenomeno-

logy. MIT Press, Cambridge, Massachusetts, 1999

[PF05] Prados, E.; Faugeras, O.: Shape from shading: a well-posed

problem? In: Proceedings of CVPR’05, IEEE, 2005

[PH01] Peterhans, Esther; Heitger, Friedrich: Simulation of neu-

ronal responses defining depth order and contrast polarity at

illusory contours in monkey area V2. In: Journal of Computa-

tional Neuroscience 10 (2001), Nr. 2, S. 195–211

136 Literaturverzeichnis

[Pla72] Playboy’s Playmate of the Month - Miss November. In: Playboy

Magazine, Playboy Enterprises, Inc. 11/72 (1972)

[PM90] Perona, Pietro; Malik, Jitendra: Scale-space and edge detec-

tion using anisotropic diffusion. In: IEEE Trans. Pattern Anal.

Mach. Intell. 12 (1990), Nr. 7, S. 629–639

[Por08] Portilla, Javier: BLS-GSM denoising.http://decsai.ugr.

es/~javier/denoise/, 2008 (Abruf: 03.07.2008)

[PSWS03] Portilla, J.; Strela, V.; Wainwright, M.; Simoncelli, E.:

Image denoising using scale mixtures of Gaussians in the wave-

let domain. In: IEEE Trans. Image Proc., 2003

[PZ89] Parent, Pierre; Zucker, Steven: Trace inference, curvature

consistency, and curve detection. In: IEEE Trans. Pattern

Anal. Mach. Intell. 11 (1989), Nr. 8, S. 823–839. – ISSN 0162–

8828

[RGM00] Ross, W. D.; Grossberg, S.; Mingolla, E.: Visual corti-

cal mechanisms of perceptual grouping: interacting layers, net-

works, columns, and maps. In: Neural Netw. 13 (2000), Nr. 6,

S. 571–588. – ISSN 0893–6080

[RT99] Ruzon, Mark A.; Tomasi, Carlo: Corner detection in textured

color images. In: ICCV, 1999, S. 1039–1045

[Sau99a] Saund, Eric: Perceptual organization of occluding contours

generated by opaque surfaces. In: Proceedings of the 1999 Con-

ference on Computer Vision and Pattern Recognition, 1999, S.

624–630

[Sau99b] Saund, Eric: Perceptual organization of occluding contours of

opaque surfaces. In: Comput. Vis. Image Underst. 76 (1999),

Nr. 1, S. 70–82. – ISSN 1077–3142

[SB97] Smith, Stephen M.; Brady, J. M.: SUSAN - a new approach

to low level image processing. In: Int. J. Comput. Vision 23

(1997), Nr. 1, S. 45–78. – ISSN 0920–5691

[Sch00] Schumann, F.: Beitr¨

age zur Analyse der Gesichtswahrneh-

mungen. Erste Abhandlung. Einige Beobachtungen ¨

uber die

Zusammenfassung von Gesichtseindr¨

ucken zu Einheiten. In:

Zeitschrift f¨

ur Psychologie und Physiologie der Sinnesorgane 23

(1900), S. 1–32. – Englische ¨

Ubersetzung durch A. Hogg (1987)

Literaturverzeichnis 137

in The perception of Illusory Contours, S. Petry, G.E. Meyer

(New York: Springer) S. 40-49.

[Sch68] Schwarz, H.: Numerik symmetrischer Matrizen. Stuttgart :

Teubner, 1968

[Spi01] Spillmann, Lothar: Gehirn und Gestalt II. Neuronale Mecha-

nismen. In: Kognitionswissenschaft 9 (2001), Nr. 3, S. 122–143

[ST97] Schmidt, R.F.; Thews, G.: Physiologie des Menschen. 27.

Auflage. Springer, 1997

[SU88] Sha’ashua, Amnon; Ullman, Shimon: Structural saliency:

the detection of globally salient structures using a locally

connected network. 1988 (AIM-1061). – Forschungsbericht.

– 15 S.

[SVO93] Sary, G.; Vogels, R.; Orban, G.A.: Cue-invariant shape

selectivity of macaque inferior temporal neurons. In: Science

260 (1993), S. 995–997

[SW00] Scharr, Hanno; Weickert, Joachim: An anisotropic diffu-

sion algorithm with optimized rotation invariance. 2000. – In

G. Sommer, N. Kruger, C. Perwass (Hrsg.), Mustererkennung

[Tra96] Trapp, Ralph: Entwurf einer Filterbank auf der Basis neuro-

physiologischer Erkenntnisse zur orientierungs- und frequenz-

selektiven Dekomposition von Bilddaten. (1996). – Interner

Bericht Nr. NAVIS 01/96

[Tra98] Trapp, Ralph: Stereoskopische Korrespondenzbestimmung mit

impliziter Detektion von Okklusionen, Universit¨

at Paderborn,

Fachbereich Elektrotechnik, Diss., September 1998

[Wei96] Weickert, Joachim: Anisotropic diffusion in image proces-

sing, Universit¨

at Kaiserslautern, Diss., 1996

[Wei99] Weickert, Joachim: Coherence-enhancing diffusion of colour

images. In: Image Vision Comput. 17 (1999), Nr. 3-4, S. 201–

212

[Wer23] Wertheimer, Max: Untersuchungen zur Lehre von der Gestalt

II. In: Psychologische Forschung 4 (1923), S. 301–350

[WH96] Williams, Lance R.; Hanson, Allen R.: Perceptual comple-

tion of occluded surfaces. In: Computer Vision and Image Un-

derstanding: CVIU 64 (1996), Nr. 1, S. 1–20

138 Literaturverzeichnis

[Wil94] Williams, Lance R.: Perceptual completion of occluded surfa-

ces, Dept. of Computer Science, University of Massachusetts at

Amherst, Amherst, Mass., Diss., 1994

[WJ96] Williams, Lance R.; Jacobs, David W.: Local parallel com-

putation of stochastic completion fields. In: Computer Vision

and Pattern Recognition, CVPR (1996), S. 161–168

[WT00] Williams, Lance R.; Thornber, Karvel K.: A comparison of

measures for detecting natural shapes in cluttered backgrounds.

In: International Journal of Computer Vision 34(2/3) (2000),

S. 81–96

[Yar67] Yarbus, A. L. (Hrsg.): Eye Movements and Vision. Plenum,

1967

[ZF84] Zurm¨

uhl, R.; Falk, S.: Matrizen und ihre Anwendungen.

Berlin, Heidelberg, New York, Tokyo : Springer-Verlag, 1984

[ZT98] Ziou, D.; Tabbone, S.: Edge detection techniques: an over-

view. In: International Journal on Pattern Recognition and

Image Analysis 8 (1998), Nr. 4, S. 537–559

[ZW00] Zweck, John W.; Williams, Lance R.: Euclidean group

invariant computation of stochastic completion fields using

shiftable-twistable functions. In: ECCV (2), 2000, S. 100–116