scieee Science in your language
[en] (orig)
Dreidimensionale Vermessung kreisförmiger
Objekte mittels Luminanz und Tiefendaten
Zur Erlangung des akademischen Grades
Doktor-Ingenieur (Dr.-Ing.)
der Fakultät für Elektrotechnik, Informatik und Mathematik
der Universität Paderborn
genehmigte Dissertation
von
M. Eng. Nan-shan Chen
aus Taiwan
Referent: Prof. Dr. rer. nat. G. Hartmann
Korreferent: Prof. Dr.-Ing. K. Meerkötter
Tag der Mündlichen Prüfung: 17. Juli 2003
D 14-190
Paderborn, 2003
Nomenklatur
Allgemeine:
Eine lineare Abbildung und ihre Matrix teilen dasselbe Symbol, da es ein Isomor-
phismus zwischen den Vektorräumen besteht. Sie werden in der Regel in Fett-Druck
geschrieben, z. B. die Matrizen bzw. Abbildungen A,B,C,etc.; die Vektoren a,b,
c,u,v,w,x,y,n,µ,σ, ..., und die Skalaren a,b,c,µ,σ,m,n,etc.. In kalligra-
phischer Schrift, wie A, wird in der Regel ein Raum dargestellt. Die häufig benutzten
Buchstaben für Räume sind E,U,V,W,R,N. Die Zahlen-Mengen sehen wie N,Z,
Q,R,Caus.
Im euklidischen bzw. unitären Raum ist angenommen, wann immer die Begriffe Or-
thogonalität, Längen- bzw. Winkel-Messung im Kontext essentiell ist. Das kanoni-
sche Skalarprodukt ist impliziert, wenn nicht ausdrücklich specifiert wird. Mit xy
bezeichnen wir also das hermitesche Skalarprodukt für x,yim unitären Raum Un.
Cf. Fußnote 77 auf S. 47.
(u,v)Skalarprodukt der Vektoren uund v
xy x und yin derselben Equivalenzkalsse
V+WSumme von Teilräumen V,W
V W direkte Summe von Teilräumen V,W
V W Teilräume V,Wstehen senkrecht aufeinander
Vdas orthogonale Komplement zum Raum V
V Wdirekte Summe der orthogonalen Räume V,W
kAk2Spektralnorm der Matrix A(vektornorm-induzierte Matrixnorm) 1
kAk2=supx6=0kAxk2/kxk2= supkxk2=1 kAxk2=σ1
kAkFFrobeniusnorm oder Hilbert-Schmidt-Norm der Matrix A
kAk2
F= tr AA= tr AA=Pr
i=1 σ2
i=PPa2
ij
kAkUunitärinvariante Norm mit kUAVkU=kAkU,Uund Vunitär
kvk2euklidische Vektornorm, 2-Norm, `2-Norm des Vektors v
kvkp`p-Norm, p-Norm, Hölder-Norm (P|vi|p)1/p, p 1
1mm-dimensionaler DC-Vektor. Cf. Gl. (2.4.1) auf S. 31.
Arnächste Rang-rApproximation der Matrix A
A=A1unitäre Matrix Aüber C
AT=A1orthogonale Matrix Aüber R
A=Aselbstadjungierte (hermitesche) Matrix Aüber C
AT=Asymmetrische Matrix Aüber R
1[Horn und Johnson, 1985, pp. 290-320, §5.6]
i
ii
NOMENKLATUR
A>0positive Matrix (mit allen Elementen aij >0)
A0nichtnegative Matrix (mit allen Elementen aij 0)
A<0negative Matrix (mit allen Elementen aij <0)
˜
Aspalten-zentrierte Matrix ZA (Cf. Def. 2.4.3 auf S. 32)
Abb. Abkürzung von „Abbildung“
A1Inverse der quadratischen Matrix A
Ageneralisierte Inverse A(1) mit AXA =A
A(1,3) generalisierte {1,3}-Inverse der Matrix A.Cf. Gl. (2.19) auf S. 15.
A(1,2,5) {1,2,5}-Inverse, Gruppen-Inverse der quadratischen Matrix A.
A{1,2,5}Matrizen Xmit AXA =A,XAX =X,AX =XA.
A(1k,2,5) Drazin-Inverse AkADA=Ak,ADAAD=AD,AAD=ADA.
ADDrazin- (kommunierende) Inverse der quadratischen Matrix A
A#Gruppen-Inverse der quadratischen Matrix A
A#AA#A=A,A#AA#=A#,AA#=A#A
A#Existenz R(A)N(A) = Cn Ind(A) = 1 2
A#{1,2,5}-Inverse der quadratischen Matrix A
AMoore-Penrose-Inverse der rektangulären Matrix A
Akomplex Konjugierte der Matrix A= (aij),A= (aij)
ATTransponierte von A: (Au,v) = (u,ATv),u,v
AAdjungierte von A: (Au,v) = (u,Av),u,v
AAdjungierte der Matrix Adurch A=AT=AT
A(A)=A,(AB)=BA,(αA+βB)=αA+βB
Am×nAndeutung der Dimension m×nvon Matrix A
aiZeilenvektor der Matrix A.Cf. Gl. (2.40) auf S. 28
CKörper der komplexen Zahlen
Ctheoretische Kovarianzmatrix eines Zufallsvektors
CAKovarianzmatrix der Matrix Ain Gl. (2.52) auf S. 36
DOA Direction of Arrival
det AProdukt aller Eigenwerte des Operators A[Axler, 1995]
dM(x)Mahalanobis-Distanz von xzum Mittelwertvektor
dM(x,y)Mahalanobis-Distanz zwischen xund y(Cf. Gl. (2.72) auf S. 44)
r
dM(x,y)regularisierte Mahalanobis-Distanz (Cf. Gl. (2.77) auf S. 46)
dim VDimension des Raumes V
dim N(A)Rangabfall, Nullität (Dimension des Nullraums) der Matrix A
e1Standard-Basisvektor [1 0 ···0]T
EP quadratische Matrix Amit AA=AA
E[X]Erwartungswert der Zufallsvariablen X
Eendlichdimensionaler, reeller, linearer Raum mit symmetrisher,
positiv definiter Bilinearform
Enn-dimensionaler euklidischer Raum (cf. Fußnote 76 auf S. 47)
F[·]Fourier Transformation eines 1- oder 2-dimensionalen Skalarfeldes
HHesse-Matrix eines Skalarfeldes Rn7→ R(cf. Fußnote 99 auf S. 69)
ISkalarfeld der Bildintensität R27→ Roder Rn7→ R(cf. Fußnote 88)
IbSkalarfeld der binären Bildintensität R27→ {0,1}(cf. § 3.1 ab S. 59)
IRing der ganzen Zahlen
ı1
=(c)Imaginärteil einer komplexen Zahl c
2[Ben-Israel und Greville, 1974, p. 162]
iii
IIdentitätsmatrix mit geeigneter Dimension
InIdentitätsmatrix der Dimension n×n
Ind AIndex einer quadratischen Matrix A
Ind Ader kleinste nichtnegative ganze Zahl mit rank Ak= rank Ak+1
i. i. d independent identically distributed
Kbeliebiger Körper ohne Einschränkung
K1+16=0 beliebiger Körper mit Charakteristik 6= 2
Kn2Menge aller (n2)-dimenionalen Hyperkreise (Def. 2.4.17 auf S. 49)
κp(A)Konditionsnummber (Inversion) der Matrix A kAkp·kA1kp
Ker AKern oder Nullraum der Matrix A
λider i-te Eigenwert einer Matrix
µAMittelwertvektor der Matrix A
b
µASchätzmittelwertvektor der Matrix AGl. (2.41) auf S. 31
µXErwartungswert der Zufallsvariablen X
N(A)Nullraum oder Kern der Matrix A
N(A)linker Nullraum der Matrix A
N(A)das orthogonale Komplement zu N(A)
N(µ, σ2)Gaußverteilung mit Mittelwert µund Varianz σ2
N(µ, σ2)Gaußverteilung mit Dichtefunktion 1
σ2πe(xµ)2/2σ2
N(µ,C)Gaußverteilung mit Mittelwertvektor µund Kovarianzmatrix C
N(µ,C)Dichte (det C1/(2π)n)1/2exp (1/2)(xµ)C1(xµ)
PV,WProjektor(s) auf Ventlang (parallel zu) Wmit P2
V,W=PV,W
PV,WProjektor(s) mit R(PV,W) = Vund N(PV,W) = W
PVOrthoprojektor(s) auf Teilraum Vmit P2
V=PV=P
V
PR(A)Orthoprojektor(s) auf den Bildraum R(A)von A
PR(A),N(A)(Matrix des) Projektor(s) auf R(A)entlang (parallel zu) N(A)
QKörper der rationalen Zahlen
RPN Range Perpendicular to Nullspace: R(A) N(A)
Rad BRadikal einer Bilinearform bzw. eines Raumes mit Skalarprodukt
RV,WReflektor(s) in Ventlang (parallel zu) Wmit R2
V,W=I6=RV,W
RVOrthoreflektor(s) in Teilraum V, mit R1
V=RV=R
V6=I
R(A)Bildraum (Spaltenraum) der Matrix A
R(A)Zeilenraum der Matrix A
R(A)das orthogonale Komplement zu R(A)
rank ARang der Matrix A
RKörper der reellen Zahlen
<(c)Realteil einer komplexen Zahl c
ρ(A)Eigenwertspektrum der Matrix A
S. Abkürzung von „Seite“
SVD Singulärwertzerlegung (Singular Value Decomposition)
σStandardabweichung (cf. Fußnote 64 auf S. 41)
σXStandardabweichung der Zufallsvariablen X
σ2
XVarianz der Zufallsvariablen X
σ(A)Singulärwertspektrum der Matrix A:{σ1, σ2,...,σmin(m,n)}
σ1der größte Singulärwert der Matrix A
σ2
1Betrag des größten Eigenwerts der Matrix AAoder AA
σrder kleinste nichtverschwindende Singulärwert der Matrix A
Sn1in Eneingebettete Hypersphäre
span{...}Aufspannung bzw. Erzeugung eines linearen Raumes
iv
NOMENKLATUR
span{A}Erzeugung durch Spaltenvektoren der Matrix A
TFnDiskrete Fouriertransformationsmatrix für nPunkte
tr ASpur (trace) der Matrix A
tuiZeilenvektor tui= [u1iu2i···uti]der Matrix Ueiner SVD
t˜uiZeilenvektor t˜ui= [˜u1i˜u2i··· ˜uti]der Matrix ˜
Ueiner SVD
Unn-dimensionaler Unitärraum (cf. Fußnote 77 auf S. 47)
˜
Ulinke Singulärmatrix einer spalten-zentrierten Matrix
˜
Vrechte Singulärmatrix einer spalten-zentrierten Matrix
Var[X]Varianz der Zufallsvariablen X
x(ζ, t)stochastischer Prozeß [Lathi, 1968, Chap. 3]
x(ζ, t)Musterfunktion des stochastischen Prozesses x(t, ζ)
Zmzentrierender Orthoprojektor. Cf. Gl. (2.43) auf S. 32.
Inhaltsverzeichnis
Nomenklatur i
Inhaltsverzeichnis v
1 Einleitung 1
1.1 Problemstellung und Zielsetzung . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Das System und Verweise auf die Abschnitte . . . . . . . . . . . . . . . . 3
1.3 Portierbare Implmentation und Open-Source . . . . . . . . . . . . . . . . . 3
2 Grundlagen 5
2.1 Projektoren und Reflektoren . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.1 Projektor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.1.2 Orthoprojektor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.1.3 Reflektor ............................... 9
2.1.4 Orthoreflektor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1.5 Konstruktion der Projektoren . . . . . . . . . . . . . . . . . . . . . 10
2.1.6 Komplexe Householder-Transformation . . . . . . . . . . . . . . . 11
2.2 Generalisierte Inversen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3 Singulärwertzerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3.1 Berechung der Singulärwertzerlegung . . . . . . . . . . . . . . . . 19
2.3.2 Vier fundamentale Teilräume . . . . . . . . . . . . . . . . . . . . . 22
2.3.3 Eigenschaften der Singulärwertzerlegung . . . . . . . . . . . . . . 25
2.4 Meßdaten und Singulärwertzerlegung . . . . . . . . . . . . . . . . . . . . 28
2.4.1 Der Kondensator ist ein Projektor . . . . . . . . . . . . . . . . . . 29
2.4.2 Kovarianzmatrix via SVD . . . . . . . . . . . . . . . . . . . . . . 36
2.4.3 Mahalanobis-Distanz via SVD . . . . . . . . . . . . . . . . . . . . 38
2.4.4 Kovarianz, Mahalanobis-Metrik und Gaußverteilung . . . . . . . . 41
2.4.5 Regularisierte Mahalanobis-Distanz via SVD . . . . . . . . . . . . 44
2.4.6 Hyperkreis und Regularisierte Mahalanobis-Distanz . . . . . . . . 49
3 Ellipsen 59
3.1 Konturenextraktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.1.1 Canny-Detektor und Gabor-Filterung . . . . . . . . . . . . . . . . 62
3.1.2 Kammdetektor unter Abwesenheit der Orientierungskarte . . . . . 66
3.2 Ellipsenextraktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4 Hyperkreis 77
4.1 Geometrische Filterung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.2 Hyperebene via SVD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
v
vi
INHALTSVERZEICHNIS
4.3 Hyperkreis via SVD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.4 Affinitätstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
5 Ausblick 93
Literaturverzeichnis 97
Index 125
Autorenverzeichnis 135
Abbildungsverzeichnis 139
Kapitel 1
Einleitung
Die kreisförmige Kontur ist eines der wichtigsten geometrischen Merkmale vieler Objekte
im industriellen Alltag. Dreidimensionale Vermessung solcher Objekte stellt kritische In-
formation für verschiedene Aufgaben des künstlichen Sehens zur Verfügung. Präsentiert
werden Verfahren für parametrische Bestimmung eines Kreises im dreidimensionalen eu-
klidischen Raum, mit Generalisierungsmöglichkeit auf endlichdimensionale Räume.
Auf einem Skalarfeld (Intensitätsdaten) mit einem korrespondierenden Vektorfeld (Tie-
fendaten) eines künstlichen Blickes basierend wird untersucht, signifikante Kreise in der
Szene, mit Priorität von Robustheit und geringem Zeitaufwand, parametrisch zu bestim-
men.
Lösungsansätze werden vorgestellt, die die Präzisionsanforderungen am Beispiel einer
robotischen Manipulation der Autoräder erfüllen. Eigenständige, portierbare Implementie-
rungen in ANSI C sind entsprechend präsentiert, die für weitere Untersuchungen der rele-
vanten Teilprobleme sehr wertvoll sind.
Die parametrische Lagebestimmung eines in der Szene vorhandenen Kreises basiert auf
einer Fusion eines Skalarfeldes (Intensitätsbilddaten einer Szene) und eines Vektorfeldes
(durch geeichte Stereokameras geschätzte 3D-Koordinaten derselben Szene). Die Fusion
der beiden Datenquellen ergibt eine Menge der dreidimensionalen Koordinaten, die eine
verrauschte Abtastung des gesuchten Kreises im Raum darstellt. Ein eindimensionaler Kreis
im dreidimensionalen euklidischen Raum wird als „Hyperkreis“ aus dieser Datenmenge pa-
rametrisch bestimmt. Der neue geometrische Begriff „Hyperkreis“ wird eingführt, um die
Problematik und unseren Ansatz auf endlichdimensionale Räume zu generalisieren. Die Im-
plementation ist hyperkreis-basiert und nimmt eine Datenmenge der beliebigen Dimension
auf, was jedoch praktisch nicht immer realisierbar ist.
1.1 Problemstellung und Zielsetzung
Gegeben sind die Bilddaten aus einem geeichten Stereokamerakopf (SONY EVI-310/311)
[Trapp, 1998] im Labor des Fachgebiets GET, Universität Paderborn. Die Daten bestehen
aus zwei Grauwertbildern und einer Tiefenkarte, in der die geschätzten kartesischen Koor-
dinaten in der Kameraszene bezüglich des Kamerakopfes (Abb. 4.6–(b) auf S. 87) einge-
1
2
KAPITEL 1. EINLEITUNG
tragen sind. Diese Tiefenkarte korrespondiert pixelweise mit einem der beiden Intensitäts-
bilder [Trapp, 1998] 3. Aus diesen Daten soll ein in der Szene visuell vorhandener Kreis
parametrisch in demselben Koordinatensystem bestimmt werden. Da dieses Ergebnis für
den Roboterarm (Manutec r2) (Abb. 4.6–(a) auf S. 87) zur Manipulation des Objektes ver-
wendet werden soll, muß die Lage des Zielobjektes hinreichend präzis angegeben werden,
um das Werkzeug relativ zum Objekt ausrichten zu können. Die erforderliche Genauigkeit
am Beispiel der Demontage eines Autorades und entsprechender Werkzeuge sei ca. 1mm
hinsichtlich der „Verschiebung“ und ca. 1Grad in der Orientierung.
(a) (b) (c)
Abbildung 1.1: Intensitätsbild und Tiefenkarte. Bild (a) ist eines der beiden von dem Stereokamera-
kopf aufgenommenen Intensitätsbilder. In Bild (b) werden die Z-Koordinaten, die pixelweise dem Bild
(a) korrespondieren, bezüglich des Kamerakopfes normalisiert und affin auf falsche Farben abgebil-
det. Die undefinierten Vektoren in der Tiefenkarte werden schwarz dargestellt. Das Bild (c) visualisert
das Ergebnis der regularisierten Mahalanobis-Filterung der Z-Koordinaten. Die eigentlichen Werte in
der Tiefenkarte werden nicht geändert, sondern nur die Ausreißer werden ausgeschlossen, indem sie
als die Undefinierten identifiziert werden. Die erst im Kapitel 3 (S. 59) bestimmte Ellipse wird hier
im voraus auf den Bildern gezeichnet.
Wegen inhärenter Ambiguität der Stereopsis und der Gegebenheit der passiven Stereo-
korrespondenzverfahren sind in der Tiefenkarte viele undefinierte Vektoren. Solche sind
in Abb. 1.1-(b) und -(c) schwarz gezeichnet. Unsichere Korrespondenzbestimmungen, die
nicht durch dasselbe Verfahren ausgeschlossen worden sind, werden in der Regel als ex-
trem ausreißende Werte in der resultierenden Tiefenkarte erscheinen, wie z. B. die roten
und orangen Flecken in Abb. 1.1-(b). Solche Art von Rauschen läßt sich nicht effektiv durch
lineare Filterungen entfernen. In Bild Abb. 1.1-(c) werden die „roten oder orangen Ausrei-
ßer“ im Bild-(b) durch eine nicht-lineare Filtering erfolgreich entfernt [Chen et al., 2000].
Dies ergibt sich aus der in § 2.4.5 ab S. 44 definierten regularisierten Mahalanobisdistanz
4. Im Bild-(c) wurde eine Distanzschwelle von 3(pnmfilt) verwendet 5. Dieses Verfah-
ren wird jedoch nicht zur Entfernung der „Ausreißer“ in der Tiefenkarte eingesetzt, denn
wir können in einem späteren Stadium nach der Datenreduktion im Kapitel 3 noch niedri-
geren Rechenaufwand erzielen, während in diesem Verfahren die Berechnung der Moore-
3Ob die linke oder die rechte Kamera des Kopfes ist hier uninteressant. Sie ist arbiträr in [Trapp, 1998] ausge-
wählt worden.
4Es sei darauf geachtet, daß die übliche Definition der Mahalanobisdistanz [Mahalanobis, 1930, 1936] [Everitt,
1998] [Duran und Odell, 1974] in der Praxis problematisch ist und eine Berechnung in jedem Moment zum Absturz
führen kann, denn es handelt sich um die Invertierung einer eventuell singulären Matrix. In diesem Fall ist die
Mahalanobisdistanz nicht definiert. Dies heißt nicht, daß wir mit der Distanzberechnung aufhören müssen, sondern
es existiert eine plausible Regularisierung durch die Moore-Penrose-Inverse, die im Kapitel 2 (S. 5) vorgeschlagen
und diskutiert wird. Ich habe mich gewundert, daß dieses Problem trotz des Recherchierens nirgendwo diskutiert
ist, obwohl die Definition überall zitiert und in der Praxis eingesetzt wird. Wahrscheinlich gehen die Autoren davon
aus, daß eine Kovarianzmatrix aus vollrangigen Daten positiv definit sein müsse. Dies ist in der Praxis leider nicht
der Fall. Oft wird die Kovarianz semidefinit oder sogar indefinit.
5Die „Einheit“ der Distanz wird auf S. 41 und S. 41 im Kapitel 2 diskutiert.
1.2. DAS SYSTEM UND VERWEISE AUF DIE ABSCHNITTE
3
Penrose-Inversen der Kovarianz aller relevanten und irrelevanten Z-Koordinaten involviert
ist. Cf. Abb. 4.11 auf S. 91.
Andererseits stört uns noch immer die Unvollständigkeit der Tiefenkarte, die wir nun als
das diskrete, unvollständige Vektorfeld bezeichnen. Die Anzahl der undefinierten Vektoren
in Abb. 1.1-(b) beträgt ca. 20 % (kdf2pnm) von dem vollen 108 ×118 Vektorfeld. Diese
Ratevariiert vomBild zu Bild je nach der Experimentierumgebungaus nicht vorhersagbaren
Gründen.
Wir fassen die Gegebenheiten zusammen:
1. ein diskretes, vollständiges Skalarfeld mit Intensitätsinformation der Szene, das die
gesuchte Ellispe möglicherweise nur teilweise in der Szene erfasst hat.
2. ein diskretes, unvollständiges Vektorfeld mit Kamerakoordinaten, das mit dem Ska-
larfeld pixelweise korrespondiert und eine unbekannte Rauschstruktur besitzt.
Die beiden sollen als verschiedene sensorische Quellen betrachtet werden, um gesuchte
Information daraus zu gewinnen.
1.2 Das System und Verweise auf die Abschnitte
In Kapitel 2 (S. 5) werden die mathematischen Grundlagen sowie die der Arbeit spezifi-
schen Definitionen und Korollare zusammengefaßt. Es läßt sich als eine selbständige Ein-
heit lesen. Für einen schnellen Durchblick der Arbeit empfiehlt sich jedoch, dieses Kapitel
zu überspringen und nur an der Stelle der Verweise nachzuschlagen. Nichtsdestoweniger ist
das Kapitel ein wesentlicher Bestandteil und der Geist der Arbeit.
1.3 Portierbare Implmentation und Open-Source
Alle Programme, die in dieser Arbeit relevant sind, sind in ANSI/ISO-C geschrieben, um
maximale Portierbarkeit und minimale Resourcen-Forderung zu erzielen. Sie sind mit ver-
schiedenen Compilern und auf veschiedenen Maschinen 6entwickelt und getestet worden.
Ein großer Vorteil der Wahl ist, daß alle Ergebnisse der Arbeit auf verschiedensten
Machinen und Projekten, betriebsystem-unabhängig, sofort compilierbar und einsatzbereit
sind. Keinerlei zusätzliche Software außer einem ANSI/ISO C-Compiler ist erforderlich,
welcher auf praktisch allen Platformen vorhanden ist. Es wurde ein großes Projekt mit vie-
len Hilfsprogrammen und eigenem BLAS. Ein eigenes BLAS zu entwickeln bedeutet auch
die Anpassungsnotwendigkeit jeder einzelnen Routine, falls sie aus fremden Quellen (z. B.
EISPACK, LINPACK, LAPACK) übernommen werden soll. Für die Korrektheit werden die
Ergebnisse stets mit denen von Matlab oder SciLab verglichen bzw. kontrolliert. Sie sind
jedoch im Projekt nicht involviert, sonst verliert die ganze Implementierung die Beweglich-
keit und Wiedereinsetzbarkeit, auf die sehr großen Wert gelegt wird.
6Sun Sparc-Stations mit SunOS/Solaris/Gnu C; Hewlett Packard 200LX Palmtop PC mit MSDOS/Borland
Turbo C; und Compaq LTE ELITE 50 Laptop mit Linux(Debian)/Gnu C; Acer TravelMate 312T mit Li-
nux(Deian)/Gnu C.
4
KAPITEL 1. EINLEITUNG
In der Entwicklung ist ein Floating-Point-Format zum Austausch der Bilder zwischen
den einzelnen Modulen kaum vermeidbar. Zu diesem Zweck wurde das PNM-Format 7auf
PFM (Portable Float Map) erweitert, das die hohe Portierbarkeit von PNM ererbt. Das PFM-
Format schreibt das IEEE-754 Single Preision Format in Big-Endian vor 8. Die Manipula-
tionen und Konvertierungen zwischen PNM, PFM, und Khoros VIFF bzw. KDF Formaten
werden unterstützt, da die Bilddaten aus den Stereokameras in Khoros-Format geliefert wer-
den.
Die Quellcodes sind nicht ad hoc gemacht, sondern für allgemeine Forschungsprojekte
und Wiedereinsetzbarkeit gedacht und produziert worden. Sie werden demnächst im Netz
zur Vefügung gestellt. Projekt-spezifische Aufgaben sind durch die Shell-Skripte auszufüh-
ren, die die einzelnen C-Programme der Teilprojekte aufrufen.
7Gesamtbezeichnung von Portable Bit Map (PBM), Portable Gray Map (PGM) und Portable Pix Map (PPM)
aus dem Packet netpbm.
8Das Magic „P7“ ist für Bilder mit einem Float-Band verwendet; „P8“ für die Zweibändigen, usw. Siehe
PFM(5). Da jedes Pixel vier Bytes belegt, muß ein Endian-System im Format vorgeschrieben werden. Infolgedes-
sen ist eine Routine zur Endian-Detektion und -Konvertierung für die Portierbarkeit auf verschiedene Maschinen
unentbehrlich (z. B. PC in Little-Endian und Sun-Sparc in Big-Endian).
Kapitel 2
Grundlagen
In diesem Kapitel werden die mathematischen Grundlagen zusammengefasst und die No-
menklaturen sowie Notationen vereinbart. In einem etwas ungewöhlichen Stil werden nur
die dieser Arbeit spezifischen bzw. neu eingeführten Definitionen und Korollare durchnu-
meriert. Die wohl etablierten werden wir so nahe wie möglich neben einander stehen lassen.
Infolgedessen sind besonders die Abbildungen Abb. 2.1 auf S. 7 und Abb. 2.2 auf S. 20 nicht
nur anschaulich sondern auch sehr nützlich.
In § 2.1 vereinbaren wir die Begriffe komplementärer, dualer und assoziierter Projektor
und Reflektor. Die meisten Autoren erklären nur die Selbst-Adjungierten als Projektoren
und Reflektoren. Dennoch, mit dieser Einschränkung ignorieren wir die enge Zusammen-
hänge zwischen den Idempotenten und den Involutorischen, die wir verallgemeinernd je-
weils als Projektoren bzw. Reflektoren bezeichnen. Die behauptete Parallelität der Projek-
toren und Reflektoren werden geometrisch und algebraisch in Abb. 2.1 auf S. 7 veranschau-
licht. Die komplexe Householder-Transformation wird diskutiert, die wir u. a. zum Beweis
von Lemma 2.4.27 auf S. 54 in § 2.4.6 verwenden werden.
In § 2.2 werden die Definitionen und Fakten der generalisierten Inversen zusammenge-
fasst. Viele davon werden in Abb. 2.2 auf S. 20 zusammen mit SVD anschaulich relativiert.
Dieser Abschnitt besteht zwar hauptsächlich aus einer kompakten Wiedergabe der existie-
renden Fakten aus unterschiedlicher Literatur, ist die Übersicht für uns in Erörterungen über
die regularisierte Mahalanobis-Distanz in § 2.4.5 ab S. 44 wichtig. Es ist in diesem Kom-
plex ungeeignet, auf die etablierten Fakten einzeln zu verweisen.
In § 2.3 werden die Besonderheiten unserer Implementierung und Anwendung der Sin-
gulärwertzerlegung (SVD) erörtert. Viele Zusammenhänge und Sätze werden anschaulich
in Abb. 2.2 auf S. 20 dargestellt. Es stellt sich heraus, daß diese Abbildung zur Erinnerung
vieler Zusammenhänge höchst praktisch und zum allgemeinen Zweck sehr zu empfehlen
ist.
In § 2.4.1 wird die Handhabung der Meßdaten und die Konvention ihrer Umsetzung in
die Datenmatrizen definiert. Wir legen hier das Wesen der Daten-Zentrierung aus algebrai-
schem und numerischem Aspekt aus. Das affine Wesen der Daten-Zentrierung ist oft in den
mathematischen Formulierungen hinderlich und wird hier linear in einem anderen Raum
als Orthoprojektor auf den AC-Teilraum aufgefasst. Das heißt, die (nicht-lineare) Daten-
Zentrierung wird bei uns als eine (lineare) orthogonale Projektion behandelt. Somit ergibt
5
6
KAPITEL 2. GRUNDLAGEN
sich oft eine kompaktere Darstellungen, wie wir im Beweis vom Lemma 2.4.23 auf S. 52
demonstrativ ausnutzen werden.
In § 2.4.2, § 2.4.3 und § 2.4.4 bringen wir die Begriffe Kovarianzmatrix,Mahalanobis-
Distanz,Gaußsche Dichte und die Singulärwertzerlegung zusammen und sehen, daß alle
Begriffe in der Singulärwertzerlegung enthalten sind. Die Auslegung der Singulärwertzer-
legung wird im Falle einer Datenmatrix anstatt einer linearen Abbildung diskutiert.
In § 2.4.5 generalisieren wir den Begriff Mahalanobis-Distanz, so daß sie auch für ei-
ne Datenmenge erklärt wird, die auf einem affinen Teilraum9mit Dimension kleiner als n
liegt. Dies erfolgt, indem wir im euklidischen Raum Fußnote 76 auf S. 47 eine ausgeartete
Bilinearform einführen. Die Geltung der resultierenden Metrik Fußnote 67 auf S. 44 je-
doch schränkt sich auf das orthogonale Komplement des Radikals [Kaplansky, 1974, p. 7].
(Cf. Abb. 2.2 auf S. 20 die Einschränkungen des Urbildes der Abbildung (A),Aauf den
Zeilenraum R(A)und A,Aauf den Spaltenraum R(A).) Der Gewinn der Generalisie-
rung bzw. Regularisierung ist, daß sich alle Datenmengen unter dierser Metrik theoretisch
und numerisch wohl verhalten werden, insbesondere für die Hyperkreise Cf. Def. 2.4.17 auf
S. 49.
In § 2.4.6 stellen wir einige praktische Korollare über die Hyperkreise, Kovarianzmatrix
und Mahalanobis-Distanz vor.
2.1 Projektoren und Reflektoren
Projektoren (die Idempotenten) und Reflektoren (die Involutorischen) sind prächtige Begrif-
fe, die in linearer Algebra von fundamentaler Bedeutung sind. Orthogonale10 Projektoren
bzw. Orthoprojektor sind zur Darstellung eines Teilraums praktisch, da sich jeder von ih-
nen eindeutig mit einem Teilraum identifiziert vide[Szökefalvi-Nagy, 1967] [Rao und Mi-
tra, 1971] [Boullion und Odell, 1971] [Golub und Van Loan, 1983, 1989, 1996]. Sie sind
essentiell in moderner Konzeption der Lösungen kleinster Quadrate eines linearen Glei-
chungssystems, die wir in § 2.2 gebrauchen werden. Schiefe Projektoren sind ebenfalls zur
Darstellung zweier komplementärer Teilräume besonders kompakt und natürlich.
Nennenswerte Monographien sind [Ficken, 1967, pp. 148–151], [Fekete, 1985, pp. 137–
143] und [Kahan, 1998]. welche die Projektoren und die Reflektoren seltenerweise parallel
behandeln. Denn in der Tat sind die beiden algebraisch und geometrisch untrennbar verkop-
pelt. Vergleiche unsere Abb. 2.1 auf S. 7 mit denen in [Fekete, 1985, p. 141] und [Ficken,
1967, p. 148].
9Ein affiner Teilraum bzw. affiner Unterraum wird auch lineare Varietät (linear variety) genannt. Anschaulich
läßt sich der Begriff affiner Unterraum so konstruieren, indem man den ganzen Vektorraum nach einem bestimmen
Unterraum in nicht-leere, disjunkte Teilmenge so aufteilt (zerlegt), daß jede einzelne Teilmenge zu dem Unterraum
„parallel“ ist. Eine Teilmenge heißt zu einem Unterraum „parallel“, wenn die Differenz zweier beliebigen Vekto-
ren aus der Teilmenge im Unterraum liegt. (NB. Zur Kompaktheit der Erklärung haben wir hier die Bedingung der
„Parallelität“ provisorisch verstärkt.) Zur formaler Konstruktion werden in der Regel die algebraischen Begriffe
Äquivalenzrelation (Reflexivität, Symmetrie und Transitivität), Äquivalenzklasse und Nebenklasse als Grundbau-
steine verwendet. Infolgedessen ist jeder affine Teilraum durch einen eindeutigen Unterraum zu identifizieren und
zu generieren. Die geometrischen Begriffe “Gerade” und “Ebene” beispielsweise werden demnach algebraisch
formalisiert.
10Mit „orthogonal“ ist in diesem Zusammenhang keine lineare Isometrie gemeint, sondern das „senkrechte“
geometrische Verhältnis zwischen der Projektionsrichtung und dem Zielunterraum eines Projektors. Um Misver-
ständnisse zu vermeiden, werden wir anstatt dessen das Wort Orthoprojektor verwenden.
2.1. PROJEKTOREN UND REFLEKTOREN
7
sin(θmin) = 1/kPk2
cos(π/2θmin) = kPk2
P=PV,W= [V 0] [V W]1= (PWPV)=IQ= (I+R)/2 = (IS)/2
Q=PW,V= [W 0] [W V]1= (PVPW)=IP= (I+S)/2 = (IR)/2
R=RV,W= 2PI=PQ=S,R2=I
S=RW,V=I2P=QP=R,S2=I
In=P+Q,Cn=V W,x=y+z
In=P+Q,Cn=VW,x=y0+z0
u
0
V=R(P) = N(IP)
=N(Q) = R(IQ)
=R(I+R) = N(IR)
=N(I+S) = R(IS)
-
W
W=R(Q) = N(IQ)
=N(P) = R(IP)
=R(I+S) = N(IS)
=N(I+R) = R(IR)
u
(32,18)
Ix
I
r(-32,-18)
Ix
s
(9,18)
y=Px
P
s
(-14,18)
Rx = (2PI)x
= (I2Q)x
= (PQ)x
=Sx
R
r(-9,-18)
Px
s
(23,0)
z=Qx = (IP)x
Q
s
(14,-18)
Sx = (2QI)x
= (I2P)x
= (QP)x
=Rx
S
r(-23,0)
Qx = (PI)x
s
(0,34) y0=PW,Vx=Px
s(-32,50)
Rx= (2PI)x
= (PQ)x
s
(32,-16) z0=PV,Wx=Qx
s
(32,-50) Sx= (2QI)x
= (QP)x
r
(0,-34)
Px
r
(-32,16)
Qx
6
W=R(P) = N(IP)
=N(Q) = R(IQ)
HHHHHHHHHHHHHHHHHHH
Hj
H
H
H
H
H
H
H
H
H
H
H
V=R(IP) = N(P)
=N(IQ) = R(Q)
H
H
Abbildung 2.1: Komplementäre und duale Projektoren sowie ihre assoziierten Reflektoren.
Durch die komplementären Teilräume V,Wund den Vektor xin Cnwerden diese Zusam-
menhänge induziert. Diese Abbildung ist mittels L
A
TEX-picture in mm berechnet und ge-
zeichnet worden, wobei V= span{V}= span{[1 2]T},W= span{W}= span{[1 0]T},
P=PV,W= [V 0][V W]1= [0 0.5; 0 1],P= [0 0; 0.4 0.8],θmin 63.4und
der Beispielvektor x= [32 18]T. Diese Abbildung wird zwar in R2gezeichnet, deren Gel-
tung (bis auf die klein beschrifteten Koordinaten der Vektoren) ist jedoch generell für Cn
gedacht. Für höhere dimensionale Räume sei darauf geachtet, daß Vund Wkomplementäre
Teilräume seien.
8
KAPITEL 2. GRUNDLAGEN
2.1.1 Projektor
Idempotenz ist eine fruchtbare Abstraktion aller scheinbar trivialen Phänomene, bei der die
wiederholte Anwendung einer Operation das Ergebnis der ersten Anwendung nicht mehr
verändert. In linearer Algebra erkennen wir die Projektionen, ob senkrecht oder schief, als
idempotente Abbildungen. In anderen Worten, alle idempotenten Abbildungen bezeichnen
wir hier als Projektoren.
Alle idempotenten Abbildungen bezeichnen wir hier als Projektoren [Halmos, 1958,
pp. 73–78]. Ein Endomorphismus P:Cn7→ Cnheißt Projektor, wenn er idempotent ist.
Bild und Kern des Projektors sind komplementär und seine Spur ist gleich dem Rang, das
heißt
P2=P=Cn=R(P)N(P)
tr P= rank P= dim R(P).(2.1)
Wegen der Idempotenz sind die Eigenwerte eines Projektors entweder 1oder 0(λ2=λ).
Umgekehrt, besitzt eine quadratischen Matrix nur Eigenwerte 1und 0, dann stellt die Matrix
einen Projektor dar. Die algebraische Vielfachheit des Eigenwertes 1ist gleich dem Rang,
der Spur, und der Dimension des Bildraumes des Projektors. Der Bildraum eines Projek-
tors ist also nicht nur ein invarianter Teilraum, sonder jeder Vektor in ihm wird unter der
Projektion festgelassen. Die Projektion findet statt entlang oder parallel zu [Stewart, 1963,
p.108] [Griffel, 1989a, pp. 109–112] einem Teilraum, den wir als Richtungsteilraum be-
zeichnen Der Richtungsteilraum der Projektion ist der Kern des Projektors. Die Dimension
des Kerns ist die algebraische Vielfachheit des Eigenwertes 0. Die Summe der Dimensio-
nen des Bildraumes und des Richtungsteilraums eines Projektors in Cnist n. Sie sind also
komplementäre Teilräume. Dies ist die Anatomie eines Projektors. Siehe Abb. 2.1 auf S. 7.
Ist die Matrix Pein Projektor, dann sind auch die Matrizen
IP,P,IP
Projektoren, wobei IPder komplementäre und Pder duale Projektor von Pgenannt
werden sollen (Abb. 2.1 auf S. 7). Bei einem Projektor Psprechen wir von einer Projek-
tion aller Vektoren im Raum auf den Teilraum R(P)entlang (parallel zum) des Teilraums
N(P). Mit PV,Wbezeichnen wir einen Projektor mit dem Bild Vund Kern Wwie in
Abb. 2.1 auf S. 7 dargestellt ist. Die durch einen Projektor Phervorgerufenen bzw. defi-
nierten komplementären Teilräume R(P) = N(IP)und N(P) = R(IP)haben ein
geometrisches Verhältnis, das zum Teil durch einen Minimalwinkel [Ipsen und Meyer, 1995,
Fig. 1]
θ= sin11
kPk2
,kPk21(2.2)
zu charakterisieren ist. V. et. Abb. 2.1 auf S. 7. Wir sehen in Gl. (2.1) auf S. 8, daß jeder
Projektor auf zwei komplementäre Teilräume aufgebaut und vollständig durch sie zu cha-
rakterisieren ist. Umgekehrt, für jedes Paar zweier komplementärer Teilräume gib es genau
zwei komplementäre Projektoren, die die zwei Teilräume als Bild und Kern enthalten.
2.1.2 Orthoprojektor
Ist ein Projektor Pselbstadjungiert, so heißt er Orthoprojektor (orthogonaler Projektor),
denn der Bildraum ist orthogonal zum Nullraum. Die Darstellungsmatrix eines Orthopro-
jektorsisteinSonderfallder sogenannten EP-Matrizen und besitzt immer eine Spektralnorm
2.1. PROJEKTOREN UND REFLEKTOREN
9
von 1. Die EP-Matrizen besitzen viele wichtigen Eigenschaften, die in § 2.2 aufgelistet wer-
den. Wir schreiben hier allerdings vorweg, daß u. a.,
P2=P=P=
Cn=R(P)N(P)
Cn=R(P)N(P)
P2=P=P=P
.(2.3)
2.1.3 Reflektor
Wie bei der Idempotenz der Fall, ist auch die Involution eine fruchtbare Abstraktion aller
Phänomene, bei der die zweite Anwendung einer Operation die erste Anwendung annuliert.
Für die Vektoren aus einem linearen Raum erkennen wir die Spiegelung, ob senkrecht oder
schief, als eine involutorische Abbildung. Alle involutorischen Abbildungen werden wir hier
als Reflektoren bezeichnen11, obgleich nur sehr wenig Autoren es tun.
Alle involutorischen Abbildungen werden wir hier als Reflektoren bezeichen12, obgleich
nur sehr wenig Autoren es tun. Ein Endomorphismus R:Cn7→ Cnheißt Reflektor, wenn
er involutorisch ist, das heißt, wenn
R2=I6=Roder I6=R=R1.(2.4)
Ein Operator Ris genau dann ein Reflektor, wenn er die Differenz zweier komplementären
Projektoren ist [Fekete, 1985, p. 141]. Die Eigenwerte eines Reflektors sind entweder 1oder
1. Umgekehrt, besitzt eine quadratische Matrix nur Eigenwerte 1und 1, dann ist sie ein
Reflektor. Ist Rein Reflektor, so ist gewiss auch Rein Reflektor, der der komplementäre
Reflektor von Rheißen soll. Anders als ein Projektor, der im allgemeinen einen nicht-tri-
vialen Kern besitzt, ist ein Reflektor hingegen ein Automorphismus (bijektive Abbildung).
Es besteht eine Bijektion [Fekete, 1985, pp. 140–141] zwischen den Reflektoren und den
Projektoren durch die Beziehung
R= 2PI,oder P= (I+R)/2.(2.5)
Die Anatomie eines Reflektors ist also mit seinem assoziierten Projektor untrennbar gekop-
pelt. Ein Reflektor läßt sich nämlich durch das Bild und den Kern des assoziierten Projektors
vollständig charakterisieren. Der Spiegel eines Reflektors ist genau der Bildraum des asso-
ziierten Projektors. In anderen Worten, die assoziierten Projektor und Reflektor teilen einen
Teilraum gemeinsam als jeweils der Bildraum und der Spiegel. Die Dimension des Spiegels
ist die Vielfachheit des Eigenwertes 1. Der Spiegel ist nicht nur ein dem Reflektor invarianter
Unterraum, sondern jeder Vektor im Spiegel wird in sich selber abgebildet. Die Spiegelung
bzw. Reflektion findet statt entlang (parallel zu) [Ficken, 1967, p. 149] des Eigenraumes mit
dem Eigenwert 1. Dieser invariante Raum des Reflektors nennen wir Richtungsteilraum
des Reflektors.
Ein Reflektor Rin Cnzerlegt somit den Raum, durch die Bijektion (2.5) mit einem
Projektor, auf zwei komplementäre Teilräume R(P) = R(I+R)und N(P) = N(I+R),
11Dies wird normalerweise als Involution bezeichnet wie z. B. in [Fekete, 1985, p. 140]. Viele Autoren nennen
einen Operator erst dann „Reflektor“, wenn er selbstadjungiert (bzw. symmetrisch) ist. Wir folgen hier [Kahan,
1998] und nennen alle involutorischen Operatoren mit (2.4) Reflektoren oder Schief-Reflektoren. Die selbstadjun-
gierten Reflektoren nennen wir Orthoreflektoren (orthogonale bzw. senkrechte Reflektoren). Der Grund, warum wir
hier alle Involutionen Reflektoren nennen, wird in Abb. 2.1 auf S. 7 deutlich. Die Resultate hier gelten für lineare
Räume über allgemeine Körper K1+16=0 [Ficken, 1967, p. 149].
10
KAPITEL 2. GRUNDLAGEN
d. h. (Vgl. (2.1)),
R2=I6=R=Cn=R(I+R)N(I+R).(2.6)
Ein Operator ist genau dann ein Reflektor, wenn er die Differenz zweier Projektoren ist.
V. et. Abb. 2.1 auf S. 7.
2.1.4 Orthoreflektor
Ein selbstadjungierter Reflektor Rheißt Orthoreflektor (orthogonaler Reflektor), denn die
mit ihm assoziierten Teilräume R(I+R)und N(I+R)(2.6), (2.1) stehen senkrecht
aufeinander.
R2=I6=R=R=Cn=R(I+R)N(I+R).(2.7)
Die Householder-Spiegelung [Witt, 1937, 1998] [Kaplansky, 1974, p. 17] [Householder,
1975] [Laurie, 1997a,b] ist ein Beispiel der Anwendung von der orthogonalen Spiegelung.
Siehe auch Bemerkung 2.4.29 auf S. 56.
2.1.5 Konstruktion der Projektoren
Sei V Cn,V 6={0}ein Teilraum. Seien die Spalten der Matrix Vminimal erzeugend für
V. Dann ist der Orthoprojektor auf V
PV=V(VV)1V.(2.8)
Infolgedessen sind alle Orthoprojektoren auf die vier fundamentalen Teilräume einer linea-
ren Abbildung in Abb. 2.2 auf S. 20 durch die SVD bereits gegebenen.
Seien V,W Cnkomplementäre Teilräume. Seien Spalten der Matrizen Vund W
jeweils minimal erzeugend für Teilräume Vund W. Dann ist der Projektor PV,Wauf V
entlang W[Meyer, 2000, p. 386]
PV,W= [ V|0] [ V|W]1= [ V|W]I 0
0 0 [V|W]1.(2.9)
Seien Vund Wkomplementäre Teilräume in Cn. Seien PVund PWOrthoprojektoren
auf Vund W. Dann ist der Projektor PV,Wauf Ventlang Wgegeben durch 13
PV,W=PV(PV+PWI)2PW.(2.10)
Seien V,W Cnzwei komplementäre Teilräume und xCnein beliebiger Vek-
tor, dann ist dadurch ein Verhältnis von Spiegelungen und Projektionen entstanden, wie in
Abb. 2.1 auf S. 7 dargestellt wird. Umgekehrt, bei jedem Projektor PCn×nsind zwei
Teilräume charakteristisch: R(P)und N(P), wobei der Kern N(P)die Richtung der Pro-
jektion bestimmt. R(P)und N(P)sind die invarianten Teilräume jeweils zum Eigenwert
13Dank sei Prof. Zdislav V. Kovarik, McMaster University, Hamilton, Ontario, Canada, für den Hinweis der
Formel Gl. (2.10) auf S. 10 aus seinem Aufsatz [Kovarik, 1977].
2.1. PROJEKTOREN UND REFLEKTOREN
11
1und 0. Bei einem Reflektor RCn×nsind jedoch R(R)und N(R)trivial, denn ein
Reflektor ist ein Automorphismus. Für einen Reflektor Rsind der „Spiegel“ und die „Rich-
tung der Spiegelung“ charakteristisch. Solche sind aber genau die beiden charakteristischen
Teilräume, R(P)und N(P), des assoziierten Projektors P= (I+R)/2. Der Spiegel
und die Richtung der Spiegelung sind also R(I+R)und N(I+R). In anderen Worten
ist der Spiegel des Reflektors genau der Eigenraum zum Eigenwert 1und der Richtungs-
teilraum der Spiegelung der Eigenraum zum Eigenwert 1. Die Bijektion R= 2PI
bzw. P= (I+R)/2verbindet die Idempotenten und die Involutorischen und macht die
Projektoren und die Reflektoren untrennbar. (Siehe Abb. 2.1 auf S. 7.) Daher haben wir
alle Idempotenten die Projektoren gennant, und alle Involutorischen die Reflektoren. Die
Selbstadjungierten haben wir alsoOrthoprojektorenundOrthoreflektoren genannt. Es beste-
he kein Grund, die Nicht-Hermiteschen auszusondern, wie es die meisten Autoren pflegen.
Die „Schiefen“ haben genau so hohen Anspruch auf die Namen Projektor und Reflektor wie
die „Senkrechten“ bzw. Selbstadjungierten. Ein „schiefer Spiegel“ mit dem optischen Nor-
mal ungleich dem Oberflächen-Normal mag ungewöhnlich sein. In der Tat werden solche
industriell hergestellt, obgleich die Auflösung solcher optischen Instrumente eingeschränkt
ist. Mit noch groberer Körnigkeit sehen wir schiefe akustische Spiegel in den Konzerthal-
len (u. a. in der Paderhalle). Auch für solche sei die Bezeichnung Reflektor geeignet. Den
Umweg, zunächst den Begriff Reflektion auf die hermiteschen Involutionen einzuschrän-
ken, dann wiederum die Involutorischen mit „skew reflection“ [Fekete, 1985, p. 142] oder
„reflection of Xin Yalong Z[Ficken, 1967, p. 149] anzureden, halten wir für unnötig.
2.1.6 Komplexe Householder-Transformation
Bei der Householder-Transformation handelt es sich um eine Isometrie, die einen gegebe-
nen Vektor xauf einen anderen vorgegebenen Vektor yabbildet [Householder, 1972, 1975].
Diese Technik wird oft in numerischen Verfahren verwendet, um Nullen in eine Matrix unter
Similarität einzuführen. Zu diesem Zweck konstruierte A. S. Householder „elementary re-
flectors“ oder „elementary Hermitians“, die symmetrisch und involutorisch sind. Die Grun-
didee ist zwischen den Vektoren xund yeine Spiegelung Hzu bilden, so daß der Vektor
xin die Richtung des Vektors yabgebildet wird. Da in den meinsten Texten das Verfahren
nur im reellen Fall vorgestellt und diskutiert wird, gehen viele davon aus, daß eine komplexe
Version des Verfahrens mittels Ersetzens des Transponierens durch das Adjungieren (hermi-
tesches Transponieren) aus dem reellen Fall erfolgt. Überraschenderweise funktioniert das
Verfahren bei den komplexen Vektoren nicht, sondern es wird xy=yxvorausgesetzt.
Diese Bedingung ist zwar original in [Householder, 1972, 1975] erwähnt worden, sie wird
jedoch selten zur Kenntnis genommen und vorgestellt. Eine direkte Übertragung der reel-
len Householder-Spiegelung auf komplexe Fälle mittels Ersetzens der Transponierten durch
hermitesche Transponierte versagt, so daß nicht einmal der Teilraum span {y} Cner-
reicht werden kann. Weiterhin wird in der Anwendung oft ein reeller Vielfacher vom Vek-
tor ybenötigt. Dieser Umstand bleibt meines erachtens nur in einem kleineren Fachgebiet
bekannt 14 [Laurie, 1997a,b] [Householder, 1972, 1975] [Lehoucq, 1996] [Sun, 1995] [Wil-
kinson, 1965a] [Dubrulle, 1996]. Es stellt sich heraus, daß das Verfahren modifiziert werden
muß, um den zweiten Vektor yerreichen zu können, mit dem Preis, daß die Matrix nicht
mehr selbst-adjungiert und involutorisch sein wird. Der erste Vektor xwird nach wie vor
als x/kxk2in der ersten Zeile der resultierenden Matrix beibehalten, falls y=e1,nicht
14zitiert in der Reihenfolge des Heraussuchens der Literatur.
12
KAPITEL 2. GRUNDLAGEN
aber in der ersten Spalte 15.
Das Versagen der Householder-Transformation bei komplexen Vektoren läßt sich wie
folgt zeigen. Sei Hx =βy, wobei x,yCn,H=H=H1Cn×n, wie es bei
der reellen Householder-Transformation der Fall ist. Dann muß xHx =βxygelten. Ein
Widerspruch entsteht jedoch dadurch, daß die linke Seite xHx stets reell ist, während der
Imaginärteil der rechten Seite βxynicht immer verschwindet.
Seien x,yCn,x,y6=0. Gesucht wird eine Matrix UCn×n, so daß Ux =
βy, β R. Eine unitäre Lösung Uist
U=I(1 + eıθ)P=Ux =kxk2
kyk2
y,(2.11)
wobei der Orthoprojektor P, der Householder-Vektor vund ein Winkel θgegeben sind
durch
P=v v
vv,v=x
kxk2±y
kyk2
, θ = 2(xv).(2.12)
Die Matrix Ukann in einer möglichst ähnlichen Form wie im reellen Fall (cf. Abb. 2.1 auf
S. 7) umgeschrieben werden als
U=I2αP, α =1 + eıθ
2,(2.13)
oder, wie es Prof. Dirk Laurie in [Laurie, 1997a,b] formuliert hat als
U=IPωP, ω =vx
vx=eıθ.(2.14)
Die Matrix Uis nun im allgemeinen nicht Hermitesch und nicht involutorisch aber stets
unitär, denn aus P2=P=Pfolgt UU=UU=I. Wenn y=ei(i= 1,...,n), dann
gilt
Ux =kxk2
kyk2
y=∓kxk2ei.
Daraus ergibt sich
x/kxk2=e
iU=die i-te Zeile der Matrix U. (2.15)
Dieses Nebenprodukt der Transformation wird sehr oft als Hauptzweck zur Basisvervoll-
ständigung oder Berechnung des orthogonalen Komplements bzw. des Kernes von einem
einzeiligen System eingesetzt.
Ist (xy)R, d. h., xy=yx, so ist
xv=xx
kxk2±y
kyk2=xx
kxk2±xy
kyk2
=xx
kxk2±yx
kyk2=x
kxk2±y
kyk2x=vx.
15Die Erscheinung des Vektors xin der Matrix ist eine direkte Konsequenz der unitären Abbildung. Meines
erachtens sprechen zu viele Menschen von „der ersten Spalte“ der Householder-Matrix. Dies ist nicht allgemein
gültig und sollte nicht den Nachkommenden gelehrt werden.
2.1. PROJEKTOREN UND REFLEKTOREN
13
Ist vx=xv, da y=±kyk2(vx/kxk2), so gilt
xy=±xkyk2vx
kxk2=±kyk2xvxx
kxk2
=±kyk2vxxx
kxk2=±kyk2vx
kxk2x=yx.
Daraus folgt
xy=yx xv=vx(2.16)
und
θ= 0 oder ω= 1 (xy)ist reell.(2.17)
Im Falle (xy)Rreduzieren sich Gl. (2.11) auf S. 12, Gl. (2.13) auf S. 12 auf den
Hermiteschen und involutorischen Elementar-Reflektor.
Wir haben die komplexe Version der Householder-Transformation deswegen in der
Form von Gl. (2.13) auf S. 12 bzgl. θund Ppräsentiert, weil
der Winkel θkein Beliebiger ist, sondern essentiell bei der Einführung
des hermiteschen Skalarproduktes über Centstanden ist. Die stellt die
Besonderheit aus, daß das hermitesche Skalarprodukt in unitären Räumen
nicht reellwertig und nicht kommutativ ist Fußnote 77 auf S. 47. Dadurch
entsteht ein Phasen-Winkel, der in unitären Räumen von fundamentaler
Bedeutung sein soll. Allerdings wird dieser Winkel, meines erachtens,
nicht in der Literatur mit einem Namen angesprochen, obwohl er einen
verdiene.
die Form I2Pbeibehalten werden kann. Diese Form deutet darauf hin,
daß die o. a. unitäre Abbildung immerhin mit dem komplementären Re-
flektor des assoziierten Projektors (IP) auf den (n1)-dimensionalen
Halbierungsteilraum zusammenhängt. Cf. Gl. (2.5) auf S. 9 und Abb. 2.1
auf S. 7.
Mit der „luxuriösen“ Ausstattung eines Skalarproduktes werden die geometrischen Be-
griffe Länge eines Vektors und Winkel zwischen zwei Vektoren in einen linearen Raum
eingeführt. Infolgedessen ist der lineare Raum zugleich mit einer induzierten Norm und
einer induzierten Metrik versehen. Das Wesentliche von einem Skalarprodukt ist, „das geo-
metrische Verhältnis“ zweier Vektoren x,ydurch eine Bilinearform bzw. eine hermitesche
Form (x,y)zu bestimmen. Dies dürfe gedacht werden als eine Art gewichtete oder nicht
gewichtete „Kreuz-Korrelation“. Im Falle einer Bilinearform über Rist das „Verhältnis“
(x,y) = cos ψp(x,x)(y,y)R
durch den Winkel ψund die quadratischen Längen (x,x)und (y,y)beschrieben. In an-
deren Worten gehören die Länge und der Winkel dem „Inhalt“ dieses „geometrischen Ver-
hältnisses“ zweier Vektoren. Im Falle einer hermiteschen Form über Cist das „Verhältnis“
zwischen zwei Vektoren x,yC
(x,y) = (a+)p(x,x)(y,y)C, a, b R.
Da (x,y)nun komplex ist, haben wir außer den beiden Längen noch zwei reelle Werte, die
„das Verhältnis“ beschreiben. Ergo ist der Winkel φ=(x,y)von fundamentaler Bedeu-
tung außer dem Betrag |(x,y)|16. Das heißt, die Beschreibung des „Verhältnisses“ zweier
16Der Betrag des komplexen Skalarproduktes definiert einen Winkel mit |(x,y)|= cos ψp(x,x)(y,y)der
dem Minimalwinkel [Ipsen und Meyer, 1995] entspricht. (matstat -wv) Fußnote 17 auf S. 14
14
KAPITEL 2. GRUNDLAGEN
komplexer Vektoren durch die Längen und einen einzigen reellen Wert alleine kann nicht
vollständig sein17. Die Entstehung dieses Winkels muß Konsequenzen haben, was im reel-
len Fall nicht vorhanden ist. Daß in Gl. (2.11) auf S. 12 und Gl. (2.12) auf S. 12 der Winkel
θ= 2φbenötigt wird, hätte uns nicht überraschen sollen. Dieser Winkel φdes Skalar-
produktes erscheint auch beim komplexen Gram-Schmidt-Schritt [Gram, 1883] [Schmidt,
1907a, p. 442] falls die Reihenfolge des Skalarprodukts vertauscht ist. In diesem Fall ver-
sagt das Verfahren und der resultierende Vektor ist nicht orthogonal zum gewünschten Vek-
tor, sondern das Skalarprodukt wird von dem „Winkel des Skalarproduktes“ φ=(xy)
abhängen. Deshalb ist empfehlenswert, bereits im reellen Fall das Skalarprodukt im Ortho-
gonalisierungs-Schritt in der „richtigen“ Reihenfolge zu schreiben.
In der Tat war A. S. Householder (1904–1993) nicht der erste, der sich mit solch einem
Problem beschäftigt hat. Ernst Witt (1911–1991) hat 1937 [Witt, 1937, 1998] die Existenz
einer orthogonalen Transformation zwischen Vektoren mit gleicher Länge auf beliebigen
Körpern K1+16=0 bewiesen. Bela von Szökefalvi-Nagy [Szökefalvi-Nagy, 1967] hat im Hil-
bertraum über die unitären Abbildungen diskutiert, die einen Teilraum zum anderen abbil-
den. Seine Ergebnisse sind uns genau so hilfreich wie die Householder-Transformation für
den Beweis vom Lemma 2.4.27 auf S. 54. Allerdings muß dies wieder modifiziert werden,
wenn ein reeller Vielfacher des Ziel-Vektors erwünscht ist. Die Abwandlung erfolgt wieder
durch Einführung vom Winkel φdes Skalarproduktes. (Siehe nagy.m.)
2.2 Generalisierte Inversen
In der Computer-Vision sind viele Inversionsprobleme zu lösen. Die Grundlage zur Lö-
sungen solcher Probleme stellt vor allem die theoretische Entwicklung der generalisierten
Inversen dar, welche u. a. auch durch die Singulärwertzerlegung numerisch zuverlässig zu
berechnen sind (siehe matstat.c -i,ginv.c und pinv.c).
Die für den Autor hilfreichsten Monographien zum Thema sind [Rao und Mitra, 1971]
[Boullion und Odell, 1971] [Albert, 1972] [Ben-Israel und Greville, 1974] [Kuhnert, 1976]
[Cline, 1979] [Campbell und Meyer, 1979]. Für Testmatrizen siehe [Gregory und Karney,
1969][Opitz,1995][Higham,1995][Chen,1998 pinv*.*, ginv*.*, drazin*.*].
1. (Geometrische) Moore-Bedingungen [Bjerhammer, 1951a,b] [Moore, 1920] [Moore,
1935]:
AX =PR(A),
XA =PR(X).(2.18)
17 Für weitere Diskussionen über das Verhältnis und die kanonischen Winkel bzw. Hauptwinkel (principal
angles) zwischen den Teilräumen sei die folgende Sammlung der Literaturen aufgelistet (in chronologischer Rei-
henfolge): [Jordan, 1875] [Afriat, 1957] [Davis, 1958] [Zassenhaus, 1964] [Kato, 1966] [Davis und Kahan, 1970]
[Shilov, 1971, pp. 244–245, p. 373] [Hohn, 1973, p. 373] [Stewart, 1973a] [Björck und Golub, 1973] [Afriat
et al., 1975] [Stewart, 1977] [Wedin, 1982] [Golub und Van Loan, 1983, pp. 20–24] [Golub und Van Loan, 1983,
pp. 425–431] [Vandewalle und De Moor, 1988, p. 56] [Stewart und Sun, 1990] [Ritov, 1992] [Ipsen und Meyer,
1995] [Stewart, 1998, pp. 74–76] [Stewart, 1999, pp. 7–8] [Meyer, 2000, pp. 450–459]. V. et. Usenet-Post von
Prof. Pertti Lounesto in angle03 und Notiz [Chen, 2001].
2.2. GENERALISIERTE INVERSEN
15
2. (Algebraische) Erweiterte Penrose-Bedingungen [Penrose, 1955, 1956]:
(1) AXA =A
(1k)AkXA =Ak
(2) XAX =X
(3) AX = (AX)
(4) XA = (XA)
(5) AX =XA.(2.19)
3. Die (eindeutige) Lösung Xder Gleichungen (1),(2),(3) und (4) in Gl. (2.19) auf S. 15
stimmt mit der in Gl. (2.18) auf S. 14 überein. Solche wird daher die Moore-Penrose-
Inverse (oder einfach Pseudoinverse) der Matrix Agenannt und oft mit Abezeich-
net. Die Moore-Penrose-Inverse wird bei manchen Autoren auch mit {1,2,3,4}-In-
verse bezeichnet. Es ist üblich, die Numerierung in Gl. (2.19) auf S. 15 zur Bezeich-
nung allermeinerer Lösungen zu benutzen, die eine Untermenge der Bedingungen in
Gl. (2.19) auf S. 15 erfüllen.
4. Mit ADbezeichnen wir die (eindeutige) Drazin-Inverse der Matrix A. Sie wird auch
{1k,2,5}-Inverse genannt, da sie die (1k), (2) und (5) in Gl. (2.19) auf S. 15 erfüllt
[Drazin, 1958] [Meyer, 2000, p. 399].
5. Eine kleinste-quadrate-lösende Inverse A(1,3) ist eine Matrix aus den {1,3}-Inversen.
6. Für die Orthoprojektoren gilt A2=A=A=A=A.
7. Sei ACn×n. Die folgenden Aussagen äquivalent: 18
(a) Die Gruppeninverse der quadratischen Matrix Aexistiert.
(b) Ahat Index 1.
(c) rank A= rank A2.
(d) Der Bildraum der Matrix A„schrumpft“ nicht mit dem Potenzieren.
(e) Der Kern der Matrix A„wächst“ nicht mit dem Potenzieren.
(f) R(A)und N(A)sind komplementäre Teilräume.
(g) Cn×n=R(A)N(A).
8. Sei ACn×n. Die folgenden Aussagen sind äquivalent: 19
(a) Die Matrix Ahat Index k.
(b) rank Ak= rank Ak+1.
(c) Der Kern von Ahört mit dem Wachsen auf am Ak.
(d) Das Bild von Ahört mit dem Schrumpfen auf am Ak.
9. Besitzt eine Matrix ACn×nIndex 1, so ist die Drazin-Inverse ADgliech der
Gruppeninverse A#.20
10. Sei ACn×nund Ind A=k, dann 21
(a) Die Kette der Nullräume hört auf zu wachsen am N(Ak).
18[Ben-Israel und Greville, 1974, pp. 162–163] [Ben-Israel und Greville, 1974, p. 162, Theorem 1, p. 165, Ex. 6]
19[Meyer, 2000, p. 395]
20[Campbell und Meyer, 1975]
21[Meyer, 2000, pp. 394–397] [Meyer, 2000, p. 395, Property 3, 4] [Ficken, 1967, p. 280]
16
KAPITEL 2. GRUNDLAGEN
(b) Die Kette der Bildräume hört auf zu schrumpfen am R(Ak).
(c) R(Ak)und N(Ak)sind invariante Teilräume unter A.
(d) R(Ak)N(Ak) = 0.
(e) R(Ak) + N(Ak) = Cn.
(f) R(Ak)N(Ak) = Cn.
(g) R(Ak)und N(Ak)sind invariant unter A.
11. Sei Aeine EP-Matrix, dann hat Aden Index 1. [Ben-Israel und Greville, 1974, p. 162,
Ex. 7].
12. Sei ACn×n. Die folgenden Aussagen sind äquivalent: 22
(a) Aist mit Avertauschbar.
(b) AA=AA.
(c) R(A) = R(A).
(d) N(A) = N(A).
(e) Cn=R(A)N(A).
(f) Ax =λx Ax=λx.
(g) Aist EP oder RPN (range perpendicular to nullspace).
(h) Aist bild-hermitesch (bild-symmetrisch).
(i) Es existiert eine Matrix Ymit A=YA
(j) A#=A=AD.
13. Weitere Anmerkungen 23:
(a) Die EP-Matrizen (mit AA=AA) konstruieren eine größere Kategorie als
die der normalen Matrizen und haben eine „gute“ Spektraleigenschaft.
(b) AAist der Orthoprojektor in den Raum R(A).
R(AA) = R(A) = R(AA),(2.20)
(c) AAist Orthoprojektor in den Raum R(A)
R(AA) = R(A) = R(AA) = R(A).(2.21)
(d) AADist ein Schiefprojektor in den Raum R(Ak)entlang des Raumes N(Ak).
IAADist der komplementäre Projektor in den Raum N(Ak)entlang R(Ak).
2.3 Singulärwertzerlegung
Der Schwerpunkt dieses Kapitels liegt in der Singulärwertzerlegung (SVD) und ihrer zahl-
reiche Anwendungen in dieser Arbeit. Fast alle linearen Verfahren haben wir mit diesem
„Algebraischen Schweizer Messer“ in ANSI-C Programmiersprache realisieren und im Pro-
jekt einsetzen können, obgleich hier und da Alternativen zur Verfügung stünden [Chen et al.,
2000]. Eine Wiederholung ist nicht beabsichtigt, sondern die Aufgabenspezifischen und die
Unentbehrlichen oder selten Angesprochenen werden diskutiert.
22[Katz, 1965] [Ben-Israel und Greville, 1974, pp. 163–166] [Campbell und Meyer, 1979, p. 74, Theorem 4.3.1].
[Campbell und Meyer, 1979, p. 129, Theorem 7.3.4], [Koliha, 1999]. [Meyer, 2000, p. 408]
23[Campbell und Meyer, 1979, p. 74] [Griffel, 1989b, p. 152] (ginv.tex ca. p. 46.) [Campbell und Meyer, 1979,
p. 12, Theorem 1.2.2] [Meyer, 2000, p 400]
2.3. SINGULÄRWERTZERLEGUNG
17
Alle Matrizen sind diagonal, reell und positiv semidefinit (cum grano salis). Dies ist
eine weitere kanonische Form aller Matrizen in Cm×nunter der Singulärwertzerlegung.
Durch die Auswahl einer geeigneten Basis führt die Ähnlichkeitstransformation aller qua-
dratischen Matrizen zu Jordanscher Normalform. Durch Auswahl zweier geeigneten Basen,
sowohl in Domäne als auch in Kodomäne, werden alle Matrizen zu einer diagonalen Form,
die stets reell und positiv semidefinit ist. Die diagonalen Elemente werden Singulärwerte
genannt. Die Basisvektoren heißen die linken und die rechten Singulärvektoren.
Die SVD wird langsam in der Gesellschaft der Mustererkennung bekannt und ange-
wandt obwohl sich die Existenz der SVD (nicht in endgültiger Form) auf die Jahre 1873
[Beltrami, 1873] und 1874 [Jordan, 1874a,b] zurückführen läßt. Meines Erachtens lassen
sich die Ingenieure nämlich meistens nur überzeugen, wenn ein Verfahren effizient und zu-
verlässig zu realisieren ist. Dies geschah in ALGOL60 am Anfang der 70’er Jahre [Golub
und Kahan, 1965] [Golub und Reinsch, 1970a] [Golub und Reinsch, 1970b] [Wilkinson und
Reinsch, 1971]. Der sogenannte Golub-Kahan-Reinsch-Algorithmus wurde in Fortran 77
übersetzt [Forsythe et al., 1977]. Bis 1986 erschienen noch Kommentare wie der folgende:
„...this approach is not ...the most convenient (a library routine for computing
the singular value decomposition might not be available, on a microcomputer,
for example.)“ [Higham, 1986]
Es war sogar noch im Jahre 1998 schwierig, eine zuverlässige Implementierung in ANSI-
C zu finden 24, denn die meisten Numeriker bleiben nach wie vor bei Fortran. Fortran is
zwar die effiziente und aktuelle Mainstream-Sprache für die Numerischen Aufgaben, jedoch
haben wir uns wegen industrieller Einsetzbarkeit und Portierbarkeit für C entschieden. Es
sei darauf hingewiesen, daß noch bis heute eine C-Routine für SVD nicht ohne weiteres
einzusetzen ist! Sondern, sie muß sorgfältig und weitgehend getestet werden, bevor man
sich überhaupt auf das Ergebnis und die Stabilität der Routine verlassen kann.
Obwohl die Berechnung der SVD oft relativ teurer ist als die von Fall zu Fall an spezi-
elle Matrizenstruktur angepaßten Algorithmen, hat es uns hinsichtlich der Rechenzeit nicht
viel ausgemacht, denn in der vorhandenen Arbeit handelt sich noch meistens um kleinere
Matrizen (d. i., mit Anzahl der Elemente kleiner als 512 ×512). Hinzu kommt, daß die
Rechenleistung der Maschinen noch stark am Steigen ist 25. Dies ist überhaupt ein Grund
dafür, warum wir uns mit einem in den siebziger Jahren veröffentlichten Algorithmus noch
heute auseinandersetzen müssen.
Ein nennenswerter Vorteil der SVD ist die Beidhändigkeit in der Theorie und in der
Praxis (im Vergleich zu anderen Formen wie die Jordansche). Daher kann auch in der Pra-
xis theoretische Gedanken parallel geführt werden und umgekehrt Cf. Abb. 2.2 auf S. 20.
Jedoch ist eine „ForTran“ (Formula Translation) in der Numerik ein Tabu hinsichtlich der
24Der Golub-Kahan-Reinsch-Algorithmus wurde in LINPACK, EISPACK und LAPACK (in Fortran 77) in-
tegriert und aus LAPACK wurde auch CLAPACK für C abgeleitet. Auch in der beliebten, etwas umstrittenen
Monographie [Press et al., 1992] wurde die o. g. Algorithmus in C übersetzt. Es sei bemerkt, daß die SVD-Rou-
tine svdcmp.c in [Press et al., 1992] nicht ohne weiteres für kritische Zwecke einzusetzen ist! Denn es gibt ein
Beendigungsproblem in der QR-Iteration. Die Terminierung der Iteration verläßt sich nämlich auf einen Unterlauf
der Fließkomma-Zahlen (x+a== a, x a). Dank Prof. Peter Spellucci in TU Darmstadt wurde mir dieses
Problem schnell erhoben. (videsvdcmp.crp.) Die Fortran-Quellcodes werden meistens maschinell (z. B. f2c)
und nicht in die einheimische Konvention der C-Sprache übersetzt, z. B. mit Array-Indexierung ab 1, was ich im-
mer zu vermeiden versuche. Denn eine Grenzenprüfung wäre bei vielen „bounds-checkers“ nicht möglich. Ein C-
Programm, das noch nie durch Grenzenprüfung intensiv getestet worden ist, sei, meiner Erfahrung nach, niemals
zuverlässig.
25Zur Arbeit benutzt der Autor einen 233 MHz SISD CISC-Prozessor mit einem ungebremsten Betriebssystem.
18
KAPITEL 2. GRUNDLAGEN
Effizienz, Genauigkeit und Stabilität. Die Numeriker haben dennoch Konsens, daß numeri-
sche Operationen durch orthogonale Transformationen wie bei der SVD stabil bleiben im
Gegensatz zu denen via z. B. Jordanform, von der in der Praxis nur abzuraten ist, trotz
der theoretischen Eleganz. Für eine historische Übersicht der Entwicklung der SVD sei
[Stewart, 1992b] ein hilfreicher Aufsatz, in dem auch die Rechenbarkeit 26 und zahlreiche
Anwendungen wie z. B. in der PCA (Principal Component Analysis) 27, oder im Procru-
stesproblem 28angesprochen werden. Obwohl die Lösung des Procrustesproblems und deren
Generalisierungen 29viele Anwendungen in Computer-Vision findet, werden die originalen
Beiträger oft nicht genannt 30. Auch deswegen ist [Stewart, 1992b] sehr zu empfehlen.
SVD ist u. a. deswegen in der Mustererkennung ein wichtiges Werkzeug da zahlreiche
Probleme in diesem Gebiet wesentlich schlecht-gestellt (ill-posed) [Hadamard, 1923] (oder
„nichtkorrekt“ [Kuhnert, 1976, p. 59]) sind. Die SVD dient nämlich weitgehend als robustes
Mittel zur Regularisierung eines schlecht-gestellten Problems [Hansen, 1987, 1989, 1990,
1998]. Die Gewinnung der Moore-Penrose-Inversen ist ein Beispiel dafür, denn die Moore-
Penrose-Inverse ist keine stetige Funktion der Elemente der eigentlichen Matrix [Stewart,
1969] [Campbell und Meyer, 1975] [Noble, 1976, p. 251] [Campbell und Meyer, 1979§10]
und eine beliebig kleine Störung an einer rang-defizienten Matrix Akann eine beliebig
große Abweichung der Pseudoinversen Aerregen [Campbell und Meyer, 1979, p. 247,
Unpleasant fact] [Noble, 1976]. Dieses „nichtkorrekte“ Problem der Berechnung der Moo-
re-Penrose-Inversen Ader Matrix Akann durch SVD regularisiert werden [Campbell und
Meyer, 1979, p. 247]. Allerdings ist dies nicht blind in der Praxis anzuwenden [Press et al.,
1992, pp. 61–64]. Die Variation der Singulärwerte unter Störung der zu zerlegenden Ma-
trix ist beschränkt durch die Spektralnorm der Störungsmatrix. [Lawson und Hanson, 1974,
p. 23], [Horn und Johnson, 1985, p. 419, Corollary]. [Stewart und Sun, 1990, pp. 259–269]
[Gill et al., 1991, p. 196, §5.8.4] [Stewart, 1991] [Stewart, 1992c] [van der Veen et al., 1993]
[Hansen, 1998, p. 20] [Stewart, 1992b] [Golub und Van Loan, 1996, p. 449, Corollary 8.6.2]
[Higham, 1996]
Mit der Zeit dehnen sich schnell die Anwendungen der SVD auf zahlreiche Gebiete aus
31, darunter findet man inzwischen auch Patenten 32. Dies liegt nach meiner Sicht daran,
daß SVD die meisten, wenn nicht alle, Eigenschaften a priori linearer Entitäten auf einmal
verdeutlicht sowohl theoretisch, als auch technisch.
26[Golub und Kahan, 1965] [Golub und Reinsch, 1970a] [Golub und Reinsch, 1970b]
27[Hotelling, 1933] [Hotelling, 1933] [Karhunen, 1946] [Loève, 1955]
28[Green, 1952] [Fan und Hoffman, 1955] [Hurley und Cattell, 1962] [Schöneman, 1966] [Higham, 1986] [Rao,
1980] [Stewart, 1992b] [Golub und Van Loan, 1996, p. 601]
29[Green, 1952] [Fan und Hoffman, 1955] [Schöneman, 1966] [Hurley und Cattell, 1962] [Higham, 1986] [Rao,
1980] [Stewart, 1992b] [Golub und Van Loan, 1996, p. 601]
30wie z. B. der oft zitierte [Arun et al., 1987] und seine Zitierenden. Siehe [Stewart, 1992b] für die originalen
Breiträger und eine gute Übersicht der Singulärwertzerlegung.
31[Furnas et al., 1988] [De Moor et al., 1988] [Deprettere, 1988] [Scharf, 1991] [Vaccaro, 1991] [Berry et al.,
1994a] [Moonen und De Moor, 1995] [Landauer und Dumais, 1997]
32Patents: „Computer information retrieval using latent semantic structure“. U. S. Patent No. 4,839,853, Jun 13,
1989. Patent: „Computerized cross-language document retrieval using latent semantic indexing“. U. S. Patent No.
5,301,109, Apr 5, 1994.
2.3. SINGULÄRWERTZERLEGUNG
19
2.3.1 Berechung der Singulärwertzerlegung
Alle Matrizen ACm×nlassen sich auf Faktoren UCm×m,ΣRm×nund V
Cn×nzerlegen, das heißt 33
A
|{z}
m×n
=U
|{z}
m×m
Σ
|{z}
m×n
V
|{z}
n×n
,(2.22)
mit
U=U1,V=V1,Σ0,
wobei Uund Vunitär sind, und die quadratische Partition oben links der Σ,Cf. Gl. (2.26)
auf S. 22, diagonal und positiv semidefinit ist. Wir bezeichnen mit Vdie Hermitesch Trans-
ponierte der Matrix V. In dieser Arbeit werden unitäre Matrizen auch orthogonal genannt,
wenn als Grundkörper Rangenommen ist, was meistens der Fall ist in der vorliegenden
Arbeit. 34 Die Abb. 2.2 auf S. 20 dient von nun an zur Übersicht, die auf einmal viele kom-
plexen Zusammenhänge umfaßt, die durch eine SVD auf jeder Matrix hervorgerufen wird.
Die Formulierung Gl. (2.22) auf S. 19 wird meistens in Beweisführungen benutzt und
ist relativ ungünstig in unserer Realisierung. Ohne Verlust der Äquivalenz schreiben wir
A
|{z}
m×n
=U
|{z}
m×n
Σ
|{z}
n×n
V
|{z}
n×n
,(2.23)
wobei A,UCm×n,ΣRn×nund VCn×n. Die Variation von Gl. (2.22) auf S. 19
zu Gl. (2.23) auf S. 19 hat in unserer Realisierung folgende Vorteile:
1. Die rechnerische Komplexität der in dieser Arbeit benutzten Routinen für die SVD
[Golub und Reinsch, 1970a] [Golub und Reinsch, 1970b] auf SISD-Architektur ist
etwa O(mn2)geschätzt [Golub et al., 1980] [Golub und Van Loan, 1996, pp. 253–
254] [Pan und Hamdi, 1996]. Somit ergibt sich ein niedrigerer Rechenaufwand wenn
n < m.
2. Eine SVD-Routine kann die Matrix Uin situ der Eingabematrix Azurückliefern,
was in den Implementierungen üblich ist.
3. Im Falle einer „schlanken“ Matrix A(m > n), fordert die Matrix Uin Gl. (2.23) auf
S. 19 viel weniger Speicher als in Gl. (2.22) auf S. 19, was bei uns meintens der Fall
ist.
4. Inunseren Matrizen-Eingaberoutinen 35 insogenannter „Zeilendominanter“Program-
miersprache C ist es günstiger, eine „schlanke“ ASCII Matrix mit m > n einzulesen
als eine „Fette“ mit m < n. Ebenfalls läßt sich eine „schlanke“ Matrix im Speicher
einfacher aktualisieren.
Es lohnt sich an dieser Stelle, Gl. (2.22) auf S. 19 und Gl. (2.23) auf S. 19 zu vergleichen
und die Unterschiede aufzulisten, denn wir benutzen hier Gl. (2.23) auf S. 19 während in
33Eugenio Beltrami (1835–1899) [Beltrami, 1873], Camille Jordan (1838–1921), James Joseph Sylvester (1814–
1897), Erhard Schmidt (1876–1959) [Schmidt, 1907a,b] und Hermann Weyl (1885–1955) [Stewart, 1992b].
34[Forsythe et al., 1977] [Dewilde und Deprettere, 1988] [Golub und Van Loan, 1996, pp. 69–74]
35matsrc0/matio.c und matsrc1/matio1.c
20
KAPITEL 2. GRUNDLAGEN
Cm= span{U}
. &
Cm=R(A)N(A)
Im=U1U
1+U2U
2
[U1] [U2]
(AA–invariante Unterräume)
PR(Ak),N(Ak)=AAD=ADA
PR(A)=U1U
1=AAPN(A)=U2U
2=IAA
=AA(1,3) =IAA(1,3)
Projektion (r) Projektion (mr)
R(A) = R(AA) = R(AA) = N(A) = N(A) = N(AA) =
R((A)) = A(Cn) = A(R(A)) = N(AA) = R(IAA) = R(A)
R(AA) = R(UΣU) = R(UV)
CmSpaltenraum >linker Nullraum Cm
z }| {
R(A) = span{u1,...,ur}z}| {
span{ur+1, . . . , um}=N(A)
0U.
(A),A/R(A)A,A
/R(A)ldim R(A) = dim R(A) = r
dim R(A) + dim N(A) = n
0V-
R(A) = span{v1,...,vr}
|{z }
span{vr+1,...,vn}=N(A)
| {z }
CnZeilenraum Nullraum Cn
R(A) = R(A) = R(AA) = N(A) = N(AA) = N(AA) =
R(AA) = A(Cm) = A(R(A)) = N((A)) = R(IAA) = R(A) =
R((AA))N(AA) = N(VΣV) = N(UV)
Projektion (r) Projektion (nr)
PR(A)=V1V
1=AA PN(A)=V2V
2=IAA
PN(Ak),R(Ak)=IAAD=IADA
(AA–invariante Unterräume)
[V1] [V2]
In=V1V
1+V2V
2
Cn=R(A)N(A)
- %
Cn= span{V}
Abbildung 2.2: Singulärwertzerlegung und fundamentale Räume. Die Singulärwertzerlegung A=
UΣV, der Fundamentalsatz der linearen Algebra und die generalisierten Inversen. Es sei darauf
geachtet, daß diese Abbildung nach Gl. (2.22) auf S. 19 anstatt Gl. (2.23) auf S. 19 bis auf den Polar-
Faktor UVin Gl. (2.38) auf S. 27 und Gl. (2.39) auf S. 27 zu interpretieren ist.
2.3. SINGULÄRWERTZERLEGUNG
21
den meisten Literaturen und theoretischen Erörterungen Gl. (2.22) auf S. 19 impliziert wird
ohne diese Situation in der Praxis anzusprechen. Nota bena: Abb. 2.2 auf S. 20 entspricht
Gl. (2.22) auf S. 19 bis auf den Polar-Faktor UV, der nur für Gl. (2.23) auf S. 19 gilt
wegen unpassender Dimension.
Da Σ„diagonal“ und Vstets n×nist, liegt die Diskrepanz allein in der Anzahl der
Spaltenvektoren in Cmder Matrix Uin Gl. (2.23) auf S. 19. (Siehe Abb. 2.2 auf S. 20.) Die
Matrix Uin Gl. (2.23) auf S. 19 besitzt die gleiche Dimension m×nwie Aund ist generell
nicht-quadratisch. Sie kann also keine unitäre Matrix sein mit
U=U1,(2.24)
sondern eine subunitäre Matrix oder eine partielle Isometrie36mit
U=U,(2.25)
wobei Udie Moore-Penrose-Pseudoinverse der Matrix Uist.
m > n:Ist die Matrix A„groß und schlank“, so erhalten wir „zu wenig“ linke Singulär-
vektoren in Cmin der Matrix Ufür die Erzeugung des ganzen Raumes Cmund linken
Nullraumes N(A). Dies ist glücklicherweise ohne weiteres zu umgehen. Bei bedarf
des linken Nullraums N(A)einer Matrix A, können wir einfach anstatt A, die Ad-
jungierte Azerlegen, denn A=VΣU. Wir erhalten also den linken Nullraum
der eigentlichen Matrix Aan der Stelle vom „rechten“ Nullraum der Matrix A. Dies
gilt gewiss auch für den Raum Cm, falls eine orthonormale erzeugende Menge benö-
tigt wird. Die Aufspannung vom Cmund N(A), die im Falle m > n in Gl. (2.23)
auf S. 19 betroffen wird, stellt also kein Problem dar und findet wichtige Anwen-
dungen in dieser Arbeit37. In diesem Fall gilt UU=I, denn Ubesitzt immerhin
orthonormale Spalten.
m < n:Ist die Matrix A„klein und dick“, so erhalten wir „zu viele“ linke Singulärvekto-
ren. Wir haben in Σn×nstets mindestens nmverschwundene Singulärwerte. Die
rechten nmSpaltenvektoren in Usind redundant fürs die Erzeugung von Cmund
müssen linear abhängig sein von den restlichen mSpalten der Matrix U. In diesem
Fall setzen wir 0an den Stellen von den rechten nmSpalten für die Orthogona-
lität aller Spaltenvektoren in der Matrix U. Sie müssen also nicht berechnet werden,
denn sie entsprechen den nmgleicherweise stets verschwundenen Singulärwerten
in Σ.Nota bena: Ukann nun nur als partielle Isometrie oder subunitäre Matrix (mit
Gl. (2.25) auf S. 21) bezeichnet werden, denn sie besitzt einen nicht-trivialen Kern
der Dimension nm.
36 Eine partielle Isometrie UCm×nis eine Isometrie Cn7→ Cmmit Einschränkung (restriction) vom
Urbild auf den Teilraum R(U) = N(U), d. h., eine Isometrie in Cnmit dem Nullraum ausgeschlossen. Sie
bildet alle Vektoren aus R(U), dem orthogonalen Komplement zu N(U),isometrisch in den Raum R(U)ab.
Eine partielle Isometrie darf nicht-quadratisch und sogar rang-diffizient sein. Sie ist eine Verallgemeinerung der
Isometrie. Darüber hinaus ermöglicht die partielle Isometrie, die Polarform der quadratischen Matrizen für nicht-
quadratische Matrizen zu generalisieren. Eine partielle Isometrie besitzt nur die Singulärwerte 1oder 0. [Halmos,
1958, pp. 150–170 ] [Boullion und Odell, 1971, pp. 33–38, Theorem 3] [Ben-Israel und Greville, 1974, pp. 252–
254, Theorem 3]. [Campbell und Meyer, 1979, pp. 71–72, Theorem 4.2.1] [Higham, 1986] [Golub und Van Loan,
1996, pp. 149–151]
37 Die Aufgabe der Erzeugung vom ganzen Raum ist nicht mittels Gram-Schmidt-Orthonormalisierung [Gram,
1883] [Schmidt, 1907a, p. 442] zu erfüllen. Das Gram-Schmidt-Verfahren ist ein Verfahren zur Orthonormalisie-
rung einer vorhandenen Menge der linear unabhängigen Vektoren. Es vervollständigt die „fehlenden“ Basisvekto-
ren nicht. Mit Hilfe der SVD wird jedoch aus einem einzigen Vektor ein vollständiges Erzeugendensystem für den
ganzen Raum erhalten. Sei xCn. Sei UΣV=x. Dann ist das orthogonale Komplement von span {x}
durch die rechten n1Spalten der Matrix Vausgespannt. Der Vektor xist als ein komplexes Vielfach in der
ersten Spalte der Matrix Venthalten. Abb. 2.2 auf S. 20 verdeutlicht diese Anwendung.
22
KAPITEL 2. GRUNDLAGEN
Da SVD eine rang-auflösende Zerlegung [Stewart, 1992a] ist, schreiben wir auch für
eine rang-rMatrix Ain partitionierter Form
Am×n="U1
|{z}
m×r
U2
|{z}
m×(nr)#Σr×r0
0 0 V
1}n×r
V
2}n×(nr)
=U1U2Σr×r0
0 0 V
1
V
2(2.26)
oder ausgeschrieben
A= [u1u2...ur|ur+1 ...un]
σ1...
σr
0
v
1
v
2
.
.
.
v
r
v
r+1
.
.
.
v
n
,(2.27)
wobei σidie Singulärwerte, uidie linken Singulärvektoren und vidie rechten Singulär-
vektoren der Matrix Agenannt werden. Ohne Verlust der Generalität werden die von Null
verschiedenen Singulärwerte nach
σ1σ2 ··· σr>0(2.28)
sortiert 38. Diese Konvention is bei vielen wichtigen Aussagen über die SVD sowie in ihren
Anwendungen vorteilhaft. Bei Bedarf müssten sie nach dem Aufruf der eigentlichen SVD-
Routine explizit sortiert werden, denn eine Sortierung ist in dem Algorithmus nicht impli-
ziert. Eine geometrische Anschauung der Singulärvektoren uiund vials Basisvektoren,
wenn die Matrix Aals lineare Transformation zu betrachten ist, ist in Abb. 2.3 auf S. 23 aus
[Tomasi, 1999] dargestellt. Mit der Existenz der Zerlegung Gl. (2.22) auf S. 19 sind also
alle generellen Matrizen in Cm×n(m=noder m6=n)„diagonalisierbar“ im Gegensatz
zur Spektralzerlegung, wobei eine Klasse von Defektiven Matrizen vorkommt, die sich nicht
diagonalisieren lassen.
2.3.2 Vier fundamentale Teilräume
Mit fundamentalen Teilräumen [Strang, 1993] einer linearen Abbildung meinen wir
R(A) = span {u1,...,ur} span {ur+1,...,un}=N(A),(2.29)
R(A) = span {v1,...,vr} span {vr+1,...,vn}=N(A),(2.30)
die explizit durch die Singulärvektoren der SVD einer Matrix Aorthonormal aufgespannt
werden. Wir nennen R(A)den Bildraum oder Spaltenraum der Matrix A;N(A)den lin-
ken Nullraum der Matrix A, welcher orthogonal und komplementär zu R(A)in Cmsteht;
N(A)den Nullraum der Matrix A; und R(A)den Zeilenraum der Matrix A, welcher
orthogonal und komplementär zu N(A)in Cnsteht. In Abb. 2.2 auf S. 20 ist eine Anschau-
ung bildlich dargestellt über die wichtigsten Zusammenhänge zwischen den fundamentalen
38Wir sortieren die Singulärwerte zusammen mit den Singulärvektoren in der Praxis nur bei Bedarf mit einem
modifizierten Quick-Sort in svdsort.c.
2.3. SINGULÄRWERTZERLEGUNG
23
2
x
1
x
v2
v1
2 2
2
v’
1
v’
2
y
y1
u3
y3
u
σ
2 2
u
σ
1 1
σ
2 2
u’ σ
1 1
u’
x
ξ
ξ1
ξ
η
η1
y
η
Abbildung 2.3: Geometrische Anschauung der Singulärwertzerlegung. SVD ist eine Auswahl zweier
Basen einer linearen Abbildung von sowohl {v1,...,vn}in der Domäne, als auch {u1,...,um}in
der Kodomäne, so daß sich die Abbildung zur bloßen nicht-negativen, reellen Skalierung reduziert.
Die Skalierung wird durch das Singulärspektrum {σ1,...,σn}alleine beschrieben. Das Singulär-
spektrum charakterisiert vollständig die Gestalt der Abbildung. Zwei verschiedene lineare Abbildun-
gen unterscheiden sich nur durch das Singulärspektrum (cum grano salis). (Nutzung der Zeichnung
mit freundlicher Genehmigung von Herrn Carlo Tomasi, Robotics Laboratory, Department of Com-
puter Science, Stanford University, 6. März 2000) [Tomasi, 1999]
24
KAPITEL 2. GRUNDLAGEN
Teilräumen [Strang, 1993], Projektoren,Moore-Penrose-Inversen 39 und den orthogonalen
Raumzerlegungen, die bei jeder Matrix Abzw. linearer Abbildung apriorisch zu Stande
kommt und durch eine Singulärwertzerlegung dargeboten sind. Worin liegt die „Fundamen-
talität“? Dies hat G. Strang in [Strang, 1993] nicht erklärt. Die Fundamentalität liege in der
Apriorität 40 vierer Teilräume. Nach I. Kant sei der Wissenschaftliche Prozeß die Synthese
neuer Erkenntnisse a priori, d. h., Wiederentdeckung oder Schöpfung der erfahrungsunab-
hängigen Existenz. Und diese Apriorität ist dieselbe Apriorität der Singulärwertdarstellung
einer linearen Abbildung, denn in den Faktoren ist nichts anderes als explizite Aufspannung
aller vier Räume. Die Singulärwerte erzählen bloß etwas über die Ausdehnung der Teilräu-
me und die Gestalt der linearen Abbildung Cf. Abb. 2.3 auf S. 23. Die Existenz der SVD
identifiziert sich also mit der vierer fundamentaler Teilräume einer linearen Abbildung.
Schränken wir uns auf den Grundkörper einer linearen Abbildung auf Cein, so identifi-
ziert sich die SVD mit jeder linearen Abbildung. Dies sei die Fundamentalität der SVD 41.
Zum Argument hilft uns ggf. die Eindeutigkeit der SVD einer linearen Abbildung. In der
Literatur herrscht ausschließlich
Die Singulärwertzerlegung ist eindeutig, wenn ...
Wir sagen aber
Die Singulärwertzerlegung ist eindeutig.
Selbstverständlich ist dies in einer anderen Pragmatik ausgesagt. Wir sprechen nämlich
nicht von den einzelnen Singulärvektoren, sondern den Singulärräumen.
Definition 2.3.1 (Singulärraum). Ein Raum heißt linker bzw. rechter Singulärraum, wenn
er durch alle linken bzw. rechten Singulärvektoren zu demselben Singulärwerte aufgespannt
ist.
Die Eindeutigkeit der SVD ist also eine unmittelbare Folgerung, wenn die Granularität
der Pragmatik von Singulärvektoren auf Singulärräume untergesetzt ist. Die übliche Erklä-
rung mit der Vorzeichenänderungsfreiheit der Singulärvektoren und Drehung einer Basis
würde die wichtige Eindeutigkeit der SVD verdecken. Unsere Definition eines Singulär-
raumesist eigentlich nichts Neues, sondern steht in Parallelität zu der von einem Eigenraum.
Cf. Abb. 2.2 auf S. 20. Bei einem Eigenwertproblem suchen wir nicht die einzelnen Eigen-
vektoren, sondern die Eigenräume. Und dies hat eine direkte Konsequenz in numerischer
Stabilität der meisten Algorithmen 42. Die Dimension des Singulärraums ist die Vielfachheit
des assoziierten Singulärwertes. Unter dem Aufspannen der Räume Cmund Cndurch alle
linken und rechten Singulärvektoren verstehen wir jetzt die direkte Summe der Singulärräu-
me. Das Aufspannen durch Singulärvektoren ist nicht eindeutig, aber die direkte Summation
von den Singulärräumen ist eindeutig.
Der obere Block von Abb. 2.2 auf S. 20 ist die linke Matrix UCm×m, der untere
Block die rechte Matrix VCn×nder SVD einer Matrix ACm×nnach Gl. (2.22)
39[Lawson und Hanson, 1974, pp. 237–239] [Kuhnert, 1976, pp. 18–21][Campbell und Meyer, 1979, p. 12,
Theorem 1.2.2] [Ipsen und Meyer, 1995] [Meyer, 2000, pp. 424–428]
40im Kantschen Sinne [Kant, 1781]
41Dies ist bei der Spektralzerlegung nicht der Fall, denn sie ist wegen der defektiven bzw. nicht-diagonalisier-
baren Matrizen in diesem Kontext „unvollständig“.
42Die Studierenden würden sich sonst überraschen, wenn sie eines Tages in der Numerik zusehen müssen, wie
ein Eigenvektor zu tanzen anfängt, während sich zwei Eigenwerte zusammen treffen.
2.3. SINGULÄRWERTZERLEGUNG
25
auf S. 19. Die Spaltenvektoren der Matrizen Uund Vspannen jeweils den Raum Cmund
Cnorthonormal auf. Die Räume Cmund Cnwerden jeweils bei Existenz jeder Matrix
Aapriorisch in zwei orthogonal komplementäre Teilräume durch direkte Summe zerlegt.
Parallel zu solcher werden die beiden Identitäten, Imund In, jeweils in zwei komplementäre
Orthoprojektoren durch die Matrizenaddition zerlegt.
Die beiden Zerlegungen führen insgesamt zu vier fundamentalen Teilräumen und ent-
sprechenden Orthoprojektoren. Es sei eine vertikale Linie in der Mitte der Abb. 2.2 auf
S. 20 vorgestellt, die sowohl konkret die Matrizen Uund Vpartitioniert als auch abstrakt
die Räume Cmund Cnzerlegt. Die Position der vertikalen Linie wird durch den numeri-
schen Rang der Matrix Abestimmt, wobei der numerische Rang der Matrix Abereits nach
Berechnung der SVD aus der Matrix Σ, d. i., den Singulärwerten σi, abzulesen ist [Rust,
1998]. Ist die Matrix Avollrangig, so verschwindet die rechte Seite des Diagramms, das
heißt, schrumpfen die Nullräume N(A)und N(A)in die Null-Vektoren 0mund 0n. Ist
die Matrix Agleich 0, so verschwindet die linke Seite des Diagrams, oder schrumpfen die
Bildräume zu Nullen.
Wir haben also nach der SVD Gl. (2.22) auf S. 19 vier rechteckige Matrizen, U1,U2,
V1und V2, die keine unitäre Matrizen mehr sind, sondern Isometrien 43 oder partielle
Isometrien bzw. subunitäre Matrizen 44. Diese spannen wiederum orthonormal die jeweils
vier fundamentale Räume R(A),N(A),R(A)und N(A)auf, die stets mit jeder Matrix
Akoexistieren und sie charakterisieren.
2.3.3 Eigenschaften der Singulärwertzerlegung
Zu Abb. 2.2 auf S. 20 und Abb. 2.1 auf S. 7 fassen wir kompakt einige wichtige Eigen-
schaften der Singulärwertzerlegung und ihre Zusammenhänge mit Projektoren und Moore-
Penrose-Inverse zussamen.
Schmidt-Eckart-Young-MirskyApproximationssatz 45:SeienSingulärvektorenui,vi
und Singulärwerte σ1 ··· σmin(m,n)von ACm×n. Sei Ar=Pr
i=1 σiuiv
i,
so gilt
kArAkU= inf
rank BrkBAkU(2.31)
43[Campbell und Meyer, 1979, p. 71, Proposition 4.2.1]
44[Ben-Israel und Greville, 1974, p. 254] [Campbell und Meyer, 1979, p. 72, Theorem 4.2.1]
45[Schmidt, 1907a,b] [Eckart und Young, 1936] [Mirsky, 1960] Seien die Singulärwerte sotiert nach σ1σ2
···σr>0, dann definiert
ν2
k(A) =
k
X
i=1
σ2
i
eine unitär invariante Norm für jede k= 1,...,r [Meyer, 2000, p. 425]. Spezielle Fälle der νk(A)sind die
vektornorm-induzierte Matrixnorm, die Spektralnorm [Horn und Johnson, 1985, pp. 290-320, §5.6] gleich dem
größten Singulärwert
kAk2= sup
x6=0
kAxk2
kxk2
= sup
kxk2=1
kAxk2=σ1,
und die Frobeniusnorm oder Hilbert-Schmidt-Norm
kAkF= (tr AA)1/2= (tr AA)1/2= (σ2
1+···+σ2
2)1/2.
Für Definition und ausführliche Diskussion über verschiedene Matrixnormen ist [Horn und Johnson, 1985§5.6,
pp. 290-320] sehr zu empfehlen. Siehe auch [Ipsen und Meyer, 1995].
26
KAPITEL 2. GRUNDLAGEN
Singulärspektrum chefs.pgm:378 ×279
Spektral-Residuum: σ100+1
Residuenenergie:
min(m,n)
P
i=r+1
σ2
i=
279
P
i=101
σ2
i
org. 001 002 003 004
005 006 007 008 009
010 011 012 013 014
020 030 040 060 100
Abbildung 2.4: Singulärspektrum und Teilraummodellierung: Beispiel Rathaus. Dies ist eine Veran-
schaulichung des Approximationssatzes Gl. (2.31) auf S. 25. Oben links ist die originale Szene, eine
279×378 vollrangige Matrix. Die Singulärwerte, σi[36010.715,1.7005×1012], i = 1,...,279,
sind sortiert und logarithmisch gezeichnet (matstat.c -t0). Die Gesamtenergie der Szene ist
P279
1σ2
i= 1.60974 ×109. Die Approximationen bis Rang 100 sind nach Gl. (2.31) auf S. 25 in
der zunehmenden Reihenfolge dargestellt (matstat.c -t). Die Residuenenergie am Rang 100 ist
P279
101 σ2
i= 3×106(0.1865%) nach Gl. (2.32) auf S. 27. Das Spektral-Residuum ist σ101 = 257.318
nach Gl. (2.33) auf S. 27. Nach der Überlegung über die Vollrang-Faktorisierung enthält das Bild
unten rechts am Rang 100 nur ca. 9.5% soviel unabhängige Werte wie im originalen Bild.
2.3. SINGULÄRWERTZERLEGUNG
27
Am Beispiel einer Kamera-Szene wird der Approximationssatz in Abb. 2.4 auf S. 26
veranschaulicht.
Das Hilbert-Schmidt bzw. Frobenius Residuum:
kArAk2
F=
min(m,n)
X
i=r+1
σ2
i.(2.32)
Das Spektralresiduum (von induzierter 2-Norm):
kArAk2
2=σ2
r+1.(2.33)
Für ACm×ngilt (A)= (A)und für Orthoprojektor PR(A)gilt
P
R(A)=PR(A)(2.34)
Sei m=nund (R(A),N(A)), [Ipsen und Meyer, 1995, (2.7)]
cos θ=kPR(A)PN(A)k2=kPN(A)PR(A)k2(2.35)
Im generellen, besitzt ein Projektor PCneine Bild-Kern-Zerlegung [Koecher,
1997, p. 51] [Meyer, 2000, p. 394] mit Index 1
R(P)N(P) = Cn.(2.36)
Der minimale Winkel θzwischen dem Bild und dem Kern des Projektors Pist gege-
ben durch [Ipsen und Meyer, 1995, (2.7)]
sin θ= 1/kPk2.(2.37)
Falls m=n,R(A)und N(A)sind genau dann komplementäre Teilräume, wenn
Ind(A) = 1,d.h.,wenndasPotenzierenderMatrixAdie Dimensionen vomBildraum
oder Kern nicht ändert. Dies heißt wiederum wenn das Bild nicht schrumpft und der
Kern nicht wächst, denn mit dem Potenzieren einer Matrix Akann der Bildraum nur
schumpfen und der Kern nur wachsen. Der Bildraum und der Kern der Matrix Asind
sogar einander orthogonal wenn Aweiterhin eine EP-Matrix ist.
Polar-Zerlegung oder Polarform ist die Faktorisierung einer biliebigen Matrix (auch
m6=n) auf eine partielle Isometrie und eine selbstadjungierte positiv semidefinite
Matrix. Die folgenden Polarform via SVD sind jeweils eindeutig. Sei A=UΣV
die SVD nach Gl. (2.23) auf S. 19, dann
A=UΣV=UInΣV= (UV)
|{z }
m×n
(V)
|{z }
n×n
=QH1,(2.38)
A=UΣV=UΣInV= (UΣU)
|{z }
m×m
(UV)
|{z }
m×n
=H2Q,(2.39)
wobei selbstadjungierte, positiv semidefinite H1und H2jeweils eindeutig sind. Ist
Avollrangig, so ist Uauch eindeutig und H1,H2positive definite. [Ben-Israel und
Greville, 1974, p. 255, Theorem 5] [Campbell und Meyer, 1979, p.73, Theorem 4.2.2]
[Higham, 1986] [Shoemake und Duff, 1992] [Golub und Van Loan, 1996]
28
KAPITEL 2. GRUNDLAGEN
2.4 Meßdaten und Singulärwertzerlegung
Die Singulärwertzerlegung einer Matrix ACm×nist meistens betrachtet als Zerlegung
einer linearen Transformation Cn7→ Cmauf
1. eine Isometrie 46 (bzw. Basiswechsel durch die rechten Singulärvektoren
in V) im Quellraum Cn,
2. eine reine Skalierung durch die Singulärwerte in Σ,
3. und eine weitere Isometrie (bzw. Basiswechsel durch die linken Singulär-
vektoren in U) im Zielraum Cm,
wie in Abb. 2.3 auf S. 23 geometrisch veranschaulicht wird. Wir sehen somit die Abbildung
A:Cn7→ Cmals Produkt dreier verketetteter Teilabbildungen V,Σund Uan. Awird
also im Zusammenhang der Gleichung Ax =b,xCn,bCmgedacht.
Diese Interpretation der Faktorisierung ist jedoch unpassend, falls eine Matrix AMeß-
daten erfasst. Wir stellen uns daher die Frage, 47
Wie sind U,Σund Vzu interpretieren, wenn die zu zerlegende Matrix A
Meßdaten enthält?
An dieser Stelle müssen wir noch einmal die Strukturierung der Meßdaten in eine Matrix
Afestlegen und solche charakterisieren. Bei jeder multivariaten Messung mit nVariablen
erhalten wir einen n-Vektor. Dieser n-Vektor werde als eine Zeile in die Datenmatrix A
hingeschrieben. Mit mwiederholten Messungen ergibt sich also eine m×nDatenmatrix 48
A=
a11 a12 ··· a1n
a21 a22 ··· a2n
a31 a32 ··· a3n
a41 a42 ··· a4n
a51 a52 ··· a5n
a61 a62 ··· a6n
.
.
..
.
..
.
..
.
.
am1am2··· amn
m×n
=
a1
a2
a3
a4
a5
a6
.
.
.
am
.(2.40)
Unsere Datenmatrix Ain Cm×n„wächst“ also mit zunehmender Anzahl der Messungen
nach unten. Die auf diese Weise zusammengefaßten Daten in der Matrix Alassen sich
verschieden interpretieren:
1. Mehrkanalmessungen mit nals Anzahl der Meßkanäle (Sensoren) und mals Anzahl
der Messungen. Jede Spalte kann als eine diskrete Zeitreihe gedacht werden. Der
46Zur Isometrie gehören z. B. Drehungen und Spiegelungen. Verschiebungen und weitere topologische Opera-
tionen werden hier nicht berücksichtigt, da wir uns nur auf lineare Abbildungen konzentrieren.
47Siehe Seite 40 für eine Rekapitulation unserer Antwort.
48In der Statistik werden oft die Symbole pund nfür jeweils Anzahl der Variablen und Messungen benutzt,
wobei die Matrix Ap×nmit zunehmender Anzahl der Messungen nach rechts zu wachsen ist. Diese Konvention
ist jedoch unpraktisch in unserer Implementierungen in C, welche ein Array von „oben“ nach „unten“ zeilenweise
speichert (auch zeilendominant genannt), während Fortran von „links“ nach „rechts“ spaltenweise speichert (auch
spaltendominant genannt). Weitere Möglichkeit der Konfiguration der Datenmatrix für die SVD der periodischen
Signale ist u. a. in [Bhattacharya und Kanjilal, 1999] untersucht.
2.4. MESSDATEN UND SINGULÄRWERTZERLEGUNG
29
Index iist also der Zeitpunkt und jder Index eines bestimmten Sensors. Jede Zeile
kann als ein Merkmalsvektor gedacht werden.
2. Messungen der geometrischen Koordinaten mit Dimension des Raumes nund der
Anzahl der gemessenen Punkte m. Jede Zeile stellt einen Punkt im n-Raum dar. Der
Index iidentifiziert also jeden einzelnen Punkt a1,...,amund jist der Koeffizient
bezüglich des j-ten Basisvektors. aij ist die j-te Koordinate des i-ten Punktes im
Bezug auf die im Kontext definierte Basis.
3. DieZeilenvektorenai(i= 1,...,m)seien Ereignisse desZufallsvektors [p1p2. . . pn]
aus den Zufallsvariablen 49 p1,...,pn. Jede Spalte der Matrix Aist somit eine Reali-
sierung einer bestimmten Zufallsvariablen pj(j= 1,...,n)von mBeobachtungen.
Ein stochastischer Prozeß läßt sich in dieser Konfiguration in Matrixform untersu-
chen. 50
4. Ein stochastisches Signal x(t)läßt sich in der Form der Gl. (2.40) auf S. 28 darstellen,
sobald eine Basis {φ1(t),...,φn(t)}für das Signal festgelegt ist. In diesem Falle, ist
ndie Dimension des Signalraumes 51,mdie Anzahl der wiederholten Beobachtungen
des stochastischen Signals. Der Zufallsprozeß x(t)kann also als ein Zufallspunkt in
einem n-dimensionalen Raum gedacht werden. [Lathi, 1968, Chap. 3, pp. 212–214]
2.4.1 Der Kondensator ist ein Projektor
Sei Datenmatrix ACm×naus Gl. (2.40) auf S. 28. Es ist häufig erforderlich, die Mit-
telwerte ˆµj= 1/m Piaij jeder Spalte jder Matrix Abzw. den Schwerpunkt b
µA=
[ˆµ1,...,ˆµn]52 aus der Matrix Azu subtrahieren, d. h., den Schwerpunkt b
µAder Daten-
wolke herunter auf 0zu versetzen. Diese affine Verschiebung der Daten bezeichnen wir als
das Zentrieren der Datenmenge.
Definition 2.4.1 (Zentrierung). Ein Vektor x= [ x1x2···xm]Cmheißt zentriert,
wenn Pxi= 0. Eine Datenmatrix ACm×nin der Form von Gl. (2.40) auf S. 28 heißt
spalten-zentriert, wenn
m
P
i=1
ai1
m
P
i=1
ai2···
m
P
i=1
ain =01×n.
49Abbildung des Musterraumes auf Zahlen in Roder C.
50Für die Definition eines stochastischen Prozesses x(ζ, t)siehe [Lathi, 1968, Chap 3, pp. 158–230]. Eine an-
schauliche Abbildung befindet sich in [Lathi, 1968, Fig. 3-1, p. 160]. Ergodizität des Prozesses wird angenommen,
d. h., die Scharstatistik (Ensamble-Statistik) sei gleich der Zeit-Statistik. Das heißt wiederum, daß jede Musterfunk-
tion (sample function) oder Realisierung des Prozesses repräsentativ sei für das ganze Ensemble des Zufallspro-
zesses und daher die vollständige Charakterisierung eines Prozesses. Eine Spalte der Matrix Ain Gl. (2.40) auf
S. 28 kann also einen Prozeß darstellen. Die Datenmatrix Akann somit zugleich nProzesse x1(t),...,xn(t)
abtasten. Die Ergodizität eines Prozesses impliziert die Stationarität, d. h., Die Statistiken aller Ordnungen sind
invariant gegenüber Zeitverschiebung [Lathi, 1968, p. 176].
51Wir berücksichtigen hier nur Signale endlicher Dimension.
52Dies ist ein unverzerrter oder erwartungstreuer (unbiased) und konsistenter Schätzmittelwert. Ein Schätzer
ˆ
θfür die Zufallsvariable θheißt erwartungstreu (unbiased), wenn E[ˆ
θ] = θ, sonst heißt er verzerrt oder nicht
erwartungstreu (baised). Die Schätung heißt konsistent, wenn limm→∞ Var[ˆ
θ] = 0, sonst heißt sie inkonsistent.
Siehe z. B. [Schwartz und Shaw, 1975, pp. 91–94]. Der Zufallsvektor b
µAder Schätzmittelwerte ˆµjhat Erwar-
tungswerte E[b
µA] = µAmit limm→∞ Var[b
µA] = limm→∞ σ2
µA/m =0. Der Schätzer ist normalverteilt
mit N(µA,σ2
µA/m).
30
KAPITEL 2. GRUNDLAGEN
und zeilen-zentriert, wenn
n
P
j=1
a1j
n
P
j=1
a2j···
n
P
j=1
amj T
=0m×1.
Da wir die Datenmatrix spaltenweise manipulieren, meinen wir spalten-zentriert, wenn nur
zentriert gesagt wird. (Cf. matstat.c -pz.)
Beobachtung 2.4.2 (Warum Zentrieren?). Die Zentrierung der Daten ist oft der erste Schritt
zur Datenverarbeitung. Warum? Da eine plausible Erklärung meines erachtens in der Litera-
tur nicht gegeben wird, wollen wir hier argumentieren, daß es sich um eine „Kurzsichtigkeit
am Nullvektor“ handelt, aus jeweils algebraischem und numerischem Aspekt.
In einem linearen Raum sind alle Vektoren gleichberechtigt bis auf den Nullvektor.
Er zeichnet sich von allen anderen Vektoren dadurch aus, daß ihn alle linearen Abbil-
dungen fest lassen müssen. Die Auszeichnung des Nullvektors ist eine direkte Kon-
sequenz aus den Axiomen eines Vektorraumes und des zugrunde liegenden Körpers
53 seit Hermann Günther Grassmann (1809–1877) [Graßmann, 1894, 1896] [Gray,
1980, 1994] und Giuseppe Peano (1858–1932) 54. In einem linearen Raum mit nicht-
ausgeartetem Skalarprodukt ist der Nullvektor der einzige isotropische Vektor (das
Radikal) [Kaplansky, 1974, p. 7], der zu allen anderen Vektoren orthogonal ist. Wir
versetzen den Schwerpunkt einer Datenwolke zum Nullvektor, weil wir die Daten
dort am besten „anschauen“ können. Das Verhalten aller linearen Abbildungen ist am
Nullvektor am schärfsten aufgelöst, denn alle linearen Abbildungen drehen sich ohne
Ausnahme nur um ihn herum. In anderen Worten, unsere Augen sind dort am Null-
vektor befestigt, während wir zur Datenanalyse linear-algebraische Werkzeuge ver-
wenden. Eine de facto 2-dimensionale Dynamik mitten unter den Daten sehen wir, aus
großer Entfernung, mittels linear-algebraischen Begriffs als eine rang-3Matrix. Ver-
setzen wir den Schwerpunkt zum Nullvektor, so wird das Wesen der 2-dimensionalen
Dynamik in der Form einer rang-2Datenmatrix zum Vorschein gebracht. (v. et. Bei-
spiel 2.4.16 auf Seite 48.) Dasselbe kommt bei einer Eigenanalyse und weiteren linea-
ren Methoden der Datenanalyse vor. Dies war eine Erklärung aus dem algebraischen
Aspekt.
Auch in der Numerik spielt das Zentrieren der zu verarbeitenden Daten eine nicht
zu ignorierende Rolle. Rechnerisch werden die reellen Zahlen durch das Fließkom-
ma-Format [Goldberg, 1991] dargestellt. Dennoch besteht zwischen den Reellen und
ihrer maschienellen Approximierung immenser Unterschied:
1. Die Menge aller darstellbaren Zahlen eines bestimmten Fließkomma-
Formates ist endlich,abzählbar und besitzt keine Dichtheit, während
die der Reellen unendlich,überzählbar und dicht ist.
2. Die endlich verfügbaren Fließkomma-Zahlen bestimmter Länge sind
inhomogen verteilt, so daß der eine Bereich der Reellen am Null fei-
ner und der andere grober aufgelöst wird, während die gesamte Dyna-
mik aller darstellbaren Zahlen hinreichend groß beibehalten werden
kann.
53Der Begriff Körper war zu der Zeit noch nicht etabliert.
54Giuseppe Peano, Calcolo geometrico secondo l’Ausdehnungslehre di H. Grassmann preceduto dalle opera-
zioni della logica deduttiva, 1888.
2.4. MESSDATEN UND SINGULÄRWERTZERLEGUNG
31
Die Eigenschaften der Fließkomma-Darstellung haben in der Praxis negative Kon-
sequenzen, die meines erachtens oft übersehen seien. Zum Beispiel, die Menge der
Zahlen
M={1,2,3,4,5}
wäre überhaupt nicht darstellbar, wenn die Menge Maffin durch einen großen Wert
verschoben wird. Verschieben wir experimentell die Werte um 1×1020 unter IEEE-
754 Double-Precision [IEEE, 1985], so erhalten wir genau die Menge
M0={1 + 1020,2 + 1020,3 + 1020,4 + 1020,5 + 1020}
={1×1020,1×1020,1×1020,1×1020,1×1020}.
Die eigentliche Schar-Dynamik der Daten ist gänzlich verschwunden bzw. nicht auf-
gelöst 55. Durch die Brille des Fließkomma-Formates sehen wir die o. g. Menge der
verschiedenen Zahlen als eine einzige Zahl aus einer großen Entfernung. In anderen
Worten, auch rechnerisch „sind unsere Augen fest mit dem Nullvektor gebunden“,
das heißt, nur dort können wir die Zahlen in Fließkomma-Darstellung am schärfsten
„sehen“.
Durch das Zentrieren der Datenmatrix ACm×nergeben sich mittelwertfreie Zeitreihe
(zero-mean time series) aller Realisierungen 56 (Spalten der Datenmatrix) in einer zentrier-
ten Matrix ˜
ACm×n. Das Zentrieren ist in Cnkeine lineare Abbildung sondern eine
Affine. Dennoch werden wir zeigen, daß sich diese affine Abbildung in Cmals ein linearer
Operator darstellen läßt.
Sei m×1Vektor
1=
1
1
1
1
1
1
.
.
.
1
m×1
,
dann ist der Schwerpunktvektor der Matrix A
b
µA=1
mm
P
i=1
ai1
m
P
i=1
ai2···
m
P
i=1
ain 1×n
=1
m1A.(2.41)
55Bei den Fließkomma-Zahlen, gilt
x+ 1 = x
auch für eine überraschend kleine Zahl wie x= 17000000 in IEEE-754-Single-Precision [IEEE, 1985]. Dies läßt
sich durch das einfache Programm float.c verifizieren. Solches Verhalten der Fließkomma-Zahlen ist „legal“
und ist generell nicht als Exception [Goldberg, 1991] aufgeworfen. Das bedeutet, die dadurch verursachten Feh-
ler sind extrem schwierig zu lokalisieren, zu erheben, oder überhaupt merken zu können. (Siehe auch [Edelman,
1994].) Die o. a. Eigenschaften der Fließkomma-Zahlen fordern zusätzliche Aufmerksamkeit in den numerischen
Verfahren, auch wenn die Daten bereits zentriert worden sind. Bei einer unbekannten Schar-Dynamik der Einga-
bedaten ist daher eine lineare Skalierung unentbehrlich vorzuprogrammieren, besonders wenn eine Zentrierung
der Daten wegen Verlust der Linearität nicht erlaubt ist. Diese Anforderung für die Korrektheit hat disher zu we-
nig Aufmerksamkeit gewonnen. Die Datei basis33.c zur Vervollständigung orthonormaler Basis demonstriert
übrigens deutlich, wozu eine indifferente Mentalität diesbezüglich führen kann.
56Instanzen aus einem Ensembel eines Stochastischen Prozesses.
32
KAPITEL 2. GRUNDLAGEN
Die zentrierte Matrix ist
˜
A=A1b
µA=A1
m1 1A=Im1
m1 1A=ZmA,(2.42)
wobei 1b
µAvon Rang 1und die zentrierte Matrix ˜
Aeine Rang-1-Abwandlung der Daten-
matrix Aist. Diese Rang-1-Abwandlung ist zwar nicht-linear in Cn, läßt sich jedoch durch
einen linearen Operator in Cmdarstallen.
Definition 2.4.3 (Zentrierender Operator). Die lineare Abbildung ZmCm×m
Zm=I1
m11=1
m
m11··· 1
1m1··· 1
.
.
..
.
.....
.
.
111m1
m×m
(2.43)
heißt zentrierender Operator bzw. zentrierende Matrix für einen Vektor xCmoder ei-
ne Matrix in ACm×n. Die Matrix ˜
A=ZmAist also spalten-zentriert. Eine zeilen-
zentrierte Matrix ist ˜
A0=AZn. Wir bezeichnen ihn einfach mit Z, wenn die Dimension
aus dem Kontext im klaren sein soll. Mit ˜
Abezeichnen wir eine spalten-zentrierte m×n
Datenmatrix Amit ˜
A=ZmA.
Beispiel 2.4.4. Die zentrierende Matrix Z10 in C10 ist
Z10 =1
10
91··· 1
19··· 1
.
.
..
.
.....
.
.
111 9
.
Da das Zentrieren die Idempotenz-Forderung erfüllen muß, wie bei der Entfernung vom
DC-Anteil in einem elektrischen Signal durch die idealen Kondensatoren der Fall ist, eva-
luieren wir Z2
mdes zentrierenden Operators Zm.
Z2
m= (Im1
m1 1)(Im1
m1 1)
=Im2
m1 1+1
m2(1 1)2
=Im2
m1 1+1
m2(m1 1)
=Im1
m1 1
=Imuu(u=1/m, kuk2= 1)
=Zm.(2.44)
Zmist also in der Tat idempotent und gewiss symmetrisch, ergo ein Orthoprojektor. Da
Zmein Projektor ist, muß IZm= (1/m)1 1der komplementäre Projektor sein. Da
das Tensor-Produkt [1 1]vom Rang 1ist, muß rank(Zm) = m1.Zmist also ein
Orthoprojektor auf den (m1)-dimensionalen Eigenraum mit dem Eigenwert 1:
R(Zm) = N(IZm) = N(1
m1 1) = span {1},(2.45)
2.4. MESSDATEN UND SINGULÄRWERTZERLEGUNG
33
entlang des 1-dimensionalen Kernes bzw. Eigenraumes vom Eigenwert 0:
N(Zm) = R(IZm) = span {1}.(2.46)
Der 1-dimensionale Teilraum span {1m}von Cndarf als der DC-Teilraum bzw. Teilraum
desGleichstromsinterpretiertwerden,undder(m1)-dimensionaleTeilraum span {1m}
der AC-Teilraum bzw. Teilraum des Wechselstroms. Da Zmsymmetrisch und positiv se-
midefinit ist und die Eigenwerte λi(Zm) {0,1}, sind die Mengen der Eigenwerte und
Singulärwerte identisch.
Wir fassen die Eigenschaften eines zentrierenden Operators Zmim folgenden Korollar
zusammen.
Korollar 2.4.5 (Zentrierender Projektor). Sei Zmein zentrierender Operator in Cm,
dann
1. Z2
m=Zm=Z
m=Z
mist positive semidefinit,
2. rank Zm= tr Zm=m1,
3. N(Zm) = R(ImZm) = span {1m},
4. Eigenwerte von Zm:{1,1,1,...,1,0},
5. Singulärwerte von Zm:{1,1,1,...,1,0},
6. Spektralnorm kZmk2= 1.
Andererseits ist der komplementäre Projektor IZm= (1/m)1 1als eine Projektion
auf den 1-dimensionalen „DC-Teilraum“ anzusehen. Desweiteren, wenn Anur Zeilenvek-
toren enthält, die auf einem affinen Teilraum von Cnmit Dimension kleiner als nliegen,
wird das Zentrieren der Matrix Aden Rang um 1reduzieren, d. h.,
rank ˜
A= rank A1.(2.47)
Dies impliziert, daß eine vollrangige Datenmatrix Aeine reguläre Kovarianzmatrix CA
2.4.2) nicht gewährleistet.
Da der zentrierende Orthoprojektor Zmeine einfache Form Gl. (2.43) auf S. 32 besitzt,
kann er die Singulärwertzerlegung in einer geschlossenen Form annehmen. Der Orthopro-
jektor Zmbesitzt m1-fach den Singuärwert von 1und einfach den Singulärwert von
0. Die beiden Singulärräume sind nichts anderes als bloß der (m1)-dimensionale AC-
Teilraum, R(Zm) = span{1m}, und der 1-dimensionale DC-Teilraum bzw. der Kern
Ker Zm= span{1m}.
Bei der Auswahl einer Basis für das orthogonale Komplement vom DC-Teilraum span{1m}
haben wir zwar eine große Freiheit, sie kann aber durch eine Householder-Spiegelung vom
Vektor 1mauf eine Vielfachheit des Vektors e1bestimmt werden. Diese Basis ergibt zu-
sammen mit dem Vektor 1m/meine orthogonale und zugleich symmetrische Matrix für
die linke und die rechte Singulärmatrizen Uund V. Das ist, Uund Vkann als dersel-
be Orthoreflektor ausgewählt werden, der den Vektor 1/m1 1 ··· 1zu e1=
1 0 ··· 0spiegelt. Der zentrierende Projektor Zmkann also in die folgenden Or-
thoreflektoren in geschlossener Form zerlegt werden. Cf. § 2.1 ab S. 6, § 2.1.6 ab S. 11 und
gmat.c -Z.
34
KAPITEL 2. GRUNDLAGEN
Bemerkung 2.4.6 (SVD eines zentrierenden Projektors). Sei Zmein zentrierender Operator
in Cm,m > 1, dann ist (Cf. gmat.c -Z und -o)
U=V=R=1
m
11 1··· 1
11mm
1+m
1
1+m··· 1
1+m
11
1+m
1mm
1+m··· 1
1+m
.
.
..
.
..
.
.....
.
.
11
1+m
1
1+m··· 1mm
1+m
und
Σ=
0 0 ··· 0
0 1 ··· 0
.
.
..
.
.....
.
.
0 0 ··· 1
(2.48)
eine Singulärwertzerlegung Zm=UΣV=RΣR. Diese geschlossene Form ist zu-
gleich die Spektralzerlegung von Zm.
Bemerkung 2.4.7 (SVD eines zentrierenden Projektors). Die im Korollar 2.4.6 ausgewählte
Form der SVD eines zentrierenden Projektors erweist nicht nur den Vorteil der Symmetrie
und einer geschlossenen Form, die die numerische Genauigkeit erhöht und den Rechenauf-
wand stark reduziert, sondern ermöglicht auch eine anschauliche Interpretation vom zen-
trierenden Projektor Zm. Die diagonale Matrix Σ=Pspan{e1}ist in der Tat ein Or-
thoprojektor, der die eigentliche Aufgabe der „DC-Filterung“ ausführt allerdings auf
die kanonische Form aller Projektoren gleicher Art versetzt, d. i., entlang der Richtung
e1=10··· 0auf das orthogonale Komplement span{e1}. Der rechte Ortho-
reflektor R=Rist dafür zuständig, die DC-Anteile des Signals im DC-Teilraum auf den
Teilraum span{e1}hin zu spiegeln, wo gerade der Kern des Projektors Σ=Pspan{e1}
ist. Da sich alle DC-Anteile nun im Kern des Projektors befinden, werden sie durch die Pro-
jektion nulliert. Übrig bleiben nun bloß die AC-Antile des Signals. Sie werden durch eine
nochmalige Anwendung des Orthoreflektors Ran der linken Seite zurück gespiegelt. Das
Gesamt-Produkt Zm=RΣR kann als ein orthogonaler Raum-Zerleger mit
Cm=DC-Teilraum AC-Teilraum
=R(ImZm)R(Zm)(2.49)
= span{1m}span{1m}
angesehen werden. Cf. Abb. 2.2 auf S. 20.
Bemerkung 2.4.8 (Zentrierender Projektor auf der Fourier-Basis). Der zentrierenden Pro-
jektor Znläßt sich bezüglich der unitären Fourier-Basis wie folgt darstellen.
Zn=TFΣTF1,(2.50)
wobei Σaus Gl. (2.48) auf S. 34, TFCn×ndie unitäre Fourier-Matrix57mit TF=
1/nzij, i, j {1,2,3,...,n1}und zCdie primitive n-te Einheitswurzel mit
2.4. MESSDATEN UND SINGULÄRWERTZERLEGUNG
35
z= exp [2πi/n], n > 0sind, d. i.
TF=1
n
1 1 1 ··· 1
1z z2··· zn1
1z2z4··· z2(n1)
.
.
..
.
..
.
.··· .
.
.
1zn1z2(n1) ··· z(n1)(n1)
.(2.51)
Hier treffen sich die „elektrotechnische“ und die linear algebraische Interpretationen des
Begriffs „Spektrum“ problemlos in endlich dimensionalen Räumen.
Lemma 2.4.9 (Zentriertes Produkt der Matrizen). Sei ACm×nspalten-zentriert,
dann ist das Produkt AB für all Matrizen BCn×pspalten-zentriert. Ist Azeilen-zen-
triert, so ist das Produkt BA für alle Matrizen BCp×mzeilen-zentriert.
Beweis. Sei C=AB,C= [cij]m×p,A= [aij ]m×n,B= [bij]n×pund Aspalten-
zentriert. Betrachten wir die j-te Spalte cjvon C,j= 1,...,p, so haben wir aus dem
Product AB das Element
cij =
n
X
k=1
aikbkj,
welches nur mit der i-ten Zeile der Matrix Aund der j-ten Spalten der Matrix Bzu tun hat.
Die Summe aller Elemente der j-ten Spalte von der Matrix Cist
m
X
i=1
cij =
m
X
i=1
n
X
k=1
aikbkj =
n
X
k=1
m
X
i=1
aikbkj =
n
X
k=1
bkj
m
X
i=1
aik = 0,
wobei Pm
i=1 aik = 0 per Definition der Spalten-Zentriertheit der Matrix Ain Def. 2.4.1 auf
S. 29. Das Gleiche gilt für eine zeilen-zentrierte Aund eine linke Multiplikation durch eine
beliebige Matrix Bmit geeigneter Dimension.
Bemerkung 2.4.10 (Zentriertes Produkt der Matrizen). Lemma 2.4.9 gilt im allgemeinen
nur für eine Multiplikation von der „richtigen“ Seite
Aspalten-zentriert =AB spalten-zentriert;
Azeilen-zentriert =BA zeilen-zentriert.
Die Zentriertheit von Aist nur hinreichend, aber nicht notwendig für die Zentriertheit von
AB bzw. BA. Dennoch, ist Matrix Bdiagonale und vollrangig, so gilt
AB spalten-zentriert =Aspalten-zentriert;
BA zeilen-zentriert =Azeilen-zentriert,
denn cij =Pn
k=1 aikbkj =aijbjj, und Pm
i=1 cij =Pm
i=1 aijbjj =bjj Pm
i=1 aij. Also, ist
C=AB spalten-zentriert und Qn
j=1 bjj 6= 0, so ist Aspalten-zentriert, bzw., ist die j-te
Spalte von C=AB zentriert und bjj 6= 0 von der diagonalen Matrix B, dann ist die j-te
Spalte von Azentriert. Wir sehen, daß der zentrierende Orthoprojektor Zmin Gl. (2.43) auf
57Die Fourier-Matrix ist auch eine skalierte Vandermonde-Matrix des Vektors [z0z1··· zn1].
36
KAPITEL 2. GRUNDLAGEN
S. 32 sowohl spalten-zentriert als auch zeilen-zentriert ist. Unser Lemma stimmt mit der Er-
wartung überein, daß eine zentrierte Matrix via Matrix-Produkt weitere zentrierte Matrizen
zu Stande bringt. Kann also irgendeine zentrierte Matrix die Rolle unseres zentrierenden
Operators Zmübernehmen? Die Antwort ist gewiss nein, denn er muß auch noch die Be-
dingung der Idempotenz erfüllen.
Korollar 2.4.11 (SVD einer zentrierten Matrix). Seien ACm×nund die Singulär-
wertzerlegung A=UΣVnach Gl. (2.23) auf S. 19, wobei Usubunitär, Σdiagonal und
Vunitär sind:
(a) Ist Uspalten-zentrierten, ZmU=U, dann ist Aspalten-zentrierten,
ZmA=A.
(b) Ist Avollrangig und spalten-zentriert mit m > n, dann ist Uspalten-
zentriert.
Beweis. (a). Die Zentriertheit von Afolgt unmittelbar aus Lemma 2.4.9. (b). Da AV =
, ist spalten-zentriert nach Lemma 2.4.9. Weil Qn
i=1 σi6= 0 und Σdiagonal ist, ist
Unach Bemerkung 2.4.10 spalten-zentriert, d. i., ZmU=U.
Bemerkung 2.4.12 (SVD einer zentrierten Matrix). Korollar 2.4.11 wurde nicht in der Form
von Gl. (2.22) auf S. 19 ausgeführt, weil die Zentrierung einer unitären Matrix notwendi-
gerweise den Rang genau um 1fallen läßt. Wir können deswegen nicht von einer unitären
und zentrierten Matrix sprechen. In anderen Worten, eine unitäre Matrix kann nicht zen-
triert sein, denn Pn
i=1 uij = 0,j= 1,...,nführt direkt zum Widerspruch der linearen
Abhängigkeit der Zeilen bzw. Spalten in der unitären Matrix U= [uij]mit U1=U.
Dies ist um so deutlicher mit Hilfe unseres zentrierenden Operators, daß das Zentrieren
einer quadratischen Matrix der Größe mist ein Produkt von der Matrix mit Zm, welcher
einen Rang von m1besitzt, und das Produkt kann den Rang nicht größer als m1haben.
Die Bedingung m > n ist deswegen in Korollar 2.4.11-(b) gestellt, weil eine quadratische
Matrix nicht zugleich vollrangig und zentriert sein kann. Falls eine vollrangige und qua-
dratische Matrix zentriert wird, muß ihr Rang um 1abfallen. Infolgedessen haben wir einen
verschwundenen Singulärwert. Die Zentriertheit des entsprechenden linken Singulärvektors
ist also wegen des verschwundenen Singulärwertes nicht garantiert. Cf. Bemerkung 2.4.10
auf S. 35.
2.4.2 Kovarianzmatrix via SVD
Die Kovarianzmatrix CAder Matrix A58 ist eine hermitesche, positiv semidefinite Matrix
in Cn×nmit
CA=1
m1˜
A˜
A=1
m1
m
X
i=1
˜a
i˜ai, cij =1
m1
m
X
k=1
˜a
ki˜akj,(2.52)
58auch Varianz-Kovarianz-Matrix (variance-covariance matrix) genannt. Sie wird bei manchen Autoren die
Gramsche Matrix der zentrierten Matrix (Gramian of the mean-centered data matrix) genannt. Siehe z. B. [Hohn,
1973, pp. 452–454].
2.4. MESSDATEN UND SINGULÄRWERTZERLEGUNG
37
wobei ˜aij ein Element die zentrierte Matrix ˜
A=ZmAin Gl. (2.40) auf S. 28 ist. Sie
kann einfach algebraisch wie in (2.52) gedacht oder mit ihrer stochastischen Herkunft mit
betrachtet werden.
Die Kovarianzmatrix CAbeinhaltet nämlich die Schätzwerte für die Varianzen und Ko-
varianzen der in der Datemmatrix Gl. (2.40) auf S. 28 als Spalten erschienenen Zeitreihen,
d. h. , Realisierungen des Zufallsvektors p=p1. . . pn
C=E(pµp)(pµp)
=
E[ (p1µp1)(p1µp1) ] ··· E[ (p1µp1)(pnµpn) ]
E[ (p2µp2)(p1µp1) ] ··· E[ (p2µp2)(pnµpn) ]
.
.
.....
.
.
E[ (pnµpn)(p1µp1) ] ··· E[ (pnµpn)(pnµpn) ]
.(2.53)
Die Kovarianzmatrix CAin Gl. (2.52) auf S. 36 gilt somit als unverzerrte (erwartungs-
treue) aber inkonsistente Schätzungen für die theoretische Kovarianzmatrix in Gl. (2.53) auf
S. 37. Ersetzten wir in Gl. (2.52) auf S. 36 den Nenner m1durch m, so erhalten wir
eine nicht-erwartungstreue (verzerrte) aber konsistente ML-Schätzung der Varianzen und
Kovarianzen. Dies ist in unseren Implementierungen leicht umschaltbar gemacht 59 60.
Sei die SVD der zentrierten Datenmatrix in Cm×n
ZmA=˜
A=˜
U˜
Σ˜
V,(2.54)
und die Kovarianzmatrix in Cn×n
CA=1
m˜
A˜
A,61 (2.55)
dann
CA=1
m˜
A˜
A=1
m(˜
U˜
Σ˜
V)(˜
U˜
Σ˜
V)
=1
m˜
V˜
Σ2˜
V(Spektralzerlegung)
=1
m(˜
Σ˜
V)(˜
Σ˜
V) = 1
m
n
X
i=1
˜σ2˜vi˜v
i,(2.56)
wobei ˜vidie i-te Spalte der Matrix ˜
Vund die Spektralzerlegung der Matrix CAmitenthal-
ten ist mit Eigenwerten gleich der quadratischen Singulärwerte. Sei ˜
Avollranig. Die Inverse
der Kovarianzmatrix ist
CA1=1
m˜
V˜
Σ2˜
V1
=m(˜
V˜
Σ2˜
V)1
=m˜
V˜
Σ2˜
V(Spektralzerlegung)
=m(˜
Σ1˜
V)(˜
Σ1˜
V) = m
n
X
i=1
1
˜σ2˜vi˜v
i.(2.57)
59Siehe matstat.c -pB,m33.c -pB,hyper.c -pB, ...
60Der Nenner m1anstatt mbei Varianzschätzung kann folgendermaßen ausgelegt werden: Da der im Schätzer
benutzte Schätzmittelwert aus den mEinträgen der Beobachtungen bereits eine Schätzung ist, bleiben uns nur noch
m1Freiheitsgrade.
61Für kompakte Formulierung wird hier bei CAdie Division durch mverwendet. Dies nennen wir die ML-
Schätzung der Kovarianzmatrix. Ist mdurch m1ersetzt, so ergibt sich erwartungstreue Version der Kovarianz-
schätzung.
38
KAPITEL 2. GRUNDLAGEN
Daher sind die Kovarianzmatrix CAund ihre Inverse CA1aus der SVD der zentrierten
Matrix ˜
A=ZmAin den Singulärwerten und rechten Singulärvektoren bereits enthal-
ten. Desweiteren stellen die Singulärwerte in ˜
Σund die rechten Singulärvektoren in ˜
Vdie
Spektralzerlegung der Matrix ˜
A˜
Abereit zur Verfügung. Das heißt, die Matrix ˜
Venthält
als Spalten die Basen für die Eigenräume der Matrix ˜
A˜
A. Vgl. Abb. 2.2 auf S. 20. Da
CACn×nselbstadjungiert ist, ist sie normal, d.h., sie ist vertauschbar mit ihrer Adjun-
gierten. Da eine matrix in Cn×ngenau dann unitär diagonalisierbar ist, wenn sie normal
ist, können wir immer eine Orthonormalbasis für CAfinden, wo CAkanonisch eine dia-
gonale Form annimmt.
In (2.56) und (2.57) haben wir die Muster-Kovarianzmatrix anhand der Singulärwertzer-
legung der zentrierten Datenmatrix ˜
Aausgedrückt. Dies heißt praktisch, wenn die SVD der
zentrierten Datenmatrix bereits berechnet ist, ist die Kovarianzmatrix sofort verfügbar und
zwar nur von den Singulärwerten und die rechten Singulärvektoren abhängig. Oft haben wir
allerdings nur die Singulärwertzerlegung der nicht-zentrierten Datenmatrix zur Verfügung.
Ist es möglich, daß wir die Kovarianzmatrix CAanhand der SVD der nicht-
zentrierten Datenmarix ausdrücken?
Die Antwort lautet: Ja, und zwar mit Hilfe unseres zentrierenden Operators Zaus § 2.4.1
ab S. 29. Sei die SVD einer nicht-zentrierten Datenmatrix A=UΣV.
CA=1
m(ZA)(ZA) = 1
mAZA (ZOrthoprojektor)
=1
m(UZU)ΣV=1
m(ZU)(ZU)ΣV
=CUΣV,wobei CU=1
m(ZU)(ZU).(2.58)
Zur „Korrektur“ brauchen wir also die Muster-Kovarianzmatrix CUdes linken Singulär-
faktors Uim Vergleich mit Gl. (2.56) auf S. 37. In anderen Worten, die Unzentriertheit der
Datenmatrix macht die Kovarianz auch vom linken Singulärfaktor Uahbängig und die Zen-
trierung wird bei Unachträglich ausgeführt. Bei der Überlegung vom Rang der Kovarianz
sei darauf geachtet, daß CUnicht definitiv regulär ist, obgleich Usubunitär ist. Über den
möglichen Rangabfall von CUhaben wir in § 2.4.1 ab S. 29 diskutiert. Sei ˜
Avollranig, so
haben wir aus (2.58)
CA1=m[(ZA)(ZA)]1=V(ΣCUΣ)1V.(2.59)
2.4.3 Mahalanobis-Distanz via SVD
Nicht nur ist die Kovarianzmatrix bereits in der SVD der zentrierten Matrix vorhanden,
sondern auch die Mahalanobis-Distanzen.
Beobachtung2.4.13 (Eigenbasis). Sei Datenmatrix ACm×nund die SVDderzentrierten
Matrix ˜
A=ZA =˜
U˜
Σ˜
V. Seien ai,˜ai,˜uidie Zeilenvektoren von A,˜
Aund ˜
U.
˜
A=˜
U˜
Σ˜
V=˜
U(˜
Σ˜
V) = ( ˜
U˜
Σ)˜
V
˜
U=˜
A(˜
Σ˜
V)1,(˜
U˜
Σ) = ˜
A˜
V
˜ai=aib
µA=˜ui(˜
Σ˜
V)
˜ui=˜ai(˜
Σ˜
V)1= (aib
µA)(˜
Σ˜
V)1,(2.60)
2.4. MESSDATEN UND SINGULÄRWERTZERLEGUNG
39
sowie Gl. (2.56) auf S. 37 und Gl. (2.57) auf S. 37.
Wir bezeichnen mit dM(ai,b
µA)die Mahalanobis-Distanz zwischen dem Zeilenvek-
tor aiund dem Schwerpunkt b
µAbezüglich der Menge {a1,...,am}aus der Datenmatrix
Gl. (2.40) auf S. 28. Sei das Produkt ZA vollranig, so erhalten wir durch Generalisierung
des metrischen Tensors G=CA1die quadratische Mahalanobis-Distanz
dM(ai,b
µA)2= (aib
µA)G(aib
µA)
= (aib
µA)CA1(aib
µA)
=˜aiCA1˜a
i
= (˜ui˜
Σ˜
V)CA1(˜ui˜
Σ˜
V)
=m˜ui˜u
i.(2.61)
Bezeichnen wir mit dM(ai,aj)die Distanz zwischen dem Vektor aiund ajunter der Ma-
halanobis-Metrik 62 bezüglich der Menge {a1,...,am}, so haben wir die quadratische Ma-
halanobis-Distanz
dM(ai,aj)2= (aiaj)G(aiaj)
= (aiaj)CA1(aiaj)
=m(˜ui˜uj)(˜ui˜uj).(2.62)
Damit haben wir gesehen, wie die Mahalanobis-Distanzen der Zeilenvektoren aivon Ain
Gl. (2.40) auf S. 28 bereits in der Matrix ˜
Uvorhanden sind, falls die SVD der zentrierten
Matrix ˜
A=˜
U˜
Σ˜
Vgegeben sei.
Bemerkung 2.4.14.Wir haben die Mahalanobis-Distanz zugunsten höherer Generalität in
Cndefinieren können, weil die quadratische Form mit einem komplexen Vektor reell ist.
„Eigentlich“ sind die Zeilenvektoren ˜ui(i= 1,...,m)in ˜
Unichts anderes als die
originalen Zeilenvektoren ˜ai(i= 1,...,m)in der Matrix ˜
Abezüglich der „guten“ Ba-
sis, die durch ˜
Σ˜
V(Regulärität angenommen) gegeben ist. Das ist, die Basisvektoren
σj˜vj(j= 1,...,n)konstruieren genau die Eigenbasis mit der durch entsprechenden Sin-
gulärwert gegebenen Skalierung. Die Singulärwerte sind die Längen der Semiachsen des
modellierenden Ellipsoids wie bereits in (2.60), Beobachtung. 2.4.13 (S. 38) dargestellt
worden ist.
Es sei darauf hingewiesen, daß die Distanzen davon unabhängig sind, ob die SVD sor-
tiert 63 ist oder nicht. Aber eine Sortierung vertauscht die originalen Koordinaten der Punkte
in Aund ˜
A, wenn wir die Zeilenvektoren aibzw. ˜aials Punkte im n-Raum betrachten. Die
meisten SVD-Routinen liefern eine unsortierte Version der Zerlegung zurück. Desweite-
ren merken wir uns, daß die Mahalanobis-Metrik abhängig ist von der Kovarianzmatrix in
Gl. (2.52) auf S. 36. Daher gibt es in der Praxis zwei Versionen der Mahalanobis-Metrik
die eine mit erwartungstreuer aber inkonsistenter und die andere mit verzerrter aber kon-
sistenter Kovarianzschätzung. Solche Variation sind auch in unseren Implementierungen
leicht umschaltbar gemacht.
62Da der Kern bzw. das Radikal der Bilinearform im generellen nicht der Nullvektor ist, also kein linearer Teil-
raum, sprechen wir von der Mahalanobis-Metrik nur im Tangentialraum lokal zum Mittelwertvektor. Andererseits
können wir die Mahalanobis-Metrik als eine affine Struktur über einem linearen Raum betrachten.
63Mit Sortierung der SVD meinen wir eine Sortierung nach den Sigulärwerten (in R) in abnehmender Reihen-
folge, wobei sowohl die assoziierten linken als auch die rechten Singulärektoren mitsortiert werden.
40
KAPITEL 2. GRUNDLAGEN
Wir kehren an dieser Stelle zurück zur Frage auf Seite 28: „Wie sind U,Σund Vzu
interpretieren, wenn die zu zerlegende Matrix AMeßdaten enthält?“. Die Antwort lautet,
kurz gefasst:
Die Singulärwertzerlegung transformiert die Daten in den euklidischen Raum
mit Mahalanobis-Metrik und präsentiert als linke Singulärvektoren die trans-
formierten Daten, als Singulärwerte die Varianzen der entkoppelten Daten, und
als rechte Singulärvektoren die Basis.
Wir bringen nun wie folgt die Begriffe SVD, Kovarianz, Eigenanalyse, und Mahalanobis-
Metrik in Verbindung, während wir noch einmal der Beobachtung. 2.60 (S. 38) einen Blick
werfen.
−10
−8
−6
−4
−2
0
2
4
6
8
10
−15 −10 −5 0 5 10 15
SVD, Mahalanobis−Metrik und Gausssche Verbunddichte
dM=1
dM=2
dM=3
Abbildung 2.5: SVD, Mahalanobis-Metrik und Gaußsche Verbunddichte sind eng mit einander ver-
koppelt. Hier wird die Form des euklidischen Raumes durch die konzentrischen Ellipsoide angedeutet.
Die Skalaren sind 1-, 2- und 3-Mal die entkoppelten Standardabweichung und die Singulärwerte sind
genau m-Mal die maximierten Standardabweichungen.
Gegeben sei die SVD der zentrierten Datenmatrix aus Gl. (2.54) auf S. 37 ˜
A=
ZmA=˜
U˜
Σ˜
V.
1. Die SVD schätzt die Kovarianzmatrix und inverse Kovarianzmatrix je-
weils als (1/m)˜
V˜
Σ2˜
Vund m˜
V˜
Σ2˜
Vin Gl. (2.56) auf S. 37 und
Gl. (2.57) auf S. 37.
2. Die SVD dekorreliert dann die nZufallsvariablen bzw. die nKanäle der
Meßdaten, indem sie die geschätzte Kovarianzmatrix diagonalisiert. Die-
se Dekorrelation erfolgt durch eine unitäre Transformation ˜
V. In anderen
Worten, die SVD weißt (whitens) die Daten in ˜
Aauf ˜
U˜
Σ, so daß die
Spalten in ˜
U˜
Σauseinander entkoppelt sind. Die Kovarianzen zwischen
den neuen Variablen sind verschwunden und die Singulärwerte haben nun
eine Interpretation von Standardabweichungen des unitär transformierten
2.4. MESSDATEN UND SINGULÄRWERTZERLEGUNG
41
Zufallsvektor bis auf einen Faktor m:64
σi=m×Standardabweichung(pi),
σ2
i=m×Varianz(pi),(2.63)
wobei pi(i= 1,...,n)die Zufallsvariablen aus Punkt 3 auf S. 29.
3. Dieobengenannten transformiertenDatensindalsZeilenvektorender Ma-
trix ˜
U˜
Σpräsentiert, d. h., die Zeilenvektoren
[σ1ui1, σ2ui2,...,σnuin] (i= 1,...,m).(2.64)
4. Die entkoppelten und standardisierten Daten sind als Zeilenvektoren der
Matrix ˜
Upräsentiert. Der Vektor ˜u sind also die in der Statistik soge-
nannten standardisierten Zufallsvektor, der eine Einheitsvarianz besitzt.
Die Koordinaten sind nun ˜
Σ˜
Vund die Vektoren ˜uierhalten somit eine
Einheit bzw. Skala von einer Standardabweichung. Die Zufallsvektoren
˜uisind nun nämlich unter der Basis ˜
Σ˜
Vhypersphärisch verteilt.
5. Die Mahalanobis-Distanzen sind explizit in ˜
Udurch die SVD präsen-
tiert. Sie sind nach Gl. (2.61) auf S. 39 und Gl. (2.62) auf S. 39 aus ˜
U
unmittelbar zu erhalten. Dies ermöglicht die viel bequemere Interpreta-
tion der Mahalanobis-Distanz wie folgt. Die quadratische Mahalanobis-
Distanz ist nichts anderes als die übliche Distanz der originalen Daten
˜aibzw. aizum Schwerpunkt b
µAunter der standardisierten Eigenbasis
(1/m)˜
Σ˜
V.
2.4.4 Kovarianz, Mahalanobis-Metrik und Gaußverteilung
Wie bereits in Gl. (2.53) auf S. 37 definiert weist der Begriff Kovarianzmatrix einen stocha-
stischen Charakter auf. Wir untersuchen nun die Zusammenhänge unter Kovarianzmatrix,
Mahalanobis-Metrik, SVD, und die wichtigste Verteilung Gaußverteilung. Wir verdeutli-
chen,
1. wie das Exponentialteil der Gaußverteilung, (xµ) in Gl. (2.67) auf S. 43 eigent-
lich als Mahalanobis-Distanz zu verstehen ist;
2. wie die Mahalanobis-Distanz die invariante „Einheit“ der Standardabweichung ge-
winnt;
3. wie die SVD als Schätzer für die n-dimensionale Gaußsche Verbunddichtefunktion
anzuwenden ist.
64 Wir haben deswegen das Symbol σsowohl statistisch für die Varianz als auch algebraisch für die Singulär-
werte einer SVD verwendet, weil die quadratischen Singulärwerte bis auf einen Faktor mgenau die Varianzen
sind von den transformierten Daten. Sei unsortierte SVD ˜
A= ( ˜
U˜
Σ)˜
V, dann die Kovarianzmatrix CA0der
transformierten Daten bezüglich der Basis ˜
Vist
CA0= (1/m)( ˜
U˜
Σ)(˜
U˜
Σ)
= (1/m)˜
Σ(˜
U˜
U)˜
Σ= (1/m)˜
Σ2
= diag(σ2
1/m, σ2
2/m, . . . , σ2
n/m).
42
KAPITEL 2. GRUNDLAGEN
Dieo.g.Punktewerdenaufeinmal deutlich, wenn wir die Dichtefunktion in n-dimensionalen
Raum anschauen. 65
Ein stochastischer Prozess x(t)heißt Gaußsch, wenn die Zufallsvariablen x(t1),x(t2),
..., x(tk)für jede kNund alle Mengen {t1, t2,...,tk}verbund-Gaußsch verteilt ist
[Lathi, 1968, p. 205].
Wir wählen k=nfür eine Menge von nAbtastungen der Musterfunktion x(ζ, t)zu
den Zeitpunkten {t1, t2,...,tn}und wiederholen mMale das Experiment des Gaußschen
Prozesses. So, erhalten wir eine m×nDatemmatrix Ain Gl. (2.40) auf S. 28, wobei
jede Zeile x(ζi, tj), j = 1,...,n eine Musterfunktion von ζizu den Zeiten {t1,...,tn}
abtastet und jede Spalte x(ζi, tj), i = 1,...,mBeobachtungen zu dem festen Zeitpunkt tj
verschiedenen Musterfunktionen darstellen 66
A=
x(ζ1, t1)x(ζ1, t2)··· x(ζ1, tn)
x(ζ2, t1)x(ζ2, t2)··· x(ζ2, tn)
x(ζ3, t1)x(ζ3, t2)··· x(ζ3, tn)
x(ζ4, t1)x(ζ4, t2)··· x(ζ4, tn)
x(ζ5, t1)x(ζ5, t2)··· x(ζ5, tn)
x(ζ6, t1)x(ζ6, t2)··· x(ζ6, tn)
.
.
..
.
..
.
..
.
.
x(ζm, t1)x(ζm, t2)··· x(ζm, tn)
m×n
=
a1
a2
a3
a4
a5
a6
.
.
.
am
.(2.65)
Sei Zufallsvektor x=aT
iaus Gl. (2.40) auf S. 28, mit Verbundgaußverteilung
x=
x(t1)
x(t2)
.
.
.
x(tn)
=
x1
x2
.
.
.
xn
xCn
dann läßt sich der Gaußsche Prozeß vollständig durch den Mittelvektor µxund die Kovari-
anzmatrix CAin Gl. (2.52) auf S. 36 und Gl. (2.53) auf S. 37 beschreiben, ob der Gaußsche
Prozeß stationär oder nicht [Lathi, 1968, p. 206]. Die multivariate Verbunddichte f(x)läßt
sich bezüglich des Zufallsvektors x, der theoretischen Kovarianzmatrix CGl. (2.53) auf
S. 37 und des Mittelwertvektors µxwie folgt schreiben:
f(x) = 1
(2π)n/2det Cexp 1
2(xµx)C1(xµx)
=det C1
(2π)n1/2
exp 1
2(xµx)C1(xµx)
=sdet C1
(2π)nexp 1
2(xµx)C1(xµx)
=sdet C1
(2π)nexp 1
2d2
M(x,µx),(2.66)
mit ZZ···ZCn
f(x) = 1,
65[Lathi, 1968, p. 110, p. 147 (2-135), p. 151 (2-140), pp. 205–207 Gaussian Random Process]
66Ähnlich wie das Bild in [Lathi, 1968, Fig. 3-1, p. 160]
2.4. MESSDATEN UND SINGULÄRWERTZERLEGUNG
43
wobei µxder Mittelwertvektor und Cdie theoretische Kovarianzmatrix sind. Man merke,
daß die Form der quadratischen Mahalanobis Distanze erscheint im exponentialen Teil der
Dichtekunktion f(x)in Gl. (2.66) auf S. 42. Die beiden in Gl. (2.66) auf S. 42 (ind gleich,
da det1CA= det CA1, wenn CAregulär ist. Ersetzen wir CAdurch σ2,µxdurch µin
Gl. (2.66) auf S. 42 für 1-dimensionalen Fall, so erhalten wir die auf der 10-Mark-Banknote
sehr schön gedruckte Kurve von Carl Friederich Gauß (1777-1855)
f(x) = 1
σ2πexp "1
2xµ
σ2#.(2.67)
Sei die SVD der zentrierten Matrix aus Gl. (2.54) auf S. 37
˜
A=ZmA=˜
U˜
Σ˜
V,(2.54)
dann ist die Determinante der geschätzten Kovarianzmatrix
det CA= det 1
m1˜
V˜
Σ2˜
V
=1
m1n
det( ˜
V) det(˜
Σ2) det( ˜
V)
=1
m1n
(det ˜
Σ)2,
und
det(CA1) = (det CA)1= (m1)n(det ˜
Σ)2.(2.68)
Somit wird die geschätzte Gaußsche Verbunddichte von Gl. (2.66) auf S. 42 bezüglich
der SVD Gl. (2.54) auf S. 37
b
f(x) = sdet CA1
(2π)nexp 1
2d2
M(x,b
µx)
=s(m1)n(det ˜
Σ)2
(2π)nexp 1
2d2
M(x,b
µx)
=1
det ˜
Σ2π
m1n/2
exp 1
2d2
M(x,b
µx)
=1
det ˜
Σ2π
m1n/2
exp m1
2(xb
µx)˜
V˜
Σ2˜
V(xb
µx).(2.69)
(2.69) ist eine allgemeine Form der geschätzten Gaußschen Verbunddichte bezüglich belie-
bigen Zufallsvektors x. Wir haben die geschätzte Dichte f(x)allerdings bereits an den m
Punkten aider Datenmatrix Aevaluiert, falls Gl. (2.54) auf S. 37 berechnet worden ist. Aus
Gl. (2.61) auf S. 39 ergibt
b
f(ai) = 1
det ˜
Σsm1
2πn
exp 1
2d2
M(ai,b
µA)
=1
det ˜
Σsm1
2πn
exp 1
2(m1) ˜ui˜u
i
=1
det ˜
Σ2π
m1n/2
exp 1
2(m1) ˜ui˜u
i.(2.70)
44
KAPITEL 2. GRUNDLAGEN
Seien s1,...,sndie Standardabweichungen der entkoppelten Zufallsvariablen, d. h., der
Spalten der Matrix ˜
U˜
Σ. Da σi=m1siaus Gl. (2.63) auf S. 41, wobei σiSingulär-
werte aus ˜
Σsind, dann läßt sich (2.70) wie folgt vereinfachen:
b
f(ai) = (2π)n/2
n
Y
i=1
s1
iexp 1
2(m1) ˜ui˜u
i
= n
Y
i=1
si2π!1
exp 1
2(m1) ˜ui˜u
i.(2.71)
2.4.5 Regularisierte Mahalanobis-Distanz via SVD
Die Mahalanobis-Distanz dM(x,y)zweier Vektoren x,yCnist eine quadratische Form
Cn7→ R
(xy,xy)7→ (xy)G(xy),(2.72)
wobei der metrische Tensor Gder inversen Kovarianzmatrix CA1entnommen ist, bezüg-
lich einer bestimmten Menge der Vektoren in Cn. Es läßt sich ohne weiteres zeigen, daß
solche den Axiomen einer Metrik 67 genügt. Wir sprechen von einer Mahalanobis-Metrik
68.
Diese Definition der Mahalanobis-Metrik setzt selbstverständlich die Invertierbarkeit
der Kovarianzmatrix CAvoraus. In der Praxis kann es oft passieren, daß die Kovarianzma-
trix CAin Gl. (2.52) auf S. 36 singulär wird, wenn die Datenmatrix Ain Gl. (2.40) auf S. 28
rang-deffizient ist. Selbst wenn die Datenmatrix Avollrangig ist, kann die Kovarianzma-
trix CAsogar nach Gl. (2.47) auf S. 33 in § 2.4.1 singulär sein, wenn alle Zeilenvektoren
aigenau auf einem affinen Teilraum der Dimension kleiner als nlägen. Desweiteren ist
nicht nur die Singularität der Kovarianzmatrix CAdas einzige Problem, sondern auch die
Kondition κp(CA)der zu invertierenden Kovarianzmatrix CAeine wichtige Rolle in der
numerischen Praxis spielt. Die Invertierung schlecht-konditionierter Matrizen führt oft zu
numerischer Instabilität. Im extremen Falle begegnet man z. B. einer Matrix wie die folgen-
67 Sei Meine Menge. Eine Metrik auf Mist eine Abbildung d:M×M7→ R+, so daß für alle x, y M,
gilt
1. d(x, y)0und d(x, y) = 0 x=y(Positiv-Definitheit),
2. d(x, y) = d(y, x)(Symmetrie),
3. d(x, y)d(x, z) + d(z, y)(Cauchy-Schwarzsche Ungleichung).
Ein linearer Raum mit einer Metrik heißt metrischer Raum. Ein metrischer Raum heißt vollständig, wenn jede
Cauchy-Folge kovergent ist.
68 Ein linearer Raum Vmit einem Funktional kxkheißt normierter Raum, wenn für alle x,y V und αC
gilt
1. kxk 0,kxk= 0 x=0,
2. kαxk=|α| · kxk,
3. kx+yk kxk+kyk.
Eine Überführung vom normierten Raum zum Raum mit Skalarprodukt (,)ist durch Polarisierung möglich. Sei
x,yim linearen Raum mit k · k über K, dann gilt
(x,y) = 1/4(kx+yk2 kxyk2)falls K=R
1/4(kx+yk2 kxyk2+ıkx+ıyk2ıkxıyk2)falls K=C.(2.73)
2.4. MESSDATEN UND SINGULÄRWERTZERLEGUNG
45
de 8×8symmetrische, singuläre Rosser’sche Matrix vom Rang 7[Rosser et al., 1951]
A=
611 196 192 407 852 49 29
196 899 113 192 71 43 844
192 117 900 196 61 49 8 52
407 192 196 611 8 44 59 23
871 61 8 411 599 208 208
52 43 49 44 599 411 208 208
49 8 8 59 208 208 99 911
29 44 52 23 208 208 911 99
.(2.74)
Der Autor kennt keine einzige Routine (bis auf SVD) fürs Invertieren, die die Singularität
der Matrix detektiert (unter Standard-Gleitkommazahlen der üblichen Präzision „IEEE-754
double“ [IEEE, 1985]) 69.
Die Aufgabe, Mahalanobis-Distanz zu berechnen, wird in solchen Fällen inkorrekt bzw.
schlecht-gestellt [Hadamard, 1923]. Wir suchen also eine robustere Erweiterung der Maha-
lanobis-Distanz, die den Schwierigkeiten:
1. die Mahalanobis-Distanz ist nicht erklärt im Falle einer singulären Kova-
rianzmatrix, und
2. die Berechnung der Mahalanobis-Distanz kann bei schlecht-konditionier-
ten Kovarianzmatrizen numerisch instabil sein,
umgeht. Wie wir sehen werden, die Antwort beinhaltet die Singulärwertzerlegung als der
Schlüssel zur Lösung.
Die Gewinnung des metrischen Tensors Gin Gl. (2.61) auf S. 39 und Gl. (2.62) auf
S. 39 durch Invertierung der Kovarianzmatrix CAverläßt sich auf die Spektraleigenschaft
[Ben-Israel und Greville, 1974, pp. 166-169] [Campbell und Meyer, 1979, p. 74] der Ma-
trizeninversion. Das bedeutet: sei λCein Eigenwert und xCnein Eigenvektor der
quadratischen Matrix ACn×n, so gilt
Ax =λx A1x=λ1x.(2.75)
Diese Eigenschaft garantiert im übrigen die Erhaltung der Positiv-Definitheit der Matrix A,
wenn sie so ist, was man für eine Metrik braucht.
Für singuläre quadratische Matrizen Asuchen wir nun eine eindeutige, generalisierte
Inverse, die diese Spektraleigenschaft Gl. (2.75) auf S. 45 besitzt. Sie sind als Spektralin-
versen bezeichnet [Rao und Mitra, 1971] [Boullion und Odell, 1971, p. 20] [Ben-Israel und
Greville, 1974, pp. 159–161] [Campbell und Meyer, 1979].
Die einem sofort einfallende, und eindeutige Moore-Penrose-Inverse Ajedoch erfüllt
im allgemeinen die Gl. (2.75) auf S. 45 nicht. Die Gruppeninverse A#70 erfüllt zwar diese
Bedingung, aber sie existiert nur wenn R(A)und N(A)komplementäre Teilräume sind.
69Dieses Beispiel ist hier angeführt, um die Nicht-Trivialität der numerischen Realisierungen zu betonen. Alle,
die dran zweifeln, sollten sich trotz des durchaus harmlosen Aussehens einmal die Inverse oder die Determinan-
te der Matrix berechnen lassen. Es sei darauf aufmerksam gemacht, daß lockere Implementierung und Kontrolle
sowie indifferente Mentalität diesgegenüber zu Katastrophen führen können. Der Absturz der europäischen Rake-
te, Ariane 5, am 4. Juni, 1996 fing mit einem Konvertierungsproblem von 64-Bit-Gleitkommazahlen auf 16-Bit-
Integer an und endete mit ratloser Zündung der Selbstvernichtung. [Lions, 1996] [Le Lann, 1997].
70[Ben-Israel und Greville, 1974, pp. 162–164, 166–169] [Campbell und Meyer, 1979, p. 129]
46
KAPITEL 2. GRUNDLAGEN
Uns bleibt nur noch die eindeutige Drazin-Inverse AD71, bzw. „vertauschbare Pseudoin-
verse“ (commuting inverse) 72, die bei allen Matrizen existiert und die Spektraleigenschaft
Gl. (2.75) auf S. 45 aufweist 73 . Glücklicherweise ist unsere Anwendung der Drazin-Inver-
se auf die selbstadjungierten Matrizen eingeschränkt. Die Matrizen dieser Kategorie fallen
in die Klasse von den sogenanten EP-Matrizen. Und bei dem EP-Matrizen fallen die Moo-
re-Penrose-Inverse, die Gruppeninversen und die Drazin-Inverse 74 zusammen. [Ben-Israel
und Greville, 1974, p. 164, Theorem 3] Wir können also in unserer Aufgabe die Moore-
Penrose-Inverse das Problem lösen, denn sei ACn×n,Aist genau dann EP, wenn 75
(Ax =λx Ax=λx).(2.76)
Hinzu kommt, daß sich die Moore-Penrose-Inverse durch die SVD berechnen läßt, wobei
eine Regularisierung der schlechten Kondition der Inversion äußerst günstig vorzunehmen
ist.
Definition 2.4.15 (Regularisierte Mahalanobis-Distanz). Wir defininieren die regulari-
sierte Mahalanobis-Distanz r
dM(x,y)Rzweier Vektoren x,yCnbezüglich einer
bestimmten Menge der Vektoren in Cndurch
r
dM2(x,y) = (xy)CA(xy) = mt˜uit˜u
j,(2.77)
wobei die Regularisierung operativ in der Berechnung der Moore-Penrose-Inversen enthal-
ten ist, wie bereits in § 2.4.2 diskutiert worden ist. (Cf. schur2.c -pm,matstat.c
-mpB und mahr.m)
Die Zeilenvektoren t˜uiund t˜ujin Gl. (2.77) auf S. 46 sind dieselben aus Gl. (2.62)
auf S. 39 in § 2.4.3 bis auf einen adjustierbaren numerischen Rang r, ab den die SVD
abgeschnitten wird und die entsprechenden Singulärvektoren (ergo Komponenten in t˜ui)
auf Null gesetzt werden. Für die regularisierte Mahalanobis-Distanz zwischen einem Vektor
aiund dem Schwerpunkt b
µAheißt das aus Gl. (2.61) auf S. 39
r
dM2(ai,b
µA) = mt˜uit˜u
i=m
r
X
j=1
˜u2
ij.(2.78)
Wir wollen nun die Plausibilität der regularisierten Mahalanobis-Distanz in Gl. (2.77)
auf S. 46 im pathologischen Falle inspezieren, wenn die Kovarianzmatrix CAsingulär wä-
re. Dies ist gerade bei uns interessant, denn ein Hyperkreis (Def. 2.4.17 auf S. 49) in Un
71[Ben-Israel und Greville, 1974, pp. 169–175] [Campbell und Meyer, 1975] [Cline, 1979, pp. 57–62] [Wilkin-
son, 1979] [Higham und Knight, 1993] [Meyer, 2000, p. 399]
72[Rao und Mitra, 1971, pp. 95–97] [Pringle und Rayner, 1971, pp. 19-22]
73Siehe ginv.c -D2 und -D1 via core-nilpotent-decomposition [Meyer, 2000, pp. 397–399] und SVD bzw.
RREF (reduced row echelon form bzw. reduzierte Zeilenstufenform). Für weitere Möglichkeit der Implementierung
solcher Inversen, siehe z. B. [Campbell und Meyer, 1979, pp. 125–127].
74Obwohl die Drazin-Inverse zum diesem Zweck im letzten nicht gebraucht werden muß, war eine praktische
Untersuchung ihrer Eigenschaften notwendig. Sie ist deswegen auch im Projekt implementiert worden. (Siehe
ginv.c -D1.)
75Für einen Beweis siehe [Campbell und Meyer, 1979, p. 75, Theorem 4.3.2].
2.4. MESSDATEN UND SINGULÄRWERTZERLEGUNG
47
76 77liegt immer auf einem affinen Teilraum von Dimension n1. Jede Realisierung bzw.
Abtastung eines Hyperkreises (Def. 2.4.17 auf S. 49), wenn ungestört, ergibt nach Gl. (2.47)
auf S. 33 in § 2.4.1 eine singuläre Kovarianzmatrix. Da sich die Hyperkreise höherer Di-
mension nur schwierig visualisieren lassen, wenn nicht unmöglich, ist ein Funktional auf
den Grundkörper mit charakterisierenden Eigenschaften einer Punktmenge wie die Maha-
lanobis-Distanz zur Untersuchung äußerst hilfreich.
Mit Mahalanobis-Distanz drehen und skalieren wir die Koordinaten je nach der durch
ein Hyperellipsoid modellierten Streuung der Daten, so daß die Verteilung der Daten sphä-
risch wird im Bezug auf diesem (orthogonalen) Koordinatensystem. Dies macht die „Ein-
heit“ der Distanz gleich der Standardabweichung und unabhänigig von den originalen Ein-
heiten.
Bei verschwindender Variation der Daten in einer Richtung bricht das Hyperellipsoid
in dieser Dimension zusammen. Die dazu gehörige Skala werden „unendlich dicht“. Die
resultierenden Koordinaten werden numerisch instabil werden wegen begrenzter Darstel-
lungspräzision, selbst wenn sie nicht unendlich groß werden. Die Strategie ist nun eine
76 Ein n-dimensionaler euklidischer Raum Enist ein linearer Raum Vüber Rmit Skalarprodukt, das heißt,
ein Vektorraum mit zusätzlicher geometrischer Struktur, der Form des Raumes, mit der wir von einer Länge des
Vektors oder einem Winkel zwischen zwei Vektoren oder überhaupt vom Begriff Orthogonalität sprechen können.
Diese geometrische Struktur ist eine symmetrische, positiv-definite Bilinearform (u,v) : V × V 7→ R,mit den
Axiomen
1. (u,v) = (v,u)R,(Symmetrie)
2. (u,u)0,(u,u) = 0 u=0(positiv definite quadratische Form)
3. (u, αv+βw) = α(u,v) + β(u,w),(Bilinearform)
für alle u,v,w V und α, β R. Alle Bilinearformen, die die Axiome genügen, dürfen als das Skalarprodukt
auserkoren werden. Aus 1. folgt, daß 3. auch in der ersten Variablen linear ist. Nach Einführung einer Basis genügt
den Axiomen die Form uTAv mit einer symmetrischen, positiv definiten Matrix ARn×n. [Shilov, 1971,
pp. 215–216] [Kaplansky, 1974, pp. 1–5] [Kostrikin und Manin, 1989, p. 117] Fußnote 77 auf S. 47
77 Ein n-dimensionaler unitärer Raum Unist ein linearer Raum Vüber Cmit Skalarprodukt (u,v), so daß
für alle u,v,w V und α, β C, gilt:
1. (u,v) = (v,u)C,(konjugiert symmetrisch, nicht kommutativ!)
2. (u,u)0,(u,u) = 0 u=0(positiv definite quadratische Form)
3. (u, αv+βw) = α(u,v) + β(u,w),(„Physiker-Sesquilinearform“)
Ein vollständiger unitärer Raum heißt Hilbertraum [Kantorowitsch und Akilow, 1978, p. 65]. Aus 1. folgt, daß die
quadratische Form in 2. reell ist. Diese geometrische Struktur heißt positiv definite hermitesche Sesquilinearform.
Dadurch wird eine Norm kuk=p(u,u)Fußnote 68 auf S. 44 induziert. Die Norm induziert wiederum eine
Metrik d(u,v) = k(uv)kFußnote 67 auf S. 44. Damit ist der Raum zugleich mit einer Metrik ausgestat-
tet. Nach Einführung einer Basis genügt den Axiomen die Form uAv mit einer hermiteschen, positiv definiten
Matrix ACn×n. Wir übernehmen die „Physiker-Konvention“ bzw. „Numeriker-Konvention“, daß die Sesqui-
lineareform in der zweiter Variablen linear und in der ersten konjugiert linear seien. Wir schreiben und berechnen
nämlich ein komplexes Skalarprodukt durch uv, indem wir die Vektoren als Spalten-Matrizen formulieren. NB.
Wir haben Erfolg bei Erweiterung des Begriffs Länge des Vektors auf komplexe Räume, denn die quadratische
Form in 2. ist stets reell. Dennoch begegnen wir Schwierigkeiten beim Begriff „Winkel“, weil das Skalarprodukt
in cos θ= (u,v)/p(u,u)(v,v)im generellen komplex ist. Bei Bedarf kann der Betrag am Zähler genommen
werden, denn |(u,v)| p(u,u)(v,v). Dennoch ist solcher keine plausibler Erweiterung des Winkels im eu-
klidischen Raum auf unitären Raum. Eine plausible Erweiterung des Begriffs Winkel auf unitären Raum zwischen
zwei komplexen Vektoren solle, meiner Ansicht nach, das geometrische Verhältnis zwischen zwei komplexen Vek-
toren vollständig beschreiben, wie es im euklidischen Raum der Fall ist. Dies könne Erfolg haben, indem man das
Verhältnis zwischen zwei 2-dimensionalen Teilräumen im euklidischen Raum betrachte. Der Begriff Orthogo-
nalität zweier komplexen Vektoren u,vist zwar durch (u,v) = 0 wohl-definiert, die Interpretation derer sei
plausibler mittels Verhältnisses zwischen zwei 2-dimensionalen Teilräumen im euklidischen Raum. [Davis, 1958]
(im Hilbert-Raum) [Davis und Kahan, 1970] (im Hilbert-Raum) [Shilov, 1971, pp. 244–245,p. 373] [Hohn, 1973,
p. 373] [Golub und Van Loan, 1983, pp. 20–24] [Golub und Van Loan, 1983, pp. 425–431] [Vandewalle und De
Moor, 1988, p. 56] [Ipsen und Meyer, 1995] [Suschowk, 1956 (1957] [Zassenhaus, 1964] [Wedin, 1982] [Ritov,
1992] [Golub und Van Loan, 1996, pp. 603–604] [Stewart, 1998, pp. 74–76] [Stewart, 1999, pp. 7–8] [Meyer,
2000, pp. 450–459]
[Chen, 2001] Fußnote 76 auf S. 47
48
KAPITEL 2. GRUNDLAGEN
regularisierte Metrik benutzen, die die Messung in dieser „defekten“ Dimension einfach
„ignorieren“. Mit „ignorieren“ meinen wir das Nullieren der Beiträge der Koordinaten in
dieser Richtung zur Distanz überhaupt. Dieser regularisierte metrische Tensor bekommen
wir als die Moore-Penrose-Pseudoinverse der rangdeffizienten Kovarianzmatrix.
Die (eindeutige) Moore-Penrose-Inverse einer beliebigen Matrix in Cm×nwird oft nu-
merisch durch die Singulärwertzerlegung berechnet werden. Ein begleitender Vorteil bei der
SVD ist, daß die Anwendung der SVD fast „idiotensicher“ ist hinsichtlicher der numeri-
schen Stabilität. Dies gilt auch in der Situation, wo das Hyperellipsoid in gewisser Richtung
ziemlich „flach“ wird.
Die Psdeudoinverse, andererseits, resultiert in eine gleichrangige Matrix mit invertierten
Eigenwerten (im Falle der reellen symmetrischen Kovarianz), wenn die zu Invertierenden
(numerisch) singulär wird. Die originalen Null-Eigenwerte bleiben unverändert. In diesem
Fall bleiben die Skalierung in den Richtungen der von Null verschiedenen Eigenwerte un-
verändert während die Skalierung in den Richtungen der verschwundenen Eigenwerte „un-
endlich grob“ gemacht wird, so daß der Anteil eines Punktes in diesen Richtungen trägt zur
regularisierten Mahalanobis-Distanz nichts bei. Das heiß, die Variation der Daten in diesen
Richtungen hat keinen Einfluß auf die regularisierte Mahalanobis-Distanz.
Beispiel 2.4.16. Seien 4×3Datenmatrix und ihre Zentrierte
A=
6 2 3
4 2 3
1 7 3
13 3
,˜
A=Z4A=
5 0 0
5 0 0
0 5 0
05 0
.
Dies ist eine gleichmäßige 4-punkt-Abtastung eines 1-Hyperkreises (Def. 2.4.17 auf S. 49)
mit Normalvektor n= [ 0 0 1 ], Zentrum z= [ 1 2 3 ] und Radius r= 5 (hyper.c -c).
Der 1-Hyperkreis entpricht einem üblichen Kreis in E3. Es sei beachtet, daß rank A= 3,
und die eigentliche Dimension der Daten-Dynamik, rank ˜
A= 2, wird erst durch das Zen-
trieren vom Projektor Z4auf den AC-Teilraum,span{n}, zum Vorschein gebracht. Die
Punkte (Zeilenvektoren der Matrix A) liegen nämlich alle in einem 2-dimensionalen affi-
nen Teilraum. Die ML-Schätzung der Kovarianzmatrix ist eine 3×3rang-2symmetrische
Matrix
CA=1
4˜
A˜
A=
12.5 0 0
0 12.5 0
0 0 0
,
welche mit der theoretischen Kovarianzmatrix übereinstimmt mit
tr CA=r2= 52
und
kCAk2= tr CA/(n1) = tr CA/(3 1) = 12.5
Wir merken, daß CAist nur semidefinit (mit zweifachem 12.5und einem Null-Eigenwert).
Da CAnicht invertiertbar ist, ist die Mahalanobis-Distanz undefiniert. Unsere regulari-
sierte Mahalanobis-Distanz nimmt als „Metrik“ die rang-2symmetrische Moore-Penrose
Pseudoinverse
CA=
0.08 0 0
0 0.08 0
0 0 0
2.4. MESSDATEN UND SINGULÄRWERTZERLEGUNG
49
mit λ1=λ2= 0.8und λ3= 0 als Eigenwerte. Die regularisierte Mahalanobis-Distanz Mr
von einem Punkt zum Zentrum
r
dM(P1= (5 0 0)) = 2
r
dM(P2= (6 0 0)) = 1.697056 >2
r
dM(P3= (5 0 1)) = 2
r
dM(P4= (6 0 1)) = 1.697056 >2.
P1liegt im Hyperkreis (Def. 2.4.17 auf S. 49) und hat eine regularisierte Mahalanobis-
Distanz n1 = 2.
P2ist in die Richtung der Hyperebene leicht von dem Hyperkreis entfernt und hat eine
Mahalanobis-Distanz größer als die des P1.
P3is von P1aus in die Richtung des Null-Eigenwertes verschoben und hat eine regu-
larisierte Mahalanobis-Distanz gleich der der orthogonalen Projektion (P1) auf der Hyper-
ebene.
P4ist vom P1verschoben sowohl in die Richtung der Hyperebene als auch in die Rich-
tung des Nullraums der C. In diesem Fall hat der Anteil in der letzteren Richtung keinen
Beitrag zu der Distanzmessung.
Anschaulich gedacht, besteht unsere Regularisierung darin, die (linearen) Beiträge der
Mahalanobis-Distanz im Nullraum der Kovarianzmatrix zu ignorieren, da eine Messung
der Distanz in solchem nicht möglich ist. In anderen Worten, unsere regularisierte Distanz
macht keinen Unterschied der Messungen zwischen einem Hyperkreis und einem Hyperzy-
linder.
2.4.6 Hyperkreis und Regularisierte Mahalanobis-Distanz
Definition 2.4.17 (Hyperkreis). Ein Hyperkreis in Unist eine nicht ausgeartetete Schnitt-
menge einer Hyperebene und einer Hypersphäre. Das Normal bzw. der Richtungsteilraum
des Hyperkreises ist das Normal bzw. Richtungsteilraum der Hyperebene. Das Zentrum
bzw, der Radius des Hyperkreises das Zentrum bzw, der Radius der Hypersphäre. Da ein
Hyperkreis eine (n2)-dimensionale Mannigfaltigkeit in Unist, bezeichnen wir mit Kn2
die Menge aller (n2)-Hyperkreise in Un.
Ein Hyperkreis ist also durch ein Zentrum z Un, einen Radius rR, und einen
Richtungsteilraum P Unbzw. ein Normal n Unzu bestimmen.
Beispiel 2.4.18. In E3mit Standard-Skalarprodukt ist ein 1-Hyperkreis in K1ein gewöhn-
licher Kreis, der im Raum schwebt, Cf. Abb. 2.6 auf S. 51. Der Richtungsteilraum Pvon
einem 1-Hyperkreis in K1ist eine 2-dimensionale Ebene durch den „Ursprung“. Auf dem
Papier, bzw. in E2ist ein 0-Hyperkreis in K0bloß eine Menge von zwei Punkten mit null
Freiheitsgrad. Note bene! Ein Kreis auf dem Papier, E2, ist kein Hyperkreis, sondern eine 1-
Hypersphäre in S1 E2. Die Bezeichnungen sind der topologischen Konvention konform.
Die Visualisierung eines Hyperkreises, einer (n2)-Mannigfaltigkeit, in höherer Di-
50
KAPITEL 2. GRUNDLAGEN
mension ist schwierig, wenn nicht unmöglich 78. Um rechnerisch mit dem Begriff Hyper-
kreis auseinandersetzen zu können, brauchen wir konkrete Abtastungen der Hyperkreise.
Wir präsentieren wie folgt einen Erzeugungsalgorithmus mit statistisch gleichverteilten Ab-
tastpunkten auf einem (n2)-Hyperkreis En.
Algorithmus 2.4.19 (Erzeugung des Hyperkreises). Sei ein Hyperkreis K Kn2mit
Radius rR, Normal nRn, Zentrum zRn. Die folgenden Schritte generieren gleich
verteilte Zufallspunkte kK:
1. Erzeuge aiRn, i = 1,...,n1, so daß
span {a1,a2,...,an1}= span {n},a
iaj=δij,(2.79)
2. Erzeuge neue Zahl giR, i = 1,...,n1, so daß
giN(0,1),E[gi] = 0,E[gigj] = δij,(2.80)
3. Berechne neuen Vektor bspan {n}durch
b=
n1
X
j=1
gjaj,(2.81)
4. Berechne neuen Vektor kKdurch
k=c+rb
bb,(2.82)
5. Wiederhole (2) bis (4) für die gewünschte Anzahl der Punkte.
Bemerkung 2.4.20 (Erzeugung des Hyperkreises). G. W. Brown hat 1956 zuerst eine Me-
thode zur Erzeugung gleich verteilter Zufallspunkte auf einer Sphäre veröffentlicht [Brown,
1956] [Knuth, 1981, 1969, pp. 130–131]. Der Algorithmus 2.4.19 (S. 50) ist von Brown-
scher Methode abgeleitet und in ghyper -c implementiert worden. Siehe Abb. 2.6 auf
S. 51 für eine Visualisierung des Hyperkreises in K1und K2. Ein Hyperkreis in K0be-
steht nur aus zwei Punkten. Ein Kreis auf dem Papier, E2, ist kein Hyperkreis, sondern eine
1-Hypersphäre.
Da bei uns ein Hyperkreis höherer Dimension nur durch den Algorithmus 2.4.19 (S. 50)
per Zufallspunkte realisiert werden kann, beweisen wir in diesem Abschnitt einige hilfreiche
Korollare über ihre statistischen Eigenschaften und Mahalanobis-Distanzen.
Lemma 2.4.21 (Kovarianzmatrix der Hypersphäre). Sei gleich verteilter Zufallsvektor
x Unauf einer (n1)-sphäre Sn1 Unmit Radius rRund beliebigem Zentrum
z Un, dann ist die Kovarianzmatrix aus Gl. (2.53) auf S. 37
CSn1=E[ (xz)(xz)] = r2
nI.(2.83)
78Die folgenden Monographien werden uns bei der mentalen sowie evtl. physikalischen Visualisierung der hö-
heren dimensionalen Gebilde sicherlich weiter helfen: [Abbott, 1952; Abbott und Buck, 1990] [Du Val, 1964]
[Weeks, 1985] [Coxeter, 1973] [Altmann, 1986] [Rucker, 1987] [Banchoff, 1990]
2.4. MESSDATEN UND SINGULÄRWERTZERLEGUNG
51
Verrauschter 1-Hyperkreis in E3und Projektionen Projektionen verrauschten 2-Hyperkreises in E4
verrauschter 1−Hyperkreis in E3 & Projektionen
Projektion auf x=0
Projektion auf y=0
Projektion auf z=0
0510 15 20
x
0
5
10
15
20
y
0
5
10
15
20
25
30
35
40
45
50
z
Projektionen des verrauschten 2−Hyperkr. in E4 auf E3 & E2
Projektion auf y=0
Projektion auf z=0
Projektion auf t=0
Projektion auf t=0
Projektion auf y−z
Projektion auf x−z
Projektion auf x−y
0510 15 20 25
0
5
10
15
20
25
30
35
0
5
10
15
20
25
30
35
40
45
(a)
(b)
Abbildung 2.6: Visualisierung des Hyperkreises durch Projektionen. (a) Projektionen eines 1-
Hyperkreises in E3auf E2mit Radius = 5, Anzahl = 128, Zentrum = [10 10 30], Normal
= [1 1 1], σ = 0.5. (b) Projektionen eines 2-Hyperkreises in E4auf E3und E2mit Radius = 5,
Anzahl = 1024, Zentrum = [10 20 30 40], Normal = [1 1 1 1], σ = 0.2(via ghyper.c-c und
gaussian.c).
Beweis. Sei Zufallsvektor x= [x1x2···xn]Tgleich verteilt auf einer (n1)-Sphäre mit
Radius rund Zentrum z= [z1z2···zn]Tmit
(x1z1)2+···+ (xnzn)2=r2.(2.84)
Da xgegen das Zentrum isotropisch ist, ist der Erwatungswert einzelnen Komponenten
E[x1z1] = ···=E[xnzn] = 0.(2.85)
und
E(x1z1)2=···=E(xnzn)2.(2.86)
Da xkonstante Länge von rbesitzt, haben wir
E(xz)T(xz)=E(x1z1)2+···+ (xnzn)2=Er2=r2.(2.87)
Aus (2.86) und (2.87) ergibt sich die diagonale Elemente der Kovarianzmatrix Gl. (2.53)
auf S. 37
cii =E(xizi)2=r2/n, (i= 1,...,n).(2.88)
Die nicht-diagonale Elemente der Kovarianzmatrix
cij =E(xiµxi)(xjµxj)=E[xixj]E[xi]E[xj] = 0,(2.89)
da xiund xj(i6=j)unkorreliert sind (E[xixj] = E[xi]E[xj]) laut unseres Algorith-
mus 2.4.19 (S. 50) der Hypersphäregenerierung.
Dies heißt, die Kovarianzmatrix gleich verteilter Punkte auf einer Sphäre ist diagonal
und nur abhängig von der Dimension des Raumes und dem Radius 79. Aus diesem Lemma
ergibt sich das folgende Korollar über die konstante Mahalanobis-Distanz gleich verteilter
Punkte auf einer Sphäre.
79Durch Ausführungen von (ghyper.c -sn4096 (param.) | matstat.c -Ppc -pB) verifizie-
ren wir, daß dies mit Berechnungen der Kovarianzmatrix CAaus Datenmatrix Aübereinstimmt.
52
KAPITEL 2. GRUNDLAGEN
Korollar 2.4.22 (Mahalanobis-Distanz der Hypersphäre). Sei gleich verteilter Zufalls-
vektor x Unauf einer (n1)-Sphäre Sn1 Un, dann ist der konstante Erwartungswert
der Mahalanobis-Distanz aller Punkte auf der Sphäre eine Konstante, die nur anhängig st
von der Dimension n:
EdM(x Sn1)=n. (2.90)
Beweis. Sei z Undas Zentrum der Sphäre und rRder Radius.
Ed2
M(x Sn1)=E(xz)TC1
Sn1(zz).
Aus Lemma 2.4.21 auf S. 50, (2.83), die Kovarianzmatrix CSn1= (r2/n)Iin der quadra-
tischen Form ist eine Konstante.
Ed2
M(x Sn1)=E"(xz)Tr2
nI1
(zz)#
=Eh(xz)Tn
r2I(zz)i
=n
r2E(xz)T(zz)
=n
r2r2=n.
Lemma 2.4.23 (Lineare Abbildung und Kovarianzmatrix). Seien Zufallsvektoren
x,yCnund Endomorphismus ACn×n,rank A=n. Seien Cx,CyCn×ndie
Kovarianzmatrizen von xund y, dann
y=Ax =Cy=ACxA.(2.91)
Beweis. Dies hätte stochastisch gezeigt werden sollen. Dennoch, um die Robustheit unserer
Darstelung von dem Zentrieren einer Datenmatrix als eine Projektion Zmin Gl. (2.42) auf
S. 32 und Gl. (2.43) auf S. 32 in § 2.4.1 zu demonstrieren, betrachten wir, wie die Muster-
kovarianzmatrizen zusammenhängen unter einer linearen Abbildung. Seien Datenmatrizen
X,YCm×n, die mRealiserungen der Zufallsvektoren, d. h., die Spalten-Zufallsvekto-
ren x,yals Zeilenvektoren in der Form der Gl. (2.40) auf S. 28 enthalten. Somit ist die
o. g. lineare Abbildung äquivalent zu
Ym×n=Xm×nA
n×n.
Die Musterkovarianzmatrix nach der Abbildung ist
CY=1
m(ZmY)(ZmY)
=1
m(ZmXA)(ZmXA)
=1
m(AXZ
m)(ZmXA)
=1
mA(ZmX)(ZmX)A
=A1
m(ZmX)(ZmX)A
=ACXA.
2.4. MESSDATEN UND SINGULÄRWERTZERLEGUNG
53
Bemerkung 2.4.24.Ob der Nenner gliech moder m1, hat keine Rolle gespielt. Hier waren
X,Ydie nicht-zentrierten Datenmatrizen. Die Anwendung des zentrierenden Projektors
aus Gl. (2.42) auf S. 32 und Gl. (2.43) auf S. 32 hat die Beweisführung kompakt gemacht.
Nota bene: Hier wurde keine weitere Eigenschaft des Endomorphismus Aangenommen.
Lemma 2.4.25 (Invarianz der Mahalanobis-Distanz). Die Mahalanobis-Distanz ist in-
variant unter Verschiebung und regulärer linearer Abbildung. Seien Zufallsvektoren x,y
Un, und dM(x0), dM(y0)Rdie Mahalanobis-Distanzen von x0,y0 Unjeweils zu µx
und µy. Sei Endomorphismus ACn×n(rank A=n). Dann
y=Ax =dM(y0) = dM(x0)x0,y0 Un.(2.92)
Beweis. Die Invarianz unter Verschiebung versteht sich, denn sie wird per Definition „aus-
genommen“. Die Mahalanobis-Distanz des transformierten Vektors y0
d2
M(y0) = (y0µy)C1
y(y0µy)
= (Ax0Aµx)C1
y(Ax0Aµx)
= (Ax0Aµx)(A1C1
xA1)(Ax0Aµx)
= (x0µx)A(A1C1
xA1)A(x0µx)
= (x0µx)C1
x(x0µx)
=d2
M(x0).
Lemma 2.4.26 (Invarianz der Regularisierten Mahalanobis-Distanz). Die regularisierte
Mahalanobis-Distanz ist invariant unter Verschiebung und unitärer Abbildung. Seien Zu-
fallsvektoren x,y Un, und dM(x0), dM(y0)Rdie Mahalanobis-Distanzen zwischen
x0,y0 Unund µxund µy. Sei unitäre Matrix UCn×n, Dann
y=Ux =r
dM(y0) = r
dM(x0)x0,y0 Un.(2.93)
Beweis. Die Invarianz unter Verschiebung versteht sich, denn sie wird ebenfalls per Defini-
tion „ausgenommen“. Die regularisierte Mahalanobis-Distanz des transformierten Vektors
y0
r
dM2(y0) = (y0µy)C
y(y0µy)
= (Ux0Uµx)C
y(Ux0Uµx)
= (x0µx)UC
yU(x0µx)
= (x0µx)U(UCxU)U(x0µx)
=80(x0µx)U(UC
xU)U(x0µx)
= (x0µx)UU1C
xU1U(x0µx)
= (x0µx)C
x(x0µx)
=r
dM2(x0).
54
KAPITEL 2. GRUNDLAGEN
Lemma 2.4.27 (Kanonische Kovarianzmatrix des Hyperkreises). Sei Zufallsvektor x
Ungleich verteilt auf einem Hyperkreis K Kn2 Unmit Radius rR, dann gibt
es eine Abbildung BCn×n, so daß die Kovarianzmatrix des Zufallsvektors y=Bx
diagonalisiert wird mit
CK=E(yµy)(yµy)=r2
n1
0
1...
1
(2.94)
Beweis für reellen Fall. Für jeden Hyperkreis K Kn2 Engibt es ein Normal n
En. Wir wählen nun als die Abbildung Aaus Lemma 2.4.23 auf S. 52 den Householder-
Reflektor H[Witt, 1937, 1998] [Kaplansky, 1974, p. 17] [Householder, 1972, 1975] [Laurie,
1997a,b], die das Normal n Enin die Richtung des ersten kanonischen Basisvektors
e1= [ 1 0 0 ···0 ]Tabbildet, bzw. alle Koordinaten des Normals nbis auf die Erste
annihiliert. Sei Householder-Vektor
v=n±knk2e1,v En,(2.95)
so daß die Householder-Transformation ergibt
Hn = (I2P)n=I2v vT
vTvn=∓knk2e1=∓knk2
1
0
0
.
.
.
0
,(2.96)
wobei Pist ein Orthoprojektor auf den 1-dimensionalen Raum vom Householder-Vektor
span {v}. Mit der Transformation y=Hx ist nun die erste Koordinate des Zufallsvektors
yH(Kn2)eine Konstante. Infolgedessen verschwindet das Element c11 der Kovarianz-
matrix CKn2. Mit gleicher Technik wie im Beweis vom Lemma 2.4.21 auf S. 50 erhalten
wir r2/(n1) für die restlichen diagonalen Elemente und 0für die nicht-diagonalen Ele-
mente. Die reeller Householder-Reflektor Hbesitzt folgende Eigenschaften:
Hist symmetrisch, HT=H,
Hist involutorisch, H2=I,81
Hist orthogonal, H2=I,
Hhat eine konstante Determinante, det H=1,
Hbesitzt den Vektor nT/knk2als die erste Zeile bzw. die erste Spalte,
Hbildet den Vektor nin die Richtung des Basisvektors e1ab.
80Im allgemeinen gilt (AB)=BAnicht. Die Aussage (ACA)=ACAist ebenfalls falsch,
selbst wenn Aregulär und Cselbstadjungiert, nicht-negativ definit ist. Hier handelt sich um unitäre Matrix U.
Wir haben (UAV)=VAUfür unitäre Matrizen Uund V[Pringle und Rayner, 1971, pp. 30–32] [Rao
und Mitra, 1971, p. 67] [Ben-Israel und Greville, 1974, p. 25] [Campbell und Meyer, 1979, pp. 11–12, Theorem
1.2.1]. Daher konnten wir das Lemma 2.4.26 nicht auf diese Weise für beliebigen Endomorphismus beweisen.
Dieses Lemma soll für beliebige, reguläre Matrix erweiterbar sein. Es genügt allerdings, um den Korollar 2.4.32
(S. 58) beweisen zu können. (cf. mahr.m und matstat -mpB.)
81Eine involutorische Matrix heißt auch unipotente Matrix, die zu sich selbst invers ist.
2.4. MESSDATEN UND SINGULÄRWERTZERLEGUNG
55
Beweis für komplexen Fall. Für jeden Hyperkreis Kn2 Ungibt es ein Normal n Un.
Wir wählen als die lineare Abbildung Aaus Lemma 2.4.23 auf S. 52 eine unitäre Matrix
UCn×n, die das Normal n Unin die Richtung des ersten kanonischen Basisvektors
e1= [ 1 0 0 ···0 ]Tabbildet, bzw. alle Koordinaten des abgebildeten Normals Un bis auf
die Erste annihiliert. Seien komplexe Skalaren α, eıθ C, und der n-Vektor v Unmit
v=n±knk2e1,v Un(2.97)
und die gesuchte unitäre Matrix UCn×n, so daß
Un = (I2αP)n
=I2<(vn)
(vn)
v v
vvn(2.98)
=IPeıθPn
=Iv v
vveıθ v v
vvn
= Iv v
vv(vn)
(vn)
v v
vv!n(2.99)
=∓knk2e1=∓knk2
1 + 0ı
0
0
.
.
.
0
,(2.100)
wobei
P=v v
vv, α =<(vn)
(vn)eıθ =(vn)
(vn)und θ=2(v,n).(2.101)
Mit der Transformation y=Ux ist nun die erste Koordinate des Zufallsvektors y
U(Kn2)eine Konstante. Infolgedessen verschwindet das Element c11 der Kovarianzma-
trix CKn2. Mit gleicher Technik wie im Beweis vom Lemma 2.4.21 auf S. 50 erhalten wir
r2/(n1) für die restlichen diagonalen Elemente und 0für die nicht-diagonalen Elemente.
Die unitäre Matrix Uim komplexen Fall unterscheidet sich von der Householder-Matrix H
im reellen Falle dadurch, daß
Ukeine selbstadjungierte Matrix mehr ist, U6=U,
Ukeine involutorische Abbildung mehr ist, U26=I,
Ueine unitäre Matrix bleibt, U=U1,
sich der Normalvektor nals n/knk2in der ersten Zeile der unitären
Matrix Ubefindet. Die unitäre Matrix Ubesitzt also eine Form
U=n/knk2
K,KCn×(n1).(2.102)
Ist ne1Rbzw. α=<(vn)/(vn) = 1 oder ω=vn/(vn) = 1, so reduziert sich
die unitäre Matrix Uauf die Householder-Spiegelungsmatrix Hvom reellen Fall.
56
KAPITEL 2. GRUNDLAGEN
Bemerkung 2.4.28 (Komplexe „Householder-Spiegelung“). Nota bene! Householder-Spie-
gelung oder Householder-Transformation 82 ist ein teures Beipiel, an dem der reelle Fall
nicht zum komplexen Fall überführt werden kann, indem man einfach die Transponierte
durch die Hermitesche (d. h. konjugiert Transponierte) ersetzt.
Bemerkung 2.4.29 (Householder-Spiegelung). Die Householder-Spiegelung oder House-
holder-Transformation die im Beweis vom Lemma 2.4.27 auf S. 54 benutzt worden ist,
ist darüber hinaus sehr robustes Verfahren zur Orthogonalisierung. Sie wird oft in Nume-
rik dazu benutzt, um 0in eine Matrix unter Ähnlichkeitsbedingung einzuführen. Da die
Matrix Hstets eine normalisierte Version des Normalvektors n/knk2in der ersten Spalte
enthält, spannen also die restlichen n1Spalten der Matrix Hdas orthogonale Komple-
ment span {n}orthonormal auf. Dies ist eine orthonormale Basisvervollständigung, bei
der das Gram-Schmidtsche Orthogonalisierungsverfahren [Gram, 1883], [Schmidt, 1907a,
p. 442] nicht verwendet werden kann. Denn das Gram-Schmidtsche Verfahren ben¨
tigt alle
nlinear unabhängigen Vektoren, um starten zu können. Es ist implementiert als gmat.c
-o in matsrc0/gmat.c/house_orth2()83. denn es ist sehr häufig erforderlich, ei-
ne orthonormale basis aus einem vorgegebenen Vektor zu finden, wie wir es im Algorith-
mus 2.4.19 (S. 50) gebraucht haben. Dieses Verfahren besitzt folgende Vorteile:
1. Da die Matrix nicht nur unitär, sondern auch eine selbstadjungierte Invo-
lution ist, d. h. ,H1=H=H, erspart man das Transponieren bei
Bedarf einer Inversion. Vgl. Gl. (2.7) auf S. 10.
2. Householder-Orthogonalisierung ist numerisch stabiler als z. B. die Gi-
vens-Drehung, und sie benötigt weniger Operationen als das modifizierte
Gram-Schmidt-Verfahren 84.
3. Dies dient auch für die Berechnung des Nullraums bzw. orthonormalen
Komplements, das das Gram-Schmidtsche Verfahren nicht anbieten kann.
(Siehe Abb. 2.2 auf S. 20.)
4. Dies ist anwendbar für arbiträre endliche Dimension im Vergleich zu an-
deren Verfahren, die nur für z. B. 3-dimensionalen Raum bestimmt sind.
(Siehe basis33.c.)
Für mehr Details über Householder-Spiegelung siehe Kommentare in Datei matsrc0:
gmat.c,hm.m,Monographienvom Urheber [Householder,1972]und[Householder, 1975]
[Laurie, 1997a,b] oder [Witt, 1937, 1998] [Stewart, 1973b, pp. 231–235] [Kaplansky, 1974,
p. 17] [Strang, 1980, pp. 392-397] [Gill et al., 1991, p. 121] [Golub und Van Loan, 1983,
pp. 38-39].
Korollar 2.4.30 (Kovarianzmatrix des Hyperkreises). Sei gleich verteilter Zufallsvektor
xCnauf einem Hyperkreis K Kn2 Unmit Normalvektor n Unund radius
rR, dann ist die generelle Form der Kovarianzmatrix CKn2durch den Orthoprojektor
82Alston Scott Householder (1904–1993) nannte solche Reflektoren „elementary Hermitian matrix“,„elemen-
tary reflections“ in [Householder, 1972, pp. 11-16, §2] [Householder, 1975, pp. 3–4 §1.1, pp 133–139] [Laurie,
1997a,b].
83Die numerische Stabilität ist wohl behandelt durch [Stewart, 1973b, pp. 231–235].
84[Gram, 1883], [Schmidt, 1907a, p. 442] [Golub und Van Loan, 1996, p. 263]
2.4. MESSDATEN UND SINGULÄRWERTZERLEGUNG
57
auf den Richtungsteilraum des Hyperkreises gegeben durch:
CKn2=E[ (xµx)(xµx)]
=r2
n1Pspan{n}
=r2
n1KK
KK,(2.103)
wobei die n×(n1) Matrix Keine Basis für span {n}als Spaltenvektoren enthält,
d. h. das n1-dimensionale orthogonale Komplement des Raumes span {n}.
Beweis. Aus (2.94) vom Lemma 2.4.27 auf S. 54, und Lemma 2.4.23 auf S. 52 existiert
eine unitäre Abbildung y=Ux, so daß die Kovarianzmatrix des transformierten Vektors y
CKn2(y) = U1
0
r2/(n1) ...
r2/(n1)
U1,
wobei UCn×ndie unitäre Matrix aus Gl. (2.98) auf S. 55 ist mit
U=I2αP=Iv v
vv(vn)
(vn)
v v
vv,v=n±knk2e1.
Sei KCn×(n1)(KK=In1)aus Gl. (2.102) auf S. 55. Da die unitäre Matrix
U1=Uden Vektor n/knk2als die erste Zeile besitzt, die n1Spalten in Kspan-
nen das orthonormale Komplement des Raumes span {n}, d. h., den Richtungsteilraum
des Hyperkreises Kauf.
CK=U
0
r2/(n1) ...
r2/(n1)
U
=r2
n1[U]
0
1...
1
[U]
=r2
n1n
knk2
K
0
1...
1
n
knk2
K
=r2
n1KK=r2
n1Pspan{n}.
Die theoretische Kovarianzmatrix (2.103) im Korollar 2.4.30 (S. 56) ist zur Referenz
stets durch ghyper.c -c ausgegeben.
58
KAPITEL 2. GRUNDLAGEN
Korollar 2.4.31 (Spur der Kovarianzmatrix des Hyperkreises). Sei gleich verteilter Zu-
fallsvektor xCnauf einem Hyperkreis K Kn2Un mit radikus r, dann ist die Spur
der Kovarianzmatrix
tr CK= tr E[ (xµx)(xµx)] = r2.(2.104)
Beweis. Diese Folgerung ergibt sich trivial sowohl aus dem Lemma 2.4.27 auf S. 54 als
auch aus dem Korollar 2.4.30 (S. 56).
Wir wollen hier kurz zusammenfassen darüber, wohin wir hinaus wollen und was wir
bisher haben. Da die Kovarianzmatrix eines Zufallsvektors auf einem Hyperkreis stets sin-
gulär ist, können wir nur von unserer regularisierten Mahalanobis-Distanz sprechen. Um
nützliche Fakten über die regularisierte Mahalanobis-Distanz des Hyperkreises aussagen
zu können, brauchen wir eine möglichst einfache Form der Kovarianzmatrix. Ähnliches
geschah für die Hypersphäre ohne Umstand im Korollar 2.4.22 (S. 52), weil die Punkte iso-
tropisch um das Zentrum verteilt, ergo die Kovarianzen verschwunden sind. Im Falle des
Hyperkreises sind die Zufallspunkte nicht mehr isotropisch um das Zentrum verteilt, son-
dern vom Normalvektor abhängen. Infolgedessen besitzt die Kovarianzmatrix im generellen
nicht mehr immer eine diagonale Form. Um mit einer diagonalen Form der Kovarianzma-
trix arbeiten zu können, mußten wir wissen, ob sich der Zufallsvektor transformieren läßt,
während die regularisierte Mahalanobis-Distanzen unverändert bleiben. Zu diesem Zweck
besagt das Lemma 2.4.26 auf S. 53, daß auch die regularisierte Mahalanobis-Distanz inva-
riant ist unter unitären Abbildungen des Zufallsvektors. Eine spezifische unitäre Abbildung,
die die Kovarianzmatrix in eine diagonale Form umwandelt, haben wir im Lemma 2.4.27
auf S. 54 gegeben. Dies folgt daraus, indem wir das Normal des Hyperkreises in die Rich-
tung des ersten Vektors e1der Standard-Basis „spiegeln“ (cum grano salis), d. h., den Hy-
perkreis isometrisch senkrecht zum Vektor e1„drehen“. Am Rande haben wir im Korol-
lar 2.4.30 (S. 56) die allgemeine Form der Kovarianzmatrix und den Orthoprojektor des
Richtungsteilraumes in Verbindung gesetzt. Mit den o. a. Ergebnissen, sind wir nun aus-
zusagen bereit, daß auch der Erwatungswert der regularisierten Mahalanobis-Distanz aller
Punkte auf einem Hyperkreis eine Konstante ist, die nur von der Dimension abhängt.
Korollar 2.4.32 (Regularisierte Mahalanobis-Distanz des Hyperkreises). Sei Zufalls-
vektor x Ungleich verteilt auf einem (n2)-Hyperrkreis K Kn2 Un, dann ist der
konstante Erwartungswert der regularisierten Mahalanobis-Distanz aller Punkte auf dem
Hyperkreis
Er
dM(xK)=n1.(2.105)
Beweis. Sei rRder Radius des Hyperkreises. Laut Lemma 2.4.26 auf S. 53 ist das Pro-
blem äquivalent zu dem mit dem Zufallsvektor y=Bx, wobei Beine durch Lemma 2.4.27
auf S. 54 gegebene unitäre Abbildung ist. Der Erwartungswert der regularisierten, quadra-
tischen Mahalanobis-Distanz ist also
Er
dM2(y Kn2)=Eh(yµy)C
K(yµy)i,
wobei die Kovarianzmatrix CKin der quadratischen Form ist eine Konstante laut Lem-
ma 2.4.27 auf S. 54. Ersetzten wir sie durch Gl. (2.94) auf S. 54, so erhalten wir
Er
dM2(y Kn2)=r2
n1E(yµy)T(yµy)=n1.
Da r
dM0, haben wir E[r
dM(x) ] = n1.
Kapitel 3
Ellipsenlokalisierung
Ein Kreis im 3-dimensionalen Raum ist unter der perspektiven Projektion eine Ellipse auf
der 2-dimensionalen Ebene [Kanatani, 1993]. Unser Ansatz, den in der Szene präsentierten
Kreis im 3-dimensionalen Raum zu vermessen, basiert auf der parametrischen Bestimmung
der entsprechenden Ellispe im Intensiätsskalarfeld (Luminanz) und eine Fusion derer mit
dem Tiefenvektorfeld (3-dimensionale Koordinaten), wobei das Skalarfeld I:R×R7→
Rund das Vektorfeld T:R×R7→ R3mit Pixel-Pixel-Korrespondenz auf derselben
Domäne definiert sind. Die parametrische Bestimmung der Ellipse im Skalarfeld verläßt
sich auf die Konturenextraktion aus dem Intensitätsbild. Wir beschreiben in diesem Kapitel
die Experimente der Konturenextraktion und Ellipsenbestimmung.
Im § 3.1 ab S. 59 stellen wir unseren Einsatz energiebasierter sowie gradientenbasierter
Methode zur „Kantendetektion“ und die Nachverarbeitung zur Formung der Konturen in der
Form verketteter Pixel vor.
Im § 3.2 ab S. 69 werden wir die Begründung unseres Ansatzes zur Ellipsen-Lokalisie-
rung und die experimentellen Ergebnisse derer auf natürlichen Szenen präsentieren.
3.1 Konturenextraktion
Die Konturenextraktion bildet die Basis vieler Aufgaben im Gebiet des „künstlichen Se-
hens“. Sie ist zwar nicht als der Schwerpunkt der Arbeit zu sehen, für unseren Ansatz zur
Lösung der Problematik ist sie aber experimentell unentbehrlich. Saubere Segmentierung
und Repräsentation der Konturen einer optisch empfangenen Szene ermöglicht eine syn-
taktische 85 Analyse und „semantische“ Inferenzen der Bildstruktur. Die Operationen auf
den höheren Ebenen auf dem Wege zur realistischen, und bis heute unbegreifbaren Begriff-
Formung in uns profitieren vor allem von einer starker Verminderung der Datenmenge.
Anstatt des gewöhnlichen Sprachgebrauches der „Kantendetektion“ wird hier „Kontu-
renextraktion“ benutzt. Eine Kontur kann hier eine Linie, eine Kante oder eine Mischung
(Cf. Abb. 3.1 auf S. 60) aus den beiden heißen. Mit Konturenextraktion eines Intensi-
85Parallel zur Linguistik werden hier die Relationen zwischen den Bildelementen (Pixeln) gemeint, die den
„Symbolen“ entsprechen. Die Zuweisung der Bildelemente zu einem Aggregat ist eine syntakische Strukturierung
der Bildelemente. Dieses Aggregat werden wir Kontur nennen.
59
60
KAPITEL 3. ELLIPSEN
(a) (b)
Abbildung 3.1: Kanten oder Linien: Demonstration eines fließenden Übergangs. Die anschauliche De-
monstration via Phasen-Kongruenz ist aus [Kovesi, 1999, 2002, fig. 2] entnommen. Das Bild (a) illu-
striert einen fließenden Übergang von einem Step zu einer Linie (step2line.m (500,-1,256)),
während das Bild (b) zu einem Dach (step2line.m (500,-2,256)). Der gradienten-basierte
Canny-Detektor (pgmcanny.c) weist hier Schwierigkeiten auf (Multi-Antwort und Verschiebung),
während die energie-basierten Methoden via Quadratur-Filterung (gfilt.c -s), mit Verminde-
rung der radialen Bandbreite bei (b), oder Phasen-Kongruenz die Hybride holistisch als vertikale
Geraden auffassen können. Die originalen 256 ×256 Bilder sind für Drucker Gamma-korrigiert
(pfmgamma.c) und daher für Wiederverwerten nicht geeignet. Für weitere Diskussionen über Hy-
briden-Konturen siehe auch [Perona und Malik, 1990, 1991]. (Nutzung der Bilder mit freundlicher
Genehmigung von Herrn Peter Kovesi, School of Computer Science & Software Engineering, The
University of Western Australia, 25. November, 2002)
tätsbildes meinen wir, als Resultat, ein Bild bzw. eine Sammlung der Konturenlisten meh-
rerer verketteten Konturenpixels, die sich ununterbrochen „sinnvoll“ zu der gleichen Kontur
gruppieren lassen. Für Inferenzen, ob syntaktische oder semantische, auf den höheren Ebe-
nen verlangen wir, daß eine herausgezogene Kontur ein-pixel-breit sei. Eine Konturenliste
enthält Konturenpixels, die binäre Werte annehmen oder eine „Konturenstärke“ kodieren
können. Anschaulich ist unter Konturenextraktion hier eine Art Federzeichnung des Ein-
gangsintensitätsbildes vorzustellen. Cf. Abb. 3.2 auf S. 63 oder Abb. 4.6 auf S. 87.
Die Güte einer Konturenextraktion wird in der Arbeit vor allem visuell bewertet und
Kontrolliert. Der Grund dafür ist die Abwesenheit einer allgemeingültigen und weitgehend
akzeptierten Definition des Begriffes Kontur, denn in dem Begriff sind u. a. auch kognitive
und psychologische Faktoren involviert. Auf der anderen Seite, vertreten wir die Meinung,
daß trotz strenger theoretischen Entwicklung eine visuelle Inspektion der Ergebnisse stets
notwendig sei, Daher fordern wir auch hierbei auf, daß ein gemeinsames, leicht zugäng-
liches Referenzbild, z. B. das Lena-Bild in Abb. 3.2 auf S. 63 [Lena Sjööblom-Soderberg,
1972] [Munson, 1996], verwendet werde, damit zumindest die Ergebnisse visuell verglichen
werden könnten.
Ein Kriterium zur Güte der Konturenextraktion, das wir unter Umständen stellen könn-
ten, ist die „Idempotenz-Eigenschaft“ [Halmos, 1958, pp. 73–78] des Konturenextraktors
(cf. § 2.1.1 ab S. 8). Nach unserer ad hoc operativen Definition der Konturen (cf. Fußno-
te 85 auf S. 59) mit Konturenverkettung (cf. Abb. 3.2 auf S. 63, Abb. 4.6 auf S. 87), dürfen
wir erwarten, daß von einer nochmaligen Konturenextraktion sich dasgleiche, oder zumin-
dest ein „Ähnliches“ ergebe. Wir bedenken jedoch, daß ein idempotenter Operator linear
sein muß, während unser Konturenextraktor mit einem binären Ergebnis insgesamt nicht-
3.1. KONTURENEXTRAKTION
61
linear ist. Wie dem auch sei, sind wir im Stande, visuell die „Idempotenz-Eigenschaft“ der
Konturenextraktoren experimentell „mit Gewissheit“ festzustellen. Wir sprechen daher in
diesem Zusammenhang von einer Pseudo-Idempotenz.86
Wir werden hier die eingesetzten und entwickelten Verfahren mit Kommentaren zur Im-
plementierung minimal beschreiben. Wegen der Schlechtgestellheit [Hadamard, 1923] der
Problematik der Konturenextraktion spielt die Implementierung hier eine relativ signifikan-
tere Rolle, denn bei jeder Auflösung der Ambiguität in einem veröffentlichen Verfahren wird
sehr oft zu verschiedenen Ergebnissen geführt. Daher wäre eine Beschreibung unserer Ver-
fahren ohne Verweis auf die wirklich beitragenden C-Quellkoden unvollständig.
Unsere Wahl der Verfahren zur Konturenextraktion erster Phase ist zweierlei,
1. Gradienten-basierte Methode: Canny-Detektor (pgmcanny.c -g),
2. Energie-basierte Methode: Gabor-Filterung (gfilt.c -s),
wobei hauptsächlich die erste Methode zugunsten des Rechenaufwands verwendet wird
(pgmell.sh,pose.sh). Es sei dran erinnert, daß der Canny-Detektor nur für Kanten
(Step) gedacht und optimiert ist, und bei einem Signal wie in Abb. 3.1 auf S. 60 die Eindeu-
tigkeit87 der Antwort verlieren wird. Dennoch ist der Canny-Detektor ein hervorragendes
Verfahren und wird deutlich am meisten zitiert und verwendet. Er ist nach wie vor das de
factor Standardverfahren zur Kantendetektion seit 1983. Die Abb. 3.2 auf S. 63 illustriert
das endgültige Ergebnis unserer Konturenextraktion via gradienten-basierten Canny-Detek-
tor am Beispiel Lena und eine Szene unseres Laboratriums. Die zweite Methode via lokale
Energie [Morrone und Owens, 1987] [Venkatesh und Owens, 1989] wird benötigt, wenn
der Canny-Detektor überfordert wird, wie z. B. im Falle, wo die Lokalisierung der Linien-
Konturen in Abb. 3.2–(c) auf S. 63 und der Hybriden-Konturen in Abb. 3.1 auf S. 60 kri-
tisch ist, oder in Abb. 3.4 auf S. 66 und Abb. 3.5 auf S. 67, wo die „Konturen“ nur in der
Tiefenstruktur impliziert und physikalisch nicht vorhanden sind.
Das Resultat der Konturenextraktion erster Phase sind zwei „gradientenähnliche“ Ska-
larfelder 88. Zur zweiten Phase der Extraktion verwenden wir Canny’s Non-Maximum-
Suppression 89 [Canny, 1983, 1986], um die Pixel zu unterdrücken, derer Konturenstärken
86Die Rolle der Idempotenz in der Bildverarbeitung ist sehr wenig diskutiert worden [Frei und Chen, 1977]
[Gonzalez, 1987, pp. 340–347] [Owens et al., 1989]. [Frei und Chen, 1977] formulieren die Problematik in einer
hohen dimensionalen Raum Rm×n, in dem ein m×nBild als ein mn-Vektor im linearen Raum betrachtet wird,
während wir hier ein Bild als ein Skalarfeld I:R×R7→ Rbehandeln.
87Die Eindeutigkeit ist eines der Kriterien der Optimalität des Canny-Detektors. Die Kreterien der Optimalität
sind: 1. gute Detektion mit maximalem S/N, 2. gute Lokalisation der Kanten, und 3. einfache Antwort auf ei-
ne Kante. Der optimale Detektor demzufolge ist allerdings nicht die Gaußsche Ableitung (Gaussian derivative),
sondern ihr sehr ähnlich [Canny, 1986], während pgmcanny.c die Gaußsche Ableitung via iir.c [Deriche,
1993] zur Approximation des Detektors verwendet, wobei die Gaußsche Ableitung wiederum als regularisierte
Realisierung des Gradienten gedacht weden darf. Cf. Fußnote 88 auf S. 61.
88Der Gradient am Vektor x=x1,...,xnTRneines Skalarfeldes, I(x) : Rn7→ R, ist ein Vektorfeld
Rn7→ Rn
I(x) = hI
x1· · · I
xni(3.1)
Im 2-dimensionalen Fall, R27→ R2, läßst sich das Vektorfeld in zwei Skalarfeldern darstellen das eine für den
Betrag und das andere für die durch einen Winkel kodierten Richtung des 2-Vektors. Im Skalarfeld für den Betrag
kodieren wir die lokalen Konturenstärken (Cf. Abb. 3.7 auf S. 69). Im Skalarfeld der Winkel tragen wir die lokalen
Richtungen der Konturenpixel ein und nennen wir es „Orientierungskarte“ (pgmcanny.c -g). Mit „gradienten-
ähnlich“ wird zwei Skalarfelder gemeint, die durch andere Mittel wie z. B. Quadratur-Filterung (Cf. gfilt.c
-s und Abb. 3.7 auf S. 69) oder Diagonalisierung der Matrix der ersten Fundamentalform bzw. des Riemannten-
sors (pfmgauge.c -1) [Hilbert und Cohn-Vossen, 1932, 1952] [Heckbert und Garland, 1999] gewonnen und als
Konturenstärke sowie Oritentierungskarte benutzt werden.
89Siehe auch [Sahoo et al., 1988] für eine Übersicht für die Technik der Unterdrückung unerwünschter Konturen.
62
KAPITEL 3. ELLIPSEN
keine lokale Maxima sind. Das Ergebnis wird durch Hysterese-Schwellenwert-Verfolgung
(pfmdir.c -H) oder „dynamische Schwellenwert-Verfolgung“ (pgmlink.c -D) [Ven-
katesh und Rosin, 1995] zu den endgültigen Konturen verkettet, wobei die isolierten Pixel,
die Statistik (lstfilt.c -s) der Konturen und ihre Gewichte je nach Bedarf behan-
delt werden. Obwohl das Ergebis der Konturenextraktion im Grunde ein binäres Skalarfeld
Ib:R27→ {0,1}ist, wobei die Domäne R2nun auf die Konturen stark eingeschränkt ist,
sind die Konturenstärken an diesen Stellen zur Verfügung in den Listen beibehalten. Trotz
weiterer Entwicklung sind unsere Implementierung dies bezüglich und das ASCII-Format
für die Konturen-Listen und Ellipsen-Listen den Veröffentlichungen und den entsprechen-
den Quellcoden von [Rosin, 1994] [Venkatesh und Rosin, 1995] [Rosin und West, 1995]
[Rosin, 1995] [Rosin und West, 1989] [Rosin und West, 1997] sehr zu verdanken.
3.1.1 Canny-Detektor und Gabor-Filterung
Canny-Detektor [Canny, 1983, 1986] (pgmcanny.c)90 wird vor allem zur Konturen-
detektion auf dem Skalarfeld I:R×R7→ Reiner Szene (bzw. dem Intensitätsbild) ver-
wendet. Solches liefert die „optimalen Kanten“, in denen die Kanten-Stärke kodiert sind.
Die dazugehörige Gaußsche Glättung und diskrete Ableitung des Eingangsbildes wird zu-
gunsten der Präzision und des Zeitaufwands statt einer festen Faltungsmaske durch einen
rekursiven Filter [Deriche, 1993] (iir.c ) im Ortsbereich oder durch DFT (dft.c -X -Y
) im Ortsfrequenzbereich durchgeführt 91.
Obwohldie GaußscheGlättung(pgmgauss.c)oderGaußsche Ableitung (pgmcanny.c
-g) am Eingang des Canny-Detektors kongenial einen stochastischen, nachrichtentechni-
schen Charakter [Canny, 1986] besitzt, läßt sich allerdings aus einer ganz anderen Sicht
als eine lineare, neutrale und regularisierende Apertur betrachten. Die Gaußsche Glättung
läßt sich als die lineare und neutrale Apertur der Beobachtung interpretieren, die nicht in
der physikalischen Realität zu umgehen ist. Für eine lineare sowie neutrale (uncommitted
[ter Haar Romeny, 1999]) Beobachtung ohne Vorzug aller Merkmale bis auf eine „Ska-
la“ (scale) ist wieder einmal die Gaußsche Apertur Gl. (2.66) auf S. 42 die einzige Lö-
sung [ter Haar Romeny, 1999]. Diese Skala (scale) entspricht der Standardabweichung σ
(pgmcanny.c -s) der Gaußschen Apertur. Auf der anderen Seite, da die partielle Ablei-
tung in Canny-Detektor pgmcanny.c schlech-gestellt ist, ist solche durch dieselbe Gauß-
sche Apertur zu regularisiren [Schwartz, 1951, 1966] [Florack et al., 1992] [ter Haar Ro-
meny, 1999]. Als Konsequenz ist die regularisierte Ableitung des diskretisierten Bildes eine
Faltung mit der Gaußschen Ableitung (Gaussian derivative), die in pgmcanny.c imple-
mentiert ist. Die Gaußsche Funktion und ihre Ableitungen sind Lösungen der linearen Dif-
fusionsgleichung, die den linearen Skala-Raum (scale-space) generiert (cf. Abb. 3.3 auf
S. 64).
Gabor-Filterung verwenden wir andererseits im Laboratrium GET, Universität Pader-
born, um biologisch plausibel die Bild-Konturen zu extraieren. Der Einsatz der Gabor-Fil-
90pgmcanny.c ist im Stande, Bilder in PBM-, PGM-, oder PFM-Format zu bearbeiten. Intern wird in IEEE-754
single [IEEE, 1985] berechnet. Das Programm benutzt die (unendlich ableitbare) Gaußsche Apertur und führt die
Ableitungen erster Ordnung entlang der beiden „praktischen Bildbasen“ unter Gaußscher Regularisierung aus, da
eine Ableitung schlectgestellt ist [Schwartz, 1951, 1966] [ter Haar Romeny, 1999].
91In vielen Implementierungen werden zur Gättung kleine oder große räumliche Faltungsmasken der Gaußschen
Approximation und zur Ableitung kleine Maske wie z. B. der Sobel-Operator verwendet [Sobel, 1990] [Daniels-
son, 1990].
3.1. KONTURENEXTRAKTION
63
(a) (b)
(c) (d)
Abbildung 3.2: Canny-Detektor mit Hysterese-Schwellenwert-Kantenverfolgung- und -Verkettung am
Beispiel Lena und Rad [Canny, 1983, 1986]. Die Ergebnisse der Konturenextraktion (pgmcanny.c
-s1-gund gradedge.sh-H) aus den 512×512 Intensitätsbildern (a) [Lena Sjööblom-Soderberg,
1972] [Munson, 1996] und (c) sind jeweils in (b) und (d) in Postscript wiedergeben. Als Apertur wurde
der Wert σ= 1.2(pgmcanny.c -s1.2) zur Gaußschen Regularisierung der patiellen Ableitung
verwendet [ter Haar Romeny, 1999]. Die originalen 512 ×512 Bilder (a) und (c) sind für Drucker
Gamma-korrigiert (pfmgamma.c) und daher für Wiederverwerten nicht geeignet.
64
KAPITEL 3. ELLIPSEN
Abbildung 3.3: Die weitere, mit inbegriffene Dimension der Bild-Struktur. Die Beobachtung einer
Szene kann nur durch eine Apertur erfolgen. Die Variation des „Umfangs“ einer linearen, neutralen
Apertur generiert eine weitere Dimension der wahrgenommenen Bildstruktur. Ohne explizite Benen-
nung strukturiert Hartmann [Hartmann, 1982] hierarchisch die Bild-Merkmale in dieser Dimension.
Koenderink [Koenderink, 1984] hat die lineare Diffusionsgleichung L/∂s =~
· ~
L= L=
Lxx +Lyy als die generierende Gleichung für den linearen Skala-Raum (scale-space) [Witkin, 1983]
identifiziert, daß die partielle Ableitung in Skala (scale) gleich dem Laplacian des Luminanzfeldes ist.
Die Gaußsche Funktion ist die Greensche Funktion der Diffusionsgleichung [ter Haar Romeny, 1999].
(Mit freundlicher Genehmigung von Herrn Bart M. ter Haar Romeny, Image Sciences Institute, Uni-
versity Medical Center, The Netherlands, 7. Februar, 2001, ist diese Abbildung aus [ter Haar Romeny,
1999] entnommen.)
terung 92 in der Bildverarbeitung wird oft durch die neurophysiologischen Fakten inspiriert,
wobei die Quadratur-Funktionen 93 das lineare Verhalten der orientierungsselektiven einfa-
chen Zellen 94 eingesetzt, da in der primären visuellen Rinde (V1, Schichten 4und 6) wegen
ihrer Phasenrelationens [Pollen und Ronner, 1981] paarweise modellieren sollen. Deswei-
teren scheinen die komplexen Zellen (in V1, Schichten 2,3und 5) auf die Stimuli im rezep-
tiven Feld nicht-linear zu reagieren, wobei die Ausgangssignale mehreren einfachen Zellen
weiter zu verknüpfen und keine Differenzierung der (Quadratur-)Phasenverschiebung der
92Siehe [Gábor, 1946] [Ville, 1948] [Marcelja, 1980] [Bastiaans, 1980] [Daugman, 1980, 1985] [Jones und
Palmer, 1987a,b].
93Eine reelle, „quasi Einseitenband“-Übertragungsfunktion auf der 2-dimensionalen Fourier-Halbebene ent-
spricht einer komplexen Funktion in der Ortsdomäne. Die Real- und Imaginär-Teile der komplexen Übertragungs-
funktion im Ortsbereich stehen in Qudratur-Phasenrelation und werden zur Modellierung [Marcelja, 1980] [Daug-
man, 1980, 1985, 1989] der einfachen Zellen [Hubel und Wiesel, 1962] [Bishop et al., 1973] [Goodwin et al., 1975]
eingesetzt, da die einfachen Zellen meist ebenso in Quadratur-Phasenrelationen paarweise zu finden sind [Pollen
und Ronner, 1981]. Jeder unserer Gabor-Kanäle ergo modelliert zwei in Quadratur-Phasenrelation stehenden ein-
fachen Zellen [Movshon et al., 1978b; Movshon und Tolhurst, 1975] [Andrews und Pollen, 1979] [Marcelja, 1980]
[Daugman, 1985, pp. 1164–1165]. Obwohl ein 1-dimensionales analytisches Signal [Gábor, 1946] [Ville, 1948]
und Hilbert-Transformation [Bracewell, 1987] wohl definiert sind, findet man bis heute keinen Konsens über eine
Definition multi-dimensionaler Hilbert-Transformation und multi-dimensionalen analytischen Signals. Die Riesz-
Transformation [Bülow et al., 2000], partielle Hilbert-Transformation [Hahn, 1992], analytisches Bild [Havlicek
et al., 1997] wurden u. a. vorgeschlagen. Siehe auch [Peyrin et al., 1968] [Zhu et al., 1990] [Havlicek et al., 2000]
und dft.c -H1.
94Die Organization der Zellen und ihrer rezeptiven Felder auf der Retina wurde zuerst in [Hubel und Wiesel,
1962, 1974, 1978], anschließend in [Bishop et al., 1973] [Goodwin et al., 1975] beschrieben, während die Linearität
der Zellen in [Movshon et al., 1978a,b; Movshon und Tolhurst, 1975] diskutiert wurde.
3.1. KONTURENEXTRAKTION
65
Stimuli aufzuweisen. Da die einfachen Zellen verschiedene Bereiche (Mittelfrequenzen 95
) auf der Fourier-Ebene verdecken, und unterschiedliche Orientierung des Mittelfrequenz-
vektors, radiale Bandbreite und Orientierungsbandbreite 96, werden oft Multi-Kanäle Fil-
terung mit der Gabor-Funktion vorgenommen.
In gfilt.c werden lineare Multi-Kanal-Gabor-Filterungen (MKGF), nicht-lineares
„Energie-Modell“ [Adelson und Bergen, 1985] und nicht-lineare Verknüpfung via „The-
winner-takes-it-all“ (WTIA) 97 am Ausgang der Kanäle implementiert. Im Gegensatz zu
unserer alten Implementierung in [Trapp, 1998] verfügt die Implementierung über die Fle-
xibilität, daß sich alle Parameter der Übertragungsfunktionen ändern und online generieren
lassen. Dies ist wichtig auch für weitere Untersuchungen, denn der Parameter-Raum einer
einzigen Übertragungsfunktion auf der Fourier-Ebene ist mindestens 4-dimensional 98. Mit
solcher Komplexität ist eine experimentelle Möglichkeit für die Verifizierung einer Konjek-
tur immer hilfreich, wenn nicht erforderlich. In Abb. 3.4 auf S. 66 wird die Extraktion einer
optisch nicht-vorhandener Konturen via gfilt.c demonstriet, was mittels existeriender
Implementierung unserer Gabor-Filterung nicht machbar ist. In dieser Abbildung wird der
optisch nicht-vorhandene Kreis von xclock aus dem X11 lokalisiert. Der kritische Punkt
in diesem Beispiel ist eine Drehung der (notwendigerweise) elliptischen Gabor-Funktion
um das Eigen-Zentrum um π/2, daß sich die Antworten im Ortsbereich zu verknüpfen an-
fangen. Desweiteren sind beispielsweise die Experimente in Abb. 3.5 auf S. 67 und Abb. 3.6
auf S. 68, wo die Elliptizität, radiale Bandbreite, Mittelfrequenz, und die Positionierung der
Kanäle auf der Fourier-Ebene variiert werden müssen, was nur durch die neue Implemen-
tierung gfilt.c möglich ist.
95Da die Ortsfrequenz in unserem Fall ein 2-Vektor (mit DC in der „Mitte“) der Fourier-Ebene ist, wird sie hier
polar via Betrag und Richtung angesprochen. Unsere Konvention der Richtung eines Ortsfrequenzvektors sei hori-
zontal von rechts im Uhrzeigersinn. Die Richtung eines Ortsfrequenzvektors entspricht also in der Ortsdomäne der
Propagierungsrichtung der „Welle“. Mit der Abkürzung Frequenz sei der Betrag eines Ortsfrequenzvektors ge-
meint, welcher eine gewöhnliche Einheit besitzt. Ein Fourier-Pixel (unserer Bezeichnung) auf der Fourier-Ebene
entspricht im Ortsbereich einem Zyklus/Bild bzw. cpi (cycle per image). Das heißt, eine Verschiebung um 1Pixel in
der radialen Richtung von DC auf der Fourier-Ebene entspricht im Ortsbereich einer Änderung von 1Zuklus/Bild
(cpi) der harmonischen Schwingung. Wir benutzen außerdem „Nyquist“ (gfilt.c -w) als eine „bildgrößenun-
abhängige“ Einheit für die Frequenz (im Bezug auf Pixel). Die Frequenz von 1„Nyquist“ (unserer Konvention) ist
also die höchstmögliche Abtastrate, welche einer Wellenlänge von 2Pixeln pro Zyklus (gfilt.c -l)unabhän-
gig von der Bildgröße entspricht. Sinnvolle Werte der Frequenz seien also in [0,1] Nyquist. Die voreingestellte
Mittelfrequenz in gfilt.c,-w0.5, heißt immer 4Pixel pro Zuklus (gfilt.c -l4). Nota bene: In dieser Kon-
vention wird allerdings ein größeres Bild mit „höherer Auflösung“ (im Bezug auf der Bildgröße) mit den gleichen
Parametern in unserem gfilt.c gefiltert.
96Die Bandbreite ist hier durch FWHM (full-width-half-maximum) der Übertragungsfunktion in der Fourierdo-
mäne gegeben, was für die Intensität der Objekte in der astronomishen Bildverarbeitung üblich ist. Die FWHM
entspricht 2σp2 ln(2) 2.35482σfür Gl. (2.67) auf S. 43. Wir adoptieren die Definitionen der radialen Band-
breite und Orientierungsbandbreite in [Bovik et al., 1990, Fig. 3]. Da wir die Übertragungsfunktion im Fourier-
bereich initialisieren, läßt sich der Filterentwurf von den vorgegebenen Parametern (Mittelfrequenz, Bandbreiten,
Orientierung, Exzentrizität) in gfilt.c unkompliziert online-ausführen.
97The-winner-takes-it-all ist ein Algorithmus der nicht-linearen Verknüpfung der lokalen Energie [Adelson und
Bergen, 1985] am Ausgang der NKanäle: F1G(arg maxi|hi(x,y)|)(u, v)I(u, v),i {0, . . . , N 1}, wo-
bei Gi(u, v) = F[hi(x, y)] der i-te Gaborkanal in Fourierdomäne, I(u, v)das zu bearbeitende Bild im Fourier-
Bereich sind. Siehe gfilt.c für Details.
98Die Mittelfrequenz ist ein 2-Vektor auf der Fourier-Ebene. Die Bandbreite (oder die Elliptizität bzw. aspect
ratio der 2-dimensionalen Gabor- bzw. Gaußschen Funktion) ist ein 2-Vektor (Orientierungsbandbreite und radia-
le Bandbreite). Diese Dimensionierung schließt bereits eine beliebige Drehung eines elliptischen Gaussians um
das eigene Zentrum und die Anordnung multikanäler Übertragungsfunktionen auf der Fourier-Ebene aus. Alterna-
tiv kann die Dimensionierung im Zusammenhang vom Gaborschen „logon“ [Gábor, 1946] interpretiert werden.
Ein logon im Falle einer 2-dimensionalen Gaborschen bzw. Gaußschen Funktion ist ein 4-dimensionaler Hyper-
würfel im Verbund-Orts-Fourier-Raum, in dem die Unbestimmtheitsrelation [Heisenberg, 1927] herrscht. Daß die
2-dimensionale Gabor-Funktion die Verbund-Ungenauigkeit minimiert, hat John G. Daugman in [Daugman, 1985]
bewiesen.
66
KAPITEL 3. ELLIPSEN
(a) (b) (c) (d)
Abbildung 3.4: Gabor-Gestaltung und illusive Kontur: Beispiel xclock. Der implizierte Kreis in
xclock (a) von X11 ist physikalisch nicht vorhanden. Dies ist eine sogenannte „illusive Kontur“.
Mit einer üblichen Übertragungsfunktion (b), wie es oft in der Literatur diskutiert sind, ist eine nicht-
vorhandene Kontur nicht herauszuziehen, während das Ergebnis (d) durch eine um π/2gedrehte Über-
tragungsfunktion (c) (gfilt.c -w0.5 -b0.5 -Q3.5) mit großer Toleranz der Parameter möglich
ist. Siehe auch Shell-Scripts gxclock.sh und pgmell.sh, in dem 12 Kanäle von (c) benutzt sind.
Ein weiterer Grund für eine neue Implementierung für die Multi-Kanal-Gabor-Filterung
(gfilt.c) ist der experimentelle Versuch, einen „Skala-Raum (scale-space)“, nicht im
Sinne von [Hartmann, 1982, 1983] [Witkin, 1983] [Koenderink, 1984], durch den Parame-
ter-Raum der Bandbreite und Mittelfrequenz der Gabor-Kanäle zu generieren. Cf. Abb. 3.3
auf S. 64.
3.1.2 Kammdetektor unter Abwesenheit der Orientierungskarte
Ein Dilemma bei Anwendung der Gabor-Filterung zur Konturenextraktion ist die Wahl der
Anzahl der Kanäle. Sind die Übertragungsfunktionen auf der Fourier-Ebene dicht neben
einander überlagert, wie bei den Orientierungssäulen im visuellen Kortex der Fall ist, so
erhöht sich drastisch der Rechenaufwand, denn mit jedem zusätzlichen Kanal ist eine DFT
mehr erforderlich, da die Antworten erst im Ortsbereich verknüft werden. Ist die Anzahl der
Kanäle verringert, so verliert man die Konnektivität der endgültigen Konturen. Unsere alte
„Standard“- bzw. festprogrammierte Übertragungsfunktionen sind eine Oktave von radia-
ler Bandbreite, 0.5Nyquist der Mittelfrequenz, und π/12 für die Orientierungsbandbreite.
Dies impliziert eine Elliptizität (aspect ratio) der Gabor-Funktion von 0.394957. Mittels
Herstellung einer Orientierungskarte (gradedge.sh) via diagonalisierung der Hesse-
Matrix99(gmagedge.sh) haben wir hier jedoch mit dengleichen Parametern wohl kon-
nektierte Konturen extraieren können, wie beispielsweise in Abb. 3.8 auf S. 70 und Abb. ??
auf S. ?? demonstriert ist. Die Lage der extraierten Konturen werden in Abb. 3.10 auf S. 72
und Abb. 3.11 auf S. 73 überprüft.
99Die Hesse-Matrix am Vektor x=x1· · · xnTRneines zweimal partiell differenzierbaren Skalar-
feldes I:Rn7→ Rläßt sich durch die zweiten Ableitungen wie folgt bilden:
H(I(x)) = 2I(x)
xxT=
2I
x2
1
2I
x1x2· · · 2I
x1xn
2I
x2x1
2I
x2
2
· · · 2I
x2xn
.
.
..
.
.....
.
.
2I
xnx1
2I
xnx2· · · 2I
x2
n
.(3.2)
3.1. KONTURENEXTRAKTION
67
(a) (b) (c) (d)
(e) (f) (g) (h)
Abbildung 3.5: Gabor-Gestaltung und Wahrnehmung illusiver Konturen I. Das originale 175 ×169
Bild (a) wird mit MKGF von insgesamt 96 Gabor-Kanälen in (b) durch gfilt.c -pz0 -s -N8
-F0.9 -O0 gefiltert jeweils 12 Kanäle an der Mittelfrequenz 0.5,0.45,0.405,0.3645,0.32805,
0.295245,0.2657205 und 0.23914845 = 0.5×0.97Nyquist mit radialer Bandbreite von 1Ok-
tave und Orientierungsbandbreite von 15. Das Bild (c) sdellt die lokale Energie der Ausgabe vom
gfilt.c nach dem nicht-linearen WTIA-Verknüpfung im Ortsbereich dar. Einfache Konturen (d)
sind aus (c) via gradedge.sh zu extraieren. (Siehe Abb. 3.8–(c) auf S. 70 für den Inhalt des
gradedge.sh.) Der Aufwand von 96 Kanälen (30 Sekunden auf einem 233 Mhz SISD CISC-Pro-
zessor) in (b), (c) und (d) ist für die Suche der geeigneten Skala gewidmet. Die geeignete Skala wird an
der Mittelfrequenz von 0.23914845 Nyquist gefunden, wobei die Kontur des Würfels als eine dicke
Linie anstatt zwei Kanten „wahrgenommen“ wird. In der Tat lassen sich die illusiven Konturen mit
großer Toleranz der Parameter und viel wenigerem Aufwand (4 Sekunden in derselben Umgebung)
ableiten. Mit 12 Kanälen an der Mittelfrequenz 0.24 Nyquist und elliptischem Verhältnis von 0.3(e)
sind die lokale Energie (f) durch gfilt -pz0 -s -A15 -Q0.3 -w0.24 und die abgeleiteten Kon-
turen (g) durch gradedge.sh zu gewinnen. Das Bild (h) überprüft die Lage der Konturen durch
eine Überlagerung mit dem originalen Bild (a). Es sei darauf hingewiesen, daß die Ergebnisse (c)
und (f) durch anschauliche WTIA-Verknüpfung der lokalen Energie zu gewinnen sind. Dies bedeutet,
daß eine Form der illusiven Konturen bereits bei den einfachen und komplexen Zellen durchaus reprä-
sentiert werden kann, da die hierzu benötigten Operationen für die biologischen Systeme realistisch
sind.
68
KAPITEL 3. ELLIPSEN
(a) (b) (c) (d)
(e) (f) (g) (h)
Abbildung 3.6: Gabor-Gestaltung und Wahrnehmung illusiver Konturen II. Als Fortsetzung zur
Abb. 3.5 auf S. 67 wird hier der redundante Aufwand zur Formung nicht-physikalischer Konturen
weiter reduziert. Wir haben in (b) nun 4Gabor-Kanäle, die den Haupt-Beitrag zur kritischen lokalen
Energie in (c) darstellen (gfilt.c -pz0 -s -w0.5 -Q0.2 -A45 -b0.5). Das Bild (d) wird nach
wie vor durch gradedge.sh gewonnen. Weiterhin wird in (e) (h) auf nur 2Kanäle reduziert,
derer Orientierungen einander in 86stehen. Da die zwei vertikalen Kanten in (e) gekrümmt sind,
ist in (g) und (h) deutlich stärkere Antwort auf die Kanten oben links und unten rechts vom linken
Kanal in (e) zu erkennen. (gfilt.c -s -Q0.2 -a90 -A86 -w0.5 -b0.5). Die Verbindungskraft
einer optisch mit großer Entfernung unterbrochenen Kontur besteht sehr effizient in der Elliptizität
(gfilt.c -Q) einer 2-dimensionalen Gabor-Funktion bzw. des Rezeptivfeldes einer einfachen Zel-
le. Introspektiv gedacht könnte die Wahrnehmung der illusiven Kontur ausgelöst werden durch eine
geringe Anzahl der einfachen Zellen in der primitiven Stufe des visuellen Pfades in die Richtung bot-
tom-up. Auf der anderen Seite könnte attentiv in der Form einer „Schablone“ top-down die Zellen-
Aktivitäten „interpretiert“ werden. Unser Experiment und Auslegung verfügt über den Vorteil der An-
schaulichkeit und kein Verstoß gegen bekannte neurophysiologische Fakten. (Die Energie-Bilder (c)
und (g) sind durch pfmgamma.c -G0.35 Gamma-Korrigiert.)
3.2. ELLIPSENEXTRAKTION
69
(a) (b)
Abbildung 3.7: Lokale Energie via Gabor-Filterung: Beispiel Lena und Rad. MKGF und WTIA von
gfilt.c -s mit dengleichen Parametern wie in [Trapp, 1998]. Diese dienen als Eingabe für die in
Abb. 3.8 auf S. 70 und Abb. ?? auf S. ??.
3.2 Ellipsenextraktion
Für „Ellipsen-Detektion“ und -Fitting existieren äußerst zahlreiche Literaturen100, denn die
Ellipsen im 2-dimensionalen Raum sind perspektive Projektionen der Kreise im 3-dimen-
sionalen Raum. Solche geometrischen Primitive sind für besonders wichtig gehalten und
sind in weitreichenden Aufgaben in Computer-Vision involviert. Dennoch sind praktische
Ergebnisse auf natürlichen Szenen mit der Geschwindigkeit und Präzision, die unsere For-
derungen erfüllen, mit heutiger Rechenleistung sehr eingeschränkt.
Mit Ellipsenextraktion wird hier parametrische Lokalisierung einer Ellispe gemeint,
denn mit parametrischer Bestimmung der Lage einer Ellipse ist Sub-Pixel-Präzision in
Bildkoordinatenmöglich. Weil die Tiefendaten im rektangulären Pixel-Rastergeliefert wird,
müssen die Koordinaten allerdings bei der Fusion wieder einmal zu dem nächsten Nachbar
quantisiert werden. Die Bezeichnung „Erkennung“ möchten wir hier mit Absicht vermein-
den, denn sie ist für sehr verschiedene Aufgaben verwendet und daher mehrdeutig gewor-
den. Die Aufgabe besteht darin, die Frage
Wo ist die Ellispe in der Szene?
nicht aber
Die Hesse-Matrix bzw. Weingarten-Abbildung is der ersten und der zweiten Fundamentalform verbunden. Die
Diagonalisierung solcher eines 2-dimensionalen Skalarfeldes verrät die lokalen Hauptrichtungen v1(x),v2(x)
und Hauptkrümmungen κ1(x), κ2(x)σ(H)nahe x. Die invariante Gaußkrümmung is gleich det H=κ1κ2
und die invariante mittlere Krümmung tr H/2 = (κ1+κ2)/2, wobei κ1und κ2die Hauptkrümmungen sind.
[Hilbert und Cohn-Vossen, 1932, 1952] [ter Haar Romeny, 1999; ter Haar Romeny et al., 1994] [Heckbert und
Garland, 1999].
100unter anderen [Agin, 1981] [Yuen et al., 1989] [Rosin und West, 1989] [Porrill, 1990] [Ellis et al., 1992]
[Rosin, 1993a] [Rosin, 1993b] [Yoo und Sethi, 1993] [Gander et al., 1994b] [Gander et al., 1994a] [Karl et al.,
1994] [Ho und Chen, 1995] [Fitzgibbon et al., 1996] [Rosin, 1996b] [Rosin, 1996a] [Cabrera und Meer, 1996]
[Werghi et al., 1996] [Cui et al., 1996] [Aguado et al., 1996] [Hal´ır und Flusser, 1998] [McLaughlin, 1998]
70
KAPITEL 3. ELLIPSEN
(a) (b)
(c) (d)
Abbildung 3.8: Konturenextraktion nach der Gabor-Filterung: Beispiel Lena. Nachverarbeitung nach
der Multikanal-Gabor-Filterung und WTIA mit dem Eingangsbild von Abb. 3.7–(a) auf S. 69. Die
Bilder (a) und (b) sind die jeweils vorhergehenden Ergebnisse durch den G- und M-Verdünnungsal-
gorithmus unterm Khoros. Das Bild (c) ist vom Algorithmus (gradedge.sh) durch die Kreierung
einer Orientierungskarte während der Multikanal-Gabor-Filterung (gfilt.c -t2), Non-Maximum-
Suppression,Hysterese-Schwellenwert-Verfolgung (pfmdir -H) [Canny, 1983, 1986], binäre Ver-
dünnung (pgmthin.c) [Zhang und Suen, 1984] [Lee und Chen, 1992] [Gonzalez, 1987, 398–402]
[Guy und Medioni, 1983, 1992, 1996] und Konturenverkettung (pgmlink.c) gewonnen worden.
Mit einem ähnlichen Verfahren (gmagedge.sh), bis auf den Verzicht auf die vorgegebene Orien-
tierungskarte, ist das Bild (d) konstruiert worden. Die für die Non-Maximum-Suppression notwendige
Orientierungskarte wird durch die Diagonalisierung der Hesse-Matrix (v. et. Fußnote 99 auf S. 69
und pfmgauge.c -g) des Eingangsbildes Abb. 3.7–(a) auf S. 69 nachgewonnen. Es sei darauf hin-
gewiesen, daß die Konturen in den früheren Ergebnissen (a) und (b) nicht ein-pixel-breit sind und viel
geringere Idempotenz-Eigenschaft als unsere in den Bildern (c) und (d) aufweisen. Cf. § 2.1.1 ab S. 8.
3.2. ELLIPSENEXTRAKTION
71
(a) (b)
(c) (d)
Abbildung 3.9: Konturenextraktion nach der Gabor-Filterung: Beispiel Rad. Nachverarbeitung nach
der Multikanal-Gabor-Filterung und WTIA mit dem Eingangsbild von Abb. 3.7–(b) auf S. 69. Die
Bilder (a) und (b) sind die jeweils vorhergehenden Ergebnisse durch den G- und M-Verdünnungsal-
gorithmus unterm Khoros. Das Bild (c) ist vom Algorithmus (gradedge.sh) durch die Kreierung
einer Orientierungskarte während der Multikanal-Gabor-Filterung (gfilt.c -t2), Non-Maximum-
Suppression,Hysterese-Schwellenwert-Verfolgung (pfmdir -H) [Canny, 1983, 1986], binäre Ver-
dünnung (pgmthin.c) [Zhang und Suen, 1984] [Lee und Chen, 1992] [Gonzalez, 1987, 398–402]
[Guy und Medioni, 1983, 1992, 1996] und Konturenverkettung (pgmlink.c) gewonnen worden.
Mit einem ähnlichen Verfahren (gmagedge.sh), bis auf den Verzicht auf die vorgegebene Orien-
tierungskarte, ist das Bild (d) konstruiert worden. Die für die Non-Maximum-Suppression notwendige
Orientierungskarte wird durch die Diagonalisierung der Hesse-Matrix (v. et. Fußnote 99 auf S. 69
und pfmgauge.c -g) des Eingangsbildes Abb. 3.7–(b) auf S. 69 nachgewonnen. Es sei darauf hin-
gewiesen, daß die Konturen in den früheren Ergebnissen (a) und (b) nicht ein-pixel-breit sind und viel
geringere Idempotenz-Eigenschaft als unsere in den Bildern (c) und (d) aufweisen. Cf. § 2.1.1 ab S. 8.
72
KAPITEL 3. ELLIPSEN
(a) (b)
(c) (d)
Abbildung 3.10: Lage-Überprüfung-I der Konturenextraktion nach Gabor-Filterung via
gradedge.sh. In (a) und (c) geben wir jeweils Abb. 3.8–(c) auf S. 70 und Abb. ??–(c) auf
S. ?? wieder. Um die Zussamengehörigkeit der Konturenpixel zu einer Konturenliste zu verdeutlihen,
zeichnen wir die Terminatoren jeder Konturenliste mit schwarzen Punkten, während der Rest in
grauen Linien gezeichnet wird. In (b) und (d) werden diese herausgezogenen ein-pixel-breiten
Konturen binär ins Bild der lokalen Energie Abb. 3.7 auf S. 69 überlagert, um die Lage der
Konturen zu überprüfen. Nota bene: Sowohl die lokale Energie als die Konturen-Stärke als auch die
Orientierungen der Gabor-Kanäle als Orientierungskarte werden zur Konturenextraktion verwendet.
3.2. ELLIPSENEXTRAKTION
73
(a) (b)
(c) (d)
Abbildung 3.11: Lage-Überprüfung-II der Konturenextraktion nach Gabor-Filterung via
gmagedge.sh. In (a) und (c) geben wir jeweils Abb. 3.8–(d) auf S. 70 und Abb. ??–(d) auf
S. ?? wieder. Um die Zussamengehörigkeit der Konturenpixel zu einer Konturenliste zu verdeutlihen,
zeichnen wir die Terminatoren jeder Konturenliste mit schwarzen Punkten, während der Rest in
grauen Linien gezeichnet wird. In (b) und (d) werden diese herausgezogenen ein-pixel-breiten
Konturen binär ins Bild der lokalen Energie Abb. 3.7 auf S. 69 überlagert, um die Lage der Konturen
zu überprüfen. Nota bene: Nur die lokale Energie wird hier als Konturenstärke benutzt. Keine
Orientierungsinformation ist am Eingang des Algorithmus vorhanden.
74
KAPITEL 3. ELLIPSEN
Ob eine Ellispe in der Szene existiert?
zu beantworten. Es wird angenommen, daß es eine „visuell signifikante“ Ellispe in der Sze-
ne zu finden sei. Bei Schwierigkeiten all dieser Anführungszeichen sei es bedacht, daß auch
Rauschen in der Szene die Kontur einer kleinen Ellipse formen kann. Weiterhin muß sich
die Ellipse „zum großen Teil“ in der Szene befinden, denn theoretisch ist ein gerades Seg-
ment im Bild auch ein Teil einer Ellispe, derer Umfang sich der Unendlichkeit annähert.
Solche Umstände u. a. werden uns auf ein ad hoc Verfahren einschränken.
Die Ansätze via Evidenz-Akkumulation sind zwar robust gegenüber Störungen in dem
Intensitätsfeld, er heißt aber im Falle einer Ellipsen-Modellierung eine erschöpfte Akkumu-
lation der Evidenzen im 5-dimensionalen Parameter-Raum gefolgt durch eine Suche nach
dem lokalem Maximum im 5-dimensionalen Evedienz-Raum und ist daher mit sehr hoher
Komplexität verbunden. In der praxis können wir uns den Zeitaufwand für einen hough-
basierten Algorithmus nicht leisten, denn für die erforderliche Präzision unserer Aufga-
be müssen wir den Evidenz-Raum mit einem noch feineren Gitter diskretisieren, was die-
sen Ansatz für die Echt-Zeit-Anwendung mit der gegenwärtig verfügbaren Rechenleistung
nicht-realisierbar macht.
DieVerfahrenviaTemplate-Matchingandererseits,unabhängigdavon,wie es „gematcht“
wird, setzt die Schablone voraus. Im Falle der Ellipsen besitzt aber die Schablone ein Frei-
heitsgrad von 5. Dies bedeutet auch eine Suche im 5-dimensionalen Schablonen-Raum plus
eine Suche im 2-dimensionalen Bild-Raum. Schränkt man die Freiheit der Schablonen ein,
so verliert man die Auflösung der Ellipsen, wie beim Parameter-Raum der Evidenz-Akku-
mulation der Fall ist. Dies heißt auch beispielsweise, daß man das zu demontierende Objekt
nicht schräg oder unvollständig in der Szene haben darf. Wir haben mit unserem Ansatz
hier demonstriert, daß solche Nachteile vermieden werden können, ohne größeren, wenn
nicht mit geringerem, Rechenaufwand aufwenden zu müssen.
Die Voraussetzung unseres Ansatzes der Ellipsen-Lokalisierung ist eine gute Kontu-
renextraktion, welche in § 3.1 ab S. 59 diskutiert worden ist. Es sei darauf hingewiesen,
daß eine „gute“ Konturenextraktion im Vergleichen zu den o. g. Verfahren nur einen sehr
geringen Aufwand benötigt. Dennoch unterziehen sich bei unserer Konturenextraktion die
Eingangsintensitätsdaten aus einer der Stereo-Kameras einer starker Datenreduktion. Des
Autors Meinung nach sei die Datenreduktion eine der höchsten Direktiven überhaupt bei
einem kybernetischen Versuch, eine natürliche Wahrnehmung nachzuahmen. Dies heißt,
schlicht und logisch, die irrelevante Information zu ignorieren, um Effizienz zu gewinnen.
Selbstverständlich führt dieses Ignorieren der Daten hier und da zu unerwünschten Konse-
quenzen. Der Autor persönlich ist zweimal unter genau derselben Situation in den falschen
Bus eingestiegen. Im nach hinein stellt sich introspektiv heraus, daß dies genau die Konse-
quenz der o. g. Unterlassung ist. Es sei aber anstatt des bloßen Verlustes das Verhältnis vom
Verlust und Gewinn betrachtet, denn unsere Informationsverarbeitung wäre sonst durch die
immense Menge der Daten überlastet.
Die Konturen, als Ergebnis vom § 3.1 ab S. 59, präsentieren sich nun als Listen der ver-
ketteten Konturen-Pixel, eine syntaktische101 Strukturierung der sonst nicht-zusammenhän-
genden Bildelemente. Die Konturenlisten werden jeweils direkt mit einer Ellipse modelliert
(kalmell.c) [Porrill, 1990]. Alternativ werden die Konturenpixel zu Linien und Bogen
segmentiert (pix2line.c [Rosin und West, 1989]) und anschließend mit Ellipsen model-
liert (ellin3x.c [Rosin und West, 1989]). Um die signifikanteste Ellipse, die eventuell
101Cf. Fußnote 85 auf S. 59
3.2. ELLIPSENEXTRAKTION
75
in der Szene vorhanden ist, haben wir ad hoc die Berechnung mit zusätzlicher Gewichtung,
Auslesung und Sortierung versehen lassen (ellfilt.c). Uns ist gelungen, in den natür-
lichen Szenen, mit hoher Sicherheit die „signifikantesten“ Ellipsen präzis zu lokalisieren
(pgmell.sh,pose.sh und pose2.sh). Es sei darauf hingewiesen, daß sich unserer
Ansatz sehr stark auf eine zuverlässige Konturenextraktionsalgorithmus. Wir demonstrie-
ren in Abb. 3.12 auf S. 75 und Abb. 3.13 auf S. 76 einige natürliche Szene, die den anderen
Verfahren mit gleichem Zeitaufwand sehr schwierig sind.
Abbildung 3.12: Ellipsen-Lokalisierung: Beispiele an realen Szenen I.
76
KAPITEL 3. ELLIPSEN
Abbildung 3.13: Ellipsen-Lokalisierung: Beispiele an realen Szenen II.
Kapitel 4
Hyperkreis
Es ist möglich, einen Kreis im 3-dimensionalen Raum von ihrer perspektiven Projektion
in der 2-dimensionalen Ebene, einer Ellipse, mittels geeichter Kameras perspektiv geome-
trisch, mit eingeschränkter Ambiguität, zu invertieren. Das Ergebnis solcher Verfahren er-
füllt dennoch unsere Forderung der Genauigkeit nicht [Kanatani, 1993]. Eine Vermessung
durch Invertierung ist nämlich für unsere Aufgabe zu sensitiv und abhängig von der Kon-
turenextraktion. Eine zuverlässige, eindeutige und wohl-definierte „Konturenextraktion“ ist
die gemeinsame Schwachstelle im künstlichen Sehen überhaupt, wie wir bereits im Kapi-
tel 3 diskutiert haben.
Unsere parametrische Lagebestimmung eines in der Szene vorhandenen Kreises ba-
siert auf der Fusion eines Skalarfeldes und eines Vektorfeldes, wobei das Skalarfeld aus
den Intensitätsdaten der Szene und das Vektorfeld aus den Tiefendaten derselben Szene
besteht. Die Tiefendaten sind die Koordinatenvektoren, die durch geeichte Stereokameras
geschätzt werden und in Pixel-Pixel-Korrespondenz zu den Intensitätsdaten stehen [Trapp,
1998]. Die Fusion der beiden Datenquellen ergibt eine Punktmenge der dreidimensionalen
Koordinaten, die eine verrauschte Abtastung des gesuchten Kreises im Raum darstellt. Der
Kreis im dreidimensionalen euklidischen Raum wird als Spezialfall eines 1-Hyperkreises
(cf.Def. 2.4.17 auf S. 49) aufgefasstundzurModellierungderPunktmengeparametrischge-
schätzt. Die Implementation der entgültigen dreidimensionalen Vermessung ist hyperkreis-
basiert und nimmt eine Datenmenge beliebiger Dimension auf, die nur durch maschinelle
Leistungsfähigkeit eingeschränkt ist [Chen et al., 2000].
Der im Kapitel 2 (S. 5) eingeführte geometrische Begriff Hyperkreis verallgemeinert auf
endlich dimensionale Räume den üblichen Kreis. Der Begriff Hyperkreis läßt sich nicht nur
hier zur Modellierung einer 3-dimensionalen Punktmenge anwenden, sondern er ermöglicht
eine neue geometrische Anschauung höherer dimensionalen Daten. Wegen der Einfachheit
i. a. des Begriffes parallel zu den wichtigsten geometrischen Primitiven argumentieren wir,
daß der neue Aspekt höherer dimensionalen Daten von potenzieller Bedeutung sein soll.
4.1 Nicht-Lineare Geometrische Ausreißer-Filterung
Die in der Tiefenkarte vorhandenen Fehler verhindern die genaue Lage-Bestimmung des
Objektes, besonders in einer schiefen Orientierung, die beim Stereoverfahren nicht vorge-
77
78
KAPITEL 4. HYPERKREIS
sehen ist, Cf. Abb. 1.1 auf S. 2, Abb. 4.3 auf S. 80, Abb. 4.5 auf S. 81 und Abb. 4.8 auf S. 89.
Die Entfernung der Fehler ist also eine kritische Voraussetzung für ein brauchbares Ergeb-
nis. Wir stellen hier ad hoc ein äußerst effektives Verfahren vor. Mit ad hoc meinen wir,
daß es leider nur für einen 1-Hyperkreis im 3-dimensionalen Raum geschaffen ist. Weiterer
Untersuchungen einer möglichen Generalisierung auf n-Hyperkreise lassen sich wünschen
102. Dennoch ist dieser Ansatz zusammen mit der anschließenden Regression deutlich effizi-
enter als eine „robuste Regression“ [Brown, 1982] [Rousseeuw, 1984] [Rousseeuw, 1987],
die sich während der Regression unmittelbar mit den „Ausreißern“ auseinandersetzt 103. Wir
nutzen im Gegensatz hierzu das geometrische Vorwissen von einem Kreise zur Vorverarbei-
tung einer Datenmenge, die Ausreißer enthalten kann, stark aus. Unser Ansatz ist insgesamt
eine robuste Regression.
In unserer Formulierung der Datenmatrix ist die Kovarianzmatrix in den Singulärwer-
ten sowie rechten Singulärvektoren und die regularisierten Mahalanobis-Distanzen in den
linken Singulärvektoren mitenthalten, Cf. § 2.4.2 ab S. 36 und § 2.4.3 ab S. 38. Mit der
Anwendung der SVD wird das Problem der Invertierung einer singulären Kovarianzmatrix
oder höher Konditionsnummer umgegangen (pnmfilt.c). Während es möglich ist, zum
Teil die vorhandenen Fehler in der Tiefenkarte anhand regularisierter Mahalanobis-Distanz
zu entfernen ,Cf. Abb. 1.1–(c) auf S. 2 und Abb. 4.1 auf S. 78, vermeiden wir dies wegen
des relativ höheren Rechenaufwands, einer SVD aller definierten Tiefenvektoren. Die Feh-
ler in der Tiefenkarte werden erst nach Datenreduktionsstadien, Ellipsendetektion und Teil-
Fusion mit der Tiefenkarte, nachverarbeitet. Dies erspart uns die Verarbeitung irrelevanter
Tiefen-Vektoren, die zu unserem Ergebnis wenig beitragen können.
Outlier Filtering by Mahalanobis Metric
raw range data
filtered range
−60 −40 −20 020 40 60
x(mm) −100
−80
−60
−40
−20
020406080
y(mm)
−1600
−1590
−1580
−1570
−1560
−1550
−1540
−1530
−1520
−1510
−1500
−1490
z(mm)
Abbildung 4.1: Regularisierten Mahalanobis-Distanz und Ausreißer. (Def. 2.4.15 auf S. 46) via SVD
auf die Tiefenvektoren (pnmfilt.c). Die Daten beziehen sich auf die Szene in Abb. 1.1 auf S. 2. Die
grünen Punkte stellen die rohen Daten aus der Tiefenkarte dar. Die schwarzen sind übriggebliebenen
Vektoren nach unserer Mahalanobis-Filterung. Dies ist mit Abb. 4.2 auf S. 80 zu vergleichen.
102In der Tat ist unser Verfahren (curvfilt.c) nicht auf einen 1-Hyperkreis eingeschränkt, sondern soll für
alle zu gewissem Grad ableitbaren Kurven anwendbar sein.
103Siehe progress und progress.exe. Mit der robusten „Least Median of Squares Regression“ [Rous-
seeuw, 1984] ist es zwar auch sehr effektiv zur Detektion der „Ausreißer“, ist dies in der Geschwindigkeit ein
großer Nachteil.
4.2. HYPEREBENE VIA SVD
79
Die Ambiguität des Begriffes „Ausreißer“ wird vermieden, indem wir ad hoc eine ope-
rative Definition eines Ausreißers einführen. Um einen Vektor in einer 3-dimensionalen,
geordneten Punktmenge {xi, i = 1,...,m}als „Ausreißer“ zu identifizieren und auszu-
schließen, definieren wir die eine „Abweichung“ Di(λ)des iten punktes xivon einem
hypothetischen Kreis als [Chen et al., 2000]
Di(λ) =
λ
X
δ=1 (xixiδ)×(xi+δxi)2,(4.1)
wobei ×ist das 3-dimensionale Kreuzprodukt und (2λ+ 1) die Länge des Fenters einer
Nachbarschaft des Punktes xi, für den die „Abweichung“ Di(λ)berechnet wird. Ein Punkt
xisei als Ausreißer identifiziert und abgelehnt, wenn
Di(λ)>10 ·Med{Dk(λ) : k= 1,···, m},(4.2)
wobei Med bezeichnet den nicht-linearen Median-Operator. Gute Ergebnisse für unsere An-
wendung erhalten wir mit einem empirischen Werte von λ= 5. Diese nicht-lineare Filte-
rung nutzt sehr stark die geometrische Invarianz eines Kreises aus und erfüllt die folgenden
Kriterien:
Transparenz unter additiven, Gaußschen, weißen Störungen;
Unversehrtheit der durchgelassenen Vektoren bzw. Punkte;
Ausreichende Effektivität für Brauchbarkeit des Ergebnisses.
Diese Filterung hat keinerlei Einfluß auf eine Punktmenge von einem gleichmäßig abge-
tasteten Kreis mit additiven Gaußschen, weißen Rauschen, während sogar ein typischer
menschlicher Tippfehler detektiert werden kann 104. Dies ist eine wichtige Eigenschaft für
die anschließenden Schätzungen. Desweiteren läßt sich empirisch feststellen, daß der Algo-
rithmus über eine Radius-Invarianz verfügt. In Abb. 4.2 auf S. 80 wird das Ergebniss der
geometrischen Filterung am Beispiel Abb. 1.1 auf S. 2 gezeichnet. Die „Sauberkeit“ dieses
Algorithmus wird mit einem weiteren Beispiel Abb. 4.3 auf S. 80 in Abb. 4.4 auf S. 81
demonstriert. Wir sehen in Abb. 4.5 auf S. 81, daß er für diese bestimmte Aufgabe des
Projektes kritisch und unentbehrlich ist.
4.2 Hyperebene via SVD
Sei eine Menge von mBeobachtungsvektoren {xi, i = 1,...,m}
xi=
xi1
xi2
.
.
.
xin
,
Wir nennen den Spaltenvektor xieinen Punkt in En, einem n-dimensionalen euklischen
Raum mit gewöhnlichem Skalarprodukt. Ein (n1)-Flach bzw. eine Hyperebene Π En
Π = {xi:p1xi1+p2xi2+···+pn+1 = 0}, p1, p2,...,pn+1 R(4.3)
104Cf. ghyper.c,gaussian.c,curvfilt.c
80
KAPITEL 4. HYPERKREIS
Outlier Filtering by Geometric Invariance
raw range data
filtered range
−60 −40 −20 020 40 60
x(mm) −100
−80
−60
−40
−20
020406080
y(mm)
−1600
−1590
−1580
−1570
−1560
−1550
−1540
−1530
−1520
−1510
−1500
−1490
z(mm)
Abbildung 4.2: Beispiel der geometrischen Filterung der Ausreißer nach Gl. (4.1) auf S. 79 und
Gl. (4.2) auf S. 79 (curvfilt.c). Die grünen Punkte stellen die rohen Daten aus der Tiefenkar-
te dar. Die schwarzen sind übriggebliebenen Vektoren nach der Filterung. Die Daten beziehen sich
auf die Szene in Abb. 1.1 auf S. 2. Dies ist mit Abb. 4.1 auf S. 78 zu vergleichen. Mit starker Aus-
nutzung von geometrischen Vorwissen ist unser Verfahren in der Lage, effizienter ein „saubereres“
Ergebnis zu liefern.
Abbildung 4.3: Tiefendaten in kritischer Orientierung: Beispiel Rad. Dieses Beispiel stellt eine Her-
ausforderung für das Stereoverfahren [Trapp, 1998]. Das Rad steht in einer kritisch schrägen Orientie-
rung an der Vermögensgrenze des Stereoverfahrens. Dennoch liegt die Orientierung weit innderhalb
des Vermögens unserer Algorithmen [Chen et al., 2000].
4.2. HYPEREBENE VIA SVD
81
Hypercircle Estimate on Filtered Range Data
rms 1.06770356, uncertainty: 0.67828 deg
radius: 180.3740702561 raw range data
filtered range
estimated circle
50 100 150 200 250 300
x(mm) −200
−150
−100
−50
050 100150200
y(mm)
−2100
−2050
−2000
−1950
−1900
−1850
−1800
−1750
−1700
z(mm)
Abbildung 4.4: Daten-Fusion mit Ausreißer-Detektion und Filterung. Beispiel der geometrischen Aus-
reißer-Filterung im Bezug auf die Szene in Abb. 4.3 auf S. 80 [Chen et al., 2000]. Die blauen Punkte
stellen die rohen Vektoren aus der Tiefenkarte dar. Die schwarzen sind übriggebliebenen Vektoren
nach unserem Verfahren. Im voraus wird der geschätzte Kreis rot gezeichnet mit RMS-Residuum:
1.0677036 mm, Orientierungsunsicherheit: 0.67828, Radius: 180.3740 mm. Vgl. mit dem
Ergebnis in Abb. 4.5 auf S. 81, wo unsere Ausreißer-Filterung nicht durchgeführt wird. (Da die Ste-
reo-Messungen[Trapp, 1998] durch 32-bitIEEE-754-Single-Precision[IEEE, 1985] [Goldberg,1991,
p. 193] in Khoros-Float-Format gegeben sind, werden hier die Ergebnisse in maximal 8Dezimalstel-
len ausgedruckt, obgleich die Daten intern in mindestens 64-bit-double verarbeitet worden sind.)
Hypercircle Estimate on Raw Range Data
rms 49.28086033, uncertainty: 29.1249 deg
radius: 176.8992819695 raw range data
estimated circle
50 100 150 200 250 300
x(mm) −200
−150
−100
−50
050 100150200
y(mm)
−2100
−2050
−2000
−1950
−1900
−1850
−1800
−1750
−1700
z(mm)
Abbildung 4.5: Daten-Fusion ohne Ausreißer-Detektion und Filterung. Im Vergleich zu Abb. 4.4 auf
S. 81 wird in dieser Abbildung die Kreisbestimmung ohne Ausreißer-detektion und -Filterung durch-
geführt [Chen et al., 2000]. Der geschätzte Kreis mit RMS-Residuum: 49.28086 mm, Orientie-
rungsunsicherheit: 29.1249, Radius: 176.89928 mm wird im voraus rot gezeichnet (Da die
Stereo-Messungen [Trapp, 1998] durch 32-bit IEEE-754-Single-Precision [IEEE, 1985] [Goldberg,
1991, p. 193] in Khoros-Float-Format gegeben sind, werden hier die Ergebnisse in maximal 8De-
zimalstellen ausgedruckt, obgleich die Daten intern in mindestens 64-bit-double verarbeitet worden
sind.)
82
KAPITEL 4. HYPERKREIS
soll die Menge {xi}modellieren mit dem gesuchten Parameter-Vektor
p=
p1
p2
.
.
.
pn+1
.(4.4)
In [Chen et al., 2000] die „beste“ affine Teilraum durch eine SVD berechnet. Die Punkte xi
werden wie Gl. (2.40) auf S. 28 von oben nach unten, Cf. § 2.4 ab S. 28, in einer m×n
Datenmatrix Deingetragen 105.
D=
xT
1
xT
2
xT
3
xT
4
xT
5
.
.
.
xT
m
=
x11 x12 ··· x1n
x21 x22 ··· x2n
x31 x32 ··· x3n
x41 x42 ··· x4n
x51 x52 ··· x5n
.
.
..
.
.....
.
.
xm1xm2··· xmn
.(4.5)
Wir appendieren eine zusätzliche Spalte mit „Einsen“ und formen eine m×(n+ 1) aug-
mentierte Matrix
A=
x11 x12 ··· x1n1
x21 x22 ··· x2n1
x31 x32 ··· x3n1
x41 x42 ··· x4n1
x51 x52 ··· x5n1
.
.
..
.
.....
.
..
.
.
xm1xm2··· xmn 1
.(4.6)
Sei sortierte Singulärwertzerlegung von Anach Gl. (2.23) auf S. 19 Cf. § 2.1 ab S. 6 und
§ 2.3 ab S. 16,
A=UΣVT,(4.7)
dann ist die letzte Spalte in V
˜
p=vn+1 =
v1
v2
.
.
.
vn+1
.(4.8)
eine Lösung der kleinsten Quadrate. Cf. Gl. (2.31) auf S. 25. Dies ist äquivalent zur Lösung
der Gleichung
Ap =0,mit kpk2= 1,(4.9)
Wegen Meßfehler und anderen Störungen besitzt Ain der Regel einen trivialen Kern. In
anderen Worten, die letzte rechte Singulärvektor vn+1 ist die Lösung des Minimierungs-
problem, Cf. Gl. (2.31) auf S. 25,
pAAp,mit kpk2= 1.(4.10)
105Die Daten {xi}, werden in unserer Anwendung die Koordinaten-Vektoren aus der Tiefenkarte sein,
Cf. Abb. 1.1 auf S. 2.
4.3. HYPERKREIS VIA SVD
83
Dies gilt für alle unitär invarianten Normen.
Da Variierungen von allen Elementen xij in der Teilraummodellierung involviert sind,
kann diese Methode als total least squares (TLS) 106 betrachtet werden.
4.3 Hyperkreis via SVD
Nach Def. 2.4.17 auf S. 49 in § 2.4.6 sei der gesuchte Hyperkreis die Schnittmenge der
(n1)-Hyperebene ˜
Π En
n
X
j=1
xj˜pj
+ ˜pn+1 = 0 (4.11)
und einer noch zu determinierenden (n1)-Hypersphäre S Sn1 En
n
X
j=1
(xjcj)2r2= 0 (4.12)
mit unbekanntem Vektor z={c1,...,cn} ˜
Π Enund rR, wobei die Hyperebene ˜
Π
aus § 4.2 ab S. 79 ist durch nund pgegeben mit
˜
Π = {x+p:xKer nT,n,p En,p˜
Π}.(4.13)
Wegen der Einschränkung z˜
Πwird in unserem Ansatz die Bestimmung der (n1)-
Sphäre in Ender (4.12) durch das Modellieren einer (n2)-Sphäre in En1ersetzt, indem
wir die Vektoren in Gl. (4.5) auf S. 82 auf die affine Teilraum ˜
Πprojizieren lassen durch eine
affine Projektion. Mit x0
i En1bezeichnen wir die orthogonale Projektion von xi En
auf den affinen Teilraum ˜
Π.
Repräsentiert wird der affine Teilraum ˜
Πin (4.13) durch einen (n1)-dimensionalen
Richtungsteilraum und ein Element in ˜
Π. Der Richtungsteilraum wird wiederum durch eine
orthonormale Basis für das orthogonale Komplement vom Normal nrepräsentiert. Die-
se Basis ist explizit durch eine Singulärwertzerlegung auf der Zeilen-Matrix nTgegeben
(Cf. Abb. 2.2 auf S. 20) 107. Gesucht sind also jetzt das Zentrum z0= (c0
1,...,c0
n1)
En1und der Radius rRvon einer (n2)-Sphäre ˜
Π,Pn1
j=1 (x0
jc0
j)2=r2.
Sei x0
i En1die orthogonale, affine Projektion von dem Vektor xi Enaus Din
Gl. (4.5) auf S. 82 auf dem (n1)-dimensionalen affinen Teilraum ˜
Π. Sei Pder Richtungs-
teilraum von ˜
Πund Pnelementarprojektor auf naus Gl. (4.13) auf S. 83. Die Datenmatrix
nach der affinen Projektion wird zu (Cf. § 2.4.1 ab S. 29)
Dπ=DZmD(IPP)bzw. Dπ=DZmDPn,(4.14)
106[Golub und Van Loan, 1980] [Van Huffel, 1987, 1988, 1997] [Van Huffel und Vandervalle, 1987; Van Huffel
und Vandewalle, 1987]. [Van Huffel und Vandewalle, 1991] [Späth, 1999] [Fierro et al., 1997] Dies ist in hyper.c
implementiert. Siehe matstat.c -Q1 für eine weitere Implementierung der TLS.
107Das allgemeine Problem, eine orthonormale Basis von einem einzigen Vektor herauf aufzubauen, ist nicht
durch den Gram-Schmidt-Proceß zu realisieren. Dies ist ein sehr oft zu sehendes Misverständnis. Sondern, ein
Householder-Reflektor (Cf. § 2.1.6 ab S. 11) wird vorgeschlagen (von Eric Rudd im Usenet; siehe auch unsere
Implementierungen basis33.c und gmat.c -o) oder den Kern der 1×nMatrix nTvia SVD zu berechnen,
Cf. Abb. 2.2 auf S. 20, matstat.c -s0,schur2 -s und svd.c.
84
KAPITEL 4. HYPERKREIS
wobei die letzte Spalte von Dπdurch eine Drehung Qeine Konstante kwird. Sei Dn1
πdie
m×(n1) Untermatrix von den ersten n1Spalten von DπQ,
Dn1
π=
x0T
1
x0T
2
x0T
3
x0T
4
x0T
5
.
.
.
x0T
m
=
x0
11 x0
12 ··· x1(n1)
x0
21 x0
22 ··· x2(n1)
x0
31 x0
32 ··· x3(n1)
x0
41 x0
42 ··· x4(n1)
x0
51 x0
52 ··· x5(n1)
.
.
..
.
.....
.
.
x0
m1x0
m2··· xm(n1)
.(4.15)
Die neue m×(n1) Datenmatrix Dn1
πmit Punkten x0
i En1ist durch eine (n
1)-Sphäre zu modellieren (hyper.c -s). Um Iterationen zu vermeiden, minimieren wir
MMSE (Modified Mean Square Error) von von Thomas und Chan 108,
Q=
m
X
i=1
n1
X
j=1
(x0
ij ˜c0
j)2
˜r2
2
.(4.16)
welche zu einem linearen System
x0
11 ··· x0
1n11
x0
21 ··· x0
2n11
x0
31 ··· x0
3n11
x0
41 ··· x0
4n11
x0
51 ··· x0
5n11
.
.
.....
.
.1
x0
m1··· x0
mn11
s1
s2
.
.
.
sn
=
Px02
1j
Px02
2j
.
.
.
Px02
mj
(4.17)
führt mit
sj=2c0
j(j= 1,···, n 1); sn=
n1
X
j=1
c02
jr2.(4.18)
Dies wiederum wird durch eine SVD gelöst und ergibt das geschätzte Zentrum ˜c0
jund Ra-
dius ˜r
˜c0
j=sj
2(j= 1,···, n 1); ˜r2=
n1
X
j=1
˜c02
jsn.(4.19)
Das geschätzte Zentrum ˜
z˜
Πergibt sich durch kund die Umkehrisometrie Q1:
˜
z=˜c0
1... ˜c0
n1kQ.(4.20)
Der Orthoprojektor PPbzw. sein Komplementärer Pnin (4.14) wird in unserem Projekt
durch einen schiefen Projektor ersetzt. Cf. Gl. (2.9) auf S. 10 und Gl. (2.10) auf S. 10 in
§ 2.1.5 und [Chen et al., 2000] sowie hyper.c -c und hyper.c -s.
108[Thomas und Chan, 1989]. Siehe auch [Bookstein, 1979] [Landau, 1987] [Thomas und Chan, 1989] [Takiyama
und Ono, 1989] [Chaudhuri und Kundu, 1993].
4.3. HYPERKREIS VIA SVD
85
In § 4.2 ab S. 79 und § 4.3 ab S. 83 haben wir die Bestimmung eines üblichen Krei-
ses im 3-dimensionalen Raum auf n-dimensionale Räume verallgemeinert. Sie ist ein li-
neares Verfahren zur Bestimmung eines (n2)-Hyperkreises in En, wo alleine die Sin-
gulärwertzerlegung alle algebraischen Aufgaben übernehmen kann. Ein üblicher Kreis im
3-dimensionalen Raum wird zu einem Spezialfall unserer Hyperkreise. In hyper.c -c
wird der lineare Algorithmus zur Bestimmung eines (n2)-Hyperkreises implementiert.
Zum Testen der Hyperkreise in höheren dimensionalen Räumen ist in ghyper.c -c der
Algorithmus 2.4.19 (S. 50) implementiert, welche algorithmisch unabhängig voneinander
arbeiten. Als Eingaben für ghyper.c wird ein Radius, ein Zentrum beliebiger Dimension
und ein Normalvektor dergleichen Dimension angegeben. Als Ausgabe wird eine beliebige
Anzahl der Zufallspunkte ausgegeben, die auf dem Hyperkreis liegen (Cf. Abb. 2.6–(b) auf
S. 51):
# ghyper version 0.9 Nan-shan Chen C19990607/20000519
# command line: "ghyper -n 1024 -c param4"
# ranmar subsequence (555, 555), position = 177439 (1-indexed)
# This sequence may be reproduced by -I555 -K555 -G177439
# hypercircle generated from the following parameters:
# Center: 10 20 30 40
# Normal: 1 1 1 1
# radius: 5
6.58322 21.232497 28.921771 43.262513
6.4347391 23.355132 30.815672 39.394457
9.6310175 16.177576 32.952728 41.238679
5.6892833 21.102441 31.437061 41.771215
6.2398444 19.468438 32.97328 41.318438
9.263555 20.853 26.497652 43.385793
9.4440056 16.942309 33.905894 39.707791
14.30428 18.594589 28.935448 38.165683
12.446607 15.858661 31.309625 40.385107
6.2360415 19.246432 32.084509 42.433018
10.327064 19.137466 33.732248 36.803222
11.08734 22.151748 31.020706 35.740207
6.6191481 23.677369 29.814109 39.889373
13.458571 20.598017 29.463804 36.479608
5.8044821 21.903488 31.903531 40.388499
7.7412601 17.281475 32.734739 42.242525
10.060879 19.329395 26.814827 43.794899
13.227736 21.007963 26.366374 39.397927
10.766811 18.418762 33.69203 37.122396
11.378956 23.366027 27.122083 38.132933
7.6076424 23.896191 30.465779 38.030388
14.19957 19.528495 28.44585 37.826084
12.068194 19.990756 25.920701 42.020349
10.548548 21.035574 32.552484 35.863394
12.123608 16.380915 28.97654 42.518937
10.9803 22.692399 30.404815 35.922486
11.675553 18.406669 33.093409 36.824368
. . . .
. . . .
. . . .
Diese Daten ergeben durch hyper.c -c -fl folgende Ausgabe 109:
Offset: 10.01890223 19.95226238 29.94313783 40.08569756
Normal: 0.50000000 0.50000000 0.50000000 0.50000000
Center: 10.00000000 20.00000000 30.00000000 40
radius: 5.00000000
hypersphere orthogonal rmse: 0.00000000
hyperplane algebraic rmse: 0.00000000
hyperplane orthgonal rmse: 0.00000000
uncertainly: 0.00000000 degrees
109Für kompakte Darstellung sind die generierten Daten in niedrigerer Präzision zitiert während für hyper.c
die Ausgaben mit voller Präzision double von ghyper.c -cfl benutzt werden müssen.
86
KAPITEL 4. HYPERKREIS
Mit additiven, erwartungsfreien, Gaußschen, weißen Zufallsvektoren 110 wurden die Algo-
rithmen höheren dimensionalen Räumen bis zur Dimension 150 getestet, wobei die Repro-
duzierbarkeit der Zufallssequenz 111 in den Implementationen gesichert ist:
# data file generated by gaussian v1.9 Nan-shan Chen C19980304
# command line: "gaussian -s0.2 hypcirc4.dat"
# ranmar subsequence (555, 555), position = 172229 (1-indexed)
# This sequence may be reproduced by -I555 -K555 -G172229
# corrupting intput data file: "hypcirc4.dat" with
# additive gaussian white noise, sigma=0.2, mean=0
8.10201720 22.33646819 26.90547753 42.20840699
8.76968279 23.52058263 30.13928415 37.31405972
. . . .
. . . .
. . . .
Keine Anomalien 112 konnten in höheren dimensionalen Räumen festgestellt werden. Wir
möchten bei der Gelegenheit darauf hinweisen, daß unsere Implementationen mit konstan-
tem Streben nach Korrektheit, Portierbarkeit, Flexibilität und allgemeiner Anwendbarkeit
sorgfältig produziert worden sind. Dies gilt auch bei der Auswahl eines Zufallsgenerators
Fußnote 111 auf S. 86. Da zum Ziel außerst hoher Aufwand der Entwicklung erforderlich
gewesen ist, hoffen wir, daß sie für weitere Untersuchungen wieder eingesetzt werden kön-
nen.
4.4 Affinitätstest
Die bisher vorhandene Schätzung der Zuverlässigkeit bzw. Unsicherheit der Orientierungs-
schätzungen eines kreisförmigen Objektes ist im Bezug auf die Punktmenge selbst durch die
Residuen der Ausgleichsrechnung gewonnen worden (Cf. Abb. 4.4 auf S. 81 und Abb. 4.5
auf S. 81). Da die absolute Genauigkeit der Lageschätzung eines Kreises erst nach der soge-
nannten „Hand-Auge-Eichung“ des gesamten Roboter-Kamera-Systems vollständig geprüft
werden kann, die in dieser Phase noch nicht verfügbar ist, soll die Affinität zwischen den
Orientierungsschätzungen und Drehungen des Objeckts geprüft werden. Andererseits kann
die Brauchbarkeit der Auflösung der Tiefendaten erst durch Vermessungen eines realisti-
schen Objectkes mit bekannter Geometrie festgestellt werden. Zu diesem Zweck ist ein in
Abb. 4.6 auf S. 87 dargestelltes Experiment für die Affinitätsprüfung aufgebaut. Um die
eventuell vorhandenen Probleme entdecken zu können, wurde die Experimentsumgebung
110Mit „weiß“ meinen wir hier nicht nur diagonale Kovarianz, sondern auch eine skalare Vielfachheit der Identi-
tätsmatrix. Cf. gaussian.c.
111 Der in gaussian.c und ghyper.c fungierende Zufallsgenerator ist ranmar.c. Sie ist eine Übersetzung
von Jim Butler in Ithaca College aus der Fortran-Routine ranmar.f von Florida State University [Marsaglia und
Zaman, 1987]. Der Zufallsgenerator verfüge über 900 Millionen verschiedene Sequenzen mit einer Periode von
1030. Zitat aus den Fortran-Quellcoden: This is the best known random number generator available. (However, a
newly discovered technique can yield a period of 10600. But that is still in the development stage.) It passes all of
the tests for random number generators and has a period of 2144, is completely portable (gives bit identical results
on all machines with at least 24-bit mantissas in the floating point representation).“ Zur Formung der Gaußschen
Dichte beutzten wir eine Variante der Polarform der Box-Muller-Transformation [Box et al., 1958] [Knuth, 1981,
1969, p. 117] mit der Grundform:
y1= cos(2πx1)p2 ln(x2)
y2= sin(2πx1)p2 ln(x2),
wobei x1, x2[0,1] gleich verteilt seien, und y1, y2N(0,1).
112[Conway und Sloane, 1993, 1999] [Le Lionnais, 1984, p. 58] [Peterson, 1988, pp. 96–101]
4.4. AFFINITÄTSTEST
87
(a) (b)
Abbildung 4.6: Affinitätsprüfung: Experimentsumgebung. Aufbau des Experiments zur Prüfung der
Affinität zwischen den manuell eingestellten Orientierungen eines auf dem Stativ montierten Krei-
ses (a) und den geschätzten Orientierungen unserer Verfahren durch den Stereo-Kamerakopf (b).
Cf. Abb. 4.7 auf S. 87, Abb. 4.8 auf S. 89, Abb. 4.9 auf S. 90, Abb. 4.10 auf S. 91 und Abb. 4.11
auf S. 91.
Abbildung 4.7: Affinitätsprüfung: Ellipse und Orientierungsschätzung. Affinitätsprüfung mit dem
Aufbau in Abb. 4.6 auf S. 87. Die Orientierung des Objektes in dieser Beispiel-Szene liegt bereits
außerhalb des erlaubten Orientierung des Stereoverfahrens. Daher werden die definierten Vektoren
spärlich besetzt und mit größeren Fehlern versehen. Die Daten sind via Abb. 4.8 auf S. 89 in Abb. 4.9
auf S. 90, Abb. 4.10 auf S. 91 und Abb. 4.11 auf S. 91 evaluiert.
88
KAPITEL 4. HYPERKREIS
so einfach wie möglich eingerichtet, daß die Szene möglichst störungsfrei durch das Stereo-
verfahren [Trapp, 1998] und unsere Algorithmen verarbeitet werden konnte. Typische Aus-
gaben des Shell-Scripts pose.sh, die unsere C-Programme 113 Netpbm und Gnuplot
aufruft, werden teilweise in Abb. 4.7 auf S. 87 und Abb. 4.8 auf S. 89 wiedergeben.
Das Experiment (Cf. Abb. 4.6 auf S. 87) wurde durch 21 verschiedene Einstellungen
des Winkels von 0bis 45am Stativ durchgeführt. Im Verlauf des Experiments wurde jede
aufgenommene Szene durch das Shell-Script pose und seine Ausgaben in Abb. 4.7 auf
S. 87 und Abb. 4.8 auf S. 89 u. a. online kontrolliert. Die „Vergenz“ der beiden Kameras
fürs Stereoverfahren [Trapp, 1998] wurde nicht bei jeder Szene neu eingestellt. Wegen der
Vergenz und mechanischer Probleme am Kamerakopf wurden nicht alle Szenen direkt in
die Evaluierungsmenge aufgenommen, sondern eine Szene wurde wiederholt aufgenommen
und evaluiert, wenn Absurditäten in Abb. 4.7 auf S. 87 und Abb. 4.8 auf S. 89 zu erkennen
waren.
Die geschätzten Posen des Kreises und die Zentren sind gegen Drehung des Objektes
am Stativ in Abb. 4.9 auf S. 90-(a) animiert. Die Animation stellt eine bedeutende Übersicht
zur Diagnose des Experiments zur Verfügung. Zur Evaluierung der Daten wird die Affinität
zwischen unseren Schätzungen und den Einstellungen am Stativ durch lineare Regression
in Abb. 4.9 auf S. 90-(b) untersucht. Es sei darauf hingewiesen, daß eine orthogonale Re-
gression in diesem Fall theoretisch ungeeignet ist, da sich die Fehler eher in den geschätzten
Posen als in den eingestellten Winkeln befinden. Wichtige Punkte in der Evaluierung sowie
Interpretation der Ergebnisse durch lineare Regression fassen wir wie folgt zusammen:
Affinität statt Linearität;
Algebraische statt geometrische Distanz;
Fixiering der Steigung zur Identität.
Um die Konsistenz unter verschiedenen „Auflösungen“ zu prüfen, werden alle Daten par-
alle in Abb. 4.9 auf S. 90, Abb. 4.10 auf S. 91 und Abb. 4.11 auf S. 91 dargestellt. Die
Feststellung, daß die niedrigeren „Auflösungen“ bzw. stärkeren Unterabtastungen im Ste-
reoverfahren schwächere Sicherheit in der Pose-Schätzung ergeben, ist äußerst wichtig, ob-
gleich solche trivial zu sein scheint. Wir erhalten in Abb. 4.9 auf S. 90-(b) jeweils ein RMS-
Residuum von 0.3386,0.5192, und 1.0533zur erwünschten Affinität der geschätz-
ten und eingestellten Orientierung des Objekts. Über die Einzelheiten der Regression wird
in Abb. 4.9 auf S. 90 kommentiert. Die gleichen Daten von Abb. 4.9 auf S. 90-(b) sowie
geschätzten Radii aller Unterabtastungsfaktoren sind in Abb. 4.10 auf S. 91-(a) überlagert
dargestellt. In Abb. 4.11 auf S. 91 demonstrieren wir die Robustheit unserer geometrischen
Filterung (Cf. § 4.1 ab S. 77).
113pose.sh:kdf2pnm.c,pgmroi.c,pfm2ppm.c,pgmcanny.c,pgmpix.c,pfmpix.c,
pgmlink.c,kalmell.c,ellfilt.c,lst2pgm.c,phoenix3.c,curvfilt.c,hyper.c,
g3data.c,pfmgamma.c,asc2pgm.c,
4.4. AFFINITÄTSTEST
89
Zentrum: [282.811 6.28918 -1725.69], Radius: 174.878 mm,
Yaw: 59.1074, Pitch: -4.18782, RMS-Residuum: 1.14858 mm, Unsicherheit: 0.752577
Robust-Geschätztung des Kreises aus der Punktmenge Alle definierten Vektoren in der Tiefenkarte
Raw Pointset Estimated Circle from Outlier−Filtered Pointset
Center: 282.8111554293 6.2891895925 −1725.6876575706 radius: 174.8784262497
yaw = 59.1073865229750, pitch = −4.1878160802734
rms err: 1.14857541, uncertainty: 0.752577
Center: 272.4681013265 10.4294468356 −1738.3123529747 radius: 166.9492
yaw: 63.0081557637623 (degrees) pitch: −5.6777400551296 (degrees)
raw range data
filtered range
estimated circle
180 200 220 240 260 280 300 320 340 360
x(mm) −200
−150
−100
−50
050 100150200
y(mm)
−1900
−1850
−1800
−1750
−1700
−1650
−1600
−1550
z(mm)
All Raw Range Data Filtered Range Data Estimated Circle
raw range data
filtered range
estimated circle
50 100 150 200 250 300 350 400 450 500
x(mm) −250
−200
−150
−100
−50
050100
150
200
250
y(mm)
−1900
−1850
−1800
−1750
−1700
−1650
−1600
−1550
z(mm)
Abbildung 4.8: Kreislokalisierung in kritischer Lage mit dem Aufbau in Abb. 4.6 auf S. 87. Die Pose-
Estimation bezieht sich auf die Szene der Affinitätsprüfung in Abb. 4.7 auf S. 87, wobei das Ste-
reoverfahren mit Absicht durch einen Winkel von 60am Stativ überfordert wird, um mehr Fehler
produzieren zu können. Trotz der unheimlich starken Störungen in den Tiefenvektoren gewinnen wir
eine Unsicherheit der Orientierungsschätzung von 0.752577 Grad. Dies demonstriert die Robust-
heit unseres Verfahrens. Dies bedeutet auch, daß das Stereoverfahren [Trapp, 1998] trotz der ver-
stärkten Fehler auch weit außerhalb der angegebenen Grenze ziemlich konsistente, sogar brauchbare,
Daten liefert. Fehler-Unterdrückung sollte günstigerweise im Stereoverfahren eingebaut werden müs-
sen. (Da die Stereo-Messungen [Trapp, 1998] durch 32-bit IEEE-754-Single-Precision [IEEE, 1985]
[Goldberg, 1991, p. 193] in Khoros-Float-Format gegeben sind, werden hier die Ergebnisse in maxi-
mal 8Dezimalstellen ausgedruckt, obgleich die Daten intern in mindestens 64-bit-double verarbeitet
worden sind.)
90
KAPITEL 4. HYPERKREIS
Unterabtastungsfaktor 1Vertikales RMS-Residuum 0.3386 Grad
Unterabtastungsfaktor 2Vertikales RMS-Residuum 0.5192 Grad
Unterabtastungsfaktor 4Vertikales RMS-Residuum 1.0533 Grad
(a) (b)
Abbildung 4.9: Affinitätsprüfung mit dem Aufbau in Abb. 4.6 auf S. 87. In der linken Spalte (a) wird
der geschätzte Kreis und sein Zentrum in allen ausgeführten Orientierungen animiert. Dies beliefert
uns mit einer wichtigen Übersicht zur makroskopischen Diagnose in der Entwicklung. In der rechten
Spalte (b) werden die geschätzen Orientierungen der Kreise (y) gegen die am Stativ manuell ein-
gestellten Winkeln (x) gezeichnet. Nota bene: Wir dürfen hier keinen Anspruch auf eine Linearität
stellen, sondern eine Affinität. Daher wird eine Gerade y=ax +bder kleinsten Quadrate über alge-
braische bzw. vertikale Distanz (lsline2.c -e) berechnet. In [Büker et al., 1999] haben wir zwar
die Steigung afreigelassen, dies hätte wir auf 1einschränken müssen. Hier in der rechten Spalte wird
y= 1 ·x+bin der Regression verwendet (lsline2.c -1). Orthogonale Distanz wurde nicht
verwendet, weil sich die Fehler meist in ykonzentrieren.
4.4. AFFINITÄTSTEST
91
Pose-Schätzungen in allen Unterabtastungen. Radius-Schätzungen in allen Unterabtastungen.
(a) (b)
Abbildung 4.10: Affinitätsprüfung mit dem Aufbau in Abb. 4.6 auf S. 87. (a) Die drei „Auflösungs-
stufen“ von den geschätzen Orientierungen (y) der Kreise gegen die manuell eingestellten Winkeln
(x) aus Abb. 4.9 auf S. 90 werden überlagert geplottet, um die Konsistenz aller Unterabtastungsraten
zu überprüfen. (b) Schätzungen der Radii in drei „Auflösungsebenen“ werden überlagert dargestellt.
Die Schwäche der stärkeren Unterabtastung (blau) wird in den beiden verdeutlicht.
RMS-Residuen der nicht-gefilterten Daten RMS-Residuen der geometrisch gefilterten Daten
(a) (b)
Abbildung 4.11: Affinitätsprüfung mit dem Aufbau in Abb. 4.6 auf S. 87. Diese Abbildung verdeut-
licht die Effektivität der Fehlerunterdrückung unserer nicht-linearen, geometrischen Filterung. Alle
drei „Unterabtastungen“ sind jeweils in einem Plot überlagert gezeichnet. Im linken Plot (a) werden
die RMS-Fehler der Orientierung ohne Ausreißerdetektion der Punktmenge in verschiedenen Orien-
tierungen dargestellt. Im rechten Plot (b)werden die Gleichen mit geometrischer Filterung wiederholt.
Da unsere geometrische Filterung nichts anderes getan hat als bloß die als „Ausreißer“ identifizier-
ten Vektoren aus der Tiefenkarte ausgeschlossen hat, läßt sich feststellen, daß die Hauptquelle der
unterdrückten Fehler in der Tiefenkarte liegt. Cf. Abb. 1.1 auf S. 2 und curvfilt.c. Allerdings
ist diese nicht-lineare Filterung zur Zeit ad hoc und nur anwendbar bei einer dreidimensionalen, ge-
ordneten Punktmange. Dennoch führt dies insgesamt zu einer robusten Modellierung [Brown, 1982]
[Rousseeuw, 1984] [Rousseeuw, 1987].
92
KAPITEL 4. HYPERKREIS
Kapitel 5
Ausblick
Hyperkreis. Wir haben den geometrischen Begriff eingeführt, um einen üblichen Kreis
im dreidimensionalen Raum zu modellieren. Dies wäre zwar nicht notwendig gewesen, er-
möglicht aber Explorationen der Datengeometrie in höheren Dimensionen. Mit Datengeo-
metrie meinen wir die gegenseitigen geometrischen bzw. algebraischen Verhältnisse der Da-
ten. Besonders schwierig wird Einsichte in die Daten zu gewinnen. In der Industrie ist die
Auswertung hoch dimensionaler Daten immer häufiger eine wichtige Fragestellung. Man
spricht also von „data mining“. Eine ausschlaggebende Aufgabe von „Data mining“ ist
meiner Auffassung nach, die tief verborgenen Strukturen in den Daten zu erkennen und
auszugraben. Was heißt erkennen? und wozu? „Erkennen“ muß notwendigerweise wieder-
erkennen“ heißen. Das ist eine Identifizierung von etwas Fremden mit etwas bereits Be-
kannten. Wir erkennen eine Ebene vielleicht, weil sie etwa optisch oder tastsinnig „flach“
wahrzunehmen ist. Näher betrachtet, wir identifizieren sie mit einem bereits wohl definier-
ten geometrischen Gebilde, an dem all die bekannten Werkzeuge einzusetzen sind. Wir
freuen uns, eine Kugel wiederzuerkennen, nicht nur, weil sie mit unseren schönen Gefühlen
sehr verbunden ist, sondern auch, weil sie bereits so gründlich erforscht worden ist, so daß
wir bereit sind, uns damit auseinanderzusetzten, falls ein Problem entsteht.
Kugel und Ebene sind „wichtige“ geometrische Primitive. Schneiden wir die Kugelober-
fläche mit einer Ebene, so entsteht ein weiteres „wichtiges“ Gebilde, ein Kreis. Hypersphäre
und Hyperebene sind ebenso bekannte und „wichtige“ geometrische Primitive. Schneiden
wir nun die Hypersphäre mit einer Hyperebene, so entsteht ein weiteres Primitiv, das keinen
Namen besitzt. Wir haben „Hyperkreis“ vorgeschlagen. Die Verallgemeinerung von einem
Kreis auf einen Hyperkreis soll ebenso „wichtig“ sein, wie die von Ebene und Sphäre auf
Hyperebene und Hypersphäre. Diese Parallelität ist auch in Kapitel 2 (S. 5) mit den Projek-
toren und Reflektoren angeführt.
Schauen wir uns genauer um, so sehen wir, es ist überhaupt sehr schwierig, den Kreisen
in unserem Alltag einen Augenblick zu entfliehen 114. Warum sind die Kreise ubiquitär?
Weil sie einfach zu produzieren sind? Weil sie schön sind? Oder weil sie praktisch sind?
Der nächste Mann am Tisch antwortete mir auf diese Frage, weil sie „natürlich“, „bequem“,
„harmonisch“, „symbolisch“, „allerwichtigste Form“ seien und „keinen Anfang, kein Ende“
hätten. Ich würde sagen, der Kreis kann auch „poetisch“ sein:
114Nein, das ist in der Wüste oder im Meer kaum einfacher.
93
94
KAPITEL 5. AUSBLICK
Fortunae rota volvitur: descendo minoratus;
alter in altum tollitur; nimis exaltatus
Rex sedet in vertice caveat ruinam!
nam sub axe legimus Hecubam reginam.
aus Carmina Burana
Vielmehr kümmern wir uns um die Existenz gewisser Apriorität. Die „Wichtigkeit“ des
Kreises ist in der Tat nicht nur an dem Gefühle gebunden, sondern auch an der algebrai-
schen „Einfachheit“ und den mechanischen Eigenschaften sowie physikalischen Gesetzen
a priori, so daß er durch einen klitzekleinen Zufall in der Natur und in der Wissenschaft ent-
stehen kann. Die Carmina Burana haben uns daran erinnert, daß ein Kreis auch durch eine
Drehung entsteht. Eine Drehung in SO(n)ist eine apriorische Existenz. Hier werden jedoch
die Spezialorthogonalen Gruppen nicht auf Dimension 3eingeschränkt. Und nachdem ich
dem Mann über einen Hyperkreis aufgeklärt habe, fragte er
Kommt er oft vor?
Dies ist gerade die Frage, die uns beschäftigt hat. Nach all diesen Besinnungen, werden wir
darauf erst einmal „umgehend“
Warum nicht?
erwidern. Wir „sehen“ sie nämlich nur nicht. Daher haben wir in Abb. 2.6–(b) auf S. 51 ver-
sucht, einen Hyperkreis im 4-dimensionalen Raum zu visualisieren. Einige Eigenschaften
eines Hyperkreises haben wir in Kapitel 2 (S. 5) vorgestellt. Und da wir doch befürchteten,
daß sie nicht vorkommen würden, haben wir einen Algorithmus (ghyper.c) zur Generie-
rung eines Hyperkreises präsentiert. Die erzeugten Zufallsabtastungen sind wiederum durch
einen anderen Algorithmus (hyper.c) parametrisch als Hyperkreis zu modellieren. Sie-
he auch [Chen et al., 2000]. Ein Hyperkreis sollte nun „realistisch“ genug sein. Dennoch,
für Anwendungen müssen wir Beispiele in der Natur und Wissenschaft finden, trotz der
Überzeugung, daß sie beispielsweise durch Interaktionen von Hypersphären und Hyperebe-
nen oder Drehungen in höheren Dimensionen oft vorkommen sollten. Die Untersuchung,
die wir geleistet haben, ist keinesfalls genügend. Die topologischen Zusammenhänge mit
einem Torus müssen beispielsweise geklärt werden. Wir sind auch deswegen unzufrieden,
weil eine Drehung niemals zum Vorschein gebracht worden ist, obwohl der Inbegriff wie
ein Geist in der ganzen Arbeit durchdringend und allgegenwärtig ist.
Nicht-Orthogonale Raumzerlegung zur Schätzung des Rauschunterraums. In Ka-
pitel 4 (S. 77) haben wir die Daten auf eine Hyperebene schief projiziert, wobei der 1-
dimensionale Kern des Projektors der Z-Achse des Kamerakopfes parallel gewählt worden
ist, weil sich die Rauschenleistung empirisch in diesesr Richtung konzentriert ist. Wie wäre
es, wenn diese Richtung unbekannt ist? Ein Teilproblem davon kann vereinfacht folgender-
maßen paraphrasiert werden.
Gegeben seien mPunkte im n-dimensionalen Raum, ARm×n,mn.
Es ist möglich, daß alle Punkte (Zeilenvektoren in A) exakt entweder auf dem
1-dimensionalen Raum Xoder auf seinem (n1)-dimensionalen komplemen-
tären Raum Yliegen, wobei Ynicht orthogonal sein muß zu X. Siehe Abb. 5.1
95
auf S. 95. Da alle Information über die die komplementären Teilräume Xund
Yin Aenthalten ist, soll Xund Yaus Aalleine bestimmt werden. Dabei wird
angenommen, daß die Zeilenvekoren in Adie Räume Xund Y„hinreichend“
aufspannen. Weil Xund Ykomplementäre Unterräume sind, ist das Problem
äquivalent zu dem, den Projektor PY,Xauf den Teilraum Yentlang des Teil-
raumes Xzu schätzen.
Non−Orthogonal Space−Splitting Problem
−15 −10 −5 0510
x(mm) −15
−10
−5
0
5
10
15
20
y(mm)
−4
−2
0
2
4
6
8
10
12
z(mm)
Non−Orthogonal Space−Splitting Problem
−12 −9 −6 −3 0 3 6 9 12 15 18
y(mm)
−4
−2
0
2
4
6
8
10
12
z(mm)
Abbildung 5.1: Nicht-Orthogonale Raumzerlegung zur Schätzung des Rauschunterraums. Gegeben
seien mPunkte im n-dimensionalen Raum, ARm×n, m n. Die mPunkte spannen hinreichend
einen 1-dimensionalen Raum Xund einen (n1)-dimensionalen komplementären Raum Yauf.
Gesucht wird der schiefe Projektor PY,X. Dies soll auf r- und (nr)-dimensionale (r < n) kom-
plementäre Teilräume erweitert werden. Cf. [Afriat, 1957] [Davis, 1958] (im Hilbert-Raum) [Afriat
et al., 1975] [Davis und Kahan, 1970] [Kovarik, 1977] (im Banach-Raum).
Darüber hinaus wäre eine „natürliche“ Basis für Abzw. die Daten dieselben für Xund
Y. Eine orthogonale Basis wäre in diesem Fall nicht sinnvoller als eine nicht-orthogonale
Basis wie dieselben für Xund Y. Das Problem soll auf komplementäre Teilräume Xmit
Dimension r < n und Ymit Dimension nrerweitert werden, wobei Xund Yständen
nicht unbedingt orthogonal zu einander.
Datenzentrierung als orthogonale Projektion. In § 2.4.1 ab S. 29 haben wir uns mit
dem Problem der Datenzentrierung auseinandergesetzt. Das Datenzentrieren wird extrem
oft geübt aber kaum formal angesprochen, sehr wahrscheinlich deswegen, weil es nicht-li-
near ist. Ohne Linearität sind wir sehr behindert. Aber auch bloß die Affinität macht einen
ausdruck wie ZmAzu einem wie (Im(1/m)11)Aaus Gl. (2.42) auf S. 32. Mit der
Einführung von AC-Teilraum und DC-Teilraum haben wir das Zentrieren in der anderen
Dimension als orthogonaler Projektor formulieren können. Dies kann als eine Art Lineari-
sierung des Problems angesehen werden und wird viel mehr algebraischen Ausdrücke ver-
einfachen oder komplizierte Zusammenhänge veranschaulichen. Wie wir im Lemma 2.4.23
auf S. 52 vorgeführt haben, so würden wir z. B. aber auch über die Bestimmung des Ranges
einer Kovarianzmatrix oder die affine Projektion in § 4.3 ab S. 83 noch mehr leisten können.
96
KAPITEL 5. AUSBLICK
Literaturverzeichnis
E. A. Abbott. Flatland: a romance of many dimensions / with ill. by the author, A square.
Dover, New York, 6 edition, 1952. P41TBX1363(6) (v. et. Rucker [Rucker, 1986] and
[Abbott und Buck, 1990] for German translation).
E. A. Abbott und P. Buck. Flächenland. Reprinta historica didactica; 5. Franzbecker, Bad
Salzdetfurth, 1990. P03K1036 (see [Abbott, 1952] for original edition).
E. H. Adelson und J. R. Bergen. Spatiotemporal energy models for the perception of
motion. Journal of the Optical Society of America A, 2(2):284–299, 1985.
S. N. Afriat. Orthogonal and oblique projectors and the characteristics of pairs of vector
spaces. Proceedings of the Cambridge Philosophical Society, 53:800–816, 1957. cited in
[Afriat et al., 1975] [Ipsen und Meyer, 1995] [Davis und Kahan, 1970];.
S. N. Afriat, M. V. R. Sastry, und G. Tintner. Studies in Correlation: Multivariate Analysis
and Econometrics. Angewandte Statistik und Ökonometrie; 1. Vandenhoeck & Ruprecht,
Göttingen, 1975. P41TKO1089.
G. J. Agin. Fitting ellipses and general second-order curves. In CMU-RI-TR, 1981.
A. S. Aguado, M. E. Montiel, und M. S. Nixon. On using directional information for
parameter space decomposition in ellipse detection. Pattern Recognition, 29(3):369–381,
1996.
A. Albert. Regression and the Moore Penrose pseudoinverse. Mathematics in science and
engineering; 94. Academic Press, New York, 1972. P41TKK1445.
S. L. Altmann. Rotations, Quaternions and Double Groups. Oxford Science Publicati-
ons. Clarendon Press, Oxford, 1986. P41TEX1747 (v. et. [Du Val, 1964] [Coxeter, 1973]
recommended by Pertti Lounesto).
B. W. Andrews und D. A. Pollen. Relationship between spatial frequency selectivity and
receptive field profile of simple cells. Journal of Physiology (London), 287:163–176, 1979.
cited in [Daugman, 1985].
K. S. Arun, T. S. Huang, und S. D. Blostein. Least-squares fitting of two 3-d point sets.
IEEE Transactions on Pattern Analysis and Machine Intelligence, 9(5):698–700, 1987.
cited in [Umeyama, 1991].
L. Autonne. Sur les groupes linéaires, réels et orthogonaux. Bulletin de la Société Ma-
thématique de France, 30:121–134, 1902. cited in [Ben-Israel und Greville, 1974, p. 242]
[Munthe-Kaas et al., 2001].
97
98
LITERATURVERZEICHNIS
S. Axler. Down mit determinants! American Mathematical Monthly, 102:139–154, 1995.
(collected in [Carlson et al., 1997]).
T. F. Banchoff. Beyond the Third Dimension: Geometry, Computer, Graphics, and Higher
Dimensions. Scientific American Library; 33. Scientific American Library, New York,
1990. P41TBW1677 (cites [Abbott, 1952] in pp. 2–3).
S. Barnett. Matrices in control theory: with applications to linear programming. Van
Nostrand Reinhold, London, 1971. P41TIQ1439+1 (ausgeschieden: 2812; 24.4.2001, 2
DM) cites [Ben-Israel und Charnes, 1963].
T. S. Baskett und I. J. Katz. Theorems on products of epr matrices. Linear Algebra Appl.,
2:87–103, 1969. (cited in [Koliha, 1999]; v. et. [Hartwig und Katz, 1997]).
M. Bastiaans. Gabor’s expansion of a signal into gaussian elementary signals. Proceedings
of the IEEE, 68:538–539, 1980. cited in [Daugman, 1988].
E. Beltrami. Sulle funzioni bilineari. Giornale di Matematiche ad Uso degli Studenti Delle
Universita, 11:98–106, 1873. An English translation by D. Boley is available as University
of Minnesota, Department of Computer Science, Technical Report 90–37, 1990.
A. Ben-Israel und A. Charnes. Contributions to the theory of generalized inverses. SIAM
journal of Appl. Math., 11:667–699, 1963. (cited in [Barnett, 1971, p. 130]).
A. Ben-Israel und T. N. E. Greville. Generalized Inverses: Theory and Applications. A
Wiley-Interscience publication. John Wiley & Sons, New York, 1974. P41TJU1027 (cited
in [Kuhnert, 1976, p. 23]); v. et. [Boullion und Odell, 1971] [Campbell und Meyer, 1991];
cites [Halmos, 1958]; [Ben-Israel und Greville, 1976]; cites [Cline, 1968]; cites [Schmidt,
1907a,b] [Autonne, 1902] [Eckart und Young, 1936, 1939]).
A. Ben-Israel und T. N. E. Greville. Some topics in generalized inverses of matrices.
In M. Z. Nashed, editor, Generalized Inverses and Applications, Publication of the Ma-
thematics Research Center, The University of Wisconsin, Madison; 32, pages 125–147.
Academic Press, New York, 1976. P41TJV1080 (cites [Ben-Israel und Greville, 1974]).
P. G. Bergman, R. Penfield, R. Schiller, und H. Zatkis. The Hamiltonian of the general
theory of relativity with electromagnetic field. Physical Review, 52:1950, 1950. cited in
[Stewart und Sun, 1990, pp. 108–109].
M. W. Berry, S. T. Dumais, und G. W. O’Brien. Using linear algebra for intelligent infor-
mation retrieval. SIAM Review, 37(4):573–595, 1994a. (v. et. [Berry et al., 1994b] [Furnas
et al., 1988]); cited in [Husbands et al., 2000].
M. W. Berry, S. T. Dumais, und G. W. O’Brien. Using linear algebra for intelligent in-
formation retrieval. Technical Report UT-CS-94-270, Department of Computer Science,
University of Tennessee, Knoxville, 1994b. v. et. [Berry et al., 1994a].
J. Bhattacharya und P. P. Kanjilal. On the detection of deterinism in a time series. Physica
D, 132:100–110, 1999.
P. O. Bishop, J. S. Coombs, und G. H. Henry. Receptive fields of simple cells in the
cat striate cortex. Journal of Physiology (London), 231:31–60, 1973. cited in [Marcelja,
1980].
LITERATURVERZEICHNIS
99
A. Bjerhammer. Applications of calculus of matrices to method of least squares; with
special references to geodetic calculations. Trans. Roy. Inst. Tech. Stockholm, 49:1–86,
1951a. (cited in [Kuhnert, 1976, p. 16]).
A. Bjerhammer. Rectangular reciprocal matrices with special reference to geodetic calcu-
lations. Bulletin Géodésique, 52:188–220, 1951b. cited in [Kuhnert, 1976, p. 16] [Stewart
und Sun, 1990, pp. 108–109]).
A. Bjerhammer. Theory of errors and generalized matrix inverse. Scientific Publishing
Company, Amsterdam-London-New York, 1973. (cited in [Kuhnert, 1976, p. 23]).
Å. Björck und G. H. Golub. Numerical methods for computing angles between linear
subspaces. Math. Comp., 27:579–594, 1973. Cited in [Golub und Van Loan, 1983, p. 431].
F. L. Bookstein. Fitting conic sections to scattered data. Computer Vision, Graphics and
Image Processing, 9:56–71, 1979. cited in [Chaudhuri und Kundu, 1993] [Karl et al.,
1994] [Gander et al., 1994a].
T. L. Boullion und P. L. Odell. Generalized Inverse Matrices. John Wiley & Sons, New
York, 1971. P41TDQ1918 (cited in [Kuhnert, 1976, p. 23]; v. et. [Ben-Israel und Greville,
1974] [Campbell und Meyer, 1991])).
A. C. Bovik, M. Clark, und W. S. Geisler. Multichannel texture analysis using localized
spatial filters. IEEE Transactions on Pattern Analysis and Machine Intelligence, 12(1):
55–73, 1990. P50/88i61 copied 970072950.
G. E. P. Box, M. E. Muller, und G. Marsaglia. A note on the generation of random normal
deviates. Annals Math. Stat., 29:610–611, 1958. (cited for polar method in Knuth [Knuth,
1981, 1969, p. 117]; v. et. Boeing Scientific Res. Lab. report D1-82-0203 (1962)).
R. N. Bracewell. The Fourier Transform and its Applications. McGraw-Hill electrical
and electronic engineering series. McGraw-Hill, New York, 2 edition, 1987. P41TIR1353,
P41TIR1353(2)-1+4.
G. W. Brown. Random points on n-dimensional sphere. In E. F. Beckenbach, editor,
Modern Mathematics for the Engineer, First Series, page 302. McGraw-Hill, New York,
1956. (cited in [Knuth, 1981, 1969, pp. 130–131]).
M. L. Brown. Robust line estimation with errors in both variables. Journal of the American
Statistical Association, 77:71–79, 1982. cited in [Rousseeuw, 1987].
U. Büker, S. Drüe, N. Götze, G. Hartmann, R. Stemmer, und R. Trapp. Aktive Objekter-
kennung und -vermessung zur Steuerung eines Demontageroboters. Künstliche Intelligenz
im Rahmen des BMBF Projektes, 1/99:25–30, 1999. (Diese Arbeit wurde im Rahmen des
BMBF Projektes 01 IN 506 B 2 DEMON gefördert.).
T. Bülow, D. Pallek, und G. Sommer. Riesz transforms for the isotropic estimation of the
local phase and moiré interferograms. In G. Sommer, N. Krüger, und C. Perwass, editors,
Mustererkennung 2000, 22. DAGM-Symposium, Kiel, 13.-15. September 2000, Procee-
dings, Informatik Aktuell, pages 333–340. Springer, 2000. cites [Hahn, 1992].
J. R. Bunch und C. P. Nielsen. Updating the singular value decomposition. Numerische
Mathematik, 31:111–129, 1978. cited in [Stewart, 1990] [Stewart, 1992c].
100
LITERATURVERZEICHNIS
J. Cabrera und P. Meer. Unbiased estimation of ellipses by bootstrapping. IEEE Transac-
tions on Pattern Analysis and Machine Intelligence, 18(7):752–756, 1996.
S. L. Campbell. Recent Applications of Generalized Inverses. Research notes in mathe-
matics; 66. Pitman, London, 1982. P40TAY3023 (v. et. [Campbell und Meyer, 1979]).
S. L. Campbell und C. D. Meyer. Continuity properties of the Drazin pseudoinverse. Line-
ar Algebra and Its Applications, 10:77–83, 1975. P4061l11, 1.1968 - 274.1998 Magazin
(cites [Stewart, 1969] [Greville, 1967] [Meyer, 1974]).
S. L. Campbell und C. D. Meyer. Generalized Inverses of Linear Transformations. Surveys
and reference works in mathematics; 4. Pitman, London, 1979. P65TDQ3041+2 (ausge-
schieden: 9381; 24.4.2001, 2 DM) (newest edition is [Campbell und Meyer, 1991]; cited in
[Ipsen und Meyer, 1998] [Higham und Knight, 1993]; cites [Drazin, 1958], [Gauß, 1809];
v. et. [Campbell, 1982] [Boullion und Odell, 1971] [Ben-Israel und Greville, 1974]).
S. L. Campbell und C. D. Meyer. Generalized Inverses of Linear Transformations. Dover
Publications, New York, 1991. cited in [Ipsen und Meyer, 1995]; (This edition is not found
in UBPB; v. et. the older version [Campbell und Meyer, 1979] and [Campbell, 1982]; citing
[Drazin, 1958], [Gauß, 1809]; v. et. [Boullion und Odell, 1971] [Ben-Israel und Greville,
1974]).
J. F. Canny. Finding edges and lines in images. Master’s thesis, MIT AI Lab., 1983.
avalable as technical report TR-720; v. et. [Canny, 1986].
J. F. Canny. A computational approach to edge detection. IEEE Transactions on Pattern
Analysis and Machine Intelligence, 8(6):679–698, 1986. cited in [Nalwa und Binford,
1986] [Venkatesh und Rosin, 1995]; v. et. [Canny, 1983], [Deriche, 1993], pgmcanny.c;
cf. [Marr und Hildreth, 1980] [Shen und Castan, 1992].
D. Carlson, C. R. Johnson, D. C. Lay, und A. D. Porter, editors. Resources for Teaching
Linear Algebra, volume 42 of MAA Notes. American Mathematical Society, Ann Watkins,
and William Watkins., 1997. v. et. [Cowen, 1997] [Axler, 1995] [Maron und Maron, 1993].
B. B. Chaudhuri. Optimal circular fit to objects in two and three dimensions. Pattern
Recognition Letters, 11(8):571–574, 1990.
B. B. Chaudhuri und P. Kundu. Optimum circular fit to weighted data in multi-dimensional
space. Pattern Recognition Letters, 14(1):1–6, 1993. (cites [Bookstein, 1979], [Landau,
1987], [Thomas und Chan, 1989], [Chaudhuri, 1990]).
B. B. Chaudhuri und G. P. Samanta. Elliptic fit of objects in two and three dimensions by
moment of inertia optimization. Pattern Recognition Letters, 12:1–7, 1991. (cited by [Karl
et al., 1994]).
N.-S. Chen. A collection of 450 annotated test matrices in ASCII files. (These files are
constantly being updated.), 1998.
N.-S. Chen. Notes on angles between subspaces. (These notes contains notes and a rare
collections of literature discussing the distance, angles between subspaces.), 2001.
N.-S. Chen, G. Hartmann, und S. Drüe. Circle location from intensity and range data using
the singular value decomposition. In Proceedings of the 15th International Conference on
Pateern Recognition ICPR’2000, volume III, pages Vol III: 782–785, 2000.
LITERATURVERZEICHNIS
101
R. E. Cline. Inverses of rank invariant powers of a matrix. SIAM J. Numer. Anal., 5:
182–197, 1968. (cited in [Ben-Israel und Greville, 1974, p. 169]).
R. E. Cline. Elements of the Theory of Generalized Inverses for Matrices. The UMAP ex-
pository monograph series. Education Development Center, Newton, Mass., 1979. (citing
[Halmos, 1958], [Drazin, 1958]; v. et. [Cline und Greville, 1980]).
R. E. Cline und T. N. E. Greville. A Drazin inverse for rectangular matrices. j-LINEAR-
ALGEBRA-APPL, 29:53–62, 1980. (v. et. [Cline, 1979]).
F. W. Compbell, G. F. Cooper, und C. Enroth-Cugel. The spatial selectivity of the visual
cells of the cat. Journal of Physiology London, 203:223–235, 1969. cited in [Marcelja,
1980].
F. W. Compbell und J. G. Robson. Application of fourier analysis to the visibility of
grating. Journal of Physiology London, 197:551–566, 1968. cited in [Marcelja, 1980].
J. H. Conway und N. J. A. Sloane. Sphere Packings, Lattices and Groups. Grund-
lehren der mathematischen Wissenschaften; 290. Springer, New York, 2 edition, 1993.
P41TFH1351(2) v. et. 3rd ed. [Conway und Sloane, 1999] (hypersphere).
J. H. Conway und N. J. A. Sloane. Sphere Packings, Lattices and Groups. Grund-
lehren der mathematischen Wissenschaften; 290. Springer, New York, 3 edition, 1999.
P77TFH1505(3) v. et. 2nd ed. [Conway und Sloane, 1993] (hypersphere).
F. W. Cooper und J. G. Robson. Successive transformation of spatial information in the
visual system. In IEE /NPL Conference on Pattern Recognition, pages 134–143. IEE Conf.
Publ. London 42, 1968. cited in [Marcelja, 1980].
C. C. Cowen. A project on circles in space. In D. Carlson, C. R. Johnson, D. C. Lay,
und A. D. Porter, editors, Resources for Teaching Linear Algebra, pages 59–70. American
Mathematical Society, Washington, 1997. v. et. [Carlson et al., 1997].
H. S. M. Coxeter. Regular Polytopes. Dover Books on Advanced Mathematics. Dover,
New York, 3 edition, 1973. P41TGA1782(3) (v. et. [Du Val, 1964] [Altmann, 1986] re-
commended by Pertti Lounesto).
Y. T. Cui, J. Weng, und H. Reynolds. Estimation of ellipse parameters using optimal
minimum-variance estimator. Pattern Recognition Letters, 17(3):309–316, 1996.
P.-E. Danielsson. Generalized and separable sobel operators. In H. Freeman, editor, Machi-
ne Vision for Three-Dimensional Scenes, pages 376–379. Academic Press, 1990. v. et. [So-
bel, 1990] (not found in UBPB).
J. G. Daugman. Two-dimensional spectral analysis of cortical receptive field profiles.
Vision Research, 20:847–856, 1980.
J. G. Daugman. Uncertainty relation for resolution in space, spatial frequency, and orien-
tation optimized by two-dimensional visual cortical filters. Journal of the Optical Society
of America A, 2(7):1160–1169, 1985. cites [Andrews und Pollen, 1979; Daugman, 1980;
Gábor, 1946; Hubel und Wiesel, 1962, 1974; Marcelja, 1980; Movshon et al., 1978b; Mov-
shon und Tolhurst, 1975; Pollen und Ronner, 1981; Rodieck, 1965], P40/67o3 A copied
970047243.
102
LITERATURVERZEICHNIS
J. G. Daugman. Complete discrete 2-d gabor transforms by neural networks for image ana-
lysis and compression. IEEE Transactions on Acoustics, Speech, and Signal Processing,
36(7):1169–1179, 1988. (invited paper) P50/88i42 copied 970072758.
J. G. Daugman. Entropy reduction and decorrelation in visual coding by oriented neural
receptive fields. IEEE Trans. Biomed. Engin., 36(1), 1989.
C. Davis. Separation of two linear subspaces. Acta Scientiarum Mathematicarum, 19:
172–187, 1958. (Magazin P40/61a5 1958 TOMUS XIX).
C. Davis und W. Kahan. The rotation of eigenvectors by a perturbation. III. SIAM Journal
on Numerical Analysis, 7(1):1–46, 1970. cited in [Kovarik, 1977]; cites [Afriat, 1957]
[Suschowk, 1956 (1957] [Mirsky, 1960] [Zassenhaus, 1964].
B. L. R. De Moor, J. Staar, und J. Vandewalle. Oriented energy and oriented signal-to-noise
ratio concepts in the analysis of vector sequence and time series. In E. F. Deprettere, editor,
SVD and Signal Processing: Algorithms, Applications and Architectures, pages 209–232.
Elsevier Science, Delft, The Netherlands, 1988. (P51YCB3194-1 *** Important! To read
again! ***).
S. C. Deerwester, S. T. Dumais, T. K. Landauer, G. W. Furnas, und R. A. Harshman. Inde-
xing by latent semantic analysis. Journal of the American Society of Information Science,
41(6):391–407, 1990. cited in [Kolenda und Hansen, 1999] [Landauer und Dumais, 1997]
[Husbands et al., 2000].
E. F. Deprettere, editor. SVD and Signal Processing: Algorithms, Applications and Ar-
chitectures, volume 1 of SVD and signal processing; 2. Elsevier Science, Delft, The Net-
herlands, 1988. (P51YCB3194-1) (cited by [van der Veen et al., 1993] [Leach, 1998])
(v. et. [Vaccaro, 1991] [Moonen und De Moor, 1995]).
R. Deriche. Recursively implementing the gaussian and its derivatives. Technical Report
RR-1893, INRIA, 1993. (RR-1893.pdf,RR-1893.ps.gz;v. et. [Monga et al., 1991],
pgmcanny.c,iir.c).
P. Dewilde und E. F. Deprettere. Singular value decomposition: An introduction. In E. F.
Deprettere, editor, SVD and Signal Processing: Algorithms, Applications and Architectu-
res, pages 3–41. Elsevier Science, Delft, The Netherlands, 1988. P51YCB3194-1.
M. P. Drazin. Pseudo-inverse in associative rings and semigroups. American Mathematical
Monthly, 65:506–514, 1958. (cited in [Campbell und Meyer, 1979], [Campbell und Meyer,
1991], [Ipsen und Meyer, 1998] [Cline, 1979, p. 57]).
P. Du Val. Homographies Quaternions and Rotations. Oxford Mathematical Monographs.
Clarendon Press, Oxford, 1964. P49TEN1357 (seel also [Coxeter, 1973] [Altmann, 1986]
recommended by Pertti Lounesto).
A. A. Dubrulle. Work notes on elementary matrices. Technical Report HPL-63-69,
Hewlett-Packward Laboratories, 1996. cited in [Lehoucq, 1996].
B. S. Duran und P. L. Odell. Cluster Analysis: A Survey. Lecture notes in economics and
mathematical systems; 100; Econometrics. Springer, Berlin, 1974. *** P31QGW1393;
v. et. [Mahalanobis, 1930] [Everitt, 1998].
LITERATURVERZEICHNIS
103
C. Eckart und G. Young. The approximation of one matrix by another of lower rank.
Psychometrika, 1:211–218, 1936. cited in [Stewart, 1992b] [Ben-Israel und Greville, 1974,
p. 242]; v. et. [Eckart und Young, 1939].
C. Eckart und G. Young. A principal axis transformation for non-Hermitian matrices.
Bulletin of the American Mathematical Society, 45:118–121, 1939. cited in [Stewart,
1992b] [Ben-Israel und Greville, 1974, p. 242]; v. et. [Eckart und Young, 1936].
A. Edelman. When is x(1/x)6= 1? (Lecture Notes, MIT), 1994.
T. Ellis, A. Abbood, und B. Brillault. Ellipse detection and matching with uncertainty.
Image and Vision Computing, 10:271–276, 1992.
B. S. Everitt. Cluster Analysis. Arnold, London, 3 edition, 1998. *** P41TKO2116(3);
v. et. [Mahalanobis, 1930] [Duran und Odell, 1974].
K. Fan und A. J. Hoffman. Some metric inequalities in the space of matrices. Procee-
dings of the American Mathematical Society, 6:111–116, 1955. cited in [Higham, 1986]
[Stewart, 1992b].
A. E. Fekete. Real Linear Algebra. Monographs and textbooks in pure and applied ma-
thematics; 91. Dekker, New York, 1985. P41TDQ3871.
F. A. Ficken. Linear Transformations and Matrices. Prentice-Hall, New Jersey, 1967.
P41TDQ1560.
D. J. Field. Relations between the statistics of natural images and the response properties
of cortical cells. Journal of The Optical Society of America A, 4(12):2379–2394, 1987.
cited in [Kovesi, 2002].
R. D. Fierro, G. H. Golub, P. C. Hansen, und D. P. O’leary. Regularization by truncated
total least squares. SIAM Journal on Scientific Computing, 18(4):1223–1241, 1997.
A. Fitzgibbon, M. Pilu, und R. Fisher. Direct least-square fitting of ellipses. IEEE Tran-
sactions on Pattern Analysis and Machine Intelligence, 1996. [To be submitted to IEEE
PAMI; Extended version of ICPR’96 and ICIP’96 papers].
L. M. J. Florack. Mathematical techniques for image analysis. 8D020 Course Notes,
Version I.I; cites [Hilbert, 1887, 1890, 1893] [Hadamard, 1902] [Schwartz, 1951, 1966],
2002.
L. M. J. Florack, B. M. ter Haar Romeny, J. J. Koenderink, und M. A. Viergever. Families
of tuned scale-space kernels. In G. Sandini, editor, Proceedings of the European Confe-
rence on Computer Vision May 19–22 1992, pages 19–23, Santa Margherita Ligure, Italy,
1992.
G. E. Forsythe, M. A. Malcom, und C. B. Moler, editors. Computer Methods for Mathe-
matical Computations. Prentice-Hall, N.J., 1977. (P41TDZ1034) cited in [Leach, 1998].
W. Frei und C. Chen. Fast boundary detection: A generalization and a new algorithm. IEEE
Transactions on Computers, C-26(10):988–998, 1977. (cited in [Hall, 1979, pp. 396–402],
[Gonzalez, 1987, pp. 340–347]; v. et. 980767857 for a short description.).
104
LITERATURVERZEICHNIS
G. W. Furnas, S. C. Deerwester, S. T. Dumais, T. K. Landauer, R. A. Harshman, L. A.
Streeter, und K. E. Lochbaum. Information retrieval using a singular value decomposition
model of latent semantic structure. In International Conference on Research and Deve-
lopment in Information Retrieval, pages 465–480, Grenoble, France, 1988. (v. et. [Berry
et al., 1994a]).
D. Gábor. Theory of communication. Journal of the Institute of Electrical Engineers
(London), 93(26):429–457, 1946. cites [Heisenberg, 1927]; v. et. [Ville, 1948]; cited in
[Daugman, 1985, 1988; Marcelja, 1980] [Havlicek et al., 1997].
W. Gander, G. H. Golub, und R. Strebel. Fitting of circles and ellipses, least square solu-
tion. tech-reports-1994 217, Eidgenössische Technische Hochschule Zürich, Department
Informatik, Institut für Wissenschaftliches Rechnen, 1994a. also in [Gander et al., 1994b];
cites [Bookstein, 1979] [Späth, 1986].
W. Gander, G. H. Golub, und R. Strebel. Least-squares fitting of circles and ellipses. BIT,
34(4):558–578, 1994b. P40/64b1; from [Gander et al., 1994a].
C. F. Gauß. Theoria motus corporum coelestium in sectionibus conicis. John Wiley &
Sons, 1809. (see [Gauß, 1963] for engl trans.).
C. F. Gauß. Theory of the motion of the heavenly bodies moving about the sun in conic
sections (Theoria motus corporum coelestium in sectionibus conicis). Dover books on
astronomy and space topics. Dover, New York, 1963. P41VBI1039 (v. et. [Gauß, 1809]).
P. E. Gill, W. Murry, und M. H. Wright. Numerical Linear Algebra and Optimization.
Addison-Wesley, Redwood City, Calif., 1991. P41TKZ1911-1.
I. C. Gohberg und M. G. Krein. Introduction to the Theory of Linear Nonselfadjoint Ope-
rators. Translations of Mathematical Monographs. American Mathematical Society; 18,
Providence, RI, 1969. P41TJS1328 P65TJS1328+2 cited in [Ipsen und Meyer, 1995].
D. Goldberg. What every computer scientist should know about floating-point arithmetic.
ACM Computing Surveys (CSUR), 23(1):5–48, 1991. cites [IEEE, 1985].
G. H. Golub und W. Kahan. Calculating the singular values and pseudo-inverse of a matrix.
SIAM Journal on Numerical Analysis, Ser. B, 2(2):205–224, 1965. cited in [Rust, 1998]
[Golub und Reinsch, 1970a,b].
G. H. Golub, W. Kahan, und F. T. Luk. Computing the singular-value decomposition on
the illiac-iv. CM Transactions on Mathematical Software, 6:524–539, 1980. cited in [Pan
und Hamdi, 1996].
G. H. Golub., V. Klema, und G. W. Stewart. Rank degeneracy and least squares pro-
blems. Technical Report TR-456, Departmant of Computer Science, University of mary-
land, 1976. (cited by [Rust, 1998]).
G. H. Golub und C. Reinsch. Singular value decomposition and least squares solution.
Numerische Mathematik, 14(5):403–420, 1970a. v. et. [Golub und Reinsch, 1970b]; cited
in [Pan und Hamdi, 1996]; cites [Wilkinson, 1965b].
G. H. Golub und C. Reinsch. Singular value decomposition and least squares solution. In
J. H. Wilkinson und C. Reinsch, editors, Linear Algebra vol. II of Handbook for Automatic
Computation, pages 134–151. Springer-Verlag, New York, 1970b. v. et. “the yellow book”
[Golub und Reinsch, 1970a]; cites [Wilkinson, 1965b].
LITERATURVERZEICHNIS
105
G. H. Golub und C. F. Van Loan. An analysis of the total least squares problem. SIAM
Journal on Numerical Analysis, 17:883–893, 1980. P40/61s8, 3.1966- (cited in [Späth,
1986]).
G. H. Golub und C. F. Van Loan. Matrix Computations. The Johns Hopkins University
Press, 1983. (P41TDQ3588) (v. et. [Golub und Van Loan, 1989] [Golub und Van Loan,
1996]; cites [Pearson, 1901] on p. 425; cited in [Leach, 1998] ).
G. H. Golub und C. F. Van Loan. Matrix Computations. Johns Hopkins University Press,
Baltimore, Maryland, 2nd edition, 1989. (v. et. [Golub und Van Loan, 1983] [Golub und
Van Loan, 1996]).
G. H. Golub und C. F. Van Loan. Matrix Computations. The Johns Hopkins University
Press, 3 edition, 1996. (P41TDQ3588(3)) (v. et. [Golub und Van Loan, 1983] [Golub und
Van Loan, 1989]).
R. C. Gonzalez. Digital Image Processing. Addison-Wesley Publishing Company, 2 edi-
tion, 1987. P41TVV1460(2)+2 (cites [Frei und Chen, 1977] in pp. 340–347; [Zhang und
Suen, 1984] [Lee und Chen, 1992]).
A. W. Goodwin, G. H. Henry, und P. O. Bishop. Direction selectivity of simple striate
cells. J. Neurophysiology, 38:1500–1523, 1975. cited in [Marcelja, 1980].
J. P. Gram. Über die Entwicklung reeler Functionen in Reihen mittelst der Methode der
kleinsten Quadrate. Journal für die reine und angewandte Mathematik, 94:41–73, 1883.
cf. [Schmidt, 1907a].
H. G. Graßmann. Die Ausdehnungslehre von 1844 (Die lineale Ausdehnungslehre: ein
neuer Zweig der Mathematik) und die geometrische Analyse. Gesammelte mathematische
und physikalische Werke; 1,1. Verlag von Otto Wigand, Leipzig, 1894. P40TAW1097-1,1;
v. et. [Graßmann, 1896].
H. G. Graßmann. Die Ausdehnungslehre von 1862. Gesammelte [Serie] mathematische
und physikalische Werke; 1,2. Verlag von Otto Wigand, Leipzig, 1896. P40TAW1097-1,2;
v. et. [Graßmann, 1894].
J. Gray. The history of the concept of a finite-dimensional vector space. Historia Mathe-
matica, pages 65–70, 1980. P40/61h3 (2.1975–27.2000).
J. J. Gray. Finite-dimensional vector spaces. In I. Grattan-Guinness, editor, Companion
Encyclopedia of the History and Philosophy of the Mathematical Sciences, volume 2, pa-
ges 947–951. Routledge, London, 1994. P40TBC1708.
B. F. Green. The orthogonal apprroximation of the oblique structure in factor analysis. Psy-
chometrika, 17(4):429–440, 1952. cited in [Higham, 1986] [Stewart, 1992b]; v. et. [Schö-
neman, 1966] [Rao, 1980] [Hurley und Cattell, 1962].
R. T. Gregory und D. L. Karney. A Collection of Matrices for Testing Computational
Algorithms. Wiley-Interscience, a division of John Wiley & Sons, New York, 1969.
P41TDZ1408 (cites [Rosser et al., 1951, pp. 61–62]).
T. N. C. Greville. Spectral generalized inverses of square matrices. M. R. C. Technical
Summary Report #823, Mathematics Research Center, Univ. of Wisc., Madison Wisc.,
1967. (cited in [Campbell und Meyer, 1975], [Ben-Israel und Greville, 1974, p. 169]).
106
LITERATURVERZEICHNIS
D. H. Griffel. Linear algebra and its applications, volume 1 of Ellis Horwood series in
mathematics and its applications. Elllis Horwood Limited, 1989a. P41TDQ3994-1.
D. H. Griffel. Linear algebra and its applications, volume 2 of Ellis Horwood series in
mathematics and its applications. Elllis Horwood Limited, 1989b. P41TDQ3994-2.
G. Guy und G. Medioni. Inferring global perceptual contours from local features. In
IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pages
786–787, 1983. v. et. [Guy und Medioni, 1992] [Guy und Medioni, 1996].
G. Guy und G. Medioni. Inferring global perceptual contours from local features. IEEE
Trans. Pattern Anal. Machine Intell., 24, 1992. v. et. [Guy und Medioni, 1983] [Guy und
Medioni, 1996].
G. Guy und G. Medioni. Inferring global perceptual contours from local features. Interna-
tional Journal of Computer Vision, 20(1):113–133, 1996. v. et. [Guy und Medioni, 1992]
[Guy und Medioni, 1983].
J. Hadamard. Sur les problèmes aux dérivées partielles et leur signification physique. Bul.
Univ. Princeton, 13:49–62, 1902. v. et. [Hadamard, 1923]; cited in [Florack, 2002].
J. Hadamard. Lectures on the Cauchy Problem in Linear Partial Differential Equations.
Yale University Press, New Haven, CT, 1923. v. et. [Hadamard, 1902].
S. L. Hahn. Multidimensional complex signals with single-orthant spectra. Proceedings
of the IEEE, 80(8):1287–1300, 1992. cited in [Havlicek et al., 1997].
R. Halír und J. Flusser. Numerically stable direct least squares fitting of ellipses. In The
Sixth International Conference in Central Europe on Computer Graphics and Visualizati-
on, WSCG’98, 1998.
E. L. Hall. Computer Image Processing and Recognition. Computer Science and Applied
Mathematics. Academic Press, New York, 1979. P41TVV1834; (cites [Frei und Chen,
1977] in pp. 396–402).
P. R. Halmos. Finite-Dimensional Vector Spaces. Van-Nostrand, New Jersey, 1958.
(P41TDQ2710) cited by Cline [Cline, 1979] as an excellent textbook for basic matrix
theory parallel to Noble’s [Noble und Daniel, 1977] and Strang’s [Strang, 1980]; cited in
[Ben-Israel und Greville, 1974, p. 50].
P. C. Hansen. The truncated svd as a method for regularization. BIT, 27:534–553,
1987. Cited in Åke Björck’s bibliography on least squares, which is available by anony-
mous ftp from math.liu.se in pub/references. cited in [Rust, 1998]; 978463811;
v. et. [Hansen, 1989, 1990, 1998].
P. C. Hansen. Regularization, gsvd and truncated gsvd. BIT, 29:491–504, 1989. v. et. [Han-
sen, 1987, 1990, 1998].
P. C. Hansen. Truncated singular value decomposition solutions to discrete ill-posed pro-
blems with ill-determined numerical rank. SIAM Journal on Scientific and Statistical Com-
puting, 11:503–518, 1990. Cited in Åke Björck’s bibliography on least squares, which is
available by anonymous ftp from math.liu.se in pub/references;v. et. [Hansen,
1987, 1989, 1998].
LITERATURVERZEICHNIS
107
P. C. Hansen. Rank-Deficient and Discrete Ill-Posed Problems: Numerical Aspects of Li-
near Inversion. SIAM monographs on mathematical modeling and computation. SIAM,
Philadelphia, 1998. P41TKZ2276 (cited in [Rust, 1998] and 979790705); v. et. [Hansen,
1987, 1989, 1990].
R. J. Hanson und J. L. Phillips. A numerical method for solving fredholm integral equa-
tions of the first kind using singular values. SIAM Journal on Numerical Analysis, 8:
616–622, 1971. (cited in [Rust, 1998]) (v. et. [Hanson und Phillips, 1971]).
R. J. Hanson und J. L. Phillips. An adaptive numerical method for solving linear fredholm
equations of the first kind. Numer. Math., 24:291–307, 1975. Cited in Åke Björck’s bi-
bliography on least squares, which is available by anonymous ftp from math.liu.se in
pub/references. (v. et. [Hanson und Phillips, 1971]).
G. Hartmann. Continuous line structures by a hierarchical system. In Proceedings of the
6th International Conference on Pateern Recognition ICPR’1982, pages 195–200, 1982.
G. Hartmann. Processing of continuous lines and edges by the visual system. Biological
Cybernetics, 47:43–50, 1983.
R. E. Hartwig und I. J. Katz. On products of ep matrices. Linear Algebra Appl., 252:
339–345, 1997. (cited in [Koliha, 1999]; v. et. [Baskett und Katz, 1969]).
J. P. Havlicek, D. S. Harding, und A. C. Bovik. Multidimensional quasi-eigenfunction
approximations and multicomponent. IEEE Transactions on Image Processing, 9(2), 2000.
v. et. [Havlicek et al., 1997].
J. P. Havlicek, J. W. Havlicek, und A. C. Bovik. The analytic image. In International
Conference on Image Processing (ICIP ’97), volume 3, pages 446–449. IEEE Computer
Society, 1997. v. et. [Havlicek et al., 2000].
P. S. Heckbert und M. Garland. Optimal triangulation and quadric–based surface simplifi-
cation. Computational Geometry, 14(1–3):49–65, 1999.
W. Heisenberg. Über quantentheoretische Umdeutung kinematischer und mechanischer
Beziehungen (About the quantum-theoretical reinterpretation of kinetic and mechanical
relationships). Zeitschrift für Physik, 33:879–893, 1925. v. et. [Heisenberg, 1927, 1931].
W. Heisenberg. Über den anschaulichen Inhalt der quantentheorestischen Kinematik und
Mechanik. Zeitschrift für Physik, 43:172–198, 1927. Translation by John Archibald Whee-
ler and Wojciech Hubert Zurek “The Perceptible content of the Quantum Theoretical Kine-
matics and Mechanics” in Quantum Theory and Measurement ed. JAW and WHZ, Priceton
University Press, Princeton NJ 1983, p. 62–84; v. et. [Heisenberg, 1925, 1931] [Kennard,
1927] [Robertson, 1929]; cited in [Gábor, 1946].
W. Heisenberg. Die Rolle der Unbestimmtheitsrelationen in der modernen Physiak. Mo-
natshefte für Mathematik und Physik, 38:365–372, 1931. v. et. [Heisenberg, 1925, 1927].
N. J. Higham. Computing the polar decomposition–with applications. SIAM Journal on
Scientific and Statistical Computing, 7(4):1160–1174, 1986. P40/61s31; cited in [Shoe-
make und Duff, 1992] [Higham, 1995]; cites [Green, 1952] [Fan und Hoffman, 1955]
[Schöneman, 1966].
108
LITERATURVERZEICHNIS
N. J. Higham. The test matrix toolbox for matlab (version 3.0). Numerical Analysis
Report No. 276, Manhester Centre for Computational Mathematics, 1995. cites [Higham,
1986].
N. J. Higham. Accuracy and Stability of Numerical Algorithms. SIAM, Philadelphia PA,
1996. P41TKX5046.
N. J. Higham und P. A. Knight. Finite precision behavior of stationary iteration for solving
singular systems. Linear Algebra and Appl., 192:165–186, 1993. (cites [Campbell und
Meyer, 1979]).
N. J. Higham und R. S. Schreiber. Fast polar decomposition of an arbitrary matrix. Techni-
cal Report 88–942, Computer Science, Cornell University, Ithaca, NY 14853, 1988. cited
in [Golub und Van Loan, 1989] [Shoemake und Duff, 1992].
D. Hilbert. Über einen algemeinen Gesichtpunkt für Invarianten-theoretische Untersu-
chungen im binaren Formengebiete. Mathematische Annalen, 28:381–446, 1887. cited in
[Florack, 2002].
D. Hilbert. Über die Theorie der algebraischen Formen. Mathematische Annalen, 36:
473–534, 1890. cited in [Florack, 2002].
D. Hilbert. Über die vollen Invariantensystemen. Mathematische Annalen, 42:313–373,
1893. cited in [Florack, 2002].
D. Hilbert und S. Cohn-Vossen. Anschauliche Geometrie. Grundlehren der mathemati-
schen Wissenschaften in Einzeldarstellungen; 37. Springer, Berlin, 1932. P41TGA1334-
DT v. et. [Hilbert und Cohn-Vossen, 1952].
D. Hilbert und S. Cohn-Vossen. Geometry and the imagination (Anschauliche Geometrie
1932). Chelsea scientific books; 87. Chelsea, New York, 1952. P41TGA1334 v. et. [Hilbert
und Cohn-Vossen, 1932].
C.-T. Ho und L.-H. Chen. A fast ellipse/circle detector using geometric symmetry. Pattern
Recognition, 28(1):117–124, 1995. (v. et. [Yuen et al., 1989] [McLaughlin, 1998]).
F. E. Hohn. Elementary Matrix Algebra. Macmillan, New York, 3 edition, 1973.
P41TDR1280(3).
R. A. Horn und C. R. Johnson. Matrix Analysis. Cambridge University Press, Cambridge,
1985. P41TDQ3774+7.
H. Hotelling. Analysis of a complex of statistical variables into principal components.
Journal of Educational Psychology, 24:417–441 and 498–520, 1933. cited in [Stewart,
1992b]; v. et. [Hotelling, 1936].
H. Hotelling. Relation between two sets of variates. Biometrika, 28:322–377, 1936. cited
in [Stewart, 1992b]; v. et. [Hotelling, 1933].
A. S. Householder. Unitary triangularization of a nonsymmetric matrix. Journal of the
ACM, 5(4):339–342, 1958. v. et. [Householder, 1972, 1975].
A. S. Householder. Lectures on numerical algebra: notes on lectures given at the
1972 MAA summer seminar. Mathematical Ass. of America, Washington, DC, 1972.
P41TKZ1238 v. et. [Householder, 1958, 1975], [Householder und Landahl, 1945] [Lau-
rie, 1997a,b].
LITERATURVERZEICHNIS
109
A. S. Householder. The Theory of Matrices in Numerical Analysis. Dover, New York,
1975. P65TKZ1466+4 v. et. [Householder, 1958, 1972], [Householder und Landahl, 1945]
[Laurie, 1997a,b]; cited in [Lehoucq, 1996].
A. S. Householder und H. D. Landahl. Mathematical biophysics of the central nervous
system. Principia Press, Bloomington, Ind., 1945. v. et. [Householder, 1972, 1975].
D. H. Hubel und T. N. Wiesel. Receptive fields, binocular interaction, and functional
architecture in the cat’s visual cortex. Journal of Physiology (London), 160:106–154, 1962.
cited in [Daugman, 1985, 1988; Marcelja, 1980].
D. H. Hubel und T. N. Wiesel. Sequence regularity and geometry of orientation columns
in the monkey striate cortex. J. Comput. Neurol., 158:267–293, 1974. cited in [Daugman,
1985, 1988].
D. H. Hubel und T. N. Wiesel. Functional architecture of macaque monkey visual cortex.
Proceedings of the Royal Society of London B, 198:1–59, 1978. cited in [Lee, 1996].
J. R. Hurley und R. B. Cattell. The Procrustes program: Direct rotation to test a hypothesi-
zed factor structure. Behavioral Science, 7:258–262, 1962. v. et. [Schöneman, 1966] [Rao,
1980] [Green, 1952]; Cited in [Stewart, 1992b].
P. Husbands, H. Simon, und C. Ding. On the use of singular value decomposition for text
retrieval. In M. W. Berry, editor, Proc. of SIAM Comp. Info. Retrieval Workshop, 2000.
cites [Deerwester et al., 1990] [Berry et al., 1994a].
IEEE. IEEE standard 754-1985 for binary floating-point arithmetic. Reprinted in SIG-
PLAN 22, 9–25, IEEE, 1985. cited in [Goldberg, 1991].
I. C. F. Ipsen und C. D. Meyer. The angle between complementary subspaces. Technical
Report Series 4.24.667 NA-019501, Mathematics Department, NCSU, 1995. (v. et. [Mey-
er, 2000]; cites [Afriat, 1957; Björck und Golub, 1973; Campbell und Meyer, 1991; Davis
und Kahan, 1970; Gohberg und Krein, 1969; Golub und Van Loan, 1989; Kato, 1966;
Ljance, 1959; Schumacher, 1992; Stewart, 1973a, 1977; Stewart und Sun, 1990; Strang,
1988, 1993; Wedin, 1982; Zhu, 1994]).
I. C. F. Ipsen und C. D. Meyer. The idea behind krylov methods. American Mathematical
Monthly, 105(10):889–899, 1998. (available in the homepage of Meyer; citing [Drazin,
1958], [Campbell und Meyer, 1979]).
J. P. Jones und L. A. Palmer. An evaluation of the two-dimensional gabor filter model of
simple receptive fields in cat striate cortex. J. Neurophysiology, 58(6):1233–1258, 1987a.
(v. et. [Jones und Palmer, 1987b]).
J. P. Jones und L. A. Palmer. The two-dimensional spatial structure of simple receptive
fields in the cat striate cortex. J. Neurophysiology, 58(6):1187–1211, 1987b. (v. et. [Jones
und Palmer, 1987a]).
C. Jordan. Mémoire sur les formes bilinéaires. Journal de Mathématiques Pures et Appli-
quées, Deuxième Série, 19:35–54, 1874a.
C. Jordan. Sur la réduction des formes bilinéaires. Comptes Rendus de l’Académie des
Sciences, Paris, 78:614–617, 1874b.
110
LITERATURVERZEICHNIS
C. Jordan. Essai sur la géométrie à n dimensions. Bulletin de la Société Mathématique, 3:
103–174, 1875.
B. Kågström und A. Ruhe, editors. Matrix Pencils: Proceedings of a Conference held at
Pite Havsbad, Sweden March 22–24 1982. Lecture Notes in Mathematics; 973. Springer,
Berlin, 1993. P40TAY820075 cited in [Ipsen und Meyer, 1995] v. et. [Wedin, 1982].
W. Kahan. Geometry of elementary operations. (same source as [Kahan, 1999]), 1998.
W. Kahan. Is there a skew cayley transform with zero diagonal? v. et. [Satake, 1975,
p. 201] [Fekete, 1985, p. 265] (same source as [Kahan, 1998]), 1999.
K. Kanatani. Geometric Computation for Machine Vision. Carendon Press, Oxford, 1993.
P41TGJ1711.
K. Kanatani. Comments on ”nonparametric segmentation of curves into various repre-
sentations”. IEEE Transactions on Pattern Analysis and Machine Intelligence, 19(12):
1391–1392, 1997. v. et. [Rosin und West, 1997] [Rosin und West, 1997].
I. Kant. Kritik der reinen Vernunft. Ed. Dt. Bibliothek, München, 2 edition, 1781. Dem
Text liegt zugrunde die 1. Ausg. (1781), hrsg. von Karl Kehrbach, 2. Aufl. Leipzig 1878;
P11JIQE1030.
L. W. Kantorowitsch und G. P. Akilow. Funktionalanalysis in normierten Räumen. Thun,
1978. P41TJL2052.
I. Kaplansky. Linear Algebra and Geometry. Chelsea Publ. Co., New York, 2 edition,
1974. P65TDQ3203(2)+4 cites [Witt, 1937]; cites on p. 120 [MacLane und Birkhoff,
1967, Chapter 12].
K. Karhunen. Zur Spektraltheorie stochastischer Prozesse. Prozessa Annales Academiae
Scientiarum Fennicae, Ser. A: 1, Mathematica, physica, 37:1–37, 1946. P03SA24-1947
(v. et. [Loève, 1955] [Loève, 1963]).
W. C. Karl, G. C. Verghese, und A. S. Willsky. Reconstructing ellipsoids from projec-
tions. Computer Vision, Graphics, and Image Processing: Graphical Models and Image
Processing, 56(2):124–139, 1994. (citing [Bookstein, 1979], [Chaudhuri und Samanta,
1991]).
T. Kato. Perturbation Theory for Linear Operators. Die Grundlehren der mathemati-
schen Wissenschaften in Einzeldarstellungen mit besonderer Berücksichtigung der An-
wendungsgebiete; 132. Springer, Berlin, 1966. P65TJK1051+3 cited in [Ipsen und Meyer,
1995]; see [Kato, 1976] for 2nd ed.
T. Kato. Perturbation Theory for Linear Operators. Die Grundlehren der mathemati-
schen Wissenschaften in Einzeldarstellungen mit besonderer Berücksichtigung der An-
wendungsgebiete; 132. Springer, Berlin, 2 edition, 1976. P65TJK1051(2)+8 (see [Kato,
1966] for the 1st ed.).
I. J. Katz. Wiegman type theorem for eprmatrices. Duke Math. Journal, 32:423–427,
1965. cited in [Ben-Israel und Greville, 1976, p. 166].
E. H. Kennard. Zur Quantenmechanik einfacher Bewegungstypen. Zeitschrift für Physik,
44:326–352, 1927. v. et. [Heisenberg, 1927] [Robertson, 1929].
LITERATURVERZEICHNIS
111
D. E. Knuth. Fundamental Algorithms, volume 1 of The Art of Computer Programming;
1. Addison-Wesley, 1973, 1968. P41TXB1078(2) (v. et. [Knuth, 1981, 1969, 1998]).
D. E. Knuth. Seminumerical Algorithms, volume 2 of The Art of Computer Programming;
2. Addison-Wesley, 1981, 1969. P41TXB1078(2)-2 (v. et. [Knuth, 1973, 1968, 1998]).
D. E. Knuth. Sorting and Searching, volume 3 of The Art of Computer Programming; 3.
Addison-Wesley, 1998. P41TXB1078(2)-3 (v. et. [Knuth, 1973, 1968, 1981, 1969]).
M. Koecher. Lineare Algebra und analytische Geometrie. Springer-Lehrbuch: Grundwis-
sen Mathematik. Springer, Berlin, 4 edition, 1997. P41TDQ3562(4).
J. J. Koenderink. The structure of images. Biological Cybernetics, 50:363–370, 1984.
T. Kolenda und L. K. Hansen. Independent components in text. In M. Girolami, editor, Ad-
vances in Independent Component Analysis, pages Chapt. 13, pp. 23556. Springer-Verlag,
1999. cites [Deerwester et al., 1990].
J. J. Koliha. Simple proof of the product theorem for ep matrices. Linear Algebra and
Its Applications, 294:213–215, 1999. (cites [Barnett, 1971; Campbell und Meyer, 1991;
Hartwig und Katz, 1997]).
A. I. Kostrikin und Y. I. Manin. Linear Algebra and Geometry. Algebra, Logic and
Applications Series Volumne 1. Gordon and Breach Science Publishers, Amsterdam, 1989.
P41TDQ4021+1 (originally published in Russian in 1981 by Moscow University Press).
Z. V. Kovarik. Similarity and interpolation between projectors. Acta Scientiarum Ma-
thematicarum, 39:341–351, 1977. (Magazin P40/61a5 1977 Tomus 39); cites [Davis und
Kahan, 1970].
P. Kovesi. Image features from phase congruency. Videre: Journal of Computer Vision
Research, 1(3):1–26, 1999. v. et. [Kovesi, 2002].
P. Kovesi. Edges are not just steps. In The 5th Asian Conference on Computer Vision,
23–25 January 2002, Melbourne, Australia, 2002. v. et. [Kovesi, 1999]; cites [Field, 1987]
[Morrone und Owens, 1987] [Morrone und Burr, 1988] [Owens et al., 1989].
F. Kuhnert. Pseudoinverse Matrizen und die Methode der Regularisierung. Teubner-
Texte zur Mathematik. BSB B. G. Teubner Verlagsgesellschaft, Leipzig, 1 edition, 1976.
(P41TDQ2639); cites [Bjerhammer, 1951a,b], [Moore, 1920], [Penrose, 1955, 1956],
[Ben-Israel und Greville, 1974], [Boullion und Odell, 1971], [Bjerhammer, 1973], [Rao
und Mitra, 1971], [Stewart, 1973b].
U. M. Landau. Estimation of a circular arc center and its radius. Computer Vision, Gra-
phics and Image Processing, 38:317–326, 1987.
T. K. Landauer und S. T. Dumais. A solution to plato’s problem: The latent semantic
analysis theory of acquisition, induction and representation of knowledge. Psychological
Review, 104(2):211–240, 1997. cites [Deerwester et al., 1990].
B. P. Lathi. An Introduction to Random Signals and Communication Theory. International
Textbook Company, Scranton, 1968.
D. Laurie. Complex analogue of householder reflections: Summary. Numerical Ana-
lysis Digest, 97(22), 1997a. http://www.netlib.org/na-digest-html/97/
v97n22.html;cf. [Householder, 1972, 1975] [Sun, 1995] [Lehoucq, 1996].
112
LITERATURVERZEICHNIS
D. Laurie. Complex analogues of householder reflections. Numerical Analysis Digest,
97(18), 1997b. http://www.netlib.org/na-digest-html/97/v97n18.
html;cf. [Householder, 1972, 1975] [Sun, 1995] [Lehoucq, 1996].
C. L. Lawson und R. J. Hanson. Solving Least Squares Problems. Prentice Hall Series in
Automatic Computation. Prentice-Hall, Englewood Cliffs, 1974. P51TKZ1212 (cited in
[Vandewalle und De Moor, 1988]).
G. Le Lann. An analysis of the ariane 5 flight 501 failure a system engineering perspec-
tive. In 10th IEEE International ECBS Conference, March 1997, pages 339–346, 1997.
(v. et. [Lions, 1996]).
F. Le Lionnais. Les nombres remarquables. Actualites scientifiques et industrielles; 1407.
Hermann, Paris, 1984. P41TBX3080.
S. Leach. Singular value decomposition - a primer. minisvd.ps cites [Scharf, 1991]
[Forsythe et al., 1977] [Deprettere, 1988] [Vaccaro, 1991] [Golub und Van Loan, 1983],
1998.
H.-J. Lee und B. Chen. Recognition of handwritten chinese characters via short line seg-
ments. Pattern Recognition, 25(5):543–552, 1992. v. et. [Zhang und Suen, 1984] (XITE).
T. S. Lee. Image representation using 2D gabor wavelets. IEEE Trans. on Pattern Analysis
and Machine Intelligence, 18(10), 1996. cites [Daugman, 1980, 1985, 1988; Gábor, 1946;
Hubel und Wiesel, 1978; Jones und Palmer, 1987a; Marcelja, 1980; Olshausen und Field,
1966,?; Optican und Richmond, 1987; Tolhurst, 1989; Werner und Mountcastle, 1965],
P50/88i61 reviewed 970154527 but not copied.
R. B. Lehoucq. The computation of elementary unitary matrices. ACM Transactions on
Mathematical Software, 22(4):393–400, 1996. cf. [Laurie, 1997a,b] [Sun, 1995]; cites
[Wilkinson, 1965a] [Householder, 1975] [Dubrulle, 1996].
Lena Sjööblom-Soderberg. Centerfold: Miss. November 1972. Playboy, 11:138, 1972.
v. et. 1997 October issue, Playmate News; cited in [Munson, 1996].
J.-L. Lions. Ariane 5 flight 501 failure. Report by the Inquiry Board Ariane Status Re-
port No. 6, ESA (European Space Agency)/CNES (Centre National d’Etudes Spatiales),
Paris, 1996. http://www.esrin.esa.it/htdocs/tidc/Press/Press96/
ariane5rep.html or lib/txt/comp/ariane5.zip;v. et. [Le Lann, 1997].
V. E. Ljance. Some properties of idempotent operators. Teor. i Prikl. Mat. L’vov, 1:16–22,
1959. (Russian) cited in [Ipsen und Meyer, 1995].
M. M. Loève. Probability Theory. Van Nostrand, New York, 1955. (v. et. [Loève, 1963]
[Karhunen, 1946]).
M. M. Loève. Probability Theory. The university series in higher mathematics. Van
Nostrand, New York, 3 edition, 1963. P41TKA1681(3). v. et. [Loève, 1955] [Karhunen,
1946].
S. MacLane und G. Birkhoff. Algebra. Macmillian, London, 1967. P41TDP2812 cited in
[Kaplansky, 1974, p. 120].
L. Maffei und A. Fiorentini. The visual cortex as a spatial frequency analyzer. Vision Res.,
13:1255–1267, 1973. cited in [Marcelja, 1980].
LITERATURVERZEICHNIS
113
L. Maffei, C. Morrone, M. Pirchio, und G. Sandini. Responses of visual cortical cells to
periodic and non-periodic stimuli. Journal of Physiology London, 296:27–47, 1979. cited
in [Marcelja, 1980].
P. C. Mahalanobis. On tests and meassures of groups divergence I. Journal of the Asiatic
Society of Benagal, 26:541, 1930. (seel also [Everitt, 1998] [Duran und Odell, 1974]).
P. C. Mahalanobis. On the generalized distance in statistics. Proceedings of the National
Institute of Science of India, 12:49–55, 1936.
S. Marcelja. Mathematical description of the response of simple cortical cells. Journal
of Optical Society of America, A, 70(11):1297–1300, 1980. cites [Bishop et al., 1973;
Compbell et al., 1969; Compbell und Robson, 1968; Cooper und Robson, 1968; Gábor,
1946; Goodwin et al., 1975; Hubel und Wiesel, 1962; Maffei und Fiorentini, 1973; Maffei
et al., 1979; Movshon et al., 1978a,b; Orban et al., 1979; Robson, 1975] P40/67o03A
(Magazin: -1980).
M. J. Maron und G. M. Maron. A geometric interpretation of the columns of the (pseu-
do)inverse of a.College Math Journal, 24(1):73–75, 1993. (This acticle is collected in
[Carlson et al., 1997]).
D. Marr und E. C. Hildreth. Theory of edge detection. Proceedings of the Royal Society of
London, B–207:187–217, 1980. v. et. [Deriche, 1993], pgmarr.c,iir.c;cf. [Canny,
1986] [Shen und Castan, 1992].
G. Marsaglia und A. Zaman. Toward a universal random number generator. Techni-
cal Report FSU-SCRI-87-50, Florida State University, 1987. (ranmar.c,ghyper.c,
gaussian.c; later modified by F. James and published in A Review of Pseudo-random
Number Generators”).
R. A. McLaughlin. Randomized hough transform: Improved ellipse detection with com-
parison. Pattern Recognition Letters, 19(3-4):299–305, 1998. (v. et. [Yuen et al., 1989]
[Ho und Chen, 1995]).
C. D. Meyer. Limits and the index of a square matrix. SIAM J. Appl. Math, 26:469–478,
1974. (cited in [Campbell und Meyer, 1975]).
C. D. Meyer. Matrix Analysis and Applied Linear Algebra. SIAM, Philadelphia, 2000.
P41TDQ4893-1 (v. et. [Ipsen und Meyer, 1995]).
L. Mirsky. Symmetric gauge functions and unitarily invariant norms. Quarterly Journal
of Mathematics, 11:50–59, 1960. cited in [Stewart, 1992b].
O. Monga, R. Deriche, G. Malandain, und J.-P. Cocquerez. Recursive filtering and edge
tracking: two primary tools for 3d edge detection. Image and Vision Computing, 9(4):
203–214, 1991. (v. et. [Deriche, 1993] and iir.c).
R. K. Moniot. Least-squares fitting of a hyperplane. cites [Pearson, 1901] [Williamson,
1968], 2002.
M. Moonen und B. L. R. De Moor, editors. SVD and Signal Processing III: Algorithms, Ar-
chitectures and Applications, volume 3 of SVD and signal processing; 3. Elsevier Science,
Delft, The Netherlands, 1995. (P51YCB3194-3).
114
LITERATURVERZEICHNIS
E. H. Moore. On the reciprocal of the general algebraic matrix. Bulletin of the American
Mathematical Society, 26:394–395, 1920. (cited in [Cline, 1979, p. 18], [Kuhnert, 1976,
p. 16], [Ben-Israel und Greville, 1974, p. 7] [Stewart und Sun, 1990, pp. 108–109]).
E. H. Moore. General analysis. Memoirs Amer. Philos. Soc., 1:147–209, 1935. (cited in
[Ben-Israel und Greville, 1974, p. 7]).
M. C. Morrone und D. C. Burr. Feature detection in human vision: A phase-dependent
energy model. Proceedings of the Royal Society of London B, 235:221–245, 1988. cited
in [Kovesi, 2002].
M. C. Morrone und R. A. Owens. Feature detection from local energy. Pattern Recognition
Letters, 6:303–313, 1987. cited in [Kovesi, 2002].
J. A. Movshon, I. D. Thompson, und D. J. Tolhurst. Receptive field organization of com-
plex cells in the cat’s striate cortex. Journal of Physiology (London), 283:79–99, 1978a.
cited in [Marcelja, 1980].
J. A. Movshon, I. D. Thompson, und D. J. Tolhurst. Spatial summation in the receptive
fields of simple cells in the cat’s striate cortex. Journal of Physiology (London), 283:
53–77, 1978b. cited in [Daugman, 1985].
J. A. Movshon und D. J. Tolhurst. On the response linearity of neurons in cat visual cortex.
Journal of Physiology (London), 249:56–57, 1975. cited in [Daugman, 1985].
D. C. Munson. A note on Lena. IEEE Transactions on Image Processing, 5(1):3, 1996.
cites [Lena Sjööblom-Soderberg, 1972]).
H. Z. Munthe-Kaas, G. R. W. Quispe, und A. Zanna. Generalized polar decompositions
on lie groups with involutive automorphisms. Comput. Math., 1:297–324, 2001. cites
[Autonne, 1902].
V. S. Nalwa und T. O. Binford. On detecting edges. IEEE Transactions on Pattern Analysis
and Machine Intelligence, PAMI-8(6):699–714, 1986. cites [Canny, 1986].
M. Z. Nashed und L. B. Rall. Annotated bibliography on generalized inverses and appli-
cations. In M. Z. Nashed, editor, Generalized Inverses and Applications, pages 771–1041.
Academic Press, New York, 1976. cited in [Stewart und Sun, 1990, pp. 108–109].
B. Noble. Methods for computing the moore-penrose generalized inverse, and related
matters. In M. Z. Nashed, editor, Generalized Inverses and Applications, Publication of the
Mathematics Research Center, The University of Wisconsin, Madison; 32, pages 245–301.
Academic Press, New York, 1976. P41TJV1080 (cites [Ben-Israel und Greville, 1974]).
B. Noble und J. W. Daniel. Applied Linear Algebra. Prentice-Hall, 2 edition, 1977.
P41TDQ1675(2).
I. Ohzawa, G. C. DeAngelis, und R. D. Freeman. Stereoscopic depth discrimination in the
visual cortex: Neurons ideally suited as disparity detectors. Science, pages 1037–1041,
1990. (v. et. [Ohzawa et al., 1997; Ohzawa und Freeman, 1986]).
I. Ohzawa, G. C. DeAngelis, und R. D. Freeman. Encoding of binocular disparity by
complex cells in the cat’s visual cortex. Journal of Neurophysiology, 77:2897–2909, 1997.
(v. et. [Ohzawa et al., 1990; Ohzawa und Freeman, 1986]).
LITERATURVERZEICHNIS
115
I. Ohzawa und R. D. Freeman. The binocular organization of simple cells in the cat’s
visual cortex. Journal of Neurophysiology, 56(1):221–242, 1986. (v. et. [Ohzawa et al.,
1990, 1997]).
B. A. Olshausen und D. J. Field. Emergence of simple-cell receptive field properties by
learning a sparse code for natural images. Nature, 381:607–609, 1966. P40/58n3; cited in
[Lee, 1996].
P. Opitz. Numerische Einschließung der Moore-Penrose-Inversen von Matrizen. PhD
thesis, Technische Hochschule Leipzig, Mathematik/Informatik und Naturwissenschaft,
Leipzig, 1995. P03D10147.
L. M. Optican und B. J. Richmond. Temporal encoding of two-dimensional pattern by
single units in primate inferior temporal cortex. iii. information theoretic analysis. J. Neu-
rophysiology, 57:162–178, 1987. cited in [Lee, 1996].
G. A. Orban, H. Kato, und P. O. Bishop. End-zone region in receptive fields of hypercom-
plex and other striate neurons in the cat. J. Neurophysiology, 42:818–832, 1979. cited in
[Marcelja, 1980].
R. Owens, S. Venkatesh, und J. Ross. Edge detection is a projection. Pattern Recognition
Letters, 9:223–244, 1989. cited in [Kovesi, 2002].
Y. Pan und M. Hamdi. Singular value decomposition on processor arrays with a pipelined
bus system. Journal of Netwok and Computer Applications, 19:235–248, 1996. cites
[Golub et al., 1980], [Golub und Reinsch, 1970b].
K. Pearson. On lines and planes of closest fit to systems of points in space. The London,
Edinburgh and Dublin Philosophical Magazine and Journal of Science, 2:559–572, 1901.
v. et. [Williamson, 1968]; cited in [Moniot, 2002].
R. Penrose. A generalized inverse for matrices. Proceedings of the Cambridge Philoso-
phical Society, 51:406–413, 1955. (cited in [Cline, 1979, p. 18], [Kuhnert, 1976, p. 16],
[Stewart und Sun, 1990, pp. 108–109]).
R. Penrose. On best approximate solutions of linear matrix equations. Proceedings of
the Cambridge Philosophical Society, 52:17–19, 1956. (cited in [Kuhnert, 1976, p. 16]
[Stewart und Sun, 1990, pp. 108–109]).
P. Perona und J. Malik. Detecting and localizing edges composed of steps, peaks and roofs.
In Proc. 3rd Int. Conf. on Computer Vision, pages 52–57, 1990. v. et. [Perona und Malik,
1991].
P. Perona und J. Malik. Detecting and localizing composite edges in images. In Procs.
ICCV, Osaka, 1991. v. et. [Perona und Malik, 1990].
I. Peterson. The Mathematical Tourist: Snapshots of Modern Mathematics. Freeman, New
York, 1988. P41TBW1669.
F. Peyrin, Y. M. Zhu, und R. Goutte. Extension of the notion of analytic signal for mul-
tidimensional signals. Application to images. In I. T. Young, editor, Signal Processing
III: Theories and Applications, pages 677–680, Amsterdam, B. V. (North-Holland), 1968.
Elsevier Science Publishers. cited in [Havlicek et al., 1997].
116
LITERATURVERZEICHNIS
D. A. Pollen und S. F. Ronner. Phase relationship between adjacent simple cells in the
visual cortex. Science, 212:1409–1411, 1981. cited in [Daugman, 1985] P40/58s1 copied
970160934.
J. Porrill. Fitting ellipses and predicting confidence envelopes using a bias corrected kal-
man filter. Image and Vision Computing, 8(1):37–41, 1990.
W. H. Press, S. A. Teukolsky, W. T. Vetterling, und B. P. Flannery. Numerical Recipes in
C: The Art of Scientific Computing. Cambridge University Press, Cambridge, 2 edition,
1992. P41TKX3832(2)-10,A+1.
R. M. Pringle und A. A. Rayner. Generalized inverse matrices with applications
to statistics. Griffin’s statistical monographs and courses; 28. Griffin, London, 1971.
P41TKP1068.
C. R. Rao. Matrix approximations and reduction of dimensionality in multivariate statisti-
cal analysis. In P. R. Krishnaiah, editor, Multivariate Analysis–V. North-Holland, Amster-
dam, 1980. v. et. [Green, 1952] [Hurley und Cattell, 1962] [Schöneman, 1966]; cited in
[Stewart, 1992b].
C. R. Rao und S. K. Mitra. Generalized Inverse of Matrices and its Applications. Wi-
ley Series in Probability and Mathematical Statistics. Wiley, New York, 1971. (cited in
[Kuhnert, 1976, p. 23] & 985253598).
Y. Ritov. Bounds on the error of an approximate invariant subspace for non-self-adjoint
matrices. Ejournals, 1992.
H. P. Robertson. The uncertainty principle. Physical Review, 34:163–164, 1929. v. et. [Hei-
senberg, 1927] [Kennard, 1927].
J. G. Robson. Receptive fields: Neural representation of the spatial and intensive attri-
butes of the visual image. In E. C. Carterette und M. P. Friedman, editors, Handbook of
Perception, volume V. Academic, New York, 1975. cited in [Marcelja, 1980].
R. W. Rodieck. Quantitative analysis of cat retinal ganglion cell response to visual stimuli.
Vision Research, 5:583–601, 1965. cited in [Daugman, 1985].
P. L. Rosin. Ellipse fitting by accumulating five-point fits. Pattern Recognition Letters, 14:
661–669, 1993a. v. et. [Rosin, 1993b, 1997].
P. L. Rosin. A note on the least squares fitting of ellipses. Pattern Recognition Letters, 14
(10):799–808, 1993b. v. et. [Rosin, 1993a, 1997].
P. L. Rosin. Non-parametric multiscale curve smoothing. International Journal of Pattern
Recognition and Artificial Intelligence, 8(6):1381–1406, 1994.
P. L. Rosin. Edges: Saliency measures and automatic thresholding. Technical Re-
port I.95.58, Institute of Remote Sensing Applications, Joint Research Centre, 1995.
(v. et. [Venkatesh und Rosin, 1995] and pgmlink).
P. L. Rosin. Analyzing error of fit functions for ellipses. In BMVC96, page Poster Session
2, 1996a.
P. L. Rosin. Assessing error of fit functions for ellipses. Graphical Models and Image
Processing, 58(5):494–502, 1996b.
LITERATURVERZEICHNIS
117
P. L. Rosin. Further five point fit ellipse fitting. In BMVC97, Electronic Proceedings of the
Eighth British Machine Vision Conference, 1997. v. et. [Rosin, 1993a,b].
P. L. Rosin und G. A. W. West. Segmentation of edges into lines and arcs. Image Vision
Comput., 7:109–114, 1989. (cited in [Venkatesh und Rosin, 1995]; v. et. [Rosin und West,
1995] and pgmlink).
P. L. Rosin und G. A. W. West. Nonparametric segmentation of curves into various re-
presentations. IEEE Transactions on Pattern Analysis and Machine Intellegence, 17(12):
1140–1153, 1995. v. et. [Kanatani, 1997] [Rosin und West, 1997].
P. L. Rosin und G. A. W. West. Response to kanatani. IEEE Transactions on Pattern
Analysis and Machine Intelligence, 19(9):1393–1394, 1997. v. et. [Rosin und West, 1995]
[Kanatani, 1997].
J. B. Rosser, C. Lanczos, M. R. Hestenes, und W. Karush. Separation of close eigenvalues
of a real symmetric matrix. Jour. Res. Nat. Bur. Standards, 47:291–297, 1951. (cited in
[Gregory und Karney, 1969, pp. 61–62]).
P. J. Rousseeuw. Least median of squares regression. Journal of the American Statistical
Association, 79:871–881, 1984. v. et. [Rousseeuw, 1987].
P. J. Rousseeuw. Robust Regression and Outlier Detection. John Wiley & Sons, New York,
1987. P41TKM3609 (cites [Brown, 1982]; v. et. [Rousseeuw, 1984], progress.exe).
R. Rucker. The fourth dimension. Penguin, 1986. P41UAZ1875-EN (v. et. Abbott [Abbott,
1952] and [Rucker, 1987] for German edition).
R. Rucker. Die Wunderwelt der vierten Dimension: ein Kursbuch für Reisen in die höere
Wirklichkeit. Scherz, 1987. P41UAZ1875 P77UAZ1859 (see [Rucker, 1986] for English
edition).
B. W. Rust. Truncating the singular value decomposition for ill-posed problems. Tech-
nical Report NISTIR 6131, National Institute of Standards and Technology, Gaithersburg,
MD 20899, 1998. (cites [Golub und Kahan, 1965] [Golub. et al., 1976] [Hansen, 1990]
[Hansen, 1987] [Hansen, 1998] [Smithies, 1970] [Hanson und Phillips, 1971] [Hanson und
Phillips, 1975]).
P. K. Sahoo, S. Soltani, A. K. C. Wong, und Y. C. Chen. A survey of thresholding tech-
niques. Comput. Vision Graphics Image Process, 41:233–260, 1988. (cited in [Venkatesh
und Rosin, 1995]).
I. Satake. Linear Algebra. Monographs and textbooks in pure and applied mathematics;
29. Marcel Dekker Inc., New York, 1975. P41TDQ2778 Aus dem Japan. ers.
L. L. Scharf. The SVD and reduced-rank signal processing. In R. J. Vaccaro, editor, SVD
and Signal Processing II: Algorithms, Analysis and Applications, pages 3–31. Elsevier
Science, Delft, The Netherlands, 1991. P51YCB3194-2 cited by [van der Veen et al.,
1993] [Leach, 1998] (v. et. [Deprettere, 1988] [Vaccaro, 1991] ).
E. Schmidt. Zur Theorie der linearen und nichtlinearen Integralgleichungen. I. Teil. Ent-
wicklung willkürlichen Funktionen nach System vorgeschriebener. Mathematische Anna-
len, 63:433–476, 1907a. v. et. [Schmidt, 1907b]; cf. [Gram, 1883]; cited in [Ben-Israel und
Greville, 1974, p. 242].
118
LITERATURVERZEICHNIS
E. Schmidt. Zur Theorie der linearen und nichtlinearen Integralgleichungen. II. Teil. Auf-
lösung der allgemeinen linearen Integralgleichung. Mathematische Annalen, 64:161–174,
1907b. v. et. [Schmidt, 1907a]; cited in [Ben-Israel und Greville, 1974, p. 242].
P. H. Schöneman. A generalized solution of the orthogonal Procrustes problem. Psy-
chometrika, 31:2–10, 1966. cited in [Higham, 1986] [Stewart, 1992b]; v. et. [Rao, 1980]
[Hurley und Cattell, 1962] [Green, 1952].
J. M. Schumacher. A pointwise criterion for controller robustness. Systems and Control
Letters, 18:1–8, 1992. cited in [Ipsen und Meyer, 1995].
L. Schwartz. Théorie des distributions. In Actualités scientifiques et industrielles; Publi-
cations de l’Institut de Mathématique de l’Université de Strasbourg, volume I, II, pages
1091–1122, 1950–1951. l’Université de Strasbourg, Paris, 1951. v. et. [Schwartz, 1966];
cited in [ter Haar Romeny, 1999] [Florack, 2002].
L. Schwartz. Théorie des Distributions. Hermann & Cie, 2 edition, 1966. v. et. [Schwartz,
1951]; cited in [ter Haar Romeny, 1999] [Florack, 2002].
M. Schwartz und L. Shaw. Signal processing: discrete spectral analysis, detection, and
estimation. McGraw-Hill classic textbook reissue series. McGraw-Hill, New York, 1975.
P51YCB1362.
J. Shen und S. Castan. An optimal linear operator for step edge detection. Computer
Vision, Graphics and Image Processing, 54(2):112–133, 1992. cf. [Canny, 1986] [Marr
und Hildreth, 1980].
G. E. Shilov. Linear Algebra. Prentice-Hall, 1971. P41TDQ1439.
K. Shoemake und T. Duff. Matrix animation and polar decomposition. In Proceedings of
Graphics Interface, pages 258–264, 1992. (citing [Higham, 1986] [Higham und Schreiber,
1988]).
F. Smithies. Integral Equations. Cambridge Tracts in Mathematics and Mathematical Phy-
sics. Cambridge University Press, Cambridge, 1970. P41TIR2252 (cited in [Rust, 1998]).
I. Sobel. An isotropic 3×3image gradient operator. In H. Freeman, editor, Machine Vision
for Three-Dimensional Scenes, pages 376–379. Academic Press, 1990. v. et. [Danielsson,
1990] (not found in UBPB).
H. Späth. Orthogonal least squares fitting with linear manifold. Numerische Mathematik,
48:441–445, 1986. cited in [Van Huffel und Vandewalle, 1991, p. 6] [Gander et al., 1994a];
citesGolubVanLoan1980.
H. Späth. Incomplete total least squares. Numerische Mathematik, 81(4):521–538, 1999.
J. Staar. Concepts for Reliable Modeling of Linear Systems with Application to On-line
Identification of Multivariable State Space Descriptions. PhD thesis, Dept. of Electrical
Engrg., Katholieke Universiteit Leuven, Leuven, Belgium, 1982. (cited in [Vandewalle
und De Moor, 1988]).
F. M. Stewart. Introduction to linear Algebra. The University Series in Undergraduate
Mathematics. Van Nostrand, Princeton, NJ, 1963. P41TDQ3431.
LITERATURVERZEICHNIS
119
G. W. Stewart. On the continuity of the generalized inverse. SIAM J. Appl. Math, 17:
33–45, 1969. (cited in [Campbell und Meyer, 1975]).
G. W. Stewart. Error and perturbation bounds for subspaces associated with certain eigen-
value problems. SIAM Review, 15:727–764, 1973a.
G. W. Stewart. Introduction to Matrix Computations. Computer Science and Applied
Mathematics. Academic Press, 1973b. (cited in [Kuhnert, 1976, p. 27]).
G. W. Stewart. On the perturbation of pseudo-inverses, projections, and linear least squares
problems. SIAM Review, 19:634–662, 1977.
G. W. Stewart. An updating algorithm for subspace tracking. Technical Report CS-TR
2494, Department of Computer Science, University of Maryland, 1990. (revised January
1991) also in [Stewart, 1992c]; cites [Bunch und Nielsen, 1978].
G. W. Stewart. Perturbation theory for the singular value decomposition. In R. J. Vaccaro,
editor, SVD and Signal Processing II: Algorithms, Analysis and Applications, pages 99–
109. Elsevier Science, Delft, The Netherlands, 1991. P51YCB3194-2 cited in [van der
Veen et al., 1993] (v. et. [Deprettere, 1988] [Vaccaro, 1991] ).
G. W. Stewart. Determining rank in the presence of error. Technical Report UMIACS-TR-
92-108, CS-TR-2972, Dept. of Computer Science, Univ. of Maryland, 1992a.
G. W. Stewart. On the early history of the singular value decomposition (for gene golub on
his fifteenth birthday). SIAM Review, 35:551–566, 1992b. (UMIACS-TR-92-31, CS-TR-
2855) ( cites [Beltrami, 1873] [Jordan, 1874a,b], [Weyl, 1912] [Eckart und Young, 1936]
[Green, 1952] [Fan und Hoffman, 1955] [Hurley und Cattell, 1962] [Schöneman, 1966]
[Rao, 1980] ).
G. W. Stewart. An updating algorithm for subspace tracking. IEEE Transactions on Signal
Processing, 40:1535–1541, 1992c. also in [Stewart, 1990]; cites [Bunch und Nielsen,
1978].
G. W. Stewart. Matrix Algorithms Volume I: Basic Decompositions, volume 1.
SIAM, Philadelphia, 1998. P41TKZ2307 (This book exists as postscript fi-
les: 00tit.ps 01mat.ps 02mam.ps 03gau.ps 04qrd.ps 05rnk.ps
99ref.ps *962615378. For volume II, 00tit.ps 01eig.ps 02qra.ps
03sym.ps 04esp.ps 97app.ps 98ref.ps *962614513).
G. W. Stewart. Eigenspaces / canonical angles between subspaces. Class Notes CMSC760
/ MAPL600, Department of Computer Science, University of Maryland, 1999.
G. W. Stewart und J.-G. Sun. Matrix Perturbation Theory. Computer science and scien-
tific computing. Academic Press, Boston, 1990. P41TKZ1987 cited in [Ipsen und Meyer,
1995]; cites [Moore, 1920] [Bjerhammer, 1951b] [Penrose, 1955] [Penrose, 1956] [Berg-
man et al., 1950] [Nashed und Rall, 1976].
G. Strang. Linear Algebra and Its Applications. Academic Press, New York, 2 edition,
1980. P40TDQ4746(2)-T, P41TDQ4746(2)-T+1 cited by Cline [Cline, 1979] as an excel-
lent textbook for basic matrix theory (there’s a 3rd ed. 1988 [Strang, 1988]).
G. Strang. Linear Algebra and Its Applications. Academic Press, New York, 3 edition,
1988. (3rd ed. not yet appear in UBPB); see the 2nd ed. [Strang, 1980].
120
LITERATURVERZEICHNIS
G. Strang. The fundamental theorem of linear algebra. The American Mathematical
Monthly, 100:848–855, 1993. cited in [Ipsen und Meyer, 1995] P40/61a31.
X. Sun. On elementary unitary and φ-unitary transformations. Technical Report Technical
report DUKE–TR–1995–27, Duke University, Department of Computer Science, 1995.
cf. [Laurie, 1997a,b] [Lehoucq, 1996].
D. Suschowk. Über die gegenseitige Lage zweier linearer Vektorräume. Beyer. Akad. Wiss.
Math.-Nat. Kl. S.-B., pages 15–22, 1956 (1957). cited in [Davis und Kahan, 1970].
B. Szökefalvi-Nagy. Spektraldarstellung linearer Transformationen des Hilbertschen
Raumes. Ergebnisse der Mathematik und ihrer Grenzgebiete; [N.F.],39. Springer, Berlin,
1967. P65TJK1310+4.
R. Takiyama und N. Ono. A least square error estimation of the center and radii of con-
centric arcs. Pattern Recognition Letters, 10(4):237–242, 1989.
B. M. ter Haar Romeny. Introduction to scale-space theory: Multiscale geometric image
analysis. In Conf. on Visualization in Biomedical Computing VBC’96, Hamburg, Germany,
1996. v. et. [ter Haar Romeny, 1999].
B. M. ter Haar Romeny. Scale-space theory for multiscale geometric image analysis. In
CVPR’99 half-day tutorial, 21 June 1999, 1999. v. et. [ter Haar Romeny, 1996]; cites
[Schwartz, 1951, 1966].
B. M. ter Haar Romeny, L. M. J. Florack, A. H. Salden, und M. A. Viergever. Higher order
differential structure of images. Image and Vision Computing, 12(6):317–325, 1994.
S. M. Thomas und Y. T. Chan. A simple approach for the estimation of circular arc center
and its radius. Computer Vision, Graphics and Image Processing, 45:362–370, 1989.
D. J. Tolhurst. The amount of information transmitted aboout contrast by neurons in the
cat’s visual cortex. Visual Neuroscience, 2:409–413, 1989. cited in [Lee, 1996].
C. Tomasi. CS205, Stanford University: Mathematical methods for robotics and vision.
available as http://www.stanford.edu/class/cs205/book.pdf or book.
ps, 1999.
R. Trapp. Stereoskopische Korrespondenzbestimmung mit implizierter Detektion von Ok-
klusionen. PhD thesis, Universität-GH Paderborn, Paderborn, 1998.
S. Umeyama. Least-squares estimation of transformation parameters between two point
patterns. IEEE Transactions on Pattern Analysis and Machine Intelligence, 13(4):376–
380, 1991. cites [Arun et al., 1987].
R. J. Vaccaro, editor. SVD and Signal Processing II: Algorithms, Analysis and Applicati-
ons, volume 2 of SVD and signal processing; 2. Elsevier Science, Delft, The Netherlands,
1991. (P51YCB3194-2) (cited by [van der Veen et al., 1993] [Leach, 1998]) (v. et. [De-
prettere, 1988] [Moonen und De Moor, 1995] ).
A.-J. van der Veen, E. F. Deprettere, und A. L. Swindlehurst. Subspace based signal analy-
sis using singular value decomposition. Proceedings of the IEEE, 81(9):1277–1308, 1993.
(137 references e. g., [Deprettere, 1988] [Vaccaro, 1991] [Scharf, 1991] [Stewart, 1991]).
LITERATURVERZEICHNIS
121
S. Van Huffel. Analysis of the Total Least Squares Problem and Its Use in Parameter Esti-
mation. PhD thesis, Dept. of Electrical Engrg., Katholieke Universiteit Leuven, Leuven,
Belgium, 1987. (cited in [Vandewalle und De Moor, 1988]).
S. Van Huffel. The total least squares technique: Computation, properties and applica-
tions. In E. F. Deprettere, editor, SVD and Signal Processing: Algorithms, Applicati-
ons and Architectures, pages 189–207. Elsevier Science, Delft, The Netherlands, 1988.
P51YCB3194-1 (cited in [Vandewalle und De Moor, 1988]).
S. Van Huffel. Recent advances in total least squares techniques and errors in variables
modeling. In proceedings of the Second International Workshop on Total Least Squares
and Errors-in-Variables Modeling, Leuven, Belgium, Philadelphia Pa., 1997. Society for
Industrial and Applied Mathematics. P40TAY960370.
S. Van Huffel und J. Vandervalle. Algebraic relationships between classical regression and
total least-squares estimation. Linear Algebra and its Applications, 93:149–162, 1987.
Cited in Åke Björck’s bibliography on least squares, which is available by anonymous ftp
from math.liu.se in pub/references.
S. Van Huffel und J. Vandewalle. Subset selection using the total least squares approach
in collinearity problems with errors in the variables. Linear Algebra and its Applications,
88/89:695–714, 1987. Cited in [Golub und Van Loan, 1989].
S. Van Huffel und J. Vandewalle. The Total Least Squares Problem: computational aspects
and analysis. Society for Industrial and Applied Mathematics, Philadelphia Pa., 1991.
P41TIF2870.
J. Vandewalle und B. L. R. De Moor. A variety of applications of singular value decompo-
sition in identification and signal processing. In E. F. Deprettere, editor, SVD and Signal
Processing: Algorithms, Applications and Architectures, pages 43–91. Elsevier Science,
Delft, The Netherlands, 1988. P51YCB3194-1 (cites [Van Huffel, 1987] [Staar, 1982]
[Van Huffel, 1988] [Golub und Van Loan, 1983] [Lawson und Hanson, 1974] ).
S. Venkatesh und R. Owens. An energy feature detection scheme. In Proceedings, IEEE
Int. Conf. on Image Processing, pages 553–557, Singapore, 1989.
S. Venkatesh und P. L. Rosin. Dynamic threshold determination by local and global edge
evaluation. Graphical Models and Image Processing, 75(2):146–160, 1995. (P50/80c6A)
(cites [Canny, 1986] [Rosin und West, 1989] [Sahoo et al., 1988]; v. et. [Rosin, 1995] and
pgmlink).
J. Ville. Théorie et applications de la notation de signal analytique. Cables et Transmission,
2A:61–74, 1948. translated from the French in I. Selin, “Theory and applications of the
notion of complex signal, Tech. Rept. T-92, The RAND Corporation, Santa Monica, CA,
August 1958. v. et. [Gábor, 1946]; cited in [Havlicek et al., 1997].
P.-Å. Wedin. On angles between subspaces of a finite dimensional inner product space.
In B. Kågström und A. Ruhe, editors, Matrix Pencils, pages 263–285, New York, 1982.
Springer. cited in [Ipsen und Meyer, 1995] v. et. [Kågström und Ruhe, 1993].
J. R. Weeks. The Shape of Space: How to Visualize Surfaces and Three-Dimensional
Manifolds. Pure and applied mathematics : a program of monographs, textbooks, and
lecture notes. Dekker, New York, 3 edition, 1985. P41TGT1240.
122
LITERATURVERZEICHNIS
N. Werghi, C. Doignon, und G. Abba. Ellipse fitting and three-dimensional localization of
objects based on elliptic features. IEEE International Conference on Image Processing, 1:
57–60, 1996.
G. Werner und V. B. Mountcastle. Neural activity in mechano-receptive cutaneous af-
ferents: Stimulus-response relations, weber functions, and information transmission. J.
Neurophysiology, 28:359–397, 1965. cited in [Lee, 1996].
H. Weyl. Das asymptotische Verteilungsgesetz der Eigenwert linearer partieller Differen-
tialgleichungen (mit einer Anwendung auf der Theorie der Hohlraumstrahlung). Mathe-
matische Annalen, 71:441–479, 1912.
J. H. Wilkinson. The Algebraic Eigenvalue Problem. Clarendon Press, Oxford, England,
1965a. v. et. [Wilkinson, 1978]; cited in [Lehoucq, 1996].
J. H. Wilkinson. Error analysis of transformation based on the use of matrices of the form
i2wwh. In L. B. Rall, editor, Error in digital computation, volume II, pages 77–101.
John Wiley & Sons, Inc, New York, 1965b. cited in [Golub und Reinsch, 1970a,b].
J. H. Wilkinson. The Algebraic Eigenvalue Problem. Clarendon Press, Oxford, England,
1978. P65TKZ1107+7 (v. et. [Wilkinson, 1965a]).
J. H. Wilkinson. Note on the practical significance of the Drazin inverse. Technical Report
STAN-CS-79-736, Computer Science Department, Stanford University, 1979.
J. H. Wilkinson und C. Reinsch, editors. Linear Algebra vol. II of Handbook for Automatic
Computation. Springer-Verlag, New York, 1971. (“the yellow book”) P41TUA1097-2+2.
J. H. Williamson. Least-squares fitting of a straight line. Canadian Journal Physics, 46:
1845–1846, 1968. v. et. [Pearson, 1901]; cited in [Moniot, 2002].
A. P. Witkin. Scale-space filtering. In Proc. International Joint Conference on Artificial
Intelligence (IJCAI 1983), pages 1019–1023, (Karlsruhe, Germany), 1983. Academic Pres.
E. Witt. Theorie der quadratischen Formen in beliebigen Körpern. Journal für die reine
und angewandte Mathematik, 176:31–44, 1937. v. et. [Witt, 1998]; cited in [Kaplansky,
1974, p. 17].
E. Witt. Theorie der quadratischen Formen in beliebigen Körpern. In I. Kersten, editor,
Collected papers = Gesammelte Abhandlungen: With an essay on Witt vectors / by Günter
Harder, pages 2–15. Springer, Berlin, 1998. P41TAWW1145 v. et. [Witt, 1937]; cited in
[Kaplansky, 1974, p. 17].
J. H. Yoo und I. K. Sethi. An ellipse detection method from the polar and pole definition
of conics. Pattern Recognition, 26:307–315, 1993.
H. K. Yuen, J. Illingworth, und J. Kittler. Detecting partially occluded ellipses using the
hough transform. Image and Vision Computing, 7(1):31–37, 1989. (v. et. [McLaughlin,
1998] [Ho und Chen, 1995]).
H. Zassenhaus. “angles of inclination” in correlation theory. American Mathematical
Monthly, 71:218–219, 1964. cited in [Davis und Kahan, 1970].
T. Y. Zhang und C. Y. Suen. A fast parallel algorithm for thinning digital patterns. Com-
munications of the ACM, 27(3):236–239, 1984. v. et. [Lee und Chen, 1992] (XITE); cited
in [Gonzalez, 1987].
LITERATURVERZEICHNIS
123
S. Q. Zhu. Robust complementarity and its application to robust stabilization. preprint
from the Automation and Robotics Research Institute, University of Texas at Arlington,
Fort Worth, Texas. (cited in [Ipsen und Meyer, 1995]), 1994.
Y. M. Zhu, F. Peyrin, und R. Goutte. The use of a two-dimensional Hilbert transform for
Wigner analysis of 2-dimensional real signals. Signal Proc., 19:205–220, 1990. cited in
[Havlicek et al., 1997].
124
LITERATURVERZEICHNIS
Index
Gnuplot, 88
Khoros, 70, 71
PBM(5), 4, 62
PGM(5), 4, 62
PPM(5), 4, 62
angle03, 14
asc2pgm.c, 88
basis33.c, 31, 56, 83
house(), 56
curvfilt.c, 79, 80, 88, 91
dft.c
-H1, 64
-X, 62
-Y, 62
ellfilt.c, 88
f2c, 17
float.c, 31
g3data.c, 88
gaussian.c, 51, 79, 86
gfilt.c, 65
-A45, 68
-F0.9, 67
-N8, 67
-O0, 67
-Q0.2, 68
-Q3.5, 66
-Q, 68
-b0.5, 66, 68
-l4, 65
-l, 65
-pz0, 67, 68
-s, 60, 61, 68, 69
-t2, 70, 71
-w0.5, 65, 66, 68
-w, 65
ghyper.c, 79
-c, 50, 51, 57, 85, 94
-fl, 85
-s, 51, 57
ginv.c, 14
-D1, 46
-D2, 46
gmagedge.sh
-H, 70, 71, 73
gmat.c
-Z, 33, 34
-h1, 56
-o, 34, 56, 83
house_orth2(), 56
gradedge.sh, 67, 68
-H, 63, 70–72
-L5, 63
gxclock.sh, 66
hm.m, 56
hyper.c, 83, 88
-c, 48, 84, 85, 94
-pB, 37
-s, 84
iir.c, 61, 62
kalmell.c, 88
kdf2pnm.c, 88
lsline2.c
-1, 90
-e, 90
lst2pgm.c, 88
lstfilt.c
-p, 63, 70, 71, 87
m33.c
-pB, 37
mahr.m, 46, 54
matio0.c, 19
matio1.c, 19
matstat.c
-Q1, 83
-i, 14
-mpB, 46, 54
-pB, 37
-pc, 51
125
126
INDEX
-pz, 30
-s0, 83
-t0, 26
-t, 26
-wv, 13
nagy.m, 14
netpbm, 88
pfm2ppm.c, 88
pfmdir.c
-H, 62, 63
-n, 70, 71
pfmgamma.c, 60, 63, 88
-G0.35, 67, 68
pfmgauge.c
-1, 61
-g, 70, 71
pfmpix.c, 88
pgmcanny.c, 60–62, 88
-g, 61, 63, 87
-s1, 63
-s, 62
pgmell.sh, 61, 66
pgmlink.c, 62, 88
-D, 62, 70, 71
l5, 63
pgmpix.c, 88
pgmroi.c, 88
pgmthin.c, 63, 70, 71
phoenix3.c, 88
pinv.c, 14
pnmfilt.c, 2, 78
pose.sh, 61, 88
progress.exe, 78
progress, 78
ranmar.c, 86
ranmar.f, 86
schur2.c
-pm, 46
-s, 83
step2line.m
(500,-1,256), 60
(500,-2,256), 60
svd.c, 83
svdcmp.crp, 17
svdcmp.c, 17
svdsort.c, 22
xclock, 66
KDF(5), 4
PFM(5), 4
PNM(5), 4
VIFF(5), 4
Äquivalenzklasse, 6
Äquivalenzrelation, 6
lstfilt.c
-s, 62
pfmdir.c
-H, 62
pgmlink.c
-D, 62
Abbildung
bijektive, 9
Ableitbarkeit
unendliche, 62
Ableitung, 62
diskrete, 62
Gaußsche, 61
partielle, 63
regularisierte, 61, 62
abzählbar, 30
AC-Anteil, 34
AC-Tailraum, 33
AC-Teilraum, 33, 48, 95
adjungierte Matrix, 38
affine Abbildung, 31, 32
affine Projektion, 83, 95
affine Struktur, 39
affiner Teilraum, 6, 46, 82
affiner Unterraum
Definition, 6
Affinität, 88, 90
algebraische Distanz, 90
Ambiguität, 61
analytisches Bild, 64
analytisches Signal, 64
ANSI C, 17
Apertur, 62
Gaußsche, 62, 63
Approximationssatz, 26
Approximationssatz der SVD, 25
Apriorität, 24
Ariane 5, 45
assoziierter Projektor, 9
assoziierter Reflektor, 9
Ausreißer-Filterung, 77
Ausreißerdetektion, 91
Automorphismus
Reflektoren, 9
Bandbreite, 66
INDEX
127
Definition, 65
Basisnicht-orthogonal, 95
Basisvervollständigung, 56
Basiswechsel, 28
biased estimate, 29
Bijektion, 11
Reflektoren und Projektoren, 9
Bild, 9
Bild-Kern-Zerlegung, 27
Bildraum, 16
Bilinearform, 39, 44
ausgeartete, 6
singuläre, 6
bottom-up, 68
bounds-checking, 17
Box-Muller-Transformation, 86
Butler, Jim, 86
cancellation theorem
Witt, 14
Canny-Detektor, 61
Optimalität, 61
Canny-Rosin-Venkatesh-Verfahren, 63
canonical angles between subspaces, 14
Carmina Burana, 94
Cauchy-Schwarzsche Ungleichung, 44
Cauchy-Schwarzsche-Ungleichung, 47
centering
definition, 29
commuting inverse, 46
core-nilpotent decomposition, 46
covariance matrix, 36
cpi, cycle per image, 65
Dach, 60
data matrix, 28
data mining, 93
Datengeometrie, 93
Datenmatrix, 28
Datenzentrierung, 95
Datenzentrierung als orthogonale Prjektion,
95
DC-Anteil, 34
DC-Filterung, 34
DC-Tailraum, 33
DC-Teilraum, 33, 34, 95
decoupling, 28
defektive Matrix, 24
Dekorrelation, 41
diagonale Matrix, 35
diagonalisierbar, 22, 38
unitär, 38
Diagonalisierung, 70, 71
Dichtheit, 30
Diffusionsgleichung, lineare, 64
direkte Summe, 20
direkte Summe der Singulärräume, 24
Drazin-Inverse, 45, 46
Drehung, 28, 94
Dreiecksungleichung, 44
dualer Projektor, 8
Ebene, 6
Eckart-Young-Mirsky
Approximationssatz, 25
eigenanalyse, 39
Eigenbasis, 38
Eigenraum, 24
Eigenwert, 33
ein-pixel-breit, 59, 70, 71
Eindeutigkeit der SVD, 24
einfache Zelle, 68
Einheitswurzel, 35
Einschränkung, 6, 21
Einseitenband, 64
Elementarreflektor, 11
elementary Hermitian, 11
elementary Hermitians
Householder, 56
elementary reflections
Householder, 56
elementary reflector, 11
Ellipse, 59, 77
Elliptizität der Gabor-Funktion, 68
Endian, 4
Endomorphismus, 8, 9
energiebasiert, 59
Ensamble-Statistik, 29
Entkopplung, 28, 41
EP-Matrix, 9, 16, 46
Ergodizität, 29
erste Funfamentalform, 61
erwartungstreu, 29, 37
euklidischer Raum
Definition, 47
euklisischer Raum, 79
Exception, 31, 45
Faltung, 62
128
INDEX
Federzeichnung, 61
Fehlkorrespondenz, 3
Filterentwurf, 65
Filterung
DC, 34
Flach, 79
Fließkomma-Zahlen, 30
Formhermitesche, 47
symmetrischepositiv-definite bilineare,
47
Fortran, 17
Fourier-Basis, 34, 35
Fourier-Matrix, 35
Fourier-Pixel, 65
Frequenz
Konvention, 65
Frobenius Residuum der SVD, 27
Frobeniusnorm, 25
full rank decomposition, 26
fundamentale äume, 22
fundamentale Unterräume, 20
Fundamentalsatz der linearen Algebra, 20
Fusion, 59, 77
FWHM (full-width-half-maximum), 65
Gabor-Filter
Bandbreite, 65
Gestalt, 65
Mittelfrequenz, 65
Orientierung, 65
Gabor-Filtering, 62
Gabor-Filterung, 66
Gabor-Funktion, 68
Gauß, 43
Gaußhrümmung, 69
Gaußsche Ableitung, 61, 62
Gaußsche Apertur, 62, 63
Gaußsche Dichte, 86
Gaußsche Funktion, 64
Gaußsche Glättung, 62
Interpretation, 62
Gaußsche Regularisierung, 63
Gaußscher Operator, 62
Gaußsches Rauschen, 86
Gaußverteilung, 43
Gaussian derivative, 61, 62
generalizierte Inverse, 20
geometrische Filterung, 77, 91
geometrische Invarianz, 79
geometrische Struktur, 47
geometrische Vorwissen, 80
Gerade, 6, 90
geschlossene Form, 34
Gestalt der linearen Abbildung, 24
Gleitkommazahlen, 45
Golub-Kahan-Reinsch-Algorithmus, 17
Gradient
Definition, 61
gradientenähnlich
Definition, 61
gradientenbasiert, 59
Gram-Schmidt-Orthonormalisierung, 21
Gram-Schmidtsches Verfahren, 56
Gramian matrix, 36
Gramsche Matrix, 36
Grassmann, Hermann, 30
Greensche Funktion, 64
Gruppeninverse, 45
Halbierungsteilraum, 13
Hauptkrümmung, 69
Hauptrichtung, 69
Hauptwinkel zwischen Teilräumen, 14
hermitesch, 15
hermitesches Skalarprodukt, 47
Hermitesches Transponieren, 56
Hesse-Matrix, 70, 71
Definition, 69
Hessian, 70, 71
Hilbert-Schmidt Residuum der SVD, 27
Hilbert-Schmidt-Norm, 25
Hilbert-Transformation, 64
Hilbertraum
Definition, 47
Householder reflector, 11
Householder, Alston Scott, 56
Householder-Reflektor, 54
Householder-Spiegelung, 33, 56
komplexe, 56
Householder-Spieglung, 10
Householder-Transformation, 54, 56
komplexe, 11
Householder-Vektor, 12, 54
HP200LX, 4
HSC, Hierarchical Contour Coding, 64
Hybriden-Konturen, 61
Hyperebene, 79
Hyperkreis, 46, 49, 58, 77, 93
Definition, 49
INDEX
129
Kovarianzmatrix von, 54
Mahalanobis-Distanz von, 58
Visualisierung, 51
hyperkreis-basiert, 77
Hyperzylinder, 49
Hysterese-Schwellenwert-Verfolgung, 70, 71
hyteresis thresholding, 70, 71
idempotent, 8, 15, 32, 60
Idempotenz, 6, 9, 36
Idempotenz-Eigenschaft, 60
der Konturen, 70, 71
Idempotenz-Forderung, 32
ill-posed, 18, 62
ill-posed problem, 18
illusive Konturen, 61, 67, 68
Index, 20
inkonsistent, 29
inkonsistente, 37
Integer, 45
Intensitätsdaten, 77
invariante Teilräume, 10, 16
Invarianz
Mahalanobis-Distanz, 53
regularisierte Mahalanobis-Distanz, 53
Inverse
generalisierte, 20
Invertierung, 45, 77
Involution, 9
Definition, 9
involutorisch, 9, 54
Definition, 9
ISO/ANSI-C, 31
Isometrie, 25
Isomorphismus, 9
Reflektoren und Projektoren, 9
isotropisch, 30
Jordanform, 18
Kamera, 88
kanonische Form, 34
kanonische Winkel zwischen Teilräumen, 14
Kante, 59, 60
Kantendetektion, 59
Kern, 9, 16, 20, 21
Khoros, 4
kleinste Quadrate, 90
kognitive Faktoren, 60
kommutativ
nicht, 47
komplementäre Teilräume, 7
komplementäre Unterräume, 7
komplementärer Projektor, 8, 33
komplementärer Reflektor, 10
komplementäre Teilräume, 95
komplexe Householder-Spiegelung, 56
komplexe Zellen, 62
komplexes Skalarprodukt, 47
Kondensator, 32
konjugiert linear, 47
konjugiert Transponierte, 56
konsistent, 29, 37
Kontur, 59
Definition, 59
Konturen
als syntaktische Struktur, 59
Konturenextraktion
Definition, 59
Güte der, 60
Konturenextraktor
Güte der, 60
Konturenliste, 59
Konturenpixel, 59
Konturenverkettung, 60
Kovarianzmatrix, 2
Definition, 36
Hyperkreis, 54
Kondition, 44
Rang, 95
reguläre, 33
singuläre, 33, 44
Sphäre, 50
Kreis, 59, 77
Kreuz-Korrelation, 13
Kreuzprodukt, 79
Kurzsichtigkeit am Nullvektor, 30
Laplacian, 64
latent semantic indexing, 18
Laurie, Dirk, 56
left nullspace, 21
left singular vectors, 22
linear, 60
lineare Abbildung, 32
lineare Algebra, 30
lineare Diffusionsgleichung, 64
lineare Varietät, 6
linearer Operator, 31
linearer Raum, 30, 39
130
INDEX
Linearisierung, 95
Linearität, 88, 90
Linie, 59, 60
linke Singulärvektoren, 22
linker Nullraum, 20, 21
lokale Energie, 61, 67, 68
Lounesto, Pertti, 14
LSA, 18
LSI, 18
Mahalanobis-Distanz, 5, 39
Definition, 44
Hyperkreis, 58
Invarianz, 53
Sphäre, 52
Mahalanobis-Metrik, 39
Definition, 44
regularisierte, 44
Mannigfaltigkeit, 50
Matrix
defektive, 24
EP, 16
nicht-diagonalisierbare, 24
normale, 16
singuläre, 45
matrix
covariance, 36
Gramian, 36
Metrik, 6, 44, 45
Definition, 44
metrischer Raum
Definition, 44
Vollständigkeit, 44
metrischer Tensor, 39, 44
Minimalwinkel, 8
Mittelfrequenz, 65, 66
mittelwertfrei, 31
mittlere Krümmung, 69
MKGF, 65, 70, 71
ML-Schätzung
Kovarianzmatrix, 37
modifiziertes Gram-Schmidt-Verfahren, 56
Moore-Penrose-Inverse, 2, 18
Nebenklasse, 6
nicht erwartungstreu, 29
nicht-ausgeartete Bilinearform, 30
nicht-diagonalisierbare Matrix, 24
nicht-erwartungstreu, 37
nicht-lineare geometrische Filterung, 77
Nicht-Maximum-Unterdrückung, 70, 71
nicht-orthogonale Raumzerlegung, 94
nicht=zentrierte Datenmatrix, 38
nichtkorrekte Aufgabe, 18
non-maximum-suppression, 70, 71
normale Matrix, 16, 38
normierter Raum
Definition, 44
Nullraum, 16, 20
Nullvektor, 30
Numeriker-Konvention, 47
Nyquist
Definition, 65
oblique projector, 16
Operator
Gaußscher, 62
zentrierender, 32
Optimalität, 61
Orientierungsbandbreite, 67, 68
Definition, 65
Orientierungskarte, 67, 68, 70, 71
Definition, 61
Orientierungssäule, 66
orthogonal, 19
orthogonale Distanz, 90
orthogonale Projektion, 20, 95
orthogonale Raumzerlegungen, 20
orthogonale Regression, 88
orthogonale Spiegelung
Definition, 10
orthogonale Transformation, 18
orthogonaler Projektor
Definition, 8
orthogonaler Reflektor
Definition, 9, 10
orthogonales Komplement, 33
Orthogonalität, 21
orthonormal, 20
Orthonormalbasis, 38
orthonormale Baiss, 22
orthonormales Komplement, 56
Orthoprojektor, 6, 10, 15, 25, 32, 34, 54
Definition, 8
Orthoreflektor, 9, 33, 34
Definition, 9, 10
Ortsfrequenz
Betrag, 65
Konvention, 65
Richtung, 65
INDEX
131
Ortsfrequenzvektor, 65
Parallelität, 5, 24
partielle Isometrie, 21, 25
Patent
U. S. Patent No. 5,301,109, 18
U. S. Patent No. 4,839,853, 18
PCA, 18
periodische Signale, 28
perspektive Projektion, 59, 77
Phase, 13
Phasen-Kongruenz, 60
Physiker-Konvention, 47
PixelDefinition, 59
Polar-Zerlegung, 21, 27
Polarform, 21, 27
Polarisierung, 44
positiv semidefinit, 33
Positiv-Definitheit, 44, 45
Postscript, 63
principal angles between subspaces, 14
principal component analysis, 18
Procrustesproblem, 18
Produkt der Matrizen, 35
Projektor, 10
assoziierter, 9
Definition, 8
dualer, 8
komplementärer, 8
orthogonaler, 54
Projektoren, 7, 20
Propagierungsrichtung, 65
Pseudo-Idempotenz, 60
psychologische Faktoren, 60
Punkt, 79
Punktmenge, 77
quadratische Form, 44
quadratische Matrix, 36
Quadratur-Filtering, 62
Quadratur-Filterung, 60, 61
Quadratur-Funktionen, 64
radiale Bandbreite, 67, 68
Definition, 65
Radikal, 6, 30, 39
Radius-Invarianz, 79
Rangder Datenmatrix, 33
einer zentrierten quadratischen Matrix,
36
Rang einer Kovarianzmatrix, 95
Rang-1-Abwandlung, 32
rang-auflösende Zerlegung, 22
rang-defizient, 18
Rangabfall, 33, 38
Rangabfall einer unitären Matrix, 36
rank-1update, 32
rank-revealing decomposition, 22
Rauschenteilraum, 94
Rauschenunterraum, 94
rechte Singulärvektoren, 22
reduced row echelon form, 46
reduzierte Zeilenstufenform, 46
reelle Zahlen, 30
Reflektor, 9, 10
assoziierter, 9
Definition, 9
komplementärer, 10
orthogonaler
Definition, 10
schiefer, 9
Reflektoren, 7
Regression, 90
robust, 78
reguläre Matrix, 33
regularisierte Ableitung, 61, 62
regularisierte Mahalanobis-Distanz
Definition, 46
Invarianz, 53
regularisierte Mahalanobis-Metrik, 44
regularisierte Mahalanobisdistanz, 2, 3
Regularisierung, 2, 18, 62
Gaußsche, 62, 63
Residuenenergie, 26
restriction, 21
Rezeptivfeld, 68
Richtungsteilraum
des Hyperkreises, 11, 57, 58
des Projektors, 8
des Reflektors, 9
Riemanntensor, 61
Riesz-Transformation, 64
right singular vectors, 22
Robust-Schätzung des Kreises, 89
robuste Modellierung, 91
robuste Regression, 78
Robustheit, 89
Rosser’sche Matrix, 45
132
INDEX
RREF (row reduced echelon form), 46
scale, 62, 64
scale-space, 64, 66
Schätzer, 29
Schätzmittelwert, 29
Schätzmittelwertvektor
Definition, 31
Scharstatistik, 29
Schiefprojektor, 16
schlecht-gestellt, 18, 62
schlechtgestelles Problem, 18
Schlechtgestellheit, 61
schlectgestellt, 62
Schmidt-Eckart-Young-Mirsky
Approximationssatz, 25
Schwerpunkt, 30
Definition, 29
selbst-adjungiert, 15
Semantik, 59
sesquilineares Skalarprodukt, 47
SesquilinearfForm
hermitesche positiv definite, 47
singulär, 45
Singulärräume, 24
Singulärraum, 24
Definition, 24
Dimension von, 24
Singulärspektrum, 26
Singulärvektor, 36
Singulärvektoren, 22
Singulärwert, 33, 36, 38
Singulärwertdarstellung, 24
Singulärwertzerlegung, 20, 33
singular space
definition, 24
singular vectors, 22
Skala, 62, 64
Skala-Raum, 64, 66
Skalarprodukt
aus Norm durch Polarisierung, 44
hermitesches, 47
komplexes, 47
sesquilineares, 47
Skalarproduktes
als Kreuz-Korrelation, 13
SO(n), 94
Sobel-Operator, 62
Sortierung der SVD, 39
spalten-zentrierte Matrix
Definition, 29
Spalten-Zentriertheit, 35
spaltendominant, 28
Spaltenraum, 20
special orthogonal group, 94
Spektral-Residuum, 26
Spektraleigenschaft der Inversion, 45
Spektralinverse, 45
Spektralnorm, 25
Spektralresiduum der SVD, 27
Spektralzerlegung, 22, 34, 38
Spektrum, 35
Spellucci, Peter, 17
Spezialorthogonale Gruppe, 94
Sphäre
Kovarianzmatrix von, 50
Mahalanobis-Distanz von, 52
Spiegelung, 9, 28, 34
Householder, 56
orthogonale
Definition, 10
Standardabweichung, 40
Stationarität, 29
Stereokamerakopf, 88
stochastischer Prozeß
Definition, 29
subunitäre Matrix, 21, 36
Sun Space, 4
SVD, 46
Approximationssatz, 25
Frobenius Residuum der, 27
Golub-Kahan-Reinsch-Algorithmus, 17
Hilbert-Schmidt Residuum der, 27
SVD einer zentrierten Matrix, 36
SVD eines zentrierenden Projektors, 34
Symmetrie, 34, 44
symmetrisch, 33
Syntaktik, 59
syntaktische Strukturierung, 59
Tangentialraum, 39
Teilräume
komplementäre, 7
Teilraum des Gleichstroms, 33
Teilraum des Wechselstroms, 33
Teilraummodellierung, 26
The-winner-takes-it-all, 65
Tiefendaten, 77
TLS, 83
top-down, 68
INDEX
133
Torus, 94
TravelMate, 4
uberzählbar, 30
Übertragungsfunktion, 64
Unbestimmtheit, 65
unbiased estimate, 29
uncommitted sperture, 62
unipotent, 54
unitär, 19, 25
unitär diagonalisierbar, 38
unitär invariante Norm, 25
unitäre Matrix, 36
unitärer Raum, 53
Definition, 47
Unterräume
komplementäre, 7
Ununterbrochenheit, 63
unverzerrt, 37
Vandermonde-Matrix, 35
Verbund-Orts-Fourier-Raum, 65
Verbundgaußverteilung, 42
Verdünnung, 70, 71
Vergenz, 88
vertauschbar, 16, 38
vertauschbare Inverse, 46
vertikale Distanz, 90
verzerrt, 37
verzerrte Schätzung, 29
Vielfachheit der Eigenwerte, 9
Vielfachheit der Singulärwerte, 24
Visualisierung, 50
visuelle Inspektion, 60
Vollrang-Faktorisierung, 26
vollrangig, 26
vollrangige Matrix, 33, 36
Vollrangzerlegung, 26
weißen, 28, 41
weißes Rauschen, 86
Weingarten-Abbildung, 69
whitening, 28, 41
Winkel, 13
Winkel zwischen Bild und Kern, 8
Winkel zwischen Teilräumen, 8
WTIA, 65, 70, 71
Y2K, 45
zeilen-zentrierte Matrix
Definition, 29
Zeilen-Zentriertheit, 35
zeilendominant, 28
Zeilennraum, 20
Zeit-Statistik, 29
Zentrieren
Definition, 29
warum?, 30
zentrierende Abbildung
Definition, 32
zentrierende Matrix, 32
Definition, 32
zentrierender Operator, 36
Definition, 32
zentrierender Projektor
Anwendung, 53
zentrierter Vektor
Definition, 29
Zentriertheit, 35
definition, 29
Zentrierung, 33
Definition, 29
Zentrierung einer Datenmatrix
als eine Projektion, 52
zu sich selbst invers, 54
Zufallsgenerator, 86
Zufallsprozeß
Definition, 29
Zufallsvariable, 29
134
INDEX
Autorenverzeichnis
Abbott und Buck [1990], 50
Abbott [1952], 50
Adelson und Bergen [1985], 65
Afriat et al. [1975], 14, 95
Afriat [1957], 14, 95
Agin [1981], 69
Aguado et al. [1996], 69
Albert [1972], 14
Altmann [1986], 50
Andrews und Pollen [1979], 64
Arun et al. [1987], 18
Axler [1995], ii
Banchoff [1990], 50
Bastiaans [1980], 64
Beltrami [1873], 17, 19
Berry et al. [1994a], 18
Bhattacharya und Kanjilal [1999], 28
Bishop et al. [1973], 64
Bjerhammer [1951a], 14
Bjerhammer [1951b], 14
Björck und Golub [1973], 14
Bookstein [1979], 84
Boullion und Odell [1971], 6, 14, 21, 45
Bovik et al. [1990], 65
Box et al. [1958], 86
Bracewell [1987], 64
Brown [1956], 50
Brown [1982], 78, 91
Büker et al. [1999], 90
Bülow et al. [2000], 64
Cabrera und Meer [1996], 69
Campbell und Meyer [1975], 15, 18, 46
Campbell und Meyer [1979], 14, 16, 18, 21,
24, 25, 27, 45, 46, 54
Canny [1983], 61–63, 70, 71
Canny [1986], 61–63, 70, 71
Chaudhuri und Kundu [1993], 84
Chen et al. [2000], 2, 16, 77, 79–82, 84, 94
Chen [1998], 14
Chen [2001], 14, 47
Cline [1979], 14, 46
Conway und Sloane [1993], 86
Conway und Sloane [1999], 86
Coxeter [1973], 50
Cui et al. [1996], 69
Danielsson [1990], 62
Daugman [1980], 64
Daugman [1985], 64, 65
Daugman [1989], 64
Davis und Kahan [1970], 14, 47, 95
Davis [1958], 14, 47, 95
Deprettere [1988], 18
Deriche [1993], 61, 62
Dewilde und Deprettere [1988], 19
Drazin [1958], 15
Dubrulle [1996], 11
Duran und Odell [1974], 2
Du Val [1964], 50
Eckart und Young [1936], 25
Edelman [1994], 31
Ellis et al. [1992], 69
Everitt [1998], 2
Fan und Hoffman [1955], 18
Fekete [1985], 6, 9, 11
Ficken [1967], 6, 9, 11, 15
Fierro et al. [1997], 83
Fitzgibbon et al. [1996], 69
Florack et al. [1992], 62
Forsythe et al. [1977], 17, 19
Frei und Chen [1977], 61
Furnas et al. [1988], 18
Gander et al. [1994a], 69
Gander et al. [1994b], 69
Gill et al. [1991], 18, 56
Goldberg [1991], 30, 31, 81, 89
Golub et al. [1980], 19
Golub und Kahan [1965], 17, 18
Golub und Reinsch [1970a], 17–19
135
136
AUTORENVERZEICHNIS
Golub und Reinsch [1970b], 17–19
Golub und Van Loan [1980], 83
Golub und Van Loan [1983], 6, 14, 47, 56
Golub und Van Loan [1989], 6
Golub und Van Loan [1996], 6, 18, 19, 21,
27, 47, 56
Gonzalez [1987], 61, 70, 71
Goodwin et al. [1975], 64
Gram [1883], 14, 21, 56
Gray [1980], 30
Gray [1994], 30
Graßmann [1894], 30
Graßmann [1896], 30
Green [1952], 18
Gregory und Karney [1969], 14
Griffel [1989a], 8
Griffel [1989b], 16
Guy und Medioni [1983], 70, 71
Guy und Medioni [1992], 70, 71
Guy und Medioni [1996], 70, 71
Gábor [1946], 64, 65
Hadamard [1923], 18, 45, 61
Hahn [1992], 64
Halmos [1958], 8, 21, 60
Hal´ır und Flusser [1998], 69
Hansen [1987], 18
Hansen [1989], 18
Hansen [1990], 18
Hansen [1998], 18
Hartmann [1982], 64, 66
Hartmann [1983], 66
Havlicek et al. [1997], 64
Havlicek et al. [2000], 64
Heckbert und Garland [1999], 61, 69
Heisenberg [1927], 65
Higham und Knight [1993], 46
Higham [1986], 17, 18, 21, 27
Higham [1995], 14
Higham [1996], 18
Hilbert und Cohn-Vossen [1932], 61, 69
Hilbert und Cohn-Vossen [1952], 61, 69
Ho und Chen [1995], 69
Hohn [1973], 14, 36, 47
Horn und Johnson [1985], i, 18, 25
Hotelling [1933], 18
Householder [1972], 11, 54, 56
Householder [1975], 10, 11, 54, 56
Hubel und Wiesel [1962], 64
Hubel und Wiesel [1974], 64
Hubel und Wiesel [1978], 64
Hurley und Cattell [1962], 18
IEEE [1985], 31, 45, 62, 81, 89
Ipsen und Meyer [1995], 8, 13, 14, 24, 25,
27, 47
Jones und Palmer [1987a], 64
Jones und Palmer [1987b], 64
Jordan [1874a], 17
Jordan [1874b], 17
Jordan [1875], 14
Kahan [1998], 6, 9
Kanatani [1993], 59, 77
Kantorowitsch und Akilow [1978], 47
Kant [1781], 24
Kaplansky [1974], 6, 10, 30, 47, 54, 56
Karhunen [1946], 18
Karl et al. [1994], 69
Kato [1966], 14
Katz [1965], 16
Knuth [1981, 1969], 50, 86
Koecher [1997], 27
Koenderink [1984], 64, 66
Koliha [1999], 16
Kostrikin und Manin [1989], 47
Kovarik [1977], 10, 95
Kovesi [1999], 60
Kovesi [2002], 60
Kuhnert [1976], 14, 18, 24
Landauer und Dumais [1997], 18
Landau [1987], 84
Lathi [1968], iv, 29, 42
Laurie [1997a], 10–12, 54, 56
Laurie [1997b], 10–12, 54, 56
Lawson und Hanson [1974], 18, 24
Le Lann [1997], 45
Lee und Chen [1992], 70, 71
Lehoucq [1996], 11
Lena Sjööblom-Soderberg [1972], 60, 63
Le Lionnais [1984], 86
Lions [1996], 45
Loève [1955], 18
Mahalanobis [1930], 2
Mahalanobis [1936], 2
Marcelja [1980], 64
Marsaglia und Zaman [1987], 86
McLaughlin [1998], 69
Meyer [2000], 10, 14–16, 24, 25, 27, 46, 47
Mirsky [1960], 25
Moonen und De Moor [1995], 18
Moore [1920], 14
Moore [1935], 14
AUTORENVERZEICHNIS
137
Morrone und Owens [1987], 61
Movshon et al. [1978a], 64
Movshon et al. [1978b], 64
Movshon und Tolhurst [1975], 64
Munson [1996], 60, 63
Noble [1976], 18
Opitz [1995], 14
Owens et al. [1989], 61
Pan und Hamdi [1996], 19
Penrose [1955], 15
Penrose [1956], 15
Perona und Malik [1990], 60
Perona und Malik [1991], 60
Peterson [1988], 86
Peyrin et al. [1968], 64
Pollen und Ronner [1981], 64
Porrill [1990], 69, 74
Press et al. [1992], 17, 18
Pringle und Rayner [1971], 46, 54
Rao und Mitra [1971], 6, 14, 45, 46, 54
Rao [1980], 18
Ritov [1992], 14, 47
Rosin und West [1989], 62, 69, 74
Rosin und West [1995], 62
Rosin und West [1997], 62
Rosin [1993a], 69
Rosin [1993b], 69
Rosin [1994], 62
Rosin [1995], 62
Rosin [1996a], 69
Rosin [1996b], 69
Rosser et al. [1951], 45
Rousseeuw [1984], 78, 91
Rousseeuw [1987], 78, 91
Rucker [1987], 50
Rust [1998], 25
Sahoo et al. [1988], 61
Scharf [1991], 18
Schmidt [1907a], 14, 19, 21, 25, 56
Schmidt [1907b], 19, 25
Schwartz und Shaw [1975], 29
Schwartz [1951], 62
Schwartz [1966], 62
Schöneman [1966], 18
Shilov [1971], 14, 47
Shoemake und Duff [1992], 27
Sobel [1990], 62
Späth [1999], 83
Stewart und Sun [1990], 14, 18
Stewart [1963], 8
Stewart [1969], 18
Stewart [1973a], 14
Stewart [1973b], 56
Stewart [1977], 14
Stewart [1991], 18
Stewart [1992a], 22
Stewart [1992b], 18, 19
Stewart [1992c], 18
Stewart [1998], 14, 47
Stewart [1999], 14, 47
Strang [1980], 56
Strang [1993], 22, 24
Sun [1995], 11
Suschowk [1956 (1957], 47
Szökefalvi-Nagy [1967], 6, 14
Takiyama und Ono [1989], 84
Thomas und Chan [1989], 84
Tomasi [1999], 22, 23
Trapp [1998], 1, 2, 65, 69, 77, 80, 81, 88, 89
Vaccaro [1991], 18
Van Huffel [1987], 83
Van Huffel [1988], 83
Van Huffel [1997], 83
Vandewalle und De Moor [1988], 14, 47
Venkatesh und Owens [1989], 61
Venkatesh und Rosin [1995], 62
Ville [1948], 64
Wedin [1982], 14, 47
Weeks [1985], 50
Werghi et al. [1996], 69
Wilkinson und Reinsch [1971], 17
Wilkinson [1965a], 11
Wilkinson [1979], 46
Witkin [1983], 64, 66
Witt [1937], 10, 14, 54, 56
Witt [1998], 10, 14, 54, 56
Yoo und Sethi [1993], 69
Yuen et al. [1989], 69
Zassenhaus [1964], 14, 47
Zhang und Suen [1984], 70, 71
Zhu et al. [1990], 64
ter Haar Romeny et al. [1994], 69
ter Haar Romeny [1999], 62–64, 69
van der Veen et al. [1993], 18
Ben-IsraelundGreville [1974],ii,14–16,21,
25, 27, 45, 46, 54
De Moor et al. [1988], 18
Van Huffel und Vandervalle [1987], 83
Van Huffel und Vandewalle [1987], 83
Van Huffel und Vandewalle [1991], 83
138
AUTORENVERZEICHNIS
Abbildungsverzeichnis
1.1 Intensitätsbild und Tiefenkarte . . . . . . . . . . . . . . . . . . . . . . . . 2
2.1 Komplementäre, duale Projektoren und assoziierte Reflektoren . . . . . . . 7
2.2 Singulärwertzerlegung und fundamentale Räume . . . . . . . . . . . . . . 20
2.3 Geometrische Anschauung der Singulärwertzerlegung . . . . . . . . . . . . 23
2.4 Singulärspektrum und Teilraummodellierung: Beispiel Rathaus . . . . . . . 26
2.5 SVD, Mahalanobis-Metrik und Gaußsche Verbunddichte . . . . . . . . . . 40
2.6 Visualisierung des Hyperkreises durch Projektionen . . . . . . . . . . . . . 51
3.1 Kanten oder Linien: Demonstration eines fließenden Übergangs . . . . . . 60
3.2 Canny-Detektor mit Hysterese-Kantenverkettung: Lena und Rad . . . . . . 63
3.3 Die weitere, mit inbegriffene Dimension der Bild-Struktur . . . . . . . . . 64
3.4 Gabor-Gestaltung und illusive Kontur: Beispiel xclock . . . . . . . . . . 66
3.5 Gabor-Gestaltung und Wahrnehmung illusiver Konturen I . . . . . . . . . . 67
3.6 Gabor-Gestaltung und Wahrnehmung illusiver Konturen II . . . . . . . . . 68
3.7 Lokale Energie via Gabor-Filterung: Beispiel Lena und Rad . . . . . . . . 69
3.8 Konturenextraktion nach der Gabor-Filterung: Beispiel Lena . . . . . . . . 70
3.9 Konturenextraktion nach der Gabor-Filterung: Beispiel Rad . . . . . . . . . 71
3.10 Konturenextraktion nach Gabor-Filterung: Lage-Überprüfung-I . . . . . . . 72
3.11 Konturenextraktion nach Gabor-Filterung: Lage-Überprüfung-II . . . . . . 73
3.12 Ellipsen-Lokalisierung: Beispiele an realen Szenen I . . . . . . . . . . . . 75
3.13 Ellipsen-Lokalisierung: Beispiele an realen Szenen II . . . . . . . . . . . . 76
4.1 Regularisierten Mahalanobis-Distanz und Ausreißer . . . . . . . . . . . . . 78
4.2 Geometrischen Filterung der Ausreißer: Beispiel Rad . . . . . . . . . . . . 80
4.3 Tiefendaten in kritischer Orientierung: Beispiel Rad . . . . . . . . . . . . . 80
4.4 Daten-Fusion mit Ausreißer-Detektion und Filterung . . . . . . . . . . . . 81
4.5 Daten-Fusion ohne Ausreißer-Detektion und Filterung . . . . . . . . . . . 81
4.6 Affinitätsprüfung: Experimentsumgebung . . . . . . . . . . . . . . . . . . 87
4.7 Affinitätsprüfung: Ellipse und Orientierungsschätzung . . . . . . . . . . . 87
4.8 Affinitätsprüfung: Kreislokalisierung in kritischer Lage . . . . . . . . . . . 89
4.9 Affinitätsprüfung: Animation der Schätzungen . . . . . . . . . . . . . . . . 90
4.10 Affinitätsprüfung: Vergleich verschiedener Auflösungen . . . . . . . . . . . 91
4.11 Affinitätsprüfung: Residuen der linearen Schätzungen . . . . . . . . . . . . 91
5.1 Nicht-Orthogonale Raumzerlegung zur Schätzung des Rauschunterraums . 95
139