scieee Science in your language
[en] (orig)
Matthias Wahn
Implementierung und Test
des Variationellen EXX-Verfahrens
X
X
X
Implementierung und Test
des Variationellen EXX-Verfahrens
Matthias Wahn
Dissertation
zur Erlangung des akademischen Grades
DOCTOR RERUM NATURALIUM
vorgelegt dem
Department Physik der Fakult¨
at f¨
ur Naturwissenschaften
an der Universit¨
at Paderborn
X
Tag der Einreichung: 15.5.2009
Tag der m¨
undlichen Pr¨
ufung: 22.6.2009
Promotionskommission:
Professor Dr. Klaus Lischka (Vorsitzender)
Professor Dr. Wolf Gero Schmidt (1. Gutachter)
Professor Dr. J¨
org Neugebauer (2. Gutachter)
Dr. Harald Herrmann
TEXT IN WHITE in order to keep this page empty
produced using L
A
T
EX 2ε
Kurzbeschreibung
In der vorliegenden Arbeit wurde das variationelle EXX-Verfahren (varEXX) [78,79,80]
in einen Pseudopotential-Ebene-Wellen-Code (S/PHI/nX [81,82]) implementiert, und die
Methode zuvor nur an lokalisierten Systemen getestet so erstmalig auch f¨
ur peri-
odische Strukturen verf¨
ugbar gemacht. Anschließend durchgef¨
uhrte Tests an verschiede-
nen Halbleitermaterialien zeigten, dass varEXX die ben¨
otigte Rechenzeit im Vergleich zur
herk¨
ommlichen, numerisch ¨
außerst aufwendigen Formulierung des EXX-Verfahrens dra-
stisch reduziert, dabei jedoch nur einen Bruchteil des Speicherplatzes ben¨
otigt.
Als Beispiel f¨
ur die auf diese Weise deutlich erweiterten Anwendungsm¨
oglichkeiten
des EXX-Formalismus wurde untersucht, ob sich exakte Austauschpotentiale ann¨
ahernd
linear in Abh¨
angigkeit von der Ladungsdichte verhalten, was von großer Bedeutung f¨
ur
die Verwendung von EXX-Pseudopotentialen ist. Es konnten erstmals DFT-Berechnungen
mit exaktem Austauschpotential f¨
ur GaN und InN durchgef¨
uhrt werden, bei denen die
komplette semi-core-Schale der Kationen (3. Schale bei Ga, 4. Schale bei In) explizit in
der Valenz ber¨
ucksichtigt wird. Diese wurden anschließend mit Rechnungen, die nur die
3d- bzw. 4d-Elektronen als Valenzelektronen behandeln, verglichen.
Ein weiterer Fokus der Arbeit lag auf der Entwicklung eines Konstruktionsschemas
f¨
ur ab-initio-Parameter im Modell starker Bindung (Tight-Binding-Modell) [122]. Die Me-
thode basiert auf dem Konzept der Verallgemeinerten Wannier-Funktionen von Marza-
ri und Vanderbilt [116], und erlaubt es, die elektronische Struktur (Eigenenergien und
Eigenzust¨
ande) sehr großer Systeme mit mehreren Tausend Atomen in der Genauig-
keit atomistischer Berechnungen auszuwerten. Dies kann etwa zur Berechnung der opti-
schen Eigenschaften von Quantenpunkten eingesetzt werden, wobei dann auf DFT-EXX-
Berechnungen zur¨
uckgegriffen werden kann, um eine korrekte Beschreibung der Bandl¨
ucke
zu gew¨
ahrleisten. Im Rahmen dieser Arbeit wurden effektive ab-initio-Parameters¨
atze f¨
ur
das GaN- und InN-Volumensystem entwickelt und hinsichtlich ihrer Eignung zur Beschrei-
bung der Bandstruktur sorgf¨
altig getestet.
V
X
Abstract
In the present thesis, the variational EXX method (varEXX) [78,79,80] has been imple-
mented into a pseudopotential plane-wave code (S/PHI/nX [81,82]). So far this method
has been applied only for localized systems. By integrating it into the plane-wave frame-
work it has been made applicable to periodic systems for the first time. The conventional
approach of EXX is computationally very demanding. Subsequently performed tests of
the new method indicate that varEXX allows a tremendous performance speed up while
only a fraction of the memory consumption is required compared to the conventional EXX
formulation.
The efficient formulation of varEXX allows for a wide range of new applications. As
an example it has been investigated whether exact exchange potentials can be considered
as approximate linear functionals of the electron density. This is of significant importance
concerning the practical use of EXX pseudopotentials. For the first time, DFT calculati-
ons using exact exchange pseudopotentials could be performed for GaN and InN with the
complete semi-core-shell of the cations (3rd shell for Ga, 4th shell for In) being treated ex-
plicitly in the valency. Thereafter the results have been compared with those of calculations
considering only the semi-core 3d- and 4d-electrons in the valency, respectively.
A second focus of the thesis is the development of a generation scheme for ab-initio
tight-binding parameters [122]. The method employs the formalism of Generalized Wannier-
Functions introduced by Marzari und Vanderbilt [116] and allows for a calculation of the
electronic structure (eigenenergies and eigenstates) of huge systems with several thousands
of atoms within the accuracy of the atomistic scale. This can be used for a computation
of the optical properties of quantum dots based on foregoing DFT-EXX calculations in
order to guarantee a correct description of the bandgap. Within the scope of this work
effective ab-initio parametrizations for the GaN and InN bulk system have been deve-
loped and carefully tested with regard to their ability to an accurate description of the
bandstructure.
VII
X
Inhaltsverzeichnis
Einleitung 1
I Exakter Austausch 7
1 Das Vielteilchenproblem 9
1.1 Born-Oppenheimer-N¨
aherung . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2 Das Variationsprinzip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3 Das Hartree-Fock-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4 Dichtefunktional-Theorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.1 Die Hohenberg-Kohn-Theoreme . . . . . . . . . . . . . . . . . . . . 17
1.4.2 Die Kohn-Sham-Gleichungen . . . . . . . . . . . . . . . . . . . . . . 18
1.4.3 Levy’s Constraint-Search-Formulierung der DFT . . . . . . . . . . . 21
1.5 Das Austausch-Korrelations-Funktional . . . . . . . . . . . . . . . . . . . . 22
1.5.1 Definition von Austausch- und Korrelationsenergie in der DFT . . . 22
1.5.2 Lokale Dichten¨
aherung und verwandte Funktionale . . . . . . . . . 23
1.5.3 Selbstwechselwirkungskorrektur . . . . . . . . . . . . . . . . . . . . 24
1.5.4 Exakte Darstellung des Austausch-Korrelationsfunktionals als St¨
orrei-
he . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.6 Exakte Austauschpotentiale . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.6.1 Das Standard-EXX-Verfahren . . . . . . . . . . . . . . . . . . . . . 28
1.6.2 Das OEP-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.6.3 St¨
orungstheoretische Herleitung der OEP/EXX-Gleichung . . . . . 32
2 Das variationelle EXX-Verfahren 35
2.1 Idee und mathematische Formulierung . . . . . . . . . . . . . . . . . . . . . 36
2.2 ¨
Aquivalenz des variationellen Ansatzes zu OEP und Standard-EXX . . . . . 38
2.3 Variation an Stelle direkter Inversion . . . . . . . . . . . . . . . . . . . . . 39
2.4 Variationelles EXX und Hartree-Fock-Verfahren . . . . . . . . . . . . . . . 40
3 Methoden zur numerischen Beschreibung periodischer Systeme 43
3.1 Symmetrien und periodische Randbedingungen . . . . . . . . . . . . . . . . 44
3.2 Numerische Integration in der Brillouin-Zone . . . . . . . . . . . . . . . . . 45
3.3 Entwicklung nach ebenen Wellen . . . . . . . . . . . . . . . . . . . . . . . . 46
3.4 N¨
aherung der starren R¨
umpfe . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.5 Pseudopotentiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.5.1 Konstruktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.5.2 Kleinman-Bylander-Darstellung . . . . . . . . . . . . . . . . . . . . . 53
IX
X INHALTSVERZEICHNIS
3.5.3 Nicht-lineare Rumpfkorrektur . . . . . . . . . . . . . . . . . . . . . 53
4 Implementierung 55
4.1 Die Sternheimer-Gleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.1.1 Numerische L¨
osung der Sternheimer-Gleichung: Umformulierung in
ein Minimierungs-Problem . . . . . . . . . . . . . . . . . . . . . . . 56
4.1.2 Minimierungsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.1.2.1 Methode des steilsten Abstiegs (Steepest Descent) ..... 60
4.1.2.2 Methode der konjugierten Gradienten (Conjugate Gradi-
ent) ............................... 63
4.1.2.3 Pr¨
akonditionierung . . . . . . . . . . . . . . . . . . . . . . 65
4.2 Induzierte Ladungsdichte . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.3 Minimierung der induzierten Ladungsdichte . . . . . . . . . . . . . . . . . . 69
4.3.1 Mixing, Selbstkonsistenz und Minimierung . . . . . . . . . . . . . . 72
4.3.2 Pulay-Mixing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.3.3 Pr¨
akonditionierung . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.4 Der nicht-lokale Austauschoperator in ebenen Wellen . . . . . . . . . . . . 78
4.4.1 Behandlung der Singularit¨
at . . . . . . . . . . . . . . . . . . . . . . 78
4.4.2 Symmetrisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.5 Variationelles EXX als selbstkonsistenter Zyklus . . . . . . . . . . . . . . . 81
4.5.1 Optimierung des Algorithmus . . . . . . . . . . . . . . . . . . . . . 82
4.5.2 Variationelles und Standard-EXX: Ein Vergleich des Iterationspro-
zesses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.6 Symmetriegen¨
aherte EXX-Methode . . . . . . . . . . . . . . . . . . . . . . 86
4.6.1 Exakte Symmetrisierung beim Standard-EXX-Verfahren . . . . . . 87
4.6.2 Symmetriegen¨
ahertes Standard-EXX-Verfahren . . . . . . . . . . . 88
4.6.3 ¨
Ubertragung auf das variationelle EXX-Verfahren . . . . . . . . . . 90
5 Variationelles und Standard-EXX: Ein Leistungsvergleich 93
6 Physikalische Bedeutung der induzierten Ladungsdichte 97
7 EXX-Pseudopotentiale: Linearisierung der Austauschwechselwirkung 101
II Wannier-Funktionen 109
8 Verallgemeinerte Wannier-Funktionen als lokalisierte ab-initio-Basis
im Modell starker Bindung 111
8.1 Verallgemeinerte Wannier-Funktionen . . . . . . . . . . . . . . . . . . . . . 112
8.1.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
8.1.2 Lokalisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
8.1.3 Maximale Lokalisierung . . . . . . . . . . . . . . . . . . . . . . . . . 115
8.1.4 Initialisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
8.2 Ab-initio-Parametrisierung im Modell starker Bindung . . . . . . . . . . . 118
8.3 Lokalisierung kein Maß f¨
ur die G¨
ute der Basis . . . . . . . . . . . . . . . . 119
8.4 Optimierte Wannier-Basen f¨
ur GaN und InN . . . . . . . . . . . . . . . . . 124
Zusammenfassung und Ausblick 129
INHALTSVERZEICHNIS XI
Anh¨
ange 133
A Fourier-Entwicklungen einiger wichtiger Gr¨
oßen 135
A.1 Das Coulomb-Potential . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
A.2 Der nicht-lokale Austauschoperator . . . . . . . . . . . . . . . . . . . . . . 135
A.3 Die lineare Antwort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
B Die Greensche Funktion 140
C Die Sternheimer-Gleichung 143
C.1 Die Sternheimer-Gleichung aus dem Variationsprinzip von Ritz . . . . . . . 143
C.2 Entartung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
C.3 Die Sternheimer-Gleichung mit nicht-hermiteschem H0...........146
D Tensordarstellung der EXX-Methode 149
E Verallgemeinerung des EXX-Formalismus auf N-darstellbare
Ladungsdichten 154
F Symmetriegen¨
ahertes EXX: Herleitung der variationellen
Formulierung 156
G Die OEP/EXX-Gleichung aus dem Vielteilchenansatz von G¨
orling
und Levy 158
H Verallgemeinerte Wannier-Funktionen 164
H.1 Translation um einen Gittervektor . . . . . . . . . . . . . . . . . . . . . . . 164
H.2 Aktualisierung der ¨
Uberlapp-Matrix . . . . . . . . . . . . . . . . . . . . . . 164
H.3 Der Hamilton-Operator in der Darstellung Verallgemeinerter Wannier-Funk-
tionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
H.4 Berechnung der Ein-Teilchen-Energien aus der Wannier-Darstellung . . . . 166
Literaturverzeichnis 169
Danksagung 177
X
Einleitung
Warum exakte Austauschpotentiale”?
Der Kohn-Sham-Formalismus der Dichtefunktional-Theorie (DFT) [1,2] ist die zurzeit
wohl am weitesten verbreitete Methode f¨
ur ab-initio-Berechnungen1im Bereich der Fest-
k¨
orperphysik. Obwohl er eine prinzipiell exakte Methode darstellt, ist man in der Praxis
jedoch bislang2auf N¨
aherungen angewiesen, wie etwa der Lokalen Dichte-Approxima-
tion (LDA) oder den verschiedenen Varianten der Generalisierten Gradientenkorrekturen
(GGA). Zwar gestatten diese Ans¨
atze sehr effiziente Berechnungen der Gesamtenergie
eines Systems im Grundzustand und anderer damit zusammenh¨
angender Gr¨
oßen dar-
auf begr¨
undet sich der große Erfolg der DFT —, allerdings besitzen sie auch eine Reihe
schwerwiegender Nachteile. Konzeptionell ist die DFT eine reine Grundzustandstheorie;
die mit ihr berechneten Ein-Teilchen-Energien lassen sich streng genommen nicht als rea-
le Gr¨
oßen interpretieren. So werden etwa in LDA die Bandl¨
ucken von Halbleitern und
Isolatoren um bis zu ¨
uber 100% untersch¨
atzt (vgl. Abb. 1und 2). Ein weiterer Punkt
ist die falsche Asymptotik des Kohn-Sham-Potentials endlicher Systeme, als Folge dar-
aus wiederum erscheinen z.B. eine Reihe experimentell stabiler, negativ geladener Ionen
(H, O, F,...) in LDA als unstabil [3,4,5]. F¨
ur einige ¨
Ubergangsmetalle mit dn2s2-
Konfiguration liefert ferner die Lokale Spin-Dichte-Approximation (LSD) f¨
alschlicherwei-
se die dn1s1-Konfiguration [6]. Schließlich sei aufgef¨
uhrt, dass das exakte Kohn-Sham-
Potential (genauer: dessen Austauschanteil, siehe unten) in Abh¨
angigkeit von der Beset-
zungszahl eine so genannte Ganzzahl-Diskontinuit¨
at” aufweist, die in LDA/GGA nicht
beschrieben werden kann [7,8].
Mit Ausnahme des letzten Punktes ist die Ursache f¨
ur die erw¨
ahnten Schwierigkeiten
in der elektronischen Selbstwechselwirkung zu suchen [5]: Im Kohn-Sham-Formalismus
wird das reale System zun¨
achst auf ein fiktives System wechselwirkungsfreier Teilchen
abgebildet. Sie bewegen sich in einem effektiven, lokalen Potential (dem Kohn-Sham-
Potential), das alle elektronischen Wechselwirkungen des realen Systems in geeigneter
Weise ber¨
ucksichtigt. Eine korrekte Formulierung muss dabei beachten, dass ein einzel-
nes Elektron nur mit der Ladungsverteilung der anderen Elektronen, jedoch nicht mit
sich selbst wechselwirkt. So enth¨
alt das effektive Potential zus¨
atzlich zum Hartree-Term,
der die elektrostatische Energie der gesamten Ladungsdichte beschreibt, noch das so ge-
nannte Austausch-Korrelationspotential, dessen Austauschanteil bei exakter Beschreibung
die in der elektrostatischen Energie enthaltene elektronische Selbstwechselwirkung wieder
kompensiert. Diese Kompensation gelingt jedoch mit den in LDA und GGA gemachten
1Es werden nur die Naturkonstanten und die Geometrie des Systems zu Grunde gelegt, d.h., man
verwendet dabei keine empirischen oder angepassten Parameter.
2Tats¨
achlich besteht nur sehr wenig Aussicht darauf, bei praktischen Anwendungen der DFT jemals auf
N¨
aherungsans¨
atze verzichten zu k¨
onnen.
1
2 Einleitung
LDA
EXX
Ge
Si
GaAs
AlAs
SiC
GaN
AlN
C
0
2
4
6
0
2
4
6
theoretische Bandlücke [eV]
experimentelle Bandlücke [eV]
Abbildung 1: Vergleich der LDA- und EXX-
Bandl¨
ucken verschiedener Halbleiter mit den ex-
perimentellen Werten. Nach St¨
adele et al. [52].
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0
-0.5
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
LDA
LDA+ G0W0
OEPx(cLDA)
OEPx(cLDA)+ G0W0
CdS
zb-GaN
ZnO
ZnS
CdSe
ZnSe
InN
Ge
wz-GaN
experimentelle Bandlücke [eV]
theoretische Bandlücke [eV]
Abbildung 2: Vergleich theoretischer und ex-
perimenteller Bandl¨
ucken. OEPx(cLDA) be-
zeichnet hier EXX-Berechnungen mit LDA-
Korrelation. Die LDA- und OEPx(cLDA)-Ergeb-
nisse dienen zudem als Startpunkt einer GW -
Rechnung (+GW ). Nach Rinke et al. [171,175].
N¨
aherungsannahmen nur unvollst¨
andig.
Aus diesem Grund wurden verschiedene, ¨
uber LDA/GGA hinausgehende Methoden
entwickelt. Bei Selbstwechselwirkungskorrektur-Methoden (SIC) [5] etwa wird versucht,
die unvollst¨
andige Kompensation der Selbstwechselwirkung durch zus¨
atzliche Terme wie-
der auszugleichen. Vor allem bei lokalisierten Systemen f¨
uhrt SIC h¨
aufig zu einer deut-
lich verbesserten Beschreibung, der Zugang ist jedoch nicht invariant gegen¨
uber unit¨
aren
Transformationen der Wellenfunktionen, d.h. die Systembeschreibung ist abh¨
angig von der
Wahl der Basisfunktionen.
Ein sehr erfolgreiches Instrument zur Berechnung von Bandstrukturen ist ferner die
Quasiteilchen-Theorie in Gestalt der GW -N¨
aherung von Hedin [150,151], die es erlaubt,
Ergebnisse einer DFT-N¨
aherungsrealisierung mit st¨
orungstheoretischen Methoden zu ver-
bessern. Die Methode ist rechentechnisch sehr aufwendig, liefert aber wesentlich genauere
Bandl¨
ucken als LDA/GGA. Da GW in der Regel nicht selbst-konsistent betrieben wird,
h¨
angt die Genauigkeit der Resultate von der G¨
ute der Eingangsdaten ab. Es ist daher sinn-
voll, elektronische Strukturen bereits innerhalb der DFT m¨
oglichst genau bestimmen zu
k¨
onnen. Eine geeignete M¨
oglichkeit dazu er¨
offnete sich mit der Entwicklung des Exakten-
Austausch-Verfahrens (EXX) [41,47,51,52], das auch den Schwerpunkt der vorliegenden
Arbeit bildet. Die Kombination von EXX und GW erweist sich als ¨
außerst pr¨
azise Strategie
zur Bestimmung von Bandstrukturen (vgl. Abb. 2) und ist seit j¨
ungster Zeit Gegenstand
intensiver Forschung [170,171,172,173,174,175].
Das EXX-Verfahren erm¨
oglicht die Konstruktion des exakten DFT-Austauschpoten-
tials. Dies hat gegen¨
uber der Verwendung von N¨
aherungspotentialen zwei entscheidende
Vorteile: (i) Innerhalb der Austausch-Korrelationswechselwirkung kommt dem Austausch-
anteil die dominierende Rolle zu: er ¨
ubertrifft die Korrelationsenergie um typischerweise
eine Gr¨
oßenordnung [44,45,46]. (ii) Die exakte Kenntnis des Austauschpotentials gen¨
ugt,
Einleitung 3
um die elektronische Selbstwechselwirkung vollst¨
andig zu eliminieren. Formal greift der
Formalismus dabei zur¨
uck auf das Austauschfunktional der Hartree-Fock-Theorie [12,13],
in der die Selbstwechselwirkung konzeptionell in v¨
ollig korrekter Weise gehandhabt wird.
W¨
ahrend jedoch das Hartree-Fock-Verfahren auf ein nicht-lokales, orbitalabh¨
angiges Aus-
tauschpotential f¨
uhrt, ist das EXX-Potential lokal, in ¨
Ubereinstimmung mit dem Ansatz
des Kohn-Sham-Formalismus. Anders als beim Hartree-Fock-Verfahren, das Bandl¨
ucken
typischerweise um einen Faktor 2 3 ¨
ubersch¨
atzt, findet man zudem eine sehr gute ¨
Uber-
einstimmung der in EXX berechneten Bandl¨
ucken mit den experimentellen Werten [52]
(vgl. Abb. 1). Als entscheidender Nachteil des EXX-Formalismus erweist sich allerdings
der enorme technische Aufwand, der zu seiner numerischen Realisierung erforderlich ist,
sowohl hinsichtlich der ben¨
otigten Speicherkapazit¨
at als auch in Bezug auf die Rechenzeit
(im Vergleich mit entsprechenden LDA/GGA-Rechnungen betr¨
agt der Mehraufwand 2 3
Gr¨
oßenordnungen). So ist u.a. die Greensche Funktion und der lineare Antwortoperator zu
berechnen, wozu neben den letzlich interessierenden besetzten Zust¨
anden auch unbesetze
Zust¨
ande ber¨
ucksichtigt werden m¨
ussen. Bei realistischen Berechnungen von Halbleiter-
kristallen, etwa GaAs oder Gruppe-III-Nitriden, findet man dabei typischerweise, dass auf
jeden besetzten Zustand ca. 100 unbesetzte Zust¨
ande kommen. Dies beschr¨
ankt die An-
wendungsm¨
oglichkeiten dieses Verfahrens auf einfachste Kristallstrukturen (mit weniger
als etwa 5 Atomen pro Einheitszelle).
Es wurde jedoch 2002 von Wahn und Neugebauer [78] sowie 2003 von K¨
ummel und
Perdew [79,80] eine alternative Formulierung des EXX-Formalismus vorgeschlagen, die
g¨
anzlich ohne unbesetzte Zust¨
ande auskommt. Das EXX-Potential wird dabei mit Hilfe
variationeller Algorithmen bestimmt, weshalb dieser Zugang im Folgenden als variatio-
nelles EXX-Verfahren (varEXX) bezeichnet werden soll. Im Vergleich zur urspr¨
unglichen
Fassung der EXX-Methode ist varEXX nicht nur vollkommen konsistent mit dem Konzept
der DFT als einer reinen Grundzustandstheorie, sondern erlaubt eine wesentliche Reduk-
tion des numerischen Aufwandes; die Konstruktion der Greenschen Funktion und des
linearen Antwortoperators entf¨
allt v¨
ollig. Dar¨
uber hinaus l¨
asst sich die Schl¨
usselgr¨
oße des
varEXX-Konzepts, die induzierte Ladungsdichte”, in einfacher und anschaulicher Weise
physikalisch interpretieren. Das neue Verfahren ist bisher erfolgreich im Falle von Ato-
men [78,79] und Clustern [80] getestet worden.
Ziele der Arbeit
Hauptanliegen der vorliegenden Arbeit war es nun, varEXX in den Pseudopotential-Ebe-
ne-Wellen-Code S/PHI/nX [81,82] zu implementieren, um die Methode so erstmalig auch
f¨
ur die Anwendung auf periodische Systeme verf¨
ugbar zu machen. Der Algorithmus wur-
de dann an einer Reihe von Halbleitermaterialien getestet und seine Effizienz (CPU-
Zeit, Speicheranforderungen) mit der der uspr¨
unglichen EXX-Formulierung verglichen.
Dabei konnte auf eine bereits in S/PHI/nX vorhande Implementierung des Standard-
EXX-Verfahrens3zur¨
uckgegriffen werden.
Durch den neuen Code er¨
offnet sich nun die M¨
oglichkeit, Fragestellungen anzugehen,
die ¨
uber das bisher mit dem Standard-EXX-Verfahren Machbare hinausausgehen. Als ein
Beispiel daf¨
ur wurde in dieser Arbeit untersucht, ob das exakte Austauschpotential ein
(zumindest ann¨
ahernd) lineares Funktional der Ladungsdichte ist. Dies ist von großer
Bedeutung insbesondere im Hinblick auf die Verwendung von EXX-Pseudopotentialen,
3Es handelt sich dabei allerdings um eine N¨
aherung des Standard-EXX-Verfahrens, die numerisch effi-
zienter als das exakte Verfahren realisiert werden kann.
4 Einleitung
bei denen ein Teil der so genannten semi-core-Elektronen als Valenzelektronen behandelt
wird, der andere Teil jedoch im Rumpf verbleibt.
Ein weiterer Fokus dieser Arbeit lag auf der Entwicklung einer Methode zur Kon-
struktion von ab-initio-Parametern im Tight-Binding-Modell. Der Zugang erlaubt es, die
Genauigkeit von Berechnungen auf atomistischer Skala (etwa Berechnungen in EXX oder
EXX+GW4) auf die Behandlung von Systemen mesoskopischer Gr¨
oßenordnung zu ¨
uber-
tragen. So lassen sich etwa die optischen Eigenschaften von Quantenpunkten untersuchen,
die wegen der großen Anzahl beteiligter Atome (typischerweise 103bis 105) einerseits
nicht mehr in einem vollst¨
andigen Basissatz (ebene Wellen, LAPW, ...) gehandhabt wer-
den k¨
onnen, f¨
ur die andererseits aber auch eine genaue Beschreibung der elektronischen
Struktur (d.h., der Eigenwerte und Eigenzust¨
ande) vonn¨
oten ist.
Aufbau der Arbeit
Der erste Teil der Arbeit ist der variationellen Formulierung des Exakten-Austausch-
Verfahrens (varEXX) sowie dessen Implementierung und Anwendung gewidmet.
In Kapitel 1wird zun¨
achst die Austauschenergie sowie die elektronische Selbstwechsel-
wirkung im Rahmen des Hartree-Fock-Formalismus definiert. Anschließend wird eine kurze
Einf¨
uhrung in die Dichtefunktional-Theorie gegeben. Es wird gezeigt, wie sich das quanten-
mechanische Vielteilchenproblem mit Hilfe der Hohenberg-Kohn-Theoreme in Form einer
effektiven Ein-Teilchen-Gleichung (der Kohn-Sham-Gleichung) schreiben l¨
asst, und es wer-
den die g¨
angigsten N¨
aherungsrealisierungen des Austausch-Korrelationsfunktionals (LDA
und GGA) vorgestellt. Einen mathematisch strengeren, dabei aber sogar anschauliche-
ren Zugang zur DFT bietet die Constraint-Search-Formulierung von Levy; sie erm¨
oglicht
dar¨
uber hinaus die Ableitung einer exakten Reihenentwicklung des Austausch-Korrela-
tionspotentials (G¨
orling-Levy-St¨
orungstheorie), die allerdings außerordentlich kompliziert
ist. Schließlich wird gezeigt, wie ein Abbruch dieser Reihe nach dem linearen Glied auf
den (Standard-)EXX-Formalismus f¨
uhrt.
In Kapitel 2wird das variationelle EXX-Verfahren eingef¨
uhrt. Es wird die zentrale
Gr¨
oße des Konzepts, die induzierte Ladungsdichte” definiert und ihr Zusammenhang zum
EXX-Potential ¨
uber ein Variationsprinzip formuliert. ¨
Uberdies wird erl¨
autert, wie es mit
vergleichsweise einfachen variationellen Methoden gelingen kann, den komplizierten Zu-
sammenhang zwischen Austauschpotential und Ladungsdichte zu erfassen, ohne dabei auf
unbesetzte Zust¨
ande und aufwendig zu berechnende Gr¨
oßen wie der Greenschen Funktion
oder der linearen Antwort (siehe oben) zur¨
uckgreifen zu m¨
ussen.
Kapitel 3stellt das notwendige R¨
ustzeug zur numerischen Beschreibung periodischer
Systeme zur Verf¨
ugung, insbesondere mit Hinblick auf die Verwendung einer Ebene-
Wellen-Basis. Dabei wird auch das Konzept der Pseudopotentiale kurz skizziert.
Kapitel 4beschreibt detailliert die Implementierung des variationellen EXX-Verfahrens
in das DFT-Programm-Paket S/PHI/nX. Zun¨
achst wird die Sternheimer-Gleichung, d.i.
die Grundgleichung der Rayleigh-Schr¨
odingerschen St¨
orungstheorie in 1. Ordnung, als Mi-
nimierungsaufgabe formuliert, und es werden geeignete numerische Minimierungsverfahren
sowie Pr¨
akonditionierungen diskutiert. Dies erm¨
oglicht die effiziente Berechnung der in-
duzierten Ladungsdichte. Als elegante M¨
oglichkeit, aus dieser Gr¨
oße das EXX-Potential
zu erhalten, werden ferner Mixing-Verfahren diskutiert. Schließlich wird die Optimierung
4Es ist dabei allerdings zu beachten, dass die GW -Methode nur Quasiteilchen-Energien, aber keine
Zust¨
ande liefert.
Einleitung 5
des Codes beschrieben und bereits auf M¨
oglichkeiten zur weiteren Steigerung der Effizienz
hingewiesen.
In Kapitel 5folgt ein tabellarischer Vergleich zwischen der Leistung (CPU-Zeit, Spei-
cherbedarf) des varEXX-Verfahrens und der des Standard-EXX-Verfahrens.
Eine anschauliche Interpretation der induzierten Ladungsdichte und ihr Bezug zur
elektronischen Selbstwechselwirkung wird in Kapitel 6anhand der Beispiele GaAs und Si
aufgezeigt.
Kapitel 7untersucht, ob das exakte Austauschpotential n¨
aherungsweise eine lineare
Abh¨
angigkeit von der Ladungsdichte aufweist (siehe oben). Die Resultate werden mit den
Ergebnissen von LDA+GW -Rechnungen nach Rohlfing et al. [152] verglichen und hin-
sichtlich ihrer Bedeutung f¨
ur die Verwendung von EXX-Pseudopotentialen in zuk¨
unftigen
Berechnungen diskutiert.
Der zweite Teil der Arbeit besch¨
aftigt sich mit der Konstruktion von ab-initio-Parame-
tern im Rahmen des Tight-Binding-Modells (siehe oben). Dazu wird zun¨
achst eine kurze
Einf¨
uhrung in die Theorie der Verallgemeinerten Wannier-Funktionen nach Marzari und
Vanderbilt [116] gegeben, um darauf aufbauend das Konstruktionsschema f¨
ur die ab-initio-
Parametrisierung gem¨
Wahn und Neugebauer [122] herzuleiten. Das Verfahren wird an
den Halbleitern GaAs, GaN und InN getestet, die Ergebnisse werden kritisch diskutiert.
Es schließen sich eine Zusammenfassung der Arbeit und ein Ausblick an.
Der Anhang enth¨
alt die schrittweise Herleitung einer Reihe von im Haupttext ver-
wendeter Formeln, um so ein wirkliches Nachvollziehen der Zusammenh¨
ange zu vereinfa-
chen. Dar¨
uber hinaus finden sich dort Erg¨
anzungen zu einigen Abschnitten, die f¨
ur deren
Verst¨
andnis zwar nicht unmittelbar ben¨
otigt werden, jedoch die Thematik abrunden (z.B.
der Zusammenhang zwischen EXX und Sham-Schl¨
uter-Gleichung). Es wird zudem eine
mathematisch etwas abstraktere Formulierung des EXX-Verfahrens gegeben (mit Hilfe
einer Verallgemeinerung des linearen Antwortoperators), die zwar nicht f¨
ur eine Imple-
mentierung geeignet ist, aber auf Grund ihrer K¨
urze ¨
außerst hilfreich etwa bei der Diskus-
sion des Potential-Ladungsdichte-Mixings ist sowie einige Sachverhalte, z.B. den linearen
Zusammenhang zwischen Austauschpotential und induzierter Ladungsdichte, unmittelbar
verdeutlicht.
In der gesamten Arbeit werden atomare Einheiten verwendet, d.h. also
~= 1 , me= 1 ,e2
4πε0
= 1 .
Energie und L¨
ange werden daher, wenn nicht anders vermerkt, in der Einheit Hartree bzw.
in Bohr angegeben. Um Verwirrungen zu vermeiden, wird ferner der Laplace-Operator
stets mit 2bezeichnet und das Symbol ausschließlich zur Kennzeichnung von Diffe-
renzen und der induzierten Ladungsdichte (∆ρ) verwendet.
X
Teil I
Exakter Austausch
7
X
Kapitel 1
Das Vielteilchenproblem
Um den Aufbau der Materie physikalisch-mathematisch beschreiben zu k¨
onnen, bedarf
es zun¨
achst eines geeigneten Modells. Das den folgenden Betrachtungen zu Grunde lie-
gende Modell beruht auf den in der Chemie ¨
ublichen Vorstellungen: Die Materie wird
als System von Elektronen und Kernen (oder Ionen) aufgefasst der innere Aufbau der
Kerne aus Protonen und Neutronen sowie noch feinere Strukturen, etwa Quarks oder
Strings, werden jedoch gemeinhin nicht in die ¨
Uberlegungen mit einbezogen. Besteht das
betrachtete Modellsystem nun aus NElektronen und MKernen, und vernachl¨
assigt man
zudem relativistische Effekte, so wird es im Prinzip vollst¨
andig durch die Viel-Teilchen-
Schr¨
odinger-Gleichung
HΦ(r1,...,rN,R1,...,RM, t) = i Φ(r1,...,rN,R1,...,RM, t)
t (1.1)
beschrieben, wobei nat¨
urlich noch geeignete Rand- oder Anfangsbedingungen beachtet
werden m¨
ussen. Die Wellenfunktion Φ des Gesamtsystems h¨
angt dabei von den Ortsko-
ordinaten der Elektronen ri, denen der Kerne Rjund der Zeit tab. Wirken ferner keine
¨
außeren Kr¨
afte auf das System, setzt sich der Hamilton-Operator
H:= Te+Tn+Vee +Ven +Vnn (1.2)
zusammen aus den Operatoren der kinetischen Energie der Elektronen und Kerne, in
Ortsdarstellung gegeben durch
Te:=
N
X
i=1 1
22
ri, Tn:=
M
X
I=1 1
2mI2
RI
mit den Kernmassen mI, sowie den Coulomb-Wechselwirkungen der Teilchen
Vee := 1
2
N
X
i,j=1
i6=j
1
|rirj|, Ven :=
N
X
i=1
M
X
I=1
ZI
|riRI|, Vnn := 1
2
M
X
I,J=1
I6=J
ZIZJ
|RIRJ|
mit den Kernladungszahlen ZI. Da (1.2) nicht explizit von der Zeit abh¨
angt, lassen
sich die L¨
osungen Φ der Schr¨
odinger-Gleichung (1.1) als Linearkombinationen station¨
arer
Zust¨
ande der Form Ψα(r1,...,rN,R1,...,RM) exp(iEαt) schreiben, die sich aus der
Eigenwertgleichung
HΨα=EαΨα,(1.3)
9
10 1 Das Vielteilchenproblem
der zeitunabh¨
angigen Schr¨
odinger-Gleichung, ergeben. Als Eigenwertgleichung wird (1.3)
im Allgemeinen durch verschiedene Paare von Eigenfunktionen Ψαund Eigenenergien Eα,
jeweils unterschieden durch den Index α, gel¨
ost. F¨
ur den Hamilton-Operator Hgibt es
eine kleinste Eigenenergie, die als Grundzustandsenergie bezeichnet wird. Die zugeh¨
orige
Eigenfunktion ist der Grundzustand (vgl. auch Abschnitt 1.2). Bei Eigenfunktionen zu
h¨
oheren Energien spricht man von angeregten Zust¨
anden.
Gleichung (1.3) kann jedoch nur f¨
ur einfachste Systeme wie dem freien Wasserstoff-
atom [9] analytisch gel¨
ost werden. F¨
ur sehr große Systeme, z.B. einen Festk¨
orper, f¨
ur
den die Anzahl der zu betrachtenden Teilchen in der Gr¨
oßenordnung der Avogadro-
Konstante NA= 6.023 ·1023 liegt, l¨
asst sich (1.3) beim derzeitigen Stand der Compu-
tertechnik jedoch auch numerisch nicht mehr direkt l¨
osen. Es m¨
ussen daher (weitere)
vereinfachende N¨
aherungsannahmen gemacht werden. Solche N¨
aherungsans¨
atze k¨
onnen
ggf. auch mit einer (exakten) Transformation des Problems etwa auf ein System wech-
selwirkungsfreier Teilchen, vgl. Abschnitt 1.4.2 kombiniert werden. Eine wesentliche
Vereinfachung besteht in der Entkopplung von Elektronen- und Kernbewegung, die im
folgenden Abschnitt skizziert werden soll.
1.1 Born-Oppenheimer-N¨
aherung
Ausgangspunkt der Born-Oppenheimer-N¨
aherung oder adiabatischen N¨
aherung [10] ist
der große Unterschied zwischen der Elektronenmasse meund den Kernmassen MI: Das
Verh¨
altnis me/MIliegt typischerweise in der Gr¨
oßenordnung 104 105. Klassisch be-
trachtet besitzen die Kerne damit eine wesentlich gr¨
oßere Tr¨
agheit als die Elektronen.
Daher k¨
onnen Letztere nahezu instantan” auf die Bewegung der Kerne reagieren, d.h.,
ihr Zustand wird der Kernbewegung adiabatisch” folgen. Der elektronische Zustand ist
folglich n¨
aherungsweise nur durch die momentane Konfiguration der Kerne bestimmt, die
zu dem betrachteten Zeitpunkt ein festes Potential darstellen. Unter diesen Annahmen
l¨
asst sich die Wellenfunktion Ψ des Gesamtsystems in einen elektronischen Anteil Ψeund
einen nuklearen Anteil Ψnseparieren,
Ψ(r,R) = Ψe(r,Rn(R),(1.4)
wobei hier mit r:= (r1,...,rN) die Elektronenkoordinaten und mit R:= (R1,...,RM)
die Kernkoordinaten zusammengefasst sind. Der elektronische Anteil h¨
angt dabei nur pa-
rametrisch von Rab und ist L¨
osung des Eigenwertproblems
HeΨe(r,R) = EeΨe(r,R) (f¨
ur RIR3Mfest) .(1.5)
Der Hamilton-Operator ist hier durch
He(r,R) :=
N
X
i=1 1
22
ri+vext(ri,R)+1
2
1...N
X
i,j
i6=j
1
|rirj|(1.6)
gegeben, wobei der Einfluss der Kerne in dem Potential
vext(ri,R) :=
M
X
I=1
ZI
|riRI|(1.7)
zusammengefasst ist. Die Bezeichnung vext wurde hier im Vorgriff auf die Abschnitte 1.3
und 1.4 gew¨
ahlt, in denen (1.7) das ¨
außere” oder externe” Potential darstellt.
1.2 Das Variationsprinzip 11
Eine ¨
ahnliche Gleichung wie (1.5) l¨
asst sich nun auch f¨
ur die Bewegung der Ker-
ne aufstellen. Dazu beachte man, dass die Kerne auf Grund ihrer vergleichsweise hohen
Tr¨
agheit die Elektronenbewegung nur noch in gemittelter Form wahrnehmen” k¨
onnen:
Das von den Elektronen auf die Kerne wirkende Potential ergibt sich im Rahmen der Born-
Oppenheimer-N¨
aherung zu hHe(R)i, wobei die Mittelung ¨
uber die elektronische Wellen-
funktion Ψeerfolgt. Der Hamilton-Operator der Kernbewegung ist dann gegeben durch
Hn(R) :=
M
X
I=1 1
2mI2
RI+1
2
M
X
I,J=1
I6=J
ZIZJ
|RIRJ|+hHe(R)i.(1.8)
Die Born-Oppenheimer-N¨
aherung funktioniert dann, wenn die Elektron-Phonon-Kopp-
lung vernachl¨
assigt werden kann. F¨
ur die Fragestellungen dieser Arbeit, die sich auf die Be-
rechnung des elektronischen Grundzustandes von Halbleiter-Volumensystemen beziehen,
ist sie daher eine exzellente N¨
aherung. Beispiele f¨
ur Ph¨
anomene, bei denen die Elektron-
Phonon-Kopplung wesentlich ist, und f¨
ur die sich die Born-Oppenheimer-N¨
aherung folglich
nicht eignet, sind hochenergetische Streuprozesse von Atomen an Festk¨
orperoberfl¨
achen
oder die BCS-Theorie der Supraleitung [11].
1.2 Das Variationsprinzip
Ausgangspunkt f¨
ur viele Methoden zur n¨
aherungsweisen Beschreibung eines quantenme-
chanischen Viel-Teilchen-Systems ist oft nicht die Schr¨
odinger-Gleichung selbst in Gestalt
eines Eigenwertproblems (1.3) oder (1.5), sondern eine ¨
aquivalente Formulierung des Pro-
blems als Variationsaufgabe”. Pr¨
aziser ausgedr¨
uckt besteht die Aufgabe darin, diejenigen
Funktionen Ψα(oder allgemeiner Vektoren eines geeigneten Hilbertraums H) zu finden,
die das Funktional1
E[Ψ] := hΨ|H|Ψi
hΨ|Ψi H\{0}) (1.9)
station¨
ar werden lassen, f¨
ur die es also ein Extremum oder einen Sattelpunkt besitzt:
δ
δΨE[Ψ]Ψ=Ψα
!
= 0 .(1.10)
Ausf¨
uhren der Variationsableitung2liefert unmittelbar die Eigenwertgleichung (1.3) mit
Eα=Eα], vgl. z.B. Ref. 92. Wegen des Nenners in (1.9) braucht hier keine Normie-
rung der Ψ vorausgesetzt werden. Alternativ kann man auch einfacher E[Ψ] := hΨ|H|Ψi
definieren, muss dann aber explizit normierte Ψ fordern:
δ
δΨhΨ|H|Ψiε·(hΨ|Ψiconst.)!
= 0 .(1.11)
Auch hier f¨
uhrt Ableiten direkt auf (1.3), wobei die Gleichung aber nur dann erf¨
ullt werden
kann, wenn der Lagrange-Parameter εeinem Eigenwert Eαenspricht. Ist Hein nach unten
1In (1.9) wird keine Normierung der Vektoren vorausgesetzt. Um eine Division durch Null zu vermeiden,
muss daher der Nullvektor im Definitionsbereich ausgeschlossen werden.
2Zur Definition der Ableitung im Komplexen vgl. Ref. 126.
12 1 Das Vielteilchenproblem
beschr¨
ankter3Operator, besitzt (1.9) ein globales Minimum Ψ0. Im Falle des Hamilton-
Operators spricht man dann vom Grundzustand des Systems, der zugeh¨
orige Eigenwert
E0=E0]min
ΨE[Ψ] (1.12)
ist die Grundzustandsenergie.
Eine einfache N¨
aherungsmethode besteht darin, nicht alle Ψ H \{0}zur Variation
zuzulassen, sondern nur in einem bestimmten Unterraum zu suchen. Es ist klar, dass man
dann im Allgemeinen die tats¨
achlichen station¨
aren Punkte verpassen” wird; im Falle des
Grundzustandes etwa wird man nur eine obere Schranke f¨
ur E0erhalten. Diese Methode
wird auch Ritzsches Variationsverfahren genannt. Je gr¨
oßer der betrachtete Unterraum,
desto besser wird die N¨
aherung. Im Grenzfall einer vollst¨
andigen Basis geht das Ritzsche
Verfahren in das exakte Variationsprinzip (1.10) oder (1.11)¨
uber.
Auf dem Ritzschen Ansatz basiert auch die im folgenden Abschnitt beschriebene
Hartree-Fock-Methode: hier wird der Hilbertraum aller antisymmetrischen N-Elektronen-
Funktionen eingeschr¨
ankt auf die Teilmenge der einfachen Slater-Determinanten. Die in
Abschnitt 1.4 eingef¨
uhrte Dichtefunktional-Theorie kann dagegen als spezielle Formu-
lierung des exakten Variationsprinzips aufgefasst werden (vgl. Abschnitt 1.4.3), die f¨
ur
praktische Anwendungen notwendigen N¨
aherungen erfolgen dort an anderer Stelle (Ab-
schnitt 1.5.2). Schließlich l¨
asst sich auch die Umformulierung der im variationellen EXX-
Verfahren verwendeten Sternheimer-Gleichung in ein Minimierungsproblem (Abschnitt
4.1.1)¨
uber das Variationsprinzip verstehen (vgl. Anhang C.1).
1.3 Das Hartree-Fock-Verfahren
Eine der ersten Methoden zur n¨
aherungsweisen Beschreibung des quantenmechanischen
Vielteilchenproblems (1.5) wurde um 1930 von Hartree und Fock entwickelt [12,13]. Dem
Hartree-Fock-Verfahren kommt in dieser Arbeit eine besondere Bedeutung zu, da hier
bereits der Ausdruck f¨
ur die Austauschenergie abgeleitet (definiert) wird, der sp¨
ater bei
der Konstruktion exakter Austauschpotentiale im Rahmen der Dichtefunktional-Theorie
eine zentrale Rolle spielt. Es sei daher an dieser Stelle kurz umrissen, eine detailliertere
Darstellung findet sich z.B. in den Referenzen 21,92 und 127.
Eine Folge des Paulischen Prinzips der Ununterscheidbarkeit identischer Teilchen ist,
dass eine Wellenfunktion, die dem Zustand eines N-Fermionen-Systems entspricht, anti-
symmetrisch bzgl. der Vertauschung zweier Teilchenkoordinaten sein muss [92,127]. Ein
geeigneter Hilbertraum wird dann von den Slater-Determinanten aufgespannt. Ist mit
{φ1, φ2,...}eine vollst¨
andige Orthonormalbasis in einem Ein-Teilchen-Hilbertraum gege-
ben, l¨
asst sich aus jedem Satz {φki}i∈{1,...,N}von Npaarweise verschiedenen Basisfunk-
tionen eine Slater-Determinante konstruieren, die dann durch
ΨSD
k1...kN(x1,...,xN) := 1
N!
φk1(x1)φk2(x1)··· φkN(x1)
φk1(x2)φk2(x2)··· φkN(x2)
.
.
..
.
.....
.
.
φk1(xN)φk2(xN)··· φkN(xN)
(1.13)
3Ein nach unten beschr¨
ankter linearer Operator besitzt einen kleinsten Eigenwert. Hamilton-Operatoren
in der Mathematik auch h¨
aufig Schr¨
odinger-Operatoren genannt zu physikalisch sinnvollen Systemen
sind gew¨
ohnlich nach unten beschr¨
ankt, weil ein physikalisches System im Allgemeinen einen Grundzustand
besitzt.
1.3 Das Hartree-Fock-Verfahren 13
gegeben ist. Dabei sollen die Ein-Teilchen-Zust¨
ande aus einem Orts- und einem Spinanteil
zusammengesetzt sein, also φk(xi) := ψk(ri)χσk(si) mit xi:= (ri, si) und der Spinquan-
tenzahl σkdes k-ten Zustandes. Der Faktor vor der Determinante sorgt f¨
ur die richtige
Normierung hΨSD|ΨSDi= 1. Die Slater-Determinanten bilden ein vollst¨
andiges Ortho-
normalsystem, die Eigenfunktionen des Hamilton-Operators (1.6) lassen sich daher nach
ihnen entwickeln. Die N¨
aherung des Hartree-Fock-Formalismus besteht nun darin, dass
man als Ansatz f¨
ur diese Eigenfunktionen nur eine Slater-Determinante verwendet. Dazu
setzt man (1.13) in das Energiefunktional (1.9) ein. Dann hat man
EHFSD] = ETSD] + EextSD] + EHSD] + ExSD] (1.14)
mit der kinetischen Energie
ETSD] = *ΨSD
N
X
i=1 1
22
iΨSD+=
N
X
i=1 Zψ
ki(ri)1
22
iψki(ri) d3ri(1.15)
und der potentiellen Energie
EextSD] =
N
X
i=1 Zψ
ki(ri)vext(ri)ψki(ri) d3ri.(1.16)
Die Energie der Elektron-Elektron-Wechselwirkung ergibt sich hingegen komplizierter als
Summe des Hartree-Funktionals
EHSD] = 1
2
1...N
X
i,j Zψ
ki(r)ψ
kj(r)ψkj(r)ψki(r)
|rr|d3rd3r(1.17)
und des so genannten Austauschfunktionals
ExSD] = 1
2
1...N
X
i,j
δσiσjZψ
ki(r)ψ
kj(r)ψki(r)ψkj(r)
|rr|d3rd3r.(1.18)
Die nach dem Pauli-Prinzip notwendige Antisymmetrie der N-Elektronen-Wellenfunktio-
nen hat hier das Funktional Exins Spiel gebracht, das die so genannte Austauschwech-
selwirkung beschreibt, zu der kein klassisches Analogon existiert. Der Name r¨
uhrt daher,
dass die Koordinaten rund r, von denen die Funktionen ψkibzw. ψkjabh¨
angen, in Ex
gegen¨
uber dem Hartree-Funktional EHgerade ausgetauscht” worden sind. Dieser Ko-
ordinatenaustausch” findet nat¨
urlich auch im Spinanteil der Wellenfunktionen statt und
f¨
uhrt dann zu dem in (1.18) zus¨
atzlich auftretenden Kronecker-Symbol δσiσj, womit Ex
nur bei parallelen Spins eine Rolle spielt.
Bei der anschließenden Minimierung gem¨
(1.10) ist zu beachten, dass die Orthonor-
malit¨
at der Ein-Teilchen-Funktionen erhalten bleibt. Dies kann mit Hilfe von Lagrange-
Multiplikatoren geschehen:
δ
δψ
k(r)
EHFSD]
1...N
X
i,j
λkikjZψ
ki(r)ψkj(r) d3r
!
= 0 .(1.19)
Hier sollen die ψkjeweils einen der besetzten Zust¨
ande ψk1, . . . , ψkNkennzeichnen. Die
Variationsableitungen der Energiefunktionale (1.15) und (1.16) lauten dann zusammenge-
fasst
δ(ET+Eext)
δψ
k(r)=1
22+vext(r)ψk(r).(1.20)
14 1 Das Vielteilchenproblem
Bei der Hartree-Energie EHergibt sich
δEH
δψ
k(r)=
N
X
i=1 Zψ
ki(r)ψki(r)
|rr|ψk(r) d3r,(1.21)
und f¨
ur die Austauschenergie Exfindet man
δEx
δψ
k(r)=
N
X
i=1
δσσiZψ
ki(r)ψk(r)ψki(r)
|rr|d3r,(1.22)
wobei σdie Spinrichtung von ψkbezeichnen soll. Schließlich muss auch der Term f¨
ur die
Nebenbedingungen in (1.19) ber¨
ucksichtigt werden:
δ
δψ
k(r)
1...N
X
i,j
λkikjZψ
ki(r)ψkj(r) d3r=
N
X
i=1
λkkiψki(r).(1.23)
Durch eine unit¨
are Transformation der Ein-Teilchen-Wellenfunktionen,4die so gew¨
ahlt
wird, dass die Matrix (λkki) diagonal wird, entf¨
allt die Summation ¨
uber die i’s in der letzten
Gleichung. Die Ausdr¨
ucke (1.20) (1.23) liefern dann zusammengesetzt die Hartree-Fock-
Gleichungen in ihrer kanonischen Form”:
1
22+vext +vH[ρ] + VFock[{ψi}]ψk=εkψk(k {1,...,N}).(1.24)
Hier wurde das Hartree-Potential oder elektrostatische Potential
vH[ρ](r) := Zρ(r)
|rr|d3r(1.25)
als von der Ladungsdichte
ρ(r) :=
N
X
i=1 |φki(r)|2(1.26)
abh¨
angiges Funktional und der nicht-lokale Austauschoperator VFock[{ψi}] mit
VFock[{ψi}]ψk(r) := ZN
X
i=1
δσσi
ψki(r)ψ
ki(r)
|rr|ψk(r) d3r(1.27)
eingef¨
uhrt, wobei σwieder die Spinrichtung des Zustandes ψkkennzeichnen soll. Um her-
vorzuheben, dass es sich bei VFock[{ψi}] um einen Integral-Operator handelt, wurde es
hier im Gegensatz zu den multiplikativ wirkenden Potentialen vext und vHmit einem
Großbuchstaben bezeichnet.
Gem¨
des Variationsprinzips (1.12) findet man mit dem Hartree-Fock-Verfahren ei-
ne obere Schranke f¨
ur die tats¨
achliche Grundzustandsenergie des Systems, die sich aus
(1.5) ergeben w¨
urde, wenn diese Gleichung l¨
osbar w¨
are. Die Abweichung der Hartree-
Fock-Energie zu der tats¨
achlichen Grundzustandsenergie wird als Korrelationsenergie be-
zeichnet. Weiterf¨
uhrende auf der Berechnung der Wellenfunktionen basierende Ans¨
atze,
die auch die Korrelation n¨
aherungsweise miteinbeziehen, sind etwa die Møller-Plesset-
St¨
orungstheorien 2. bis 4. Ordnung (MP2, MP4) [14] sowie Configuration-Interaction-
(CI) oder Coupled-Cluster-Methoden (CC) [15].
4Die Slater-Determinante (1.13)¨
andert sich bis auf einen Phasenfaktor nicht bei einer unit¨
aren Trans-
formation der Ein-Teilchen-Funktionen, und auch das nachfolgend definierte Hartree-Potential vHsowie
der nicht-lokale Austauschoperator VFock[{ψi}] sind invariant gegen¨
uber einer solchen Transformation [21].
1.3 Das Hartree-Fock-Verfahren 15
Der nicht-lokale Austauschoperator als Funktional der Dichtematrix
Im Vorgriff auf die im folgenden Abschnitt beschriebene Dichtefunktional-Theorie wur-
de der Z¨
ahler im Integranden von (1.25) hier bereits zur Ladungsdichte ρzusammenge-
fasst. Auch im Hinblick auf die Untersuchungen von Kapitel 7sei erw¨
ahnt, dass ¨
Ahnliches
f¨
ur den nicht-lokalen Austauschoperator ebenfalls gelingt, wenn man auf die urspr¨
ungli-
chen Wellenfunktionen φk(xi) := ψk(ri)χσk(si) zur¨
uckgreift. Die Dichtematrix5der Slater-
Determinante (1.13) ist dann gegeben durch
γ(x,x) =
N
X
i=1
φki(x)φ
ki(x).(1.28)
Der Kern des Austauschoperators kann damit aber geschrieben werden als
vFock[γ](x,x) := γ(x,x)
|rr|.(1.29)
Anwendung von vFock[γ] auf φkliefert f¨
ur den Ortsanteil dann sofort (1.27) wenn man
beachtet, dass die Integration ¨
uber xdie Summation ¨
uber die Spinkomponenten mitein-
schließt.
Sehr ¨
ahnlich, wie im n¨
achsten Abschnitt die Kohn-Sham-Gleichungen aus einem Va-
riationsprinzip f¨
ur die Dichte abgeleitet werden (siehe Gleichungen (1.39) und (1.48)),
lassen sich interessanterweise die Hartree-Fock-Gleichungen (1.24) aus einer Variation f¨
ur
die Dichtematrix herleiten. Wie man zeigt, l¨
asst sich nicht nur der Austauschoperator und
damit auch die Austauschenergie (1.18), sondern die gesamte Hartree-Fock-Energie EHF
von (1.14) als Funktional von γausdr¨
ucken [21]. Die Variationsableitung von EHF nach
γerfolgt dann unter der Nebenbedingung, dass γdie Dichtematrix einer einfachen N-
Teilchen-Determinante ist. Daraus ergibt sich das Variationsprinzip
EHF[γHF]EHF[γ],(1.30)
wobei γHF die Dichtematrix ist, die aus den L¨
osungen von (1.24) zusammengesetzt ist.
Nicht-lokaler Austauschoperator und elektronische Selbstwechselwirkung
Eine wesentliche Eigenschaft der Hartree-Fock-Methode ist die korrekte Handhabung der
elektronischen Selbstwechselwirkung. Dabei handelt es sich um eine unphysikalische Gr¨
oße,
die durch die Beitr¨
age der Summanden mit i=jzur Hartree-Energie (1.17) und zur
Austauschenergie (1.18) gegeben ist. Wegen des unterschiedlichen Vorzeichens in beiden
Ausdr¨
ucken k¨
urzt sich die Selbstwechselwirkung jedoch in Gleichung (1.24) exakt her-
aus und ist daher in diesem Formalismus unproblematisch. Betrachtet man aber etwa die
Austauschwechselwirkung allein, so zeigt sich, dass die Selbstwechselwirkung den domi-
nierenden Anteil im Energiefunktional (1.18) darstellt [5,16]. So ist beispielsweise beim
freien Wasserstoffatom die Austauschenergie (und mit entgegengesetztem Vorzeichen
ebenso die Hartree-Energie) zu 100% durch die Selbstwechselwirkung gegeben. Aus die-
sem Grund kann eine unvollst¨
andige Eliminierung der Selbstwechselwirkung infolge einer
nur n¨
aherungsweisen Berechnung des Austausch-Terms erhebliche Probleme verursachen.
Dies betrifft auch die nachfolgend vorgestellte Dichtefunktional-Theorie bei Verwendung
von LDA- oder GGA-Austausch-Korrelationsfunktionalen (vgl. Abschnitt 1.5.2); auf eine
Reihe damit verbundener Schwierigkeiten wurde bereits in der Einleitung verwiesen.
5genauer: die reduzierte Dichtematrix 1. Ordnung
16 1 Das Vielteilchenproblem
Im Gegensatz zu den in der Dichtefunktional-Theorie verwendeten lokalen Austausch-
potentialen (auch dem exakten EXX-Potential”, vgl. Abschnitt 1.6), die ein auf alle Elek-
tronen identisch wirkendes Kraftfeld repr¨
asentieren, stellt das nicht-lokale Austauschpo-
tential (1.27) der Hartree-Fock-Gleichungen eine auf jedes Elektron individuell” wirken-
de Kraft dar. Insbesondere werden im Hartree-Fock-Formalismus besetzte und unbesetzte
Zust¨
ande verschieden gehandhabt, und zwar so, dass formal auf unbesetzte Zust¨
ande ein
von NElektronen verursachtes elektrostatisches Potential wirkt, besetzte Zust¨
ande hinge-
gen ein nur von den N1anderen” Elektronen bewirktes Potential sehen”. Dies erkennt
man wie folgt: Multipliziert man die rechte Seite von (1.27) mit der geschickten Eins”
ψk(r)/ψk(r) = 1, l¨
asst sich der Austauschoperator mit
ρk(r,r) :=
N
X
i=1
δσσi
ψ
ki(r)ψk(r)ψki(r)
ψk(r),(1.31)
zusammenfassen zu
VFock
k[{ψi}](r) = Zρk(r,r)
|rr|d3r.(1.32)
Dies ist nun eine lokale Gr¨
oße, allerdings ist sie f¨
ur jeden Zustand kverschieden defi-
niert. Fasst man das Austauschpotential in dieser Form mit dem Hartree-Potential (1.25)
zusammen, ergibt sich ein formales elektrostatisches Potential
Zρ(r)ρk(r,r)
|rr|d3r,(1.33)
wobei streng genommen auch dieser Ausdruck nur sinnvoll ist, wenn er vor die Wellen-
funktion ψkgeschrieben wird. Mit
Zρk(r,r) d3r=1 mit ψkbesetzter Zustand
0 mit ψkunbesetzter Zustand (1.34)
l¨
asst sich (1.33) so deuten, dass durch das Austauschpotential die in vHber¨
ucksichtigte
Ladungsverteilung um ein Elektron” reduziert wird, falls ψkeinen besetzten Zustand be-
zeichnet. Wie man zeigt (vgl. etwa Ref. 89,92), findet diese Reduktion von Ladungsdichte
gerade in der Umgebung des k-ten Elektrons statt und betrifft nur Teilchen mit der selben
Spinrichtung σ. Man spricht von einem so genannten Austauschloch”. Die Verdr¨
angung
von Teilchen gleicher Spinrichtung vom Ort des k-ten Teilchens ist letztlich eine Folge des
Pauli-Prinzips. Ein nicht besetzter Zustand ψkhingegen sieht” das gesamte, von allen N
Valenzelektronen verursachte Potential; in diesem Falle beschreibt ρkzwar eventuell eine
Umverteilung der Ladung, die Gesamtladung jedoch wird davon nicht beeinflusst.
1.4 Dichtefunktional-Theorie
Die Grundidee der Dichtefunktional-Theorie (DFT) ist, das Variationsprinzip (1.12) so
umzuformulieren, dass nicht mehr der Vielteilchen-Wellenfunktion Ψ, sondern der viel
handlicheren” Ladungsdichte ρdie Schl¨
usselrolle bei der Berechnung der elektronischen
Struktur zuf¨
allt. Statt der 3NKoordinaten, die f¨
ur ein N-Elektronengas bei Betrach-
tung der Wellenfunktionen zu ber¨
ucksichtigen w¨
aren, hat man mit der Ladungsdichte eine
Gr¨
oße, die sich unabh¨
angig von der Anzahl der betrachteten Teilchen durch 3 Koordi-
naten beschreiben l¨
asst. Insbesondere bei Verwendung von Minimierungstechniken (vgl.
Abschnitt 4.1.2) stellt dies numerisch eine enorme Vereinfachung des Problems dar.
1.4 Dichtefunktional-Theorie 17
Einen ersten Ansatz f¨
ur ein allein von der Ladungsdichte abh¨
angendes Energiefunktio-
nal bieten die Arbeiten von Thomas und Fermi aus dem Jahre 1927 [17,18,19,20]. Diese
von vorneherein als N¨
aherung konzipierte Methode liefert jedoch vielfach keine befriedi-
genden Ergebnisse6und ist heute eher von historischer Bedeutung. Eine Darstellung des
Thomas-Fermi-Modells findet sich z.B. in Ref. 21.
Die Grundlage f¨
ur eine im Prinzip exakte Theorie, die ein gegebenes elektroni-
sches System im Grundzustand mit Hilfe eines Funktionals der Ladungsdichte beschreibt,
wurde 1964 von Hohenberg und Kohn durch den Beweis zweier S¨
atze, den ber¨
uhmten
Hohenberg-Kohn-Theoremen [1], geschaffen. Sowohl die traditionelle Herleitung dieser
Dichtefunktional-Theorie als auch im Hinblick auf Abschnitt 1.5.4 ein mathematisch
etwas strengerer Zugang sollen nun kurz umrissen werden, wobei die folgende Darstellung
an der von Parr und Yang [21] orientiert ist.
1.4.1 Die Hohenberg-Kohn-Theoreme
Der Hamilton-Operator des elektronischen Systems (1.5) ist mit der Angabe der Elektro-
nenzahl Nund des ¨
außeren Potentials vext eindeutig definiert.7Unter der Annahme, dass
der Grundzustand des Systems nicht entartet ist, existiert daher zu jedem ¨
außeren Poten-
tial vext genau eine N-Teilchen-Wellenfunktion Ψ0, die diesen Grundzustand beschreibt.
Mit dem Operator der Teilchendichte ˆρl¨
asst sich Ψ0¨
uber die Beziehung
ρ0(r) = hΨ0|ˆρ(r)|Ψ0i=*Ψ0
N
X
i=1
δ(rri)Ψ0+(1.35)
wiederum eindeutig die Grundzustandsladungsdichte zuordnen. Insgesamt ergibt sich also
eine eindeutige Zuordnung vext 7→ ρ0. Der Wertebereich dieser Zuordnung ist die Menge
der v-darstellbaren Ladungsdichten, also solcher Dichten, die sich mit (1.35)¨
uberhaupt
einem Potential zuordnen lassen, vgl. Abschnitt 1.4.3. F¨
ur den weiteren Verlauf dieses
Abschnitts sei die v-Darstellbarkeit von ρ0stets vorausgesetzt. Der Beweis des Hohenberg-
Kohn-Theorems I [1] liefert nun die Eindeutigkeit der umgekehrten Zuordnung ρ07→ vext:
Das ¨
außere Potential vext ist (bis auf eine additive Konstante) ein Funktional der Grund-
zustandsladungsdichte. Da die Grundzustandsenergie E0¨
uber die Wellenfunktion Ψ0als
Funktional von vext aufgefasst werden kann, folgt die eigentliche Aussage des Theorems:
Die Grundzustandsenergie E0des N-Teilchen-Systems ist ein Funktional der Grundzu-
standsladungsdichte ρ0.
Es ergeben sich also sowohl vext als auch durch Integration die Teilchenzahl N
aus ρ0; daher bestimmt ρ0den gesamten Hamilton-Operator und alle Eigenschaften des
Systems, wie z.B. die kinetische oder die potentielle Energie. F¨
ur die Gesamtenergie des
Grundzustandes ergibt sich
E0[ρ0] = T[ρ0] + Eext[ρ0] + Eee[ρ0] (1.36)
=Zvext[ρ0](r)ρ0(r) d3r+F[ρ0],
wobei im zweiten Schritt das Funktional Fmit
F[ρ] := T[ρ] + Eee[ρ] (1.37)
6Das Thomas-Fermi-Modell erweist sich beispielsweise als ungeeignet f¨
ur die Vorhersage molekularer
Bindungen [22].
7Die Kernkoordinaten seien ab jetzt als fest betrachtet.
18 1 Das Vielteilchenproblem
benutzt wurde, das nicht explizit vom ¨
außeren Potential abh¨
angt und deshalb auch als
universelles Potential” bezeichnet wird8.
Wie l¨
asst sich nun aber zu einem gegebenen ¨
außeren Potential vext die entsprechen-
de Grundzustandsladungsdichte bestimmen, ohne die N-Teilchen-Wellenfunktion Ψ0be-
stimmen zu m¨
ussen? Die Antwort hierauf gibt das Hohenberg-Kohn-Theorem II, das ein
Variationsprinzip f¨
ur die Elektronendichte konstituiert: Bei Variation von ρnimmt das
Energiefunktional
Evext [ρ] := Zvext(r)ρ(r) d3r+F[ρ] (1.38)
sein Minumum gerade f¨
ur die Grundzustandselektronendichte ρ0an; f¨
ur geeignete La-
dungsdichten ρgilt also
E0=Evext [ρ0]Evext [ρ].(1.39)
Dies ist das Analogon zum Variationsprinzip (1.12) f¨
ur die Vielteilchen-Wellenfunktion Ψ0.
Ber¨
ucksichtigt man die Erhaltung der Teilchenzahl N¨
uber einen Langrange-Parameter µ,
folgt die Bedingung
δ
δρ Evext [ρ]µ·Zρ(r) d3rN !
= 0 (1.40)
und damit die Euler-Lagrange-Gleichung
µ=δEvext [ρ]
δρ(r)=vext(r) + δF [ρ]
δρ(r).(1.41)
Beide Theoreme geben allerdings keinen Hinweis auf eine explizite Gestalt des Funk-
tionals F. Daher ist die DFT bislang nur eine im Prinzip exakte Theorie, die in der Praxis
jedoch nicht ohne N¨
aherungen auskommt. Ihre Formulierung durch Kohn und Sham [2],
die Gegenstand des folgenden Abschnitts sein soll, gestattet allerdings eine Reihe von
N¨
aherungen, die f¨
ur viele Anwendungen hinreichende Genauigkeit aufweisen und letztlich
den großen Erfolg der DFT begr¨
unden.
1.4.2 Die Kohn-Sham-Gleichungen
In der Kohn-Sham-Formulierung der Dichtefunktional-Theorie [2] wird dem realen elektro-
nischen System ein System fiktiver Elektronen” gegen¨
ubergestellt, f¨
ur die die Coulomb-
Abstoßung ausgeschaltet ist, die aber die gleiche Ladungsdichte besitzen wie das reale
System. F¨
ur das universelle Funktional” Faus (1.37) lassen sich im Falle dieses nicht-
wechselwirkenden Referenzsystems jedoch viel bessere N¨
aherungen finden als beim tats¨
ach-
lichen System (vgl. dazu auch Kap. 1.5).
Das fiktive System kann durch durch folgende Eigenwertgleichung beschrieben werden:
Hsψi= [1
22+vs(r)]ψi=εiψi,(1.42)
also durch eine formale Einteilchen-Schr¨
odinger-Gleichung. Die Kohn-Sham-Teilchen se-
hen” sich zwar nicht durch die Coulomb-Wechselwirkung, dem Pauli-Prinzip m¨
ussen sie
aber gehorchen. T¨
aten sie es n¨
amlich nicht, w¨
urden ja alle in denselben Zustand, den
8Fist formal gesehen genauso auf das Wasserstoffatom wie auch auf ein kompliziertes Molek¨
ul
oder einen Festk¨
orper anwendbar.
1.4 Dichtefunktional-Theorie 19
Grundzustand des Einteilchensystems, rutschen. Also k¨
onnen wir die Vielteilchen-Wellen-
funktion des Grundzustandes als Slater-Determinante ansetzen,
Ψs=1
N!det[ψ1,...,ψN],(1.43)
wobei die Determinante aus den Nniedrigsten Einteilchenzust¨
anden gebildet werde. Im
Gegensatz zur kinetischen Energie Tdes tats¨
achlichen Systems ergibt sich die kinetische
Energie Tsdes Kohn-Sham-Systems damit einfach zu
Ts[ρ] =
N
X
i=1hψi| 1
22|ψii.(1.44)
Auch auf das Referenzsystem lassen sich die beiden Theoreme von Hohenberg und Kohn
[1] anwenden; deshalb wurde Tshier bereits gleich als Funktional von ρaufgefasst. Ent-
sprechend zu (1.41) lautet die Euler-Langrange-Gleichung des Kohn-Sham-Systems9
µ=vs(r) + δTs[ρ]
δρ(r).(1.45)
Auf eine formal identische Gleichung gelangt man jedoch auch f¨
ur das reale System, wenn
man f¨
ur Ffolgenden Ansatz macht:
F[ρ] = Ts[ρ] + EH[ρ] + Exc[ρ].(1.46)
Hier ist EHdie Hartree-Energie, die bereits in (1.17) als Funktional von ρdefiniert wurde,
und Exc bezeichnet die so genannte Austausch-Korrelationsenergie, definiert durch
Exc[ρ] := T[ρ]Ts[ρ] + Eee[ρ]EH[ρ].(1.47)
Die Austausch-Korrelationsenergie zerf¨
allt also in einen kinetischen Anteil TTs, der,
wie zumindest f¨
ur Atome gezeigt wurde [21,23], sehr klein ist, und den nicht-klassischen
Anteil der Elektron-Elektron-Wechselwirkung. Die Euler-Langrange-Gleichung (1.41) wird
damit im Falle des realen Systems zu
µ=vext(r) + δF[ρ]
δρ(r)
=vext(r) + δEH[ρ]
δρ(r)+δExc[ρ]
δρ(r)+δTs[ρ]
δρ(r)(1.48)
=veff[ρ](r) + δTs[ρ]
δρ(r),
wobei das effektive Potential durch
veff[ρ](r) := vext(r) + vH[ρ](r) + vxc[ρ](r) (1.49)
mit dem Hartree-Potential
vH[ρ](r) := δEH[ρ]
δρ(r)=Zρ(r)
|rr|d3r(1.50)
9Bereits hier sei darauf hingewiesen, dass das Funktional F trotz der Bezeichnug universell” f¨
ur
das Kohn-Sham-System anders definiert ist, als f¨
ur das reale System! Da es im Kohn-Sham-System keine
Coulomb-Abstoßung gibt, gilt in (1.37) n¨
amlich Eee[ρ] = 0 und folglich F[ρ] = Ts[ρ].
20 1 Das Vielteilchenproblem
und dem (lokalen!) Austausch-Korrelations-Potential
vxc[ρ](r) := δExc[ρ]
δρ(r)(1.51)
gegeben ist. Der Trick” des Ansatzes von Kohn und Sham ist also, bis auf Tsalle Anteile
des Funktionals Fvon (1.46) in das effektive Potential veff[ρ]her¨
uberzuschieben”. Da-
mit nehmen die Euler-Lagrange-Gleichungen des realen und des nicht-wechselwirkenden
Referenzsystens (1.48) genau die gleiche Gestalt an, wenn man vs=veff [ρ] setzt. Da
veff allerdings ein von der Dichte ρabh¨
angiges Funktional ist, muss die entsprechende
Eigenwert-Gleichung
1
22+vext(r) + vH[ρ](r) + vxc[ρ](r)ψi(r) = εiψi(r) (1.52)
selbstkonsistent zusammen mit der Gleichung f¨
ur die Ladungsdichte gel¨
ost werden, die f¨
ur
eine einfache Slater-Determinante nach (1.35) durch
ρ(r) =
N
X
i=1 |ψi(r)|2(1.53)
gegeben ist. Die beiden vorangehenden Gleichungen (1.52) und (1.53) stellen zusammen die
Kohn-Sham-Gleichungen dar. Benutzt man (1.46) in (1.38), erh¨
alt man die Gesamtenergie
des realen Systems:
Ereal[ρ] = Zvext(r)ρ(r) d3r+Ts[ρ] + EH[ρ] + Exc[ρ].(1.54)
Eine alternative Form findet man, indem Ts[ρ] mit Hilfe von (1.52) durch die Summe der
Kohn-Sham-Eigenwerte εisubstituiert wird10:
Ereal[ρ] =
N
X
i
εiEH[ρ] + Exc[ρ]Zvxc[ρ](r)ρ(r) d3r . (1.55)
Die Gesamtenergie des Kohn-Sham-Systems unterscheidet sich von der des realen Systems,
was sp¨
ater in Abschnitt 1.5.4 benutzt wird. Da das Kohn-Sham-System wechselwirkungs-
frei ist, gilt F[ρ] = Ts[ρ] (vgl. Fußnote auf Seite 19), und das ¨
außere Potential ist durch
das effektive Potential von (1.49) gegeben. Aus (1.38) folgt damit
EKS[ρ] = Zveff[ρ](r)ρ(r) d3r+Ts[ρ] (1.56)
=Ereal[ρ] + EH[ρ]Exc[ρ] + Zvxc[ρ](r)ρ(r) d3r .
Die Euler-Lagrange-Gleichungen (1.41) und (1.48) folgen direkt aus dem Variations-
prinzip f¨
ur die Ladungsdichte (1.38). Deshalb liefert die L¨
osung der Kohn-Sham-Gleichun-
gen zwar die korrekte Ladungsdichte des realen Systems die Wellenfunktionen ψiund
die Energieniveaus εides Kohn-Sham-Systems erlauben jedoch nicht mehr ohne Weiteres
eine direkte physikalische Interpretation. F¨
ur finite Systeme und Oberfl¨
achen l¨
asst sich
10Die Substitution gelingt mit
N
P
i
εi=
N
P
i
hψi| 1
22+veff [ρ]|ψii=Ts[ρ] + Rveff [ρ](r)ρ(r) d3r. Dies ist
mit (1.56) auch gerade die Gesamtenergie des Kohn-Sham-Systems.
1.4 Dichtefunktional-Theorie 21
allerdings zeigen, dass der h¨
ochste besetzte Eigenwert εmax des Kohn-Sham-Systems ex-
akt” ist in dem Sinne, dass er der (negativen) Ionisierungsenergie Iund dem chemischen
Potential µentspricht [2,25], das als Lagrange-Parameter bereits in (1.41) aufgetaucht
ist:
εmax =I=µ . (1.57)
L¨
asst man nicht-ganzzahlige Besetzungszahlen nider Kohn-Sham-Zust¨
ande zu, ergeben
sich die Einteilchen-Energien ferner auch ¨
uber das Janak-Theorem [26] aus der Gesamt-
energie durch Ableitung nach der Besetzungszahl:
E[ρ]
ni
=εi.(1.58)
1.4.3 Levy’s Constraint-Search-Formulierung der DFT
Zum besseren Verst¨
andnis der G¨
orling-Levy-St¨
orungstheorie [40,41], auf die in Abschnitt
1.5.4 eingegangen wird, soll an dieser Stelle kurz eine zu der Hohenberg-Kohn-Formulierung
[1] alternative Darstellung der Dichtefunktional-Theorie angesprochen werden, die als
Constraint-Search-Formulierung bezeichnet wird. Diese 1979 von Levy [27] vorgeschlagene
Herangehensweise hat zudem den Vorteil, dass die von Hohenberg und Kohn gemachten
Annahmen (Nicht-Entartung des Grundzustandes, v-Darstellbarkeit der Ladungsdichte,
vgl. Abschnitt 1.4.1) abgeschw¨
acht werden k¨
onnen. Sind die Annahmen jedoch erf¨
ullt,
stimmen beide Formulierungen ¨
uberein; es handelt sich also um eine echte Verallgemeine-
rung der urspr¨
unglichen Hohenberg-Kohn-Formulierung.
Bei der Constraint-Search-Formulierung startet man zun¨
achst mit dem normalen”
Variationsprinzip (1.12) f¨
ur die Vielteilchen-Wellenfunktion Ψ, f¨
uhrt dann aber die Mini-
mierung in zwei Stufen aus: Einmal wird ¨
uber alle (antisymmetrischen) Ψ minimiert, die
auf eine bestimmte Ladungsdichte ρf¨
uhren, das ist die Constraint Search. Da nach dem
Variationsprinzip die Suche aber ¨
uber alle (normierten) N-Teilchen-Zust¨
ande durchgef¨
uhrt
werden muss, wird in einem zweiten Variationsschritt ¨
uber alle geeigneten Ladungsdichten
minimiert:
E0= min
ΨhΨ|T+Vee +
N
X
i
vext(ri)|Ψi(1.59)
= min
ρ(min
ΨρhΨ|T+Vee +
N
X
i
vext(ri)|Ψi)
= min
ρmin
ΨρhΨ|T+Vee |Ψi+Zvext(r)ρ(r) d3r.
F¨
ur die Minimierung wird hier nicht vorausgesetzt, dass die Ladungsdichte v-darstellbar ist
(vgl. Abschnitt 1.4.1), allerdings muss sie N-darstellbar” sein. Alle physikalisch sinnvollen
Ladungsdichten sind N-darstellbar die Bedingungen daf¨
ur lauten [28]
ρ(r)0,Zρ(r) d3r=N , Z|pρ(r)2pρ(r)|d3r < .(1.60)
Durch die letzte Bedingung wird sichergestellt, dass die kinetische Energie endlich bleibt
(Abschnitt IV in Ref. 28). Vergleicht man die letzte Zeile von (1.59) mit dem aus den
Hohenberg-Kohn-Theoremen folgenden Variationsprinzip (1.39) f¨
ur die Ladungsdichte,
E0= min
ρF[ρ] + Zvext(r)ρ(r) d3r(mit ρ v-darstellbar),(1.61)
22 1 Das Vielteilchenproblem
so findet man f¨
ur das universelle Funktional” Feinen Ausdruck, der im Falle v-dar-
stellbarer Ladungsdichten genau dasselbe Ergebnis liefern muss wie Ausdruck (1.37) der
Hohenberg-Kohn-Theorie, aber allgemeiner f¨
ur N-darstellbare Ladungsdichten definiert
ist:
F[ρ] = min
ΨρhΨ|T+Vee |Ψi(mit ρ N-darstellbar).(1.62)
Auch die Beschr¨
ankung auf nicht-entartete Grundzust¨
ande entf¨
allt hier; es wird dasjenige
Ψ gew¨
ahlt, das die Klammer minimiert. Diese Beziehung stellt also eine Art” funktio-
nalen Zusammenhang zwischen der Ladungsdichte und den Zust¨
anden dar, der aber
anders als bei den Hohenberg-Kohn-Theoremen wegen der m¨
oglichen Entartung nicht
mehr ein-eindeutig ist.
F¨
ur die Gesamtenergien (1.54) und (1.56) schreibt man daher in der Constraint-Search-
Formulierung auch
Enww[ρ] = Zveff [ρ](r)ρ(r) d3r+Fnww[ρ],(1.63)
Ereal[ρ] = Zvext(r)ρ(r) d3r+Freal[ρ] (1.64)
mit den universellen Potentialen
Fnww[ρ] := min
ΨρhΨ|T|Ψi=Ts[ρ]!
=hΨ0|T|Ψ0i,(1.65)
Freal[ρ] := min
ΨρhΨ|T+Vee |Ψi!
=hΨ1|T+Vee |Ψ1i.(1.66)
Die Abk¨
urzung nww” steht hier f¨
ur nicht-wechselwirkendes System”. Dessen Viel-Teil-
chen-Zust¨
ande Ψ0und die des realen Systems Ψ1ergeben sich f¨
ur eine gegebene Ladungs-
dichte ρdamit (formal) nur aus der Minimierung der spitzen Klammern v¨
ollig un-
abh¨
angig vom ¨
außeren bzw. vom effektiven Potential. Es sei jedoch nochmals darauf hin-
gewiesen, dass Ψ0hier im Allgemeinen nicht mehr, wie noch im Kohn-Sham-Formalismus,
durch eine einfache Slater-Determinante gegeben ist.
1.5 Das Austausch-Korrelations-Funktional
1.5.1 Definition von Austausch- und Korrelationsenergie in der DFT
¨
Ublicherweise wird die Austausch-Korrelationsenergie aus (1.47) in einen Austauschanteil
Exund einen Korrelationsanteil Ecuntergliedert:
Exc[ρ] = Ex[ρ] + Ec[ρ].(1.67)
Eine analoge Aufspaltung folgt dann auch f¨
ur das Austausch-Korrelationspotential:
vxc[ρ] = vx[ρ] + vc[ρ] mit vx[ρ] := δEx[ρ]
δρ , vc[ρ] := δEc[ρ]
δρ .(1.68)
Zur Definition der beiden Anteile sei wieder die Notation von Abschnitt 1.4.3 benutzt: F¨
ur
eine Ladungsdichte ρbezeiche also Ψ0den N-Teilchen-Zustand des Kohn-Sham-Systems
und Ψ1den des realen Systems. Der Zusammenhang zwischen den Zust¨
anden und der
Dichte ist durch die Gleichungen (1.65) und (1.66) gegeben. Ist ρeine v-darstellbare Dichte,
1.5 Das Austausch-Korrelations-Funktional 23
ist der Kohn-Sham-Zustand nach Konstruktion des nicht-wechselwirkenden Systems durch
die Slater-Determinante Ψ0= det[ψ1,...N]/N! gegeben (vgl. Abschnitt 1.4.2), wobei
die Einteilchen-Zust¨
ande ψidie Nniedrigsten Eigenfunktionen in (1.52) sind. Damit l¨
asst
sich die Austauschenergie in der DFT analog zu der im Hartree-Fock-Formalismus (1.18)
definieren:11
Ex[ρ] := 1
2
1...N
X
i,j
δσiσjZψ
i(r)ψ
j(r)ψi(r)ψj(r)
|rr|d3rd3r(1.69)
=hΨ0|Vee |Ψ0ihΨ0|vH[ρ]|Ψ0i.(1.70)
In der Constraint-Search-Formulierung wird gleich die zweite Zeile als Definition verwendet
(vgl. z.B. [29,30,31,40]) mit dem Hartree-Potential vHvon (1.50); sie ist allgemeiner,
denn ihr Definitionsbereich l¨
asst sich auf alle antisymmetrischen Wellenfunktionen Ψ0
ausweiten, wie in den Variationsprinzipien (1.12) und (1.59) auch gefordert.
Die Korrelationsenergie ergibt sich einfach als Rest”, der ¨
ubrig bleibt, wenn man die
Definition von Exzusammen mit (1.67) und (1.65), (1.66) in Gleichung (1.56) benutzt:
Ec[ρ] = hΨ1|T+Vee |Ψ1ihΨ0|T+Vee |Ψ0i.(1.71)
Geschlossene Ausdr¨
ucke f¨
ur Exc[ρ] und vxc[ρ] lassen sich, bis auf wenige Ausnahmen
wie dem dissoziierten H2-Molek¨
ul [32] oder He und He-artigen Ionen [44], bislang nicht
angeben, jedoch ist es formal m¨
oglich, sie mit Hilfe einer Reihenentwicklung darzustellen.
Dies soll im ¨
ubern¨
achsten Abschnitt 1.5.4 skizziert werden. Formalismen zur exakten Ab-
leitung des lokalen Austauschpotentials vx(bei Annahme der v-Darstellbarkeit der Dichte)
werden in Abschnitt 1.6 vorgestellt. Zuvor soll nun aber noch auf die g¨
angigsten N¨
aherun-
gen eingegangen werden.
1.5.2 Lokale Dichten¨
aherung und verwandte Funktionale
Als effizientes Verfahren zur Untersuchung praktischer Fragestellungen wurde die Dichte-
funktional-Theorie zun¨
achst in der Physik durch die Einf¨
uhrung der Lokalen Dichten¨
ahe-
rung (LDA) [2] und ihrer Erweiterung f¨
ur spin-polarisierte Systeme, der Lokalen Spin-
Dichte-N¨
aherung (LSD) [33], popul¨
ar. Ihre weite Verbreitung auch in der Quantenche-
mie erfolgte dann etwas sp¨
ater und geht mit der Entwicklung einer Reihe so genannter
Verallgemeinerter Gradientenn¨
aherungen (GGA) [35,36,37,38,39] einher, die sich als
Weiterentwicklungen der LDA auffassen lassen.
Ausgangspunkt der LDA ist das homogene Elektronen-Gas, also ein System von NElek-
tronen in einem konstanten ¨
außeren Potential. In diesem Fall lassen sich die Hartree-Fock-
Gleichungen exakt l¨
osen, vgl. z.B. Ref. 92, und man erh¨
alt den folgenden Zusammenhang
zwischen der Austauschenergie pro Elektron εhom
xund der konstanten Ladungsdichte ρhom:
εhom
x[ρhom] = 3
43
πρhom1
3
.(1.72)
Die exakte Gestalt des entsprechenden Korrelationsanteils εhom
cist dagegen unbekannt.
Deshalb wird hier in der Regel auf die Ergebnisse von Quanten-Monte-Carlo-Rechnungen
f¨
ur das homogene Elekronen-Gas nach Ceperley und Alder [34] zur¨
uckgegriffen. F¨
ur die in
11Der einzige Unterschied zwischen der Kohn-Sham- und der Hartree-Fock-Austauschenergie besteht
dann darin, dass im ersten Fall Kohn-Sham-, im zweiten aber Hartree-Fock-Orbitale verwendet werden.
24 1 Das Vielteilchenproblem
dieser Arbeit durchgef¨
uhrten Kohn-Sham-LDA-Rechnungen werden sie in der parametri-
sierten Form von Perdew und Zunger [5] benutzt. Ein n¨
aherungsweiser Ausdruck f¨
ur die
Austausch-Korrelationsenergie (1.67) ist dann durch
ELDA
xc [ρ] := Zεhom
xc [ρ(r)]ρ(r) d3r(1.73)
gegeben, wobei Austausch- und Korrelationsenergie pro Elektron in εhom
xc := εhom
x+εhom
c
zusammengefasst worden sind. Damit ergibt sich unmittelbar das Austausch-Korrelations-
potential in LDA:
vLDA
xc [ρ](r) := δELDA
xc [ρ]
δρ(r)=εhom
xc [ρ(r)] + δεhom
xc [ρ]
δρ(r)ρ(r).(1.74)
Trotz seiner Einfachheit liefert das LDA-Funktional f¨
ur eine Vielzahl realistischer Fra-
gestellungen quantitativ gute Resultate, vgl. z.B. Ref. 24. Per Konstruktion ist LDA exakt
f¨
ur den Grenzfall eines homogenen Elektronen-Gases. Folglich ist zu erwarten, dass sich die
N¨
aherung am besten f¨
ur Systeme mit nur leicht variierender Dichte eignet. Weist die Dich-
te dagegen starke Oszillationen auf, scheint die Verwendung des LDA-Funktionals nicht
mehr unmittelbar gerechtfertigt zu sein. Bei den Verallgemeinerten Gradientenn¨
aherungen
(GGA) wird daher die Dichte nicht mehr nur lokal wie in (1.73) ber¨
ucksichtigt, sondern
auch ihr Gradient miteinbezogen. GGA-Energiefunktionale sind also von der Form
EGGA
xc [ρ] := Zfxc[ρ(r),ρ(r)] d3r . (1.75)
Verschiedene Realisierungen des GGA-Funktionals sind das BP-Funktional von Becke [35]
(Austauschanteil) und Perdew [36] (Korrelationsanteil), das BLYP-Funktional von Be-
cke [35] (Austauschanteil), Lee, Yang und Parr [37] (Korrelationsanteil), sowie das PW91-
Funktional von Perdew und Wang [38] und das PBE-Funktional von Perdew, Burke und
Ernzerhof [39].
Interessanterweise f¨
uhrt die Verwendung von GGA-Funktionalen nicht unbedingt zu
exakteren Beschreibungen gegen¨
uber der LDA [24]; vielmehr muss h¨
aufig im Einzelfall
¨
uberpr¨
uft werden, welches Funktional f¨
ur eine gegebene Fragestellung am geeignetsten
ist. Auf eine Reihe von Ph¨
anomenen, die weder durch LDA noch mit GGAs befriedi-
gend beschrieben werden k¨
onnen, wurde bereits in der Einleitung eingegangen. Hier seien
noch einmal das falsche asymptotische Abklingverhalten des Austauschpotentials endlicher
Systeme (exponentiell statt 1/r f¨
ur r ) und die Untersch¨
atzung der Bandl¨
ucke bei
Halbleitern um bis zu ¨
uber 100% erw¨
ahnt, beides Konsequenzen aus der nur n¨
aherungswei-
sen Handhabung der elektronischen Selbstwechselwirkung (vgl. auch Abschnitt 1.3), sowie
ferner das Versagen bei der Beschreibung der so genannten Ganzzahl-Diskontinuit¨
at”.
1.5.3 Selbstwechselwirkungskorrektur
Ein Ansatz, die Handhabung der elektronischen Selbstwechselwirkung bei Verwendung
gen¨
aherter Austausch-Korrelationspotentiale wie LDA oder GGA zu verbessern, ist die so
genannte Selbstwechselwirkungskorrektur (SIC, von engl.: self-interaction correction). Im
Schema von Perdew und Zunger [5] beispielsweise wird dabei ein gegebener N¨
aherungs-
ausdruck Eapprox
xc f¨
ur die Austausch-Korrelationsenergie (1.67) wie folgt modifiziert:
ESIC
xc [{ρk}] := Eapprox
xc [ρ]
occ.
X
kEH[ρk] + Eapprox
xc [ρk],(1.76)
1.5 Das Austausch-Korrelations-Funktional 25
wobei ρk:= |ψk|2die Dichte des k-ten Orbitals bezeichnet und EHdas Hartree-Ener-
giefunktional (1.17) ist. F¨
ur die Kohn-Sham-Gleichung (1.52) erh¨
alt man damit ein orbi-
talabh¨
angiges effektives Potential der Form
vk
eff[{ρi}] := vext +vH[ρ] + vapprox
xc [ρ](vH[ρk] + vapprox
xc [ρk]) .(1.77)
Bei lokalisierten Systemen f¨
uhrt SIC h¨
aufig zu einer deutlich verbesserten Beschreibung.
So lassen sich beispielsweise die Bindungsenergien negativ geladener Ionen sehr genau
bestimmen. Zudem erh¨
alt man im Gegensatz zu LDA/GGA das korrekte asymptotische
Abklingverhalten des effektiven Potentials und der Ladungsdichte.
SIC steht jedoch nicht im Einklang mit dem Kohn-Sham-Formalismus, denn auf Grund
der Orbitalabh¨
angigkeit des effektiven Potentials wird durch die Kohn-Sham-Gleichung
(1.52) kein wechselwirkungsfreies System mehr beschrieben. Auch sind die Wellenfunk-
tionen nicht mehr notwendigerweise orthogonal, wodurch die Teilchenzahlerhaltung ver-
letzt werden kann. Zudem ist der Kohn-Sham-Operator in SIC nicht invariant gegen-
¨
uber unit¨
aren Transformationen der Wellenfunktionen,12 d.h., es ist im Allgemeinen
HSIC
KS [{ψi}]6=HSIC
KS [{Uψi}] mit einer unit¨
aren Transformation Uim Raum der besetzen
Zust¨
ande.
1.5.4 Exakte Darstellung des Austausch-Korrelationsfunktionals
als St¨
orreihe
Abschnitt 1.5.2 stellte einige Methoden zur n¨
aherungsweisen Berechnung des DFT-Au-
stausch-Korrelationspotentials (1.51) vor. Kennzeichnend f¨
ur die LDA- und GGA-Poten-
tiale ist dabei, dass sie keinen Ansatz zu einer systematischen Verbesserung des Austausch-
Korrelationspotentials aufzeigen. Tats¨
achlich existiert aber ein Schema, das zumindest
im Prinzip dessen beliebig genaue Beschreibung zuließe. Dieses 1993 von G¨
orling und
Levy vorgeschlage Verfahren [40,41,42], das nun, den genannten Referenzen folgend, skiz-
ziert werden soll, basiert auf einem st¨
orungstheoretischen Ansatz, und sei deshalb hier als
G¨
orling-Levy-St¨
orungstheorie” bezeichnet. Mit ihr lassen sich Austausch-Korrelations-
energie Exc und Austausch-Korrelationspotential vxc ¨
uber eine Reihenentwicklung exakt
darstellen. Die Anforderungen an Rechnerkapazit¨
at und -leistung, um diese Reihe auszu-
konvergieren, ¨
ubersteigen das heute technisch M¨
ogliche allerdings bei weitem. M¨
oglich ist
jedoch ein Abbrechen der Entwicklung bereits nach dem ersten Glied; man erh¨
alt dann ge-
rade den Austauschteil des Austausch-Korrelationspotentials. In diesem Sinne kann man
die G¨
orling-Levy-St¨
orungstheorie als Verallgemeinerung oder Weiterf¨
uhrung des EXX-
Formalismus (vgl. Abschnitt 1.6 und Kapitel 2) bezeichnen.
F¨
ur das Folgende sei zun¨
achst die N-Darstellbarkeit der Ladungsdichte (1.60) vor-
ausgesetzt. Um nun eine Reihe f¨
ur die Austausch-Korrelationswechselwirkung abzuleiten,
wird der Ausdruck f¨
ur die Korrelationsenergie (1.71) zun¨
achst verallgemeinert:
Eα
c[ρ] := [hΨα|T|ΨαihΨ0|T|Ψ0i]
|{z }
=: Tα
c[ρ]
+α·[hΨα|Vee |ΨαihΨ0|Vee |Ψ0i]
|{z }
=: Vα
c[ρ]
,
(1.78)
12Der korrekte Kohn-Sham-Operator ist invariant gegen¨
uber unit¨
aren Transformationen der Wellen-
funktionen ψi, da er allein von der Ladungsdichte abh¨
angt, f¨
ur die bei Isolatoren und Halbleitern
ρ=Pocc
i|ψi|2=Pocc
i|Uψi|2mit einer beliebigen unit¨
aren Transformation Uim Raum der besetzen
Zust¨
ande gilt. Es sei im Hinblick auf die folgenden Abschnitte darauf hingewiesen, dass dann ¨
ahnlich auch
f¨
ur den nicht-lokalen Austauschoperator VFock[{ψi}] = VFock[{Uψi}] gilt.
26 1 Das Vielteilchenproblem
wobei Ψαwieder die gegebene Dichte ρliefere und ¨
uber das Minimum von hΨ|T+αVee |Ψi
definiert sei. Tα
cund αV α
cbezeichnen den kinetischen Anteil und den Anteil der Elekton-
Elektron-Abstoßung an der Korrelationsenergie Eα
c.
Mit dieser Definition l¨
asst sich ein Hamilton-Operator konstruieren,
Hα[ρ] := T+αVee +
N
X
i=1 vext(ri) + (1 α)vH[ρ](ri) (1.79)
+ (1 α)vx[ρ](ri) + δE1
c[ρ]
δρ(ri)δEα
c[ρ]
δρ(ri),
bei dem mit dem Parameter α[0,1] zwischen dem Hamilton-Operator des Kohn-Sham-
Systems (α= 0) und dem des realen Systems (α= 1) stetig hin- und hergeschaltet
werden kann. W¨
ahrend sich die Wellenfunktionen, die sich aus dem entsprechenden Ei-
genwertproblem ergeben, im Allgemeinen mit α¨
andern, bleibt die Ladungsdichte dabei
stets konstant. Aus diesem Grund wird (1.79) auch adiabatische Verbindung” zwischen
dem Kohn-Sham- und dem realen System genannt.
F¨
ur die Korrelation, ihren kinetischen Anteil und ihren Wechselwirkungsanteil wird
weiter angenommen, dass sie sich in Taylorreihen entwickeln lassen, deren Glieder noch
zu bestimmen sind, und schreibt
Eα
c[ρ] =
X
j=1
ec,j[ρ]αj, Tα
c[ρ] =
X
j=1
tc,j[ρ]αj, V α
c[ρ] =
X
j=1
vc,j[ρ]αj.(1.80)
Unter Ausnutzung von Tα
c[ρ]/∂α =α·V α
c[ρ]/∂α (Gl. (35) in Ref. 40), erh¨
alt man
daraus
ec,j[ρ] = 0 f¨
ur j= 1
1
j1tc,j[ρ] = 1
jvc,j1[ρ] f¨
ur j2,(1.81)
womit sich (1.79) auf folgende Gestalt bringen l¨
asst:
Hα[ρ] = H0[ρ]
|{z }
=: H0
+α·"Vee
N
X
i=1 vH[ρ](ri) + vx[ρ](ri)#
|{z }
=: H1
+
X
j=2
αj·"
N
X
i=1
δec,j[ρ]
δρ(ri)#
|{z }
=: Hj
.
(1.82)
Hαkann also aufgefasst werden als Hamilton-Operator des Kohn-Sham-Systems, das sich
unter dem Einfluss der St¨
orungen αjHj(j1) befindet. Man beachte, dass die unteren
Indizes an den Operatoren sich hier auf die Ordnung der St¨
orung beziehen, im Gegensatz
zu dem oberen Parameter α, der die St¨
arke der St¨
orung beschreibt. Da die St¨
orung bereits
selbst eine Reihenentwicklung ist, wird das entsprechende Eigenwertproblem in einer etwas
modifizierten Version der St¨
orungstheorie von Rayleigh-Schr¨
odinger behandelt,
H0+αH1+α2H2+···Ψ0+αΨ1+α2Ψ2+···= (1.83)
=E0+αE1+α2E2+···Ψ0+αΨ1+α2Ψ2+···.
Die 0-te Ordnung beschreibt das Kohn-Sham-System selbst, es gilt also
E0=EKS[ρ] mit Ψ0= Ψ0.(1.84)
1.5 Das Austausch-Korrelations-Funktional 27
F¨
ur die h¨
oheren Ordnungen erh¨
alt man durch Sortieren nach den Potenzen von αdie
Energiekorrekturen
Ej=
j
X
p=1hΨ0|Hp|Ψjpi(jIN) .(1.85)
Verwendet man weiter (1.82) in der Skalierungsbeziehung
Ec[ρλ] = 1
α2[hΨα|Hα|ΨαihΨ0|Hα|Ψ0i] (1.86)
mit λ=α1und ρλ(x, y, z) := λ3ρ(λx, λy, λz) [40], findet man durch Koeffizientenver-
gleich mit (1.80) schließlich eine Rekursionsformel f¨
ur die Koeffizienten mit j2 der
Taylorentwicklung:
ec,j[ρ] = EjhΨ0|Hj|Ψ0i(1.87)
(1.85)
=
j
X
p=1hΨ0|Hp|ΨjpihΨ0|Hj|Ψ0i
=
j1
X
p=1hΨ0|Hp|Ψjpi
(1.82)
=hΨ0|H1|Ψj1i+
j1
X
p=2 *Ψ0
N
X
i=1
δec,p[ρ]
δρ(ri)Ψjp+,
wobei im letzten Schritt die Definition der Hpaus (1.82) eingesetzt worden ist. Die
Auswertung der Taylorreihe f¨
ur die Austausch-Korrelationsenergie (1.80) bis zur Ord-
nung jverlangt somit nur die Kenntnis der Funktionalableitungen ihrer Koeffizienten
von kleinerer Ordnung als jund kann formal in beliebiger Genauigkeit erfolgen! Wie in
Ref. 41 gezeigt wird, sind die jeweils ben¨
otigten Funktionalableitungen auch tats¨
achlich
analytisch zug¨
anglich.13 Damit ergibt sich dann auch das (verallgemeinerte) Austausch-
Korrelationspotential
vα
xc[ρ] := δ
δρ(Ex[ρ] + Eα
c[ρ]) = vx[ρ] +
X
j=1
αjvc,j[ρ] mit vc,j[ρ] := δec,j [ρ]
δρ ,(1.88)
das f¨
ur α= 1 dem exakten Austausch-Korrelationspotential entspricht. Wegen (1.81)
ergibt sich in erster Ordung das exakte Austauschpotential vx[ρ] von (1.68). Dessen Be-
rechnung und im Prinzip ¨
uber die vc,j[ρ] auch die sukzessive Berechnung des exak-
ten Korrelationspotentials gelingt unter bestimmten Voraussetzungen ¨
uber zwei Wege:
(i) direktes Ableiten der Austauschenergie Ex[ρ] bzw. der Energieterme ec,j[ρ] nach der La-
dungsdichte ρ, (ii) Auswerten des gest¨
orten Eigenwertproblems (1.82) f¨
ur die verschiedenen
Ordnungen von α. Dies soll im folgenden Abschnitt 1.6 beschrieben werden, allerdings nur
f¨
ur vx eine weiterf¨
uhrende Auswertung der St¨
orreihe ist, wie eingangs bereits angedeu-
tet, numerisch noch nicht sinnvoll durchf¨
uhrbar und daher rein formaler Natur. Weg (ii)
f¨
uhrt dabei direkt auf eine implizite Gleichung f¨
ur vx, der so genannten OEP-Gleichung,
die den Ausgangspunkt f¨
ur die Entwicklung des in Kapitel 2beschriebenen variationellen
EXX-Verfahrens [78,79,80] darstellt.
13An dieser Stelle wird jedoch v-Darstellbarkeit vorausgesetzt, da eine ein-eindeutige Beziehung zwischen
effektiven Potential und Ladungsdichte (vgl. Hohenberg-Kohn-Theorem I [1]) benutzt wird. Formel (1.87)
ben¨
otigt hingegen nur die schw¨
achere Annahme der N-Darstellbarkeit.
28 1 Das Vielteilchenproblem
1.6 Exakte Austauschpotentiale
In voller Allgemeinheit w¨
are das exakte Austauschpotential als Funktionalableitung von
(1.70) gegeben,
vx[ρ] := δEx[ρ]
δρ =δ
δρhΨ0|(Vee vH[ρ]) |Ψ0i,(1.89)
wobei alle N-darstellbaren Ladungsdichten zugelassen sind und die N-Teilchen-Wellen-
funktionen Ψ0die Beziehung (1.65) erf¨
ullen. In dieser Allgemeinheit l¨
asst sich die Funktio-
nalableitung allerdings (bislang) nicht auswerten. Dies gelingt jedoch, wenn man annimmt,
dass die Kohn-Sham-Zust¨
ande einfache Slater-Determinanten der besetzten Ein-Teilchen-
Zust¨
ande ψisind, und die Austauschenergie Ex[ρ] damit wie in (1.69) ausgedr¨
uckt werden
kann. Hinreichende Bedingung daf¨
ur ist die v-Darstellbarkeit der Ladungsdichten [21,43],
die daher im weiteren Verlauf dieser Arbeit stets, wenn nicht ausdr¨
ucklich anders gesagt,
vorausgesetzt wird. Eine formale Erweiterung des Konzepts auf N-darstellbare Dichten
konnte jedoch im Rahmen der Arbeit entwickelt werden und ist in Anhang Ebeschrieben.
Die zur Hartree-Fock-Theorie analoge Gestalt von Exhat nun den Vorteil, dass da-
mit auch in der DFT die exakte Behandlung des Austauschanteils bereits ausreicht, um
die unphysikalische elektronische Selbstwechselwirkung vollst¨
andig zu eliminieren, vgl. Ab-
schnitt 1.3. Es ist daher zu erwarten, dass Fehler, die auf deren unvollst¨
andige Eliminierung
auf Grund einer nur n¨
aherungsweisen Beschreibung des Austauschs zur¨
uckzuf¨
uhren sind
(vgl. Einleitung), bei Verwendung des exakten vx[ρ] korrigiert werden. Da der Austausch-
anteil zudem die dominierende Rolle bei der Austausch-Korrelationswechselwirkung spielt
typischerweise ¨
ubertrifft er die Korrelation um eine Gr¨
oßenordung [44,45,46] —,
kommt seiner genauen Kenntnis besondere Relevanz zu.
1.6.1 Das Standard-EXX-Verfahren
Ausgehend von der der Definition der Austauschenergie (1.69) l¨
asst sich das Austausch-
potential durch zweimaliges Anwenden der Kettenregel f¨
ur Variationsableitungen finden,
wie zuerst G¨
orling und Levy zeigten [41], vgl. aber auch [47,48,52,53,54]:
vx[ρ](r) =
occ
X
iZd3rZd3r′′ δEx[{ψk}]
δψ
i(r)
δψ
i(r)
δveff (r′′)+ c.c.δveff(r′′)
δρ(r).(1.90)
Die Abk¨
urzung occ.” (occupied ) soll hier wie immer im Folgenden andeuten, dass nur
¨
uber die besetzten Zust¨
ande zu summieren ist. Die Methode, das lokale Austauschpotential
vxdurch direktes Auswerten der rechten Seite dieser Gleichung zu bestimmen, wird als
Exact-Exchange-Verfahren (EXX) bezeichnet. Diese Terminologie geht auf Langreth und
Mehl [29], Kotani [57], sowie auf St¨
adele et al. [52] zur¨
uck. Zur Unterscheidung von der
in Kapitel 2vorgestellten variationellen Bestimmung von vxsei dieses Verfahren in der
vorliegenden Arbeit auch als Standard-EXX-Verfahren” (stEXX) bezeichnet. Alternativ
wird auch der Begriff Optimized-Effektive-Potential-Methode (zwei Abk¨
urzungen, OEP
und OPM, sind gebr¨
auchlich) verwendet, der aber urspr¨
unglich nicht aus der Tradi-
tion” der DFT herr¨
uhrt. Genau genommen versteht man unter OEP [63,65,66,67] auch
nicht das direkte Berechnen von vxgem¨
(1.90), sondern das L¨
osen einer ¨
aquivalenten
Integralgleichung, vgl. Abschnitt 1.6.2.
Um Gleichung (1.90) benutzen zu k¨
onnen, werden noch die drei Funktionalableitun-
gen der rechten Seite ben¨
otigt. Die erste berechnet sich analog zu Gleichung (1.22) aus
1.6 Exakte Austauschpotentiale 29
Abschnitt 1.3 und entspricht der Anwendung des Fock-Operators (1.27) auf die i-te Wel-
lenfunktion:
δEx[{ψk}]
δψ
i(r)=
occ
X
j
δσiσjZψ
j(r)ψi(r)ψj(r)
|rr|d3r=VFock[{ψj}]ψi(r).(1.91)
Die Variationsableitung der Zust¨
ande nach dem effektiven Potential findet man mit Hilfe
der St¨
orungstheorie in 1. Ordnung, vgl. Anhang B:
δψi(r)
δveff (r)=X
j
εj6=εi
ψj(r)ψ
j(r)ψi(r)
εiεj
=Gi(r,r)ψi(r).(1.92)
Die Summe geht hier ¨
uber alle Kohn-Sham-Orbitale mit Ausnahme jener mit εj=εi, d.h.,
auch die unbesetzten Zust¨
ande m¨
ussen ber¨
ucksichtigt werden. Ferner bezeichnet Gidie in
(B.11) definierte Greensche Funktion der Eigenwert-Gleichung (1.52) im zum Eigenraum
von εiorthogonalen Unter-Hilbertraum.
Die Handhabung des letzten Faktors in (1.90) ist etwas schwieriger. Er kann als Inverse
des linearen Antwortoperators χ0aufgefasst werden, der die Reaktion der Ladungsdichte
auf eine infinitesimal kleine” ¨
Anderung des effektiven Potentials beschreibt. Es ergibt
sich:
χ0(r,r) := δρ(r)
δveff (r)=
occ.
X
i
unocc.
X
j
ψ
i(r)ψj(r)ψ
j(r)ψi(r) + c.c.
εiεj
.(1.93)
F¨
ur die in (1.90) ben¨
otigte Umkehrung χ1
0=δveff ρ existiert nun allerdings keine ana-
lytisch geschlossene Darstellung mehr. Streng genommen ist sie auch gar nicht definiert,
da das Potential veff nur bis auf eine Konstante bestimmt ist, und einer ¨
Anderung der
Dichte deshalb unendlich viele Potential¨
anderungen zugeordnet werden k¨
onnen. In ge-
eigneten Basissatzdarstellungen von χ1
0, die z.B. in [41,52,55,56] diskutiert werden,
lassen sich konstante Verschiebungen jedoch explizit ausschließen. Wie G¨
orling und Levy
in Anhang B von Ref. 41 zeigen, korrespondiert dies im Definitionsbereich der Dichten
auch gerade mit der physikalisch sinnvollen Forderung Rδρ(r)d3r= 0, also der Erhaltung
der Ladung im System. Im Falle periodischer Systeme l¨
asst sich dies z.B. einfach durch
die Herausnahme der (G= 0)-Komponente im reziproken Raum erreichen [52]. Es sei an
dieser Stelle auch bemerkt, dass hier wiederum die v-Darstellbarkeit ben¨
otigt wird: f¨
ur
ein nicht-v-darstellbares ρist veff [ρ] und damit auch veff[ρ]/δρ nicht mehr ohne Weiteres14
wohldefiniert, vgl. auch Ref. 47.
Durch Einsetzen der obigen Ausdr¨
ucke (1.91) und (1.92) in Gleichung (1.90) hat man
dann
vx[ρ](r) =Zd3rχ1
0(r,r)
occ
X
iZd3r′′ψ
i(r)G
i(r,r′′)VFock[{ψj}]ψi(r′′) + c.c.
| {z }
=: ρFock
,
(1.94)
wobei die G
idie auf den Raum der unbesetzten Zust¨
ande projizierten Greenschen Funk-
tionen (B.12) sind. Bereits mit Blick auf den weiteren Verlauf der Arbeit sei Folgen-
des angemerkt: Nach der Rayleigh-Schr¨
odingerschen St¨
orungstheorie kann der Ausdruck
14Eine Erweiterung der Definition ist jedoch formal m¨
oglich, vgl. Anhang E.
30 1 Das Vielteilchenproblem
GiVFock[{ψj}]ψials lineare Korrekturfunktion interpretiert werden, die sich bei St¨
orung
des Kohn-Sham-Systems durch VFock[{ψj}] ergibt. In (1.94) besitzt aber damit die Summe
¨
uber idie Gestalt einer sp¨
ater in (2.4) definierten induzierten Ladungsdichte”. Im Unter-
schied zu dort wird sie hier allerdings durch den nicht-lokalen Austauschoperator erzeugt
und sei deshalb mit ρFock bezeichnet.
¨
Ahnlich wie das Funktional (1.44) der kinetischen Energie Tsist also auch vxnur
¨
uber den Umweg” der Kohn-Sham-Orbitale ψizug¨
anglich, eine direkte parametrische
Abh¨
angigkeit von ρin geschlossener Form gibt der EXX-Formalismus nicht. Gleichung
(1.94) liefert dann das Austauschpotential der zu den ψigeh¨
orende Dichte, die jedoch
nicht notwendigerweise die Grundzustandsdichte ρ0ist. Um ρ0und das zugeh¨
orige vx[ρ0]
zu finden, muss (1.94) daher selbstkonsistent zusammen mit den Kohn-Sham-Gleichungen
(1.52) und (1.53) gel¨
ost werden.
Beim L¨
osen der Kohn-Sham-Gleichungen k¨
onnen dann Korrelationseffekte entweder
n¨
aherungsweise ber¨
ucksichtigt werden, beispielsweise durch den Korrelationsteil des LDA-
Potentials (1.74), oder v¨
ollig vernachl¨
assigt werden. Letzteres wird h¨
aufig, so auch in der
vorliegenden Arbeit, mit der Bezeichnug “exchange-only” gekennzeichnet.
W¨
ahrend die Methode allerdings in einer modifizierten Form (OEP, vgl. den folgen-
den Abschnitt) auf atomare Systeme bereits lange erfolgreich angewandt wird, st¨
oßt
man im Falle gr¨
oßerer Systeme, wie beispielsweise Festk¨
orpern, schnell an Grenzen. Die-
se resultieren daraus, dass (i) bei der Berechnung der letzten beiden Faktoren in (1.90)
unbesetzte Zust¨
ande ins Spiel kommen (Greensche Funktion), (ii) aus der Notwendigkeit,
den linearen Antwortoperator χ0zu invertieren und (iii) aus dem Aufwand bei der Be-
rechnung des nicht-lokalen Austauschoperators VFock (vgl. Abschnitt 4.4). Das Umgehen
von zumindest der ersten beiden der genannten Schwierigkeiten ist ein zentrales Anliegen
der vorliegenden Arbeit und wird in Kapitel 2ausf¨
uhrlich dargelegt.
Abschließend noch ein paar Bemerkungen zur Unterscheidung des DFT-EXX-Schemas
vom Hartree-Fock-Formalismus:
(i) Obwohl die Austauschenergien in beiden F¨
allen formal ¨
uber den selben Ausdruck
gegeben sind, vgl. (1.18) und (1.69), sind sie verschieden, da sich die Kohn-Sham-
Orbitale von den Hartree-Fock-Orbitalen (um mehr als eine unit¨
are Transformation)
unterscheiden, siehe auch Punkt (iv). Vergleichende Berechnungen, die bisher f¨
ur
Atome und kleine Molek¨
ule durchgef¨
uhrt worden sind [49,58,59,60,61,68,78],
vgl. auch Ref. 62 mit Ref. 39, legen jedoch nahe, dass sowohl die Wellenfunktionen
als auch die Austauschenergien in beiden Formalismen nur sehr gering voneinander
abweichen. Dieser Punkt wird noch einmal in Abschnitt 2.4 aufgegriffen.
(ii) Im Hartree-Fock-Schema wird der Austausch ¨
uber ein nicht-lokales, d.h., auf jedes
Hartree-Fock-Orbital anders wirkendes Potential ber¨
ucksichtigt (vgl. Abschnitt 1.3).
Im Gegensatz dazu ist das Austauschpotential der Kohn-Sham-Gleichungen lokal
und beschreibt daher eine Kraft, die auf alle Kohn-Sham-Teilchen gleich wirkt (die-
se k¨
onnen sich gegenseitig nicht sehen”). Zusammen mit dem Hartree- und dem
Korrelationspotential beschreibt es die gesamte elektronische Wechselwirkung des
realen Systems gewissermaßen in einer gemittelten Form.
(iii) Diese Beschreibung kann im Kohn-Sham-Schema zumindest im Prinzip v¨
ollig
ohne N¨
aherung erfolgen, wenn das exakte Austausch-Korrelationspotential verwen-
det w¨
urde. Das lokale Austauschpotential l¨
asst sich dabei nach Gleichung (1.88) des
vorangehenden Abschnitts als erstes Glied einer entsprechenden Taylorentwicklung
1.6 Exakte Austauschpotentiale 31
auffassen. Im Gegensatz dazu ist Hartree-Fock jedoch bereits konzeptuell als N¨
ahe-
rung angelegt, wobei allerdings auch hier eine systematische Verbesserung in Form
der Configuration Interaction existiert.
(iv) Im Hartree-Fock-Formalismus ist der Grundzustand durch diejenige Slater-Determi-
nante definiert, die die Gesamtenergie des Systems hΨ|H|Ψiminimiert. F¨
ur die Mi-
nimierung werden dabei außer der Orthonormalit¨
at der Ein-Teilchen-Orbitale keine
Einschr¨
ankungen angenommen. Im “exchange-only” Kohn-Sham-Formalismus wird
ebenfalls die Gesamtenergie hΨ|H|Ψiminimiert, zur Minimierung werden jedoch
hier nur Slater-Determinanten aus normierten Ein-Teilchen-Zust¨
anden zugelassen,
die sich als Grundzustand eines nicht-wechselwirkenden Referenzsystems mit ir-
gendeinem lokalen Potential (dem effektiven “exchange-only” Kohn-Sham-Potential)
darstellen lassen. Ganz deutlich erkennt man dies anhand von Gleichung (1.99) im
nachfolgend besprochenen OEP-Formalismus. Die Orthogonalit¨
at der Orbitale folgt
¨
ubrigens daraus, denn ein reelles lokales Potential liefert immer einen hermiteschen
Hamilton-Operator.
Daran lassen sich Schranken f¨
ur die Gesamtenergien EHF,EKS(EXX) und ˜
EKS(X)
des Systemgrundzustands im Hartree-Fock-, im “exchange-only” Kohn-Sham-EXX-
bzw. in einem gen¨
aherten “exchange-only” Kohn-Sham-Schema ablesen: Da die Mi-
nimierung im Hartree-Fock-Schema weniger Nebenbedingungen unterliegt als bei
Kohn-Sham, folgt, dass EKS(EXX) nicht kleiner als EHF sein kann. Jedes gen¨
aherte
effektive “exchange-only” Kohn-Sham-Potential kann wiederum nicht auf die nied-
rigste “exchange-only” Kohn-Sham-Gesamtenergie (also die Gesamtenergie in EXX)
f¨
uhren [87]. Allgemein gilt also
EHF EKS(EXX) <˜
EKS(X) .
1.6.2 Das OEP-Verfahren
Bereits sehr fr¨
uh, und zun¨
achst sogar v¨
ollig unabsichtlich, fand man exakte, “exchange-
only” Kohn-Sham-Potentiale f¨
ur atomare, radialsymmetrische Probleme [65,66,67]. Dabei
wurde vxnicht direkt berechnet wie im vorangehenden Abschnitt, sondern durch L¨
osen
der mit
Zχ1
0(r,r)χ0(r,r′′) d3r=δ(rr′′) (1.95)
zu (1.90)¨
aquivalenten Integralgleichung
Zd3rvx[ρ](r)χ0(r,r) =
occ
X
iZδEx[{ψi}]
δψ
i(r)
δψ
i(r)
δveff (r)+ c.c.d3r.(1.96)
Einsetzen der Ausdr¨
ucke (1.91) (1.93) f¨
ur die Funktionalableitungen liefert dann
occ
X
iZd3rψ
i(r)G
i(r,r)VFock[{ψj}]ψi(r)vx(r)·ψi(r)+ c.c.= 0 (1.97)
mit den auf die unbesetzten Zust¨
ande projizierten Greenschen Funktionen G
ivon (B.12).
Dies ist die so genannte OEP-Gleichung. Interessanterweise wurde sie von Sharp und Hor-
ton bereits 1953 angegeben [63], d.h., vor Entwicklung der DFT! Die beiden Autoren folg-
ten dabei einer Idee Slaters [64], eine einfache N¨
aherung f¨
ur die Hartree-Fock-Methode zu
32 1 Das Vielteilchenproblem
finden, indem man dasjenige lokale Potential konstruiert, das das nicht-lokale Austausch-
potential (1.27) der Hartree-Fock-Gleichungen am besten ann¨
ahert. Die Bezeichnung OEP
(optimized effective potential ) wurde sp¨
ater von Talman, Shadwick, Aashamar und Luke
gepr¨
agt, die einen ¨
ahnlichen Ansatz verfolgten [65,66,67]. Hier wird versucht, ein lokales
Potential vOEP der formalen Schr¨
odinger-Gleichung
1
22+vOEP(r)ψi(r) = εiψi(r) (1.98)
zu finden, so dass die Slater-Determinante Ψ der besetzten Einteilchen-Wellenfunktionen ψi
das Energiefunktional hHi:= hΨ|H|Ψistation¨
ar werden l¨
asst:
δhHi
δvOEP(r)=
occ
X
iZδhHi
δψ
i(r)
δψ
i(r)
δvOEP(r)d3r+ c.c.!
= 0 .(1.99)
Zun¨
achst ebenfalls als N¨
aherung f¨
ur Hartree-Fock gedacht, kann dieses Variationsprinzip
f¨
ur das lokale Potential einer effektiven Ein-Teilchen-Gleichung im Rahmen des Kohn-
Sham-Formalismus als Schema zur Konstruktion des exakten, “exchange-only” Kohn-
Sham-Potentials interpretiert werden. Darauf wurde zuerst von Perdew und Mitarbei-
tern hingewiesen [68,69]. Tats¨
achlich ist dieses Variationsprinzip ¨
aquivalent zu Gleichung
(1.97), wenn man beachtet, dass der erste Faktor der rechten Seite, δhHiψ
i, formal
gerade der linken Seite der Hartree-Fock-Gleichung (1.24) entspricht und der zweite Fak-
tor analog zu (1.92) gegeben ist. Einsetzen, Umformen und Vergleichen mit (1.97) f¨
uhrt
schließlich auf
vOEP(r) = vext(r) + vH(r) + vx(r).(1.100)
Dass OEP anfangs nur auf radialsymmetrische Systeme Anwendung fand [65,66,67], ist
wohl im Wesentlichen auf die damals zur Verf¨
ugung stehenden Rechnerkapazit¨
aten zur¨
uck-
zuf¨
uhren. Zum einen muss Gleichung (1.97) in diesem Fall nur in einer Dimension f¨
ur den
Radialteil gel¨
ost werden, zum anderen ist auch die Randbedingung limr→∞ vOEP(r) = 0
recht leicht zu handhaben. Letztlich ist aber das numerische L¨
osen der Integralgleichung
(1.96) mit Hilfe eines linearen Gleichungssystems ¨
aquivalent zur Inversion des linearen
Antwortoperators χ0von (1.93) und f¨
uhrt auf dieselben Probleme: auch die Integralglei-
chung bestimmt vxbzw. vOEP nur bis auf eine additive Konstante; das entsprechende
Gleichungssystem ist also unterbestimmt.
Eine sehr genaue und daher wichtige N¨
aherung f¨
ur OEP ist die von Krieger, Li und
Iafrate entwickelte und nach ihnen benannte KLI-Methode [70,71,72,73]. Sie beruht auf
einer ebenfalls bereits in der oben zitierten Ver¨
offentlichung von Sharp und Horton [63]
vorgeschlagenen Ersetzung der Eigenwertdifferenzen εjεiim Nenner der Greenschen
Funktionen G
idurch einen geeigneten konstanten Wert. Ausf¨
uhrliche Darstellungen der
Methode finden sich z.B. in den Referenzen 48,49,50. KLI l¨
asst sich vergleichsweise
einfach implementieren und auch auf Halbleiter und Isolatoren anwenden. Dies wurde
beispielsweise eingehend von Bylander und Kleinman untersucht [74,75,76,77].
1.6.3 St¨
orungstheoretische Herleitung der OEP/EXX-Gleichung
In Abschnitt 1.6.1 wurde in Gleichung (1.90) das exakte Austauschpotential vx[ρ] mit Hilfe
der Kettenregel direkt aus der Definition der Austauschenergie (1.69) abgeleitet. Alternativ
l¨
asst sich diese Gleichung bzw. die zu ihr ¨
aquivalente OEP-Gleichung (1.97) aber auch
elegant aus der in Abschnitt 1.5.4 vorgestellten st¨
orungstheoretischen Entwicklung des
1.6 Exakte Austauschpotentiale 33
Austausch-Korrelationsfunktionals erhalten, wie G¨
orling und Levy in Ref. 42 zeigen. Diese
Vorgehensweise ist hier insofern von Bedeutung, als sie auf der Ebene” der Viel-Teilchen-
Wellenfunktionen das genaue Analogon zu der in dieser Arbeit untersuchten variationellen
EXX-Methode [78,79,80] darstellt, die auf einer st¨
orungstheoretischen Behandlung der
Ein-Teilchen-Wellenfunktionen beruht.
Der in der G¨
orling-Levy-St¨
orungstheorie verwendete Ansatz (1.83) liefert in linearer
Ordnung f¨
ur Energie- und Zustandskorrektur noch Ausdr¨
ucke, die mit denen der Rayleigh-
Schr¨
odinger-St¨
orungstheorie identisch sind. Mit dem in (1.82) definierten St¨
oroperator H1
ergibt sich die lineare Zustandskorrektur
Ψ1=
X
k=1
ΦkhΦk|Vee vH[ρ]vx[ρ]|Φ0i
E0Ek
.(1.101)
Hier bezeichne Φ0:= Ψ0den Grundzustand des ungest¨
orten Kohn-Sham-Systems, und
die Φkmit k1 seien dessen virtuell15 angeregte Zust¨
ande. Alle Φk(kIN0) sind
dabei durch einfache Slater-Determinanten gegeben, die aus den Kohn-Sham-Orbitalen ψi
von Gleichung (1.52) aufgebaut sind. Ferner sollen die Ekdie zu den Determinanten Φk
geh¨
orenden Kohn-Sham-Energien bezeichnen.
Alle Zust¨
ande Ψα= Ψ0+αΨ1+···, die sich in (1.82) entlang der adiabatischen
Verbindung”, also f¨
ur alle α[0,1], ergeben, f¨
uhren auf die gleiche Ladungsdichte ρ.
Anders, und bereits im Hinblick auf Kapitel 2formuliert: das Aufschalten der St¨
orung
durch Hochdrehen” von αdarf keine ¨
Anderung der Ladungsdichte bewirken. Mit dem
Dichteoperator ˆρ(r) folgt also
hΨ0|ˆρ(r)|Ψ0i=hΨα|ˆρ(r)|Ψαi
=hΨ0|ˆρ(r)|Ψ0i+αhΨ0|ˆρ(r)|Ψ1i+αhΨ1|ˆρ(r)|Ψ0i+
+ Terme der Ordnung 2 oder h¨
oher in α .
Damit die Gleichheit f¨
ur jedes α[0,1] erf¨
ullt ist, m¨
ussen alle Entwicklungskoeffizienten
bis auf den der 0. Ordnung verschwinden. In linearer Ordnung ergibt sich damit
hΨ0|ˆρ(r)|Ψ1i+hΨ1|ˆρ(r)|Ψ0i= 0 .(1.102)
Setzt man hier den Ausdruck (1.101) f¨
ur die 1. Zustandskorrektur ein und nutzt aus, dass
nur einfach angeregte Slater-Determinanten Φkeinen Beitrag zur linken Seite von (1.102)
liefern, erh¨
alt man daraus eine Gleichung in den Ein-Teilchen-Wellenfunktionen ψides
Kohn-Sham-Systems (schrittweise in Anhang Gvorgef¨
uhrt):
occ.
X
i
unocc.
X
jψ
i(r)ψj(r)hψj|VFock[{ψk}]vx[ρ]|ψii
εiεj
+ c.c.= 0 ,(1.103)
wobei VFock[{ψk}] wieder von der Form des Fock-Operators (1.27) ist. Diese Gleichung ist,
wenn auch etwas anders aufgeschrieben, v¨
ollig identisch mit der OEP-Gleichung (1.97).
Damit ist sie auch ¨
aquivalent zur EXX-Gleichung (1.94), wenn man von den in den voran-
gehenden beiden Abschnitten beschriebenen Schwierigkeiten bei dieser Umformung einmal
absieht. Die linke Seite von (1.102) wird im variationellen EXX-Verfahren dann ¨
uber die
Ein-Teilchen-Zust¨
ande formuliert und stellt in diesem Konzept die zentrale Gr¨
oße der in-
duzierten Ladungsdichte” dar. Wegen der grundlegenden Bedeutung dieser Methode im
Rahmen der vorliegenden Arbeit sei ihr im Folgenden ein eigenes Kapitel gewidmet.
15Es sei unterschieden zwischen den virtuellen Anregungen, die sich aus den unbesetzten Zust¨
anden einer
Berechnung des N-Elektronen-Systems ergeben, und den Anregungen, die ¨
uber die Elektronenaffinit¨
at A
und die Ionisierungsenergie Idurch (IA) definiert sind.
X
Kapitel 2
Das variationelle EXX-Verfahren
In der Einleitung wurde auf eine Reihe von Nachteilen verwiesen, die die Verwendung
gen¨
aherter Austausch-Korrelationsfunktionale wie beispielsweise LDA oder GGA mit sich
bringt und die auf eine unvollst¨
andige Eliminierung der elektronischen Selbstwechselwir-
kung zur¨
uckzuf¨
uhren sind. Diese Probleme lassen sich mit dem im Vorangehenden vorge-
stellten EXX/OEP-Formalismus ¨
uberwinden, da hier die Eliminierung ganz analog zum
Hartree-Fock-Schema vollst¨
andig gelingt. Der Preis, den man daf¨
ur zu zahlen hat, ist ein
immenser numerischer Aufwand. OEP hat deshalb fast nur bei radialsymmetrischen, effek-
tiv eindimensionalen Problemen Anwendung finden k¨
onnen, vgl. Abschnitt 1.6.2. Jedoch
auch in der breiter anwendbaren EXX-Formulierung (1.94) skaliert allein die Inversion
des linearen Antwortoperators χ0kubisch mit der Abschneideenergie Ecut (kritsch bzgl.
der CPU-Zeit), und die Anzahl der ben¨
otigten unbesetzten Zust¨
ande ist beispielsweise
bei Verwendung einer Ebene-Wellen-Basis (vgl. Abschnitt 3.3) typischerweise um zwei
Gr¨
oßenordnungen h¨
oher als die der besetzten (kritisch bzgl. des Speicherbedarfs). Eine
drastische Restriktion der Anwendungsm¨
oglichkeiten ist die Folge.
Mehr theoretischer Natur ist Frage, weshalb ¨
uberhaupt unbesetzte Orbitale ben¨
otigt
werden. In der st¨
orungstheoretischen Herleitung der OEP-Gleichung nach Abschnitt 1.6.3
kamen diese durch Slater-Determinanten ins Spiel, die (virtuelle1) einfach angeregte Zu-
st¨
ande des Kohn-Sham-Systems repr¨
asentieren. Steht dies nicht aber im Widerspruch zum
Charakter der Kohn-Sham-DFT als einer reinen Grundzustandstheorie?
Um die Antwort gleich vorweg zu nehmen: Nein, denn es zeigt sich, dass die unbesetz-
ten Zust¨
ande zur Berechnung des exakten Austauschpotentials nur als Hilfsgr¨
oßen benutzt
werden und auch v¨
ollig umgangen werden k¨
onnen. Dies wurde unabh¨
angig voneinander
zun¨
achst von Wahn und Neugebauer [78] und wenige Zeit sp¨
ater von K¨
ummel und Per-
dew [79,80] nachgewiesen. Bei geschickter Formulierung des Problems wird ferner auch die
explizite Berechnung von χ0und seiner Inversen vermieden, so dass sowohl die speicher-
als auch die zeitkritischen Aspekte des EXX-Formalismus v¨
ollig eliminiert werden k¨
onnen.
Die genannten Autoren entwickelten daraus eine Methode, die ausschließlich auf Grundzu-
standsgr¨
oßen basiert und in der das exakte Austauschpotential durch Minimierung eines
vx-abh¨
angigen Funktionals, der (Norm der) induzierten Ladungsdichte” berechnet wird.
Daher wird dieses Verfahren im Folgenden als variationelles EXX-Verfahren (varEXX)
bezeichnet. Es wurde bisher erfolgreich im Falle von Atomen [78,79] und Clustern [80]
getestet. In der vorliegenden Arbeit wurde es erstmalig in einen Pseudopotential-Ebene-
Wellen-Code [81,82] implementiert (vgl. Kapitel 4), womit eine Erweiterung seines An-
wendungsbereichs auch auf den Fall periodischer Systeme erm¨
oglicht wurde (vgl. Kapitel 5
1Vgl. Fußnote auf Seite 33.
35
36 2 Das variationelle EXX-Verfahren
und 7). Das Verfahren sei im Folgenden vorgestellt.
2.1 Idee und mathematische Formulierung
Die von Wahn und Neugebauer gegebene Herleitung des variationellen EXX-Verfahrens
(vgl. Kapitel 2 in Ref. 78)¨
ahnelt der Vorgehensweise, die OEP-Gleichung aus der G¨
orling-
Levy-St¨
orungstheorie [40,41,42] zu entwickeln (vgl. Abschnitt 1.6.3). Ferner werden derar-
tige Ans¨
atze auch schon seit l¨
angerer Zeit in der Dichtefunktional-St¨
orungstheorie [83,84]
verwendet, etwa zur Berechnung von Phononenspektren, wie z.B. in dem ¨
Ubersichtsartikel
von Baroni et al. [85] beschrieben.
Ausgangspunkt des variationellen EXX ist die formal gleiche Gestalt der Austausch-
energien sowohl im Hartree-Fock- als auch im Kohn-Sham-Schema. Der Grundgedanke
besteht darin, die Eigenschaften des Fock-Operators als exaktes, aber nicht-lokales Aus-
tauschpotential der Hartree-Fock-Gleichung (1.24) mittels einer St¨
orung auf das lokale
Austauschpotential der Kohn-Sham-Gleichung (1.52)her¨
uberzuschieben”. Mit dem An-
satz
Hα:= 1
22+vext +vH[ρ] + vx[ρ] + vc[ρ]
|{z }
=: H0
+α·VFock[{ψi}]vx[ρ]
|{z }
=: H1
(2.1)
l¨
asst sich der Operator H0des Kohn-Sham-Systems durch Hochdrehen” von α[0,1] ste-
tig in den Operator H1=Hα|α=1 des Hartree-Fock-Systems2¨
uberf¨
uhren, wobei Letzterer
hier allerdings noch um den Korrelationsanteil der Kohn-Sham-Gleichung erg¨
anzt ist. Man
beachte, dass der obere, stetige Index αsich hier auf die St¨
arke der St¨
orung bezieht und
der untere Index f¨
ur den Kohn-Sham-Operator bzw. die St¨
orung steht. Weiter wird nun
gefordert, dass die Ladungsdichte f¨
ur alle α[0,1] in 1. N¨
aherung konstant bleibt. (Was
genau hier mit 1. N¨
aherung” gemeint ist, wird unten mit Gleichung (2.4) klar.) Damit
etabliert (2.1) eine adiabatische Verbindung” ¨
ahnlich zu der im St¨
orungsansatz (1.79)
von G¨
orling und Levy. Dort allerdings war Hαim N-Teilchen-Hilbertraum definiert, wo-
hingegen die Operatoren in (2.1) auf die Ein-Teilchen-Wellenfunktionen ψiwirken. Der
Ansatz (2.1) ist daher bereits konzeptuell viel n¨
aher an der numerischen Praxis.
Um die Forderung nach konstanter Dichte formulieren zu k¨
onnen, werden zun¨
achst die
Orbitale des durch αH1gest¨
orten Systems ben¨
otigt. Sie sind nach der Rayleigh-Schr¨
odin-
gerschen St¨
orungstheorie in 1. Ordnung durch ψ0
i+αψ1
igegeben, wobei die ψ0
idie Ei-
genfunktionen des ungest¨
orten Problems (1.52) sind, und sich die Korrekturfunktionen ψ1
i
aus der so genannten Sternheimer-Gleichung
(H0ε0
i)ψ1
i+ (H1ε1
i)ψ0
i= 0 (2.2)
ergeben [86]. Die Energiekorrekturen sind dabei durch ε1
i=hψ0
i|H1|ψ0
iigegeben. Wie in
Kapitel 4noch n¨
aher erl¨
autert, beruhen die Vorteile des variationellen EXX-Verfahrens
gegen¨
uber dem Standard-EXX-Verfahren entscheidend auf den effizienten L¨
osungsm¨
oglich-
keiten f¨
ur diese Gleichung.
2Genau genommen handelt es sich bei H1nur formal um den Operator des Hartree-Fock-Systems, da
VFock[{ψi}] aus den Kohn-Sham-Orbitalen aufgebaut ist. Dies geschieht in v¨
olliger Analogie zur Definition
der Kohn-Sham-Austauschenergie (1.69) mit Hilfe des Ausdrucks der Hartree-Fock-Austauschenergie.
2.1 Idee und mathematische Formulierung 37
Mit den Korrekturen ψ1
ifindet man nun die zu Hαgeh¨
orende Dichte
ρα=
occ
X
i|ψ0
i+αψ1
i|2
=
occ
X
i|ψ0
i|2
|{z }
=ρ0
+α·
occ
X
i(ψ0
i)ψ1
i+ (ψ1
i)ψ0
i
|{z }
=: ρ
+ Ausdruck der Ordnung 2 in α.
(2.3)
In linearer Ordnung, d.h., f¨
ur α0, ist die Dichte¨
anderung also durch αρgegeben. Da
αρdie (lineare) Ladungsverschiebung beschreibt, die durch den Einfluss der St¨
orung αH1
hervorgerufen wird, sei diese Gr¨
oße hier, Ref. 78 folgend, als induzierte Ladungsdichte
bezeichnet. Ist die Dichte konstant, folgt f¨
ur die 1. Ordnung
ρ:=
occ
X
i(ψ0
i)ψ1
i+ (ψ1
i)ψ0
i= 0 (2.4)
oder, ¨
aquivalent dazu,
ρ[vx]= 0 .(2.5)
In der letzten Beziehung wurde ρgleich als Funktional des Austauschpotentials vxge-
schrieben. Dies ist m¨
oglich, da die induzierte Ladungsdichte nach (2.4)¨
uber die direkt
von vxabh¨
angenden ψ0
iund die durch die St¨
orung H1[{ψ0
i}, vx] zumindest indirekt von vx
abh¨
angenden Korrekturen ψ1
igegeben ist. Man beachte, dass (2.5) nur f¨
ur das exakte vx
gilt. F¨
ur ein nur angen¨
ahertes Probe-Potential vProbe
xist (2.5) hingegen niemals3erf¨
ullt, so
dass sich daraus insgesamt ein Variationsprinzip f¨
ur das exakte Austauschpotential ergibt:
ρ[vProbe
x]0,(2.6)
wobei die Gleichheit nur im exakten Fall gilt. F¨
ur eine effiziente numerische Minimierung
der linken Seite sei auf Abschnitt 4.3 verwiesen.
In das Variationsprinzip gehen an keiner Stelle unbesetzte Zust¨
ande ein, und die lineare
Antwortfunktion χ0wird ebenfalls nirgends gebraucht. Es ist daher plausibel, dass dieser
Ansatz bei der Entwicklung von Computeralgorithmen die M¨
oglichkeit großer technischer
Vorteile gegen¨
uber dem Standard-EXX-Verfahren bietet. Eine tiefere Einsicht, auf welche
Weise in diesem Ansatz die Schwierigkeiten des Standard-Verfahrens umgangen werden
k¨
onnen, wird im ¨
ubern¨
achsten Abschnitt 2.3 zu geben versucht.
Vergleicht man (2.4) mit (1.102) aus Abschnitt 1.6.3, f¨
allt auf, dass beide Gleichungen
eine ¨
ahnliche Struktur besitzen. Tats¨
achlich sind sie identisch. Dar¨
uber hinaus stellen sie
eine besonders knappe Formulierung der OEP-Gleichung dar, was im Folgenden gezeigt
werden soll.
3In diesem Kapitel werden v-darstellbare Dichten vorausgesetzt. Folglich w¨
are das Hohenberg-Kohn-
Theorem I verletzt, falls es f¨
ur eine gegebene Dichte ρein zweites v
xg¨
abe, das die Bedingung (2.5) ebenfalls
erf¨
ullt.
38 2 Das variationelle EXX-Verfahren
2.2 ¨
Aquivalenz des variationellen Ansatzes zu OEP und
Standard-EXX
Im Ansatz (1.79) von G¨
orling und Levy wurde das gesamte lokale Austausch-Korrelations-
Potential vxc des Kohn-Sham-Schemas in den Austausch-Korrelations-Operator Vee vH[ρ]
des realen Systems ¨
uberf¨
uhrt. Die Konstanz der Dichte folgt dabei letztlich aus der Defi-
nition des Kohn-Sham-Systems, das ja gerade so konstruiert ist, dass es die reale Dichte
repliziert (vgl. Abschnitt 1.4.2).
Im Gegensatz dazu wird im vorangehend beschriebenen Ansatz nur das lokale Kohn-
Sham-Austauschpotential in ein nicht-lokales von der Form des Fock-Operators ¨
uberf¨
uhrt.
Nun liegen jedoch den Herleitungen des Fock-Operators und des Kohn-Sham-Austausch-
potentials g¨
anzlich verschiedene Ideen zu Grunde; einmal wird die Austauschenergie Ex
nach der Ein-Teilchen-Funktion ψiabgeleitet (vgl. Abschnitt 1.3), im anderen Fall jedoch
nach der Dichte ρ(vgl. Abschnitt 1.6.1). Die Einf¨
uhrung von VFock[{ψi}] in das Kohn-
Sham-Schema gem¨
(2.1) ist daher zun¨
achst ein heuristischer Ansatz, und es ist n¨
otig,
die ¨
Aquivalenz des Variationsprinzips (2.6) mit der OEP-Gleichung (1.97) noch einmal
streng zu beweisen.
Das Variationsprinzip (2.6) ist genau dann erf¨
ullt, wenn man ein vProbe
xgefunden hat,
das, in (2.1) eingesetzt, auf Korrekturfunktionen ψ1
if¨
uhrt, die die induzierte Ladungs-
dichte ρverschwinden lassen.4Gem¨
der St¨
orungstheorie lassen sich die L¨
osungen der
Sternheimer-Gleichung (2.2) auch als Reihenentwicklung mit Hilfe der Greenschen Funk-
tion (B.11) darstellen,
ψ1
i(r) = X
j
εj6=εi
ψ0
j(r)hψ0
j|H1|ψ0
ii
ε0
iε0
j
=ZGi(r,r)H1ψ0
i(r) d3r,(2.7)
wobei H1in (2.1) definiert wurde und ¨
uber alle Eigenfunktionen ψ0
jdes Kohn-Sham-Ope-
rators von (1.52) summiert wird mit Ausnahme derjenigen aus dem Eigenraum zu ε0
i.
Setzt man dies in Gleichung (2.4) ein,
ρ(r) =
occ
X
iX
j
εj6=εi
ψ0
i(r)ψ0
j(r)hψ0
j|H1|ψ0
ii
ε0
iε0
j
+ c.c.(2.8)
=
occ
X
iZd3rhψ0
i(r)Gi(r,r)H1ψ0
i(r) + c.c.i= 0 ,
und beachtet ferner, dass Summanden mit besetzten Zust¨
anden ψ0
jsich herausk¨
urzen
(Vertauschen von iund jliefert das negative Vorzeichen), ergibt sich daraus unmittelbar
die OEP-Gleichung in der Form (1.103) bzw. (1.97). Damit ist auch die ¨
Aquivalenz zur
EXX-Gleichung (1.90) gezeigt, wobei aber die in Kapitel 2besprochenen Schwierigkeiten
bei der Umstellung der Formel ber¨
ucksichtigt werden m¨
ussen.
Perdew und K¨
ummel [79,80] verfolgten bei der Herleitung des variationellen EXX-
Verfahrens gewissermaßen den umgekehrten Weg: Sie starteten von der OEP-Gleichung
4Eigentlich ist die induzierte Ladungsdichte in erster N¨
aherung durch αρgegeben. Da aber mit (2.4)
nur das (punktweise) Verschwinden des Koeffizienten ρentscheidend ist, sei im Folgenden stets α= 1
gesetzt.
2.3 Variation an Stelle direkter Inversion 39
in der kompakten Gestalt (2.5), die bereits durch Krieger, Li und Iafrate [72] sowie von
Grabo et al. [48,49] angegeben wurde, und konstruierten daraus ebenfalls ¨
uber die
Sternheimer-Gleichung (2.2) das St¨
orungsproblem (2.1).
2.3 Variation an Stelle direkter Inversion
Wenn das variationelle Verfahren ohne die unbesetzten Zust¨
ande und ohne χ0und dessen
Inversion auskommt, m¨
ussen deren Aufgaben” an anderer Stelle ¨
ubernommen werden.
Dies soll hier kurz diskutiert werden.
Zun¨
achst zu den unbesetzten Zust¨
anden: Bei der Berechnung von vx[ρ] mit dem Stan-
dard-Verfahren erscheinen sie gem¨
(1.94) an zwei Stellen: in der Greenschen Funkti-
on (B.12) und zur Berechnung der linearen Antwort χ0, wobei nach (F.2) bei Letzterer
die unbesetzten Zust¨
ande ebenfalls ¨
uber die Greensche Funktion ins Spiel kommen. Die
Greensche Funktion dient dabei der Beschreibung einer St¨
orung des Kohn-Sham-Systems,
und k¨
onnte wie (2.7) zeigt auch im variationellen Verfahren zur Berechnung der
linearen Korrekturen ψ1
ibenutzt werden. Die Berechnung der ψ1
igelingt jedoch viel effi-
zienter ¨
uber die Sternheimer-Gleichung (2.2). Die Idee dabei ist sehr ¨
ahnlich zu der, die
(direkte) Inversion von χ0zu vermeiden und sei deshalb weiter unten damit gemeinsam
diskutiert.
Zur Eliminierung von χ0: Die induzierte Ladungsdichte αρkann als Verschiebung der
Ladungsverteilung weder Ladung hinzu-, noch abf¨
uhren. Mathematisch wird dies durch
die Forderung der Orthogonalit¨
at ψ0
iψ1
iin der Sternheimer-Gleichung erreicht, vgl.
Abschnitt 4.1.1. Es gilt also
Zρ(r) d3r=
occ
X
iZψ0
i(r)ψ1
i(r) d3r+ c.c. = 0 .(2.9)
Wie von G¨
orling und Levy in Ref. 41 bzw. hier im Anschluss an Gleichung (1.93) diskutiert,
charakterisiert diese Bedingung gerade den Wertebereich der linearen Antwort χ0. Dies
ist der Untervektorraum (der Ladungsdichte¨
anderungen), in dem χ0invertierbar ist, also
die EXX-Gleichung (1.90) definiert ist. Ferner geht die induzierte Ladungsdichte αρf¨
ur
infinitesimal kleine” αformal in den Z¨
ahler” von χ0=δρ/δveff ¨
uber:
αρ=
occ
X
i
(ψ0
i)(αψ1
i) + c.c. (2.10)
occ
X
i
(ψ0
i)δψ0
i+ c.c. = δ
occ
X
i|ψ0
i|2=δρ (α 0) .
Die in Abschnitt 2.1 verlangte Forderung, dass die Ladungsdichte in linearer N¨
aherung
konstant bleibt, wenn man das Potential um veff := αH1¨
andert, k¨
onnte man nun sehr
einfach formulieren, wenn der St¨
oroperator lokal w¨
are:
Zχ0[veff](r,r) veff (r) d3r=Zδρ[veff ](r)
δveff (r)veff(r) d3r!
= 0 .(2.11)
So ist z.B. die linke Seite der OEP-Gleichung (1.96) von dieser Form, wenn man veff := vx
setzt. Das Problem ist nun aber, dass der St¨
oroperator H1von (2.1) nicht-lokal ist, da
er den Fock-Operator enth¨
alt. Damit ist χ0allerdings ¨
uberfordert”. Wie in Anhang D
gezeigt, l¨
asst sich die lineare Antwort jedoch auch so erweitern, dass sie auf diese Form
40 2 Das variationelle EXX-Verfahren
nicht-lokaler Potentialdifferenzen anwendbar ist, und die Idee, lineare Dichte¨
anderungen
gleich Null zu setzen, kann auf ¨
ahnliche Weise wie in obiger Gleichung (2.11) formuliert
werden. Dort wird auch auf den engen Bezug dieser Interpretation zur Sham-Schl¨
uter-
Gleichung und damit letztlich auch zur GW -Methode [150,151] verwiesen. Die induzierte
Ladungsdichte (2.4) kann demnach als Ergebnis einer Anwendung der linearen Antwort
auf die Potential¨
anderung aufgefasst werden; eine explizite Berechnug von χ0wird nicht
mehr ben¨
otigt.
Durch welchen Mechanismus wird im variationellen Verfahren nun aber die im Stan-
dard-Formalismus ben¨
otigte Inversion von χ0ersetzt? Dies geschieht auf ganz ¨
ahnliche
Weise, wie sich die Greensche Funktion mit Hilfe der Sternheimer-Gleichung umgehen
l¨
asst. Der Greensche Operator ist gem¨
(B.8) in einem geeigneten Unterraum die Um-
kehrung des Operators H0ε0
i, mit deren Hilfe die Sternheimer-Gleichung in (2.7) expli-
zit nach ψ1
iaufgel¨
ost werden konnte. Analog wird auch χ1
0in (1.94) nur zur expliziten
Aufl¨
osung nach dem Austauschpotential vxben¨
otigt. In den impliziten Darstellungen von
vxund ψ1
imit Hilfe der OEP-Gleichung in Gestalt von (1.96) oder (2.4) bzw. ¨
uber die
Sternheimer-Gleichung (2.2) werden nur die Operatoren χ0bzw. H0ε0
iselbst, nicht aber
deren Umkehrungen ben¨
otigt. Solche impliziten Gleichungen lassen sich aber als Varia-
tionsprizip f¨
ur die gesuchte Variable verstehen: sie muss nur so lange variiert werden,
bis die Gleichung erf¨
ullt ist. Es erweist sich dabei h¨
aufig als bequem, das Variationsprin-
zip als Extremalprinzip f¨
ur eine skalare Gr¨
oße zu formulieren, die dann zum Funktio-
nal der Variablen wird. Dies l¨
asst sich stets wie in (2.6) f¨
ur die OEP-Gleichung
durch Betragsbildung erreichen. Es gibt aber auch andere M¨
oglichkeiten, solche Funktio-
nale zu konstruieren, wie z.B. in Abschnitt 4.1.1 f¨
ur den Fall der Sternheimer-Gleichung
ausgef¨
uhrt. Wie die Minimierung dieser Funktionale im Einzelnen gelingt, wird in den
Abschnitten 4.1.2 und 4.3 ausf¨
uhrlich diskutiert.
Noch einmal kurz: Die Vorteile der variationellen Formulierung des EXX-Verfahrens
beruhen letztlich auf dem Trick, komplizierte Operator-Inversionen mit Hilfe implizi-
ter Gleichungen in numerisch einfachere Extremalwertprobleme umzuformulieren. Dieser
Kunstgriff l¨
asst sich dabei gleich zweimal anwenden, sowohl zur Vermeidung des Green-
schen Operators ˆ
Gi= (H0ε0
i)1, als auch zur Vermeidung von χ1
0(beide in geeigneten
Unterr¨
aumen definiert).
2.4 Variationelles EXX und Hartree-Fock-Verfahren
Gleichung (2.1) stellt einen engen Bezug zwischen dem “exchange-only” (vc:= 0) Kohn-
Sham-Formalismus (Hαmit α= 0) und dem Hartree-Fock-Schema (Hαmit α= 1) her.
Dennoch lassen sich die Ergebnisse einer Kohn-Sham-EXX-Rechnung nicht in die Ergeb-
nisse einer Hartree-Fock-Rechnung ¨
uberf¨
uhren auch nicht in 1. N¨
aherung —, indem
man einfach die durch die St¨
orung H1hervorgerufenen Korrekturen ψ1
iberechnet und
auf die Kohn-Sham-Funktionen addiert. Der Grund ist, dass der nicht-lokale Austausch-
operator VFock[{ψi}] hier aus den Kohn-Sham-, nicht aber aus den selbst-konsistenten
Hartree-Fock-Orbitalen aufgebaut ist.
Dennoch macht Ansatz (2.1) die große ¨
Ubereinstimmung der Ladungsdichte, der Ge-
samtenergie [49,60,61,62,68,78] und sogar der Orbitale [58,59] im Hartree-Fock- und
dem “exchange-only” Kohn-Sham-Schema plausibel.5Denn in (2.1) wird mit Hilfe der
5Es sei allerdings an dieser Stelle auf die großen qualitativen Unterschiede der beiden Methoden
hinsichtlich der Ein-Teilchen-Energien hingewiesen: Wie in der Einleitung bereits ausgef¨
uhrt, steht der
sehr guten ¨
Ubereinstimmung der theoretischen Bandl¨
ucken in EXX mit den experimentellen Werten eine
2.4 Variationelles EXX und Hartree-Fock-Verfahren 41
Minimierung (2.6) das lokale Potential vxgewissermaßen so gefittet” oder gemittelt”,
dass es sich optimal an VFock anpasst. Anders ausgedr¨
uckt, das EXX-Potential ist die beste
lokale N¨
aherung f¨
ur VFock. Dies war wenngleich in anderer Formulierung ja auch der
Leitgedanke beim OEP-Ansatz (1.99); es best¨
atigt sich hier also wiederum die ¨
Aquivalenz
von EXX und OEP. Nimmt man weiter an, dass vEXX eine gute N¨
aherung f¨
ur VFock ist,
so sollte man erwarten, dass sich die Orbitale und die (aus ihnen aufgebauten) Gesamt-
energien in beiden Formalismen nur sehr wenig voneinander unterscheiden. Dass sie gut
ist, best¨
atigen die oben genannten Referenzen. Vollst¨
andig kann der Unterschied zwischen
Hartree-Fock- und Kohn-Sham-Orbitalen jedoch im Allgemeinen nicht verschwinden, da
H1als Differenz zwischen einem lokalen und nicht-lokalen Operator im Allgemeinen nicht
0 werden kann außer in einfachsten F¨
allen wie dem Wasserstoffatom, f¨
ur das auch
das Fock-Potential als lokaler Operator darstellbar ist (und sich gerade gegen das Hartree-
Potential weghebt). Es sei noch bemerkt, dass die Vernachl¨
assigung der Orbitaldifferenzen
zum so genannten lokalisierten Hartree-Fock-Verfahren [87] f¨
uhrt, das als Verallgemeine-
rung des KLI-Verfahrens [70,71,72,73] angesehen werden kann und gegen¨
uber Letzterem
den Vorteil besitzt, wie der Fock-Operator invariant bzgl. unit¨
arer Transformationen der
Wellenfunktionen zu sein.
¨
Ubersch¨
atzung der Bandl¨
ucken bei Hartree-Fock um typischerweise einen Fakor 2 3 gegen¨
uber.
X
Kapitel 3
Methoden zur numerischen
Beschreibung periodischer
Systeme
Zentrale Gr¨
oßen bei der mathematischen Beschreibung quantenmechanischer Systeme sind
in Gestalt linearer Operatoren und Funktionen gegeben, die als Elemente eines geeigneten
Vektorraums, z.B. eines Hilbertraums, bzw. als lineare Abbildungen darin definiert sind.
Zur konkreten Darstellung dieser Objekte ben¨
otigt man Koordinatensysteme, auch Basis-
systeme genannt. Ihre Wahl ist beliebig (solange sie vollst¨
andig” sind) und kann daher
nach Zweckm¨
aßigkeit erfolgen. Da dieser Vektorraum jedoch in der Regel -dimensional
ist, besteht eine erste numerische Vereinfachung1darin, nicht mehr die vollst¨
andige Ba-
sis zu betrachten, sondern nur noch eine endliche, von der gew¨
unschten Genauigkeit
abh¨
angende Anzahl nvon Basisvektoren (Diskretisierung”). Damit wird das Problem
¨
uberhaupt erst mit dem Rechner handhabbar; Operatoren werden zu (n×n)-Matrizen
und Funktionen zu n-dimensionalen Vektoren.
Je nach Zweckm¨
aßigkeit verwendet man in der Praxis verschiedene Typen von Basis-
funktionen. Halbleiterkristalle, wie sie in dieser Arbeit behandelt werden, lassen sich als
(n¨
aherungsweise) periodische Systeme besonders gut mit ebenen Wellen beschreiben (Ab-
schnitt 3.3). Effektiv ist dieser Ansatz, wenn er mit dem durch die Theorie der chemischen
Bindung motivierten Pseudopotentialkonzept kombiniert wird (Abschnitte 3.4 und 3.5).
Weitere Reduktionen des numerischen Aufwandes ergeben sich durch Ausnutzung vorhan-
dener Symmetrien; statt den (im Idealfall unendlich ausgedehnten) Kristall zu betrachten,
beschr¨
ankt man sich de facto auf eine kleine Einheitszelle mit nur wenigen Kernen/Ionen
(Abschnitte 3.1 und 3.2).
Anders dagegen bei Systemen, in denen etwa mehrere Tausend Atome explizit zu
ber¨
ucksichtigen sind, z.B. Quantenpunkte: Hier sind ebene Wellen im Allgemeinen nicht
mehr praktikabel, und ist es besser, lokalisierte Tight-Binding-Basen zu verwenden. In
diesem Zusammenhang sei auf Teil II dieser Arbeit verwiesen, in dem eine spezielle Tight-
Binding-Basis, konstruiert aus Verallgemeinerten Wannier-Funktionen”, vorgestellt wird.
1Die in diesem Kapitel besprochenen N¨
aherungen sind jedoch nicht die einzigen: durch die Einf¨
uhrung
der Born-Oppenheimer-N¨
aherung, der Verwendung gen¨
aherter Austausch-Korrelationspotentiale wie LDA
oder GGA sowie dem Abbrechen der G¨
orling-Levy-Entwicklung nach dem ersten Glied (“exchange-only”)
u.¨
A. wurden bereits im Vorangehenden erhebliche Vereinfachungen vorgenommen.
43
44 3 Methoden zur numerischen Beschreibung periodischer Systeme
3.1 Symmetrien und periodische Randbedingungen
Ein idealer Kristall besteht aus einer periodischen Anordnung von Kernen oder bei
Verwendung von Pseudopotentialen, vgl. Abschnitt 3.5 Ionen, in deren Potential sich
eine unendliche Anzahl von Elektronen bewegt. Je nach Struktur gibt es S¨
atze linear
unabh¨
angiger Vektoren a1,a2,a3IR3, deren ganzzahlige Linearkombinationen Rden
Kristall in sich selbst ¨
uberf¨
uhren (Translationssymmetrie):
R=n1a1+n2a2+n3a3(mit n1, n2, n3Z).(3.1)
Das durch die aiaufgespannte Parallelepiped wird Einheitszelle genannt und besitzt das
Volumen = |a1·(a2×a3)|. Eine Wahl der ai, die auf das kleinste Volumen f¨
uhrt, das,
periodisch fortgef¨
uhrt, den ganzen Kristall ergibt, definiert die primitive Zelle. Tats¨
achlich
lassen sich durch einen solchen Ansatz nicht nur Volumensysteme, sondern auch Ober-
fl¨
achen, Cluster, Molek¨
ule und isolierte Atome beschreiben. Dabei setzt man diese Struk-
turen periodisch fort, w¨
ahlt aber die Abst¨
ande zwischen den Einzelsystemen so groß, dass
die ¨
Uberlappung ihrer Wellenfunktionen so gering wie m¨
oglich gehalten wird. Da die Ein-
heitszelle im Rechner nat¨
urlich nicht beliebig gedehnt werden kann, ist hier ein sinnvoller
Kompromiss zu finden.
Analog zu den Gittervektoren (3.1) definiert man ein reziprokes Gitter durch die Vek-
toren
G=n1b1+n2b2+n3b3(mit n1, n2, n3Z),(3.2)
wobei die bieine zu den aireziproke Basis des IR3sind:
bi:= 2πaj×ak
(f¨
ur i, j, k zyklisch) .(3.3)
Der durch die biaufgespannte Bereich mit dem Volumen 8π3/ heißt reduzierter Bereich.
H¨
aufig wird er jedoch durch die volumensgleiche 1. Brillouin-Zone (BZ), einer Wigner-
Seitz-Zelle im reziproken Raum, ersetzt. Die Konstruktion von Wigner-Seitz-Zellen wird
in vielen Standardwerken der Theoretischen Festk¨
orperphysik, z.B. in Ref. 88 oder 89,
beschrieben.
Im Einteilchen-Hamilton-Operator H(r) = 1
22+V(r) kommt die Translationsym-
metrie des Systems durch ein translationsinvariantes Potential V(r) = V(r+R) zum
Ausdruck. Als Eigenfunktionen ψnkergeben sich damit so genannte Blochfunktionen, die
in eine ebene Welle und eine gitterperiodische Modulationsfunktion unkseparieren:
ψnk(r) = eik·runk(r) mit unk(r) = unk(r+R).(3.4)
Dabei kann der Quasi-Wellenvektor” kstets als Element der 1. Brillouin-Zone gew¨
ahlt
werden, denn es gilt ψn,k=ψn,k+Gf¨
ur beliebige reziproke Gittervektoren aus (3.2). Die
Dispersion, d.h., die k-Abh¨
angigkeit der zugeh¨
origen Eigenwerte εnkl¨
asst sich in Form
einer Bandstruktur darstellen, in der die Energieb¨
ander durch den Bandindex nabgez¨
ahlt
werden. Blochfunktionen gen¨
ugen der Blochbedingung
ψnk(r+R) = eik·Rψnk(r),(3.5)
d.h., sie sind im Allgemeinen nicht gitterperiodisch (nur dann, wenn kein reziproker
Gittervektor gem¨
(3.2) ist).
Neben der Translationssymmetrie weist das System in der Regel eine Anzahl NPS von
Punktsymmetrien auf, d.h., f¨
ur das Potential des Hamilton-Operators gilt V(r)=V(Sνr)
3.2 Numerische Integration in der Brillouin-Zone 45
mit ν= 1,...,NPS. Die Sνsind dabei durch unit¨
are (3 ×3)-Matrizen gegeben, die eine
Gruppe, die Punktgruppe des Systems, bilden. Aus der Blochbedingung erh¨
alt man
ψn,Sνk(r) = ψn,k(S1
νr), εn,Sνk=εn,k,(3.6)
was beispielsweise in Ref. 90 oder 91 vorgef¨
uhrt wird. Unabh¨
angig von der speziellen
Punktgruppensymmetrie des Systems gilt im reziproken Raum stets die so genannte Zeit-
umkehrsymmetrie. Sie ergibt sich aus der konjugiert-komplexen Schr¨
odinger-Gleichung
und der Blochbedingung (vgl. z.B. Ref. 92):
ψn,k(r) = eiαn,kψ
n,k(r), εn,k=εn,k,(3.7)
wobei αn,keine beliebige Phase ist.
Zu der praktischen Unm¨
oglichkeit, alle unendlich vielen Elektronen des idealen Kris-
talls numerisch zu ber¨
ucksichtigen, tritt das konzeptuelle Problem, dass Blochfunktionen
auf dem IR3nicht normierbar und damit zur quantenmechanischen Beschreibung zun¨
achst
nicht geeignet sind. Beide Schwierigkeiten lassen durch Verwendung periodischer Randbe-
dingungen, auch Born-von-K´arm´an-Randbedingungen genannt, umgehen. Die N¨
aherung
besteht hier darin, nur einen Teil des periodischen Systems zu betrachten, der durch ein
ganzzahliges Vielfaches der Einheitszelle, d.h. also, durch ein Parallelepiped mit den Kan-
ten Liai(LiIN geeignet) gegeben ist. Die Blochfunktionen werden dann nur auf diesem
periodischen Grundgebiet normiert, und man nimmt weiter an, dass sie mit diesem Gebiet
periodisch sind:
ψnk(r+Liai) = ψnk(r).(3.8)
Diese Annahme f¨
uhrt zu einer Diskretisierung des reziproken Raums: Der Quasi-Wellen-
vektor kkann nur noch die Werte
k=m1
L1
b1+m2
L2
b2+m3
L3
b3(mit m1, m2, m3Z) (3.9)
annehmen, wobei der reduzierte Bereich durch 0 mi< Liabgetastet wird. F¨
ur gen¨
ugend
große Likann der Abstand benachbarter kjedoch beliebig klein gemacht werden, daher
bezeichnet man diese ¨
aquidistante Verteilung der k-Punkte auch als quasikontinuierlich”.
Man beachte, dass die Anzahl L1L2L3der k-Punkte gerade der Anzahl der Einheitszel-
len im periodischen Grundgebiet entspricht. Etwas plakativ kann man also formulieren:
der Ortsraum-Variablen Rentspricht im reziproken Raum die Variable k. Die Beschrei-
bung des Kristalls wird umso genauer, je gr¨
oßer das periodische Grundgebiet ist, d.h.,
je dichter das durch (3.9) gegebene Gitter gew¨
ahlt wurde. Im Grenzfall gehen Summen
¨
uber k-Punkte daher in Integrale ¨
uber. Solche Integrale sollen im folgenden Abschnitt 3.2
behandelt werden.
3.2 Numerische Integration in der Brillouin-Zone
F¨
ur gitterperiodischen Systeme findet man mit Hilfe der Bloch-Bedingung (3.5), dass die
Ladungsdichte und eine Reihe anderer Gr¨
oßen, wie etwa der nicht-lokale Austauschopera-
tor (vgl. Abschnitt 4.4), durch Integrale ¨
uber die 1. Brillouin-Zone (BZ) gegeben sind. Im
Folgenden sei hier exemplarisch die Ladungsdichte betrachtet, die sich dann gem¨
(1.53)
zu
ρ(r) =
8π3X
nZBZ
focc(n, k)·|ψnk(r)|2d3k(3.10)
46 3 Methoden zur numerischen Beschreibung periodischer Systeme
ergibt. Hier ist
focc(n, k) := 1
1 + exp εnkεF
kBT(3.11)
die Fermi-Funktion mit der Fermi-Energie εF, der Boltzmann-Konstante kBund der Tem-
peratur T, ferner beinhaltet der Index ndabei die Spinquantenzahl σ. F¨
ur die numeri-
sche Behandlung muss die Integration durch eine Summe ¨
uber einen diskreten Satz an
k-Punkten approximiert werden. Dabei wird ausgenutzt, dass sich die Wellenfunktionen
dicht beieinander liegender k-Punkte nur wenig voneinander unterscheiden, und damit ein
ganzer Bereich im reziproken Raum durch einen einzigen k-Punkt repr¨
asentiert werden
kann. Wie hoch die Aufl¨
osung tats¨
achlich gew¨
ahlt werden muss, h¨
angt vom betrachteten
System ab und muss durch Konvergenztests herausgefunden werden.
Zur Generierung geeigneter k-Punkt-S¨
atze sind verschiedene Methoden entwickelt wor-
den [93,94,95,96,97]. Eine der gebr¨
auchlichsten ist das auch in dieser Arbeit benutzte
Verfahren von Monkhorst und Pack [96], bei dem ein regelm¨
aßiges Gitter durch den redu-
zierten Bereich (vgl. Abschnitt 3.1) gelegt wird. Unterteilt man den reduzierten Bereich
dabei in Richtung der bi-Vektoren je Limal, spricht man von einem (L1×L2×L3)-
Monkhorst-Pack-Gitter, vgl. Abb 3.1.
Weiter reduzieren l¨
asst sich die Anzahl der ben¨
otigten k-Punkte durch Ausnutzung
der Punktsymmetrie des Systems. Punkte, die durch Punkttransformationen ineinander
¨
uberf¨
uhrt werden k¨
onnen, bilden eine ¨
Aquivalenzklasse. Die Symmetrie-Relationen (3.6)
und (3.7) erlauben es nun, pro ¨
Aquivalenzklasse jeweils nur einen k-Punkt, gewichtet mit
der M¨
achtigkeit der Klasse, in der Summe zu ber¨
ucksichtigen und das Ergebnis daf¨
ur
anschließend zu symmetrisieren”. Die Dichte (3.10) wird dann ann¨
ahernd durch
ρ(r)ρsym(r) := 1
NPS
NPS
X
ν=1
ρunsym(Sνr) (3.12)
beschrieben, wobei NPS die Anzahl der Punkttransformationen ist, und ρunsym als Summe
¨
uber einen reduzierten Satz Nred nicht-¨
aquivalenter k-Punkte gegeben ist:
ρunsym(r) := X
n
Nred
X
s=1
wksfocc(n, ks)|ψnks(r)|2.(3.13)
Die Gewichte wksmit PNred
s=1 wks= 1 sind dabei proportional zur M¨
achtigkeit der durch
die ksrepr¨
asentierten Klassen.
Es sei darauf hingewiesen, dass die Symmetrisierung (3.12) im Allgemeinen einer Sum-
mation ¨
uber mehr k-Punkte als den L1L2L3Punkten des urspr¨
unglichen Monkhorst-Pack-
Gitters entspricht. Dies r¨
uhrt daher, dass das Monkhorst-Pack-Gitter im Allgemeinen nicht
invariant gegen¨
uber Punkttransformationen des Bravais-Gitters (und der Zeitinversions-
symmetrie) ist, wie Abbildung 3.1 demonstriert. Eine Summation explizit ¨
uber das ge-
samte Monkhorst-Pack-Gitter, aber ohne anschließende Symmetrisierung, liefert deshalb
nicht notwendigerweise ein symmetrisches Ergebnis.
3.3 Entwicklung nach ebenen Wellen
Die Separierbarkeit der Blochfunktionen (3.4) gestattet es, den Ebene-Wellen-Faktor eik·r
aus dem Eigenwertproblem Hψnk=εnkψnkherauszuk¨
urzen und eine Differentialgleichung
nur f¨
ur die Modulationsfunktion unkaufzustellen:
2
b
1
b
2
b
1
b
2
b
1
b
2
b
1
b
)a(
)b(
)d(
2
b
1
b
2
b
1
b
)e(
)f(
Abbildung 3.1: Symmetrien beim Monkhorst-Pack-Schema am Beispiel eines 2-dimensionalen Gitters mit hexagonaler Struktur. Die reziproken Gittervektoren
b1und b2spannen den reduzierten Bereich (grau) auf. (a) k-Punkt-Satz einer (2×2)-Monkhorst-Pack-Zerlegung im reduzierten Bereich. (b) Der k-Punkt-Satz
kann auf die schwarz gezeichneten Punkte reduziert werden, denn diese lassen sich durch Symmetrietransformationen (hier: Inversion, Verschiebung um reziproke
Gittervektoren) in die mit leeren Kreisen markierten k-Punkte ¨
uberf¨
uhren. (c) Der reduzierte k-Punkt-Satz. (d) Durch Anwenden aller Punktsymmetrien (hier:
Drehung um 0,60,120,180,240,300und die Inversion) auf den reduzierten k-Punkt-Satz ergeben sich die so genannten Sterne”. (e) Translation aller
Punkte der Sterne um geeignete reziproke Gittervektoren in den reduzierten Bereich. (f) Dieser k-Punkt-Satz ist dem in (d) ¨
aquivalent. Der Vergleich mit (a)
zeigt, dass die urspr¨
ungliche Monkhorst-Pack-Zerlegung hier nicht invariant gegen¨
uber Punkttransformationen des Bravais-Gitters ist. Summiert man jeweils
¨
uber die markierten Punkte im grauen Feld, erh¨
alt man in (a) folglich nicht die volle Symmetrie, in (f) hingegen schon.
47
48 3 Methoden zur numerischen Beschreibung periodischer Systeme
1
222k·1
ik2+V(r)unk(r) = εnkunk(r).(3.14)
Wegen der Gitterperiodizit¨
at des Potentials Vund der Modulationen unkkann diese Glei-
chung fouriertransformiert werden:
X
G+1
2|G+k|2δG,G+ˆ
V(GG)cnk(G) = εnkcnk(G).(3.15)
Die
cnk(G) = 1
Z
unk(r) eiG·rd3r(3.16)
sind dabei die Koeffizienten der Fourierentwicklung
unk(r) = 1
X
G
cnk(G) eiG·r.(3.17)
Offensichtlich wird beim ¨
Ubergang von der Orts- zur Impulsdarstellung aus dem nicht-
lokalen Operator der kinetischen Energie ein lokaler Multiplikationsoperator. Umgekehrt
erh¨
alt man jedoch aus einem wie im Falle der Kohn-Sham-Gleichungen (1.52) lokalen
Potential V(r) einen nicht-lokalen Operator. Daher empfiehlt es sich, die Operationen
jeweils in der Basis auszuf¨
uhren, in der sie lokal dargestellt werden k¨
onnen. Dabei kann mit
Hilfe schneller Fouriertransformationen (FFT) effizient zwischen den beiden Darstellungen
hin- und hergewechselt werden.
Aus der R¨
ucktransformation (3.17) ergibt sich zusammen mit (3.4) auch die Fourier-
darstellung der Blochfunktionen:
ψnk(r) = 1
X
G
cnk(G) ei(G+k)·r.(3.18)
Die Basis hier ist die so genannte |G+ki-Basis” mit ei(G+k)·r=hr|G+ki.
Wie zu Beginn des Kapitels bereits erw¨
ahnt, muss die Menge der Basisfunktionen in
der Praxis auf eine endliche Anzahl reduziert werden. Dies geschieht hier durch Einf¨
uhrung
einer Abschneideenergie oder cutoff-Energie Ecut. Sie stellt eine Obergrenze f¨
ur die kineti-
sche Energie der schnellsten” Basisfunktionen dar. F¨
ur gegebenes kwird die Summation
in (3.17) bzw. (3.18) also auf alle Gmit 1
2|G+k|2< Ecut eingeschr¨
ankt. Die Abschnei-
deenergie ist somit ein leicht kontrollierbares Maß f¨
ur die Qualit¨
at (die Vollst¨
andigkeit”)
der Basis. Bei praktischen Anwendungen muss mit Hilfe von Konvergenztests sichergestellt
sein, dass die Rechnungen bzgl. Ecut auskonvergiert sind. Aus dem Variationsprinzip von
Ritz (vgl. Abschnitt 1.2) folgt eine Konvergenz von oben gegen die tats¨
achliche Gesamt-
energie.
Mit dem Vorangehenden wird klar, dass die Verwendung einer Ebene-Wellen-Basis
umso effizienter ist, je kleiner die ben¨
otigte Abschneideenergie ist. Die Anzahl der er-
forderlichen G-Vektoren l¨
asst sich dabei durch die Relation NGE3/2
cut absch¨
atzen. Die
Fourierentwicklung stark lokalisierter und/oder heftig oszillierender Wellenfunktionen, wie
sie z.B. durch die Singularit¨
aten des ¨
außeren Potentials an den Kernorten hervorgeru-
fen werden, verlangt jedoch auch sehr hohe Frequenzen. Dem kann mit der Einf¨
uhrung
so genannter Pseudopotentiale begegnet werden, die die Orbitale innerhalb eines f¨
ur die
3.4 N¨
aherung der starren R¨
umpfe 49
chemische Bindung nicht relevanten Rumpfbereichs durch gegl¨
attete Pseudoorbitale er-
setzen und damit die erforderliche Abschneideenergie drastisch reduzieren. Andererseits
wurden in den vergangenen Jahren auch gemischte” Basiss¨
atze entwickelt, in denen ebe-
ne Wellen mit lokalisierten Basisfunktionen kombiniert werden. Erw¨
ahnt seien hier die
linearized augmented plane-waves (LAPW) [100], die augmented plane-waves plus local
orbitals (APW+lo) [101,102] sowie die projector augmented plane-waves (PAW) [103].
In dieser Arbeit werden ebene Wellen in Verbindung mit nicht-lokalen, normerhaltenden
Pseudopotentialen benutzt, auf deren Konstruktion genauer in Abschnitt 3.5 eingegangen
wird. Mit dieser Methode lassen sich die hier untersuchten Halbleitermaterialien (GaAs,
Gruppe-III-Nitride) gut beschreiben.
3.4 N¨
aherung der starren R¨
umpfe
Chemische Bindungen werden fast ausschließlich von den ¨
außeren, so genannten Valenz-
elektronen der beteiligten Atome bestimmt. Ferner ist die Hybridisierung zwischen den
Valenzelektronen und den inneren, so genannten Rumpfelektronen h¨
aufig vernachl¨
assig-
bar. Daher ist es in der Regel ausreichend, die inneren Schalen zusammen mit den Kernen
als unver¨
anderliche Ionen” oder starre R¨
umpfe” (engl.: frozen cores”) aufzufassen, de-
ren Wechselwirkung mit den Valenzelektronen gen¨
ahert ¨
uber ein effektives Potential vIon
beschrieben wird.
Von den Ergebnissen einer Allelektronen-Rechnung f¨
ur ein freies Atom mit Kernla-
dungszahl Zausgehend, wird daf¨
ur die atomare Ladungsdichte ρAE =ρR+ρVin einen
Anteil ρR=PNR
i=1 |ψi|2der NRRumpfelektronen und einen Anteil ρV=PZ
i=NR+1 |ψi|2der
ZNRValenzelektronen aufgeteilt. Von nun an wird die atomare Rumpfladungsdichte ρR
als konstant vorausgesetzt, also nicht mehr zur Variation zugelassen. Damit erh¨
alt man
den nur von der Valenzladungsdichte ρVabh¨
angenden atomaren Kohn-Sham-Operator
1
22+vIon(r) + vH[ρV](r) + vxc[ρV](r).(3.19)
Alle ρR-abh¨
angigen Terme sind hier durch das Ionenpotential
vIon(r) := Z
|r|+vH[ρR](r) + vxc[ρR, ρV](r) (3.20)
ber¨
ucksichtigt. Es enth¨
alt neben dem Kernpotential den Rumpfanteil des Hartree-Poten-
tials, der auf Grund der Linearit¨
at in der Ladungsdichte vH[ρ1+ρ2] = vH[ρ1] + vH[ρ2]
exakt vom Valenzanteil abgespalten werden kann. Das Austausch-Korrelationspotential
hingegen ist nicht linear in der Dichte; daher ist vIon ¨
uber den Ausgleichsterm
vxc[ρR, ρV] := vxc[ρR+ρV]vxc[ρV] (3.21)
streng genommen noch von der Valenzladungsdichte ρVabh¨
angig. Sie wird aber n¨
ahe-
rungsweise auch bei der Betrachtung mehratomiger Systeme gleich der atomaren Valenz-
dichte ρVgesetzt und festgehalten, so dass (3.20) das Potential eines starren Rumpfs” dar-
stellt. Dies entspricht letztlich einer Linearisierung” des Austausch-Korrelationspotentials,
vxc[ρR]vxc[ρR+ρV]vxc[ρV], die damit gerechtfertigt wird, dass die ¨
Uberlappung von
Rumpf- und Valenzzust¨
anden des Allelektronen-Atoms in der Regel vernachl¨
assigt wer-
den kann. Falls diese Vorgehensweise keine befriedigenden Ergebnisse liefert, l¨
asst sich
eine nicht-linearen Rumpfkorrektur [104,105,115] durchf¨
uhren, die im Rahmen der
N¨
aherung der starren R¨
umpfe exakt ist, vgl Abschnitt 3.5.3.
50 3 Methoden zur numerischen Beschreibung periodischer Systeme
Um schließlich zu einer Kohn-Sham-Gleichung f¨
ur MAtome zu gelangen, wird das ex-
terne Potential vext in (1.52) durch eine geeignete Superposition von Ionenpotentialen der
Form (3.20) definiert und zur Berechnung der Dichte in (1.53)¨
uber alle Valenzelektronen
im System summiert.
Die Entscheidung, auf welche Weise die Einteilung der Elektronen in Rumpf- und
Valenzbereich erfolgen soll, h¨
angt vom betrachteten Element und der gew¨
unschten Ge-
nauigkeit ab. Bei den Elementen der III-V-Verbindungen werden oft die abgeschlossenen
inneren Schalen dem Rumpf-, die s- und p-Elektronen der ¨
außeren Schale hingegen dem
Valenzbereich zugeordnet, so z.B. bei GaAs oder InAs. In einigen F¨
allen sind jedoch auch
tiefer liegende Zust¨
ande an der chemischen Bindung beteiligt: So wechselwirken etwa bei
GaN und InN die kationischen d-Zust¨
ande der so genannten semi-core-Schale (der Schale
unterhalb der eigentlichen Valenzschale) mit den energetisch nah liegenden 2s-Zust¨
anden
des Stickstoffs und m¨
ussen daher bei einer genaueren Rechnung explizit als Valenzelek-
tronen ber¨
ucksichtigt werden. Im Rahmen dieser Arbeit wurde erstmalig die G¨
ultigkeit
dieser Vorgehensweise im Zusammenhang mit EXX-Pseudopotentialen untersucht, vgl.
dazu Kapitel 7.
3.5 Pseudopotentiale
Durch den im vorangehenden Abschnitt beschriebenen Ansatz der unver¨
anderlichen Ionen
l¨
asst sich zwar die Anzahl der effektiv zu berechnenden Ein-Teilchen-Zust¨
ande wesent-
lich reduzieren, dennoch w¨
urde auch die Beschreibung der verbleibenden Valenzelektro-
nen noch einen immensen numerischen Aufwand verlangen: In der N¨
ahe der Ionenr¨
umpfe
weisen die Valenzorbitale starke Oszillationen auf, die von der Singularit¨
at der Ionenpo-
tentiale (3.20) sowie von der Orthogonalit¨
at zu den Rumpforbitalen herr¨
uhren große
Basiss¨
atze w¨
aren also von N¨
oten. Vor allem bei Verwendung ebener Wellen (vgl. Ab-
schnitt 3.3) erweist sich daher die Einf¨
uhrung von Pseudopotentialen” als ¨
außerst hilfrei-
che Weiterf¨
uhrung des Konzepts der starren R¨
umpfe.
Die zu Grunde liegende Idee ist, dass die Gestalt der Valenzorbitale innerhalb eines
durch einen Abschneideradius rcut
nl bestimmten Rumpfbereichs um die Kernorte die Eigen-
schaften einer chemischen Bindung des Atoms kaum beeinflusst. rcut
nl soll dabei zumindest
so groß gew¨
ahlt sein, dass sich alle Knoten (Nulldurchg¨
ange) der betrachteten Orbitale
darin befinden, wobei im Allgemeinen f¨
ur verschiedene Hauptquantenzahlen nund Dre-
himpulse lunterschiedliche Radien zugelassen sind. Gesucht ist nun ein Potential, das
die tats¨
achlichen Wellenfunktionen außerhalb des Rumpfbereichs mit gen¨
ugender Genau-
igkeit reproduziert, die numerisch problematischen Oszillationen innerhalb jedoch durch
einen m¨
oglichst weichen, d.h., durch m¨
oglichst wenige ebene Wellen beschreibbaren Ver-
lauf ersetzt. Ein anderer Aspekt ist die ¨
Ubertragbarkeit: das ideale Pseudopotential soll
unabh¨
angig von der chemischen Umgebung die richtigen, d.h., mit einer Allelektronen-
Rechnung ¨
ubereinstimmenden Resultate liefern. W¨
ahrend das Pseudopotential mit wach-
sendem rcut
nl immer weicher gew¨
ahlt werden kann, wird seine ¨
Ubertragbarkeit geringer.
Zwischen diesen beiden Anforderungen muss daher ein sinnvoller Kompromiss gefunden
werden. Eng mit der ¨
Ubertragbarkeit h¨
angt ferner die so genannte Normerhaltung zusam-
men; bei normerhaltenden Pseudopotentialen besitzt das pseudoisierte” Atom innerhalb
des Abschneideradius die gleiche Ladung wie sein Allelektronen-Gegenst¨
uck.
Moderne, normerhaltende ab-initio Pseudopotentiale erf¨
ullen eine Reihe weiterer Be-
dingungen [106,107,108,109], die nat¨
urlich nicht alle zugleich exakt erf¨
ullt werden k¨
onnen.
In den genannten Referenzen findet sich eine eingehende Diskussion dieser Bedingungen,
3.5 Pseudopotentiale 51
die zusammengenommen lauten:
(i) Die Orbitale des Pseudoatoms besitzen die gleichen Eigenwerte wie die entsprechen-
den Valenzorbitale des Allelektronen-Atoms.
(ii) Die Orbitale des Pseudoatoms stimmen außerhalb des Abschneideradius rcut
nl mit den
entsprechenden Orbitalen des Allelektronen-Atoms ¨
uberein. Zudem m¨
ussen die Pseu-
doorbitale mindestens zweimal differenzierbar sein und d¨
urfen keine Nulldurchg¨
ange
besitzen, damit sich die Schr¨
odinger-Gleichung nach dem Pseudopotential aufl¨
osen
l¨
asst.
(iii) Innerhalb des Rumpfbereichs enthalten die Orbitale des Pseudoatoms die gleiche
Ladung wie die entsprechenden Allelektronen-Orbitale (Normerhaltung).
(iv) Die logarithmische Ableitung nach rund wiederum deren Energieableitung stimmt
f¨
ur r > rcut
nl bei den jeweiligen Orbitalen von Pseudo- und Allelektronen-Atom ¨
ube-
rein. Durch diese Bedingung soll zusammen mit Forderung (i) erreicht werden, dass
die Streueigenschaften des Potentials bei der Pseudoisierung in 1. Ordnung erhal-
ten bleiben [108]. Dies ist eine Voraussetzung f¨
ur die ¨
Ubertragbarkeit des Pseudo-
potentials. Da sich die Eigenwerte je nach chemischer Umgebung ¨
andern, ist die
¨
Ubereinstimmung der Energieableitung als Erweiterung von (i) gedacht.
Streng genommen muss (iv) hier nicht explizit gefordert werden, da dieser Punkt durch
die Bedingung (iii) bereits implizit abgedeckt ist, vgl. den folgenden Abschnitt.
3.5.1 Konstruktion
Die Generierung des Pseudopotentials erfolgt iterativ in einem selbstkonsistenten Zyklus.
Dabei wird der Radialanteil RPs
nl eines Pseudoorbitals im Rumpfbereich durch eine geeig-
nete Funktion parametrisiert, die gen¨
ugend Freiheitsgrade sowohl zur Anpassung an die
oben genannten Forderungen (i) (iv) als auch zur Modellierung eines m¨
oglichst weichen
Pseudopotentials besitzt. Hierf¨
ur wurden verschiedene Ans¨
atze entwickelt, vgl. [106,107,
109,110] und die darin enthaltenen Literaturverweise. Bei dem Verfahren von Troullier
und Martins [109] etwa wird ein gerades Polynom 12. Grades p(r) = P6
i=0 a2ir2izur
Beschreibung des Radialteils verwendet, so dass zus¨
atzlich zum Abschneideradius
sieben Parameter variiert werden k¨
onnen:
RPs
nl (r) := (rlexp{p(r)}f¨
ur rrcut
nl
RAE
nl (r) f¨
ur rrcut
nl .(3.22)
Diese Funktion kann in die radiale Schr¨
odinger-Gleichung eingesetzt werden, die sich dann
wegen Punkt (ii) nach dem abgeschirmten Pseudopotential
vPs,abg
nl (r) := εnl +1
2
1
uPs
nl (r)
d2uPs
nl (r)
dr2l·(l+ 1)
2r2(3.23)
aufl¨
osen l¨
asst, wobei uPs
nl (r) := r·RPs
nl (r) gesetzt wurde. Daraus ergibt sich das ionische
Pseudopotential durch Abziehen des elektrostatischen (Hartree) Potentials und des Aus-
tausch-Korrelationspotentials:
vPs,ion
nl (r) := vPs,abg
nl (r)vH[ρPs](r)vxc[ρPs](r).(3.24)
52 3 Methoden zur numerischen Beschreibung periodischer Systeme
Dabei ist ρPs die Ladungsdichte des Pseudoatoms. Mit Gleichung (3.24) kn¨
upft das Pseu-
dopotentialkonzept an die in Abschnitt 3.4 beschriebene N¨
aherung der starren R¨
umpfe”
an, womit aber auch die dort gemachten N¨
aherungsannahmen, insbesondere die Linea-
rit¨
at des Austausch-Korrelationspotentials, ¨
ubernommen werden (vgl. Abschnitt 3.5.3).
Abbildung 3.2 vergleicht schematisch den Verlauf einer Pseudowellenfunktion mit dem
der tats¨
achlichen Wellenfunktion.
Zwischen Norm und logarithmischer Ableitung der Pseudoorbitale besteht folgender
Zusammenhang:
1
2
ε
r ln Rl(r, ε)r=rcut
ε=ε
=1
R2
l(rcut, ε)Zrcut
0
R2
l(r, ε)dr,(3.25)
wobei r·Rl(r, ε) die L¨
osung der radialen Schr¨
odinger-Gleichung des Allektronen- oder des
Pseudoatoms f¨
ur eine gegebene Energie εist (nicht notwendigerweise eine Eigenfunktion).
In der N¨
ahe der atomaren Eigenenergien besitzt daher ein normerhaltendes Pseudopoten-
tial die gleichen Streueigenschaften (logarithmische Ableitungen) wie das Allelektronen-
Potential, was eine wichtige Voraussetzung f¨
ur die ¨
Ubertragbarkeit des Pseudopotentials
ist.
Abbildung 3.2: Schematische Darstel-
lung eines tats¨
achlichen Atomorbitals
(durchgezogenen) und eines Pseudoorbi-
tals (gestrichelt) sowie den zugeh¨
origen
Potentialen. rmbezeichnet den Abschnei-
deradius. (Quelle: Ref. 82)
Auch die in dieser Arbeit verwendeten
EXX/OEP-Pseudopotentiale wurden auf diese Wei-
se generiert. Dabei wurde das bereits erw¨
ahn-
te Troullier-Martins-Schema [109] angewandt. Da
allerdings im EXX/OEP-Formalismus der Au-
stauschanteil von vxc[ρ] nicht einfach parametrisch
von ρabh¨
angt, wird bei der Konstruktion der
ionischen EXX/OEP-Pseudopotentiale die OEP-
Gleichung (1.97) f¨
ur das Pseudoatom gel¨
ost (vgl.
S. 62ff. in Ref. 111).
Das Pseudopotential (3.24) h¨
angt von nund l
ab; es gilt daher bei Anwendung auf eine beliebige
Funktion nur f¨
ur jene Komponenten dieser Funk-
tion, die im Raum der atomaren Pseudoorbitale
|nlmimit m {−l, . . . , +l}liegen. Das gesamte io-
nische Pseudopotential kann als Entwicklung nach
den |nlmigeschrieben werden und ist dann durch
die nicht-lokale2Darstellung
VPs,ion := X
n,l,m |nlmivPs,ion
nl (r)hnlm|(3.26)
gegeben3, wobei hr|nlmi=RPs
nl (r)Ylm(θ, φ). Um den
Rechenaufwand zu verringern, beschr¨
ankt man die
Summe ¨
uber nin (3.26) h¨
aufig auf die Valenzscha-
le(n). Sollen auch angeregte Zust¨
ande sehr genau beschrieben werden, m¨
ussen entspre-
chend h¨
ohere nber¨
ucksichtigt werden. Weiter reduzieren l¨
asst sich der Rechenaufwand
mit der nachfolgend skizzierten Methode von Kleinman und Bylander [113,114].
2Wenn in (3.26) nur ¨
uber eine Hauptquantenzahl summiert wird, l¨
asst sich das Pseudopotential auch als
semi-lokales Potential VPs,ion := Pl,m |Ylmi˜vPs,ion
nl (r)hYlm|formulieren. Semi-lokal” soll hier bedeuten:
nicht-lokal im Winkelanteil (Integraloperator), aber lokal im Radialteil (Multiplikationsoperator).
3Pr¨
azier formuliert: VPs,ion ist ein Integraloperator, dessen Kern im Ortsraum gegeben ist durch
hr|VPs,ion|ri:= P
n,l,m
hr|nlmivPs,ion
nl (r)hnlm|ri.
3.5 Pseudopotentiale 53
3.5.2 Kleinman-Bylander-Darstellung
Soll das Pseudopotential (3.26) in einer Ebene-Wellen-Basis direkt dargestellt werden,
ist der Rechenaufwand proportional zu NG·(NG+ 1)/2, wenn NGdie Anzahl der Ba-
sisfunktionen bezeichnet [113]. Auf eine mit NGann¨
ahernd lineare Skalierung l¨
asst sich
der Aufwand jedoch vermindern, wenn man (3.26) auf eine separable Gestalt bringt, d.h.,
durch eine Linearkombination geeigneter Projektoren P|ξnlmifnlmhξnlm|darstellt. Klein-
man und Bylander [113] konstruierten eine solche Darstellung folgendermaßen:
Zun¨
achst wird (3.26) in einen langreichweitigen lokalen Anteil und eine kurzreichweitige
nicht-lokale Korrektur aufgespalten:
VPs,ion =vlang
lok (r) + Vkurz
nlok =vlang
lok (r) + X
n,l,m |nlmivkurz
nl (r)hnlm|.(3.27)
Hierbei wird ausgenutzt, dass alle Pseudopotentiale (3.24) f¨
ur große rin die gemeinsa-
me Asymptote Zval/r m¨
unden. Ab einem bestimmten Abschneideradius rcut
nl ist VPs,ion
daher (nahezu) allein durch den lokalen Anteil gegeben. Der nicht-lokale Anteil ist entspre-
chend nur f¨
ur r < rcut von Null verschieden und durch vkurz
nl (r) := vPs,ion
nl (r)vlang
lok (r) de-
finiert. Auf Grund der Zentrifugalbarriere l·(l+1)/2r2der radialen Schr¨
odinger-Gleichung
werden Elektronen mit hohen Drehimpulsen lnach außen gedr¨
uckt” und also allein durch
den lokalen Anteil des Pseudopotentials beschrieben, f¨
ur den eine geeignete Komponen-
te vPs,ion
nlok llok der Entwicklung (3.26) benutzt wird. Im nicht-lokalen Anteil kann daher die
Summe auf einige wenige llmax beschr¨
ankt werden. Da vlang
lok die Streueigenschaften
der h¨
oheren Drehimpulskomponenten reproduzieren soll, wird vorzugsweise llok =lmax
gesetzt.
Nach dieser Vorbereitung wird Vkurz
nlok durch das separable Kleinman-Bylander-Pseu-
dopotential
VKB := X
n,l,m
vkurz
nl |nlmihnlm|vkurz
nl
hnlm|vkurz
nl |nlmi(3.28)
ersetzt, das gerade so konstruiert ist, dass gilt: VKB|nlmi= Vkurz
nlok |nlmi. Dieser ¨
Uber-
gang kann jedoch zu unphysikalischen Geisterzust¨
anden” f¨
uhren, die Energien unterhalb
oder nahe denen der physikalischen Valenzzust¨
ande besitzen [114]. Durch eine geeignete
Wahl der Abschneideradien rcut
nl und der lokalen Komponente llok kann deren Auftreten
jedoch vermieden werden [115].
3.5.3 Nicht-lineare Rumpfkorrektur
Um im Rahmen der N¨
aherung der starren R¨
umpfe” (Abschnitt 3.4) Ausdr¨
ucke f¨
ur die
Gesamtenergie sowie das Kohn-Sham-Potential zu erhalten, die allein von der Dichte der
Valenzelektronen abh¨
angen, wird u.a. folgende N¨
aherung vorgenommen, die sich mit Glei-
chung (3.24) auf das Pseudopotentialkonzept ¨
ubertr¨
agt: Es wird unterstellt, dass der Anteil
der elektronischen Wechselwirkung im Kohn-Sham-Potential des betrachteten Atoms li-
near in der Dichte ist und daher f¨
ur Rumpf- und Valenzladungsdichte getrennt berechnet
werden kann. Dies ist exakt jedoch nur f¨
ur den elektrostatischen Anteil erf¨
ullt:
vH[ρ1+ρ2](r) = Zρ1(r) + ρ2(r)
|rr|d3r=vH[ρ1](r) + vH[ρ2](r).(3.29)
54 3 Methoden zur numerischen Beschreibung periodischer Systeme
Sowohl f¨
ur das lokale Austauschpotential als auch f¨
ur die Korrelation ist eine analoge
Relation, streng formal gesehen, nicht g¨
ultig. Die Potentiale beider Wechselwirkungen
sind nicht-linear; im Allgemeinen gilt daher
vx[ρ1+ρ2](r)6=vx[ρ1](r) + vx[ρ2](r) (3.30)
vc[ρ1+ρ2](r)6=vc[ρ1](r) + vc[ρ2](r).(3.31)
Diese Nicht-Linearit¨
at kann zu Fehlern f¨
uhren, wenn die Ladungsdichten der Rumpf- und
der Valenzzust¨
ande r¨
aumlich nicht mehr hinreichend voneinander getrennt sind, wie es
beispielsweise bei Elementen mit nur wenigen Elektronen in der Valenzschale oft der Fall
ist (Alkalimetalle). Man kann dann allerdings versuchen, eine so genannte nicht-lineare
Rumpfkorrektur” (engl.: non-linear core correction nlcc”) [104,105,115] vorzuneh-
men. Die dahinter stehende Idee ist, im Austausch-Korrelationspotential nun wieder die
gesamte Ladungsdichte zu benutzen, und nicht nur wie in Gleichung (3.19) die
Valenzladungsdichte. Die Gesamtladungsdichte ist dabei n¨
aherungsweise durch die Sum-
me der (atomaren) Rumpfladungsdichten und der Valenzladungsdichte gegeben. Da die
Rumpfladungsdichte allerdings stark lokalisiert und oszillierend ist, l¨
asst sie sich nicht ef-
fektiv im Rahmen einer Ebene-Wellen-Darstellung beschreiben. Sie wird daher durch eine
so genannte partielle Rumpfladungsdichte” (engl.: partial core density) ˜ρRersetzt, die im
chemisch relevanten Bereich außerhalb eines geeigneten Radius rnlcc die echte Rumpfla-
dungsdichte ρRreproduziert, innerhalb von rnlcc jedoch durch eine leichter fouriertrans-
formierbare Funktion gegeben ist:
˜ρR(r) := (ρR(r) f¨
ur rrnlcc
b(r)ρR(r) f¨
ur r < rnlcc, mit geeignetem b(r)1.(3.32)
Damit wird das Austausch-Korrelationspotential wie folgt linearisiert”:
vxc[ρR+ρV]vxc[˜ρR+ρV] + (vxc[ρR+ρV]vxc[˜ρR+ρV])
|{z }
=: f
vxc[ρV, ρR,˜ρR]
.(3.33)
In der Kohn-Sham-Gleichung f¨
ur mehrere Atome wird dann vxc[˜ρSP
R+ρ] anstelle von vxc[ρ]
verwendet (wobei ˜ρSP
Rdie Superposition der festen atomaren partiellen Rumpfladungsdich-
ten bezeichnen soll und ρdie Dichte aller explizit ber¨
ucksichtigten Elektronen sei), und die
Ionenpotentiale sind gegeben, indem in Gleichung (3.20) entsprechend vxc[ρR, ρV] durch
f
vxc[ρV, ρR,˜ρR] ersetzt wird. Es l¨
asst sich ˜ρRalso als Kontrollparameter auffassen [105],
der im Falle ˜ρR:= ρRdie Rumpf-Valenz-Austauschwechselwirkung exakt beschreibt (zu-
mindest f¨
ur das Pseudoatom), im Falle ˜ρR:= 0 hingegen in die in Abschnitt 3.4 beschrie-
bene N¨
aherung der starren R¨
umpfe ohne die nicht-lineare Rumpfkorrektur ¨
ubergeht. Im
Zusammenhang mit dem Pseudopotentialkonzept folgt dann, dass die Gleichung (3.24) f¨
ur
den radialen Anteil des ionischen Pseudopotentials in
vPs,ion
nl (r) := vPs,abg
nl (r)vH[ρPs](r)vxc[˜ρR+ρPs](r) (3.34)
abge¨
andert werden muss.
Kapitel 4
Implementierung
Im vorangehenden Kapitel wurden grundlegende Techniken zur Beschreibung periodischer
Systeme, insbesondere mit Hilfe ebener Wellen in Verbindung mit Pseudopotentialen,
dargestellt. Darauf aufbauend soll nun die im Rahmen dieser Arbeit durchgef¨
uhrte nu-
merische Realisierung der variationellen EXX-Methode (varEXX) mit dem Ebene-Wellen-
Pseudopotential-Code S/PHI/nX [81,82] dokumentiert werden. Gem¨
Kapitel 2sind
die beiden Schl¨
usselpunkte der Methode: (i) die L¨
osung der Sternheimer-Gleichung (2.2)
und (ii) die Minimierung der induzierten Ladungsdichte (2.4). In den folgenden drei Ab-
schnitten 4.1 bis 4.3 werden daher zun¨
achst numerische Verfahren (Minimierungs- und
Mixing-Techniken) zur effizienten Behandlung dieser Aufgaben vorgestellt und wo not-
wendig an die speziellen Erfordernisse von varEXX angepasst. Eine weitere Schwie-
rigkeit stellt die Auswertung des nicht-lokalen Austauschoperators (1.27) dar, die in Ab-
schnitt 4.4 besprochen wird. Im Anschluss daran werden die Einzelschritte dann zu einem
iterativen Zyklus zusammengesetzt, der aus einer inneren Schleife” besteht, die das exak-
te Austauschpotential einer gegebenen Dichte berechnet, und einer ¨
außeren”, in der die
Kohn-Sham-Gleichung selbstkonsistent gel¨
ost wird (Abschnitt 4.5). Abschließend wird ein
N¨
aherungsansatz f¨
ur das EXX-Verfahren vorgestellt, der sowohl bei der urspr¨
unglichen
Formulierung (stEXX) als auch bei der variationellen Formulierung (varEXX) angewandt
werden kann und in beiden F¨
allen eine drastische Reduktion des numerischen Aufwands
erm¨
oglicht, zugleich aber Bandstrukturen liefert, die sehr gut mit jenen einer exakten
Rechnung ¨
ubereinstimmen (Abschnitt 4.6).
4.1 Die Sternheimer-Gleichung
Wie in Abschnitt 2.3 bereits ausgef¨
uhrt, l¨
asst sich die Berechnung der Greenschen Funk-
tion Gi, also die explizite Umkehrung von H0ε0
iim Orthogonalraum zu ε0
i, durch die
Verwendung der Sternheimer-Gleichung (2.2) ersetzen, die dann variationell” gel¨
ost wird.
Der Vorteil ist, dass zur Darstellung der linearen Korrekturfunktionen ψ1
ikeine unbesetz-
ten Zust¨
ande mehr ben¨
otigt werden. Der Bedarf an Speicherplatz zur Berechnung der
induzierten Ladungsdichte liegt damit in der gleichen Gr¨
oßenordnung wie der zur Berech-
nung der Grundzustandsladungsdichte, wenn man von der St¨
orung, im Wesentlichen also
dem nicht-lokalen Austauschoperator, einmal absieht. Andererseits gewinnt man auch hin-
sichtlich der Rechenzeit: Wie das Folgende zeigt, l¨
asst sich mit geeigneten Methoden ein
erheblich besseres Skalierungsverhalten der CPU-Zeit erzielen als beim Greensfunktion-
Ansatz.
Als Variationsmethoden eignen sich Minimierungsverfahren, zwei der gebr¨
auchlichsten
55
56 4 Implementierung
wurden dazu in dieser Arbeit implementiert: das Verfahren des steilsten Abstiegs und
das zumeist effizientere Verfahren der konjugierten Gradienten. Die Effizienz beider l¨
asst
sich mit Hilfe einer so genannten Pr¨
akonditionierung nochmals steigern. Jedoch lassen
sich diese Methoden nicht unmittelbar auf die Sternheimer-Gleichung anwenden daf¨
ur
sind zun¨
achst einige Vorbetrachtungen notwendig, die im Folgenden diskutiert werden
sollen. Recht detaillierte Erg¨
anzungen dazu sowohl in praktischer als auch in theoretischer
Hinsicht finden sich in Anhang C.
4.1.1 Numerische L¨
osung der Sternheimer-Gleichung: Umformulierung
in ein Minimierungs-Problem
Die Sternheimer-Gleichung ist die Grundgleichung der Rayleigh-Schr¨
odingerschen St¨
o-
rungstheorie in 1. Ordnung:
(H0ε0
i)|ψ1
ii+ (H1ε1
i)|ψ0
ii= 0 .(4.1)
Hier bezeichne H0den Hamilton-Operator eines ungest¨
orten Systems mit den bekann-
ten Eigenenergien ε0
iund Eigenfunktionen ψ0
i, dem eine durch H1beschriebene St¨
orung
aufgeschaltet sei. Die linearen Korrekturfunktionen seien durch die ψ1
ibeschrieben. Es
erweist sich als bequem, ψ1
iorthogonal zum Eigenraum von ε0
ianzusetzen.1Die Energie-
korrektur ε1
iergibt sich, indem die Sternheimer-Gleichung von links mit hψ0
i|multipliziert
wird:
ε1
i=hψ0
i|H1|ψ0
ii.(4.2)
Numerisch, d.h., in einer endlichen Basisdarstellung, ist die Sternheimer-Gleichung ein
unterbestimmtes2System mgekoppelter linearer Gleichungen in mVariablen. Bei der Be-
schreibung der hier untersuchten Materialien mit ebenen Wellen (vgl. Abschnitt 3.3) liegt
die Anzahl mder ben¨
otigten (G+k)-Vektoren” typischerweise in einer Gr¨
oßenordnung
zwischen 102und 104. Bei einer direkten Diagonalisierung von (H0ε0
i), was der Be-
stimmung der Greenschen Funktion (B.11) entspricht, skaliert die Anzahl der ben¨
otigten
Fließkommaoperationen proportional zu m3. Eine geeignete Strategie bei so aufwendi-
gen Gleichungssystemen ist, das Problem als Minimierungsaufgabe zu formulieren. F¨
ur
deren L¨
osung gibt es dann Verfahren, die proportional zu m2skalieren. Sie werden in
Abschnitt 4.1.2 besprochen.
Gesucht ist also (f¨
ur jedes i) ein Funktional, das eine (Probe-)Korrekturfunktion auf
eine reelle Zahl abbildet, also ein Ei:H IR ; ψ1
i7→ Ei[ψ1
i] (H: Hilbertraum der Ein-
Teilchenzust¨
ande), und das genau f¨
ur jenes ψ1
iminimal wird, das L¨
osung der Sternheimer-
Gleichung ist. Eine M¨
oglichkeit, ein solches Funktional zu konstruieren, ist, auf beiden
Seiten von (4.1) das Betragsquadrat zu bilden. Auf der rechten Seite steht dann die (reelle
Zahl) 0 und auf der linken ergibt sich unmittelbar ein Funktional von ψ1
iin der gesuchten
Form. Dies funktioniert f¨
ur alle auf Hdefinierten Operatoren H0, also auch f¨
ur solche, die
1Die Sternheimer-Gleichung (4.1) besitzt, falls sie l¨
osbar ist, im Allgemeinen keine eindeutige L¨
osung.
Denn ist ψ1
iL¨
osung der Sternheimer-Gleichung, so ist z.B. auch ψ1
i+λψ0
imit jedem λCL¨
osung. Durch
die zus¨
atzliche Forderung der Orthogonalit¨
at von ψ1
izum Eigenraum von ε0
iwird aus dem L¨
osungsraum
ein eindeutiges Element ausgew¨
ahlt. Man beachte, dass (4.2) nicht von der speziellen Wahl des Winkels
zwischen Original- und Korrekturfunktion abh¨
angt.
2(H0ε0
i) besitzt einen Nullraum, den Eigenraum zu ε0
i, und kann folglich in m-dimensionaler Basis-
darstellung h¨
ochstens vom Rang m1 sein.
4.1 Die Sternheimer-Gleichung 57
nicht hermitesch sind.3F¨
ur den in dieser Arbeit relevanten Fall eines hermiteschen Ope-
rators H0l¨
asst sich das Funktional aber noch auf elegantere Weise konstruieren, n¨
amlich
so, dass der f¨
ur die Minimierung ben¨
otigte Gradient gerade durch die linke Seite der
Sternheimer-Gleichung gegeben ist. Das Funktional ist dann gewissermaßen die Stamm-
funktion von (4.1):
Ei[ψ1
i] := 1
2hψ1
i|(H0ε0
i)|ψ1
ii+ Re hψ1
i|(H1ε1
i)|ψ0
ii.(4.3)
Die Richtung des steilsten Anstiegs ist dabei durch
2δEi[ψ1
i]
δ(ψ1
i)= (H0ε0
i)|ψ1
ii+ (H1ε1
i)|ψ0
ii(4.4)
gegeben. Hier wurde benutzt, dass dazu gem¨
der (Variations-)Ableitung im Komplexen
ψ1
iund (ψ1
i)formal als unabh¨
angige Vektoren aufzufassen sind. Die Differentiation erfolgt
nur nach der konjugiert-komplexen Funktion (ψ1
i), daf¨
ur ist allerdings noch mit einem
Faktor 2 zu multiplizieren, vgl. z.B. Ref. 126. Die Sternheimer-Gleichung l¨
asst sich damit
auch so formulieren:
δEi[ψ1
i]
δ(ψ1
i)= 0 ,(4.5)
d.h., L¨
osungen der Sternheimer-Gleichung lassen das in (4.3) angegebene Funktional stati-
on¨
ar werden. Das Funktional hat die Dimension einer Energie und stellt eine quadratische
Form in ψ1
idar. Die tiefere Begr¨
undung daf¨
ur ist, dass es sich als eine Art Ritzsches Varia-
tionsprinzip f¨
ur die Korrekturfunktion auffassen l¨
asst. Dies ist in Anhang C.1 ausgef¨
uhrt.
Bevor die oben erw¨
ahnten numerischen Algorithmen eingesetzt werden k¨
onnen, um stati-
on¨
are Punkte von Eiaufzusp¨
uren, muss allerdings zun¨
achst klar sein, ob es sich dort um
ein Minumum, ein Maximum oder einen Sattelpunkt handelt. Wie in Ref. 78 gezeigt, l¨
asst
sich der Hilbertraum Hin drei Bereiche H,H0und H+untergliedern, f¨
ur die gilt:
hψ|(H0ε0
i)|ψi<0 f¨
ur ψ H\{0}mit H:= span{ψ0
j|ε0
j< ε0
i},(4.6)
hψ|(H0ε0
i)|ψi= 0 f¨
ur ψ H0mit H0:= span{ψ0
j|ε0
j=ε0
i},(4.7)
hψ|(H0ε0
i)|ψi>0 f¨
ur ψ H+\{0}mit H+:= span{ψ0
j|ε0
j> ε0
i}.(4.8)
Im linearen Teilraum H+ist (H0ε0
i) also positiv definit4, und Eibesitzt dort folglich
ein eindeutiges Minimum. In Hist (H0ε0
i) hingegen negativ definit, so dass Eidort
ein eindeutiges Maximum aufweist. Falls die Sternheimer-Gleichung eine L¨
osung besitzt,
wird es sich dabei also im Allgemeinen außer, wenn ε0
idie tiefste Eigenenergie von H0
ist um einen Sattelpunkt von Eihandeln, vgl. Abb. 4.1. Der Teilraum H0schließlich
ist der Eigenraum von ε0
i. Hier reduziert sich Eiwegen (4.7) auf ein lineares Funktional
von ψ1
i, dessen Gradient (4.4) durch den konstanten Vektor (H1ε1
i)|ψ0
iigegeben ist. Je
nachdem, ob dieser Vektor verschwindet oder nicht, ist die Sternheimer-Gleichung (4.5)
3Dieser Fall ist realistisch: Ist H0beispielsweise der Hamilton-Operator eines kugelsymmetrischen Sy-
stems (Atom) in Ortsdarstellung, wobei die Radialanteile der Wellenfunktionen mit Hilfe einer Basis loga-
rithmischer St¨
utzstellen beschrieben werden sollen, ist das (diskretisierte) H0nicht mehr hermitesch. Dies
wird quasi als Nachtrag zur Diplomarbeit [78] in Anhang C.3 diskutiert.
4Ein auf einem Hilbertraum Herkl¨
arter linearer Operator Aheißt genau dann positiv definit”, wenn
gilt: hψ|A|ψi>0 f¨
ur alle ψ H\{0}. Analog ist negativ definit” definiert, indem > durch < ersetzt
wird. Ist die 2. (Variations-)Ableitung eines Funktionals an einer Stelle durch einen positiv/negativ definiten
Operator gegeben, besitzt es dort ein Minimum/Maximum. Die 2. Ableitung von Eiist (H0ε0
i).
58 4 Implementierung
),( yxE
),( minmax yx
f=
ˆ
),( yx
x
y
Abbildung 4.1: Dargestellt ist ein Paraboloid zur Gleichung E(x, y) := a11x2+a22y2+b1x+b2y+const.
mit a11<0und a22>0. Bei (xmax, ymin)hat Eeinen Sattelpunkt. Die x-Achse entspricht hier dem
linearen Teilraum Hund die y-Achse dem Teilraum H+in (4.6) bzw. (4.8). Aus der Zeichnung erkennt
man, dass wegen HH+die Extremwertbestimmung in den beiden Teilr¨
aumen separat durchgef¨
uhrt
werden kann. Zur Bestimmung der induzierten Ladungsdichte ist jedoch nur der Teilraum H+relevant.
also in ganz H=HH0 H+l¨
osbar oder nicht. Ist sie l¨
osbar, ist der L¨
osungsraum
durch alle
ψ1
i=φmax +φ0+φmin mit
φmax H, Ei[φmax] = max
H{Ei[φ]}
φmin H+, Ei[φmin] = min
H+{Ei[φ]}
φ0 H0
(4.9)
gegeben. φmax und φmin lassen sich analytisch ¨
uber die Projektion der Greenschen Funktion
(B.11) auf Hbzw. H+darstellen:
φmax =X
j
ε0
j0
i
ψ0
jhψ0
j|H1|ψ0
ii
ε0
iε0
j
, φmin =X
j
ε0
j0
i
ψ0
jhψ0
j|H1|ψ0
ii
ε0
iε0
j
.(4.10)
Wird die Sternheimer-Gleichung nur f¨
ur die Valenzzust¨
ande gel¨
ost dies ist im variatio-
nellen EXX-Verfahren der Fall (vgl. Abschnitt 2.1) —, gehen im Gegensatz zur Darstellung
von φmin bei φmax nur Zust¨
ande und Energien von Valenzelektronen ein. Die Berechnung
von φmax ¨
uber (4.10) wird daher in der Regel effizienter sein als mit einem Variationsver-
fahren.
Die Frage nach der L¨
osbarkeit der Sternheimer-Gleichung h¨
angt unmittelbar damit
zusammen, ob das ungest¨
orte System Entartungen aufweist oder nicht. Dies ist in An-
hang C.2 genauer ausgef¨
uhrt. Dabei zeigt sich: Ist der Eigenwert ε0
inicht entartet, ist
die Sternheimer-Gleichung (4.1) stets l¨
osbar. Im Falle einer Entartung des ungest¨
orten
Systems gilt dies jedoch nicht, und entsprechend besitzt das Funktional (4.3) im Allge-
meinen keinen station¨
aren Punkt! Tats¨
achlich hat man es in der Praxis aber vielfach mit
entarteten Systemen zu tun. So ist bei vielen Halbleitern (etwa bei den hier untersuchten
Materialien GaAs, GaN, InN) das oberste Valenzband am Γ-Punkt dreifach entartet. Ist
H0der Kohn-Sham-Operator eines LDA-Systems, verschwindet zudem in einigen F¨
allen
(z.B. InN, Ge) f¨
alschlicherweise die Bandl¨
ucke, wodurch sich der Entartungsgrad nochmals
4.1 Die Sternheimer-Gleichung 59
erh¨
ohen kann.5Typischerweise weisen aber nicht nur Hochsymmetriepunkte, sondern gan-
ze Bereiche der Brillouin-Zone Entartungen auf. Daher l¨
asst sich das Problem auch in einer
geeignet diskretisierten Brillouin-Zone (z.B. mit dem Monkhorst-Pack-Verfahren [96], vgl.
Abschnitt 3.2), in der Hochsymmetriepunkte ¨
ublicherweise vermieden werden, nicht um-
gehen.
Im Prinzip ließe sich nun diese Schwierigkeit auf analoge Weise behandeln wie in der
entarteten St¨
orungstheorie, n¨
amlich durch Diagonalisierung von H1(vgl. Anhang C.2).
Es zeigt sich jedoch, dass im variationellen EXX-Verfahren die gesamte L¨
osung ψ1
ider
Sternheimer-Gleichung gar nicht ben¨
otigt wird: Zur Berechnung der induzierten Ladungs-
dichte ist n¨
amlich nur der Anteil von ψ1
irelevant, der im Hilbertraum Hcder unbesetzten
Zust¨
ande liegt. Alle Komponenten in Richtung besetzter Zust¨
ande k¨
onnen dagegen belie-
big gew¨
ahlt werden, also etwa durch Projektion gleich Null gesetzt werden. Bezeichnet Pc
den Projektionsoperator auf Hc, kann statt (2.4) also auch
ρ=
occ
X
i
(ψ0
i)Pcψ1
i+ c.c. (4.11)
verwendet werden. Dies liegt daran, dass sich in ρder Anteil der Korrektur in Rich-
tung der Valenzzust¨
ande gerade herausk¨
urzt, wie es sich analog auch im Standard-EXX-
Verfahren ergibt, vgl. Abschnitt 2.2. Physikalisch bedeutet dies, dass die Ladungsdichte
zumindest in linearer Ordnung nicht auf eine St¨
orung reagiert, die nur besetzte Zust¨
ande
untereinander koppelt [85]. Pcψ1
iist L¨
osung der vereinfachten” Sternheimer-Gleichung
Pc(H0ε0
i)|ψ1
ii+ (H1ε1
i)|ψ0
ii= (H0ε0
i)Pc|ψ1
ii+PcH1|ψ0
ii= 0 .(4.12)
Hier wurde [Pc, H0] = 0 und Pcψ0
i= 0 f¨
ur i {1,...,N}benutzt. Gegen¨
uber (4.1) hat
diese Gleichung numerisch einige Vorteile: (i) Es ist nicht mehr notwendig, die Energiekor-
rektur ε1
izu berechen. (ii) Pcψ1
iist das eindeutige Minimum von (4.3) in Hc, da Hc H+,
d.h., die aufwendige Kombination von Maximierung und Minimierung zur Bestimmung
des Sattelpunkts ψ1
ientf¨
allt. Im Falle einer Entartung schließlich muss (iii) nicht mehr der
Eigenraum zu ε0
iermittelt werden, (iv) entf¨
allt die sonst notwendige Diagonalisierung von
H1, vgl. Anhang C.2, und (v) ist nicht mehr zu entscheiden, wann ein Eigenwert ¨
uber-
haupt entartet ist oder nicht, was numerisch nur durch Vergleichen der Differenz zweier
Eigenwerte mit einem kleinen, aber letztlich willk¨
urlich festgelegten Parameter δm¨
oglich
w¨
are.
4.1.2 Minimierungsverfahren
Die beiden im Folgenden vorgestellten Verfahren, Steepest Descent und Conjugate Gra-
dient, sind f¨
ur die Minimierung einer quadratischen Form konzipiert und damit f¨
ur die
Anwendung auf das Energiefunktional (4.3) besonders geeignet. Besitzt eine (mindestens
2-mal stetig differenzierbare, reellwertige) Funktion ein Minimum bei x, kann jedoch die
Umgebung von xin vielen F¨
allen6durch eine quadratische Form approximiert werden
(Taylorentwicklung); daher sind Steepest Descent und Conjugate Gradient ganz generell
Standardmethoden zur numerischen Minimierung.
5In LDA wird die Bandl¨
ucke also in einigen F¨
allen so stark untersch¨
atzt, dass das System metallisch
erscheint (vgl. auch Abb. 1und 2). Der EXX-Formalismus w¨
are dann durch Einf¨
uhrung einer Fermi-
Funktion geeignet zu verallgemeinern.
62-malige stetige Differenzierbarkeit ist notwendige Voraussetzung f¨
ur eine Taylorentwicklung der Funk-
tion bis zum 2. Grad, sie ist allerdings nicht hinreichend, vgl. z.B. Ref. 123. Die meisten in der Physik
relevanten Funktionen sind jedoch taylorentwickelbar.
60 4 Implementierung
VorgabeeinesStartpunkts
Residuum(direkt)
bxr --= kk A
optimaleSchrittweite
Linienminimierung
Residuum(indirekt)
Projektionaufden Teilraum U:
kUk Prr =
~
d<
k
r
~
teilbardurch?
Abbruchkriterium
kq
min
xx »
k
Ende
1+¬ kk
11min,1 --- -= kkkk Arrr l
UÎ
0
x
kk
kk
kArr
rr
~~
~~
min, =l
kkkk rxx ~
min,1 l+=
+
nein
ja
ja
nein
Flussdiagramm 4.1: Die Methode des steilsten Abstiegs (optimiert). Der Iterationszyklus wird beendet,
sobald das Residuum kleiner als δist. Der Projektionsschritt und die Startbedingung x0Uentfallen,
wenn die Minimierung nicht auf den linearen Teilraum Ubeschr¨
ankt sein soll. Werden viele Iterationen
ben¨
otigt, empfiehlt es sich, alle q(z.B. q > 10) Iterationen das Residuum direkt ¨
uber den Gradienten
zu berechnen, um eine Akkumulation numerischer Rundungsfehler zu vermeiden.
Eine Wellenfunktion ψ Hwird numerisch im Allgemeinen durch einen Vektor xCm
beschrieben, wobei mdie Gr¨
oße des verwendeten Basissatzes ist. In ebenen Wellen bei-
spielsweise entsprechen die Elemente von xden Fourierkoeffizienten cnk(G) von Glei-
chung (3.16). Deshalb muss die Minimierung hier im Cmbetrachtet werden. Sei also A
eine hermitesche, positiv definite (m×m)-Matrix und bein Vektor in Cm. Dann ist durch
F:Cm IR ; x7− 1
2hx|A|xi+1
2hx|bi+1
2hb|xi(4.13)
oder ausgeschrieben
F(x1,...,xm) := 1
2
m
X
i=1
m
X
j=1
x
ia
ij xj+1
2
m
X
i=1
x
ibi+1
2
m
X
i=1
b
ixi(4.14)
eine quadratische Form definiert, deren Gradient durch
F(x) = Ax+bmit iF(x) := 2
x
i
F(x) =
m
X
j=1
a
ij xj+bi(4.15)
gegeben ist. Zur Definition der Ableitung im Komplexen vgl. Ref. 126. Ein intuitives
Verst¨
andnis der Methoden kann man erhalten, wenn man sich Fals einen von zwei reellen
Variablen abh¨
angenden Paraboloiden vorstellt, der in der Ebene durch elliptische H¨
ohen-
linien veranschaulicht werden kann. Dies wird im Folgenden zur Veranschaulichung der
Methoden benutzt. Die Darstellung orientiert sich dabei an der von Shewchuk [131].
4.1.2.1 Methode des steilsten Abstiegs (Steepest Descent)
Die Idee dieser Methode ist, von einem beliebigen Startpunkt x0Cmaus so lange
der Richtung des steilsten Abstiegs, also −∇F(x0), zu folgen, bis man entlang dieser
4.1 Die Sternheimer-Gleichung 61
- 4 - 2 2 4 x1
- 4
- 2
2
4
x2
k=10 (a)
- 4 - 2 2 4 x1
- 4
- 2
2
4
x2
k=10 (b)
- 4 - 2 2 4 x1
- 4
- 2
2
4
x2
k=2 (c)
- 4 - 2 2 4 x1
- 4
- 2
2
4
x2
k=2 (d)
Abbildung 4.2: Konvergenzverhalten der Methode des steilsten Abstiegs in Abh¨
angigkeit von der
Konditionierung κund dem Startpunkt. (a) Großes κ, g¨
unstige Wahl des Startpunkts. (b) Großes κ,
ung¨
unstiger Startpunkt: Die Methode ben¨
otigt in dem schmalen Tal viele Schritte, um das Minimum zu
finden. In (c) und (d) sind die Startpunkte jeweils wie dar¨
uberliegend gew¨
ahlt, aber κist klein. Auch mit
einem schlechten Startpunkt ist die Konvergenz schnell. Bei der idealen Konditionierung κ= 1 w¨
aren
die H¨
ohenlinien Kreise, und das Minimum w¨
are in einem einzigen Schritt erreicht. Nach Ref. 131.
Linie das Minimum x1erreicht hat. In x1bestimmt man erneut den Gradienten und
wiederholt diesen Prozess iterativ so oft, bis man dicht genug ans Minimum xmin gelangt
ist. Am Minimum selbst verschwindet der Gradient, so dass dicht genug” z.B. ¨
uber ein
Abbruchkriterium definiert werden kann, das den Prozess beendet, sobald die Steigung
eine bestimmte Untergrenze δerreicht hat. Die Punkte xkdefinieren eine Folge, die im
Prinzip ins exakte Minimum konvergiert:
lim
k→∞ xk xmin .(4.16)
Der Fehler des k-ten Schrittes ist durch ek:= xkxmin gegeben. Damit kann der negative
Gradient, in diesem Kontext auch als Residuum (Rest) bezeichnet, auch als Anwendung
von Aauf den Fehler interpretiert werden:
rk:= −∇F(xk) = Axkb=Axk+Axmin =Aek.(4.17)
62 4 Implementierung
Steepest Descent gibt es in zwei Varianten: Beim einfachen” Steepest Descent erh¨
alt man
die Folge der xk¨
uber die Rekursion
xk+1 =xk+λrk(4.18)
mit einer konstanten Schrittweite λ. Dies konvergiert f¨
ur
0< λ < αmin
2(4.19)
mit dem kleinsten Eigenwert αmin von A, was aus (4.18) und der Forderung kxk+1xmink<
kxkxminkfolgt.
Schneller konvergiert das optimierte” Steepest-Descent-Verfahren: Hier wird zun¨
achst
die optimale Schrittweite λmin,k bestimmt, die Fentlang der Linie x=xk+λrk(λIR)
minimiert. Sie ergibt sich, indem die Ableitung von Fentlang dieser Linie zu 0 gesetzt
wird,
d
dλF(xk+λrk)λ=λmin,k
!
= 0 ,
woraus nach Anwendung der Kettenregel und Einsetzen von (4.17)
λmin,k =hrk|rki
hrk|A|rki(4.20)
folgt. Dies ist reell, da ein hermitesches Avorausgesetzt wurde. Die Folge der xkergibt
sich dann aus
xk+1 =xk+λmin,k rk.(4.21)
In dieser Form ben¨
otigt das optimierte Steepest Descent jedoch noch zwei Matrix-Vektor-
Multiplikationen pro Iteration, n¨
amlich Axkin (4.17) und Arkin (4.20). Die erste davon
l¨
asst sich eliminieren, indem man (4.21) durch Multiplikation mit Aund Subtraktion
von betwas umformt:
rk+1 =rkλmin,k Ark.(4.22)
Das Skalierungsverhalten, dominiert von den m2Fließkommaoperationen der Matrix-Vek-
tor-Multiplikation, verbessert sich so um einen Faktor 2. Da das Residuum dann allerdings
nicht mehr direkt berechnet wird, k¨
onnen Rundungsfehler auftreten, so dass es sich emp-
fiehlt, nach einer bestimmten Anzahl von Iterationen (4.21) zu benutzen.
Bei der Anwendung von Steepest Descent auf die Sternheimer-Gleichung ist zu beach-
ten, dass die Minimierung nur in einem bestimmten Unterraum UCmdurchgef¨
uhrt
wird, der dem Teilraum Hcaus Abschnitt 4.1.1 entspricht. Dies l¨
asst sich erreichen, indem
(i) ein Startpunkt x0Ugew¨
ahlt wird und (ii) in (4.21) nur der Anteil des Residuums in U
benutzt wird, also ˜
rk:= PUrk=PUF(xk) anstelle von rk, wobei PUder Projektor auf
Uist. Die Projektion ist numerisch unproblematisch (skaliert linear mit m), da sie gem¨
(4.12) eine Orthogonalisierung zu den besetzten Zust¨
anden darstellt. Flussdiagramm 4.1
zeigt schematisch den Ablauf des Algorithmus.
Das Verfahren ist jedoch nur f¨
ur gut konditionierte Funktionen geeignet. Dabei be-
stimmt das Verh¨
altnis des gr¨
oßten Eigenwerts αmax zum kleinsten Eigenwert αmin der
Matrix Adie Konditionierungszahl κ:= αmaxmin. Ist κsehr groß, hat Fdie Gestalt ei-
nes schmalen Tals, und Steepest Descent konvergiert bei ung¨
unstiger Wahl des Startpunkts
4.1 Die Sternheimer-Gleichung 63
x0
x1
s2
s1
-2 -1 1 2
-4
-3
-2
-1
1
2
3
4
x2
x1
xmin
(a)
x0
x1
s2
s1
-2 -1 1 2
-2
-1
1
2
x2
x1
xmin
(b)
Abbildung 4.3: (a) Paraboloid mit kreisf¨
ormigen H¨
ohenlinien: F1(x) := x2=xT1 0
0 1x. F¨
uhrt man
Linienminimierungen entlang zweier orthogonaler, aber sonst beliebiger Richtungen s1,s2aus, gelangt
man ins Minimum. (b) zeigt eine um den Faktor 2 gestauchte Kopie von (a); die Ellipsen kennzeichnen
jetzt den Paraboloiden F2(x) := xTAxmit A=1 0
0 1/4. Alle rechten Winkel in (a) sind dabei in
A-orthogonale Winkel ¨
uberf¨
uhrt worden, zur Illustration sind einige Pfeilpaare mit eingezeichnet. Nun
f¨
uhren Linienminimierungen entlang zweier beliebiger A-orthogonaler Richtungen ins Ziel. Man beachte,
dass beim Conjugate-Gradient-Verfahren im Unterschied zu hier die erste Linienminimierung immer in
Richtung des Gradienten erfolgt, vgl. Abb. 4.4 (b). Vgl. auch Ref. 131.
nur sehr langsam. Abbildung 4.2 illustriert das Konvergenzverhalten in Abh¨
angigkeit von
der Konditionierung und dem Startpunkt.
Im Rahmen der Arbeit wurde die Anwendung der hier vorgestellten Minimierungs-
methoden f¨
ur verschiedene Halbleitermaterialien auf das Energiefunktional (4.3) getestet
(vgl. Abb. 4.5). Tats¨
achlich zeigt dabei Steepest Descent ein nur sehr langsames Konver-
genzverhalten. Im Falle von InN etwa werden bei einer Abschneideenergie Ecut = 80 Ry
und dem Startpunkt 0 f¨
ur die Korrekturfunktionen ψ1
imehr als 600 Iterationen ben¨
otigt,
um ins Minimum zu gelangen. Eine wesentliche Verbesserung erzielt man mit dem im
Folgenden skizzierten Conjugate-Gradient-Verfahren.
4.1.2.2 Methode der konjugierten Gradienten (Conjugate Gradient)
Der Ansatz dieser Methode nutzt aus, dass die Isooberfl¨
achen F(x) = const. des Hyper-
Paraboloiden (4.13) Hyper-Ellipsoide im Cmsind, die durch geeignete Streckungen/Stau-
chungen entlang ihrer Hauptachsen in die Gestalt einer Hyper-Kugel gebracht werden
64 4 Implementierung
-2 2 4 x1
-1
1
2
3
4
x2
-2 2 4 x1
-1
1
2
3
4
x2
(a) (b)
Abbildung 4.4: Minimierung einer quadratischen Funktion im Vergleich: (a) Steepest Descent, (b) Con-
jugate Gradient. Im Gegensatz zu Steepest Descent findet Conjugate Gradient bei einem m-dimen-
sionalen Problem in mSchritten ins Minimum (hier m= 2). Der erste Schritt ist in beiden Verfahren
durch den Gradienten gegeben und daher identisch. Nach Ref. 131.
k¨
onnen. Legt man nun eine kartesische Basis {s1,...,sm}durch den Cm, gelangt man mit
maximal mSchritten ins Minimum xmin der Kugel, wenn f¨
ur jede Richtung skgenau eine
Linienminimierung durchgef¨
uhrt wird. Mit einem beliebigen Startpunkt x0und m-maliger
Anwendung der Rekursionsformel
xk+1 := xk+λmin,k sk(k {0,...,m1}) (4.23)
ist also xmin =xmgefunden, wobei durch λ=λmin,k jeweils der Ausdruck F(xk+λsk) mi-
nimiert wird. Dies ist f¨
ur den 2-dimensionalen reellen Fall in Abb. 4.3 (a) veranschaulicht.
Der Vorteil dieser Strategie, die im Falle kugelf¨
ormiger Isofl¨
achen (ideale Konditionierung,
κ= 1) nat¨
urlich sehr uneffizient w¨
are, liegt in ihrer Verallgemeinerbarkeit: ¨
Ahnlich, wie
sich eine Kugel kxk2=hx|xi=const. als Spezialfall der Ellipse hx|A|xi=const. f¨
ur A=1
auffassen l¨
asst, kann auch die Orthogonalit¨
atsrelation hx|xi= 0 zur A-Orthogonalit¨
at”
hx|A|xi= 0 verallgemeinert werden. A-orthogonale Vektoren werden in diesem Kontext
auch als zueinander konjugiert bezeichnet. Durch eine entsprechende Verallgemeinerung
des Gram-Schmidtschen Orthogonalisierungsverfahrens kann dann aus mbeliebigen linear
unabh¨
angigen Vektoren im Cmeine Basis erzeugt werden, deren Vektoren paarweis A-or-
thogonal zueinander stehen [131]. Benutzt man nun f¨
ur die Suchrichtungen skin (4.23)
anstelle eines rechtwinkligen ein solches A-orthogonales System, findet man, v¨
ollig un-
abh¨
angig von der Konditionierung der Matrix A, das Minimum von (4.13) in maximal m
Schritten. Dies ist in Abb. 4.3 (b) demonstriert.
Die Schwierigkeit dieser Vorgehensweise ist, dass das Gram-Schmidt-Verfahren kubisch
mit der Dimension mskaliert und zudem alle Suchrichtungen {s1,...,sm}im Speicher ge-
halten werden m¨
ussen. Numerisch interessant werden konjugierte Richtungen erst dadurch,
dass in jedem Schritt ein zu allen vorherigen Suchrichtungen konjugierter Vektor auch aus
dem Gradienten von F(dem Residuum (4.17)) konstruiert werden kann, indem dieser
allein zur letzten Suchrichtung A-orthogonalisiert wird [128]. Daraus ergibt sich das in
Flussdiagramm 4.2 gezeigte Schema des Algorithmus. Abbildung 4.4 veranschaulicht den
Vorteil der Methode gegen¨
uber dem Verfahren des steilsten Abstiegs. F¨
ur eine tieferge-
hende Betrachtung der Thematik sei auf die Referenzen 128,129,130,131 verwiesen. Die
zur L¨
osung der Sternheimer-Gleichung ben¨
otigte Restriktion der Minimierung auf einen
Teilraum von Cmkann ebenso leicht wie beim Steepest-Descent-Verfahren erreicht werden.
Sie ist in Flussdiagramm 4.2 mit angegeben.
4.1 Die Sternheimer-Gleichung 65
VorgabeeinesStartpunkts
Schrittweite
Linienminimierung
Residuum
d<
k
r
~
Abbruchkriterium
min
xx »
k
Ende
1+¬ kk
UÎ
0
x
Residuum
bxr --= 00 A
Projektionauf U:
Suchrichtung
00
~rr U
P=
kk
kk
krr
rr
~~
~~
11
1
++
+=b
kkkk srs 111
~+++ += b
00
~
rs =
Gram-Schmidt-Koeffizient
KonjugationdesResiduums
kk
kk
kAss
rr ~~
min, =l
Projektionauf U:
kkkk Asrr min,1
~l-=
+
11
~++ =kUk Prr
ja
nein
kkkk sxx min,1 l+=
+
Flussdiagramm 4.2: Die Methode der konjugierten Gradienten. Bei diesem Verfahren ergibt sich die
Suchrichtung durch Konjugation (A-Orthogonalisierung, vgl. Abb. 4.3) des Gradienten zur vorange-
henden Suchrichtung. Die Projektionen und die Startbedingung x0Usind nur notwendig, wenn die
Minimierung auf einen linearen Teilraum Ubeschr¨
ankt sein soll.
In Abb. 4.5 ist das Konvergenzverhalten des Verfahrens bei Anwendung auf das Ener-
giefunktional (4.3) dargestellt. Es zeigt sich eine deutlich Verbesserung im Vergleich zu
Steepest Descent. Je nach Abschneideenergie wurden bei den getesten Materialien (GaAs,
GaN und InN mit Abschneideenergien von 15, 70 bzw. 80 Ry) zwischen 20 und 60 Itera-
tionen f¨
ur die Minimierung ben¨
otigt. Eine weitere Steigerung der Effizienz l¨
asst sich durch
Pr¨
akonditionierung erreichen, was im folgenden Abschnitt kurz umrissen wird.
4.1.2.3 Pr¨
akonditionierung
Der große Vorteil des Konjugierte-Gradienten-Verfahrens, dass n¨
amlich der neue Suchvek-
tor nur durch Konjugation des Gradienten zur letzten Suchrichtung erzeugt wird, macht
das Verfahren in der Praxis aber auch anf¨
allig f¨
ur numerische Rundungsfehler, die sich
bei hochdimensionalen Problemen im Laufe der Zeit akkumulieren k¨
onnen. Gegebenen-
falls werden dadurch mehr als mSchritte f¨
ur die Minimierung ben¨
otigt. Tats¨
achlich m¨
ochte
man bei vielen Anwendungen aber sogar mit deutlich weniger als mSchritten auskommen.
Aus diesem Grund wird das Verfahren im Allgemeinen mit einer so genannten Pr¨
akondi-
tionierung betrieben. Ziel dabei ist, durch eine Transformation von (4.13) und (4.15) die
Konditionierung κ(vgl. Abschnitt 4.1.2.1) des Problems zu verbessern. Mit einer hermite-
66 4 Implementierung
0 10 20 30 40 50 60
Iterationen
10-8
10-6
10-4
10-2
1
102
104
106
Differenz zum Min. [eV]
0 10 20 30 40 50 60
Iterationen
10-6
10-4
10-2
1
102
104
Residuum
0 10 20 30 40 50 60
Iterationen
10-8
10-6
10-4
10-2
1
102
104
106
Differenz zum Min. [eV]
0 10 20 30 40 50 60
Iterationen
10-6
10-4
10-2
1
102
104
Residuum
0 10 20 30 40 50 60
Iterationen
10-8
10-6
10-4
10-2
1
102
104
106
Differenz zum Min. [eV]
GaAs GaAs
Steepest Descent
Conjugate Gradient
0 10 20 30 40 50 60
Iterationen
10-6
10-4
10-2
1
102
104
Residuum
Prec. Conjugate Gradient (Payne)
Prec. Conjugate Gradient (Arias)
GaN GaN
InN
InN
Abbildung 4.5: Iterative Minimierungsmethoden im Vergleich. Die Graphen links zeigen die Abwei-
chung des Energiefunktionals (4.3) von dessen Minimum als Funktion der Iterationsschritte. Rechts
daneben ist, ebenfalls ¨
uber die Anzahl der Iterationen, das Residuum (die linke Seite der Sternheimer-
Gleichung (4.1) im Teilraum der unbesetzten Zust¨
ande) aufgetragen. Die Abschneideenergie betrug
15 Ry f¨
ur GaAs, 70 Ry f¨
ur InN und 80 Ry f¨
ur InN, und Startpunkt f¨
ur die Korrekturfunktionen war 0.
In allen F¨
allen ergibt sich die gleiche Reihenfolge bei der Qualit¨
at der Methoden: Steepest Descent
zeigt ein sehr langsames Konvergenzverhalten. Eine wesentliche Verbesserung erreicht man mit dem
Conjugate-Gradient-Verfahren, dessen Effizienz sich durch geeignete Pr¨
akonditionierungen nochmals
deutlich steigern l¨
asst.
4.1 Die Sternheimer-Gleichung 67
VorgabeeinesStartpunkts
Schrittweite
Linienminimierung
Residuum
d<
k
r
~
Abbruchkriterium
min
xx »
k
Ende
1+¬ kk
UÎ
0
x
Residuum
bxr --= 00 A
Projektoinauf U:
Suchrichtung
Gram-Schmidt-Koeffizient
Konjug.desResiduums
Projektionauf U:
11
~++ =kUk Prr
ja
nein
kk
kk
kA
M
ss
rr ~~
1
min,
-
=l
kUk Prr =
~
0
1
0
~
rs -
=MP
U
kkkk sxx min,1 l+=
+
kkkk Asrr min,1
~l-=
+
kkkUk MP srs 11
1
1
~++
-
++= b
kk
kk
kA
AM
ss
sr
~
1
1
-
+-=b
Flussdiagramm 4.3: Die Methode der Konjugierten Gradienten mit Pr¨
akonditionierung. M1ist eine
N¨
aherung f¨
ur die Inverse von A. Im Algorithmus wird nur die Anwendung auf (die Projektion des)
Residuums ben¨
otigt. Wie in den Flussdiagrammen 4.1 und 4.2 sind Projektionen PUeingef¨
ugt, um die
Minimierung auf einen Unterraum Uzu beschr¨
anken.
schen, positiv definiten Matrix Mgilt7
Ax+b= 0 M1Ax+M1b= 0 .(4.24)
Dabei soll Meine geeignete N¨
aherung” von Amit der Eigenschaft κ(M1A)κ(A)
sein, die sich aber deutlich leichter als Aselbst invertieren l¨
asst, z.B. die Matrix der Dia-
gonalelemente von A. Die Schwierigkeit besteht darin, dass die linke Seite dieser Gleichung
im Allgemeinen nicht als Ableitung eines Funktionals analog zu (4.13) dargestellt werden
kann, da M1Anicht notwendigerweise hermitesch oder positiv definit ist. Als hermi-
tesche und positiv definite Matrix kann jedoch Min der Form M=EEfaktorisiert
werden, wobei sich Ez.B. aus einer Cholesky-Zerlegung [129] ergibt. Nun haben M1A
und E1A(E)1die gleichen Eigenwerte [131] und sind damit gleich gut konditioniert.
Da aber E1A(E)1hermitesch und positiv definit ist, benutzt man statt (4.24) die
Transformation
Ax+b= 0 E1A(E)1ˆx +E1b= 0 mit ˆx := Ex.(4.25)
Die L¨
osung dieser Gleichung ist das Minimum der quadratischen Form
˜
F(x) := 1
2hˆx|E1A(E)1|ˆxi+1
2hˆx|E1bi+1
2hE1b|ˆxi,(4.26)
7Eine positiv definite Matrix ist invertierbar, da alle ihre Eigenwerte positiv sind. Invertierbare Matrizen
wiederum sind bijektive Abbildungen. Damit folgt, dass (4.24) eine ¨
Aquivalenzumformung ist.
68 4 Implementierung
deren Isofl¨
achen anschaulich geprochen kugelf¨
ormiger” als die des urspr¨
unglichen
Funktionals (4.13) sind. Die Anwendung von Steepest Descent oder Conjugate Gradient
auf ˜
Fkonvergiert folglich schneller als die auf F. In der Praxis muss letztlich weder die
Invertierung von Mnoch die Fakorisierung M=EEexplizit ausgef¨
uhrt werden, da alle
auftretenden Ausdr¨
ucke so umgestellt werden k¨
onnen, dass nur M1rkben¨
otigt wird [131].
Es muss folglich noch nicht einmal Mselbst bekannt sein, sondern nur die Anwendung
seiner Inversen auf das Residuum. Der Ablauf des Algorithmus ist in Flussdiagramm 4.3
demonstriert.
In dieser Arbeit wurden zwei Pr¨
akonditionierungen getestet, die urspr¨
unglich f¨
ur die
Diagonalisierung der Kohn-Sham-Gleichung (1.52) in Ebene-Wellen-Darstellung mit Hilfe
des Konjugierte-Gradienten-Verfahrens entwickelt wurden. Beim Ansatz von Teter, Payne
und Allan [130,132] ist M1im reziproken Raum durch eine Diagonalmatrix gegeben,
hG+k|M1|G+ki:= (4.27)
:= δGG
27 + 18x+ 12x2+ 8x3
27 + 18x+ 12x2+ 8x3+ 16x4mit x:= 1
2|G+k|2
Enk
kin
,
wobei Enk
kin := hψ0
nk|1
22|ψ0
nkidie kinetische Energie des ungest¨
orten Zustandes ψ0
nkist.
F¨
ur x0 strebt dieser Ausdruck gegen 1, so dass sich M1also im Bereich kleiner Wellen-
vektoren ann¨
ahernd wie die Einheitsmatrix verh¨
alt. F¨
ur große xhingegen gehen die Diago-
nalelemente asymptotisch in 1/(2x)¨
uber, d.h., sie werden proportional zu |G+k|2. Die ur-
spr¨
ungliche Intention dabei ist, die in der reziproken Kohn-Sham-Gleichung (3.15) f¨
ur hohe
Frequenzen gegebene Dominanz der kinetischen Energie wieder auszugleichen. Empirisch
zeigt sich, dass diese Vorgehensweise auch bei der L¨
osung der Sternheimer-Gleichung (4.1)
eine erhebliche Steigerung der Effizienz gegen¨
uber dem Konjugierte-Gradienten-Verfahren
ohne Pr¨
akonditionierung erm¨
oglicht, obwohl der St¨
oroperator H1im Unterschied zu H0
keinen Beitrag der kinetischen Energie enth¨
alt. Bei den untersuchten Systemen konnte die
Anzahl der ben¨
otigten Iterationen so um mehr als 60% reduziert werden, vgl. Abb. 4.5.
Der Vorteil ist dabei umso gr¨
oßer, je h¨
oher die verwendete Abschneideenergie ist.
Als geringf¨
ugig schneller als (4.27) erweist sich der Pr¨
akonditionierer von Ismail-Beigi
und Arias [133]. Die Idee ist dabei ganz ¨
ahnlich wie eben; wieder ist M1im reziproken
Raum durch eine Diagonalmatrix gegeben, deren Diagonalelemente f¨
ur kleine Wellenvek-
toren n¨
aherungsweise 1, f¨
ur große jedoch proportional zu |G+k|2sind:
hG+k|M1|G+ki:= δGG
p(x)
1 + x p(x)mit x:= |G+k|2
Ekin/nmax
,(4.28)
wobei
Ekin =
occ.
X
n,khψ0
nk|1
22|ψ0
nki
die kinetische Energie des ungest¨
orten Systems,
p(x) := 1 + x(1 + x(1 + x(1 + x(1 + x(1 + x(1 + x(1 + x)))))))
ein Polynom 8. Grades und nmax die Anzahl der besetzten B¨
ander ist. Der Vorteil dieses
Pr¨
akonditionierers gegen¨
uber dem von Teter et al. betr¨
agt bei den hier untersuchten Ma-
terialen allerdings nur sehr wenige Iterationsschritte (1 bis 4), vgl. Abb. 4.5. Mit beiden
Methoden l¨
asst sich das Energiefunktional (4.3) in 10 bis 20 Iterationsschritten minimie-
ren. F¨
ur das variationelle EXX-Verfahren ist es daher nicht entscheidend, ob (4.27) oder
(4.28) eingesetzt wird.
4.2 Induzierte Ladungsdichte 69
4.2 Induzierte Ladungsdichte
Im letzten Abschnitt wurde detailliert die L¨
osung der Sternheimer-Gleichung, also die
Berechnung der linearen Korrekturfunktionen ψ1
i, mit Hilfe schneller, iterativer Minimie-
rungsverfahren besprochen. Der n¨
achste Schritt des variationellen EXX-Verfahrens besteht
nun in der Berechnung der induzierten Ladungsdichte ρgem¨
Gleichung (2.4). Zur nu-
merischen Auswertung wird sie dabei zweckm¨
aßigerweise in der Form
ρ:= 2 Re
occ
X
i
(ψ0
i)ψ1
i(4.29)
geschrieben. Wird eine Ebene-Wellen-Basis verwendet und die Brillouin-Zonen-Integration
durch eine Summe ¨
uber die k-Punkte eines Monkhorst-Pack-Gitters gen¨
ahert, k¨
onnen ganz
analog zu der in Abschnitt 3.2 f¨
ur die Ladungsdichte ρbeschriebenen Vorgehensweise auch
hier die im System vorhandenen Punktsymmetrien zur Reduktion des k-Punkt-Satzes aus-
genutzt werden. Die Sternheimer-Gleichung (4.12) wird also nur an den Nred Punkten eines
reduzierten k-Punkt-Satzes ausgewertet, und mit den Korrekturfunktionen wird anschlie-
ßend
ρunsym := 2 Re
occ
X
n
Nred
X
s=1
wks(ψ0
nks)ψ1
nks(4.30)
berechnet. Dabei sollen die wksgeeignete Wichtungen der kssein. Bezeichnet weiter NPS
die Anzahl der Punkttransformationen Siim System, ist die induzierte Dichte in dieser
Basis durch
ρsym(r) := 1
NPS
NPS
X
i=1
ρunsym(Sir) (4.31)
gegeben. Gem¨
dem in Abschnitt 2.1 formulierten Variationsprinzip (2.6) ist es nun das
Ziel, diese Gr¨
oße durch Variieren des lokalen Austauschpotentials zum Verschwinden zu
bringen. Dies gelingt mit den im folgenden Abschnitt beschriebenen Mixing”-Verfahren.
Die (nicht-verschwindende) induzierte Ladungsdichte, die sich aus einem nur gen¨
aherten
Austauschpotential wie LDA ergibt, kann dabei physikalisch sehr anschaulich interpretiert
werden, vgl. dazu Abschnitt 6.
4.3 Minimierung der induzierten Ladungsdichte
Der letzte Schritt im variationllen EXX-Verfahren ist die numerische Auswertung des Va-
riationsprinzips (2.6) von Abschnitt 2.1, also die Minimierung der (Norm der) induzierten
Ladungsdichte in Abh¨
angigkeit des lokalen Austauschpotentials:
ρ[vx] 0 f¨
ur vx vEXX ,(4.32)
wobei vEXX das exakte Austauschpotential bezeichnen soll. Die Minimierung kann dabei
auf zwei verschiedene Arten geschehen: (i) Bei festgehaltenen Kohn-Sham-Funktionen ψ0
i
und -energien ε0
ioder aber (ii) bei expliziter Ber¨
ucksichtigung der vx-Abh¨
angigkeit von
ψ0
iund ε0
i. Beide M¨
oglichkeiten werden in dem in dieser Arbeit entwickelten Algorith-
mus verwendet, haben aber verschiedene physikalische Bedeutungen. Um den Unterschied
zu verdeutlichen, soll die Minimierung zun¨
achst kurz theoretisch analysiert werden, im
Anschluss daran werden dann geeignete numerische Methoden er¨
ortert.
70 4 Implementierung
Zu Punkt (i): Der ¨
Ubersichtlichkeit halber sei die induzierte Ladungsdichte f¨
ur die
folgenden Betrachtungen nat¨
urlich nicht in der Implementierung in der knappen
Form (D.12) aus Anhang Dausgedr¨
uckt:
ρ[vx] = ˆ
X0[{ψ0
i},{ε0
i}] (VFock[{ψ0
i}]vx) (4.33)
=ˆ
X0[{ψ0
i},{ε0
i}]VFock[{ψ0
i}]ˆχ0[{ψ0
i},{ε0
i}]vx.
Hier ist ˆ
X0der auf nicht-lokale St¨
orungen erweiterte8lineare Antwortoperator (D.5), und
ferner seien ψ0
iund ε0
iEigenfunktionen und -Eigenwerte eines Kohn-Sham-Systems mit
einem effektiven Potential veff. Dass sich veff und damit eben auch ψ0
iund ε0
i bei
¨
Anderung von vxebenfalls ¨
andert, sei dabei nicht ber¨
ucksichtigt. ρist dann eine linea-
re (genauer: affine) Funktion von vx, und die Aufgabe, ρ[vx] verschwinden zu lassen,
l¨
auft damit auf die L¨
osung eines linearen Gleichungsystems (der Inversion von χ0) her-
aus. Dies steht in Einklang damit, dass nach der G¨
orling-Levy-St¨
orungstheorie (vgl. die
Abschnitte 1.5.4 und 1.6.3) die Austauschwechselwirkung durch eine Taylorentwicklung in
1. Ordnung gegeben ist. L¨
ost man ρ[vx] = 0 durch Inversion von χ0, ergibt sich ausge-
schrieben gerade die Standard-EXX-Gleichung (1.90), d.h., die Minimierung von (4.33)
liefert das exakte Austauschpotential vEXX[ρ]der zu den ψ0
igeh¨
orenden Dichte ρ.
Interessant ist, dass damit die Bestimmungsgleichung f¨
ur vEXX eine formal analoge
Gestalt aufweist wie die Sternheimer-Gleichung; wie diese k¨
onnte man sie also mit den in
Abschnitt 4.1.2 besprochenen Minimierungsverfahren (z.B. Steepest Descent) l¨
osen: es ist
in (4.13) nur A=χ0und b=ˆ
X0VFock zu setzen. Das zu minimierende Funktional lautet
dann:
S[vx] := 1
2hvx|(ˆχ0)|vxi+hvx|ˆ
X0VFocki(4.34)
(man beachte, dass χ0negativ semi-definit ist [134,148], und es sich hier um ein rein
reelles Problem handelt). Dieser Zusammenhang zwischen der Sternheimer-Gleichung und
der Minimierung von ρwurde bereits in Abschnitt 2.3 angedeutet. Im n¨
achsten Abschnitt
wird die Minimierung von ρmit Hilfe von Selbstkonsistenzverfahren vorgestellt. Dabei
wird sich die einfachste Variante dieser Methoden das einfache Mixen” in der Tat
als Anwendung des Steepest-Descent-Verfahrens auf (4.34) entpuppen.
Zun¨
achst aber noch zu Punkt (ii): In Gleichung (4.33) werde nun ber¨
ucksichtigt, dass
ˆ
X0und VFock implizit ¨
uber die Kohn-Sham-Wellenfunktionen und -Eigenwerte vom
effektiven Potential und damit von vxabh¨
angen:
ρ[vx] = ˆ
X0[{ψ0
i[vx]},{ε0
i[vx]}] (VFock[{ψ0
i[vx]}]vx).(4.35)
Dabei sind ψ0
i[vx] und ε0
i[vx] als L¨
osungen des Eigenwertproblems
1
22+vext(r) + vH[ρ](r) + vx(r) + vc[ρ](r)ψi(r) = εiψi(r) (4.36)
gegeben. Wie die Kohn-Sham-Gleichung (1.52) soll diese Gleichung selbstkonsistent zu-
sammen mit der Formel f¨
ur die Ladungsdichte (1.53) gel¨
ost werden, im Unterschied zu
(1.52) ist hier das Austauschpotential aber keine Funktion der Dichte. Berechnet man also
die induzierte Dichte gem¨
(4.35) f¨
ur ein spezielles vx, wird zun¨
achst (4.36) gel¨
ost, und
8Wie in Anhang Dsei bei Anwendung auf ein lokales Potential vlok wieder ˆ
X0vlok := ˆχ0vlok mit dem
normalen” Antwortoperator ˆχ0definiert, um die Schreibweise nicht zu sehr aufzubl¨
ahen.
4.3 Minimierung der induzierten Ladungsdichte 71
anschließend werden mit den daraus resultierenden Eigenfunktionen ψ0
i[vx] und Eigen-
werten ε0
i[vx] der Fock-Operator sowie der (erweiterte) Antwortoperator (D.5) berechnet,
woraus sich schließlich ρ[vx] ergibt.
Die selbstkonsistente L¨
osung von (4.36) ist aber gleichbedeutend mit der Minimie-
rung des Energiefunktionals E[ρ] := Rvext(r)ρ(r) d3r+Ts[ρ] + EH[ρ] + Ex[ρ] + Ec[ρ] mit
Ex[ρ] := Rvx(r)ρ(r) d3r, was dem Ausdruck (1.54) f¨
ur die Gesamtenergie des realen Sy-
stems bei festgehaltenem vxentspricht. Im Gegensatz zu der in (4.33) definierten Indukti-
onsdichte f¨
uhrt die Definition (4.35) in (4.32) damit auf ein vEXX, das zwei Variationsprin-
zipien gemeinsam erf¨
ullt: Zum einen gilt kρ[vEXX]k= 0, und zum anderen minimiert das
aus den ψ0
i[vEXX] gebildete ρvEXX die Energie E[ρ]. Da in Punkt (i) Wellenfunktionen und
Ein-Teilchen-Energien eines beliebigen effektiven Potentials vorausgesetzt wurden, k¨
onnen
dort auch die so konstruierten ψ0
i[vEXX] und ε0
i[vEXX] eingesetzt werden. Aus der in (i)
kursiv hervorgehobenen Aussage folgt dann, dass vEXX das exakte Austauschpotential der
zu den ψ0
i[vEXX] geh¨
orenden Dichte ρvEXX ist. Diese ergibt sich aber aus dem effektiven
Potential veff[ρvEXX ] := vext +vH[ρvEXX ] + vEXX +vc[ρvEXX ], denn (4.36) ist ja selbstkonsis-
tent gel¨
ost. Damit folgt sofort veff [ρvEXX ] = vext +vH[ρvEXX ]+vEXX[ρvEXX ]+vc[ρvEXX ], d.h.,
vEXX und ρvEXX erf¨
ullen nicht nur das Eigenwertproblem (4.36), sondern auch die Kohn-
Sham-Gleichung (1.52). ¨
Aquivalent dazu: ρvEXX minimiert nicht nur das oben definierte
E[ρ], sondern auch die Gesamtenergie des realen Systems (1.54), und es gilt ρvEXX =ρ0mit
der Grundzustandsladungsdichte ρ0des Systems. Die Minimierung von (4.35) beinhaltet
damit neben der Berechnung des exakten Austauschpotentials vEXX[ρ0]der Grundzustands-
dichte ρ0auch zugleich die L¨
osung des gesamten Kohn-Sham-EXX-Problems!
Daher ist (4.35) im Gegensatz zu (4.33) auch keine lineare (affine) Funktion
in vxmehr. Es sei darauf hingewiesen, dass aber auch die Bestimmung des exakten Au-
stauschpotentials zu einer vorgebenen Ladungsdichte ρnach (i) nur dadurch als lineares
Problem aufgefasst werden konnte, weil das zu ρgeh¨
orende (und unter der Bedingung der
v-Darstellbarkeit eindeutig bestimmte) effektive Potential und damit auch die entspre-
chenden Eigenfunktionen und -werte schon als bekannt vorausgesetzt wurden. Dies wird
auch in der G¨
orling-Levy-St¨
orungstheorie getan, vgl. (1.101). Von ρausgehend ist die Be-
rechnung von vEXX[ρ] hingegen ein nicht-lineares Probem die Nichtlinearit¨
at liegt dabei
jedoch einzig in der Zuordnung ρ veff {ψ0
i},{ε0
i}, die f¨
ur sich alleine genommen
nichts mit der Austauschwechselwirkung zu tun hat. Erg¨
anzend sei noch bemerkt, dass
sich hierin wiederum der im Sinne von Abschnitt 1.4 universelle” Charakter des exakten
Austauschpotentials manifestiert, da in diese Zuordnung das ¨
außere Potential nicht expli-
zit9einfließt.
Mit dem Vorangegangenen ist klar, dass man bei praktischen Anwendungen in der Re-
gel an der Minimierung der induzierten Ladungsdichte nach (ii), also bei Ber¨
ucksichtigung
auch der impliziten vx-Abh¨
angigkeiten, interessiert sein wird. Mit iterativen Verfahren
wie dem nachfolgend vorgestellten Mixing ließe sich dies auch ohne Weiteres bewerkstel-
ligen. Sp¨
ater wird sich jedoch bei der Optimierung des variationellen EXX-Verfahrens
(Abschnitt 4.5.1) herausstellen, dass eine Kombination der Minimierungen nach (i) und
(ii) eine technisch weitaus bessere Strategie ist. Der Algorithmus besteht dann aus einer
inneren Schleife, in der gem¨
(i) vorgegangen wird, und einer ¨
außeren, die (ii) realisiert.
Da sich das Mixing dabei vorwiegend in der inneren Schleife abspielt, wird es im Folgenden
vor allem mit Blick auf Punkt (i) diskutiert.
9Mit den S¨
atzen von Hohenberg und Kohn ist nat¨
urlich ρeine Funktion von vext, und damit ist das
Austauschpotential ebenso wie das universelle Funktional F[ρ] in (1.37) eine implizite Funktion von vext.
72 4 Implementierung
4.3.1 Mixing, Selbstkonsistenz und Minimierung
Mixing-Verfahren sind zentral f¨
ur die Behandlung von Problemen, die selbstkonsistent”
gel¨
ost werden m¨
ussen, d.h., bei denen die Gr¨
oßen, aus denen die L¨
osung ermittelt werden
soll, bereits ihrerseits von der (im Allgemeinen noch nicht bekannten) L¨
osung abh¨
angen.
Beispiele sind die Hartree-Fock-Gleichung (1.24) und die Kohn-Sham-Gleichung (1.52): in
beiden F¨
allen m¨
ussen die Ein-Teilchen-Wellenfunktionen bekannt sein, damit aus ihnen die
Eigenwertgleichung erst formuliert werden kann. Da bei Kohn-Sham die Wellenfunktionen
nur zusammengefasst zur Ladungsdichte ben¨
otigt werden, l¨
asst sich die Selbstkonsistenz
hier in der Form
ρ=F[ρ] (4.37)
schreiben [134,135], wobei Feine nicht-lineare Funktion ist, die die L¨
osung des Eigen-
wertproblems (1.52) in Abh¨
angigkeit einer Eingangsdichte ρin und die anschließende Be-
rechnung der daraus resultierenden Ausgangsdichte ρout =F[ρin]¨
uber (1.53) beinhaltet.10
Mathematisch ist ρein Fixpunkt von F, und gem¨
dem Fixpunktsatz von Banach (vgl.
z.B. Ref. 123 oder 124) erh¨
alt man ρdurch (unendlich oftmaliges) rekursives Anwenden
von Fauf ein beliebiges ρin, wenn Fkontrahierend”11 ist. Diese Voraussetzung ist aber im
Allgemeinen nicht gegeben, und h¨
aufig divergiert daher die Folge der so erzeugten Dichten
in der Praxis. Ein einfacher Ansatz, dennoch das selbstkonsistente ρdurch Rekursion
finden zu k¨
onnen, ist nun, in jeder Iteration Eingangs- und Ausgangsdichte miteinander
zu mischen” und den Rekursionsprozess auf diese Weise zu d¨
ampfen. Mit dem Residuum
R[ρin] := ρout ρin =F[ρin]ρin (4.38)
erh¨
alt man etwa beim einfachen Mixen” die neue Eingangsladungsdichte jeweils aus
ρm+1
in = (1 λ)ρm
in +λρm
out =ρm
in +λR[ρm
in],(4.39)
wobei f¨
ur λtypischerweise Werte im Bereich zwischen 0.1 und 0.5, oft aber auch wesentlich
kleiner, angesetzt werden [134,137,148].
Durch das Residuum kommt nun ein Bezug zur Minimierung ins Spiel. Denn aus (4.37)
und (4.38) folgt, dass das Residuum f¨
ur die selbstkonsistente Dichte ρverschwindet; die
Suche nach ρist also ¨
aquivalent zu der Aufgabe, kR[ρ]kzu minimieren. Dies erm¨
oglicht
nun, Selbstkonsistenz-Methoden im Rahmen des variationellen EXX-Verfahrens auch auf
das Minimierungsproblem (4.32) anzuwenden. Indem die (negative) induzierte Ladungs-
dichte als Residuum betrachtet wird,
R[vx] := ρ[vx],(4.40)
l¨
asst sich das einfache Mixing dabei analog zu (4.39) durch
vm+1
x:= vm
x+λR[vm
x] = vm
xλρ[vm
x] (4.41)
mit λ > 0 realisieren. Hier ist allerdings zu beachten, dass im Gegensatz zur Vorgehens-
weise bei der Kohn-Sham- oder der Hartree-Fock-Gleichung zwei unterschiedliche physi-
kalische Gr¨
oßen Potential und Ladungsdichte miteinander gemischt werden.
10Alternativ l¨
asst sich dies auch ¨
uber das effektive Kohn-Sham-Potential formulieren: ˜
F[veff
] = veff
,
wobei ˜
Ff¨
ur ein gegebenes veff
in zun¨
achst die Ladungsdichte und damit anschließend veff
out berechnet.
11Ein in einem normierten Raum Xdefinierter Operator Fist kontrahierend”, wenn f¨
ur x, y Xmit
einem L < 1 gilt: kF(x)F(y)k Lkxyk.
4.3 Minimierung der induzierten Ladungsdichte 73
Benutzt man in (4.41) die Definition (4.33) von ρ[vx] erfolgt also keine Aktualisie-
rung des Eigenwertproblems (4.36) in jedem Schritt —, so fungiert der skalare Parameter λ
dabei als einfache N¨
aherung f¨
ur die Inverse der linearen Antwort. Dies erkennt man unter
Beachtung von ρ[vEXX] = 0, indem man (4.33) f¨
ur beliebiges vxsowie f¨
ur das exakte
vEXX betrachtet und anschließend die beiden so entstandenen Gleichungen voneinander
subtrahiert:
vEXX =vx+ ˆχ1
0ρ[vx].(4.42)
Gleichung (4.41) ist also eine einfache Approximation von (4.42). Damit erkl¨
art sich auch
das negative Vorzeichen von λin der rechten Seite von (4.41) bzw. von ρbei der Defini-
tion des Residuums (4.40): ˆχ0ist ein negativ definiter Operator [134,148] und ˆχ1
0folglich
ebenfalls.12 Abbildung 4.6 zeigt die Minimierung der induzierten Dichte gem¨
(4.41) in
Abh¨
angigkeit von der Iteration bei GaAs.
Zwischen Mixing-Verfahren und der in Abschnitt 4.1.2 beschriebenen Minimierung ei-
nes Funktionals bestehen einige Analogien, die hier besonders deutlich werden. Ist n¨
amlich
die 1. Variationsableitung (diskret: Jakobi-Matrix) des Residuums Rein selbstadjungier-
ter Operator (diskret: eine hermitesche Matrix), existiert ein reellwertiges Funktional S,
dessen 1. Variationsableitung (diskret: Gradient S) durch Rgegeben ist. Die stati-
on¨
aren Punkte von Ssind dann gerade die gesuchten Nullstellen von R ganz ¨
ahn-
lich, wie sich die L¨
osungen von (4.15) als station¨
are Punkte von (4.13) darstellen las-
sen. F¨
ur R=ρmit der induzierten Ladungsdichte (4.33) ist dies tats¨
achlich der
Fall: es gilt δR[vx]vx=χ0, und χ0ist hermitesch. Insbesondere ergibt sich eine ¨
Uber-
einstimmung von einfachem Mixing und einfachem Steepest Descent: die Rekursions-
formeln (4.18) und (4.41) beider Verfahren besitzen die gleiche Gestalt. In der Tat ist
das einfache Mixen (4.41) von Potential und induzierter Dichte nichts anderes als die
Anwendung des Steepest-Descent-Verfahrens auf das Funktional S[vx] von (4.34): es ist
δS[vx]vx= ρ[vx] = R[vx], und die Rekursionsformel (4.18) f¨
ur Steepest Descent
liefert unmittelbar (4.41) mit xi=vi
xund ri=R[vi
x]. Der einzige Unterschied zur Vor-
gehensweise von Abschnitt 4.1.2.1 besteht darin, das Residuum nicht direkt nach (4.33)
zu bestimmen, sondern um die direkte Berechnung von χ0zu vermeiden indirekt
¨
uber (4.29). Dies ist auch der Grund, weshalb im variationellen EXX-Verfahren die Mini-
mierung von ρ¨
uberhaupt durch Mixing erfolgt und nicht beispielsweise mit Conjugate
Gradient dazu w¨
are eine explizite Kenntnis von χ0n¨
otig, die bei Mixing-Methoden wie
dem nachfolgend vorgestellten Pulay-Verfahren nicht notwendig ist.
Es sei noch darauf hingewiesen, dass nicht immer eine solche Stammfunktion” Skon-
struiert werden kann. Dies ist etwa der Fall f¨
ur das Residuum (4.38) des Ladungsdichte-
Mixings beim L¨
osen der Kohn-Sham-Gleichung, denn seine Ableitung J[ρ] := δR[ρ]ρ
ist nicht hermitesch (vgl. Fußnote auf Seite 76). Das einfache Mixing (4.39) der Dich-
te kann also nicht als Steepest-Descent-Verfahren interpretiert werden. Dennoch gibt es
starke ¨
Ahnlichkeiten: Zum einen sind auch hier die Rekursionsformeln beider Verfahren,
(4.39) und (4.18), von gleicher Gestalt. Zum anderen besitzt Jnur reelle, positive (rechte)
Eigenwerte αi[134,146,148], was sich als Verallgemeinerung der positiven Definitheit von
Ain (4.13) auffassen l¨
asst. H¨
atten die Eigenwerte unterschiedliche Vorzeichen, so w¨
urde
das Mixing ¨
ahnlich wie die Minimierungsmethoden in Abschnitt 4.1.2 nicht konver-
gieren [134]. Schließlich ist auch der in den Referenzen 134 und 135 angegebene Bereich
12Wie in Abschnitt 1.6.1 wird hier ein auf die nicht-konstanten Funktionen beschr¨
ankter Definitions-
(und Werte-)bereich von ˆχ0angenommen.
74 4 Implementierung
f¨
ur λ, f¨
ur den das einfache Mixing kovergent ist, identisch mit der Konvergenzbedingung
(4.19) des einfachen Steepest-Descent-Verfahrens.
Die Verbindung von Selbstkonsistenz- und Minimierungsproblemen basiert letztlich
darauf, dass erstere ¨
uber das Residuum immer in der Form einer homogenen Gleichung
geschrieben werden k¨
onnen, hier etwa als R[ρ] = 0 bzw. R[vx] = 0. Numerisch, also in
einer geeigneten endlichen Basisdarstellung, entspricht dies einem System gekoppelter (im
Allgemeinen nicht-linearer) Gleichungen. Damit kann eine Vielzahl von in der numerischen
Mathematik entwickelten Methoden zur L¨
osung solcher Systeme auf das Selbstkonsistenz-
problem ¨
ubertragen werden mit dem Ziel, die Konvergenz gegen¨
uber dem einfachen Mixing
zu steigern. F¨
ur das Dichte-Mixing im Rahmen der Dichtefunktionaltheorie wurde eine
Reihe von Ans¨
atzen entwickelt [137,138,139,140,141,144], die darauf beruhen, in aufein-
ander folgenden Schritten immer bessere N¨
aherungen f¨
ur die (Inverse der) Jakobi-Matrix
von Rzu konstruieren. Wie Kresse und Furthm¨
uller [142,143] ausf¨
uhren, handelt es sich
bei allen diesen Verfahren um verschiedene Realisierungen oder Weiterentwicklungen ei-
nes von Broyden [136] vorgeschlagenen Quasi-Newton-Raphson-Schemas. Ausgangspunkt
dabei ist eine Linearisierung” des Residuums (4.38) an der Stelle der selbstkonsistenten
Dichte ρ, woraus sich mit der Forderung R[ρ] = 0 die Gleichung
ρ=ρ+J1R[ρ] (4.43)
mit der Jakobi-Matrix (der 1. Ableitung) Jdes Residuums ergibt. Die Struktur dieser
Gleichung ist mit der von Gleichung (4.42) zur Berechnung des EXX-Potentials v¨
ollig
identisch. Alle in der Literatur zur effizienten L¨
osung der Kohn-Sham-Gleichung vorge-
schlagenen Algorithmen k¨
onnen folglich unmittelbar auf die Minimierung von ρ¨
uber-
tragen werden! Da (4.42) im Gegensatz zu (4.43) eine exakte Gleichung ist, stellt sie sogar
einen Idealfall f¨
ur die Anwendung von Quasi-Newton-Raphson-Verfahren dar. Die ver-
schiedenen Algorithmen unterscheiden sich in der Art und Weise, wie J1im Laufe des
Iterationsprozesses aktualisiert und approximiert wird. In dieser Arbeit wurde die Metho-
de von Pulay [140,141] verwendet, und zwar in einer von Kresse und Furthm¨
uller [142]
zur Verbesserung der numerischen Stabilit¨
at leicht modifizierten Fassung. Sie soll nun, in
einer f¨
ur das Mixing von Potential und induzierter Dichte adaptierten Version, skizziert
werden.
4.3.2 Pulay-Mixing
W¨
ahrend beim einfachen Mixing (4.41) in jedem Schritt vom Potential vm
xder jeweils
vorangehenden Iteration ausgegangen wird, ist die Idee des Pulay-Mixers, aus allen (oder
einer bestimmten Anzahl der) vorangehenden Iterationen die beste Linearkombination zu
benutzen:
vm+1
x:= vopt
xλρ[vopt
x] (4.44)
mit
vopt
x=X
i
αivi
x.(4.45)
Die Aufgabe besteht dann in der Konstruktion von vopt
x, d.h., in der Bestimmung der
Koeffizienten αi. Da in der urspr¨
unglichen Formulierung des Verfahrens nicht Potentiale,
sondern Ladungsdichten gemischt werden, wird an dieser Stelle die zus¨
atzliche Bedingung
X
i
αi!
= 1 (4.46)
4.3 Minimierung der induzierten Ladungsdichte 75
eingef¨
uhrt, um die Ladungserhaltung zu gew¨
ahrleisten. Hier entspricht sie der Erhaltung
der konstanten Komponente (G=0) im Startpontential v1
x. Obwohl nun konstante Ver-
schiebungen des Potentials die Physik eines Systems nicht beeinflussen, wird diese For-
derung hier jedoch ebenfalls ben¨
otigt; (4.45) soll n¨
amlich analog auch f¨
ur die induzierten
Dichten formuliert werden. Mit (4.33) ergibt sich dann:
ρ[vopt
x] = ρX
i
αivi
x=ˆ
X0VFock ˆχ0X
i
αivi
x= (4.47)
(4.46)
=X
i
αiˆ
X0VFock ˆχ0vi
x=X
i
αiρ[vi
x].
Die Koeffizienten der besten” Linearkombination (4.45) sind nun dadurch definiert, dass
mit ihnen die Norm der induzierten Dichte
hρ[vopt
x]|ρ[vopt
x]i(4.48)
minimal wird. Daraus und mit der Nebenbedingung (4.46) folgt
αi=PjA1
ji
Pkj A1
kj
mit Aij := hρ[vj
x]|ρ[vi
x]i.(4.49)
Dies entspricht der originalen Vorgehensweise von Pulay [140,141]. W¨
ahrend dabei die
aufeinander folgenden Iterationen des Potentials und der induzierten Dichte durch (4.45)
und (4.49) explizit ber¨
ucksichtigt werden, geht deren Verlauf in der Variante von Kresse
und Furthm¨
uller [142] nur in Form der Differenzen
vi
x:= vi+1
xvi
x,∆∆ρi:= ρ[vi+1
x]ρ[vi
x] f¨
ur i < m (4.50)
ein. Zun¨
achst wird die Nebenbedingung (4.46) benutzt, um die Anzahl der Koeffizienten
in (4.45) um Eins zu reduzieren:
vopt
x=vm
x+
m1
X
i=1
¯αivi
x.(4.51)
F¨
ur die ¯αiist dann keine Nebenbedingung mehr n¨
otig, und es gilt
¯αi=
m1
X
i=1
¯
A1
ji h∆∆ρj|ρ[vm
x]imit ¯
Aij := h∆∆ρj|∆∆ρii.(4.52)
In der Praxis wird meist nicht der gesamte Verlauf von i= 1 an betrachtet, vielmehr wer-
den nur die letzten nSchritte miteinbezogen. Die Summation startet also bei i=mn+ 1.
F¨
ur n= 1 geht das Schema dann in den einfachen Mixer (4.41)¨
uber. Der Algorithmus ist
in Flussdiagramm 4.4 veranschaulicht. Abbildung 4.6 zeigt das Konvergenzverhalten im
Vergleich mit dem einfachen Mixer.
Mit der selben Argumentation wie in Ref. 142 und 143 im Falle der Jakobi-Matrix von
(4.43) vorgef¨
uhrt, l¨
asst sich nun auch hier zeigen, wie der Pulay-Mixer sukzessive immer
bessere N¨
aherungen f¨
ur ˆχ1
0liefert. Einsetzen von (4.51) in (4.44) f¨
uhrt auf
vm+1
x=vm
x+Gmρ[vm
x],(4.53)
76 4 Implementierung
wobei die Matrix
Gm:= λ1+
m1
X
k,n=1
¯
A1
kn (λ|∆∆ρni|vn
xi)h∆∆ρk|(4.54)
die Relation
|vi
xi+Gm|∆∆ρii= 0 f¨
ur i < m (4.55)
erf¨
ullt. W¨
are Gmdas exakte ˆχ1
0, w¨
are die Beziehung ebenfalls erf¨
ullt, allerdings ohne die
Beschr¨
ankung i < m. Dies ergibt sich durch Subtraktion von Gleichung (4.42) f¨
ur zwei
verschiedene Iterationen. Gmist folglich die exakte Inversion von ˆχ0in dem Unterraum,
der durch v1
xbis vm1
xaufgespannt wird. Dies veranschaulicht sehr sch¨
on die auf Pulay
zur¨
uckgehende Bezeichnung Direct Inversion in the Iterative Subspace (DIIS) der Methode.
4.3.3 Pr¨
akonditionierung
Beim selbstkonsistenten L¨
osen der Kohn-Sham-Gleichung wird das Mixing meist mit
Pr¨
akonditionierung betrieben. Als einfacher Ansatz f¨
ur die Inverse der Jakobi-Matrix J
von (4.43) wird daf¨
ur h¨
aufig das Schema von Kerker verwendet, in dem J1n¨
aherungs-
weise durch die im reziproken Raum diagonale Matrix
K(G,G) = AG2
G2+G2
0
δGG(4.56)
mit einem Anahe bei 1 und einem G01.5˚
A1gegeben ist [142,143,145]. Im Rahmen
des Thomas-Fermi-Modells [17,18,19,20] l¨
asst sich Kals Inverse der dielektrischen Ma-
trix in Jellium interpretieren. Ersetzt man etwa beim einfachen Mixing (4.39) den skalaren
Parameter λdurch K, erkennt man, dass die Pr¨
akonditionierung als eine Art Filter wirkt:
kleine G-Vektoren werden im Selbstkonsistenzzyklus st¨
arker gebremst als stark oszillie-
rende Komponenten, f¨
ur die bei A1 fast keine D¨
ampfung mehr erfolgt.
In dieser Arbeit durchgef¨
uhrte Tests zeigten jedoch, dass das Kerker-Schema f¨
ur das
Mischen von Potential und induzierter Dichte gem¨
(4.41) und (4.44) nicht geeignet
ist: Der Selbstkonsistenzzyklus konvergiert schlechter als ohne Pr¨
akonditionierung oder
divergiert sogar. Nun ist Kallerdings auch als N¨
aherungsansatz f¨
ur J1gedacht, man kann
also nicht unbedingt erwarten, dass er f¨
ur χ1
0ebenfalls funkioniert. Es sei nun gezeigt,
dass aber ein skalarer Ansatz f¨
ur χ1
0bereits dem Niveau” der Kerker-Pr¨
akonditionierung
bei J1entspricht, in dem Sinne, dass aus (4.56) eine skalare Gestalt von χ1
0folgt. Daf¨
ur
wird eine Relation zwischen Jund χ0ben¨
otigt. Sie ist im reziproken Raum n¨
aherungsweise
durch
J(G,G) = δGGχ0(G,G)vCoul(G) (4.57)
gegeben, wobei vCoul das Coulomb-Potential ist [139,143].13,14 Benutzt man nun hier f¨
ur
Jdie diagonale N¨
aherung K1mit A= 1, also
δGG
G2+G2
0
G2
!
=δGGχ0(G,G)vCoul(G),(4.58)
13Vgl. auch [134,146,147,148]. Dort wird die Beziehung zwischen der dielektrischen Matrix ǫund der
linearen Antwort diskutiert. Analog zu Jbeim Mischen von Ladungsdichten ist ǫdie Jakobi-Determinante
beim Mischen von Potentialen. Die dort angestellten ¨
Uberlegungen k¨
onnen aber direkt auf die Herleitung
von (4.57)¨
ubertragen werden, indem man n¨
amlich die Rollen von Ladungsdichte und effektivem Kohn-
Sham-Potential vertauscht.
14An (4.57) wird auch klar, dass Jim Allgemeinen keine symmetrische/hermitesche Matrix ist (vgl.
Abschnitt 4.3.1), weil das hermetische χ0hier noch mit dem Coulomb-Potential multipliziert wird.
11
x
2
xv:v rlD-=
ij
ij
Arr DDDD=:
å
-
+-=
-
-= 1
1
1
:
m
nmj
jiji Aba
å
-
+-=
+DD-D×+D-= 1
1
xx
1
x)v(v:v
m
nmi
ii
i
mmm rlarl
m
rD
mj
j
brr DDD=:
{ }
1
x
2
x
1
xv,,v,v -+-+- DDD mnmnm
K
{ }
121 ,,, -+-+- DDDDDD mnmnm rrr K
11 :-- D-D=DD mmm rrr
1
xx
1
xvv:v -- -=D mmm
DifferenzenimSpeicherhalten:
Start:
1.Iteration:einfachesMixen
zurnächstenIteration Diff.imPotential
Diff.inderinduz.Dichte
optimaleKoeffizienten
neuesPotential
Berechnungderneueninduz.Dichte
außerhalbdesPulay-Mixers
(var.EXX-Verfahren)
1+¬ mm
1
x
v
1
rD
m
x
v
Zwischenergebnisse()
mji <,
Pulay-Mixing
(Potential/induz.Dichte)
Flussdiagramm 4.4: Pulay-Mixing von Austauschpotential und induzierter Ladungsdichte im variationellen EXX-Verfahren. Der erste Schritt entspricht dem
einfachen Mixing (4.41), ab dem zweiten wird der Verlauf der bisherigen Ergebnisse bis zu maximal nSchritten r¨
uckw¨
arts ber¨
ucksichtigt. In jeder Iteration
wird außer dem aktuellen vm
xauch das zugeh¨
orige ρm(Residuum) ben¨
otigt, dessen Berechnung außerhalb des Mixers erfolgt (gestrichelte Linien, vgl. innere
Schleife in Flussdiagramm 4.5).
77
78 4 Implementierung
folgt zun¨
achst, dass χ0in dieser Darstellung ebenfalls diagonal sein muss. Mit der Fou-
rierentwicklung des Coulomb-Potentials (A.1) gilt dann f¨
ur die Diagonalelemente
G2+G2
0
G2= 1 χ0(G,G)4π
G2(4.59)
oder ¨
aquivalent dazu
χ0(G,G) = G2
0
4π=const. (4.60)
In dieser Arbeit wurde daher sowohl beim einfachen als auch beim Pulay-Mixing ein
skalarer Parameter benutzt, d.h., es wurden (4.41) und (4.44) ohne weitere Modifikationen
verwendet. Empirisch zeigte sich, dass dabei Werte zwischen 0.01 und 0.04 eine gute Wahl
f¨
ur λsind. Einsetzen des oben genannten Wertes f¨
ur G0in atomaren Einheiten liefert
λ0.06, f¨
uhrt also auf eine vergleichbare Gr¨
oßenordnung.
4.4 Der nicht-lokale Austauschoperator in ebenen Wellen
Notwendig f¨
ur die Entwicklung eines EXX-Codes sowohl nach der Standard-Methode (Ab-
schnitt 1.6.1) wie auch nach der variationellen Methode (Kapitel 2) ist die Implementierung
des nicht-lokalen Austauschoperators (1.27). Seine numerische Handhabung ist allerdings
mit zwei Schwierigkeiten verbunden: (i) die Berechnung der Singularit¨
at im Nenner und
(ii) die Symmetrisierung, wenn mit einem reduzierten k-Punkt-Satz gearbeitet werden
soll. In der Tat wird sich der Operator als die gegenw¨
artig zeitaufwendigste Gr¨
oße im
Algorithmus des variationellen EXX-Verfahrens erweisen, vgl. Kapitel 5.
In dieser Arbeit wurde die Berechnung des Austauschoperators in der Ebene-Wellen-
Basis ausgef¨
uhrt, dabei wurde auf eine bereits im Rahmen eines fr¨
uheren Projekts (der
Implementierung des Standard-EXX-Verfahrens in S/PHI/nX [81,82]) angefertigte Rea-
lisierung zur¨
uckgegriffen. Allerdings legen unten angestellte ¨
Uberlegungen die Vermutung
nahe, dass eine Auswertung im Ortsraum die g¨
unstigere Alternative sein k¨
onnte. Es w¨
are
daher interessant, in einem zuk¨
unftigen Projekt das variationelle EXX-Verfahren mit einer
Ortsraumdarstellung des nicht-lokalen Austauschoperators zu kombinieren.
4.4.1 Behandlung der Singularit¨
at
Im reziproken Raum wird die Austauschwechselwirkung eines spin-kompensierten Systems
n¨
aherungsweise durch einen Satz nicht-lokaler Ausdr¨
ucke der Form
ˆ
VFock(k,G,G) = 4π
occ
X
n,qX
G
cnq(G+G′′)c
nq(G+G′′)
|kqG′′|2(4.61)
beschrieben [52,98], wie in Anhang A.2 explizit vorgef¨
uhrt ist. Sie sind, ¨
ahnlich wie die
kinetische Energie in (3.15), jeweils f¨
ur einen festen Punkt kin der Brillouin-Zone (BZ)
erkl¨
art.
In der Summe treten dabei integrable Polstellen 2. Ordnung auf, wenn kqein rezi-
proker Gittervektor ist. Deshalb kann die Summation nicht ohne Weiteres mit Hilfe von
wenigen, diskreten Punkten in der BZ ausgef¨
uhrt werden, wie es etwa bei der Ladungs-
dichte m¨
oglich ist (vgl. Abschnitt 3.2). Eine L¨
osung dieses Problems wurde von Gygi und
Baldereschi [98] vorgeschlagen. Durch Einf¨
uhrung einer Hilfsfunktion Fwird die numeri-
sche Integration dabei an den Polstellen durch eine exakte Integration ersetzt.
4.4 Der nicht-lokale Austauschoperator in ebenen Wellen 79
1 4 710 13 16 19 22 25 28
Iteration (innere Schleife)
10-6
10-5
10-4
10-3
10-2
||∆ρ||2
einfach
Pulay (n=2)
Pulay (n=5)
Pulay (n=20)
Abbildung 4.6: Minimierung der induzierten Ladungsdichte in GaAs. Gegen¨
uber dem einfachen Mi-
xer (4.41) l¨
asst sich mit dem Pulay-Ansatz (4.44) eine deutlich schnellere Konvergenz erreichen. Das
optimale vopt
xwurde dabei jeweils aus einer Linearkombination der letzten nIterationen bestimmt. Da
der Pulay-Mixer f¨
ur n= 1 in den einfachen ¨
ubergeht, stimmen alle Kurven im ersten Schritt ¨
uberein.
Startpotential war das LDA-Austauschpotential. F¨
ur die Ladungsdichte wurde (4.33) benutzt, d.h., es
wurde nur die explizite vx-Abh¨
angigkeit ber¨
ucksichtigt. In Flussdiagramm 4.5 entspricht dies der inne-
ren Schleife. Da der Grenzwert der induzierten Ladungsdichte ja exakt bekannt ist, n¨
amlich ρ0,
ließ sich hier im Gegensatz etwa zu Abb. 4.5, wo nur die Differenz zum besten erreichten Wert
aufgetragen werden kann der tats¨
achliche Fehler in jedem Schritt angegeben. Die obige Kurve strebt
einem S¨
attigungswert zu oder konvergiert zumindest nach einer gewissen Zeit sehr langsam; dann ist
offensichtlich die Grenze der numerischen Genauigkeit erreicht.
F¨
ur festes kseien also q0,G0so, dass der Integrand in (4.61) singul¨
ar wird: q0=
kG0. Wegen (A.5) ist die Singularit¨
at damit f¨
ur qq0asymptotisch durch
cn,kG0(G+G0)c
n,kG0(G+G0)
|kqG0|2=cn,k(G)c
n,k(G)
|kqG0|2(4.62)
gegeben. Dies kann f¨
ur qq0wiederum durch cn,k(G)c
n,k(G)F(p) angen¨
ahert werden,
wenn F(p) bei p0 die gleiche Asymptotik wie 1/p2besitzt. Fordert man zus¨
atzlich,
dass Fim reziproken Gitter (3.2) periodisch ist, l¨
asst sich damit zu (4.61) folgendermaßen
eine geschickte Null” hinzuf¨
ugen:
ˆ
VFock(k,G,G) = (4.63)
4π
X
n"X
q
X
G
cnq(G+G′′)c
nq(G+G′′)
|kqG′′|2cn,k(G)c
n,k(G)F(kq)!
+cn,k(G)c
n,k(G)X
q
F(kq)#.
Hier heben sich die Singularit¨
aten in den großen runden Klammern gerade auf. Alle Terme,
bei denen kqein reziproker Gittervektor ist, werden also ausgelassen, was durch den
Strich an der ersten Summe ¨
uber qangedeutet ist. Im Argument von Fkonnte der jeweils
kritische G′′-Vektor wegen der vorausgesetzten Periodizit¨
at weggelassen werden. Ebenfalls
80 4 Implementierung
auf Grund der Periodizit¨
at von Fist die zweite Summe ¨
uber qunabh¨
angig von k. Dort
kann Fdaher durch den mittleren Wert /(2π)3RBZ F(p) d3pin der BZ ersetzt werden,
falls das Integral bekannt ist.
Die Gestalt der Hilfsfunktion und ihr Integral h¨
angen von der Struktur des betrachteten
Systems ab. In Ref. 98 findet man indes beides nur f¨
ur den Fall der kubisch-fl¨
achenzentrier-
ten Gitterstruktur (fcc) angegeben. Offensichtlich aus diesem Grund sind EXX-Berechnun-
gen periodischer Systeme15 bis 2005 nur f¨
ur diese Struktur ver¨
offentlicht worden. Wenzien,
Cappellini und Bechstedt leiteten jedoch entsprechende Hilfsfunktionen auch f¨
ur einfach-
kubische (sc), kubisch-innenzentrierte (bcc), hexagonale sowie f¨
ur einfach-orthorhombische
Bravaisgitter ab [99]. Die ben¨
otigten Integrale liegen allerdings nur f¨
ur die kubischen Gitter
in analytisch-geschlossener Form vor. F¨
ur den hexagonalen Fall wurde daher das Ergeb-
nis einer numerischen Integration in Ref. 99 tabelliert als Funktion I(c/a) verschiedener
Verh¨
altnisse der Gitterkonstanten angegeben. Hier sei auf einen Druckfehler hingewiesen:
Die erste Spalte von Tabelle II genannter Referenz listet c/a in Einheiten von p2/3 auf.
Irrt¨
umlich wurde aber der Kehrwert angegeben. Da Idort nur f¨
ur wenige Seitenverh¨
alt-
nisse gegeben ist und sich besonders bei kleinen Werten c/a nur schwer linear approxi-
mieren l¨
asst, wurde die Tabelle f¨
ur die vorliegende Arbeit noch einmal neu und etwas
feinmaschiger berechnet. Zus¨
atzlich wurden die Integrale auch f¨
ur den tetragonalen Fall
(einfach-orthorhombisch mit a=b) ausgewertet. Die Ergebnisse zeigt Tab. 4.1.
Die Methode wurde im Rahmen dieser Arbeit f¨
ur alle oben genannten Bravaisgitter16
in den Code S/PHI/nX [81,82] implementiert. Dadurch konnten beispielsweise erstmals
EXX- und darauf aufbauende EXX+G0W0-Berechnungen von GaN und InN in der ge-
gen¨
uber der Zinkblende-Struktur stabileren und daher technologisch relevanteren Wurtzit-
Phase erm¨
oglicht werden [172].
4.4.2 Symmetrisierung
Die zweite Schwierigkeit bei der Berechnung des Austauschoperators betrifft die Sym-
metrisierung, die sich im Vergleich mit der einer lokalen Gr¨
oße wie der Dichte (vgl. Ab-
schnitt 3.2) sehr aufwendig gestaltet. Wird in (4.61) die Summation ¨
uber qin eine Summe
¨
uber einen irreduziblen Bereich der BZ sowie einer weiteren ¨
uber alle Punkttransforma-
tionen aufgespalten, ergibt sich, wie in (A.8) gezeigt,
ˆ
VFock(k,G,G) = 4π
occ
X
n
Nred
X
s=1
NPS
X
i=1 X
G
ws
cn,qs(S1
iG+G′′)c
n,qs(S1
iG+G′′)
|S1
ikqsG′′|2.(4.64)
Hier ist Nred die Anzahl der Punkte qsim irreduziblen Bereich der BZ mit den zugeh¨
origen
Wichtungen ws, und NPS bezeichnet die Anzahl der Punkttransformationen Si. Die nume-
rische Auswertung dieses Ausdrucks wird durch dessen Abh¨
angigkeit von kerschwert. Zum
einen kommt dadurch eine Symmetrieoperation im Nenner ins Spiel. W¨
are dies nicht der
Fall, ließe sich zun¨
achst ohne Einbeziehung der Symmetrien eine Matrix ˆ
Vunsym
Fock (k,G,G)
konstruieren, die nur durch Umordnung ihrer Eintr¨
age (Ganzzahlarithmetik) und eine an-
schließende Summation symmetrisiert werden k¨
onnte sehr ¨
ahnlich, wie in (3.12) die
symmetrisierte Dichte aus der unsymmetrisierten gewonnen wird. Zum anderen aber muss
15F¨
ur radialsymmetrische Systeme wurde die EXX-Methode unter der Bezeichnung OEP bereits seit
1976 angewandt, vgl. Abschnitt 1.6.2.
16F¨
ur das orthorhombische Gitter wurde allerdings nur der tetragonale Spezialfall ber¨
ucksichtigt. Eine
Verallgemeinerung w¨
are jedoch nicht schwer zu implementieren; die Integrale h¨
angen dann jeweils von zwei
Seitenverh¨
altnissen, z.B. b/a und c/a, ab.
4.5 Variationelles EXX als selbstkonsistenter Zyklus 81
hexagonal tetragonal
c/a I(c/a)c/a I(c/a)
in Einh. p2/3 in Einh. (a/2π)3in Einh. 1 in Einh. (a/2π)3
0 0 0 0
0.25 2.41198 0.25 3.04513
0.5 4.6399 0.5 5.77592
1 8.1361 1 9.8293
1.5 10.502 1.5 12.5214
2 12.4069 2 14.4238
3 14.8682 3 17.2456
4 16.4539 4 19.27
5 17.6677 5 20.436
6 18.7455 6 21.9869
7 19.8621 7 22.6149
8 20.4293 8 23.4241
10 21.7925 10 24.956
12 22.548 12 26.3131
24 26.4598 24 30.5836
Tabelle 4.1: Integrale der Hilfsfunktion ¨
uber die Brillouin-Zone f¨
ur verschiedene Verh¨
atnisse c/a der
Gitterkonstanten im hexagonalen und tetragonalen Bravaisgitter (vgl. Abschnitt 4.4.1). Die entspre-
chenden Hilfsfunktionen Fsind Referenz 99 entnommen. Im tetragonalen Fall wurden in der dort
angegebenen Funktion des orthorhombischen Gitters die Gitterkonstanten aund bgleichgesetzt.
(4.64) f¨
ur jeden der Nred Punkte aus dem reduzierten k-Punkt-Satz seperat ausgerech-
net werden. Die Gr¨
oße skaliert damit ¨
außerst ung¨
unstig: bestehen die |G+ki-Basen je-
weils aus etwa mebenen Wellen, ist der erforderliche zeitliche Aufwand insgesamt durch
NredNPSnvalm3gegeben (nval : Anzahl der Valenzb¨
ander).
Demgegen¨
uber k¨
onnte die Symmetrisierung des Operators im Ortsraum numerisch
einfacher zu gelingen, denn aus (1.27) folgt (f¨
ur ein spin-kompensiertes System) mit den
selben Bezeichnungen wie oben
VFock(r,r) =
occ
X
n
Nred
X
s=1
NPS
X
i=1
ws
ψn,qs(S1
ir)ψ
n,qs(S1
ir)
|rr|.(4.65)
Die Vorteile dieser Formulierung sind: (i) Es muss nur noch eine Matrix berechnet werden.
(ii) Wegen |rr|=|S1
irS1
ir|l¨
asst sich im Gegensatz zur Darstellung im reziproken
Raum zun¨
achst durch Weglassen der Summe ¨
uber die Sieine unsymmetrisierte Version
Vunsym
Fock (r,r) konstruieren, die anschließend durch Umordnen ihrer Eintr¨
age symmetrisiert
werden kann. (iii) Es entf¨
allt die durch die Fourier-Entwicklung ins Spiel gekommene
Faltung (Summe ¨
uber G′′ in (4.64)).
4.5 Variationelles EXX als selbstkonsistenter Zyklus
Nachdem in den vorangehenden Abschnitten alle f¨
ur die numerische Implementierung der
variationellen EXX-Methode notwendigen Einzelschritte vorgestellt wurden, k¨
onnen sie
jetzt zusammengef¨
ugt werden. Flussdiagramm 4.5 gibt schematisch einen ¨
Uberblick ¨
uber
den Programmablauf, wie er in dieser Arbeit realisiert wurde. Er besteht aus mehreren, in-
einander verschachtelten Iterationszyklen, deren Funktion und Zusammenspiel direkt aus
82 4 Implementierung
den einleitenden ¨
Uberlegungen von Abschnitt 4.3 folgt. Dort wurde diskutiert, dass die
induzierte Ladungsdichte ρentweder (i) mit festgehaltenen Kohn-Sham-Orbitalen ψ0
ier-
folgen kann dies liefert das EXX-Potential der zu diesen ψ0
igeh¨
origen Ladungsdichte
oder aber (ii) mit einer Aktualisierung der Orbitale dann erh¨
alt man das EXX-Poten-
tial der Grundzustandsladungsdichte ρ0. Da man gew¨
ohnlich an Letzterem interessiert ist,
k¨
onnte man nun direkt Strategie (ii) verfolgen: sie ist in Diagramm 4.5 gegeben, wenn die
mit () markierte Querverbindung nicht benutzt wird (d.h., es wird dort s= 1 gesetzt).
Im Prinzip w¨
urde der Algorithmus so bereits funktionieren. Er besteht dann aus folgenden
Schritten:
(1) Vorgabe eines geeigneten Start-Austauschpotentials v(0)
x, etwa aus einer vorangehen-
den LDA- oder GGA-Rechnung (Abschnitt 1.5.2).
(2) Berechnung der Wellenfunktionen ψ0,(m)
idurch L¨
osen der Kohn-Sham-Gleichung zu
festgehaltenem Probe-Austauschpotential v(m)
x(Gleichung (4.36)).
(3) Berechnen des nicht-lokalen Austauschoperators V(m)
Fock aus den ψ0,(m)
i(Abschnitt 4.4).
(4) Erzeugen des St¨
oroperators H(m)
1:= V(m)
Fock v(m)
x.
(5) L¨
osen der Sternheimer-Gleichung mit Hilfe eines geeigneten Minimierungsverfahrens
(Abschnitt 4.1), um die linearen Korrekturen ψ1,(m)
izu erhalten.
(6) Berechnen der induzierten Ladungsdichte ρ(m)aus den Orbitalen ψ0,(m)
iund den
Korrekturen ψ1,(m)
i(Abschnitt 4.2).
(7) Erzeugen des neuen Probe-Austauschpotentials v(m+1)
xdurch einfaches Mischen oder
Pulay-Mischen von ρ(m)und v(m)
x(Abschnitt 4.3).
(8) Wiederholen der Schritte (2) (7) solange, bis Selbstkonsistenz erreicht ist.
Die Schritte (2) und (5) sind dabei selbst iterative Zyklen. Es sei auch noch einmal be-
tont, dass Punkt (2) nur die L¨
osung der Kohn-Sham-Gleichung zu einem fest vorgegebenen
Probe-Austauschpotential beinhaltet und folglich nicht aufwendiger ist als eine gew¨
ohn-
liche LDA-Kalkulation. Es zeigt sich jedoch im Folgenden, dass es technisch viel g¨
unsti-
ger ist, auch bei der Berechnung von vEXX[ρ0] so viel wie m¨
oglich auf die Minimierung
gem¨
(i) zur¨
uckzugreifen.
4.5.1 Optimierung des Algorithmus
Auf Grund der schlechten Skalierung des Austauschoperators in Abh¨
angigkeit von der
Gr¨
oße des Basissatzes (vgl. Abschnitt 4.4.2 und Tabelle 5.1) w¨
are eine Implementierung
der variationellen EXX-Methode gem¨
der obigen Punkte (1) (8), wobei in jedem Itera-
tionszyklus der Austauschoperator neu generiert w¨
urde, nicht effizient. Der Aufwand kann
aber auf einfache Weise erheblich reduziert werden: Die Idee ist, nicht f¨
ur jede Aktuali-
sierung v(m)
xdes lokalen Austauschpotentials die Wellenfunktionen neu zu berechnen und
damit anschließend die teure Aktualisierung von VFock durchzuf¨
uhren, sondern dies erst
dann zu tun, wenn vxan die aktuell gegebenen Orbitale hinreichend angepasst ist. Mit
anderen Worten: man minimiert zun¨
achst ρ,ohne die Abh¨
angigkeit der Orbitale von vx
zu ber¨
ucksichtigen, verf¨
ahrt also genau wie in Punkt (i) des Abschnitts 4.3 beschrieben.
4.5 Variationelles EXX als selbstkonsistenter Zyklus 83
Ansatz(z.B.LDA/GGA)
LDA/GGA
x
)0(
xv:v =
Kohn-Sham-Gleichung
nächsteIteration
nicht-lokales Austauschpotential
Störoperator
LösenderSternheimer-Gleichung
( , ,etc.)Prec.Conj.GradientSteepest-Descent
( ) 0
)(,0)(
1c
)(,1
c
)(,0)(
0=+- m
i
mm
i
m
i
mHPPH yye
å*
=D occ
)(,1)(,0)( )(Re2:
i
m
i
m
i
myyr
induzierteLadungsdichte
)(
x
)(
Fock
)(
1vV: mmm
H-=
}][{V )(,0
Fock
m
i
y
)(,0)(,0)(,0
c
)(
xHext
2][vv][vv
2
1m
i
m
i
m
i
myeyrr =
ú
û
ù
ê
ë
é++++Ñ-
mm ®+1
sm mod0º
Mixing
]v[v:v )(
x
)(
x
)1(
x
mmm rl D-=
+
]v[v:v opt
x
opt
x
)1(
xrl D-=
+m
(einfach)
(Pulay)
d<- -)1(
KS
)(
KS
mm EE
Ende:
][v 0EXX r
nein
ja
ja
nein
innereSchleife
äußereSchleife
(*)
Flussdiagramm 4.5: Schematische Darstellung des varEXX-Algorithmus. Der iterative Prozess besteht
aus vier ineinander verschachtelten Selbstkonsistenzzyklen, die hier durch verschiedene Graustufen her-
vorgehoben sind. In der ¨
außeren Schleife wird die Kohn-Sham-Gleichung (1.52) in EXX-Genauigkeit
gel¨
ost. Da vxnur ¨
uber die Orbitale zug¨
anglich ist, werden diese zun¨
achst in einer Unterentschleife
f¨
ur festes v(m)
xerzeugt und dann nach Berechnung von VFock an eine zweite, innere” Schleife
¨
ubergeben. Dort findet die Minimierung der induzierten Dichte statt, wobei in jedem Schritt noch die
Sternheimer-Gleichung iterativ gel¨
ost wird. Das so erzeugte Austauschpotential dient dann als Start-
punkt der n¨
achsten (¨
außeren) Iteration.
Erst, nachdem dies vollbracht ist,17 werden Wellenfunktionen, nicht-lokaler Austausch-
operator und St¨
oroperator aktualisiert. Solange keine Selbstkonsistenz erreicht ist, sind
diese Gr¨
oßen dann jedoch nicht mehr mit dem zuletzt berechneten vxkonsistent. ρist
daher wieder verschieden von 0 und wird aufs Neue minimiert, nat¨
urlich ebenfalls, ohne
die Orbitale zu aktualisieren. Dieses Vorgehen l¨
asst sich zusammenfassen, indem in obiger
Aufz¨
ahlung Schritt (8) durch die folgenden beiden Schritte ersetzt wird:
(8) Wiederholen der Schritte (4) (7) solange, bis v(m)
xhinreichend (siehe unten) kon-
vergiert ist.
(9) Wiederholen der Schritte (2) (8) solange, bis Selbstkonsistenz erreicht ist.
Durch (8) wird also eine weitere Unterschleife (im Folgenden innere Schleife” genannt)
17In der Praxis muss die Minimierung von ρdabei nicht bis an die Grenze der numerischen Genauigkeit
erfolgen, da dies insgesamt nicht zu einer schnelleren Konvergenz f¨
uhrt (siehe unten).
84 4 Implementierung
0 1 2 3 4 5678 9 10
Iteration (äußere Schleife)
10-6
10-5
10-4
10-3
10-2
||∆ρ||2
einfach
Pulay (n=5)
0 1 2 3 4
Iteration (äußere Schleife)
10-6
10-5
10-4
10-3
10-2
||∆ρ||2
0 30 60 90 120
Iteration (innere Schleife)
innere Schleife
äußere Schleife
innere Schleifen:
Abbildung 4.7: Links: Minimierung der induzierten Ladungsdichte in GaAs gem¨
der ¨
außeren Schleife
in Flussdiagramm 4.5. Die f¨
ur jeden Einzelschritt ben¨
otigte Minimierung von ρgem¨
der inneren
Schleife (vgl. Abb. 4.6) erfolgte dabei mittels einfachem Mixing (durchgezogene Linie) oder mit dem
Pulay-Verfahren (gestrichelte Linie). Letzteres ist hier bereits nach 3 Iterationen bis zur Grenze der
numerischen Genauigkeit konvergiert. Rechts: Norm der induzierten Ladungsdichte ρin Abh¨
angigkeit
von allen Aktualisierungen des Austauschpotentials vx. Nach jeder Minimierung von kρkin der inne-
ren Schleife (hier jeweils 30 Schritte) werden die Wellenfunktionen an vxangepasst (¨
außere Schleife).
Dadurch springt kρkzu Beginn jeder ¨
außeren Schleife wieder nach oben, mit zunehmder Selbstkonsis-
tenz verschwinden diese Ausschl¨
age jedoch. Zum Konvergenzverhalten der beiden Kurven vgl. Abb. 4.6.
in den Gesamtzyklus (im Folgenden als ¨
außere Schleife” bezeichnet) eingef¨
ugt. In Dia-
gramm 4.5 wird dies durch Einschalten der Querverbindung () erreicht, wobei sdie
Anzahl der f¨
ur (8) ben¨
otigten Schritte ist. Bei den in dieser Arbeit untersuchten Mate-
rialien stellt 10 s30 eine geeignete Wahl dar. In Abbildung 4.7 ist die Abh¨
angigkeit
der (Norm der) induzierten Dichte von der Iteration der inneren bzw. ¨
außeren Schleife
illustriert. Tats¨
achlich braucht in (8) nicht stets bis an die Grenze der numerischen Ge-
nauigkeit konvergiert zu werden; da die Konsistenz aller beteiligten Gr¨
oßen mit jedem
¨
außeren Schritt zunimmt, verbleibt in den jeweiligen Unterschritten n¨
amlich immer weni-
ger zu tun”. Anders formuliert: mit der Zeit werden die Vorgaben f¨
ur die Unterzyklen so
gut, dass die Konvergenz dort schnell erreicht ist. Dies gilt insbesondere auch f¨
ur die Stern-
heimer-Gleichung, die sich innerhalb der inneren Schleife befindet und deshalb in jedem
und nicht nur in jedem s-ten Schritt gel¨
ost werden muss. Dazu benutzt man sinnvol-
lerweise als Ansatz f¨
ur die Korrekturfunktionen ψ1,(m)
idas Ergebnis der jeweils vorange-
henden Iteration ψ1,(m1)
i.¨
Ahliches gilt auch f¨
ur die Ansatzfunktion des EXX-Potentials
selbst; zwar erwies sich der Algorithmus wie an GaAs, GaN und InN getestet auch
f¨
ur das Startpotential v(0)
x= 0 als stabil, aber effizienter ist es nat¨
urlich, bereits von einem
N¨
ahrungsansatz wie etwa LDA oder GGA aus zu starten.
Obwohl durch die Einf¨
uhrung der innere Schleife” die Anzahl notwendiger Aktuali-
sierungen des nicht-lokalen Austauschoperators schon stark reduziert werden konnte, ist
es dennoch sinnvoll, noch nach weiteren M¨
oglichkeiten zu suchen, den mit VFock verbun-
denen Aufwand zu vermindern. So l¨
asst sich beispielsweise auszunutzen, dass VFock nur
ben¨
otigt wird, um die linearen Korrekturfunktionen der Valenzbandorbitale zu berech-
nen. Wie Hybertsen und Louie diskutieren [176], ben¨
otigt man zu deren Beschreibung
aber weit weniger ebene Wellen als f¨
ur die Funktionen des Leitungsbandes. Daher ist es
sinnvoll, f¨
ur VFock eine Extra-Abschneideenergie EFock
cut einzuf¨
uhren, die sich unabh¨
angig
4.5 Variationelles EXX als selbstkonsistenter Zyklus 85
von der Abschneideenergie Ecut des vollen Hamiltonoperators einstellen l¨
asst und kleiner
gew¨
ahlt werden kann. Wie Ecut muss auch EFock
cut letztlich in Konvergenztests bestimmt
werden; in der Regel ist dabei EFock
cut 2/3Ecut ausreichend [168].
Wie in Abschnitt 4.4.2 diskutiert, tr¨
agt auch die Symmetrisierung des Austauschope-
rators erheblich zu dessen schlechter Skalierung bei. Praktisch w¨
are es daher, die Sym-
metrisierung des Operators einfach weglassen zu k¨
onnen. Tats¨
achlich l¨
asst sich nun die
EXX-Methode dahingehend n¨
ahern, dass nur noch das lokale Austauschpotential symme-
trisiert werden muss. Dies soll in Abschnitt 4.6 er¨
ortert werden. Es ist dazu allerdings
hilfreich, sich die Unterschiede sowie die Parallelen zwischen den numerischen Algorith-
men des variationellen EXX-Varfahrens (Flussdiagramm 4.5) und der Standard-Methode
(Abschnitt 1.6.1) genau zu verdeutlichen.
4.5.2 Variationelles und Standard-EXX: Ein Vergleich des Iterations-
prozesses
Im Unterschied zu den Abschnitten 2.2 und 2.3, in denen variationelle und Standard-
Methode rein formal-analytisch miteinander verglichen wurden, soll hier untersucht wer-
den, inwieweit sich der iterative Prozess, also die Entwicklung von der Ansatzfunktion v(0)
x
bis zum auskonvergierten EXX-Potential, bei beiden Methoden unterscheidet. Die Kennt-
nis der Gemeinsamkeiten kann besonders beim Programmieren n¨
utzlich sein, wenn eines
der Verfahren bereits im Code vorhanden ist.
Grob umrissen basiert der Algorithmus der Standard-Methode (stEXX) auf folgenden
Punkten:
(1a) Vorgabe eines geeigneten Start-Austauschpotentials v(0)
x, etwa aus einer vorangehen-
den LDA- oder GGA-Rechnung (Abschnitt 1.5.2).
(2a) Selbstkonsistentes L¨
osen der Kohn-Sham-Gleichung zu festgehaltenem Probe-Au-
stauschpotential v(m)
x(Gleichung (4.36)).
(3a) Vollst¨
andige Diagonalisierung der Hamilton-Matrix (Kohn-Sham-Matrix), um auch
die unbesetzten Zust¨
ande zu erhalten.
(4a) Berechnen des nicht-lokalen Austausch-Operators V(m)
Fock, der Greenschen Funktio-
nen G(m)
iund der (Inversen der) linearen Antwort χ(m)
0.
(5a) Berechnen der von V(m)
Fock induzierten Ladungsdichte ρ(m)
Fock mit Hilfe der Greenschen
Funktionen (eckige Klammer in Gleichung (1.94)).
(6a) Erzeugen des neuen Probe-Austauschpotentials v(m+1)
xdurch Anwenden von (χ(m)
0)1
auf ρ(m)
Fock (Gleichung (1.94)).
(7a) Wiederholen der Schritte (2a) (6a) solange, bis Selbstkonsistenz erreicht ist.
Um die folgende Gegen¨
uberstellung mit dem oben (Seiten 82/83) beschrieben Ablauf der
variationellen Methode (varEXX) zu erleichtern, sind die stEXX-Schritte mit hier einem
a” markiert.
Sei nun beiden Methoden ein gleiches Startpotential v(0)
xvorgegeben und zun¨
achst der
nullte” Durchlauf (also m= 0) betrachtet. Damit sind auch die in den varEXX-Schritten
(1) (3) bzw. den stEXX-Schritten (1a) (4a) berechneten unbesetzten Zust¨
ande ψ0,(0)
i
86 4 Implementierung
und V(0)
Fock v¨
ollig identisch. Der Unterschied besteht bis jetzt also lediglich darin, dass in
stEXX eine Reihe (teurer) Gr¨
oßen zus¨
atzlich berechnet wird: unbesetzte Zust¨
ande durch
Diagonalisierung der Kohn-Sham-Matrix, die Greensche Funktion sowie die lineare Ant-
wort und deren Inverse.
Anschließend wird nun sowohl in varEXX (4) (6) als auch in stEXX (5a) eine li-
neare Dichte¨
anderung betrachtet ab hier allerdings unterscheiden sich die Berechnun-
gen: W¨
ahrend bei varEXX die ¨
Anderung durch den Operator H1:= VFock vxindu-
ziert wird, ist die St¨
orung bei stEXX durch VFock allein gegeben (vgl. die Bemerkungen
nach Gleichung (1.94)). Noch gr¨
oßer die Unterschiede bei der Aktualisierung des Aus-
tauschpotentials: varEXX erzeugt v(1)
xdurch Mixen von ρ(0) und v(1)
x, stEXX hingegen
durch Multiplizieren von ρ(0)
Fock mit (χ(0)
0)1. Tats¨
achlich weichen die in (7) bzw. (6a)
generierten Austauschpotentiale v(1)
xim Allgemeinen stark voneinander ab, und auf den
ersten Blick scheinen damit auch alle weiteren Iterationen bis zum Erreichen der Selbst-
konsistenz nicht mehr miteinander vergleichbar zu sein. Durch die in (8) eigentlich zur
Optimierung der varEXX-Methode eingef¨
uhrte innere Schleife” ist dies aber dennoch
m¨
oglich: Da die stEXX-Schritte (5a) und (6a) der Auswertung der EXX-Gleichung (1.94)
entsprechen, gilt dort v(1)
x=vEXX[ρ(0)], d.h., es wird das exakte Austauschpotential der
zu den ψ0,(0)
igeh¨
orenden Dichte ρ(0) erzeugt. Nun sei andererseits die innere Schleife
des varEXX-Algorithmus betrachtet: Hier wird, ebenfalls ausgehend von den ψ0,(0)
i, die
induzierte Dichte minimiert, ohne zwischenzeitlich die Wellenfunktionen zu aktualisie-
ren. Auch dies f¨
uhrt aber gem¨
Punkt (i) der Einleitung von Abschnitt 4.3 gerade auf
vEXX[ρ(0)]. L¨
asst man die innere Schleife also vollst¨
andig auskonvergieren, wird auf diese
Weise das stEXX-Verfahren wieder eingeholt”. Somit startet der n¨
achste Durchlauf, be-
ginnend in (2) bzw. (2a), in beiden Verfahren wiederum vom gleichen Ausgangs-Potential
und alle weiteren ebenso. Es l¨
asst sich also zusammenfassen: Die Aktualisierungen des
lokalen Austausch-Potentials im stEXX-Verfahren entsprechen jenen der ¨
außeren Schleife
im varEXX-Verfahren.
Die ¨
Aquivalenz beider Methoden geht damit ¨
uber das in Abschnitt 2.2 Gezeigte hinaus:
Dort wurde streng genommen nur die ¨
Aquivalenz der Formulierungen f¨
ur irgendeine
feste Dichte, die nicht notwendigerweise die Grundzustandsladungsdichte18 des betrachte-
ten Systems ist, bewiesen. In stEXX und varEXX wird aber nicht nur das EXX-Potential
einer Dichte berechnet, sondern zugleich die Kohn-Sham-Gleichung 1.52 selbstkonsistent
gel¨
ost. Dass dies, trotz aller technischen Verschiedenheit im Umgang mit dem Austausch-
potential, auf ganz analoge Weise geschieht, wurde hier gezeigt. Die Kenntnis der Analogi-
en zwischen beiden Methoden wird nun im folgenden Abschnitt benutzt, um eine zun¨
achst
f¨
ur die Standard-Methode formulierte N¨
aherung bei der Behandlung der Symmetrien auch
auf die variationelle Formulierung ¨
ubertragen zu k¨
onnen.
4.6 Symmetriegen¨
aherte EXX-Methode
Die Hauptschwierigkeit dieser Arbeit bestand darin, dass w¨
ahrend der Implementierung
der variationellen EXX-Methode in S/PHI/nX [81,82] zun¨
achst auf Teile (insbesondere
den nicht-lokalen Austauschoperator) des bereits zuvor in diesen Code implementierten
Standard-EXX-Verfahrens zur¨
uckgegriffen wurde, wobei allerdings nicht bekannt war, dass
es sich bei dessen Realisierung um eine sehr effektive N¨
aherung handelte. Diese N¨
aherung
18Sie ist aber durch die vorausgesetzte v-Darstellbarkeit und die Hohenberg-Kohn-Theoreme ein-
eindeutig einem Satz Wellenfunktionen zugeordnet.
4.6 Symmetriegen¨
aherte EXX-Methode 87
besteht darin, alle im Formalismus auftretenden Brillouin-Zonen-Integrationen nur ¨
uber
dem irreduziblen Bereich der Brillouin-Zone auszuf¨
uhren, ohne sie im Anschluss daran
zu symmetrisieren. Symmetrisiert wird dann einzig das daraus resultierende lokale Aus-
tauschpotential. Daher sei diese Vorgehensweise im Folgenden als symmetriegen¨
aherte
EXX-Methode” bezeichnet.
Tats¨
achlich ist die so erreichte Reduktion der ben¨
otigten CPU-Zeit enorm, was vor
allem auf die Vereinfachungen bei der Auswertung des nicht-linearen Austauschoperators
zur¨
uckzuf¨
uhren ist: Wird etwa die Integration ¨
uber die Brillouin-Zone einer Zinkblende-
Struktur mit Hilfe einer (4 ×4×4)-Zerlegung nach Monkhorst und Pack [96] ausgef¨
uhrt,
so ben¨
otigt man bei Weglassen der Summe ¨
uber die Symmetrien Siin Ausdruck (4.64) nur
rund 4% der Zeit, die bei voller Symmetrisierung des nicht-linearen Austauschoperators
erforderlich w¨
are. Streng formal l¨
asst sich diese N¨
aherung allerdings nicht begr¨
unden, ihre
Rechtfertigung liegt vielmehr in der empirisch gefundenen guten ¨
Ubereinstimmung der
so berechneten Bandl¨
ucken mit den Resultaten einer exakten Rechnung (Abweichungen
kleiner als wenige Zehntel eV, vgl. Tab. 4.2). In gewisser Weise ist die Situation somit ¨
ahn-
lich wie beim LDA-Funktional: auch dessen Erfolg konnte aus dem zu Grunde liegenden
ad-hoc-Modell (Abschnitt 1.5.2) kaum begr¨
undet werden und musste daher zun¨
achst19 als
eine praktische Erfahrungstatsache gewertet werden.
Die Idee der symmetriegen¨
aherten EXX-Methode basiert auf einer Modifikation der
f¨
ur periodische Randbedingungen formulierten EXX-Gleichung (1.94) und sei deshalb zu-
erst f¨
ur das Standard-EXX-Verfahren beschrieben (Abschnitt 4.6.2). Da eine komplette
Symmetrisierung des nicht-lokalen Austauschoperators aber auch die Anwendungsm¨
oglich-
keiten des variationellen Ansatzes stark beschr¨
ankt (VFock erweist sich als die Engstelle
im variationellen EXX-Verfahren, vgl. Kapitel 5), ist es lohnenswert, die N¨
aherung auch
hierauf zu ¨
ubertragen (Abschnitt 4.6.3). Zuvor jedoch scheint es hilfreich, die Gleichungen
einmal explizit so aufzuschreiben, wie sie sich bei exakter Symmetrisierung ergeben (n¨
ach-
ster Abschnitt). Zur Vereinfachung wird dazu im Folgenden ein nicht spin-polarisierter
Halbleiter oder Isolator vorausgesetzt.
4.6.1 Exakte Symmetrisierung beim Standard-EXX-Verfahren
Formuliert man Gleichung (1.94) speziell f¨
ur periodische Randbedigungen und spaltet
dabei gem¨
Abschnitt 3.2 alle Brillouin-Zonen-Integrale auf in eine Summe ¨
uber den
reduzierten k-Punkt-Satz {k1,...,kNred }und eine zweite Summe ¨
uber die Punkttransfor-
mationen {S1,...,SNPS }im reziproken Raum (die von den r¨
aumlichen Punkttransforma-
tionen unabh¨
angige Zeitumkehrsymmetrie (3.7) sei also darin enthalten), erh¨
alt man
vx[ρ](r) = Zd3rχ1
0(r,r) ρFock(r) (4.66)
=Zd3rNPS
X
ν=1
Nred
X
s=1
wsχ0
Sνks1
(r,r)NPS
X
ν=1
Nred
X
s=1
wsρFock
Sνks(r).
Hier ist
ρFock(r) := X
k
ρFock
k(r) (4.67)
19Es wurden allerdings sp¨
ater Begr¨
undungen f¨
ur das LDA-Funktional in Form von Erhaltungss¨
atzen
gefunden, vgl. z.B. die Referenzen 5und 149.
88 4 Implementierung
=X
k
occ.
X
i
2Zd3r′′hψ
ik(r)G
ik(r,r′′)VFock[{ψl}]ψik(r′′) + c.c.i
|{z }
=: ρFock
k(r)
mit der in (F.1) definierten Greenschen Funktion G
ikdie vom nicht-lokalen Austauschope-
rator VFock induzierte lineare Dichte¨
anderung (vgl. Abschnitt 1.6.1), und die Summation
¨
uber kwurde in (4.66) dann mit Hilfe der Symmetrisierung” als
ρFock(r) := X
k
ρFock
k(r) =
NPS
X
ν=1
Nred
X
s=1
wsρFock
Sνks(r)
ausgef¨
uhrt. Der Austauschoperator selbst ist dabei durch den Kern
VFock(r,r) :=
occ.
X
i,k
ψik(r)ψ
ik(r)
|rr|=
NPS
X
ν=1
Nred
X
s=1
occ.
X
i
ws
ψi,Sνks(r)ψ
i,Sνks(r)
|rr|(4.68)
gegeben. Ferner wird die lineare Antwort im hier betrachteten Unterraum gitterperiodi-
scher Ladungsdichten und Potentiale zu
χ0(r,r) = X
k
occ.
X
i
unocc.
X
j
2ψ
ik(r)ψjk(r)ψ
jk(r)ψik(r) + ψik(r)ψ
jk(r)ψjk(r)ψ
ik(r)
εikεjk
=X
k
occ.
X
i
unocc.
X
j
4ψ
ik(r)ψjk(r)ψ
jk(r)ψik(r)
εikεjk
|{z }
=: χ0
k(r,r)
,(4.69)
wie den Referenzen 52 und 176 entnommen werden kann. Im letzten Schritt wurde dabei
die Zeitumkehrsymmetrie (3.7) ausgenutzt, was f¨
ur das Folgende entscheidend sein wird.
Der in (4.67) sowie (4.69) auftretende Faktor 2 resultiert aus der Summe ¨
uber den Spin.20
Insgesamt treten in (4.66) also drei Brillouin-Zonen-Integrationen auf in ρFock, in
VFock und in χ0—, die bei exakter Auswertung der Gleichung jeweils unabh¨
angig vonein-
ander ausgef¨
uhrt werden m¨
ussen. Insbesondere muss also jeder dieser Ausdr¨
ucke extra”
symmetrisiert werden, und erst anschließend k¨
onnen sie gem¨
(4.66) zu vxzusammenge-
setzt werden, das selbst nicht mehr symmmetrisiert zu werden braucht.
4.6.2 Symmetriegen¨
ahertes Standard-EXX-Verfahren
Beim symmetriegen¨
aherten EXX wird nun die Auswertung der vorangehenden Gleichun-
gen wie folgt modifiziert: Sowohl in (4.66) als auch in der rechten Seite von (4.68) wird nur
noch die Summe ¨
uber den reduzierten k-Punkt-Satz ber¨
ucksichtigt, die Summation ¨
uber
die Punkttransformationen Sνhingegen entf¨
allt. Im Allgemeinen besitzen aber dann die
Ausdr¨
ucke (4.67) bis (4.69) f¨
ur sich selbst genommen nicht mehr die korrekte Symmetrie,
d.h., sie sind nicht mehr invariant gegen¨
uber den (r¨
aumlichen) Punkttransformationen des
Kristalls. Dies ¨
ubertr¨
agt sich auf das in (4.66) berechnete vx, das deswegen jetzt im
Gegensatz zur exakten Rechnung nachtr¨
aglich symmetrisiert wird. Man beachte, dass
diese Symmetrisierung aber keiner k-Punkt-Summation mehr zugeordnet werden kann; es
20In den Gleichungen (8) und (11) von Ref. 52 wurde dieser Faktor irrt¨
umlicherweise nicht mit angegeben,
im sp¨
ateren Verlauf jedoch implizit ber¨
ucksichtigt.
4.6 Symmetriegen¨
aherte EXX-Methode 89
werden also nur die r¨
aumlichen Punkttransformationen des Bravais-Gitters ber¨
ucksichtigt.
Ein weiteres Problem ist, wie sich gleich zeigen wird, dass das so berechnete vxkomplex-
wertig in der Ortsdarstellung ist. Um zu einem rein reellwertigen Potential zu gelangen,
werden daher die Imagin¨
aranteile abgeschnitten, d.h., k¨
unstlich zu Null gesetzt. Insgesamt
hat man also f¨
unf ¨
Anderungen zur exakten Vorgehensweise:
(i) keine Symmetrisierung von VFock
(ii) keine Symmetrisierung von ρFock
(iii) keine Symmetrisierung von χ0
(iv) Wegschneiden des Imagin¨
aranteils im aus (i) (iii) berechneten vx
(v) Symmetrisierung von vx
Dass die Punkte (i) (iii) nicht nur auf ein r¨
aumlich nicht der Kristallsymmetrie
entsprechendes, sondern auch auf ein komplexwertiges Potential f¨
uhren, folgt aus der
Tatsache, dass das Weglassen der Symmetrisierung in (4.66) und (4.68) auch die In-
versionssymmetrie, also die Zeitumkehrinvarianz (3.7), betrifft. In einer gew¨
ohnlichen”
DFT-Rechnung, in der ein von der Dichte parametrisch abh¨
angendes Austausch-(Korre-
lations-)Potential verwendet wird, kann man die Zeitumkehrsymmetrie bei der Symmetri-
sierung vernachl¨
assigen: wegen |ψi,k|2=|ψi,k|2ist es egal, ob sie in (3.12) explizit mit
einbezogen wird oder nicht, wenn nur die Gewichte wsentsprechend gesetzt werden. Auf
Grund der Orbitalabh¨
angigkeit des EXX-Formalismus ist diese Vereinfachung jetzt aller-
dings nicht mehr zul¨
assig. Tut man es wie hier dennoch, ¨
andern sich grundlegende
Eigenschaften der betrachteten Ausdr¨
ucke. So erkennt man leicht, dass die Eintr¨
age des
Austauschoperators (4.68) in Ortsdarstellung rein reell sind, wenn zu jedem kauch k
ber¨
ucksichtigt wird. Geht dagegen nur noch einer dieser Punkte in die Summe ein, wird
der Operator komplexwertig. Die von ihm bewirkte Dichte¨
anderung (4.67) bleibt jedoch
weiterhin eine reellwertige Gr¨
oße, da sich der Imagin¨
arteil darin explizit wegk¨
urzt.
Nun zur linearen Antwort: Hier h¨
angt es davon ab, ob in (4.69) die obere oder die untere
Zeile benutzt wird. Enth¨
alt die Summe ksowohl als k, sind beide Zeilen ¨
aquivalent und
reell. Entf¨
allt aber einer dieser Punkte, ist nur noch die obere reell, die untere nicht mehr.
Zudem liefert die untere Zeile dann auch keine symmetrische Matrix mehr (im reziproken
Raum ist sie entsprechend nicht mehr hermitesch, vgl. (A.10) und (A.12) in Anhang A.3).
Aus der Anwendung der so manipulierten linearen Antwort auf den wie gezeigt
reellwertigen Ausdruck (4.67) folgt dann unmittelbar die Komplexwertigkeit von vx.
Tats¨
achlich ist es wichtig, beim symmetriegen¨
aherten EXX die zweite Zeile von (4.69)
zu benutzen. W¨
urde man die erste verwenden, und damit also die Zeitinversionssymmetrie
aus der N¨
aherung herausnehmen, funktioniert die Methode nicht mehr. Dies gilt auch um-
gekehrt, wenn etwa VFock korrekt symmetrisiert wird, ρFock und/oder χ0aber nicht. Die
Ursache f¨
ur das Funktionieren der N¨
aherung liegt also offensichtlich in einer Kompensati-
on der bei der Modifikation der Einzelausdr¨
ucke (4.67) bis (4.69) gemachten Fehler, vgl.
Tab. 4.2. Abbildung 4.8 zeigt die gute ¨
Ubereinstimmung der so generierten EXX-Potentiale
mit denen einer exakten Rechnung.
Bei der nun folgenden ¨
Ubertragung der Methode auf den variationellen Ansatz ist die
Frage also vor allem: Wie k¨
onnen die obigen Punkte (i) (v) in dem iterativen Zyklus von
Abschnitt 4.5 simuliert” werden?
90 4 Implementierung
EΓ
gap [eV]
VFock symm., VFock nicht symm.,
symm. nicht symm. χ0, ρFock nicht symm. χ0, ρFock symm.
AlN 5.71 5.74 5.98 5.35
Ge 0.99 0.83 1.06 0.72
Si 3.23 3.06 3.32 2.97
GaAs 1.55 1.38 1.70 1.21
Tabelle 4.2: EXX-Bandl¨
ucken verschiedener Halbleiter am Γ-Punkt bei exakter Handhabung der Sym-
metrisierung (Spalte 2) und mit dem symmetriegen¨
aherten Verfahren (Spalte 3). Wird VFock symmetri-
siert, χ0und ρFock hingegen nicht, sind die Bandl¨
ucken stets etwas zu groß (Spalte 4), im umgekehrten
Fall zu klein (Spalte 5). Es wurden KLI-Pseudopotentiale benutzt und ferner der Korrelationsanteil des
LDA-Funktionals verwendet (außer f¨
ur GaAs, wo keine Korrelation ber¨
ucksichtigt wurde).
Al N
-10
-5
0
5
10
Austauschpotential [eV]
0
LDA
EXX
EXX (sym.-genähert)
Ge Ge
-5
0
5
0
Si Si
-5
0
5
0
Abbildung 4.8: EXX-Potentiale von AlN (links), Ge (mitte) und Si (rechts) bei exakter Handhabung
der Symmetrie (gr¨
un) sowie bei Verwendung des symmetriegen¨
aherten Verfahrens (rot). Zum Vergleich
ist auch das LDA-Potential mit eingezeichnet (blau).
4.6.3 ¨
Ubertragung auf das variationelle EXX-Verfahren
Das Minimierungsprinzip (2.6) der Ausgangspunkt der variationellen EXX-Formulie-
rung stellt letztlich nur eine sehr verknappte Form der OEP-Gleichung (1.96) dar (vgl.
Abschnitt 2.2). Um nun ein analoges Prinzip f¨
ur das symmetriegen¨
ahrte EXX zu entwerfen,
erscheint es daher am einfachsten, auch hier nicht von der expliziten EXX-Gleichung (4.66)
auszugehen, sondern die ¨
aquivalente OEP-Gleichung zu betrachten. Dies hat insbesondere
den Vorteil, dass χ0dabei nicht invertiert wird, und dessen ¨
Anderungen daher mit de-
nen der anderen Gr¨
oßen zusammengefasst werden k¨
onnen, wie detailliert in Anhang F
beschrieben. So findet man schließlich, dass die in (2.4) definierte induzierte Ladungsdich-
te ρim Variationsprinzip (2.6) durch folgende modifizierte” induzierte Ladungsdichte
ersetzt werden muss:
f
ρ(r) :=
Nred
X
s=1
wsψ0
i,ks(r)ψ1
i,ks(r) + ψ0
i,ks(r)]
ψ1
i,ks(r).(4.70)
4.6 Symmetriegen¨
aherte EXX-Methode 91
Wie oben bezeichnen die ksmit den zugeh¨
origen Gewichten wseinen geeigneten k-Punkt-
Satz zur numerischen Integration ¨
uber einen irreduziblen Bereich der Brillouin-Zone. Ab-
gesehen davon, dass f
ρnicht symmetrisiert ist, sind die linearen Korrekturen entscheidend
abge¨
andert: Statt wie eigentlich im variationellen EXX-Verfahren eine St¨
orung der Form
H1:= VFock vxzu betrachten, sind die Korrekturfunktionen nun durch zwei verschiede-
ne St¨
orungen definiert. Die ψ1
i,ksergeben sich dabei aus einer St¨
orung des Kohn-Sham-
Systems mit H1:= VFock 2vx, und die ]
ψ1
i,kserh¨
alt man aus St¨
orung mit f
H1:= VFock.
Daher sind die beiden Summanden in (4.70) im Allgemeinen nicht komplex-konjugiert
zueinander, und f
ρist insgesamt eine komplexwertige Gr¨
oße. Wird f
ρnun im weiteren
Verlauf der Rechnung mit dem Austauschpotential gemischt (vgl. Abschnitt 4.3) erh¨
alt
man in der Folge ein komplexwertiges und nicht der Kristallsymmetrie entsprechendes
Potential in ¨
Ubereinstimmung mit den Betrachtungen des vorangehenden Abschnitts.
Dort allerdings erfolgt gem¨
den Punkten (iv) und (v) in jedem Schritt eine explizite
Symmetrisierung und ein Wegschneiden der Imagin¨
aranteile des Potentials. Wie in Ab-
schnitt 4.5.2 gezeigt, entsprechen allerdings die Iterationen von vxbeim Standard-EXX
nicht unmittelbar den Aktualisierungen von vxbeim variationellen Verfahren, sondern nur
jenen der ¨
außeren Schleife”. Damit gelingt es, die Punkte (i) (v) des vorangehenden Ab-
schnitts genau auf die variationelle Vorgehensweise zu ¨
ubertragen: in der inneren Schleife
von Flussdiagramm 4.5 wird dabei f
ρaus (4.70) minimiert (es sind dazu nat¨
urlich zwei
Sternheimer-Gleichungen n¨
otig), wobei ein komplexes Austauschpotential zugelassen ist.
Dies entspricht genau dem im vorigen Abschnitt mit (i) (iii) erzeugten vx. Bevor dann
allerdings mit dem L¨
osen der Kohn-Sham-Gleichung die n¨
achste Iteration der ¨
außeren
Schleife beginnt, wird dieses Austauschpotential entsprechend den obigen Punkten (iv)
und (v) zu einem Potential mit physikalisch vern¨
unftiger” Gestalt (reell und symme-
trisch) modifiziert.
X
Kapitel 5
Variationelles und Standard-EXX:
Ein Leistungsvergleich
Wie bereits in der Einleitung formuliert, bestand das Hauptanliegen der vorliegenden Ar-
beit in der Implementierung des variationellen EXX-Verfahrens [78,79,80] in das Ebene-
Wellen-DFT-Packet S/PHI/nX [81,82], so dass es erstmalig auch an periodischen Syste-
men getestet werden kann. Hier soll nun abgesch¨
atzt werden, wie groß der daraus resultie-
rende Vorteil gegen¨
uber der Standard-Methode (Abschnitt 1.6.1) in Bezug auf die ben¨
otig-
ten technischen Anforderungen (CPU-Zeit, Speicherbedarf) tats¨
achlich ist. Das Ergebnis
einer Anwendung beider Methoden auf eine Reihe von Halbleitern ist in Tab. 5.1 zusam-
mengefasst. In allen Rechnungen wurde dabei die Symmetrie mit der in Abschnitt 4.6
besprochenen N¨
aherung behandelt.
Schon bei vergleichsweise geringen Abschneideenergien (etwa bei GaAs mit Ecut =15 Ry
und EFock
cut = 12 Ry) findet man bzgl. der pro Schritt ben¨
otigten CPU-Zeit eine Reduk-
tion um den Faktor 0.75. Der Speicherbedarf reduziert sich sogar ca. um die H¨
alfte.
Der Vorsprung wird noch gr¨
oßer bei hohen Abschneideenergien: So konnte f¨
ur GaN (mit
Ecut = 70 Ry und EFock
cut = 52 Ry) die Zeit etwa halbiert und der Speicherbedarf auf ein
Drittel reduziert werden.
Der Aufwand zur Berechnung des nicht-lokalen Austauschoperators VFock ist in beiden
Verfahren identisch. Im Standard-Verfahren macht dies ca. 50% der CPU-Zeit pro Schritt
aus, im variationellen Verfahren hingegen sind dies typischerweise zwischen 80% und 90%.
Rechnet man den Anteil von VFock heraus, ist der variationelle Ansatz damit sogar bis
zu einem Faktor 10 mal schneller als die Standard-Methode. VFock ist damit zugleich als
entscheidender Engpass der neuen Methode identifiziert.
Die Zahlen von Tab. 5.1 lassen sich also wie folgt zusammenfassen: (i) Der numeri-
sche Aufwand f¨
ur EXX l¨
asst sich durch Verwendung des variationellen Ansatzes deutlich
reduzieren. (ii) Eine weitere Reduktion des Aufwandes kann nur durch eine Optimie-
rung in der Berechnung des nicht-lokalen Austauschoperators erfolgen (vgl. dazu auch
Abschnitt 4.4.2).
93
94 5 Variationelles und Standard-EXX: Ein Leistungsvergleich
GaAs (15 Ry / 12 Ry) Zeit / Schritt Zeit VFock Speicher
LDA 2 s 13 MB
Std. EXX 0120 s = 2 min 0050 s = 00 min 35 MB
Var. EXX 90 s = 01.5 min 0050 s 19 MB
Speed-Up: mit (ohne) VFock 1.33 (1.75)
Reduktionsfaktor 0 .54
Si (30 Ry / 23 Ry) Zeit / Schritt Zeit VFock Speicher
LDA 2.6 s 53 MB
Std. EXX 1020 s = 17.0 min 0480 s = 08 min 180 MB
Var. EXX 600 s = 10 min 0480 s = 08 min 99 MB
Speed-Up: mit (ohne) VFock 1.69 (4.55)
Reduktionsfaktor 0 .55
Ge (40 Ry / 30 Ry) Zeit / Schritt Zeit VFock Speicher
LDA 4.2 s 66 MB
Std. EXX 3900 s = 66.0 min 2040 s = 34 min 466 MB
Var. EXX 2280 s = 38 min 2040 s = 34 min 196 MB
Speed-Up: mit (ohne) VFock 1.72 (7.14)
Reduktionsfaktor 0 .42
AlN (60 Ry / 45 Ry) Zeit / Schritt Zeit VFock Speicher
LDA 3.3 s 60 MB
Std. EXX 2280 s = 38.0 min 1200 s = 20 min 293 MB
Var. EXX 1380 s = 23 min 1200 s = 20 min 145 MB
Speed-Up: mit (ohne) VFock 1.64 (5.88)
Reduktionsfaktor 0 .49
GaN(70 Ry / 52 Ry) Zeit / Schritt Zeit VFock Speicher
LDA 3.7 s 78 MB
Std. EXX 6480 s = 1.8 h 3000 s = 50 min 710 MB
Var. EXX 3360 s = 56 min 3000 s = 50 min 227 MB
Speed-Up: mit (ohne) VFock 1.92 (10.0)0
Reduktionsfaktor 0 .32
Semi-core-Schale ¨
uber das Pseudopotential ber¨
ucksichtigt
5 Variationelles und Standard-EXX: Ein Leistungsvergleich 95
(S. 94)
Tabelle 5.1: Leistungsvergleich zwischen variationellem und Standard-EXX-Verfahren f¨
ur einige aus-
gew¨
ahlte Volumensysteme. Die verwendeten Abschneideenergien Ecut und EFock
cut sind jeweils in Klam-
mern angeben. Aufgelistet sind die CPU-Zeit pro Schritt, die pro Schritt f¨
ur VFock aufgewendete CPU-
Zeit (in beiden Verfahren identisch) sowie der maximal ben¨
otigte Speicherplatz. Ferner ist f¨
ur die Zeit
der Speed-Up-Faktor sowie f¨
ur den Speicherbedarf der Reduktionsfaktor im Vergleich zum Standard-
Verfahren angegeben. Ebenfalls sind die entsprechenden Werte einer LDA-Rechnung aufgef¨
uhrt.
X
Kapitel 6
Physikalische Bedeutung
der induzierten Ladungsdichte
Vergleicht man Ladungsdichteverteilungen miteinander, die sich aus einer DFT-LDA-
Rechnung und einer DFT-EXX-Rechnung ergeben, so zeigt sich, wie bereits in Ref. 52
beschrieben, ein allgemeiner Trend: Die Ladungsdichte ist in EXX st¨
arker lokalisiert als
in LDA. Beim Halbleiterkristall ist dies besonders deutlich auf den Bindungen zu er-
kennen (vgl. Abb. 6.2 oben, 6.3 und 6.4 auf den folgenden Seiten), f¨
ur Atome ist ein
¨
ahnliches Verhalten bekannt [44,45,72,73]. Diese Beobachtung l¨
asst sich leicht deuten,
wenn man bedenkt, dass im EXX/OEP-Formalismus die elektronische Selbstwechselwir-
kung vollst¨
andig eliminiert ist, vgl. Abschnitt 1.6. In LDA, wo dies nicht der Fall ist, stellt
die Selbstwechselwirkung ein (unphysikalisches) Kraftfeld dar, durch das die Elektronen
in Regionen hoher Ladungsdichte zu weit voneinander abgedr¨
angt” werden: die Ladungs-
dichte erscheint dadurch homogener. Folglich f¨
uhrt eine Herausnahme dieser Kraft durch
EXX/OEP dann umgekehrt zu einer st¨
arkeren Lokalisierung.
Ne
0,02
0,01
0
-0,01
]Bohr[r
ind. Ladungsdichte
1234 5
06
Abbildung 6.1: Radialanteil r2ρ[vLDA
x]der in-
duzierten Ladungsdichte beim Ne-Atom. Die Dich-
te konzentriert sich st¨
arker in Richtung des Kerns.
(Nach Wahn und Neugebauer [78])
Als die Gr¨
oße, die im variationellen
EXX-Verfahren f¨
ur die Herausnahme der
Selbstwechselwirkung sorgt”, l¨
asst sich die
induzierte Ladungsdichte ρ[vx] identifi-
zieren. Nach dem Variationsprinzip (2.6)
verschwindet sie nur f¨
ur vx=vEXX.
Setzt man dagegen vx=vLDA
x, so illus-
triert nebenstehende Abb. 6.1 recht an-
schaulich den verursachten Effekt am Bei-
spiel des Ne-Atoms: ρ[vLDA
x] verschiebt
Ladungsdichte von ¨
außeren Bereichen hin
zum Kern, die Lokalisierung der Dichte
nimmt dadurch insgesamt zu. Obwohl nun
ρ[vLDA
x] gem¨
ihrer Konstruktion nach
Gleichung (2.4) die Ladungsverschiebung beim ¨
Ubergang vLDA
xvEXX nur in 1. Ordnung
beschreibt, ist darin dennoch bereits alle Information f¨
ur eine vollst¨
andige Herausnahme
der Selbstwechselwirkung enthalten. Die Begr¨
undung liegt in der Linearit¨
at des EXX-
Formalismus: mit Gleichung (4.42) hat man vEXX[ρLDA] = vLDA
x+ ˆχ1
0ρ[vLDA
x], wobei
die Berechnung von ˆχ1
0im variationellen EXX-Verfahren nat¨
urlich durch einen geeigne-
ten Mixing-Prozess ersetzt wird, vgl. Abschnitt 4.3. Im daraus konstruierten Kohn-Sham-
Potential vext +vH[ρLDA]+vEXX[ρLDA]+vc[ρLDA] ist dann die Selbstwechselwirkung exakt
97
98 6 Physikalische Bedeutung der induzierten Ladungsdichte
Ga As
-0.02
0
0.02
0.04
0.06
0.08
0.1
Ladungsdichte [e- / Bohr3]
0
ρLDA
ρEXX
ρEXX − ρLDA
Ga As
-6
-4
-2
0
2
4
6
Austauschpotential [eV]
0
vx
LDA
vx
EXX
vx
EXXvx
LDA
Si Si
0
0.02
0.04
0.06
0.08
0.1
0
ρLDA
ρEXX
ρEXX − ρLDA
Si Si
-5
0
5
10
0
vx
LDA
vx
EXX
vx
EXXvx
LDA
x5
Abbildung 6.2: Schnitt entlang der (1,1,1)-Richtung durch die Einheitszelle von GaAs (links) und Si
(rechts). Oben: Ladungsdichten in LDA und EXX sowie deren Differenzen (Differenz bei GaAs um den
Faktor 5 vergr¨
oßert dargestellt). Unten: Austauschpotentiale in LDA und EXX sowie deren Differenzen.
eliminiert,1wenngleich auch die Kohn-Sham-Gleichung noch nicht selbstkonsistent gel¨
ost
ist.
Durch das selbstkonsistente L¨
osen der Kohn-Sham-Gleichung wird die Dichte nun noch
in nicht-linearer Weise modifiziert (vgl. Abschnitt 4.3), diese Nachjustierungen” sind je-
doch bei den hier untersuchten Systemen im Verh¨
altnis zu ρ[vLDA
x] um etwa eine Gr¨
oßen-
ordnung kleiner. Abbildung 6.2 (oben) zeigt die selbstkonsistente EXX-Ladungsdichte
(gr¨
un) im Vergleich mit der LDA-Ladungsdichte (blau) f¨
ur die Halbleiter GaAs und
Si. Bemerkenswert ist, dass die Ladungsverschiebung (rot) beim ¨
Ubergang LDA EXX
¨
außerst klein gegen¨
uber der eigentlichen Ladungsverteilung ist, w¨
ahrend die entsprechen-
de Differenz zwischen EXX- und LDA-Austauschpotential etwa von gleicher Gr¨
oßenord-
nung wie das Austauschpotential selbst ist (Abb. 6.2 unten). Der gleiche Trend wurde in
Ref. 78 f¨
ur Atome beschrieben. Die geringe Gr¨
oßenordung der induzierten Ladungsdich-
1Unter der Bedingung, dass die Korrelation keine zus¨
atzlichen Fehler ins Spiel bringt, also etwa beim
“exchange-only” EXX-Verfahren.
6 Physikalische Bedeutung der induzierten Ladungsdichte 99
(a) (b)
(c) (d)
[011]
[100]
[011]
[100]
Ga
As
Si Si
Ga
As
+1,51
-0,43
-2,38
-4,32
+3,23e-3
+1,43e-3
-0,36e-3
-2,16e-3
+3,49
+1,21
-1,07
-3,35
+9,16e-3
+4,77e-3
+0,37e-3
-4,02e-3
Abbildung 6.3: Differenz zwischen EXX- und LDA-Ladungsdichte in e/Bohr3(links) sowie zwischen
EXX- und LDA-Austauschpotential in eV (rechts) f¨
ur GaAs (oben) und Si (unten). In EXX ergibt sich
vor allem auf den Bindungen eine st¨
arkere Lokalisierung der Dichte als in LDA, entsprechend ist das
Austauschpotential in EXX gegen¨
uber dem einer LDA-Rechnung an diesen Stellen abgesenkt.
Abbildung 6.4: Isooberfl¨
ache der Differenz
zwischen EXX- und LDA-Ladungsdichte in
GaAs: ρEXX(r)ρLDA(r) = +1.4e/Bohr3.
Wie in den vorangehenden Abbildungen 6.2
und 6.3 erkennt man auch hier die Ladungs-
verschiebung hin zu den Bindungen.
100 6 Physikalische Bedeutung der induzierten Ladungsdichte
te ist konsistent mit der allgemein anerkannten Aussage, dass LDA- und Hartree-Fock-
Wellenfunktionen sehr ¨
ahnlich sind, vgl. z.B. Ref. 58 und 59.
Ferner wird an Abb. 6.2 auch der negativ-definite Charakter von χ0erkennbar: Die
Differenz der Austauschpotentiale (unten, rot) ergibt sich grob, außer in der N¨
ahe der
Kerne, aus der entsprechenden Ladungsdichtedifferenz (oben, rot) durch Spiegelung an der
Abszisse und Streckung in Richtung der Ordinate. Auch Abbildung 6.3 illustriert dieses
Verhalten. Nat¨
urlich liegen gerade in den Abweichungen von einer exakten Spiegelung
die wesentlichen Eigenschaften und Schwierigkeiten des EXX-Formalismus, denn χ0
kann eben nicht einfach durch eine geeignete Konstante gen¨
ahert werden.
Kapitel 7
EXX-Pseudopotentiale:
Linearisierung der
Austauschwechselwirkung
Die gegen¨
uber der Standard-EXX-Methode numerisch (hinsichtlich der CPU-Zeit und des
Speicherbedarfs) deutlich effizientere variationelle EXX-Methode erlaubt die Untersuchung
von Fragestellungen, die bisher nicht angegangen werden konnten. Als Beispiel soll hier un-
tersucht werden, ob sich das EXX-Potential in Bezug auf die Ladungsdichte als ann¨
ahernd
lineares Funktional betrachten l¨
asst. Von großer Bedeutung ist dies speziell im Hinblick auf
die Verwendung von EXX-Pseudopotentialen, bei denen ein Teil der semi-core-Elektronen
explizit als Valenzelektronen behandelt wird, der andere Teil jedoch im Rumpf verbleibt.
Energie [eV]
Ga3d
0
-5
-10
-15
-20
-25
-30
Ga4s
Ga4p
In4d
In5s
In5p
N2s
N2p
Abbildung 7.1: Eigenwerte von Ga-, In- und N-Pseudoato-
men. Getrichelte Linien: LDA-Berechnungen mit LDA-Pseu-
dopotentialen. Durchgezogene Linien: EXX-Berechnungen mit
EXX-Pseudopotentialen. Nach Ref. 169.
So verf¨
ahrt man ¨
ublicherwei-
se etwa bei den Materialien
GaN und InN, bei denen die
Zuordnung der kationischen d-
Elektronen zum Valenzbereich auf
Grund ihrer Hybridisierung mit
den 2s-Zust¨
anden des Stickstoffs
notwendig ist (vgl. Abbildung 7.1
und Abschnitt 3.4). Bei einem
Schnitt” durch die semi-core-
Schale, wobei deren s- und p-Or-
bitale dem Rumpf, die d-Orbita-
le hingegen der Valenz zugeordnet
werden, gibt es jedoch eine starke
¨
Uberlappung von Rumpf- und Va-
lenzladungsdichte.
Es ist daher notwendig, G¨
ultigkeit und/oder Grenzen der mit der Pseudoisierung ein-
hergehenden Linearisierung des verwendeten Austausch-Korrelationspotentials bez¨
uglich
Rumpf- und Valenzladungsdichte zu testen. Alternativ ließe sich im Prinzip auch die ge-
samte semi-core-Schale den Valenzzust¨
anden zuordnen. Dies ist aber unter numerischen
Gesichtspunkten wenig w¨
unschenswert; insbesondere in EXX stellt die dann notwendi-
ge Erh¨
ohung der Abschneideenergie wegen der ung¨
unstigen Skalierung des nicht-lokalen
Austauschoperators (vgl. Abschnitt 4.4) ein Problem dar. So lassen sich zwar Berech-
nungen von GaN und InN bei expliziter Ber¨
ucksichtung der semi-core-d-Elektronen mit
101
102 7 EXX-Pseudopotentiale: Linearisierung der Austauschwechselwirkung
EXXaEXXb
Ecut EFock
cut Espd
gap Ed
gap Espd
gap Ed
gap
60 50 1.05 0.80 0.92 0.69
80 60 1.05 0.80 0.93 0.69
80 70 0.80 0.94
100 60 1.04 0.80 0.93 0.69
100 70 0.80 0.94
100 80 1.04 0.80 0.94 0.69
120 60 1.03 0.80 0.91
120 80 1.02 0.80 0.91 0.69
Tabelle 7.1: Konvergenztest f¨
ur InN. Die Bandl¨
ucken sind in der Einheit eV angegeben, die Abschnei-
deenergien f¨
ur die Wellenfunktionen Ecut sowie den nicht-lokalen Austauschoperator EFock
cut in Ry. Die
semi-core-Schale wurde einmal vollst¨
andig (Espd
gap) und einmal nur mit den d-Elektronen (Ed
gap) in die
Valenz miteinbezogen. EXXa: LDA-Korrelation sowohl im Pseudopotential als auch in der expliziten
Berechnung. EXXb: LDA-Korrelation nur im Pseudopotential, nicht in der expliziten Berechnung.
dem Standard-EXX-Verfahren noch bew¨
altigen (vgl. Ref. 169,171), die Hinzunahme der
s- und p-Zust¨
ande ¨
ubersteigt bei vertretbarem technischen Aufwand jedoch das derzeit
Machbare.
Der genannte Schnitt” durch den semi-core-Bereich w¨
are allerdings gerechtfertigt,
wenn sich das Austausch-Korrelationspotential, oder zumindest dessen dominierender Au-
stauschanteil, hinreichend linear bzgl. der Ladungsdichte verh¨
alt, also die Relation (3.30)
durch
vx[ρ1+ρ2](r)vx[ρ1](r) + vx[ρ2](r) (7.1)
ersetzt werden kann. F¨
ur ρ1und ρ2sind hier nat¨
urlich speziell die Rumpf- und die Va-
lenzladungsdichte einzusetzen. Die Vermutung, dass das EXX-Potential (7.1) erf¨
ullt, wird
durch folgende Beobachtungen gest¨
utzt: (i) Die EXX/OEP-Gesamtenergie EEXX stimmt
stets in etwa mit der Hartree-Fock-Gesamtenergie EHF ¨
uberein, es gilt also EHF <
EEXX
[50,52,60,61]. (ii) Der nicht-lokale Austauschoperator kann ¨
ahnlich wie das elektrosta-
tische Potential als lineares Funktional aufgefasst werden. Tats¨
achlich besteht der Un-
terschied formal nur darin, dass das elektrostatische Potential ein Funktional der Dichte
ist, w¨
ahrend der Kern des nicht-lokalen Austauschoperators vom Dichteoperator abh¨
angt
(siehe Gleichung (1.29)). In v¨
olliger Analogie zu (3.29) ergibt sich daher mit zwei Dichte-
operatoren γ1und γ2:
vFock[γ1+γ2](x,x) = γ1(x,x) + γ2(x,x)
|rr|=vFock[γ1](x,x) + vFock[γ2](x,x).
(7.2)
Hierbei beachte man, dass der Kern des nicht-lokalen Austauschoperators spin-abh¨
angig
ist, Orts- und Spinkoordinate sind in der Variablen xzusammengefasst worden. Da sich
nun ferner das (“exchange-only”) EXX/OEP-Potential als beste lokale N¨
aherung an das
nicht-lokale Austauschpotential des Hartree-Fock-Formalismus auffassen l¨
asst (vgl. Ab-
schnitt 1.6.2), so ist zumindest naheliegend, dass sich dessen Linearit¨
at auf das EXX-
Potential ¨
ubertr¨
agt”. Wie gut die Beziehung (7.1) f¨
ur ein gegebenes Austauschpotential
7 EXX-Pseudopotentiale: Linearisierung der Austauschwechselwirkung 103
EXXaEXXb
Ecut EFock
cut Espd
gap Ed
gap Espd
gap Ed
gap
80 60 2.75 1.57 2.65
100 60 2.54 2.75 2.43 2.65
100 80 2.53 2.75 2.44 2.65
120 60 3.21 2.75 3.03 2.65
120 70 2.81 2.65
120 80 2.84 2.75 2.71 2.65
Tabelle 7.2: Konvergenztest f¨
ur GaN. Bezeichnungen und Einheiten wie in Tab. 7.1. Die Abschnei-
deenergie des nicht-linearen Austauschoperators EFock
cut konnte auf Grund begrenzter Speicherkapazit¨
at
nicht ganz auskonvergiert werden.
tats¨
achlich erf¨
ullt ist, konnte mit der bisherigen Implementierung (stEXX) nicht gete-
stet werden, da die Mitnahme der energetisch tief liegenden und damit stark lokalisierten
s- und p-Orbitale der kationischen semi-core-Schale mit den zur Verf¨
ugung stehenden
Computerclustern zu aufwendig war. Mit dem im Rahmen dieser Arbeit implementier-
ten variationellen EXX-Verfahren hingegen ist dies nun m¨
oglich, indem zwei Rechnungen
durchgef¨
uhrt werden: einmal wird die semi-core-Schale nur bis zu den d-Elektronen, ein
anderes Mal insgesamt in der Valenz ber¨
ucksichtigt (im Weiteren seien daf¨
ur abk¨
urzend
die Bezeichnungen d-Rechnung” bzw. spd-Rechnung” verwendet). Ein solcher Vergleich
liefert f¨
ur das LDA-Potential eine gute ¨
Ubereinstimmung der berechneten Bandl¨
ucken, ob-
wohl LDA (sowie auch GGA) ein nicht-lineares Funktional in Bezug auf die Dichte darstellt
(bei GaN findet man eine Differenz von ca. 0.15 eV, und InN ist sowohl f¨
ur eine d- als auch
eine spd-Rechnung metallisch, vgl. Tab. 7.3). Anders die GW-Methode [150,151], deren
Selbstenergieoperator ebenfalls nicht-linear ist. Diese Methode (aufgesetzt auf eine selbst-
konsistente LDA-Berechnung) liefert f¨
ur GaN gem¨
Rohlfing et al. [152] einen deutlichen
Unterschied in der Bandl¨
ucke: 0.71 eV. Mit dem variationellen EXX-Verfahren l¨
asst sich
ein solcher Vergleich nun erstmalig auch f¨
ur das exakte Austauschpotential durchf¨
uhren;
die Ergebnisse sind in den Tabellen 7.1 und 7.2 in Form von Konvergenztests zusammen-
gefasst und in Tab. 7.3 im Vergleich mit den Resultaten anderer Methoden sowie dem
Experiment dargestellt.
Durchf¨
uhrung der Rechnung
Die Bandstrukturen wurden mit der in dieser Arbeit durchgef¨
uhrten und in Kapitel 4de-
tailliert beschriebenen Implementierung des variationellen EXX-Verfahrens in den DFT-
Code S/PHI/nX [81,82] berechnet. Dabei wurde allerdings auf das in Abschnitt 4.6 be-
schriebene symmetriegen¨
aherte EXX-Verfahren” zur¨
uckgegriffen, da bei den hier unter-
suchten Gruppe-III-Nitriden eine Symmetrisierung des nicht-lokalen Austauschoperators
wegen seines Skalierungsverhaltens im reziproken Raum (vgl. Abschnitt 4.4) nicht mit
vertretbarem Aufwand bew¨
altigt werden kann, wenn die semi-core-Schale ganz oder teil-
weise in die Valenz miteinbezogen werden soll. Die Berechnungen wurden f¨
ur die meta-
stabile [153] Zinkblende-Phase durchgef¨
uhrt. Fr¨
uhere Berechnungen in LDA [154,155]
sowie EXX+GW [169,172] (s- und p-Elektronen im Rumpfbereich) legen jedoch na-
he, dass sich die entsprechenden Bandl¨
ucken der stabilen Wurtzit-Phase daraus ablei-
104 7 EXX-Pseudopotentiale: Linearisierung der Austauschwechselwirkung
Methode semi-core InN GaN
LDA d0.44b1.51a
LDA spd 0.0a1.66a
EXX(cLDA) 1.49k3.52k
EXX(cLDA) d0.8a2.75a
EXX(cLDA) spd 1.02a2.84a
LDA+GW d 0.0c(W) 3.59d
LDA+GW spd 2.88d
EXX(cLDA)+GW d 0.53e3.07e
Experiment 0.7 1.0f,j(W) 3.2h
1.9g(W) 3.3i,j
avorliegende Arbeit
bRef. 168
cRef. 160,161
dRef. 152
eRef. 172
fRef. 157,158,159
gRef. 156
hRef. 162,163,164
iRef. 165,166
jRef. 167
kRef. 169
Tabelle 7.3: Bandl¨
ucken von InN und GaN in DFT-EXX(cLDA), DFT-LDA und mit der Quasiteilchen-
Methode (GW) im Vergleich mit dem Experiment. Einige Daten sind bei InN nur f¨
ur die Wurtzit-
Phase verf¨
ugbar, insbesondere auch die experimentelle Bandl¨
ucke; diese Werte sind hier durch ein W
gekennzeichnet.
ten lassen, indem 0.2 eV auf die Werte der Zinkblende-Phase addiert wird. Um eine
bessere Vergleichbarkeit mit dem Experiment und den Daten der meisten anderen EXX-
Berechnungen zu erm¨
oglichen, wurde jeweils die experimentelle Gitterkonstante angenom-
men (4.53 ˚
A f¨
ur GaN und 4.98 ˚
A f¨
ur InN). Es wurden normerhaltende relativistische EXX-
Pseudopotentiale benutzt [111,112], die einen LDA-Korrationsanteil besitzen. Die selbst-
konsistente Rechnung wurde sowohl mit als auch ohne LDA-Korrelation durchgef¨
uhrt. Die
Brillouin-Zonen-Integration erfolgte dabei auf einer (4×4×4)-Zerlegung nach Monkhorst
und Pack [96].
Orbitale, Ladungsdichten, etc. wurden mit Hilfe von ebenen Wellen dargestellt, da-
bei konnte die Abschneideenergie EFock
cut f¨
ur den Austauschoperator unabh¨
angig von der
Abschneideenergie Ecut der Wellenfunktionen variiert werden. Mit einem zur Verf¨
ugung
stehenden Arbeitsspeicher von maximal 4 GB ergab sich f¨
ur EFock
cut eine Obergrenze von
etwa 80 Ry. W¨
ahrend sich die spd-Rechnungen f¨
ur InN damit auf ca. 0.04 eV auskonvergie-
ren lassen (Tab. 7.1), gelingt dies f¨
ur GaN nicht mehr vollst¨
andig (Tab. 7.2). Insbesondere
scheint in dem betrachteten Bereich noch eine EFock
cut -Abh¨
angigkeit zu bestehen: mit wach-
sendem EFock
cut wird die Bandl¨
ucke geringer. Entsprechnde spd-Rechnungen in LDA zeigen,
dass bei GaN mindestens Ecut 140 Ry notwendig ist; damit w¨
are gem¨
Abschnitt 4.5.1
ein EFock
cut >
100 Ry erforderlich. Die anschließende Diskussion soll in Bezug auf GaN daher
als Hinweis verstanden werden, der unter dem Vorbehalt steht, dass endg¨
ultige Klarheit
erst durch eine zuk¨
unftige genauere Rechnung erlangt werden kann. Dies l¨
asst sich nach
gegenw¨
artigem Ermessen am schnellsten durch einen Wechsel der Basisdarstellung des
nicht-linearen Austausch-Operators erreichen (vgl. Abschnitt 4.4.2).
Ergebnisse und Diskussion
Aus Tab. 7.3 ist ersichtlich, dass sich die Band¨
ucken einer d-Rechnung und einer spd-
Rechnung bei InN um etwa 0.2 eV voneinander unterscheiden. F¨
ur GaN kann der Diffe-
renzbetrag auf Grund des oben Genannten nicht pr¨
azise angegeben werden, die besten
verf¨
ugbaren Rechnungen (Ecut = 120, EFock
cut = 80, vgl. Tab. 7.2) lassen jedoch hier sogar
auf eine Differenz von weniger als 0.1 eV schließen. Beachtet man, dass f¨
ur Bandstrukur-
7 EXX-Pseudopotentiale: Linearisierung der Austauschwechselwirkung 105
Ga N
-1
0
1
2
3
4
5
partielle Ladungsdichte [e- / Bohr3]
rd
cut
rspd
cut
rspd
cut
rd
cut
0
Band 5-10 (spd-Rechng.)
Band 1-6 (d-Rechng.)
Differenz
In N
-0.2
0
0.2
0.4
0.6
0.8
1
1.2
partielle Ladungsdichte [e- / Bohr3]
rspd
cut rd
cut
rspd
cut
rd
cut
0
Band 5-10 (spd-Rechng.)
Band 1-6 (d-Rechng.)
Differenz
Abbildung 7.2: Partielle Ladungsdichten entlang der (1,1,1)-Richtung durch die Einheitszelle von GaN
(oben) und InN (unten). Im Bereich der Bindung und des N-Atoms stimmen die partiellen Ladungsdich-
ten einer d- und einer spd-Rechnung weitgehend ¨
uberein. Die Abweichungen im Bereich der Kationen
werden durch Pseudopotentialeffekte verursacht, vgl. Abb. 7.3. Die Abschneideradien rcut
dund rcut
spd
kennzeichnen den Bereich der kationischen Pseudopotentiale, die f¨
ur die d- bzw. spd-Rechnung ver-
wendet worden sind.
106 7 EXX-Pseudopotentiale: Linearisierung der Austauschwechselwirkung
0 1 2 3
r [Bohr]
0
1
2
3
4
5
partielle Ladungsdichte [e- / Bohr3]
rspd
cut rd
cut
Orbital 5-10
Orbital 1-6
0 1 2 3
r [Bohr]
0
0.25
0.5
0.75
1
1.25
1.5
partielle Ladungsdichte [e- / Bohr3]
rspd
cut rd
cut
Orbital 5-10
Orbital 1-6
Ga In
Abbildung 7.3: Partielle Ladungsdichte der 3d- und 4s-Elektronen des Ga-Atoms (links) bzw. der 4d-
und 5s-Elektronen des In-Atoms (rechts). Blaue Kurven: Explizite Ber¨
ucksichtigung aller semi-core-
Elektronen. Rote Kurven: Die s- und p-Elektronen der semi-core-Schale wurden nur implizit ¨
uber das
Pseudopotential ber¨
ucksichtigt. Wie in Abb. 7.2 kennzeichnen rcut
dund rcut
spd die Bereiche der Pseudo-
potentiale, die f¨
ur die d- bzw. die spd-Rechnung benutzt worden sind. Innerhalb der Abschneideradien
ergeben sich Unterschiede der berechneten Ladungsdichten, die in etwa den Differenzen entsprechen,
die in Abb. 7.2 um die Kationen entstehen. Dies zeigt, dass es sich bei den Differenzen um reine
Pseudopotentialeffekte handelt.
berechnungen mit Hilfe von Pseudopotentialen 0.2 eV ohnehin als Toleranz anzunehmen
sind, wird die Vermutung eines linearen EXX-Potentials (7.1) durch diese Untersuchun-
gen sehr gut best¨
atigt. Sieht man von dieser Toleranz ab, liefern die spd-Rechnungen in
beiden F¨
allen eine geringe ¨
Offnung der Bandl¨
ucke im Vergleich zu den entsprechenden
d-Rechnungen. Im Falle von GaN ergibt sich damit eine leichte Verbesserung hin zum ex-
perimentellen Resultat (vgl. Tab. 7.3), f¨
ur InN wird die Bandl¨
ucke (nach Umrechnung”
auf die Wurtzitstruktur durch Addieren von 0.2 eV, siehe oben) im Vergleich zu den ex-
perimentellen Werten zwischen 0.7 und 1 eV [157,158,159] etwas ¨
ubersch¨
atzt.
Die Linearit¨
at von vEXX sollte sich andererseits auch an der Ladungsdichteverteilung
¨
uberpr¨
ufen lassen, insbesondere an dem Anteil, der durch die Wellenfunktionen der d-
B¨
ander gegeben ist. W¨
are n¨
amlich das EXX-Potential nicht linear, sollte die dann un-
zul¨
assige Separation in Valenz- und Rumpfelektronen zu einer Verzerrung der tats¨
achli-
chen Gestalt dieser partiellen Dichte f¨
uhren. Die s- und p-B¨
ander der semi-core-Schale
sind sowohl f¨
ur GaN als auch InN weit von den dar¨
uberliegenden d-B¨
andern entfernt;
ihr Anteil kann daher leicht von der Gesamtladungsdichte einer spd-Rechnung abgezogen
werden. Eine saubere Trennung der d-B¨
ander vom 2s-Band des Stickstoffs gelingt dage-
gen auf Grund der Hybridisierung der beteiligten Orbitale nicht. In Abb. 7.2 wird daher
die partielle Ladungsdichte betrachtet, die sich aus den kationischen semi-core-d-B¨
andern
und dem N-2s-Band ergibt. Tats¨
achlich erweist sich diese Dichte, wie die Abbildung il-
lustriert, f¨
ur beide untersuchten Halbleiter sowohl im Bereich der Bindung als auch im
Bereich des Stickstoff-Atoms als weitgehend unabh¨
angig davon, ob sie mit einer d- oder
einer spd-Rechnung erzeugt worden ist. In einem Bereich um das jeweilige Kation aller-
dings ergeben sich Differenzen. Gibt es also doch Gebiete, in denen sich vEXX nicht linear
verh¨
alt? Dazu beachte man, dass die beobachteten Differenzen auch von Pseudopotential-
7 EXX-Pseudopotentiale: Linearisierung der Austauschwechselwirkung 107
Ga N
-0.2
-0.1
0
0.1
0.2
ρEXX − ρLDA [e- / Bohr3]
rspd
cut rd
cut
rspd
cut
rd
cut
0
∆ρ (spd-Rechng.)
∆ρ (d-Rechng.)
In N
-0.06
-0.04
-0.02
0
0.02
ρEXX − ρLDA [e- / Bohr3]
rspd
cut rd
cut
rspd
cut
rd
cut
0
∆ρ (spd-Rechng.)
∆ρ (d-Rechng.)
Abbildung 7.4: Differenz zwischen der EXX-Ladungsverteilung und der LDA-Ladungsverteilung entlang
der (1,1,1)-Richtung durch die Einheitszelle von GaN (oben) und InN (oben). ¨
Ahnlich wie in Abb. 7.2
f¨
ur die Dichten ergeben sich auch f¨
ur die induzierten Ladungsdichten nur im Bereich der kationischen
Pseudopotentiale (gekennzeichnet wie in Abb. 7.2) nennenswerte Unterschiede.
108 7 EXX-Pseudopotentiale: Linearisierung der Austauschwechselwirkung
effekten herr¨
uhren k¨
onnen, sich also zumindest zu einem Teil auch als numerische Arte-
fakte erkl¨
aren lassen. Um dies zu verdeutlichen, wurden in Abb. 7.2 die Abschneideradien
der verwendeten Pseudopotentiale mit eingezeichnet. Innerhalb der so markierten Pseudo-
potentialbereiche weichen aber nun die berechneten Dichteverteilungen bekanntermaßen
von den tats¨
achlichen Dichten betr¨
achtlich ab (vgl. Abb. 3.2). Folglich sind insbesondere
bei Verwendung unterschiedlicher Pseudopotentiale (wie hier bei einer d- und einer spd-
Rechnung) die berechneten (partiellen) Dichten innerhalb dieser Bereiche nicht miteinan-
der vergleichbar. Dieser Effekt ergibt sich bereits bei der Berechnung des freien Atoms,
wie Abb. 7.3 zeigt. Dies ist ein deutlicher Hinweis darauf, dass f¨
ur die in Abb. 7.2 beobach-
teten Differenzen in der Tat zum großen Teil Pseudopotentialeffekte verantwortlich sind
und daher nicht auf eine Nichtlinearit¨
at des EXX-Potentials in diesem Bereich geschlossen
werden kann.
Ein ¨
ahnliches Bild ergibt sich, wenn man die Ladungsdichtedifferenzen zwischen einer
EXX- und einer LDA-Rechnung betrachtet, vgl. Abb. 7.4. Außerhalb des Pseudopoten-
tialbereichs findet man wiederum eine weitgehende ¨
Ubereinstimmung zwischen der indu-
zierten Ladungsdichte einer d-Rechnung und einer spd-Rechnung. Dabei zeigt sich wie
bereits in den Resultaten von Kapitel 6, dass Ladungsdichte aus der Umgebung des An-
ions verschoben wird in den Bereich der Bindung, was als Herausnahme der elektronischen
Selbstwechselwirkung interpretiert werden kann. Es ist zu erwarten, dass die Herausnahme
der Selbstwechselwirkung auch zu einer st¨
arkeren Lokalisierung der semi-core-Schale selbst
f¨
uhrt, wie es etwa die induzierten Ladungsdichten der d-Rechnungen nahelegen (Abb. 7.4,
rote Kurven). Da sich dieser Effekt jedoch im Bereich der hier benutzten Pseudopotentiale
abspielt, wie abermals durch die eingezeichneten Abschneideradien verdeutlicht, l¨
asst er
sich in diesem Rahmen nicht hinreichend genau analysieren dies ist allerdings f¨
ur die
untersuchte Fragestellung auch nicht erforderlich.
Zusammenfassend kann Folgendes gesagt werden: (i) Die vorliegenden Ergebnisse zei-
gen, dass es sich beim EXX-Potential um ein zumindest n¨
aherungsweise linear von der
Dichte abh¨
angendes Funktional handelt; dies folgt sowohl aus einem Vergleich der aus
einer d- bzw. einer spd-Rechnung resultierenden Bandl¨
ucken (Differenz ca. 0.2 eV) sowie
auch aus einem Vergleich der entsprechenden Ladungsdichten und induzierten Ladungs-
dichten. Die G¨
ultigkeit von EXX-Rechnungen, die die s- und p-Zust¨
ande nur ¨
uber das
Pseudopotential ber¨
ucksichtigen, wird damit best¨
atigt, was entscheidend f¨
ur die k¨
unftigen
Anwendungsm¨
oglichkeiten der (trotz der variationellen Formulierung ja immer noch sehr
teuren) EXX-Methode ist. (ii) Diese n¨
aherungsweise Linearit¨
at des EXX-Potentials f¨
uhrt
bei der Verwendung von EXX-Pseudopotentialen zu einem g¨
anzlich anderen Verhalten als
die (nicht-lineare) GW -Methode, denn letztere erweist sich als stark abh¨
angig davon, wie
die Zuordnung der Elektronen zu Rumpf- und Valenzbereich erfolgt: je nach Zuordnung
der kationischen s- und p-Zust¨
ande der semi-core-Schale ergibt sich bei GaN eine Diffe-
renz von 0.71 eV in der Bandl¨
ucke (GW basierend auf einer LDA-Rechnung) [152]. F¨
ur die
Zukunft verbleibt zu untersuchen, wie sich eine GW-Korrektur auf die hier berechneten
EXX-Bandl¨
ucken auswirkt.
Teil II
Wannier-Funktionen
109
X
Kapitel 8
Verallgemeinerte
Wannier-Funktionen als
lokalisierte ab-initio-Basis im
Modell starker Bindung
In Kapitel 3wurden in Verbindung mit normerhaltenden Pseudopotentialen die
ebenen Wellen als eine geeignete Basis zur Beschreibung periodischer Systeme vorgestellt.
Ebenen Wellen sind, ebenso wie die anderen in Abschnitt 3.3 erw¨
ahnten Basiss¨
atze (z.B.
den LAPWs), vollst¨
andig in dem Sinne, dass sich die Qualit¨
at einer Rechnung systematisch
durch Hinzunahme von mehr Basisfunktionen verbessern l¨
asst. F¨
ur die Berechnung sehr
großer Systeme, so z.B. von Quantenpunkten mit einer Anzahl von typischerweise 103bis
105Atomen, erweist sich die Verwendung einer vollst¨
andigen Basis jedoch als zu aufwendig;
eine Behandlung des Problems mit der heute zur Verf¨
ugung stehenden Computertechnik
w¨
are nicht machbar, insbesondere, wenn man an den optischen Eigenschaften interessiert
ist und daher zur genauen Beschreibung der elektronischen Struktur der EXX-Formalismus
herangezogen werden soll. In dieser Arbeit wurde daher eine ab-initio-Parametrisierung
im Modell starker Bindung (engl.: tight-binding approach, TB) entwickelt [122] und in die
DFT-Bibliothek S/PHI/nX [81,82] eingebaut. Dieser Zugang erlaubt es, die Genauigkeit
von Berechnungen auf atomistischer Skala auf Systeme mesoskopischer Gr¨
oßenordnung
zu ¨
ubertragen. Ferner sind die hier durchgef¨
uhrten Untersuchungen auch als erste Vor-
arbeiten dahingehend zu verstehen, die Berechnung des nicht-lokalen Austauschoperators
VFock und damit die bei Verwendung des variationellen EXX-Verfahrens (Teil I) letzte
gr¨
oßere Schwierigkeit der EXX-Methode effizienter zu gestalten. Die Methode soll nun
in diesem Kapitel vorgestellt werden.
Wie in der Einleitung bereits erw¨
ahnt, er¨
offnen den Ansatz dazu die von Marzari
und Vanderbilt entwickelten Verallgemeinerten Wannier-Funktionen (GWFs, von amer.:
Generalized Wannier functions) [116,117], die im n¨
achsten Abschnitt vorgestellt werden:
¨
Uber eine unit¨
are Transformation mit der Bloch-Basis einer bestimmten, linearen Teil-
menge T H des Hilbertraums Hverbunden1, spannen die Verallgemeinerten Wannier-
1Ist man beispielsweise wie in dieser Arbeit an den optischen Eigenschaften eines Halbleiterkristalls
interessiert, wird Tsinnvollerweise aus den Bloch-Zust¨
anden der (oberen) Valenzb¨
ander und (mindestens)
des untersten Leitungsbands aufgespannt.
111
112 8 Verallgemeinerte Wannier-Funktionen als lokalisierte ab-initio-Basis ...
Funktionen ebenfalls genau den Teilraum Tauf. Zur Darstellung von Funktionen oder
Operatoren in Tsind Bloch- und Wannier-Basis also v¨
ollig gleichwertig, ein Wechsel zwi-
schen ihnen stellt keine N¨
aherung dar!
Dies beinhaltet aber auch, dass beide Basen gleich m¨
achtig sind; wollte man also al-
le Matrixelemente eines Operators berechnen, h¨
atte man durch den Basiswechsel noch
nichts erreicht. Jedoch ist die unit¨
are Transformation nicht eindeutig festgelegt. Daraus
ergeben sich Freiheiten, die zu unterschiedlichen Lokalisierungen der Verallgemeinerten
Wannier-Funktionen f¨
uhren. W¨
ahlt man die Basistranformation daher so, dass die Lokali-
sierung maximal ist, ist umgekehrt die r¨
aumliche ¨
Uberlappung zweier ausreichend entfernt
liegenden Funktionen minmal. Ein Operator in der Darstellung solcher maximal lokalisier-
ten Wannier-Funktionen [116] sollte also nur f¨
ur Matrixelemente benachbarter Basisfunk-
tionen eine (wesentlich) von Null verschiedene Gr¨
oßenordnung aufweisen, alle anderen
Elemente hingegen k¨
onnten vernachl¨
assigt werden. Anders ausgedr¨
uckt, Verallgemeinerte
Wannier-Funktionen sollten sich f¨
ur die Verwendung als Basisfunktionen im Modell der
starken Bindung eignen. Ob und wie gut dies gelingt, wird in den Abschnitten 8.2 bis 8.4
anhand von GaAs, GaN und InN aufgezeigt.
8.1 Verallgemeinerte Wannier-Funktionen
8.1.1 Definition
Die Verallgemeinerten Wannier-Funktionen ergeben sich aus einer Erweiterung des Kon-
zepts der klassischen”, von G. H. Wannier 1937 zur Beschreibung angeregter Zust¨
ande in
kristallischen Isolatoren eingef¨
uhrten und nach ihm benannten Wannier-Funktionen [118].
Letztere sind definiert als Fourier-Transformation eines Energiebandes der Bloch-Zust¨
an-
de ψnkin der Brillouin-Zone, wobei der Quasi-Wellenvektor kin den Gittervektor R
¨
uberf¨
uhrt wird:2
|nRi:=
(2π)3ZBZ
eiR·k|ψnkid3k , (8.1)
wobei das Volumen der Einheitszelle ist und das Integral ¨
uber die Brillouin-Zone (BZ)
ausgef¨
uhrt wird. Tats¨
achlich birgt diese Definition Schwierigkeiten hinsichtlich der Normie-
rung, vgl. Anhang H.3, um Analogie zu den hier zitierten Ver¨
offentlichungen zu wahren,
sei sie jedoch auch hier verwendet. Die inverse Relation ergibt sich daraus durch Multipli-
kation mit eiR·kund anschließende Summation ¨
uber die Gittervektoren:
|ψnki=X
R
eiR·k|nRi.(8.2)
Da die Fourier-Transformation eine unit¨
are Transformation ist, bilden die Wannier-Funk-
tionen ein vollst¨
andiges Orthonormalsystem im Hilbertraum H:
hnR|nRi=δn,nδR,R,
X
n=1 X
R|nRihnR|=1.(8.3)
Nun sind (normierte) Eigenzust¨
ande eines Operators nur bis auf Phasenfaktoren genau
bestimmt, daraus ergeben sich Freiheiten bei der Wahl der Bloch-Funktionen:
|ψnki eiθ(n,k)|ψnki,(8.4)
2Man beachte: Es wird nicht ein Blochzustand |ψnkifouriertransformiert, wie etwa in (3.18), sondern
tats¨
achlich das Band in dem Sinne, dass (8.1) eine Linearkombination (Superposition) aus den Bloch-
zust¨
anden dieses Bandes darstellt.
8.1 Verallgemeinerte Wannier-Funktionen 113
wobei θeine beliebige reelle Funktion von nund kist. W¨
ahrend |eiθ(n,k)ψnk(r)|2aller-
dings invariant gegen¨
uber der Wahl von θist, trifft dies f¨
ur das Quadrat der resultie-
renden Wannier-Funktionen nicht mehr zu, vielmehr l¨
asst sich ihre Form und r¨
aumliche
Ausdehnung durch θbeeinflussen.
Eine praktische Schwierigkeit bei der Bestimmung der Wannier-Funktionen besteht
darin, dass die B¨
ander einer elektronischen Struktur im Allgemeinen nicht isoliert sind,
sondern an vielen Stellen Kreuzungen und Ber¨
uhrungspunkte (Entartungen) mit anderen
B¨
andern aufweisen. Eine Gruppe3solcher sich ¨
uberlagernder B¨
ander stellen z.B. die obe-
ren drei Valenzb¨
ander von GaAs dar, w¨
ahrend das untere Valenzband keine Entartungen
enth¨
alt und daher ein isoliertes Band ist (vgl. Abb. 8.5). Nur auf Letzteres l¨
asst sich daher
(8.1) direkt anwenden, f¨
ur die anderen stellt sich die Frage, auf welche Weise den Energien
die Bandindizes zugeordnet werden sollen.
Durch eine Verallgemeinerung von (8.4) l¨
asst sich dieses Problem jedoch umgehen.
Sei dazu eine Gruppe von NB¨
andern betrachtet, die in der Bandstruktur keine gemein-
samen Punkte mit energetisch h¨
oher oder tiefer liegenden B¨
andern besitzt. O.B.d.A. sei
der Bandindex mohne R¨
ucksicht auf die Gestalt der B¨
ander an jedem k-Punkt in ener-
getisch aufsteigender Reihenfolge festgelegt, wobei die Numerierung bei 1 beginne. Die
Menge der entsprechenden Blochfunktionen spannt im Hilbertraum Heinen Unterraum
T:= span{|ψnki|n {1,...,N},kBZ}auf. Zus¨
atzlich zur Freiheit bei der Wahl der
Phasenfaktoren sei nun auch eine Durchmischung der B¨
ander an einem k-Punkt zugelas-
sen: (8.4) wird erweitert zu
|ψnki
N
X
m=1
Uk
mn|ψmki,(8.5)
wobei die Uk
mn einen Satz unit¨
arer (N×N)-Matrizen darstellen. Durch diese so genannte
Eichtransformation werden die Blochfunktionen also zun¨
achst bzgl. des Bandindex trans-
formiert. Anschließend erfolgt genau wie in (8.1) noch eine Fouriertransformation bzgl. k.
Damit ergeben sich insgesamt die Verallgemeinerten Wannier-Funktionen [116] zu
|nRi:=
(2π)3ZBZ
eiR·k
N
X
m=1
Uk
mn|ψmki.(8.6)
Die Hintereinanderschaltung unit¨
arer Transformationen ist wiederum unit¨
ar, daher bleibt
bei einem Basiswechsel gem¨
(8.6) der Teilraum Tinvariant. Unterteilt man die gesamte
Bandstruktur geeignet in solche Gruppen von B¨
andern, gilt f¨
ur die Verallgemeinerten
Wannier-Funktionen daher ebenfalls (8.3).
Der Einfachheit halber soll sich der Begriff
Wannier-Funktion” im weiteren Kontext
dieser Arbeit immer auf diese Definition (8.6) beziehen. Funktionen im Sinne von (8.1)
seien als klassische Wannier-Funktionen” bezeichnet. Nat¨
urlich sind sie ein Spezialfall
von (8.6), wenn n¨
amlich alle Uk
mn diagonal gew¨
ahlt werden.
In Ortsdarstellung k¨
onnen alle Wannier-Funktionen zu festem ndurch Translation
ineinander ¨
uberf¨
uhrt werden:
hr|nRi=hrR|n0i.(8.7)
Daher reicht es h¨
aufig aus, nur die der Heimatzelle” R=0zugeordnete Wannier-Funk-
tion |n0izu betrachten. Der Beweis dieser Relation findet sich in Anhang H. Ferner ist
3Um Verwirrungen zu vermeiden: Der Begriff Gruppe” steht hier nicht mit dem gleichnamigen Begriff
aus der Gruppentheorie in Zusammenhang.
114 8 Verallgemeinerte Wannier-Funktionen als lokalisierte ab-initio-Basis ...
die Ladungsdichte in einem Halbleiter- oder Isolatorkristall invariant gegen¨
uber unit¨
aren
Transformationen der Ein-Teilchen-Wellenfunktionen, es gilt also
ρ(r) =
(2π)3
occ
X
nZBZ |ψnk(r)|2=
occ
X
nX
R|hr|nRi|2.(8.8)
Lokalisierte Wannier-Funktionen lassen sich als Orbitale interpretieren, die denen des in
der Chemie gebr¨
auchlichen Bildes zur Beschreibung kovalenter oder ionischer Bindungen
entsprechen. Verallgemeinerte wie auch klassische Wannier-Funktionen sind aber im All-
gemeinen keine Eigenfunktionen des Hamilton-Operators mehr.
Die hier beschriebene Vorgehensweise funktioniert zun¨
achst nur f¨
ur eine Gruppe von
B¨
andern, die durch eine Energiel¨
ucke von anderen B¨
andern isoliert ist. Sind die betrachte-
ten B¨
ander jedoch Teil einer gr¨
oßeren Gruppe zusammenh¨
angener B¨
ander z.B. bei der
Betrachtung eines Metalls —, l¨
asst sich mit einem in Ref. 117 vorgeschlagenen Algorith-
mus eine physikalisch sinnvolle Zuordnung des Bandindex erreichen: Beim ¨
Ubergang von
einem k-Punkt zum n¨
achsten wird die Zuordnung stets so gew¨
ahlt, dass die B¨
ander dabei
m¨
oglichst stetig verlaufen. Der Schwerpunkt der hier durchgef¨
uhreten Untersuchengen
lag jedoch auf einer m¨
oglichst guten Beschreibung der Bandl¨
ucke in der Umgebung des
Γ-Punktes, die Wahl der B¨
ander konnte dabei leicht manuell erfolgen.
8.1.2 Lokalisierung
Die Transformation (8.4) bzw. ihre Verallgemeinerung (8.5) beeinflussen die Gestalt und
damit die Lokalisierung der Wannier-Funktionen. Um zur Generierung einer TB-Basis
m¨
oglichst lokalisierte Wannier-Funktionen aufzufinden, muss Lokalisierung” zun¨
achst ge-
eignet definiert werden. In Ref. 116 wird dazu das Quadrat einer Wannier-Funktion im
Ortsraum als Verteilung aufgefasst, deren Varianz bzgl. der Variablen rdann zur Definition
der Streuung
S({Uk}) :=
N
X
n=1 hnR|r2|nRihnR|r|nRi2(8.9)
verwendet wird. Dies ist die Summe der Varianzen aller NWannier-Funktionen in der
Einheitszelle. Je kleiner die Streuung S, umso gr¨
oßer ist die Lokalisierung der Wannier-
Funktionen. Die Streuung wurde hier gleich als Funktion der Ukgeschrieben, da sie ¨
uber
die Wannier-Funktionen implizit von der Wahl der Basistransformation (8.6) abh¨
angt.
Wegen (8.7) gen¨
ugt es, diesen Ausdruck f¨
ur R=0auszuwerten.
F¨
ur das Weitere erweist es sich als vorteilhaft, die in (8.9) ben¨
otigten ersten beiden
Momente der
Wannier-Verteilung” im reziproken Raum darstellen zu k¨
onnen. Man findet
f¨
ur das erste Moment
hrin:= hn0|r|n0i= i
(2π)3ZBZhunk|∇k|unkid3k(8.10)
und f¨
ur das zweite Moment
hr2in:= hn0|r2|n0i=
(2π)3ZBZhunk|∇2
k|unkid3k , (8.11)
wobei die unk(r) = eik·rψnk(r) die periodischen Anteile der nach (8.5) transformier-
ten Blochzust¨
ande bezeichnen [119]. hrinkennzeichnet den Schwerpunkt” der Wannier-
Funktion |n0i.
8.1 Verallgemeinerte Wannier-Funktionen 115
Um diese beiden Ausdr¨
ucke auch numerisch auf einem diskreten k-Punkt-Gitter aus-
werten zu k¨
onnen, wird eine einfache Finite-Differenzen-Darstellung des Nabla-Opera-
tors kbenutzt, bei der f¨
ur einen Punkt kdie Differenzen kizu den n¨
achsten Nach-
barst¨
utzstellen ber¨
ucksichtigt werden. Eine solche Darstellung ist in Ref. 116 f¨
ur kubische
Systeme explizit angegeben. Setzt man diese Finite-Differenzen-Formeln in (8.10) und
(8.11) ein, erh¨
alt man zwar im Limes immer dichterer Aufl¨
osungen der Brillouin-Zone
(∆ki0) wieder die exakten Ausdr¨
ucke, f¨
ur diskrete Gitter jedoch erh¨
alt man bei einer
Verschiebung der Blochfunktionen um einen Gittervektor R0,
ψnk(r) ψnk(rR0) = eiR0·kψnk(r),
nicht mehr die erwartete analoge Translation der Wannier-Funktionen
hr|nRi hrR0|nRi.(8.12)
Korrektes Transformationsverhalten kann aber auch bei den diskretisierten Ausdr¨
ucken
erreicht werden, indem sie n¨
amlich in h¨
oherer Ordnung der kimodifiziert werden. Der
Grenz¨
ubergang ki0zur exakten Differentiation wird dadurch nicht ge¨
andert. Dis-
kretisierte Versionen von (8.10) und (8.11), die die Relation (8.12) erf¨
ullen, sind gegeben
mit
hrin 1
NX
i,k
wikiIm ln Mk,ki
nn (8.13)
und
hr2in1
NX
i,k
win(1 |Mk,ki
nn |2) + (Im ln Mk,ki
nn )2o,(8.14)
wobei if¨
ur jedes kdie n¨
achsten Nachbarst¨
utzstellen abz¨
ahlt, die jeweils noch mit einem
Faktor wigewichtet werden, und die Mk,ki
nn als Diagonalelemente der durch
Mk,ki
mn := humk|un,k+∆kii(8.15)
definierten ¨
Uberlapp-Matrix gegeben sind. Sie sind ein Maß f¨
ur die Unterschiedlichkeit
des periodischen Anteils der Blochfunktionen beim ¨
Ubergang von einem Punkt kzum
Nachbarpunkt k+ ki.
8.1.3 Maximale Lokalisierung
Um nun ¨
uber ein Variationsverfahren zu maximal lokalisierten Wannier-Funktionen zu
gelangen, muss der Gradient des Streufunktionals (8.9) bzgl. der Transformationsmatri-
zen Ukbekannt sein. F¨
ur ein diskretes k-Punkt-Gitter sei dessen Herleitung hier grob
skizziert. Die ¨
Anderung der Streuung h¨
angt ¨
uber die ersten beiden Momente (8.13) und
(8.14) von der ¨
Anderung der ¨
Uberlapp-Matrix (8.15) ab. Sie l¨
asst sich berechnen, indem
zun¨
achst infinitesimal kleine” Transformationen
exp{Wk}=1+ Wk+ h¨
ohere Ordnungen in Wk(8.16)
betrachtet werden. Damit die Transformationen unit¨
ar sind, m¨
ussen die Wkantihermi-
tesch sein; es soll also (∆Wk)+=Wkgelten, vgl. z.B. Ref. 125. In linearer Ordnung
wird (8.5) damit zu
|ψnki |ψnki+
N
X
m=1
Wk
mn|ψmki,(8.17)
116 8 Verallgemeinerte Wannier-Funktionen als lokalisierte ab-initio-Basis ...
woraus sich die ¨
Anderung der ben¨
otigten ¨
Uberlapp-Matrixelemente ergibt:
hunk|
N
X
m=1
(∆Wk
nm)humk|! |un,k+∆ki+
N
X
m=1
Wk+∆k
mn |um,k+∆ki!(8.18)
=Mk,k
nn +
N
X
m=1
Mk,k
nm Wk+∆k
mn
N
X
m=1
(∆Wk
nm)Mk,k
mn
|{z }
= Mk,k
nn
+ quadr. Term .
Benutzt man dies in (8.13) und (8.14), erh¨
alt man schließlich, nach einigen algebraischen
Umformungen und dem Grenz¨
ubergang Wk0, einen Ausdruck f¨
ur den Gradienten
der Streuung:
Gk:= dS
dWk= 4 X
i
wihA(Rk,ki)S(Tk,ki)i.(8.19)
Dabei bezeichnen S(B) := (B+B+)/2i und A(B) := (BB+)/2 den symmetrischen
bzw. antisymmetrischen Anteil einer Matrix B. Ferner gilt
Rk,k
nm := Mk,k
mn (Mk,k
nn )
und
Tk,k
nm := Mk,k
mn
Mk,k
nn
(Im ln Mk,k
nn + k·hrin).
Streng genommen ist (8.19) nicht der Gradient von Sbzgl. der unit¨
aren Transfomatio-
nen Uk, sondern der Gradient im Raum ihrer (durch i dividierten) Erzeugenden4. Die
Transformationen selbst sind dann analog zu (8.16) durch exp{Gk}gegeben. Im Raum der
Erzeugenden l¨
asst sich nun zur Minimierung des Streufunktionals das Steepest-Descent-
Verfahren (vgl. Abschnitt 4.1.2.1) anwenden. Dazu folgt man iterativ dem Gradienten in
kleinen Schritten ε Gk
s. Im Raum der unit¨
aren Transformationen wiederum ergeben sich
die Schritte dann rekursiv durch
Uk
s+1 := Uk
sexp{ε Gk
s}.(8.20)
Die Exponentialfunktion der antihermiteschen Matrizen Gk
skann durch Diagonalisierung
berechnet werden kann, vgl. z.B. Ref. 123.
Interessanterweise m¨
ussen w¨
ahrend der Minimierung keine Aktualisierungen der Ba-
sisfunktionen vorgenommen werden: im Iterationszyklus werden nur die Gr¨
oßen Uk
s,Gk
s
und Mk,k
sben¨
otigt. Anschließend k¨
onnen gem¨
(8.6) die Wannier-Funktionen in einem
Schritt aus den selbstkonsisten Ukberechnet werden. Aktualisierungen der ¨
Uberlapp-
Matrix sind dabei durch
Mk,k
s= (Uk
s)+Mk,k
0Uk+∆k
s(8.21)
gegeben. Diese letzte Beziehung macht das Verfahren sehr effizient, da bis auf den
Initialisierungschritt die aufwendige Berechnung nach (8.15) durch eine einfache Ma-
trizenmultiplikation ersetzt wird. Eine Herleitung von (8.21) findet sich in Anhang H.2.
8.1 Verallgemeinerte Wannier-Funktionen 117
(a) (b)
Abbildung 8.1: Das As-Atom und seine Bindungen zu den vier benachbarten Ga-Atomen im idealen
GaAs-Kristall. Gauß-f¨
ormige Ansatzfunktionen |gnif¨
ur die sp3-hybrid-artigen Wannier-Funktionen sind
(a) auf der Bindung genau in der Mitte zwischen zwei Nachbaratomen bzw. (b) auf der der Bindung
gegen¨
uberliegenden Seite des Anions positioniert, die Positionen (a) und (b) gehen dabei gerade durch
Spiegelung am As-Atom auseinander hervor. Es ist jeweils nur eine Ansatzfunktion gezeigt; bei der
Initialisierung sind die anderen entsprechend der tetraedrischen Symmetrie angeordnet. Die sich aus
diesen Ans¨
atzen ergebenden Wannier-Funktionen sind in Abb. 8.2 gezeigt.
8.1.4 Initialisierung
Um die Konvergenz des Verfahrens zu beschleunigen und um Nebenminima des Streuungs-
funktionals (8.9) zu vermeiden, sollte in (8.20) mit einem Startpunkt Uk
0begonnen werden,
der sich in der N¨
ahe des globalen Minimums befindet. Dazu macht man, geleitet beispiels-
weise durch die chemische Intuition, zun¨
achst grobe Ans¨
atze f¨
ur die Wannier-Funktionen,
die etwa durch geeignet positionierte, linear unabh¨
angige Gauß-Funktionen gnrealisiert
werden k¨
onnen, vgl. Abb. 8.1. Diese Ansatzfunktionen werden dann in zwei Schritten
in eine Orthonormalbasis des interessierenden Unterhilbertraums T:= span{|ψnki|n
{1,...,N},kBZ}(vgl. Abschnitt 8.1.1)¨
uberf¨
uhrt. Zun¨
achst erfolgt dazu eine Projek-
tion auf die Bloch-Basis:
|φnki=
N
X
m=1 |ψmkihψmk|gni.(8.22)
Dies wird anschließend noch mit Hilfe einer L¨
owdin-Transformation orthonormalisiert:5
|˜
ψnki=
N
X
m=1 1
Pmn |φmkimit Pmn := hφmk|φnki.(8.23)
Da sowohl (8.22) als auch (8.23) Basistransformationen in Tsind und das Ergebnis eine
Orthonormalbasis darstellt, folgt, dass ihre Hintereinanderschaltung unit¨
ar ist. Die Start-
punkte in (8.20) sind damit durch
(U0)k
mn :=
N
X
µ=1 hψmk|gµi1
Pµn
(8.24)
4Unter der Erzeugenden” einer unit¨
aren Transformation Usei hier ein hermitescher Operator Tmit
U= exp{iT}verstanden. Der Operator iTist dann antihermitesch, vgl. Gleichung (8.16).
5Die L¨
owdin-Transformation [120,121] ist ein Orthonormalisierungsverfahren, bei dem die Symmetrie-
eigenschaften des urspr¨
unglichen Basissatzes erhalten bleiben. Die Transformation (8.22) geschieht ganz
analog dazu, wie etwa die (nicht-orthonormalen, aber in der Symmetrie des Bravais-Gitters angeordneten)
atomaren Orbitale (AO) mittels der L¨
owdin-Transformation in LCAO-Orbitale ¨
uberf¨
uhrt werden k¨
onnen.
Physikalisch sinnvolle Ans¨
aze {gn}f¨
ur die Wannier-Basis werden im Allgemeinen ebenfalls die Symmetrie
des Bravais-Gitters widerspiegeln.
118 8 Verallgemeinerte Wannier-Funktionen als lokalisierte ab-initio-Basis ...
gegeben. In der Praxis erh¨
alt man bereits allein durch Anwendung dieser Uk
0in (8.6)
sehr lokalisierte Wannier-Funktionen. Der anschließende Iterationsprozess gem¨
(8.20)
schiebt” dann gewissermaßen nur noch kleinere Ausl¨
aufer der Wannier-Funktion in den
Hauptbereich der Lokalisierung. V¨
ollig lassen sich solche Nebenausl¨
aufer jedoch nicht ver-
meiden (vgl. z.B. Abb. 8.2,8.6 und 8.7); sie sorgen f¨
ur die Orthogonalit¨
at der Wannier-
Funktionen untereinander.
8.2 Ab-initio-Parametrisierung im Modell starker Bindung
Als Parameter im Modell starker Bindung seien hier die Matrixelemente des Hamilton-
Operators in der Darstellung einer stark lokalisierten Wannier-Basis bezeichnet. Mit der
Definition der Verallgemeinerten Wannier-Funktionen (8.6) findet man die Matrixelemente
hnR|H|nRi=2
(2π)6
N
X
m=1 Zeik·(RR)(Uk
mn)Uk
mnεmkd3k , (8.25)
wobei die εmkdie (mit den Blochfunktionen konsistenten) Ein-Teilchen-Energien sind.
F¨
ur |RR|= 0 erh¨
alt man Wechselwirkungen zwischen Wannier-Orbitalen, die der sel-
ben Einheitszelle Rzugeordnet sind, |RR|>0 beschreibt Wechselwirkungen zwischen
Atomen verschiedener Einheitszellen. Im Gegensatz zur Darstellung in klassischen Wan-
nier-Funktionen verschwinden hier Elemente mit n6=nim Allgemeinen nicht. Dies ist
eine Folge der Durchmischung der B¨
ander gem¨
(8.5) (vgl. Anhang H.3, wo auch die
Herleitung von (8.25) angegeben ist).
Die Effizienz der Wannier-Funktionen als TB-Basis h¨
angt nun davon ab, wieviele
Wechselwirkungen bei einer Diagonalisierung des (Wannier-)Hamilton-Operators explizit
ber¨
ucksichtigt werden m¨
ussen, oder anders formuliert, ab welcher Distanz Rmax Wech-
selwirkungen zwischen verschiedenen Zellen vernachl¨
assigt werden k¨
onnen. Ein geeigne-
tes Kriterium, um die Genauigkeit des Parametersatzes in Abh¨
angigkeit von Rmax zu
testen, ergibt sich aus einem Vergleich der originalen Bandstruktur mit der aus den
TB-Parametern berechneten. Letztere ergibt sich dabei aus der Diagonalisierung einer
k-abh¨
angigen Matrix Ekmit den Elementen
Ek
nnNRX
|R|<Rmax
eik·RhnR|H|n0i,(8.26)
wobei NRdie Anzahl der Einheitszellen im periodischen Grundgebiet ist [122].6Auf Grund
der Gitterperiodizit¨
at des Hamilton-Operators und der Translationseigenschaft der Wan-
nier-Funktionen (8.7) gehen in der rechten Seite nur Wechselwirkungen zu einer beliebigen
Referenzzelle (hier R=0) ein. Die Matrixelemente hnR|H|n0ilassen sich dabei als Ko-
effizienten einer Fourierentwicklung der Bandstruktur auffassen: Die grobe Gestalt der
B¨
ander wird bereits durch kleine |R|festgelegt, zur Beschreibung von Details wie etwa
den Bereich um den Γ-Punkt sind aber auch Wechselwirkungen mit weiter entfernten
Wannier-Funktionen zu ber¨
ucksichtigen. Es sei bemerkt, dass die Gleichung exakt wird,
wenn bei der Summation alle Gittervektoren aus dem periodischen Grundgebiet zugelas-
sen werden. Nat¨
urlich ist es jedoch das Ziel bei der Konstruktion einer TB-Basis, die Ukin
(8.25) so zu w¨
ahlen, dass die Approxiation auch bei m¨
oglichst kleinem Rmax noch hinrei-
chend genau ist. Gleichung (8.26) ist ferner auch insofern interessant, als sie ein schnelles
6Eine schrittweise Herleitung der Formel findet sich in Anhang H.4.
8.3 Lokalisierung kein Maß f¨
ur die G¨
ute der Basis 119
Sampling der BZ erm¨
oglicht, ohne dabei an jedem Punkt kden vollen Hamilton-Operator
diagonalisieren zu m¨
ussen.
¨
Ahnlich, wie in diesem Abschnitt f¨
ur den Hamilton-Operator vorgestellt, ließe sich
nun auch der nicht-lokale Austauschoperator VFock in der Basis der Wannier-Orbitale
darstellen. Wiederum w¨
are zu erwarten, dass Elemente mit gen¨
ugend großem |RR|
vernachl¨
assigt werden k¨
onnten. Allerdings ist zu erwarten, dass die Darstellung des Aus-
tauschoperators in der Wannier-Basis nicht so einfach gelingt wie die des Hamilton-
Operators (8.25), bei der sich ausnutzen ließ, dass die Wannier-Funktionen unit¨
are Trans-
formationen seiner Eigenfunktionen sind (vgl. Anhang H.3). Im Rahmen dieser Arbeit
wurde die ab-initio-Parametrisierung daher nur f¨
ur den Hamilton-Operator getestet.
Schema zur Konstruktion des Parametersatzes
Mit Hilfe der beiden vorangehenden Formeln l¨
asst sich nun ein Schema zur Generierung von
ab-initio-TB-Parameters¨
atzen angeben [122]. Es kann in f¨
unf Schritten zusammengefasst
werden:
(i) Berechnug der Blochzust¨
ande und Ein-Teilchen-Energien mit Hilfe eines geeigneten
N¨
aherungsverfahrens (DFT-LDA, DFT-EXX, etc.)
(ii) Wahl einer geeigneten Startkonfiguration f¨
ur die Wannier-Funktionen (vgl. Abschnit-
te 8.1.4 und 8.3)
(iii) Konstruktion einer lokalisierten Wannier-Basis gem¨
dem Variationsschema von
Marzari und Vanderbilt [116] (vgl. Abschnitt 8.1.3)
(iv) Berechnung der Hamilton-Matrix in der Wannier-Darstellung nach Gleichung (8.25)
(v) Mit Hilfe einer Rekonstruktion der Bandstruktur gem¨
(8.26)¨
uberpr¨
ufen, wieviele
Wechselwirkungen in dem Parametersatz ber¨
ucksichtigt werden m¨
ussen. Hier muss
ein sinnvoller Kompromiss zwischen der Effizienz und der Genauigkeit eingegangen
werden. Ist dies nicht m¨
oglich, muss ggf. in (ii) nach einer besseren Anfangskonfigu-
ration gesucht werden, vgl. den folgenden Abschnitt 8.3.
8.3 Lokalisierung kein Maß f¨
ur die G¨
ute der Basis
In Abschnitt 8.1.4 wurde beschrieben, wie sich mit Hilfe geschickt gew¨
ahlter Ansatz-
funktionen gngeeignete Startpunkte Uk
0f¨
ur den Maximierungsprozess der Lokalisierung
(vgl. Abschnitt 8.1.3) konstruieren lassen. Wie aber gelangt man nun zu solchen gn? Hier
wird man sich im Allgemeinen zun¨
achst von der chemischen Vorstellung leiten lassen und
Ans¨
atze f¨
ur die Wannier-Funktionen dort machen, wo man sie erwartet, beispielsweise
auf den atomaren Bindungen wie in Abbildung 8.1 (a) dargestellt. Im Rahmen dieser Ar-
beit durchgef¨
uhrte Tests [122] zeigten, dass die Qualit¨
at einer aus Wannier-Funktionen
konstruierten TB-Basis entscheidend von der Initialisierung abh¨
angen kann. Zugleich of-
fenbarten sie aber auch, dass die chemisch intuitive Wahl nicht in jedem Fall die optimalen
TB-Paramters¨
atze liefert es erweist sich vielmehr als notwendig, die Resultate verschie-
dener Startkonfigurationen hinsichtlich ihrer Eignung als TB-Basis sorgf¨
altig miteinander
zu vergleichen. Im Folgenden sei daher exemplarisch die Situation beschrieben, die sich
bei der Untersuchung des GaAs-Volumensystems ergab:
120 8 Verallgemeinerte Wannier-Funktionen als lokalisierte ab-initio-Basis ...
As
Ga
=S= 29.2 Bohr2
(a) (b)
=S= 28.8 Bohr2
(c) (d)
Abbildung 8.2: Zwei verschiedene Wannier-Basen in GaAs. Oben: F¨
ur diesen Satz erfolgte die Ini-
tialisierung der sp3-artigen Wannier-Funktionen (a) auf der Bindung (vgl. Abb. 8.1 (a)), w¨
ahrend die
s-artige Funktion (b) direkt auf dem Ga-Atom initialisiert wurde. Unten: (c) Bei diesem Satz haben die
Wannier-Funktionen, die gem¨
Abb. 8.1 (b) initialisiert wurden, nur noch bedingt einen sp3-artigen
Charakter, da sich ihr Ladungszentrum nun auf der der Bindung gegen¨
uberliegenden Seite befindet.
(d) Die s-artige Funktion wurde wiederum auf dem Ga-Atom initialisiert. Beide Basiss¨
atze weisen in
etwa die gleiche Lokalisierung auf. Von den sp3-artigen Funktionen (links) ist jeweils nur eine der vier
tetraedrisch angeordneten Funktionen dargestellt. In Abb. 8.3 wird ihre Eignung als tight-binding-Basis
untersucht.
Gem¨
dem in Abschnitt 8.2 vorgestellten Schema zur Konstruktion einer ab-initio-
TB-Basis m¨
ussen zuerst die Bloch-Funktionen |ψmkierzeugt werden. Dazu wurde in ei-
ner selbstkonsistenten DFT-Rechnung zun¨
achst die Ladungsdichte berechnet, wobei die
Austausch-Korrelationswechselwirkung ¨
uber das LDA-Funktional ber¨
ucksichtigt wurde.
Die k-Punkt-Integration erfolgte mit Hilfe eines symmetriereduzierten (4 ×4×4)-Monk-
horst-Pack-Gitters, die Abschneideenergie der Ebene-Wellen-Basis betrug 15 Ry, und es
wurde die experimentelle Gitterkonstante von 10.68 Bohr benutzt. Ferner wurden mit dem
Programm fhi98PP [115] nach dem Hamann-Verfahren [110] generierte Pseudopotentiale
verwendet, wobei die Elektronen der 4. Schale des Ga-Atoms als Valenz-, alle anderen als
Rumpfelektronen behandelt wurden. Um sp¨
ater mit der TB-Basis die Bandl¨
ucke beschrei-
ben zu k¨
onnen, wurden anschließend in einer Bandstrukturrechnung Blochfunktionen und
Ein-Teilchen-Energien der vier Valenzb¨
ander und des untersten Leitungsbandes bestimmt.
Dies geschah f¨
ur die Punkte eines nicht symmetriereduzierten Monkhorst-Pack-Gitters, das
den Γ-Punkt miteinschließt.
Nun wurde zun¨
achst die Initialisierung gem¨
dem chemisch intuitiven Bild getestet,
das folgende Konfiguration nahe legt: Die Beschreibung der besetzten Zust¨
ande, also der
Valenzb¨
ander, sollte durch vier Wannier-Funktionen pro Einheitszelle gelingen, die eine
Gestalt ¨
ahnlich der von sp3-Hybriden aufweisen und am (elektronegativeren) Anion lo-
kalisiert sind. Da die Zentren der Ladungswolken dabei jeweils auf einer der tetraedrisch
8.3 Lokalisierung kein Maß f¨
ur die G¨
ute der Basis 121
L
3ΓW
3
-2
-1
0
1
2
3
Energie [eV]
aus Wannier-Funktionen
aus ebenen Wellen
L
3ΓW
3
-2
-1
0
1
2
3
S = 29.2 Bohr2S = 28.8 Bohr2
Abbildung 8.3: Bandstruktur von GaAs in der Umgebung des Γ-Punktes. Die durch Kreise darge-
stellte Bandstruktur (links und rechts identisch) wurde aus einer Ebene-Wellen-Darstellung berechnet
(LDA), die durchgezogenen Kurven ergeben sich aus der Wannier-Darstellung. Links: Die auf den Bin-
dungen initialisierten Wannier-Funktionen (vgl. Abb. 8.1 (a) und Abb. 8.2 oben) versagen v¨
ollig bei
der Beschreibung der Bandl¨
ucke. Rechts: Werden stattdessen Wannier-Funktionen mit vergleichbarer
Lokalisierung verwendet, die aber jeweils auf der der Bindung gegen¨
uberliegenden Seite initialisiert wur-
den (vgl. Abb. 8.1 (b) und Abb. 8.2 unten), kann eine deutlich bessere Reproduktion der originalen
Bandstruktur erreicht werden. (Anmerkung: Die Knicke einiger durchgezogener Kurven am Γ-Punkt
sind auf den gew¨
ahlten Abstand der St¨
utzstellen zur¨
uckzuf¨
uhren, sind also rein numerisch bedingt und
stellen keine durch die Wannier-Basis ins Spiel kommenden Besonderheiten dar.)
angeordneten Bindungen zu erwarten sind, erfolgte die Positionierung der entsprechen-
den Ansatzorbitale (Gauß-Funktionen) wie in Abbildung 8.1 (a) demonstriert. F¨
ur das
Leitungsband steht damit noch eine Funktion pro Einheitszelle zur Verf¨
ugung, die sie
soll ja unbesetzte Zust¨
ande beschreiben auf dem Kation mit einer s-artigen Gestalt zu
erwarten w¨
are. Die Initialisierung erfolgte demgem¨
durch eine Gauß-Funktion direkt auf
dem Ga-Atom. Nach Projektion auf die Blochfunktionen betrug die Streuung der so kon-
struierten Startkonfiguration 107.1 Bohr2. Sie wurde in der anschließenden Minimierung
des Funktionals (8.9) um ca. 70% auf 29.2 Bohr2reduziert, wobei die in Abbildung 8.2 (a)
und (b) dargestellten lokalisierten Wannier-Funktionen entstanden. Tats¨
achlich entspricht
deren Form und Position in etwa der im Vorangehenden beschriebenen naiven” Erwar-
tung, wobei um das kationische s-Orbital noch einige an den benachbarten N-Atomen
lokalisierte Ausl¨
aufer mit sp-Charakter gruppiert sind, die die Orthogonalit¨
at der Basis-
funktionen untereinander gew¨
ahrleisten (vgl. Abschnitt 8.1.4).
Eine weitergehende Untersuchung machte allerdings deutlich, dass die Rekonstruktion
der Bandstruktur mit Hilfe dieses Basissatzes nur ¨
außerst langsam hinsichtlich der Anzahl
der ben¨
otigten Matrixelemente gegen die originale, d.h., direkt in der Ebene-Wellen-Basis
erzeugten Bandstruktur konvergiert. Selbst wenn Rmax in Gleichung (8.26) so groß ein-
gestellt wird, dass noch Wechselwirkungen zwischen Wannier-Funktionen viert-n¨
achster
Nachbarzellen erfasst werden, misslingt die Beschreibung des f¨
ur die optischen Eigen-
schaften relevanten Bereichs der BZ um den Γ-Punkt v¨
ollig: Die Bandl¨
ucke verschwindet,
122 8 Verallgemeinerte Wannier-Funktionen als lokalisierte ab-initio-Basis ...
In
N
In
hhN
(a) (b)
Ga
(((
(N
N
Ga
(c) (d)
Abbildung 8.4: Oben: Optimierte Wannier-Basis in InN. (a) Vier Wannier-Funktionen in der Form von
sp3-Hybriden sind an den Anionen lokalisiert. (b) Eine weitere Funktion befindet sich auf dem Kation,
weist aber keine klar s-artige Gestalt auf. Unten: Optimierte Wannier-Basis in GaN. (c) Vier Wannier-
Funktionen mit sp3-Gestalt sind wiederum an den Anionen lokalisiert. (d) Die f¨
unfte Basisfunktion
besitzt hier klaren s-artigen Charakter, befindet sich jedoch im Gegensatz zu InN ebenfalls auf dem
Anion.
wohingegen die Entartung bei Γ anstelle der oberen drei nur zwei Valenzb¨
ander umfasst
(vgl. linke Bandstruktur in Abb. 8.3). Somit erweist sich diese Basis f¨
ur die Konstruktion
eines TB-Parametersatzes als ungeeignet.
In einer Reihe weiterer Tests wurden nun von der intuitiven Vorstellung abweichen-
de Anfangskonfigurationen untersucht. Es zeigte sich, dass eine effiziente TB-Basis (d.h.,
eine Basis, in der sich hinreichende Genauigkeit bei Ber¨
ucksichtigung m¨
oglichst weniger
Wechselwirkungen erreichen l¨
asst) mit folgender Initialisierung konstruiert werden kann:
W¨
ahrend wie zuvor eine Gauß-Funktion f¨
ur das s-Orbital auf dem Kation angesetzt wird,
werden die anderen vier nicht mehr auf den Bindungslinien platziert, sondern jeweils auf
der der Bindung gegen¨
uberliegenden Seite des Anions, genauer: sie gehen aus den alten
Ans¨
atzen f¨
ur die sp3-Hybride durch Spiegelung am As-Kern hervor. Dies ist in Abbil-
dung 8.1 (b) veranschaulicht. Anschließende Projektion dieser Konfiguration auf die Bloch-
funktionen und Minimierung liefert die in Abbildung 8.2 (c) und (d) gezeigten Wannier-
8.4 Optimierte Wannier-Basen f¨
ur GaN und InN 123
LΓW K Γ
-16
-12
-8
-4
0
4
8
Energie [eV]
aus Wannier-Funktionen
aus ebenen Wellen
LΓW K Γ
-16
-12
-8
-4
0
4
8
Energie [eV]
InN GaN
Abbildung 8.5: Bandstrukturen von InN (links) und GaN (rechts). Es ist jeweils das Resultat der
originalen DFT-EXX-Berechnung in ebenen Wellen (Kreise) im Vergleich mit der Rekonstruktion aus den
TB-Parametern (durchgezogene Linien) dargestellt. In den Parameters¨
atzen werden Wechselwirkungen
zwischen Wannier-Funktionen bis zu den viert-n¨
achsten Nachbarzellen ber¨
ucksichtigt. F¨
ur die Bandl¨
ucke
ergibt sich eine Abweichung von ca. 0.04 eV bei InN und ca. 0.3 eV bei GaN.
Funktionen. Die Streuung wurde dabei um ca. 80% auf 28.9 Bohr2reduziert, d.h., der
intuitive und der hier konstruierte Ansatz f¨
uhren zwar zu verschiedenen Minima des Streu-
funktionals (8.9), in beiden F¨
allen besitzen die entsprechenden Wannier-Basen aber eine
vergleichbare Lokalisierung. Die Rekonstruktion der Bandstruktur offenbart nun jedoch
den Vorteil der zweiten Wannier-Basis f¨
ur die Konstruktion eines TB-Parametersatzes:
Zumindest in der interessierenden Region um den Γ-Punkt l¨
asst sich das Resultat der
Ebene-Wellen-Rechnung deutlich besser reproduzieren (die maximale Abweichung im Be-
reich des Γ-Punkts betr¨
agt 0.11 eV), wenn in Gleichung (8.26) Wechselwirkungen noch bis
zu den viert-n¨
achsten Nachbarzellen miteinbezogen werden (vgl. rechte Bandstruktur in
Abb. 8.3).
Dieses Beispiel zeigt, dass die Lokalisierung alleine noch kein ausreichendes Kriterium
zur Generierung effizienter TB-Basen darstellt. Tats¨
achlich w¨
are auch zu erwarten, dass
ein zu beschreibender Operator Xselbst die Gestalt einer optimalen Basis beeinflusst. De-
finiert man Effizienz” in diesem Zusammenhang ¨
uber die Anzahl der (f¨
ur eine gegebene
Genauigkeit) ben¨
otigten Matrixelemente, ließe sich bei der Variation der unit¨
aren Trans-
formationsmatrizen Ukin (8.6) beispielsweise fordern, dass hnR|X|nRials Funktion
der Gittervektoren Rund Rein m¨
oglichst starkes Abklingverhalten bzgl. des Abstan-
des |RR|der Einheitszellen aufweist. Damit w¨
are etwa (8.26) automatisch optimiert,
eine Nachjustierung per Hand” wie oben geschildert w¨
are nicht mehr notwendig. Diese
Idee ist hier als Ausblick zu verstehen, eine Weiterentwicklung des Ansatzes geht ¨
uber die
Zielstellung dieser Arbeit hinaus.
124 8 Verallgemeinerte Wannier-Funktionen als lokalisierte ab-initio-Basis ...
8.4 Optimierte Wannier-Basen f¨
ur GaN und InN
Der in Abschnitt 8.2 vorgestellte Formalismus wurde nun auf GaN und InN in Zink-
blendestruktur angewandt [122]. Daf¨
ur wurden in einem ersten Schritt wieder die Bloch-
funktionen erzeugt. Die Vorgehensweise war dabei v¨
ollig analog wie im vorangehenden
Abschnitt f¨
ur GaAs beschrieben, allerdings wurden die DFT-Berechnungen nun mit Hil-
fe des EXX-Formalismus durchgef¨
uhrt. Wiederum wurde f¨
ur die k-Punkt-Integration ein
(4 ×4×4)-Monkhorst-Pack-Gitter verwendet, die Abschneideenergie der Ebene-Wellen-
Berechnung betrug 50 Ry f¨
ur InN und 60 Ry im Falle von GaN. Es wurden relativisti-
sche OEP-Pseudopotentiale benutzt [111,112], die d-Elektronen der Kationen wurden als
Rumpfelektronen betrachtet. Damit ergeben sich Bandl¨
ucken von 1.48 eV bei InN und
3.57 eV bei GaN. Die entsprechenden Bandstrukturen sind in Abbildung 8.5 gezeigt.
F¨
ur die Optimierung der TB-Basen wurden nun wieder verschiedene Startkonfiguratio-
nen f¨
ur die Wannier-Orbitale untersucht. Anders als bei GaAs erwies sich f¨
ur die betrach-
teten Gruppe-III-Nitride eine Initialisierung von jeweils vier Orbitalen auf den Bindungen
(analog zu Abb. 8.1 (a)) als vorteilhafter als die Initialisierung auf den gegen¨
uberliegen-
den Seiten. Nach der Minimierung wurden so in beiden Materialen zu den Anionen (N)
hin orientierte Bindungsorbitale mit deutlichen sp3-Charakter ausgepr¨
agt, vgl. Abb. 8.4.
In ¨
Ubereinstimmung mit der chemischen Vorstellung befindet sich in InN die Position
des f¨
unften Orbitals auf dem Kation (In). Seine Gestalt weicht dabei allerdings stark von
der f¨
ur ein s-Orbital typischen Kugelform ab (Abb. 8.4 (b)). Deutlichen s-Charakter
tr¨
agt hingegen das f¨
unfte Orbital der f¨
ur GaN optimierten Wannier-Basis. Seine Position
befindet sich hier jedoch entgegen der Erwartung auf dem Anion (Abb. 8.4 (d)).
Abbildung 8.5 zeigt eine sehr gute ¨
Ubereinstimmung der originalen EXX-Bandstruktur,
die mit Hilfe einer Ebene-Wellen-Rechnung erzeugt wurde, und ihrer Rekonstruktion aus
den ab-initio-TB-Parametern. Insbesondere zeigt sich, dass auch die Bandl¨
ucke mit Hil-
fe des erzeugten Paramatersatzes korrekt reproduziert werden konnte. Dies ist plausibel:
Denn w¨
ahrend die Konstruktion der Wannier-Orbitale gem¨
(8.6) nur von den Wellen-
funktionen abh¨
angt, die in EXX und LDA/GGA nur unwesentlich voneinander verschieden
sind, fließen in die Berechnung der ab-initio-Parameter gem¨
(8.25) auch die Einteilchen-
Energien ein. Der Zugang kann damit sensibel auf die durch EXX erreichte deutliche
Verbesserung der Bandstruktur reagieren, was mit den in Abb. 8.5 gezeigten Ergebnissen
gut best¨
atigt wird.
Es sei an dieser Stelle noch einmal explizit darauf hingewiesen, dass die Verwendung
von im Vergleich zu LDA/GGA sehr komplizierten und numerisch aufwendigen Funktiona-
len wie hier dem EXX-Funktional f¨
ur die Konstruktion der ab-initio-TB-Parameter keiner-
lei zus¨
atzlichen Aufwand darstellt. Sind einmal die Wellenfunktionen und die Einteilchen-
Energien bekannt, geschieht die Konstruktion der Parameter stets auf die gleiche Art und
Weise (vgl. Abschnitt 8.2), v¨
ollig unabh¨
angig von den Anforderungen, die zur Berech-
nung eben dieser Wellenfunktionen und Einteilchen-Energien vonn¨
oten sind. Die verwen-
deten Eingangsdaten m¨
ussen noch nicht einmal aus einer DFT-Rechnung herr¨
uhren, so
k¨
onnen beispielsweise Ergebnisse einer Hartree-Fock-Rechnung ebenso als Grundlage zur
Konstruktion Verallgemeinerter Wannier-Orbitale und entsprechender TB-Parameters¨
atze
dienen, einzige Bedingung ist dabei, dass sich die Wellenfunktionen der vorausgehenden
Rechung als Blochwellen (vgl. Abschnitt 3.1) darstellen lassen.
Ein interessanter Ausgangspunkt f¨
ur weiterf¨
uhrende Untersuchungen w¨
are zudem, die
Methode auch auf Ergebnisse von EXX+GW-Berechnungen aufzusetzen, eine der zurzeit
genausten Methoden zur Berechnung von Bandl¨
ucken [170,171,172,173,174,175]. Hier
8.4 Optimierte Wannier-Basen f¨
ur GaN und InN 125
ist allerdings zu beachten, dass GW nur Korrekturen zu den Einteilchen-Energien liefert,
nicht aber zu den Wellenfunktionen. Bei der Konstruktion der ab-initio-Parameter gem¨
(8.25) w¨
urden die GW-Korrekturen folglich nur die Einteilchen-Energien beeinflussen, die
Wellenfunktionen w¨
aren weiterhin einer EXX-Rechnung zu entnehmen.
126 8 Verallgemeinerte Wannier-Funktionen als lokalisierte ab-initio-Basis ...
GaN
c= 0.08
c= 0.03
c= 0.02
sp3-artig s-artig
Abbildung 8.6: Verallgemeinerte Wannier-Orbitale in GaN (Ga: gr¨
un, N: blau) f¨
ur verschiedene
Isofl¨
achenparameter c. Linke Spalte: sp3-artiges, rechte Spalte: s-artiges Wannier-Orbital. Bei klei-
nen cerkennt man, dass die Funktionen neben dem Hauptlokalisierungsgebiet noch zahlreiche kleinere
Ausl¨
aufer besitzen.
8.4 Optimierte Wannier-Basen f¨
ur GaN und InN 127
InN
c= 0.06
c= 0.04
c= 0.015
sp3-artig s-artig
Abbildung 8.7: Verallgemeinerte Wannier-Orbitale in InN (In: rot, N: blau) f¨
ur verschiedene Isofl¨
achen-
parameter c. Linke Spalte: sp3-artiges, rechte Spalte: s-artiges Wannier-Orbital. Bei kleinen cerkennt
man, dass die Funktionen neben dem Hauptlokalisierungsgebiet noch zahlreiche kleinere Ausl¨
aufer be-
sitzen.
X
Zusammenfassung und Ausblick
Es sei zuerst eine kurze Zusammenfassunge der beiden Teile der vorliegenden Arbeit
Variationelle EXX-Methode (Teil I), Verallgemeinerte Wannier-Funktionen als lokalisier-
te ab-initio-Basis (Teil II) gegeben. Anschließend wird eine kurze Einordnung dieser
Arbeit in die aktuelle wissenschaftliche Entwicklung auf dem Gebiet der theoretischen
Festk¨
orperphysik versucht.
Zu Teil I (Variationelles EXX-Verfahren)
Schwerpunkt der vorliegenden Arbeit war die Entwicklung und Implementierung des varia-
tionellen EXX-Verfahrens (varEXX) [78,79,80] in einen Pseudopotential-Ebene-Wellen-
Code (S/PHI/nX [81,82]), um diese Methode, die bislang nur f¨
ur Atome und Cluster
getestet worden ist, so erstmalig auch f¨
ur periodische Systeme verf¨
ugbar zu machen.
Die Programmierung des varEXX-Verfahrens umfasste im Wesentlichen vier Schritte:
(i) Die Implementierung eines geeigneten Minimierungsverfahrens zur L¨
osung der Stern-
heimer-Gleichung (Abschnitt 4.1). Hierf¨
ur wurden verschiedene Algorithmen (Stee-
pest-Descent,Conjugate-Gradient,Preconditioned Conjugate-Gradient) getestet.
(ii) Die Erzeugung der induzierten Ladungsdichte (Abschnitt 4.2).
(iii) Ein geeignetes Verfahren f¨
ur das Mixing von Potential und induzierter Ladungs-
dichte (Abschnitt 4.3). Die prinzipielle Vorgehensweise wurde dabei zun¨
achst mit
dem einfachen Mixing untersucht. Anschließend wurde eine optimierte Version des
Pulay-Mixers an die Erfordernisse im varEXX-Verfahren angepasst. Interessanter-
weise zeigte sich dabei, dass eine Pr¨
akonditionierung des Mixers nach dem Kerker-
Schema, wie es etwa beim selbstkonsistenten L¨
osen der Kohn-Sham-Gleichung f¨
ur
das Mischen der Ladungsdichte verwendet wird, f¨
ur das Mixen von Potential und
induzierter Ladungsdichte ungeeignet ist. Stattdessen findet man, dass durch die Be-
sonderheit des Mischens dieser unterschiedlichen Gr¨
oßen der Kerker-Ansatz bereits
implizit erf¨
ullt ist.
(iv) Die Berechnung des nicht-lokalen Austauschoperators (Abschnitt 4.4). Die numeri-
sche Auswertung dieser Gr¨
oße erweist sich aus zweierlei Gr¨
unden als sehr aufwendig:
zum einen muss die Singularit¨
at des Nenners in geeigneter Weise gehandhabt wer-
den, und zum anderen gestaltet sich die Symmetrisierung außerordentlich schwierig.
Dieser Schritt ist daher der problematischste des Verfahrens (siehe unten).
Das Verfahren wurde anschließend auf eine Reihe von Halbleitern angewandt und seine
Leistung mit der einer bereits im Code vorhandenen Implementierung des Standard-EXX-
Verfahrens verglichen. Mit dem variationellen Ansatz gelang es, die ben¨
otigte CPU-Zeit
129
130 Zusammenfassung und Ausblick
dabei ungef¨
ahr zu halbieren und den Speicherbedarf sogar auf rund 1/3 zu reduzieren.
Es zeigte sich zudem, dass varEXX umso effektiver gegen¨
uber der Standard-Methode ist,
je h¨
oher die Abschneideenergie der Ebene-Wellen-Basis angesetzt wird. Rechnet man fer-
ner den Anteil der vom nicht-lokalen Austauschoperator1ben¨
otigten CPU-Zeit heraus,
erlaubt der variationelle Zugang sogar eine Reduktion der Rechenzeit um rund einen Fak-
tor 10. Zudem erwies sich der Algorithmus als sehr stabil: In der Regel wurde ein LDA-
Austauschpotential als Start f¨
ur den selbstkonsistenten DFT-EXX-Zyklus verwendet, je-
doch zeigten Tests an GaAs, GaN und InN, dass das Verfahren auch mit der Nullfunktion
(also keinem Ansatz, der sich bereits in der N¨
ahe des exakten EXX-Potentials befindet)
als Startpunkt konvergiert.
Der Engpass des Verfahrens (vor allem hinsichtlich der CPU-Zeit) ist der nicht-lokale
Austauschoperator; zuk¨
unftige Versuche einer weiteren Effizienzsteigerung des EXX-Ver-
fahrens m¨
ussen an dieser Stelle ansetzen. Wie in Abschnitt 4.4.2 bereits angedeutet, er-
scheint dazu die Auswertung des nicht-lokalen Austauschoperators in der Ortsdarstellung
eine geeignete Maßnahme. Interessant w¨
are es auch, zu untersuchen, inwieweit sich durch
die Verwendung einer Basis Verallgemeinerter Wannier-Funktionen (siehe unten) Vorteile
in Bezug auf die Handhabung dieses Operators erzielen lassen.
Der erste Teil der Arbeit schließt mit einer Untersuchung der Linearit¨
at des exak-
ten Austauschpotentials als Funktional der Ladungsdichte. Speziell wurde am Beispiel
von GaN und InN untersucht, ob die bei der Verwendung von Pseudopotentialen bei die-
sen Materialien ¨
ubliche Aufspaltung in Rumpf- und Valenzelektronen im Bereich der so
genannten semi-core-Schale (s- und p-Schale in den Rumpf, d-Schale in die Valenz) hin-
sichtlich des exakten Austauschpotentials zul¨
assig ist. Die Ergebnisse entsprechender DFT-
EXX-Rechnungen wurden daf¨
ur mit denen von Berechnungen verglichen, die die gesamte
semi-core-Schale des Kations in der Valenz ber¨
ucksichtigen. Diese f¨
ur eine Absch¨
atzung
der Leistungsf¨
ahigkeit der EXX-Methode insgesamt sehr wichtigen Untersuchungen wur-
den erstmalig durch den im Rahmen dieser Arbeit implementierten varEXX-Formalismus
erm¨
oglicht. Durch die errechneten Daten wird die Annahme gest¨
utzt, dass es sich beim
EXX-Potential um ein zumindest ann¨
ahernd lineares Funktional der Dichte handelt. Zwar
ergeben sich kleine Differenzen in der Bandl¨
ucke (ca. 0.2 eV bei InN), jedoch muss bei Ver-
wendung von Pseudopotentialen ohnehin von einer Fehlertoleranz in dieser Gr¨
oßenordnung
ausgegangen werden. Insbesondere wurde sowohl mit als auch ohne Ber¨
ucksichtung der
d-Elektronen in der Valenz eine weitgehende ¨
Ubereinstimmung der Ladungsdichtevertei-
lung gefunden (abgesehen von Bereichen in unmittelbarer N¨
ahe der Kationen-Kerne, in
denen man wegen der durch die Pseudopotentiale verursachten Verzerrungen auch keine
Vergleichbarkeit erwarten kann).
Die gefundenen Ergebnisse zeigen, dass sich EXX-Berechnungen damit anders verhal-
ten als die nicht-linear konzipierte GW -Methode: Entsprechende GW-Resultate auf der
Basis von DFT-LDA-Berechnungen (LDA+GW) f¨
ur GaN zeigen, dass sich bei dieser Me-
thode die Bandl¨
ucke dieses Halbleiters bei Hinzunahme der d-Zust¨
ande in die Valenz um
0.71 eV verringert (vgl. Rohlfing et al. [152]).
1Der nicht-lokale Austauschoperator wird sowohl im Standard- als auch im variatonellen EXX-Verfahren
ben¨
otigt.
Zusammenfassung und Ausblick 131
Zu Teil II (Verallg. Wannier-Funktionen als lokalisierte ab-initio-Basis)
Hier wurde eine im Rahmen dieser Arbeit entwickelte Konstruktionsmethode f¨
ur ab-initio-
Basiss¨
atze im Tight-Binding-Modell [122] vorgestellt. Die Methode benutzt die Ergebnisse
(Wellenfunktionen und Einteilchen-Energien) einer vorausgehenden Berechnung des ent-
sprechenden (periodischen) Systems als Eingangsdaten. Daraus werden mit Hilfe einer
systematischen Konstruktionsvorschrift zun¨
achst Verallgemeinerte Wannier-Orbitale und
anschließend TB-Parameter erzeugt. Hierbei werden keinerlei empirischen Anpassungen
o.¨
A. vorgenommen, d.h., die erzeugten TB-Parameter sind reine ab-initio-Gr¨
oßen (un-
ter der Voraussetzung, dass die vorausgehende Berechnung der Wellenfunktionen und
Einteilchen-Energien ebenfalls ab-initio erfolgte). Als großer Vorteil der Methode kann wei-
terhin gewertet werden, dass die Konstruktion der ab-initio-Parameter v¨
ollig unabh¨
angig
von der speziellen Wahl des Verfahrens zur Erzeugung der Eingangsdaten ist: So bedeutet
etwa die Konstruktion eines ab-initio-Parametersatzes auf Grundlage einer DFT-EXX-
Rechnung keinen Mehraufwand gegen¨
uber einer entsprechenden Konstruktion aus DFT-
LDA-Daten. Neuartige Verfahren, die ¨
uber Standard-DFT-Funktionale hinausgehen, las-
sen sich also sehr einfach in diesen Formalismus integrieren. Schließlich ist zu betonen, dass
durch die ab-initio-Konstruktion die Genauigkeit der jeweils zu Grunde liegenden Daten in
den Parameters¨
atzen konserviert” wird. Mit Hilfe von TB-Parametern, die etwa aus einer
EXX-Rechnung gewonnen wurden, lassen sich somit wieder die EXX-Bandl¨
ucken reprodu-
zieren. Die Bedeutung der in dieser Arbeit entwickelten TB-Methode liegt nun darin, dass
sie eine M¨
oglichkeit er¨
offnet, die Genauigkeit von Berechnungen ¨
uber EXX- und andere
komplizierte Funktionale, deren direkte Anwendung mit der derzeitigen Computerleistung
nur auf Systeme mit wenigen Atomen beschr¨
ankt ist, auf mesoskopische Skalen mit ca.
10 000 Atomen (z.B. Quantenpunkte) ¨
ubertragen zu k¨
onnen.
Das Verfahren wurde im Rahmen der Arbeit an GaAs, GaN und InN in der Zinkblende-
Phase getestet. Mit einer DFT-Rechnung wurden dazu in einem ersten Schritt Ein-Teilchen-
Zust¨
ande und -Energien erzeugt. Durch die Verwendung von EXX-Funktionalen erh¨
alt
man dabei einen TB-Parametersatz, der f¨
ur die Berechnung optischer Matrixelemente
geeignet ist (siehe oben). Anschließend wurde die Basis der Eigenfunktionen (oder ein
geeigneter Unterraum) durch eine unit¨
are Transformation in eine Basis Verallgemeinerter
Wannier-Funktionen ¨
uberf¨
uhrt. Bei dieser Transformation entsteht kein Verlust an Genau-
igkeit. Die Lokalisierung der Wannier-Funktionen l¨
asst sich ¨
uber ihre Varianz (Streuung)
im Ortsraum messen; eine Minimierung dieses Funktionals f¨
uhrt auf Wannier-Funktionen
mit maximaler Lokalisierung, die daher als Tight-Binding-Orbitale einsetzbar sind. Ei-
ne Darstellung des Hamilton-Operators in dieser Basis liefert Tight-Binding-Parameter,
deren Genauigkeit sich leicht durch die Anzahl der ber¨
ucksichtigten N¨
achste-Nachbar-
Wechselwirkungen kontrollieren l¨
asst.
Erste Tests an GaAs offenbarten jedoch, dass die Minimierung der Varianz kein ausrei-
chendes Kriterium f¨
ur die Erzeugung effizienter Tight-Binding-Parameters¨
atze darstellt.
Verschiedene S¨
atze Verallgemeinerter Wannier-Funktionen mit vergleichbarer minimaler
Streuung, jedoch sehr unterschiedlicher Konvergenz bzgl. der N¨
achsten-Nachbar-Wechsel-
wirkung wurden gefunden, indem die Minimierung von verschiedenen Anfangskonfigura-
tionen aus gestartet wurde. Dies zeigt die Notwendigkeit sorgf¨
altiger Tests der Anfangs-
konfiguration bei der Konstruktion der Orbitale.
Die optimalen Wannier-Orbitale, die dabei f¨
ur InN gefunden wurden, stehen im Ein-
klang mit der chemischen Intuition: es ergeben sich vier sp3-artige Orbitale, die jeweils
am Anion lokalisiert sind, und ein s-artiges Orbital auf dem Kation. F¨
ur GaN ergeben
sich zwar ebenfalls vier auf den Anionen platzierte sp3-artige Orbitale, die s-artigen Or-
132 Zusammenfassung und Ausblick
bitale sind hier aber, im Gegensatz zur chemischen Intuition, ebenfalls auf den Anionen
lokalisiert.
Eine Weiterentwicklung der Methode k¨
onnte darin bestehen, nicht die Lokalisierung der
Wannier-Funktionen zu minimieren, sondern etwa bei der unit¨
aren Transformation auf die
Wannier-Basis zu fordern, dass die Matrixelemente des betrachteten Operators (z.B. des
Hamilton-Operators) in dieser Darstellung ein m¨
oglichst starkes Abklingverhalten bzgl.
des Abstandes |RR|der Gittervekoren aufweisen. Diese Strategie w¨
urde automatisch
auf einen optimierten Tight-Binding-Parametersatz f¨
uhren.
Einordung der Arbeit in die aktuelle Forschung
Die Situation zu Beginn der vorliegenden Untersuchungen l¨
asst sich etwa wie folgt um-
reißen: In der Kohn-Sham-Dichtefunktionaltheorie wurden eine Vielzahl von Austausch-
Korrelationsfunktionalen entwickelt (LDA, GGAs), die zwar effiziente Berechnungen er-
lauben, aber f¨
ur Fragestellungen, die eine genaue Beschreibung der Bandl¨
ucke von Isolato-
ren und Halbleitern ben¨
otigen (bspw. optische Eigenschaften des Materials), zu ungenau
sind. Demgegen¨
uber steht das EXX-Funktional, das insbesondere in Kombination mit ei-
ner anschließenden GW-Korrektur ¨
außerst genaue Vorhersagen der Bandl¨
ucke erm¨
oglicht,
das andererseits aber so hohe numerische Anforderungen stellt, dass die Anwendung auf
einfachste Systeme beschr¨
ankt bleibt (siehe Einleitung), und damit ein Einsatz bei kom-
plexeren Untersuchungen nicht m¨
oglich ist.
Hier setzt nun die vorliegende Arbeit an: Es konnte gezeigt werden, dass sich durch
die Verwendung einer alternativen, variationellen Formulierung des EXX-Verfahrens der
ben¨
otigte numerische Aufwand auch f¨
ur periodische Systeme drastisch reduzieren l¨
asst.
Durch den variationellen Ansatz gelingt es, zwei der drei Engp¨
asse der originalen For-
mulierung (Greensche Funktion, Inversion der linearen Antwort, nicht-lokaler Austausch-
operator) durch numerisch einfache Minimierungsverfahren zu ersetzen, was ca. eine Ver-
dopplung der Rechengeschwindigkeit bei weniger als einem Drittel des ben¨
otigten Speicher-
platzes erm¨
oglicht. Ohne die f¨
ur den Austauschoperator des nun einzig verbleibenden
Engpasses ben¨
otigte Zeit gemessen, l¨
asst sich sogar eine bis zu ca. 10 mal schnellere
Rechenzeit erzielen (siehe oben).
Die M¨
oglichkeiten f¨
ur den praktischen Einsatz von EXX-Potentialen wurden damit
entscheidend erweitert, so dass nun neue und deutlich komplexere Fragestellungen an-
gegangen werden k¨
onnen. Im Rahmen dieser Arbeit wurde dies am Beispiel von EXX-
Pseudopotential-Berechnungen f¨
ur GaN und InN demonstriert, die sich erstmalig unter
Mitnahme der kationischen s- und p-semi-core-Schalen in der Valenz durchf¨
uhren ließen.
Vor allem aber sei an dieser Stelle hervorgehoben, dass sich durch die variationelle EXX-
Methode zugleich auch der Anwendungsbereich von EXX+GW vergr¨
oßert eines der
zurzeit pr¨
azisesten Verfahren zur Bestimmung von Bandstrukturen und Gegenstand akti-
ver Forschung [170,171,172,173,174,175]. Nicht zuletzt zeigt auch der im zweiten Teil
der Arbeit entwickelte ab-initio-TB-Ansatz eine Richtung auf, wie sich die Genauigkeit
von EXX- und anderen ¨
uber herk¨
ommliche DFT-Funktionale hinausgehenden Potentialen
effizient sogar auf Systeme mesoskopischer Gr¨
oßenordung ¨
ubertragen l¨
asst.
Anh¨
ange
133
X
Anhang A
Fourier-Entwicklungen einiger
wichtiger Gr¨
oßen
Um Un¨
ubersichtlichkeiten durch zu viele Klammern zu vermeiden, sei das Konjugiert-
Komplexe einer Variablen in den folgenden Abschnitten durch einen Querstrich (z.B. ¯z)
bezeichnet und nicht wie sonst in dieser Arbeit ¨
ublich mit einem Sternchen (z).
A.1 Das Coulomb-Potential
An einigen Stellen im Text wird die Fouriertransformierte des Coulomb-Potentials benutzt.
Ihre Herleitung wird in vielen Lehrb¨
uchern, z.B. in Ref. 92, explizit vorgef¨
uhrt, daher sei
hier nur das Ergebnis zusammengefasst:
vCoul(r) := 1
r ˆvCoul(G) := 1
Z1
reiGrd3r1
4π
G2,(A.1)
wobei das Volumen der durch die Vektoren a1,a2,a3aufgespannten Einheitszelle ist, vgl.
Abschnitt 3.1. Es sind zwei Schwierigkeiten zu beachten: (i) Das Coulomb-Potential vCoul
ist keine periodische Funktion; die Voraussetzung f¨
ur eine Fourierreihen-Darstellung ist
somit nicht erf¨
ullt. Wendet man den Formalismus trotzdem an, ergibt sich eine k¨
unstliche
Periodisierung des Potentials, die im Ortsraum der Superposition PRvCoul(r+R)¨
uber
alle Gittervektoren Rentsprechen w¨
urde. (ii) Auf Grund des schwachen Abfallverhaltens
von vCoul(r) geht diese Summe jedoch gegen f¨
ur alle rIR3, was sich in der Singularit¨
at
von (A.1) f¨
ur die (G=0)-Komponente widerspiegelt. Man behift sich daher meist mit der
Vorstellung, dass das Volumen insgesamt ladungsneutral ist, dass also zu jeder Ladung
eine entprechende Ladung mit entgegensetztem Vorzeichen existiert. Dann heben sich die
Singularit¨
aten gegenseitig weg, und es werden nur noch die Komponenten mit G6=0
ber¨
ucksichtigt. Sollen allgemeine Ergebnisse speziell f¨
ur ebene Wellen formuliert werden
wie im Folgenden der Austauschoperator —, substituiert man daher n¨
aherungsweise
1
r 4π
X
G6=0
1
G2e+iGr .(A.2)
A.2 Der nicht-lokale Austauschoperator
Es sei zun¨
achst bemerkt, dass der Austauschoperator (1.27) bei einem gitterperiodischen
System zwar invariant gegen¨
uber einer gemeinsamen Transformation von rund rnach
135
136 A Fourier-Entwicklungen einiger wichtiger Gr¨
oßen
r+Rbzw. r+Rist, nicht jedoch gegen¨
uber einer getrennten Transformation dieser Koordi-
naten. Er ist also nicht gitterperiodisch in dem Sinne, dass VFock(r,r) = VFock(r+R,r) =
VFock(r,r+R) f¨
ur alle Gittervektoren Rgilt, und kann daher streng genommen nicht ¨
uber
der Einheitszelle fourierentwickelt werden. Ebensowenig ist eine Fourierentwicklung ¨
uber
dem periodischen Grundgebiet (vgl. Abschnitt 3.1) m¨
oglich. Soll er auf eine Blochfunkti-
on ψnkangewandt werden, sind allerdings nur jene Komponenten von VFock von Interesse,
die sich aus seiner Projektion auf die |G+ki-Basis ergeben. Diese lassen sich, wie nun
gezeigt, mit Hilfe von (A.2) n¨
aherungsweise bestimmen. F¨
ur jeden k-Punkt ergibt sich
dabei ein eigener nicht-lokaler Ausdruck.1Es ist:
hG+k|VFock|G+ki= (A.3)
=1
ZZ ei(G+k)·rX
n,q
ψnq(r)ψnq(r)
|rr|ei(G+k)·rd3rd3r
=1
ZZ ei(G+k)·rX
n,q
1
hX
G1
cnq(G1)ei(G1+q)·rihX
G2
cnq(G2)ei(G2+q)·ri
|rr|·
·ei(G+k)·rd3rd3r.
Nun wird das Coulomb-Potential vCoul(rr) = |rr|1durch die periodisierte Versi-
on (A.2) ersetzt. Die Entwicklung erfolgt dabei aber abh¨
angig vom jeweiligen Summan-
den in der |G3+ (kq)i-Basis, um sich den mit k,qjeweils verschiedenen Perioden
der Z¨
ahler anzupassen:
hG+k|VFock|G+ki
1
2X
n,qZZ
X
G1X
G2
cnq(G1)cnq(G2)·
·ei(G+k)·rei(G1+q)·rei(G2+q)·rei(G+k)·r·
·4π
G3+kq6=0
X
G3
1
|G3+kq|2ei(G3+kq)·(rr)d3rd3r
=4π
3X
n,qZZ
X
G1X
G2
G3+kq6=0
X
G3
cnq(G1)cnq(G2)·
·ei(GG1G3)·rei(GG2G3)·r1
|G3+kq|2d3rd3r.
Substituiert man G
1:= GG1und G
2:= GG2, wodurch jeweils der Summations-
bereich (alle reziproken Gittervektoren) nicht ge¨
andert wird, ergibt sich daraus
1Bei radialsymmetrischen Systemen f¨
uhrt die Darstellung des Austauschoperators mit Hilfe der Ra-
dialanteile der Wellenfunktionen in v¨
ollig analoger Weise auf einen Satz vom Drehimpuls labh¨
angender
Operatoren [78].
A.2 Der nicht-lokale Austauschoperator 137
hG+k|VFock|G+ki
4π
3X
n,qX
G
1X
G
2
G3+kq6=0
X
G3
cnq(GG
1)cnq(GG
2)·
·Z
ei(G
1G3)·rd3r
|{z }
= δG
1G3
Z
ei(G
2G3)·rd3r
|{z }
= δG
2G3
1
|G3+kq|2
=4π
X
n,q
G3+kq6=0
X
G3
cnq(GG3)cnq(GG3)
|G3+kq|2.
Mit der Substitution G := G3erh¨
alt man schließlich
hG+k|VFock|G+ki 4π
X
n,q
kqG′′6=0
X
G′′
cnq(G+G′′)cnq(G+G′′)
|kqG′′|2,(A.4)
was dem in den Referenzen 52 und 98 angebenen Ausdruck entspricht. Die Summation
¨
uber qstellt dabei eigentlich eine Integration ¨
uber die 1. Brillouin-Zone dar, wobei ¨
uber
einen Pol 2. Ordnung hinwegintegriert wird. Eine von Gygi und Baldereschi [98] entwickelte
numerische Behandlung dieser Schwierigkeit ist in Abschnitt 4.4.1 ausgef¨
uhrt. Dort wird
die Relation
cn,k+G0(G) = cn,k(G+G0) (A.5)
verwendet, die der Vollst¨
andigkeit halber hier bewiesen werden soll. Es ist
ψn,k(r) = ψn,k+G(r)
un,k(r) eik·r=un,k+G(r) ei·(k+G)r
un,k+G(r) = un,k(r) eiG·r.(A.6)
Mit der Fourierentwicklung (3.16) ergibt sich dann
cn,k+G0(G) = 1
Z
un,k+G0(r) eiG·rd3r(A.7)
(A.6)
=1
Zun,k(r) eiG0·reiG·rd3r
=1
Z
un,k(r) ei·(G+G0)rd3r=cn,k(G+G0),
was zu beweisen war.
Symmetrisierung des Austauschoperators
Ben¨
otigt wird noch die Symmetrisierung des Austauschoperators, die sich aus (A.4) mit
einer Aufspaltung der Summe ¨
uber qin eine gewichtete Summe ¨
uber einen irreduziblen
Bereich der Brillouin-Zone sowie einer weiteren ¨
uber alle Punkttransformationen (vgl.
138 A Fourier-Entwicklungen einiger wichtiger Gr¨
oßen
Abschnitt 3.2) ergibt:
ˆ
VFock(k,G,G) = 4π
occ
X
n
Nred
X
s=1
NPS
X
i=1 X
G
ws
cn,Siqs(G+G′′)cn,Siqs(G+G′′)
|kSiqsG′′|2(A.8)
=4π
occ
X
n
Nred
X
s=1
NPS
X
i=1 X
G
ws
cn,qs(S1
iG+S1
iG′′)cn,qs(S1
iG+S1
iG′′)
|S1
ikqsS1
iG′′|2
=4π
occ
X
n
Nred
X
s=1
NPS
X
i=1 X
G
ws
cn,qs(S1
iG+G′′)cn,qs(S1
iG+G′′)
|S1
ikqsG′′|2.
Die hier benutzte Relation cn,Sq(G) = cn,q(S1G), also das Gegenst¨
uck zu (3.6) im rezi-
proken Raum, ist in Ref. 91 hergeleitet.
A.3 Die lineare Antwort
Sollen nur Potential- und Ladungsdichte¨
anderungen betrachtet werden, die periodisch mit
der Einheitszelle sind, ist die lineare Antwort f¨
ur einen nicht spin-polarisierten Halbleiter
oder Isolator in der Ortsdarstellung durch
χ0(r,r) = 2 X
vck
ψvk(r)ψck(r)ψck(r)ψvk(r) + c.c.
εvkεck
(A.9)
gegeben [52,176]. Dabei ist vder Index der Valenzb¨
ander und cder der Leitungsb¨
ander.
Im Gegensatz zum nicht-lokalen Austausch-Operator kann dieser Ausdruck exakt in den
reziproken Raum transformiert werden, da die beiden Eing¨
ange unabh¨
angig voneinander
Gitterperiodizit¨
at besitzen, d.h., es gilt χ0(r,r) = χ0(r+R,r) = χ0(r,r+R) f¨
ur beliebige
Gittervektoren R. Die Fourier-Entwicklung ist dann gegeben durch
ˆχ0(G,G) = (A.10)
=1
2ZZ
eiG·rχ0(r,r) e+iG·rd3rd3r
=1
ZZ
2X
vck"ψvk(r) eiG·rψck(r)·ψck(r) e+iG·rψvk(r)
εvkεck
+
+ψvk(r) eiG·rψck(r)·ψck(r) e+iG·rψvk(r)
εvkεck#d3rd3r
=2
X
vck"Zψvk(r) eiG·rψck(r) d3rZψck(r) e+iG·rψvk(r) d3r
εvkεck
+
+Zψvk(r) eiG·rψck(r) d3rZψck(r) e+iG·rψvk(r) d3r
εvkεck#.
A.3 Die lineare Antwort 139
Dieses Ergebnis l¨
asst sich mit der Zeitinversionssymmetrie (3.7) noch vereinfachen. Im
zweiten Summanden wird dazu die Summation ¨
uber kdurch die Summation ¨
uber k
ersetzt (was erlaubt ist wegen kBZ kBZ):
ˆχ0(G,G) = (A.11)
=2
X
vc "X
kBZ
Zψvk(r) eiG·rψck(r) d3rZψck(r) e+iG·rψvk(r) d3r
εvkεck
+
+X
kBZ
Zψv,k(r) eiG·rψc,k(r) d3rZψc,k(r) e+iG·rψv,k(r) d3r
εv,kεc,k#
(3.7)
=2
X
vc "X
kBZ
Zψvk(r) eiG·rψck(r) d3rZψck(r) e+iG·rψvk(r) d3r
εvkεck
+
+X
kBZ
Zeiαvkψvk(r) eiG·reiαckψck(r) d3rZeiαckψck(r) e+iG·reiαvkψvk(r) d3r
εvkεck#.
Die durch die Zeitumkehrsymmetrie ins Spiel gekommenen Phasenfaktoren k¨
urzen sich
gegenseitig gerade heraus; beide Summanden sind also identisch, und man erh¨
alt schließlich
ˆχ0(G,G) = (A.12)
=4
X
vck
Zψvk(r) eiG·rψck(r) d3rZψck(r) e+iG·rψvk(r) d3r
εvkεck
oder, in einer ¨
ublichen abk¨
urzenden, jedoch nicht ganz strengen Schreibweise,
ˆχ0(G,G) = 4
X
vck
hvk|eiG·r|ckihck|e+iG·r|vki
εvkεck
.(A.13)
Anhang B
Die Greensche Funktion
Greensche Funktionen werden ¨
uber so genannte Fundamentall¨
osungen linearer inhomoge-
ner Differentialgleichungen definiert. Dies sei hier nur an einem Beispiel illustriert:
Es soll etwa die L¨
osung uder Differentialgleichung
d2
dx2+ 1u(x) = f(x) (B.1)
gefunden werden. Dazu bestimme man zun¨
achst die L¨
osung Eder Gleichung, die aus (B.1)
entsteht, indem man die Inhomogenit¨
at fdurch die δ-Distribution ersetzt:
d2
dx2+ 1E(x) = δ(x).(B.2)
Ewird als Fundamentall¨
osung bezeichnet. Man erh¨
alt sie z.B. aus einer Fourier-Transfor-
mation von Gleichung (B.2):
k2+ 1ˆ
E(k) = ˆ
δ(k) = 1
2π.(B.3)
Umstellen nach ˆ
E(k) und inverses Fourier-Transformieren liefert dann E. Ohne Beweis sei
nun angegeben, dass man die L¨
osung der inhomogenen Gleichung (B.1) durch Faltung der
Fundamentall¨
osung mit der Inhomogenit¨
at ferh¨
alt:
u(x) = (Ef)(x) := ZE(xy)f(y) dy=ZG(x, y)f(y) dy . (B.4)
Der auf der linken Seite eingef¨
uhrte Integralkern G(x, y) := E(xy) heißt Greensche
Funktion. Genaueres entnehme man der Spezialliteratur, z.B. Ref. 123.
In der Quantenmechanik ist man h¨
aufig an der Greenschen Funktion Gεinteressiert,
die sich als L¨
osung der Gleichung
(H(r)ε)Gε(r,r) = δ(rr) (B.5)
ergibt, wobei Hder Hamilton-Operator in Ortsdarstellung sein soll. Die δ-Distribution
l¨
asst sich formal als kontinuierliches Analogon zur Einheitsmatrix im Endlich-Dimensiona-
len auffassen, womit die Greensche Funktion in gewisser Weise zur Inversen des Hamilton-
Operators wird:
Gε=(Hε·1)1(f¨
ur εnicht aus dem Spektrum von H).(B.6)
140
B Die Greensche Funktion 141
Sind die Eigenwerte (das Spektrum) von Hdurch {εn}gegeben, und stellt man sich
Hals echte” (diskrete) Matrix vor, erkennt man sofort, dass Gεnstrenggenommen nicht
definiert ist: Mit det(Hεn·1) = 0 kann keine Inverse zu (Hεn·1) existieren. Allerdings
besteht in diesem Fall die M¨
oglichkeit, zun¨
achst εndurch εn+ iηzu ersetzen, um dann
sp¨
ater den Grenz¨
ubergang η0 vollziehen zu k¨
onnen, vgl. z.B. Ref. 92.
Das System {|ni} der Eigenfunktionen von Hbildet ein vollst¨
andiges Orthonormal-
system im Hilbertraum H. Mit der Spektraldarstellung des Hamilton-Operators
H=X
n|niεnhn|(B.7)
und dem Greenschen Operator
Gε:= X
n
|nihn|
εεn
(ε6∈Spektrum von H) (B.8)
findet man
Gε(Hε·1) = X
n,m
|nihn|mi(εnε)hm|
εεn
=1=(Hε·1)Gε.(B.9)
Schreibt man den Greenschen Operator (B.8) in Ortsdarstellung, wird daraus die Green-
sche Funktion
Gε(r,r) = hr|Gε|ri=X
n
φn(r)φ
n(r)
εεn
(ε6∈Spektrum von H),(B.10)
wobei φn(r) := hr|nigesetzt wurde. F¨
ur ε=εmist die Greensche Funktion nur im Unter-
raum H
mdefinierbar, der von allen Elementen aus Hgebildet wird, die auf dem Eigenraum
von εmsenkrecht stehen:
Gm(r,r) = X
n
εn6=εm
φn(r)φ
n(r)
εmεn
.(B.11)
An vielen Stellen im Text wird die Projektion der Greenschen Funktion Gmauf den
Teilraum Hcder unbesetzten Zust¨
ande verwendet, wobei meinem besetzten Zustand
zugeordnet ist. Bezeichnet Pc:= Punocc
i|nihn|den Projektionsoperator auf Hc, ist sie
durch
G
m(r,r) := PcGm(r,r) =
unocc
X
n
φn(r)φ
n(r)
εmεn
(B.12)
gegeben.
Berechnung von Variationsableitungen mit Hilfe der St¨
orungstheorie in 1. Ord-
nung
An dieser Stelle sei auch kurz auf den Zusammenhang zwischen der St¨
orungstheorie
1. Ordnung und der Variationsableitung einer Eigenfunktion φieines Operators der Form
H:=1
22+veingegangen, wobei vein lokaler, also multiplikativ wirkender Operator sei.
Dazu f¨
uhrt man eine kleine Variation vvon vein, die sich als St¨
orung auffassen l¨
asst.
Die Eigenwert-Gleichung des gest¨
orten Systems schreibt sich dann
[1
22+v+ v](φi+ φi) = (εi+ εi)(φi+ φi).(B.13)
142 B Die Greensche Funktion
Die der Variation ventsprechende ¨
Anderung φider Eigenfunktion φiergibt sich also
als Zustandskorrektur”, f¨
ur die die St¨
orungstheorie in linearer Ordnung die folgende
n¨
aherungsweise Darstellung liefert:
φi(r)X
j
εj6=εi
φj(r)hφj|v|φii
εiεj
=Z
rIR3
X
j
εj6=εi
φj(r)φ
j(r)φi(r)
εiεj
v(r) d3r.(B.14)
Die Summation erfolgt ¨
uber alle zum Eigenraum von εiorthogonalen Zust¨
ande. Die Ap-
proximation (B.14) wird dabei immer besser, je kleiner die Variation vist. Die gesuchte
Variationsableitung entspricht daher gerade dem Ausdruck in den großen runden Klam-
mern und kann mit Hilfe der Greenschen Funktion (B.11) geschrieben werden:
δφi(r)
δv(r)=X
j
εj6=εi
φj(r)φ
j(r)φi(r)
εiεj
=Gi(r,r)φi(r).(B.15)
Man beachte, dass die Variationsableitung δφiv ein Ausdruck ist, der von zwei Variablen
hier rund r abh¨
angt. Dies ist in vollkommener Analogie zu der Ableitung einer
Funktion mehrerer Variablen, die sich bekanntlich als Matrix darstellen l¨
asst (vgl. z.B.
Ref. 123).
Anhang C
Die Sternheimer-Gleichung
C.1 Die Sternheimer-Gleichung aus dem Variationsprinzip
von Ritz
In Abschnitt 4.1 wurde zur numerisch effizienten L¨
osung der Sternheimer-Gleichung (4.1)
auf dem Hilbertraum Hein Funktional Ei:H IR ; ψ1
i7→ Ei[ψ1
i] eingef¨
uhrt, das die Ein-
heit einer Energie hat und eine quadratische Form in der linearen Korrekturfunktion ψ1
i
darstellt. Einheit und mathematische Gestalt ergaben sich dabei rein abstrakt, indem Ei
in (4.3) als reellwertige Stammfunktion der linken Seite der Sternheimer-Gleichung kon-
struiert wurde.
Hier m¨
ochte ich jedoch noch eine weitere Herleitung dieses Funktionals geben, die,
obschon sie etwas aufwendiger ist, eine physikalisch anschaulichere Interpretation erlaubt.
Es sei gezeigt, dass Ei und damit die Sternheimer-Gleichung selbst ebenfalls auch
direkt aus dem Variationsprinzip von Ritz (vgl. Abschnitt 1.2) hergeleitet werden kann,
wenn dort die in der Rayleigh-Schr¨
odingerschen St¨
orungstheorie benutzten Reihenentwick-
lungen eingesetzt werden.
Die Idee dabei ist folgende: Gem¨
dem Variationsprinzip (1.11) stellen sich die (nor-
mierten) Eigenfunktionen eines Systems gerade so ein, dass das Energiefunktional hψ|H|ψi
minimal ist, wenn |ψieinem Grundzustand entspricht, und zumindest station¨
ar ist, wenn
|ψieinen angeregten Zustand beschreibt. Dies gilt nat¨
urlich f¨
ur das ungest¨
orte System
ebenso wie f¨
ur das gest¨
orte. Wenn aber die Gr¨
oßen des ungest¨
orten Systems bereits be-
kannt sind, k¨
onnten diese bei der Formulierung des gest¨
orten Problems fest eingesetzt
werden, und die Variation brauchte nur noch ¨
uber die Korrekturen der Wellenfunktionen
zu erfolgen. Die Variation der Grundzustandskorrektur w¨
urde ein Minimum des f¨
ur das
gest¨
orte Problem formulierten hψ|H|ψiliefern (wobei ψdie normierte Summe aus un-
gest¨
orter Wellenfunktion und Korrektur ist), und die Variation von Korrekturen h¨
oherer
Zust¨
ande w¨
urde auf station¨
are Punkte f¨
uhren dies entspricht genau dem Verhalten des
in (4.3) f¨
ur die lineare Korrektur ψ1
igefundenen Energiefunktionals! Tats¨
achlich ergibt
sich (4.3) direkt aus der hier skizzierten Idee, wenn man nur Korrekturfunktionen bis zur
1. Ordnung, d.h. also, im Energiefunktional hψ|H|ψiAusdr¨
ucke noch bis zur 2. Ordnung
ber¨
ucksichtigt.
Dazu sei zun¨
achst das gest¨
orte System unter denselben Annahmen wie bei der Rayleigh-
Schr¨
odingerschen St¨
orungstheorie nach einem reellen Parameter λentwickelt:
H:= H0+λ H1
εi:= ε0
i+λ ε1
i+λ2ε2
i+··· ,(C.1)
143
144 C Die Sternheimer-Gleichung
|ψii:= |ψ0
ii+λ|ψ1
ii+λ2|ψ2
ii+··· .
Hier bezeiche wie ¨
ublich H0den Hamilton-Operator des ungest¨
orten Systems, dem eine
St¨
orung λH1aufgeschaltet sei. Eigenwerte ε0
iund Eigenfunktionen |ψ0
iides ungest¨
orten
Systems seien bekannt. Nach dem Variationsprinzip (1.11) wird das Funktional hψ|(H0+
H1)|ψistation¨
ar f¨
ur alle Eigenfunktionen |ψiides gest¨
orten Systems, wobei die Variation
unter der Nebenbedingung der Normierung erfolgt, d.h. also, wenn nur Wellenfunktio-
nen auf der Kugel hψ|ψi=kψk2= 1 im Hilbertraum Hzugelassen sind.1Wird die
Nebenbedingung ¨
uber einen Lagrange-Multiplikator εber¨
ucksichtigt, hat man
δEε[ψ]
δψε=εi
ψ=ψi
= 0 mit Eε[ψ] := hψ|(H0+λH1)|ψiε·[hψ|ψi1] (C.2)
f¨
ur alle Eigenenergien εiund -funktionen |ψiides gest¨
orten Systems. Einsetzen von (C.1)
in (C.2) liefert
Eε[ψ] = (hψ0|+λhψ1|+λ2hψ2|+···)(H0+λH1)(|ψ0i+λ|ψ1i+λ2|ψ2i+···)
(ε0+λε1+λ2ε2+···)(hψ0|+λhψ1|+λ2hψ2|+···)
(|ψ0i+λ|ψ1i+λ2|ψ2i+···)
+ (ε0+λε1+λ2ε2+···)
=hψ0|H0|ψ0i+λhψ0|H0|ψ1i+λhψ1|H0|ψ0i+λhψ0|H1|ψ0i
+λ2hψ0|H0|ψ2i+λ2hψ1|H0|ψ1i+λ2hψ2|H0|ψ0i
+λ2hψ0|H1|ψ1i+λ2hψ1|H1|ψ0i
ε0hψ0|ψ0iλε0hψ0|ψ1iλε0hψ1|ψ0iλε1hψ0|ψ0i
λ2ε0hψ0|ψ2iλ2ε0hψ1|ψ1iλ2ε0hψ2|ψ0i
λ2ε1hψ0|ψ1iλ2ε1hψ1|ψ0i
+ (ε0+λε1+λ2ε2) + O(λ3).(C.3)
Hier wurde der ¨
Ubersichtlichkeit halber der Index ian den Wellenfunktionen und Energien
unterdr¨
uckt. Im Restglied O(λ3) sind alle Terme kubischer oder h¨
oherer Ordnung in λ
zusammengefasst. Unter Beachtung von H0ψ0=ε0ψ0lassen sich eine Reihe von Gliedern
herausk¨
urzen. Vernachl¨
assigt man ferner das Restglied O(λ3), erh¨
alt man in quadratischer
N¨
aherung:
Eε[ψ]λhψ0|(H1ε1)|ψ0i+λ2hψ1|(H0ε0)|ψ1i
+λ2hψ0|(H1ε1)|ψ1i+λ2hψ1|(H1ε1)|ψ0i+ (ε0+λε1+λ2ε2).
Hier liefern alle Glieder, die ψ1weder als Bra- noch als Ket-Vektor explizit enthalten, nur
einen konstanten Beitrag zum Energiefunktional. Die Lage der station¨
aren Punkte in Hist
aber invariant gegen¨
uber einer Eichung der Energieskala; deshalb k¨
onnen die konstanten
1In Abschnitt 4.1 wurde die Sternheimer-Gleichung f¨
ur ein effektives Ein-Teilchen-Problem (Kohn-
Sham-System) formuliert, in diesem Falle bezeichnet ψalso eine Ein-Teilchen-Wellenfunktion. In der fol-
genden Diskussion kann es sich jedoch auch allgemein um eine N-Teilchen-Wellenfunktion handeln.
C.2 Entartung 145
Glieder ignoriert werden, und man darf das Funktional noch mit einem beliebigen Faktor,
z.B. 1/(2λ2), multiplizieren. Insgesamt kann man statt Eε[ψ] also auch
˜
Eε[ψ1] := 1
2hψ1|(H0ε0)|ψ1i+1
2hψ0|(H1ε1)|ψ1i+1
2hψ1|(H1ε1)|ψ0i
=1
2hψ1|(H0ε0)|ψ1i+ Re hψ1|(H1ε1)|ψ0i(C.4)
verwenden. Da auf der rechten Seite nur die lineare Korrekturfunktion variabel ist, wurde
als Argument von ˜
Eεhier gleich ψ1benutzt. F¨
ugt man den Index ian Energien und
Zust¨
ande wieder an, ist dies in der Tat identisch mit dem in Abschnitt 4.1 angegebenen
Energiefunktional (4.3), was zu zeigen war.
Noch eine Bemerkung zur Normierung: Die hier benutzte Nebenbedingung hψ|ψi= 1
ist im Allgemeinen nicht mit der ¨
ublicherweise in der St¨
orungstheorie angesetzten Nor-
mierung hψ0|ψi=Nkonsistent, aus der man die Orthogonalit¨
at der Korrekturfunktionen
zu ψ0erh¨
alt, vgl. z.B. Ref. 127. Deshalb wurde bei der Vereinfachung des obigen Aus-
drucks (C.3) auch nicht mit der (nicht gegebenen) Orthogonalit¨
at zwischen der Korrek-
turfunktion |ψ1iund der ungest¨
orten Funktion |ψ0iargumentiert! Fordert man Orthogo-
nalit¨
at zwischen der Korrektur |ψi:= |ψi |ψ0iund der ungest¨
orten Funktion |ψ0i,
kann die Normierung im Allgemeinen nicht exakt erf¨
ullt werden (es muss Nachnormiert”
werden), denn es gilt dann
hψ|ψi= (hψ0|+hψ|)(|ψ0i+|ψi)
=hψ0|ψ0i+hψ0|ψi+hψ|ψ0i+hψ|ψi(C.5)
=hψ0|ψ0i
|{z }
=1
+ 2 Re hψ0|ψi
|{z }
=0
+hψ|ψi
= 1 + hψ|ψi.
Wegen |ψi=λ|ψ1i+λ2|ψ2i+···enth¨
alt die Abweichung hψ|ψiallerdings nur qua-
dratische und h¨
ohere Ordnungen in λ, oder anders formuliert: in linearer N¨
aherung l¨
asst
sich die Normierungsbedingung zugleich mit der Orthogonalit¨
atsforderung erf¨
ullen. Ge-
nau dies wurde in Kapitel 2bei der Definition (2.4) der induzierten Ladungsdichte ρ
ausgenutzt: ρbeschreibt den Einfluss von H1nur in linearer Ordnung, daher ist die La-
dungserhaltung (2.9) exakt erf¨
ullt, obwohl zur Berechnung der induzierten Ladungsdichte
die Sternheimer-Gleichung zusammen mit der Orthogonalit¨
atsforderung gel¨
ost wurde, vgl.
Abschnitt 4.1. Es sei an dieser Stelle nochmals darauf hingewiesen, dass dies aber keine
N¨
aherung der EXX-Methode darstellt, vielmehr ist die lineare N¨
aherung der induzierten
Ladungsdichte eine wesentliche Eigenschaft der EXX-Methode selbst.
C.2 Entartung
Am Ende des Abschnitts 4.1 wurde gezeigt, dass die Sternheimer-Gleichung im Rahmen
der variationellen EXX-Methode nur in einem verkleinerten” Hilbertraum, n¨
amlich dem
der unbesetzten Zust¨
ande, gel¨
ost zu werden braucht, und sich das Problem der Entartung
auf diese Weise eliminieren l¨
asst. Um jedoch die Diskussion der Sternheimer-Gleichung
abzurunden, sei an dieser Stelle kurz beschrieben, wie im Falle einer Entartung auch
die vollst¨
andigen Korrekturfunktionen berechnet werden k¨
onnen. Der zu Grunde liegende
Formalismus ist nat¨
urlich die entartete St¨
orungstheorie von Rayleigh-Schr¨
odinger. Deren
Ergebnisse sind aber ¨
ublicherweise mit Hilfe von Greenschen Funktionen formuliert. Das
146 C Die Sternheimer-Gleichung
Ziel hier besteht also darin, eine entsprechende Verallgemeinerung der in Abschnitt 4.1
entwickelten Methoden zu finden, um wieder ohne die Greensche Funktion auskommen zu
k¨
onnen.
Eng mit der Entartung gemeint ist eine m¨
ogliche Entartung eines Eigenwertes εi
von H0, also dem Hamilton-Operator des ungest¨
orten Systems verkn¨
upft ist die Frage,
ob die Sternheimer-Gleichung (4.1)¨
uberhaupt eine L¨
osung besitzt, oder, ¨
aquivalent dazu,
ob das in (4.3) definierte Energiefunktional Eieinen station¨
aren Punkt (Minimum, Sattel-
punkt oder Maximum) besitzt. Seien dazu noch einmal die drei in (4.6) (4.8) definierten
Teilr¨
aume H,H0und H+betrachtet, von denen H0gerade dem Eigenraum von εient-
spricht. Gem¨
Abschnitt 4.1 besitzt Eiin Hein Maximum und in H+ein Minimum,
zu kl¨
aren bleibt also nur noch das Verhalten in H0. Hier reduziert sich das Funktional auf
den linearen Anteil
Ei[ψ1
i] = 1
2hψ1
i|(H1ε1
i)|ψ0
ii+1
2hψ0
i|(H1ε1
i)|ψ1
ii(f¨
ur ψ1
i H0),(C.6)
dessen Gradient durch den konstanten Vektor
2δEi[ψ1
i]
δ(ψ1
i)= (H1ε1
i)|ψ0
ii(f¨
ur ψ1
i H0) (C.7)
gegeben ist. Eine L¨
osung der Sternheimer-Gleichung im gesamten Hilbertraum existiert
also genau dann, wenn (C.7) identisch verschwindet. In H0ergibt sich f¨
ur das Energie-
funktional in diesem Fall Ei= 0. Ist (C.7) jedoch von 0 verschieden, definiert (C.6) eine
schiefe (Hyper-)Ebene” ¨
uber H0, d.h., es kann kein station¨
arer Punkt existieren, und
darauf angesetzte Algorithmen zur Extremwertsuche k¨
onnen nicht konvergieren (sie lau-
fen ins Unendliche”).
F¨
ur nicht-entartetes ε0
iergibt sich nun, dass (C.7) stets verschwindet, und die Stern-
heimer-Gleichung immer l¨
osbar ist. Da dann n¨
amlich der Eigenraum H0eindimensional
ist und nur durch den zugeh¨
origen Eigenvektor ψ0
iaufgespannt wird, reduziert sich der
St¨
oroperator auf die (1 ×1)-Matrix hψ0
i|H1|ψ0
iiund entspricht der in (4.2) gegebenen
Energiekorrektur ε1
i.
F¨
ur entartetes ε0
iist der Fall etwas komplizierter: Nach der entarteten St¨
orungstheorie
ist n¨
amlich nun die Basis in H0nicht mehr frei, sondern muss so gew¨
ahlt werden, dass die
St¨
orung H1darin diagonal wird. Dies entspricht gerade einer (m¨
oglichen) Aufhebung der
Entartung durch die St¨
orung. F¨
ur die ψ0
jmit ε0
j=ε0
igilt dann hψ0
j|H1|ψ0
ii=δij ε1
imit
der ¨
ublichen Definition ε1
i:= hψ0
i|H1|ψ0
ii. Damit gilt insbesondere H1ψ0
i=ε1
iψ0
i, womit
schließlich (C.7) verschwindet.
Anders formuliert: Im entarteten Fall muss zun¨
achst die richtige” Sternheimer-Glei-
chung gefunden werden, d.h. pr¨
aziser: es muss eine Basis des entarteten Eigenraums so be-
stimmt werden, dass die damit aufgestellte Sternheimer-Gleichung l¨
osbar ist. Die entspre-
chenden Basisfunktionen sind zugleich die Eigenfunktionen des Gesamtsystems H0+H1
in H0. Die Korrektur besteht in H0also allein in der Justierung der Basis. Anschließend
kann, wie in Abschnitt 4.1 beschrieben, der Sattelpunkt in HH+¨
uber geeignete Ma-
ximierungs-/Minimierungsverfahren berechnet werden.
C.3 Die Sternheimer-Gleichung mit nicht-hermiteschem H0
Dieser Abschnitt l¨
asst sich in gewissen Sinne als Erg¨
anzung zu Ref. 78 verstehen, in der
das variationelle EXX-Verfahren an kugelsymmetrischen Systemen (Be-Atom, Ne-Atom)
C.3 Die Sternheimer-Gleichung mit nicht-hermiteschem H0147
getestet worden ist. Beschreibt man solche Systeme in Kugelkoordinaten, muss die Schr¨
o-
dinger-Gleichung (bzw. hier die Kohn-Sham-Gleichung als effektive Ein-Teilchen-Schr¨
o-
dinger-Gleichung) nur noch in einer Dimension f¨
ur den Radialteil der Wellenfunktionen
gel¨
ost werden. ¨
Ublicherweise verwendet man dabei eine logarithmische Zerlegung (Basis)
der Radialachse, da die starken Oszillationen nahe des Ursprungs eine wesentlich st¨
arkere
Aufl¨
osung verlangen als die im Vergleich dazu ruhigen Schw¨
anze der Funktionen. Der
Operator der kinetischen Energie (Laplace-Operator) und damit der gesamte Hamilton-
Operator werden in dieser Darstellung jedoch zu nicht-hermiteschen Matrizen. Die in
Abschnitt 4.1 beschriebe L¨
osung der Sternheimer-Gleichung mit Hilfe der Minimierung
ihrer Stammfunktion” (4.3) kann daher nicht mehr ohne Weiteres verwendet werden, wie
in Ref. 78 gezeigt. Mit dem nun vorgestellten Trick kann die Minimierungsmethode je-
doch auch auf einen solchen Fall ¨
ubertragen werden. Wie in Abschnitt 4.1.2 sei abk¨
urzend
A=H0ε0
i,x=ψ1
iund b= (H1ε1
i)ψ0
igesetzt, und wie dort sei nur der diskrete Fall
diskutiert.
Die Idee ist einfach: Ist Aeine beliebige n-quadratische Matrix, ist das Produkt A+A,
wobei A+die Adjungierte von Asein soll, in jedem Fall eine hermitesche Matrix, denn
aus (AB)+=B+A+(mit A,B n-quadratisch) folgt sofort (A+A)+=A+(A+)+=A+A.
Zudem ist A+Aeine positiv semi-definite Matrix, denn f¨
ur alle xCngilt hx|A+Axi=
hAx|Axi=kAxk20. Multipliziert man also die Gleichung
Ax+b=0mit bCnfest (C.8)
mit von links A+, erf¨
ullt die neue Gleichung die in (4.13) geforderten Voraussetzungen,
und alle in Abschnitt 4.1.2 beschriebenen Methoden k¨
onnen auf sie angewandt werden:
A+Ax+A+b=0.(C.9)
Bevor man diese Gleichung jedoch zur L¨
osung von (C.8) benutzen kann, muss klar sein,
dass beide Gleichungen auch wirklich ¨
aquivalent sind. Dies l¨
asst sich leicht beweisen, wenn
(i) A+eine ein-eindeutige (bijektive) lineare Abbildung auf dem Wertebereich W(A) der
Abbildung Aist und (ii) Gleichung (C.8)¨
uberhaupt eine L¨
osung besitzt. Dies soll hier
kurz gezeigt werden:
Beweis der Bijektivit¨
at von A+auf W(A): Ist N(A) der Nullraum von A, hat W(A)
die Dimension p:= ndim N(A). Sei dann {w1,...,wp}eine Basis von W(A). Nun
l¨
asst sich Cnin den Wertebereich von Aund dessen Orthogonalraum2zerlegen: Cn=
W(A)W(A). Mit einem Satz der linearen Algebra3gilt N(A+) = W(A), womit hier
Cn=W(A)N(A+) folgt. Dann gilt f¨
ur jedes xCn: es gibt x1 W(A), x2 N(A+)
so, dass x=x1+x2und folglich A+x=A+x1+A+x2=A+x1+0. Der Wertebereich
von A+ist daher durch W(A+) = span{A+x|x W(A)}gegeben. Daraus folgt, dass
{A+w1,...,A+wp}eine Basis von W(A+) ist, denn als adjungierte Matrizen besitzen A
und A+den gleichen Rang, d.h., die Dimensionen ihrer Wertebereiche sind gleich.
Damit folgt die Injektivit¨
at: Seien x,x W(A). Es ist zu zeigen: Aus A+x=A+x
folgt x=x. Sei also A+x=A+x. Dann hat man A+(xx) = 0 mit xx W(A).
2Der Orthogonalraum einer Menge UCnist definiert als die Menge aller Elemente, die senkrecht
auf Ustehen: U:= {xCn|hx|ui= 0 f¨
ur uU}. Die direkte Summe zweier linearer Teilr¨
aume Uund
Vmit UV={0}ist definiert als UV:= {xCn|es gibt uU, vVmit x=u+v}. F¨
ur einen
linearen Teilraum UCngilt Cn=UU. Vgl. dazu z.B. Ref. 123, Band 1, Kapitel 8.
3Vgl. z.B. Ref. 123, Band 1, Satz 10.14.
148 C Die Sternheimer-Gleichung
Mit einer Basis {w1,...,wp}von W(A) existieren also α1,...,αpCso, dass xx=
Pp
i=1 αiwi. Da aber A+(xx) = Pp
i=1 αiA+wi= 0 und {A+w1,...,A+wp}gem¨
dem
Vorangehenden Basis von W(A+), folgt α1=···=αp= 0. Damit ist xx=0, d.h.,
x=x, womit die Injektivit¨
at gezeigt ist.
Nun zur Surjektivit¨
at: Sei y W(A+). Zu zeigen: Es gibt x W(A) mit y=A+x.
Mit der Basis von W(A+) wie oben existieren β1,...pCso, dass y=Pp
i=1 βiA+wi=
A+Pp
i=1 βiwi. Definiert man x:= Pp
i=1 βiwi, folgt unmittelbar y=A+xmit x W(A),
womit auch die Surjektivit¨
at gezeigt ist. Damit gelingt nun der
Beweis der ¨
Aquivalenz der Gleichungen (C.8) und (C.9): Es ist klar, dass alle L¨
osungen
xCnvon (C.8) auch L¨
osungen von (C.9) sind. Bleibt zu zeigen, dass auch umgekehrt
alle L¨
osungen von (C.9) L¨
osungen von (C.8) sind, wenn (C.8)¨
uberhaupt eine L¨
osung
x0Cnbesitzt (vgl. den vorangehenden Abschnitt C.2). Unter dieser Annahme folgt,
dass bElement des Wertebereichs W(A) der Abbildung Aist, da b=Ax0 W(A). Es
ist also Ax+b W(A) f¨
ur alle xCn, d.h., der Wertebereich der linken Seite von (C.8)
ist ebenfalls W(A). Nun ist aber wie oben gezeigt A+auf W(A) eine bijektive linea-
re Abbildung. Aus A+Ax+A+b=A+(Ax+b) = 0folgt daher unmittelbar Gleichung
(C.8), was zu zeigen war.
Interessanterweise l¨
asst sich dieses Ergebnis auch auf eine ganz andere Art ableiten.
Bildet man n¨
amlich das Betragsquadrat auf beiden Seiten von (C.8), erh¨
alt man
kAx+bk2=hxA+b|Ax+bi(C.10)
=hxA|Axi+hxA|bi+hb|Axi+hb|bi
=hx|A+Axi+hx|A+bi+hb|Axi+kbk2= 0 .
Das Betragsquadrat ist genau dann 0, wenn sein Argument 0ist, womit sofort die ¨
Aqui-
valenz dieser Gleichung zu (C.8) folgt. Zudem ist 0 auch das (eindeutige) Minimum des
Betragsquadrats. Ferner ist das Betragsquadrat im Gegensatz zur Betragsfunktion (!)
¨
uberall stetig differenzierbar, besitzt also einen Gradienten, der genau bei 0verschwin-
det. Dies liefert unmittelbar Gleichung (C.9):
∇kAx+bk2= 2 d
dxkAx+bk2= 2 A+Ax+ 2 A+b= 0 .(C.11)
Dabei wurde (C.10) nur nach dem konjugiert-komplexen Vektor xabgeleitet (also dem
Bra-Vektor), daf¨
ur aber noch mit 2 multipliziert.4Mit diesem Weg findet man also zus¨
atz-
lich zu (C.9) auch noch automatisch” das passende Funktional, mit dem die Minimierung
durchgef¨
uhrt werden kann, n¨
amlich die linke Seite von (C.10). Man beachte aber, dass das
Ableiten im Allgemeinen keine ¨
Aquivalenzrelation darstellt; so besitzt (C.11) in jedem Fall
eine L¨
osung, auch wenn (C.8) nicht l¨
osbar ist. Notwendig und hinreichend f¨
ur die ¨
Aqui-
valenz ist, dass (C.8) l¨
osbar ist, dass also b W(A), was auch in dem zuerst gef¨
uhrten
Beweis vorausgesetzt worden ist.
4Zur Definition des Gradienten im Komplexen vgl. Ref. 126.
Anhang D
Tensordarstellung der
EXX-Methode
Die linke Seite der Gleichung (2.11) in Abschnitt 2.3 beschreibt mit Hilfe der linearen
Antwort-Funktion χ0, wie sich die Dichte in linearer Ordnung ¨
andert, wenn auf das ef-
fektive Potential der Kohn-Sham-Gleichung (1.52) eine lokale ¨
Anderung v: IR3IR
addiert wird. Zur Handhabung einer nicht-lokalen Potentialdifferenz, wie sie im variationel-
len EXX-Verfahren gem¨
(2.1) auftritt, wird jedoch ein m¨
achtigerer” linearer Antwort-
Operator X0ben¨
otigt, da vnun durch eine (IR3×IR3C)-Funktion repr¨
asentiert wird,
n¨
amlich den Kern des Integraloperators H1von Gleichung (2.1).
Dieses verallgemeinerte X0l¨
asst sich sehr leicht finden, wenn man noch einmal dem Ge-
dankengang von Abschnitt 2.1 folgt, diesmal allerdings f¨
ur eine beliebige lineare St¨
orung H1,
deren Anwendung auf eine Wellenfunktion ψsich durch
(H1ψ)(r) := Zv(r,r)ψ(r) d3r(D.1)
mit einem geeigneten vbeschreiben l¨
asst. Die Herleitung der induzierten Ladungsdich-
te, d.h., der linearen Dichte¨
anderung αρmit ρgem¨
(2.4) geschah dort v¨
ollig un-
abh¨
angig von der speziellen Gestalt der St¨
orung, deshalb bleibt sie auch f¨
ur das allgemei-
ner definierte H1aus (D.1) g¨
ultig. Auch sind die Korrekturfunktionen ψ1
iwieder ¨
uber die
Sternheimer-Gleichung (2.2) oder mit Hilfe der Greenschen Funktion wie in (2.7) gegeben.
Dies, eingesetzt in (2.4), liefert in Abh¨
angigkeit von vdie lineare Dichte¨
anderung
ρ(r) =
occ
X
iZd3rhψ0
i(r)Gi(r,r)(H1ψ0
i)(r) + c.c.i(D.2)
=
occ
X
iZd3rhψ0
i(r)X
j
εj6=εi
ψ0
j(r)ψ0
j(r)
εiεjZv(r,r)ψ0
i(r′′) d3r′′ + c.c.i
=ZZT(r,r,r′′)∆v(r,r′′) d3rd3r′′ + c.c. ,
wobei
T(r,r,r′′) :=
occ
X
iX
j
εj6=εi
ψ0
i(r)ψ0
j(r)ψ0
j(r)ψ0
i(r′′)
εiεj
.(D.3)
149
150 D Tensordarstellung der EXX-Methode
Ausdruck (D.2) l¨
aßt sich noch vereinfachen, wenn man eine hermitesche St¨
orung voraus-
setzt, also v(r,r′′)= v(r′′,r) annimmt:
ρ(r) = ZZT(r,r,r′′)∆v(r,r′′) d3rd3r′′ +ZZT(r,r,r′′)v(r′′,r) d3rd3r′′ .
Umbenennung der Variablen im zweiten Summanden liefert dann
ρ(r) = ZZT(r,r,r′′) + T(r,r′′,r)v(r,r′′) d3rd3r′′ (D.4)
=ZZX0(r,r,r)∆v(r,r′′) d3rd3r′′
mit dem Kern
X0(r,r,r′′) := T(r,r,r′′) + T(r,r′′,r)(D.5)
=
occ.
X
i
unocc.
X
j
ψ0
i(r)ψ0
j(r)ψ0
j(r)ψ0
i(r′′) + ψ0
i(r)ψ0
j(r)ψ0
j(r′′)ψ0
i(r)
εiεj
.
Hier wurden bei der Summierung ¨
uber jnur noch die unbesetzten Zust¨
ande ber¨
ucksichtigt,
da alle anderen Summanden sich analog wie bei der Herleitung der normalen linearen
Antwort (1.93) gerade herausk¨
urzen. W¨
urde man X0n¨
aherungsweise in einem endlichen
Basissatz darstellen, w¨
are dies ein Tensor dritter Stufe ganz analog, wie kontinuierliche
Operatoren bei Diskretisierung” in Matrizen ¨
ubergehen.
W¨
ahrend der Nullraum von χ0allein durch die Menge der konstanten Funktionen gege-
ben ist [56], ist allerdings der von X0wesentlich gr¨
oßer: F¨
ur alle hermiteschen St¨
orungen
vmit hψ0
i|v|ψ0
ji= 0, also solche, die besetzte und unbesetzte Zust¨
ande nur jeweils
untereinander koppeln1, folgt aus (D.4) und (D.5) sofort ρ= 0. Konstante Potentialver-
schiebungen bilden nat¨
urlich einen Teilraum dieses Nullraums. Damit ist X0auch dann
nicht invertierbar, wenn man den Definitionsbereich auf diejenigen Operatoren beschr¨
ankt,
die ihrerseits wieder nur auf dem Teilraum nicht-konstanter Funktionen definiert sind. In
endlicher Darstellung ist dies intuitiv klar: F¨
ur die St¨
orung (Matrix) gibt es nat¨
urlich mehr
Variationsm¨
oglichkeiten als f¨
ur die induzierte Dichte (Vektor).
Interessanterweise l¨
asst sich X0zu einem noch allgemeineren Operator ˜
X0erweitern,
der zu einer gegebenen, nicht-lokalen Potential¨
anderung nicht die lineare ¨
Anderung der
Dichte, sondern die des Dichteoperators liefert. Dieser ist (f¨
ur ein nicht spin-polarisiertes
Kohn-Sham-System) in Ortsdarstellung durch
ρ(r1,r2) :=
occ.
X
i
ψ0
i(r1)ψ0
i(r2)(D.6)
gegeben und seine lineare ¨
Anderung infolge von ¨
Anderungen der Wellenfunktionen ψ1
i
folglich durch
ρ(r1,r2) :=
occ.
X
i
ψ0
i(r1)ψ1
i(r2)+ψ1
i(r1)ψ0
i(r2).(D.7)
1Dieser Nullraum ist die tiefere Begr¨
undung daf¨
ur, dass bei der L¨
osung der Sternheimer-Gleichung die
so ¨
uberaus n¨
utzliche vereinfachte Version der Sternheimer-Gleichung (4.12) benutzt werden konnte.
D Tensordarstellung der EXX-Methode 151
Gleichsetzen von r1und r2liefert f¨
ur (D.6) dann die gew¨
ohnliche Dichte und f¨
ur (D.7)
die induzierte Dichte (2.4). Eine ganz analoge ¨
Uberlegung wie oben in (D.2) bis (D.5)
durchgef¨
uhrt liefert in diesem Fall
˜
X0(r1,r2,r3,r4) := (D.8)
occ.
X
i
unocc.
X
j
ψ0
i(r1)ψ0
j(r2)ψ0
j(r3)ψ0
i(r4)+ψ0
i(r2)ψ0
j(r1)ψ0
j(r4)ψ0
i(r3)
εiεj
.
EXX-Formalismus kurzgefasst
Aus (D.4) folgt nun die EXX/OEP-Gleichung, indem gem¨
(2.1) speziell
v(r,r′′) := hr|H1|r′′i=VFock[{ψi}](r,r′′)δ(rr′′)vx[ρ](r) (D.9)
gesetzt wird. Damit ergibt sich zun¨
achst die induzierte Ladungsdichte
ρ(r) = ZZX0(r,r,r′′)VFock(r,r′′)δ(rr′′)vx(r)d3rd3r′′ (D.10)
=ZZX0(r,r,r)VFock(r,r′′) d3rd3r′′ Zχ0(r,r)vx(r) d3r.
Einsetzen von (D.5), Vereinfachen und Zu-Null-Setzen dieses Ausdrucks f¨
uhrt dann unmit-
telbar auf die OEP-Gleichung (1.97). Im Vergleich zu dieser oder zur EXX-Gleichung (1.90)
erscheint dem Verfasser die Form (D.10) allerdings anschaulicher; insbesondere der linea-
re Charakter des EXX-Formalismus wird hier unmittelbar klar, denn der Zusammenhang
zwischen St¨
orung und ¨
Anderung der Ladungsdichte ist nun formal sehr einfach durch einen
Integraloperator gegeben.
Als praktische Merkformel” sei der EXX-Formalismus nun auf eine noch knappere
aber daf¨
ur ¨
außerst pr¨
agnante! Gestalt gebracht. Definiert man dazu
ˆ
X0f: IR37→ IR ; (D.11)
(ˆ
X0f)(r) := (RRX0(r,r,r′′)f(r,r′′) d3rd3r′′ (fnicht-lokal, hermitesch)
Rχ0(r,r)f(r) d3r(flokal, multiplikativ)
mit X0gem¨
(D.5) und χ0nach (1.93), kann man (D.10) formal
ρ:= ˆ
X0(VFock vx) = ˆ
X0VFock ˆχ0vx(D.12)
schreiben. Damit aber l¨
asst sich der gesamte EXX-Formalismus in folgender einfacher
Gleichung zusammenfassen:
ˆ
X0(VFock vx)!
= 0 .(D.13)
Nat¨
urlich ist dabei zu beachten, dass alle Gr¨
oßen der linken Seite ggf. ¨
uber die Dichte
noch von den Wellenfunktionen ψiabh¨
angen.
152 D Tensordarstellung der EXX-Methode
Zusammenhang zur Sham-Schl¨
uter-Gleichung
Die Form von (D.10) mit der darin enthaltenen Doppelintegration legt einen Zusammen-
hang zur Sham-Schl¨
uter-Gleichung [177] nahe. Diese beschreibt allgemein die Beziehung
zwischen dem Austausch-Korrelationsanteil der nicht-lokalen, energieabh¨
angigen Selbst-
energie Σxc und dem lokalen Austausch-Korrelationspotential vxc des Kohn-Sham-Systems
und ist durch
Zd3rZd3r
Zdε GKS(r,r, ε)G(r′′,r, ε)Σxc(r,r′′, ε)δ(rr′′)vxc(r)= 0
(D.14)
gegeben. Hier ist Gdie voll wechselwirkende Greensfunktion [177] und
GKS(r,r, ε) := lim
η0+X
j
ψ0
j(r)ψ0
j(r)
ε(εj+ iηsgn(EFεj)) (D.15)
die Greensfunktion des Kohn-Sham-Systems mit Fermi-Energie EF, wobei der Limes so
zu verstehen ist, dass er erst nach Anwendung von GKS auf einen anderen Ausdruck
ausgef¨
uhrt wird. Es ist ferner bekannt [171,177,178], dass die Sham-Schl¨
uter-Gleichung
n¨
aherungsweise in die OEP-Gleichung (1.97)¨
uberf¨
uhrt werden kann, wenn man (i) die
Selbstenergie nur durch ihren Austauschanteil ber¨
ucksichtigt, der mit dem nicht-lokalen
Austauschoperator (1.27) identisch ist, Σx=VFock, sowie entsprechend vxc durch vxer-
setzt, und (ii) Gdurch GKS gen¨
ahert wird. Dann entspricht die eckige Klammer in (D.14)
gerade der St¨
orung vaus (D.9) und ist insbesondere unabh¨
angig von ε.
Hier soll nun speziell gezeigt werden, dass sich unter diesen Bedingungen die bei-
den Greensfunktionen gerade zu dem oben definierten verallgemeinerten Lineare-Antwort-
Operator (D.5) zusammenfassen lassen:
X0(r,r,r′′) = 1
2πiZGKS(r,r, ε)GKS(r′′,r, ε) dε . (D.16)
Da diese Beziehung nicht unmittelbar ersichtlich ist (und auch die nat¨
urlich in ¨
ahnlicher
Weise erfolgende Herleitung der OEP-Gleichung aus der Sham-Schl¨
uter-Gleichung in der
Literatur nur in sehr gestraffter” Form vorliegt), soll sie hier etwas detaillierter vorgef¨
uhrt
werden. Sei daf¨
ur zun¨
achst
F(ε) := X
j,k
ψ0
j(r)ψ0
j(r)
ε(εj+ iηsgn(EFεj))
ψ0
k(r′′)ψ0
k(r)
ε(εk+ iηsgn(EFεk)) (D.17)
definiert. Ziel ist es dann, F¨
uber die reelle Achse zu integrieren, was am einfachsten
mit Hilfe der Funktionentheorie gelingt. Sei dazu die Doppelsumme in (D.17) so sortiert,
dass alle Glieder mit εj=εkund alle mit εj6=εkzusammengefasst sind. F¨
ur den nicht
entarteten Fall ließe sich das auch zu j=kbzw. j6=kvereinfachen. Dann hat man
F(ε) = X
j,k
εj=εk
ψ0
j(r)ψ0
j(r)ψ0
k(r′′)ψ0
k(r)
[ε(εj+ iηsgn(EFεj))]2(D.18)
+X
j,k
εj6=εk
ψ0
j(r)ψ0
j(r)ψ0
k(r′′)ψ0
k(r)
[ε(εj+ iηsgn(EFεj))][ε(εk+ iηsgn(EFεk))] .
D Tensordarstellung der EXX-Methode 153
Zur Integration dieses Ausdrucks l¨
asst sich der Residuensatz anwenden:
Z
−∞
F(ε) dε= 2πiX
i
Res(F, pi),(D.19)
wobei die pidie in der oberen H¨
alfte der komplexen Ebene Cliegenden Punkte bezeichnen,
f¨
ur die Fnicht holomorph ist. Sie sind hier durch die Polstellen εi+iηsgn(EFεi) gegeben,
die zu einem besetzten Zustand igeh¨
oren. Um nun
Resi:= Res F, εi+ iηsgn(EFεi):= 1
2πiI
|εεi|=δ
F(ε) dε(D.20)
zu finden, beachte man, dass die erste Summe in (D.18) nur Pole 2. Ordnung enth¨
alt,
f¨
ur die das Residuum verschwindet. Es muss also nur noch die zweite Summe betrachtet
werden. Dort verschwinden wiederum alle Beitr¨
age mit εj6=εiεk6=εi. Damit verbleibt
Resi=1
2πiI
|εεi|=δX
j
εj6=εi
ψ0
j(r)ψ0
j(r)ψ0
i(r′′)ψ0
i(r)
[ε(εj+ iηsgn(EFεj))][ε(εi+ iη)] (D.21)
+X
k
εk6=εi
ψ0
i(r)ψ0
i(r)ψ0
k(r′′)ψ0
k(r)
[ε(εi+ iη)][ε(εk+ iηsgn(EFεk))] dε .
Dies l¨
asst sich weiter vereinfachen mit der Cauchy-Formel
f(z) = 1
2πiI
A
f(ζ)
ζzdζ(zA),(D.22)
wobei feine geeignete holomorphe Funktion in einem zul¨
assigen Gebiet ACund A
der Rand dieses Gebiets ist.2Mit ζ=εund z=εi+ iηwird (D.21) damit zu
Resi=X
j
εj6=εi
ψ0
j(r)ψ0
j(r)ψ0
i(r′′)ψ0
i(r)
(εi+ iη)(εj+ iηsgn(EFεj)) (D.23)
+X
k
εk6=εi
ψ0
i(r)ψ0
i(r)ψ0
k(r′′)ψ0
k(r)
(εi+ iη)(εk+ iηsgn(EFεk)) .
Benennt man in der zweiten Summe kin jum, lassen sich die Summen zusammenfassen.
Anschließendes Einsetzen in den Residuensatz (D.19) und Vollziehen des Grenz¨
ubergangs
η0+liefert
lim
η0+
1
2πiZF(ε) dε=
occ.
X
i
lim
η0+Resi= (D.24)
=
occ.
X
iX
j
εj6=εi
ψ0
j(r)ψ0
j(r)ψ0
i(r′′)ψ0
i(r)
εiεj
+ψ0
i(r)ψ0
i(r)ψ0
j(r′′)ψ0
j(r)
εiεj.
Alle Glieder f¨
ur besetzte Zust¨
ande jk¨
urzen sich heraus (wie man durch Vertauschen von
iund jerkennt), und ein Vergleich mit (D.5) liefert unmittelbar die Beziehung (D.16),
was zu beweisen war.
2Die genauen Bedingungen f¨
ur die G¨
ultigkeit der Cauchyschen Integralformel sowie des Residuensatzes
lassen sich nicht kurz” zusammenfassen. Man entnehme sie der Speziallitaratur, z.B. Ref. 123. Sie sind
aber f¨
ur den hier untersuchten Fall erf¨
ullt.
Anhang E
Verallgemeinerung des
EXX-Formalismus auf
N-darstellbare Ladungsdichten
Es sei hier ein Ansatz vorgeschlagen, wie der nach Abschnitt 1.6.1 nur im Falle v-dar-
stellbarer Ladungsdichten anwendbare EXX/OEP-Formalismus zumindest formal auf N-
darstellbare Dichten verallgemeinert werden kann.
Bei der in Abschnitt 1.6.3 gezeigten Herleitung der EXX/OEP-Gleichung mag folgende
Frage aufgetaucht sein: Obwohl nur f¨
ur v-darstellbare Ladungsdichten definiert, wurde die
Gleichung aus der f¨
ur alle N-darstellbaren Dichten g¨
ultigen G¨
orling-Levy-St¨
orungstheorie
(Abschnitt 1.5.4) entwickelt. An welcher Stelle ging nun diese Allgemeinheit verloren? Die
Antwort ist folgende: In (1.101) wurde davon ausgegangen, dass die zur Ladungsdichte ρ
geh¨
orende Slater-Determinante Φ0aus den Nenergetisch niedrigsten Orbitalen der Kohn-
Sham-Gleichung (1.52) aufgebaut ist. Dies gilt jedoch nur im Falle der v-Darstellbarkeit.
Wie Levy und Perdew [43] zeigen (vgl. auch Ref. 21), existiert jedoch auch f¨
ur belie-
bige N-darstellbare Dichten ρstets ein effektives Potential der Kohn-Sham-Gleichung, so
dass eine einfache, aus Ngeeigeten Kohn-Sham-Orbitalen aufgebaute Slater-Determinante
gerade auf ρf¨
uhrt. Die benutzten Orbitale sind dann aber nicht mehr notwendigerweise
die Nniedrigsten; die Determinante ist also im Allgemeinen ein angeregter Zustand des
Kohn-Sham-Systems. Diese Tatsache erm¨
oglicht nun, die Austauschenergie wiederum wie
in (1.69) formal ¨
uber den Fock-Operator zu definieren; nur dass in der Summe jetzt nicht
mehr von 1 bis N, sondern ¨
uber die Ein-Teilchen-Zust¨
ande der Determinante, d.h., ¨
uber
die besetzten Orbitale, gez¨
ahlt wird.
Mit dieser Definition lassen sich ebenfalls beide Strategien zur Berechnung von vx[ρ],
die direkte (Abschnitt 1.6.1) und die st¨
orungstheoretische (Abschnitt 1.6.3), verfolgen: Sei
die geeignete, auf ρf¨
uhrende Determinante mit Φkρbezeichnet. Dann muss in (1.101)
nur Φ0durch das entsprechende Φkρersetzt werden, und umgekehrt wird in der Summe
nat¨
urlich auch Φkρdurch Φ0ersetzt. Die resultierende Gleichung hat ganau dieselbe Ge-
stalt wie (1.103) oder (1.97), nur dass in der Summe ¨
uber die Nbesetzten Orbitale jetzt
die Orbitale von Φkρgez¨
ahlt werden, und die Summierung der unbesetzten Orbitale eben-
falls entsprechend umgestaltet werden muss. Auch die direkte Berechnung des exakten
Austauschpotentials ¨
uber (1.90) liefert dieses Resultat: in χ0von (1.93) werden besetzte
und unbesetzte Orbitale analog umgruppiert.
Dieses χ0zeigt deutlich, was hier geschieht: es vermittelt zwischen einer kleinen ¨
Ande-
rung des effektiven Potentials und der entsprechenden linearen ¨
Anderung einer Ladungs-
154
E Verallgemeinerung des EXX-Formalismus auf N-darstellbare Ladungsdichten 155
dichte, die zu einem angeregten Zustand geh¨
ort. Die Inverse wiederum lebt” sie nur
auf dem kleineren, um konstante Funktionen reduzierten Definitionsbereich kann daher
zwischen der nicht-v-darstellbaren Dichte ρund dem Potential vermitteln, was der nor-
male” lineare Antwortoperator, zum Grundzustand Φ0geh¨
orend, nicht leisten konnte.
Auf zwei Schwierigkeiten im Zusammenhang mit dieser Definition sei allerdings hin-
gewiesen: (i) Man muss von vorneherein wissen, aus welchen Kohn-Sham-Orbitalen sich
eine gegebene Ladungsdichte ρzusammensetzt. Daf¨
ur gibt es bislang allerdings kein (prak-
tisch anwendbares) Kriterium, was den formalen Charakter obiger Definition ausmacht.
(ii) Bei dieser Vorgehensweise wird die Suche in (1.65), die eigentlich ¨
uber alle antisym-
metrischen Viel-Teilchen-Zust¨
ande erfolgt, auf einfache Slater-Determinanten reduziert.
Diese Definition des universellen Funktionals ist nicht mehr ganz so allgemein wie die
urspr¨
ungliche, aber ebenfalls anwendbar; sie wird z.B. in Ref. 21 und 179 diskutiert. An-
dererseits ist die Einschr¨
ankung auf Determinanten auch von Vorteil: sie garantiert eine
Austauschenergie in einer Form analog zur Hartree-Fock-Theorie und folglich, dass bereits
die Austauschwechselwirkung zur vollst¨
andigen Aufhebung der elektronischen Selbstwech-
selwirkung ausreichend ist.
Anhang F
Symmetriegen¨
ahertes EXX:
Herleitung der variationellen
Formulierung
Um ein Variationsprinzip f¨
ur das symmetriegen¨
aherte EXX-Verfahren (Abschnitt 4.6) her-
zuleiten, wird im Folgenden zun¨
achst die OEP-Gleichung (1.96) in periodischen Rand-
bedingungen formuliert (f¨
ur ein spin-kompensiertes System) und anschließend auf eine
Gestalt gebracht, die sich leicht als induzierte Ladungsdichte interpretieren l¨
asst. Wie in
Anhang Asei das Konjugiert-Komplexe zur Vermeidung zu vieler Klammern wieder durch
einen Querstrich anstelle eines Sterns gekennzeichnet.
Analog zu (B.12) ist die auf die unbesetzten Zust¨
ande projizierte Greensche Funktion
des Hamilton-Operators in (3.14) gegeben durch
G
ik(r,r) :=
unocc.
X
j
ψ0
jk(r)ψ0
jk(r)
ε0
ikε0
jk
=G
ik(r,r) = G
ik(r,r),(F.1)
wobei noch die nachfolgend benutzte Symmetrieeigenschaft mit angegeben wurde. Damit
kann der lineare Antwortoperator (4.69) in der Form
χ0(r,r) = X
k
occ.
X
i
unocc.
X
j
4ψ0
ik(r)ψ0
jk(r)ψ0
jk(r)ψ0
ik(r)
ε0
ikε0
jk
(F.2)
=X
k
occ.
X
i
4ψ0
ik(r)G
ik(r,r)ψ0
ik(r)
geschrieben werden. Einsetzen in die OEP-Integrodifferentialgleichung (1.96) liefert dann
X
k
occ.
X
iZvx(r)·4ψ0
ik(r)G
ik(r,r)ψ0
ik(r)d3r= (F.3)
=X
k
occ.
X
iZ2δEx[ρ]
δψ0
ik(r)G
ik(r,r)ψ0
ik(r) + 2 δEx[ρ]
δψ0
ik(r)G
ik(r,r)ψ0
ik(r)d3r,
wobei der Faktor 2 auf der rechten Seite aus der Summe ¨
uber den Spin resultiert. Um dies
auf eine Gestalt zu bringen, die sich in gewohnter Weise st¨
orungstheoretisch interpretieren
156
F Symmetriegen¨
ahertes EXX: Herleitung der variationellen Formulierung 157
l¨
asst (d.h., die Greensche Funktion soll von links auf eine St¨
orung wirken), werden beide
Seiten der Gleichung komplex konjugiert:
X
k
occ.
X
iZψ0
ik(r)G
ik(r,r)·2vx(r)ψ0
ik(r)d3r= (F.4)
=X
k
occ.
X
iZψ0
ik(r)G
ik(r,r)δEx[ρ]
δψ0
ik(r)+ψ0
ik(r)G
ik(r,r)δEx[ρ]
δψ0
ik(r)d3r
=X
k
occ.
X
iZψ0
ik(r)G
ik(r,r)VFockψ0
ik(r) + ψ0
ik(r)G
ik(r,r)VFockψ0
ik(r)d3r.
Dabei wurde die Symmetrierelation (F.1) der Greenschen Funktion verwendet und in der
zweiten Umformung noch (1.22) sowie (1.27) benutzt. Umstellen liefert schließlich
X
k
occ.
X
iψ0
ik(r)ZG
ik(r,r) (VFock 2ˆvx)ψ0
ik(r) d3r
|{z }
=: ψ1
ik(r)
+ (F.5)
+ψ0
ik(r)ZG
ik(r,r)VFockψ0
ik(r) d3r
|{z }
=: f
ψ1
ik(r)
= 0 .
Durch die Wirkung der Greenschen Funktion auf die jeweils rechts von ihr stehenden
Ausdr¨
ucke k¨
onnen die Integrale als lineare Korrekturfunktionen ψ1
ikbzw. f
ψ1
ikaufgefasst
werden, mit denen sich die linke Seite der Gleichung in ¨
ahnlicher Form wie die induzierte
Ladungsdichte (2.4) zusammenfassen l¨
asst:
f
ρ(r) := X
k
occ.
X
iψ0
ik(r)ψ1
ik(r) + ψ0
ik(r)f
ψ1
ik(r)= 0 .(F.6)
Die Korrekturfunktionen ψ1
ikund f
ψ1
ikk¨
onnen dann nat¨
urlich wieder ¨
uber die Sternhei-
mer-Gleichung berechnet werden. Analog zu (4.12) ergibt sich:
(H0ε0
i)Pc|ψ1
ii+PcH1|ψ0
ii= 0 mit H1:= VFock vx,(F.7)
(H0ε0
i)Pc|f
ψ1
ii+Pcf
H1|ψ0
ii= 0 mit f
H1:= VFock .(F.8)
Dies ist das in Abschnitt 4.6.3 verwendete Ergebnis.
Mit der Zeitinversionssymmetrie (3.7), angewandt etwa auf die linke Seite von (F.4),
erkennt man leicht, dass f¨
ur reellwertige Potentiale vxdie Definition der induzierten La-
dungsdichte (F.6) mit der urspr¨
unglichen Definition (2.4) identisch ist. F¨
ur komplexwer-
tige vx, wie sie beim symmetriegen¨
aherten EXX als Zwischenergebnisse auftreten (vgl.
Abschnitte 4.6.2 und 4.6.3), weichen die Definitionen hingegen voneinander ab.
Anhang G
Die OEP/EXX-Gleichung
aus dem Vielteilchenansatz
von G¨
orling und Levy
In Abschnitt 1.6.3 wurde, G¨
orling und Levy [42] folgend, skizziert, wie sich die OEP/EXX-
Gleichung in eleganter Weise aus einem st¨
orungstheoretischen Ansatz im Hilbertraum der
N-Teilchen-Funktionen herleiten l¨
asst. Dieser Ansatz f¨
uhrt ganz analog zur variatio-
nellen Formulierung von Kapitel 2 auf die Forderung, die durch die St¨
orung induzierte
Ladungsdichte in erster Ordnung verschwinden zu lassen (Gleichung (1.102)), wobei die
Beschreibung allerdings komplett im Viel-Teilchen-Hilbertraum erfolgt. Die ¨
Aquivalenz zur
bekannten Formulierung der OEP/EXX-Gleichung in Ein-Teilchen-Funktionen, d.h., die
Umformung von Gleichung (1.102) zu Gleichung (1.103), wurde allerdings in Ref. 42 nicht
n¨
aher erl¨
autert. Obwohl es sich dabei um eine rein algebraische Aufgabe handelt, ist diese
Umformulierung jedoch keinesfalls trivial. Um ein echtes Nachvollziehen zu erm¨
oglichen,
sei sie daher an dieser Stelle schrittweise vorgef¨
uhrt.
Setzt man dazu (1.101) in die linke Seite von Gleichung (1.102) ein, so muss zun¨
achst
der Ausdruck hΦ0|ˆρ(r)|Φjif¨
ur alle j1 ausgewertet werden. Dabei sind sowohl der Grund-
zustand Φ0als auch die angeregten Zust¨
ande Φj(j1) durch Slater-Determinanten ge-
geben, die aus den Ein-Teilchen-Zust¨
anden φider Kohn-Sham-Gleichung (1.52) aufgebaut
sind:
Φ0(x1,...,xN) = 1
N!X
P∈S
(1)pφp1(x1)···φpN(xN),
Φj(x1,...,xN) = 1
N!X
Q∈S
(1)qφνq1(x1)···φνqN(xN).
Es seien φ1,...Ndie besetzen Kohn-Sham-Orbitale, und φν1,...,φνNseien paarweis
verschiedene besetzte oder unbesetzte Kohn-Sham-Orbitale, von denen aber mindestens
eines unbesetzt sein soll.1Die ganzzahligen Indizes stehen jeweils f¨
ur einen geeigneten Satz
von Quantenzahlen und werden durch die Elemente der Permutationsgruppe Sunterein-
ander vertauscht.2F¨
ur jedes P S sei dabei P(1,...,N) = (p1,...,pN). pgibt an, ob
1Genau genommen m¨
usste νj
istatt νigeschrieben werden, denn jedes Φjist nat¨
urlich aus anderen
Kohn-Sham-Orbitalen aufgebaut. Der ¨
Ubersichtlichkeit halber wird der Index jhier jedoch unterdr¨
uckt.
2Anstatt der Quantenzahlen k¨
onnte man auch die Koordinatenindizes permutieren. Bei der folgenden
Auswertung von hΦj|Vee|Φ0ierweist es sich jedoch als einfacher, die Quantenzahlen zu vertauschen.
158
G Die OEP/EXX-Gleichung aus dem Vielteilchenansatz von G¨
orling und Levy 159
Peine gerade oder ungerade Permutation ist. Die Permutationen wurden beim angereg-
ten Zustand mit Qbezeichnet, um im Nachfolgenden Verwirrungen zu vermeiden. Ferner
sollen die Ein-Teilchen-Zust¨
ande wie in (1.13) aus Spin- und Ortsanteil zusammengesetzt
sein, also φk(xi) := ψk(ri)χσk(si) mit xi:= (ri, si) und der Spinquantenzahl σkdes k-ten
Zustandes. Abk¨
urzend sei noch die Notation
Zdxi··· :=
+1
2
X
si=1
2Zd3ri··· (G.1)
f¨
ur die Integration ¨
uber den Ort und die Summe ¨
uber die beiden Spinkan¨
ale eingef¨
uhrt.
Damit ergibt sich:
hΦ0|ˆρ(r)|Φji=hΦ0|
N
X
m=1
δ(rrm)|Φji(G.2)
=1
N!X
P,Q∈S
(1)p+q
N
X
m=1 Zdx1···dxN·
·φ
p1(x1)···φ
pN(xN)δ(rrm)φνq1(x1)···φνqN(xN)
=1
N!X
P,Q∈S
(1)p+q·
·
N
X
m=1hφp1|φνq1i···hφpm|δ(rrm)|φνqmi···hφpN|φνqNi.
Ist Φjein mehrfach angeregter Zustand, enth¨
alt also mehrere Ein-Teilchen-Zust¨
ande φνi
mit νi> N, werden in allen Summanden orthogonale Zust¨
ande direkt miteinander gekop-
pelt, und der gesamte Ausdruck verschwindet. Sei also in Φjnur der α-te Ein-Teilchen-
Zustand angeregt, φαφνα, und f¨
ur die anderen Ein-Teilchen-Zust¨
ande gelte o.B.d.A.
φνi=φi. F¨
ur das Matrixelement hφpi|φνqiigilt dann: Es verschwindet, wenn qi=α, denn
in jedem Fall ist hφpi|φναi= 0. F¨
ur qi6=αerh¨
alt man hφpi|φνqii=hφpi|φqii=δpiqi.
Definiert man ein umgekehrtes Kronecker-Symbol” durch
˜
δαβ := 1 δαβ =0, α =β
1, α 6=β,(G.3)
l¨
asst sich dies mit hφpi|φνqii=δpi,qi˜
δα,qizusammenfassen, und (G.2) wird zu
hΦ0|ˆρ(r)|Φji=1
N!X
P,Q∈S
(1)p+q
N
X
m=1
δp1,q1˜
δα,q1···δpm1,qm1˜
δα,qm1·
·hφpm|δ(rrm)|φνqmiδpm+1,qm+1 ˜
δα,qm+1 ···δpN,qN˜
δα,qN.
Auf Grund der δpi,qiverschwinden alle Summanden mit P6=Q, es gilt also
hΦ0|ˆρ(r)|Φji=
=1
N!X
Q∈S
(1)2q
N
X
m=1
˜
δα,q1···˜
δα,qm1hφqm|δ(rr)|φνqmi˜
δα,qm+1 ···˜
δα,qN,
160 G Die OEP/EXX-Gleichung aus dem Vielteilchenansatz von G¨
orling und Levy
wobei noch benutzt wurde, dass rmeine reine Integrationsvariable bei der Berechnung
des Skalarprodukts ist, die in rumbenannt werden kann.3Bei der Summation ¨
uber m
von 1 bis Ndurchlaufen auch die qijeweils alle Werte von 1 bis N. Daher kann man die
Ersetzung qiidurchf¨
uhren, und man hat
hΦ0|ˆρ(r)|Φji=1
N!X
Q∈S
N
X
m=1
˜
δα,1···˜
δα,m1hφm|δ(rr)|φνmi˜
δα,m+1 ···˜
δα,N .
Da die Summanden nun von qiunabh¨
angig sind, liefert die Summation ¨
uber Qgenau N!
mal dasselbe, womit sich der Normierungsfaktor wegk¨
urzt. Auf Grund der ˜
δα,i kann des
Weiteren in der Summe ¨
uber mnur der Summand m=αvon 0 verschieden sein. Damit
ergibt sich schließlich
hΦ0|ˆρ(r)|Φji=hφα|δ(rr)|φναi
=Zdxψ
α(r)χ
σα(s)δ(rr)ψνα(r)χσνα(s)
=ψ
α(r)ψνα(r)δσασνα.
Das Ergebnis ist 0, wenn die Spinquantenzahlen σαund σναdes besetzten bzw. unbesetzten
Zustandes nicht ¨
ubereinstimmen. Insgesamt erh¨
alt man also
hΦ0|ˆρ(r)|Φji=(ψ
α(r)ψνα(r)δσασναf¨
ur Φjeinfach angeregt mit φαφνα
0 f¨
ur Φjmehrfach angeregt .(G.4)
Es sei bemerkt, dass das Matrixelement hier eine r-abh¨
angige Funktion und kein Skalar
ist, weil der Dichteoperator ˆρin (G.2) außer von den Teilchenkoordinaten rmnoch von
der Koordinate rabh¨
angt, ¨
uber die im Skalarprodukt nicht integriert wird.
Multipliziert man nun (1.101) von links mit hΨ0|ˆρ(r)|, wobei gem¨
Abschnitt 1.6.3
Ψ0= Φ0, liefern folglich nur die Summanden mit einfach angeregten Slater-Determinanten
einen Beitrag. Zur Berechnung ihrer entsprechenden Koeffizienten werden nun noch die
Matrixelemente des lokalen Potentials vlok[ρ] := vH[ρ] + vx[ρ] und des Operators der ge-
samten elektronischen Wechselwirkung Vee ben¨
otigt.
Sei also Φjeine einfach angeregte Determinante, in der wieder wie oben φαdurch φνα
ersetzt worden ist. F¨
ur das lokale Potential erh¨
alt man dann mit einer zur Auswertung
von (G.2) analogen ¨
Uberlegung:
hΦj|vlok[ρ]|Φ0i=hφνα|vlok[ρ]|φαiδσασνα.(G.5)
F¨
ur den Operator der elektronischen Wechselwirkung ergibt sich:
hΦj|Vee|Φ0i=1
N!X
P,Q∈S
(1)p+q1
2
N
X
m,n=1
m6=n
Zdx1···dxN·(G.6)
·φ
νq1(x1)···φ
νqm(xm)···φ
νqn(xn)···φ
νqN(xN)·
·1
|rmrn|φp1(x1)···φpm(xm)···φpn(xn)···φpN(xN).
3Formal streng korrekt w¨
are es, das Skalarprodukt durch hφqm|δ(r ·)|φνqmiauszudr¨
ucken.
G Die OEP/EXX-Gleichung aus dem Vielteilchenansatz von G¨
orling und Levy 161
Da bis auf φναalle φνibesetzte Zust¨
ande bezeichnen, sei also o.B.d.A. wieder φνi=φi
f¨
ur i6=αgesetzt. Damit k¨
onnen bei der Summation ¨
uber Qh¨
ochstens die Permutation
Q=P, also insbesondere qm=pmund qn=pn, und die Permutation der Vertauschung
dieser beiden Zust¨
ande, also q1=p1,...,qm=pn,...,qn=pm,...,qN=pN, einen
Beitrag liefern. Ganz analog zur Berechnung der Wechselwirkungsenergie einer Slater-De-
terminante ergibt sich
hΦj|Vee|Φ0i=1
N!X
P∈S
1
2
N
X
m,n=1
m6=n
Zdx1···dxN·
·(1)2pφ
νp1(x1)···φ
νpm(xm)···φ
νpn(xn)···φ
νpN(xN)·
·1
|rmrn|φp1(x1)···φpm(xm)···φpn(xn)···φpN(xN)+
+ (1)2p+1 φ
νp1(x1)···φ
νpn(xm)···φ
νpm(xn)···φ
νpN(xN)·
·1
|rmrn|φp1(x1)···φpm(xm)···φpn(xn)···φpN(xN).
Wenn φνi=φif¨
ur alle i {1,...,N}gelten w¨
urde, entspr¨
ache die erste eckige Klammer
exakt dem Ausdruck f¨
ur die Hartree-Energie und die zweite w¨
are mit der Austausch-
Energie identisch, wenn Summen und Integrale jeweils hineingezogen w¨
urden. Nun ist
aber φναorthogonal zu jedem besetzten Zustand. Summanden, in denen φναdirekt an φα
gekoppelt wird, verschwinden daher beim Ausf¨
uhren der Integration:
hΦj|Vee|Φ0i=
=1
N!X
P∈S
1
2
N
X
m,n=1
m6=n
(+1) ˜
δα,p1˜
δα,p2···˜
δα,pn1˜
δα,pn+1 ···˜
δα,pm1˜
δα,pm+1 ···˜
δα,pN·
·Zφ
νpm(xm)φ
νpn(xn)φpm(xm)φpn(xn)
|rmrn|dxmdxn+
+ (1) ˜
δα,p1˜
δα,p2···˜
δα,pn1˜
δα,pn+1 ···˜
δα,pm1˜
δα,pm+1 ···˜
δα,pN·
·Zφ
νpn(xm)φ
νpm(xn)φpm(xm)φpn(xn)
|rmrn|dxmdxn,
wobei ˜
δαβ wieder wie in (G.3) definiert sei. Die Variablen xmund xnwerden nur zur
Integration ben¨
otigt und k¨
onnen daher auch in xbzw. xumbenannt werden. Ferner
durchlaufen bei der Summation ¨
uber mund njeweils von 1 bis Nauch die Variablen pm
bzw. pnje alle Werte von 1 bis N, und es ist pm6=pngenau dann, wenn m6=n. Daher
kann man ersetzen: pmmund pnn. Insgesamt erh¨
alt man so:
162 G Die OEP/EXX-Gleichung aus dem Vielteilchenansatz von G¨
orling und Levy
hΦj|Vee|Φ0i=
=1
N!X
P∈S
1
2
N
X
m,n=1
(m6=n)
˜
δα,1˜
δα,2···˜
δα,n1˜
δα,n+1 ···˜
δα,m1˜
δα,m+1 ···˜
δα,N ·
·Zφ
νm(x)φ
νn(x)φm(x)φn(x)
|rr|dxdxZφ
νn(x)φ
νm(x)φm(x)φn(x)
|rr|dxdx.
Der Fall m=nmuss hier nicht mehr explizit ausgeschlossen werden, da sich die ent-
sprechenden Ausdr¨
ucke gegenseitig wegheben. Ferner ist die geschweifte Klammer von der
Permutation Punabh¨
angig, die Summe ¨
uber Pliefert also N! mal dasselbe, und der Nor-
mierungsfaktor k¨
urzt sich heraus. Auf Grund der ˜
δα,i tragen weiter zur Summe ¨
uber m
und nnur Glieder bei, f¨
ur die m=αoder n=αgilt. Es ist daher
hΦj|Vee|Φ0i=
=1
2
N
X
n=1
(m=α)
Zφ
να(x)φ
νn(x)φα(x)φn(x)
|rr|dxdxZφ
νn(x)φ
να(x)φα(x)φn(x)
|rr|dxdx
+1
2
N
X
m=1
(n=α)
Zφ
νm(x)φ
να(x)φm(x)φα(x)
|rr|dxdxZφ
να(x)φ
νm(x)φm(x)φα(x)
|rr|dxdx.
Beide Klammern sind identisch, wenn man in der oberen Zeile die Laufvariable nin m
umbenennt und die Namen der Integrationsvariablen xund xvertauscht. So ergibt sich
hΦj|Vee|Φ0i=
=
N
X
m=1 Zφ
να(x)φ
νm(x)φm(x)φα(x)
|rr|dxdxZφ
να(x)φ
νm(x)φm(x)φα(x)
|rr|dxdx.
Nun war nach Voraussetzung φνm=φmf¨
ur m6=α. Der Summand mit m=αjedoch ist
0, da die beiden Integrale identisch sind. Er bleibt auch 0, wenn in der Formal φ
νm(x) f¨
ur
alle m {1,...,N}durch φ
m(x) ersetzt wird. Damit folgt
hΦj|Vee|Φ0i=
=
N
X
m=1 Zφ
να(x)φ
m(x)φm(x)φα(x)
|rr|dxdxZφ
να(x)φ
m(x)φm(x)φα(x)
|rr|dxdx
=Zφ
να(x)ZPN
m=1 φ
m(x)φm(x)
|rr|dxφα(x) dx
Zφ
να(x)ZN
X
m=1
φ
m(x)φm(x)
|rr|φα(x) dxdx
=δσασναZψ
να(r)Zρ(r)
|rr|d3rψα(r) d3r+
+δσασναZψ
να(r)ZN
X
m=1
δσmσα
ψ
m(r)ψm(r)
|rr|ψα(r) d3rd3r .
G Die OEP/EXX-Gleichung aus dem Vielteilchenansatz von G¨
orling und Levy 163
Im letzten Schritt wurde benutzt, dass die Integration gem¨
(G.1) die Summation ¨
uber die
Spinkan¨
ale miteinschließt. Wird diese Summation ausgef¨
uhrt, verschwinden alle Terme, in
denen Wellenfunktionen mit unterschiedlichen Spinquantenzahlen gekoppelt werden. Die
Ortsintegration erfolgt dann nur noch ¨
uber den Ortanteil ψider Wellenfunktion. Ferner
wurde die Definition der Ladungsdichte (1.53) eingesetzt. In den Klammern stehen damit
gerade die Definitionen des Hartree-Potentials (1.25) und des Austausch-Potentials (1.27).
Es ist also schließlich
hΦj|Vee|Φ0i= (G.7)
=δσασναZψ
να(r)vH[ρ](r)ψα(r) d3r+δσασναZψ
να(r)VFock[{ψi}]ψα(r) d3r
=δσασναhψνα|vH[ρ]|ψαi+δσασναhψνα|VFock[{ψi}]|ψαi.
Bevor Ausdruck (1.102) endg¨
ultig ausgewertet werden kann, wird noch die Differenz
E0Ejder Energien der Slater-Determinanten ben¨
otigt. Dies ist jedoch einfach: Da Φ0
und ΦjDeterminanten eines Kohn-Sham-Systems sind, sind die zugeh¨
origen Energien
durch die Summe der Energien der Ein-Teilchen-Zust¨
ande gegeben, aus denen sie jeweils
aufgebaut sind, vgl. die Fußnote auf Seite 20. Unterscheiden sich Φ0und Φjnur darin,
dass der besetzte Zustand φidurch den unbesetzten Zustand φjersetzt worden ist, folgt
unmittelbar E0Ej=εiεj.
Damit gelingt nun die Umformulierung der Viel-Teilchen- in die Ein-Teilchen-Darstel-
lung. Setzt man (1.101) unter Beachtung von Ψ0= Φ0in (1.102) ein und benutzt (G.4),
(G.5) und (G.7), hat man
hΨ0|ˆρ(r)|Ψ1i= (G.8)
=
X
j=1hΦ0|ˆρ(r)|ΦjihΦj|Vee vH[ρ]vx[ρ]|Φ0i
E0Ej
=
N
X
α=1
X
να=N+1
δσασναψ
α(r)ψνα(r)hψνα|vH[ρ] + VFock[{ψk}]vH[ρ]vx[ρ]|ψαi
εαενα
.
Die Summe ¨
uber die besetzten Zust¨
ande kommt ins Spiel, da jeder besetzte Zustand ψα
(α {1,...,N}) durch jeden unbesetzten Zustand ψνα(να {N+ 1,...}) ersetzt wer-
den muss. Bei einem nicht-spinpolarisierten System ist stets δσασνα= 1, daf¨
ur w¨
aren die
Summanden aber noch mit geeigneten Besetzungszahlen zu multiplizieren. Die Umbenen-
nung αi,ναjliefert schließlich in der Tat die linke Seite der OEP/EXX-Gleichung
(1.103), was zu zeigen war.
Mit (2.8) erkennt man, dass es sich bei der in Kapitel 2definierten induzierten La-
dungsdichte (2.4) und der von Levy und G¨
orling hergeleiteten Dichte¨
anderung (1.102) um
v¨
ollig identische Ausdr¨
ucke handelt:
ρ:=
occ.
X
i
(ψ0
i)ψ1
i+ c.c. = hΨ0|ˆρ(r)|Ψ1i+ c.c. ,(G.9)
wobei die ψ1
idie linearen Korrekturen der Ein-Teilchen-Wellenfunktionen ψ0
isind und Ψ1
die lineare Korrektur des Viel-Teilchen-Grundzustandes Ψ0ist.
Anhang H
Verallgemeinerte
Wannier-Funktionen
H.1 Translation um einen Gittervektor
Verallgemeinerte Wannier-Funktionen zu festem nk¨
onnen durch Translation ineinander
¨
uberf¨
uhrt werden. Setzt man die Definition der Blochfunktionen (3.4) n¨
amlich in (8.6) ein,
folgt
hr|nRi=
(2π)3ZBZ
eiR·k
N
X
m=1
Uk
mn ψmk(r) (H.1)
=
(2π)3ZBZ
eiR·k
N
X
m=1
Uk
mn eik·rumk(r)
=
(2π)3ZBZ
ei0·k
N
X
m=1
Uk
mn eik·(rR)umk(rR)
=hrR|n0i,
d.h., |nRiist in Ortsdarstellung die um den Gittervektor Rverschobene Funktion |n0i.
H.2 Aktualisierung der ¨
Uberlapp-Matrix
Zentrale Bedeutung bei der Implementierung des in Abschnitt 8.1 vorgestellten Verfahrens
zur Erzeugung von Wannier-Funktionen von Marzari und Vanderbilt [116,117] kommt den
¨
Uberlapp-Matrizen (8.15) zu. Aus ihnen ergibt sich ¨
uber die Momente der
Wannier-Ver-
teilung” (8.13) und (8.14) sowohl die Lokalisierung (8.9) der Wannier-Funktionen als auch
der Gradient der Lokalisierung (8.19). Andererseits stellt die Berechnung der Nk·N2Ma-
trixelemente (Nk: Anzahl der k-Punkte, N: Anzahl der B¨
ander) aus den Blochfunktionen
gem¨
Definition (8.15) aber auch den teuersten Schritt in dem Verfahren dar.
Die Effizienz der Methode beruht letztlich darauf, dass außer bei der Initialisie-
rung die ¨
Uberlapp-Matrizen mittels einer numerisch trivialen Matrizenmultiplikation
auch aus den unit¨
aren Transformationen erhalten werden k¨
onnen, wie Gleichung (8.21)
zeigt. Da die Elemente der ¨
Uberlapp-Matrizen zudem die einzige Stelle im Iterationspro-
zess sind, an der die (durch vorangehende Schritte im Allgemeinen bereits transformierten)
164
H.3 Der Hamilton-Operator in der Darstellung Verallgemeinerter Wannier-Funktionen 165
Blochfunktionen explizit eingehen, entf¨
allt damit auch die Notwendigkeit, die Durchmi-
schung der B¨
ander gem¨
(8.5) explizit ausf¨
uhren zu m¨
ussen.
Die Beziehung (8.21) l¨
asst sich leicht herleiten: Multipliziert man (8.5) mit eik·r, folgt
|unki
N
X
m=1
Uk
mn|umki.
F¨
ur die Transformation der ¨
Uberlapp-Matrixelemente ergibt sich damit
Mk,k
mn := humk|un,k+∆ki N
X
µ=1
(Uk
µm)huµk|N
X
ν=1 |uν,k+∆kiUk+∆k
νn
=
N
X
µ,ν=1
(Uk
µm)huµk|uν,k+∆kiUk+∆k
νn
=(Uk)+Mk,kUk+∆kmn ,
was zu beweisen war.
H.3 Der Hamilton-Operator in der Darstellung Verallge-
meinerter Wannier-Funktionen
Die Definition der Verallgemeinerten Wannier-Funktionen (8.6) liefert f¨
ur die Matrixele-
mente des Hamilton-Operators
hnR|H|nRi= (H.2)
=2
(2π)6N
X
m=1 Z
BZ
d3khψmk|e+ik·R(Uk
mn)HN
X
m=1 Z
BZ
d3kUk
mneik·R|ψmki
=2
(2π)6X
m, mZd3kd3kei·(kRkR)(Uk
mn)Uk
mnhψmk|H|ψmki
|{z }
=εmkδmmδ(kk)
=2
(2π)6X
mZd3keik·(RR)(Uk
mn)Uk
mnεmk.
Hierbei wurde angenommen, dass die Blochfunktionen auf das periodische Grundgebiet
normiert sind (vgl. Abschnitt 3.1). Sind sie hingegen auf die Einheitszelle normiert, muss
die rechte Seite von (H.2) noch mit der Anzahl NRder darin enthaltenen Einheitszellen
multipliziert werden, da im Kontext mit Wannier-Funktionen das Skalarprodukt h...|...i
im Ortsraum sinnvollerweise als Integral ¨
uber das periodische Grundgebiet1definiert ist.
1Hierin liegt eine potentielle Fehlerquelle bei der Implementierung in einen Ebene-Wellen-Code: Dort
wird meist nur der periodische Anteil der Blochfunktionen betrachtet, der dann auf die Einheitszelle
normiert ist, vgl. Abschnitt 3.3.
166 H Verallgemeinerte Wannier-Funktionen
Spezialfall klassischer Wannier-Funktionen
F¨
ur den Spezialfall klassischer Wannier-Funktionen, wenn also die Durchmischung der
B¨
ander (8.5) abgeschaltaltet wird, l¨
asst sich obige Formel (H.2) vereinfachen. Setzt man
dazu alle Uk:= 1, erh¨
alt man
hnR|H|nRi=2
(2π)6X
mZd3keik·(RR)δmn δmnεmk(H.3)
=δnn
2
(2π)6Zd3keik·(RR)εnk.
Matrixelemente zwischen klassischen Wannier-Funktionen verschiedener B¨
ander (hier sind
nund nja wirklich Bandindizes) verschwinden also. Dies ist klar, weil die Teilhilbertr¨
aume
der zu den (isolierten) B¨
andern geh¨
orenden Blochfunktionen orthogonal zueinander stehen.
Ferner sind die nicht-verschwindenden Elemente direkt ¨
uber eine Fouriertransformation
des Bandes εnk(kBZ) gegeben.
H.4 Berechnung der Ein-Teilchen-Energien aus der Wan-
nier-Darstellung
In (H.2) gehen in der rechten Seite die aus einer vorangegangenen Diagonalisisierung von
Hin ebenen Wellen bereits bekannten Eigenwerte εmkein. Umgekehrt erh¨
alt man die
Ein-Teilchen-Energien aus der Wannier-Darstellung von H¨
uber Gleichung (8.26) [122].
Sie soll hier bewiesen werden.
Dazu seien zun¨
achst die Projektionen der Bloch- auf die Wannier-Funktionen mit Hilfe
der Wannier-Funktionen der Heimatzelle” bei R=0ausgedr¨
uckt:
hnR|ψmki=ZPG
d3rhnR|rihr|ψmki
rr+R
=ZPG
d3rhnR|r+Rihr+R|ψmki
(H.1)
=ZPG
d3rhn0|riψmk(r+R)
Bloch
=ZPG
d3rhn0|riψmk(r) eik·R
=hn0|ψmkieik·R.
F¨
ur die Substitution im zweiten Schritt wurde ausgenutzt, dass sowohl Wannier- wie
auch Blochfunktionen auf dem periodischen Grundgebiet (PG) periodisch sind. Im dritten
Schritt wurde die Translationseigenschaft (H.1) der Wannier-Funktionen benutzt und im
vierten noch die Blochbedingung (3.5). Mit der Vollst¨
andigkeitsrelation2(8.3) folgt dann
|ψmki=X
n, R|nRihnR|ψmki=X
n, R|nRihn0|ψmkieik·R.
Diese Relation gilt auch dann, wenn in der Summe nicht ¨
uber alle B¨
ander, sonden nur ¨
uber
die B¨
ander n {1,...,N}einer isolierten Gruppe” (vgl. Abschnitt 8.1.1) summiert wird,
2Die Vollst¨
andigkeitsrelation (8.3) ist dort f¨
ur klassische Wannier-Funktionen formuliert. Sie gilt aber
gem¨
Abschnitt 8.1.1 auch f¨
ur Verallgemeinerte Wannier-Funktionen.
H.4 Berechnung der Ein-Teilchen-Energien aus der Wannier-Darstellung 167
und |ψmkiin dieser Gruppe enthalten ist.3Damit gilt an jedem Punkt kdes reziproken
Raums f¨
ur die Ein-Teilchen-Energien:
εmkδmm=hψmk|H|ψmki
=X
n, R
eik·Rhψmk|n0ihnR|HX
n,R|nRihn0|ψmkieik·R
=X
n, nhψmk|n0iX
R,R
eik·(RR)hnR|H|nRihn0|ψmki.
Dies ist aber komponentenweise geschrieben gerade die unit¨
are Transformation beim
Wechsel von der Wannier- zur Energiedarstellung von H, so dass die εmkalso auch die
Eigenwerte der Matrix Ekmit
Ek
nn:= X
R,RPG
eik·(RR)hnR|H|nRi(H.4)
=X
R,RPG
eik·(RR)hn, RR|H|n0i
=NRX
RPG
eik·RhnR|H|n0i
sind. Im zweiten Schritt wurde die Gitterperiodizit¨
at des Hamilton-Operators verwendet,
und f¨
ur den letzten Schritt beachte man, dass f¨
ur beliebiges festgehaltenes Rdie Summe
¨
uber Rwegen der mit dem Grundgebiet PG periodischen Wannier-Funktionen identisch
ist. Q.e.d.
3Es gilt n¨
amlich PN
n=1 PR|nRihnR|=PN
m=1 RBZ d3k|ψmkihψmk|wegen der Unitarit¨
at der Transfor-
mation (8.6). Dies ist aber gerade die 1im Teilhilbertraum Tder isolierten Gruppe.
X
Literaturverzeichnis
[1] P. Hohenberg und W. Kohn, Phys. Rev. 136, B 864 (1964)
[2] W. Kohn und L.J. Sham, Phys. Rev. 140, A 1133 (1965)
[3] H.B. Shore, J.H. Rose und E. Zaremba, Phys. Rev. B 15, 2858 (1977)
[4] K. Schwarz, Chem. Phys. Lett. 57, 605 (1978)
[5] J.P. Perdew und A. Zunger, Phys. Rev. B 23, 5048 (1981)
[6] J. Harris und R.O. Jones, J. Chem. Phys. 68, 3316 (1978)
[7] J.P. Perdew und M. Levy, Phys. Rev. Lett. 20, 1884 (1983)
[8] L.J. Sham und M. Schl¨
uter, Phys. Rev. B 32, 3883 (1985)
[9] E. Schr¨
odinger, Ann. d. Physik 79, 361 (1926)
[10] M. Born und J.R. Oppenheimer, Ann. d. Physik 84, 457 (1927)
[11] J. Bardeen, L.N. Cooper und J.R. Schrieffer, Phys. Rev. 108, 1175 (1957)
[12] D.R. Hartree, Proc. Camb. Phil. Soc. 24, 328 (1928)
[13] V.A. Fock, Z. Phys. 61, 126 (1930)
[14] C. ller und M.S. Plesset, Phys. Rev. 46, 618 (1934)
[15] A. Szabo und N.S. Ostlund, Modern Quantum Chemistry, McGraw-Hill, New York
(1989)
[16] J.C. Slater und J.H. Wood, Int. J. Quantum Chem. 4, 3 (1971)
[17] L.H. Thomas, Proc. Camb. Phil. Soc. 23, 542 (1927)
[18] E. Fermi, Rend. Accad. Lincei 6, 602 (1927)
[19] E. Fermi, Z. Phys. 48, 73–79 (1928)
[20] E. Fermi, Rend. Accad. Lincei 7, 342 (1928)
[21] R.G. Parr und W. Yang, Density-functional theory of atoms and molecules, Oxford
University Press (1989)
[22] E. Teller, Rev. Mod. Phys. 34, 627 (1962)
169
170 LITERATURVERZEICHNIS
[23] C.-O. Almbladh und A.C. Pedroza, Phys. Rev. A 29, 2322 (1984)
[24] R.M. Dreizler und E.K.U. Gross, Density Functional Theory, Springer, Berlin (1990)
[25] C.-O. Almbladh und U. von Barth, Phys. Rev. B 31, 3231 (1985)
[26] F.J. Janak, Phys. Rev. B 18, 7165 (1978)
[27] M. Levy, Proc. Natl. Acad. Sci. USA 76, 6062 (1979)
[28] T.L. Gilbert, Phys. Rev. B 12, 2111 (1975)
[29] D.C. Langreth und M.J. Mehl, Phys. Rev. B 28, 1809 (1983)
[30] M. Levy und J.P. Perdew, Phys. Rev. A 32, 2010 (1985)
[31] M. Levy, Phys. Rev. A 43, 4637 (1991)
[32] E.J. Baerends, Phys. Rev. Lett. 87, 133004-1 (2001)
[33] U. von Barth und L. Hedin, J. Phys. C 5, 1629 (1972)
[34] D.M. Ceperley und B.L. Alder, Phys. Rev. Lett. 45, 566 (1980)
[35] A.D. Becke, Phys. Rev. A 38, 3098 (1988)
[36] J.P. Perdew, Phys. Rev. B 33, 8822 (1986)
[37] C.L. Lee, W. Yang und R.G. Parr, Phys. Rev. B 37, 785 (1988)
[38] J.P. Perdew und Y. Wang, Phys. Rev. B 45, 13244 (1992)
[39] J.P. Perdew, K. Burke und M. Ernzerhof, Phys. Rev. Lett. 77, 3865 (1996)
[40] A. G¨
orling und M. Levy, Phys. Rev. B 47, 13 105 (1993)
[41] A. G¨
orling und M. Levy, Phys. Rev. A 50, 196 (1994)
[42] A. G¨
orling und M. Levy, Int. J. Quantum Chem., Symp. 29, 93 (1995)
[43] M. Levy und J.P. Perdew in Density Functional Methods In Physics (Hrsg.: R.M.
Dreizler und J. Providencia), Plenum Press, New York (1985)
[44] C.J. Umrigar und X. Gonze, Phys. Rev. A 50, 3827 (1994)
[45] C. Filippi, X. Gonze und C.J. Umrigar in Recent Developments and Applications of
Density Functional Theory (Hrsg.: J.M. Seminario), Elsevier, Amsterdam (1996)
[46] In-Ho Lee und R.M. Martin, Phys. Rev. A 56, 7197 (1997)
[47] A. G¨
orling, Phys. Rev. B 53, 7024 (1996)
[48] T. Grabo, T. Kreibich und E.K.U. Gross, Mol. Eng. 7, 27 (1997)
[49] T. Grabo, T. Kreibich, S. Kurth und E.K.U. Gross in Strong Coulomb Correlation
in Electronic Structure (Hrsg.: V.I. Anisimov), Gordan & Breach Science Publishers
(2000)
LITERATURVERZEICHNIS 171
[50] E. Engel und R.M. Dreizler, J. Comput. Chem. 20, 31 (1999)
[51] M. St¨
adele, J.A. Majewski, P. Vogl und A. G¨
orling, Phys. Rev. Lett. 79, 2089 (1997)
[52] M. St¨
adele, M. Moukara, J.A. Majewski, P. Vogl und A. G¨
orling, Phys. Rev. B, 59,
10 031 (1999)
[53] W.G. Aulbur, M. St¨
adele und A. G¨
orling, Phys. Rev. B 62, 7121 (2000)
[54] T. Kreibich, E.K.U. Gross und E. Engel, Phys. Rev. A 57, 138 (1998)
[55] A. G¨
orling, Phys. Rev. A 46, 3753 (1992)
[56] S. Hirata, S. Ivanov, I. Grabowski, R.J. Bartlett, K. Burke und J.D. Talman, J.
Chem. Phys. 115, 1635 (2001)
[57] T. Kotani, Phys. Rev. B 50, 14 816 (1994)
[58] Q. Zhao und R.G. Parr, Phys. Rev. A 46, 2337 (1992)
[59] Q. Zhao und R.G. Parr, J. Chem. Phys. 98, 543 (1992)
[60] E. Engel und S.H. Vosko, Phys. Rev. A 47, 2800 (1993)
[61] S. Ivanov, S. Hirata und R.J. Bartlett, Phys. Rev. Lett. 83, 5455 (1999)
[62] A. G¨
orling, Phys. Rev. Lett. 83, 5459 (1999)
[63] R.T. Sharp and G.K. Horton, Phys. Rev. 90, 317 (1953)
[64] J.C. Slater, Phys. Rev. 81, 385, (1951)
[65] J.D. Talman und W.F. Shadwick, Phys. Rev. A 14, 36 (1976)
[66] K. Aashamar, T.M. Luke und J.D. Talman, At. Data and Nucl. Data Tables 22, 443
(1978)
[67] K. Aashamar, T.M. Luke und J.D. Talman, Phys. Rev. A 19, 6 (1979)
[68] V. Sahni, J. Gruenebaum und J.P. Perdew, Phys. Rev. B 26, 4371 (1982)
[69] J.P. Perdew und M.R. Norman, Phys. Rev. B 26, 5445 (1982)
[70] J.B. Krieger, Y. Li und G.J. Iafrate, Phys. Lett. A 146, 256 (1990)
[71] J.B. Krieger, Y. Li und G.J. Iafrate, Phys. Rev. A 45, 101 (1992)
[72] J.B. Krieger, Y. Li und G.J. Iafrate, Phys. Rev. A 46, 5453 (1992)
[73] J.B. Krieger, Y. Li und G.J. Iafrate, Phys. Rev. A 47, 165 (1993)
[74] D.M. Bylander und L. Kleinman, Phys. Rev. Lett. 74, 3660 (1995)
[75] D.M. Bylander und L. Kleinman, Phys. Rev. B 52, 14 566 (1995)
[76] D.M. Bylander und L. Kleinman, Phys. Rev. B 54, 7891 (1996)
[77] D.M. Bylander und L. Kleinman, Phys. Rev. B 55, 9432, (1997)
172 LITERATURVERZEICHNIS
[78] M. Wahn, Implementation und Analyse des exakten Austauschfunktionals in der
Dichtefunktionaltheorie, Diplomarbeit, Technische Universit¨
at Berlin (2002)
[79] S. K¨
ummel und J.P. Perdew, Phys. Rev. Lett. 90, 043 004 (2003)
[80] S. K¨
ummel und J.P. Perdew, Phys. Rev. B 68, 035 103 (2003)
[81] S/PHI/nX, auf C++ basierte modulare DFT-Bibliothek (http://sphinxlib.de)
[82] S. Boeck, A. Dick, Ch. Freysoldt, F. Grzegorzewski, T. Hammerschmidt, L. Ismer,
L. Lymperakis und M. Wahn, SFHIngX User’s Guide (Hrsg.: S. Boeck und J. Neu-
gebauer), Berlin (2003), online siehe Ref. 81
[83] E.N. Zein, Fiz. Tverd. Tela (Leningrad) 26, 3024 (1984) [englische ¨
Ubersetzung in
Sov. Phys. Solid State 26, 1825 (1984)]
[84] S. Baroni, P. Giannozzi und A. Testa, Phys. Rev. Lett. 58, 1861 (1987)
[85] S. Baroni, S. de Gironcoli, A. dal Corso und P. Giannozzi, Rev. Mod. Phys. 73, 515
(2001)
[86] R.M. Sternheimer f¨
uhrte mit Hilfe dieser Gleichung numerische Berechnungen zur
Polarisierbarkeit von Ionen durch, Phys. Rev. 96, 951 (1954)
[87] F. della Sala und A. G¨
orling, J. Chem. Phys. 115, 5718 (2001)
[88] C. Kittel, Introduction to Solid State Physics, 7th ed., Wiley, New York (1996)
[89] O. Madelung, Introduction to Solid-State Theory, Springer, Berlin (1978)
[90] R. Enderlein und N.J.M. Horing, Fundamentals of Semiconductor Physics, World
Scientific, Singapore (1997)
[91] P.J.H. Denteneer und W. van Haeringen, J. Phys. C 18, 4127 (1985)
[92] U. Scherz, Quantenmechanik, Teubner, Stuttgart (1999)
[93] A. Baldereschi, Phys. Rev. B 7, 5212 (1973)
[94] D.J. Chadi und M.L. Cohen, Phys. Rev. B 8, 5747 (1973)
[95] J.D. Joannopoulos und M.L. Cohen, J. Phys. C 6, 1572 (1973)
[96] H.J. Monkhorst und J.D. Pack, Phys. Rev. B 13, 5188 (1976)
[97] R.A. Evarestov und V.P. Smirnov, Phys. Stat. Sol. B 119, 9 (1983)
[98] F. Gygi und A. Baldereschi, Phys. Rev. B 34, 4405 (1986)
[99] B. Wenzien, G. Cappellini und F. Bechstedt, Phys. Rev. B 51, 14 701 (1995)
[100] D.J. Singh, Planewaves, pseudopotentials and the LAPW method, Kluwer, Boston
(1994)
[101] E. Sj¨
ostedt, L. Nordstr¨
om und D. J. Singh, Solid State Comm. 114, 15 (2000)
LITERATURVERZEICHNIS 173
[102] G.K.H. Madsen, P. Blaha, K. Schwarz, E. Sj¨
ostedt und L. Nordstr¨
om, Phys. Rev. B
64, 195 134 (2001)
[103] P.E. Bl¨
ochl, Phys. Rev. B 50, 17 953 (1994)
[104] S.G. Louie, S. Froyen und M.L. Cohen, Phys. Rev. B 26, 1738 (1982)
[105] M. Fuchs, M. Bockstedte, E. Pehlke und M. Scheffler, Phys. Rev. B 57, 2134 (1998)
[106] D.R. Hamann, M. Schl¨
uter und C. Chiang, Phys. Rev. Lett. 43, 1494 (1979)
[107] G. Kerker, J. Phys. C 13, L189 (1980)
[108] G.B. Bachelet, D.R. Hamann und M. Schl¨
uter, Phys. Rev. B 26, 4199 (1982)
[109] N. Troullier und J.L. Martins, Phys. Rev. B 43, 1993 (1991)
[110] D.R. Hamann, Phys. Rev. B 40, 2980 (1989)
[111] M. Moukara, Pseudopotentiale mit exaktem Austausch, Dissertation, Technische Uni-
versit¨
at M¨
unchen (1998)
[112] M. Moukara, M. St¨
adele, J.A. Majewski, P. Vogl und A. G¨
orling, J. Phys.: Condens.
Matter 12, 6783 (2000)
[113] L. Kleinman und D.M. Bylander, Phys. Rev. Lett. 48, 1425 (1982)
[114] X. Gonze, R. Stumpf und M. Scheffler, Phys. Rev. B 44, 8503 (1991)
[115] M. Fuchs und M. Scheffler, Comput. Phys. Commun. 119, 67 (1999)
[116] N. Marzari und D. Vanderbilt, Phys. Rev. B 56, 12 847 (1997)
[117] I. Souza, N. Marzari und D. Vanderbilt, Phys. Rev. B 65, 035 109 (2001)
[118] G.H. Wannier, Phys. Rev. 52, 191 (1937)
[119] E.I. Blount, Solid State Phys. 13, 305 (1962)
[120] P.-O. L¨
owdin, J. Chem. Phys. 18, 365 (1950)
[121] P.-O. L¨
owdin, Adv. Phys. 5, 172 (1956)
[122] M. Wahn und J. Neugebauer, Phys. Stat. Sol. B 243, No. 7, 1583 (2006)
[123] R. W¨
ust, H¨
ohere Mathematik f¨
ur Physiker (Band 1 und 2), de Gruyter, Berlin (1995)
[124] L. Collatz, Differentialgleichungen, Teubner, Stuttgart (1990)
[125] W. Nolting, Grundkurs Theoretische Physik, Bd. 5, Teil 1, Abschnitt 3.2.7,
Zimmermann-Neufang, Ulmen (1989)
[126] M.R. Spiegel, Komplexe Variablen, McGraw-Hill, London (1977)
[127] F. Schwabl, Quantenmechanik, Springer, Berlin (1988)
[128] E. Polak, Computational Methods in Optimization, Academic Press, New York
(1971)
174 LITERATURVERZEICHNIS
[129] W.H. Press, S.A. Teulosky, W.T. Vetterling, und B.P. Flannery, Numerical Recipes
in C: the art of scientific computing, Cambridge University Press (1992)
[130] M.C. Payne, M.P. Teter, D.C. Allen, T.A. Arias, und J.D. Joannopoulos, Rev. Mod.
Phys. 64, 1045 (1992)
[131] J.R. Shewchuk, An Introduction to the Conjugate Gradient Method Without the
Agonizing Pain, Edition 11
4, Pittsburgh, USA (1994),
http://www.cs.cmu.edu/quake-papers/painless-conjugate-gradient.pdf
[132] M.P. Teter, M.C. Payne und D.C. Allan, Phys. Rev. B 40, 12 255 (1989)
[133] S. Ismail-Beigi und T.A. Arias, Comput. Phys. Commun. 128, 1 45 (2000)
[134] P.H. Dederichs und R. Zeller, Phys. Rev. B 28, 5462 (1983)
[135] H. Akai und P.H. Dederichs, J. Phys. C 18, 2455 (1985)
[136] C.G. Broyden, Math. Comput. 19, 577 (1965)
[137] D.D. Johnson, Phys. Rev. B 38, 12 807 (1988)
[138] G.P. Srivastava, J. Phys. A 17, L317 (1984)
[139] D. Vanderbilt und S.G. Louie, Phys. Rev. B 30, 6118 (1984)
[140] P. Pulay, Chem. Phys. Lett. 73, 393 (1980)
[141] P. Pulay, J. Comp. Chem. 3, 556 (1982)
[142] G. Kresse und J. Furthm¨
uller, Comput. Mat. Sci. 6, 15 (1996)
[143] G. Kresse und J. Furthm¨
uller, Phys. Rev. B 54, 11 169 (1996)
[144] D.R. Bowler und M.J. Gillan, Chem. Phys. Lett. 325, 473 (2000)
[145] G.P. Kerker, Phys. Rev. B 23, 3082 (1981)
[146] R. Car, E. Tosatti, S. Baroni und S. Leelaprute, Phys. Rev. B 24, 985 (1981)
[147] K.-M. Ho, J. Ihm und J.D. Joannopoulos, Phys. Rev. B 25, 4260 (1982)
[148] J.F. Annett, Comput. Mat. Sci. 4, 23 (1995)
[149] O. Gunnarsson und B.I. Lundqvist, Phys. Rev. B 13, 4274 (1976)
[150] L. Hedin, Phys. Rev. 139, A796 (1965)
[151] L. Hedin und S. Lundqvist in Solid State Physics, Advances in Research and Ap-
plication (Hrsg.: F. Seitz, D. Turnbull und H. Ehrenreich), Academic, New York
(1969), Band 23, S. 1
[152] M. Rohlfing, P. Kr¨
uger und J. Pollmann, Phys. Rev. B 57, 6485 (1998)
[153] Vgl. den ¨
Ubersichtsartikel von S.C. Jain, M. Willander, J. Narayan und R. van
Overstraeten: J. Appl. Phys. 87, 965 (2000)
LITERATURVERZEICHNIS 175
[154] C. Stampfl und C.G. Van de Walle, Phys. Rev. B 59, 5521 (1999)
[155] F. Bechstedt und J. Furthm¨
uller, J. Cryst. Growth 246, 315 (2002)
[156] Intrinsic Properties of Group IV Elements and III-V, II-VI, and I-VII Compounds
(Hrsg.: K.H. Hellwege und O. Madelung), Landolt-B¨
ornstein, New Series, Group III,
Vol. 22, Pt. A, Springer, Berlin (1987)
[157] J. Wu, W.W. Walukiewicz, K.M. Yu, J.W. Ager III, E.E. Haller, H. Lu, W.J. Schaff,
Y. Saito und Y. Nanishi, Appl. Phys. Lett. 80, 3967 (2002)
[158] T. Matsuoka, H. Okamoto, M. Nakao, H. Harima und E. Kurimoto, Appl. Phys.
Lett. 81, 1246 (2002)
[159] V.Y. Davydov, A.A. Klochikhin, V.V. Emtsev, S.V. Ivanov, V.V. Vekshin, F. Bech-
stedt, J. Furthm¨
uller, H. Harima, A.V. Mudryi, A. Hashimoto, Y. Yamamoto, J.
Aderhold, J. Graul, E.E. Haller, Phys. Stat. Sol. B 230, R4 (2002)
[160] T. Kotani und M. van Schilfgaarde, Solid State Commun. 121, 461 (2002)
[161] M. Usuda, N. Hamada, K. Shiraishi und A. Oshiyama, Jpn. J. Appl. Phys., Part 2,
43, L407 (2004)
[162] T. Lei, M. Fanciulli, R.J. Molnar, T.D. Moustakas, R.J. Graham, und J. Scanlon,
Appl. Phys. Lett. 59, 944 (1992)
[163] T. Lei, T.D. Moustakas, R.J. Graham, Y. He und S.J. Berkowitz, J. Appl. Phys. 71,
4933 (1992)
[164] C. R. Eddy, T. Moustakas und J. Scanlon, J. Appl. Phys. 73, 448 (1993)
[165] M.J. Paisley, Z. Sitar, J.B. Posthill und R.F. Davis, J. Vac. Sci. Technol. A 7, 701
(1989)
[166] Z. Sitar, M.J. Paisley, J. Ruan, J.W. Choyke und R.F. Davis, J. Mater. Sci. Lett.
11, 261 (1992)
[167] I. Vurgaftman und J.R. Meyer, J. Appl. Phys. 94, 3675 (2003)
[168] A. Qteish, private Korrespondenz
[169] A. Qteish, A.I. Al-Sharif, M. Fuchs, M. Scheffler, S. Boeck und J. Neugebauer, Phys.
Rev. B 72, 155 317 (2005)
[170] A. Qteish, P. Rinke, M. Scheffler und J. Neugebauer, Phys. Rev. B 74, 245 208 (2006)
[171] P. Rinke, A. Qteish, J. Neugebauer, C. Freysoldt und M. Scheffler, New J. Phys. 7,
126 (2005)
[172] P. Rinke, M. Scheffler, A. Qteish, M. Winkelnkemper, D. Bimberg und J. Neuge-
bauer, Appl. Phys. Lett. 89, 161 919 (2006)
[173] P. Rinke, A. Qteish, J. Neugebauer und M. Scheffler, ΨkNewsletter 79, 163 (2007)
176 LITERATURVERZEICHNIS
[174] P. Rinke, M. Winkelnkemper, A. Qteish, D. Bimberg, J. Neugebauer und M. Scheff-
ler, Consistent set of band parameters for the group-III nitrides AlN, GaN, and InN.
Phys. Rev. B, akzeptiert
[175] P. Rinke, A. Qteish, J. Neugebauer und M. Scheffler, Exciting prospects for solids:
Exact-exchange based functionals meet quasiparticle energy calculations. Phys. Stat.
Sol. B, akzeptiert
[176] M.S. Hybertsen und S.G. Louie, Phys. Rev. B 35, 5585 (1987)
[177] L.J. Sham und M. Schl¨
uter, Phys. Rev. Lett. 51, 1888 (1983)
[178] M.E. Casida, Phys. Rev. A 51, 2005 (1995)
[179] E.H. Lieb, Int. J. Quantum Chem. 24, 243 (1983)
Danksagung
Mein Dank gilt nat¨
urlich an erster Stelle Professor Dr. J¨
org Neugebauer, der mir die
Gelegenheit zur Durchf¨
uhrung dieser Doktorarbeit gegeben hat. Ohne seine Betreuung,
sein stetes Interesse am Projekt und die unz¨
ahligen fruchtbaren Diskussionen mit ihm
w¨
are diese Arbeit kaum zu verwirklichen gewesen.
Herrn Professor Dr. Scheffler danke ich daf¨
ur, dass er mir die M¨
oglichkeit gab, die-
se Arbeit am Fritz-Haber-Institut der Max-Planck-Gesellschaft (im vielleicht sch¨
onsten
Arbeitszimmer des Instituts) anzufertigen.
Sixten Boeck und Christoph Freysoldt m¨
ochte ich vor allem f¨
ur ihre unerm¨
udliche Hilfe
bei der Einarbeitung in das Programmieren mit C++ danken, aber auch f¨
ur die vielen
anderen, nicht nur wissenschaftlichen, Diskussionen. Patrick Rinke m¨
ochte ich ebenfalls
f¨
ur viele kreative Hinweise und Gespr¨
ache danken und Professor Dr. Qteish f¨
ur die Be-
reitstellung der OEP-Pseudopotentiale. Ein herzlicher Dank geht an Liverios Lymperakis,
mit dem ich lange Zeit das B¨
uro geteilt habe.
In sehr angenehmer Erinnerung bleibt mir die Zusammenarbeit mit Stefan Schulz aus
der Gruppe von Professor Dr. Czycholl an der Uni Bremen.
Außerdem gilt mein Dank allen Mitgliedern der Abteilung Computergest¨
utztes Ma-
terial-Design am MPI f¨
ur Eisenforschung sowie der Theorie-Abteilung des Fritz-Haber-
Instituts. Die gute Atmosph¨
are in diesen beiden Gruppen hat insgesamt sehr zum Gelingen
der Arbeit beigetragen.
Ebenfalls m¨
ochte ich meinen besten Freunden danken, die mich auf dem nicht immer
v¨
ollig m¨
uhelosen Weg immer wieder motiviert haben. Meiner lieben Julia danke ich f¨
ur
die Kraft und das n¨
otige Durchhalteverm¨
ogen, das sie mir in den letzten Monaten dieser
Arbeit gegeben hat.
Ganz besonders aber m¨
ochte ich an dieser Stelle meinen Eltern Dank sagen! Sie ha-
ben mir Entscheidendes erm¨
oglicht, ohne das ich diese Seiten hier nicht h¨
atte schreiben
k¨
onnen!
177