Document [original]

Matthias Wahn

Implementierung und Test

des Variationellen EXX-Verfahrens

Implementierung und Test

des Variationellen EXX-Verfahrens

Matthias Wahn

Dissertation

zur Erlangung des akademischen Grades

DOCTOR RERUM NATURALIUM

vorgelegt dem

Department Physik der Fakult¨

at f¨

ur Naturwissenschaften

an der Universit¨

at Paderborn

Tag der Einreichung: 15.5.2009

Tag der m¨

undlichen Pr¨

ufung: 22.6.2009

Promotionskommission:

Professor Dr. Klaus Lischka (Vorsitzender)

Professor Dr. Wolf Gero Schmidt (1. Gutachter)

Professor Dr. J¨

org Neugebauer (2. Gutachter)

Dr. Harald Herrmann

TEXT IN WHITE in order to keep this page empty

produced using L

EX 2ε

Kurzbeschreibung

In der vorliegenden Arbeit wurde das variationelle EXX-Verfahren (varEXX) [78,79,80]

in einen Pseudopotential-Ebene-Wellen-Code (S/PHI/nX [81,82]) implementiert, und die

Methode — zuvor nur an lokalisierten Systemen getestet — so erstmalig auch f¨

ur peri-

odische Strukturen verf¨

ugbar gemacht. Anschließend durchgef¨

uhrte Tests an verschiede-

nen Halbleitermaterialien zeigten, dass varEXX die ben¨

otigte Rechenzeit im Vergleich zur

herk¨

ommlichen, numerisch ¨

außerst aufwendigen Formulierung des EXX-Verfahrens dra-

stisch reduziert, dabei jedoch nur einen Bruchteil des Speicherplatzes ben¨

otigt.

Als Beispiel f¨

ur die auf diese Weise deutlich erweiterten Anwendungsm¨

oglichkeiten

des EXX-Formalismus wurde untersucht, ob sich exakte Austauschpotentiale ann¨

ahernd

linear in Abh¨

angigkeit von der Ladungsdichte verhalten, was von großer Bedeutung f¨

die Verwendung von EXX-Pseudopotentialen ist. Es konnten erstmals DFT-Berechnungen

mit exaktem Austauschpotential f¨

ur GaN und InN durchgef¨

uhrt werden, bei denen die

komplette semi-core-Schale der Kationen (3. Schale bei Ga, 4. Schale bei In) explizit in

der Valenz ber¨

ucksichtigt wird. Diese wurden anschließend mit Rechnungen, die nur die

3d- bzw. 4d-Elektronen als Valenzelektronen behandeln, verglichen.

Ein weiterer Fokus der Arbeit lag auf der Entwicklung eines Konstruktionsschemas

f¨

ur ab-initio-Parameter im Modell starker Bindung (Tight-Binding-Modell) [122]. Die Me-

thode basiert auf dem Konzept der Verallgemeinerten Wannier-Funktionen von Marza-

ri und Vanderbilt [116], und erlaubt es, die elektronische Struktur (Eigenenergien und

Eigenzust¨

ande) sehr großer Systeme mit mehreren Tausend Atomen in der Genauig-

keit atomistischer Berechnungen auszuwerten. Dies kann etwa zur Berechnung der opti-

schen Eigenschaften von Quantenpunkten eingesetzt werden, wobei dann auf DFT-EXX-

Berechnungen zur¨

uckgegriffen werden kann, um eine korrekte Beschreibung der Bandl¨

ucke

zu gew¨

ahrleisten. Im Rahmen dieser Arbeit wurden effektive ab-initio-Parameters¨

atze f¨

das GaN- und InN-Volumensystem entwickelt und hinsichtlich ihrer Eignung zur Beschrei-

bung der Bandstruktur sorgf¨

altig getestet.

Abstract

In the present thesis, the variational EXX method (varEXX) [78,79,80] has been imple-

mented into a pseudopotential plane-wave code (S/PHI/nX [81,82]). So far this method

has been applied only for localized systems. By integrating it into the plane-wave frame-

work it has been made applicable to periodic systems for the first time. The conventional

approach of EXX is computationally very demanding. Subsequently performed tests of

the new method indicate that varEXX allows a tremendous performance speed up while

only a fraction of the memory consumption is required compared to the conventional EXX

formulation.

The efficient formulation of varEXX allows for a wide range of new applications. As

an example it has been investigated whether exact exchange potentials can be considered

as approximate linear functionals of the electron density. This is of significant importance

concerning the practical use of EXX pseudopotentials. For the first time, DFT calculati-

ons using exact exchange pseudopotentials could be performed for GaN and InN with the

complete semi-core-shell of the cations (3rd shell for Ga, 4th shell for In) being treated ex-

plicitly in the valency. Thereafter the results have been compared with those of calculations

considering only the semi-core 3d- and 4d-electrons in the valency, respectively.

A second focus of the thesis is the development of a generation scheme for ab-initio

tight-binding parameters [122]. The method employs the formalism of Generalized Wannier-

Functions introduced by Marzari und Vanderbilt [116] and allows for a calculation of the

electronic structure (eigenenergies and eigenstates) of huge systems with several thousands

of atoms within the accuracy of the atomistic scale. This can be used for a computation

of the optical properties of quantum dots based on foregoing DFT-EXX calculations in

order to guarantee a correct description of the bandgap. Within the scope of this work

effective ab-initio parametrizations for the GaN and InN bulk system have been deve-

loped and carefully tested with regard to their ability to an accurate description of the

bandstructure.

VII

Inhaltsverzeichnis

Einleitung 1

I Exakter Austausch 7

1 Das Vielteilchenproblem 9

1.1 Born-Oppenheimer-N¨

aherung . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.2 Das Variationsprinzip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.3 Das Hartree-Fock-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.4 Dichtefunktional-Theorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.4.1 Die Hohenberg-Kohn-Theoreme . . . . . . . . . . . . . . . . . . . . 17

1.4.2 Die Kohn-Sham-Gleichungen . . . . . . . . . . . . . . . . . . . . . . 18

1.4.3 Levy’s Constraint-Search-Formulierung der DFT . . . . . . . . . . . 21

1.5 Das Austausch-Korrelations-Funktional . . . . . . . . . . . . . . . . . . . . 22

1.5.1 Definition von Austausch- und Korrelationsenergie in der DFT . . . 22

1.5.2 Lokale Dichten¨

aherung und verwandte Funktionale . . . . . . . . . 23

1.5.3 Selbstwechselwirkungskorrektur . . . . . . . . . . . . . . . . . . . . 24

1.5.4 Exakte Darstellung des Austausch-Korrelationsfunktionals als St¨

orrei-

he . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

1.6 Exakte Austauschpotentiale . . . . . . . . . . . . . . . . . . . . . . . . . . 28

1.6.1 Das Standard-EXX-Verfahren . . . . . . . . . . . . . . . . . . . . . 28

1.6.2 Das OEP-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

1.6.3 St¨

orungstheoretische Herleitung der OEP/EXX-Gleichung . . . . . 32

2 Das variationelle EXX-Verfahren 35

2.1 Idee und mathematische Formulierung . . . . . . . . . . . . . . . . . . . . . 36

2.2 ¨

Aquivalenz des variationellen Ansatzes zu OEP und Standard-EXX . . . . . 38

2.3 Variation an Stelle direkter Inversion . . . . . . . . . . . . . . . . . . . . . 39

2.4 Variationelles EXX und Hartree-Fock-Verfahren . . . . . . . . . . . . . . . 40

3 Methoden zur numerischen Beschreibung periodischer Systeme 43

3.1 Symmetrien und periodische Randbedingungen . . . . . . . . . . . . . . . . 44

3.2 Numerische Integration in der Brillouin-Zone . . . . . . . . . . . . . . . . . 45

3.3 Entwicklung nach ebenen Wellen . . . . . . . . . . . . . . . . . . . . . . . . 46

3.4 N¨

aherung der starren R¨

umpfe . . . . . . . . . . . . . . . . . . . . . . . . . 49

3.5 Pseudopotentiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

3.5.1 Konstruktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

3.5.2 Kleinman-Bylander-Darstellung . . . . . . . . . . . . . . . . . . . . . 53

X INHALTSVERZEICHNIS

3.5.3 Nicht-lineare Rumpfkorrektur . . . . . . . . . . . . . . . . . . . . . 53

4 Implementierung 55

4.1 Die Sternheimer-Gleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.1.1 Numerische L¨

osung der Sternheimer-Gleichung: Umformulierung in

ein Minimierungs-Problem . . . . . . . . . . . . . . . . . . . . . . . 56

4.1.2 Minimierungsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . 59

4.1.2.1 Methode des steilsten Abstiegs (Steepest Descent) ..... 60

4.1.2.2 Methode der konjugierten Gradienten (Conjugate Gradi-

ent) ............................... 63

4.1.2.3 Pr¨

akonditionierung . . . . . . . . . . . . . . . . . . . . . . 65

4.2 Induzierte Ladungsdichte . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

4.3 Minimierung der induzierten Ladungsdichte . . . . . . . . . . . . . . . . . . 69

4.3.1 Mixing, Selbstkonsistenz und Minimierung . . . . . . . . . . . . . . 72

4.3.2 Pulay-Mixing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

4.3.3 Pr¨

akonditionierung . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

4.4 Der nicht-lokale Austauschoperator in ebenen Wellen . . . . . . . . . . . . 78

4.4.1 Behandlung der Singularit¨

at . . . . . . . . . . . . . . . . . . . . . . 78

4.4.2 Symmetrisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

4.5 Variationelles EXX als selbstkonsistenter Zyklus . . . . . . . . . . . . . . . 81

4.5.1 Optimierung des Algorithmus . . . . . . . . . . . . . . . . . . . . . 82

4.5.2 Variationelles und Standard-EXX: Ein Vergleich des Iterationspro-

zesses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

4.6 Symmetriegen¨

aherte EXX-Methode . . . . . . . . . . . . . . . . . . . . . . 86

4.6.1 Exakte Symmetrisierung beim Standard-EXX-Verfahren . . . . . . 87

4.6.2 Symmetriegen¨

ahertes Standard-EXX-Verfahren . . . . . . . . . . . 88

4.6.3 ¨

Ubertragung auf das variationelle EXX-Verfahren . . . . . . . . . . 90

5 Variationelles und Standard-EXX: Ein Leistungsvergleich 93

6 Physikalische Bedeutung der induzierten Ladungsdichte 97

7 EXX-Pseudopotentiale: Linearisierung der Austauschwechselwirkung 101

II Wannier-Funktionen 109

8 Verallgemeinerte Wannier-Funktionen als lokalisierte ab-initio-Basis

im Modell starker Bindung 111

8.1 Verallgemeinerte Wannier-Funktionen . . . . . . . . . . . . . . . . . . . . . 112

8.1.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

8.1.2 Lokalisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

8.1.3 Maximale Lokalisierung . . . . . . . . . . . . . . . . . . . . . . . . . 115

8.1.4 Initialisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

8.2 Ab-initio-Parametrisierung im Modell starker Bindung . . . . . . . . . . . 118

8.3 Lokalisierung kein Maß f¨

ur die G¨

ute der Basis . . . . . . . . . . . . . . . . 119

8.4 Optimierte Wannier-Basen f¨

ur GaN und InN . . . . . . . . . . . . . . . . . 124

Zusammenfassung und Ausblick 129

INHALTSVERZEICHNIS XI

Anh¨

ange 133

A Fourier-Entwicklungen einiger wichtiger Gr¨

oßen 135

A.1 Das Coulomb-Potential . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

A.2 Der nicht-lokale Austauschoperator . . . . . . . . . . . . . . . . . . . . . . 135

A.3 Die lineare Antwort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138

B Die Greensche Funktion 140

C Die Sternheimer-Gleichung 143

C.1 Die Sternheimer-Gleichung aus dem Variationsprinzip von Ritz . . . . . . . 143

C.2 Entartung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145

C.3 Die Sternheimer-Gleichung mit nicht-hermiteschem H0...........146

D Tensordarstellung der EXX-Methode 149

E Verallgemeinerung des EXX-Formalismus auf N-darstellbare

Ladungsdichten 154

F Symmetriegen¨

ahertes EXX: Herleitung der variationellen

Formulierung 156

G Die OEP/EXX-Gleichung aus dem Vielteilchenansatz von G¨

orling

und Levy 158

H Verallgemeinerte Wannier-Funktionen 164

H.1 Translation um einen Gittervektor . . . . . . . . . . . . . . . . . . . . . . . 164

H.2 Aktualisierung der ¨

Uberlapp-Matrix . . . . . . . . . . . . . . . . . . . . . . 164

H.3 Der Hamilton-Operator in der Darstellung Verallgemeinerter Wannier-Funk-

tionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165

H.4 Berechnung der Ein-Teilchen-Energien aus der Wannier-Darstellung . . . . 166

Literaturverzeichnis 169

Danksagung 177

Einleitung

Warum ”exakte Austauschpotentiale”?

Der Kohn-Sham-Formalismus der Dichtefunktional-Theorie (DFT) [1,2] ist die zurzeit

wohl am weitesten verbreitete Methode f¨

ur ab-initio-Berechnungen1im Bereich der Fest-

k¨

orperphysik. Obwohl er eine prinzipiell exakte Methode darstellt, ist man in der Praxis

jedoch bislang2auf N¨

aherungen angewiesen, wie etwa der Lokalen Dichte-Approxima-

tion (LDA) oder den verschiedenen Varianten der Generalisierten Gradientenkorrekturen

(GGA). Zwar gestatten diese Ans¨

atze sehr effiziente Berechnungen der Gesamtenergie

eines Systems im Grundzustand und anderer damit zusammenh¨

angender Gr¨

oßen — dar-

auf begr¨

undet sich der große Erfolg der DFT —, allerdings besitzen sie auch eine Reihe

schwerwiegender Nachteile. Konzeptionell ist die DFT eine reine Grundzustandstheorie;

die mit ihr berechneten Ein-Teilchen-Energien lassen sich streng genommen nicht als rea-

le Gr¨

oßen interpretieren. So werden etwa in LDA die Bandl¨

ucken von Halbleitern und

Isolatoren um bis zu ¨

uber 100% untersch¨

atzt (vgl. Abb. 1und 2). Ein weiterer Punkt

ist die falsche Asymptotik des Kohn-Sham-Potentials endlicher Systeme, als Folge dar-

aus wiederum erscheinen z.B. eine Reihe experimentell stabiler, negativ geladener Ionen

(H−, O−, F−,...) in LDA als unstabil [3,4,5]. F¨

ur einige ¨

Ubergangsmetalle mit dn−2s2-

Konfiguration liefert ferner die Lokale Spin-Dichte-Approximation (LSD) f¨

alschlicherwei-

se die dn−1s1-Konfiguration [6]. Schließlich sei aufgef¨

uhrt, dass das exakte Kohn-Sham-

Potential (genauer: dessen Austauschanteil, siehe unten) in Abh¨

angigkeit von der Beset-

zungszahl eine so genannte ”Ganzzahl-Diskontinuit¨

at” aufweist, die in LDA/GGA nicht

beschrieben werden kann [7,8].

Mit Ausnahme des letzten Punktes ist die Ursache f¨

ur die erw¨

ahnten Schwierigkeiten

in der elektronischen Selbstwechselwirkung zu suchen [5]: Im Kohn-Sham-Formalismus

wird das reale System zun¨

achst auf ein fiktives System wechselwirkungsfreier Teilchen

abgebildet. Sie bewegen sich in einem effektiven, lokalen Potential (dem Kohn-Sham-

Potential), das alle elektronischen Wechselwirkungen des realen Systems in geeigneter

Weise ber¨

ucksichtigt. Eine korrekte Formulierung muss dabei beachten, dass ein einzel-

nes Elektron nur mit der Ladungsverteilung der anderen Elektronen, jedoch nicht mit

sich selbst wechselwirkt. So enth¨

alt das effektive Potential zus¨

atzlich zum Hartree-Term,

der die elektrostatische Energie der gesamten Ladungsdichte beschreibt, noch das so ge-

nannte Austausch-Korrelationspotential, dessen Austauschanteil bei exakter Beschreibung

die in der elektrostatischen Energie enthaltene elektronische Selbstwechselwirkung wieder

kompensiert. Diese Kompensation gelingt jedoch mit den in LDA und GGA gemachten

1Es werden nur die Naturkonstanten und die Geometrie des Systems zu Grunde gelegt, d.h., man

verwendet dabei keine empirischen oder angepassten Parameter.

2Tats¨

achlich besteht nur sehr wenig Aussicht darauf, bei praktischen Anwendungen der DFT jemals auf

N¨

aherungsans¨

atze verzichten zu k¨

onnen.

2 Einleitung

LDA

EXX

GaAs

AlAs

SiC

GaN

AlN

theoretische Bandlücke [eV]

experimentelle Bandlücke [eV]

Abbildung 1: Vergleich der LDA- und EXX-

Bandl¨

ucken verschiedener Halbleiter mit den ex-

perimentellen Werten. Nach St¨

adele et al. [52].

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0

-0.5

0.0

0.5

1.0

1.5

2.0

2.5

3.0

3.5

4.0

LDA

LDA+ G0W0

OEPx(cLDA)

OEPx(cLDA)+ G0W0

CdS

zb-GaN

ZnO

ZnS

CdSe

ZnSe

InN

wz-GaN

experimentelle Bandlücke [eV]

theoretische Bandlücke [eV]

Abbildung 2: Vergleich theoretischer und ex-

perimenteller Bandl¨

ucken. OEPx(cLDA) be-

zeichnet hier EXX-Berechnungen mit LDA-

Korrelation. Die LDA- und OEPx(cLDA)-Ergeb-

nisse dienen zudem als Startpunkt einer GW -

Rechnung (+GW ). Nach Rinke et al. [171,175].

N¨

aherungsannahmen nur unvollst¨

andig.

Aus diesem Grund wurden verschiedene, ¨

uber LDA/GGA hinausgehende Methoden

entwickelt. Bei Selbstwechselwirkungskorrektur-Methoden (SIC) [5] etwa wird versucht,

die unvollst¨

andige Kompensation der Selbstwechselwirkung durch zus¨

atzliche Terme wie-

der auszugleichen. Vor allem bei lokalisierten Systemen f¨

uhrt SIC h¨

aufig zu einer deut-

lich verbesserten Beschreibung, der Zugang ist jedoch nicht invariant gegen¨

uber unit¨

aren

Transformationen der Wellenfunktionen, d.h. die Systembeschreibung ist abh¨

angig von der

Wahl der Basisfunktionen.

Ein sehr erfolgreiches Instrument zur Berechnung von Bandstrukturen ist ferner die

Quasiteilchen-Theorie in Gestalt der GW -N¨

aherung von Hedin [150,151], die es erlaubt,

Ergebnisse einer DFT-N¨

aherungsrealisierung mit st¨

orungstheoretischen Methoden zu ver-

bessern. Die Methode ist rechentechnisch sehr aufwendig, liefert aber wesentlich genauere

Bandl¨

ucken als LDA/GGA. Da GW in der Regel nicht selbst-konsistent betrieben wird,

h¨

angt die Genauigkeit der Resultate von der G¨

ute der Eingangsdaten ab. Es ist daher sinn-

voll, elektronische Strukturen bereits innerhalb der DFT m¨

oglichst genau bestimmen zu

k¨

onnen. Eine geeignete M¨

oglichkeit dazu er¨

offnete sich mit der Entwicklung des Exakten-

Austausch-Verfahrens (EXX) [41,47,51,52], das auch den Schwerpunkt der vorliegenden

Arbeit bildet. Die Kombination von EXX und GW erweist sich als ¨

außerst pr¨

azise Strategie

zur Bestimmung von Bandstrukturen (vgl. Abb. 2) und ist seit j¨

ungster Zeit Gegenstand

intensiver Forschung [170,171,172,173,174,175].

Das EXX-Verfahren erm¨

oglicht die Konstruktion des exakten DFT-Austauschpoten-

tials. Dies hat gegen¨

uber der Verwendung von N¨

aherungspotentialen zwei entscheidende

Vorteile: (i) Innerhalb der Austausch-Korrelationswechselwirkung kommt dem Austausch-

anteil die dominierende Rolle zu: er ¨

ubertrifft die Korrelationsenergie um typischerweise

eine Gr¨

oßenordnung [44,45,46]. (ii) Die exakte Kenntnis des Austauschpotentials gen¨

ugt,

Einleitung 3

um die elektronische Selbstwechselwirkung vollst¨

andig zu eliminieren. Formal greift der

Formalismus dabei zur¨

uck auf das Austauschfunktional der Hartree-Fock-Theorie [12,13],

in der die Selbstwechselwirkung konzeptionell in v¨

ollig korrekter Weise gehandhabt wird.

W¨

ahrend jedoch das Hartree-Fock-Verfahren auf ein nicht-lokales, orbitalabh¨

angiges Aus-

tauschpotential f¨

uhrt, ist das EXX-Potential lokal, in ¨

Ubereinstimmung mit dem Ansatz

des Kohn-Sham-Formalismus. Anders als beim Hartree-Fock-Verfahren, das Bandl¨

ucken

typischerweise um einen Faktor 2 – 3 ¨

ubersch¨

atzt, findet man zudem eine sehr gute ¨

Uber-

einstimmung der in EXX berechneten Bandl¨

ucken mit den experimentellen Werten [52]

(vgl. Abb. 1). Als entscheidender Nachteil des EXX-Formalismus erweist sich allerdings

der enorme technische Aufwand, der zu seiner numerischen Realisierung erforderlich ist,

sowohl hinsichtlich der ben¨

otigten Speicherkapazit¨

at als auch in Bezug auf die Rechenzeit

(im Vergleich mit entsprechenden LDA/GGA-Rechnungen betr¨

agt der Mehraufwand 2 – 3

Gr¨

oßenordnungen). So ist u.a. die Greensche Funktion und der lineare Antwortoperator zu

berechnen, wozu neben den letzlich interessierenden besetzten Zust¨

anden auch unbesetze

Zust¨

ande ber¨

ucksichtigt werden m¨

ussen. Bei realistischen Berechnungen von Halbleiter-

kristallen, etwa GaAs oder Gruppe-III-Nitriden, findet man dabei typischerweise, dass auf

jeden besetzten Zustand ca. 100 unbesetzte Zust¨

ande kommen. Dies beschr¨

ankt die An-

wendungsm¨

oglichkeiten dieses Verfahrens auf einfachste Kristallstrukturen (mit weniger

als etwa 5 Atomen pro Einheitszelle).

Es wurde jedoch 2002 von Wahn und Neugebauer [78] sowie 2003 von K¨

ummel und

Perdew [79,80] eine alternative Formulierung des EXX-Formalismus vorgeschlagen, die

g¨

anzlich ohne unbesetzte Zust¨

ande auskommt. Das EXX-Potential wird dabei mit Hilfe

variationeller Algorithmen bestimmt, weshalb dieser Zugang im Folgenden als variatio-

nelles EXX-Verfahren (varEXX) bezeichnet werden soll. Im Vergleich zur urspr¨

unglichen

Fassung der EXX-Methode ist varEXX nicht nur vollkommen konsistent mit dem Konzept

der DFT als einer reinen Grundzustandstheorie, sondern erlaubt eine wesentliche Reduk-

tion des numerischen Aufwandes; die Konstruktion der Greenschen Funktion und des

linearen Antwortoperators entf¨

allt v¨

ollig. Dar¨

uber hinaus l¨

asst sich die Schl¨

usselgr¨

oße des

varEXX-Konzepts, die ”induzierte Ladungsdichte”, in einfacher und anschaulicher Weise

physikalisch interpretieren. Das neue Verfahren ist bisher erfolgreich im Falle von Ato-

men [78,79] und Clustern [80] getestet worden.

Ziele der Arbeit

Hauptanliegen der vorliegenden Arbeit war es nun, varEXX in den Pseudopotential-Ebe-

ne-Wellen-Code S/PHI/nX [81,82] zu implementieren, um die Methode so erstmalig auch

f¨

ur die Anwendung auf periodische Systeme verf¨

ugbar zu machen. Der Algorithmus wur-

de dann an einer Reihe von Halbleitermaterialien getestet und seine Effizienz (CPU-

Zeit, Speicheranforderungen) mit der der uspr¨

unglichen EXX-Formulierung verglichen.

Dabei konnte auf eine bereits in S/PHI/nX vorhande Implementierung des Standard-

EXX-Verfahrens3zur¨

uckgegriffen werden.

Durch den neuen Code er¨

offnet sich nun die M¨

oglichkeit, Fragestellungen anzugehen,

die ¨

uber das bisher mit dem Standard-EXX-Verfahren Machbare hinausausgehen. Als ein

Beispiel daf¨

ur wurde in dieser Arbeit untersucht, ob das exakte Austauschpotential ein

(zumindest ann¨

ahernd) lineares Funktional der Ladungsdichte ist. Dies ist von großer

Bedeutung insbesondere im Hinblick auf die Verwendung von EXX-Pseudopotentialen,

3Es handelt sich dabei allerdings um eine N¨

aherung des Standard-EXX-Verfahrens, die numerisch effi-

zienter als das exakte Verfahren realisiert werden kann.

4 Einleitung

bei denen ein Teil der so genannten semi-core-Elektronen als Valenzelektronen behandelt

wird, der andere Teil jedoch im Rumpf verbleibt.

Ein weiterer Fokus dieser Arbeit lag auf der Entwicklung einer Methode zur Kon-

struktion von ab-initio-Parametern im Tight-Binding-Modell. Der Zugang erlaubt es, die

Genauigkeit von Berechnungen auf atomistischer Skala (etwa Berechnungen in EXX oder

EXX+GW4) auf die Behandlung von Systemen mesoskopischer Gr¨

oßenordnung zu ¨

uber-

tragen. So lassen sich etwa die optischen Eigenschaften von Quantenpunkten untersuchen,

die wegen der großen Anzahl beteiligter Atome (typischerweise 103bis 105) einerseits

nicht mehr in einem vollst¨

andigen Basissatz (ebene Wellen, LAPW, ...) gehandhabt wer-

den k¨

onnen, f¨

ur die andererseits aber auch eine genaue Beschreibung der elektronischen

Struktur (d.h., der Eigenwerte und Eigenzust¨

ande) vonn¨

oten ist.

Aufbau der Arbeit

Der erste Teil der Arbeit ist der variationellen Formulierung des Exakten-Austausch-

Verfahrens (varEXX) sowie dessen Implementierung und Anwendung gewidmet.

In Kapitel 1wird zun¨

achst die Austauschenergie sowie die elektronische Selbstwechsel-

wirkung im Rahmen des Hartree-Fock-Formalismus definiert. Anschließend wird eine kurze

Einf¨

uhrung in die Dichtefunktional-Theorie gegeben. Es wird gezeigt, wie sich das quanten-

mechanische Vielteilchenproblem mit Hilfe der Hohenberg-Kohn-Theoreme in Form einer

effektiven Ein-Teilchen-Gleichung (der Kohn-Sham-Gleichung) schreiben l¨

asst, und es wer-

den die g¨

angigsten N¨

aherungsrealisierungen des Austausch-Korrelationsfunktionals (LDA

und GGA) vorgestellt. Einen mathematisch strengeren, dabei aber sogar anschauliche-

ren Zugang zur DFT bietet die Constraint-Search-Formulierung von Levy; sie erm¨

oglicht

dar¨

uber hinaus die Ableitung einer exakten Reihenentwicklung des Austausch-Korrela-

tionspotentials (G¨

orling-Levy-St¨

orungstheorie), die allerdings außerordentlich kompliziert

ist. Schließlich wird gezeigt, wie ein Abbruch dieser Reihe nach dem linearen Glied auf

den (Standard-)EXX-Formalismus f¨

uhrt.

In Kapitel 2wird das variationelle EXX-Verfahren eingef¨

uhrt. Es wird die zentrale

Gr¨

oße des Konzepts, die ”induzierte Ladungsdichte” definiert und ihr Zusammenhang zum

EXX-Potential ¨

uber ein Variationsprinzip formuliert. ¨

Uberdies wird erl¨

autert, wie es mit

vergleichsweise einfachen variationellen Methoden gelingen kann, den komplizierten Zu-

sammenhang zwischen Austauschpotential und Ladungsdichte zu erfassen, ohne dabei auf

unbesetzte Zust¨

ande und aufwendig zu berechnende Gr¨

oßen wie der Greenschen Funktion

oder der linearen Antwort (siehe oben) zur¨

uckgreifen zu m¨

ussen.

Kapitel 3stellt das notwendige R¨

ustzeug zur numerischen Beschreibung periodischer

Systeme zur Verf¨

ugung, insbesondere mit Hinblick auf die Verwendung einer Ebene-

Wellen-Basis. Dabei wird auch das Konzept der Pseudopotentiale kurz skizziert.

Kapitel 4beschreibt detailliert die Implementierung des variationellen EXX-Verfahrens

in das DFT-Programm-Paket S/PHI/nX. Zun¨

achst wird die Sternheimer-Gleichung, d.i.

die Grundgleichung der Rayleigh-Schr¨

odingerschen St¨

orungstheorie in 1. Ordnung, als Mi-

nimierungsaufgabe formuliert, und es werden geeignete numerische Minimierungsverfahren

sowie Pr¨

akonditionierungen diskutiert. Dies erm¨

oglicht die effiziente Berechnung der in-

duzierten Ladungsdichte. Als elegante M¨

oglichkeit, aus dieser Gr¨

oße das EXX-Potential

zu erhalten, werden ferner Mixing-Verfahren diskutiert. Schließlich wird die Optimierung

4Es ist dabei allerdings zu beachten, dass die GW -Methode nur Quasiteilchen-Energien, aber keine

Zust¨

ande liefert.

Einleitung 5

des Codes beschrieben und bereits auf M¨

oglichkeiten zur weiteren Steigerung der Effizienz

hingewiesen.

In Kapitel 5folgt ein tabellarischer Vergleich zwischen der Leistung (CPU-Zeit, Spei-

cherbedarf) des varEXX-Verfahrens und der des Standard-EXX-Verfahrens.

Eine anschauliche Interpretation der induzierten Ladungsdichte und ihr Bezug zur

elektronischen Selbstwechselwirkung wird in Kapitel 6anhand der Beispiele GaAs und Si

aufgezeigt.

Kapitel 7untersucht, ob das exakte Austauschpotential n¨

aherungsweise eine lineare

Abh¨

angigkeit von der Ladungsdichte aufweist (siehe oben). Die Resultate werden mit den

Ergebnissen von LDA+GW -Rechnungen nach Rohlfing et al. [152] verglichen und hin-

sichtlich ihrer Bedeutung f¨

ur die Verwendung von EXX-Pseudopotentialen in zuk¨

unftigen

Berechnungen diskutiert.

Der zweite Teil der Arbeit besch¨

aftigt sich mit der Konstruktion von ab-initio-Parame-

tern im Rahmen des Tight-Binding-Modells (siehe oben). Dazu wird zun¨

achst eine kurze

Einf¨

uhrung in die Theorie der Verallgemeinerten Wannier-Funktionen nach Marzari und

Vanderbilt [116] gegeben, um darauf aufbauend das Konstruktionsschema f¨

ur die ab-initio-

Parametrisierung gem¨

aß Wahn und Neugebauer [122] herzuleiten. Das Verfahren wird an

den Halbleitern GaAs, GaN und InN getestet, die Ergebnisse werden kritisch diskutiert.

Es schließen sich eine Zusammenfassung der Arbeit und ein Ausblick an.

Der Anhang enth¨

alt die schrittweise Herleitung einer Reihe von im Haupttext ver-

wendeter Formeln, um so ein wirkliches Nachvollziehen der Zusammenh¨

ange zu vereinfa-

chen. Dar¨

uber hinaus finden sich dort Erg¨

anzungen zu einigen Abschnitten, die f¨

ur deren

Verst¨

andnis zwar nicht unmittelbar ben¨

otigt werden, jedoch die Thematik abrunden (z.B.

der Zusammenhang zwischen EXX und Sham-Schl¨

uter-Gleichung). Es wird zudem eine

mathematisch etwas abstraktere Formulierung des EXX-Verfahrens gegeben (mit Hilfe

einer Verallgemeinerung des linearen Antwortoperators), die zwar nicht f¨

ur eine Imple-

mentierung geeignet ist, aber auf Grund ihrer K¨

urze ¨

außerst hilfreich etwa bei der Diskus-

sion des Potential-Ladungsdichte-Mixings ist sowie einige Sachverhalte, z.B. den linearen

Zusammenhang zwischen Austauschpotential und induzierter Ladungsdichte, unmittelbar

verdeutlicht.

In der gesamten Arbeit werden atomare Einheiten verwendet, d.h. also

~= 1 , me= 1 ,e2

4πε0

= 1 .

Energie und L¨

ange werden daher, wenn nicht anders vermerkt, in der Einheit Hartree bzw.

in Bohr angegeben. Um Verwirrungen zu vermeiden, wird ferner der Laplace-Operator

stets mit ∇2bezeichnet und das Symbol ∆ ausschließlich zur Kennzeichnung von Diffe-

renzen und der induzierten Ladungsdichte (∆ρ) verwendet.

Teil I

Exakter Austausch

Kapitel 1

Das Vielteilchenproblem

Um den Aufbau der Materie physikalisch-mathematisch beschreiben zu k¨

onnen, bedarf

es zun¨

achst eines geeigneten Modells. Das den folgenden Betrachtungen zu Grunde lie-

gende Modell beruht auf den in der Chemie ¨

ublichen Vorstellungen: Die Materie wird

als System von Elektronen und Kernen (oder Ionen) aufgefasst — der innere Aufbau der

Kerne aus Protonen und Neutronen sowie noch feinere Strukturen, etwa Quarks oder

Strings, werden jedoch gemeinhin nicht in die ¨

Uberlegungen mit einbezogen. Besteht das

betrachtete Modellsystem nun aus NElektronen und MKernen, und vernachl¨

assigt man

zudem relativistische Effekte, so wird es im Prinzip vollst¨

andig durch die Viel-Teilchen-

Schr¨

odinger-Gleichung

HΦ(r1,...,rN,R1,...,RM, t) = i ∂Φ(r1,...,rN,R1,...,RM, t)

∂t (1.1)

beschrieben, wobei nat¨

urlich noch geeignete Rand- oder Anfangsbedingungen beachtet

werden m¨

ussen. Die Wellenfunktion Φ des Gesamtsystems h¨

angt dabei von den Ortsko-

ordinaten der Elektronen ri, denen der Kerne Rjund der Zeit tab. Wirken ferner keine

außeren Kr¨

afte auf das System, setzt sich der Hamilton-Operator

H:= Te+Tn+Vee +Ven +Vnn (1.2)

zusammen aus den Operatoren der kinetischen Energie der Elektronen und Kerne, in

Ortsdarstellung gegeben durch

Te:=

i=1 −1

2∇2

ri, Tn:=

I=1 −1

2mI∇2

mit den Kernmassen mI, sowie den Coulomb-Wechselwirkungen der Teilchen

Vee := 1

i,j=1

i6=j

|ri−rj|, Ven :=

i=1

I=1

−ZI

|ri−RI|, Vnn := 1

I,J=1

I6=J

ZIZJ

|RI−RJ|

mit den Kernladungszahlen ZI. Da (1.2) nicht explizit von der Zeit abh¨

angt, lassen

sich die L¨

osungen Φ der Schr¨

odinger-Gleichung (1.1) als Linearkombinationen station¨

arer

Zust¨

ande der Form Ψα(r1,...,rN,R1,...,RM) exp(−iEαt) schreiben, die sich aus der

Eigenwertgleichung

HΨα=EαΨα,(1.3)

10 1 Das Vielteilchenproblem

der zeitunabh¨

angigen Schr¨

odinger-Gleichung, ergeben. Als Eigenwertgleichung wird (1.3)

im Allgemeinen durch verschiedene Paare von Eigenfunktionen Ψαund Eigenenergien Eα,

jeweils unterschieden durch den Index α, gel¨

ost. F¨

ur den Hamilton-Operator Hgibt es

eine kleinste Eigenenergie, die als Grundzustandsenergie bezeichnet wird. Die zugeh¨

orige

Eigenfunktion ist der Grundzustand (vgl. auch Abschnitt 1.2). Bei Eigenfunktionen zu

h¨

oheren Energien spricht man von angeregten Zust¨

anden.

Gleichung (1.3) kann jedoch nur f¨

ur einfachste Systeme wie dem freien Wasserstoff-

atom [9] analytisch gel¨

ost werden. F¨

ur sehr große Systeme, z.B. einen Festk¨

orper, f¨

den die Anzahl der zu betrachtenden Teilchen in der Gr¨

oßenordnung der Avogadro-

Konstante NA= 6.023 ·1023 liegt, l¨

asst sich (1.3) beim derzeitigen Stand der Compu-

tertechnik jedoch auch numerisch nicht mehr direkt l¨

osen. Es m¨

ussen daher (weitere)

vereinfachende N¨

aherungsannahmen gemacht werden. Solche N¨

aherungsans¨

atze k¨

onnen

ggf. auch mit einer (exakten) Transformation des Problems — etwa auf ein System wech-

selwirkungsfreier Teilchen, vgl. Abschnitt 1.4.2 — kombiniert werden. Eine wesentliche

Vereinfachung besteht in der Entkopplung von Elektronen- und Kernbewegung, die im

folgenden Abschnitt skizziert werden soll.

1.1 Born-Oppenheimer-N¨

aherung

Ausgangspunkt der Born-Oppenheimer-N¨

aherung oder adiabatischen N¨

aherung [10] ist

der große Unterschied zwischen der Elektronenmasse meund den Kernmassen MI: Das

Verh¨

altnis me/MIliegt typischerweise in der Gr¨

oßenordnung 10−4– 10−5. Klassisch be-

trachtet besitzen die Kerne damit eine wesentlich gr¨

oßere Tr¨

agheit als die Elektronen.

Daher k¨

onnen Letztere nahezu ”instantan” auf die Bewegung der Kerne reagieren, d.h.,

ihr Zustand wird der Kernbewegung ”adiabatisch” folgen. Der elektronische Zustand ist

folglich n¨

aherungsweise nur durch die momentane Konfiguration der Kerne bestimmt, die

zu dem betrachteten Zeitpunkt ein festes Potential darstellen. Unter diesen Annahmen

l¨

asst sich die Wellenfunktion Ψ des Gesamtsystems in einen elektronischen Anteil Ψeund

einen nuklearen Anteil Ψnseparieren,

Ψ(r,R) = Ψe(r,R)Ψn(R),(1.4)

wobei hier mit r:= (r1,...,rN) die Elektronenkoordinaten und mit R:= (R1,...,RM)

die Kernkoordinaten zusammengefasst sind. Der elektronische Anteil h¨

angt dabei nur pa-

rametrisch von Rab und ist L¨

osung des Eigenwertproblems

HeΨe(r,R) = EeΨe(r,R) (f¨

ur R∈IR3Mfest) .(1.5)

Der Hamilton-Operator ist hier durch

He(r,R) :=

i=1 −1

2∇2

ri+vext(ri,R)+1

1...N

i,j

i6=j

|ri−rj|(1.6)

gegeben, wobei der Einfluss der Kerne in dem Potential

vext(ri,R) :=

I=1

−ZI

|ri−RI|(1.7)

zusammengefasst ist. Die Bezeichnung vext wurde hier im Vorgriff auf die Abschnitte 1.3

und 1.4 gew¨

ahlt, in denen (1.7) das ”¨

außere” oder ”externe” Potential darstellt.

1.2 Das Variationsprinzip 11

Eine ¨

ahnliche Gleichung wie (1.5) l¨

asst sich nun auch f¨

ur die Bewegung der Ker-

ne aufstellen. Dazu beachte man, dass die Kerne auf Grund ihrer vergleichsweise hohen

Tr¨

agheit die Elektronenbewegung nur noch in gemittelter Form ”wahrnehmen” k¨

onnen:

Das von den Elektronen auf die Kerne wirkende Potential ergibt sich im Rahmen der Born-

Oppenheimer-N¨

aherung zu hHe(R)i, wobei die Mittelung ¨

uber die elektronische Wellen-

funktion Ψeerfolgt. Der Hamilton-Operator der Kernbewegung ist dann gegeben durch

Hn(R) :=

I=1 −1

2mI∇2

RI+1

I,J=1

I6=J

ZIZJ

|RI−RJ|+hHe(R)i.(1.8)

Die Born-Oppenheimer-N¨

aherung funktioniert dann, wenn die Elektron-Phonon-Kopp-

lung vernachl¨

assigt werden kann. F¨

ur die Fragestellungen dieser Arbeit, die sich auf die Be-

rechnung des elektronischen Grundzustandes von Halbleiter-Volumensystemen beziehen,

ist sie daher eine exzellente N¨

aherung. Beispiele f¨

ur Ph¨

anomene, bei denen die Elektron-

Phonon-Kopplung wesentlich ist, und f¨

ur die sich die Born-Oppenheimer-N¨

aherung folglich

nicht eignet, sind hochenergetische Streuprozesse von Atomen an Festk¨

orperoberfl¨

achen

oder die BCS-Theorie der Supraleitung [11].

1.2 Das Variationsprinzip

Ausgangspunkt f¨

ur viele Methoden zur n¨

aherungsweisen Beschreibung eines quantenme-

chanischen Viel-Teilchen-Systems ist oft nicht die Schr¨

odinger-Gleichung selbst in Gestalt

eines Eigenwertproblems (1.3) oder (1.5), sondern eine ¨

aquivalente Formulierung des Pro-

blems als ”Variationsaufgabe”. Pr¨

aziser ausgedr¨

uckt besteht die Aufgabe darin, diejenigen

Funktionen Ψα(oder allgemeiner Vektoren eines geeigneten Hilbertraums H) zu finden,

die das Funktional1

E[Ψ] := hΨ|H|Ψi

hΨ|Ψi(Ψ ∈ H\{0}) (1.9)

station¨

ar werden lassen, f¨

ur die es also ein Extremum oder einen Sattelpunkt besitzt:

δΨ∗E[Ψ]Ψ=Ψα

= 0 .(1.10)

Ausf¨

uhren der Variationsableitung2liefert unmittelbar die Eigenwertgleichung (1.3) mit

Eα=E[Ψα], vgl. z.B. Ref. 92. Wegen des Nenners in (1.9) braucht hier keine Normie-

rung der Ψ vorausgesetzt werden. Alternativ kann man auch einfacher E[Ψ] := hΨ|H|Ψi

definieren, muss dann aber explizit normierte Ψ fordern:

δΨ∗hΨ|H|Ψi−ε·(hΨ|Ψi−const.)!

= 0 .(1.11)

Auch hier f¨

uhrt Ableiten direkt auf (1.3), wobei die Gleichung aber nur dann erf¨

ullt werden

kann, wenn der Lagrange-Parameter εeinem Eigenwert Eαenspricht. Ist Hein nach unten

1In (1.9) wird keine Normierung der Vektoren vorausgesetzt. Um eine Division durch Null zu vermeiden,

muss daher der Nullvektor im Definitionsbereich ausgeschlossen werden.

2Zur Definition der Ableitung im Komplexen vgl. Ref. 126.

12 1 Das Vielteilchenproblem

beschr¨

ankter3Operator, besitzt (1.9) ein globales Minimum Ψ0. Im Falle des Hamilton-

Operators spricht man dann vom Grundzustand des Systems, der zugeh¨

orige Eigenwert

E0=E[Ψ0]≤min

ΨE[Ψ] (1.12)

ist die Grundzustandsenergie.

Eine einfache N¨

aherungsmethode besteht darin, nicht alle Ψ ∈ H \{0}zur Variation

zuzulassen, sondern nur in einem bestimmten Unterraum zu suchen. Es ist klar, dass man

dann im Allgemeinen die tats¨

achlichen station¨

aren Punkte ”verpassen” wird; im Falle des

Grundzustandes etwa wird man nur eine obere Schranke f¨

ur E0erhalten. Diese Methode

wird auch Ritzsches Variationsverfahren genannt. Je gr¨

oßer der betrachtete Unterraum,

desto besser wird die N¨

aherung. Im Grenzfall einer vollst¨

andigen Basis geht das Ritzsche

Verfahren in das exakte Variationsprinzip (1.10) oder (1.11)¨

uber.

Auf dem Ritzschen Ansatz basiert auch die im folgenden Abschnitt beschriebene

Hartree-Fock-Methode: hier wird der Hilbertraum aller antisymmetrischen N-Elektronen-

Funktionen eingeschr¨

ankt auf die Teilmenge der einfachen Slater-Determinanten. Die in

Abschnitt 1.4 eingef¨

uhrte Dichtefunktional-Theorie kann dagegen als spezielle Formu-

lierung des exakten Variationsprinzips aufgefasst werden (vgl. Abschnitt 1.4.3), die f¨

praktische Anwendungen notwendigen N¨

aherungen erfolgen dort an anderer Stelle (Ab-

schnitt 1.5.2). Schließlich l¨

asst sich auch die Umformulierung der im variationellen EXX-

Verfahren verwendeten Sternheimer-Gleichung in ein Minimierungsproblem (Abschnitt

4.1.1)¨

uber das Variationsprinzip verstehen (vgl. Anhang C.1).

1.3 Das Hartree-Fock-Verfahren

Eine der ersten Methoden zur n¨

aherungsweisen Beschreibung des quantenmechanischen

Vielteilchenproblems (1.5) wurde um 1930 von Hartree und Fock entwickelt [12,13]. Dem

Hartree-Fock-Verfahren kommt in dieser Arbeit eine besondere Bedeutung zu, da hier

bereits der Ausdruck f¨

ur die Austauschenergie abgeleitet (definiert) wird, der sp¨

ater bei

der Konstruktion exakter Austauschpotentiale im Rahmen der Dichtefunktional-Theorie

eine zentrale Rolle spielt. Es sei daher an dieser Stelle kurz umrissen, eine detailliertere

Darstellung findet sich z.B. in den Referenzen 21,92 und 127.

Eine Folge des Paulischen Prinzips der Ununterscheidbarkeit identischer Teilchen ist,

dass eine Wellenfunktion, die dem Zustand eines N-Fermionen-Systems entspricht, anti-

symmetrisch bzgl. der Vertauschung zweier Teilchenkoordinaten sein muss [92,127]. Ein

geeigneter Hilbertraum wird dann von den Slater-Determinanten aufgespannt. Ist mit

{φ1, φ2,...}eine vollst¨

andige Orthonormalbasis in einem Ein-Teilchen-Hilbertraum gege-

ben, l¨

asst sich aus jedem Satz {φki}i∈{1,...,N}von Npaarweise verschiedenen Basisfunk-

tionen eine Slater-Determinante konstruieren, die dann durch

ΨSD

k1...kN(x1,...,xN) := 1

√N!



φk1(x1)φk2(x1)··· φkN(x1)

φk1(x2)φk2(x2)··· φkN(x2)

.....

φk1(xN)φk2(xN)··· φkN(xN)



(1.13)

3Ein nach unten beschr¨

ankter linearer Operator besitzt einen kleinsten Eigenwert. Hamilton-Operatoren

— in der Mathematik auch h¨

aufig Schr¨

odinger-Operatoren genannt — zu physikalisch sinnvollen Systemen

sind gew¨

ohnlich nach unten beschr¨

ankt, weil ein physikalisches System im Allgemeinen einen Grundzustand

besitzt.

1.3 Das Hartree-Fock-Verfahren 13

gegeben ist. Dabei sollen die Ein-Teilchen-Zust¨

ande aus einem Orts- und einem Spinanteil

zusammengesetzt sein, also φk(xi) := ψk(ri)χσk(si) mit xi:= (ri, si) und der Spinquan-

tenzahl σkdes k-ten Zustandes. Der Faktor vor der Determinante sorgt f¨

ur die richtige

Normierung hΨSD|ΨSDi= 1. Die Slater-Determinanten bilden ein vollst¨

andiges Ortho-

normalsystem, die Eigenfunktionen des Hamilton-Operators (1.6) lassen sich daher nach

ihnen entwickeln. Die N¨

aherung des Hartree-Fock-Formalismus besteht nun darin, dass

man als Ansatz f¨

ur diese Eigenfunktionen nur eine Slater-Determinante verwendet. Dazu

setzt man (1.13) in das Energiefunktional (1.9) ein. Dann hat man

EHF[ΨSD] = ET[ΨSD] + Eext[ΨSD] + EH[ΨSD] + Ex[ΨSD] (1.14)

mit der kinetischen Energie

ET[ΨSD] = *ΨSD 

i=1 −1

2∇2

iΨSD+=

i=1 Zψ∗

ki(ri)−1

2∇2

iψki(ri) d3ri(1.15)

und der potentiellen Energie

Eext[ΨSD] =

i=1 Zψ∗

ki(ri)vext(ri)ψki(ri) d3ri.(1.16)

Die Energie der Elektron-Elektron-Wechselwirkung ergibt sich hingegen komplizierter als

Summe des Hartree-Funktionals

EH[ΨSD] = 1

1...N

i,j Zψ∗

ki(r)ψ∗

kj(r′)ψkj(r′)ψki(r)

|r−r′|d3rd3r′(1.17)

und des so genannten Austauschfunktionals

Ex[ΨSD] = −1

1...N

i,j

δσiσjZψ∗

ki(r)ψ∗

kj(r′)ψki(r′)ψkj(r)

|r−r′|d3rd3r′.(1.18)

Die nach dem Pauli-Prinzip notwendige Antisymmetrie der N-Elektronen-Wellenfunktio-

nen hat hier das Funktional Exins Spiel gebracht, das die so genannte Austauschwech-

selwirkung beschreibt, zu der kein klassisches Analogon existiert. Der Name r¨

uhrt daher,

dass die Koordinaten rund r′, von denen die Funktionen ψkibzw. ψkjabh¨

angen, in Ex

gegen¨

uber dem Hartree-Funktional EHgerade ”ausgetauscht” worden sind. Dieser ”Ko-

ordinatenaustausch” findet nat¨

urlich auch im Spinanteil der Wellenfunktionen statt und

f¨

uhrt dann zu dem in (1.18) zus¨

atzlich auftretenden Kronecker-Symbol δσiσj, womit Ex

nur bei parallelen Spins eine Rolle spielt.

Bei der anschließenden Minimierung gem¨

aß (1.10) ist zu beachten, dass die Orthonor-

malit¨

at der Ein-Teilchen-Funktionen erhalten bleibt. Dies kann mit Hilfe von Lagrange-

Multiplikatoren geschehen:

δψ∗

k(r)

EHF[ΨSD]−

1...N

i,j

λkikjZψ∗

ki(r)ψkj(r) d3r

!

= 0 .(1.19)

Hier sollen die ψkjeweils einen der besetzten Zust¨

ande ψk1, . . . , ψkNkennzeichnen. Die

Variationsableitungen der Energiefunktionale (1.15) und (1.16) lauten dann zusammenge-

fasst

δ(ET+Eext)

δψ∗

k(r)=−1

2∇2+vext(r)ψk(r).(1.20)

14 1 Das Vielteilchenproblem

Bei der Hartree-Energie EHergibt sich

δEH

δψ∗

k(r)=

i=1 Zψ∗

ki(r′)ψki(r′)

|r−r′|ψk(r) d3r′,(1.21)

und f¨

ur die Austauschenergie Exfindet man

δEx

δψ∗

k(r)=−

i=1

δσσiZψ∗

ki(r′)ψk(r′)ψki(r)

|r−r′|d3r′,(1.22)

wobei σdie Spinrichtung von ψkbezeichnen soll. Schließlich muss auch der Term f¨

ur die

Nebenbedingungen in (1.19) ber¨

ucksichtigt werden:

δψ∗

k(r)

1...N

i,j

λkikjZψ∗

ki(r)ψkj(r) d3r=

i=1

λkkiψki(r).(1.23)

Durch eine unit¨

are Transformation der Ein-Teilchen-Wellenfunktionen,4die so gew¨

ahlt

wird, dass die Matrix (λkki) diagonal wird, entf¨

allt die Summation ¨

uber die i’s in der letzten

Gleichung. Die Ausdr¨

ucke (1.20) – (1.23) liefern dann zusammengesetzt die Hartree-Fock-

Gleichungen in ihrer ”kanonischen Form”:

−1

2∇2+vext +vH[ρ] + VFock[{ψi}]ψk=εkψk(k∈ {1,...,N}).(1.24)

Hier wurde das Hartree-Potential oder elektrostatische Potential

vH[ρ](r) := Zρ(r′)

|r−r′|d3r′(1.25)

als von der Ladungsdichte

ρ(r) :=

i=1 |φki(r)|2(1.26)

abh¨

angiges Funktional und der nicht-lokale Austauschoperator VFock[{ψi}] mit

VFock[{ψi}]ψk(r) := −ZN

i=1

δσσi

ψki(r)ψ∗

ki(r′)

|r−r′|ψk(r′) d3r′(1.27)

eingef¨

uhrt, wobei σwieder die Spinrichtung des Zustandes ψkkennzeichnen soll. Um her-

vorzuheben, dass es sich bei VFock[{ψi}] um einen Integral-Operator handelt, wurde es

hier im Gegensatz zu den multiplikativ wirkenden Potentialen vext und vHmit einem

Großbuchstaben bezeichnet.

Gem¨

aß des Variationsprinzips (1.12) findet man mit dem Hartree-Fock-Verfahren ei-

ne obere Schranke f¨

ur die tats¨

achliche Grundzustandsenergie des Systems, die sich aus

(1.5) ergeben w¨

urde, wenn diese Gleichung l¨

osbar w¨

are. Die Abweichung der Hartree-

Fock-Energie zu der tats¨

achlichen Grundzustandsenergie wird als Korrelationsenergie be-

zeichnet. Weiterf¨

uhrende auf der Berechnung der Wellenfunktionen basierende Ans¨

atze,

die auch die Korrelation n¨

aherungsweise miteinbeziehen, sind etwa die Møller-Plesset-

St¨

orungstheorien 2. bis 4. Ordnung (MP2, MP4) [14] sowie Configuration-Interaction-

(CI) oder Coupled-Cluster-Methoden (CC) [15].

4Die Slater-Determinante (1.13)¨

andert sich bis auf einen Phasenfaktor nicht bei einer unit¨

aren Trans-

formation der Ein-Teilchen-Funktionen, und auch das nachfolgend definierte Hartree-Potential vHsowie

der nicht-lokale Austauschoperator VFock[{ψi}] sind invariant gegen¨

uber einer solchen Transformation [21].

1.3 Das Hartree-Fock-Verfahren 15

Der nicht-lokale Austauschoperator als Funktional der Dichtematrix

Im Vorgriff auf die im folgenden Abschnitt beschriebene Dichtefunktional-Theorie wur-

de der Z¨

ahler im Integranden von (1.25) hier bereits zur Ladungsdichte ρzusammenge-

fasst. Auch im Hinblick auf die Untersuchungen von Kapitel 7sei erw¨

ahnt, dass ¨

Ahnliches

f¨

ur den nicht-lokalen Austauschoperator ebenfalls gelingt, wenn man auf die urspr¨

ungli-

chen Wellenfunktionen φk(xi) := ψk(ri)χσk(si) zur¨

uckgreift. Die Dichtematrix5der Slater-

Determinante (1.13) ist dann gegeben durch

γ(x,x′) =

i=1

φki(x)φ∗

ki(x′).(1.28)

Der Kern des Austauschoperators kann damit aber geschrieben werden als

vFock[γ](x,x′) := −γ(x,x′)

|r−r′|.(1.29)

Anwendung von vFock[γ] auf φkliefert f¨

ur den Ortsanteil dann sofort (1.27) wenn man

beachtet, dass die Integration ¨

uber x′die Summation ¨

uber die Spinkomponenten mitein-

schließt.

Sehr ¨

ahnlich, wie im n¨

achsten Abschnitt die Kohn-Sham-Gleichungen aus einem Va-

riationsprinzip f¨

ur die Dichte abgeleitet werden (siehe Gleichungen (1.39) und (1.48)),

lassen sich interessanterweise die Hartree-Fock-Gleichungen (1.24) aus einer Variation f¨

die Dichtematrix herleiten. Wie man zeigt, l¨

asst sich nicht nur der Austauschoperator und

damit auch die Austauschenergie (1.18), sondern die gesamte Hartree-Fock-Energie EHF

von (1.14) als Funktional von γausdr¨

ucken [21]. Die Variationsableitung von EHF nach

γerfolgt dann unter der Nebenbedingung, dass γdie Dichtematrix einer einfachen N-

Teilchen-Determinante ist. Daraus ergibt sich das Variationsprinzip

EHF[γHF]≤EHF[γ],(1.30)

wobei γHF die Dichtematrix ist, die aus den L¨

osungen von (1.24) zusammengesetzt ist.

Nicht-lokaler Austauschoperator und elektronische Selbstwechselwirkung

Eine wesentliche Eigenschaft der Hartree-Fock-Methode ist die korrekte Handhabung der

elektronischen Selbstwechselwirkung. Dabei handelt es sich um eine unphysikalische Gr¨

oße,

die durch die Beitr¨

age der Summanden mit i=jzur Hartree-Energie (1.17) und zur

Austauschenergie (1.18) gegeben ist. Wegen des unterschiedlichen Vorzeichens in beiden

Ausdr¨

ucken k¨

urzt sich die Selbstwechselwirkung jedoch in Gleichung (1.24) exakt her-

aus und ist daher in diesem Formalismus unproblematisch. Betrachtet man aber etwa die

Austauschwechselwirkung allein, so zeigt sich, dass die Selbstwechselwirkung den domi-

nierenden Anteil im Energiefunktional (1.18) darstellt [5,16]. So ist beispielsweise beim

freien Wasserstoffatom die Austauschenergie (und — mit entgegengesetztem Vorzeichen —

ebenso die Hartree-Energie) zu 100% durch die Selbstwechselwirkung gegeben. Aus die-

sem Grund kann eine unvollst¨

andige Eliminierung der Selbstwechselwirkung infolge einer

nur n¨

aherungsweisen Berechnung des Austausch-Terms erhebliche Probleme verursachen.

Dies betrifft auch die nachfolgend vorgestellte Dichtefunktional-Theorie bei Verwendung

von LDA- oder GGA-Austausch-Korrelationsfunktionalen (vgl. Abschnitt 1.5.2); auf eine

Reihe damit verbundener Schwierigkeiten wurde bereits in der Einleitung verwiesen.

5genauer: die reduzierte Dichtematrix 1. Ordnung

16 1 Das Vielteilchenproblem

Im Gegensatz zu den in der Dichtefunktional-Theorie verwendeten lokalen Austausch-

potentialen (auch dem exakten ”EXX-Potential”, vgl. Abschnitt 1.6), die ein auf alle Elek-

tronen identisch wirkendes Kraftfeld repr¨

asentieren, stellt das nicht-lokale Austauschpo-

tential (1.27) der Hartree-Fock-Gleichungen eine auf jedes Elektron ”individuell” wirken-

de Kraft dar. Insbesondere werden im Hartree-Fock-Formalismus besetzte und unbesetzte

Zust¨

ande verschieden gehandhabt, und zwar so, dass formal auf unbesetzte Zust¨

ande ein

von NElektronen verursachtes elektrostatisches Potential wirkt, besetzte Zust¨

ande hinge-

gen ein nur von den N−1”anderen” Elektronen bewirktes Potential ”sehen”. Dies erkennt

man wie folgt: Multipliziert man die rechte Seite von (1.27) mit der ”geschickten Eins”

ψk(r)/ψk(r) = 1, l¨

asst sich der Austauschoperator mit

ρk(r,r′) :=

i=1

δσσi

ψ∗

ki(r′)ψk(r′)ψki(r)

ψk(r),(1.31)

zusammenfassen zu

VFock

k[{ψi}](r) = −Zρk(r,r′)

|r−r′|d3r′.(1.32)

Dies ist nun eine lokale Gr¨

oße, allerdings ist sie f¨

ur jeden Zustand kverschieden defi-

niert. Fasst man das Austauschpotential in dieser Form mit dem Hartree-Potential (1.25)

zusammen, ergibt sich ein formales elektrostatisches Potential

Zρ(r′)−ρk(r,r′)

|r−r′|d3r′,(1.33)

wobei streng genommen auch dieser Ausdruck nur sinnvoll ist, wenn er vor die Wellen-

funktion ψkgeschrieben wird. Mit

Zρk(r,r′) d3r′=1 mit ψkbesetzter Zustand

0 mit ψkunbesetzter Zustand (1.34)

l¨

asst sich (1.33) so deuten, dass durch das Austauschpotential die in vHber¨

ucksichtigte

Ladungsverteilung ”um ein Elektron” reduziert wird, falls ψkeinen besetzten Zustand be-

zeichnet. Wie man zeigt (vgl. etwa Ref. 89,92), findet diese Reduktion von Ladungsdichte

gerade in der Umgebung des k-ten Elektrons statt und betrifft nur Teilchen mit der selben

Spinrichtung σ. Man spricht von einem so genannten ”Austauschloch”. Die Verdr¨

angung

von Teilchen gleicher Spinrichtung vom Ort des k-ten Teilchens ist letztlich eine Folge des

Pauli-Prinzips. Ein nicht besetzter Zustand ψkhingegen ”sieht” das gesamte, von allen N

Valenzelektronen verursachte Potential; in diesem Falle beschreibt ρkzwar eventuell eine

Umverteilung der Ladung, die Gesamtladung jedoch wird davon nicht beeinflusst.

1.4 Dichtefunktional-Theorie

Die Grundidee der Dichtefunktional-Theorie (DFT) ist, das Variationsprinzip (1.12) so

umzuformulieren, dass nicht mehr der Vielteilchen-Wellenfunktion Ψ, sondern der viel

”handlicheren” Ladungsdichte ρdie Schl¨

usselrolle bei der Berechnung der elektronischen

Struktur zuf¨

allt. Statt der 3NKoordinaten, die f¨

ur ein N-Elektronengas bei Betrach-

tung der Wellenfunktionen zu ber¨

ucksichtigen w¨

aren, hat man mit der Ladungsdichte eine

Gr¨

oße, die sich unabh¨

angig von der Anzahl der betrachteten Teilchen durch 3 Koordi-

naten beschreiben l¨

asst. Insbesondere bei Verwendung von Minimierungstechniken (vgl.

Abschnitt 4.1.2) stellt dies numerisch eine enorme Vereinfachung des Problems dar.

1.4 Dichtefunktional-Theorie 17

Einen ersten Ansatz f¨

ur ein allein von der Ladungsdichte abh¨

angendes Energiefunktio-

nal bieten die Arbeiten von Thomas und Fermi aus dem Jahre 1927 [17,18,19,20]. Diese

von vorneherein als N¨

aherung konzipierte Methode liefert jedoch vielfach keine befriedi-

genden Ergebnisse6und ist heute eher von historischer Bedeutung. Eine Darstellung des

Thomas-Fermi-Modells findet sich z.B. in Ref. 21.

Die Grundlage f¨

ur eine — im Prinzip — exakte Theorie, die ein gegebenes elektroni-

sches System im Grundzustand mit Hilfe eines Funktionals der Ladungsdichte beschreibt,

wurde 1964 von Hohenberg und Kohn durch den Beweis zweier S¨

atze, den ber¨

uhmten

Hohenberg-Kohn-Theoremen [1], geschaffen. Sowohl die traditionelle Herleitung dieser

Dichtefunktional-Theorie als auch — im Hinblick auf Abschnitt 1.5.4 — ein mathematisch

etwas strengerer Zugang sollen nun kurz umrissen werden, wobei die folgende Darstellung

an der von Parr und Yang [21] orientiert ist.

1.4.1 Die Hohenberg-Kohn-Theoreme

Der Hamilton-Operator des elektronischen Systems (1.5) ist mit der Angabe der Elektro-

nenzahl Nund des ¨

außeren Potentials vext eindeutig definiert.7Unter der Annahme, dass

der Grundzustand des Systems nicht entartet ist, existiert daher zu jedem ¨

außeren Poten-

tial vext genau eine N-Teilchen-Wellenfunktion Ψ0, die diesen Grundzustand beschreibt.

Mit dem Operator der Teilchendichte ˆρl¨

asst sich Ψ0¨

uber die Beziehung

ρ0(r) = hΨ0|ˆρ(r)|Ψ0i=*Ψ0

i=1

δ(r−ri)Ψ0+(1.35)

wiederum eindeutig die Grundzustandsladungsdichte zuordnen. Insgesamt ergibt sich also

eine eindeutige Zuordnung vext 7→ ρ0. Der Wertebereich dieser Zuordnung ist die Menge

der v-darstellbaren Ladungsdichten, also solcher Dichten, die sich mit (1.35)¨

uberhaupt

einem Potential zuordnen lassen, vgl. Abschnitt 1.4.3. F¨

ur den weiteren Verlauf dieses

Abschnitts sei die v-Darstellbarkeit von ρ0stets vorausgesetzt. Der Beweis des Hohenberg-

Kohn-Theorems I [1] liefert nun die Eindeutigkeit der umgekehrten Zuordnung ρ07→ vext:

Das ¨

außere Potential vext ist (bis auf eine additive Konstante) ein Funktional der Grund-

zustandsladungsdichte. Da die Grundzustandsenergie E0¨

uber die Wellenfunktion Ψ0als

Funktional von vext aufgefasst werden kann, folgt die eigentliche Aussage des Theorems:

Die Grundzustandsenergie E0des N-Teilchen-Systems ist ein Funktional der Grundzu-

standsladungsdichte ρ0.

Es ergeben sich also sowohl vext als auch — durch Integration — die Teilchenzahl N

aus ρ0; daher bestimmt ρ0den gesamten Hamilton-Operator und alle Eigenschaften des

Systems, wie z.B. die kinetische oder die potentielle Energie. F¨

ur die Gesamtenergie des

Grundzustandes ergibt sich

E0[ρ0] = T[ρ0] + Eext[ρ0] + Eee[ρ0] (1.36)

=Zvext[ρ0](r)ρ0(r) d3r+F[ρ0],

wobei im zweiten Schritt das Funktional Fmit

F[ρ] := T[ρ] + Eee[ρ] (1.37)

6Das Thomas-Fermi-Modell erweist sich beispielsweise als ungeeignet f¨

ur die Vorhersage molekularer

Bindungen [22].

7Die Kernkoordinaten seien ab jetzt als fest betrachtet.

18 1 Das Vielteilchenproblem

benutzt wurde, das nicht explizit vom ¨

außeren Potential abh¨

angt und deshalb auch als

”universelles Potential” bezeichnet wird8.

Wie l¨

asst sich nun aber zu einem gegebenen ¨

außeren Potential vext die entsprechen-

de Grundzustandsladungsdichte bestimmen, ohne die N-Teilchen-Wellenfunktion Ψ0be-

stimmen zu m¨

ussen? Die Antwort hierauf gibt das Hohenberg-Kohn-Theorem II, das ein

Variationsprinzip f¨

ur die Elektronendichte konstituiert: Bei Variation von ρnimmt das

Energiefunktional

Evext [ρ] := Zvext(r)ρ(r) d3r+F[ρ] (1.38)

sein Minumum gerade f¨

ur die Grundzustandselektronendichte ρ0an; f¨

ur geeignete La-

dungsdichten ρgilt also

E0=Evext [ρ0]≤Evext [ρ].(1.39)

Dies ist das Analogon zum Variationsprinzip (1.12) f¨

ur die Vielteilchen-Wellenfunktion Ψ0.

Ber¨

ucksichtigt man die Erhaltung der Teilchenzahl N¨

uber einen Langrange-Parameter µ,

folgt die Bedingung

δρ Evext [ρ]−µ·Zρ(r) d3r−N !

= 0 (1.40)

und damit die Euler-Lagrange-Gleichung

µ=δEvext [ρ]

δρ(r)=vext(r) + δF [ρ]

δρ(r).(1.41)

Beide Theoreme geben allerdings keinen Hinweis auf eine explizite Gestalt des Funk-

tionals F. Daher ist die DFT bislang nur eine im Prinzip exakte Theorie, die in der Praxis

jedoch nicht ohne N¨

aherungen auskommt. Ihre Formulierung durch Kohn und Sham [2],

die Gegenstand des folgenden Abschnitts sein soll, gestattet allerdings eine Reihe von

N¨

aherungen, die f¨

ur viele Anwendungen hinreichende Genauigkeit aufweisen und letztlich

den großen Erfolg der DFT begr¨

unden.

1.4.2 Die Kohn-Sham-Gleichungen

In der Kohn-Sham-Formulierung der Dichtefunktional-Theorie [2] wird dem realen elektro-

nischen System ein System fiktiver ”Elektronen” gegen¨

ubergestellt, f¨

ur die die Coulomb-

Abstoßung ausgeschaltet ist, die aber die gleiche Ladungsdichte besitzen wie das reale

System. F¨

ur das ”universelle Funktional” Faus (1.37) lassen sich im Falle dieses nicht-

wechselwirkenden Referenzsystems jedoch viel bessere N¨

aherungen finden als beim tats¨

ach-

lichen System (vgl. dazu auch Kap. 1.5).

Das fiktive System kann durch durch folgende Eigenwertgleichung beschrieben werden:

Hsψi= [−1

2∇2+vs(r)]ψi=εiψi,(1.42)

also durch eine formale Einteilchen-Schr¨

odinger-Gleichung. Die Kohn-Sham-Teilchen ”se-

hen” sich zwar nicht durch die Coulomb-Wechselwirkung, dem Pauli-Prinzip m¨

ussen sie

aber gehorchen. T¨

aten sie es n¨

amlich nicht, w¨

urden ja alle in denselben Zustand, den

8Fist — formal gesehen — genauso auf das Wasserstoffatom wie auch auf ein kompliziertes Molek¨

oder einen Festk¨

orper anwendbar.

1.4 Dichtefunktional-Theorie 19

Grundzustand des Einteilchensystems, rutschen. Also k¨

onnen wir die Vielteilchen-Wellen-

funktion des Grundzustandes als Slater-Determinante ansetzen,

Ψs=1

√N!det[ψ1,...,ψN],(1.43)

wobei die Determinante aus den Nniedrigsten Einteilchenzust¨

anden gebildet werde. Im

Gegensatz zur kinetischen Energie Tdes tats¨

achlichen Systems ergibt sich die kinetische

Energie Tsdes Kohn-Sham-Systems damit einfach zu

Ts[ρ] =

i=1hψi|− 1

2∇2|ψii.(1.44)

Auch auf das Referenzsystem lassen sich die beiden Theoreme von Hohenberg und Kohn

[1] anwenden; deshalb wurde Tshier bereits gleich als Funktional von ρaufgefasst. Ent-

sprechend zu (1.41) lautet die Euler-Langrange-Gleichung des Kohn-Sham-Systems9

µ=vs(r) + δTs[ρ]

δρ(r).(1.45)

Auf eine formal identische Gleichung gelangt man jedoch auch f¨

ur das reale System, wenn

man f¨

ur Ffolgenden Ansatz macht:

F[ρ] = Ts[ρ] + EH[ρ] + Exc[ρ].(1.46)

Hier ist EHdie Hartree-Energie, die bereits in (1.17) als Funktional von ρdefiniert wurde,

und Exc bezeichnet die so genannte Austausch-Korrelationsenergie, definiert durch

Exc[ρ] := T[ρ]−Ts[ρ] + Eee[ρ]−EH[ρ].(1.47)

Die Austausch-Korrelationsenergie zerf¨

allt also in einen kinetischen Anteil T−Ts, der,

wie zumindest f¨

ur Atome gezeigt wurde [21,23], sehr klein ist, und den nicht-klassischen

Anteil der Elektron-Elektron-Wechselwirkung. Die Euler-Langrange-Gleichung (1.41) wird

damit im Falle des realen Systems zu

µ=vext(r) + δF[ρ]

δρ(r)

=vext(r) + δEH[ρ]

δρ(r)+δExc[ρ]

δρ(r)+δTs[ρ]

δρ(r)(1.48)

=veff[ρ](r) + δTs[ρ]

δρ(r),

wobei das effektive Potential durch

veff[ρ](r) := vext(r) + vH[ρ](r) + vxc[ρ](r) (1.49)

mit dem Hartree-Potential

vH[ρ](r) := δEH[ρ]

δρ(r)=Zρ(r′)

|r−r′|d3r′(1.50)

9Bereits hier sei darauf hingewiesen, dass das Funktional F— trotz der Bezeichnug ”universell” — f¨

das Kohn-Sham-System anders definiert ist, als f¨

ur das reale System! Da es im Kohn-Sham-System keine

Coulomb-Abstoßung gibt, gilt in (1.37) n¨

amlich Eee[ρ] = 0 und folglich F[ρ] = Ts[ρ].

20 1 Das Vielteilchenproblem

und dem (lokalen!) Austausch-Korrelations-Potential

vxc[ρ](r) := δExc[ρ]

δρ(r)(1.51)

gegeben ist. Der ”Trick” des Ansatzes von Kohn und Sham ist also, bis auf Tsalle Anteile

des Funktionals Fvon (1.46) in das effektive Potential veff[ρ]”her¨

uberzuschieben”. Da-

mit nehmen die Euler-Lagrange-Gleichungen des realen und des nicht-wechselwirkenden

Referenzsystens (1.48) genau die gleiche Gestalt an, wenn man vs=veff [ρ] setzt. Da

veff allerdings ein von der Dichte ρabh¨

angiges Funktional ist, muss die entsprechende

Eigenwert-Gleichung

−1

2∇2+vext(r) + vH[ρ](r) + vxc[ρ](r)ψi(r) = εiψi(r) (1.52)

selbstkonsistent zusammen mit der Gleichung f¨

ur die Ladungsdichte gel¨

ost werden, die f¨

eine einfache Slater-Determinante nach (1.35) durch

ρ(r) =

i=1 |ψi(r)|2(1.53)

gegeben ist. Die beiden vorangehenden Gleichungen (1.52) und (1.53) stellen zusammen die

Kohn-Sham-Gleichungen dar. Benutzt man (1.46) in (1.38), erh¨

alt man die Gesamtenergie

des realen Systems:

Ereal[ρ] = Zvext(r)ρ(r) d3r+Ts[ρ] + EH[ρ] + Exc[ρ].(1.54)

Eine alternative Form findet man, indem Ts[ρ] mit Hilfe von (1.52) durch die Summe der

Kohn-Sham-Eigenwerte εisubstituiert wird10:

Ereal[ρ] =

εi−EH[ρ] + Exc[ρ]−Zvxc[ρ](r)ρ(r) d3r . (1.55)

Die Gesamtenergie des Kohn-Sham-Systems unterscheidet sich von der des realen Systems,

was sp¨

ater in Abschnitt 1.5.4 benutzt wird. Da das Kohn-Sham-System wechselwirkungs-

frei ist, gilt F[ρ] = Ts[ρ] (vgl. Fußnote auf Seite 19), und das ¨

außere Potential ist durch

das effektive Potential von (1.49) gegeben. Aus (1.38) folgt damit

EKS[ρ] = Zveff[ρ](r)ρ(r) d3r+Ts[ρ] (1.56)

=Ereal[ρ] + EH[ρ]−Exc[ρ] + Zvxc[ρ](r)ρ(r) d3r .

Die Euler-Lagrange-Gleichungen (1.41) und (1.48) folgen direkt aus dem Variations-

prinzip f¨

ur die Ladungsdichte (1.38). Deshalb liefert die L¨

osung der Kohn-Sham-Gleichun-

gen zwar die korrekte Ladungsdichte des realen Systems — die Wellenfunktionen ψiund

die Energieniveaus εides Kohn-Sham-Systems erlauben jedoch nicht mehr ohne Weiteres

eine direkte physikalische Interpretation. F¨

ur finite Systeme und Oberfl¨

achen l¨

asst sich

10Die Substitution gelingt mit

εi=

hψi| − 1

2∇2+veff [ρ]|ψii=Ts[ρ] + Rveff [ρ](r)ρ(r) d3r. Dies ist

mit (1.56) auch gerade die Gesamtenergie des Kohn-Sham-Systems.

1.4 Dichtefunktional-Theorie 21

allerdings zeigen, dass der h¨

ochste besetzte Eigenwert εmax des Kohn-Sham-Systems ”ex-

akt” ist in dem Sinne, dass er der (negativen) Ionisierungsenergie Iund dem chemischen

Potential µentspricht [2,25], das als Lagrange-Parameter bereits in (1.41) aufgetaucht

ist:

εmax =−I=µ . (1.57)

L¨

asst man nicht-ganzzahlige Besetzungszahlen nider Kohn-Sham-Zust¨

ande zu, ergeben

sich die Einteilchen-Energien ferner auch ¨

uber das Janak-Theorem [26] aus der Gesamt-

energie durch Ableitung nach der Besetzungszahl:

∂E[ρ]

∂ni

=εi.(1.58)

1.4.3 Levy’s Constraint-Search-Formulierung der DFT

Zum besseren Verst¨

andnis der G¨

orling-Levy-St¨

orungstheorie [40,41], auf die in Abschnitt

1.5.4 eingegangen wird, soll an dieser Stelle kurz eine zu der Hohenberg-Kohn-Formulierung

[1] alternative Darstellung der Dichtefunktional-Theorie angesprochen werden, die als

Constraint-Search-Formulierung bezeichnet wird. Diese 1979 von Levy [27] vorgeschlagene

Herangehensweise hat zudem den Vorteil, dass die von Hohenberg und Kohn gemachten

Annahmen (Nicht-Entartung des Grundzustandes, v-Darstellbarkeit der Ladungsdichte,

vgl. Abschnitt 1.4.1) abgeschw¨

acht werden k¨

onnen. Sind die Annahmen jedoch erf¨

ullt,

stimmen beide Formulierungen ¨

uberein; es handelt sich also um eine echte Verallgemeine-

rung der urspr¨

unglichen Hohenberg-Kohn-Formulierung.

Bei der Constraint-Search-Formulierung startet man zun¨

achst mit dem ”normalen”

Variationsprinzip (1.12) f¨

ur die Vielteilchen-Wellenfunktion Ψ, f¨

uhrt dann aber die Mini-

mierung in zwei Stufen aus: Einmal wird ¨

uber alle (antisymmetrischen) Ψ minimiert, die

auf eine bestimmte Ladungsdichte ρf¨

uhren, das ist die Constraint Search. Da nach dem

Variationsprinzip die Suche aber ¨

uber alle (normierten) N-Teilchen-Zust¨

ande durchgef¨

uhrt

werden muss, wird in einem zweiten Variationsschritt ¨

uber alle geeigneten Ladungsdichten

minimiert:

E0= min

ΨhΨ|T+Vee +

vext(ri)|Ψi(1.59)

= min

ρ(min

Ψ→ρhΨ|T+Vee +

vext(ri)|Ψi)

= min

ρmin

Ψ→ρhΨ|T+Vee |Ψi+Zvext(r)ρ(r) d3r.

F¨

ur die Minimierung wird hier nicht vorausgesetzt, dass die Ladungsdichte v-darstellbar ist

(vgl. Abschnitt 1.4.1), allerdings muss sie ”N-darstellbar” sein. Alle physikalisch sinnvollen

Ladungsdichten sind N-darstellbar — die Bedingungen daf¨

ur lauten [28]

ρ(r)≥0,Zρ(r) d3r=N , Z|pρ(r)∇2pρ(r)|d3r < ∞.(1.60)

Durch die letzte Bedingung wird sichergestellt, dass die kinetische Energie endlich bleibt

(Abschnitt IV in Ref. 28). Vergleicht man die letzte Zeile von (1.59) mit dem aus den

Hohenberg-Kohn-Theoremen folgenden Variationsprinzip (1.39) f¨

ur die Ladungsdichte,

E0= min

ρF[ρ] + Zvext(r)ρ(r) d3r(mit ρ v-darstellbar),(1.61)

22 1 Das Vielteilchenproblem

so findet man f¨

ur das ”universelle Funktional” Feinen Ausdruck, der im Falle v-dar-

stellbarer Ladungsdichten genau dasselbe Ergebnis liefern muss wie Ausdruck (1.37) der

Hohenberg-Kohn-Theorie, aber allgemeiner f¨

ur N-darstellbare Ladungsdichten definiert

ist:

F[ρ] = min

Ψ→ρhΨ|T+Vee |Ψi(mit ρ N-darstellbar).(1.62)

Auch die Beschr¨

ankung auf nicht-entartete Grundzust¨

ande entf¨

allt hier; es wird dasjenige

Ψ gew¨

ahlt, das die Klammer minimiert. Diese Beziehung stellt also ”eine Art” funktio-

nalen Zusammenhang zwischen der Ladungsdichte und den Zust¨

anden dar, der aber —

anders als bei den Hohenberg-Kohn-Theoremen — wegen der m¨

oglichen Entartung nicht

mehr ein-eindeutig ist.

F¨

ur die Gesamtenergien (1.54) und (1.56) schreibt man daher in der Constraint-Search-

Formulierung auch

Enww[ρ] = Zveff [ρ](r)ρ(r) d3r+Fnww[ρ],(1.63)

Ereal[ρ] = Zvext(r)ρ(r) d3r+Freal[ρ] (1.64)

mit den universellen Potentialen

Fnww[ρ] := min

Ψ→ρhΨ|T|Ψi=Ts[ρ]!

=hΨ0|T|Ψ0i,(1.65)

Freal[ρ] := min

Ψ→ρhΨ|T+Vee |Ψi!

=hΨ1|T+Vee |Ψ1i.(1.66)

Die Abk¨

urzung ”nww” steht hier f¨

ur ”nicht-wechselwirkendes System”. Dessen Viel-Teil-

chen-Zust¨

ande Ψ0und die des realen Systems Ψ1ergeben sich f¨

ur eine gegebene Ladungs-

dichte ρdamit (formal) nur aus der Minimierung der spitzen Klammern — v¨

ollig un-

abh¨

angig vom ¨

außeren bzw. vom effektiven Potential. Es sei jedoch nochmals darauf hin-

gewiesen, dass Ψ0hier im Allgemeinen nicht mehr, wie noch im Kohn-Sham-Formalismus,

durch eine einfache Slater-Determinante gegeben ist.

1.5 Das Austausch-Korrelations-Funktional

1.5.1 Definition von Austausch- und Korrelationsenergie in der DFT

Ublicherweise wird die Austausch-Korrelationsenergie aus (1.47) in einen Austauschanteil

Exund einen Korrelationsanteil Ecuntergliedert:

Exc[ρ] = Ex[ρ] + Ec[ρ].(1.67)

Eine analoge Aufspaltung folgt dann auch f¨

ur das Austausch-Korrelationspotential:

vxc[ρ] = vx[ρ] + vc[ρ] mit vx[ρ] := δEx[ρ]

δρ , vc[ρ] := δEc[ρ]

δρ .(1.68)

Zur Definition der beiden Anteile sei wieder die Notation von Abschnitt 1.4.3 benutzt: F¨

eine Ladungsdichte ρbezeiche also Ψ0den N-Teilchen-Zustand des Kohn-Sham-Systems

und Ψ1den des realen Systems. Der Zusammenhang zwischen den Zust¨

anden und der

Dichte ist durch die Gleichungen (1.65) und (1.66) gegeben. Ist ρeine v-darstellbare Dichte,

1.5 Das Austausch-Korrelations-Funktional 23

ist der Kohn-Sham-Zustand nach Konstruktion des nicht-wechselwirkenden Systems durch

die Slater-Determinante Ψ0= det[ψ1,...,ψN]/√N! gegeben (vgl. Abschnitt 1.4.2), wobei

die Einteilchen-Zust¨

ande ψidie Nniedrigsten Eigenfunktionen in (1.52) sind. Damit l¨

asst

sich die Austauschenergie in der DFT analog zu der im Hartree-Fock-Formalismus (1.18)

definieren:11

Ex[ρ] := −1

1...N

i,j

δσiσjZψ∗

i(r)ψ∗

j(r′)ψi(r′)ψj(r)

|r−r′|d3rd3r′(1.69)

=hΨ0|Vee |Ψ0i−hΨ0|vH[ρ]|Ψ0i.(1.70)

In der Constraint-Search-Formulierung wird gleich die zweite Zeile als Definition verwendet

(vgl. z.B. [29,30,31,40]) mit dem Hartree-Potential vHvon (1.50); sie ist allgemeiner,

denn ihr Definitionsbereich l¨

asst sich auf alle antisymmetrischen Wellenfunktionen Ψ0

ausweiten, wie in den Variationsprinzipien (1.12) und (1.59) auch gefordert.

Die Korrelationsenergie ergibt sich einfach als ”Rest”, der ¨

ubrig bleibt, wenn man die

Definition von Exzusammen mit (1.67) und (1.65), (1.66) in Gleichung (1.56) benutzt:

Ec[ρ] = hΨ1|T+Vee |Ψ1i−hΨ0|T+Vee |Ψ0i.(1.71)

Geschlossene Ausdr¨

ucke f¨

ur Exc[ρ] und vxc[ρ] lassen sich, bis auf wenige Ausnahmen

wie dem dissoziierten H2-Molek¨

ul [32] oder He und He-artigen Ionen [44], bislang nicht

angeben, jedoch ist es formal m¨

oglich, sie mit Hilfe einer Reihenentwicklung darzustellen.

Dies soll im ¨

ubern¨

achsten Abschnitt 1.5.4 skizziert werden. Formalismen zur exakten Ab-

leitung des lokalen Austauschpotentials vx(bei Annahme der v-Darstellbarkeit der Dichte)

werden in Abschnitt 1.6 vorgestellt. Zuvor soll nun aber noch auf die g¨

angigsten N¨

aherun-

gen eingegangen werden.

1.5.2 Lokale Dichten¨

aherung und verwandte Funktionale

Als effizientes Verfahren zur Untersuchung praktischer Fragestellungen wurde die Dichte-

funktional-Theorie zun¨

achst in der Physik durch die Einf¨

uhrung der Lokalen Dichten¨

ahe-

rung (LDA) [2] und ihrer Erweiterung f¨

ur spin-polarisierte Systeme, der Lokalen Spin-

Dichte-N¨

aherung (LSD) [33], popul¨

ar. Ihre weite Verbreitung auch in der Quantenche-

mie erfolgte dann etwas sp¨

ater und geht mit der Entwicklung einer Reihe so genannter

Verallgemeinerter Gradientenn¨

aherungen (GGA) [35,36,37,38,39] einher, die sich als

Weiterentwicklungen der LDA auffassen lassen.

Ausgangspunkt der LDA ist das homogene Elektronen-Gas, also ein System von NElek-

tronen in einem konstanten ¨

außeren Potential. In diesem Fall lassen sich die Hartree-Fock-

Gleichungen exakt l¨

osen, vgl. z.B. Ref. 92, und man erh¨

alt den folgenden Zusammenhang

zwischen der Austauschenergie pro Elektron εhom

xund der konstanten Ladungsdichte ρhom:

εhom

x[ρhom] = −3

43

πρhom1

.(1.72)

Die exakte Gestalt des entsprechenden Korrelationsanteils εhom

cist dagegen unbekannt.

Deshalb wird hier in der Regel auf die Ergebnisse von Quanten-Monte-Carlo-Rechnungen

f¨

ur das homogene Elekronen-Gas nach Ceperley und Alder [34] zur¨

uckgegriffen. F¨

ur die in

11Der einzige Unterschied zwischen der Kohn-Sham- und der Hartree-Fock-Austauschenergie besteht

dann darin, dass im ersten Fall Kohn-Sham-, im zweiten aber Hartree-Fock-Orbitale verwendet werden.

24 1 Das Vielteilchenproblem

dieser Arbeit durchgef¨

uhrten Kohn-Sham-LDA-Rechnungen werden sie in der parametri-

sierten Form von Perdew und Zunger [5] benutzt. Ein n¨

aherungsweiser Ausdruck f¨

ur die

Austausch-Korrelationsenergie (1.67) ist dann durch

ELDA

xc [ρ] := Zεhom

xc [ρ(r)]ρ(r) d3r(1.73)

gegeben, wobei Austausch- und Korrelationsenergie pro Elektron in εhom

xc := εhom

x+εhom

zusammengefasst worden sind. Damit ergibt sich unmittelbar das Austausch-Korrelations-

potential in LDA:

vLDA

xc [ρ](r) := δELDA

xc [ρ]

δρ(r)=εhom

xc [ρ(r)] + δεhom

xc [ρ]

δρ(r)ρ(r).(1.74)

Trotz seiner Einfachheit liefert das LDA-Funktional f¨

ur eine Vielzahl realistischer Fra-

gestellungen quantitativ gute Resultate, vgl. z.B. Ref. 24. Per Konstruktion ist LDA exakt

f¨

ur den Grenzfall eines homogenen Elektronen-Gases. Folglich ist zu erwarten, dass sich die

N¨

aherung am besten f¨

ur Systeme mit nur leicht variierender Dichte eignet. Weist die Dich-

te dagegen starke Oszillationen auf, scheint die Verwendung des LDA-Funktionals nicht

mehr unmittelbar gerechtfertigt zu sein. Bei den Verallgemeinerten Gradientenn¨

aherungen

(GGA) wird daher die Dichte nicht mehr nur lokal wie in (1.73) ber¨

ucksichtigt, sondern

auch ihr Gradient miteinbezogen. GGA-Energiefunktionale sind also von der Form

EGGA

xc [ρ] := Zfxc[ρ(r),∇ρ(r)] d3r . (1.75)

Verschiedene Realisierungen des GGA-Funktionals sind das BP-Funktional von Becke [35]

(Austauschanteil) und Perdew [36] (Korrelationsanteil), das BLYP-Funktional von Be-

cke [35] (Austauschanteil), Lee, Yang und Parr [37] (Korrelationsanteil), sowie das PW91-

Funktional von Perdew und Wang [38] und das PBE-Funktional von Perdew, Burke und

Ernzerhof [39].

Interessanterweise f¨

uhrt die Verwendung von GGA-Funktionalen nicht unbedingt zu

exakteren Beschreibungen gegen¨

uber der LDA [24]; vielmehr muss h¨

aufig im Einzelfall

uberpr¨

uft werden, welches Funktional f¨

ur eine gegebene Fragestellung am geeignetsten

ist. Auf eine Reihe von Ph¨

anomenen, die weder durch LDA noch mit GGAs befriedi-

gend beschrieben werden k¨

onnen, wurde bereits in der Einleitung eingegangen. Hier seien

noch einmal das falsche asymptotische Abklingverhalten des Austauschpotentials endlicher

Systeme (exponentiell statt −1/r f¨

ur r→ ∞) und die Untersch¨

atzung der Bandl¨

ucke bei

Halbleitern um bis zu ¨

uber 100% erw¨

ahnt, beides Konsequenzen aus der nur n¨

aherungswei-

sen Handhabung der elektronischen Selbstwechselwirkung (vgl. auch Abschnitt 1.3), sowie

ferner das Versagen bei der Beschreibung der so genannten ”Ganzzahl-Diskontinuit¨

at”.

1.5.3 Selbstwechselwirkungskorrektur

Ein Ansatz, die Handhabung der elektronischen Selbstwechselwirkung bei Verwendung

gen¨

aherter Austausch-Korrelationspotentiale wie LDA oder GGA zu verbessern, ist die so

genannte Selbstwechselwirkungskorrektur (SIC, von engl.: self-interaction correction). Im

Schema von Perdew und Zunger [5] beispielsweise wird dabei ein gegebener N¨

aherungs-

ausdruck Eapprox

xc f¨

ur die Austausch-Korrelationsenergie (1.67) wie folgt modifiziert:

ESIC

xc [{ρk}] := Eapprox

xc [ρ]−

occ.

kEH[ρk] + Eapprox

xc [ρk],(1.76)

1.5 Das Austausch-Korrelations-Funktional 25

wobei ρk:= |ψk|2die Dichte des k-ten Orbitals bezeichnet und EHdas Hartree-Ener-

giefunktional (1.17) ist. F¨

ur die Kohn-Sham-Gleichung (1.52) erh¨

alt man damit ein orbi-

talabh¨

angiges effektives Potential der Form

eff[{ρi}] := vext +vH[ρ] + vapprox

xc [ρ]−(vH[ρk] + vapprox

xc [ρk]) .(1.77)

Bei lokalisierten Systemen f¨

uhrt SIC h¨

aufig zu einer deutlich verbesserten Beschreibung.

So lassen sich beispielsweise die Bindungsenergien negativ geladener Ionen sehr genau

bestimmen. Zudem erh¨

alt man im Gegensatz zu LDA/GGA das korrekte asymptotische

Abklingverhalten des effektiven Potentials und der Ladungsdichte.

SIC steht jedoch nicht im Einklang mit dem Kohn-Sham-Formalismus, denn auf Grund

der Orbitalabh¨

angigkeit des effektiven Potentials wird durch die Kohn-Sham-Gleichung

(1.52) kein wechselwirkungsfreies System mehr beschrieben. Auch sind die Wellenfunk-

tionen nicht mehr notwendigerweise orthogonal, wodurch die Teilchenzahlerhaltung ver-

letzt werden kann. Zudem ist der Kohn-Sham-Operator in SIC nicht invariant gegen-

uber unit¨

aren Transformationen der Wellenfunktionen,12 d.h., es ist im Allgemeinen

HSIC

KS [{ψi}]6=HSIC

KS [{Uψi}] mit einer unit¨

aren Transformation Uim Raum der besetzen

Zust¨

ande.

1.5.4 Exakte Darstellung des Austausch-Korrelationsfunktionals

als St¨

orreihe

Abschnitt 1.5.2 stellte einige Methoden zur n¨

aherungsweisen Berechnung des DFT-Au-

stausch-Korrelationspotentials (1.51) vor. Kennzeichnend f¨

ur die LDA- und GGA-Poten-

tiale ist dabei, dass sie keinen Ansatz zu einer systematischen Verbesserung des Austausch-

Korrelationspotentials aufzeigen. Tats¨

achlich existiert aber ein Schema, das — zumindest

im Prinzip — dessen beliebig genaue Beschreibung zuließe. Dieses 1993 von G¨

orling und

Levy vorgeschlage Verfahren [40,41,42], das nun, den genannten Referenzen folgend, skiz-

ziert werden soll, basiert auf einem st¨

orungstheoretischen Ansatz, und sei deshalb hier als

”G¨

orling-Levy-St¨

orungstheorie” bezeichnet. Mit ihr lassen sich Austausch-Korrelations-

energie Exc und Austausch-Korrelationspotential vxc ¨

uber eine Reihenentwicklung exakt

darstellen. Die Anforderungen an Rechnerkapazit¨

at und -leistung, um diese Reihe auszu-

konvergieren, ¨

ubersteigen das heute technisch M¨

ogliche allerdings bei weitem. M¨

oglich ist

jedoch ein Abbrechen der Entwicklung bereits nach dem ersten Glied; man erh¨

alt dann ge-

rade den Austauschteil des Austausch-Korrelationspotentials. In diesem Sinne kann man

die G¨

orling-Levy-St¨

orungstheorie als Verallgemeinerung oder Weiterf¨

uhrung des EXX-

Formalismus (vgl. Abschnitt 1.6 und Kapitel 2) bezeichnen.

F¨

ur das Folgende sei zun¨

achst die N-Darstellbarkeit der Ladungsdichte (1.60) vor-

ausgesetzt. Um nun eine Reihe f¨

ur die Austausch-Korrelationswechselwirkung abzuleiten,

wird der Ausdruck f¨

ur die Korrelationsenergie (1.71) zun¨

achst verallgemeinert:

Eα

c[ρ] := [hΨα|T|Ψαi−hΨ0|T|Ψ0i]

|{z }

=: Tα

c[ρ]

+α·[hΨα|Vee |Ψαi−hΨ0|Vee |Ψ0i]

|{z }

=: Vα

c[ρ]

(1.78)

12Der korrekte Kohn-Sham-Operator ist invariant gegen¨

uber unit¨

aren Transformationen der Wellen-

funktionen ψi, da er allein von der Ladungsdichte abh¨

angt, f¨

ur die bei Isolatoren und Halbleitern

ρ=Pocc

i|ψi|2=Pocc

i|Uψi|2mit einer beliebigen unit¨

aren Transformation Uim Raum der besetzen

Zust¨

ande gilt. Es sei im Hinblick auf die folgenden Abschnitte darauf hingewiesen, dass dann ¨

ahnlich auch

f¨

ur den nicht-lokalen Austauschoperator VFock[{ψi}] = VFock[{Uψi}] gilt.

26 1 Das Vielteilchenproblem

wobei Ψαwieder die gegebene Dichte ρliefere und ¨

uber das Minimum von hΨ|T+αVee |Ψi

definiert sei. Tα

cund αV α

cbezeichnen den kinetischen Anteil und den Anteil der Elekton-

Elektron-Abstoßung an der Korrelationsenergie Eα

Mit dieser Definition l¨

asst sich ein Hamilton-Operator konstruieren,

Hα[ρ] := T+αVee +

i=1 vext(ri) + (1 −α)vH[ρ](ri) (1.79)

+ (1 −α)vx[ρ](ri) + δE1

c[ρ]

δρ(ri)−δEα

c[ρ]

δρ(ri),

bei dem mit dem Parameter α∈[0,1] zwischen dem Hamilton-Operator des Kohn-Sham-

Systems (α= 0) und dem des realen Systems (α= 1) stetig hin- und hergeschaltet

werden kann. W¨

ahrend sich die Wellenfunktionen, die sich aus dem entsprechenden Ei-

genwertproblem ergeben, im Allgemeinen mit α¨

andern, bleibt die Ladungsdichte dabei

stets konstant. Aus diesem Grund wird (1.79) auch ”adiabatische Verbindung” zwischen

dem Kohn-Sham- und dem realen System genannt.

F¨

ur die Korrelation, ihren kinetischen Anteil und ihren Wechselwirkungsanteil wird

weiter angenommen, dass sie sich in Taylorreihen entwickeln lassen, deren Glieder noch

zu bestimmen sind, und schreibt

Eα

c[ρ] =

∞

j=1

ec,j[ρ]αj, Tα

c[ρ] =

∞

j=1

tc,j[ρ]αj, V α

c[ρ] =

∞

j=1

vc,j[ρ]αj.(1.80)

Unter Ausnutzung von ∂Tα

c[ρ]/∂α =−α·∂V α

c[ρ]/∂α (Gl. (35) in Ref. 40), erh¨

alt man

daraus

ec,j[ρ] = 0 f¨

ur j= 1

−1

j−1tc,j[ρ] = 1

jvc,j−1[ρ] f¨

ur j≥2,(1.81)

womit sich (1.79) auf folgende Gestalt bringen l¨

asst:

Hα[ρ] = H0[ρ]

|{z }

=: H0

+α·"Vee −

i=1 vH[ρ](ri) + vx[ρ](ri)#

|{z }

=: H1

∞

j=2

αj·"−

i=1

δec,j[ρ]

δρ(ri)#

|{z }

=: Hj

(1.82)

Hαkann also aufgefasst werden als Hamilton-Operator des Kohn-Sham-Systems, das sich

unter dem Einfluss der St¨

orungen αjHj(j≥1) befindet. Man beachte, dass die unteren

Indizes an den Operatoren sich hier auf die Ordnung der St¨

orung beziehen, im Gegensatz

zu dem oberen Parameter α, der die St¨

arke der St¨

orung beschreibt. Da die St¨

orung bereits

selbst eine Reihenentwicklung ist, wird das entsprechende Eigenwertproblem in einer etwas

modifizierten Version der St¨

orungstheorie von Rayleigh-Schr¨

odinger behandelt,

H0+αH1+α2H2+···Ψ0+αΨ1+α2Ψ2+···= (1.83)

=E0+αE1+α2E2+···Ψ0+αΨ1+α2Ψ2+···.

Die 0-te Ordnung beschreibt das Kohn-Sham-System selbst, es gilt also

E0=EKS[ρ] mit Ψ0= Ψ0.(1.84)

1.5 Das Austausch-Korrelations-Funktional 27

F¨

ur die h¨

oheren Ordnungen erh¨

alt man durch Sortieren nach den Potenzen von αdie

Energiekorrekturen

Ej=

p=1hΨ0|Hp|Ψj−pi(j∈IN) .(1.85)

Verwendet man weiter (1.82) in der Skalierungsbeziehung

Ec[ρλ] = 1

α2[hΨα|Hα|Ψαi−hΨ0|Hα|Ψ0i] (1.86)

mit λ=α−1und ρλ(x, y, z) := λ3ρ(λx, λy, λz) [40], findet man durch Koeffizientenver-

gleich mit (1.80) schließlich eine Rekursionsformel f¨

ur die Koeffizienten mit j≥2 der

Taylorentwicklung:

ec,j[ρ] = Ej−hΨ0|Hj|Ψ0i(1.87)

(1.85)

p=1hΨ0|Hp|Ψj−pi−hΨ0|Hj|Ψ0i

j−1

p=1hΨ0|Hp|Ψj−pi

(1.82)

=hΨ0|H1|Ψj−1i+

j−1

p=2 *Ψ0−

i=1

δec,p[ρ]

δρ(ri)Ψj−p+,

wobei im letzten Schritt die Definition der Hpaus (1.82) eingesetzt worden ist. Die

Auswertung der Taylorreihe f¨

ur die Austausch-Korrelationsenergie (1.80) bis zur Ord-

nung jverlangt somit nur die Kenntnis der Funktionalableitungen ihrer Koeffizienten

von kleinerer Ordnung als jund kann formal in beliebiger Genauigkeit erfolgen! Wie in

Ref. 41 gezeigt wird, sind die jeweils ben¨

otigten Funktionalableitungen auch tats¨

achlich

analytisch zug¨

anglich.13 Damit ergibt sich dann auch das (verallgemeinerte) Austausch-

Korrelationspotential

vα

xc[ρ] := δ

δρ(Ex[ρ] + Eα

c[ρ]) = vx[ρ] +

∞

j=1

αjvc,j[ρ] mit vc,j[ρ] := δec,j [ρ]

δρ ,(1.88)

das f¨

ur α= 1 dem exakten Austausch-Korrelationspotential entspricht. Wegen (1.81)

ergibt sich in erster Ordung das exakte Austauschpotential vx[ρ] von (1.68). Dessen Be-

rechnung — und im Prinzip ¨

uber die vc,j[ρ] auch die sukzessive Berechnung des exak-

ten Korrelationspotentials — gelingt unter bestimmten Voraussetzungen ¨

uber zwei Wege:

(i) direktes Ableiten der Austauschenergie Ex[ρ] bzw. der Energieterme ec,j[ρ] nach der La-

dungsdichte ρ, (ii) Auswerten des gest¨

orten Eigenwertproblems (1.82) f¨

ur die verschiedenen

Ordnungen von α. Dies soll im folgenden Abschnitt 1.6 beschrieben werden, allerdings nur

f¨

ur vx— eine weiterf¨

uhrende Auswertung der St¨

orreihe ist, wie eingangs bereits angedeu-

tet, numerisch noch nicht sinnvoll durchf¨

uhrbar und daher rein formaler Natur. Weg (ii)

f¨

uhrt dabei direkt auf eine implizite Gleichung f¨

ur vx, der so genannten OEP-Gleichung,

die den Ausgangspunkt f¨

ur die Entwicklung des in Kapitel 2beschriebenen variationellen

EXX-Verfahrens [78,79,80] darstellt.

13An dieser Stelle wird jedoch v-Darstellbarkeit vorausgesetzt, da eine ein-eindeutige Beziehung zwischen

effektiven Potential und Ladungsdichte (vgl. Hohenberg-Kohn-Theorem I [1]) benutzt wird. Formel (1.87)

ben¨

otigt hingegen nur die schw¨

achere Annahme der N-Darstellbarkeit.

28 1 Das Vielteilchenproblem

1.6 Exakte Austauschpotentiale

In voller Allgemeinheit w¨

are das exakte Austauschpotential als Funktionalableitung von

(1.70) gegeben,

vx[ρ] := δEx[ρ]

δρ =δ

δρhΨ0|(Vee −vH[ρ]) |Ψ0i,(1.89)

wobei alle N-darstellbaren Ladungsdichten zugelassen sind und die N-Teilchen-Wellen-

funktionen Ψ0die Beziehung (1.65) erf¨

ullen. In dieser Allgemeinheit l¨

asst sich die Funktio-

nalableitung allerdings (bislang) nicht auswerten. Dies gelingt jedoch, wenn man annimmt,

dass die Kohn-Sham-Zust¨

ande einfache Slater-Determinanten der besetzten Ein-Teilchen-

Zust¨

ande ψisind, und die Austauschenergie Ex[ρ] damit wie in (1.69) ausgedr¨

uckt werden

kann. Hinreichende Bedingung daf¨

ur ist die v-Darstellbarkeit der Ladungsdichten [21,43],

die daher im weiteren Verlauf dieser Arbeit stets, wenn nicht ausdr¨

ucklich anders gesagt,

vorausgesetzt wird. Eine formale Erweiterung des Konzepts auf N-darstellbare Dichten

konnte jedoch im Rahmen der Arbeit entwickelt werden und ist in Anhang Ebeschrieben.

Die zur Hartree-Fock-Theorie analoge Gestalt von Exhat nun den Vorteil, dass da-

mit auch in der DFT die exakte Behandlung des Austauschanteils bereits ausreicht, um

die unphysikalische elektronische Selbstwechselwirkung vollst¨

andig zu eliminieren, vgl. Ab-

schnitt 1.3. Es ist daher zu erwarten, dass Fehler, die auf deren unvollst¨

andige Eliminierung

auf Grund einer nur n¨

aherungsweisen Beschreibung des Austauschs zur¨

uckzuf¨

uhren sind

(vgl. Einleitung), bei Verwendung des exakten vx[ρ] korrigiert werden. Da der Austausch-

anteil zudem die dominierende Rolle bei der Austausch-Korrelationswechselwirkung spielt

— typischerweise ¨

ubertrifft er die Korrelation um eine Gr¨

oßenordung [44,45,46] —,

kommt seiner genauen Kenntnis besondere Relevanz zu.

1.6.1 Das Standard-EXX-Verfahren

Ausgehend von der der Definition der Austauschenergie (1.69) l¨

asst sich das Austausch-

potential durch zweimaliges Anwenden der Kettenregel f¨

ur Variationsableitungen finden,

wie zuerst G¨

orling und Levy zeigten [41], vgl. aber auch [47,48,52,53,54]:

vx[ρ](r) =

occ

iZd3r′Zd3r′′ δEx[{ψk}]

δψ∗

i(r′)

δψ∗

i(r′)

δveff (r′′)+ c.c.δveff(r′′)

δρ(r).(1.90)

Die Abk¨

urzung ”occ.” (occupied ) soll hier wie immer im Folgenden andeuten, dass nur

uber die besetzten Zust¨

ande zu summieren ist. Die Methode, das lokale Austauschpotential

vxdurch direktes Auswerten der rechten Seite dieser Gleichung zu bestimmen, wird als

Exact-Exchange-Verfahren (EXX) bezeichnet. Diese Terminologie geht auf Langreth und

Mehl [29], Kotani [57], sowie auf St¨

adele et al. [52] zur¨

uck. Zur Unterscheidung von der

in Kapitel 2vorgestellten variationellen Bestimmung von vxsei dieses Verfahren in der

vorliegenden Arbeit auch als ”Standard-EXX-Verfahren” (stEXX) bezeichnet. Alternativ

wird auch der Begriff Optimized-Effektive-Potential-Methode (zwei Abk¨

urzungen, OEP

und OPM, sind gebr¨

auchlich) verwendet, der aber urspr¨

unglich nicht aus der ”Tradi-

tion” der DFT herr¨

uhrt. Genau genommen versteht man unter OEP [63,65,66,67] auch

nicht das direkte Berechnen von vxgem¨

aß (1.90), sondern das L¨

osen einer ¨

aquivalenten

Integralgleichung, vgl. Abschnitt 1.6.2.

Um Gleichung (1.90) benutzen zu k¨

onnen, werden noch die drei Funktionalableitun-

gen der rechten Seite ben¨

otigt. Die erste berechnet sich analog zu Gleichung (1.22) aus

1.6 Exakte Austauschpotentiale 29

Abschnitt 1.3 und entspricht der Anwendung des Fock-Operators (1.27) auf die i-te Wel-

lenfunktion:

δEx[{ψk}]

δψ∗

i(r)=−

occ

δσiσjZψ∗

j(r′)ψi(r′)ψj(r)

|r−r′|d3r′=VFock[{ψj}]ψi(r).(1.91)

Die Variationsableitung der Zust¨

ande nach dem effektiven Potential findet man mit Hilfe

der St¨

orungstheorie in 1. Ordnung, vgl. Anhang B:

δψi(r′)

δveff (r)=X

εj6=εi

ψj(r′)ψ∗

j(r)ψi(r)

εi−εj

=Gi(r′,r)ψi(r).(1.92)

Die Summe geht hier ¨

uber alle Kohn-Sham-Orbitale mit Ausnahme jener mit εj=εi, d.h.,

auch die unbesetzten Zust¨

ande m¨

ussen ber¨

ucksichtigt werden. Ferner bezeichnet Gidie in

(B.11) definierte Greensche Funktion der Eigenwert-Gleichung (1.52) im zum Eigenraum

von εiorthogonalen Unter-Hilbertraum.

Die Handhabung des letzten Faktors in (1.90) ist etwas schwieriger. Er kann als Inverse

des linearen Antwortoperators χ0aufgefasst werden, der die Reaktion der Ladungsdichte

auf eine ”infinitesimal kleine” ¨

Anderung des effektiven Potentials beschreibt. Es ergibt

sich:

χ0(r,r′) := δρ(r)

δveff (r′)=

occ.

unocc.

ψ∗

i(r)ψj(r)ψ∗

j(r′)ψi(r′) + c.c.

εi−εj

.(1.93)

F¨

ur die in (1.90) ben¨

otigte Umkehrung χ−1

0=δveff /δρ existiert nun allerdings keine ana-

lytisch geschlossene Darstellung mehr. Streng genommen ist sie auch gar nicht definiert,

da das Potential veff nur bis auf eine Konstante bestimmt ist, und einer ¨

Anderung der

Dichte deshalb unendlich viele Potential¨

anderungen zugeordnet werden k¨

onnen. In ge-

eigneten Basissatzdarstellungen von χ−1

0, die z.B. in [41,52,55,56] diskutiert werden,

lassen sich konstante Verschiebungen jedoch explizit ausschließen. Wie G¨

orling und Levy

in Anhang B von Ref. 41 zeigen, korrespondiert dies im Definitionsbereich der Dichten

auch gerade mit der physikalisch sinnvollen Forderung Rδρ(r)d3r= 0, also der Erhaltung

der Ladung im System. Im Falle periodischer Systeme l¨

asst sich dies z.B. einfach durch

die Herausnahme der (G= 0)-Komponente im reziproken Raum erreichen [52]. Es sei an

dieser Stelle auch bemerkt, dass hier wiederum die v-Darstellbarkeit ben¨

otigt wird: f¨

ein nicht-v-darstellbares ρist veff [ρ] und damit auch veff[ρ]/δρ nicht mehr ohne Weiteres14

wohldefiniert, vgl. auch Ref. 47.

Durch Einsetzen der obigen Ausdr¨

ucke (1.91) und (1.92) in Gleichung (1.90) hat man

dann

vx[ρ](r) =Zd3r′χ−1

0(r,r′)

occ

iZd3r′′ψ∗

i(r′)G⊥

i(r′,r′′)VFock[{ψj}]ψi(r′′) + c.c.

| {z }

=: ∆ρFock

(1.94)

wobei die G⊥

idie auf den Raum der unbesetzten Zust¨

ande projizierten Greenschen Funk-

tionen (B.12) sind. Bereits mit Blick auf den weiteren Verlauf der Arbeit sei Folgen-

des angemerkt: Nach der Rayleigh-Schr¨

odingerschen St¨

orungstheorie kann der Ausdruck

14Eine Erweiterung der Definition ist jedoch formal m¨

oglich, vgl. Anhang E.

30 1 Das Vielteilchenproblem

GiVFock[{ψj}]ψials lineare Korrekturfunktion interpretiert werden, die sich bei St¨

orung

des Kohn-Sham-Systems durch VFock[{ψj}] ergibt. In (1.94) besitzt aber damit die Summe

uber idie Gestalt einer sp¨

ater in (2.4) definierten ”induzierten Ladungsdichte”. Im Unter-

schied zu dort wird sie hier allerdings durch den nicht-lokalen Austauschoperator erzeugt

und sei deshalb mit ∆ρFock bezeichnet.

Ahnlich wie das Funktional (1.44) der kinetischen Energie Tsist also auch vxnur

uber den ”Umweg” der Kohn-Sham-Orbitale ψizug¨

anglich, eine direkte parametrische

Abh¨

angigkeit von ρin geschlossener Form gibt der EXX-Formalismus nicht. Gleichung

(1.94) liefert dann das Austauschpotential der zu den ψigeh¨

orende Dichte, die jedoch

nicht notwendigerweise die Grundzustandsdichte ρ0ist. Um ρ0und das zugeh¨

orige vx[ρ0]

zu finden, muss (1.94) daher selbstkonsistent zusammen mit den Kohn-Sham-Gleichungen

(1.52) und (1.53) gel¨

ost werden.

Beim L¨

osen der Kohn-Sham-Gleichungen k¨

onnen dann Korrelationseffekte entweder

n¨

aherungsweise ber¨

ucksichtigt werden, beispielsweise durch den Korrelationsteil des LDA-

Potentials (1.74), oder v¨

ollig vernachl¨

assigt werden. Letzteres wird h¨

aufig, so auch in der

vorliegenden Arbeit, mit der Bezeichnug “exchange-only” gekennzeichnet.

W¨

ahrend die Methode — allerdings in einer modifizierten Form (OEP, vgl. den folgen-

den Abschnitt) — auf atomare Systeme bereits lange erfolgreich angewandt wird, st¨

oßt

man im Falle gr¨

oßerer Systeme, wie beispielsweise Festk¨

orpern, schnell an Grenzen. Die-

se resultieren daraus, dass (i) bei der Berechnung der letzten beiden Faktoren in (1.90)

unbesetzte Zust¨

ande ins Spiel kommen (Greensche Funktion), (ii) aus der Notwendigkeit,

den linearen Antwortoperator χ0zu invertieren und (iii) aus dem Aufwand bei der Be-

rechnung des nicht-lokalen Austauschoperators VFock (vgl. Abschnitt 4.4). Das Umgehen

von zumindest der ersten beiden der genannten Schwierigkeiten ist ein zentrales Anliegen

der vorliegenden Arbeit und wird in Kapitel 2ausf¨

uhrlich dargelegt.

Abschließend noch ein paar Bemerkungen zur Unterscheidung des DFT-EXX-Schemas

vom Hartree-Fock-Formalismus:

(i) Obwohl die Austauschenergien in beiden F¨

allen formal ¨

uber den selben Ausdruck

gegeben sind, vgl. (1.18) und (1.69), sind sie verschieden, da sich die Kohn-Sham-

Orbitale von den Hartree-Fock-Orbitalen (um mehr als eine unit¨

are Transformation)

unterscheiden, siehe auch Punkt (iv). Vergleichende Berechnungen, die bisher f¨

Atome und kleine Molek¨

ule durchgef¨

uhrt worden sind [49,58,59,60,61,68,78],

vgl. auch Ref. 62 mit Ref. 39, legen jedoch nahe, dass sowohl die Wellenfunktionen

als auch die Austauschenergien in beiden Formalismen nur sehr gering voneinander

abweichen. Dieser Punkt wird noch einmal in Abschnitt 2.4 aufgegriffen.

(ii) Im Hartree-Fock-Schema wird der Austausch ¨

uber ein nicht-lokales, d.h., auf jedes

Hartree-Fock-Orbital anders wirkendes Potential ber¨

ucksichtigt (vgl. Abschnitt 1.3).

Im Gegensatz dazu ist das Austauschpotential der Kohn-Sham-Gleichungen lokal

und beschreibt daher eine Kraft, die auf alle Kohn-Sham-Teilchen gleich wirkt (die-

se k¨

onnen sich gegenseitig nicht ”sehen”). Zusammen mit dem Hartree- und dem

Korrelationspotential beschreibt es die gesamte elektronische Wechselwirkung des

realen Systems gewissermaßen in einer gemittelten Form.

(iii) Diese Beschreibung kann im Kohn-Sham-Schema — zumindest im Prinzip — v¨

ollig

ohne N¨

aherung erfolgen, wenn das exakte Austausch-Korrelationspotential verwen-

det w¨

urde. Das lokale Austauschpotential l¨

asst sich dabei nach Gleichung (1.88) des

vorangehenden Abschnitts als erstes Glied einer entsprechenden Taylorentwicklung

1.6 Exakte Austauschpotentiale 31

auffassen. Im Gegensatz dazu ist Hartree-Fock jedoch bereits konzeptuell als N¨

ahe-

rung angelegt, wobei allerdings auch hier eine systematische Verbesserung in Form

der Configuration Interaction existiert.

(iv) Im Hartree-Fock-Formalismus ist der Grundzustand durch diejenige Slater-Determi-

nante definiert, die die Gesamtenergie des Systems hΨ|H|Ψiminimiert. F¨

ur die Mi-

nimierung werden dabei außer der Orthonormalit¨

at der Ein-Teilchen-Orbitale keine

Einschr¨

ankungen angenommen. Im “exchange-only” Kohn-Sham-Formalismus wird

ebenfalls die Gesamtenergie hΨ|H|Ψiminimiert, zur Minimierung werden jedoch

hier nur Slater-Determinanten aus normierten Ein-Teilchen-Zust¨

anden zugelassen,

die sich als Grundzustand eines nicht-wechselwirkenden Referenzsystems mit ir-

gendeinem lokalen Potential (dem effektiven “exchange-only” Kohn-Sham-Potential)

darstellen lassen. Ganz deutlich erkennt man dies anhand von Gleichung (1.99) im

nachfolgend besprochenen OEP-Formalismus. Die Orthogonalit¨

at der Orbitale folgt

ubrigens daraus, denn ein reelles lokales Potential liefert immer einen hermiteschen

Hamilton-Operator.

Daran lassen sich Schranken f¨

ur die Gesamtenergien EHF,EKS(EXX) und ˜

EKS(X)

des Systemgrundzustands im Hartree-Fock-, im “exchange-only” Kohn-Sham-EXX-

bzw. in einem gen¨

aherten “exchange-only” Kohn-Sham-Schema ablesen: Da die Mi-

nimierung im Hartree-Fock-Schema weniger Nebenbedingungen unterliegt als bei

Kohn-Sham, folgt, dass EKS(EXX) nicht kleiner als EHF sein kann. Jedes gen¨

aherte

effektive “exchange-only” Kohn-Sham-Potential kann wiederum nicht auf die nied-

rigste “exchange-only” Kohn-Sham-Gesamtenergie (also die Gesamtenergie in EXX)

f¨

uhren [87]. Allgemein gilt also

EHF ≤EKS(EXX) <˜

EKS(X) .

1.6.2 Das OEP-Verfahren

Bereits sehr fr¨

uh, und zun¨

achst sogar v¨

ollig unabsichtlich, fand man exakte, “exchange-

only” Kohn-Sham-Potentiale f¨

ur atomare, radialsymmetrische Probleme [65,66,67]. Dabei

wurde vxnicht direkt berechnet wie im vorangehenden Abschnitt, sondern durch L¨

osen

der mit

Zχ−1

0(r′,r)χ0(r,r′′) d3r=δ(r′−r′′) (1.95)

zu (1.90)¨

aquivalenten Integralgleichung

Zd3r′vx[ρ](r′)χ0(r′,r) =

occ

iZδEx[{ψi}]

δψ∗

i(r′)

δψ∗

i(r′)

δveff (r)+ c.c.d3r′.(1.96)

Einsetzen der Ausdr¨

ucke (1.91) – (1.93) f¨

ur die Funktionalableitungen liefert dann

occ

iZd3r′ψ∗

i(r)G⊥

i(r,r′)VFock[{ψj}]ψi(r′)−vx(r′)·ψi(r′)+ c.c.= 0 (1.97)

mit den auf die unbesetzten Zust¨

ande projizierten Greenschen Funktionen G⊥

ivon (B.12).

Dies ist die so genannte OEP-Gleichung. Interessanterweise wurde sie von Sharp und Hor-

ton bereits 1953 angegeben [63], d.h., vor Entwicklung der DFT! Die beiden Autoren folg-

ten dabei einer Idee Slaters [64], eine einfache N¨

aherung f¨

ur die Hartree-Fock-Methode zu

32 1 Das Vielteilchenproblem

finden, indem man dasjenige lokale Potential konstruiert, das das nicht-lokale Austausch-

potential (1.27) der Hartree-Fock-Gleichungen am besten ann¨

ahert. Die Bezeichnung OEP

(optimized effective potential ) wurde sp¨

ater von Talman, Shadwick, Aashamar und Luke

gepr¨

agt, die einen ¨

ahnlichen Ansatz verfolgten [65,66,67]. Hier wird versucht, ein lokales

Potential vOEP der formalen Schr¨

odinger-Gleichung

−1

2∇2+vOEP(r)ψi(r) = εiψi(r) (1.98)

zu finden, so dass die Slater-Determinante Ψ der besetzten Einteilchen-Wellenfunktionen ψi

das Energiefunktional hHi:= hΨ|H|Ψistation¨

ar werden l¨

asst:

δhHi

δvOEP(r)=

occ

iZδhHi

δψ∗

i(r′)

δψ∗

i(r′)

δvOEP(r)d3r′+ c.c.!

= 0 .(1.99)

Zun¨

achst ebenfalls als N¨

aherung f¨

ur Hartree-Fock gedacht, kann dieses Variationsprinzip

f¨

ur das lokale Potential einer effektiven Ein-Teilchen-Gleichung im Rahmen des Kohn-

Sham-Formalismus als Schema zur Konstruktion des exakten, “exchange-only” Kohn-

Sham-Potentials interpretiert werden. Darauf wurde zuerst von Perdew und Mitarbei-

tern hingewiesen [68,69]. Tats¨

achlich ist dieses Variationsprinzip ¨

aquivalent zu Gleichung

(1.97), wenn man beachtet, dass der erste Faktor der rechten Seite, δhHi/δψ∗

i, formal

gerade der linken Seite der Hartree-Fock-Gleichung (1.24) entspricht und der zweite Fak-

tor analog zu (1.92) gegeben ist. Einsetzen, Umformen und Vergleichen mit (1.97) f¨

uhrt

schließlich auf

vOEP(r) = vext(r) + vH(r) + vx(r).(1.100)

Dass OEP anfangs nur auf radialsymmetrische Systeme Anwendung fand [65,66,67], ist

wohl im Wesentlichen auf die damals zur Verf¨

ugung stehenden Rechnerkapazit¨

aten zur¨

uck-

zuf¨

uhren. Zum einen muss Gleichung (1.97) in diesem Fall nur in einer Dimension f¨

ur den

Radialteil gel¨

ost werden, zum anderen ist auch die Randbedingung limr→∞ vOEP(r) = 0

recht leicht zu handhaben. Letztlich ist aber das numerische L¨

osen der Integralgleichung

(1.96) mit Hilfe eines linearen Gleichungssystems ¨

aquivalent zur Inversion des linearen

Antwortoperators χ0von (1.93) und f¨

uhrt auf dieselben Probleme: auch die Integralglei-

chung bestimmt vxbzw. vOEP nur bis auf eine additive Konstante; das entsprechende

Gleichungssystem ist also unterbestimmt.

Eine sehr genaue und daher wichtige N¨

aherung f¨

ur OEP ist die von Krieger, Li und

Iafrate entwickelte und nach ihnen benannte KLI-Methode [70,71,72,73]. Sie beruht auf

einer ebenfalls bereits in der oben zitierten Ver¨

offentlichung von Sharp und Horton [63]

vorgeschlagenen Ersetzung der Eigenwertdifferenzen εj−εiim Nenner der Greenschen

Funktionen G⊥

idurch einen geeigneten konstanten Wert. Ausf¨

uhrliche Darstellungen der

Methode finden sich z.B. in den Referenzen 48,49,50. KLI l¨

asst sich vergleichsweise

einfach implementieren und auch auf Halbleiter und Isolatoren anwenden. Dies wurde

beispielsweise eingehend von Bylander und Kleinman untersucht [74,75,76,77].

1.6.3 St¨

orungstheoretische Herleitung der OEP/EXX-Gleichung

In Abschnitt 1.6.1 wurde in Gleichung (1.90) das exakte Austauschpotential vx[ρ] mit Hilfe

der Kettenregel direkt aus der Definition der Austauschenergie (1.69) abgeleitet. Alternativ

l¨

asst sich diese Gleichung — bzw. die zu ihr ¨

aquivalente OEP-Gleichung (1.97) — aber auch

elegant aus der in Abschnitt 1.5.4 vorgestellten st¨

orungstheoretischen Entwicklung des

1.6 Exakte Austauschpotentiale 33

Austausch-Korrelationsfunktionals erhalten, wie G¨

orling und Levy in Ref. 42 zeigen. Diese

Vorgehensweise ist hier insofern von Bedeutung, als sie auf der ”Ebene” der Viel-Teilchen-

Wellenfunktionen das genaue Analogon zu der in dieser Arbeit untersuchten variationellen

EXX-Methode [78,79,80] darstellt, die auf einer st¨

orungstheoretischen Behandlung der

Ein-Teilchen-Wellenfunktionen beruht.

Der in der G¨

orling-Levy-St¨

orungstheorie verwendete Ansatz (1.83) liefert in linearer

Ordnung f¨

ur Energie- und Zustandskorrektur noch Ausdr¨

ucke, die mit denen der Rayleigh-

Schr¨

odinger-St¨

orungstheorie identisch sind. Mit dem in (1.82) definierten St¨

oroperator H1

ergibt sich die lineare Zustandskorrektur

Ψ1=

∞

k=1

ΦkhΦk|Vee −vH[ρ]−vx[ρ]|Φ0i

E0−Ek

.(1.101)

Hier bezeichne Φ0:= Ψ0den Grundzustand des ungest¨

orten Kohn-Sham-Systems, und

die Φkmit k≥1 seien dessen virtuell15 angeregte Zust¨

ande. Alle Φk(k∈IN0) sind

dabei durch einfache Slater-Determinanten gegeben, die aus den Kohn-Sham-Orbitalen ψi

von Gleichung (1.52) aufgebaut sind. Ferner sollen die Ekdie zu den Determinanten Φk

geh¨

orenden Kohn-Sham-Energien bezeichnen.

Alle Zust¨

ande Ψα= Ψ0+αΨ1+···, die sich in (1.82) entlang der ”adiabatischen

Verbindung”, also f¨

ur alle α∈[0,1], ergeben, f¨

uhren auf die gleiche Ladungsdichte ρ.

Anders, und bereits im Hinblick auf Kapitel 2formuliert: das Aufschalten der St¨

orung

durch ”Hochdrehen” von αdarf keine ¨

Anderung der Ladungsdichte bewirken. Mit dem

Dichteoperator ˆρ(r) folgt also

hΨ0|ˆρ(r)|Ψ0i=hΨα|ˆρ(r)|Ψαi

=hΨ0|ˆρ(r)|Ψ0i+αhΨ0|ˆρ(r)|Ψ1i+αhΨ1|ˆρ(r)|Ψ0i+

+ Terme der Ordnung 2 oder h¨

oher in α .

Damit die Gleichheit f¨

ur jedes α∈[0,1] erf¨

ullt ist, m¨

ussen alle Entwicklungskoeffizienten

bis auf den der 0. Ordnung verschwinden. In linearer Ordnung ergibt sich damit

hΨ0|ˆρ(r)|Ψ1i+hΨ1|ˆρ(r)|Ψ0i= 0 .(1.102)

Setzt man hier den Ausdruck (1.101) f¨

ur die 1. Zustandskorrektur ein und nutzt aus, dass

nur einfach angeregte Slater-Determinanten Φkeinen Beitrag zur linken Seite von (1.102)

liefern, erh¨

alt man daraus eine Gleichung in den Ein-Teilchen-Wellenfunktionen ψides

Kohn-Sham-Systems (schrittweise in Anhang Gvorgef¨

uhrt):

occ.

unocc.

jψ∗

i(r)ψj(r)hψj|VFock[{ψk}]−vx[ρ]|ψii

εi−εj

+ c.c.= 0 ,(1.103)

wobei VFock[{ψk}] wieder von der Form des Fock-Operators (1.27) ist. Diese Gleichung ist,

wenn auch etwas anders aufgeschrieben, v¨

ollig identisch mit der OEP-Gleichung (1.97).

Damit ist sie auch ¨

aquivalent zur EXX-Gleichung (1.94), wenn man von den in den voran-

gehenden beiden Abschnitten beschriebenen Schwierigkeiten bei dieser Umformung einmal

absieht. Die linke Seite von (1.102) wird im variationellen EXX-Verfahren dann ¨

uber die

Ein-Teilchen-Zust¨

ande formuliert und stellt in diesem Konzept die zentrale Gr¨

oße der ”in-

duzierten Ladungsdichte” dar. Wegen der grundlegenden Bedeutung dieser Methode im

Rahmen der vorliegenden Arbeit sei ihr im Folgenden ein eigenes Kapitel gewidmet.

15Es sei unterschieden zwischen den virtuellen Anregungen, die sich aus den unbesetzten Zust¨

anden einer

Berechnung des N-Elektronen-Systems ergeben, und den Anregungen, die ¨

uber die Elektronenaffinit¨

at A

und die Ionisierungsenergie Idurch (I−A) definiert sind.

Kapitel 2

Das variationelle EXX-Verfahren

In der Einleitung wurde auf eine Reihe von Nachteilen verwiesen, die die Verwendung

gen¨

aherter Austausch-Korrelationsfunktionale wie beispielsweise LDA oder GGA mit sich

bringt und die auf eine unvollst¨

andige Eliminierung der elektronischen Selbstwechselwir-

kung zur¨

uckzuf¨

uhren sind. Diese Probleme lassen sich mit dem im Vorangehenden vorge-

stellten EXX/OEP-Formalismus ¨

uberwinden, da hier die Eliminierung ganz analog zum

Hartree-Fock-Schema vollst¨

andig gelingt. Der Preis, den man daf¨

ur zu zahlen hat, ist ein

immenser numerischer Aufwand. OEP hat deshalb fast nur bei radialsymmetrischen, effek-

tiv eindimensionalen Problemen Anwendung finden k¨

onnen, vgl. Abschnitt 1.6.2. Jedoch

auch in der breiter anwendbaren EXX-Formulierung (1.94) skaliert allein die Inversion

des linearen Antwortoperators χ0kubisch mit der Abschneideenergie Ecut (kritsch bzgl.

der CPU-Zeit), und die Anzahl der ben¨

otigten unbesetzten Zust¨

ande ist beispielsweise

bei Verwendung einer Ebene-Wellen-Basis (vgl. Abschnitt 3.3) typischerweise um zwei

Gr¨

oßenordnungen h¨

oher als die der besetzten (kritisch bzgl. des Speicherbedarfs). Eine

drastische Restriktion der Anwendungsm¨

oglichkeiten ist die Folge.

Mehr theoretischer Natur ist Frage, weshalb ¨

uberhaupt unbesetzte Orbitale ben¨

otigt

werden. In der st¨

orungstheoretischen Herleitung der OEP-Gleichung nach Abschnitt 1.6.3

kamen diese durch Slater-Determinanten ins Spiel, die (virtuelle1) einfach angeregte Zu-

st¨

ande des Kohn-Sham-Systems repr¨

asentieren. Steht dies nicht aber im Widerspruch zum

Charakter der Kohn-Sham-DFT als einer reinen Grundzustandstheorie?

Um die Antwort gleich vorweg zu nehmen: Nein, denn es zeigt sich, dass die unbesetz-

ten Zust¨

ande zur Berechnung des exakten Austauschpotentials nur als Hilfsgr¨

oßen benutzt

werden und auch v¨

ollig umgangen werden k¨

onnen. Dies wurde unabh¨

angig voneinander

zun¨

achst von Wahn und Neugebauer [78] und wenige Zeit sp¨

ater von K¨

ummel und Per-

dew [79,80] nachgewiesen. Bei geschickter Formulierung des Problems wird ferner auch die

explizite Berechnung von χ0und seiner Inversen vermieden, so dass sowohl die speicher-

als auch die zeitkritischen Aspekte des EXX-Formalismus v¨

ollig eliminiert werden k¨

onnen.

Die genannten Autoren entwickelten daraus eine Methode, die ausschließlich auf Grundzu-

standsgr¨

oßen basiert und in der das exakte Austauschpotential durch Minimierung eines

vx-abh¨

angigen Funktionals, der (Norm der) ”induzierten Ladungsdichte” berechnet wird.

Daher wird dieses Verfahren im Folgenden als variationelles EXX-Verfahren (varEXX)

bezeichnet. Es wurde bisher erfolgreich im Falle von Atomen [78,79] und Clustern [80]

getestet. In der vorliegenden Arbeit wurde es erstmalig in einen Pseudopotential-Ebene-

Wellen-Code [81,82] implementiert (vgl. Kapitel 4), womit eine Erweiterung seines An-

wendungsbereichs auch auf den Fall periodischer Systeme erm¨

oglicht wurde (vgl. Kapitel 5

1Vgl. Fußnote auf Seite 33.

36 2 Das variationelle EXX-Verfahren

und 7). Das Verfahren sei im Folgenden vorgestellt.

2.1 Idee und mathematische Formulierung

Die von Wahn und Neugebauer gegebene Herleitung des variationellen EXX-Verfahrens

(vgl. Kapitel 2 in Ref. 78)¨

ahnelt der Vorgehensweise, die OEP-Gleichung aus der G¨

orling-

Levy-St¨

orungstheorie [40,41,42] zu entwickeln (vgl. Abschnitt 1.6.3). Ferner werden derar-

tige Ans¨

atze auch schon seit l¨

angerer Zeit in der Dichtefunktional-St¨

orungstheorie [83,84]

verwendet, etwa zur Berechnung von Phononenspektren, wie z.B. in dem ¨

Ubersichtsartikel

von Baroni et al. [85] beschrieben.

Ausgangspunkt des variationellen EXX ist die formal gleiche Gestalt der Austausch-

energien sowohl im Hartree-Fock- als auch im Kohn-Sham-Schema. Der Grundgedanke

besteht darin, die Eigenschaften des Fock-Operators als exaktes, aber nicht-lokales Aus-

tauschpotential der Hartree-Fock-Gleichung (1.24) mittels einer St¨

orung auf das lokale

Austauschpotential der Kohn-Sham-Gleichung (1.52)”her¨

uberzuschieben”. Mit dem An-

satz

Hα:= −1

2∇2+vext +vH[ρ] + vx[ρ] + vc[ρ]

|{z }

=: H0

+α·VFock[{ψi}]−vx[ρ]

|{z }

=: H1

(2.1)

l¨

asst sich der Operator H0des Kohn-Sham-Systems durch ”Hochdrehen” von α∈[0,1] ste-

tig in den Operator H1=Hα|α=1 des Hartree-Fock-Systems2¨

uberf¨

uhren, wobei Letzterer

hier allerdings noch um den Korrelationsanteil der Kohn-Sham-Gleichung erg¨

anzt ist. Man

beachte, dass der obere, stetige Index αsich hier auf die St¨

arke der St¨

orung bezieht und

der untere Index f¨

ur den Kohn-Sham-Operator bzw. die St¨

orung steht. Weiter wird nun

gefordert, dass die Ladungsdichte f¨

ur alle α∈[0,1] in 1. N¨

aherung konstant bleibt. (Was

genau hier mit ”1. N¨

aherung” gemeint ist, wird unten mit Gleichung (2.4) klar.) Damit

etabliert (2.1) eine ”adiabatische Verbindung” ¨

ahnlich zu der im St¨

orungsansatz (1.79)

von G¨

orling und Levy. Dort allerdings war Hαim N-Teilchen-Hilbertraum definiert, wo-

hingegen die Operatoren in (2.1) auf die Ein-Teilchen-Wellenfunktionen ψiwirken. Der

Ansatz (2.1) ist daher bereits konzeptuell viel n¨

aher an der numerischen Praxis.

Um die Forderung nach konstanter Dichte formulieren zu k¨

onnen, werden zun¨

achst die

Orbitale des durch αH1gest¨

orten Systems ben¨

otigt. Sie sind nach der Rayleigh-Schr¨

odin-

gerschen St¨

orungstheorie in 1. Ordnung durch ψ0

i+αψ1

igegeben, wobei die ψ0

idie Ei-

genfunktionen des ungest¨

orten Problems (1.52) sind, und sich die Korrekturfunktionen ψ1

aus der so genannten Sternheimer-Gleichung

(H0−ε0

i)ψ1

i+ (H1−ε1

i)ψ0

i= 0 (2.2)

ergeben [86]. Die Energiekorrekturen sind dabei durch ε1

i=hψ0

i|H1|ψ0

iigegeben. Wie in

Kapitel 4noch n¨

aher erl¨

autert, beruhen die Vorteile des variationellen EXX-Verfahrens

gegen¨

uber dem Standard-EXX-Verfahren entscheidend auf den effizienten L¨

osungsm¨

oglich-

keiten f¨

ur diese Gleichung.

2Genau genommen handelt es sich bei H1nur formal um den Operator des Hartree-Fock-Systems, da

VFock[{ψi}] aus den Kohn-Sham-Orbitalen aufgebaut ist. Dies geschieht in v¨

olliger Analogie zur Definition

der Kohn-Sham-Austauschenergie (1.69) mit Hilfe des Ausdrucks der Hartree-Fock-Austauschenergie.

2.1 Idee und mathematische Formulierung 37

Mit den Korrekturen ψ1

ifindet man nun die zu Hαgeh¨

orende Dichte

ρα=

occ

i|ψ0

i+αψ1

i|2

occ

i|ψ0

i|2

|{z }

=ρ0

+α·

occ

i(ψ0

i)∗ψ1

i+ (ψ1

i)∗ψ0

i

|{z }

=: ∆ρ

+ Ausdruck der Ordnung 2 in α.

(2.3)

In linearer Ordnung, d.h., f¨

ur α→0, ist die Dichte¨

anderung also durch α∆ρgegeben. Da

α∆ρdie (lineare) Ladungsverschiebung beschreibt, die durch den Einfluss der St¨

orung αH1

hervorgerufen wird, sei diese Gr¨

oße hier, Ref. 78 folgend, als induzierte Ladungsdichte

bezeichnet. Ist die Dichte konstant, folgt f¨

ur die 1. Ordnung

∆ρ:=

occ

i(ψ0

i)∗ψ1

i+ (ψ1

i)∗ψ0

i= 0 (2.4)

oder, ¨

aquivalent dazu,

∆ρ[vx]= 0 .(2.5)

In der letzten Beziehung wurde ∆ρgleich als Funktional des Austauschpotentials vxge-

schrieben. Dies ist m¨

oglich, da die induzierte Ladungsdichte nach (2.4)¨

uber die direkt

von vxabh¨

angenden ψ0

iund die durch die St¨

orung H1[{ψ0

i}, vx] zumindest indirekt von vx

abh¨

angenden Korrekturen ψ1

igegeben ist. Man beachte, dass (2.5) nur f¨

ur das exakte vx

gilt. F¨

ur ein nur angen¨

ahertes Probe-Potential vProbe

xist (2.5) hingegen niemals3erf¨

ullt, so

dass sich daraus insgesamt ein Variationsprinzip f¨

ur das exakte Austauschpotential ergibt:

∆ρ[vProbe

x]≥0,(2.6)

wobei die Gleichheit nur im exakten Fall gilt. F¨

ur eine effiziente numerische Minimierung

der linken Seite sei auf Abschnitt 4.3 verwiesen.

In das Variationsprinzip gehen an keiner Stelle unbesetzte Zust¨

ande ein, und die lineare

Antwortfunktion χ0wird ebenfalls nirgends gebraucht. Es ist daher plausibel, dass dieser

Ansatz bei der Entwicklung von Computeralgorithmen die M¨

oglichkeit großer technischer

Vorteile gegen¨

uber dem Standard-EXX-Verfahren bietet. Eine tiefere Einsicht, auf welche

Weise in diesem Ansatz die Schwierigkeiten des Standard-Verfahrens umgangen werden

k¨

onnen, wird im ¨

ubern¨

achsten Abschnitt 2.3 zu geben versucht.

Vergleicht man (2.4) mit (1.102) aus Abschnitt 1.6.3, f¨

allt auf, dass beide Gleichungen

eine ¨

ahnliche Struktur besitzen. Tats¨

achlich sind sie identisch. Dar¨

uber hinaus stellen sie

eine besonders knappe Formulierung der OEP-Gleichung dar, was im Folgenden gezeigt

werden soll.

3In diesem Kapitel werden v-darstellbare Dichten vorausgesetzt. Folglich w¨

are das Hohenberg-Kohn-

Theorem I verletzt, falls es f¨

ur eine gegebene Dichte ρein zweites v′

xg¨

abe, das die Bedingung (2.5) ebenfalls

erf¨

ullt.

38 2 Das variationelle EXX-Verfahren

2.2 ¨

Aquivalenz des variationellen Ansatzes zu OEP und

Standard-EXX

Im Ansatz (1.79) von G¨

orling und Levy wurde das gesamte lokale Austausch-Korrelations-

Potential vxc des Kohn-Sham-Schemas in den Austausch-Korrelations-Operator Vee −vH[ρ]

des realen Systems ¨

uberf¨

uhrt. Die Konstanz der Dichte folgt dabei letztlich aus der Defi-

nition des Kohn-Sham-Systems, das ja gerade so konstruiert ist, dass es die reale Dichte

repliziert (vgl. Abschnitt 1.4.2).

Im Gegensatz dazu wird im vorangehend beschriebenen Ansatz nur das lokale Kohn-

Sham-Austauschpotential in ein nicht-lokales von der Form des Fock-Operators ¨

uberf¨

uhrt.

Nun liegen jedoch den Herleitungen des Fock-Operators und des Kohn-Sham-Austausch-

potentials g¨

anzlich verschiedene Ideen zu Grunde; einmal wird die Austauschenergie Ex

nach der Ein-Teilchen-Funktion ψiabgeleitet (vgl. Abschnitt 1.3), im anderen Fall jedoch

nach der Dichte ρ(vgl. Abschnitt 1.6.1). Die Einf¨

uhrung von VFock[{ψi}] in das Kohn-

Sham-Schema gem¨

aß (2.1) ist daher zun¨

achst ein heuristischer Ansatz, und es ist n¨

otig,

die ¨

Aquivalenz des Variationsprinzips (2.6) mit der OEP-Gleichung (1.97) noch einmal

streng zu beweisen.

Das Variationsprinzip (2.6) ist genau dann erf¨

ullt, wenn man ein vProbe

xgefunden hat,

das, in (2.1) eingesetzt, auf Korrekturfunktionen ψ1

if¨

uhrt, die die induzierte Ladungs-

dichte ∆ρverschwinden lassen.4Gem¨

aß der St¨

orungstheorie lassen sich die L¨

osungen der

Sternheimer-Gleichung (2.2) auch als Reihenentwicklung mit Hilfe der Greenschen Funk-

tion (B.11) darstellen,

ψ1

i(r) = X

εj6=εi

ψ0

j(r)hψ0

j|H1|ψ0

ε0

i−ε0

=ZGi(r,r′)H1ψ0

i(r′) d3r′,(2.7)

wobei H1in (2.1) definiert wurde und ¨

uber alle Eigenfunktionen ψ0

jdes Kohn-Sham-Ope-

rators von (1.52) summiert wird mit Ausnahme derjenigen aus dem Eigenraum zu ε0

Setzt man dies in Gleichung (2.4) ein,

∆ρ(r) =

occ

εj6=εi

ψ0

i(r)∗ψ0

j(r)hψ0

j|H1|ψ0

ε0

i−ε0

+ c.c.(2.8)

occ

iZd3r′hψ0

i(r)∗Gi(r,r′)H1ψ0

i(r′) + c.c.i= 0 ,

und beachtet ferner, dass Summanden mit besetzten Zust¨

anden ψ0

jsich herausk¨

urzen

(Vertauschen von iund jliefert das negative Vorzeichen), ergibt sich daraus unmittelbar

die OEP-Gleichung in der Form (1.103) bzw. (1.97). Damit ist auch die ¨

Aquivalenz zur

EXX-Gleichung (1.90) gezeigt, wobei aber die in Kapitel 2besprochenen Schwierigkeiten

bei der Umstellung der Formel ber¨

ucksichtigt werden m¨

ussen.

Perdew und K¨

ummel [79,80] verfolgten bei der Herleitung des variationellen EXX-

Verfahrens gewissermaßen den umgekehrten Weg: Sie starteten von der OEP-Gleichung

4Eigentlich ist die induzierte Ladungsdichte in erster N¨

aherung durch α∆ρgegeben. Da aber mit (2.4)

nur das (punktweise) Verschwinden des Koeffizienten ∆ρentscheidend ist, sei im Folgenden stets α= 1

gesetzt.

2.3 Variation an Stelle direkter Inversion 39

in der kompakten Gestalt (2.5), die bereits durch Krieger, Li und Iafrate [72] sowie von

Grabo et al. [48,49] angegeben wurde, und konstruierten daraus — ebenfalls ¨

uber die

Sternheimer-Gleichung (2.2) — das St¨

orungsproblem (2.1).

2.3 Variation an Stelle direkter Inversion

Wenn das variationelle Verfahren ohne die unbesetzten Zust¨

ande und ohne χ0und dessen

Inversion auskommt, m¨

ussen deren ”Aufgaben” an anderer Stelle ¨

ubernommen werden.

Dies soll hier kurz diskutiert werden.

Zun¨

achst zu den unbesetzten Zust¨

anden: Bei der Berechnung von vx[ρ] mit dem Stan-

dard-Verfahren erscheinen sie gem¨

aß (1.94) an zwei Stellen: in der Greenschen Funkti-

on (B.12) und zur Berechnung der linearen Antwort χ0, wobei nach (F.2) bei Letzterer

die unbesetzten Zust¨

ande ebenfalls ¨

uber die Greensche Funktion ins Spiel kommen. Die

Greensche Funktion dient dabei der Beschreibung einer St¨

orung des Kohn-Sham-Systems,

und k¨

onnte — wie (2.7) zeigt — auch im variationellen Verfahren zur Berechnung der

linearen Korrekturen ψ1

ibenutzt werden. Die Berechnung der ψ1

igelingt jedoch viel effi-

zienter ¨

uber die Sternheimer-Gleichung (2.2). Die Idee dabei ist sehr ¨

ahnlich zu der, die

(direkte) Inversion von χ0zu vermeiden und sei deshalb weiter unten damit gemeinsam

diskutiert.

Zur Eliminierung von χ0: Die induzierte Ladungsdichte α∆ρkann als Verschiebung der

Ladungsverteilung weder Ladung hinzu-, noch abf¨

uhren. Mathematisch wird dies durch

die Forderung der Orthogonalit¨

at ψ0

i⊥ψ1

iin der Sternheimer-Gleichung erreicht, vgl.

Abschnitt 4.1.1. Es gilt also

Z∆ρ(r) d3r=

occ

iZψ0

i(r)∗ψ1

i(r) d3r+ c.c. = 0 .(2.9)

Wie von G¨

orling und Levy in Ref. 41 bzw. hier im Anschluss an Gleichung (1.93) diskutiert,

charakterisiert diese Bedingung gerade den Wertebereich der linearen Antwort χ0. Dies

ist der Untervektorraum (der Ladungsdichte¨

anderungen), in dem χ0invertierbar ist, also

die EXX-Gleichung (1.90) definiert ist. Ferner geht die induzierte Ladungsdichte α∆ρf¨

”infinitesimal kleine” αformal in den ”Z¨

ahler” von χ0=δρ/δveff ¨

uber:

α∆ρ=

occ

(ψ0

i)∗(αψ1

i) + c.c. (2.10)

−→

occ

(ψ0

i)∗δψ0

i+ c.c. = δ

occ

i|ψ0

i|2=δρ (α−→ 0) .

Die in Abschnitt 2.1 verlangte Forderung, dass die Ladungsdichte in linearer N¨

aherung

konstant bleibt, wenn man das Potential um ∆veff := αH1¨

andert, k¨

onnte man nun sehr

einfach formulieren, wenn der St¨

oroperator lokal w¨

are:

Zχ0[veff](r,r′) ∆veff (r′) d3r′=Zδρ[veff ](r)

δveff (r′)∆veff(r′) d3r′!

= 0 .(2.11)

So ist z.B. die linke Seite der OEP-Gleichung (1.96) von dieser Form, wenn man ∆veff := vx

setzt. Das Problem ist nun aber, dass der St¨

oroperator H1von (2.1) nicht-lokal ist, da

er den Fock-Operator enth¨

alt. Damit ist χ0allerdings ”¨

uberfordert”. Wie in Anhang D

gezeigt, l¨

asst sich die lineare Antwort jedoch auch so erweitern, dass sie auf diese Form

40 2 Das variationelle EXX-Verfahren

nicht-lokaler Potentialdifferenzen anwendbar ist, und die Idee, lineare Dichte¨

anderungen

gleich Null zu setzen, kann auf ¨

ahnliche Weise wie in obiger Gleichung (2.11) formuliert

werden. Dort wird auch auf den engen Bezug dieser Interpretation zur Sham-Schl¨

uter-

Gleichung und damit letztlich auch zur GW -Methode [150,151] verwiesen. Die induzierte

Ladungsdichte (2.4) kann demnach als Ergebnis einer Anwendung der linearen Antwort

auf die Potential¨

anderung aufgefasst werden; eine explizite Berechnug von χ0wird nicht

mehr ben¨

otigt.

Durch welchen Mechanismus wird im variationellen Verfahren nun aber die im Stan-

dard-Formalismus ben¨

otigte Inversion von χ0ersetzt? Dies geschieht auf ganz ¨

ahnliche

Weise, wie sich die Greensche Funktion mit Hilfe der Sternheimer-Gleichung umgehen

l¨

asst. Der Greensche Operator ist gem¨

aß (B.8) in einem geeigneten Unterraum die Um-

kehrung des Operators H0−ε0

i, mit deren Hilfe die Sternheimer-Gleichung in (2.7) expli-

zit nach ψ1

iaufgel¨

ost werden konnte. Analog wird auch χ−1

0in (1.94) nur zur expliziten

Aufl¨

osung nach dem Austauschpotential vxben¨

otigt. In den impliziten Darstellungen von

vxund ψ1

imit Hilfe der OEP-Gleichung in Gestalt von (1.96) oder (2.4) bzw. ¨

uber die

Sternheimer-Gleichung (2.2) werden nur die Operatoren χ0bzw. H0−ε0

iselbst, nicht aber

deren Umkehrungen ben¨

otigt. Solche impliziten Gleichungen lassen sich aber als Varia-

tionsprizip f¨

ur die gesuchte Variable verstehen: sie muss ”nur” so lange variiert werden,

bis die Gleichung erf¨

ullt ist. Es erweist sich dabei h¨

aufig als bequem, das Variationsprin-

zip als Extremalprinzip f¨

ur eine skalare Gr¨

oße zu formulieren, die dann zum Funktio-

nal der Variablen wird. Dies l¨

asst sich stets — wie in (2.6) f¨

ur die OEP-Gleichung —

durch Betragsbildung erreichen. Es gibt aber auch andere M¨

oglichkeiten, solche Funktio-

nale zu konstruieren, wie z.B. in Abschnitt 4.1.1 f¨

ur den Fall der Sternheimer-Gleichung

ausgef¨

uhrt. Wie die Minimierung dieser Funktionale im Einzelnen gelingt, wird in den

Abschnitten 4.1.2 und 4.3 ausf¨

uhrlich diskutiert.

Noch einmal kurz: Die Vorteile der variationellen Formulierung des EXX-Verfahrens

beruhen letztlich auf dem Trick, komplizierte Operator-Inversionen mit Hilfe implizi-

ter Gleichungen in numerisch einfachere Extremalwertprobleme umzuformulieren. Dieser

Kunstgriff l¨

asst sich dabei gleich zweimal anwenden, sowohl zur Vermeidung des Green-

schen Operators ˆ

Gi= (H0−ε0

i)−1, als auch zur Vermeidung von χ−1

0(beide in geeigneten

Unterr¨

aumen definiert).

2.4 Variationelles EXX und Hartree-Fock-Verfahren

Gleichung (2.1) stellt einen engen Bezug zwischen dem “exchange-only” (vc:= 0) Kohn-

Sham-Formalismus (Hαmit α= 0) und dem Hartree-Fock-Schema (Hαmit α= 1) her.

Dennoch lassen sich die Ergebnisse einer Kohn-Sham-EXX-Rechnung nicht in die Ergeb-

nisse einer Hartree-Fock-Rechnung ¨

uberf¨

uhren — auch nicht in 1. N¨

aherung —, indem

man einfach die durch die St¨

orung H1hervorgerufenen Korrekturen ψ1

iberechnet und

auf die Kohn-Sham-Funktionen addiert. Der Grund ist, dass der nicht-lokale Austausch-

operator VFock[{ψi}] hier aus den Kohn-Sham-, nicht aber aus den selbst-konsistenten

Hartree-Fock-Orbitalen aufgebaut ist.

Dennoch macht Ansatz (2.1) die große ¨

Ubereinstimmung der Ladungsdichte, der Ge-

samtenergie [49,60,61,62,68,78] und sogar der Orbitale [58,59] im Hartree-Fock- und

dem “exchange-only” Kohn-Sham-Schema plausibel.5Denn in (2.1) wird mit Hilfe der

5Es sei allerdings an dieser Stelle auf die großen qualitativen Unterschiede der beiden Methoden

hinsichtlich der Ein-Teilchen-Energien hingewiesen: Wie in der Einleitung bereits ausgef¨

uhrt, steht der

sehr guten ¨

Ubereinstimmung der theoretischen Bandl¨

ucken in EXX mit den experimentellen Werten eine

2.4 Variationelles EXX und Hartree-Fock-Verfahren 41

Minimierung (2.6) das lokale Potential vxgewissermaßen so ”gefittet” oder ”gemittelt”,

dass es sich optimal an VFock anpasst. Anders ausgedr¨

uckt, das EXX-Potential ist die beste

lokale N¨

aherung f¨

ur VFock. Dies war — wenngleich in anderer Formulierung — ja auch der

Leitgedanke beim OEP-Ansatz (1.99); es best¨

atigt sich hier also wiederum die ¨

Aquivalenz

von EXX und OEP. Nimmt man weiter an, dass vEXX eine gute N¨

aherung f¨

ur VFock ist,

so sollte man erwarten, dass sich die Orbitale und die (aus ihnen aufgebauten) Gesamt-

energien in beiden Formalismen nur sehr wenig voneinander unterscheiden. Dass sie gut

ist, best¨

atigen die oben genannten Referenzen. Vollst¨

andig kann der Unterschied zwischen

Hartree-Fock- und Kohn-Sham-Orbitalen jedoch im Allgemeinen nicht verschwinden, da

H1als Differenz zwischen einem lokalen und nicht-lokalen Operator im Allgemeinen nicht

0 werden kann — außer in einfachsten F¨

allen wie dem Wasserstoffatom, f¨

ur das auch

das Fock-Potential als lokaler Operator darstellbar ist (und sich gerade gegen das Hartree-

Potential weghebt). Es sei noch bemerkt, dass die Vernachl¨

assigung der Orbitaldifferenzen

zum so genannten lokalisierten Hartree-Fock-Verfahren [87] f¨

uhrt, das als Verallgemeine-

rung des KLI-Verfahrens [70,71,72,73] angesehen werden kann und gegen¨

uber Letzterem

den Vorteil besitzt, wie der Fock-Operator invariant bzgl. unit¨

arer Transformationen der

Wellenfunktionen zu sein.

Ubersch¨

atzung der Bandl¨

ucken bei Hartree-Fock um typischerweise einen Fakor 2 – 3 gegen¨

uber.

Kapitel 3

Methoden zur numerischen

Beschreibung periodischer

Systeme

Zentrale Gr¨

oßen bei der mathematischen Beschreibung quantenmechanischer Systeme sind

in Gestalt linearer Operatoren und Funktionen gegeben, die als Elemente eines geeigneten

Vektorraums, z.B. eines Hilbertraums, bzw. als lineare Abbildungen darin definiert sind.

Zur konkreten Darstellung dieser Objekte ben¨

otigt man Koordinatensysteme, auch Basis-

systeme genannt. Ihre Wahl ist beliebig (solange sie ”vollst¨

andig” sind) und kann daher

nach Zweckm¨

aßigkeit erfolgen. Da dieser Vektorraum jedoch in der Regel ∞-dimensional

ist, besteht eine erste numerische Vereinfachung1darin, nicht mehr die vollst¨

andige Ba-

sis zu betrachten, sondern nur noch eine endliche, von der gew¨

unschten Genauigkeit

abh¨

angende Anzahl nvon Basisvektoren (”Diskretisierung”). Damit wird das Problem

uberhaupt erst mit dem Rechner handhabbar; Operatoren werden zu (n×n)-Matrizen

und Funktionen zu n-dimensionalen Vektoren.

Je nach Zweckm¨

aßigkeit verwendet man in der Praxis verschiedene Typen von Basis-

funktionen. Halbleiterkristalle, wie sie in dieser Arbeit behandelt werden, lassen sich als

(n¨

aherungsweise) periodische Systeme besonders gut mit ebenen Wellen beschreiben (Ab-

schnitt 3.3). Effektiv ist dieser Ansatz, wenn er mit dem durch die Theorie der chemischen

Bindung motivierten Pseudopotentialkonzept kombiniert wird (Abschnitte 3.4 und 3.5).

Weitere Reduktionen des numerischen Aufwandes ergeben sich durch Ausnutzung vorhan-

dener Symmetrien; statt den (im Idealfall unendlich ausgedehnten) Kristall zu betrachten,

beschr¨

ankt man sich de facto auf eine kleine ”Einheitszelle” mit nur wenigen Kernen/Ionen

(Abschnitte 3.1 und 3.2).

Anders dagegen bei Systemen, in denen etwa mehrere Tausend Atome explizit zu

ber¨

ucksichtigen sind, z.B. Quantenpunkte: Hier sind ebene Wellen im Allgemeinen nicht

mehr praktikabel, und ist es besser, lokalisierte Tight-Binding-Basen zu verwenden. In

diesem Zusammenhang sei auf Teil II dieser Arbeit verwiesen, in dem eine spezielle Tight-

Binding-Basis, konstruiert aus ”Verallgemeinerten Wannier-Funktionen”, vorgestellt wird.

1Die in diesem Kapitel besprochenen N¨

aherungen sind jedoch nicht die einzigen: durch die Einf¨

uhrung

der Born-Oppenheimer-N¨

aherung, der Verwendung gen¨

aherter Austausch-Korrelationspotentiale wie LDA

oder GGA sowie dem Abbrechen der G¨

orling-Levy-Entwicklung nach dem ersten Glied (“exchange-only”)

u.¨

A. wurden bereits im Vorangehenden erhebliche Vereinfachungen vorgenommen.

44 3 Methoden zur numerischen Beschreibung periodischer Systeme

3.1 Symmetrien und periodische Randbedingungen

Ein idealer Kristall besteht aus einer periodischen Anordnung von Kernen oder — bei

Verwendung von Pseudopotentialen, vgl. Abschnitt 3.5 — Ionen, in deren Potential sich

eine unendliche Anzahl von Elektronen bewegt. Je nach Struktur gibt es S¨

atze linear

unabh¨

angiger Vektoren a1,a2,a3∈IR3, deren ganzzahlige Linearkombinationen Rden

Kristall in sich selbst ¨

uberf¨

uhren (Translationssymmetrie):

R=n1a1+n2a2+n3a3(mit n1, n2, n3∈Z).(3.1)

Das durch die aiaufgespannte Parallelepiped wird Einheitszelle genannt und besitzt das

Volumen Ω = |a1·(a2×a3)|. Eine Wahl der ai, die auf das kleinste Volumen Ω f¨

uhrt, das,

periodisch fortgef¨

uhrt, den ganzen Kristall ergibt, definiert die primitive Zelle. Tats¨

achlich

lassen sich durch einen solchen Ansatz nicht nur Volumensysteme, sondern auch Ober-

fl¨

achen, Cluster, Molek¨

ule und isolierte Atome beschreiben. Dabei setzt man diese Struk-

turen periodisch fort, w¨

ahlt aber die Abst¨

ande zwischen den Einzelsystemen so groß, dass

die ¨

Uberlappung ihrer Wellenfunktionen so gering wie m¨

oglich gehalten wird. Da die Ein-

heitszelle im Rechner nat¨

urlich nicht beliebig gedehnt werden kann, ist hier ein sinnvoller

Kompromiss zu finden.

Analog zu den Gittervektoren (3.1) definiert man ein reziprokes Gitter durch die Vek-

toren

G=n1b1+n2b2+n3b3(mit n1, n2, n3∈Z),(3.2)

wobei die bieine zu den aireziproke Basis des IR3sind:

bi:= 2πaj×ak

Ω(f¨

ur i, j, k zyklisch) .(3.3)

Der durch die biaufgespannte Bereich mit dem Volumen 8π3/Ω heißt reduzierter Bereich.

H¨

aufig wird er jedoch durch die volumensgleiche 1. Brillouin-Zone (BZ), einer Wigner-

Seitz-Zelle im reziproken Raum, ersetzt. Die Konstruktion von Wigner-Seitz-Zellen wird

in vielen Standardwerken der Theoretischen Festk¨

orperphysik, z.B. in Ref. 88 oder 89,

beschrieben.

Im Einteilchen-Hamilton-Operator H(r) = −1

2∇2+V(r) kommt die Translationsym-

metrie des Systems durch ein translationsinvariantes Potential V(r) = V(r+R) zum

Ausdruck. Als Eigenfunktionen ψnkergeben sich damit so genannte Blochfunktionen, die

in eine ebene Welle und eine gitterperiodische Modulationsfunktion unkseparieren:

ψnk(r) = eik·runk(r) mit unk(r) = unk(r+R).(3.4)

Dabei kann der ”Quasi-Wellenvektor” kstets als Element der 1. Brillouin-Zone gew¨

ahlt

werden, denn es gilt ψn,k=ψn,k+Gf¨

ur beliebige reziproke Gittervektoren aus (3.2). Die

Dispersion, d.h., die k-Abh¨

angigkeit der zugeh¨

origen Eigenwerte εnkl¨

asst sich in Form

einer Bandstruktur darstellen, in der die Energieb¨

ander durch den Bandindex nabgez¨

ahlt

werden. Blochfunktionen gen¨

ugen der Blochbedingung

ψnk(r+R) = eik·Rψnk(r),(3.5)

d.h., sie sind im Allgemeinen nicht gitterperiodisch (nur dann, wenn kein reziproker

Gittervektor gem¨

aß (3.2) ist).

Neben der Translationssymmetrie weist das System in der Regel eine Anzahl NPS von

Punktsymmetrien auf, d.h., f¨

ur das Potential des Hamilton-Operators gilt V(r)=V(Sνr)

3.2 Numerische Integration in der Brillouin-Zone 45

mit ν= 1,...,NPS. Die Sνsind dabei durch unit¨

are (3 ×3)-Matrizen gegeben, die eine

Gruppe, die Punktgruppe des Systems, bilden. Aus der Blochbedingung erh¨

alt man

ψn,Sνk(r) = ψn,k(S−1

νr), εn,Sνk=εn,k,(3.6)

was beispielsweise in Ref. 90 oder 91 vorgef¨

uhrt wird. Unabh¨

angig von der speziellen

Punktgruppensymmetrie des Systems gilt im reziproken Raum stets die so genannte Zeit-

umkehrsymmetrie. Sie ergibt sich aus der konjugiert-komplexen Schr¨

odinger-Gleichung

und der Blochbedingung (vgl. z.B. Ref. 92):

ψn,−k(r) = eiαn,kψ∗

n,k(r), εn,−k=εn,k,(3.7)

wobei αn,keine beliebige Phase ist.

Zu der praktischen Unm¨

oglichkeit, alle unendlich vielen Elektronen des idealen Kris-

talls numerisch zu ber¨

ucksichtigen, tritt das konzeptuelle Problem, dass Blochfunktionen

auf dem IR3nicht normierbar und damit zur quantenmechanischen Beschreibung zun¨

achst

nicht geeignet sind. Beide Schwierigkeiten lassen durch Verwendung periodischer Randbe-

dingungen, auch Born-von-K´arm´an-Randbedingungen genannt, umgehen. Die N¨

aherung

besteht hier darin, nur einen Teil des periodischen Systems zu betrachten, der durch ein

ganzzahliges Vielfaches der Einheitszelle, d.h. also, durch ein Parallelepiped mit den Kan-

ten Liai(Li∈IN geeignet) gegeben ist. Die Blochfunktionen werden dann nur auf diesem

periodischen Grundgebiet normiert, und man nimmt weiter an, dass sie mit diesem Gebiet

periodisch sind:

ψnk(r+Liai) = ψnk(r).(3.8)

Diese Annahme f¨

uhrt zu einer Diskretisierung des reziproken Raums: Der Quasi-Wellen-

vektor kkann nur noch die Werte

k=m1

b1+m2

b2+m3

b3(mit m1, m2, m3∈Z) (3.9)

annehmen, wobei der reduzierte Bereich durch 0 ≤mi< Liabgetastet wird. F¨

ur gen¨

ugend

große Likann der Abstand benachbarter kjedoch beliebig klein gemacht werden, daher

bezeichnet man diese ¨

aquidistante Verteilung der k-Punkte auch als ”quasikontinuierlich”.

Man beachte, dass die Anzahl L1L2L3der k-Punkte gerade der Anzahl der Einheitszel-

len im periodischen Grundgebiet entspricht. Etwas plakativ kann man also formulieren:

der Ortsraum-Variablen Rentspricht im reziproken Raum die Variable k. Die Beschrei-

bung des Kristalls wird umso genauer, je gr¨

oßer das periodische Grundgebiet ist, d.h.,

je dichter das durch (3.9) gegebene Gitter gew¨

ahlt wurde. Im Grenzfall gehen Summen

uber k-Punkte daher in Integrale ¨

uber. Solche Integrale sollen im folgenden Abschnitt 3.2

behandelt werden.

3.2 Numerische Integration in der Brillouin-Zone

F¨

ur gitterperiodischen Systeme findet man mit Hilfe der Bloch-Bedingung (3.5), dass die

Ladungsdichte und eine Reihe anderer Gr¨

oßen, wie etwa der nicht-lokale Austauschopera-

tor (vgl. Abschnitt 4.4), durch Integrale ¨

uber die 1. Brillouin-Zone (BZ) gegeben sind. Im

Folgenden sei hier exemplarisch die Ladungsdichte betrachtet, die sich dann gem¨

aß (1.53)

ρ(r) = Ω

8π3X

nZBZ

focc(n, k)·|ψnk(r)|2d3k(3.10)

46 3 Methoden zur numerischen Beschreibung periodischer Systeme

ergibt. Hier ist

focc(n, k) := 1

1 + exp εnk−εF

kBT(3.11)

die Fermi-Funktion mit der Fermi-Energie εF, der Boltzmann-Konstante kBund der Tem-

peratur T, ferner beinhaltet der Index ndabei die Spinquantenzahl σ. F¨

ur die numeri-

sche Behandlung muss die Integration durch eine Summe ¨

uber einen diskreten Satz an

k-Punkten approximiert werden. Dabei wird ausgenutzt, dass sich die Wellenfunktionen

dicht beieinander liegender k-Punkte nur wenig voneinander unterscheiden, und damit ein

ganzer Bereich im reziproken Raum durch einen einzigen k-Punkt repr¨

asentiert werden

kann. Wie hoch die Aufl¨

osung tats¨

achlich gew¨

ahlt werden muss, h¨

angt vom betrachteten

System ab und muss durch Konvergenztests herausgefunden werden.

Zur Generierung geeigneter k-Punkt-S¨

atze sind verschiedene Methoden entwickelt wor-

den [93,94,95,96,97]. Eine der gebr¨

auchlichsten ist das auch in dieser Arbeit benutzte

Verfahren von Monkhorst und Pack [96], bei dem ein regelm¨

aßiges Gitter durch den redu-

zierten Bereich (vgl. Abschnitt 3.1) gelegt wird. Unterteilt man den reduzierten Bereich

dabei in Richtung der bi-Vektoren je Limal, spricht man von einem (L1×L2×L3)-

Monkhorst-Pack-Gitter, vgl. Abb 3.1.

Weiter reduzieren l¨

asst sich die Anzahl der ben¨

otigten k-Punkte durch Ausnutzung

der Punktsymmetrie des Systems. Punkte, die durch Punkttransformationen ineinander

uberf¨

uhrt werden k¨

onnen, bilden eine ¨

Aquivalenzklasse. Die Symmetrie-Relationen (3.6)

und (3.7) erlauben es nun, pro ¨

Aquivalenzklasse jeweils nur einen k-Punkt, gewichtet mit

der M¨

achtigkeit der Klasse, in der Summe zu ber¨

ucksichtigen und das Ergebnis daf¨

anschließend zu ”symmetrisieren”. Die Dichte (3.10) wird dann ann¨

ahernd durch

ρ(r)≈ρsym(r) := 1

NPS

ν=1

ρunsym(Sνr) (3.12)

beschrieben, wobei NPS die Anzahl der Punkttransformationen ist, und ρunsym als Summe

uber einen reduzierten Satz Nred nicht-¨

aquivalenter k-Punkte gegeben ist:

ρunsym(r) := X

Nred

s=1

wksfocc(n, ks)|ψnks(r)|2.(3.13)

Die Gewichte wksmit PNred

s=1 wks= 1 sind dabei proportional zur M¨

achtigkeit der durch

die ksrepr¨

asentierten Klassen.

Es sei darauf hingewiesen, dass die Symmetrisierung (3.12) im Allgemeinen einer Sum-

mation ¨

uber mehr k-Punkte als den L1L2L3Punkten des urspr¨

unglichen Monkhorst-Pack-

Gitters entspricht. Dies r¨

uhrt daher, dass das Monkhorst-Pack-Gitter im Allgemeinen nicht

invariant gegen¨

uber Punkttransformationen des Bravais-Gitters (und der Zeitinversions-

symmetrie) ist, wie Abbildung 3.1 demonstriert. Eine Summation explizit ¨

uber das ge-

samte Monkhorst-Pack-Gitter, aber ohne anschließende Symmetrisierung, liefert deshalb

nicht notwendigerweise ein symmetrisches Ergebnis.

3.3 Entwicklung nach ebenen Wellen

Die Separierbarkeit der Blochfunktionen (3.4) gestattet es, den Ebene-Wellen-Faktor eik·r

aus dem Eigenwertproblem Hψnk=εnkψnkherauszuk¨

urzen und eine Differentialgleichung

nur f¨

ur die Modulationsfunktion unkaufzustellen:

)a(

)b(

)d(

)e(

)c(

)f(

Abbildung 3.1: Symmetrien beim Monkhorst-Pack-Schema am Beispiel eines 2-dimensionalen Gitters mit hexagonaler Struktur. Die reziproken Gittervektoren

b1und b2spannen den reduzierten Bereich (grau) auf. (a) k-Punkt-Satz einer (2×2)-Monkhorst-Pack-Zerlegung im reduzierten Bereich. (b) Der k-Punkt-Satz

kann auf die schwarz gezeichneten Punkte reduziert werden, denn diese lassen sich durch Symmetrietransformationen (hier: Inversion, Verschiebung um reziproke

Gittervektoren) in die mit leeren Kreisen markierten k-Punkte ¨

uberf¨

uhren. (c) Der reduzierte k-Punkt-Satz. (d) Durch Anwenden aller Punktsymmetrien (hier:

Drehung um 0◦,60◦,120◦,180◦,240◦,300◦und die Inversion) auf den reduzierten k-Punkt-Satz ergeben sich die so genannten ”Sterne”. (e) Translation aller

Punkte der Sterne um geeignete reziproke Gittervektoren in den reduzierten Bereich. (f) Dieser k-Punkt-Satz ist dem in (d) ¨

aquivalent. Der Vergleich mit (a)

zeigt, dass die urspr¨

ungliche Monkhorst-Pack-Zerlegung hier nicht invariant gegen¨

uber Punkttransformationen des Bravais-Gitters ist. Summiert man jeweils

uber die markierten Punkte im grauen Feld, erh¨

alt man in (a) folglich nicht die volle Symmetrie, in (f) hingegen schon.

48 3 Methoden zur numerischen Beschreibung periodischer Systeme

−1

2∇2−2k·1

i∇−k2+V(r)unk(r) = εnkunk(r).(3.14)

Wegen der Gitterperiodizit¨

at des Potentials Vund der Modulationen unkkann diese Glei-

chung fouriertransformiert werden:

G′+1

2|G+k|2δG,G′+ˆ

V(G−G′)cnk(G′) = εnkcnk(G).(3.15)

Die

cnk(G) = 1

√ΩZΩ

unk(r) e−iG·rd3r(3.16)

sind dabei die Koeffizienten der Fourierentwicklung

unk(r) = 1

√ΩX

cnk(G) eiG·r.(3.17)

Offensichtlich wird beim ¨

Ubergang von der Orts- zur Impulsdarstellung aus dem nicht-

lokalen Operator der kinetischen Energie ein lokaler Multiplikationsoperator. Umgekehrt

erh¨

alt man jedoch aus einem — wie im Falle der Kohn-Sham-Gleichungen (1.52) — lokalen

Potential V(r) einen nicht-lokalen Operator. Daher empfiehlt es sich, die Operationen

jeweils in der Basis auszuf¨

uhren, in der sie lokal dargestellt werden k¨

onnen. Dabei kann mit

Hilfe schneller Fouriertransformationen (FFT) effizient zwischen den beiden Darstellungen

hin- und hergewechselt werden.

Aus der R¨

ucktransformation (3.17) ergibt sich zusammen mit (3.4) auch die Fourier-

darstellung der Blochfunktionen:

ψnk(r) = 1

√ΩX

cnk(G) ei(G+k)·r.(3.18)

Die Basis hier ist die so genannte ”|G+ki-Basis” mit ei(G+k)·r=hr|G+ki.

Wie zu Beginn des Kapitels bereits erw¨

ahnt, muss die Menge der Basisfunktionen in

der Praxis auf eine endliche Anzahl reduziert werden. Dies geschieht hier durch Einf¨

uhrung

einer Abschneideenergie oder cutoff-Energie Ecut. Sie stellt eine Obergrenze f¨

ur die kineti-

sche Energie der ”schnellsten” Basisfunktionen dar. F¨

ur gegebenes kwird die Summation

in (3.17) bzw. (3.18) also auf alle Gmit 1

2|G+k|2< Ecut eingeschr¨

ankt. Die Abschnei-

deenergie ist somit ein leicht kontrollierbares Maß f¨

ur die Qualit¨

at (die ”Vollst¨

andigkeit”)

der Basis. Bei praktischen Anwendungen muss mit Hilfe von Konvergenztests sichergestellt

sein, dass die Rechnungen bzgl. Ecut auskonvergiert sind. Aus dem Variationsprinzip von

Ritz (vgl. Abschnitt 1.2) folgt eine Konvergenz von oben gegen die tats¨

achliche Gesamt-

energie.

Mit dem Vorangehenden wird klar, dass die Verwendung einer Ebene-Wellen-Basis

umso effizienter ist, je kleiner die ben¨

otigte Abschneideenergie ist. Die Anzahl der er-

forderlichen G-Vektoren l¨

asst sich dabei durch die Relation NG∼E3/2

cut absch¨

atzen. Die

Fourierentwicklung stark lokalisierter und/oder heftig oszillierender Wellenfunktionen, wie

sie z.B. durch die Singularit¨

aten des ¨

außeren Potentials an den Kernorten hervorgeru-

fen werden, verlangt jedoch auch sehr hohe Frequenzen. Dem kann mit der Einf¨

uhrung

so genannter Pseudopotentiale begegnet werden, die die Orbitale innerhalb eines f¨

ur die

3.4 N¨

aherung der starren R¨

umpfe 49

chemische Bindung nicht relevanten Rumpfbereichs durch gegl¨

attete Pseudoorbitale er-

setzen und damit die erforderliche Abschneideenergie drastisch reduzieren. Andererseits

wurden in den vergangenen Jahren auch ”gemischte” Basiss¨

atze entwickelt, in denen ebe-

ne Wellen mit lokalisierten Basisfunktionen kombiniert werden. Erw¨

ahnt seien hier die

linearized augmented plane-waves (LAPW) [100], die augmented plane-waves plus local

orbitals (APW+lo) [101,102] sowie die projector augmented plane-waves (PAW) [103].

In dieser Arbeit werden ebene Wellen in Verbindung mit nicht-lokalen, normerhaltenden

Pseudopotentialen benutzt, auf deren Konstruktion genauer in Abschnitt 3.5 eingegangen

wird. Mit dieser Methode lassen sich die hier untersuchten Halbleitermaterialien (GaAs,

Gruppe-III-Nitride) gut beschreiben.

3.4 N¨

aherung der starren R¨

umpfe

Chemische Bindungen werden fast ausschließlich von den ¨

außeren, so genannten Valenz-

elektronen der beteiligten Atome bestimmt. Ferner ist die Hybridisierung zwischen den

Valenzelektronen und den inneren, so genannten Rumpfelektronen h¨

aufig vernachl¨

assig-

bar. Daher ist es in der Regel ausreichend, die inneren Schalen zusammen mit den Kernen

als ”unver¨

anderliche Ionen” oder ”starre R¨

umpfe” (engl.: “frozen cores”) aufzufassen, de-

ren Wechselwirkung mit den Valenzelektronen gen¨

ahert ¨

uber ein effektives Potential vIon

beschrieben wird.

Von den Ergebnissen einer Allelektronen-Rechnung f¨

ur ein freies Atom mit Kernla-

dungszahl Zausgehend, wird daf¨

ur die atomare Ladungsdichte ρAE =ρR+ρVin einen

Anteil ρR=PNR

i=1 |ψi|2der NRRumpfelektronen und einen Anteil ρV=PZ

i=NR+1 |ψi|2der

Z−NRValenzelektronen aufgeteilt. Von nun an wird die atomare Rumpfladungsdichte ρR

als konstant vorausgesetzt, also nicht mehr zur Variation zugelassen. Damit erh¨

alt man

den nur von der Valenzladungsdichte ρVabh¨

angenden atomaren Kohn-Sham-Operator

−1

2∇2+vIon(r) + vH[ρV](r) + vxc[ρV](r).(3.19)

Alle ρR-abh¨

angigen Terme sind hier durch das Ionenpotential

vIon(r) := −Z

|r|+vH[ρR](r) + ∆vxc[ρR, ρV](r) (3.20)

ber¨

ucksichtigt. Es enth¨

alt neben dem Kernpotential den Rumpfanteil des Hartree-Poten-

tials, der auf Grund der Linearit¨

at in der Ladungsdichte vH[ρ1+ρ2] = vH[ρ1] + vH[ρ2]

exakt vom Valenzanteil abgespalten werden kann. Das Austausch-Korrelationspotential

hingegen ist nicht linear in der Dichte; daher ist vIon ¨

uber den Ausgleichsterm

∆vxc[ρR, ρV] := vxc[ρR+ρV]−vxc[ρV] (3.21)

streng genommen noch von der Valenzladungsdichte ρVabh¨

angig. Sie wird aber n¨

ahe-

rungsweise auch bei der Betrachtung mehratomiger Systeme gleich der atomaren Valenz-

dichte ρVgesetzt und festgehalten, so dass (3.20) das Potential eines ”starren Rumpfs” dar-

stellt. Dies entspricht letztlich einer ”Linearisierung” des Austausch-Korrelationspotentials,

vxc[ρR]≈vxc[ρR+ρV]−vxc[ρV], die damit gerechtfertigt wird, dass die ¨

Uberlappung von

Rumpf- und Valenzzust¨

anden des Allelektronen-Atoms in der Regel vernachl¨

assigt wer-

den kann. Falls diese Vorgehensweise keine befriedigenden Ergebnisse liefert, l¨

asst sich

eine ”nicht-linearen Rumpfkorrektur” [104,105,115] durchf¨

uhren, die im Rahmen der

N¨

aherung der starren R¨

umpfe exakt ist, vgl Abschnitt 3.5.3.

50 3 Methoden zur numerischen Beschreibung periodischer Systeme

Um schließlich zu einer Kohn-Sham-Gleichung f¨

ur MAtome zu gelangen, wird das ex-

terne Potential vext in (1.52) durch eine geeignete Superposition von Ionenpotentialen der

Form (3.20) definiert und zur Berechnung der Dichte in (1.53)¨

uber alle Valenzelektronen

im System summiert.

Die Entscheidung, auf welche Weise die Einteilung der Elektronen in Rumpf- und

Valenzbereich erfolgen soll, h¨

angt vom betrachteten Element und der gew¨

unschten Ge-

nauigkeit ab. Bei den Elementen der III-V-Verbindungen werden oft die abgeschlossenen

inneren Schalen dem Rumpf-, die s- und p-Elektronen der ¨

außeren Schale hingegen dem

Valenzbereich zugeordnet, so z.B. bei GaAs oder InAs. In einigen F¨

allen sind jedoch auch

tiefer liegende Zust¨

ande an der chemischen Bindung beteiligt: So wechselwirken etwa bei

GaN und InN die kationischen d-Zust¨

ande der so genannten semi-core-Schale (der Schale

unterhalb der eigentlichen Valenzschale) mit den energetisch nah liegenden 2s-Zust¨

anden

des Stickstoffs und m¨

ussen daher bei einer genaueren Rechnung explizit als Valenzelek-

tronen ber¨

ucksichtigt werden. Im Rahmen dieser Arbeit wurde erstmalig die G¨

ultigkeit

dieser Vorgehensweise im Zusammenhang mit EXX-Pseudopotentialen untersucht, vgl.

dazu Kapitel 7.

3.5 Pseudopotentiale

Durch den im vorangehenden Abschnitt beschriebenen Ansatz der unver¨

anderlichen Ionen

l¨

asst sich zwar die Anzahl der effektiv zu berechnenden Ein-Teilchen-Zust¨

ande wesent-

lich reduzieren, dennoch w¨

urde auch die Beschreibung der verbleibenden Valenzelektro-

nen noch einen immensen numerischen Aufwand verlangen: In der N¨

ahe der Ionenr¨

umpfe

weisen die Valenzorbitale starke Oszillationen auf, die von der Singularit¨

at der Ionenpo-

tentiale (3.20) sowie von der Orthogonalit¨

at zu den Rumpforbitalen herr¨

uhren — große

Basiss¨

atze w¨

aren also von N¨

oten. Vor allem bei Verwendung ebener Wellen (vgl. Ab-

schnitt 3.3) erweist sich daher die Einf¨

uhrung von ”Pseudopotentialen” als ¨

außerst hilfrei-

che Weiterf¨

uhrung des Konzepts der starren R¨

umpfe.

Die zu Grunde liegende Idee ist, dass die Gestalt der Valenzorbitale innerhalb eines

durch einen Abschneideradius rcut

nl bestimmten Rumpfbereichs um die Kernorte die Eigen-

schaften einer chemischen Bindung des Atoms kaum beeinflusst. rcut

nl soll dabei zumindest

so groß gew¨

ahlt sein, dass sich alle Knoten (Nulldurchg¨

ange) der betrachteten Orbitale

darin befinden, wobei im Allgemeinen f¨

ur verschiedene Hauptquantenzahlen nund Dre-

himpulse lunterschiedliche Radien zugelassen sind. Gesucht ist nun ein Potential, das

die tats¨

achlichen Wellenfunktionen außerhalb des Rumpfbereichs mit gen¨

ugender Genau-

igkeit reproduziert, die numerisch problematischen Oszillationen innerhalb jedoch durch

einen m¨

oglichst weichen, d.h., durch m¨

oglichst wenige ebene Wellen beschreibbaren Ver-

lauf ersetzt. Ein anderer Aspekt ist die ¨

Ubertragbarkeit: das ideale Pseudopotential soll

unabh¨

angig von der chemischen Umgebung die richtigen, d.h., mit einer Allelektronen-

Rechnung ¨

ubereinstimmenden Resultate liefern. W¨

ahrend das Pseudopotential mit wach-

sendem rcut

nl immer weicher gew¨

ahlt werden kann, wird seine ¨

Ubertragbarkeit geringer.

Zwischen diesen beiden Anforderungen muss daher ein sinnvoller Kompromiss gefunden

werden. Eng mit der ¨

Ubertragbarkeit h¨

angt ferner die so genannte Normerhaltung zusam-

men; bei normerhaltenden Pseudopotentialen besitzt das ”pseudoisierte” Atom innerhalb

des Abschneideradius die gleiche Ladung wie sein Allelektronen-Gegenst¨

uck.

Moderne, normerhaltende ab-initio Pseudopotentiale erf¨

ullen eine Reihe weiterer Be-

dingungen [106,107,108,109], die nat¨

urlich nicht alle zugleich exakt erf¨

ullt werden k¨

onnen.

In den genannten Referenzen findet sich eine eingehende Diskussion dieser Bedingungen,

3.5 Pseudopotentiale 51

die zusammengenommen lauten:

(i) Die Orbitale des Pseudoatoms besitzen die gleichen Eigenwerte wie die entsprechen-

den Valenzorbitale des Allelektronen-Atoms.

(ii) Die Orbitale des Pseudoatoms stimmen außerhalb des Abschneideradius rcut

nl mit den

entsprechenden Orbitalen des Allelektronen-Atoms ¨

uberein. Zudem m¨

ussen die Pseu-

doorbitale mindestens zweimal differenzierbar sein und d¨

urfen keine Nulldurchg¨

ange

besitzen, damit sich die Schr¨

odinger-Gleichung nach dem Pseudopotential aufl¨

osen

l¨

asst.

(iii) Innerhalb des Rumpfbereichs enthalten die Orbitale des Pseudoatoms die gleiche

Ladung wie die entsprechenden Allelektronen-Orbitale (Normerhaltung).

(iv) Die logarithmische Ableitung nach rund wiederum deren Energieableitung stimmt

f¨

ur r > rcut

nl bei den jeweiligen Orbitalen von Pseudo- und Allelektronen-Atom ¨

ube-

rein. Durch diese Bedingung soll zusammen mit Forderung (i) erreicht werden, dass

die Streueigenschaften des Potentials bei der Pseudoisierung in 1. Ordnung erhal-

ten bleiben [108]. Dies ist eine Voraussetzung f¨

ur die ¨

Ubertragbarkeit des Pseudo-

potentials. Da sich die Eigenwerte je nach chemischer Umgebung ¨

andern, ist die

Ubereinstimmung der Energieableitung als Erweiterung von (i) gedacht.

Streng genommen muss (iv) hier nicht explizit gefordert werden, da dieser Punkt durch

die Bedingung (iii) bereits implizit abgedeckt ist, vgl. den folgenden Abschnitt.

3.5.1 Konstruktion

Die Generierung des Pseudopotentials erfolgt iterativ in einem selbstkonsistenten Zyklus.

Dabei wird der Radialanteil RPs

nl eines Pseudoorbitals im Rumpfbereich durch eine geeig-

nete Funktion parametrisiert, die gen¨

ugend Freiheitsgrade sowohl zur Anpassung an die

oben genannten Forderungen (i) – (iv) als auch zur Modellierung eines m¨

oglichst weichen

Pseudopotentials besitzt. Hierf¨

ur wurden verschiedene Ans¨

atze entwickelt, vgl. [106,107,

109,110] und die darin enthaltenen Literaturverweise. Bei dem Verfahren von Troullier

und Martins [109] etwa wird ein gerades Polynom 12. Grades p(r) = P6

i=0 a2ir2izur

Beschreibung des Radialteils verwendet, so dass — zus¨

atzlich zum Abschneideradius —

sieben Parameter variiert werden k¨

onnen:

RPs

nl (r) := (rlexp{p(r)}f¨

ur r≤rcut

RAE

nl (r) f¨

ur r≥rcut

nl .(3.22)

Diese Funktion kann in die radiale Schr¨

odinger-Gleichung eingesetzt werden, die sich dann

wegen Punkt (ii) nach dem abgeschirmten Pseudopotential

vPs,abg

nl (r) := εnl +1

uPs

nl (r)

d2uPs

nl (r)

dr2−l·(l+ 1)

2r2(3.23)

aufl¨

osen l¨

asst, wobei uPs

nl (r) := r·RPs

nl (r) gesetzt wurde. Daraus ergibt sich das ionische

Pseudopotential durch Abziehen des elektrostatischen (Hartree) Potentials und des Aus-

tausch-Korrelationspotentials:

vPs,ion

nl (r) := vPs,abg

nl (r)−vH[ρPs](r)−vxc[ρPs](r).(3.24)

52 3 Methoden zur numerischen Beschreibung periodischer Systeme

Dabei ist ρPs die Ladungsdichte des Pseudoatoms. Mit Gleichung (3.24) kn¨

upft das Pseu-

dopotentialkonzept an die in Abschnitt 3.4 beschriebene ”N¨

aherung der starren R¨

umpfe”

an, womit aber auch die dort gemachten N¨

aherungsannahmen, insbesondere die Linea-

rit¨

at des Austausch-Korrelationspotentials, ¨

ubernommen werden (vgl. Abschnitt 3.5.3).

Abbildung 3.2 vergleicht schematisch den Verlauf einer Pseudowellenfunktion mit dem

der tats¨

achlichen Wellenfunktion.

Zwischen Norm und logarithmischer Ableitung der Pseudoorbitale besteht folgender

Zusammenhang:

−1

∂

∂ε ∂

∂r ln Rl(r, ε)r=rcut

ε=ε′

l(rcut, ε′)Zrcut

l(r, ε′)dr′,(3.25)

wobei r·Rl(r, ε) die L¨

osung der radialen Schr¨

odinger-Gleichung des Allektronen- oder des

Pseudoatoms f¨

ur eine gegebene Energie εist (nicht notwendigerweise eine Eigenfunktion).

In der N¨

ahe der atomaren Eigenenergien besitzt daher ein normerhaltendes Pseudopoten-

tial die gleichen Streueigenschaften (logarithmische Ableitungen) wie das Allelektronen-

Potential, was eine wichtige Voraussetzung f¨

ur die ¨

Ubertragbarkeit des Pseudopotentials

ist.

Abbildung 3.2: Schematische Darstel-

lung eines tats¨

achlichen Atomorbitals

(durchgezogenen) und eines Pseudoorbi-

tals (gestrichelt) sowie den zugeh¨

origen

Potentialen. rmbezeichnet den Abschnei-

deradius. (Quelle: Ref. 82)

Auch die in dieser Arbeit verwendeten

EXX/OEP-Pseudopotentiale wurden auf diese Wei-

se generiert. Dabei wurde das bereits erw¨

ahn-

te Troullier-Martins-Schema [109] angewandt. Da

allerdings im EXX/OEP-Formalismus der Au-

stauschanteil von vxc[ρ] nicht einfach parametrisch

von ρabh¨

angt, wird bei der Konstruktion der

ionischen EXX/OEP-Pseudopotentiale die OEP-

Gleichung (1.97) f¨

ur das Pseudoatom gel¨

ost (vgl.

S. 62ff. in Ref. 111).

Das Pseudopotential (3.24) h¨

angt von nund l

ab; es gilt daher bei Anwendung auf eine beliebige

Funktion nur f¨

ur jene Komponenten dieser Funk-

tion, die im Raum der atomaren Pseudoorbitale

|nlmimit m∈ {−l, . . . , +l}liegen. Das gesamte io-

nische Pseudopotential kann als Entwicklung nach

den |nlmigeschrieben werden und ist dann durch

die nicht-lokale2Darstellung

VPs,ion := X

n,l,m |nlmivPs,ion

nl (r)hnlm|(3.26)

gegeben3, wobei hr|nlmi=RPs

nl (r)Ylm(θ, φ). Um den

Rechenaufwand zu verringern, beschr¨

ankt man die

Summe ¨

uber nin (3.26) h¨

aufig auf die Valenzscha-

le(n). Sollen auch angeregte Zust¨

ande sehr genau beschrieben werden, m¨

ussen entspre-

chend h¨

ohere nber¨

ucksichtigt werden. Weiter reduzieren l¨

asst sich der Rechenaufwand

mit der nachfolgend skizzierten Methode von Kleinman und Bylander [113,114].

2Wenn in (3.26) nur ¨

uber eine Hauptquantenzahl summiert wird, l¨

asst sich das Pseudopotential auch als

semi-lokales Potential VPs,ion := Pl,m |Ylmi˜vPs,ion

nl (r)hYlm|formulieren. ”Semi-lokal” soll hier bedeuten:

nicht-lokal im Winkelanteil (Integraloperator), aber lokal im Radialteil (Multiplikationsoperator).

3Pr¨

azier formuliert: VPs,ion ist ein Integraloperator, dessen Kern im Ortsraum gegeben ist durch

hr|VPs,ion|r′i:= P

n,l,m

hr|nlmivPs,ion

nl (r)hnlm|r′i.

3.5 Pseudopotentiale 53

3.5.2 Kleinman-Bylander-Darstellung

Soll das Pseudopotential (3.26) in einer Ebene-Wellen-Basis direkt dargestellt werden,

ist der Rechenaufwand proportional zu NG·(NG+ 1)/2, wenn NGdie Anzahl der Ba-

sisfunktionen bezeichnet [113]. Auf eine mit NGann¨

ahernd lineare Skalierung l¨

asst sich

der Aufwand jedoch vermindern, wenn man (3.26) auf eine separable Gestalt bringt, d.h.,

durch eine Linearkombination geeigneter Projektoren P|ξnlmifnlmhξnlm|darstellt. Klein-

man und Bylander [113] konstruierten eine solche Darstellung folgendermaßen:

Zun¨

achst wird (3.26) in einen langreichweitigen lokalen Anteil und eine kurzreichweitige

nicht-lokale Korrektur aufgespalten:

VPs,ion =vlang

lok (r) + ∆Vkurz

nlok =vlang

lok (r) + X

n,l,m |nlmi∆vkurz

nl (r)hnlm|.(3.27)

Hierbei wird ausgenutzt, dass alle Pseudopotentiale (3.24) f¨

ur große rin die gemeinsa-

me Asymptote −Zval/r m¨

unden. Ab einem bestimmten Abschneideradius rcut

nl ist VPs,ion

daher (nahezu) allein durch den lokalen Anteil gegeben. Der nicht-lokale Anteil ist entspre-

chend nur f¨

ur r < rcut von Null verschieden und durch ∆vkurz

nl (r) := vPs,ion

nl (r)−vlang

lok (r) de-

finiert. Auf Grund der Zentrifugalbarriere l·(l+1)/2r2der radialen Schr¨

odinger-Gleichung

werden Elektronen mit hohen Drehimpulsen l”nach außen gedr¨

uckt” und also allein durch

den lokalen Anteil des Pseudopotentials beschrieben, f¨

ur den eine geeignete Komponen-

te vPs,ion

nlok llok der Entwicklung (3.26) benutzt wird. Im nicht-lokalen Anteil kann daher die

Summe auf einige wenige l≤lmax beschr¨

ankt werden. Da vlang

lok die Streueigenschaften

der h¨

oheren Drehimpulskomponenten reproduzieren soll, wird vorzugsweise llok =lmax

gesetzt.

Nach dieser Vorbereitung wird ∆Vkurz

nlok durch das separable Kleinman-Bylander-Pseu-

dopotential

∆VKB := X

n,l,m

∆vkurz

nl |nlmihnlm|∆vkurz

hnlm|∆vkurz

nl |nlmi(3.28)

ersetzt, das gerade so konstruiert ist, dass gilt: ∆VKB|nlmi= ∆Vkurz

nlok |nlmi. Dieser ¨

Uber-

gang kann jedoch zu unphysikalischen ”Geisterzust¨

anden” f¨

uhren, die Energien unterhalb

oder nahe denen der physikalischen Valenzzust¨

ande besitzen [114]. Durch eine geeignete

Wahl der Abschneideradien rcut

nl und der lokalen Komponente llok kann deren Auftreten

jedoch vermieden werden [115].

3.5.3 Nicht-lineare Rumpfkorrektur

Um im Rahmen der ”N¨

aherung der starren R¨

umpfe” (Abschnitt 3.4) Ausdr¨

ucke f¨

ur die

Gesamtenergie sowie das Kohn-Sham-Potential zu erhalten, die allein von der Dichte der

Valenzelektronen abh¨

angen, wird u.a. folgende N¨

aherung vorgenommen, die sich mit Glei-

chung (3.24) auf das Pseudopotentialkonzept ¨

ubertr¨

agt: Es wird unterstellt, dass der Anteil

der elektronischen Wechselwirkung im Kohn-Sham-Potential des betrachteten Atoms li-

near in der Dichte ist und daher f¨

ur Rumpf- und Valenzladungsdichte getrennt berechnet

werden kann. Dies ist exakt jedoch nur f¨

ur den elektrostatischen Anteil erf¨

ullt:

vH[ρ1+ρ2](r) = Zρ1(r′) + ρ2(r′)

|r−r′|d3r′=vH[ρ1](r) + vH[ρ2](r).(3.29)

54 3 Methoden zur numerischen Beschreibung periodischer Systeme

Sowohl f¨

ur das lokale Austauschpotential als auch f¨

ur die Korrelation ist eine analoge

Relation, streng formal gesehen, nicht g¨

ultig. Die Potentiale beider Wechselwirkungen

sind nicht-linear; im Allgemeinen gilt daher

vx[ρ1+ρ2](r)6=vx[ρ1](r) + vx[ρ2](r) (3.30)

vc[ρ1+ρ2](r)6=vc[ρ1](r) + vc[ρ2](r).(3.31)

Diese Nicht-Linearit¨

at kann zu Fehlern f¨

uhren, wenn die Ladungsdichten der Rumpf- und

der Valenzzust¨

ande r¨

aumlich nicht mehr hinreichend voneinander getrennt sind, wie es

beispielsweise bei Elementen mit nur wenigen Elektronen in der Valenzschale oft der Fall

ist (Alkalimetalle). Man kann dann allerdings versuchen, eine so genannte ”nicht-lineare

Rumpfkorrektur” (engl.: non-linear core correction —”nlcc”) [104,105,115] vorzuneh-

men. Die dahinter stehende Idee ist, im Austausch-Korrelationspotential nun wieder die

gesamte Ladungsdichte zu benutzen, und nicht nur — wie in Gleichung (3.19) — die

Valenzladungsdichte. Die Gesamtladungsdichte ist dabei n¨

aherungsweise durch die Sum-

me der (atomaren) Rumpfladungsdichten und der Valenzladungsdichte gegeben. Da die

Rumpfladungsdichte allerdings stark lokalisiert und oszillierend ist, l¨

asst sie sich nicht ef-

fektiv im Rahmen einer Ebene-Wellen-Darstellung beschreiben. Sie wird daher durch eine

so genannte ”partielle Rumpfladungsdichte” (engl.: partial core density) ˜ρRersetzt, die im

chemisch relevanten Bereich außerhalb eines geeigneten Radius rnlcc die echte Rumpfla-

dungsdichte ρRreproduziert, innerhalb von rnlcc jedoch durch eine leichter fouriertrans-

formierbare Funktion gegeben ist:

˜ρR(r) := (ρR(r) f¨

ur r≥rnlcc

b(r)ρR(r) f¨

ur r < rnlcc, mit geeignetem b(r)≤1.(3.32)

Damit wird das Austausch-Korrelationspotential wie folgt ”linearisiert”:

vxc[ρR+ρV]≈vxc[˜ρR+ρV] + (vxc[ρR+ρV]−vxc[˜ρR+ρV])

|{z }

=: f

∆vxc[ρV, ρR,˜ρR]

.(3.33)

In der Kohn-Sham-Gleichung f¨

ur mehrere Atome wird dann vxc[˜ρSP

R+ρ] anstelle von vxc[ρ]

verwendet (wobei ˜ρSP

Rdie Superposition der festen atomaren partiellen Rumpfladungsdich-

ten bezeichnen soll und ρdie Dichte aller explizit ber¨

ucksichtigten Elektronen sei), und die

Ionenpotentiale sind gegeben, indem in Gleichung (3.20) entsprechend ∆vxc[ρR, ρV] durch

∆vxc[ρV, ρR,˜ρR] ersetzt wird. Es l¨

asst sich ˜ρRalso als Kontrollparameter auffassen [105],

der im Falle ˜ρR:= ρRdie Rumpf-Valenz-Austauschwechselwirkung exakt beschreibt (zu-

mindest f¨

ur das Pseudoatom), im Falle ˜ρR:= 0 hingegen in die in Abschnitt 3.4 beschrie-

bene N¨

aherung der starren R¨

umpfe ohne die nicht-lineare Rumpfkorrektur ¨

ubergeht. Im

Zusammenhang mit dem Pseudopotentialkonzept folgt dann, dass die Gleichung (3.24) f¨

den radialen Anteil des ionischen Pseudopotentials in

vPs,ion

nl (r) := vPs,abg

nl (r)−vH[ρPs](r)−vxc[˜ρR+ρPs](r) (3.34)

abge¨

andert werden muss.

Kapitel 4

Implementierung

Im vorangehenden Kapitel wurden grundlegende Techniken zur Beschreibung periodischer

Systeme, insbesondere mit Hilfe ebener Wellen in Verbindung mit Pseudopotentialen,

dargestellt. Darauf aufbauend soll nun die im Rahmen dieser Arbeit durchgef¨

uhrte nu-

merische Realisierung der variationellen EXX-Methode (varEXX) mit dem Ebene-Wellen-

Pseudopotential-Code S/PHI/nX [81,82] dokumentiert werden. Gem¨

aß Kapitel 2sind

die beiden Schl¨

usselpunkte der Methode: (i) die L¨

osung der Sternheimer-Gleichung (2.2)

und (ii) die Minimierung der induzierten Ladungsdichte (2.4). In den folgenden drei Ab-

schnitten 4.1 bis 4.3 werden daher zun¨

achst numerische Verfahren (Minimierungs- und

Mixing-Techniken) zur effizienten Behandlung dieser Aufgaben vorgestellt und — wo not-

wendig — an die speziellen Erfordernisse von varEXX angepasst. Eine weitere Schwie-

rigkeit stellt die Auswertung des nicht-lokalen Austauschoperators (1.27) dar, die in Ab-

schnitt 4.4 besprochen wird. Im Anschluss daran werden die Einzelschritte dann zu einem

iterativen Zyklus zusammengesetzt, der aus einer ”inneren Schleife” besteht, die das exak-

te Austauschpotential einer gegebenen Dichte berechnet, und einer ”¨

außeren”, in der die

Kohn-Sham-Gleichung selbstkonsistent gel¨

ost wird (Abschnitt 4.5). Abschließend wird ein

N¨

aherungsansatz f¨

ur das EXX-Verfahren vorgestellt, der sowohl bei der urspr¨

unglichen

Formulierung (stEXX) als auch bei der variationellen Formulierung (varEXX) angewandt

werden kann und in beiden F¨

allen eine drastische Reduktion des numerischen Aufwands

erm¨

oglicht, zugleich aber Bandstrukturen liefert, die sehr gut mit jenen einer exakten

Rechnung ¨

ubereinstimmen (Abschnitt 4.6).

4.1 Die Sternheimer-Gleichung

Wie in Abschnitt 2.3 bereits ausgef¨

uhrt, l¨

asst sich die Berechnung der Greenschen Funk-

tion Gi, also die explizite Umkehrung von H0−ε0

iim Orthogonalraum zu ε0

i, durch die

Verwendung der Sternheimer-Gleichung (2.2) ersetzen, die dann ”variationell” gel¨

ost wird.

Der Vorteil ist, dass zur Darstellung der linearen Korrekturfunktionen ψ1

ikeine unbesetz-

ten Zust¨

ande mehr ben¨

otigt werden. Der Bedarf an Speicherplatz zur Berechnung der

induzierten Ladungsdichte liegt damit in der gleichen Gr¨

oßenordnung wie der zur Berech-

nung der Grundzustandsladungsdichte, wenn man von der St¨

orung, im Wesentlichen also

dem nicht-lokalen Austauschoperator, einmal absieht. Andererseits gewinnt man auch hin-

sichtlich der Rechenzeit: Wie das Folgende zeigt, l¨

asst sich mit geeigneten Methoden ein

erheblich besseres Skalierungsverhalten der CPU-Zeit erzielen als beim Greensfunktion-

Ansatz.

Als Variationsmethoden eignen sich Minimierungsverfahren, zwei der gebr¨

auchlichsten

56 4 Implementierung

wurden dazu in dieser Arbeit implementiert: das Verfahren des steilsten Abstiegs und

das zumeist effizientere Verfahren der konjugierten Gradienten. Die Effizienz beider l¨

asst

sich mit Hilfe einer so genannten Pr¨

akonditionierung nochmals steigern. Jedoch lassen

sich diese Methoden nicht unmittelbar auf die Sternheimer-Gleichung anwenden — daf¨

sind zun¨

achst einige Vorbetrachtungen notwendig, die im Folgenden diskutiert werden

sollen. Recht detaillierte Erg¨

anzungen dazu sowohl in praktischer als auch in theoretischer

Hinsicht finden sich in Anhang C.

4.1.1 Numerische L¨

osung der Sternheimer-Gleichung: Umformulierung

in ein Minimierungs-Problem

Die Sternheimer-Gleichung ist die Grundgleichung der Rayleigh-Schr¨

odingerschen St¨

rungstheorie in 1. Ordnung:

(H0−ε0

i)|ψ1

ii+ (H1−ε1

i)|ψ0

ii= 0 .(4.1)

Hier bezeichne H0den Hamilton-Operator eines ungest¨

orten Systems mit den bekann-

ten Eigenenergien ε0

iund Eigenfunktionen ψ0

i, dem eine durch H1beschriebene St¨

orung

aufgeschaltet sei. Die linearen Korrekturfunktionen seien durch die ψ1

ibeschrieben. Es

erweist sich als bequem, ψ1

iorthogonal zum Eigenraum von ε0

ianzusetzen.1Die Energie-

korrektur ε1

iergibt sich, indem die Sternheimer-Gleichung von links mit hψ0

i|multipliziert

wird:

ε1

i=hψ0

i|H1|ψ0

ii.(4.2)

Numerisch, d.h., in einer endlichen Basisdarstellung, ist die Sternheimer-Gleichung ein

unterbestimmtes2System mgekoppelter linearer Gleichungen in mVariablen. Bei der Be-

schreibung der hier untersuchten Materialien mit ebenen Wellen (vgl. Abschnitt 3.3) liegt

die Anzahl mder ben¨

otigten ”(G+k)-Vektoren” typischerweise in einer Gr¨

oßenordnung

zwischen 102und 104. Bei einer direkten Diagonalisierung von (H0−ε0

i), was der Be-

stimmung der Greenschen Funktion (B.11) entspricht, skaliert die Anzahl der ben¨

otigten

Fließkommaoperationen proportional zu m3. Eine geeignete Strategie bei so aufwendi-

gen Gleichungssystemen ist, das Problem als Minimierungsaufgabe zu formulieren. F¨

deren L¨

osung gibt es dann Verfahren, die proportional zu m2skalieren. Sie werden in

Abschnitt 4.1.2 besprochen.

Gesucht ist also (f¨

ur jedes i) ein Funktional, das eine (Probe-)Korrekturfunktion auf

eine reelle Zahl abbildet, also ein Ei:H → IR ; ψ1

i7→ Ei[ψ1

i] (H: Hilbertraum der Ein-

Teilchenzust¨

ande), und das genau f¨

ur jenes ψ1

iminimal wird, das L¨

osung der Sternheimer-

Gleichung ist. Eine M¨

oglichkeit, ein solches Funktional zu konstruieren, ist, auf beiden

Seiten von (4.1) das Betragsquadrat zu bilden. Auf der rechten Seite steht dann die (reelle

Zahl) 0 und auf der linken ergibt sich unmittelbar ein Funktional von ψ1

iin der gesuchten

Form. Dies funktioniert f¨

ur alle auf Hdefinierten Operatoren H0, also auch f¨

ur solche, die

1Die Sternheimer-Gleichung (4.1) besitzt, falls sie l¨

osbar ist, im Allgemeinen keine eindeutige L¨

osung.

Denn ist ψ1

iL¨

osung der Sternheimer-Gleichung, so ist z.B. auch ψ1

i+λψ0

imit jedem λ∈CL¨

osung. Durch

die zus¨

atzliche Forderung der Orthogonalit¨

at von ψ1

izum Eigenraum von ε0

iwird aus dem L¨

osungsraum

ein eindeutiges Element ausgew¨

ahlt. Man beachte, dass (4.2) nicht von der speziellen Wahl des Winkels

zwischen Original- und Korrekturfunktion abh¨

angt.

2(H0−ε0

i) besitzt einen Nullraum, den Eigenraum zu ε0

i, und kann folglich in m-dimensionaler Basis-

darstellung h¨

ochstens vom Rang m−1 sein.

4.1 Die Sternheimer-Gleichung 57

nicht hermitesch sind.3F¨

ur den in dieser Arbeit relevanten Fall eines hermiteschen Ope-

rators H0l¨

asst sich das Funktional aber noch auf elegantere Weise konstruieren, n¨

amlich

so, dass der f¨

ur die Minimierung ben¨

otigte Gradient gerade durch die linke Seite der

Sternheimer-Gleichung gegeben ist. Das Funktional ist dann gewissermaßen die Stamm-

funktion von (4.1):

Ei[ψ1

i] := 1

2hψ1

i|(H0−ε0

i)|ψ1

ii+ Re hψ1

i|(H1−ε1

i)|ψ0

ii.(4.3)

Die Richtung des steilsten Anstiegs ist dabei durch

2δEi[ψ1

δ(ψ1

i)∗= (H0−ε0

i)|ψ1

ii+ (H1−ε1

i)|ψ0

ii(4.4)

gegeben. Hier wurde benutzt, dass dazu gem¨

aß der (Variations-)Ableitung im Komplexen

ψ1

iund (ψ1

i)∗formal als unabh¨

angige Vektoren aufzufassen sind. Die Differentiation erfolgt

nur nach der konjugiert-komplexen Funktion (ψ1

i)∗, daf¨

ur ist allerdings noch mit einem

Faktor 2 zu multiplizieren, vgl. z.B. Ref. 126. Die Sternheimer-Gleichung l¨

asst sich damit

auch so formulieren:

δEi[ψ1

δ(ψ1

i)∗= 0 ,(4.5)

d.h., L¨

osungen der Sternheimer-Gleichung lassen das in (4.3) angegebene Funktional stati-

on¨

ar werden. Das Funktional hat die Dimension einer Energie und stellt eine quadratische

Form in ψ1

idar. Die tiefere Begr¨

undung daf¨

ur ist, dass es sich als eine Art Ritzsches Varia-

tionsprinzip f¨

ur die Korrekturfunktion auffassen l¨

asst. Dies ist in Anhang C.1 ausgef¨

uhrt.

Bevor die oben erw¨

ahnten numerischen Algorithmen eingesetzt werden k¨

onnen, um stati-

on¨

are Punkte von Eiaufzusp¨

uren, muss allerdings zun¨

achst klar sein, ob es sich dort um

ein Minumum, ein Maximum oder einen Sattelpunkt handelt. Wie in Ref. 78 gezeigt, l¨

asst

sich der Hilbertraum Hin drei Bereiche H−,H0und H+untergliedern, f¨

ur die gilt:

hψ|(H0−ε0

i)|ψi<0 f¨

ur ψ∈ H−\{0}mit H−:= span{ψ0

j|ε0

j< ε0

i},(4.6)

hψ|(H0−ε0

i)|ψi= 0 f¨

ur ψ∈ H0mit H0:= span{ψ0

j|ε0

j=ε0

i},(4.7)

hψ|(H0−ε0

i)|ψi>0 f¨

ur ψ∈ H+\{0}mit H+:= span{ψ0

j|ε0

j> ε0

i}.(4.8)

Im linearen Teilraum H+ist (H0−ε0

i) also positiv definit4, und Eibesitzt dort folglich

ein eindeutiges Minimum. In H−ist (H0−ε0

i) hingegen negativ definit, so dass Eidort

ein eindeutiges Maximum aufweist. Falls die Sternheimer-Gleichung eine L¨

osung besitzt,

wird es sich dabei also im Allgemeinen — außer, wenn ε0

idie tiefste Eigenenergie von H0

ist — um einen Sattelpunkt von Eihandeln, vgl. Abb. 4.1. Der Teilraum H0schließlich

ist der Eigenraum von ε0

i. Hier reduziert sich Eiwegen (4.7) auf ein lineares Funktional

von ψ1

i, dessen Gradient (4.4) durch den konstanten Vektor (H1−ε1

i)|ψ0

iigegeben ist. Je

nachdem, ob dieser Vektor verschwindet oder nicht, ist die Sternheimer-Gleichung (4.5)

3Dieser Fall ist realistisch: Ist H0beispielsweise der Hamilton-Operator eines kugelsymmetrischen Sy-

stems (Atom) in Ortsdarstellung, wobei die Radialanteile der Wellenfunktionen mit Hilfe einer Basis loga-

rithmischer St¨

utzstellen beschrieben werden sollen, ist das (diskretisierte) H0nicht mehr hermitesch. Dies

wird — quasi als Nachtrag zur Diplomarbeit [78] — in Anhang C.3 diskutiert.

4Ein auf einem Hilbertraum Herkl¨

arter linearer Operator Aheißt genau dann ”positiv definit”, wenn

gilt: hψ|A|ψi>0 f¨

ur alle ψ∈ H\{0}. Analog ist ”negativ definit” definiert, indem ”>” durch ”<” ersetzt

wird. Ist die 2. (Variations-)Ableitung eines Funktionals an einer Stelle durch einen positiv/negativ definiten

Operator gegeben, besitzt es dort ein Minimum/Maximum. Die 2. Ableitung von Eiist (H0−ε0

i).

58 4 Implementierung

),( yxE

),( minmax yx

),( yx

Abbildung 4.1: Dargestellt ist ein Paraboloid zur Gleichung E(x, y) := a11x2+a22y2+b1x+b2y+const.

mit a11<0und a22>0. Bei (xmax, ymin)hat Eeinen Sattelpunkt. Die x-Achse entspricht hier dem

linearen Teilraum H−und die y-Achse dem Teilraum H+in (4.6) bzw. (4.8). Aus der Zeichnung erkennt

man, dass wegen H−⊥H+die Extremwertbestimmung in den beiden Teilr¨

aumen separat durchgef¨

uhrt

werden kann. Zur Bestimmung der induzierten Ladungsdichte ist jedoch nur der Teilraum H+relevant.

also in ganz H=H−⊕H0⊕ H+l¨

osbar oder nicht. Ist sie l¨

osbar, ist der L¨

osungsraum

durch alle

ψ1

i=φmax +φ0+φmin mit 









φmax ∈ H−, Ei[φmax] = max

H−{Ei[φ]}

φmin ∈ H+, Ei[φmin] = min

H+{Ei[φ]}

φ0∈ H0

(4.9)

gegeben. φmax und φmin lassen sich analytisch ¨

uber die Projektion der Greenschen Funktion

(B.11) auf H−bzw. H+darstellen:

φmax =X

ε0

j<ε0

ψ0

jhψ0

j|H1|ψ0

ε0

i−ε0

, φmin =X

ε0

j>ε0

ψ0

jhψ0

j|H1|ψ0

ε0

i−ε0

.(4.10)

Wird die Sternheimer-Gleichung nur f¨

ur die Valenzzust¨

ande gel¨

ost — dies ist im variatio-

nellen EXX-Verfahren der Fall (vgl. Abschnitt 2.1) —, gehen im Gegensatz zur Darstellung

von φmin bei φmax nur Zust¨

ande und Energien von Valenzelektronen ein. Die Berechnung

von φmax ¨

uber (4.10) wird daher in der Regel effizienter sein als mit einem Variationsver-

fahren.

Die Frage nach der L¨

osbarkeit der Sternheimer-Gleichung h¨

angt unmittelbar damit

zusammen, ob das ungest¨

orte System Entartungen aufweist oder nicht. Dies ist in An-

hang C.2 genauer ausgef¨

uhrt. Dabei zeigt sich: Ist der Eigenwert ε0

inicht entartet, ist

die Sternheimer-Gleichung (4.1) stets l¨

osbar. Im Falle einer Entartung des ungest¨

orten

Systems gilt dies jedoch nicht, und entsprechend besitzt das Funktional (4.3) im Allge-

meinen keinen station¨

aren Punkt! Tats¨

achlich hat man es in der Praxis aber vielfach mit

entarteten Systemen zu tun. So ist bei vielen Halbleitern (etwa bei den hier untersuchten

Materialien GaAs, GaN, InN) das oberste Valenzband am Γ-Punkt dreifach entartet. Ist

H0der Kohn-Sham-Operator eines LDA-Systems, verschwindet zudem in einigen F¨

allen

(z.B. InN, Ge) f¨

alschlicherweise die Bandl¨

ucke, wodurch sich der Entartungsgrad nochmals

4.1 Die Sternheimer-Gleichung 59

erh¨

ohen kann.5Typischerweise weisen aber nicht nur Hochsymmetriepunkte, sondern gan-

ze Bereiche der Brillouin-Zone Entartungen auf. Daher l¨

asst sich das Problem auch in einer

geeignet diskretisierten Brillouin-Zone (z.B. mit dem Monkhorst-Pack-Verfahren [96], vgl.

Abschnitt 3.2), in der Hochsymmetriepunkte ¨

ublicherweise vermieden werden, nicht um-

gehen.

Im Prinzip ließe sich nun diese Schwierigkeit auf analoge Weise behandeln wie in der

entarteten St¨

orungstheorie, n¨

amlich durch Diagonalisierung von H1(vgl. Anhang C.2).

Es zeigt sich jedoch, dass im variationellen EXX-Verfahren die gesamte L¨

osung ψ1

ider

Sternheimer-Gleichung gar nicht ben¨

otigt wird: Zur Berechnung der induzierten Ladungs-

dichte ist n¨

amlich nur der Anteil von ψ1

irelevant, der im Hilbertraum Hcder unbesetzten

Zust¨

ande liegt. Alle Komponenten in Richtung besetzter Zust¨

ande k¨

onnen dagegen belie-

big gew¨

ahlt werden, also etwa durch Projektion gleich Null gesetzt werden. Bezeichnet Pc

den Projektionsoperator auf Hc, kann statt (2.4) also auch

∆ρ=

occ

(ψ0

i)∗Pcψ1

i+ c.c. (4.11)

verwendet werden. Dies liegt daran, dass sich in ∆ρder Anteil der Korrektur in Rich-

tung der Valenzzust¨

ande gerade herausk¨

urzt, wie es sich analog auch im Standard-EXX-

Verfahren ergibt, vgl. Abschnitt 2.2. Physikalisch bedeutet dies, dass die Ladungsdichte

zumindest in linearer Ordnung nicht auf eine St¨

orung reagiert, die nur besetzte Zust¨

ande

untereinander koppelt [85]. Pcψ1

iist L¨

osung der ”vereinfachten” Sternheimer-Gleichung

Pc(H0−ε0

i)|ψ1

ii+ (H1−ε1

i)|ψ0

ii= (H0−ε0

i)Pc|ψ1

ii+PcH1|ψ0

ii= 0 .(4.12)

Hier wurde [Pc, H0] = 0 und Pcψ0

i= 0 f¨

ur i∈ {1,...,N}benutzt. Gegen¨

uber (4.1) hat

diese Gleichung numerisch einige Vorteile: (i) Es ist nicht mehr notwendig, die Energiekor-

rektur ε1

izu berechen. (ii) Pcψ1

iist das eindeutige Minimum von (4.3) in Hc, da Hc⊂ H+,

d.h., die aufwendige Kombination von Maximierung und Minimierung zur Bestimmung

des Sattelpunkts ψ1

ientf¨

allt. Im Falle einer Entartung schließlich muss (iii) nicht mehr der

Eigenraum zu ε0

iermittelt werden, (iv) entf¨

allt die sonst notwendige Diagonalisierung von

H1, vgl. Anhang C.2, und (v) ist nicht mehr zu entscheiden, wann ein Eigenwert ¨

uber-

haupt entartet ist oder nicht, was numerisch nur durch Vergleichen der Differenz zweier

Eigenwerte mit einem kleinen, aber letztlich willk¨

urlich festgelegten Parameter δm¨

oglich

w¨

are.

4.1.2 Minimierungsverfahren

Die beiden im Folgenden vorgestellten Verfahren, Steepest Descent und Conjugate Gra-

dient, sind f¨

ur die Minimierung einer quadratischen Form konzipiert und damit f¨

ur die

Anwendung auf das Energiefunktional (4.3) besonders geeignet. Besitzt eine (mindestens

2-mal stetig differenzierbare, reellwertige) Funktion ein Minimum bei x, kann jedoch die

Umgebung von xin vielen F¨

allen6durch eine quadratische Form approximiert werden

(Taylorentwicklung); daher sind Steepest Descent und Conjugate Gradient ganz generell

Standardmethoden zur numerischen Minimierung.

5In LDA wird die Bandl¨

ucke also in einigen F¨

allen so stark untersch¨

atzt, dass das System metallisch

erscheint (vgl. auch Abb. 1und 2). Der EXX-Formalismus w¨

are dann durch Einf¨

uhrung einer Fermi-

Funktion geeignet zu verallgemeinern.

62-malige stetige Differenzierbarkeit ist notwendige Voraussetzung f¨

ur eine Taylorentwicklung der Funk-

tion bis zum 2. Grad, sie ist allerdings nicht hinreichend, vgl. z.B. Ref. 123. Die meisten in der Physik

relevanten Funktionen sind jedoch taylorentwickelbar.

60 4 Implementierung

VorgabeeinesStartpunkts

Residuum(direkt)

bxr --= kk A

optimaleSchrittweite

Linienminimierung

Residuum(indirekt)

Projektionaufden Teilraum U:

kUk Prr =

teilbardurch?

Abbruchkriterium

min

xx »

Ende

1+¬ kk

11min,1 --- -= kkkk Arrr l

UÎ

kArr

min, =l

kkkk rxx ~

min,1 l+=

nein

Flussdiagramm 4.1: Die Methode des steilsten Abstiegs (optimiert). Der Iterationszyklus wird beendet,

sobald das Residuum kleiner als δist. Der Projektionsschritt und die Startbedingung x0∈Uentfallen,

wenn die Minimierung nicht auf den linearen Teilraum Ubeschr¨

ankt sein soll. Werden viele Iterationen

ben¨

otigt, empfiehlt es sich, alle q(z.B. q > 10) Iterationen das Residuum direkt ¨

uber den Gradienten

zu berechnen, um eine Akkumulation numerischer Rundungsfehler zu vermeiden.

Eine Wellenfunktion ψ∈ Hwird numerisch im Allgemeinen durch einen Vektor x∈Cm

beschrieben, wobei mdie Gr¨

oße des verwendeten Basissatzes ist. In ebenen Wellen bei-

spielsweise entsprechen die Elemente von xden Fourierkoeffizienten cnk(G) von Glei-

chung (3.16). Deshalb muss die Minimierung hier im Cmbetrachtet werden. Sei also A

eine hermitesche, positiv definite (m×m)-Matrix und bein Vektor in Cm. Dann ist durch

F:Cm−→ IR ; x7−→ 1

2hx|A|xi+1

2hx|bi+1

2hb|xi(4.13)

oder ausgeschrieben

F(x1,...,xm) := 1

i=1

j=1

x∗

ia∗

ij xj+1

i=1

x∗

ibi+1

i=1

b∗

ixi(4.14)

eine quadratische Form definiert, deren Gradient durch

∇F(x) = Ax+bmit ∇iF(x) := 2 ∂

∂x∗

F(x) =

j=1

a∗

ij xj+bi(4.15)

gegeben ist. Zur Definition der Ableitung im Komplexen vgl. Ref. 126. Ein intuitives

Verst¨

andnis der Methoden kann man erhalten, wenn man sich Fals einen von zwei reellen

Variablen abh¨

angenden Paraboloiden vorstellt, der in der Ebene durch elliptische H¨

ohen-

linien veranschaulicht werden kann. Dies wird im Folgenden zur Veranschaulichung der

Methoden benutzt. Die Darstellung orientiert sich dabei an der von Shewchuk [131].

4.1.2.1 Methode des steilsten Abstiegs (Steepest Descent)

Die Idee dieser Methode ist, von einem beliebigen Startpunkt x0∈Cmaus so lange

der Richtung des steilsten Abstiegs, also −∇F(x0), zu folgen, bis man entlang dieser

4.1 Die Sternheimer-Gleichung 61

- 4 - 2 2 4 x1

- 4

- 2

k=10 (a)

- 4 - 2 2 4 x1

- 4

- 2

k=10 (b)

- 4 - 2 2 4 x1

- 4

- 2

k=2 (c)

- 4 - 2 2 4 x1

- 4

- 2

k=2 (d)

Abbildung 4.2: Konvergenzverhalten der Methode des steilsten Abstiegs in Abh¨

angigkeit von der

Konditionierung κund dem Startpunkt. (a) Großes κ, g¨

unstige Wahl des Startpunkts. (b) Großes κ,

ung¨

unstiger Startpunkt: Die Methode ben¨

otigt in dem schmalen Tal viele Schritte, um das Minimum zu

finden. In (c) und (d) sind die Startpunkte jeweils wie dar¨

uberliegend gew¨

ahlt, aber κist klein. Auch mit

einem schlechten Startpunkt ist die Konvergenz schnell. Bei der idealen Konditionierung κ= 1 w¨

aren

die H¨

ohenlinien Kreise, und das Minimum w¨

are in einem einzigen Schritt erreicht. Nach Ref. 131.

Linie das Minimum x1erreicht hat. In x1bestimmt man erneut den Gradienten und

wiederholt diesen Prozess iterativ so oft, bis man dicht genug ans Minimum xmin gelangt

ist. Am Minimum selbst verschwindet der Gradient, so dass ”dicht genug” z.B. ¨

uber ein

Abbruchkriterium definiert werden kann, das den Prozess beendet, sobald die Steigung

eine bestimmte Untergrenze δerreicht hat. Die Punkte xkdefinieren eine Folge, die im

Prinzip ins exakte Minimum konvergiert:

lim

k→∞ xk−→ xmin .(4.16)

Der Fehler des k-ten Schrittes ist durch ek:= xk−xmin gegeben. Damit kann der negative

Gradient, in diesem Kontext auch als Residuum (Rest) bezeichnet, auch als Anwendung

von Aauf den Fehler interpretiert werden:

rk:= −∇F(xk) = −Axk−b=−Axk+Axmin =−Aek.(4.17)

62 4 Implementierung

Steepest Descent gibt es in zwei Varianten: Beim ”einfachen” Steepest Descent erh¨

alt man

die Folge der xk¨

uber die Rekursion

xk+1 =xk+λrk(4.18)

mit einer konstanten Schrittweite λ. Dies konvergiert f¨

0< λ < αmin

2(4.19)

mit dem kleinsten Eigenwert αmin von A, was aus (4.18) und der Forderung kxk+1−xmink<

kxk−xminkfolgt.

Schneller konvergiert das ”optimierte” Steepest-Descent-Verfahren: Hier wird zun¨

achst

die optimale Schrittweite λmin,k bestimmt, die Fentlang der Linie x=xk+λrk(λ∈IR)

minimiert. Sie ergibt sich, indem die Ableitung von Fentlang dieser Linie zu 0 gesetzt

wird,

dλF(xk+λrk)λ=λmin,k

= 0 ,

woraus nach Anwendung der Kettenregel und Einsetzen von (4.17)

λmin,k =hrk|rki

hrk|A|rki(4.20)

folgt. Dies ist reell, da ein hermitesches Avorausgesetzt wurde. Die Folge der xkergibt

sich dann aus

xk+1 =xk+λmin,k rk.(4.21)

In dieser Form ben¨

otigt das optimierte Steepest Descent jedoch noch zwei Matrix-Vektor-

Multiplikationen pro Iteration, n¨

amlich Axkin (4.17) und Arkin (4.20). Die erste davon

l¨

asst sich eliminieren, indem man (4.21) durch Multiplikation mit −Aund Subtraktion

von betwas umformt:

rk+1 =rk−λmin,k Ark.(4.22)

Das Skalierungsverhalten, dominiert von den m2Fließkommaoperationen der Matrix-Vek-

tor-Multiplikation, verbessert sich so um einen Faktor 2. Da das Residuum dann allerdings

nicht mehr direkt berechnet wird, k¨

onnen Rundungsfehler auftreten, so dass es sich emp-

fiehlt, nach einer bestimmten Anzahl von Iterationen (4.21) zu benutzen.

Bei der Anwendung von Steepest Descent auf die Sternheimer-Gleichung ist zu beach-

ten, dass die Minimierung nur in einem bestimmten Unterraum U⊂Cmdurchgef¨

uhrt

wird, der dem Teilraum Hcaus Abschnitt 4.1.1 entspricht. Dies l¨

asst sich erreichen, indem

(i) ein Startpunkt x0∈Ugew¨

ahlt wird und (ii) in (4.21) nur der Anteil des Residuums in U

benutzt wird, also ˜

rk:= PUrk=−PU∇F(xk) anstelle von rk, wobei PUder Projektor auf

Uist. Die Projektion ist numerisch unproblematisch (skaliert linear mit m), da sie gem¨

aß

(4.12) eine Orthogonalisierung zu den besetzten Zust¨

anden darstellt. Flussdiagramm 4.1

zeigt schematisch den Ablauf des Algorithmus.

Das Verfahren ist jedoch nur f¨

ur gut konditionierte Funktionen geeignet. Dabei be-

stimmt das Verh¨

altnis des gr¨

oßten Eigenwerts αmax zum kleinsten Eigenwert αmin der

Matrix Adie Konditionierungszahl κ:= αmax/αmin. Ist κsehr groß, hat Fdie Gestalt ei-

nes schmalen Tals, und Steepest Descent konvergiert bei ung¨

unstiger Wahl des Startpunkts

4.1 Die Sternheimer-Gleichung 63

-2 -1 1 2

-4

-3

-2

-1

xmin

(a)

-2 -1 1 2

-2

-1

xmin

(b)

Abbildung 4.3: (a) Paraboloid mit kreisf¨

ormigen H¨

ohenlinien: F1(x) := x2=xT1 0

0 1x. F¨

uhrt man

Linienminimierungen entlang zweier orthogonaler, aber sonst beliebiger Richtungen s1,s2aus, gelangt

man ins Minimum. (b) zeigt eine um den Faktor 2 gestauchte Kopie von (a); die Ellipsen kennzeichnen

jetzt den Paraboloiden F2(x) := xTAxmit A=1 0

0 1/4. Alle rechten Winkel in (a) sind dabei in

A-orthogonale Winkel ¨

uberf¨

uhrt worden, zur Illustration sind einige Pfeilpaare mit eingezeichnet. Nun

f¨

uhren Linienminimierungen entlang zweier beliebiger A-orthogonaler Richtungen ins Ziel. Man beachte,

dass beim Conjugate-Gradient-Verfahren im Unterschied zu hier die erste Linienminimierung immer in

Richtung des Gradienten erfolgt, vgl. Abb. 4.4 (b). Vgl. auch Ref. 131.

nur sehr langsam. Abbildung 4.2 illustriert das Konvergenzverhalten in Abh¨

angigkeit von

der Konditionierung und dem Startpunkt.

Im Rahmen der Arbeit wurde die Anwendung der hier vorgestellten Minimierungs-

methoden f¨

ur verschiedene Halbleitermaterialien auf das Energiefunktional (4.3) getestet

(vgl. Abb. 4.5). Tats¨

achlich zeigt dabei Steepest Descent ein nur sehr langsames Konver-

genzverhalten. Im Falle von InN etwa werden bei einer Abschneideenergie Ecut = 80 Ry

und dem Startpunkt 0 f¨

ur die Korrekturfunktionen ψ1

imehr als 600 Iterationen ben¨

otigt,

um ins Minimum zu gelangen. Eine wesentliche Verbesserung erzielt man mit dem im

Folgenden skizzierten Conjugate-Gradient-Verfahren.

4.1.2.2 Methode der konjugierten Gradienten (Conjugate Gradient)

Der Ansatz dieser Methode nutzt aus, dass die Isooberfl¨

achen F(x) = const. des Hyper-

Paraboloiden (4.13) Hyper-Ellipsoide im Cmsind, die durch geeignete Streckungen/Stau-

chungen entlang ihrer Hauptachsen in die Gestalt einer Hyper-Kugel gebracht werden

64 4 Implementierung

-2 2 4 x1

-1

-2 2 4 x1

-1

(a) (b)

Abbildung 4.4: Minimierung einer quadratischen Funktion im Vergleich: (a) Steepest Descent, (b) Con-

jugate Gradient. Im Gegensatz zu Steepest Descent findet Conjugate Gradient bei einem m-dimen-

sionalen Problem in mSchritten ins Minimum (hier m= 2). Der erste Schritt ist in beiden Verfahren

durch den Gradienten gegeben und daher identisch. Nach Ref. 131.

k¨

onnen. Legt man nun eine kartesische Basis {s1,...,sm}durch den Cm, gelangt man mit

maximal mSchritten ins Minimum xmin der Kugel, wenn f¨

ur jede Richtung skgenau eine

Linienminimierung durchgef¨

uhrt wird. Mit einem beliebigen Startpunkt x0und m-maliger

Anwendung der Rekursionsformel

xk+1 := xk+λmin,k sk(k∈ {0,...,m−1}) (4.23)

ist also xmin =xmgefunden, wobei durch λ=λmin,k jeweils der Ausdruck F(xk+λsk) mi-

nimiert wird. Dies ist f¨

ur den 2-dimensionalen reellen Fall in Abb. 4.3 (a) veranschaulicht.

Der Vorteil dieser Strategie, die im Falle kugelf¨

ormiger Isofl¨

achen (ideale Konditionierung,

κ= 1) nat¨

urlich sehr uneffizient w¨

are, liegt in ihrer Verallgemeinerbarkeit: ¨

Ahnlich, wie

sich eine Kugel kxk2=hx|xi=const. als Spezialfall der Ellipse hx|A|xi=const. f¨

ur A=1

auffassen l¨

asst, kann auch die Orthogonalit¨

atsrelation hx|x′i= 0 zur ”A-Orthogonalit¨

at”

hx|A|x′i= 0 verallgemeinert werden. A-orthogonale Vektoren werden in diesem Kontext

auch als zueinander konjugiert bezeichnet. Durch eine entsprechende Verallgemeinerung

des Gram-Schmidtschen Orthogonalisierungsverfahrens kann dann aus mbeliebigen linear

unabh¨

angigen Vektoren im Cmeine Basis erzeugt werden, deren Vektoren paarweis A-or-

thogonal zueinander stehen [131]. Benutzt man nun f¨

ur die Suchrichtungen skin (4.23)

anstelle eines rechtwinkligen ein solches A-orthogonales System, findet man, v¨

ollig un-

abh¨

angig von der Konditionierung der Matrix A, das Minimum von (4.13) in maximal m

Schritten. Dies ist in Abb. 4.3 (b) demonstriert.

Die Schwierigkeit dieser Vorgehensweise ist, dass das Gram-Schmidt-Verfahren kubisch

mit der Dimension mskaliert und zudem alle Suchrichtungen {s1,...,sm}im Speicher ge-

halten werden m¨

ussen. Numerisch interessant werden konjugierte Richtungen erst dadurch,

dass in jedem Schritt ein zu allen vorherigen Suchrichtungen konjugierter Vektor auch aus

dem Gradienten von F(dem Residuum (4.17)) konstruiert werden kann, indem dieser

allein zur letzten Suchrichtung A-orthogonalisiert wird [128]. Daraus ergibt sich das in

Flussdiagramm 4.2 gezeigte Schema des Algorithmus. Abbildung 4.4 veranschaulicht den

Vorteil der Methode gegen¨

uber dem Verfahren des steilsten Abstiegs. F¨

ur eine tieferge-

hende Betrachtung der Thematik sei auf die Referenzen 128,129,130,131 verwiesen. Die

zur L¨

osung der Sternheimer-Gleichung ben¨

otigte Restriktion der Minimierung auf einen

Teilraum von Cmkann ebenso leicht wie beim Steepest-Descent-Verfahren erreicht werden.

Sie ist in Flussdiagramm 4.2 mit angegeben.

4.1 Die Sternheimer-Gleichung 65

VorgabeeinesStartpunkts

Schrittweite

Linienminimierung

Residuum

Abbruchkriterium

min

xx »

Ende

1+¬ kk

UÎ

Residuum

bxr --= 00 A

Projektionauf U:

Suchrichtung

~rr U

krr

+=b

kkkk srs 111

~+++ += b

rs =

Gram-Schmidt-Koeffizient

KonjugationdesResiduums

kAss

rr ~~

min, =l

Projektionauf U:

kkkk Asrr min,1

~l-=

~++ =kUk Prr

nein

kkkk sxx min,1 l+=

Flussdiagramm 4.2: Die Methode der konjugierten Gradienten. Bei diesem Verfahren ergibt sich die

Suchrichtung durch Konjugation (A-Orthogonalisierung, vgl. Abb. 4.3) des Gradienten zur vorange-

henden Suchrichtung. Die Projektionen und die Startbedingung x0∈Usind nur notwendig, wenn die

Minimierung auf einen linearen Teilraum Ubeschr¨

ankt sein soll.

In Abb. 4.5 ist das Konvergenzverhalten des Verfahrens bei Anwendung auf das Ener-

giefunktional (4.3) dargestellt. Es zeigt sich eine deutlich Verbesserung im Vergleich zu

Steepest Descent. Je nach Abschneideenergie wurden bei den getesten Materialien (GaAs,

GaN und InN mit Abschneideenergien von 15, 70 bzw. 80 Ry) zwischen 20 und 60 Itera-

tionen f¨

ur die Minimierung ben¨

otigt. Eine weitere Steigerung der Effizienz l¨

asst sich durch

Pr¨

akonditionierung erreichen, was im folgenden Abschnitt kurz umrissen wird.

4.1.2.3 Pr¨

akonditionierung

Der große Vorteil des Konjugierte-Gradienten-Verfahrens, dass n¨

amlich der neue Suchvek-

tor nur durch Konjugation des Gradienten zur letzten Suchrichtung erzeugt wird, macht

das Verfahren in der Praxis aber auch anf¨

allig f¨

ur numerische Rundungsfehler, die sich

bei hochdimensionalen Problemen im Laufe der Zeit akkumulieren k¨

onnen. Gegebenen-

falls werden dadurch mehr als mSchritte f¨

ur die Minimierung ben¨

otigt. Tats¨

achlich m¨

ochte

man bei vielen Anwendungen aber sogar mit deutlich weniger als mSchritten auskommen.

Aus diesem Grund wird das Verfahren im Allgemeinen mit einer so genannten Pr¨

akondi-

tionierung betrieben. Ziel dabei ist, durch eine Transformation von (4.13) und (4.15) die

Konditionierung κ(vgl. Abschnitt 4.1.2.1) des Problems zu verbessern. Mit einer hermite-

66 4 Implementierung

0 10 20 30 40 50 60

Iterationen

10-8

10-6

10-4

10-2

102

104

106

Differenz zum Min. [eV]

0 10 20 30 40 50 60

Iterationen

10-6

10-4

10-2

102

104

Residuum

0 10 20 30 40 50 60

Iterationen

10-8

10-6

10-4

10-2

102

104

106

Differenz zum Min. [eV]

0 10 20 30 40 50 60

Iterationen

10-6

10-4

10-2

102

104

Residuum

0 10 20 30 40 50 60

Iterationen

10-8

10-6

10-4

10-2

102

104

106

Differenz zum Min. [eV]

GaAs GaAs

Steepest Descent

Conjugate Gradient

0 10 20 30 40 50 60

Iterationen

10-6

10-4

10-2

102

104

Residuum

Prec. Conjugate Gradient (Payne)

Prec. Conjugate Gradient (Arias)

GaN GaN

InN

Abbildung 4.5: Iterative Minimierungsmethoden im Vergleich. Die Graphen links zeigen die Abwei-

chung des Energiefunktionals (4.3) von dessen Minimum als Funktion der Iterationsschritte. Rechts

daneben ist, ebenfalls ¨

uber die Anzahl der Iterationen, das Residuum (die linke Seite der Sternheimer-

Gleichung (4.1) im Teilraum der unbesetzten Zust¨

ande) aufgetragen. Die Abschneideenergie betrug

15 Ry f¨

ur GaAs, 70 Ry f¨

ur InN und 80 Ry f¨

ur InN, und Startpunkt f¨

ur die Korrekturfunktionen war 0.

In allen F¨

allen ergibt sich die gleiche Reihenfolge bei der Qualit¨

at der Methoden: Steepest Descent

zeigt ein sehr langsames Konvergenzverhalten. Eine wesentliche Verbesserung erreicht man mit dem

Conjugate-Gradient-Verfahren, dessen Effizienz sich durch geeignete Pr¨

akonditionierungen nochmals

deutlich steigern l¨

asst.

4.1 Die Sternheimer-Gleichung 67

VorgabeeinesStartpunkts

Schrittweite

Linienminimierung

Residuum

Abbruchkriterium

min

xx »

Ende

1+¬ kk

UÎ

Residuum

bxr --= 00 A

Projektoinauf U:

Suchrichtung

Gram-Schmidt-Koeffizient

Konjug.desResiduums

Projektionauf U:

~++ =kUk Prr

nein

rr ~~

min,

kUk Prr =

rs -

=MP

kkkk sxx min,1 l+=

kkkk Asrr min,1

~l-=

kkkUk MP srs 11

~++

++= b

+-=b

Flussdiagramm 4.3: Die Methode der Konjugierten Gradienten mit Pr¨

akonditionierung. M−1ist eine

N¨

aherung f¨

ur die Inverse von A. Im Algorithmus wird nur die Anwendung auf (die Projektion des)

Residuums ben¨

otigt. Wie in den Flussdiagrammen 4.1 und 4.2 sind Projektionen PUeingef¨

ugt, um die

Minimierung auf einen Unterraum Uzu beschr¨

anken.

schen, positiv definiten Matrix Mgilt7

Ax+b= 0 ⇐⇒ M−1Ax+M−1b= 0 .(4.24)

Dabei soll Meine geeignete ”N¨

aherung” von Amit der Eigenschaft κ(M−1A)≪κ(A)

sein, die sich aber deutlich leichter als Aselbst invertieren l¨

asst, z.B. die Matrix der Dia-

gonalelemente von A. Die Schwierigkeit besteht darin, dass die linke Seite dieser Gleichung

im Allgemeinen nicht als Ableitung eines Funktionals analog zu (4.13) dargestellt werden

kann, da M−1Anicht notwendigerweise hermitesch oder positiv definit ist. Als hermi-

tesche und positiv definite Matrix kann jedoch Min der Form M=EE∗faktorisiert

werden, wobei sich Ez.B. aus einer Cholesky-Zerlegung [129] ergibt. Nun haben M−1A

und E−1A(E∗)−1die gleichen Eigenwerte [131] und sind damit gleich gut konditioniert.

Da aber E−1A(E∗)−1hermitesch und positiv definit ist, benutzt man statt (4.24) die

Transformation

Ax+b= 0 ⇐⇒ E−1A(E∗)−1ˆx +E−1b= 0 mit ˆx := E∗x.(4.25)

Die L¨

osung dieser Gleichung ist das Minimum der quadratischen Form

F(x) := 1

2hˆx|E−1A(E∗)−1|ˆxi+1

2hˆx|E−1bi+1

2hE−1b|ˆxi,(4.26)

7Eine positiv definite Matrix ist invertierbar, da alle ihre Eigenwerte positiv sind. Invertierbare Matrizen

wiederum sind bijektive Abbildungen. Damit folgt, dass (4.24) eine ¨

Aquivalenzumformung ist.

68 4 Implementierung

deren Isofl¨

achen — anschaulich geprochen — ”kugelf¨

ormiger” als die des urspr¨

unglichen

Funktionals (4.13) sind. Die Anwendung von Steepest Descent oder Conjugate Gradient

auf ˜

Fkonvergiert folglich schneller als die auf F. In der Praxis muss letztlich weder die

Invertierung von Mnoch die Fakorisierung M=EE∗explizit ausgef¨

uhrt werden, da alle

auftretenden Ausdr¨

ucke so umgestellt werden k¨

onnen, dass nur M−1rkben¨

otigt wird [131].

Es muss folglich noch nicht einmal Mselbst bekannt sein, sondern nur die Anwendung

seiner Inversen auf das Residuum. Der Ablauf des Algorithmus ist in Flussdiagramm 4.3

demonstriert.

In dieser Arbeit wurden zwei Pr¨

akonditionierungen getestet, die urspr¨

unglich f¨

ur die

Diagonalisierung der Kohn-Sham-Gleichung (1.52) in Ebene-Wellen-Darstellung mit Hilfe

des Konjugierte-Gradienten-Verfahrens entwickelt wurden. Beim Ansatz von Teter, Payne

und Allan [130,132] ist M−1im reziproken Raum durch eine Diagonalmatrix gegeben,

hG+k|M−1|G′+ki:= (4.27)

:= δGG′

27 + 18x+ 12x2+ 8x3

27 + 18x+ 12x2+ 8x3+ 16x4mit x:= 1

2|G+k|2

Enk

kin

wobei Enk

kin := hψ0

nk|1

2∇2|ψ0

nkidie kinetische Energie des ungest¨

orten Zustandes ψ0

nkist.

F¨

ur x→0 strebt dieser Ausdruck gegen 1, so dass sich M−1also im Bereich kleiner Wellen-

vektoren ann¨

ahernd wie die Einheitsmatrix verh¨

alt. F¨

ur große xhingegen gehen die Diago-

nalelemente asymptotisch in 1/(2x)¨

uber, d.h., sie werden proportional zu |G+k|−2. Die ur-

spr¨

ungliche Intention dabei ist, die in der reziproken Kohn-Sham-Gleichung (3.15) f¨

ur hohe

Frequenzen gegebene Dominanz der kinetischen Energie wieder auszugleichen. Empirisch

zeigt sich, dass diese Vorgehensweise auch bei der L¨

osung der Sternheimer-Gleichung (4.1)

eine erhebliche Steigerung der Effizienz gegen¨

uber dem Konjugierte-Gradienten-Verfahren

ohne Pr¨

akonditionierung erm¨

oglicht, obwohl der St¨

oroperator H1im Unterschied zu H0

keinen Beitrag der kinetischen Energie enth¨

alt. Bei den untersuchten Systemen konnte die

Anzahl der ben¨

otigten Iterationen so um mehr als 60% reduziert werden, vgl. Abb. 4.5.

Der Vorteil ist dabei umso gr¨

oßer, je h¨

oher die verwendete Abschneideenergie ist.

Als geringf¨

ugig schneller als (4.27) erweist sich der Pr¨

akonditionierer von Ismail-Beigi

und Arias [133]. Die Idee ist dabei ganz ¨

ahnlich wie eben; wieder ist M−1im reziproken

Raum durch eine Diagonalmatrix gegeben, deren Diagonalelemente f¨

ur kleine Wellenvek-

toren n¨

aherungsweise 1, f¨

ur große jedoch proportional zu |G+k|−2sind:

hG+k|M−1|G′+ki:= δGG′

p(x)

1 + x p(x)mit x:= |G+k|2

Ekin/nmax

,(4.28)

wobei

Ekin =

occ.

n,khψ0

nk|1

2∇2|ψ0

nki

die kinetische Energie des ungest¨

orten Systems,

p(x) := 1 + x(1 + x(1 + x(1 + x(1 + x(1 + x(1 + x(1 + x)))))))

ein Polynom 8. Grades und nmax die Anzahl der besetzten B¨

ander ist. Der Vorteil dieses

Pr¨

akonditionierers gegen¨

uber dem von Teter et al. betr¨

agt bei den hier untersuchten Ma-

terialen allerdings nur sehr wenige Iterationsschritte (1 bis 4), vgl. Abb. 4.5. Mit beiden

Methoden l¨

asst sich das Energiefunktional (4.3) in 10 bis 20 Iterationsschritten minimie-

ren. F¨

ur das variationelle EXX-Verfahren ist es daher nicht entscheidend, ob (4.27) oder

(4.28) eingesetzt wird.

4.2 Induzierte Ladungsdichte 69

4.2 Induzierte Ladungsdichte

Im letzten Abschnitt wurde detailliert die L¨

osung der Sternheimer-Gleichung, also die

Berechnung der linearen Korrekturfunktionen ψ1

i, mit Hilfe schneller, iterativer Minimie-

rungsverfahren besprochen. Der n¨

achste Schritt des variationellen EXX-Verfahrens besteht

nun in der Berechnung der induzierten Ladungsdichte ∆ρgem¨

aß Gleichung (2.4). Zur nu-

merischen Auswertung wird sie dabei zweckm¨

aßigerweise in der Form

∆ρ:= 2 Re

occ

(ψ0

i)∗ψ1

i(4.29)

geschrieben. Wird eine Ebene-Wellen-Basis verwendet und die Brillouin-Zonen-Integration

durch eine Summe ¨

uber die k-Punkte eines Monkhorst-Pack-Gitters gen¨

ahert, k¨

onnen ganz

analog zu der in Abschnitt 3.2 f¨

ur die Ladungsdichte ρbeschriebenen Vorgehensweise auch

hier die im System vorhandenen Punktsymmetrien zur Reduktion des k-Punkt-Satzes aus-

genutzt werden. Die Sternheimer-Gleichung (4.12) wird also nur an den Nred Punkten eines

reduzierten k-Punkt-Satzes ausgewertet, und mit den Korrekturfunktionen wird anschlie-

ßend

∆ρunsym := 2 Re

occ

Nred

s=1

wks(ψ0

nks)∗ψ1

nks(4.30)

berechnet. Dabei sollen die wksgeeignete Wichtungen der kssein. Bezeichnet weiter NPS

die Anzahl der Punkttransformationen Siim System, ist die induzierte Dichte in dieser

Basis durch

∆ρsym(r) := 1

NPS

i=1

∆ρunsym(Sir) (4.31)

gegeben. Gem¨

aß dem in Abschnitt 2.1 formulierten Variationsprinzip (2.6) ist es nun das

Ziel, diese Gr¨

oße durch Variieren des lokalen Austauschpotentials zum Verschwinden zu

bringen. Dies gelingt mit den im folgenden Abschnitt beschriebenen ”Mixing”-Verfahren.

Die (nicht-verschwindende) induzierte Ladungsdichte, die sich aus einem nur gen¨

aherten

Austauschpotential wie LDA ergibt, kann dabei physikalisch sehr anschaulich interpretiert

werden, vgl. dazu Abschnitt 6.

4.3 Minimierung der induzierten Ladungsdichte

Der letzte Schritt im variationllen EXX-Verfahren ist die numerische Auswertung des Va-

riationsprinzips (2.6) von Abschnitt 2.1, also die Minimierung der (Norm der) induzierten

Ladungsdichte in Abh¨

angigkeit des lokalen Austauschpotentials:

∆ρ[vx]−→ 0 f¨

ur vx−→ vEXX ,(4.32)

wobei vEXX das exakte Austauschpotential bezeichnen soll. Die Minimierung kann dabei

auf zwei verschiedene Arten geschehen: (i) Bei festgehaltenen Kohn-Sham-Funktionen ψ0

und -energien ε0

ioder aber (ii) bei expliziter Ber¨

ucksichtigung der vx-Abh¨

angigkeit von

ψ0

iund ε0

i. Beide M¨

oglichkeiten werden in dem in dieser Arbeit entwickelten Algorith-

mus verwendet, haben aber verschiedene physikalische Bedeutungen. Um den Unterschied

zu verdeutlichen, soll die Minimierung zun¨

achst kurz theoretisch analysiert werden, im

Anschluss daran werden dann geeignete numerische Methoden er¨

ortert.

70 4 Implementierung

Zu Punkt (i): Der ¨

Ubersichtlichkeit halber sei die induzierte Ladungsdichte f¨

ur die

folgenden Betrachtungen — nat¨

urlich nicht in der Implementierung — in der knappen

Form (D.12) aus Anhang Dausgedr¨

uckt:

∆ρ[vx] = ˆ

X0[{ψ0

i},{ε0

i}] (VFock[{ψ0

i}]−vx) (4.33)

=ˆ

X0[{ψ0

i},{ε0

i}]VFock[{ψ0

i}]−ˆχ0[{ψ0

i},{ε0

i}]vx.

Hier ist ˆ

X0der auf nicht-lokale St¨

orungen erweiterte8lineare Antwortoperator (D.5), und

ferner seien ψ0

iund ε0

iEigenfunktionen und -Eigenwerte eines Kohn-Sham-Systems mit

einem effektiven Potential veff. Dass sich veff — und damit eben auch ψ0

iund ε0

i— bei

Anderung von vxebenfalls ¨

andert, sei dabei nicht ber¨

ucksichtigt. ∆ρist dann eine linea-

re (genauer: affine) Funktion von vx, und die Aufgabe, ∆ρ[vx] verschwinden zu lassen,

l¨

auft damit auf die L¨

osung eines linearen Gleichungsystems (der Inversion von χ0) her-

aus. Dies steht in Einklang damit, dass nach der G¨

orling-Levy-St¨

orungstheorie (vgl. die

Abschnitte 1.5.4 und 1.6.3) die Austauschwechselwirkung durch eine Taylorentwicklung in

1. Ordnung gegeben ist. L¨

ost man ∆ρ[vx] = 0 durch Inversion von χ0, ergibt sich ausge-

schrieben gerade die Standard-EXX-Gleichung (1.90), d.h., die Minimierung von (4.33)

liefert das exakte Austauschpotential vEXX[ρ]der zu den ψ0

igeh¨

orenden Dichte ρ.

Interessant ist, dass damit die Bestimmungsgleichung f¨

ur vEXX eine formal analoge

Gestalt aufweist wie die Sternheimer-Gleichung; wie diese k¨

onnte man sie also mit den in

Abschnitt 4.1.2 besprochenen Minimierungsverfahren (z.B. Steepest Descent) l¨

osen: es ist

in (4.13) nur A=−χ0und b=ˆ

X0VFock zu setzen. Das zu minimierende Funktional lautet

dann:

S[vx] := 1

2hvx|(−ˆχ0)|vxi+hvx|ˆ

X0VFocki(4.34)

(man beachte, dass χ0negativ semi-definit ist [134,148], und es sich hier um ein rein

reelles Problem handelt). Dieser Zusammenhang zwischen der Sternheimer-Gleichung und

der Minimierung von ∆ρwurde bereits in Abschnitt 2.3 angedeutet. Im n¨

achsten Abschnitt

wird die Minimierung von ∆ρmit Hilfe von Selbstkonsistenzverfahren vorgestellt. Dabei

wird sich die einfachste Variante dieser Methoden — das ”einfache Mixen” — in der Tat

als Anwendung des Steepest-Descent-Verfahrens auf (4.34) entpuppen.

Zun¨

achst aber noch zu Punkt (ii): In Gleichung (4.33) werde nun ber¨

ucksichtigt, dass

X0und VFock implizit — ¨

uber die Kohn-Sham-Wellenfunktionen und -Eigenwerte — vom

effektiven Potential und damit von vxabh¨

angen:

∆ρ[vx] = ˆ

X0[{ψ0

i[vx]},{ε0

i[vx]}] (VFock[{ψ0

i[vx]}]−vx).(4.35)

Dabei sind ψ0

i[vx] und ε0

i[vx] als L¨

osungen des Eigenwertproblems

−1

2∇2+vext(r) + vH[ρ](r) + vx(r) + vc[ρ](r)ψi(r) = εiψi(r) (4.36)

gegeben. Wie die Kohn-Sham-Gleichung (1.52) soll diese Gleichung selbstkonsistent zu-

sammen mit der Formel f¨

ur die Ladungsdichte (1.53) gel¨

ost werden, im Unterschied zu

(1.52) ist hier das Austauschpotential aber keine Funktion der Dichte. Berechnet man also

die induzierte Dichte gem¨

aß (4.35) f¨

ur ein spezielles vx, wird zun¨

achst (4.36) gel¨

ost, und

8Wie in Anhang Dsei bei Anwendung auf ein lokales Potential vlok wieder ˆ

X0vlok := ˆχ0vlok mit dem

”normalen” Antwortoperator ˆχ0definiert, um die Schreibweise nicht zu sehr aufzubl¨

ahen.

4.3 Minimierung der induzierten Ladungsdichte 71

anschließend werden mit den daraus resultierenden Eigenfunktionen ψ0

i[vx] und Eigen-

werten ε0

i[vx] der Fock-Operator sowie der (erweiterte) Antwortoperator (D.5) berechnet,

woraus sich schließlich ∆ρ[vx] ergibt.

Die selbstkonsistente L¨

osung von (4.36) ist aber gleichbedeutend mit der Minimie-

rung des Energiefunktionals E[ρ] := Rvext(r)ρ(r) d3r+Ts[ρ] + EH[ρ] + Ex[ρ] + Ec[ρ] mit

Ex[ρ] := Rvx(r)ρ(r) d3r, was dem Ausdruck (1.54) f¨

ur die Gesamtenergie des realen Sy-

stems bei festgehaltenem vxentspricht. Im Gegensatz zu der in (4.33) definierten Indukti-

onsdichte f¨

uhrt die Definition (4.35) in (4.32) damit auf ein vEXX, das zwei Variationsprin-

zipien gemeinsam erf¨

ullt: Zum einen gilt k∆ρ[vEXX]k= 0, und zum anderen minimiert das

aus den ψ0

i[vEXX] gebildete ρvEXX die Energie E[ρ]. Da in Punkt (i) Wellenfunktionen und

Ein-Teilchen-Energien eines beliebigen effektiven Potentials vorausgesetzt wurden, k¨

onnen

dort auch die so konstruierten ψ0

i[vEXX] und ε0

i[vEXX] eingesetzt werden. Aus der in (i)

kursiv hervorgehobenen Aussage folgt dann, dass vEXX das exakte Austauschpotential der

zu den ψ0

i[vEXX] geh¨

orenden Dichte ρvEXX ist. Diese ergibt sich aber aus dem effektiven

Potential veff[ρvEXX ] := vext +vH[ρvEXX ] + vEXX +vc[ρvEXX ], denn (4.36) ist ja selbstkonsis-

tent gel¨

ost. Damit folgt sofort veff [ρvEXX ] = vext +vH[ρvEXX ]+vEXX[ρvEXX ]+vc[ρvEXX ], d.h.,

vEXX und ρvEXX erf¨

ullen nicht nur das Eigenwertproblem (4.36), sondern auch die Kohn-

Sham-Gleichung (1.52). ¨

Aquivalent dazu: ρvEXX minimiert nicht nur das oben definierte

E[ρ], sondern auch die Gesamtenergie des realen Systems (1.54), und es gilt ρvEXX =ρ0mit

der Grundzustandsladungsdichte ρ0des Systems. Die Minimierung von (4.35) beinhaltet

damit neben der Berechnung des exakten Austauschpotentials vEXX[ρ0]der Grundzustands-

dichte ρ0auch zugleich die L¨

osung des gesamten Kohn-Sham-EXX-Problems!

Daher ist (4.35) — im Gegensatz zu (4.33) — auch keine lineare (affine) Funktion

in vxmehr. Es sei darauf hingewiesen, dass aber auch die Bestimmung des exakten Au-

stauschpotentials zu einer vorgebenen Ladungsdichte ρnach (i) nur dadurch als lineares

Problem aufgefasst werden konnte, weil das zu ρgeh¨

orende (und unter der Bedingung der

v-Darstellbarkeit eindeutig bestimmte) effektive Potential und damit auch die entspre-

chenden Eigenfunktionen und -werte schon als bekannt vorausgesetzt wurden. Dies wird

auch in der G¨

orling-Levy-St¨

orungstheorie getan, vgl. (1.101). Von ρausgehend ist die Be-

rechnung von vEXX[ρ] hingegen ein nicht-lineares Probem — die Nichtlinearit¨

at liegt dabei

jedoch einzig in der Zuordnung ρ←→ veff ←→ {ψ0

i},{ε0

i}, die f¨

ur sich alleine genommen

nichts mit der Austauschwechselwirkung zu tun hat. Erg¨

anzend sei noch bemerkt, dass

sich hierin wiederum der im Sinne von Abschnitt 1.4 ”universelle” Charakter des exakten

Austauschpotentials manifestiert, da in diese Zuordnung das ¨

außere Potential nicht expli-

zit9einfließt.

Mit dem Vorangegangenen ist klar, dass man bei praktischen Anwendungen in der Re-

gel an der Minimierung der induzierten Ladungsdichte nach (ii), also bei Ber¨

ucksichtigung

auch der impliziten vx-Abh¨

angigkeiten, interessiert sein wird. Mit iterativen Verfahren

wie dem nachfolgend vorgestellten Mixing ließe sich dies auch ohne Weiteres bewerkstel-

ligen. Sp¨

ater wird sich jedoch bei der Optimierung des variationellen EXX-Verfahrens

(Abschnitt 4.5.1) herausstellen, dass eine Kombination der Minimierungen nach (i) und

(ii) eine technisch weitaus bessere Strategie ist. Der Algorithmus besteht dann aus einer

inneren Schleife, in der gem¨

aß (i) vorgegangen wird, und einer ¨

außeren, die (ii) realisiert.

Da sich das Mixing dabei vorwiegend in der inneren Schleife abspielt, wird es im Folgenden

vor allem mit Blick auf Punkt (i) diskutiert.

9Mit den S¨

atzen von Hohenberg und Kohn ist nat¨

urlich ρeine Funktion von vext, und damit ist das

Austauschpotential ebenso wie das universelle Funktional F[ρ] in (1.37) eine implizite Funktion von vext.

72 4 Implementierung

4.3.1 Mixing, Selbstkonsistenz und Minimierung

Mixing-Verfahren sind zentral f¨

ur die Behandlung von Problemen, die ”selbstkonsistent”

gel¨

ost werden m¨

ussen, d.h., bei denen die Gr¨

oßen, aus denen die L¨

osung ermittelt werden

soll, bereits ihrerseits von der (im Allgemeinen noch nicht bekannten) L¨

osung abh¨

angen.

Beispiele sind die Hartree-Fock-Gleichung (1.24) und die Kohn-Sham-Gleichung (1.52): in

beiden F¨

allen m¨

ussen die Ein-Teilchen-Wellenfunktionen bekannt sein, damit aus ihnen die

Eigenwertgleichung erst formuliert werden kann. Da bei Kohn-Sham die Wellenfunktionen

nur zusammengefasst zur Ladungsdichte ben¨

otigt werden, l¨

asst sich die Selbstkonsistenz

hier in der Form

ρ∗=F[ρ∗] (4.37)

schreiben [134,135], wobei Feine nicht-lineare Funktion ist, die die L¨

osung des Eigen-

wertproblems (1.52) in Abh¨

angigkeit einer Eingangsdichte ρin und die anschließende Be-

rechnung der daraus resultierenden Ausgangsdichte ρout =F[ρin]¨

uber (1.53) beinhaltet.10

Mathematisch ist ρ∗ein Fixpunkt von F, und gem¨

aß dem Fixpunktsatz von Banach (vgl.

z.B. Ref. 123 oder 124) erh¨

alt man ρ∗durch (unendlich oftmaliges) rekursives Anwenden

von Fauf ein beliebiges ρin, wenn F”kontrahierend”11 ist. Diese Voraussetzung ist aber im

Allgemeinen nicht gegeben, und h¨

aufig divergiert daher die Folge der so erzeugten Dichten

in der Praxis. Ein einfacher Ansatz, dennoch das selbstkonsistente ρ∗durch Rekursion

finden zu k¨

onnen, ist nun, in jeder Iteration Eingangs- und Ausgangsdichte miteinander

zu ”mischen” und den Rekursionsprozess auf diese Weise zu d¨

ampfen. Mit dem Residuum

R[ρin] := ρout −ρin =F[ρin]−ρin (4.38)

erh¨

alt man etwa beim ”einfachen Mixen” die neue Eingangsladungsdichte jeweils aus

ρm+1

in = (1 −λ)ρm

in +λρm

out =ρm

in +λR[ρm

in],(4.39)

wobei f¨

ur λtypischerweise Werte im Bereich zwischen 0.1 und 0.5, oft aber auch wesentlich

kleiner, angesetzt werden [134,137,148].

Durch das Residuum kommt nun ein Bezug zur Minimierung ins Spiel. Denn aus (4.37)

und (4.38) folgt, dass das Residuum f¨

ur die selbstkonsistente Dichte ρ∗verschwindet; die

Suche nach ρ∗ist also ¨

aquivalent zu der Aufgabe, kR[ρ]kzu minimieren. Dies erm¨

oglicht

nun, Selbstkonsistenz-Methoden im Rahmen des variationellen EXX-Verfahrens auch auf

das Minimierungsproblem (4.32) anzuwenden. Indem die (negative) induzierte Ladungs-

dichte als Residuum betrachtet wird,

R[vx] := −∆ρ[vx],(4.40)

l¨

asst sich das einfache Mixing dabei analog zu (4.39) durch

vm+1

x:= vm

x+λR[vm

x] = vm

x−λ∆ρ[vm

x] (4.41)

mit λ > 0 realisieren. Hier ist allerdings zu beachten, dass im Gegensatz zur Vorgehens-

weise bei der Kohn-Sham- oder der Hartree-Fock-Gleichung zwei unterschiedliche physi-

kalische Gr¨

oßen — Potential und Ladungsdichte — miteinander ”gemischt” werden.

10Alternativ l¨

asst sich dies auch ¨

uber das effektive Kohn-Sham-Potential formulieren: ˜

F[veff

∗] = veff

∗,

wobei ˜

Ff¨

ur ein gegebenes veff

in zun¨

achst die Ladungsdichte und damit anschließend veff

out berechnet.

11Ein in einem normierten Raum Xdefinierter Operator Fist ”kontrahierend”, wenn f¨

ur x, y ∈Xmit

einem L < 1 gilt: kF(x)−F(y)k ≤ Lkx−yk.

4.3 Minimierung der induzierten Ladungsdichte 73

Benutzt man in (4.41) die Definition (4.33) von ∆ρ[vx] — erfolgt also keine Aktualisie-

rung des Eigenwertproblems (4.36) in jedem Schritt —, so fungiert der skalare Parameter λ

dabei als einfache N¨

aherung f¨

ur die Inverse der linearen Antwort. Dies erkennt man unter

Beachtung von ∆ρ[vEXX] = 0, indem man (4.33) f¨

ur beliebiges vxsowie f¨

ur das exakte

vEXX betrachtet und anschließend die beiden so entstandenen Gleichungen voneinander

subtrahiert:

vEXX =vx+ ˆχ−1

0∆ρ[vx].(4.42)

Gleichung (4.41) ist also eine einfache Approximation von (4.42). Damit erkl¨

art sich auch

das negative Vorzeichen von λin der rechten Seite von (4.41) bzw. von ∆ρbei der Defini-

tion des Residuums (4.40): ˆχ0ist ein negativ definiter Operator [134,148] und ˆχ−1

0folglich

ebenfalls.12 Abbildung 4.6 zeigt die Minimierung der induzierten Dichte gem¨

aß (4.41) in

Abh¨

angigkeit von der Iteration bei GaAs.

Zwischen Mixing-Verfahren und der in Abschnitt 4.1.2 beschriebenen Minimierung ei-

nes Funktionals bestehen einige Analogien, die hier besonders deutlich werden. Ist n¨

amlich

die 1. Variationsableitung (diskret: Jakobi-Matrix) des Residuums Rein selbstadjungier-

ter Operator (diskret: eine hermitesche Matrix), existiert ein reellwertiges Funktional S,

dessen 1. Variationsableitung (diskret: Gradient ∇S) durch −Rgegeben ist. Die stati-

on¨

aren Punkte von Ssind dann gerade die gesuchten Nullstellen von R— ganz ¨

ahn-

lich, wie sich die L¨

osungen von (4.15) als station¨

are Punkte von (4.13) darstellen las-

sen. F¨

ur R=−∆ρmit der induzierten Ladungsdichte (4.33) ist dies tats¨

achlich der

Fall: es gilt δR[vx]/δvx=χ0, und χ0ist hermitesch. Insbesondere ergibt sich eine ¨

Uber-

einstimmung von einfachem Mixing und einfachem Steepest Descent: die Rekursions-

formeln (4.18) und (4.41) beider Verfahren besitzen die gleiche Gestalt. In der Tat ist

das einfache Mixen (4.41) von Potential und induzierter Dichte nichts anderes als die

Anwendung des Steepest-Descent-Verfahrens auf das Funktional S[vx] von (4.34): es ist

δS[vx]/δvx= ∆ρ[vx] = −R[vx], und die Rekursionsformel (4.18) f¨

ur Steepest Descent

liefert unmittelbar (4.41) mit xi=vi

xund ri=R[vi

x]. Der einzige Unterschied zur Vor-

gehensweise von Abschnitt 4.1.2.1 besteht darin, das Residuum nicht direkt nach (4.33)

zu bestimmen, sondern — um die direkte Berechnung von χ0zu vermeiden — indirekt

uber (4.29). Dies ist auch der Grund, weshalb im variationellen EXX-Verfahren die Mini-

mierung von ∆ρ¨

uberhaupt durch Mixing erfolgt und nicht beispielsweise mit Conjugate

Gradient — dazu w¨

are eine explizite Kenntnis von χ0n¨

otig, die bei Mixing-Methoden wie

dem nachfolgend vorgestellten Pulay-Verfahren nicht notwendig ist.

Es sei noch darauf hingewiesen, dass nicht immer eine solche ”Stammfunktion” Skon-

struiert werden kann. Dies ist etwa der Fall f¨

ur das Residuum (4.38) des Ladungsdichte-

Mixings beim L¨

osen der Kohn-Sham-Gleichung, denn seine Ableitung J[ρ] := −δR[ρ]/δρ

ist nicht hermitesch (vgl. Fußnote auf Seite 76). Das einfache Mixing (4.39) der Dich-

te kann also nicht als Steepest-Descent-Verfahren interpretiert werden. Dennoch gibt es

starke ¨

Ahnlichkeiten: Zum einen sind auch hier die Rekursionsformeln beider Verfahren,

(4.39) und (4.18), von gleicher Gestalt. Zum anderen besitzt Jnur reelle, positive (rechte)

Eigenwerte αi[134,146,148], was sich als Verallgemeinerung der positiven Definitheit von

Ain (4.13) auffassen l¨

asst. H¨

atten die Eigenwerte unterschiedliche Vorzeichen, so w¨

urde

das Mixing — ¨

ahnlich wie die Minimierungsmethoden in Abschnitt 4.1.2 — nicht konver-

gieren [134]. Schließlich ist auch der in den Referenzen 134 und 135 angegebene Bereich

12Wie in Abschnitt 1.6.1 wird hier ein auf die nicht-konstanten Funktionen beschr¨

ankter Definitions-

(und Werte-)bereich von ˆχ0angenommen.

74 4 Implementierung

f¨

ur λ, f¨

ur den das einfache Mixing kovergent ist, identisch mit der Konvergenzbedingung

(4.19) des einfachen Steepest-Descent-Verfahrens.

Die Verbindung von Selbstkonsistenz- und Minimierungsproblemen basiert letztlich

darauf, dass erstere ¨

uber das Residuum immer in der Form einer homogenen Gleichung

geschrieben werden k¨

onnen, hier etwa als R[ρ] = 0 bzw. R[vx] = 0. Numerisch, also in

einer geeigneten endlichen Basisdarstellung, entspricht dies einem System gekoppelter (im

Allgemeinen nicht-linearer) Gleichungen. Damit kann eine Vielzahl von in der numerischen

Mathematik entwickelten Methoden zur L¨

osung solcher Systeme auf das Selbstkonsistenz-

problem ¨

ubertragen werden mit dem Ziel, die Konvergenz gegen¨

uber dem einfachen Mixing

zu steigern. F¨

ur das Dichte-Mixing im Rahmen der Dichtefunktionaltheorie wurde eine

Reihe von Ans¨

atzen entwickelt [137,138,139,140,141,144], die darauf beruhen, in aufein-

ander folgenden Schritten immer bessere N¨

aherungen f¨

ur die (Inverse der) Jakobi-Matrix

von Rzu konstruieren. Wie Kresse und Furthm¨

uller [142,143] ausf¨

uhren, handelt es sich

bei allen diesen Verfahren um verschiedene Realisierungen oder Weiterentwicklungen ei-

nes von Broyden [136] vorgeschlagenen Quasi-Newton-Raphson-Schemas. Ausgangspunkt

dabei ist eine ”Linearisierung” des Residuums (4.38) an der Stelle der selbstkonsistenten

Dichte ρ∗, woraus sich mit der Forderung R[ρ∗] = 0 die Gleichung

ρ∗=ρ+J−1R[ρ] (4.43)

mit der Jakobi-Matrix (der 1. Ableitung) Jdes Residuums ergibt. Die Struktur dieser

Gleichung ist mit der von Gleichung (4.42) zur Berechnung des EXX-Potentials v¨

ollig

identisch. Alle in der Literatur zur effizienten L¨

osung der Kohn-Sham-Gleichung vorge-

schlagenen Algorithmen k¨

onnen folglich unmittelbar auf die Minimierung von ∆ρ¨

uber-

tragen werden! Da (4.42) im Gegensatz zu (4.43) eine exakte Gleichung ist, stellt sie sogar

einen Idealfall f¨

ur die Anwendung von Quasi-Newton-Raphson-Verfahren dar. Die ver-

schiedenen Algorithmen unterscheiden sich in der Art und Weise, wie J−1im Laufe des

Iterationsprozesses aktualisiert und approximiert wird. In dieser Arbeit wurde die Metho-

de von Pulay [140,141] verwendet, und zwar in einer von Kresse und Furthm¨

uller [142]

zur Verbesserung der numerischen Stabilit¨

at leicht modifizierten Fassung. Sie soll nun, in

einer f¨

ur das Mixing von Potential und induzierter Dichte adaptierten Version, skizziert

werden.

4.3.2 Pulay-Mixing

W¨

ahrend beim einfachen Mixing (4.41) in jedem Schritt vom Potential vm

xder jeweils

vorangehenden Iteration ausgegangen wird, ist die Idee des Pulay-Mixers, aus allen (oder

einer bestimmten Anzahl der) vorangehenden Iterationen die beste Linearkombination zu

benutzen:

vm+1

x:= vopt

x−λ∆ρ[vopt

x] (4.44)

mit

vopt

x=X

αivi

x.(4.45)

Die Aufgabe besteht dann in der Konstruktion von vopt

x, d.h., in der Bestimmung der

Koeffizienten αi. Da in der urspr¨

unglichen Formulierung des Verfahrens nicht Potentiale,

sondern Ladungsdichten gemischt werden, wird an dieser Stelle die zus¨

atzliche Bedingung

αi!

= 1 (4.46)

4.3 Minimierung der induzierten Ladungsdichte 75

eingef¨

uhrt, um die Ladungserhaltung zu gew¨

ahrleisten. Hier entspricht sie der Erhaltung

der konstanten Komponente (G=0) im Startpontential v1

x. Obwohl nun konstante Ver-

schiebungen des Potentials die Physik eines Systems nicht beeinflussen, wird diese For-

derung hier jedoch ebenfalls ben¨

otigt; (4.45) soll n¨

amlich analog auch f¨

ur die induzierten

Dichten formuliert werden. Mit (4.33) ergibt sich dann:

∆ρ[vopt

x] = ∆ρX

αivi

x=ˆ

X0VFock −ˆχ0X

αivi

x= (4.47)

(4.46)

αiˆ

X0VFock −ˆχ0vi

x=X

αi∆ρ[vi

x].

Die Koeffizienten der ”besten” Linearkombination (4.45) sind nun dadurch definiert, dass

mit ihnen die Norm der induzierten Dichte

h∆ρ[vopt

x]|∆ρ[vopt

x]i(4.48)

minimal wird. Daraus und mit der Nebenbedingung (4.46) folgt

αi=PjA−1

Pkj A−1

mit Aij := h∆ρ[vj

x]|∆ρ[vi

x]i.(4.49)

Dies entspricht der originalen Vorgehensweise von Pulay [140,141]. W¨

ahrend dabei die

aufeinander folgenden Iterationen des Potentials und der induzierten Dichte durch (4.45)

und (4.49) explizit ber¨

ucksichtigt werden, geht deren Verlauf in der Variante von Kresse

und Furthm¨

uller [142] nur in Form der Differenzen

∆vi

x:= vi+1

x−vi

x,∆∆ρi:= ∆ρ[vi+1

x]−∆ρ[vi

x] f¨

ur i < m (4.50)

ein. Zun¨

achst wird die Nebenbedingung (4.46) benutzt, um die Anzahl der Koeffizienten

in (4.45) um Eins zu reduzieren:

vopt

x=vm

m−1

i=1

¯αi∆vi

x.(4.51)

F¨

ur die ¯αiist dann keine Nebenbedingung mehr n¨

otig, und es gilt

¯αi=−

m−1

i=1

A−1

ji h∆∆ρj|∆ρ[vm

x]imit ¯

Aij := h∆∆ρj|∆∆ρii.(4.52)

In der Praxis wird meist nicht der gesamte Verlauf von i= 1 an betrachtet, vielmehr wer-

den nur die letzten nSchritte miteinbezogen. Die Summation startet also bei i=m−n+ 1.

F¨

ur n= 1 geht das Schema dann in den einfachen Mixer (4.41)¨

uber. Der Algorithmus ist

in Flussdiagramm 4.4 veranschaulicht. Abbildung 4.6 zeigt das Konvergenzverhalten im

Vergleich mit dem einfachen Mixer.

Mit der selben Argumentation wie in Ref. 142 und 143 im Falle der Jakobi-Matrix von

(4.43) vorgef¨

uhrt, l¨

asst sich nun auch hier zeigen, wie der Pulay-Mixer sukzessive immer

bessere N¨

aherungen f¨

ur ˆχ−1

0liefert. Einsetzen von (4.51) in (4.44) f¨

uhrt auf

vm+1

x=vm

x+Gm∆ρ[vm

x],(4.53)

76 4 Implementierung

wobei die Matrix

Gm:= −λ1+

m−1

k,n=1

A−1

kn (λ|∆∆ρni−|∆vn

xi)h∆∆ρk|(4.54)

die Relation

|∆vi

xi+Gm|∆∆ρii= 0 f¨

ur i < m (4.55)

erf¨

ullt. W¨

are Gmdas exakte ˆχ−1

0, w¨

are die Beziehung ebenfalls erf¨

ullt, allerdings ohne die

Beschr¨

ankung i < m. Dies ergibt sich durch Subtraktion von Gleichung (4.42) f¨

ur zwei

verschiedene Iterationen. Gmist folglich die exakte Inversion von ˆχ0in dem Unterraum,

der durch ∆v1

xbis ∆vm−1

xaufgespannt wird. Dies veranschaulicht sehr sch¨

on die auf Pulay

zur¨

uckgehende Bezeichnung Direct Inversion in the Iterative Subspace (DIIS) der Methode.

4.3.3 Pr¨

akonditionierung

Beim selbstkonsistenten L¨

osen der Kohn-Sham-Gleichung wird das Mixing meist mit

Pr¨

akonditionierung betrieben. Als einfacher Ansatz f¨

ur die Inverse der Jakobi-Matrix J

von (4.43) wird daf¨

ur h¨

aufig das Schema von Kerker verwendet, in dem J−1n¨

aherungs-

weise durch die im reziproken Raum diagonale Matrix

K(G,G′) = AG2

G2+G2

δGG′(4.56)

mit einem Anahe bei 1 und einem G0≈1.5˚

A−1gegeben ist [142,143,145]. Im Rahmen

des Thomas-Fermi-Modells [17,18,19,20] l¨

asst sich Kals Inverse der dielektrischen Ma-

trix in Jellium interpretieren. Ersetzt man etwa beim einfachen Mixing (4.39) den skalaren

Parameter λdurch K, erkennt man, dass die Pr¨

akonditionierung als eine Art Filter wirkt:

kleine G-Vektoren werden im Selbstkonsistenzzyklus st¨

arker gebremst als stark oszillie-

rende Komponenten, f¨

ur die bei A≈1 fast keine D¨

ampfung mehr erfolgt.

In dieser Arbeit durchgef¨

uhrte Tests zeigten jedoch, dass das Kerker-Schema f¨

ur das

Mischen von Potential und induzierter Dichte gem¨

aß (4.41) und (4.44) nicht geeignet

ist: Der Selbstkonsistenzzyklus konvergiert schlechter als ohne Pr¨

akonditionierung oder

divergiert sogar. Nun ist Kallerdings auch als N¨

aherungsansatz f¨

ur J−1gedacht, man kann

also nicht unbedingt erwarten, dass er f¨

ur χ−1

0ebenfalls funkioniert. Es sei nun gezeigt,

dass aber ein skalarer Ansatz f¨

ur χ−1

0bereits dem ”Niveau” der Kerker-Pr¨

akonditionierung

bei J−1entspricht, in dem Sinne, dass aus (4.56) eine skalare Gestalt von χ−1

0folgt. Daf¨

wird eine Relation zwischen Jund χ0ben¨

otigt. Sie ist im reziproken Raum n¨

aherungsweise

durch

J(G,G′) = δGG′−χ0(G,G′)vCoul(G′) (4.57)

gegeben, wobei vCoul das Coulomb-Potential ist [139,143].13,14 Benutzt man nun hier f¨

Jdie diagonale N¨

aherung K−1mit A= 1, also

δGG′

G2+G2

=δGG′−χ0(G,G′)vCoul(G′),(4.58)

13Vgl. auch [134,146,147,148]. Dort wird die Beziehung zwischen der dielektrischen Matrix ǫund der

linearen Antwort diskutiert. Analog zu Jbeim Mischen von Ladungsdichten ist ǫdie Jakobi-Determinante

beim Mischen von Potentialen. Die dort angestellten ¨

Uberlegungen k¨

onnen aber direkt auf die Herleitung

von (4.57)¨

ubertragen werden, indem man n¨

amlich die Rollen von Ladungsdichte und effektivem Kohn-

Sham-Potential vertauscht.

14An (4.57) wird auch klar, dass Jim Allgemeinen keine symmetrische/hermitesche Matrix ist (vgl.

Abschnitt 4.3.1), weil das hermetische χ0hier noch mit dem Coulomb-Potential multipliziert wird.

xv:v rlD-=

Arr DDDD=:

+-=

-= 1

nmj

jiji Aba

+-=

+DD-D×+D-= 1

x)v(v:v

nmi

mmm rlarl

brr DDD=:

{ }

xv,,v,v -+-+- DDD mnmnm

{ }

121 ,,, -+-+- DDDDDD mnmnm rrr K

11 :-- D-D=DD mmm rrr

xvv:v -- -=D mmm

DifferenzenimSpeicherhalten:

Start:

1.Iteration:einfachesMixen

zurnächstenIteration Diff.imPotential

Diff.inderinduz.Dichte

optimaleKoeffizienten

neuesPotential

Berechnungderneueninduz.Dichte

außerhalbdesPulay-Mixers

(var.EXX-Verfahren)

1+¬ mm

Zwischenergebnisse()

mji <,

Pulay-Mixing

(Potential/induz.Dichte)

Flussdiagramm 4.4: Pulay-Mixing von Austauschpotential und induzierter Ladungsdichte im variationellen EXX-Verfahren. Der erste Schritt entspricht dem

einfachen Mixing (4.41), ab dem zweiten wird der Verlauf der bisherigen Ergebnisse bis zu maximal nSchritten r¨

uckw¨

arts ber¨

ucksichtigt. In jeder Iteration

wird außer dem aktuellen vm

xauch das zugeh¨

orige ∆ρm(Residuum) ben¨

otigt, dessen Berechnung außerhalb des Mixers erfolgt (gestrichelte Linien, vgl. innere

Schleife in Flussdiagramm 4.5).

78 4 Implementierung

folgt zun¨

achst, dass χ0in dieser Darstellung ebenfalls diagonal sein muss. Mit der Fou-

rierentwicklung des Coulomb-Potentials (A.1) gilt dann f¨

ur die Diagonalelemente

G2+G2

G2= 1 −χ0(G,G)4π

G2(4.59)

oder ¨

aquivalent dazu

χ0(G,G) = −G2

4π=const. (4.60)

In dieser Arbeit wurde daher sowohl beim einfachen als auch beim Pulay-Mixing ein

skalarer Parameter benutzt, d.h., es wurden (4.41) und (4.44) ohne weitere Modifikationen

verwendet. Empirisch zeigte sich, dass dabei Werte zwischen 0.01 und 0.04 eine gute Wahl

f¨

ur λsind. Einsetzen des oben genannten Wertes f¨

ur G0in atomaren Einheiten liefert

λ≈0.06, f¨

uhrt also auf eine vergleichbare Gr¨

oßenordnung.

4.4 Der nicht-lokale Austauschoperator in ebenen Wellen

Notwendig f¨

ur die Entwicklung eines EXX-Codes sowohl nach der Standard-Methode (Ab-

schnitt 1.6.1) wie auch nach der variationellen Methode (Kapitel 2) ist die Implementierung

des nicht-lokalen Austauschoperators (1.27). Seine numerische Handhabung ist allerdings

mit zwei Schwierigkeiten verbunden: (i) die Berechnung der Singularit¨

at im Nenner und

(ii) die Symmetrisierung, wenn mit einem reduzierten k-Punkt-Satz gearbeitet werden

soll. In der Tat wird sich der Operator als die gegenw¨

artig zeitaufwendigste Gr¨

oße im

Algorithmus des variationellen EXX-Verfahrens erweisen, vgl. Kapitel 5.

In dieser Arbeit wurde die Berechnung des Austauschoperators in der Ebene-Wellen-

Basis ausgef¨

uhrt, dabei wurde auf eine bereits im Rahmen eines fr¨

uheren Projekts (der

Implementierung des Standard-EXX-Verfahrens in S/PHI/nX [81,82]) angefertigte Rea-

lisierung zur¨

uckgegriffen. Allerdings legen unten angestellte ¨

Uberlegungen die Vermutung

nahe, dass eine Auswertung im Ortsraum die g¨

unstigere Alternative sein k¨

onnte. Es w¨

are

daher interessant, in einem zuk¨

unftigen Projekt das variationelle EXX-Verfahren mit einer

Ortsraumdarstellung des nicht-lokalen Austauschoperators zu kombinieren.

4.4.1 Behandlung der Singularit¨

Im reziproken Raum wird die Austauschwechselwirkung eines spin-kompensierten Systems

n¨

aherungsweise durch einen Satz nicht-lokaler Ausdr¨

ucke der Form

VFock(k,G,G′) = −4π

Ω

occ

n,qX

G′′

cnq(G+G′′)c∗

nq(G′+G′′)

|k−q−G′′|2(4.61)

beschrieben [52,98], wie in Anhang A.2 explizit vorgef¨

uhrt ist. Sie sind, ¨

ahnlich wie die

kinetische Energie in (3.15), jeweils f¨

ur einen festen Punkt kin der Brillouin-Zone (BZ)

erkl¨

art.

In der Summe treten dabei integrable Polstellen 2. Ordnung auf, wenn k−qein rezi-

proker Gittervektor ist. Deshalb kann die Summation nicht ohne Weiteres mit Hilfe von

wenigen, diskreten Punkten in der BZ ausgef¨

uhrt werden, wie es etwa bei der Ladungs-

dichte m¨

oglich ist (vgl. Abschnitt 3.2). Eine L¨

osung dieses Problems wurde von Gygi und

Baldereschi [98] vorgeschlagen. Durch Einf¨

uhrung einer Hilfsfunktion Fwird die numeri-

sche Integration dabei an den Polstellen durch eine exakte Integration ersetzt.

4.4 Der nicht-lokale Austauschoperator in ebenen Wellen 79

1 4 710 13 16 19 22 25 28

Iteration (innere Schleife)

10-6

10-5

10-4

10-3

10-2

||∆ρ||2

einfach

Pulay (n=2)

Pulay (n=5)

Pulay (n=20)

Abbildung 4.6: Minimierung der induzierten Ladungsdichte in GaAs. Gegen¨

uber dem einfachen Mi-

xer (4.41) l¨

asst sich mit dem Pulay-Ansatz (4.44) eine deutlich schnellere Konvergenz erreichen. Das

optimale vopt

xwurde dabei jeweils aus einer Linearkombination der letzten nIterationen bestimmt. Da

der Pulay-Mixer f¨

ur n= 1 in den einfachen ¨

ubergeht, stimmen alle Kurven im ersten Schritt ¨

uberein.

Startpotential war das LDA-Austauschpotential. F¨

ur die Ladungsdichte wurde (4.33) benutzt, d.h., es

wurde nur die explizite vx-Abh¨

angigkeit ber¨

ucksichtigt. In Flussdiagramm 4.5 entspricht dies der inne-

ren Schleife. Da der Grenzwert der induzierten Ladungsdichte ja exakt bekannt ist, n¨

amlich ∆ρ→0,

ließ sich hier — im Gegensatz etwa zu Abb. 4.5, wo nur die Differenz zum besten erreichten Wert

aufgetragen werden kann — der tats¨

achliche Fehler in jedem Schritt angegeben. Die obige Kurve strebt

einem S¨

attigungswert zu oder konvergiert zumindest nach einer gewissen Zeit sehr langsam; dann ist

offensichtlich die Grenze der numerischen Genauigkeit erreicht.

F¨

ur festes kseien also q0,G0so, dass der Integrand in (4.61) singul¨

ar wird: q0=

k−G0. Wegen (A.5) ist die Singularit¨

at damit f¨

ur q→q0asymptotisch durch

cn,k−G0(G+G0)c∗

n,k−G0(G′+G0)

|k−q−G0|2=cn,k(G)c∗

n,k(G′)

|k−q−G0|2(4.62)

gegeben. Dies kann f¨

ur q≈q0wiederum durch cn,k(G)c∗

n,k(G′)F(p) angen¨

ahert werden,

wenn F(p) bei p→0 die gleiche Asymptotik wie 1/p2besitzt. Fordert man zus¨

atzlich,

dass Fim reziproken Gitter (3.2) periodisch ist, l¨

asst sich damit zu (4.61) folgendermaßen

eine ”geschickte Null” hinzuf¨

ugen:

VFock(k,G,G′) = (4.63)

−4π

ΩX

n"X

′ X

G′′

cnq(G+G′′)c∗

nq(G′+G′′)

|k−q−G′′|2−cn,k(G)c∗

n,k(G′)F(k−q)!

+cn,k(G)c∗

n,k(G′)X

F(k−q)#.

Hier heben sich die Singularit¨

aten in den großen runden Klammern gerade auf. Alle Terme,

bei denen k−qein reziproker Gittervektor ist, werden also ausgelassen, was durch den

Strich an der ersten Summe ¨

uber qangedeutet ist. Im Argument von Fkonnte der jeweils

kritische G′′-Vektor wegen der vorausgesetzten Periodizit¨

at weggelassen werden. Ebenfalls

80 4 Implementierung

auf Grund der Periodizit¨

at von Fist die zweite Summe ¨

uber qunabh¨

angig von k. Dort

kann Fdaher durch den mittleren Wert Ω/(2π)3RBZ F(p) d3pin der BZ ersetzt werden,

falls das Integral bekannt ist.

Die Gestalt der Hilfsfunktion und ihr Integral h¨

angen von der Struktur des betrachteten

Systems ab. In Ref. 98 findet man indes beides nur f¨

ur den Fall der kubisch-fl¨

achenzentrier-

ten Gitterstruktur (fcc) angegeben. Offensichtlich aus diesem Grund sind EXX-Berechnun-

gen periodischer Systeme15 bis 2005 nur f¨

ur diese Struktur ver¨

offentlicht worden. Wenzien,

Cappellini und Bechstedt leiteten jedoch entsprechende Hilfsfunktionen auch f¨

ur einfach-

kubische (sc), kubisch-innenzentrierte (bcc), hexagonale sowie f¨

ur einfach-orthorhombische

Bravaisgitter ab [99]. Die ben¨

otigten Integrale liegen allerdings nur f¨

ur die kubischen Gitter

in analytisch-geschlossener Form vor. F¨

ur den hexagonalen Fall wurde daher das Ergeb-

nis einer numerischen Integration in Ref. 99 tabelliert als Funktion I(c/a) verschiedener

Verh¨

altnisse der Gitterkonstanten angegeben. Hier sei auf einen Druckfehler hingewiesen:

Die erste Spalte von Tabelle II genannter Referenz listet c/a in Einheiten von p2/3 auf.

Irrt¨

umlich wurde aber der Kehrwert angegeben. Da Idort nur f¨

ur wenige Seitenverh¨

alt-

nisse gegeben ist und sich besonders bei kleinen Werten c/a nur schwer linear approxi-

mieren l¨

asst, wurde die Tabelle f¨

ur die vorliegende Arbeit noch einmal neu und etwas

feinmaschiger berechnet. Zus¨

atzlich wurden die Integrale auch f¨

ur den tetragonalen Fall

(einfach-orthorhombisch mit a=b) ausgewertet. Die Ergebnisse zeigt Tab. 4.1.

Die Methode wurde im Rahmen dieser Arbeit f¨

ur alle oben genannten Bravaisgitter16

in den Code S/PHI/nX [81,82] implementiert. Dadurch konnten beispielsweise erstmals

EXX- und darauf aufbauende EXX+G0W0-Berechnungen von GaN und InN in der ge-

gen¨

uber der Zinkblende-Struktur stabileren und daher technologisch relevanteren Wurtzit-

Phase erm¨

oglicht werden [172].

4.4.2 Symmetrisierung

Die zweite Schwierigkeit bei der Berechnung des Austauschoperators betrifft die Sym-

metrisierung, die sich im Vergleich mit der einer lokalen Gr¨

oße wie der Dichte (vgl. Ab-

schnitt 3.2) sehr aufwendig gestaltet. Wird in (4.61) die Summation ¨

uber qin eine Summe

uber einen irreduziblen Bereich der BZ sowie einer weiteren ¨

uber alle Punkttransforma-

tionen aufgespalten, ergibt sich, wie in (A.8) gezeigt,

VFock(k,G,G′) = −4π

Ω

occ

Nred

s=1

NPS

i=1 X

G′′

cn,qs(S−1

iG+G′′)c∗

n,qs(S−1

iG′+G′′)

|S−1

ik−qs−G′′|2.(4.64)

Hier ist Nred die Anzahl der Punkte qsim irreduziblen Bereich der BZ mit den zugeh¨

origen

Wichtungen ws, und NPS bezeichnet die Anzahl der Punkttransformationen Si. Die nume-

rische Auswertung dieses Ausdrucks wird durch dessen Abh¨

angigkeit von kerschwert. Zum

einen kommt dadurch eine Symmetrieoperation im Nenner ins Spiel. W¨

are dies nicht der

Fall, ließe sich zun¨

achst ohne Einbeziehung der Symmetrien eine Matrix ˆ

Vunsym

Fock (k,G,G′)

konstruieren, die nur durch Umordnung ihrer Eintr¨

age (Ganzzahlarithmetik) und eine an-

schließende Summation symmetrisiert werden k¨

onnte — sehr ¨

ahnlich, wie in (3.12) die

symmetrisierte Dichte aus der unsymmetrisierten gewonnen wird. Zum anderen aber muss

15F¨

ur radialsymmetrische Systeme wurde die EXX-Methode unter der Bezeichnung OEP bereits seit

1976 angewandt, vgl. Abschnitt 1.6.2.

16F¨

ur das orthorhombische Gitter wurde allerdings nur der tetragonale Spezialfall ber¨

ucksichtigt. Eine

Verallgemeinerung w¨

are jedoch nicht schwer zu implementieren; die Integrale h¨

angen dann jeweils von zwei

Seitenverh¨

altnissen, z.B. b/a und c/a, ab.

4.5 Variationelles EXX als selbstkonsistenter Zyklus 81

hexagonal tetragonal

c/a I(c/a)c/a I(c/a)

in Einh. p2/3 in Einh. (a/2π)3in Einh. 1 in Einh. (a/2π)3

0 0 0 0

0.25 2.41198 0.25 3.04513

0.5 4.6399 0.5 5.77592

1 8.1361 1 9.8293

1.5 10.502 1.5 12.5214

2 12.4069 2 14.4238

3 14.8682 3 17.2456

4 16.4539 4 19.27

5 17.6677 5 20.436

6 18.7455 6 21.9869

7 19.8621 7 22.6149

8 20.4293 8 23.4241

10 21.7925 10 24.956

12 22.548 12 26.3131

24 26.4598 24 30.5836

Tabelle 4.1: Integrale der Hilfsfunktion ¨

uber die Brillouin-Zone f¨

ur verschiedene Verh¨

atnisse c/a der

Gitterkonstanten im hexagonalen und tetragonalen Bravaisgitter (vgl. Abschnitt 4.4.1). Die entspre-

chenden Hilfsfunktionen Fsind Referenz 99 entnommen. Im tetragonalen Fall wurden in der dort

angegebenen Funktion des orthorhombischen Gitters die Gitterkonstanten aund bgleichgesetzt.

(4.64) f¨

ur jeden der Nred Punkte aus dem reduzierten k-Punkt-Satz seperat ausgerech-

net werden. Die Gr¨

oße skaliert damit ¨

außerst ung¨

unstig: bestehen die |G+ki-Basen je-

weils aus etwa mebenen Wellen, ist der erforderliche zeitliche Aufwand insgesamt durch

NredNPSnvalm3gegeben (nval : Anzahl der Valenzb¨

ander).

Demgegen¨

uber k¨

onnte die Symmetrisierung des Operators im Ortsraum numerisch

einfacher zu gelingen, denn aus (1.27) folgt (f¨

ur ein spin-kompensiertes System) mit den

selben Bezeichnungen wie oben

VFock(r,r′) = −

occ

Nred

s=1

NPS

i=1

ψn,qs(S−1

ir)ψ∗

n,qs(S−1

ir′)

|r−r′|.(4.65)

Die Vorteile dieser Formulierung sind: (i) Es muss nur noch eine Matrix berechnet werden.

(ii) Wegen |r−r′|=|S−1

ir−S−1

ir′|l¨

asst sich im Gegensatz zur Darstellung im reziproken

Raum zun¨

achst durch Weglassen der Summe ¨

uber die Sieine unsymmetrisierte Version

Vunsym

Fock (r,r′) konstruieren, die anschließend durch Umordnen ihrer Eintr¨

age symmetrisiert

werden kann. (iii) Es entf¨

allt die durch die Fourier-Entwicklung ins Spiel gekommene

Faltung (Summe ¨

uber G′′ in (4.64)).

4.5 Variationelles EXX als selbstkonsistenter Zyklus

Nachdem in den vorangehenden Abschnitten alle f¨

ur die numerische Implementierung der

variationellen EXX-Methode notwendigen Einzelschritte vorgestellt wurden, k¨

onnen sie

jetzt zusammengef¨

ugt werden. Flussdiagramm 4.5 gibt schematisch einen ¨

Uberblick ¨

uber

den Programmablauf, wie er in dieser Arbeit realisiert wurde. Er besteht aus mehreren, in-

einander verschachtelten Iterationszyklen, deren Funktion und Zusammenspiel direkt aus

82 4 Implementierung

den einleitenden ¨

Uberlegungen von Abschnitt 4.3 folgt. Dort wurde diskutiert, dass die

induzierte Ladungsdichte ∆ρentweder (i) mit festgehaltenen Kohn-Sham-Orbitalen ψ0

ier-

folgen kann — dies liefert das EXX-Potential der zu diesen ψ0

igeh¨

origen Ladungsdichte —

oder aber (ii) mit einer Aktualisierung der Orbitale — dann erh¨

alt man das EXX-Poten-

tial der Grundzustandsladungsdichte ρ0. Da man gew¨

ohnlich an Letzterem interessiert ist,

k¨

onnte man nun direkt Strategie (ii) verfolgen: sie ist in Diagramm 4.5 gegeben, wenn die

mit (∗) markierte Querverbindung nicht benutzt wird (d.h., es wird dort s= 1 gesetzt).

Im Prinzip w¨

urde der Algorithmus so bereits funktionieren. Er besteht dann aus folgenden

Schritten:

(1) Vorgabe eines geeigneten Start-Austauschpotentials v(0)

x, etwa aus einer vorangehen-

den LDA- oder GGA-Rechnung (Abschnitt 1.5.2).

(2) Berechnung der Wellenfunktionen ψ0,(m)

idurch L¨

osen der Kohn-Sham-Gleichung zu

festgehaltenem Probe-Austauschpotential v(m)

x(Gleichung (4.36)).

(3) Berechnen des nicht-lokalen Austauschoperators V(m)

Fock aus den ψ0,(m)

i(Abschnitt 4.4).

(4) Erzeugen des St¨

oroperators H(m)

1:= V(m)

Fock −v(m)

(5) L¨

osen der Sternheimer-Gleichung mit Hilfe eines geeigneten Minimierungsverfahrens

(Abschnitt 4.1), um die linearen Korrekturen ψ1,(m)

izu erhalten.

(6) Berechnen der induzierten Ladungsdichte ∆ρ(m)aus den Orbitalen ψ0,(m)

iund den

Korrekturen ψ1,(m)

i(Abschnitt 4.2).

(7) Erzeugen des neuen Probe-Austauschpotentials v(m+1)

xdurch einfaches Mischen oder

Pulay-Mischen von ∆ρ(m)und v(m)

x(Abschnitt 4.3).

(8) Wiederholen der Schritte (2) – (7) solange, bis Selbstkonsistenz erreicht ist.

Die Schritte (2) und (5) sind dabei selbst iterative Zyklen. Es sei auch noch einmal be-

tont, dass Punkt (2) nur die L¨

osung der Kohn-Sham-Gleichung zu einem fest vorgegebenen

Probe-Austauschpotential beinhaltet und folglich nicht aufwendiger ist als eine gew¨

ohn-

liche LDA-Kalkulation. Es zeigt sich jedoch im Folgenden, dass es technisch viel g¨

unsti-

ger ist, auch bei der Berechnung von vEXX[ρ0] so viel wie m¨

oglich auf die Minimierung

gem¨

aß (i) zur¨

uckzugreifen.

4.5.1 Optimierung des Algorithmus

Auf Grund der schlechten Skalierung des Austauschoperators in Abh¨

angigkeit von der

Gr¨

oße des Basissatzes (vgl. Abschnitt 4.4.2 und Tabelle 5.1) w¨

are eine Implementierung

der variationellen EXX-Methode gem¨

aß der obigen Punkte (1) – (8), wobei in jedem Itera-

tionszyklus der Austauschoperator neu generiert w¨

urde, nicht effizient. Der Aufwand kann

aber auf einfache Weise erheblich reduziert werden: Die Idee ist, nicht f¨

ur jede Aktuali-

sierung v(m)

xdes lokalen Austauschpotentials die Wellenfunktionen neu zu berechnen und

damit anschließend die teure Aktualisierung von VFock durchzuf¨

uhren, sondern dies erst

dann zu tun, wenn vxan die aktuell gegebenen Orbitale hinreichend angepasst ist. Mit

anderen Worten: man minimiert zun¨

achst ∆ρ,ohne die Abh¨

angigkeit der Orbitale von vx

zu ber¨

ucksichtigen, verf¨

ahrt also genau wie in Punkt (i) des Abschnitts 4.3 beschrieben.

4.5 Variationelles EXX als selbstkonsistenter Zyklus 83

Ansatz(z.B.LDA/GGA)

LDA/GGA

)0(

xv:v =

Kohn-Sham-Gleichung

nächsteIteration

nicht-lokales Austauschpotential

Störoperator

LösenderSternheimer-Gleichung

( , ,etc.)Prec.Conj.GradientSteepest-Descent

( ) 0

)(,0)(

)(,1

)(,0)(

0=+- m

mHPPH yye

å*

=D occ

)(,1)(,0)( )(Re2:

myyr

induzierteLadungsdichte

)(

Fock

)(

1vV: mmm

H-=

}][{V )(,0

Fock

)(,0)(,0)(,0

)(

xHext

2][vv][vv

myeyrr =

é++++Ñ-

mm ®+1

sm mod0º

Mixing

]v[v:v )(

)(

)1(

mmm rl D-=

]v[v:v opt

opt

)1(

xrl D-=

(einfach)

(Pulay)

d<- -)1(

)(

mm EE

Ende:

][v 0EXX r

nein

innereSchleife

äußereSchleife

(*)

Flussdiagramm 4.5: Schematische Darstellung des varEXX-Algorithmus. Der iterative Prozess besteht

aus vier ineinander verschachtelten Selbstkonsistenzzyklen, die hier durch verschiedene Graustufen her-

vorgehoben sind. In der ¨

außeren Schleife wird die Kohn-Sham-Gleichung (1.52) in EXX-Genauigkeit

gel¨

ost. Da vxnur ¨

uber die Orbitale zug¨

anglich ist, werden diese zun¨

achst in einer Unterentschleife

f¨

ur festes v(m)

xerzeugt und dann — nach Berechnung von VFock — an eine zweite, ”innere” Schleife

ubergeben. Dort findet die Minimierung der induzierten Dichte statt, wobei in jedem Schritt noch die

Sternheimer-Gleichung iterativ gel¨

ost wird. Das so erzeugte Austauschpotential dient dann als Start-

punkt der n¨

achsten (¨

außeren) Iteration.

Erst, nachdem dies vollbracht ist,17 werden Wellenfunktionen, nicht-lokaler Austausch-

operator und St¨

oroperator aktualisiert. Solange keine Selbstkonsistenz erreicht ist, sind

diese Gr¨

oßen dann jedoch nicht mehr mit dem zuletzt berechneten vxkonsistent. ∆ρist

daher wieder verschieden von 0 und wird aufs Neue minimiert, nat¨

urlich ebenfalls, ohne

die Orbitale zu aktualisieren. Dieses Vorgehen l¨

asst sich zusammenfassen, indem in obiger

Aufz¨

ahlung Schritt (8) durch die folgenden beiden Schritte ersetzt wird:

(8′) Wiederholen der Schritte (4) – (7) solange, bis v(m)

xhinreichend (siehe unten) kon-

vergiert ist.

(9) Wiederholen der Schritte (2) – (8′) solange, bis Selbstkonsistenz erreicht ist.

Durch (8′) wird also eine weitere Unterschleife (im Folgenden ”innere Schleife” genannt)

17In der Praxis muss die Minimierung von ∆ρdabei nicht bis an die Grenze der numerischen Genauigkeit

erfolgen, da dies insgesamt nicht zu einer schnelleren Konvergenz f¨

uhrt (siehe unten).

84 4 Implementierung

0 1 2 3 4 5678 9 10

Iteration (äußere Schleife)

10-6

10-5

10-4

10-3

10-2

||∆ρ||2

einfach

Pulay (n=5)

0 1 2 3 4

Iteration (äußere Schleife)

10-6

10-5

10-4

10-3

10-2

||∆ρ||2

0 30 60 90 120

Iteration (innere Schleife)

innere Schleife

äußere Schleife

innere Schleifen:

Abbildung 4.7: Links: Minimierung der induzierten Ladungsdichte in GaAs gem¨

aß der ¨

außeren Schleife

in Flussdiagramm 4.5. Die f¨

ur jeden Einzelschritt ben¨

otigte Minimierung von ∆ρgem¨

aß der inneren

Schleife (vgl. Abb. 4.6) erfolgte dabei mittels einfachem Mixing (durchgezogene Linie) oder mit dem

Pulay-Verfahren (gestrichelte Linie). Letzteres ist hier bereits nach 3 Iterationen bis zur Grenze der

numerischen Genauigkeit konvergiert. Rechts: Norm der induzierten Ladungsdichte ∆ρin Abh¨

angigkeit

von allen Aktualisierungen des Austauschpotentials vx. Nach jeder Minimierung von k∆ρkin der inne-

ren Schleife (hier jeweils 30 Schritte) werden die Wellenfunktionen an vxangepasst (¨

außere Schleife).

Dadurch springt k∆ρkzu Beginn jeder ¨

außeren Schleife wieder nach oben, mit zunehmder Selbstkonsis-

tenz verschwinden diese Ausschl¨

age jedoch. Zum Konvergenzverhalten der beiden Kurven vgl. Abb. 4.6.

in den Gesamtzyklus (im Folgenden als ”¨

außere Schleife” bezeichnet) eingef¨

ugt. In Dia-

gramm 4.5 wird dies durch Einschalten der Querverbindung (∗) erreicht, wobei sdie

Anzahl der f¨

ur (8′) ben¨

otigten Schritte ist. Bei den in dieser Arbeit untersuchten Mate-

rialien stellt 10 ≤s≤30 eine geeignete Wahl dar. In Abbildung 4.7 ist die Abh¨

angigkeit

der (Norm der) induzierten Dichte von der Iteration der inneren bzw. ¨

außeren Schleife

illustriert. Tats¨

achlich braucht in (8′) nicht stets bis an die Grenze der numerischen Ge-

nauigkeit konvergiert zu werden; da die Konsistenz aller beteiligten Gr¨

oßen mit jedem

außeren Schritt zunimmt, verbleibt in den jeweiligen Unterschritten n¨

amlich immer weni-

ger ”zu tun”. Anders formuliert: mit der Zeit werden die Vorgaben f¨

ur die Unterzyklen so

gut, dass die Konvergenz dort schnell erreicht ist. Dies gilt insbesondere auch f¨

ur die Stern-

heimer-Gleichung, die sich innerhalb der inneren Schleife befindet und deshalb in jedem

— und nicht nur in jedem s-ten — Schritt gel¨

ost werden muss. Dazu benutzt man sinnvol-

lerweise als Ansatz f¨

ur die Korrekturfunktionen ψ1,(m)

idas Ergebnis der jeweils vorange-

henden Iteration ψ1,(m−1)

i.¨

Ahliches gilt auch f¨

ur die Ansatzfunktion des EXX-Potentials

selbst; zwar erwies sich der Algorithmus — wie an GaAs, GaN und InN getestet — auch

f¨

ur das Startpotential v(0)

x= 0 als stabil, aber effizienter ist es nat¨

urlich, bereits von einem

N¨

ahrungsansatz wie etwa LDA oder GGA aus zu starten.

Obwohl durch die Einf¨

uhrung der ”innere Schleife” die Anzahl notwendiger Aktuali-

sierungen des nicht-lokalen Austauschoperators schon stark reduziert werden konnte, ist

es dennoch sinnvoll, noch nach weiteren M¨

oglichkeiten zu suchen, den mit VFock verbun-

denen Aufwand zu vermindern. So l¨

asst sich beispielsweise auszunutzen, dass VFock nur

ben¨

otigt wird, um die linearen Korrekturfunktionen der Valenzbandorbitale zu berech-

nen. Wie Hybertsen und Louie diskutieren [176], ben¨

otigt man zu deren Beschreibung

aber weit weniger ebene Wellen als f¨

ur die Funktionen des Leitungsbandes. Daher ist es

sinnvoll, f¨

ur VFock eine Extra-Abschneideenergie EFock

cut einzuf¨

uhren, die sich unabh¨

angig

4.5 Variationelles EXX als selbstkonsistenter Zyklus 85

von der Abschneideenergie Ecut des vollen Hamiltonoperators einstellen l¨

asst und kleiner

gew¨

ahlt werden kann. Wie Ecut muss auch EFock

cut letztlich in Konvergenztests bestimmt

werden; in der Regel ist dabei EFock

cut ≈2/3Ecut ausreichend [168].

Wie in Abschnitt 4.4.2 diskutiert, tr¨

agt auch die Symmetrisierung des Austauschope-

rators erheblich zu dessen schlechter Skalierung bei. Praktisch w¨

are es daher, die Sym-

metrisierung des Operators einfach weglassen zu k¨

onnen. Tats¨

achlich l¨

asst sich nun die

EXX-Methode dahingehend n¨

ahern, dass nur noch das lokale Austauschpotential symme-

trisiert werden muss. Dies soll in Abschnitt 4.6 er¨

ortert werden. Es ist dazu allerdings

hilfreich, sich die Unterschiede sowie die Parallelen zwischen den numerischen Algorith-

men des variationellen EXX-Varfahrens (Flussdiagramm 4.5) und der Standard-Methode

(Abschnitt 1.6.1) genau zu verdeutlichen.

4.5.2 Variationelles und Standard-EXX: Ein Vergleich des Iterations-

prozesses

Im Unterschied zu den Abschnitten 2.2 und 2.3, in denen variationelle und Standard-

Methode rein formal-analytisch miteinander verglichen wurden, soll hier untersucht wer-

den, inwieweit sich der iterative Prozess, also die Entwicklung von der Ansatzfunktion v(0)

bis zum auskonvergierten EXX-Potential, bei beiden Methoden unterscheidet. Die Kennt-

nis der Gemeinsamkeiten kann besonders beim Programmieren n¨

utzlich sein, wenn eines

der Verfahren bereits im Code vorhanden ist.

Grob umrissen basiert der Algorithmus der Standard-Methode (stEXX) auf folgenden

Punkten:

(1a) Vorgabe eines geeigneten Start-Austauschpotentials v(0)

x, etwa aus einer vorangehen-

den LDA- oder GGA-Rechnung (Abschnitt 1.5.2).

(2a) Selbstkonsistentes L¨

osen der Kohn-Sham-Gleichung zu festgehaltenem Probe-Au-

stauschpotential v(m)

x(Gleichung (4.36)).

(3a) Vollst¨

andige Diagonalisierung der Hamilton-Matrix (Kohn-Sham-Matrix), um auch

die unbesetzten Zust¨

ande zu erhalten.

(4a) Berechnen des nicht-lokalen Austausch-Operators V(m)

Fock, der Greenschen Funktio-

nen G(m)

iund der (Inversen der) linearen Antwort χ(m)

(5a) Berechnen der von V(m)

Fock induzierten Ladungsdichte ∆ρ(m)

Fock mit Hilfe der Greenschen

Funktionen (eckige Klammer in Gleichung (1.94)).

(6a) Erzeugen des neuen Probe-Austauschpotentials v(m+1)

xdurch Anwenden von (χ(m)

0)−1

auf ∆ρ(m)

Fock (Gleichung (1.94)).

(7a) Wiederholen der Schritte (2a) – (6a) solange, bis Selbstkonsistenz erreicht ist.

Um die folgende Gegen¨

uberstellung mit dem oben (Seiten 82/83) beschrieben Ablauf der

variationellen Methode (varEXX) zu erleichtern, sind die stEXX-Schritte mit hier einem

”a” markiert.

Sei nun beiden Methoden ein gleiches Startpotential v(0)

xvorgegeben und zun¨

achst der

”nullte” Durchlauf (also m= 0) betrachtet. Damit sind auch die in den varEXX-Schritten

(1) – (3) bzw. den stEXX-Schritten (1a) – (4a) berechneten unbesetzten Zust¨

ande ψ0,(0)

86 4 Implementierung

und V(0)

Fock v¨

ollig identisch. Der Unterschied besteht bis jetzt also lediglich darin, dass in

stEXX eine Reihe (teurer) Gr¨

oßen zus¨

atzlich berechnet wird: unbesetzte Zust¨

ande durch

Diagonalisierung der Kohn-Sham-Matrix, die Greensche Funktion sowie die lineare Ant-

wort und deren Inverse.

Anschließend wird nun sowohl in varEXX (4) – (6) als auch in stEXX (5a) eine li-

neare Dichte¨

anderung betrachtet — ab hier allerdings unterscheiden sich die Berechnun-

gen: W¨

ahrend bei varEXX die ¨

Anderung durch den Operator H1:= VFock −vxindu-

ziert wird, ist die St¨

orung bei stEXX durch VFock allein gegeben (vgl. die Bemerkungen

nach Gleichung (1.94)). Noch gr¨

oßer die Unterschiede bei der Aktualisierung des Aus-

tauschpotentials: varEXX erzeugt v(1)

xdurch Mixen von ∆ρ(0) und v(1)

x, stEXX hingegen

durch Multiplizieren von ∆ρ(0)

Fock mit (χ(0)

0)−1. Tats¨

achlich weichen die in (7) bzw. (6a)

generierten Austauschpotentiale v(1)

xim Allgemeinen stark voneinander ab, und auf den

ersten Blick scheinen damit auch alle weiteren Iterationen bis zum Erreichen der Selbst-

konsistenz nicht mehr miteinander vergleichbar zu sein. Durch die in (8′) eigentlich zur

Optimierung der varEXX-Methode eingef¨

uhrte ”innere Schleife” ist dies aber dennoch

m¨

oglich: Da die stEXX-Schritte (5a) und (6a) der Auswertung der EXX-Gleichung (1.94)

entsprechen, gilt dort v(1)

x=vEXX[ρ(0)], d.h., es wird das exakte Austauschpotential der

zu den ψ0,(0)

igeh¨

orenden Dichte ρ(0) erzeugt. Nun sei andererseits die innere Schleife

des varEXX-Algorithmus betrachtet: Hier wird, ebenfalls ausgehend von den ψ0,(0)

i, die

induzierte Dichte minimiert, ohne zwischenzeitlich die Wellenfunktionen zu aktualisie-

ren. Auch dies f¨

uhrt aber gem¨

aß Punkt (i) der Einleitung von Abschnitt 4.3 gerade auf

vEXX[ρ(0)]. L¨

asst man die innere Schleife also vollst¨

andig auskonvergieren, wird auf diese

Weise das stEXX-Verfahren ”wieder eingeholt”. Somit startet der n¨

achste Durchlauf, be-

ginnend in (2) bzw. (2a), in beiden Verfahren wiederum vom gleichen Ausgangs-Potential

und alle weiteren ebenso. Es l¨

asst sich also zusammenfassen: Die Aktualisierungen des

lokalen Austausch-Potentials im stEXX-Verfahren entsprechen jenen der ¨

außeren Schleife

im varEXX-Verfahren.

Die ¨

Aquivalenz beider Methoden geht damit ¨

uber das in Abschnitt 2.2 Gezeigte hinaus:

Dort wurde — streng genommen — nur die ¨

Aquivalenz der Formulierungen f¨

ur irgendeine

feste Dichte, die nicht notwendigerweise die Grundzustandsladungsdichte18 des betrachte-

ten Systems ist, bewiesen. In stEXX und varEXX wird aber nicht nur das EXX-Potential

einer Dichte berechnet, sondern zugleich die Kohn-Sham-Gleichung 1.52 selbstkonsistent

gel¨

ost. Dass dies, trotz aller technischen Verschiedenheit im Umgang mit dem Austausch-

potential, auf ganz analoge Weise geschieht, wurde hier gezeigt. Die Kenntnis der Analogi-

en zwischen beiden Methoden wird nun im folgenden Abschnitt benutzt, um eine zun¨

achst

f¨

ur die Standard-Methode formulierte N¨

aherung bei der Behandlung der Symmetrien auch

auf die variationelle Formulierung ¨

ubertragen zu k¨

onnen.

4.6 Symmetriegen¨

aherte EXX-Methode

Die Hauptschwierigkeit dieser Arbeit bestand darin, dass w¨

ahrend der Implementierung

der variationellen EXX-Methode in S/PHI/nX [81,82] zun¨

achst auf Teile (insbesondere

den nicht-lokalen Austauschoperator) des bereits zuvor in diesen Code implementierten

Standard-EXX-Verfahrens zur¨

uckgegriffen wurde, wobei allerdings nicht bekannt war, dass

es sich bei dessen Realisierung um eine sehr effektive N¨

aherung handelte. Diese N¨

aherung

18Sie ist aber durch die vorausgesetzte v-Darstellbarkeit und die Hohenberg-Kohn-Theoreme ein-

eindeutig einem Satz Wellenfunktionen zugeordnet.

4.6 Symmetriegen¨

aherte EXX-Methode 87

besteht darin, alle im Formalismus auftretenden Brillouin-Zonen-Integrationen nur ¨

uber

dem irreduziblen Bereich der Brillouin-Zone auszuf¨

uhren, ohne sie im Anschluss daran

zu symmetrisieren. Symmetrisiert wird dann einzig das daraus resultierende lokale Aus-

tauschpotential. Daher sei diese Vorgehensweise im Folgenden als ”symmetriegen¨

aherte

EXX-Methode” bezeichnet.

Tats¨

achlich ist die so erreichte Reduktion der ben¨

otigten CPU-Zeit enorm, was vor

allem auf die Vereinfachungen bei der Auswertung des nicht-linearen Austauschoperators

zur¨

uckzuf¨

uhren ist: Wird etwa die Integration ¨

uber die Brillouin-Zone einer Zinkblende-

Struktur mit Hilfe einer (4 ×4×4)-Zerlegung nach Monkhorst und Pack [96] ausgef¨

uhrt,

so ben¨

otigt man bei Weglassen der Summe ¨

uber die Symmetrien Siin Ausdruck (4.64) nur

rund 4% der Zeit, die bei voller Symmetrisierung des nicht-linearen Austauschoperators

erforderlich w¨

are. Streng formal l¨

asst sich diese N¨

aherung allerdings nicht begr¨

unden, ihre

Rechtfertigung liegt vielmehr in der empirisch gefundenen guten ¨

Ubereinstimmung der

so berechneten Bandl¨

ucken mit den Resultaten einer exakten Rechnung (Abweichungen

kleiner als wenige Zehntel eV, vgl. Tab. 4.2). In gewisser Weise ist die Situation somit ¨

ahn-

lich wie beim LDA-Funktional: auch dessen Erfolg konnte aus dem zu Grunde liegenden

ad-hoc-Modell (Abschnitt 1.5.2) kaum begr¨

undet werden und musste daher zun¨

achst19 als

eine praktische Erfahrungstatsache gewertet werden.

Die Idee der symmetriegen¨

aherten EXX-Methode basiert auf einer Modifikation der

f¨

ur periodische Randbedingungen formulierten EXX-Gleichung (1.94) und sei deshalb zu-

erst f¨

ur das Standard-EXX-Verfahren beschrieben (Abschnitt 4.6.2). Da eine komplette

Symmetrisierung des nicht-lokalen Austauschoperators aber auch die Anwendungsm¨

oglich-

keiten des variationellen Ansatzes stark beschr¨

ankt (VFock erweist sich als die Engstelle

im variationellen EXX-Verfahren, vgl. Kapitel 5), ist es lohnenswert, die N¨

aherung auch

hierauf zu ¨

ubertragen (Abschnitt 4.6.3). Zuvor jedoch scheint es hilfreich, die Gleichungen

einmal explizit so aufzuschreiben, wie sie sich bei exakter Symmetrisierung ergeben (n¨

ach-

ster Abschnitt). Zur Vereinfachung wird dazu im Folgenden ein nicht spin-polarisierter

Halbleiter oder Isolator vorausgesetzt.

4.6.1 Exakte Symmetrisierung beim Standard-EXX-Verfahren

Formuliert man Gleichung (1.94) speziell f¨

ur periodische Randbedigungen und spaltet

dabei gem¨

aß Abschnitt 3.2 alle Brillouin-Zonen-Integrale auf in eine Summe ¨

uber den

reduzierten k-Punkt-Satz {k1,...,kNred }und eine zweite Summe ¨

uber die Punkttransfor-

mationen {S1,...,SNPS }im reziproken Raum (die von den r¨

aumlichen Punkttransforma-

tionen unabh¨

angige Zeitumkehrsymmetrie (3.7) sei also darin enthalten), erh¨

alt man

vx[ρ](r) = Zd3r′χ−1

0(r,r′) ∆ρFock(r′) (4.66)

=Zd3r′NPS

ν=1

Nred

s=1

wsχ0

Sνks−1

(r,r′)NPS

ν=1

Nred

s=1

ws∆ρFock

Sνks(r′).

Hier ist

∆ρFock(r′) := X

∆ρFock

k(r′) (4.67)

19Es wurden allerdings sp¨

ater Begr¨

undungen f¨

ur das LDA-Funktional in Form von Erhaltungss¨

atzen

gefunden, vgl. z.B. die Referenzen 5und 149.

88 4 Implementierung

occ.

2Zd3r′′hψ∗

ik(r′)G⊥

ik(r′,r′′)VFock[{ψl}]ψik(r′′) + c.c.i

|{z }

=: ∆ρFock

k(r′)

mit der in (F.1) definierten Greenschen Funktion G⊥

ikdie vom nicht-lokalen Austauschope-

rator VFock induzierte lineare Dichte¨

anderung (vgl. Abschnitt 1.6.1), und die Summation

uber kwurde in (4.66) dann mit Hilfe der ”Symmetrisierung” als

∆ρFock(r′) := X

∆ρFock

k(r′) =

NPS

ν=1

Nred

s=1

ws∆ρFock

Sνks(r′)

ausgef¨

uhrt. Der Austauschoperator selbst ist dabei durch den Kern

VFock(r,r′) := −

occ.

i,k

ψik(r)ψ∗

ik(r′)

|r−r′|=−

NPS

ν=1

Nred

s=1

occ.

ψi,Sνks(r)ψ∗

i,Sνks(r′)

|r−r′|(4.68)

gegeben. Ferner wird die lineare Antwort im hier betrachteten Unterraum gitterperiodi-

scher Ladungsdichten und Potentiale zu

χ0(r,r′) = X

occ.

unocc.

2ψ∗

ik(r)ψjk(r)ψ∗

jk(r′)ψik(r′) + ψik(r)ψ∗

jk(r)ψjk(r′)ψ∗

ik(r′)

εik−εjk

occ.

unocc.

4ψ∗

ik(r)ψjk(r)ψ∗

jk(r′)ψik(r′)

εik−εjk

|{z }

=: χ0

k(r,r′)

,(4.69)

wie den Referenzen 52 und 176 entnommen werden kann. Im letzten Schritt wurde dabei

die Zeitumkehrsymmetrie (3.7) ausgenutzt, was f¨

ur das Folgende entscheidend sein wird.

Der in (4.67) sowie (4.69) auftretende Faktor 2 resultiert aus der Summe ¨

uber den Spin.20

Insgesamt treten in (4.66) also drei Brillouin-Zonen-Integrationen auf — in ∆ρFock, in

VFock und in χ0—, die bei exakter Auswertung der Gleichung jeweils unabh¨

angig vonein-

ander ausgef¨

uhrt werden m¨

ussen. Insbesondere muss also jeder dieser Ausdr¨

ucke ”extra”

symmetrisiert werden, und erst anschließend k¨

onnen sie gem¨

aß (4.66) zu vxzusammenge-

setzt werden, das selbst nicht mehr symmmetrisiert zu werden braucht.

4.6.2 Symmetriegen¨

ahertes Standard-EXX-Verfahren

Beim symmetriegen¨

aherten EXX wird nun die Auswertung der vorangehenden Gleichun-

gen wie folgt modifiziert: Sowohl in (4.66) als auch in der rechten Seite von (4.68) wird nur

noch die Summe ¨

uber den reduzierten k-Punkt-Satz ber¨

ucksichtigt, die Summation ¨

uber

die Punkttransformationen Sνhingegen entf¨

allt. Im Allgemeinen besitzen aber dann die

Ausdr¨

ucke (4.67) bis (4.69) f¨

ur sich selbst genommen nicht mehr die korrekte Symmetrie,

d.h., sie sind nicht mehr invariant gegen¨

uber den (r¨

aumlichen) Punkttransformationen des

Kristalls. Dies ¨

ubertr¨

agt sich auf das in (4.66) berechnete vx, das deswegen jetzt — im

Gegensatz zur exakten Rechnung — nachtr¨

aglich symmetrisiert wird. Man beachte, dass

diese Symmetrisierung aber keiner k-Punkt-Summation mehr zugeordnet werden kann; es

20In den Gleichungen (8) und (11) von Ref. 52 wurde dieser Faktor irrt¨

umlicherweise nicht mit angegeben,

im sp¨

ateren Verlauf jedoch implizit ber¨

ucksichtigt.

4.6 Symmetriegen¨

aherte EXX-Methode 89

werden also nur die r¨

aumlichen Punkttransformationen des Bravais-Gitters ber¨

ucksichtigt.

Ein weiteres Problem ist, wie sich gleich zeigen wird, dass das so berechnete vxkomplex-

wertig in der Ortsdarstellung ist. Um zu einem rein reellwertigen Potential zu gelangen,

werden daher die Imagin¨

aranteile abgeschnitten, d.h., k¨

unstlich zu Null gesetzt. Insgesamt

hat man also f¨

unf ¨

Anderungen zur exakten Vorgehensweise:

(i) keine Symmetrisierung von VFock

(ii) keine Symmetrisierung von ∆ρFock

(iii) keine Symmetrisierung von χ0

(iv) Wegschneiden des Imagin¨

aranteils im aus (i) – (iii) berechneten vx

(v) Symmetrisierung von vx

Dass die Punkte (i) – (iii) nicht nur auf ein r¨

aumlich nicht der Kristallsymmetrie

entsprechendes, sondern auch auf ein komplexwertiges Potential f¨

uhren, folgt aus der

Tatsache, dass das Weglassen der Symmetrisierung in (4.66) und (4.68) auch die In-

versionssymmetrie, also die Zeitumkehrinvarianz (3.7), betrifft. In einer ”gew¨

ohnlichen”

DFT-Rechnung, in der ein von der Dichte parametrisch abh¨

angendes Austausch-(Korre-

lations-)Potential verwendet wird, kann man die Zeitumkehrsymmetrie bei der Symmetri-

sierung vernachl¨

assigen: wegen |ψi,−k|2=|ψi,k|2ist es egal, ob sie in (3.12) explizit mit

einbezogen wird oder nicht, wenn nur die Gewichte wsentsprechend gesetzt werden. Auf

Grund der Orbitalabh¨

angigkeit des EXX-Formalismus ist diese Vereinfachung jetzt aller-

dings nicht mehr zul¨

assig. Tut man es — wie hier — dennoch, ¨

andern sich grundlegende

Eigenschaften der betrachteten Ausdr¨

ucke. So erkennt man leicht, dass die Eintr¨

age des

Austauschoperators (4.68) in Ortsdarstellung rein reell sind, wenn zu jedem kauch −k

ber¨

ucksichtigt wird. Geht dagegen nur noch einer dieser Punkte in die Summe ein, wird

der Operator komplexwertig. Die von ihm bewirkte Dichte¨

anderung (4.67) bleibt jedoch

weiterhin eine reellwertige Gr¨

oße, da sich der Imagin¨

arteil darin explizit wegk¨

urzt.

Nun zur linearen Antwort: Hier h¨

angt es davon ab, ob in (4.69) die obere oder die untere

Zeile benutzt wird. Enth¨

alt die Summe ksowohl als −k, sind beide Zeilen ¨

aquivalent und

reell. Entf¨

allt aber einer dieser Punkte, ist nur noch die obere reell, die untere nicht mehr.

Zudem liefert die untere Zeile dann auch keine symmetrische Matrix mehr (im reziproken

Raum ist sie entsprechend nicht mehr hermitesch, vgl. (A.10) und (A.12) in Anhang A.3).

Aus der Anwendung der so manipulierten linearen Antwort auf den — wie gezeigt —

reellwertigen Ausdruck (4.67) folgt dann unmittelbar die Komplexwertigkeit von vx.

Tats¨

achlich ist es wichtig, beim symmetriegen¨

aherten EXX die zweite Zeile von (4.69)

zu benutzen. W¨

urde man die erste verwenden, und damit also die Zeitinversionssymmetrie

aus der N¨

aherung herausnehmen, funktioniert die Methode nicht mehr. Dies gilt auch um-

gekehrt, wenn etwa VFock korrekt symmetrisiert wird, ∆ρFock und/oder χ0aber nicht. Die

Ursache f¨

ur das Funktionieren der N¨

aherung liegt also offensichtlich in einer Kompensati-

on der bei der Modifikation der Einzelausdr¨

ucke (4.67) bis (4.69) gemachten Fehler, vgl.

Tab. 4.2. Abbildung 4.8 zeigt die gute ¨

Ubereinstimmung der so generierten EXX-Potentiale

mit denen einer exakten Rechnung.

Bei der nun folgenden ¨

Ubertragung der Methode auf den variationellen Ansatz ist die

Frage also vor allem: Wie k¨

onnen die obigen Punkte (i) – (v) in dem iterativen Zyklus von

Abschnitt 4.5 ”simuliert” werden?

90 4 Implementierung

EΓ

gap [eV]

VFock symm., VFock nicht symm.,

symm. nicht symm. χ0, ∆ρFock nicht symm. χ0, ∆ρFock symm.

AlN 5.71 5.74 5.98 5.35

Ge 0.99 0.83 1.06 0.72

Si 3.23 3.06 3.32 2.97

GaAs 1.55 1.38 1.70 1.21

Tabelle 4.2: EXX-Bandl¨

ucken verschiedener Halbleiter am Γ-Punkt bei exakter Handhabung der Sym-

metrisierung (Spalte 2) und mit dem symmetriegen¨

aherten Verfahren (Spalte 3). Wird VFock symmetri-

siert, χ0und ∆ρFock hingegen nicht, sind die Bandl¨

ucken stets etwas zu groß (Spalte 4), im umgekehrten

Fall zu klein (Spalte 5). Es wurden KLI-Pseudopotentiale benutzt und ferner der Korrelationsanteil des

LDA-Funktionals verwendet (außer f¨

ur GaAs, wo keine Korrelation ber¨

ucksichtigt wurde).

Al N

-10

-5

Austauschpotential [eV]

LDA

EXX

EXX (sym.-genähert)

Ge Ge

-5

Si Si

-5

Abbildung 4.8: EXX-Potentiale von AlN (links), Ge (mitte) und Si (rechts) bei exakter Handhabung

der Symmetrie (gr¨

un) sowie bei Verwendung des symmetriegen¨

aherten Verfahrens (rot). Zum Vergleich

ist auch das LDA-Potential mit eingezeichnet (blau).

4.6.3 ¨

Ubertragung auf das variationelle EXX-Verfahren

Das Minimierungsprinzip (2.6) — der Ausgangspunkt der variationellen EXX-Formulie-

rung — stellt letztlich nur eine sehr verknappte Form der OEP-Gleichung (1.96) dar (vgl.

Abschnitt 2.2). Um nun ein analoges Prinzip f¨

ur das symmetriegen¨

ahrte EXX zu entwerfen,

erscheint es daher am einfachsten, auch hier nicht von der expliziten EXX-Gleichung (4.66)

auszugehen, sondern die ¨

aquivalente OEP-Gleichung zu betrachten. Dies hat insbesondere

den Vorteil, dass χ0dabei nicht invertiert wird, und dessen ¨

Anderungen daher mit de-

nen der anderen Gr¨

oßen zusammengefasst werden k¨

onnen, wie detailliert in Anhang F

beschrieben. So findet man schließlich, dass die in (2.4) definierte induzierte Ladungsdich-

te ∆ρim Variationsprinzip (2.6) durch folgende ”modifizierte” induzierte Ladungsdichte

ersetzt werden muss:

∆ρ(r) :=

Nred

s=1

wsψ0

i,ks(r)∗ψ1

i,ks(r) + ψ0

i,ks(r)]

ψ1

i,ks(r)∗.(4.70)

4.6 Symmetriegen¨

aherte EXX-Methode 91

Wie oben bezeichnen die ksmit den zugeh¨

origen Gewichten wseinen geeigneten k-Punkt-

Satz zur numerischen Integration ¨

uber einen irreduziblen Bereich der Brillouin-Zone. Ab-

gesehen davon, dass f

∆ρnicht symmetrisiert ist, sind die linearen Korrekturen entscheidend

abge¨

andert: Statt wie eigentlich im variationellen EXX-Verfahren eine St¨

orung der Form

H1:= VFock −vxzu betrachten, sind die Korrekturfunktionen nun durch zwei verschiede-

ne St¨

orungen definiert. Die ψ1

i,ksergeben sich dabei aus einer St¨

orung des Kohn-Sham-

Systems mit H1:= VFock −2vx, und die ]

ψ1

i,kserh¨

alt man aus St¨

orung mit f

H1:= VFock.

Daher sind die beiden Summanden in (4.70) im Allgemeinen nicht komplex-konjugiert

zueinander, und f

∆ρist insgesamt eine komplexwertige Gr¨

oße. Wird f

∆ρnun im weiteren

Verlauf der Rechnung mit dem Austauschpotential gemischt (vgl. Abschnitt 4.3) erh¨

alt

man in der Folge ein komplexwertiges und nicht der Kristallsymmetrie entsprechendes

Potential in ¨

Ubereinstimmung mit den Betrachtungen des vorangehenden Abschnitts.

Dort allerdings erfolgt gem¨

aß den Punkten (iv) und (v) in jedem Schritt eine explizite

Symmetrisierung und ein Wegschneiden der Imagin¨

aranteile des Potentials. Wie in Ab-

schnitt 4.5.2 gezeigt, entsprechen allerdings die Iterationen von vxbeim Standard-EXX

nicht unmittelbar den Aktualisierungen von vxbeim variationellen Verfahren, sondern nur

jenen der ”¨

außeren Schleife”. Damit gelingt es, die Punkte (i) – (v) des vorangehenden Ab-

schnitts genau auf die variationelle Vorgehensweise zu ¨

ubertragen: in der inneren Schleife

von Flussdiagramm 4.5 wird dabei f

∆ρaus (4.70) minimiert (es sind dazu nat¨

urlich zwei

Sternheimer-Gleichungen n¨

otig), wobei ein komplexes Austauschpotential zugelassen ist.

Dies entspricht genau dem im vorigen Abschnitt mit (i) – (iii) erzeugten vx. Bevor dann

allerdings mit dem L¨

osen der Kohn-Sham-Gleichung die n¨

achste Iteration der ¨

außeren

Schleife beginnt, wird dieses Austauschpotential entsprechend den obigen Punkten (iv)

und (v) zu einem Potential mit physikalisch ”vern¨

unftiger” Gestalt (reell und symme-

trisch) modifiziert.

Kapitel 5

Variationelles und Standard-EXX:

Ein Leistungsvergleich

Wie bereits in der Einleitung formuliert, bestand das Hauptanliegen der vorliegenden Ar-

beit in der Implementierung des variationellen EXX-Verfahrens [78,79,80] in das Ebene-

Wellen-DFT-Packet S/PHI/nX [81,82], so dass es erstmalig auch an periodischen Syste-

men getestet werden kann. Hier soll nun abgesch¨

atzt werden, wie groß der daraus resultie-

rende Vorteil gegen¨

uber der Standard-Methode (Abschnitt 1.6.1) in Bezug auf die ben¨

otig-

ten technischen Anforderungen (CPU-Zeit, Speicherbedarf) tats¨

achlich ist. Das Ergebnis

einer Anwendung beider Methoden auf eine Reihe von Halbleitern ist in Tab. 5.1 zusam-

mengefasst. In allen Rechnungen wurde dabei die Symmetrie mit der in Abschnitt 4.6

besprochenen N¨

aherung behandelt.

Schon bei vergleichsweise geringen Abschneideenergien (etwa bei GaAs mit Ecut =15 Ry

und EFock

cut = 12 Ry) findet man bzgl. der pro Schritt ben¨

otigten CPU-Zeit eine Reduk-

tion um den Faktor 0.75. Der Speicherbedarf reduziert sich sogar ca. um die H¨

alfte.

Der Vorsprung wird noch gr¨

oßer bei hohen Abschneideenergien: So konnte f¨

ur GaN (mit

Ecut = 70 Ry und EFock

cut = 52 Ry) die Zeit etwa halbiert und der Speicherbedarf auf ein

Drittel reduziert werden.

Der Aufwand zur Berechnung des nicht-lokalen Austauschoperators VFock ist in beiden

Verfahren identisch. Im Standard-Verfahren macht dies ca. 50% der CPU-Zeit pro Schritt

aus, im variationellen Verfahren hingegen sind dies typischerweise zwischen 80% und 90%.

Rechnet man den Anteil von VFock heraus, ist der variationelle Ansatz damit sogar bis

zu einem Faktor 10 mal schneller als die Standard-Methode. VFock ist damit zugleich als

entscheidender Engpass der neuen Methode identifiziert.

Die Zahlen von Tab. 5.1 lassen sich also wie folgt zusammenfassen: (i) Der numeri-

sche Aufwand f¨

ur EXX l¨

asst sich durch Verwendung des variationellen Ansatzes deutlich

reduzieren. (ii) Eine weitere Reduktion des Aufwandes kann nur durch eine Optimie-

rung in der Berechnung des nicht-lokalen Austauschoperators erfolgen (vgl. dazu auch

Abschnitt 4.4.2).

94 5 Variationelles und Standard-EXX: Ein Leistungsvergleich

GaAs (15 Ry / 12 Ry) Zeit / Schritt Zeit VFock Speicher

LDA 2 s – 13 MB

Std. EXX 0120 s = 2 min 0050 s = 00 min 35 MB

Var. EXX 90 s = 01.5 min 0050 s 19 MB

Speed-Up: mit (ohne) VFock 1.33 (1.75)

Reduktionsfaktor 0 .54

Si (30 Ry / 23 Ry) Zeit / Schritt Zeit VFock Speicher

LDA 2.6 s – 53 MB

Std. EXX 1020 s = 17.0 min 0480 s = 08 min 180 MB

Var. EXX 600 s = 10 min 0480 s = 08 min 99 MB

Speed-Up: mit (ohne) VFock 1.69 (4.55)

Reduktionsfaktor 0 .55

Ge (40 Ry / 30 Ry) Zeit / Schritt Zeit VFock Speicher

LDA 4.2 s – 66 MB

Std. EXX 3900 s = 66.0 min 2040 s = 34 min 466 MB

Var. EXX 2280 s = 38 min 2040 s = 34 min 196 MB

Speed-Up: mit (ohne) VFock 1.72 (7.14)

Reduktionsfaktor 0 .42

AlN (60 Ry / 45 Ry) Zeit / Schritt Zeit VFock Speicher

LDA 3.3 s – 60 MB

Std. EXX 2280 s = 38.0 min 1200 s = 20 min 293 MB

Var. EXX 1380 s = 23 min 1200 s = 20 min 145 MB

Speed-Up: mit (ohne) VFock 1.64 (5.88)

Reduktionsfaktor 0 .49

GaN∗(70 Ry / 52 Ry) Zeit / Schritt Zeit VFock Speicher

LDA 3.7 s – 78 MB

Std. EXX 6480 s = 1.8 h 3000 s = 50 min 710 MB

Var. EXX 3360 s = 56 min 3000 s = 50 min 227 MB

Speed-Up: mit (ohne) VFock 1.92 (10.0)0

Reduktionsfaktor 0 .32

∗Semi-core-Schale ¨

uber das Pseudopotential ber¨

ucksichtigt

5 Variationelles und Standard-EXX: Ein Leistungsvergleich 95

(→S. 94)

Tabelle 5.1: Leistungsvergleich zwischen variationellem und Standard-EXX-Verfahren f¨

ur einige aus-

gew¨

ahlte Volumensysteme. Die verwendeten Abschneideenergien Ecut und EFock

cut sind jeweils in Klam-

mern angeben. Aufgelistet sind die CPU-Zeit pro Schritt, die pro Schritt f¨

ur VFock aufgewendete CPU-

Zeit (in beiden Verfahren identisch) sowie der maximal ben¨

otigte Speicherplatz. Ferner ist f¨

ur die Zeit

der Speed-Up-Faktor sowie f¨

ur den Speicherbedarf der Reduktionsfaktor im Vergleich zum Standard-

Verfahren angegeben. Ebenfalls sind die entsprechenden Werte einer LDA-Rechnung aufgef¨

uhrt.

Kapitel 6

Physikalische Bedeutung

der induzierten Ladungsdichte

Vergleicht man Ladungsdichteverteilungen miteinander, die sich aus einer DFT-LDA-

Rechnung und einer DFT-EXX-Rechnung ergeben, so zeigt sich, wie bereits in Ref. 52

beschrieben, ein allgemeiner Trend: Die Ladungsdichte ist in EXX st¨

arker lokalisiert als

in LDA. Beim Halbleiterkristall ist dies besonders deutlich auf den Bindungen zu er-

kennen (vgl. Abb. 6.2 oben, 6.3 und 6.4 auf den folgenden Seiten), f¨

ur Atome ist ein

ahnliches Verhalten bekannt [44,45,72,73]. Diese Beobachtung l¨

asst sich leicht deuten,

wenn man bedenkt, dass im EXX/OEP-Formalismus die elektronische Selbstwechselwir-

kung vollst¨

andig eliminiert ist, vgl. Abschnitt 1.6. In LDA, wo dies nicht der Fall ist, stellt

die Selbstwechselwirkung ein (unphysikalisches) Kraftfeld dar, durch das die Elektronen

in Regionen hoher Ladungsdichte zu weit voneinander ”abgedr¨

angt” werden: die Ladungs-

dichte erscheint dadurch homogener. Folglich f¨

uhrt eine Herausnahme dieser Kraft durch

EXX/OEP dann umgekehrt zu einer st¨

arkeren Lokalisierung.

0,02

0,01

-0,01

]Bohr[r

ind. Ladungsdichte

1234 5

Abbildung 6.1: Radialanteil r2∆ρ[vLDA

x]der in-

duzierten Ladungsdichte beim Ne-Atom. Die Dich-

te konzentriert sich st¨

arker in Richtung des Kerns.

(Nach Wahn und Neugebauer [78])

Als die Gr¨

oße, die im variationellen

EXX-Verfahren f¨

ur die Herausnahme der

Selbstwechselwirkung ”sorgt”, l¨

asst sich die

induzierte Ladungsdichte ∆ρ[vx] identifi-

zieren. Nach dem Variationsprinzip (2.6)

verschwindet sie nur f¨

ur vx=vEXX.

Setzt man dagegen vx=vLDA

x, so illus-

triert nebenstehende Abb. 6.1 recht an-

schaulich den verursachten Effekt am Bei-

spiel des Ne-Atoms: ∆ρ[vLDA

x] verschiebt

Ladungsdichte von ¨

außeren Bereichen hin

zum Kern, die Lokalisierung der Dichte

nimmt dadurch insgesamt zu. Obwohl nun

∆ρ[vLDA

x] gem¨

aß ihrer Konstruktion nach

Gleichung (2.4) die Ladungsverschiebung beim ¨

Ubergang vLDA

x→vEXX nur in 1. Ordnung

beschreibt, ist darin dennoch bereits alle Information f¨

ur eine vollst¨

andige Herausnahme

der Selbstwechselwirkung enthalten. Die Begr¨

undung liegt in der Linearit¨

at des EXX-

Formalismus: mit Gleichung (4.42) hat man vEXX[ρLDA] = vLDA

x+ ˆχ−1

0∆ρ[vLDA

x], wobei

die Berechnung von ˆχ−1

0im variationellen EXX-Verfahren nat¨

urlich durch einen geeigne-

ten Mixing-Prozess ersetzt wird, vgl. Abschnitt 4.3. Im daraus konstruierten Kohn-Sham-

Potential vext +vH[ρLDA]+vEXX[ρLDA]+vc[ρLDA] ist dann die Selbstwechselwirkung exakt

98 6 Physikalische Bedeutung der induzierten Ladungsdichte

Ga As

-0.02

0.02

0.04

0.06

0.08

0.1

Ladungsdichte [e- / Bohr3]

ρLDA

ρEXX

ρEXX − ρLDA

Ga As

-6

-4

-2

Austauschpotential [eV]

LDA

EXX

EXX − vx

LDA

Si Si

0.02

0.04

0.06

0.08

0.1

ρLDA

ρEXX

ρEXX − ρLDA

Si Si

-5

LDA

EXX

EXX − vx

LDA

Abbildung 6.2: Schnitt entlang der (1,1,1)-Richtung durch die Einheitszelle von GaAs (links) und Si

(rechts). Oben: Ladungsdichten in LDA und EXX sowie deren Differenzen (Differenz bei GaAs um den

Faktor 5 vergr¨

oßert dargestellt). Unten: Austauschpotentiale in LDA und EXX sowie deren Differenzen.

eliminiert,1wenngleich auch die Kohn-Sham-Gleichung noch nicht selbstkonsistent gel¨

ost

ist.

Durch das selbstkonsistente L¨

osen der Kohn-Sham-Gleichung wird die Dichte nun noch

in nicht-linearer Weise modifiziert (vgl. Abschnitt 4.3), diese ”Nachjustierungen” sind je-

doch bei den hier untersuchten Systemen im Verh¨

altnis zu ∆ρ[vLDA

x] um etwa eine Gr¨

oßen-

ordnung kleiner. Abbildung 6.2 (oben) zeigt die selbstkonsistente EXX-Ladungsdichte

(gr¨

un) im Vergleich mit der LDA-Ladungsdichte (blau) f¨

ur die Halbleiter GaAs und

Si. Bemerkenswert ist, dass die Ladungsverschiebung (rot) beim ¨

Ubergang LDA →EXX

außerst klein gegen¨

uber der eigentlichen Ladungsverteilung ist, w¨

ahrend die entsprechen-

de Differenz zwischen EXX- und LDA-Austauschpotential etwa von gleicher Gr¨

oßenord-

nung wie das Austauschpotential selbst ist (Abb. 6.2 unten). Der gleiche Trend wurde in

Ref. 78 f¨

ur Atome beschrieben. Die geringe Gr¨

oßenordung der induzierten Ladungsdich-

1Unter der Bedingung, dass die Korrelation keine zus¨

atzlichen Fehler ins Spiel bringt, also etwa beim

“exchange-only” EXX-Verfahren.

6 Physikalische Bedeutung der induzierten Ladungsdichte 99

(a) (b)

[011]

[100]

[011]

[100]

Si Si

+1,51

-0,43

-2,38

-4,32

+3,23e-3

+1,43e-3

-0,36e-3

-2,16e-3

+3,49

+1,21

-1,07

-3,35

+9,16e-3

+4,77e-3

+0,37e-3

-4,02e-3

Abbildung 6.3: Differenz zwischen EXX- und LDA-Ladungsdichte in e−/Bohr3(links) sowie zwischen

EXX- und LDA-Austauschpotential in eV (rechts) f¨

ur GaAs (oben) und Si (unten). In EXX ergibt sich

vor allem auf den Bindungen eine st¨

arkere Lokalisierung der Dichte als in LDA, entsprechend ist das

Austauschpotential in EXX gegen¨

uber dem einer LDA-Rechnung an diesen Stellen abgesenkt.

Abbildung 6.4: Isooberfl¨

ache der Differenz

zwischen EXX- und LDA-Ladungsdichte in

GaAs: ρEXX(r)−ρLDA(r) = +1.4e−/Bohr3.

Wie in den vorangehenden Abbildungen 6.2

und 6.3 erkennt man auch hier die Ladungs-

verschiebung hin zu den Bindungen.

100 6 Physikalische Bedeutung der induzierten Ladungsdichte

te ist konsistent mit der allgemein anerkannten Aussage, dass LDA- und Hartree-Fock-

Wellenfunktionen sehr ¨

ahnlich sind, vgl. z.B. Ref. 58 und 59.

Ferner wird an Abb. 6.2 auch der negativ-definite Charakter von χ0erkennbar: Die

Differenz der Austauschpotentiale (unten, rot) ergibt sich grob, außer in der N¨

ahe der

Kerne, aus der entsprechenden Ladungsdichtedifferenz (oben, rot) durch Spiegelung an der

Abszisse und Streckung in Richtung der Ordinate. Auch Abbildung 6.3 illustriert dieses

Verhalten. Nat¨

urlich liegen gerade in den Abweichungen von einer exakten Spiegelung

die wesentlichen Eigenschaften — und Schwierigkeiten — des EXX-Formalismus, denn χ0

kann eben nicht einfach durch eine geeignete Konstante gen¨

ahert werden.

Kapitel 7

EXX-Pseudopotentiale:

Linearisierung der

Austauschwechselwirkung

Die gegen¨

uber der Standard-EXX-Methode numerisch (hinsichtlich der CPU-Zeit und des

Speicherbedarfs) deutlich effizientere variationelle EXX-Methode erlaubt die Untersuchung

von Fragestellungen, die bisher nicht angegangen werden konnten. Als Beispiel soll hier un-

tersucht werden, ob sich das EXX-Potential in Bezug auf die Ladungsdichte als ann¨

ahernd

lineares Funktional betrachten l¨

asst. Von großer Bedeutung ist dies speziell im Hinblick auf

die Verwendung von EXX-Pseudopotentialen, bei denen ein Teil der semi-core-Elektronen

explizit als Valenzelektronen behandelt wird, der andere Teil jedoch im Rumpf verbleibt.

Energie [eV]

Ga3d

-5

-10

-15

-20

-25

-30

Ga4s

Ga4p

In4d

In5s

In5p

N2s

N2p

Abbildung 7.1: Eigenwerte von Ga-, In- und N-Pseudoato-

men. Getrichelte Linien: LDA-Berechnungen mit LDA-Pseu-

dopotentialen. Durchgezogene Linien: EXX-Berechnungen mit

EXX-Pseudopotentialen. Nach Ref. 169.

So verf¨

ahrt man ¨

ublicherwei-

se etwa bei den Materialien

GaN und InN, bei denen die

Zuordnung der kationischen d-

Elektronen zum Valenzbereich auf

Grund ihrer Hybridisierung mit

den 2s-Zust¨

anden des Stickstoffs

notwendig ist (vgl. Abbildung 7.1

und Abschnitt 3.4). Bei einem

”Schnitt” durch die semi-core-

Schale, wobei deren s- und p-Or-

bitale dem Rumpf, die d-Orbita-

le hingegen der Valenz zugeordnet

werden, gibt es jedoch eine starke

Uberlappung von Rumpf- und Va-

lenzladungsdichte.

Es ist daher notwendig, G¨

ultigkeit und/oder Grenzen der mit der Pseudoisierung ein-

hergehenden Linearisierung des verwendeten Austausch-Korrelationspotentials bez¨

uglich

Rumpf- und Valenzladungsdichte zu testen. Alternativ ließe sich im Prinzip auch die ge-

samte semi-core-Schale den Valenzzust¨

anden zuordnen. Dies ist aber unter numerischen

Gesichtspunkten wenig w¨

unschenswert; insbesondere in EXX stellt die dann notwendi-

ge Erh¨

ohung der Abschneideenergie wegen der ung¨

unstigen Skalierung des nicht-lokalen

Austauschoperators (vgl. Abschnitt 4.4) ein Problem dar. So lassen sich zwar Berech-

nungen von GaN und InN bei expliziter Ber¨

ucksichtung der semi-core-d-Elektronen mit

101

102 7 EXX-Pseudopotentiale: Linearisierung der Austauschwechselwirkung

EXXaEXXb

Ecut EFock

cut Espd

gap Ed

gap Espd

gap Ed

gap

60 50 1.05 0.80 0.92 0.69

80 60 1.05 0.80 0.93 0.69

80 70 0.80 0.94

100 60 1.04 0.80 0.93 0.69

100 70 0.80 0.94

100 80 1.04 0.80 0.94 0.69

120 60 1.03 0.80 0.91

120 80 1.02 0.80 0.91 0.69

Tabelle 7.1: Konvergenztest f¨

ur InN. Die Bandl¨

ucken sind in der Einheit eV angegeben, die Abschnei-

deenergien f¨

ur die Wellenfunktionen Ecut sowie den nicht-lokalen Austauschoperator EFock

cut in Ry. Die

semi-core-Schale wurde einmal vollst¨

andig (Espd

gap) und einmal nur mit den d-Elektronen (Ed

gap) in die

Valenz miteinbezogen. EXXa: LDA-Korrelation sowohl im Pseudopotential als auch in der expliziten

Berechnung. EXXb: LDA-Korrelation nur im Pseudopotential, nicht in der expliziten Berechnung.

dem Standard-EXX-Verfahren noch bew¨

altigen (vgl. Ref. 169,171), die Hinzunahme der

s- und p-Zust¨

ande ¨

ubersteigt bei vertretbarem technischen Aufwand jedoch das derzeit

Machbare.

Der genannte ”Schnitt” durch den semi-core-Bereich w¨

are allerdings gerechtfertigt,

wenn sich das Austausch-Korrelationspotential, oder zumindest dessen dominierender Au-

stauschanteil, hinreichend linear bzgl. der Ladungsdichte verh¨

alt, also die Relation (3.30)

durch

vx[ρ1+ρ2](r)≈vx[ρ1](r) + vx[ρ2](r) (7.1)

ersetzt werden kann. F¨

ur ρ1und ρ2sind hier nat¨

urlich speziell die Rumpf- und die Va-

lenzladungsdichte einzusetzen. Die Vermutung, dass das EXX-Potential (7.1) erf¨

ullt, wird

durch folgende Beobachtungen gest¨

utzt: (i) Die EXX/OEP-Gesamtenergie EEXX stimmt

stets in etwa mit der Hartree-Fock-Gesamtenergie EHF ¨

uberein, es gilt also EHF <

∼EEXX

[50,52,60,61]. (ii) Der nicht-lokale Austauschoperator kann ¨

ahnlich wie das elektrosta-

tische Potential als lineares Funktional aufgefasst werden. Tats¨

achlich besteht der Un-

terschied formal nur darin, dass das elektrostatische Potential ein Funktional der Dichte

ist, w¨

ahrend der Kern des nicht-lokalen Austauschoperators vom Dichteoperator abh¨

angt

(siehe Gleichung (1.29)). In v¨

olliger Analogie zu (3.29) ergibt sich daher mit zwei Dichte-

operatoren γ1und γ2:

vFock[γ1+γ2](x,x′) = −γ1(x,x′) + γ2(x,x′)

|r−r′|=vFock[γ1](x,x′) + vFock[γ2](x,x′).

(7.2)

Hierbei beachte man, dass der Kern des nicht-lokalen Austauschoperators spin-abh¨

angig

ist, Orts- und Spinkoordinate sind in der Variablen xzusammengefasst worden. Da sich

nun ferner das (“exchange-only”) EXX/OEP-Potential als beste lokale N¨

aherung an das

nicht-lokale Austauschpotential des Hartree-Fock-Formalismus auffassen l¨

asst (vgl. Ab-

schnitt 1.6.2), so ist zumindest naheliegend, dass sich dessen Linearit¨

at auf das EXX-

Potential ”¨

ubertr¨

agt”. Wie gut die Beziehung (7.1) f¨

ur ein gegebenes Austauschpotential

7 EXX-Pseudopotentiale: Linearisierung der Austauschwechselwirkung 103

EXXaEXXb

Ecut EFock

cut Espd

gap Ed

gap Espd

gap Ed

gap

80 60 2.75 1.57 2.65

100 60 2.54 2.75 2.43 2.65

100 80 2.53 2.75 2.44 2.65

120 60 3.21 2.75 3.03 2.65

120 70 2.81 2.65

120 80 2.84 2.75 2.71 2.65

Tabelle 7.2: Konvergenztest f¨

ur GaN. Bezeichnungen und Einheiten wie in Tab. 7.1. Die Abschnei-

deenergie des nicht-linearen Austauschoperators EFock

cut konnte auf Grund begrenzter Speicherkapazit¨

nicht ganz auskonvergiert werden.

tats¨

achlich erf¨

ullt ist, konnte mit der bisherigen Implementierung (stEXX) nicht gete-

stet werden, da die Mitnahme der energetisch tief liegenden und damit stark lokalisierten

s- und p-Orbitale der kationischen semi-core-Schale mit den zur Verf¨

ugung stehenden

Computerclustern zu aufwendig war. Mit dem im Rahmen dieser Arbeit implementier-

ten variationellen EXX-Verfahren hingegen ist dies nun m¨

oglich, indem zwei Rechnungen

durchgef¨

uhrt werden: einmal wird die semi-core-Schale nur bis zu den d-Elektronen, ein

anderes Mal insgesamt in der Valenz ber¨

ucksichtigt (im Weiteren seien daf¨

ur abk¨

urzend

die Bezeichnungen ”d-Rechnung” bzw. ”spd-Rechnung” verwendet). Ein solcher Vergleich

liefert f¨

ur das LDA-Potential eine gute ¨

Ubereinstimmung der berechneten Bandl¨

ucken, ob-

wohl LDA (sowie auch GGA) ein nicht-lineares Funktional in Bezug auf die Dichte darstellt

(bei GaN findet man eine Differenz von ca. 0.15 eV, und InN ist sowohl f¨

ur eine d- als auch

eine spd-Rechnung metallisch, vgl. Tab. 7.3). Anders die GW-Methode [150,151], deren

Selbstenergieoperator ebenfalls nicht-linear ist. Diese Methode (aufgesetzt auf eine selbst-

konsistente LDA-Berechnung) liefert f¨

ur GaN gem¨

aß Rohlfing et al. [152] einen deutlichen

Unterschied in der Bandl¨

ucke: 0.71 eV. Mit dem variationellen EXX-Verfahren l¨

asst sich

ein solcher Vergleich nun erstmalig auch f¨

ur das exakte Austauschpotential durchf¨

uhren;

die Ergebnisse sind in den Tabellen 7.1 und 7.2 in Form von Konvergenztests zusammen-

gefasst und in Tab. 7.3 im Vergleich mit den Resultaten anderer Methoden sowie dem

Experiment dargestellt.

Durchf¨

uhrung der Rechnung

Die Bandstrukturen wurden mit der in dieser Arbeit durchgef¨

uhrten und in Kapitel 4de-

tailliert beschriebenen Implementierung des variationellen EXX-Verfahrens in den DFT-

Code S/PHI/nX [81,82] berechnet. Dabei wurde allerdings auf das in Abschnitt 4.6 be-

schriebene ”symmetriegen¨

aherte EXX-Verfahren” zur¨

uckgegriffen, da bei den hier unter-

suchten Gruppe-III-Nitriden eine Symmetrisierung des nicht-lokalen Austauschoperators

wegen seines Skalierungsverhaltens im reziproken Raum (vgl. Abschnitt 4.4) nicht mit

vertretbarem Aufwand bew¨

altigt werden kann, wenn die semi-core-Schale ganz oder teil-

weise in die Valenz miteinbezogen werden soll. Die Berechnungen wurden f¨

ur die meta-

stabile [153] Zinkblende-Phase durchgef¨

uhrt. Fr¨

uhere Berechnungen in LDA [154,155]

sowie EXX+GW [169,172] (s- und p-Elektronen im Rumpfbereich) legen jedoch na-

he, dass sich die entsprechenden Bandl¨

ucken der stabilen Wurtzit-Phase daraus ablei-

104 7 EXX-Pseudopotentiale: Linearisierung der Austauschwechselwirkung

Methode semi-core InN GaN

LDA d−0.44b1.51a

LDA spd 0.0a1.66a

EXX(cLDA) – 1.49k3.52k

EXX(cLDA) d0.8a2.75a

EXX(cLDA) spd 1.02a2.84a

LDA+GW d ≈0.0c(W) 3.59d

LDA+GW spd 2.88d

EXX(cLDA)+GW d 0.53e3.07e

Experiment 0.7 – 1.0f,j(W) 3.2h

1.9g(W) 3.3i,j

avorliegende Arbeit

bRef. 168

cRef. 160,161

dRef. 152

eRef. 172

fRef. 157,158,159

gRef. 156

hRef. 162,163,164

iRef. 165,166

jRef. 167

kRef. 169

Tabelle 7.3: Bandl¨

ucken von InN und GaN in DFT-EXX(cLDA), DFT-LDA und mit der Quasiteilchen-

Methode (GW) im Vergleich mit dem Experiment. Einige Daten sind bei InN nur f¨

ur die Wurtzit-

Phase verf¨

ugbar, insbesondere auch die experimentelle Bandl¨

ucke; diese Werte sind hier durch ein W

gekennzeichnet.

ten lassen, indem ≈0.2 eV auf die Werte der Zinkblende-Phase addiert wird. Um eine

bessere Vergleichbarkeit mit dem Experiment und den Daten der meisten anderen EXX-

Berechnungen zu erm¨

oglichen, wurde jeweils die experimentelle Gitterkonstante angenom-

men (4.53 ˚

A f¨

ur GaN und 4.98 ˚

A f¨

ur InN). Es wurden normerhaltende relativistische EXX-

Pseudopotentiale benutzt [111,112], die einen LDA-Korrationsanteil besitzen. Die selbst-

konsistente Rechnung wurde sowohl mit als auch ohne LDA-Korrelation durchgef¨

uhrt. Die

Brillouin-Zonen-Integration erfolgte dabei auf einer (4×4×4)-Zerlegung nach Monkhorst

und Pack [96].

Orbitale, Ladungsdichten, etc. wurden mit Hilfe von ebenen Wellen dargestellt, da-

bei konnte die Abschneideenergie EFock

cut f¨

ur den Austauschoperator unabh¨

angig von der

Abschneideenergie Ecut der Wellenfunktionen variiert werden. Mit einem zur Verf¨

ugung

stehenden Arbeitsspeicher von maximal 4 GB ergab sich f¨

ur EFock

cut eine Obergrenze von

etwa 80 Ry. W¨

ahrend sich die spd-Rechnungen f¨

ur InN damit auf ca. 0.04 eV auskonvergie-

ren lassen (Tab. 7.1), gelingt dies f¨

ur GaN nicht mehr vollst¨

andig (Tab. 7.2). Insbesondere

scheint in dem betrachteten Bereich noch eine EFock

cut -Abh¨

angigkeit zu bestehen: mit wach-

sendem EFock

cut wird die Bandl¨

ucke geringer. Entsprechnde spd-Rechnungen in LDA zeigen,

dass bei GaN mindestens Ecut ≈140 Ry notwendig ist; damit w¨

are gem¨

aß Abschnitt 4.5.1

ein EFock

cut >

∼100 Ry erforderlich. Die anschließende Diskussion soll in Bezug auf GaN daher

als Hinweis verstanden werden, der unter dem Vorbehalt steht, dass endg¨

ultige Klarheit

erst durch eine zuk¨

unftige genauere Rechnung erlangt werden kann. Dies l¨

asst sich nach

gegenw¨

artigem Ermessen am schnellsten durch einen Wechsel der Basisdarstellung des

nicht-linearen Austausch-Operators erreichen (vgl. Abschnitt 4.4.2).

Ergebnisse und Diskussion

Aus Tab. 7.3 ist ersichtlich, dass sich die Band¨

ucken einer d-Rechnung und einer spd-

Rechnung bei InN um etwa 0.2 eV voneinander unterscheiden. F¨

ur GaN kann der Diffe-

renzbetrag auf Grund des oben Genannten nicht pr¨

azise angegeben werden, die besten

verf¨

ugbaren Rechnungen (Ecut = 120, EFock

cut = 80, vgl. Tab. 7.2) lassen jedoch hier sogar

auf eine Differenz von weniger als 0.1 eV schließen. Beachtet man, dass f¨

ur Bandstrukur-

7 EXX-Pseudopotentiale: Linearisierung der Austauschwechselwirkung 105

Ga N

-1

partielle Ladungsdichte [e- / Bohr3]

cut

rspd

cut

rspd

cut

Band 5-10 (spd-Rechng.)

Band 1-6 (d-Rechng.)

Differenz

In N

-0.2

0.2

0.4

0.6

0.8

1.2

partielle Ladungsdichte [e- / Bohr3]

rspd

cut rd

cut

rspd

cut

Band 5-10 (spd-Rechng.)

Band 1-6 (d-Rechng.)

Differenz

Abbildung 7.2: Partielle Ladungsdichten entlang der (1,1,1)-Richtung durch die Einheitszelle von GaN

(oben) und InN (unten). Im Bereich der Bindung und des N-Atoms stimmen die partiellen Ladungsdich-

ten einer d- und einer spd-Rechnung weitgehend ¨

uberein. Die Abweichungen im Bereich der Kationen

werden durch Pseudopotentialeffekte verursacht, vgl. Abb. 7.3. Die Abschneideradien rcut

dund rcut

spd

kennzeichnen den Bereich der kationischen Pseudopotentiale, die f¨

ur die d- bzw. spd-Rechnung ver-

wendet worden sind.

106 7 EXX-Pseudopotentiale: Linearisierung der Austauschwechselwirkung

0 1 2 3

r [Bohr]

partielle Ladungsdichte [e- / Bohr3]

rspd

cut rd

cut

Orbital 5-10

Orbital 1-6

0 1 2 3

r [Bohr]

0.25

0.5

0.75

1.25

1.5

partielle Ladungsdichte [e- / Bohr3]

rspd

cut rd

cut

Orbital 5-10

Orbital 1-6

Ga In

Abbildung 7.3: Partielle Ladungsdichte der 3d- und 4s-Elektronen des Ga-Atoms (links) bzw. der 4d-

und 5s-Elektronen des In-Atoms (rechts). Blaue Kurven: Explizite Ber¨

ucksichtigung aller semi-core-

Elektronen. Rote Kurven: Die s- und p-Elektronen der semi-core-Schale wurden nur implizit ¨

uber das

Pseudopotential ber¨

ucksichtigt. Wie in Abb. 7.2 kennzeichnen rcut

dund rcut

spd die Bereiche der Pseudo-

potentiale, die f¨

ur die d- bzw. die spd-Rechnung benutzt worden sind. Innerhalb der Abschneideradien

ergeben sich Unterschiede der berechneten Ladungsdichten, die in etwa den Differenzen entsprechen,

die in Abb. 7.2 um die Kationen entstehen. Dies zeigt, dass es sich bei den Differenzen um reine

Pseudopotentialeffekte handelt.

berechnungen mit Hilfe von Pseudopotentialen 0.2 eV ohnehin als Toleranz anzunehmen

sind, wird die Vermutung eines linearen EXX-Potentials (7.1) durch diese Untersuchun-

gen sehr gut best¨

atigt. Sieht man von dieser Toleranz ab, liefern die spd-Rechnungen in

beiden F¨

allen eine geringe ¨

Offnung der Bandl¨

ucke im Vergleich zu den entsprechenden

d-Rechnungen. Im Falle von GaN ergibt sich damit eine leichte Verbesserung hin zum ex-

perimentellen Resultat (vgl. Tab. 7.3), f¨

ur InN wird die Bandl¨

ucke (nach ”Umrechnung”

auf die Wurtzitstruktur durch Addieren von 0.2 eV, siehe oben) im Vergleich zu den ex-

perimentellen Werten zwischen 0.7 und 1 eV [157,158,159] etwas ¨

ubersch¨

atzt.

Die Linearit¨

at von vEXX sollte sich andererseits auch an der Ladungsdichteverteilung

uberpr¨

ufen lassen, insbesondere an dem Anteil, der durch die Wellenfunktionen der d-

B¨

ander gegeben ist. W¨

are n¨

amlich das EXX-Potential nicht linear, sollte die dann un-

zul¨

assige Separation in Valenz- und Rumpfelektronen zu einer Verzerrung der tats¨

achli-

chen Gestalt dieser partiellen Dichte f¨

uhren. Die s- und p-B¨

ander der semi-core-Schale

sind sowohl f¨

ur GaN als auch InN weit von den dar¨

uberliegenden d-B¨

andern entfernt;

ihr Anteil kann daher leicht von der Gesamtladungsdichte einer spd-Rechnung abgezogen

werden. Eine saubere Trennung der d-B¨

ander vom 2s-Band des Stickstoffs gelingt dage-

gen auf Grund der Hybridisierung der beteiligten Orbitale nicht. In Abb. 7.2 wird daher

die partielle Ladungsdichte betrachtet, die sich aus den kationischen semi-core-d-B¨

andern

und dem N-2s-Band ergibt. Tats¨

achlich erweist sich diese Dichte, wie die Abbildung il-

lustriert, f¨

ur beide untersuchten Halbleiter sowohl im Bereich der Bindung als auch im

Bereich des Stickstoff-Atoms als weitgehend unabh¨

angig davon, ob sie mit einer d- oder

einer spd-Rechnung erzeugt worden ist. In einem Bereich um das jeweilige Kation aller-

dings ergeben sich Differenzen. Gibt es also doch Gebiete, in denen sich vEXX nicht linear

verh¨

alt? Dazu beachte man, dass die beobachteten Differenzen auch von Pseudopotential-

7 EXX-Pseudopotentiale: Linearisierung der Austauschwechselwirkung 107

Ga N

-0.2

-0.1

0.1

0.2

ρEXX − ρLDA [e- / Bohr3]

rspd

cut rd

cut

rspd

cut

∆ρ (spd-Rechng.)

∆ρ (d-Rechng.)

In N

-0.06

-0.04

-0.02

0.02

ρEXX − ρLDA [e- / Bohr3]

rspd

cut rd

cut

rspd

cut

∆ρ (spd-Rechng.)

∆ρ (d-Rechng.)

Abbildung 7.4: Differenz zwischen der EXX-Ladungsverteilung und der LDA-Ladungsverteilung entlang

der (1,1,1)-Richtung durch die Einheitszelle von GaN (oben) und InN (oben). ¨

Ahnlich wie in Abb. 7.2

f¨

ur die Dichten ergeben sich auch f¨

ur die induzierten Ladungsdichten nur im Bereich der kationischen

Pseudopotentiale (gekennzeichnet wie in Abb. 7.2) nennenswerte Unterschiede.

108 7 EXX-Pseudopotentiale: Linearisierung der Austauschwechselwirkung

effekten herr¨

uhren k¨

onnen, sich also zumindest zu einem Teil auch als numerische Arte-

fakte erkl¨

aren lassen. Um dies zu verdeutlichen, wurden in Abb. 7.2 die Abschneideradien

der verwendeten Pseudopotentiale mit eingezeichnet. Innerhalb der so markierten Pseudo-

potentialbereiche weichen aber nun die berechneten Dichteverteilungen bekanntermaßen

von den tats¨

achlichen Dichten betr¨

achtlich ab (vgl. Abb. 3.2). Folglich sind insbesondere

bei Verwendung unterschiedlicher Pseudopotentiale (wie hier bei einer d- und einer spd-

Rechnung) die berechneten (partiellen) Dichten innerhalb dieser Bereiche nicht miteinan-

der vergleichbar. Dieser Effekt ergibt sich bereits bei der Berechnung des freien Atoms,

wie Abb. 7.3 zeigt. Dies ist ein deutlicher Hinweis darauf, dass f¨

ur die in Abb. 7.2 beobach-

teten Differenzen in der Tat zum großen Teil Pseudopotentialeffekte verantwortlich sind

und daher nicht auf eine Nichtlinearit¨

at des EXX-Potentials in diesem Bereich geschlossen

werden kann.

Ein ¨

ahnliches Bild ergibt sich, wenn man die Ladungsdichtedifferenzen zwischen einer

EXX- und einer LDA-Rechnung betrachtet, vgl. Abb. 7.4. Außerhalb des Pseudopoten-

tialbereichs findet man wiederum eine weitgehende ¨

Ubereinstimmung zwischen der indu-

zierten Ladungsdichte einer d-Rechnung und einer spd-Rechnung. Dabei zeigt sich wie

bereits in den Resultaten von Kapitel 6, dass Ladungsdichte aus der Umgebung des An-

ions verschoben wird in den Bereich der Bindung, was als Herausnahme der elektronischen

Selbstwechselwirkung interpretiert werden kann. Es ist zu erwarten, dass die Herausnahme

der Selbstwechselwirkung auch zu einer st¨

arkeren Lokalisierung der semi-core-Schale selbst

f¨

uhrt, wie es etwa die induzierten Ladungsdichten der d-Rechnungen nahelegen (Abb. 7.4,

rote Kurven). Da sich dieser Effekt jedoch im Bereich der hier benutzten Pseudopotentiale

abspielt, wie abermals durch die eingezeichneten Abschneideradien verdeutlicht, l¨

asst er

sich in diesem Rahmen nicht hinreichend genau analysieren — dies ist allerdings f¨

ur die

untersuchte Fragestellung auch nicht erforderlich.

Zusammenfassend kann Folgendes gesagt werden: (i) Die vorliegenden Ergebnisse zei-

gen, dass es sich beim EXX-Potential um ein zumindest n¨

aherungsweise linear von der

Dichte abh¨

angendes Funktional handelt; dies folgt sowohl aus einem Vergleich der aus

einer d- bzw. einer spd-Rechnung resultierenden Bandl¨

ucken (Differenz ca. 0.2 eV) sowie

auch aus einem Vergleich der entsprechenden Ladungsdichten und induzierten Ladungs-

dichten. Die G¨

ultigkeit von EXX-Rechnungen, die die s- und p-Zust¨

ande nur ¨

uber das

Pseudopotential ber¨

ucksichtigen, wird damit best¨

atigt, was entscheidend f¨

ur die k¨

unftigen

Anwendungsm¨

oglichkeiten der (trotz der variationellen Formulierung ja immer noch sehr

teuren) EXX-Methode ist. (ii) Diese n¨

aherungsweise Linearit¨

at des EXX-Potentials f¨

uhrt

bei der Verwendung von EXX-Pseudopotentialen zu einem g¨

anzlich anderen Verhalten als

die (nicht-lineare) GW -Methode, denn letztere erweist sich als stark abh¨

angig davon, wie

die Zuordnung der Elektronen zu Rumpf- und Valenzbereich erfolgt: je nach Zuordnung

der kationischen s- und p-Zust¨

ande der semi-core-Schale ergibt sich bei GaN eine Diffe-

renz von 0.71 eV in der Bandl¨

ucke (GW basierend auf einer LDA-Rechnung) [152]. F¨

ur die

Zukunft verbleibt zu untersuchen, wie sich eine GW-Korrektur auf die hier berechneten

EXX-Bandl¨

ucken auswirkt.

Teil II

Wannier-Funktionen

109

Kapitel 8

Verallgemeinerte

Wannier-Funktionen als

lokalisierte ab-initio-Basis im

Modell starker Bindung

In Kapitel 3wurden — in Verbindung mit normerhaltenden Pseudopotentialen — die

ebenen Wellen als eine geeignete Basis zur Beschreibung periodischer Systeme vorgestellt.

Ebenen Wellen sind, ebenso wie die anderen in Abschnitt 3.3 erw¨

ahnten Basiss¨

atze (z.B.

den LAPWs), vollst¨

andig in dem Sinne, dass sich die Qualit¨

at einer Rechnung systematisch

durch Hinzunahme von mehr Basisfunktionen verbessern l¨

asst. F¨

ur die Berechnung sehr

großer Systeme, so z.B. von Quantenpunkten mit einer Anzahl von typischerweise 103bis

105Atomen, erweist sich die Verwendung einer vollst¨

andigen Basis jedoch als zu aufwendig;

eine Behandlung des Problems mit der heute zur Verf¨

ugung stehenden Computertechnik

w¨

are nicht machbar, insbesondere, wenn man an den optischen Eigenschaften interessiert

ist und daher zur genauen Beschreibung der elektronischen Struktur der EXX-Formalismus

herangezogen werden soll. In dieser Arbeit wurde daher eine ab-initio-Parametrisierung

im Modell starker Bindung (engl.: tight-binding approach, TB) entwickelt [122] und in die

DFT-Bibliothek S/PHI/nX [81,82] eingebaut. Dieser Zugang erlaubt es, die Genauigkeit

von Berechnungen auf atomistischer Skala auf Systeme mesoskopischer Gr¨

oßenordnung

zu ¨

ubertragen. Ferner sind die hier durchgef¨

uhrten Untersuchungen auch als erste Vor-

arbeiten dahingehend zu verstehen, die Berechnung des nicht-lokalen Austauschoperators

VFock — und damit die bei Verwendung des variationellen EXX-Verfahrens (Teil I) letzte

gr¨

oßere Schwierigkeit der EXX-Methode — effizienter zu gestalten. Die Methode soll nun

in diesem Kapitel vorgestellt werden.

Wie in der Einleitung bereits erw¨

ahnt, er¨

offnen den Ansatz dazu die von Marzari

und Vanderbilt entwickelten Verallgemeinerten Wannier-Funktionen (GWFs, von amer.:

Generalized Wannier functions) [116,117], die im n¨

achsten Abschnitt vorgestellt werden:

Uber eine unit¨

are Transformation mit der Bloch-Basis einer bestimmten, linearen Teil-

menge T ⊆ H des Hilbertraums Hverbunden1, spannen die Verallgemeinerten Wannier-

1Ist man beispielsweise — wie in dieser Arbeit — an den optischen Eigenschaften eines Halbleiterkristalls

interessiert, wird Tsinnvollerweise aus den Bloch-Zust¨

anden der (oberen) Valenzb¨

ander und (mindestens)

des untersten Leitungsbands aufgespannt.

111

112 8 Verallgemeinerte Wannier-Funktionen als lokalisierte ab-initio-Basis ...

Funktionen ebenfalls genau den Teilraum Tauf. Zur Darstellung von Funktionen oder

Operatoren in Tsind Bloch- und Wannier-Basis also v¨

ollig gleichwertig, ein Wechsel zwi-

schen ihnen stellt keine N¨

aherung dar!

Dies beinhaltet aber auch, dass beide Basen gleich m¨

achtig sind; wollte man also al-

le Matrixelemente eines Operators berechnen, h¨

atte man durch den Basiswechsel noch

nichts erreicht. Jedoch ist die unit¨

are Transformation nicht eindeutig festgelegt. Daraus

ergeben sich Freiheiten, die zu unterschiedlichen Lokalisierungen der Verallgemeinerten

Wannier-Funktionen f¨

uhren. W¨

ahlt man die Basistranformation daher so, dass die Lokali-

sierung maximal ist, ist umgekehrt die r¨

aumliche ¨

Uberlappung zweier ausreichend entfernt

liegenden Funktionen minmal. Ein Operator in der Darstellung solcher maximal lokalisier-

ten Wannier-Funktionen [116] sollte also nur f¨

ur Matrixelemente benachbarter Basisfunk-

tionen eine (wesentlich) von Null verschiedene Gr¨

oßenordnung aufweisen, alle anderen

Elemente hingegen k¨

onnten vernachl¨

assigt werden. Anders ausgedr¨

uckt, Verallgemeinerte

Wannier-Funktionen sollten sich f¨

ur die Verwendung als Basisfunktionen im Modell der

starken Bindung eignen. Ob und wie gut dies gelingt, wird in den Abschnitten 8.2 bis 8.4

anhand von GaAs, GaN und InN aufgezeigt.

8.1 Verallgemeinerte Wannier-Funktionen

8.1.1 Definition

Die Verallgemeinerten Wannier-Funktionen ergeben sich aus einer Erweiterung des Kon-

zepts der ”klassischen”, von G. H. Wannier 1937 zur Beschreibung angeregter Zust¨

ande in

kristallischen Isolatoren eingef¨

uhrten und nach ihm benannten Wannier-Funktionen [118].

Letztere sind definiert als Fourier-Transformation eines Energiebandes der Bloch-Zust¨

an-

de ψnkin der Brillouin-Zone, wobei der Quasi-Wellenvektor kin den Gittervektor R

uberf¨

uhrt wird:2

|nRi:= Ω

(2π)3ZBZ

e−iR·k|ψnkid3k , (8.1)

wobei Ω das Volumen der Einheitszelle ist und das Integral ¨

uber die Brillouin-Zone (BZ)

ausgef¨

uhrt wird. Tats¨

achlich birgt diese Definition Schwierigkeiten hinsichtlich der Normie-

rung, vgl. Anhang H.3, um Analogie zu den hier zitierten Ver¨

offentlichungen zu wahren,

sei sie jedoch auch hier verwendet. Die inverse Relation ergibt sich daraus durch Multipli-

kation mit eiR·k′und anschließende Summation ¨

uber die Gittervektoren:

|ψnki=X

eiR·k|nRi.(8.2)

Da die Fourier-Transformation eine unit¨

are Transformation ist, bilden die Wannier-Funk-

tionen ein vollst¨

andiges Orthonormalsystem im Hilbertraum H:

hnR|n′R′i=δn,n′δR,R′,

∞

n=1 X

R|nRihnR|=1.(8.3)

Nun sind (normierte) Eigenzust¨

ande eines Operators nur bis auf Phasenfaktoren genau

bestimmt, daraus ergeben sich Freiheiten bei der Wahl der Bloch-Funktionen:

|ψnki −→ eiθ(n,k)|ψnki,(8.4)

2Man beachte: Es wird nicht ein Blochzustand |ψnkifouriertransformiert, wie etwa in (3.18), sondern

tats¨

achlich das Band in dem Sinne, dass (8.1) eine Linearkombination (Superposition) aus den Bloch-

zust¨

anden dieses Bandes darstellt.

8.1 Verallgemeinerte Wannier-Funktionen 113

wobei θeine beliebige reelle Funktion von nund kist. W¨

ahrend |eiθ(n,k)ψnk(r)|2aller-

dings invariant gegen¨

uber der Wahl von θist, trifft dies f¨

ur das Quadrat der resultie-

renden Wannier-Funktionen nicht mehr zu, vielmehr l¨

asst sich ihre Form und r¨

aumliche

Ausdehnung durch θbeeinflussen.

Eine praktische Schwierigkeit bei der Bestimmung der Wannier-Funktionen besteht

darin, dass die B¨

ander einer elektronischen Struktur im Allgemeinen nicht isoliert sind,

sondern an vielen Stellen Kreuzungen und Ber¨

uhrungspunkte (Entartungen) mit anderen

B¨

andern aufweisen. Eine Gruppe3solcher sich ¨

uberlagernder B¨

ander stellen z.B. die obe-

ren drei Valenzb¨

ander von GaAs dar, w¨

ahrend das untere Valenzband keine Entartungen

enth¨

alt und daher ein isoliertes Band ist (vgl. Abb. 8.5). Nur auf Letzteres l¨

asst sich daher

(8.1) direkt anwenden, f¨

ur die anderen stellt sich die Frage, auf welche Weise den Energien

die Bandindizes zugeordnet werden sollen.

Durch eine Verallgemeinerung von (8.4) l¨

asst sich dieses Problem jedoch umgehen.

Sei dazu eine Gruppe von NB¨

andern betrachtet, die in der Bandstruktur keine gemein-

samen Punkte mit energetisch h¨

oher oder tiefer liegenden B¨

andern besitzt. O.B.d.A. sei

der Bandindex mohne R¨

ucksicht auf die Gestalt der B¨

ander an jedem k-Punkt in ener-

getisch aufsteigender Reihenfolge festgelegt, wobei die Numerierung bei 1 beginne. Die

Menge der entsprechenden Blochfunktionen spannt im Hilbertraum Heinen Unterraum

T:= span{|ψnki|n∈ {1,...,N},k∈BZ}auf. Zus¨

atzlich zur Freiheit bei der Wahl der

Phasenfaktoren sei nun auch eine Durchmischung der B¨

ander an einem k-Punkt zugelas-

sen: (8.4) wird erweitert zu

|ψnki −→

m=1

mn|ψmki,(8.5)

wobei die Uk

mn einen Satz unit¨

arer (N×N)-Matrizen darstellen. Durch diese so genannte

Eichtransformation werden die Blochfunktionen also zun¨

achst bzgl. des Bandindex trans-

formiert. Anschließend erfolgt genau wie in (8.1) noch eine Fouriertransformation bzgl. k.

Damit ergeben sich insgesamt die Verallgemeinerten Wannier-Funktionen [116] zu

|nRi:= Ω

(2π)3ZBZ

e−iR·k

m=1

mn|ψmki.(8.6)

Die Hintereinanderschaltung unit¨

arer Transformationen ist wiederum unit¨

ar, daher bleibt

bei einem Basiswechsel gem¨

aß (8.6) der Teilraum Tinvariant. Unterteilt man die gesamte

Bandstruktur geeignet in solche Gruppen von B¨

andern, gilt f¨

ur die Verallgemeinerten

Wannier-Funktionen daher ebenfalls (8.3).

Der Einfachheit halber soll sich der Begriff ”

Wannier-Funktion” im weiteren Kontext

dieser Arbeit immer auf diese Definition (8.6) beziehen. Funktionen im Sinne von (8.1)

seien als ”klassische Wannier-Funktionen” bezeichnet. Nat¨

urlich sind sie ein Spezialfall

von (8.6), wenn n¨

amlich alle Uk

mn diagonal gew¨

ahlt werden.

In Ortsdarstellung k¨

onnen alle Wannier-Funktionen zu festem ndurch Translation

ineinander ¨

uberf¨

uhrt werden:

hr|nRi=hr−R|n0i.(8.7)

Daher reicht es h¨

aufig aus, nur die der ”Heimatzelle” R=0zugeordnete Wannier-Funk-

tion |n0izu betrachten. Der Beweis dieser Relation findet sich in Anhang H. Ferner ist

3Um Verwirrungen zu vermeiden: Der Begriff ”Gruppe” steht hier nicht mit dem gleichnamigen Begriff

aus der Gruppentheorie in Zusammenhang.

114 8 Verallgemeinerte Wannier-Funktionen als lokalisierte ab-initio-Basis ...

die Ladungsdichte in einem Halbleiter- oder Isolatorkristall invariant gegen¨

uber unit¨

aren

Transformationen der Ein-Teilchen-Wellenfunktionen, es gilt also

ρ(r) = Ω

(2π)3

occ

nZBZ |ψnk(r)|2=

occ

R|hr|nRi|2.(8.8)

Lokalisierte Wannier-Funktionen lassen sich als Orbitale interpretieren, die denen des in

der Chemie gebr¨

auchlichen Bildes zur Beschreibung kovalenter oder ionischer Bindungen

entsprechen. Verallgemeinerte wie auch klassische Wannier-Funktionen sind aber im All-

gemeinen keine Eigenfunktionen des Hamilton-Operators mehr.

Die hier beschriebene Vorgehensweise funktioniert zun¨

achst nur f¨

ur eine Gruppe von

B¨

andern, die durch eine Energiel¨

ucke von anderen B¨

andern isoliert ist. Sind die betrachte-

ten B¨

ander jedoch Teil einer gr¨

oßeren Gruppe zusammenh¨

angener B¨

ander — z.B. bei der

Betrachtung eines Metalls —, l¨

asst sich mit einem in Ref. 117 vorgeschlagenen Algorith-

mus eine physikalisch sinnvolle Zuordnung des Bandindex erreichen: Beim ¨

Ubergang von

einem k-Punkt zum n¨

achsten wird die Zuordnung stets so gew¨

ahlt, dass die B¨

ander dabei

”m¨

oglichst stetig” verlaufen. Der Schwerpunkt der hier durchgef¨

uhreten Untersuchengen

lag jedoch auf einer m¨

oglichst guten Beschreibung der Bandl¨

ucke in der Umgebung des

Γ-Punktes, die Wahl der B¨

ander konnte dabei leicht manuell erfolgen.

8.1.2 Lokalisierung

Die Transformation (8.4) bzw. ihre Verallgemeinerung (8.5) beeinflussen die Gestalt und

damit die Lokalisierung der Wannier-Funktionen. Um zur Generierung einer TB-Basis

m¨

oglichst lokalisierte Wannier-Funktionen aufzufinden, muss ”Lokalisierung” zun¨

achst ge-

eignet definiert werden. In Ref. 116 wird dazu das Quadrat einer Wannier-Funktion im

Ortsraum als Verteilung aufgefasst, deren Varianz bzgl. der Variablen rdann zur Definition

der Streuung

S({Uk}) :=

n=1 hnR|r2|nRi−hnR|r|nRi2(8.9)

verwendet wird. Dies ist die Summe der Varianzen aller NWannier-Funktionen in der

Einheitszelle. Je kleiner die Streuung S, umso gr¨

oßer ist die Lokalisierung der Wannier-

Funktionen. Die Streuung wurde hier gleich als Funktion der Ukgeschrieben, da sie ¨

uber

die Wannier-Funktionen implizit von der Wahl der Basistransformation (8.6) abh¨

angt.

Wegen (8.7) gen¨

ugt es, diesen Ausdruck f¨

ur R=0auszuwerten.

F¨

ur das Weitere erweist es sich als vorteilhaft, die in (8.9) ben¨

otigten ersten beiden

Momente der ”

Wannier-Verteilung” im reziproken Raum darstellen zu k¨

onnen. Man findet

f¨

ur das erste Moment

hrin:= hn0|r|n0i= i Ω

(2π)3ZBZhunk|∇k|unkid3k(8.10)

und f¨

ur das zweite Moment

hr2in:= hn0|r2|n0i=−Ω

(2π)3ZBZhunk|∇2

k|unkid3k , (8.11)

wobei die unk(r) = e−ik·rψnk(r) die periodischen Anteile der nach (8.5) transformier-

ten Blochzust¨

ande bezeichnen [119]. hrinkennzeichnet den ”Schwerpunkt” der Wannier-

Funktion |n0i.

8.1 Verallgemeinerte Wannier-Funktionen 115

Um diese beiden Ausdr¨

ucke auch numerisch auf einem diskreten k-Punkt-Gitter aus-

werten zu k¨

onnen, wird eine einfache Finite-Differenzen-Darstellung des Nabla-Opera-

tors ∇kbenutzt, bei der f¨

ur einen Punkt kdie Differenzen ∆kizu den n¨

achsten Nach-

barst¨

utzstellen ber¨

ucksichtigt werden. Eine solche Darstellung ist in Ref. 116 f¨

ur kubische

Systeme explizit angegeben. Setzt man diese Finite-Differenzen-Formeln in (8.10) und

(8.11) ein, erh¨

alt man zwar im Limes immer dichterer Aufl¨

osungen der Brillouin-Zone

(∆ki→0) wieder die exakten Ausdr¨

ucke, f¨

ur diskrete Gitter jedoch erh¨

alt man bei einer

Verschiebung der Blochfunktionen um einen Gittervektor R0,

ψnk(r)−→ ψnk(r−R0) = e−iR0·kψnk(r),

nicht mehr die erwartete analoge Translation der Wannier-Funktionen

hr|nRi −→ hr−R0|nRi.(8.12)

Korrektes Transformationsverhalten kann aber auch bei den diskretisierten Ausdr¨

ucken

erreicht werden, indem sie n¨

amlich in h¨

oherer Ordnung der ∆kimodifiziert werden. Der

Grenz¨

ubergang ∆ki→0zur exakten Differentiation wird dadurch nicht ge¨

andert. Dis-

kretisierte Versionen von (8.10) und (8.11), die die Relation (8.12) erf¨

ullen, sind gegeben

mit

hrin≈ − 1

i,k

wi∆kiIm ln Mk,∆ki

nn (8.13)

und

hr2in≈1

i,k

win(1 −|Mk,∆ki

nn |2) + (Im ln Mk,∆ki

nn )2o,(8.14)

wobei if¨

ur jedes kdie n¨

achsten Nachbarst¨

utzstellen abz¨

ahlt, die jeweils noch mit einem

Faktor wigewichtet werden, und die Mk,∆ki

nn als Diagonalelemente der durch

Mk,∆ki

mn := humk|un,k+∆kii(8.15)

definierten ¨

Uberlapp-Matrix gegeben sind. Sie sind ein Maß f¨

ur die Unterschiedlichkeit

des periodischen Anteils der Blochfunktionen beim ¨

Ubergang von einem Punkt kzum

Nachbarpunkt k+ ∆ki.

8.1.3 Maximale Lokalisierung

Um nun ¨

uber ein Variationsverfahren zu maximal lokalisierten Wannier-Funktionen zu

gelangen, muss der Gradient des Streufunktionals (8.9) bzgl. der Transformationsmatri-

zen Ukbekannt sein. F¨

ur ein diskretes k-Punkt-Gitter sei dessen Herleitung hier grob

skizziert. Die ¨

Anderung der Streuung h¨

angt ¨

uber die ersten beiden Momente (8.13) und

(8.14) von der ¨

Anderung der ¨

Uberlapp-Matrix (8.15) ab. Sie l¨

asst sich berechnen, indem

zun¨

achst ”infinitesimal kleine” Transformationen

exp{∆Wk}=1+ ∆Wk+ h¨

ohere Ordnungen in ∆Wk(8.16)

betrachtet werden. Damit die Transformationen unit¨

ar sind, m¨

ussen die ∆Wkantihermi-

tesch sein; es soll also (∆Wk)+=−∆Wkgelten, vgl. z.B. Ref. 125. In linearer Ordnung

wird (8.5) damit zu

|ψnki −→ |ψnki+

m=1

∆Wk

mn|ψmki,(8.17)

116 8 Verallgemeinerte Wannier-Funktionen als lokalisierte ab-initio-Basis ...

woraus sich die ¨

Anderung der ben¨

otigten ¨

Uberlapp-Matrixelemente ergibt:

hunk|−

m=1

(∆Wk

nm)∗humk|! |un,k+∆ki+

m=1

∆Wk+∆k

mn |um,k+∆ki!(8.18)

=Mk,∆k

nn +

m=1

Mk,∆k

nm ∆Wk+∆k

mn −

m=1

(∆Wk

nm)∗Mk,∆k

|{z }

= ∆Mk,∆k

+ quadr. Term .

Benutzt man dies in (8.13) und (8.14), erh¨

alt man schließlich, nach einigen algebraischen

Umformungen und dem Grenz¨

ubergang ∆Wk→0, einen Ausdruck f¨

ur den Gradienten

der Streuung:

Gk:= dS

dWk= 4 X

wihA(Rk,∆ki)−S(Tk,∆ki)i.(8.19)

Dabei bezeichnen S(B) := (B+B+)/2i und A(B) := (B−B+)/2 den symmetrischen

bzw. antisymmetrischen Anteil einer Matrix B. Ferner gilt

Rk,∆k

nm := Mk,∆k

mn (Mk,∆k

nn )∗

und

Tk,∆k

nm := Mk,∆k

Mk,∆k

(Im ln Mk,∆k

nn + ∆k·hrin).

Streng genommen ist (8.19) nicht der Gradient von Sbzgl. der unit¨

aren Transfomatio-

nen Uk, sondern der Gradient im Raum ihrer (durch i dividierten) Erzeugenden4. Die

Transformationen selbst sind dann analog zu (8.16) durch exp{Gk}gegeben. Im Raum der

Erzeugenden l¨

asst sich nun zur Minimierung des Streufunktionals das Steepest-Descent-

Verfahren (vgl. Abschnitt 4.1.2.1) anwenden. Dazu folgt man iterativ dem Gradienten in

kleinen Schritten ε Gk

s. Im Raum der unit¨

aren Transformationen wiederum ergeben sich

die Schritte dann rekursiv durch

s+1 := Uk

sexp{ε Gk

s}.(8.20)

Die Exponentialfunktion der antihermiteschen Matrizen Gk

skann durch Diagonalisierung

berechnet werden kann, vgl. z.B. Ref. 123.

Interessanterweise m¨

ussen w¨

ahrend der Minimierung keine Aktualisierungen der Ba-

sisfunktionen vorgenommen werden: im Iterationszyklus werden nur die Gr¨

oßen Uk

s,Gk

und Mk,∆k

sben¨

otigt. Anschließend k¨

onnen gem¨

aß (8.6) die Wannier-Funktionen in einem

Schritt aus den selbstkonsisten Ukberechnet werden. Aktualisierungen der ¨

Uberlapp-

Matrix sind dabei durch

Mk,∆k

s= (Uk

s)+Mk,∆k

0Uk+∆k

s(8.21)

gegeben. Diese letzte Beziehung macht das Verfahren sehr effizient, da — bis auf den

Initialisierungschritt — die aufwendige Berechnung nach (8.15) durch eine einfache Ma-

trizenmultiplikation ersetzt wird. Eine Herleitung von (8.21) findet sich in Anhang H.2.

8.1 Verallgemeinerte Wannier-Funktionen 117

(a) (b)

Abbildung 8.1: Das As-Atom und seine Bindungen zu den vier benachbarten Ga-Atomen im idealen

GaAs-Kristall. Gauß-f¨

ormige Ansatzfunktionen |gnif¨

ur die sp3-hybrid-artigen Wannier-Funktionen sind

(a) auf der Bindung genau in der Mitte zwischen zwei Nachbaratomen bzw. (b) auf der der Bindung

gegen¨

uberliegenden Seite des Anions positioniert, die Positionen (a) und (b) gehen dabei gerade durch

Spiegelung am As-Atom auseinander hervor. Es ist jeweils nur eine Ansatzfunktion gezeigt; bei der

Initialisierung sind die anderen entsprechend der tetraedrischen Symmetrie angeordnet. Die sich aus

diesen Ans¨

atzen ergebenden Wannier-Funktionen sind in Abb. 8.2 gezeigt.

8.1.4 Initialisierung

Um die Konvergenz des Verfahrens zu beschleunigen und um Nebenminima des Streuungs-

funktionals (8.9) zu vermeiden, sollte in (8.20) mit einem Startpunkt Uk

0begonnen werden,

der sich in der N¨

ahe des globalen Minimums befindet. Dazu macht man, geleitet beispiels-

weise durch die chemische Intuition, zun¨

achst grobe Ans¨

atze f¨

ur die Wannier-Funktionen,

die etwa durch geeignet positionierte, linear unabh¨

angige Gauß-Funktionen gnrealisiert

werden k¨

onnen, vgl. Abb. 8.1. Diese Ansatzfunktionen werden dann in zwei Schritten

in eine Orthonormalbasis des interessierenden Unterhilbertraums T:= span{|ψnki|n∈

{1,...,N},k∈BZ}(vgl. Abschnitt 8.1.1)¨

uberf¨

uhrt. Zun¨

achst erfolgt dazu eine Projek-

tion auf die Bloch-Basis:

|φnki=

m=1 |ψmkihψmk|gni.(8.22)

Dies wird anschließend noch mit Hilfe einer L¨

owdin-Transformation orthonormalisiert:5

|˜

ψnki=

m=1 1

√Pmn |φmkimit Pmn := hφmk|φnki.(8.23)

Da sowohl (8.22) als auch (8.23) Basistransformationen in Tsind und das Ergebnis eine

Orthonormalbasis darstellt, folgt, dass ihre Hintereinanderschaltung unit¨

ar ist. Die Start-

punkte in (8.20) sind damit durch

(U0)k

mn :=

µ=1 hψmk|gµi1

√Pµn

(8.24)

4Unter der ”Erzeugenden” einer unit¨

aren Transformation Usei hier ein hermitescher Operator Tmit

U= exp{iT}verstanden. Der Operator iTist dann antihermitesch, vgl. Gleichung (8.16).

5Die L¨

owdin-Transformation [120,121] ist ein Orthonormalisierungsverfahren, bei dem die Symmetrie-

eigenschaften des urspr¨

unglichen Basissatzes erhalten bleiben. Die Transformation (8.22) geschieht ganz

analog dazu, wie etwa die (nicht-orthonormalen, aber in der Symmetrie des Bravais-Gitters angeordneten)

atomaren Orbitale (AO) mittels der L¨

owdin-Transformation in LCAO-Orbitale ¨

uberf¨

uhrt werden k¨

onnen.

Physikalisch sinnvolle Ans¨

aze {gn}f¨

ur die Wannier-Basis werden im Allgemeinen ebenfalls die Symmetrie

des Bravais-Gitters widerspiegeln.

118 8 Verallgemeinerte Wannier-Funktionen als lokalisierte ab-initio-Basis ...

gegeben. In der Praxis erh¨

alt man bereits allein durch Anwendung dieser Uk

0in (8.6)

sehr lokalisierte Wannier-Funktionen. Der anschließende Iterationsprozess gem¨

aß (8.20)

”schiebt” dann gewissermaßen nur noch kleinere Ausl¨

aufer der Wannier-Funktion in den

Hauptbereich der Lokalisierung. V¨

ollig lassen sich solche Nebenausl¨

aufer jedoch nicht ver-

meiden (vgl. z.B. Abb. 8.2,8.6 und 8.7); sie sorgen f¨

ur die Orthogonalit¨

at der Wannier-

Funktionen untereinander.

8.2 Ab-initio-Parametrisierung im Modell starker Bindung

Als Parameter im Modell starker Bindung seien hier die Matrixelemente des Hamilton-

Operators in der Darstellung einer stark lokalisierten Wannier-Basis bezeichnet. Mit der

Definition der Verallgemeinerten Wannier-Funktionen (8.6) findet man die Matrixelemente

hnR|H|n′R′i=Ω2

(2π)6

m=1 Zeik·(R−R′)(Uk

mn)∗Uk

mn′εmkd3k , (8.25)

wobei die εmkdie (mit den Blochfunktionen konsistenten) Ein-Teilchen-Energien sind.

F¨

ur |R−R′|= 0 erh¨

alt man Wechselwirkungen zwischen Wannier-Orbitalen, die der sel-

ben Einheitszelle Rzugeordnet sind, |R−R′|>0 beschreibt Wechselwirkungen zwischen

Atomen verschiedener Einheitszellen. Im Gegensatz zur Darstellung in klassischen Wan-

nier-Funktionen verschwinden hier Elemente mit n6=n′im Allgemeinen nicht. Dies ist

eine Folge der Durchmischung der B¨

ander gem¨

aß (8.5) (vgl. Anhang H.3, wo auch die

Herleitung von (8.25) angegeben ist).

Die Effizienz der Wannier-Funktionen als TB-Basis h¨

angt nun davon ab, wieviele

Wechselwirkungen bei einer Diagonalisierung des (Wannier-)Hamilton-Operators explizit

ber¨

ucksichtigt werden m¨

ussen, oder anders formuliert, ab welcher Distanz Rmax Wech-

selwirkungen zwischen verschiedenen Zellen vernachl¨

assigt werden k¨

onnen. Ein geeigne-

tes Kriterium, um die Genauigkeit des Parametersatzes in Abh¨

angigkeit von Rmax zu

testen, ergibt sich aus einem Vergleich der originalen Bandstruktur mit der aus den

TB-Parametern berechneten. Letztere ergibt sich dabei aus der Diagonalisierung einer

k-abh¨

angigen Matrix Ekmit den Elementen

nn′≈NRX

|R|<Rmax

e−ik·RhnR|H|n′0i,(8.26)

wobei NRdie Anzahl der Einheitszellen im periodischen Grundgebiet ist [122].6Auf Grund

der Gitterperiodizit¨

at des Hamilton-Operators und der Translationseigenschaft der Wan-

nier-Funktionen (8.7) gehen in der rechten Seite nur Wechselwirkungen zu einer beliebigen

Referenzzelle (hier R′=0) ein. Die Matrixelemente hnR|H|n′0ilassen sich dabei als Ko-

effizienten einer Fourierentwicklung der Bandstruktur auffassen: Die grobe Gestalt der

B¨

ander wird bereits durch kleine |R|festgelegt, zur Beschreibung von Details — wie etwa

den Bereich um den Γ-Punkt — sind aber auch Wechselwirkungen mit weiter entfernten

Wannier-Funktionen zu ber¨

ucksichtigen. Es sei bemerkt, dass die Gleichung exakt wird,

wenn bei der Summation alle Gittervektoren aus dem periodischen Grundgebiet zugelas-

sen werden. Nat¨

urlich ist es jedoch das Ziel bei der Konstruktion einer TB-Basis, die Ukin

(8.25) so zu w¨

ahlen, dass die Approxiation auch bei m¨

oglichst kleinem Rmax noch hinrei-

chend genau ist. Gleichung (8.26) ist ferner auch insofern interessant, als sie ein schnelles

6Eine schrittweise Herleitung der Formel findet sich in Anhang H.4.

8.3 Lokalisierung kein Maß f¨

ur die G¨

ute der Basis 119

Sampling der BZ erm¨

oglicht, ohne dabei an jedem Punkt kden vollen Hamilton-Operator

diagonalisieren zu m¨

ussen.

Ahnlich, wie in diesem Abschnitt f¨

ur den Hamilton-Operator vorgestellt, ließe sich

nun auch der nicht-lokale Austauschoperator VFock in der Basis der Wannier-Orbitale

darstellen. Wiederum w¨

are zu erwarten, dass Elemente mit gen¨

ugend großem |R−R′|

vernachl¨

assigt werden k¨

onnten. Allerdings ist zu erwarten, dass die Darstellung des Aus-

tauschoperators in der Wannier-Basis nicht so einfach gelingt wie die des Hamilton-

Operators (8.25), bei der sich ausnutzen ließ, dass die Wannier-Funktionen unit¨

are Trans-

formationen seiner Eigenfunktionen sind (vgl. Anhang H.3). Im Rahmen dieser Arbeit

wurde die ab-initio-Parametrisierung daher nur f¨

ur den Hamilton-Operator getestet.

Schema zur Konstruktion des Parametersatzes

Mit Hilfe der beiden vorangehenden Formeln l¨

asst sich nun ein Schema zur Generierung von

ab-initio-TB-Parameters¨

atzen angeben [122]. Es kann in f¨

unf Schritten zusammengefasst

werden:

(i) Berechnug der Blochzust¨

ande und Ein-Teilchen-Energien mit Hilfe eines geeigneten

N¨

aherungsverfahrens (DFT-LDA, DFT-EXX, etc.)

(ii) Wahl einer geeigneten Startkonfiguration f¨

ur die Wannier-Funktionen (vgl. Abschnit-

te 8.1.4 und 8.3)

(iii) Konstruktion einer lokalisierten Wannier-Basis gem¨

aß dem Variationsschema von

Marzari und Vanderbilt [116] (vgl. Abschnitt 8.1.3)

(iv) Berechnung der Hamilton-Matrix in der Wannier-Darstellung nach Gleichung (8.25)

(v) Mit Hilfe einer Rekonstruktion der Bandstruktur gem¨

aß (8.26)¨

uberpr¨

ufen, wieviele

Wechselwirkungen in dem Parametersatz ber¨

ucksichtigt werden m¨

ussen. Hier muss

ein sinnvoller Kompromiss zwischen der Effizienz und der Genauigkeit eingegangen

werden. Ist dies nicht m¨

oglich, muss ggf. in (ii) nach einer besseren Anfangskonfigu-

ration gesucht werden, vgl. den folgenden Abschnitt 8.3.

8.3 Lokalisierung kein Maß f¨

ur die G¨

ute der Basis

In Abschnitt 8.1.4 wurde beschrieben, wie sich mit Hilfe geschickt gew¨

ahlter Ansatz-

funktionen gngeeignete Startpunkte Uk

0f¨

ur den Maximierungsprozess der Lokalisierung

(vgl. Abschnitt 8.1.3) konstruieren lassen. Wie aber gelangt man nun zu solchen gn? Hier

wird man sich im Allgemeinen zun¨

achst von der chemischen Vorstellung leiten lassen und

Ans¨

atze f¨

ur die Wannier-Funktionen dort machen, wo man sie erwartet, beispielsweise

auf den atomaren Bindungen wie in Abbildung 8.1 (a) dargestellt. Im Rahmen dieser Ar-

beit durchgef¨

uhrte Tests [122] zeigten, dass die Qualit¨

at einer aus Wannier-Funktionen

konstruierten TB-Basis entscheidend von der Initialisierung abh¨

angen kann. Zugleich of-

fenbarten sie aber auch, dass die chemisch intuitive Wahl nicht in jedem Fall die optimalen

TB-Paramters¨

atze liefert — es erweist sich vielmehr als notwendig, die Resultate verschie-

dener Startkonfigurationen hinsichtlich ihrer Eignung als TB-Basis sorgf¨

altig miteinander

zu vergleichen. Im Folgenden sei daher exemplarisch die Situation beschrieben, die sich

bei der Untersuchung des GaAs-Volumensystems ergab:

120 8 Verallgemeinerte Wannier-Funktionen als lokalisierte ab-initio-Basis ...

=⇒S= 29.2 Bohr2

(a) (b)

=⇒S= 28.8 Bohr2

Abbildung 8.2: Zwei verschiedene Wannier-Basen in GaAs. Oben: F¨

ur diesen Satz erfolgte die Ini-

tialisierung der sp3-artigen Wannier-Funktionen (a) auf der Bindung (vgl. Abb. 8.1 (a)), w¨

ahrend die

s∗-artige Funktion (b) direkt auf dem Ga-Atom initialisiert wurde. Unten: (c) Bei diesem Satz haben die

Wannier-Funktionen, die gem¨

aß Abb. 8.1 (b) initialisiert wurden, nur noch bedingt einen sp3-artigen

Charakter, da sich ihr Ladungszentrum nun auf der der Bindung gegen¨

uberliegenden Seite befindet.

(d) Die s∗-artige Funktion wurde wiederum auf dem Ga-Atom initialisiert. Beide Basiss¨

atze weisen in

etwa die gleiche Lokalisierung auf. Von den sp3-artigen Funktionen (links) ist jeweils nur eine der vier

tetraedrisch angeordneten Funktionen dargestellt. In Abb. 8.3 wird ihre Eignung als tight-binding-Basis

untersucht.

Gem¨

aß dem in Abschnitt 8.2 vorgestellten Schema zur Konstruktion einer ab-initio-

TB-Basis m¨

ussen zuerst die Bloch-Funktionen |ψmkierzeugt werden. Dazu wurde in ei-

ner selbstkonsistenten DFT-Rechnung zun¨

achst die Ladungsdichte berechnet, wobei die

Austausch-Korrelationswechselwirkung ¨

uber das LDA-Funktional ber¨

ucksichtigt wurde.

Die k-Punkt-Integration erfolgte mit Hilfe eines symmetriereduzierten (4 ×4×4)-Monk-

horst-Pack-Gitters, die Abschneideenergie der Ebene-Wellen-Basis betrug 15 Ry, und es

wurde die experimentelle Gitterkonstante von 10.68 Bohr benutzt. Ferner wurden mit dem

Programm fhi98PP [115] nach dem Hamann-Verfahren [110] generierte Pseudopotentiale

verwendet, wobei die Elektronen der 4. Schale des Ga-Atoms als Valenz-, alle anderen als

Rumpfelektronen behandelt wurden. Um sp¨

ater mit der TB-Basis die Bandl¨

ucke beschrei-

ben zu k¨

onnen, wurden anschließend in einer Bandstrukturrechnung Blochfunktionen und

Ein-Teilchen-Energien der vier Valenzb¨

ander und des untersten Leitungsbandes bestimmt.

Dies geschah f¨

ur die Punkte eines nicht symmetriereduzierten Monkhorst-Pack-Gitters, das

den Γ-Punkt miteinschließt.

Nun wurde zun¨

achst die Initialisierung gem¨

aß dem chemisch intuitiven Bild getestet,

das folgende Konfiguration nahe legt: Die Beschreibung der besetzten Zust¨

ande, also der

Valenzb¨

ander, sollte durch vier Wannier-Funktionen pro Einheitszelle gelingen, die eine

Gestalt ¨

ahnlich der von sp3-Hybriden aufweisen und am (elektronegativeren) Anion lo-

kalisiert sind. Da die Zentren der Ladungswolken dabei jeweils auf einer der tetraedrisch

8.3 Lokalisierung kein Maß f¨

ur die G¨

ute der Basis 121

3ΓW

-2

-1

Energie [eV]

aus Wannier-Funktionen

aus ebenen Wellen

3ΓW

-2

-1

S = 29.2 Bohr2S = 28.8 Bohr2

Abbildung 8.3: Bandstruktur von GaAs in der Umgebung des Γ-Punktes. Die durch Kreise darge-

stellte Bandstruktur (links und rechts identisch) wurde aus einer Ebene-Wellen-Darstellung berechnet

(LDA), die durchgezogenen Kurven ergeben sich aus der Wannier-Darstellung. Links: Die auf den Bin-

dungen initialisierten Wannier-Funktionen (vgl. Abb. 8.1 (a) und Abb. 8.2 oben) versagen v¨

ollig bei

der Beschreibung der Bandl¨

ucke. Rechts: Werden stattdessen Wannier-Funktionen mit vergleichbarer

Lokalisierung verwendet, die aber jeweils auf der der Bindung gegen¨

uberliegenden Seite initialisiert wur-

den (vgl. Abb. 8.1 (b) und Abb. 8.2 unten), kann eine deutlich bessere Reproduktion der originalen

Bandstruktur erreicht werden. (Anmerkung: Die Knicke einiger durchgezogener Kurven am Γ-Punkt

sind auf den gew¨

ahlten Abstand der St¨

utzstellen zur¨

uckzuf¨

uhren, sind also rein numerisch bedingt und

stellen keine durch die Wannier-Basis ins Spiel kommenden Besonderheiten dar.)

angeordneten Bindungen zu erwarten sind, erfolgte die Positionierung der entsprechen-

den Ansatzorbitale (Gauß-Funktionen) wie in Abbildung 8.1 (a) demonstriert. F¨

ur das

Leitungsband steht damit noch eine Funktion pro Einheitszelle zur Verf¨

ugung, die — sie

soll ja unbesetzte Zust¨

ande beschreiben — auf dem Kation mit einer s∗-artigen Gestalt zu

erwarten w¨

are. Die Initialisierung erfolgte demgem¨

aß durch eine Gauß-Funktion direkt auf

dem Ga-Atom. Nach Projektion auf die Blochfunktionen betrug die Streuung der so kon-

struierten Startkonfiguration 107.1 Bohr2. Sie wurde in der anschließenden Minimierung

des Funktionals (8.9) um ca. 70% auf 29.2 Bohr2reduziert, wobei die in Abbildung 8.2 (a)

und (b) dargestellten lokalisierten Wannier-Funktionen entstanden. Tats¨

achlich entspricht

deren Form und Position in etwa der im Vorangehenden beschriebenen ”naiven” Erwar-

tung, wobei um das kationische s∗-Orbital noch einige an den benachbarten N-Atomen

lokalisierte Ausl¨

aufer mit sp-Charakter gruppiert sind, die die Orthogonalit¨

at der Basis-

funktionen untereinander gew¨

ahrleisten (vgl. Abschnitt 8.1.4).

Eine weitergehende Untersuchung machte allerdings deutlich, dass die Rekonstruktion

der Bandstruktur mit Hilfe dieses Basissatzes nur ¨

außerst langsam hinsichtlich der Anzahl

der ben¨

otigten Matrixelemente gegen die originale, d.h., direkt in der Ebene-Wellen-Basis

erzeugten Bandstruktur konvergiert. Selbst wenn Rmax in Gleichung (8.26) so groß ein-

gestellt wird, dass noch Wechselwirkungen zwischen Wannier-Funktionen viert-n¨

achster

Nachbarzellen erfasst werden, misslingt die Beschreibung des f¨

ur die optischen Eigen-

schaften relevanten Bereichs der BZ um den Γ-Punkt v¨

ollig: Die Bandl¨

ucke verschwindet,

122 8 Verallgemeinerte Wannier-Funktionen als lokalisierte ab-initio-Basis ...

hhN

(a) (b)

(((

Abbildung 8.4: Oben: Optimierte Wannier-Basis in InN. (a) Vier Wannier-Funktionen in der Form von

sp3-Hybriden sind an den Anionen lokalisiert. (b) Eine weitere Funktion befindet sich auf dem Kation,

weist aber keine klar s∗-artige Gestalt auf. Unten: Optimierte Wannier-Basis in GaN. (c) Vier Wannier-

Funktionen mit sp3-Gestalt sind wiederum an den Anionen lokalisiert. (d) Die f¨

unfte Basisfunktion

besitzt hier klaren s∗-artigen Charakter, befindet sich jedoch im Gegensatz zu InN ebenfalls auf dem

Anion.

wohingegen die Entartung bei Γ anstelle der oberen drei nur zwei Valenzb¨

ander umfasst

(vgl. linke Bandstruktur in Abb. 8.3). Somit erweist sich diese Basis f¨

ur die Konstruktion

eines TB-Parametersatzes als ungeeignet.

In einer Reihe weiterer Tests wurden nun von der intuitiven Vorstellung abweichen-

de Anfangskonfigurationen untersucht. Es zeigte sich, dass eine effiziente TB-Basis (d.h.,

eine Basis, in der sich hinreichende Genauigkeit bei Ber¨

ucksichtigung m¨

oglichst weniger

Wechselwirkungen erreichen l¨

asst) mit folgender Initialisierung konstruiert werden kann:

W¨

ahrend wie zuvor eine Gauß-Funktion f¨

ur das s∗-Orbital auf dem Kation angesetzt wird,

werden die anderen vier nicht mehr auf den Bindungslinien platziert, sondern jeweils auf

der der Bindung gegen¨

uberliegenden Seite des Anions, genauer: sie gehen aus den alten

Ans¨

atzen f¨

ur die sp3-Hybride durch Spiegelung am As-Kern hervor. Dies ist in Abbil-

dung 8.1 (b) veranschaulicht. Anschließende Projektion dieser Konfiguration auf die Bloch-

funktionen und Minimierung liefert die in Abbildung 8.2 (c) und (d) gezeigten Wannier-

8.4 Optimierte Wannier-Basen f¨

ur GaN und InN 123

LΓW K Γ

-16

-12

-8

-4

Energie [eV]

aus Wannier-Funktionen

aus ebenen Wellen

LΓW K Γ

-16

-12

-8

-4

Energie [eV]

InN GaN

Abbildung 8.5: Bandstrukturen von InN (links) und GaN (rechts). Es ist jeweils das Resultat der

originalen DFT-EXX-Berechnung in ebenen Wellen (Kreise) im Vergleich mit der Rekonstruktion aus den

TB-Parametern (durchgezogene Linien) dargestellt. In den Parameters¨

atzen werden Wechselwirkungen

zwischen Wannier-Funktionen bis zu den viert-n¨

achsten Nachbarzellen ber¨

ucksichtigt. F¨

ur die Bandl¨

ucke

ergibt sich eine Abweichung von ca. 0.04 eV bei InN und ca. 0.3 eV bei GaN.

Funktionen. Die Streuung wurde dabei um ca. 80% auf 28.9 Bohr2reduziert, d.h., der

intuitive und der hier konstruierte Ansatz f¨

uhren zwar zu verschiedenen Minima des Streu-

funktionals (8.9), in beiden F¨

allen besitzen die entsprechenden Wannier-Basen aber eine

vergleichbare Lokalisierung. Die Rekonstruktion der Bandstruktur offenbart nun jedoch

den Vorteil der zweiten Wannier-Basis f¨

ur die Konstruktion eines TB-Parametersatzes:

Zumindest in der interessierenden Region um den Γ-Punkt l¨

asst sich das Resultat der

Ebene-Wellen-Rechnung deutlich besser reproduzieren (die maximale Abweichung im Be-

reich des Γ-Punkts betr¨

agt 0.11 eV), wenn in Gleichung (8.26) Wechselwirkungen noch bis

zu den viert-n¨

achsten Nachbarzellen miteinbezogen werden (vgl. rechte Bandstruktur in

Abb. 8.3).

Dieses Beispiel zeigt, dass die Lokalisierung alleine noch kein ausreichendes Kriterium

zur Generierung effizienter TB-Basen darstellt. Tats¨

achlich w¨

are auch zu erwarten, dass

ein zu beschreibender Operator Xselbst die Gestalt einer optimalen Basis beeinflusst. De-

finiert man ”Effizienz” in diesem Zusammenhang ¨

uber die Anzahl der (f¨

ur eine gegebene

Genauigkeit) ben¨

otigten Matrixelemente, ließe sich bei der Variation der unit¨

aren Trans-

formationsmatrizen Ukin (8.6) beispielsweise fordern, dass hnR|X|n′R′ials Funktion

der Gittervektoren Rund R′ein m¨

oglichst starkes Abklingverhalten bzgl. des Abstan-

des |R−R′|der Einheitszellen aufweist. Damit w¨

are etwa (8.26) automatisch optimiert,

eine Nachjustierung ”per Hand” wie oben geschildert w¨

are nicht mehr notwendig. Diese

Idee ist hier als Ausblick zu verstehen, eine Weiterentwicklung des Ansatzes geht ¨

uber die

Zielstellung dieser Arbeit hinaus.

124 8 Verallgemeinerte Wannier-Funktionen als lokalisierte ab-initio-Basis ...

8.4 Optimierte Wannier-Basen f¨

ur GaN und InN

Der in Abschnitt 8.2 vorgestellte Formalismus wurde nun auf GaN und InN in Zink-

blendestruktur angewandt [122]. Daf¨

ur wurden in einem ersten Schritt wieder die Bloch-

funktionen erzeugt. Die Vorgehensweise war dabei v¨

ollig analog wie im vorangehenden

Abschnitt f¨

ur GaAs beschrieben, allerdings wurden die DFT-Berechnungen nun mit Hil-

fe des EXX-Formalismus durchgef¨

uhrt. Wiederum wurde f¨

ur die k-Punkt-Integration ein

(4 ×4×4)-Monkhorst-Pack-Gitter verwendet, die Abschneideenergie der Ebene-Wellen-

Berechnung betrug 50 Ry f¨

ur InN und 60 Ry im Falle von GaN. Es wurden relativisti-

sche OEP-Pseudopotentiale benutzt [111,112], die d-Elektronen der Kationen wurden als

Rumpfelektronen betrachtet. Damit ergeben sich Bandl¨

ucken von 1.48 eV bei InN und

3.57 eV bei GaN. Die entsprechenden Bandstrukturen sind in Abbildung 8.5 gezeigt.

F¨

ur die Optimierung der TB-Basen wurden nun wieder verschiedene Startkonfiguratio-

nen f¨

ur die Wannier-Orbitale untersucht. Anders als bei GaAs erwies sich f¨

ur die betrach-

teten Gruppe-III-Nitride eine Initialisierung von jeweils vier Orbitalen auf den Bindungen

(analog zu Abb. 8.1 (a)) als vorteilhafter als die Initialisierung auf den gegen¨

uberliegen-

den Seiten. Nach der Minimierung wurden so in beiden Materialen zu den Anionen (N)

hin orientierte Bindungsorbitale mit deutlichen sp3-Charakter ausgepr¨

agt, vgl. Abb. 8.4.

In ¨

Ubereinstimmung mit der chemischen Vorstellung befindet sich in InN die Position

des f¨

unften Orbitals auf dem Kation (In). Seine Gestalt weicht dabei allerdings stark von

der f¨

ur ein s∗-Orbital typischen Kugelform ab (Abb. 8.4 (b)). Deutlichen s∗-Charakter

tr¨

agt hingegen das f¨

unfte Orbital der f¨

ur GaN optimierten Wannier-Basis. Seine Position

befindet sich hier jedoch entgegen der Erwartung auf dem Anion (Abb. 8.4 (d)).

Abbildung 8.5 zeigt eine sehr gute ¨

Ubereinstimmung der originalen EXX-Bandstruktur,

die mit Hilfe einer Ebene-Wellen-Rechnung erzeugt wurde, und ihrer Rekonstruktion aus

den ab-initio-TB-Parametern. Insbesondere zeigt sich, dass auch die Bandl¨

ucke mit Hil-

fe des erzeugten Paramatersatzes korrekt reproduziert werden konnte. Dies ist plausibel:

Denn w¨

ahrend die Konstruktion der Wannier-Orbitale gem¨

aß (8.6) nur von den Wellen-

funktionen abh¨

angt, die in EXX und LDA/GGA nur unwesentlich voneinander verschieden

sind, fließen in die Berechnung der ab-initio-Parameter gem¨

aß (8.25) auch die Einteilchen-

Energien ein. Der Zugang kann damit sensibel auf die durch EXX erreichte deutliche

Verbesserung der Bandstruktur reagieren, was mit den in Abb. 8.5 gezeigten Ergebnissen

gut best¨

atigt wird.

Es sei an dieser Stelle noch einmal explizit darauf hingewiesen, dass die Verwendung

von im Vergleich zu LDA/GGA sehr komplizierten und numerisch aufwendigen Funktiona-

len wie hier dem EXX-Funktional f¨

ur die Konstruktion der ab-initio-TB-Parameter keiner-

lei zus¨

atzlichen Aufwand darstellt. Sind einmal die Wellenfunktionen und die Einteilchen-

Energien bekannt, geschieht die Konstruktion der Parameter stets auf die gleiche Art und

Weise (vgl. Abschnitt 8.2), v¨

ollig unabh¨

angig von den Anforderungen, die zur Berech-

nung eben dieser Wellenfunktionen und Einteilchen-Energien vonn¨

oten sind. Die verwen-

deten Eingangsdaten m¨

ussen noch nicht einmal aus einer DFT-Rechnung herr¨

uhren, so

k¨

onnen beispielsweise Ergebnisse einer Hartree-Fock-Rechnung ebenso als Grundlage zur

Konstruktion Verallgemeinerter Wannier-Orbitale und entsprechender TB-Parameters¨

atze

dienen, einzige Bedingung ist dabei, dass sich die Wellenfunktionen der vorausgehenden

Rechung als Blochwellen (vgl. Abschnitt 3.1) darstellen lassen.

Ein interessanter Ausgangspunkt f¨

ur weiterf¨

uhrende Untersuchungen w¨

are zudem, die

Methode auch auf Ergebnisse von EXX+GW-Berechnungen aufzusetzen, eine der zurzeit

genausten Methoden zur Berechnung von Bandl¨

ucken [170,171,172,173,174,175]. Hier

8.4 Optimierte Wannier-Basen f¨

ur GaN und InN 125

ist allerdings zu beachten, dass GW nur Korrekturen zu den Einteilchen-Energien liefert,

nicht aber zu den Wellenfunktionen. Bei der Konstruktion der ab-initio-Parameter gem¨

aß

(8.25) w¨

urden die GW-Korrekturen folglich nur die Einteilchen-Energien beeinflussen, die

Wellenfunktionen w¨

aren weiterhin einer EXX-Rechnung zu entnehmen.

126 8 Verallgemeinerte Wannier-Funktionen als lokalisierte ab-initio-Basis ...

GaN

c= 0.08

c= 0.03

c= 0.02

sp3-artig s∗-artig

Abbildung 8.6: Verallgemeinerte Wannier-Orbitale in GaN (Ga: gr¨

un, N: blau) f¨

ur verschiedene

Isofl¨

achenparameter c. Linke Spalte: sp3-artiges, rechte Spalte: s∗-artiges Wannier-Orbital. Bei klei-

nen cerkennt man, dass die Funktionen neben dem Hauptlokalisierungsgebiet noch zahlreiche kleinere

Ausl¨

aufer besitzen.

8.4 Optimierte Wannier-Basen f¨

ur GaN und InN 127

InN

c= 0.06

c= 0.04

c= 0.015

sp3-artig s∗-artig

Abbildung 8.7: Verallgemeinerte Wannier-Orbitale in InN (In: rot, N: blau) f¨

ur verschiedene Isofl¨

achen-

parameter c. Linke Spalte: sp3-artiges, rechte Spalte: s∗-artiges Wannier-Orbital. Bei kleinen cerkennt

man, dass die Funktionen neben dem Hauptlokalisierungsgebiet noch zahlreiche kleinere Ausl¨

aufer be-

sitzen.

Zusammenfassung und Ausblick

Es sei zuerst eine kurze Zusammenfassunge der beiden Teile der vorliegenden Arbeit —

Variationelle EXX-Methode (Teil I), Verallgemeinerte Wannier-Funktionen als lokalisier-

te ab-initio-Basis (Teil II) — gegeben. Anschließend wird eine kurze Einordnung dieser

Arbeit in die aktuelle wissenschaftliche Entwicklung auf dem Gebiet der theoretischen

Festk¨

orperphysik versucht.

Zu Teil I (Variationelles EXX-Verfahren)

Schwerpunkt der vorliegenden Arbeit war die Entwicklung und Implementierung des varia-

tionellen EXX-Verfahrens (varEXX) [78,79,80] in einen Pseudopotential-Ebene-Wellen-

Code (S/PHI/nX [81,82]), um diese Methode, die bislang nur f¨

ur Atome und Cluster

getestet worden ist, so erstmalig auch f¨

ur periodische Systeme verf¨

ugbar zu machen.

Die Programmierung des varEXX-Verfahrens umfasste im Wesentlichen vier Schritte:

(i) Die Implementierung eines geeigneten Minimierungsverfahrens zur L¨

osung der Stern-

heimer-Gleichung (Abschnitt 4.1). Hierf¨

ur wurden verschiedene Algorithmen (Stee-

pest-Descent,Conjugate-Gradient,Preconditioned Conjugate-Gradient) getestet.

(ii) Die Erzeugung der induzierten Ladungsdichte (Abschnitt 4.2).

(iii) Ein geeignetes Verfahren f¨

ur das Mixing von Potential und induzierter Ladungs-

dichte (Abschnitt 4.3). Die prinzipielle Vorgehensweise wurde dabei zun¨

achst mit

dem einfachen Mixing untersucht. Anschließend wurde eine optimierte Version des

Pulay-Mixers an die Erfordernisse im varEXX-Verfahren angepasst. Interessanter-

weise zeigte sich dabei, dass eine Pr¨

akonditionierung des Mixers nach dem Kerker-

Schema, wie es etwa beim selbstkonsistenten L¨

osen der Kohn-Sham-Gleichung f¨

das Mischen der Ladungsdichte verwendet wird, f¨

ur das Mixen von Potential und

induzierter Ladungsdichte ungeeignet ist. Stattdessen findet man, dass durch die Be-

sonderheit des Mischens dieser unterschiedlichen Gr¨

oßen der Kerker-Ansatz bereits

implizit erf¨

ullt ist.

(iv) Die Berechnung des nicht-lokalen Austauschoperators (Abschnitt 4.4). Die numeri-

sche Auswertung dieser Gr¨

oße erweist sich aus zweierlei Gr¨

unden als sehr aufwendig:

zum einen muss die Singularit¨

at des Nenners in geeigneter Weise gehandhabt wer-

den, und zum anderen gestaltet sich die Symmetrisierung außerordentlich schwierig.

Dieser Schritt ist daher der problematischste des Verfahrens (siehe unten).

Das Verfahren wurde anschließend auf eine Reihe von Halbleitern angewandt und seine

Leistung mit der einer bereits im Code vorhandenen Implementierung des Standard-EXX-

Verfahrens verglichen. Mit dem variationellen Ansatz gelang es, die ben¨

otigte CPU-Zeit

129

130 Zusammenfassung und Ausblick

dabei ungef¨

ahr zu halbieren und den Speicherbedarf sogar auf rund 1/3 zu reduzieren.

Es zeigte sich zudem, dass varEXX umso effektiver gegen¨

uber der Standard-Methode ist,

je h¨

oher die Abschneideenergie der Ebene-Wellen-Basis angesetzt wird. Rechnet man fer-

ner den Anteil der vom nicht-lokalen Austauschoperator1ben¨

otigten CPU-Zeit heraus,

erlaubt der variationelle Zugang sogar eine Reduktion der Rechenzeit um rund einen Fak-

tor 10. Zudem erwies sich der Algorithmus als sehr stabil: In der Regel wurde ein LDA-

Austauschpotential als Start f¨

ur den selbstkonsistenten DFT-EXX-Zyklus verwendet, je-

doch zeigten Tests an GaAs, GaN und InN, dass das Verfahren auch mit der Nullfunktion

(also keinem Ansatz, der sich bereits in der N¨

ahe des exakten EXX-Potentials befindet)

als Startpunkt konvergiert.

Der Engpass des Verfahrens (vor allem hinsichtlich der CPU-Zeit) ist der nicht-lokale

Austauschoperator; zuk¨

unftige Versuche einer weiteren Effizienzsteigerung des EXX-Ver-

fahrens m¨

ussen an dieser Stelle ansetzen. Wie in Abschnitt 4.4.2 bereits angedeutet, er-

scheint dazu die Auswertung des nicht-lokalen Austauschoperators in der Ortsdarstellung

eine geeignete Maßnahme. Interessant w¨

are es auch, zu untersuchen, inwieweit sich durch

die Verwendung einer Basis Verallgemeinerter Wannier-Funktionen (siehe unten) Vorteile

in Bezug auf die Handhabung dieses Operators erzielen lassen.

Der erste Teil der Arbeit schließt mit einer Untersuchung der Linearit¨

at des exak-

ten Austauschpotentials als Funktional der Ladungsdichte. Speziell wurde am Beispiel

von GaN und InN untersucht, ob die bei der Verwendung von Pseudopotentialen bei die-

sen Materialien ¨

ubliche Aufspaltung in Rumpf- und Valenzelektronen im Bereich der so

genannten semi-core-Schale (s- und p-Schale in den Rumpf, d-Schale in die Valenz) hin-

sichtlich des exakten Austauschpotentials zul¨

assig ist. Die Ergebnisse entsprechender DFT-

EXX-Rechnungen wurden daf¨

ur mit denen von Berechnungen verglichen, die die gesamte

semi-core-Schale des Kations in der Valenz ber¨

ucksichtigen. Diese f¨

ur eine Absch¨

atzung

der Leistungsf¨

ahigkeit der EXX-Methode insgesamt sehr wichtigen Untersuchungen wur-

den erstmalig durch den im Rahmen dieser Arbeit implementierten varEXX-Formalismus

erm¨

oglicht. Durch die errechneten Daten wird die Annahme gest¨

utzt, dass es sich beim

EXX-Potential um ein zumindest ann¨

ahernd lineares Funktional der Dichte handelt. Zwar

ergeben sich kleine Differenzen in der Bandl¨

ucke (ca. 0.2 eV bei InN), jedoch muss bei Ver-

wendung von Pseudopotentialen ohnehin von einer Fehlertoleranz in dieser Gr¨

oßenordnung

ausgegangen werden. Insbesondere wurde sowohl mit als auch ohne Ber¨

ucksichtung der

d-Elektronen in der Valenz eine weitgehende ¨

Ubereinstimmung der Ladungsdichtevertei-

lung gefunden (abgesehen von Bereichen in unmittelbarer N¨

ahe der Kationen-Kerne, in

denen man wegen der durch die Pseudopotentiale verursachten Verzerrungen auch keine

Vergleichbarkeit erwarten kann).

Die gefundenen Ergebnisse zeigen, dass sich EXX-Berechnungen damit anders verhal-

ten als die nicht-linear konzipierte GW -Methode: Entsprechende GW-Resultate auf der

Basis von DFT-LDA-Berechnungen (LDA+GW) f¨

ur GaN zeigen, dass sich bei dieser Me-

thode die Bandl¨

ucke dieses Halbleiters bei Hinzunahme der d-Zust¨

ande in die Valenz um

0.71 eV verringert (vgl. Rohlfing et al. [152]).

1Der nicht-lokale Austauschoperator wird sowohl im Standard- als auch im variatonellen EXX-Verfahren

ben¨

otigt.

Zusammenfassung und Ausblick 131

Zu Teil II (Verallg. Wannier-Funktionen als lokalisierte ab-initio-Basis)

Hier wurde eine im Rahmen dieser Arbeit entwickelte Konstruktionsmethode f¨

ur ab-initio-

Basiss¨

atze im Tight-Binding-Modell [122] vorgestellt. Die Methode benutzt die Ergebnisse

(Wellenfunktionen und Einteilchen-Energien) einer vorausgehenden Berechnung des ent-

sprechenden (periodischen) Systems als Eingangsdaten. Daraus werden mit Hilfe einer

systematischen Konstruktionsvorschrift zun¨

achst Verallgemeinerte Wannier-Orbitale und

anschließend TB-Parameter erzeugt. Hierbei werden keinerlei empirischen Anpassungen

o.¨

A. vorgenommen, d.h., die erzeugten TB-Parameter sind reine ab-initio-Gr¨

oßen (un-

ter der Voraussetzung, dass die vorausgehende Berechnung der Wellenfunktionen und

Einteilchen-Energien ebenfalls ab-initio erfolgte). Als großer Vorteil der Methode kann wei-

terhin gewertet werden, dass die Konstruktion der ab-initio-Parameter v¨

ollig unabh¨

angig

von der speziellen Wahl des Verfahrens zur Erzeugung der Eingangsdaten ist: So bedeutet

etwa die Konstruktion eines ab-initio-Parametersatzes auf Grundlage einer DFT-EXX-

Rechnung keinen Mehraufwand gegen¨

uber einer entsprechenden Konstruktion aus DFT-

LDA-Daten. Neuartige Verfahren, die ¨

uber Standard-DFT-Funktionale hinausgehen, las-

sen sich also sehr einfach in diesen Formalismus integrieren. Schließlich ist zu betonen, dass

durch die ab-initio-Konstruktion die Genauigkeit der jeweils zu Grunde liegenden Daten in

den Parameters¨

atzen ”konserviert” wird. Mit Hilfe von TB-Parametern, die etwa aus einer

EXX-Rechnung gewonnen wurden, lassen sich somit wieder die EXX-Bandl¨

ucken reprodu-

zieren. Die Bedeutung der in dieser Arbeit entwickelten TB-Methode liegt nun darin, dass

sie eine M¨

oglichkeit er¨

offnet, die Genauigkeit von Berechnungen ¨

uber EXX- und andere

komplizierte Funktionale, deren direkte Anwendung mit der derzeitigen Computerleistung

nur auf Systeme mit wenigen Atomen beschr¨

ankt ist, auf mesoskopische Skalen mit ca.

10 000 Atomen (z.B. Quantenpunkte) ¨

ubertragen zu k¨

onnen.

Das Verfahren wurde im Rahmen der Arbeit an GaAs, GaN und InN in der Zinkblende-

Phase getestet. Mit einer DFT-Rechnung wurden dazu in einem ersten Schritt Ein-Teilchen-

Zust¨

ande und -Energien erzeugt. Durch die Verwendung von EXX-Funktionalen erh¨

alt

man dabei einen TB-Parametersatz, der f¨

ur die Berechnung optischer Matrixelemente

geeignet ist (siehe oben). Anschließend wurde die Basis der Eigenfunktionen (oder ein

geeigneter Unterraum) durch eine unit¨

are Transformation in eine Basis Verallgemeinerter

Wannier-Funktionen ¨

uberf¨

uhrt. Bei dieser Transformation entsteht kein Verlust an Genau-

igkeit. Die Lokalisierung der Wannier-Funktionen l¨

asst sich ¨

uber ihre Varianz (Streuung)

im Ortsraum messen; eine Minimierung dieses Funktionals f¨

uhrt auf Wannier-Funktionen

mit maximaler Lokalisierung, die daher als Tight-Binding-Orbitale einsetzbar sind. Ei-

ne Darstellung des Hamilton-Operators in dieser Basis liefert Tight-Binding-Parameter,

deren Genauigkeit sich leicht durch die Anzahl der ber¨

ucksichtigten N¨

achste-Nachbar-

Wechselwirkungen kontrollieren l¨

asst.

Erste Tests an GaAs offenbarten jedoch, dass die Minimierung der Varianz kein ausrei-

chendes Kriterium f¨

ur die Erzeugung effizienter Tight-Binding-Parameters¨

atze darstellt.

Verschiedene S¨

atze Verallgemeinerter Wannier-Funktionen mit vergleichbarer minimaler

Streuung, jedoch sehr unterschiedlicher Konvergenz bzgl. der N¨

achsten-Nachbar-Wechsel-

wirkung wurden gefunden, indem die Minimierung von verschiedenen Anfangskonfigura-

tionen aus gestartet wurde. Dies zeigt die Notwendigkeit sorgf¨

altiger Tests der Anfangs-

konfiguration bei der Konstruktion der Orbitale.

Die optimalen Wannier-Orbitale, die dabei f¨

ur InN gefunden wurden, stehen im Ein-

klang mit der chemischen Intuition: es ergeben sich vier sp3-artige Orbitale, die jeweils

am Anion lokalisiert sind, und ein s∗-artiges Orbital auf dem Kation. F¨

ur GaN ergeben

sich zwar ebenfalls vier auf den Anionen platzierte sp3-artige Orbitale, die s∗-artigen Or-

132 Zusammenfassung und Ausblick

bitale sind hier aber, im Gegensatz zur chemischen Intuition, ebenfalls auf den Anionen

lokalisiert.

Eine Weiterentwicklung der Methode k¨

onnte darin bestehen, nicht die Lokalisierung der

Wannier-Funktionen zu minimieren, sondern etwa bei der unit¨

aren Transformation auf die

Wannier-Basis zu fordern, dass die Matrixelemente des betrachteten Operators (z.B. des

Hamilton-Operators) in dieser Darstellung ein m¨

oglichst starkes Abklingverhalten bzgl.

des Abstandes |R−R′|der Gittervekoren aufweisen. Diese Strategie w¨

urde automatisch

auf einen optimierten Tight-Binding-Parametersatz f¨

uhren.

Einordung der Arbeit in die aktuelle Forschung

Die Situation zu Beginn der vorliegenden Untersuchungen l¨

asst sich etwa wie folgt um-

reißen: In der Kohn-Sham-Dichtefunktionaltheorie wurden eine Vielzahl von Austausch-

Korrelationsfunktionalen entwickelt (LDA, GGAs), die zwar effiziente Berechnungen er-

lauben, aber f¨

ur Fragestellungen, die eine genaue Beschreibung der Bandl¨

ucke von Isolato-

ren und Halbleitern ben¨

otigen (bspw. optische Eigenschaften des Materials), zu ungenau

sind. Demgegen¨

uber steht das EXX-Funktional, das insbesondere in Kombination mit ei-

ner anschließenden GW-Korrektur ¨

außerst genaue Vorhersagen der Bandl¨

ucke erm¨

oglicht,

das andererseits aber so hohe numerische Anforderungen stellt, dass die Anwendung auf

einfachste Systeme beschr¨

ankt bleibt (siehe Einleitung), und damit ein Einsatz bei kom-

plexeren Untersuchungen nicht m¨

oglich ist.

Hier setzt nun die vorliegende Arbeit an: Es konnte gezeigt werden, dass sich durch

die Verwendung einer alternativen, variationellen Formulierung des EXX-Verfahrens der

ben¨

otigte numerische Aufwand auch f¨

ur periodische Systeme drastisch reduzieren l¨

asst.

Durch den variationellen Ansatz gelingt es, zwei der drei Engp¨

asse der originalen For-

mulierung (Greensche Funktion, Inversion der linearen Antwort, nicht-lokaler Austausch-

operator) durch numerisch einfache Minimierungsverfahren zu ersetzen, was ca. eine Ver-

dopplung der Rechengeschwindigkeit bei weniger als einem Drittel des ben¨

otigten Speicher-

platzes erm¨

oglicht. Ohne die f¨

ur den Austauschoperator — des nun einzig verbleibenden

Engpasses — ben¨

otigte Zeit gemessen, l¨

asst sich sogar eine bis zu ca. 10 mal schnellere

Rechenzeit erzielen (siehe oben).

Die M¨

oglichkeiten f¨

ur den praktischen Einsatz von EXX-Potentialen wurden damit

entscheidend erweitert, so dass nun neue und deutlich komplexere Fragestellungen an-

gegangen werden k¨

onnen. Im Rahmen dieser Arbeit wurde dies am Beispiel von EXX-

Pseudopotential-Berechnungen f¨

ur GaN und InN demonstriert, die sich erstmalig unter

Mitnahme der kationischen s- und p-semi-core-Schalen in der Valenz durchf¨

uhren ließen.

Vor allem aber sei an dieser Stelle hervorgehoben, dass sich durch die variationelle EXX-

Methode zugleich auch der Anwendungsbereich von EXX+GW vergr¨

oßert — eines der

zurzeit pr¨

azisesten Verfahren zur Bestimmung von Bandstrukturen und Gegenstand akti-

ver Forschung [170,171,172,173,174,175]. Nicht zuletzt zeigt auch der im zweiten Teil

der Arbeit entwickelte ab-initio-TB-Ansatz eine Richtung auf, wie sich die Genauigkeit

von EXX- und anderen ¨

uber herk¨

ommliche DFT-Funktionale hinausgehenden Potentialen

effizient sogar auf Systeme mesoskopischer Gr¨

oßenordung ¨

ubertragen l¨

asst.

Anh¨

ange

133

Anhang A

Fourier-Entwicklungen einiger

wichtiger Gr¨

oßen

Um Un¨

ubersichtlichkeiten durch zu viele Klammern zu vermeiden, sei das Konjugiert-

Komplexe einer Variablen in den folgenden Abschnitten durch einen Querstrich (z.B. ¯z)

bezeichnet und nicht wie sonst in dieser Arbeit ¨

ublich mit einem Sternchen (z∗).

A.1 Das Coulomb-Potential

An einigen Stellen im Text wird die Fouriertransformierte des Coulomb-Potentials benutzt.

Ihre Herleitung wird in vielen Lehrb¨

uchern, z.B. in Ref. 92, explizit vorgef¨

uhrt, daher sei

hier nur das Ergebnis zusammengefasst:

vCoul(r) := 1

r ˆvCoul(G) := 1

√ΩZ1

re−iGrd3r≈1

√Ω

4π

G2,(A.1)

wobei Ω das Volumen der durch die Vektoren a1,a2,a3aufgespannten Einheitszelle ist, vgl.

Abschnitt 3.1. Es sind zwei Schwierigkeiten zu beachten: (i) Das Coulomb-Potential vCoul

ist keine periodische Funktion; die Voraussetzung f¨

ur eine Fourierreihen-Darstellung ist

somit nicht erf¨

ullt. Wendet man den Formalismus trotzdem an, ergibt sich eine k¨

unstliche

Periodisierung des Potentials, die im Ortsraum der Superposition PRvCoul(r+R)¨

uber

alle Gittervektoren Rentsprechen w¨

urde. (ii) Auf Grund des schwachen Abfallverhaltens

von vCoul(r) geht diese Summe jedoch gegen ∞f¨

ur alle r∈IR3, was sich in der Singularit¨

von (A.1) f¨

ur die (G=0)-Komponente widerspiegelt. Man behift sich daher meist mit der

Vorstellung, dass das Volumen Ω insgesamt ladungsneutral ist, dass also zu jeder Ladung

eine entprechende Ladung mit entgegensetztem Vorzeichen existiert. Dann heben sich die

Singularit¨

aten gegenseitig weg, und es werden nur noch die Komponenten mit G6=0

ber¨

ucksichtigt. Sollen allgemeine Ergebnisse speziell f¨

ur ebene Wellen formuliert werden

— wie im Folgenden der Austauschoperator —, substituiert man daher n¨

aherungsweise

r−→ 4π

ΩX

G6=0

G2e+iGr .(A.2)

A.2 Der nicht-lokale Austauschoperator

Es sei zun¨

achst bemerkt, dass der Austauschoperator (1.27) bei einem gitterperiodischen

System zwar invariant gegen¨

uber einer gemeinsamen Transformation von rund r′nach

135

136 A Fourier-Entwicklungen einiger wichtiger Gr¨

oßen

r+Rbzw. r′+Rist, nicht jedoch gegen¨

uber einer getrennten Transformation dieser Koordi-

naten. Er ist also nicht gitterperiodisch in dem Sinne, dass VFock(r,r′) = VFock(r+R,r′) =

VFock(r,r′+R) f¨

ur alle Gittervektoren Rgilt, und kann daher streng genommen nicht ¨

uber

der Einheitszelle fourierentwickelt werden. Ebensowenig ist eine Fourierentwicklung ¨

uber

dem periodischen Grundgebiet (vgl. Abschnitt 3.1) m¨

oglich. Soll er auf eine Blochfunkti-

on ψnkangewandt werden, sind allerdings nur jene Komponenten von VFock von Interesse,

die sich aus seiner Projektion auf die |G+ki-Basis ergeben. Diese lassen sich, wie nun

gezeigt, mit Hilfe von (A.2) n¨

aherungsweise bestimmen. F¨

ur jeden k-Punkt ergibt sich

dabei ein eigener nicht-lokaler Ausdruck.1Es ist:

hG+k|VFock|G′+ki= (A.3)

ΩZZ e−i(G+k)·r−X

n,q

ψnq(r)ψnq(r′)

|r−r′|ei(G′+k)·r′d3rd3r′

ΩZZ e−i(G+k)·r−X

n,q

ΩhX

cnq(G1)ei(G1+q)·rihX

cnq(G2)ei(G2+q)·r′i

|r−r′|·

·ei(G′+k)·r′d3rd3r′.

Nun wird das Coulomb-Potential vCoul(r−r′) = |r−r′|−1durch die periodisierte Versi-

on (A.2) ersetzt. Die Entwicklung erfolgt dabei aber — abh¨

angig vom jeweiligen Summan-

den — in der |G3+ (k−q)i-Basis, um sich den mit k,qjeweils verschiedenen Perioden

der Z¨

ahler anzupassen:

hG+k|VFock|G′+ki ≈

≈ − 1

Ω2X

n,qZZ

ΩX

G1X

cnq(G1)cnq(G2)·

·e−i(G+k)·rei(G1+q)·re−i(G2+q)·r′ei(G′+k)·r′·

·4π

Ω

G3+k−q6=0

|G3+k−q|2ei(G3+k−q)·(r−r′)d3rd3r′

=−4π

Ω3X

n,qZZ

ΩX

G1X

G3+k−q6=0

cnq(G1)cnq(G2)·

·e−i(G−G1−G3)·rei(G′−G2−G3)·r′1

|G3+k−q|2d3rd3r′.

Substituiert man G′

1:= G−G1und G′

2:= G′−G2, wodurch jeweils der Summations-

bereich (alle reziproken Gittervektoren) nicht ge¨

andert wird, ergibt sich daraus

1Bei radialsymmetrischen Systemen f¨

uhrt die Darstellung des Austauschoperators mit Hilfe der Ra-

dialanteile der Wellenfunktionen in v¨

ollig analoger Weise auf einen Satz vom Drehimpuls labh¨

angender

Operatoren [78].

A.2 Der nicht-lokale Austauschoperator 137

hG+k|VFock|G′+ki ≈

≈ −4π

Ω3X

n,qX

G′

G3+k−q6=0

cnq(G−G′

1)cnq(G′−G′

2)·

·Z

Ω

e−i(G′

1−G3)·rd3r

|{z }

= Ω δG′

1G3

Ω

ei(G′

2−G3)·r′d3r′

|{z }

= Ω δG′

2G3

|G3+k−q|2

=−4π

ΩX

n,q

G3+k−q6=0

cnq(G−G3)cnq(G′−G3)

|G3+k−q|2.

Mit der Substitution G′′ := −G3erh¨

alt man schließlich

hG+k|VFock|G′+ki ≈ −4π

ΩX

n,q

k−q−G′′6=0

G′′

cnq(G+G′′)cnq(G′+G′′)

|k−q−G′′|2,(A.4)

was dem in den Referenzen 52 und 98 angebenen Ausdruck entspricht. Die Summation

uber qstellt dabei eigentlich eine Integration ¨

uber die 1. Brillouin-Zone dar, wobei ¨

uber

einen Pol 2. Ordnung hinwegintegriert wird. Eine von Gygi und Baldereschi [98] entwickelte

numerische Behandlung dieser Schwierigkeit ist in Abschnitt 4.4.1 ausgef¨

uhrt. Dort wird

die Relation

cn,k+G0(G) = cn,k(G+G0) (A.5)

verwendet, die der Vollst¨

andigkeit halber hier bewiesen werden soll. Es ist

ψn,k(r) = ψn,k+G(r)

⇐⇒ un,k(r) eik·r=un,k+G(r) ei·(k+G)r

⇐⇒ un,k+G(r) = un,k(r) e−iG·r.(A.6)

Mit der Fourierentwicklung (3.16) ergibt sich dann

cn,k+G0(G) = 1

√ΩZΩ

un,k+G0(r) e−iG·rd3r(A.7)

(A.6)

√ΩZΩun,k(r) e−iG0·re−iG·rd3r

√ΩZΩ

un,k(r) e−i·(G+G0)rd3r=cn,k(G+G0),

was zu beweisen war.

Symmetrisierung des Austauschoperators

Ben¨

otigt wird noch die Symmetrisierung des Austauschoperators, die sich aus (A.4) mit

einer Aufspaltung der Summe ¨

uber qin eine gewichtete Summe ¨

uber einen irreduziblen

Bereich der Brillouin-Zone sowie einer weiteren ¨

uber alle Punkttransformationen (vgl.

138 A Fourier-Entwicklungen einiger wichtiger Gr¨

oßen

Abschnitt 3.2) ergibt:

VFock(k,G,G′) = −4π

Ω

occ

Nred

s=1

NPS

i=1 X

G′′

cn,Siqs(G+G′′)cn,Siqs(G′+G′′)

|k−Siqs−G′′|2(A.8)

=−4π

Ω

occ

Nred

s=1

NPS

i=1 X

G′′

cn,qs(S−1

iG+S−1

iG′′)cn,qs(S−1

iG′+S−1

iG′′)

|S−1

ik−qs−S−1

iG′′|2

=−4π

Ω

occ

Nred

s=1

NPS

i=1 X

G′′

cn,qs(S−1

iG+G′′)cn,qs(S−1

iG′+G′′)

|S−1

ik−qs−G′′|2.

Die hier benutzte Relation cn,Sq(G) = cn,q(S−1G), also das Gegenst¨

uck zu (3.6) im rezi-

proken Raum, ist in Ref. 91 hergeleitet.

A.3 Die lineare Antwort

Sollen nur Potential- und Ladungsdichte¨

anderungen betrachtet werden, die periodisch mit

der Einheitszelle sind, ist die lineare Antwort f¨

ur einen nicht spin-polarisierten Halbleiter

oder Isolator in der Ortsdarstellung durch

χ0(r,r′) = 2 X

vck

ψvk(r)ψck(r)ψck(r′)ψvk(r′) + c.c.

εvk−εck

(A.9)

gegeben [52,176]. Dabei ist vder Index der Valenzb¨

ander und cder der Leitungsb¨

ander.

Im Gegensatz zum nicht-lokalen Austausch-Operator kann dieser Ausdruck exakt in den

reziproken Raum transformiert werden, da die beiden Eing¨

ange unabh¨

angig voneinander

Gitterperiodizit¨

at besitzen, d.h., es gilt χ0(r,r′) = χ0(r+R,r′) = χ0(r,r′+R) f¨

ur beliebige

Gittervektoren R. Die Fourier-Entwicklung ist dann gegeben durch

ˆχ0(G,G′) = (A.10)

=1

√Ω2ZZ

Ω

e−iG·rχ0(r,r′) e+iG′·r′d3rd3r′

ΩZZ

Ω

vck"ψvk(r) e−iG·rψck(r)·ψck(r′) e+iG′·r′ψvk(r′)

εvk−εck

+ψvk(r) e−iG·rψck(r)·ψck(r′) e+iG′·r′ψvk(r′)

εvk−εck#d3rd3r′

ΩX

vck"Zψvk(r) e−iG·rψck(r) d3rZψck(r′) e+iG′·r′ψvk(r′) d3r′

εvk−εck

+Zψvk(r) e−iG·rψck(r) d3rZψck(r′) e+iG′·r′ψvk(r′) d3r′

εvk−εck#.

A.3 Die lineare Antwort 139

Dieses Ergebnis l¨

asst sich mit der Zeitinversionssymmetrie (3.7) noch vereinfachen. Im

zweiten Summanden wird dazu die Summation ¨

uber kdurch die Summation ¨

uber −k

ersetzt (was erlaubt ist wegen k∈BZ ⇒ −k∈BZ):

ˆχ0(G,G′) = (A.11)

ΩX

vc "X

k∈BZ

Zψvk(r) e−iG·rψck(r) d3rZψck(r′) e+iG′·r′ψvk(r′) d3r′

εvk−εck

k∈BZ

Zψv,−k(r) e−iG·rψc,−k(r) d3rZψc,−k(r′) e+iG′·r′ψv,−k(r′) d3r′

εv,−k−εc,−k#

(3.7)

ΩX

vc "X

k∈BZ

Zψvk(r) e−iG·rψck(r) d3rZψck(r′) e+iG′·r′ψvk(r′) d3r′

εvk−εck

k∈BZ

Zeiαvkψvk(r) e−iG·reiαckψck(r) d3rZeiαckψck(r′) e+iG′·r′eiαvkψvk(r′) d3r′

εvk−εck#.

Die durch die Zeitumkehrsymmetrie ins Spiel gekommenen Phasenfaktoren k¨

urzen sich

gegenseitig gerade heraus; beide Summanden sind also identisch, und man erh¨

alt schließlich

ˆχ0(G,G′) = (A.12)

ΩX

vck

Zψvk(r) e−iG·rψck(r) d3rZψck(r′) e+iG′·r′ψvk(r′) d3r′

εvk−εck

oder, in einer ¨

ublichen abk¨

urzenden, jedoch nicht ganz strengen Schreibweise,

ˆχ0(G,G′) = 4

ΩX

vck

hvk|e−iG·r|ckihck|e+iG′·r|vki

εvk−εck

.(A.13)

Anhang B

Die Greensche Funktion

Greensche Funktionen werden ¨

uber so genannte Fundamentall¨

osungen linearer inhomoge-

ner Differentialgleichungen definiert. Dies sei hier nur an einem Beispiel illustriert:

Es soll etwa die L¨

osung uder Differentialgleichung

d2

dx2+ 1u(x) = f(x) (B.1)

gefunden werden. Dazu bestimme man zun¨

achst die L¨

osung Eder Gleichung, die aus (B.1)

entsteht, indem man die Inhomogenit¨

at fdurch die δ-Distribution ersetzt:

d2

dx2+ 1E(x) = δ(x).(B.2)

Ewird als Fundamentall¨

osung bezeichnet. Man erh¨

alt sie z.B. aus einer Fourier-Transfor-

mation von Gleichung (B.2):

−k2+ 1ˆ

E(k) = ˆ

δ(k) = 1

√2π.(B.3)

Umstellen nach ˆ

E(k) und inverses Fourier-Transformieren liefert dann E. Ohne Beweis sei

nun angegeben, dass man die L¨

osung der inhomogenen Gleichung (B.1) durch Faltung der

Fundamentall¨

osung mit der Inhomogenit¨

at ferh¨

alt:

u(x) = (E∗f)(x) := ZE(x−y)f(y) dy=ZG(x, y)f(y) dy . (B.4)

Der auf der linken Seite eingef¨

uhrte Integralkern G(x, y) := E(x−y) heißt Greensche

Funktion. Genaueres entnehme man der Spezialliteratur, z.B. Ref. 123.

In der Quantenmechanik ist man h¨

aufig an der Greenschen Funktion Gεinteressiert,

die sich als L¨

osung der Gleichung

−(H(r)−ε)Gε(r,r′) = δ(r−r′) (B.5)

ergibt, wobei Hder Hamilton-Operator in Ortsdarstellung sein soll. Die δ-Distribution

l¨

asst sich formal als kontinuierliches Analogon zur Einheitsmatrix im Endlich-Dimensiona-

len auffassen, womit die Greensche Funktion in gewisser Weise zur Inversen des Hamilton-

Operators wird:

Gε=−(H−ε·1)−1(f¨

ur εnicht aus dem Spektrum von H).(B.6)

140

B Die Greensche Funktion 141

Sind die Eigenwerte (das Spektrum) von Hdurch {εn}gegeben, und stellt man sich

Hals ”echte” (diskrete) Matrix vor, erkennt man sofort, dass Gεnstrenggenommen nicht

definiert ist: Mit det(H−εn·1) = 0 kann keine Inverse zu (H−εn·1) existieren. Allerdings

besteht in diesem Fall die M¨

oglichkeit, zun¨

achst εndurch εn+ iηzu ersetzen, um dann

sp¨

ater den Grenz¨

ubergang η→0 vollziehen zu k¨

onnen, vgl. z.B. Ref. 92.

Das System {|ni} der Eigenfunktionen von Hbildet ein vollst¨

andiges Orthonormal-

system im Hilbertraum H. Mit der Spektraldarstellung des Hamilton-Operators

H=X

n|niεnhn|(B.7)

und dem Greenschen Operator

Gε:= X

|nihn|

ε−εn

(ε6∈Spektrum von H) (B.8)

findet man

−Gε(H−ε·1) = X

n,m

|nihn|mi(εn−ε)hm|

ε−εn

=1=−(H−ε·1)Gε.(B.9)

Schreibt man den Greenschen Operator (B.8) in Ortsdarstellung, wird daraus die Green-

sche Funktion

Gε(r,r′) = hr|Gε|r′i=X

φn(r)φ∗

n(r′)

ε−εn

(ε6∈Spektrum von H),(B.10)

wobei φn(r) := hr|nigesetzt wurde. F¨

ur ε=εmist die Greensche Funktion nur im Unter-

raum H⊥

mdefinierbar, der von allen Elementen aus Hgebildet wird, die auf dem Eigenraum

von εmsenkrecht stehen:

Gm(r,r′) = X

εn6=εm

φn(r)φ∗

n(r′)

εm−εn

.(B.11)

An vielen Stellen im Text wird die Projektion der Greenschen Funktion Gmauf den

Teilraum Hcder unbesetzten Zust¨

ande verwendet, wobei meinem besetzten Zustand

zugeordnet ist. Bezeichnet Pc:= Punocc

i|nihn|den Projektionsoperator auf Hc, ist sie

durch

G⊥

m(r,r′) := PcGm(r,r′) =

unocc

φn(r)φ∗

n(r′)

εm−εn

(B.12)

gegeben.

Berechnung von Variationsableitungen mit Hilfe der St¨

orungstheorie in 1. Ord-

nung

An dieser Stelle sei auch kurz auf den Zusammenhang zwischen der St¨

orungstheorie

1. Ordnung und der Variationsableitung einer Eigenfunktion φieines Operators der Form

H:=−1

2∇2+veingegangen, wobei vein lokaler, also multiplikativ wirkender Operator sei.

Dazu f¨

uhrt man eine kleine Variation ∆vvon vein, die sich als St¨

orung auffassen l¨

asst.

Die Eigenwert-Gleichung des gest¨

orten Systems schreibt sich dann

[−1

2∇2+v+ ∆v](φi+ ∆φi) = (εi+ ∆εi)(φi+ ∆φi).(B.13)

142 B Die Greensche Funktion

Die der Variation ∆ventsprechende ¨

Anderung ∆φider Eigenfunktion φiergibt sich also

als ”Zustandskorrektur”, f¨

ur die die St¨

orungstheorie in linearer Ordnung die folgende

n¨

aherungsweise Darstellung liefert:

∆φi(r)≈X

εj6=εi

φj(r)hφj|∆v|φii

εi−εj

r′∈IR3





X

εj6=εi

φj(r)φ∗

j(r′)φi(r′)

εi−εj



∆v(r′) d3r′.(B.14)

Die Summation erfolgt ¨

uber alle zum Eigenraum von εiorthogonalen Zust¨

ande. Die Ap-

proximation (B.14) wird dabei immer besser, je kleiner die Variation ∆vist. Die gesuchte

Variationsableitung entspricht daher gerade dem Ausdruck in den großen runden Klam-

mern und kann mit Hilfe der Greenschen Funktion (B.11) geschrieben werden:

δφi(r)

δv(r′)=X

εj6=εi

φj(r)φ∗

j(r′)φi(r′)

εi−εj

=Gi(r,r′)φi(r′).(B.15)

Man beachte, dass die Variationsableitung δφi/δv ein Ausdruck ist, der von zwei Variablen

— hier rund r′— abh¨

angt. Dies ist in vollkommener Analogie zu der Ableitung einer

Funktion mehrerer Variablen, die sich bekanntlich als Matrix darstellen l¨

asst (vgl. z.B.

Ref. 123).

Anhang C

Die Sternheimer-Gleichung

C.1 Die Sternheimer-Gleichung aus dem Variationsprinzip

von Ritz

In Abschnitt 4.1 wurde zur numerisch effizienten L¨

osung der Sternheimer-Gleichung (4.1)

auf dem Hilbertraum Hein Funktional Ei:H → IR ; ψ1

i7→ Ei[ψ1

i] eingef¨

uhrt, das die Ein-

heit einer Energie hat und eine quadratische Form in der linearen Korrekturfunktion ψ1

darstellt. Einheit und mathematische Gestalt ergaben sich dabei rein abstrakt, indem Ei

in (4.3) als reellwertige Stammfunktion der linken Seite der Sternheimer-Gleichung kon-

struiert wurde.

Hier m¨

ochte ich jedoch noch eine weitere Herleitung dieses Funktionals geben, die,

obschon sie etwas aufwendiger ist, eine physikalisch anschaulichere Interpretation erlaubt.

Es sei gezeigt, dass Ei— und damit die Sternheimer-Gleichung selbst ebenfalls — auch

direkt aus dem Variationsprinzip von Ritz (vgl. Abschnitt 1.2) hergeleitet werden kann,

wenn dort die in der Rayleigh-Schr¨

odingerschen St¨

orungstheorie benutzten Reihenentwick-

lungen eingesetzt werden.

Die Idee dabei ist folgende: Gem¨

aß dem Variationsprinzip (1.11) stellen sich die (nor-

mierten) Eigenfunktionen eines Systems gerade so ein, dass das Energiefunktional hψ|H|ψi

minimal ist, wenn |ψieinem Grundzustand entspricht, und zumindest station¨

ar ist, wenn

|ψieinen angeregten Zustand beschreibt. Dies gilt nat¨

urlich f¨

ur das ungest¨

orte System

ebenso wie f¨

ur das gest¨

orte. Wenn aber die Gr¨

oßen des ungest¨

orten Systems bereits be-

kannt sind, k¨

onnten diese bei der Formulierung des gest¨

orten Problems fest eingesetzt

werden, und die Variation brauchte nur noch ¨

uber die Korrekturen der Wellenfunktionen

zu erfolgen. Die Variation der Grundzustandskorrektur w¨

urde ein Minimum des f¨

ur das

gest¨

orte Problem formulierten hψ|H|ψiliefern (wobei ψdie normierte Summe aus un-

gest¨

orter Wellenfunktion und Korrektur ist), und die Variation von Korrekturen h¨

oherer

Zust¨

ande w¨

urde auf station¨

are Punkte f¨

uhren — dies entspricht genau dem Verhalten des

in (4.3) f¨

ur die lineare Korrektur ψ1

igefundenen Energiefunktionals! Tats¨

achlich ergibt

sich (4.3) direkt aus der hier skizzierten Idee, wenn man nur Korrekturfunktionen bis zur

1. Ordnung, d.h. also, im Energiefunktional hψ|H|ψiAusdr¨

ucke noch bis zur 2. Ordnung

ber¨

ucksichtigt.

Dazu sei zun¨

achst das gest¨

orte System unter denselben Annahmen wie bei der Rayleigh-

Schr¨

odingerschen St¨

orungstheorie nach einem reellen Parameter λentwickelt:

H:= H0+λ H1

εi:= ε0

i+λ ε1

i+λ2ε2

i+··· ,(C.1)

143

144 C Die Sternheimer-Gleichung

|ψii:= |ψ0

ii+λ|ψ1

ii+λ2|ψ2

ii+··· .

Hier bezeiche wie ¨

ublich H0den Hamilton-Operator des ungest¨

orten Systems, dem eine

St¨

orung λH1aufgeschaltet sei. Eigenwerte ε0

iund Eigenfunktionen |ψ0

iides ungest¨

orten

Systems seien bekannt. Nach dem Variationsprinzip (1.11) wird das Funktional hψ|(H0+

H1)|ψistation¨

ar f¨

ur alle Eigenfunktionen |ψiides gest¨

orten Systems, wobei die Variation

unter der Nebenbedingung der Normierung erfolgt, d.h. also, wenn nur Wellenfunktio-

nen auf der ”Kugel” hψ|ψi=kψk2= 1 im Hilbertraum Hzugelassen sind.1Wird die

Nebenbedingung ¨

uber einen Lagrange-Multiplikator εber¨

ucksichtigt, hat man

δEε[ψ]

δψ∗ε=εi

ψ=ψi

= 0 mit Eε[ψ] := hψ|(H0+λH1)|ψi−ε·[hψ|ψi−1] (C.2)

f¨

ur alle Eigenenergien εiund -funktionen |ψiides gest¨

orten Systems. Einsetzen von (C.1)

in (C.2) liefert

Eε[ψ] = (hψ0|+λhψ1|+λ2hψ2|+···)(H0+λH1)(|ψ0i+λ|ψ1i+λ2|ψ2i+···)

−(ε0+λε1+λ2ε2+···)(hψ0|+λhψ1|+λ2hψ2|+···)

(|ψ0i+λ|ψ1i+λ2|ψ2i+···)

+ (ε0+λε1+λ2ε2+···)

=hψ0|H0|ψ0i+λhψ0|H0|ψ1i+λhψ1|H0|ψ0i+λhψ0|H1|ψ0i

+λ2hψ0|H0|ψ2i+λ2hψ1|H0|ψ1i+λ2hψ2|H0|ψ0i

+λ2hψ0|H1|ψ1i+λ2hψ1|H1|ψ0i

−ε0hψ0|ψ0i−λε0hψ0|ψ1i−λε0hψ1|ψ0i−λε1hψ0|ψ0i

−λ2ε0hψ0|ψ2i−λ2ε0hψ1|ψ1i−λ2ε0hψ2|ψ0i

−λ2ε1hψ0|ψ1i−λ2ε1hψ1|ψ0i

+ (ε0+λε1+λ2ε2) + O(λ3).(C.3)

Hier wurde der ¨

Ubersichtlichkeit halber der Index ian den Wellenfunktionen und Energien

unterdr¨

uckt. Im Restglied O(λ3) sind alle Terme kubischer oder h¨

oherer Ordnung in λ

zusammengefasst. Unter Beachtung von H0ψ0=ε0ψ0lassen sich eine Reihe von Gliedern

herausk¨

urzen. Vernachl¨

assigt man ferner das Restglied O(λ3), erh¨

alt man in quadratischer

N¨

aherung:

Eε[ψ]≈λhψ0|(H1−ε1)|ψ0i+λ2hψ1|(H0−ε0)|ψ1i

+λ2hψ0|(H1−ε1)|ψ1i+λ2hψ1|(H1−ε1)|ψ0i+ (ε0+λε1+λ2ε2).

Hier liefern alle Glieder, die ψ1weder als Bra- noch als Ket-Vektor explizit enthalten, nur

einen konstanten Beitrag zum Energiefunktional. Die Lage der station¨

aren Punkte in Hist

aber invariant gegen¨

uber einer Eichung der Energieskala; deshalb k¨

onnen die konstanten

1In Abschnitt 4.1 wurde die Sternheimer-Gleichung f¨

ur ein effektives Ein-Teilchen-Problem (Kohn-

Sham-System) formuliert, in diesem Falle bezeichnet ψalso eine Ein-Teilchen-Wellenfunktion. In der fol-

genden Diskussion kann es sich jedoch auch allgemein um eine N-Teilchen-Wellenfunktion handeln.

C.2 Entartung 145

Glieder ignoriert werden, und man darf das Funktional noch mit einem beliebigen Faktor,

z.B. 1/(2λ2), multiplizieren. Insgesamt kann man statt Eε[ψ] also auch

Eε[ψ1] := 1

2hψ1|(H0−ε0)|ψ1i+1

2hψ0|(H1−ε1)|ψ1i+1

2hψ1|(H1−ε1)|ψ0i

2hψ1|(H0−ε0)|ψ1i+ Re hψ1|(H1−ε1)|ψ0i(C.4)

verwenden. Da auf der rechten Seite nur die lineare Korrekturfunktion variabel ist, wurde

als Argument von ˜

Eεhier gleich ψ1benutzt. F¨

ugt man den Index ian Energien und

Zust¨

ande wieder an, ist dies in der Tat identisch mit dem in Abschnitt 4.1 angegebenen

Energiefunktional (4.3), was zu zeigen war.

Noch eine Bemerkung zur Normierung: Die hier benutzte Nebenbedingung hψ|ψi= 1

ist im Allgemeinen nicht mit der ¨

ublicherweise in der St¨

orungstheorie angesetzten Nor-

mierung hψ0|ψi=Nkonsistent, aus der man die Orthogonalit¨

at der Korrekturfunktionen

zu ψ0erh¨

alt, vgl. z.B. Ref. 127. Deshalb wurde bei der Vereinfachung des obigen Aus-

drucks (C.3) auch nicht mit der (nicht gegebenen) Orthogonalit¨

at zwischen der Korrek-

turfunktion |ψ1iund der ungest¨

orten Funktion |ψ0iargumentiert! Fordert man Orthogo-

nalit¨

at zwischen der Korrektur |∆ψi:= |ψi − |ψ0iund der ungest¨

orten Funktion |ψ0i,

kann die Normierung im Allgemeinen nicht exakt erf¨

ullt werden (es muss ”Nachnormiert”

werden), denn es gilt dann

hψ|ψi= (hψ0|+h∆ψ|)(|ψ0i+|∆ψi)

=hψ0|ψ0i+hψ0|∆ψi+h∆ψ|ψ0i+h∆ψ|∆ψi(C.5)

=hψ0|ψ0i

|{z }

+ 2 Re hψ0|∆ψi

|{z }

+h∆ψ|∆ψi

= 1 + h∆ψ|∆ψi.

Wegen |∆ψi=λ|ψ1i+λ2|ψ2i+···enth¨

alt die Abweichung h∆ψ|∆ψiallerdings nur qua-

dratische und h¨

ohere Ordnungen in λ, oder anders formuliert: in linearer N¨

aherung l¨

asst

sich die Normierungsbedingung zugleich mit der Orthogonalit¨

atsforderung erf¨

ullen. Ge-

nau dies wurde in Kapitel 2bei der Definition (2.4) der induzierten Ladungsdichte ∆ρ

ausgenutzt: ∆ρbeschreibt den Einfluss von H1nur in linearer Ordnung, daher ist die La-

dungserhaltung (2.9) exakt erf¨

ullt, obwohl zur Berechnung der induzierten Ladungsdichte

die Sternheimer-Gleichung zusammen mit der Orthogonalit¨

atsforderung gel¨

ost wurde, vgl.

Abschnitt 4.1. Es sei an dieser Stelle nochmals darauf hingewiesen, dass dies aber keine

N¨

aherung der EXX-Methode darstellt, vielmehr ist die lineare N¨

aherung der induzierten

Ladungsdichte eine wesentliche Eigenschaft der EXX-Methode selbst.

C.2 Entartung

Am Ende des Abschnitts 4.1 wurde gezeigt, dass die Sternheimer-Gleichung im Rahmen

der variationellen EXX-Methode nur in einem ”verkleinerten” Hilbertraum, n¨

amlich dem

der unbesetzten Zust¨

ande, gel¨

ost zu werden braucht, und sich das Problem der Entartung

auf diese Weise eliminieren l¨

asst. Um jedoch die Diskussion der Sternheimer-Gleichung

abzurunden, sei an dieser Stelle kurz beschrieben, wie im Falle einer Entartung auch

die vollst¨

andigen Korrekturfunktionen berechnet werden k¨

onnen. Der zu Grunde liegende

Formalismus ist nat¨

urlich die entartete St¨

orungstheorie von Rayleigh-Schr¨

odinger. Deren

Ergebnisse sind aber ¨

ublicherweise mit Hilfe von Greenschen Funktionen formuliert. Das

146 C Die Sternheimer-Gleichung

Ziel hier besteht also darin, eine entsprechende Verallgemeinerung der in Abschnitt 4.1

entwickelten Methoden zu finden, um wieder ohne die Greensche Funktion auskommen zu

k¨

onnen.

Eng mit der Entartung — gemeint ist eine m¨

ogliche Entartung eines Eigenwertes εi

von H0, also dem Hamilton-Operator des ungest¨

orten Systems — verkn¨

upft ist die Frage,

ob die Sternheimer-Gleichung (4.1)¨

uberhaupt eine L¨

osung besitzt, oder, ¨

aquivalent dazu,

ob das in (4.3) definierte Energiefunktional Eieinen station¨

aren Punkt (Minimum, Sattel-

punkt oder Maximum) besitzt. Seien dazu noch einmal die drei in (4.6) – (4.8) definierten

Teilr¨

aume H−,H0und H+betrachtet, von denen H0gerade dem Eigenraum von εient-

spricht. Gem¨

aß Abschnitt 4.1 besitzt Eiin H−ein Maximum und in H+ein Minimum,

zu kl¨

aren bleibt also nur noch das Verhalten in H0. Hier reduziert sich das Funktional auf

den linearen Anteil

Ei[ψ1

i] = 1

2hψ1

i|(H1−ε1

i)|ψ0

ii+1

2hψ0

i|(H1−ε1

i)|ψ1

ii(f¨

ur ψ1

i∈ H0),(C.6)

dessen Gradient durch den konstanten Vektor

2δEi[ψ1

δ(ψ1

i)∗= (H1−ε1

i)|ψ0

ii(f¨

ur ψ1

i∈ H0) (C.7)

gegeben ist. Eine L¨

osung der Sternheimer-Gleichung im gesamten Hilbertraum existiert

also genau dann, wenn (C.7) identisch verschwindet. In H0ergibt sich f¨

ur das Energie-

funktional in diesem Fall Ei= 0. Ist (C.7) jedoch von 0 verschieden, definiert (C.6) eine

”schiefe (Hyper-)Ebene” ¨

uber H0, d.h., es kann kein station¨

arer Punkt existieren, und

darauf angesetzte Algorithmen zur Extremwertsuche k¨

onnen nicht konvergieren (sie lau-

fen ”ins Unendliche”).

F¨

ur nicht-entartetes ε0

iergibt sich nun, dass (C.7) stets verschwindet, und die Stern-

heimer-Gleichung immer l¨

osbar ist. Da dann n¨

amlich der Eigenraum H0eindimensional

ist und nur durch den zugeh¨

origen Eigenvektor ψ0

iaufgespannt wird, reduziert sich der

St¨

oroperator auf die (1 ×1)-Matrix hψ0

i|H1|ψ0

iiund entspricht der in (4.2) gegebenen

Energiekorrektur ε1

F¨

ur entartetes ε0

iist der Fall etwas komplizierter: Nach der entarteten St¨

orungstheorie

ist n¨

amlich nun die Basis in H0nicht mehr frei, sondern muss so gew¨

ahlt werden, dass die

St¨

orung H1darin diagonal wird. Dies entspricht gerade einer (m¨

oglichen) Aufhebung der

Entartung durch die St¨

orung. F¨

ur die ψ0

jmit ε0

j=ε0

igilt dann hψ0

j|H1|ψ0

ii=δij ε1

imit

der ¨

ublichen Definition ε1

i:= hψ0

i|H1|ψ0

ii. Damit gilt insbesondere H1ψ0

i=ε1

iψ0

i, womit

schließlich (C.7) verschwindet.

Anders formuliert: Im entarteten Fall muss zun¨

achst die ”richtige” Sternheimer-Glei-

chung gefunden werden, d.h. pr¨

aziser: es muss eine Basis des entarteten Eigenraums so be-

stimmt werden, dass die damit aufgestellte Sternheimer-Gleichung l¨

osbar ist. Die entspre-

chenden Basisfunktionen sind zugleich die Eigenfunktionen des Gesamtsystems H0+H1

in H0. Die Korrektur besteht in H0also allein in der Justierung der Basis. Anschließend

kann, wie in Abschnitt 4.1 beschrieben, der Sattelpunkt in H−⊕H+¨

uber geeignete Ma-

ximierungs-/Minimierungsverfahren berechnet werden.

C.3 Die Sternheimer-Gleichung mit nicht-hermiteschem H0

Dieser Abschnitt l¨

asst sich in gewissen Sinne als Erg¨

anzung zu Ref. 78 verstehen, in der

das variationelle EXX-Verfahren an kugelsymmetrischen Systemen (Be-Atom, Ne-Atom)

C.3 Die Sternheimer-Gleichung mit nicht-hermiteschem H0147

getestet worden ist. Beschreibt man solche Systeme in Kugelkoordinaten, muss die Schr¨

dinger-Gleichung (bzw. hier die Kohn-Sham-Gleichung als effektive Ein-Teilchen-Schr¨

dinger-Gleichung) nur noch in einer Dimension f¨

ur den Radialteil der Wellenfunktionen

gel¨

ost werden. ¨

Ublicherweise verwendet man dabei eine logarithmische Zerlegung (Basis)

der Radialachse, da die starken Oszillationen nahe des Ursprungs eine wesentlich st¨

arkere

Aufl¨

osung verlangen als die im Vergleich dazu ”ruhigen” Schw¨

anze der Funktionen. Der

Operator der kinetischen Energie (Laplace-Operator) und damit der gesamte Hamilton-

Operator werden in dieser Darstellung jedoch zu nicht-hermiteschen Matrizen. Die in

Abschnitt 4.1 beschriebe L¨

osung der Sternheimer-Gleichung mit Hilfe der Minimierung

ihrer ”Stammfunktion” (4.3) kann daher nicht mehr ohne Weiteres verwendet werden, wie

in Ref. 78 gezeigt. Mit dem nun vorgestellten Trick kann die Minimierungsmethode je-

doch auch auf einen solchen Fall ¨

ubertragen werden. Wie in Abschnitt 4.1.2 sei abk¨

urzend

A=H0−ε0

i,x=ψ1

iund b= (H1−ε1

i)ψ0

igesetzt, und wie dort sei nur der diskrete Fall

diskutiert.

Die Idee ist einfach: Ist Aeine beliebige n-quadratische Matrix, ist das Produkt A+A,

wobei A+die Adjungierte von Asein soll, in jedem Fall eine hermitesche Matrix, denn

aus (AB)+=B+A+(mit A,B n-quadratisch) folgt sofort (A+A)+=A+(A+)+=A+A.

Zudem ist A+Aeine positiv semi-definite Matrix, denn f¨

ur alle x∈Cngilt hx|A+Axi=

hAx|Axi=kAxk2≥0. Multipliziert man also die Gleichung

Ax+b=0mit b∈Cnfest (C.8)

mit von links A+, erf¨

ullt die neue Gleichung die in (4.13) geforderten Voraussetzungen,

und alle in Abschnitt 4.1.2 beschriebenen Methoden k¨

onnen auf sie angewandt werden:

A+Ax+A+b=0.(C.9)

Bevor man diese Gleichung jedoch zur L¨

osung von (C.8) benutzen kann, muss klar sein,

dass beide Gleichungen auch wirklich ¨

aquivalent sind. Dies l¨

asst sich leicht beweisen, wenn

(i) A+eine ein-eindeutige (bijektive) lineare Abbildung auf dem Wertebereich W(A) der

Abbildung Aist und (ii) Gleichung (C.8)¨

uberhaupt eine L¨

osung besitzt. Dies soll hier

kurz gezeigt werden:

Beweis der Bijektivit¨

at von A+auf W(A): Ist N(A) der Nullraum von A, hat W(A)

die Dimension p:= n−dim N(A). Sei dann {w1,...,wp}eine Basis von W(A). Nun

l¨

asst sich Cnin den Wertebereich von Aund dessen Orthogonalraum2zerlegen: Cn=

W(A)⊕W(A)⊥. Mit einem Satz der linearen Algebra3gilt N(A+) = W(A)⊥, womit hier

Cn=W(A)⊕N(A+) folgt. Dann gilt f¨

ur jedes x∈Cn: es gibt x1∈ W(A), x2∈ N(A+)

so, dass x=x1+x2und folglich A+x=A+x1+A+x2=A+x1+0. Der Wertebereich

von A+ist daher durch W(A+) = span{A+x|x∈ W(A)}gegeben. Daraus folgt, dass

{A+w1,...,A+wp}eine Basis von W(A+) ist, denn als adjungierte Matrizen besitzen A

und A+den gleichen Rang, d.h., die Dimensionen ihrer Wertebereiche sind gleich.

Damit folgt die Injektivit¨

at: Seien x,x′∈ W(A). Es ist zu zeigen: Aus A+x=A+x′

folgt x=x′. Sei also A+x=A+x′. Dann hat man A+(x−x′) = 0 mit x−x′∈ W(A).

2Der Orthogonalraum einer Menge U⊂Cnist definiert als die Menge aller Elemente, die senkrecht

auf Ustehen: U⊥:= {x∈Cn|hx|ui= 0 f¨

ur u∈U}. Die direkte Summe zweier linearer Teilr¨

aume Uund

Vmit U∩V={0}ist definiert als U⊕V:= {x∈Cn|es gibt u∈U, v∈Vmit x=u+v}. F¨

ur einen

linearen Teilraum U⊂Cngilt Cn=U⊕U⊥. Vgl. dazu z.B. Ref. 123, Band 1, Kapitel 8.

3Vgl. z.B. Ref. 123, Band 1, Satz 10.14.

148 C Die Sternheimer-Gleichung

Mit einer Basis {w1,...,wp}von W(A) existieren also α1,...,αp∈Cso, dass x−x′=

i=1 αiwi. Da aber A+(x−x′) = Pp

i=1 αiA+wi= 0 und {A+w1,...,A+wp}gem¨

aß dem

Vorangehenden Basis von W(A+), folgt α1=···=αp= 0. Damit ist x−x′=0, d.h.,

x=x′, womit die Injektivit¨

at gezeigt ist.

Nun zur Surjektivit¨

at: Sei y∈ W(A+). Zu zeigen: Es gibt x∈ W(A) mit y=A+x.

Mit der Basis von W(A+) wie oben existieren β1,...,βp∈Cso, dass y=Pp

i=1 βiA+wi=

A+Pp

i=1 βiwi. Definiert man x:= Pp

i=1 βiwi, folgt unmittelbar y=A+xmit x∈ W(A),

womit auch die Surjektivit¨

at gezeigt ist. Damit gelingt nun der

Beweis der ¨

Aquivalenz der Gleichungen (C.8) und (C.9): Es ist klar, dass alle L¨

osungen

x∈Cnvon (C.8) auch L¨

osungen von (C.9) sind. Bleibt zu zeigen, dass auch umgekehrt

alle L¨

osungen von (C.9) L¨

osungen von (C.8) sind, wenn (C.8)¨

uberhaupt eine L¨

osung

x0∈Cnbesitzt (vgl. den vorangehenden Abschnitt C.2). Unter dieser Annahme folgt,

dass bElement des Wertebereichs W(A) der Abbildung Aist, da b=−Ax0∈ W(A). Es

ist also Ax+b∈ W(A) f¨

ur alle x∈Cn, d.h., der Wertebereich der linken Seite von (C.8)

ist ebenfalls W(A). Nun ist aber — wie oben gezeigt — A+auf W(A) eine bijektive linea-

re Abbildung. Aus A+Ax+A+b=A+(Ax+b) = 0folgt daher unmittelbar Gleichung

(C.8), was zu zeigen war.

Interessanterweise l¨

asst sich dieses Ergebnis auch auf eine ganz andere Art ableiten.

Bildet man n¨

amlich das Betragsquadrat auf beiden Seiten von (C.8), erh¨

alt man

kAx+bk2=hxA+b|Ax+bi(C.10)

=hxA|Axi+hxA|bi+hb|Axi+hb|bi

=hx|A+Axi+hx|A+bi+hb|Axi+kbk2= 0 .

Das Betragsquadrat ist genau dann 0, wenn sein Argument 0ist, womit sofort die ¨

Aqui-

valenz dieser Gleichung zu (C.8) folgt. Zudem ist 0 auch das (eindeutige) Minimum des

Betragsquadrats. Ferner ist das Betragsquadrat — im Gegensatz zur Betragsfunktion (!)

—¨

uberall stetig differenzierbar, besitzt also einen Gradienten, der genau bei 0verschwin-

det. Dies liefert unmittelbar Gleichung (C.9):

∇kAx+bk2= 2 d

dx∗kAx+bk2= 2 A+Ax+ 2 A+b= 0 .(C.11)

Dabei wurde (C.10) nur nach dem konjugiert-komplexen Vektor x∗abgeleitet (also dem

Bra-Vektor), daf¨

ur aber noch mit 2 multipliziert.4Mit diesem Weg findet man also zus¨

atz-

lich zu (C.9) auch noch ”automatisch” das passende Funktional, mit dem die Minimierung

durchgef¨

uhrt werden kann, n¨

amlich die linke Seite von (C.10). Man beachte aber, dass das

Ableiten im Allgemeinen keine ¨

Aquivalenzrelation darstellt; so besitzt (C.11) in jedem Fall

eine L¨

osung, auch wenn (C.8) nicht l¨

osbar ist. Notwendig und hinreichend f¨

ur die ¨

Aqui-

valenz ist, dass (C.8) l¨

osbar ist, dass also b∈ W(A), was auch in dem zuerst gef¨

uhrten

Beweis vorausgesetzt worden ist.

4Zur Definition des Gradienten im Komplexen vgl. Ref. 126.

Anhang D

Tensordarstellung der

EXX-Methode

Die linke Seite der Gleichung (2.11) in Abschnitt 2.3 beschreibt mit Hilfe der linearen

Antwort-Funktion χ0, wie sich die Dichte in linearer Ordnung ¨

andert, wenn auf das ef-

fektive Potential der Kohn-Sham-Gleichung (1.52) eine lokale ¨

Anderung ∆v: IR3→IR

addiert wird. Zur Handhabung einer nicht-lokalen Potentialdifferenz, wie sie im variationel-

len EXX-Verfahren gem¨

aß (2.1) auftritt, wird jedoch ein ”m¨

achtigerer” linearer Antwort-

Operator X0ben¨

otigt, da ∆vnun durch eine (IR3×IR3→C)-Funktion repr¨

asentiert wird,

n¨

amlich den Kern des Integraloperators H1von Gleichung (2.1).

Dieses verallgemeinerte X0l¨

asst sich sehr leicht finden, wenn man noch einmal dem Ge-

dankengang von Abschnitt 2.1 folgt, diesmal allerdings f¨

ur eine beliebige lineare St¨

orung H1,

deren Anwendung auf eine Wellenfunktion ψsich durch

(H1ψ)(r) := Z∆v(r,r′)ψ(r′) d3r′(D.1)

mit einem geeigneten ∆vbeschreiben l¨

asst. Die Herleitung der induzierten Ladungsdich-

te, d.h., der linearen Dichte¨

anderung α∆ρmit ∆ρgem¨

aß (2.4) geschah dort v¨

ollig un-

abh¨

angig von der speziellen Gestalt der St¨

orung, deshalb bleibt sie auch f¨

ur das allgemei-

ner definierte H1aus (D.1) g¨

ultig. Auch sind die Korrekturfunktionen ψ1

iwieder ¨

uber die

Sternheimer-Gleichung (2.2) oder mit Hilfe der Greenschen Funktion wie in (2.7) gegeben.

Dies, eingesetzt in (2.4), liefert in Abh¨

angigkeit von ∆vdie lineare Dichte¨

anderung

∆ρ(r) =

occ

iZd3r′hψ0

i(r)∗Gi(r,r′)(H1ψ0

i)(r′) + c.c.i(D.2)

occ

iZd3r′hψ0

i(r)∗X

εj6=εi

ψ0

j(r)ψ0

j(r′)∗

εi−εjZ∆v(r′,r′′)ψ0

i(r′′) d3r′′ + c.c.i

=ZZT(r,r′,r′′)∆v(r′,r′′) d3r′d3r′′ + c.c. ,

wobei

T(r,r′,r′′) :=

occ

εj6=εi

ψ0

i(r)∗ψ0

j(r)ψ0

j(r′)∗ψ0

i(r′′)

εi−εj

.(D.3)

149

150 D Tensordarstellung der EXX-Methode

Ausdruck (D.2) l¨

aßt sich noch vereinfachen, wenn man eine hermitesche St¨

orung voraus-

setzt, also ∆v(r′,r′′)∗= ∆v(r′′,r′) annimmt:

∆ρ(r) = ZZT(r,r′,r′′)∆v(r′,r′′) d3r′d3r′′ +ZZT(r,r′,r′′)∗∆v(r′′,r′) d3r′d3r′′ .

Umbenennung der Variablen im zweiten Summanden liefert dann

∆ρ(r) = ZZT(r,r′,r′′) + T(r,r′′,r′)∗∆v(r′,r′′) d3r′d3r′′ (D.4)

=ZZX0(r,r′,r′′)∆v(r′,r′′) d3r′d3r′′

mit dem Kern

X0(r,r′,r′′) := T(r,r′,r′′) + T(r,r′′,r′)∗(D.5)

occ.

unocc.

ψ0

i(r)∗ψ0

j(r)ψ0

j(r′)∗ψ0

i(r′′) + ψ0

i(r)ψ0

j(r)∗ψ0

j(r′′)ψ0

i(r′)∗

εi−εj

Hier wurden bei der Summierung ¨

uber jnur noch die unbesetzten Zust¨

ande ber¨

ucksichtigt,

da alle anderen Summanden sich — analog wie bei der Herleitung der ”normalen” linearen

Antwort (1.93) — gerade herausk¨

urzen. W¨

urde man X0n¨

aherungsweise in einem endlichen

Basissatz darstellen, w¨

are dies ein Tensor dritter Stufe — ganz analog, wie kontinuierliche

Operatoren bei ”Diskretisierung” in Matrizen ¨

ubergehen.

W¨

ahrend der Nullraum von χ0allein durch die Menge der konstanten Funktionen gege-

ben ist [56], ist allerdings der von X0wesentlich gr¨

oßer: F¨

ur alle hermiteschen St¨

orungen

∆vmit hψ0

i|∆v|ψ0

ji= 0, also solche, die besetzte und unbesetzte Zust¨

ande nur jeweils

untereinander koppeln1, folgt aus (D.4) und (D.5) sofort ∆ρ= 0. Konstante Potentialver-

schiebungen bilden nat¨

urlich einen Teilraum dieses Nullraums. Damit ist X0auch dann

nicht invertierbar, wenn man den Definitionsbereich auf diejenigen Operatoren beschr¨

ankt,

die ihrerseits wieder nur auf dem Teilraum nicht-konstanter Funktionen definiert sind. In

endlicher Darstellung ist dies intuitiv klar: F¨

ur die St¨

orung (Matrix) gibt es nat¨

urlich mehr

Variationsm¨

oglichkeiten als f¨

ur die induzierte Dichte (Vektor).

Interessanterweise l¨

asst sich X0zu einem noch allgemeineren Operator ˜

X0erweitern,

der zu einer gegebenen, nicht-lokalen Potential¨

anderung nicht die lineare ¨

Anderung der

Dichte, sondern die des Dichteoperators liefert. Dieser ist (f¨

ur ein nicht spin-polarisiertes

Kohn-Sham-System) in Ortsdarstellung durch

ρ(r1,r2) :=

occ.

ψ0

i(r1)ψ0

i(r2)∗(D.6)

gegeben und seine lineare ¨

Anderung infolge von ¨

Anderungen der Wellenfunktionen ψ1

folglich durch

∆ρ(r1,r2) :=

occ.

ψ0

i(r1)ψ1

i(r2)∗+ψ1

i(r1)ψ0

i(r2)∗.(D.7)

1Dieser Nullraum ist die tiefere Begr¨

undung daf¨

ur, dass bei der L¨

osung der Sternheimer-Gleichung die

so ¨

uberaus n¨

utzliche vereinfachte Version der Sternheimer-Gleichung (4.12) benutzt werden konnte.

D Tensordarstellung der EXX-Methode 151

Gleichsetzen von r1und r2liefert f¨

ur (D.6) dann die gew¨

ohnliche Dichte und f¨

ur (D.7)

die induzierte Dichte (2.4). Eine ganz analoge ¨

Uberlegung wie oben in (D.2) bis (D.5)

durchgef¨

uhrt liefert in diesem Fall

X0(r1,r2,r3,r4) := (D.8)

occ.

unocc.

ψ0

i(r1)ψ0

j(r2)∗ψ0

j(r3)ψ0

i(r4)∗+ψ0

i(r2)∗ψ0

j(r1)ψ0

j(r4)∗ψ0

i(r3)

εi−εj

EXX-Formalismus — kurzgefasst

Aus (D.4) folgt nun die EXX/OEP-Gleichung, indem gem¨

aß (2.1) speziell

∆v(r′,r′′) := hr′|H1|r′′i=VFock[{ψi}](r′,r′′)−δ(r′−r′′)vx[ρ](r′) (D.9)

gesetzt wird. Damit ergibt sich zun¨

achst die induzierte Ladungsdichte

∆ρ(r) = ZZX0(r,r′,r′′)VFock(r′,r′′)−δ(r′−r′′)vx(r′)d3r′d3r′′ (D.10)

=ZZX0(r,r′,r′′)VFock(r′,r′′) d3r′d3r′′ −Zχ0(r,r′)vx(r′) d3r′.

Einsetzen von (D.5), Vereinfachen und Zu-Null-Setzen dieses Ausdrucks f¨

uhrt dann unmit-

telbar auf die OEP-Gleichung (1.97). Im Vergleich zu dieser oder zur EXX-Gleichung (1.90)

erscheint dem Verfasser die Form (D.10) allerdings anschaulicher; insbesondere der linea-

re Charakter des EXX-Formalismus wird hier unmittelbar klar, denn der Zusammenhang

zwischen St¨

orung und ¨

Anderung der Ladungsdichte ist nun formal sehr einfach durch einen

Integraloperator gegeben.

Als praktische ”Merkformel” sei der EXX-Formalismus nun auf eine noch knappere —

aber daf¨

ur ¨

außerst pr¨

agnante! — Gestalt gebracht. Definiert man dazu

X0f: IR37→ IR ; (D.11)

(ˆ

X0f)(r) := (RRX0(r,r′,r′′)f(r′,r′′) d3r′d3r′′ (fnicht-lokal, hermitesch)

Rχ0(r,r′)f(r′) d3r′(flokal, multiplikativ)

mit X0gem¨

aß (D.5) und χ0nach (1.93), kann man (D.10) formal

∆ρ:= ˆ

X0(VFock −vx) = ˆ

X0VFock −ˆχ0vx(D.12)

schreiben. Damit aber l¨

asst sich der gesamte EXX-Formalismus in folgender einfacher

Gleichung zusammenfassen:

X0(VFock −vx)!

= 0 .(D.13)

Nat¨

urlich ist dabei zu beachten, dass alle Gr¨

oßen der linken Seite — ggf. ¨

uber die Dichte —

noch von den Wellenfunktionen ψiabh¨

angen.

152 D Tensordarstellung der EXX-Methode

Zusammenhang zur Sham-Schl¨

uter-Gleichung

Die Form von (D.10) mit der darin enthaltenen Doppelintegration legt einen Zusammen-

hang zur Sham-Schl¨

uter-Gleichung [177] nahe. Diese beschreibt allgemein die Beziehung

zwischen dem Austausch-Korrelationsanteil der nicht-lokalen, energieabh¨

angigen Selbst-

energie Σxc und dem lokalen Austausch-Korrelationspotential vxc des Kohn-Sham-Systems

und ist durch

Zd3rZd3r′

Zdε GKS(r,r′, ε)G(r′′,r, ε)Σxc(r′,r′′, ε)−δ(r′−r′′)vxc(r′)= 0

(D.14)

gegeben. Hier ist Gdie voll wechselwirkende Greensfunktion [177] und

GKS(r,r′, ε) := lim

η→0+X

ψ0

j(r)ψ0

j(r′)∗

ε−(εj+ iηsgn(EF−εj)) (D.15)

die Greensfunktion des Kohn-Sham-Systems mit Fermi-Energie EF, wobei der Limes so

zu verstehen ist, dass er erst nach Anwendung von GKS auf einen anderen Ausdruck

ausgef¨

uhrt wird. Es ist ferner bekannt [171,177,178], dass die Sham-Schl¨

uter-Gleichung

n¨

aherungsweise in die OEP-Gleichung (1.97)¨

uberf¨

uhrt werden kann, wenn man (i) die

Selbstenergie nur durch ihren Austauschanteil ber¨

ucksichtigt, der mit dem nicht-lokalen

Austauschoperator (1.27) identisch ist, Σx=VFock, sowie entsprechend vxc durch vxer-

setzt, und (ii) Gdurch GKS gen¨

ahert wird. Dann entspricht die eckige Klammer in (D.14)

gerade der St¨

orung ∆vaus (D.9) und ist insbesondere unabh¨

angig von ε.

Hier soll nun speziell gezeigt werden, dass sich unter diesen Bedingungen die bei-

den Greensfunktionen gerade zu dem oben definierten verallgemeinerten Lineare-Antwort-

Operator (D.5) zusammenfassen lassen:

X0(r,r′,r′′) = 1

2πiZGKS(r,r′, ε)GKS(r′′,r, ε) dε . (D.16)

Da diese Beziehung nicht unmittelbar ersichtlich ist (und auch die nat¨

urlich in ¨

ahnlicher

Weise erfolgende Herleitung der OEP-Gleichung aus der Sham-Schl¨

uter-Gleichung in der

Literatur nur in sehr ”gestraffter” Form vorliegt), soll sie hier etwas detaillierter vorgef¨

uhrt

werden. Sei daf¨

ur zun¨

achst

F(ε) := X

j,k

ψ0

j(r)ψ0

j(r′)∗

ε−(εj+ iηsgn(EF−εj))

ψ0

k(r′′)ψ0

k(r)∗

ε−(εk+ iηsgn(EF−εk)) (D.17)

definiert. Ziel ist es dann, F¨

uber die reelle Achse zu integrieren, was am einfachsten

mit Hilfe der Funktionentheorie gelingt. Sei dazu die Doppelsumme in (D.17) so sortiert,

dass alle Glieder mit εj=εkund alle mit εj6=εkzusammengefasst sind. F¨

ur den nicht

entarteten Fall ließe sich das auch zu j=kbzw. j6=kvereinfachen. Dann hat man

F(ε) = X

j,k

εj=εk

ψ0

j(r)ψ0

j(r′)∗ψ0

k(r′′)ψ0

k(r)∗

[ε−(εj+ iηsgn(EF−εj))]2(D.18)

j,k

εj6=εk

ψ0

j(r)ψ0

j(r′)∗ψ0

k(r′′)ψ0

k(r)∗

[ε−(εj+ iηsgn(EF−εj))][ε−(εk+ iηsgn(EF−εk))] .

D Tensordarstellung der EXX-Methode 153

Zur Integration dieses Ausdrucks l¨

asst sich der Residuensatz anwenden:

Z∞

−∞

F(ε) dε= 2πiX

Res(F, pi),(D.19)

wobei die pidie in der oberen H¨

alfte der komplexen Ebene Cliegenden Punkte bezeichnen,

f¨

ur die Fnicht holomorph ist. Sie sind hier durch die Polstellen εi+iηsgn(EF−εi) gegeben,

die zu einem besetzten Zustand igeh¨

oren. Um nun

Resi:= Res F, εi+ iηsgn(EF−εi):= 1

2πiI

|ε−εi|=δ

F(ε) dε(D.20)

zu finden, beachte man, dass die erste Summe in (D.18) nur Pole 2. Ordnung enth¨

alt,

f¨

ur die das Residuum verschwindet. Es muss also nur noch die zweite Summe betrachtet

werden. Dort verschwinden wiederum alle Beitr¨

age mit εj6=εi∧εk6=εi. Damit verbleibt

Resi=1

2πiI

|ε−εi|=δX

εj6=εi

ψ0

j(r)ψ0

j(r′)∗ψ0

i(r′′)ψ0

i(r)∗

[ε−(εj+ iηsgn(EF−εj))][ε−(εi+ iη)] (D.21)

εk6=εi

ψ0

i(r)ψ0

i(r′)∗ψ0

k(r′′)ψ0

k(r)∗

[ε−(εi+ iη)][ε−(εk+ iηsgn(EF−εk))] dε .

Dies l¨

asst sich weiter vereinfachen mit der Cauchy-Formel

f(z) = 1

2πiI

∂A

f(ζ)

ζ−zdζ(z∈A),(D.22)

wobei feine geeignete holomorphe Funktion in einem zul¨

assigen Gebiet A⊂Cund ∂A

der Rand dieses Gebiets ist.2Mit ζ=εund z=εi+ iηwird (D.21) damit zu

Resi=X

εj6=εi

ψ0

j(r)ψ0

j(r′)∗ψ0

i(r′′)ψ0

i(r)∗

(εi+ iη)−(εj+ iηsgn(EF−εj)) (D.23)

εk6=εi

ψ0

i(r)ψ0

i(r′)∗ψ0

k(r′′)ψ0

k(r)∗

(εi+ iη)−(εk+ iηsgn(EF−εk)) .

Benennt man in der zweiten Summe kin jum, lassen sich die Summen zusammenfassen.

Anschließendes Einsetzen in den Residuensatz (D.19) und Vollziehen des Grenz¨

ubergangs

η→0+liefert

lim

η→0+

2πiZF(ε) dε=

occ.

lim

η→0+Resi= (D.24)

occ.

εj6=εi

ψ0

j(r)ψ0

j(r′)∗ψ0

i(r′′)ψ0

i(r)∗

εi−εj

+ψ0

i(r)ψ0

i(r′)∗ψ0

j(r′′)ψ0

j(r)∗

εi−εj.

Alle Glieder f¨

ur besetzte Zust¨

ande jk¨

urzen sich heraus (wie man durch Vertauschen von

iund jerkennt), und ein Vergleich mit (D.5) liefert unmittelbar die Beziehung (D.16),

was zu beweisen war.

2Die genauen Bedingungen f¨

ur die G¨

ultigkeit der Cauchyschen Integralformel sowie des Residuensatzes

lassen sich nicht ”kurz” zusammenfassen. Man entnehme sie der Speziallitaratur, z.B. Ref. 123. Sie sind

aber f¨

ur den hier untersuchten Fall erf¨

ullt.

Anhang E

Verallgemeinerung des

EXX-Formalismus auf

N-darstellbare Ladungsdichten

Es sei hier ein Ansatz vorgeschlagen, wie der nach Abschnitt 1.6.1 nur im Falle v-dar-

stellbarer Ladungsdichten anwendbare EXX/OEP-Formalismus zumindest formal auf N-

darstellbare Dichten verallgemeinert werden kann.

Bei der in Abschnitt 1.6.3 gezeigten Herleitung der EXX/OEP-Gleichung mag folgende

Frage aufgetaucht sein: Obwohl nur f¨

ur v-darstellbare Ladungsdichten definiert, wurde die

Gleichung aus der f¨

ur alle N-darstellbaren Dichten g¨

ultigen G¨

orling-Levy-St¨

orungstheorie

(Abschnitt 1.5.4) entwickelt. An welcher Stelle ging nun diese Allgemeinheit verloren? Die

Antwort ist folgende: In (1.101) wurde davon ausgegangen, dass die zur Ladungsdichte ρ

geh¨

orende Slater-Determinante Φ0aus den Nenergetisch niedrigsten Orbitalen der Kohn-

Sham-Gleichung (1.52) aufgebaut ist. Dies gilt jedoch nur im Falle der v-Darstellbarkeit.

Wie Levy und Perdew [43] zeigen (vgl. auch Ref. 21), existiert jedoch auch f¨

ur belie-

bige N-darstellbare Dichten ρstets ein effektives Potential der Kohn-Sham-Gleichung, so

dass eine einfache, aus Ngeeigeten Kohn-Sham-Orbitalen aufgebaute Slater-Determinante

gerade auf ρf¨

uhrt. Die benutzten Orbitale sind dann aber nicht mehr notwendigerweise

die Nniedrigsten; die Determinante ist also im Allgemeinen ein angeregter Zustand des

Kohn-Sham-Systems. Diese Tatsache erm¨

oglicht nun, die Austauschenergie wiederum wie

in (1.69) formal ¨

uber den Fock-Operator zu definieren; nur dass in der Summe jetzt nicht

mehr von 1 bis N, sondern ¨

uber die Ein-Teilchen-Zust¨

ande der Determinante, d.h., ¨

uber

die besetzten Orbitale, gez¨

ahlt wird.

Mit dieser Definition lassen sich ebenfalls beide Strategien zur Berechnung von vx[ρ],

die direkte (Abschnitt 1.6.1) und die st¨

orungstheoretische (Abschnitt 1.6.3), verfolgen: Sei

die geeignete, auf ρf¨

uhrende Determinante mit Φkρbezeichnet. Dann muss in (1.101)

nur Φ0durch das entsprechende Φkρersetzt werden, und umgekehrt wird in der Summe

nat¨

urlich auch Φkρdurch Φ0ersetzt. Die resultierende Gleichung hat ganau dieselbe Ge-

stalt wie (1.103) oder (1.97), nur dass in der Summe ¨

uber die Nbesetzten Orbitale jetzt

die Orbitale von Φkρgez¨

ahlt werden, und die Summierung der unbesetzten Orbitale eben-

falls entsprechend umgestaltet werden muss. Auch die direkte Berechnung des exakten

Austauschpotentials ¨

uber (1.90) liefert dieses Resultat: in χ0von (1.93) werden besetzte

und unbesetzte Orbitale analog umgruppiert.

Dieses χ0zeigt deutlich, was hier geschieht: es vermittelt zwischen einer kleinen ¨

Ande-

rung des effektiven Potentials und der entsprechenden linearen ¨

Anderung einer Ladungs-

154

E Verallgemeinerung des EXX-Formalismus auf N-darstellbare Ladungsdichten 155

dichte, die zu einem angeregten Zustand geh¨

ort. Die Inverse — wiederum ”lebt” sie nur

auf dem kleineren, um konstante Funktionen reduzierten Definitionsbereich — kann daher

zwischen der nicht-v-darstellbaren Dichte ρund dem Potential vermitteln, was der ”nor-

male” lineare Antwortoperator, zum Grundzustand Φ0geh¨

orend, nicht leisten konnte.

Auf zwei Schwierigkeiten im Zusammenhang mit dieser Definition sei allerdings hin-

gewiesen: (i) Man muss von vorneherein wissen, aus welchen Kohn-Sham-Orbitalen sich

eine gegebene Ladungsdichte ρzusammensetzt. Daf¨

ur gibt es bislang allerdings kein (prak-

tisch anwendbares) Kriterium, was den formalen Charakter obiger Definition ausmacht.

(ii) Bei dieser Vorgehensweise wird die Suche in (1.65), die eigentlich ¨

uber alle antisym-

metrischen Viel-Teilchen-Zust¨

ande erfolgt, auf einfache Slater-Determinanten reduziert.

Diese Definition des universellen Funktionals ist nicht mehr ganz so allgemein wie die

urspr¨

ungliche, aber ebenfalls anwendbar; sie wird z.B. in Ref. 21 und 179 diskutiert. An-

dererseits ist die Einschr¨

ankung auf Determinanten auch von Vorteil: sie garantiert eine

Austauschenergie in einer Form analog zur Hartree-Fock-Theorie und folglich, dass bereits

die Austauschwechselwirkung zur vollst¨

andigen Aufhebung der elektronischen Selbstwech-

selwirkung ausreichend ist.

Anhang F

Symmetriegen¨

ahertes EXX:

Herleitung der variationellen

Formulierung

Um ein Variationsprinzip f¨

ur das symmetriegen¨

aherte EXX-Verfahren (Abschnitt 4.6) her-

zuleiten, wird im Folgenden zun¨

achst die OEP-Gleichung (1.96) in periodischen Rand-

bedingungen formuliert (f¨

ur ein spin-kompensiertes System) und anschließend auf eine

Gestalt gebracht, die sich leicht als induzierte Ladungsdichte interpretieren l¨

asst. Wie in

Anhang Asei das Konjugiert-Komplexe zur Vermeidung zu vieler Klammern wieder durch

einen Querstrich anstelle eines Sterns gekennzeichnet.

Analog zu (B.12) ist die auf die unbesetzten Zust¨

ande projizierte Greensche Funktion

des Hamilton-Operators in (3.14) gegeben durch

G⊥

ik(r′,r) :=

unocc.

ψ0

jk(r′)ψ0

jk(r)

ε0

ik−ε0

=⇒G⊥

ik(r′,r) = G⊥

ik(r,r′),(F.1)

wobei noch die nachfolgend benutzte Symmetrieeigenschaft mit angegeben wurde. Damit

kann der lineare Antwortoperator (4.69) in der Form

χ0(r′,r) = X

occ.

unocc.

4ψ0

ik(r′)ψ0

jk(r′)ψ0

jk(r)ψ0

ik(r)

ε0

ik−ε0

(F.2)

occ.

4ψ0

ik(r′)G⊥

ik(r′,r)ψ0

ik(r)

geschrieben werden. Einsetzen in die OEP-Integrodifferentialgleichung (1.96) liefert dann

occ.

iZvx(r′)·4ψ0

ik(r′)G⊥

ik(r′,r)ψ0

ik(r)d3r′= (F.3)

occ.

iZ2δEx[ρ]

δψ0

ik(r′)G⊥

ik(r′,r)ψ0

ik(r) + 2 δEx[ρ]

δψ0

ik(r′)G⊥

ik(r′,r)ψ0

ik(r)d3r′,

wobei der Faktor 2 auf der rechten Seite aus der Summe ¨

uber den Spin resultiert. Um dies

auf eine Gestalt zu bringen, die sich in gewohnter Weise st¨

orungstheoretisch interpretieren

156

F Symmetriegen¨

ahertes EXX: Herleitung der variationellen Formulierung 157

l¨

asst (d.h., die Greensche Funktion soll von links auf eine St¨

orung wirken), werden beide

Seiten der Gleichung komplex konjugiert:

occ.

iZψ0

ik(r)G⊥

ik(r,r′)·2vx(r′)ψ0

ik(r′)d3r′= (F.4)

occ.

iZψ0

ik(r)G⊥

ik(r,r′)δEx[ρ]

δψ0

ik(r′)+ψ0

ik(r)G⊥

ik(r,r′)δEx[ρ]

δψ0

ik(r′)d3r′

occ.

iZψ0

ik(r)G⊥

ik(r,r′)VFockψ0

ik(r′) + ψ0

ik(r)G⊥

ik(r,r′)VFockψ0

ik(r′)d3r′.

Dabei wurde die Symmetrierelation (F.1) der Greenschen Funktion verwendet und in der

zweiten Umformung noch (1.22) sowie (1.27) benutzt. Umstellen liefert schließlich

occ.

iψ0

ik(r)ZG⊥

ik(r,r′) (VFock −2ˆvx)ψ0

ik(r′) d3r′

|{z }

=: ψ1

ik(r)

+ (F.5)

+ψ0

ik(r)ZG⊥

ik(r,r′)VFockψ0

ik(r′) d3r′

|{z }

=: f

ψ1

ik(r)

= 0 .

Durch die Wirkung der Greenschen Funktion auf die jeweils rechts von ihr stehenden

Ausdr¨

ucke k¨

onnen die Integrale als lineare Korrekturfunktionen ψ1

ikbzw. f

ψ1

ikaufgefasst

werden, mit denen sich die linke Seite der Gleichung in ¨

ahnlicher Form wie die induzierte

Ladungsdichte (2.4) zusammenfassen l¨

asst:

∆ρ(r) := X

occ.

iψ0

ik(r)ψ1

ik(r) + ψ0

ik(r)f

ψ1

ik(r)= 0 .(F.6)

Die Korrekturfunktionen ψ1

ikund f

ψ1

ikk¨

onnen dann nat¨

urlich wieder ¨

uber die Sternhei-

mer-Gleichung berechnet werden. Analog zu (4.12) ergibt sich:

(H0−ε0

i)Pc|ψ1

ii+PcH1|ψ0

ii= 0 mit H1:= VFock −2ˆvx,(F.7)

(H0−ε0

i)Pc|f

ψ1

ii+Pcf

H1|ψ0

ii= 0 mit f

H1:= VFock .(F.8)

Dies ist das in Abschnitt 4.6.3 verwendete Ergebnis.

Mit der Zeitinversionssymmetrie (3.7), angewandt etwa auf die linke Seite von (F.4),

erkennt man leicht, dass f¨

ur reellwertige Potentiale vxdie Definition der induzierten La-

dungsdichte (F.6) mit der urspr¨

unglichen Definition (2.4) identisch ist. F¨

ur komplexwer-

tige vx, wie sie beim symmetriegen¨

aherten EXX als Zwischenergebnisse auftreten (vgl.

Abschnitte 4.6.2 und 4.6.3), weichen die Definitionen hingegen voneinander ab.

Anhang G

Die OEP/EXX-Gleichung

aus dem Vielteilchenansatz

von G¨

orling und Levy

In Abschnitt 1.6.3 wurde, G¨

orling und Levy [42] folgend, skizziert, wie sich die OEP/EXX-

Gleichung in eleganter Weise aus einem st¨

orungstheoretischen Ansatz im Hilbertraum der

N-Teilchen-Funktionen herleiten l¨

asst. Dieser Ansatz f¨

uhrt — ganz analog zur variatio-

nellen Formulierung von Kapitel 2— auf die Forderung, die durch die St¨

orung induzierte

Ladungsdichte in erster Ordnung verschwinden zu lassen (Gleichung (1.102)), wobei die

Beschreibung allerdings komplett im Viel-Teilchen-Hilbertraum erfolgt. Die ¨

Aquivalenz zur

bekannten Formulierung der OEP/EXX-Gleichung in Ein-Teilchen-Funktionen, d.h., die

Umformung von Gleichung (1.102) zu Gleichung (1.103), wurde allerdings in Ref. 42 nicht

n¨

aher erl¨

autert. Obwohl es sich dabei um eine rein algebraische Aufgabe handelt, ist diese

Umformulierung jedoch keinesfalls trivial. Um ein echtes Nachvollziehen zu erm¨

oglichen,

sei sie daher an dieser Stelle schrittweise vorgef¨

uhrt.

Setzt man dazu (1.101) in die linke Seite von Gleichung (1.102) ein, so muss zun¨

achst

der Ausdruck hΦ0|ˆρ(r)|Φjif¨

ur alle j≥1 ausgewertet werden. Dabei sind sowohl der Grund-

zustand Φ0als auch die angeregten Zust¨

ande Φj(j≥1) durch Slater-Determinanten ge-

geben, die aus den Ein-Teilchen-Zust¨

anden φider Kohn-Sham-Gleichung (1.52) aufgebaut

sind:

Φ0(x1,...,xN) = 1

√N!X

P∈S

(−1)pφp1(x1)···φpN(xN),

Φj(x1,...,xN) = 1

√N!X

Q∈S

(−1)qφνq1(x1)···φνqN(xN).

Es seien φ1,...,φNdie besetzen Kohn-Sham-Orbitale, und φν1,...,φνNseien paarweis

verschiedene besetzte oder unbesetzte Kohn-Sham-Orbitale, von denen aber mindestens

eines unbesetzt sein soll.1Die ganzzahligen Indizes stehen jeweils f¨

ur einen geeigneten Satz

von Quantenzahlen und werden durch die Elemente der Permutationsgruppe Sunterein-

ander vertauscht.2F¨

ur jedes P∈ S sei dabei P(1,...,N) = (p1,...,pN). pgibt an, ob

1Genau genommen m¨

usste νj

istatt νigeschrieben werden, denn jedes Φjist nat¨

urlich aus anderen

Kohn-Sham-Orbitalen aufgebaut. Der ¨

Ubersichtlichkeit halber wird der Index jhier jedoch unterdr¨

uckt.

2Anstatt der Quantenzahlen k¨

onnte man auch die Koordinatenindizes permutieren. Bei der folgenden

Auswertung von hΦj|Vee|Φ0ierweist es sich jedoch als einfacher, die Quantenzahlen zu vertauschen.

158

G Die OEP/EXX-Gleichung aus dem Vielteilchenansatz von G¨

orling und Levy 159

Peine gerade oder ungerade Permutation ist. Die Permutationen wurden beim angereg-

ten Zustand mit Qbezeichnet, um im Nachfolgenden Verwirrungen zu vermeiden. Ferner

sollen die Ein-Teilchen-Zust¨

ande wie in (1.13) aus Spin- und Ortsanteil zusammengesetzt

sein, also φk(xi) := ψk(ri)χσk(si) mit xi:= (ri, si) und der Spinquantenzahl σkdes k-ten

Zustandes. Abk¨

urzend sei noch die Notation

Zdxi··· :=

si=−1

2Zd3ri··· (G.1)

f¨

ur die Integration ¨

uber den Ort und die Summe ¨

uber die beiden Spinkan¨

ale eingef¨

uhrt.

Damit ergibt sich:

hΦ0|ˆρ(r)|Φji=hΦ0|

m=1

δ(r−rm)|Φji(G.2)

N!X

P,Q∈S

(−1)p+q

m=1 Zdx1···dxN·

·φ∗

p1(x1)···φ∗

pN(xN)δ(r−rm)φνq1(x1)···φνqN(xN)

N!X

P,Q∈S

(−1)p+q·

m=1hφp1|φνq1i···hφpm|δ(r−rm)|φνqmi···hφpN|φνqNi.

Ist Φjein mehrfach angeregter Zustand, enth¨

alt also mehrere Ein-Teilchen-Zust¨

ande φνi

mit νi> N, werden in allen Summanden orthogonale Zust¨

ande direkt miteinander gekop-

pelt, und der gesamte Ausdruck verschwindet. Sei also in Φjnur der α-te Ein-Teilchen-

Zustand angeregt, φα→φνα, und f¨

ur die anderen Ein-Teilchen-Zust¨

ande gelte o.B.d.A.

φνi=φi. F¨

ur das Matrixelement hφpi|φνqiigilt dann: Es verschwindet, wenn qi=α, denn

in jedem Fall ist hφpi|φναi= 0. F¨

ur qi6=αerh¨

alt man hφpi|φνqii=hφpi|φqii=δpiqi.

Definiert man ein ”umgekehrtes Kronecker-Symbol” durch

δαβ := 1 −δαβ =0, α =β

1, α 6=β,(G.3)

l¨

asst sich dies mit hφpi|φνqii=δpi,qi˜

δα,qizusammenfassen, und (G.2) wird zu

hΦ0|ˆρ(r)|Φji=1

N!X

P,Q∈S

(−1)p+q

m=1

δp1,q1˜

δα,q1···δpm−1,qm−1˜

δα,qm−1·

·hφpm|δ(r−rm)|φνqmiδpm+1,qm+1 ˜

δα,qm+1 ···δpN,qN˜

δα,qN.

Auf Grund der δpi,qiverschwinden alle Summanden mit P6=Q, es gilt also

hΦ0|ˆρ(r)|Φji=

N!X

Q∈S

(−1)2q

m=1

δα,q1···˜

δα,qm−1hφqm|δ(r−r′)|φνqmi˜

δα,qm+1 ···˜

δα,qN,

160 G Die OEP/EXX-Gleichung aus dem Vielteilchenansatz von G¨

orling und Levy

wobei noch benutzt wurde, dass rmeine reine Integrationsvariable bei der Berechnung

des Skalarprodukts ist, die in r′umbenannt werden kann.3Bei der Summation ¨

uber m

von 1 bis Ndurchlaufen auch die qijeweils alle Werte von 1 bis N. Daher kann man die

Ersetzung qi→idurchf¨

uhren, und man hat

hΦ0|ˆρ(r)|Φji=1

N!X

Q∈S

m=1

δα,1···˜

δα,m−1hφm|δ(r−r′)|φνmi˜

δα,m+1 ···˜

δα,N .

Da die Summanden nun von qiunabh¨

angig sind, liefert die Summation ¨

uber Qgenau N!

mal dasselbe, womit sich der Normierungsfaktor wegk¨

urzt. Auf Grund der ˜

δα,i kann des

Weiteren in der Summe ¨

uber mnur der Summand m=αvon 0 verschieden sein. Damit

ergibt sich schließlich

hΦ0|ˆρ(r)|Φji=hφα|δ(r−r′)|φναi

=Zdx′ψ∗

α(r′)χ∗

σα(s′)δ(r−r′)ψνα(r′)χσνα(s′)

=ψ∗

α(r)ψνα(r)δσασνα.

Das Ergebnis ist 0, wenn die Spinquantenzahlen σαund σναdes besetzten bzw. unbesetzten

Zustandes nicht ¨

ubereinstimmen. Insgesamt erh¨

alt man also

hΦ0|ˆρ(r)|Φji=(ψ∗

α(r)ψνα(r)δσασναf¨

ur Φjeinfach angeregt mit φα→φνα

0 f¨

ur Φjmehrfach angeregt .(G.4)

Es sei bemerkt, dass das Matrixelement hier eine r-abh¨

angige Funktion und kein Skalar

ist, weil der Dichteoperator ˆρin (G.2) außer von den Teilchenkoordinaten rmnoch von

der Koordinate rabh¨

angt, ¨

uber die im Skalarprodukt nicht integriert wird.

Multipliziert man nun (1.101) von links mit hΨ0|ˆρ(r)|, wobei gem¨

aß Abschnitt 1.6.3

Ψ0= Φ0, liefern folglich nur die Summanden mit einfach angeregten Slater-Determinanten

einen Beitrag. Zur Berechnung ihrer entsprechenden Koeffizienten werden nun noch die

Matrixelemente des lokalen Potentials vlok[ρ] := vH[ρ] + vx[ρ] und des Operators der ge-

samten elektronischen Wechselwirkung Vee ben¨

otigt.

Sei also Φjeine einfach angeregte Determinante, in der wieder wie oben φαdurch φνα

ersetzt worden ist. F¨

ur das lokale Potential erh¨

alt man dann mit einer zur Auswertung

von (G.2) analogen ¨

Uberlegung:

hΦj|vlok[ρ]|Φ0i=hφνα|vlok[ρ]|φαiδσασνα.(G.5)

F¨

ur den Operator der elektronischen Wechselwirkung ergibt sich:

hΦj|Vee|Φ0i=1

N!X

P,Q∈S

(−1)p+q1

m,n=1

m6=n

Zdx1···dxN·(G.6)

·φ∗

νq1(x1)···φ∗

νqm(xm)···φ∗

νqn(xn)···φ∗

νqN(xN)·

·1

|rm−rn|φp1(x1)···φpm(xm)···φpn(xn)···φpN(xN).

3Formal streng korrekt w¨

are es, das Skalarprodukt durch hφqm|δ(r− ·)|φνqmiauszudr¨

ucken.

G Die OEP/EXX-Gleichung aus dem Vielteilchenansatz von G¨

orling und Levy 161

Da bis auf φναalle φνibesetzte Zust¨

ande bezeichnen, sei also o.B.d.A. wieder φνi=φi

f¨

ur i6=αgesetzt. Damit k¨

onnen bei der Summation ¨

uber Qh¨

ochstens die Permutation

Q=P, also insbesondere qm=pmund qn=pn, und die Permutation der Vertauschung

dieser beiden Zust¨

ande, also q1=p1,...,qm=pn,...,qn=pm,...,qN=pN, einen

Beitrag liefern. Ganz analog zur Berechnung der Wechselwirkungsenergie einer Slater-De-

terminante ergibt sich

hΦj|Vee|Φ0i=1

N!X

P∈S

m,n=1

m6=n

Zdx1···dxN·

·(−1)2pφ∗

νp1(x1)···φ∗

νpm(xm)···φ∗

νpn(xn)···φ∗

νpN(xN)·

·1

|rm−rn|φp1(x1)···φpm(xm)···φpn(xn)···φpN(xN)+

+ (−1)2p+1 φ∗

νp1(x1)···φ∗

νpn(xm)···φ∗

νpm(xn)···φ∗

νpN(xN)·

·1

|rm−rn|φp1(x1)···φpm(xm)···φpn(xn)···φpN(xN).

Wenn φνi=φif¨

ur alle i∈ {1,...,N}gelten w¨

urde, entspr¨

ache die erste eckige Klammer

exakt dem Ausdruck f¨

ur die Hartree-Energie und die zweite w¨

are mit der Austausch-

Energie identisch, wenn Summen und Integrale jeweils hineingezogen w¨

urden. Nun ist

aber φναorthogonal zu jedem besetzten Zustand. Summanden, in denen φναdirekt an φα

gekoppelt wird, verschwinden daher beim Ausf¨

uhren der Integration:

hΦj|Vee|Φ0i=

N!X

P∈S

m,n=1

m6=n

(+1) ˜

δα,p1˜

δα,p2···˜

δα,pn−1˜

δα,pn+1 ···˜

δα,pm−1˜

δα,pm+1 ···˜

δα,pN·

·Zφ∗

νpm(xm)φ∗

νpn(xn)φpm(xm)φpn(xn)

|rm−rn|dxmdxn+

+ (−1) ˜

δα,p1˜

δα,p2···˜

δα,pn−1˜

δα,pn+1 ···˜

δα,pm−1˜

δα,pm+1 ···˜

δα,pN·

·Zφ∗

νpn(xm)φ∗

νpm(xn)φpm(xm)φpn(xn)

|rm−rn|dxmdxn,

wobei ˜

δαβ wieder wie in (G.3) definiert sei. Die Variablen xmund xnwerden nur zur

Integration ben¨

otigt und k¨

onnen daher auch in xbzw. x′umbenannt werden. Ferner

durchlaufen bei der Summation ¨

uber mund njeweils von 1 bis Nauch die Variablen pm

bzw. pnje alle Werte von 1 bis N, und es ist pm6=pngenau dann, wenn m6=n. Daher

kann man ersetzen: pm→mund pn→n. Insgesamt erh¨

alt man so:

162 G Die OEP/EXX-Gleichung aus dem Vielteilchenansatz von G¨

orling und Levy

hΦj|Vee|Φ0i=

N!X

P∈S

m,n=1

(m6=n)

˜

δα,1˜

δα,2···˜

δα,n−1˜

δα,n+1 ···˜

δα,m−1˜

δα,m+1 ···˜

δα,N ·

·Zφ∗

νm(x)φ∗

νn(x′)φm(x)φn(x′)

|r−r′|dxdx′−Zφ∗

νn(x)φ∗

νm(x′)φm(x)φn(x′)

|r−r′|dxdx′.

Der Fall m=nmuss hier nicht mehr explizit ausgeschlossen werden, da sich die ent-

sprechenden Ausdr¨

ucke gegenseitig wegheben. Ferner ist die geschweifte Klammer von der

Permutation Punabh¨

angig, die Summe ¨

uber Pliefert also N! mal dasselbe, und der Nor-

mierungsfaktor k¨

urzt sich heraus. Auf Grund der ˜

δα,i tragen weiter zur Summe ¨

uber m

und nnur Glieder bei, f¨

ur die m=αoder n=αgilt. Es ist daher

hΦj|Vee|Φ0i=

n=1

(m=α)

Zφ∗

να(x)φ∗

νn(x′)φα(x)φn(x′)

|r−r′|dxdx′−Zφ∗

νn(x)φ∗

να(x′)φα(x)φn(x′)

|r−r′|dxdx′

m=1

(n=α)

Zφ∗

νm(x)φ∗

να(x′)φm(x)φα(x′)

|r−r′|dxdx′−Zφ∗

να(x)φ∗

νm(x′)φm(x)φα(x′)

|r−r′|dxdx′.

Beide Klammern sind identisch, wenn man in der oberen Zeile die Laufvariable nin m

umbenennt und die Namen der Integrationsvariablen xund x′vertauscht. So ergibt sich

hΦj|Vee|Φ0i=

m=1 Zφ∗

να(x)φ∗

νm(x′)φm(x′)φα(x)

|r−r′|dxdx′−Zφ∗

να(x)φ∗

νm(x′)φm(x)φα(x′)

|r−r′|dxdx′.

Nun war nach Voraussetzung φνm=φmf¨

ur m6=α. Der Summand mit m=αjedoch ist

0, da die beiden Integrale identisch sind. Er bleibt auch 0, wenn in der Formal φ∗

νm(x′) f¨

alle m∈ {1,...,N}durch φ∗

m(x′) ersetzt wird. Damit folgt

hΦj|Vee|Φ0i=

m=1 Zφ∗

να(x)φ∗

m(x′)φm(x′)φα(x)

|r−r′|dxdx′−Zφ∗

να(x)φ∗

m(x′)φm(x)φα(x′)

|r−r′|dxdx′

=Zφ∗

να(x)ZPN

m=1 φ∗

m(x′)φm(x′)

|r−r′|dx′φα(x) dx−

−Zφ∗

να(x)ZN

m=1

φ∗

m(x′)φm(x)

|r−r′|φα(x′) dx′dx

=δσασναZψ∗

να(r)Zρ(r′)

|r−r′|d3r′ψα(r) d3r+

+δσασναZψ∗

να(r)−ZN

m=1

δσmσα

ψ∗

m(r′)ψm(r)

|r−r′|ψα(r′) d3r′d3r .

G Die OEP/EXX-Gleichung aus dem Vielteilchenansatz von G¨

orling und Levy 163

Im letzten Schritt wurde benutzt, dass die Integration gem¨

aß (G.1) die Summation ¨

uber die

Spinkan¨

ale miteinschließt. Wird diese Summation ausgef¨

uhrt, verschwinden alle Terme, in

denen Wellenfunktionen mit unterschiedlichen Spinquantenzahlen gekoppelt werden. Die

Ortsintegration erfolgt dann nur noch ¨

uber den Ortanteil ψider Wellenfunktion. Ferner

wurde die Definition der Ladungsdichte (1.53) eingesetzt. In den Klammern stehen damit

gerade die Definitionen des Hartree-Potentials (1.25) und des Austausch-Potentials (1.27).

Es ist also schließlich

hΦj|Vee|Φ0i= (G.7)

=δσασναZψ∗

να(r)vH[ρ](r)ψα(r) d3r+δσασναZψ∗

να(r)VFock[{ψi}]ψα(r) d3r

=δσασναhψνα|vH[ρ]|ψαi+δσασναhψνα|VFock[{ψi}]|ψαi.

Bevor Ausdruck (1.102) endg¨

ultig ausgewertet werden kann, wird noch die Differenz

E0−Ejder Energien der Slater-Determinanten ben¨

otigt. Dies ist jedoch einfach: Da Φ0

und ΦjDeterminanten eines Kohn-Sham-Systems sind, sind die zugeh¨

origen Energien

durch die Summe der Energien der Ein-Teilchen-Zust¨

ande gegeben, aus denen sie jeweils

aufgebaut sind, vgl. die Fußnote auf Seite 20. Unterscheiden sich Φ0und Φjnur darin,

dass der besetzte Zustand φidurch den unbesetzten Zustand φjersetzt worden ist, folgt

unmittelbar E0−Ej=εi−εj.

Damit gelingt nun die Umformulierung der Viel-Teilchen- in die Ein-Teilchen-Darstel-

lung. Setzt man (1.101) unter Beachtung von Ψ0= Φ0in (1.102) ein und benutzt (G.4),

(G.5) und (G.7), hat man

hΨ0|ˆρ(r)|Ψ1i= (G.8)

∞

j=1hΦ0|ˆρ(r)|ΦjihΦj|Vee −vH[ρ]−vx[ρ]|Φ0i

E0−Ej

α=1

∞

να=N+1

δσασναψ∗

α(r)ψνα(r)hψνα|vH[ρ] + VFock[{ψk}]−vH[ρ]−vx[ρ]|ψαi

εα−ενα

Die Summe ¨

uber die besetzten Zust¨

ande kommt ins Spiel, da jeder besetzte Zustand ψα

(α∈ {1,...,N}) durch jeden unbesetzten Zustand ψνα(να∈ {N+ 1,...}) ersetzt wer-

den muss. Bei einem nicht-spinpolarisierten System ist stets δσασνα= 1, daf¨

ur w¨

aren die

Summanden aber noch mit geeigneten Besetzungszahlen zu multiplizieren. Die Umbenen-

nung α→i,να→jliefert schließlich in der Tat die linke Seite der OEP/EXX-Gleichung

(1.103), was zu zeigen war.

Mit (2.8) erkennt man, dass es sich bei der in Kapitel 2definierten induzierten La-

dungsdichte (2.4) und der von Levy und G¨

orling hergeleiteten Dichte¨

anderung (1.102) um

v¨

ollig identische Ausdr¨

ucke handelt:

∆ρ:=

occ.

(ψ0

i)∗ψ1

i+ c.c. = hΨ0|ˆρ(r)|Ψ1i+ c.c. ,(G.9)

wobei die ψ1

idie linearen Korrekturen der Ein-Teilchen-Wellenfunktionen ψ0

isind und Ψ1

die lineare Korrektur des Viel-Teilchen-Grundzustandes Ψ0ist.

Anhang H

Verallgemeinerte

Wannier-Funktionen

H.1 Translation um einen Gittervektor

Verallgemeinerte Wannier-Funktionen zu festem nk¨

onnen durch Translation ineinander

uberf¨

uhrt werden. Setzt man die Definition der Blochfunktionen (3.4) n¨

amlich in (8.6) ein,

folgt

hr|nRi=Ω

(2π)3ZBZ

e−iR·k

m=1

mn ψmk(r) (H.1)

=Ω

(2π)3ZBZ

e−iR·k

m=1

mn eik·rumk(r)

=Ω

(2π)3ZBZ

e−i0·k

m=1

mn eik·(r−R)umk(r−R)

=hr−R|n0i,

d.h., |nRiist in Ortsdarstellung die um den Gittervektor Rverschobene Funktion |n0i.

H.2 Aktualisierung der ¨

Uberlapp-Matrix

Zentrale Bedeutung bei der Implementierung des in Abschnitt 8.1 vorgestellten Verfahrens

zur Erzeugung von Wannier-Funktionen von Marzari und Vanderbilt [116,117] kommt den

Uberlapp-Matrizen (8.15) zu. Aus ihnen ergibt sich ¨

uber die Momente der ”

Wannier-Ver-

teilung” (8.13) und (8.14) sowohl die Lokalisierung (8.9) der Wannier-Funktionen als auch

der Gradient der Lokalisierung (8.19). Andererseits stellt die Berechnung der Nk·N2Ma-

trixelemente (Nk: Anzahl der k-Punkte, N: Anzahl der B¨

ander) aus den Blochfunktionen

gem¨

aß Definition (8.15) aber auch den teuersten Schritt in dem Verfahren dar.

Die Effizienz der Methode beruht letztlich darauf, dass — außer bei der Initialisie-

rung — die ¨

Uberlapp-Matrizen mittels einer numerisch trivialen Matrizenmultiplikation

auch aus den unit¨

aren Transformationen erhalten werden k¨

onnen, wie Gleichung (8.21)

zeigt. Da die Elemente der ¨

Uberlapp-Matrizen zudem die einzige Stelle im Iterationspro-

zess sind, an der die (durch vorangehende Schritte im Allgemeinen bereits transformierten)

164

H.3 Der Hamilton-Operator in der Darstellung Verallgemeinerter Wannier-Funktionen 165

Blochfunktionen explizit eingehen, entf¨

allt damit auch die Notwendigkeit, die Durchmi-

schung der B¨

ander gem¨

aß (8.5) explizit ausf¨

uhren zu m¨

ussen.

Die Beziehung (8.21) l¨

asst sich leicht herleiten: Multipliziert man (8.5) mit e−ik·r, folgt

|unki −→

m=1

mn|umki.

F¨

ur die Transformation der ¨

Uberlapp-Matrixelemente ergibt sich damit

Mk,∆k

mn := humk|un,k+∆ki −→ N

µ=1

(Uk

µm)∗huµk|N

ν=1 |uν,k+∆kiUk+∆k

νn 

µ,ν=1

(Uk

µm)∗huµk|uν,k+∆kiUk+∆k

νn

=(Uk)+Mk,∆kUk+∆kmn ,

was zu beweisen war.

H.3 Der Hamilton-Operator in der Darstellung Verallge-

meinerter Wannier-Funktionen

Die Definition der Verallgemeinerten Wannier-Funktionen (8.6) liefert f¨

ur die Matrixele-

mente des Hamilton-Operators

hnR|H|n′R′i= (H.2)

=Ω2

(2π)6N

m=1 Z

d3khψmk|e+ik·R(Uk

mn)∗HN

m′=1 Z

d3k′Uk′

m′n′e−ik′·R′|ψm′k′i

=Ω2

(2π)6X

m, m′Zd3kd3k′ei·(kR−k′R′)(Uk

mn)∗Uk′

m′n′hψmk|H|ψm′k′i

|{z }

=εmkδmm′δ(k−k′)

=Ω2

(2π)6X

mZd3keik·(R−R′)(Uk

mn)∗Uk

mn′εmk.

Hierbei wurde angenommen, dass die Blochfunktionen auf das periodische Grundgebiet

normiert sind (vgl. Abschnitt 3.1). Sind sie hingegen auf die Einheitszelle normiert, muss

die rechte Seite von (H.2) noch mit der Anzahl NRder darin enthaltenen Einheitszellen

multipliziert werden, da im Kontext mit Wannier-Funktionen das Skalarprodukt h...|...i

im Ortsraum sinnvollerweise als Integral ¨

uber das periodische Grundgebiet1definiert ist.

1Hierin liegt eine potentielle Fehlerquelle bei der Implementierung in einen Ebene-Wellen-Code: Dort

wird meist nur der periodische Anteil der Blochfunktionen betrachtet, der dann auf die Einheitszelle

normiert ist, vgl. Abschnitt 3.3.

166 H Verallgemeinerte Wannier-Funktionen

Spezialfall klassischer Wannier-Funktionen

F¨

ur den Spezialfall klassischer Wannier-Funktionen, wenn also die Durchmischung der

B¨

ander (8.5) abgeschaltaltet wird, l¨

asst sich obige Formel (H.2) vereinfachen. Setzt man

dazu alle Uk:= 1, erh¨

alt man

hnR|H|n′R′i=Ω2

(2π)6X

mZd3keik·(R−R′)δmn δmn′εmk(H.3)

=δnn′

Ω2

(2π)6Zd3keik·(R−R′)εnk.

Matrixelemente zwischen klassischen Wannier-Funktionen verschiedener B¨

ander (hier sind

nund n′ja wirklich Bandindizes) verschwinden also. Dies ist klar, weil die Teilhilbertr¨

aume

der zu den (isolierten) B¨

andern geh¨

orenden Blochfunktionen orthogonal zueinander stehen.

Ferner sind die nicht-verschwindenden Elemente direkt ¨

uber eine Fouriertransformation

des Bandes εnk(k∈BZ) gegeben.

H.4 Berechnung der Ein-Teilchen-Energien aus der Wan-

nier-Darstellung

In (H.2) gehen in der rechten Seite die aus einer vorangegangenen Diagonalisisierung von

Hin ebenen Wellen bereits bekannten Eigenwerte εmkein. Umgekehrt erh¨

alt man die

Ein-Teilchen-Energien aus der Wannier-Darstellung von H¨

uber Gleichung (8.26) [122].

Sie soll hier bewiesen werden.

Dazu seien zun¨

achst die Projektionen der Bloch- auf die Wannier-Funktionen mit Hilfe

der Wannier-Funktionen der ”Heimatzelle” bei R=0ausgedr¨

uckt:

hnR|ψmki=ZPG

d3rhnR|rihr|ψmki

r→r+R

=ZPG

d3rhnR|r+Rihr+R|ψmki

(H.1)

=ZPG

d3rhn0|riψmk(r+R)

Bloch

=ZPG

d3rhn0|riψmk(r) eik·R

=hn0|ψmkieik·R.

F¨

ur die Substitution im zweiten Schritt wurde ausgenutzt, dass sowohl Wannier- wie

auch Blochfunktionen auf dem periodischen Grundgebiet (PG) periodisch sind. Im dritten

Schritt wurde die Translationseigenschaft (H.1) der Wannier-Funktionen benutzt und im

vierten noch die Blochbedingung (3.5). Mit der Vollst¨

andigkeitsrelation2(8.3) folgt dann

|ψmki=X

n, R|nRihnR|ψmki=X

n, R|nRihn0|ψmkieik·R.

Diese Relation gilt auch dann, wenn in der Summe nicht ¨

uber alle B¨

ander, sonden nur ¨

uber

die B¨

ander n∈ {1,...,N}einer ”isolierten Gruppe” (vgl. Abschnitt 8.1.1) summiert wird,

2Die Vollst¨

andigkeitsrelation (8.3) ist dort f¨

ur klassische Wannier-Funktionen formuliert. Sie gilt aber

gem¨

aß Abschnitt 8.1.1 auch f¨

ur Verallgemeinerte Wannier-Funktionen.

H.4 Berechnung der Ein-Teilchen-Energien aus der Wannier-Darstellung 167

und |ψmkiin dieser Gruppe enthalten ist.3Damit gilt an jedem Punkt kdes reziproken

Raums f¨

ur die Ein-Teilchen-Energien:

εmkδmm′=hψmk|H|ψm′ki

=X

n, R

e−ik·Rhψmk|n0ihnR|HX

n′,R′|n′R′ihn′0|ψm′kieik·R′

n, n′hψmk|n0iX

R,R′

e−ik·(R−R′)hnR|H|n′R′ihn′0|ψm′ki.

Dies ist aber — komponentenweise geschrieben — gerade die unit¨

are Transformation beim

Wechsel von der Wannier- zur Energiedarstellung von H, so dass die εmkalso auch die

Eigenwerte der Matrix Ekmit

nn′:= X

R,R′∈PG

e−ik·(R−R′)hnR|H|n′R′i(H.4)

R,R′∈PG

e−ik·(R−R′)hn, R−R′|H|n′0i

=NRX

R∈PG

e−ik·RhnR|H|n′0i

sind. Im zweiten Schritt wurde die Gitterperiodizit¨

at des Hamilton-Operators verwendet,

und f¨

ur den letzten Schritt beachte man, dass f¨

ur beliebiges festgehaltenes R′die Summe

uber Rwegen der mit dem Grundgebiet PG periodischen Wannier-Funktionen identisch

ist. Q.e.d.

3Es gilt n¨

amlich PN

n=1 PR|nRihnR|=PN

m=1 RBZ d3k|ψmkihψmk|wegen der Unitarit¨

at der Transfor-

mation (8.6). Dies ist aber gerade die 1im Teilhilbertraum Tder isolierten Gruppe.

Literaturverzeichnis

[1] P. Hohenberg und W. Kohn, Phys. Rev. 136, B 864 (1964)

[2] W. Kohn und L.J. Sham, Phys. Rev. 140, A 1133 (1965)

[3] H.B. Shore, J.H. Rose und E. Zaremba, Phys. Rev. B 15, 2858 (1977)

[4] K. Schwarz, Chem. Phys. Lett. 57, 605 (1978)

[5] J.P. Perdew und A. Zunger, Phys. Rev. B 23, 5048 (1981)

[6] J. Harris und R.O. Jones, J. Chem. Phys. 68, 3316 (1978)

[7] J.P. Perdew und M. Levy, Phys. Rev. Lett. 20, 1884 (1983)

[8] L.J. Sham und M. Schl¨

uter, Phys. Rev. B 32, 3883 (1985)

[9] E. Schr¨

odinger, Ann. d. Physik 79, 361 (1926)

[10] M. Born und J.R. Oppenheimer, Ann. d. Physik 84, 457 (1927)

[11] J. Bardeen, L.N. Cooper und J.R. Schrieffer, Phys. Rev. 108, 1175 (1957)

[12] D.R. Hartree, Proc. Camb. Phil. Soc. 24, 328 (1928)

[13] V.A. Fock, Z. Phys. 61, 126 (1930)

[14] C. Møller und M.S. Plesset, Phys. Rev. 46, 618 (1934)

[15] A. Szabo und N.S. Ostlund, Modern Quantum Chemistry, McGraw-Hill, New York

(1989)

[16] J.C. Slater und J.H. Wood, Int. J. Quantum Chem. 4, 3 (1971)

[17] L.H. Thomas, Proc. Camb. Phil. Soc. 23, 542 (1927)

[18] E. Fermi, Rend. Accad. Lincei 6, 602 (1927)

[19] E. Fermi, Z. Phys. 48, 73–79 (1928)

[20] E. Fermi, Rend. Accad. Lincei 7, 342 (1928)

[21] R.G. Parr und W. Yang, Density-functional theory of atoms and molecules, Oxford

University Press (1989)

[22] E. Teller, Rev. Mod. Phys. 34, 627 (1962)

169

170 LITERATURVERZEICHNIS

[23] C.-O. Almbladh und A.C. Pedroza, Phys. Rev. A 29, 2322 (1984)

[24] R.M. Dreizler und E.K.U. Gross, Density Functional Theory, Springer, Berlin (1990)

[25] C.-O. Almbladh und U. von Barth, Phys. Rev. B 31, 3231 (1985)

[26] F.J. Janak, Phys. Rev. B 18, 7165 (1978)

[27] M. Levy, Proc. Natl. Acad. Sci. USA 76, 6062 (1979)

[28] T.L. Gilbert, Phys. Rev. B 12, 2111 (1975)

[29] D.C. Langreth und M.J. Mehl, Phys. Rev. B 28, 1809 (1983)

[30] M. Levy und J.P. Perdew, Phys. Rev. A 32, 2010 (1985)

[31] M. Levy, Phys. Rev. A 43, 4637 (1991)

[32] E.J. Baerends, Phys. Rev. Lett. 87, 133004-1 (2001)

[33] U. von Barth und L. Hedin, J. Phys. C 5, 1629 (1972)

[34] D.M. Ceperley und B.L. Alder, Phys. Rev. Lett. 45, 566 (1980)

[35] A.D. Becke, Phys. Rev. A 38, 3098 (1988)

[36] J.P. Perdew, Phys. Rev. B 33, 8822 (1986)

[37] C.L. Lee, W. Yang und R.G. Parr, Phys. Rev. B 37, 785 (1988)

[38] J.P. Perdew und Y. Wang, Phys. Rev. B 45, 13244 (1992)

[39] J.P. Perdew, K. Burke und M. Ernzerhof, Phys. Rev. Lett. 77, 3865 (1996)

[40] A. G¨

orling und M. Levy, Phys. Rev. B 47, 13 105 (1993)

[41] A. G¨

orling und M. Levy, Phys. Rev. A 50, 196 (1994)

[42] A. G¨

orling und M. Levy, Int. J. Quantum Chem., Symp. 29, 93 (1995)

[43] M. Levy und J.P. Perdew in Density Functional Methods In Physics (Hrsg.: R.M.

Dreizler und J. Providencia), Plenum Press, New York (1985)

[44] C.J. Umrigar und X. Gonze, Phys. Rev. A 50, 3827 (1994)

[45] C. Filippi, X. Gonze und C.J. Umrigar in Recent Developments and Applications of

Density Functional Theory (Hrsg.: J.M. Seminario), Elsevier, Amsterdam (1996)

[46] In-Ho Lee und R.M. Martin, Phys. Rev. A 56, 7197 (1997)

[47] A. G¨

orling, Phys. Rev. B 53, 7024 (1996)

[48] T. Grabo, T. Kreibich und E.K.U. Gross, Mol. Eng. 7, 27 (1997)

[49] T. Grabo, T. Kreibich, S. Kurth und E.K.U. Gross in Strong Coulomb Correlation

in Electronic Structure (Hrsg.: V.I. Anisimov), Gordan & Breach Science Publishers

(2000)

LITERATURVERZEICHNIS 171

[50] E. Engel und R.M. Dreizler, J. Comput. Chem. 20, 31 (1999)

[51] M. St¨

adele, J.A. Majewski, P. Vogl und A. G¨

orling, Phys. Rev. Lett. 79, 2089 (1997)

[52] M. St¨

adele, M. Moukara, J.A. Majewski, P. Vogl und A. G¨

orling, Phys. Rev. B, 59,

10 031 (1999)

[53] W.G. Aulbur, M. St¨

adele und A. G¨

orling, Phys. Rev. B 62, 7121 (2000)

[54] T. Kreibich, E.K.U. Gross und E. Engel, Phys. Rev. A 57, 138 (1998)

[55] A. G¨

orling, Phys. Rev. A 46, 3753 (1992)

[56] S. Hirata, S. Ivanov, I. Grabowski, R.J. Bartlett, K. Burke und J.D. Talman, J.

Chem. Phys. 115, 1635 (2001)

[57] T. Kotani, Phys. Rev. B 50, 14 816 (1994)

[58] Q. Zhao und R.G. Parr, Phys. Rev. A 46, 2337 (1992)

[59] Q. Zhao und R.G. Parr, J. Chem. Phys. 98, 543 (1992)

[60] E. Engel und S.H. Vosko, Phys. Rev. A 47, 2800 (1993)

[61] S. Ivanov, S. Hirata und R.J. Bartlett, Phys. Rev. Lett. 83, 5455 (1999)

[62] A. G¨

orling, Phys. Rev. Lett. 83, 5459 (1999)

[63] R.T. Sharp and G.K. Horton, Phys. Rev. 90, 317 (1953)

[64] J.C. Slater, Phys. Rev. 81, 385, (1951)

[65] J.D. Talman und W.F. Shadwick, Phys. Rev. A 14, 36 (1976)

[66] K. Aashamar, T.M. Luke und J.D. Talman, At. Data and Nucl. Data Tables 22, 443

(1978)

[67] K. Aashamar, T.M. Luke und J.D. Talman, Phys. Rev. A 19, 6 (1979)

[68] V. Sahni, J. Gruenebaum und J.P. Perdew, Phys. Rev. B 26, 4371 (1982)

[69] J.P. Perdew und M.R. Norman, Phys. Rev. B 26, 5445 (1982)

[70] J.B. Krieger, Y. Li und G.J. Iafrate, Phys. Lett. A 146, 256 (1990)

[71] J.B. Krieger, Y. Li und G.J. Iafrate, Phys. Rev. A 45, 101 (1992)

[72] J.B. Krieger, Y. Li und G.J. Iafrate, Phys. Rev. A 46, 5453 (1992)

[73] J.B. Krieger, Y. Li und G.J. Iafrate, Phys. Rev. A 47, 165 (1993)

[74] D.M. Bylander und L. Kleinman, Phys. Rev. Lett. 74, 3660 (1995)

[75] D.M. Bylander und L. Kleinman, Phys. Rev. B 52, 14 566 (1995)

[76] D.M. Bylander und L. Kleinman, Phys. Rev. B 54, 7891 (1996)

[77] D.M. Bylander und L. Kleinman, Phys. Rev. B 55, 9432, (1997)

172 LITERATURVERZEICHNIS

[78] M. Wahn, Implementation und Analyse des exakten Austauschfunktionals in der

Dichtefunktionaltheorie, Diplomarbeit, Technische Universit¨

at Berlin (2002)

[79] S. K¨

ummel und J.P. Perdew, Phys. Rev. Lett. 90, 043 004 (2003)

[80] S. K¨

ummel und J.P. Perdew, Phys. Rev. B 68, 035 103 (2003)

[81] S/PHI/nX, auf C++ basierte modulare DFT-Bibliothek (http://sphinxlib.de)

[82] S. Boeck, A. Dick, Ch. Freysoldt, F. Grzegorzewski, T. Hammerschmidt, L. Ismer,

L. Lymperakis und M. Wahn, SFHIngX User’s Guide (Hrsg.: S. Boeck und J. Neu-

gebauer), Berlin (2003), online siehe Ref. 81

[83] E.N. Zein, Fiz. Tverd. Tela (Leningrad) 26, 3024 (1984) [englische ¨

Ubersetzung in

Sov. Phys. Solid State 26, 1825 (1984)]

[84] S. Baroni, P. Giannozzi und A. Testa, Phys. Rev. Lett. 58, 1861 (1987)

[85] S. Baroni, S. de Gironcoli, A. dal Corso und P. Giannozzi, Rev. Mod. Phys. 73, 515

(2001)

[86] R.M. Sternheimer f¨

uhrte mit Hilfe dieser Gleichung numerische Berechnungen zur

Polarisierbarkeit von Ionen durch, Phys. Rev. 96, 951 (1954)

[87] F. della Sala und A. G¨

orling, J. Chem. Phys. 115, 5718 (2001)

[88] C. Kittel, Introduction to Solid State Physics, 7th ed., Wiley, New York (1996)

[89] O. Madelung, Introduction to Solid-State Theory, Springer, Berlin (1978)

[90] R. Enderlein und N.J.M. Horing, Fundamentals of Semiconductor Physics, World

Scientific, Singapore (1997)

[91] P.J.H. Denteneer und W. van Haeringen, J. Phys. C 18, 4127 (1985)

[92] U. Scherz, Quantenmechanik, Teubner, Stuttgart (1999)

[93] A. Baldereschi, Phys. Rev. B 7, 5212 (1973)

[94] D.J. Chadi und M.L. Cohen, Phys. Rev. B 8, 5747 (1973)

[95] J.D. Joannopoulos und M.L. Cohen, J. Phys. C 6, 1572 (1973)

[96] H.J. Monkhorst und J.D. Pack, Phys. Rev. B 13, 5188 (1976)

[97] R.A. Evarestov und V.P. Smirnov, Phys. Stat. Sol. B 119, 9 (1983)

[98] F. Gygi und A. Baldereschi, Phys. Rev. B 34, 4405 (1986)

[99] B. Wenzien, G. Cappellini und F. Bechstedt, Phys. Rev. B 51, 14 701 (1995)

[100] D.J. Singh, Planewaves, pseudopotentials and the LAPW method, Kluwer, Boston

(1994)

[101] E. Sj¨

ostedt, L. Nordstr¨

om und D. J. Singh, Solid State Comm. 114, 15 (2000)

LITERATURVERZEICHNIS 173

[102] G.K.H. Madsen, P. Blaha, K. Schwarz, E. Sj¨

ostedt und L. Nordstr¨

om, Phys. Rev. B

64, 195 134 (2001)

[103] P.E. Bl¨

ochl, Phys. Rev. B 50, 17 953 (1994)

[104] S.G. Louie, S. Froyen und M.L. Cohen, Phys. Rev. B 26, 1738 (1982)

[105] M. Fuchs, M. Bockstedte, E. Pehlke und M. Scheffler, Phys. Rev. B 57, 2134 (1998)

[106] D.R. Hamann, M. Schl¨

uter und C. Chiang, Phys. Rev. Lett. 43, 1494 (1979)

[107] G. Kerker, J. Phys. C 13, L189 (1980)

[108] G.B. Bachelet, D.R. Hamann und M. Schl¨

uter, Phys. Rev. B 26, 4199 (1982)

[109] N. Troullier und J.L. Martins, Phys. Rev. B 43, 1993 (1991)

[110] D.R. Hamann, Phys. Rev. B 40, 2980 (1989)

[111] M. Moukara, Pseudopotentiale mit exaktem Austausch, Dissertation, Technische Uni-

versit¨

at M¨

unchen (1998)

[112] M. Moukara, M. St¨

adele, J.A. Majewski, P. Vogl und A. G¨

orling, J. Phys.: Condens.

Matter 12, 6783 (2000)

[113] L. Kleinman und D.M. Bylander, Phys. Rev. Lett. 48, 1425 (1982)

[114] X. Gonze, R. Stumpf und M. Scheffler, Phys. Rev. B 44, 8503 (1991)

[115] M. Fuchs und M. Scheffler, Comput. Phys. Commun. 119, 67 (1999)

[116] N. Marzari und D. Vanderbilt, Phys. Rev. B 56, 12 847 (1997)

[117] I. Souza, N. Marzari und D. Vanderbilt, Phys. Rev. B 65, 035 109 (2001)

[118] G.H. Wannier, Phys. Rev. 52, 191 (1937)

[119] E.I. Blount, Solid State Phys. 13, 305 (1962)

[120] P.-O. L¨

owdin, J. Chem. Phys. 18, 365 (1950)

[121] P.-O. L¨

owdin, Adv. Phys. 5, 172 (1956)

[122] M. Wahn und J. Neugebauer, Phys. Stat. Sol. B 243, No. 7, 1583 (2006)

[123] R. W¨

ust, H¨

ohere Mathematik f¨

ur Physiker (Band 1 und 2), de Gruyter, Berlin (1995)

[124] L. Collatz, Differentialgleichungen, Teubner, Stuttgart (1990)

[125] W. Nolting, Grundkurs Theoretische Physik, Bd. 5, Teil 1, Abschnitt 3.2.7,

Zimmermann-Neufang, Ulmen (1989)

[126] M.R. Spiegel, Komplexe Variablen, McGraw-Hill, London (1977)

[127] F. Schwabl, Quantenmechanik, Springer, Berlin (1988)

[128] E. Polak, Computational Methods in Optimization, Academic Press, New York

(1971)

174 LITERATURVERZEICHNIS

[129] W.H. Press, S.A. Teulosky, W.T. Vetterling, und B.P. Flannery, Numerical Recipes

in C: the art of scientific computing, Cambridge University Press (1992)

[130] M.C. Payne, M.P. Teter, D.C. Allen, T.A. Arias, und J.D. Joannopoulos, Rev. Mod.

Phys. 64, 1045 (1992)

[131] J.R. Shewchuk, An Introduction to the Conjugate Gradient Method Without the

Agonizing Pain, Edition 11

4, Pittsburgh, USA (1994),

http://www.cs.cmu.edu/∼quake-papers/painless-conjugate-gradient.pdf

[132] M.P. Teter, M.C. Payne und D.C. Allan, Phys. Rev. B 40, 12 255 (1989)

[133] S. Ismail-Beigi und T.A. Arias, Comput. Phys. Commun. 128, 1 – 45 (2000)

[134] P.H. Dederichs und R. Zeller, Phys. Rev. B 28, 5462 (1983)

[135] H. Akai und P.H. Dederichs, J. Phys. C 18, 2455 (1985)

[136] C.G. Broyden, Math. Comput. 19, 577 (1965)

[137] D.D. Johnson, Phys. Rev. B 38, 12 807 (1988)

[138] G.P. Srivastava, J. Phys. A 17, L317 (1984)

[139] D. Vanderbilt und S.G. Louie, Phys. Rev. B 30, 6118 (1984)

[140] P. Pulay, Chem. Phys. Lett. 73, 393 (1980)

[141] P. Pulay, J. Comp. Chem. 3, 556 (1982)

[142] G. Kresse und J. Furthm¨

uller, Comput. Mat. Sci. 6, 15 (1996)

[143] G. Kresse und J. Furthm¨

uller, Phys. Rev. B 54, 11 169 (1996)

[144] D.R. Bowler und M.J. Gillan, Chem. Phys. Lett. 325, 473 (2000)

[145] G.P. Kerker, Phys. Rev. B 23, 3082 (1981)

[146] R. Car, E. Tosatti, S. Baroni und S. Leelaprute, Phys. Rev. B 24, 985 (1981)

[147] K.-M. Ho, J. Ihm und J.D. Joannopoulos, Phys. Rev. B 25, 4260 (1982)

[148] J.F. Annett, Comput. Mat. Sci. 4, 23 (1995)

[149] O. Gunnarsson und B.I. Lundqvist, Phys. Rev. B 13, 4274 (1976)

[150] L. Hedin, Phys. Rev. 139, A796 (1965)

[151] L. Hedin und S. Lundqvist in Solid State Physics, Advances in Research and Ap-

plication (Hrsg.: F. Seitz, D. Turnbull und H. Ehrenreich), Academic, New York

(1969), Band 23, S. 1

[152] M. Rohlfing, P. Kr¨

uger und J. Pollmann, Phys. Rev. B 57, 6485 (1998)

[153] Vgl. den ¨

Ubersichtsartikel von S.C. Jain, M. Willander, J. Narayan und R. van

Overstraeten: J. Appl. Phys. 87, 965 (2000)

LITERATURVERZEICHNIS 175

[154] C. Stampfl und C.G. Van de Walle, Phys. Rev. B 59, 5521 (1999)

[155] F. Bechstedt und J. Furthm¨

uller, J. Cryst. Growth 246, 315 (2002)

[156] Intrinsic Properties of Group IV Elements and III-V, II-VI, and I-VII Compounds

(Hrsg.: K.H. Hellwege und O. Madelung), Landolt-B¨

ornstein, New Series, Group III,

Vol. 22, Pt. A, Springer, Berlin (1987)

[157] J. Wu, W.W. Walukiewicz, K.M. Yu, J.W. Ager III, E.E. Haller, H. Lu, W.J. Schaff,

Y. Saito und Y. Nanishi, Appl. Phys. Lett. 80, 3967 (2002)

[158] T. Matsuoka, H. Okamoto, M. Nakao, H. Harima und E. Kurimoto, Appl. Phys.

Lett. 81, 1246 (2002)

[159] V.Y. Davydov, A.A. Klochikhin, V.V. Emtsev, S.V. Ivanov, V.V. Vekshin, F. Bech-

stedt, J. Furthm¨

uller, H. Harima, A.V. Mudryi, A. Hashimoto, Y. Yamamoto, J.

Aderhold, J. Graul, E.E. Haller, Phys. Stat. Sol. B 230, R4 (2002)

[160] T. Kotani und M. van Schilfgaarde, Solid State Commun. 121, 461 (2002)

[161] M. Usuda, N. Hamada, K. Shiraishi und A. Oshiyama, Jpn. J. Appl. Phys., Part 2,

43, L407 (2004)

[162] T. Lei, M. Fanciulli, R.J. Molnar, T.D. Moustakas, R.J. Graham, und J. Scanlon,

Appl. Phys. Lett. 59, 944 (1992)

[163] T. Lei, T.D. Moustakas, R.J. Graham, Y. He und S.J. Berkowitz, J. Appl. Phys. 71,

4933 (1992)

[164] C. R. Eddy, T. Moustakas und J. Scanlon, J. Appl. Phys. 73, 448 (1993)

[165] M.J. Paisley, Z. Sitar, J.B. Posthill und R.F. Davis, J. Vac. Sci. Technol. A 7, 701

(1989)

[166] Z. Sitar, M.J. Paisley, J. Ruan, J.W. Choyke und R.F. Davis, J. Mater. Sci. Lett.

11, 261 (1992)

[167] I. Vurgaftman und J.R. Meyer, J. Appl. Phys. 94, 3675 (2003)

[168] A. Qteish, private Korrespondenz

[169] A. Qteish, A.I. Al-Sharif, M. Fuchs, M. Scheffler, S. Boeck und J. Neugebauer, Phys.

Rev. B 72, 155 317 (2005)

[170] A. Qteish, P. Rinke, M. Scheffler und J. Neugebauer, Phys. Rev. B 74, 245 208 (2006)

[171] P. Rinke, A. Qteish, J. Neugebauer, C. Freysoldt und M. Scheffler, New J. Phys. 7,

126 (2005)

[172] P. Rinke, M. Scheffler, A. Qteish, M. Winkelnkemper, D. Bimberg und J. Neuge-

bauer, Appl. Phys. Lett. 89, 161 919 (2006)

[173] P. Rinke, A. Qteish, J. Neugebauer und M. Scheffler, ΨkNewsletter 79, 163 (2007)

176 LITERATURVERZEICHNIS

[174] P. Rinke, M. Winkelnkemper, A. Qteish, D. Bimberg, J. Neugebauer und M. Scheff-

ler, Consistent set of band parameters for the group-III nitrides AlN, GaN, and InN.

Phys. Rev. B, akzeptiert

[175] P. Rinke, A. Qteish, J. Neugebauer und M. Scheffler, Exciting prospects for solids:

Exact-exchange based functionals meet quasiparticle energy calculations. Phys. Stat.

Sol. B, akzeptiert

[176] M.S. Hybertsen und S.G. Louie, Phys. Rev. B 35, 5585 (1987)

[177] L.J. Sham und M. Schl¨

uter, Phys. Rev. Lett. 51, 1888 (1983)

[178] M.E. Casida, Phys. Rev. A 51, 2005 (1995)

[179] E.H. Lieb, Int. J. Quantum Chem. 24, 243 (1983)

Danksagung

Mein Dank gilt nat¨

urlich an erster Stelle Professor Dr. J¨

org Neugebauer, der mir die

Gelegenheit zur Durchf¨

uhrung dieser Doktorarbeit gegeben hat. Ohne seine Betreuung,

sein stetes Interesse am Projekt und die unz¨

ahligen fruchtbaren Diskussionen mit ihm

w¨

are diese Arbeit kaum zu verwirklichen gewesen.

Herrn Professor Dr. Scheffler danke ich daf¨

ur, dass er mir die M¨

oglichkeit gab, die-

se Arbeit am Fritz-Haber-Institut der Max-Planck-Gesellschaft (im vielleicht sch¨

onsten

Arbeitszimmer des Instituts) anzufertigen.

Sixten Boeck und Christoph Freysoldt m¨

ochte ich vor allem f¨

ur ihre unerm¨

udliche Hilfe

bei der Einarbeitung in das Programmieren mit C++ danken, aber auch f¨

ur die vielen

anderen, nicht nur wissenschaftlichen, Diskussionen. Patrick Rinke m¨

ochte ich ebenfalls

f¨

ur viele kreative Hinweise und Gespr¨

ache danken und Professor Dr. Qteish f¨

ur die Be-

reitstellung der OEP-Pseudopotentiale. Ein herzlicher Dank geht an Liverios Lymperakis,

mit dem ich lange Zeit das B¨

uro geteilt habe.

In sehr angenehmer Erinnerung bleibt mir die Zusammenarbeit mit Stefan Schulz aus

der Gruppe von Professor Dr. Czycholl an der Uni Bremen.

Außerdem gilt mein Dank allen Mitgliedern der Abteilung Computergest¨

utztes Ma-

terial-Design am MPI f¨

ur Eisenforschung sowie der Theorie-Abteilung des Fritz-Haber-

Instituts. Die gute Atmosph¨

are in diesen beiden Gruppen hat insgesamt sehr zum Gelingen

der Arbeit beigetragen.

Ebenfalls m¨

ochte ich meinen besten Freunden danken, die mich auf dem nicht immer

v¨

ollig m¨

uhelosen Weg immer wieder motiviert haben. Meiner lieben Julia danke ich f¨

die Kraft und das n¨

otige Durchhalteverm¨

ogen, das sie mir in den letzten Monaten dieser

Arbeit gegeben hat.

Ganz besonders aber m¨

ochte ich an dieser Stelle meinen Eltern Dank sagen! Sie ha-

ben mir Entscheidendes erm¨

oglicht, ohne das ich diese Seiten hier nicht h¨

atte schreiben

k¨

onnen!

177