mArachna [original]

– mArachna –

Eine semantische Analyse der mathematischen Sprache

f¨

ur ein computergest¨

utztes Information Retrieval System

vorgelegt von:

Dipl.-Phys. Nicole Natho

Berlin

Fakult¨

at II – Mathematik und Naturwissenschaften

der Technischen Universit¨

at Berlin

zur Erlangung des akademischen Grades

Doktor der Naturwissenschaften

– Dr. rer. nat. –

genehmigte Dissertation

Promotionsausschuss:

Vorsitzender: Prof. Dr. Christian Thomsen

Berichter/Gutachter: Prof. Dr. Ruedi Seiler

Berichter/Gutachter: Prof. Dr. Manfred Stede

zus¨

atzliche Gutachterin: Prof. Dr. Christiane Fellbaum

Tag der wissenschaftlichen Aussprache:

17. Februar 2005

Berlin 2005

D 83

2

3

Danksagungen

An dieser Stelle m¨

ochte ich mich zu allererst bei meinen Doktorvater Ruedi Seiler

bedanken, der immer an meine Ideen glaubte und mir viel Freiraum verschaff-

te diese zu realisieren. Er unterst¨

utzte mich tatkr¨

aftig und hat keine M¨

uhen

gescheut mir weiter zu helfen.

Des Weiteren m¨

ochte ich mich bei Christiane Fellbaum bedanken, die mir durch

ihre Begeisterung viel Mut machte dieses Projekt zu bearbeiten und mir viele

wertvolle Ratschl¨

age gab. Bei Sabina Jeschke, die mir ebenfalls im Zuge des

Mumienprojektes Vertrauen, Zeit und wertvolle Tipps gab, meine Ideen zu ver-

wirklichen. Bei Sebastian Rittau, der viele Ideen mitverwirklichte und diese tech-

nisch umsetzte. Bei Sven Grottke, der zahlreiche Stunden mit mir ausharrte, um

dieses Werk zu vollenden. Bei Erhard Zorn, der all diese Seiten Korrektur lesen

musste und immer beruhigende Worte parat hatte. Und schließlich bei Thomas

Richter, der dieser Arbeit den letzten Schliff gab. Sowie an alle, die w¨

ahrend

dieser Zeit meine Launen tapfer ertragen mussten.

4

Inhaltsverzeichnis

1 Einleitung 9

1.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.2 Ziele und Hypothesen . . . . . . . . . . . . . . . . . . . . . . . . 12

2 Disziplinen 15

2.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.2 Wissensmanagement . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.2.1 Daten, Informationen und Wissen . . . . . . . . . . . . . 18

2.2.2 Wissensorganisation und Wissensrepr¨

asentation . . . . . . 22

2.2.3 Wissensbasierte Systeme . . . . . . . . . . . . . . . . . . . 30

2.3 Sprachverstehen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

2.3.1 Psychologische Modelle zum Textverstehen . . . . . . . . 42

2.4 Computerlinguistik . . . . . . . . . . . . . . . . . . . . . . . . . . 44

2.4.1 Morphologie . . . . . . . . . . . . . . . . . . . . . . . . . . 45

2.4.2 Syntax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

2.4.3 Semantik . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

2.4.4 Fachsprache . . . . . . . . . . . . . . . . . . . . . . . . . . 66

2.5 Information Retrieval . . . . . . . . . . . . . . . . . . . . . . . . 69

2.5.1 Methoden des Information Retrieval . . . . . . . . . . . . 73

5

6INHALTSVERZEICHNIS

3 Mathematische Strukturen 77

3.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

3.2 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

3.2.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

3.2.2 Mathematische Logiken . . . . . . . . . . . . . . . . . . . 82

3.2.3 Axiomatische Mengenlehre . . . . . . . . . . . . . . . . . 89

3.3 Sprachstrukturen . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

3.3.1 Entit¨

atenebene . . . . . . . . . . . . . . . . . . . . . . . . 97

3.3.2 Binnenstrukturebene . . . . . . . . . . . . . . . . . . . . . 103

3.3.3 Satzstrukturebene . . . . . . . . . . . . . . . . . . . . . . 107

3.3.4 Wortebene . . . . . . . . . . . . . . . . . . . . . . . . . . 127

3.3.5 Symbolebene . . . . . . . . . . . . . . . . . . . . . . . . . 129

3.3.6 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . 130

3.4 Wissensstrukturen . . . . . . . . . . . . . . . . . . . . . . . . . . 133

3.4.1 Ontologie der Mathematik . . . . . . . . . . . . . . . . . . 133

3.4.2 Taxonomie der Mathematik . . . . . . . . . . . . . . . . . 139

3.4.3 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . 149

4 Architektur von mArachna 151

4.1 Gesamtkonzeption . . . . . . . . . . . . . . . . . . . . . . . . . . 151

4.2 Nat¨

urlichsprachliche Analyse . . . . . . . . . . . . . . . . . . . . 155

4.2.1 Zerlegung von L

A

T

EX in Satzteile, W¨

orter und Formeln . 155

4.2.2 Morphologische Analyse . . . . . . . . . . . . . . . . . . . 162

4.2.3 Syntaktische Analyse . . . . . . . . . . . . . . . . . . . . . 168

4.2.4 Semantische Analyse . . . . . . . . . . . . . . . . . . . . . 176

4.3 Wissensbasis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181

INHALTSVERZEICHNIS 7

4.3.1 Grundkonzept . . . . . . . . . . . . . . . . . . . . . . . . 181

4.3.2 Realisierung . . . . . . . . . . . . . . . . . . . . . . . . . . 182

4.4 Information Retrieval . . . . . . . . . . . . . . . . . . . . . . . . 185

4.4.1 Grundkonzept . . . . . . . . . . . . . . . . . . . . . . . . 185

4.4.2 Realisierungsstand . . . . . . . . . . . . . . . . . . . . . . 186

5 Ergebnisse 189

5.1 Kritische Analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . 189

5.2 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . 196

5.3 Ausblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198

6 Anhang 201

6.1 TEI-Ausgabe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201

6.2 Zerlegung der Textstruktur . . . . . . . . . . . . . . . . . . . . . 204

6.3 Morphologische Analyse . . . . . . . . . . . . . . . . . . . . . . . 208

6.4 Syntaktische Analyse . . . . . . . . . . . . . . . . . . . . . . . . . 214

6.5 Semantische Analyse . . . . . . . . . . . . . . . . . . . . . . . . . 218

8INHALTSVERZEICHNIS

Kapitel 1

Einleitung

Ein hinreichend klarer mathematischer Text kann

in einer konventionellen Sprache formuliert werden,

die nur aus einer kleinen Anzahl unver¨

anderlicher

W¨

orter besteht; diese W¨

orter werden gem¨

aß einer

Syntax kombiniert, die ihrerseits nur eine kleine

Anzahl unverletzlicher Regeln umfasst; ein so

formulierter Text heißt dann formalisiert.

(Nicolas Bourbaki1)

1.1 Motivation

Nicht nur durch das Internet, sondern auch durch wissenschaftliche Publika-

tionen w¨

achst in der Mathematik die Menge der verf¨

ugbaren Informationen

st¨

andig an. Um auf dem neuesten Stand der Forschung zu bleiben, m¨

ussen

Wissenschaftler und andere Interessenten viel Zeit f¨

ur Recherchen verwenden.

Leider liegt ein Großteil der vorhandenen Informationen in Form von nat¨

urlich-

sprachlichen mathematischen Texten vor, so dass Computer sie nicht unmittel-

bar verarbeiten k¨

onnen. Es bietet sich daher an, den Inhalt von mathematischen

Texten computergest¨

utzt zu analysieren, um relevante Informationen daraus zu

1[Bou02, S. 164]

9

10 KAPITEL 1. EINLEITUNG

gewinnen. Solche Informationsextraktionssysteme existieren in verschiedensten

Formen.

Im Projekt Mumie [SJZ04, Jes04] — Multimediale Mathematikausbildung f¨

ur

Ingenieure — wurde eine Lernplattform zum Einsatz von modernen Techno-

logien entwickelt, die mathematisches Wissen in vielf¨

altiger Weise Studenten

im Pr¨

asenzunterricht zur Verf¨

ugung stellt. In diesem Zusammenhang entstan-

den zahlreiche Unterprojekte, darunter auch das mArachna-Projekt, das Ge-

genstand dieser Arbeit ist. mArachna hat sich zum Ziel gesetzt, ein innovatives

Information Retrieval System in Form eines mathematischen Lexikons zu ent-

wickeln. Dazu sollen nat¨

urlichsprachliche mathematische Texte maschinell ver-

arbeitet und in ein ontologisches Modell der Mathematik eingeordnet werden.

Der Anwender erh¨

alt dadurch die M¨

oglichkeit, Anfragen zu mathematischen

Konzepten und Sachverhalten zu stellen. F¨

ur die Ausgabe der Suchergebnis-

se sind Wissensnetze denkbar, die eine kontextuelle Einordnung der einzelnen

Suchergebnisse erm¨

oglichen. Wissensnetze sind dabei graphische Darstellungen

zur Visualisierung von Begriffen und Sachverhalten und ihren Beziehungen un-

tereinander. Im Gegensatz zu herk¨

ommlichen Information Retrieval Systemen

ist es also m¨

oglich, nach Konzepten und Ideen anstatt z. B. nach in Texten auf-

tretenden W¨

ortern zu suchen. Der Schwerpunkt dieser Arbeit wird dabei nicht

auf dem eigentlichen Retrieval-Interface liegen, sondern auf den grundlegenden

Mechanismen zur Verarbeitung der urspr¨

unglichen mathematischen Texte und

ihrer Einordnung in eine Wissensbasis.

Mathematik

Analysis

Topologie

Algebra Geometrie

Mengenlehre & Logik

Abbildung 1.1: Wissensnetz

Zur manuellen Erstellung einer solchen mathematischen Lexikons h¨

atten Auto-

ren ihre Texte bereits mit den zur Vernetzung notwendigen Informationen ver-

sehen m¨

ussen. Dabei haben Autoren oft eine sehr unterschiedliche Auffassung,

1.1. MOTIVATION 11

wie mathematische Begriffe und Sachverhalte vernetzt werden k¨

onnten. Dies

ist nicht verwunderlich, da bei einem solch komplexen Fachgebiet wie der Ma-

thematik der Prozess der Metadatenerstellung nicht einfach zu schematisieren

ist.

Das Mumie-Projekt speichert mathematische Informationen in Form von nat¨

ur-

lichsprachlichen Texten in einer Datenbank. Die Grundidee der vorliegenden

Arbeit ist es, diese vorhandenen Informationen zu verwenden und computerlin-

guistisch zu analysieren, um aus den Ergebnissen dieser Analyse ein Lexikon

zu erstellen. Daher werden keine Metadaten in den betrachteten Dokumenten

ben¨

otigt. Bei einer solchen inhaltsbezogenen Analyse von Texten stellt sich die

Frage, wie die gew¨

unschten Informationen effizient extrahiert werden k¨

onnen.

Hierf¨

ur ist die mathematische Sprache gut geeignet, da sie in ihrer Struktur

typische Merkmale aufweist, die eine computergest¨

utzte Analyse vereinfachen

k¨

onnten. Die Sprache der Mathematik ist dabei weit mehr als nur eine Fach-

sprache mit charakteristischen Fachtermini. Sie ist ein k¨

unstliches Produkt des

Menschen, um mathematische Sachverhalte mit klaren und einfachen S¨

atzen

und exakt definierten Bezeichnungen darzustellen.

Die linguistische Analyse von mathematischen Texten liefert semantische Infor-

mationen in einer maschinenlesbaren Form. Zwischen semantischen Informatio-

nen und dem Aufbau von Wissensnetzen liegt ein weiter Weg. Jedoch besitzt die

Mathematik gl¨

ucklicherweise eine gut durchdachte, klar strukturierte Theorie,

die auf der Pr¨

adikatenlogik und der Mengenlehre aufbaut. Diese Theorie be-

steht aus einem großfl¨

achigen Beziehungsnetzwerk, in dem die mathematischen

Inhalte angeordnet werden. Dadurch entsteht eine durchg¨

ange Strukturierung,

die formalisiert werden kann. Daraus l¨

asst sich ein Klassifikationsmodell ablei-

ten: die Taxonomie der Mathematik. Daher sollte es m¨

oglich sein, zumindest

f¨

ur Teilgebiete mathematisches Wissen in Repr¨

asentationsschemata (Wissens-

basen) so zu organisieren, dass es auch durch ein Computersystem verarbeitet

werden kann.

Die Repr¨

asentationschemata werden dabei aus komplexen semantischen Netzen

bestehen. Durch diesen Aufbau ergibt sich die M¨

oglichkeit, ein Repr¨

asentati-

onsmodell zu konstruieren, das mathematische Inhalte selbstst¨

andig anordnet.

Voraussichtlich wird dabei keine vollst¨

andig automatisierte Analyse der Daten

m¨

oglich sein, jedoch soll diese Aufgabe in wesentlichen Teilen ohne manuelle

12 KAPITEL 1. EINLEITUNG

Unterst¨

utzung durch den Computer erfolgen.

1.2 Ziele und Hypothesen

Das Grobziel von mArachna ist der Aufbau eines intelligenten halbautoma-

tischen Information Retrieval Systems. Dazu sind Daten f¨

ur das Information

Retrieval erforderlich, aus denen die syntaktischen und semantischen Strukturen

der mathematischen deutschen Sprache erkannt, analysiert und schematisiert

werden k¨

onnen. Dazu notwendig ist die Konzeption eines Wissensrepr¨

asentati-

onsschemas (Ontologie), das mathematische Begriffe und Sachverhalte umfas-

send beschreiben und in einer Wissensbasis organisieren kann. Außerdem muss

ein Konzept entwickelt werden, wie Informationen wieder aus dieser Wissens-

basis extrahiert und dem Anwender in sinnvoller Art und Weise zur Verf¨

ugung

gestellt werden k¨

onnen.

Die vorangehenden Betrachtungen legen nahe, f¨

ur die Wissensextraktion und

die Wissensorganisation von folgenden Hypothesen auszugehen2:

Hypothese 1.2.1

Eine computerlinguistische Analyse der mathematischen Sprache ist einfacher

als die Analyse alltagssprachlicher Texte.

Diese Hypothese folgt aus der ¨

Uberlegung, dass mathematische Sprache in Tex-

ten normalerweise stark strukturiert ist und dabei immer wiederkehrende Phra-

senstrukturen verwendet. In diesem Zusammenhang folgt auch gleichzeitig die

n¨

achste Hypothese:

Hypothese 1.2.2

Fachsprachen wie die Mathematik besitzen wenige Ambiguit¨

aten.

Die Mathematik verwendet wenige Begriffe aus der Alltagssprache. Neue Be-

griffe werden meist formal eingef¨

uhrt, d. h. sie bauen auf bereits vorhandenen

Begriffen und Sachverhalten auf. Dies legt die folgende Hypothese nahe:

Hypothese 1.2.3

Der Wortschatz der Mathematik ist kleiner als bei anderen Fachsprachen.

2Einige der Hypothesen w¨

aren durchaus empirisch testbar. Dies ist jedoch nicht Gegenstand

dieser Arbeit.

1.2. ZIELE UND HYPOTHESEN 13

Da die mathematische Sprache stark strukturiert ist und auf einer einfachen

Logik beruht, ergeben sich f¨

ur Autoren nur wenige stilistische Freiheiten:

Hypothese 1.2.4

Stilistische Elemente spielen keine entscheidende Rolle bei der linguistischen

Analyse. Aufgrund des strengen Aufbaus der Mathematik ist anzunehmen, dass

die stilistischen Unterschiede zwischen verschiedenen Autoren gering sind.

Seit Anfang des zwanzigsten Jahrhunderts sind Mathematiker bestrebt, die Ma-

thematik zu axiomatisieren und zu formalisieren. Dieser Ansatz erscheint auch

sinnvoll f¨

ur eine Realisierung der genannten Ziele auf Computersystemen.

Hypothese 1.2.5

Das mathematische Grundlagenwissen, bestehend aus Pr¨

adikatenlogik und Men-

genlehre gen¨

ugt, um eine mathematische Wissensbasis aufzubauen, wie sie f¨

ur

ein halbautomatisches Information Retrieval System ben¨

otigt wird.

Aufgrund der vielf¨

altigen Beziehungen zu anderen Fachdisziplinen sollen in die-

ser Arbeit zuerst diejenigen Disziplinen betrachtet werden, die zur Behandlung

des Problems notwendig sind (Kapitel 2). Insbesondere soll dabei auf die Grund-

lagen der Mathematik eingegangen werden (Kapitel 3.2.2, 3.2.3). Kapitel 3.3

(Sprachstrukturen) und Kapitel 3.4 (Wissensstrukturen) sind die zentralen Ka-

pitel. Hier werden die Strukturen zum Aufbau eines innovativen Information

Retrieval Systems festgelegt. In einem letzten Schritt sollen dann anhand eines

Prototypen die Ergebnisse diskutiert werden.

14 KAPITEL 1. EINLEITUNG

Kapitel 2

Disziplinen

Das einzige Mittel gegen Aberglaube ist Wissenschaft.

(Henry Thomas Buckle, engl. Philosoph, 1821-1862)

2.1 Einleitung

Zweifellos geh¨

ort die Sprache zu den herausragendsten Eigenschaften mensch-

licher Kognition. Sie ist das wichtigste Medium, um Wissen zu kommunizieren

oder im Ged¨

achtnis zu speichern. Im Hinblick auf die zunehmende Bedeutung

des Computers ist es nicht verwunderlich, dass in den letzten Jahrzehnten zahl-

reiche Forschungsgruppen versucht haben, dem Computer das Lesen zu lehren.

Leider treten dabei zahlreiche Probleme auf, die u. a. durch die verschiedensten

Formen von sprachlichen Mehrdeutigkeiten (Ambiguit¨

aten) induziert werden.

Fachsprachen, insbesondere solche in denen Mathematik eine zentrale Stellung

einnimmt, besitzen weniger Ambiguit¨

aten (Kapitel 1.2, Hypothese 1.2.5). Der

mathematische Sprachstil ist dar¨

uber hinaus im Gegensatz zum geschriebenen

Sprachstil in Tageszeitungen, Belletristik, Gedichten usw. deutlich strukturier-

ter und hierarchischer. Er besitzt einen deduktiven logischen Aufbau und be-

steht damit aus ¨

uberschaubaren Satzstrukturen mit einfachen Aussages¨

atzen.

Durch die vereinfachten Strukturen wird eine reduzierte Grammatik induziert,

die sich leichter analysieren l¨

asst (Kapitel 1.2, Hypothese 1.2.1). Allerdings gibt

es individuelle Unterschiede zwischen verschiedenen Autoren mathematischer

15

16 KAPITEL 2. DISZIPLINEN

Texte (Individualstile), die die informationstechnische Verarbeitung erschweren

[Bau99].

Psychologie Mathematik Informatik

Textverstehen

Wissensverarbeitung

Mathematische Sprache

Mathematisches Wissen

Anwendung von mathematischem Wissen Information Retrieval System

Wissensbasierte Systeme

Computerlinguistik

Abbildung 2.1: ¨

Uberblick ¨

uber die notwendigen Disziplinen

Eine computergest¨

utzte Analyse der geschriebenen mathematischen Sprache er-

fordert trotz der genannten Vorteile einen großen Aufwand. Verschiedene Dis-

ziplinen sind notwendig, um ein solches Konzept zu realisieren. Das theoreti-

sche Fundament bildet die kognitive Psychologie, die u. a. die Extraktion von

Wissen aus Texten, die Speicherung von solchem Wissen und die Anwendung

des gespeicherten Wissens durch den Menschen betrachtet (Kapitel 2.2, Kapitel

2.3). Dabei werden nicht biologische und chemische Betrachtungen herangezo-

gen, sondern theoretische Modelle zur Wissensakquisition,Wissensorganisation

und Wissensnutzung entwickelt. Diese Modelle werden als Diskussionsgrundlage

verwendet, wie Wissen informationstechnisch verarbeitet werden kann. Insbe-

sondere ist das Sprachverstehen (Kapitel 2.3) f¨

ur die Computerlinguistik von

Interesse.

In einen weiteren Schritt sollen kurz Methoden und Probleme der Computer-

linguistik (Kapitel 2.4) dargestellt werden, die f¨

ur die maschinelle Analyse der

mathematischen Sprache von Bedeutung sind. Dar¨

uber hinaus ist die informa-

tionstechnische Wissensnutzung, die Wissen in geeigneter Weise dem Nutzer ei-

nes Computersystems zur Verf¨

ugung stellt, ein wichtiger Diskussionsgegenstand.

Die technische Realisierung wird durch das Information Retrieval (Kapitel 2.5)

gegeben, das interessante Konzepte und Analysemethoden bereitstellt.

2.1. EINLEITUNG 17

Aus der Diskussion der Disziplinen sollte es m¨

oglich sein, ein System zu entwi-

ckeln, das mathematische Sprache analysiert und das extrahierte Wissen orga-

nisiert.

18 KAPITEL 2. DISZIPLINEN

2.2 Wissensmanagement

Zu wissen, was man weiß, und zu wissen,

was man tut, das ist Wissen.

(Konfuzius, chin. Philosoph, 551 - 479 v. Chr.)

Wissen ist die Ressource der modernen Informationsgesellschaft, die zunehmend

an Bedeutung gewinnt. Dabei ist Wissen ein wenig fassbarer Wert (intellectual

capital) [V¨

a02], das in Archiven und Datenbanken in Form einer un¨

uberschau-

baren Flut von Informationen zumeist schlummert oder gar schwer zug¨

anglich

ist. Schlimmstenfalls besitzt nur ein einzelner Mensch das Wissen. Daher ist es

sinnvoll, Wissen in geeigneter Form f¨

ur verschiedene Personen zur Verf¨

ugung zu

stellen. Heutzutage besch¨

aftigt sich u. a. das Wissensmanagement (Knowledge

Management) mit dem Begriff Wissen und seiner Verarbeitung. Dabei werden

nicht fundamental neue Techniken generiert, sondern es werden bekannte Metho-

den aus den verschiedensten Disziplinen (Philosophie, Psychologie, Informatik

usw.) verwendet.

Definition 2.2.1 (Wissensmanagement)

”Wissensmanagement [engl. knowledge management], in der modernen Or-

ganisationsf¨

uhrung die Gesamtheit der Modelle und Konzepte, mit denen sich

die Bedeutung von Wissen als Ressource herausarbeiten sowie Techniken und

Instrumente zur bewussten Gestaltung wissensrelevanter Prozesse in Organisa-

tionen entwickeln lassen. [...]Innerhalb der Datenverarbeitung bezeichnet der

Begriff Wissensmanagement den Umgang mit großen, unstrukturierten Daten-

mengen und die Extraktion des darin enthaltenen Wissens.“ [Bro03, S. 979]

2.2.1 Daten, Informationen und Wissen

Die Basis des Wissens sind Daten, d. h. quantitativ aufgezeichnete Wahrneh-

mungen der Realit¨

at [V¨

a02]. Beispiele f¨

ur Daten sind Texte, Bilder, T¨

one usw.

In der Informatik sind Daten Zeichen, die mit einer Syntax versehen sind. Da-

ten werden zu Informationen, indem sie in einen Kontext gestellt und zum

Erreichen eines konkreten Ziels verwendet werden [Hau02]. Daher sind Infor-

mationen Daten mit einer Semantik. Allerdings wird dadurch nicht gekl¨

art, wie

Informationen Wissen formen. Um Wissen im Computer zu repr¨

asentieren, ist

2.2. WISSENSMANAGEMENT 19

es notwendig zu definieren, was unter Wissen verstanden werden kann. Wie so

h¨

aufig ist auch der Wissensbegriff nicht eindeutig definierbar. Gepr¨

agt durch

Platon (im Werk Theaitetos) ist in der Philosophie der Begriff Wissen mit dem

Wahrheitsbegriff (Kapitel 3.2.2) verbunden. In der Psychologie entspricht Wis-

sen einer Menge von Kenntnissen (Erfahrungen), die eine Person aus ihrem

Ged¨

achtnis wiedergeben kann [And01]. Allgemein kann Wissen als gespeicherte

Information betrachtet werden, aus der Schl¨

usse gezogen werden k¨

onnen, die

selbst wieder als Information zum Wissen beitragen. Dabei spielt der Kontext

der Information eine besondere Rolle.

Wissen := Informationen im Kontext

Um Informationen als Wissen zu organisieren, erscheint es notwendig, verschie-

dene Arten von Wissen zu unterscheiden, die das breite Spektrum des Wissens-

begriffs eingrenzen, um somit eine ¨

ubersichtliche Darstellung zu erzeugen. Nach

Anderson [And01] wird in der kognitiven Psychologie menschliches Wissen in

zwei Arten unterteilt:

•Deklaratives Wissen (Faktenwissen):

Terminologisches Wissen und Wissen ¨

uber Sachverhalte; leicht verbalisier-

bares Wissen

•Prozedurales Wissen (Verarbeitungswissen):

Wissen ¨

uber die Art und Weise von verschiedenen kognitiven Handlungen;

schwer verbalisierbar.

Aus der Philosophie stammt ein Modell von Polanyi (Klassifikationssystem von

Polanyi) [Pol85], das zwischen zwei Arten von Wissen in Bezug auf den m¨

ogli-

chen subjektiven Charakter der Wissensaufnahme unterscheidet:

•Explizites Wissen (disembodied knowledge):

Formalisierbares und digitalisierbares Wissen

•Implizites Wissen (embodied knowledge):

Personifiziertes Wissen, das durch Erfahrung erworben wird

Ein weiteres Modell stammt von Ryle [Ryl69] und Baumgartner [Bau93] und

hat ebenfalls einen philosophischen Ursprung. Es wird zwischen drei Arten von

20 KAPITEL 2. DISZIPLINEN

Wissen unterschieden, wobei die dritte Art st¨

arker die Interpretationsf¨

ahigkeit

von vorhandenen Informationen hervorhebt:

•Faktenwissen: deklaratives Wissen;

•Anwendungswissen: prozedurales Wissen;

•Handlungswissen:

Fertigkeiten, die sich in ausf¨

uhrbaren T¨

atigkeiten als praktisches Wissen

¨

außern.

Alle drei Beschreibungsmodelle von Wissenstypen weisen ¨

Ahnlichkeiten auf.

Sie unterteilen in leicht und schwer formalisierbares Wissen. Insbesondere wird

durch das Modell von Polanyi deutlich, dass die Wissensakquisition und die

Wissensnutzung einen subjektiven Charakter besitzen.

Auch in der k¨

unstlichen Intelligenz wird der Wissensbegriff ausf¨

uhrlich behan-

delt. Im Zuge der Entwicklung wurden Modelle erstellt, die versuchen menschli-

ches Wissen im Computer zu repr¨

asentieren. In diesem Zusammenhang befasste

sich Newell [New81] u. a. mit folgenden Fragenstellungen [GRS00, S. 7]:

•”Wie kann Wissen charakterisiert werden?“

•”Wie steht eine solche Charakterisierung in Beziehung zur Repr¨

asentati-

on?“

•”Was genau zeichnet ein System aus, wenn es ¨

uber Wissen verf¨

ugt?“

Newell kam zu der Auffassung eines dreistufigen Ebenenmodells, bestehend aus

Programmierebene,Symbolebene und Wissensebene. Die Programmierebene ist

die unterste Ebene und wird durch die Hardware realisiert. Die Symbolebene

tr¨

agt die Repr¨

asentationen, die als Datenstrukturen und Prozesse existieren und

den Wissensbestand auf der Wissensebene realisieren [GRS00, S. 7]. Der zen-

trale Ansatz von Newell ist die Verwendung von Logiken als fundamentalem

Werkzeug (Mathematisierung des Wissens). Logiken werden einerseits f¨

ur die

2.2. WISSENSMANAGEMENT 21

Wissensebene

Symbolebene

Programmierebene

Domänenwissen

Software

Hardware

Abbildung 2.2: Newells dreistufige Ebenenmodell

Kodierung von vorhandenem Wissen verwendet, andererseits f¨

ur die Implemen-

tierung von Inferenzmechanismen, um menschliche Schlussfolgerungsprozesse zu

imitieren.

Die Kodierung von Wissen unter Verwendung einer logikbasierten Sprache (Wis-

sensrepr¨

asentationssprache) wird in der k¨

unstlichen Intelligenz als Wissensba-

sis bezeichnet. Die technischen Realisierungen sind jedoch immer an die Art

des untersuchten Problems gebunden. Eine allgemeinere Art, Wissen darzustel-

len, sind Ontologien, die ein formales allgemeing¨

ultiges Beschreibungsmodell f¨

ur

bestimmte Weltausschnitte bereitstellen. Dies ist eine Beschreibung von Kon-

zepten und ihren Beziehungen untereinander, die f¨

ur eine Gruppe von Personen

begriffsbildend sind.

”An ontology is a formal, explicit specification of a shared concep-

tualization. A conceptualization refers to an abstract model of some

phenomenon. Explicit means that the type of concepts used and the

contraints on their use are explicitly defined. Formal refers to the

fact that the ontology should be machine readable.“ [Fen04, S. 7]

Wichtig ist der Aspekt des Informationsaustauschs. Einerseits muss eine On-

tologie eine Semantik von Informationen besitzen, die maschinenverst¨

andlich

ist. Anderseits muss diese Ontologie auch von Menschen akzeptiert werden. Je-

doch gibt es dabei Probleme. Selbst der Mensch hat in vielen Bereichen des

Lebens keine eindeutige Beschreibung f¨

ur Konzepte. So ist z. B. der Begriff der

“Religion”nicht eindeutig definierbar und somit ein einheitliches Modell nicht

m¨

oglich.

22 KAPITEL 2. DISZIPLINEN

Konzepte beschreiben einen Menge von Objekten aus dem betrachteten Weltaus-

schnitt, die gemeinsame Eigenschaften aufweisen. Die Instanzen sind spezielle

Auspr¨

agungen eines Konzeptes. So ist ein rotes Auto eine Instanz des Konzep-

tes Auto. Relationen stellen die Objekte des Weltausschnitts in Zusammenhang

zueinander, z. B. durch eine ”ist eine“-Relation. Eigenschaften beschreiben die

benutzten Konzepte und Instanzen genauer. Die Nebenbedingungen k¨

onnen Ei-

genschaften weiter einschr¨

anken z. B. in der L¨

ange [Hel00].

Im weiteren Verlauf werden Modelle vorgestellt, die menschliches Wissen sche-

matisieren. H¨

aufig werden dabei assoziative Netzwerke verwendet. Wissen er-

scheint in diesen Modellen als Vernetzung von Informationen, die es dem Tr¨

ager

erm¨

oglichen, Handlungsverm¨

ogen aufzubauen und Aktionen in Gang zu brin-

gen. Fragen an die kognitive Psychologie betreffen dabei die Vernetzungen von

Informationen und ihre Konstruktionsm¨

oglichkeiten.

2.2.2 Wissensorganisation und Wissensrepr¨

asentation

Wahrnehmungen aus der Umwelt werden in ein mentales Modell umgewandelt.

Dabei handelt es sich um Prozesse der Klassifizierung und der Interpretation der

wahrgenommenen Inhalte. Um diese internen mentalen Modelle zu beschreiben,

werden in der Psychologie Konzepte entwickelt, die als Wissensrepr¨

asentationen

bezeichnet werden. Diese Form der menschlichen Informationsverarbeitung wird

bei Anderson [And01] durch den jeweiligen Typ der Information charakterisiert.

Es gibt die bedeutungsbezogene Wissensrepr¨

asentation, die sich in zwei weit-

ere Repr¨

asentationsformen unterteilt, die propositionale Wissensrepr¨

asentation

und die konzeptuelle Wissensrepr¨

asentation. Hierbei werden Informationen im

Kontext des vorhandenen Wissens aufgenommen (Interpretation der aufgenom-

menen Informationen). Außerdem gibt es die wahrnehmungsbasierte Wissensre-

pr¨

asentation, bei der Informationen vom System direkt wahrgenommen werden,

beispielsweise visuell oder verbal. Diese Form der Wissensrepr¨

asentation ist im

Gegensatz zur bedeutungsbezogenen Wissensrepr¨

asentation gut erforscht. Im

Hinblick auf die Betrachtung von mathematischem Wissen soll die bedeutungs-

bezogene Wissensrepr¨

asentation verwendet werden.

2.2. WISSENSMANAGEMENT 23

Wahrnehmungsbezogene Wissensrepräsentation

Wissensrepräsentation

Bedeutungsbezogene Wissensrepräsentation

Propositionale Wissensrepräsentation Konzeptuelle Wissensrepräsentation

Abbildung 2.3: Wissensrepr¨

asentationen in der kognitiven Psychologie

2.2.2.1 Propositionale Wissensrepr¨

asentationen

Die propositionale Wissensrepr¨

asentation ist in der kognitiven Psychologie zu

einem n¨

utzlichen Modell bei der Beschreibung der Informationsverarbeitung

insbesondere f¨

ur nat¨

urlichsprachliche S¨

atze geworden. Der aus der Logik und der

Linguistik ¨

ubernommene Begriff Proposition nimmt eine zentrale Rolle ein. Eine

Proposition ist die kleinste Wissenseinheit, die sich sinnvoll als wahr oder falsch

beurteilen l¨

asst. Sie entspricht somit einer Aussage. Es gibt unterschiedliche

propositionale Notationssysteme, wie z. B. die Pr¨

adikat-Argument-Struktur von

Kintsch [Kin74].

Pr¨

adikat-Argument-Struktur. Die Argumente entsprechen Personen, Ge-

genst¨

anden, Eigenschaften usw., die meistens durch Nomina beschrieben wer-

den. Die Pr¨

adikate entsprechen den Beziehungen der Argumente untereinander.

Sie werden vor allem durch Verben, Adjektive oder andere relationale Ausdr¨

ucke

gebildet. Dargestellt wird eine propositionale Wissensrepr¨

asentation durch eine

Liste, bestehend aus einem Pr¨

adikat und den zugeh¨

origen Argumenten.

Beispiel 2.2.1

Eine ¨

Aquivalenzrelation ist reflexiv, transitiv und symmetrisch.

Propositionale Wissensrepr¨

asentation:

•(ist reflexiv, ¨

Aquivalenzrelation)

•(ist transitiv, ¨

Aquivalenzrelation)

•(ist symmetrisch, ¨

Aquivalenzrelation)

24 KAPITEL 2. DISZIPLINEN

Subjekt

Prädikat

Subjekt

Prädikat

Subjekt

Prädikat

Subjekt

Prädikat

Äquivalenzrelation

ist_symmetrisch

ÄquivalenzrelationÄquivalenzrelation

ist_reflexiv ist_transitiv

Äquivalenzrelation

ist_reflexiv

ist_symmetrisch

ist_transitiv

Abbildung 2.4: Graphische Realisierung eines propositionalen Netzwerks

Netzwerke aus Propositionen (propositionales Netz) beschreiben die Beziehun-

gen des betrachteten Sachverhaltes. Pr¨

adikate und Argumente werden in diesem

Netzwerk als Knoten und Pfeile als Verbindungen bezeichnet. Die r¨

aumliche

Anordnung spielt keine Rolle. Sie k¨

onnen aber in hierarchischer Beziehung zu-

einander stehen, wobei eine Proposition als eine Einheit innerhalb einer anderen

Proposition auftritt. Allerdings k¨

onnen sie keine allgemeinen Zusammenh¨

ange

beschreiben, die nicht explizit in dem Sachverhalt genannt werden. Experimen-

te ¨

uber die psychische Realit¨

at der propositionalen Einheiten werden in [BF71]

aufgef¨

uhrt.

2.2.2.2 Konzeptuelle Wissensrepr¨

asentationen

Menschen neigen dazu, Dinge, die uns umgeben, zu ordnen, zu klassifizieren

oder zu kategorisieren. Dabei werden allgemeine Merkmale einer gewonnenen

Erfahrung in Kategorien, Konzepte bzw. Begriffe zusammengefasst (Abstrakti-

on der Umwelt). Dies entspricht einer Art Mustererkennung, ohne die unsere

Informationsverarbeitung ¨

uberfordert w¨

are. Diese Mustererkennung beinhaltet

Prozesse wie Differenzierung und Generalisierung. Durch die Differenzierung

wird die Vielfalt der wahrgenommenen Informationen in handliche Einheiten

zerlegt. Die Generalisierung ordnet diese in ¨

uberschaubare Kategorien an. So-

mit ist die Kombination beider ein effektives kognitives Instrument.

2.2. WISSENSMANAGEMENT 25

Die einzelnen Kategorien werden basierend auf der Erfahrung des jeweiligen

Menschen erstellt. Es ist egal, ob diese der Wahrheit entsprechen oder welchen

Umfang sie besitzen. Kategorien sind auch nicht starr, sondern ver¨

anderbar.

Dies f¨

uhrt in der k¨

unstlichen Intelligenz zu Problemen, da dynamische Ka-

tegorien schwer zu realisieren sind. Psychologen beschreiben Kategorien mit

Attributen und Verkn¨

upfungsregeln [Bou66]. So wird die Kategorie ”Wasser“

mit den Attributen ”farblos“, ”geruchlos“, ”fl¨

ussig“ usw. belegt. Attribute ent-

sprechen damit relevanten Merkmalen, die einen Gegenstand charakterisieren.

Verkn¨

upfungsregeln entsprechen logischen Regeln, um die Kategorien zu struk-

turieren (”Wenn ..., dann“, ”besitzt“ usw.).

Eine wichtige Eigenschaft von Kategorien ist die M¨

oglichkeit der Angabe einer

beliebigen Anzahl von Attributen. Dar¨

uber hinaus werden viele solcher Katego-

rien durch den Menschen nicht eindeutig definiert. Um diese Uneindeutigkeiten

zu modellieren, werden Ideale (repr¨

asentativste Beispiele) konstruiert, die Va-

riationen in der Interpretation zulassen (Prototypen) [BF71].

Zwischen den einzelnen Kategorien gibt es verschiedene Formen von Beziehun-

gen. Um globale Zusammenh¨

ange zu erfassen, werden Informationen in gr¨

oße-

ren kategorialen Einheiten organisiert. In konzeptuellen Wissensrepr¨

asentatio-

nen werden Methoden vorgestellt, wie Kategorien in Beziehung zueinander ste-

hen und wie diese im Einzelnen strukturiert sind. Hierbei wird u. a. zwischen

semantischen Netzen ([Qui68]) und Schemata [BT81] unterschieden. [Wes94]

Semantische Netze. Das menschliche Ged¨

achtnis zeichnet sich u. a. dadurch

aus, dass es eine große Anzahl von Verbindungen oder Assoziationen zwischen

Informationen bilden kann. Semantische Netze k¨

onnen solche Assoziationen be-

schreiben. Nach Quillian [Qui68, CQ69] speichert der Mensch Informationen

¨

uber verschiedene Kategorien in hierarchischen Netzwerkstrukturen z. B. mit-

tels is-a- oder instance-of-Beziehungen. Diese Beziehungen vermitteln die Se-

mantik. Eigenschaften, die f¨

ur Kategorien einmal angelegt werden, werden auf

die darunterliegenden Hierarchieebenen vererbt. Kategorien entsprechen in die-

sen Netzwerken Knoten, und die Beziehungen entsprechen den Kanten.

Informationen, die nicht direkt als Kategorien gespeichert werden, m¨

ussen ge-

schlussfolgert werden. Dazu gibt es Untersuchungen [And01, S. 155], wie sich

die Abrufzeiten von geschlussfolgerten Informationen verhalten. Unter anderem

26 KAPITEL 2. DISZIPLINEN

beißen

Hierarchieebene II

Hierachieebene I

Hierarchieebene III

Tier

Vogel Fisch

Kanarienvogel Strauß Hai Lachs

bewegen

atmen

fressen

Flügel

fliegen

Feder

nicht fliegengroß gefährlich essbar rosa

schwimmen

Kiemen

Flossen

singengelb

Abbildung 2.5: Graphische Realisierung einer semantischer Repr¨

asentation nach

Quillian1[CQ69]

ben¨

otigt der Mensch mehr Zeit, Informationen abzurufen, die nicht explizit als

Kategorie gespeichert werden.

Als geeignetes Darstellungsmittel eines einfachen semantischen Netzes bieten

sich Graphen an. Graphen sind abstrakte Strukturen, die relationale Beziehun-

gen oder Netzwerke modellieren.

Definition 2.2.2 (Graph)

Ein Graph ist ein Paar G= (V, E)disjunkter Mengen mit E⊆[V]2; die

Elemente von Esind also 2-elementige Teilmengen von V. Die Element von V

nennt man die Ecken (Knoten) des Graphen G, die Elemente von Eseine

Kanten. Wir sagen, G= (V, E)sei ein Graph auf V[Die00, S. 4].

Ein gerichteter Graph ist ein Paar (V, E)disjunkter Mengen (von Ecken und

Kanten) zusammen mit zwei Funktionen init :E→Vund ter :E→V, die

jeder Kante eeine Anfangsecke init(e)und eine Endecke ter(e)zuordnen; die

Kante von eheißt dann von init(e)nach ter(e)gerichtet. Ein gerichteter Graph

kann zwischen zwei Ecken x,ymehrere Kanten haben, solche Kanten nennt man

Mehrfachkanten. Ist init(e) = ter(e), so ist eeine Schlinge [Die00, S. 26].

Definition 2.2.3 (Weg, Zyklus)

Ein Weg ist ein nicht leerer Graph P= (V, E)der Form

V={x0, x1,...,xk}E={x0x1, x1x2,...,xk−1xk},

1Der Graph in der Abbildung kann auch Ausnahmen darstellen. So wird V¨

ogeln die Eigen-

schaft fliegen zugeschrieben. Allerdings k¨

onnen z. B. Pinguine und Strauße nicht fliegen. Dies

wird in dieser Graphik ber¨

ucksichtigt.

2.2. WISSENSMANAGEMENT 27

1

2

4

3

c

a

d

b

e

f

5

Schlinge

Mehrfachkanten

ungerichteter Graph

G = {1, 2, 3, 4, 5}

V ={a, b, c, d, e, f}

a = {1,2}, b = {2,3}, c ={1,4}, d = {4,4}, e = {1,5}, f ={1,5}

gerichteter Graph

Abbildung 2.6: Darstellung verschiedener Graphen

wobei die xipaarweise verschieden sind. Die Ecken x0und xksind die Endecken

von P; sie sind durch Pverbunden. Die Ecken x1,...,xk−1sind die inneren

Ecken von P. Die Anzahl der Kanten eines Weges ist seine L¨

ange [Die00, S.

7]. Ist P=x0...xk−1ein Weg und k≥3, so ist der Graph C:= P+xk−1x0

ein Kreis [Die00, S. 13]. Ein Graph, der keine Kreise enth¨

alt, heißt kreislos

(azyklisch).

Abbildung 2.7: Darstellung der Wege eines ungerichteten Graphen

Definition 2.2.4 (Semantischen Netze)

Ein semantisches Netz (K, σ, T, τ)ist ein endlicher, gerichteter azyklischer Graph,

bestehend aus:

•einer Menge Kvon Kategorien (Knoten des Graphen),

•einer Relation σ⊆K×K(Kanten des Graphen),

•eine Menge Tvon Kantentypen (m¨

ogliche Relationen zwischen den Kate-

gorien) und

28 KAPITEL 2. DISZIPLINEN

•einer Funktion τ:σ−→ T, die jeder Kante einen Typ zuordnet.

[Rei89]

Knoten und Kanten k¨

onnen nicht nur Namen tragen, sondern auch Eigenschaf-

ten (Konfigurationen) haben. Komplexe Netze werden durch Hypergraphen be-

schrieben, d.h. durch Graphen mit Knoten, die selbst wieder Graphen sind.

Durch Partitionierung und Quantifizierung kann die Ausdruckskraft von seman-

tischen Netzen gesteigert werden.

1

F

S

G

GG

G

L

LL

L

R

RR

R

F

HR

1

GL

1

0

2

R

2

3

S

4

R5

5

6

7

77

1 0

9

8

9

6

8

KSV

Abbildung 2.8: Bild eines komplexen Netzwerks [HB01, S. 101]

Werden semantische Netze zur Modellierung unseres Wissen verwendet, so sto-

ßen diese bald an die Grenzen des M¨

oglichen. Dies macht es notwendig, sie durch

neue Methoden zu erweitern.

Schemata. Semantische Netze, die nur Eigenschaften von Konzepten abspei-

chern k¨

onnen, sind nicht in der Lage, die Komplexit¨

at des menschlichen Wis-

sens zu erfassen. In Schemata (z. B. Haus) wird kategoriales Wissen in Form

von strukturierenden Elementen (Slots) (z. B. Material) und deren Werten dar-

gestellt. Die Slots definieren typische Eigenschaften (z. B. Beton), die zur Be-

schreibung eines Begriffs verwendet werden. Die Werte entsprechen konkreten

Auspr¨

agungen dieser Eigenschaften. Dabei besitzen die Eigenschaften ¨

ublicher-

weise eine oder mehrere erwartete Belegungen, die standardm¨

aßig mit dem Sche-

ma assoziiert werden. Die Erwartungswerte k¨

onnen dabei zwischen verschiede-

2.2. WISSENSMANAGEMENT 29

nen Personen variieren, z. B. wird ein Stadtbewohner ein Haus eher aus Beton

annehmen, w¨

ahrend ein Bauer zuerst an Stein denkt.

Gebäude

Slotwerte

Zimmer

Stein, Holz

wohnen

Schema: Haus

Slot

Oberbegriffe

Teile

Material

Funktion

Abbildung 2.9: Darstellung eines Schema

Der Oberbegriffslot in der Abbildung 2.9 ist ein spezielle Form des Slots. Er

entspricht der ”is-a“-Relation im semantischen Netzwerk und kennzeichnet die

oberste Objektklasse.

Nicht nur Gegenst¨

ande weisen eine konzeptuelle Struktur auf. Wir verf¨

ugen auch

¨

uber Konzepte f¨

ur verschiedene Ereignisarten, z. B. ”ins Kino gehen“. Solche

Kategorien k¨

onnen auch mit einer Variante von Schemata dargestellt werden.

Abelson et al. [AS77] entwickelten diese Variante der Schemata, die auch als

Skripts bezeichnet werden.

In der k¨

unstlichen Intelligenz wird der Frame-Begriff [Min74] verwendet, er ent-

spricht dem Begriff der Schemata, allerdings wird hierbei st¨

arker das assoziative

Modell verwendet.

Definition 2.2.5 (Frames)

Ein Frame ist ein Tripel (N, SN, ST)bestehend aus

•dem Frame-Namen N

•einer Menge nicht-terminaler Slots SN ={sn1,...,snk},k≥1und

•einer Menge terminaler Slots ST ={st1,...,stm},m≥1.

[Rei89]

Dabei sind nicht-terminale Slots SN die Slots, die wiederum Frames besitzen,

um sich zu beschreiben. So kann z. B. in Abbildung 2.9 der Slot Geb¨

aude durch

30 KAPITEL 2. DISZIPLINEN

ein weiteres Frame beschrieben werden. Die terminalen Slots ST weisen da-

gegen als Eintr¨

age Zeichenketten auf und k¨

onnen nicht durch weitere Frames

dargestellt werden.

Obwohl semantische Netze und Schemata ihre Vorz¨

uge aufweisen, gelten sie

nach der vorherrschende Forschungsmeinung als inad¨

aquat, jedoch sind sie f¨

ur

den Fokus dieser Arbeit ausreichend.

2.2.3 Wissensbasierte Systeme

Algorithmus

Daten

Wissensverarbeitung

Wissensbasis

Daten

Abbildung 2.10: Unterschied zwischen Programm und wissensbasierten System

Ein k¨

unstliches System, das Wissen speichert und verarbeitet wird als wissens-

basiertes System bezeichnet. Gew¨

ohnliche Computerprogramme speichern

implizit ”Wissen“ in Algorithmen. Wird ”Wissen“ ver¨

andert, so muss der Al-

gorithmus ge¨

andert werden. Bei wissensbasierten Systemen wird dagegen streng

zwischen anwendungsspezifischem Wissen (Wissensbasis, Wissensrepr¨

asentati-

on) und der Wissensverarbeitung (Probleml¨

osungsstrategien, Inferenzmaschine)

unterschieden. So muss bei ¨

Anderung von ”Wissen“ nicht die Wissensverarbei-

tungskomponente ge¨

andert werden (Abbildung 2.10).

Neben der Wissensverarbeitung und der Wissensbasis besteht ein wissensba-

siertes System aus weiteren Komponenten. Um Wissen in einer Wissensbasis zu

speichern gibt es eine Wissensakquisitionskomponente (Knowledge Engineer-

ing). Als Schnittstelle f¨

ur Nutzer eines wissensbasierten Systems existiert eine

Dialogkomponente [BKI00]. Der Begriff Dialogkomponente wird h¨

aufig im Zu-

sammenhang mit Expertensystemen genannt, daher erscheint es sinnvoll, diese

Komponente zu verallgemeinern und sie als Benutzerschnittstelle zu bezeichnen

(Abbildung 2.11).

2.2. WISSENSMANAGEMENT 31

Daten

Benutzerschnittstelle

Wissensakquisition

Wissensverarbeitung

Wissensbasis

Benutzerschnittstelle

Ergebnis einer Abfrage

Abbildung 2.11: Aufbau eines wissensbasierten Systems

Wissensbasis. Eine Wissensbasis enth¨

alt Wissensrepr¨

asentationen, die Wis-

sensinhalte computergerecht darstellen. Aufgrund der un¨

uberschaubaren Men-

ge an Informationen ist es n¨

utzlich, eine solche Darstellung auf Teilbereiche

(Dom¨

anen,Weltausschnitte) zu beschr¨

anken und nur diese Dom¨

anen zu mo-

dellieren.

Wissensbasen enthalten explizites Wissen. Explizites Wissen l¨

asst sich auf zwei

verschiedene Darstellungsarten im Computer realisieren: deklarative und pro-

zedurale Darstellung. Deklarative Darstellungen entsprechen objektorientierten

Repr¨

asentationsformen und logischen formalen Sprachen. So k¨

onnen die in der

kognitiven Psychologie (Kapitel 2.2) verwendeten Wissensrepr¨

asentationsmo-

delle — semantische Netze, Frames und Propositionen — deklarative Darstel-

lungen modellieren und somit auf Computersysteme ¨

ubertragen werden. Proze-

durale Darstellungen stellen Wissen mittels Prozeduren bzw. Anweisungen dar

32 KAPITEL 2. DISZIPLINEN

und werden durch regelbasierte System realisiert. Dabei wird Wissen mit Hilfe

einer Menge von Regeln (Produktionsregeln) dargestellt. Ein bekanntes Beispiel

sind die Phrasenstrukturregeln der generativen Grammatik (Kapitel 2.4.2).

Wissensverarbeitung. Die Wissensverarbeitungskomponente verk¨

orpert den

Schlussfolgerungs- und Probleml¨

osungsapparat. Sie wird auch als Inferenzsys-

tem bezeichnet. Die Vorstellung der Trennung von Wissensbasis und -verarbei-

tung ist dabei nicht wirklich korrekt. Tats¨

achlich ist ein Inferenzsystem sehr

wohl abh¨

angig von dem Wissensrepr¨

asentationsmechanismus in der Wissens-

basis. Je nach Art der Repr¨

asentation (z. B. semantische Netze, Produktions-

regeln) m¨

ussen entsprechende Inferenzsysteme konstruiert werden. So muss ein

Inferenzsystem auf einem semantischen Netz Suchalgorithmen auf Graphen ver-

arbeiten k¨

onnen, bei regelbasierten Systemen werden dagegen die Regeln mittels

Pr¨

adikatenlogik verarbeitet.

Das Inferenzsystem erlaubt es, aus vorhandenem Wissen in der Wissensbasis

neues Wissen abzuleiten. Dabei werden menschliche Schlussfolgerungsprozesse

imitiert. Die bekanntesten und einfachsten Systeme sind die regelbasierten In-

ferenzsysteme. Sie bestehen aus einem System von Inferenzregeln und einem

Inferenzschema. Das Inferenzschema enth¨

alt die Verarbeitungsvorschriften, wie

Daten aus der Wissensbasis auf die Regeln angewendet werden.

Diese Inferenzsysteme arbeiten mit der Pr¨

adikatenlogik, was gleichzeitig auch

ihre Schw¨

ache ist. Damit k¨

onnen keine nicht-monotonen Schlussfolgerungen ge-

zogen werden, die h¨

aufig auftreten. Hierbei k¨

onnen Schlussfolgerungen im Lau-

fe der Verarbeitung zur¨

uckgenommen werden. Defaultlogiken versuchen dieses

Ph¨

anomen zu formalisieren. Es werden sogenannte Defaultregeln angewendet,

die die eigentlichen Bedingungen ¨

uber ein Objekt speichern (z. B. V¨

ogel flie-

gen). Dazu kommen Ausnahmen, die durch Implikationen dargestellt werden

(z. B. Pinguine k¨

onnen nicht fliegen).

Ein weiteres, komplexeres System f¨

ur die Verwaltung von nicht-monotonen

Schlussfolgerungen ist das Truth Maintenance System [BKI00]. Dieses System

arbeitet mit Constraints und wird h¨

aufig als effizientes Wartungssystem f¨

ur

Wissensbasen verwendet.

Bei der Darstellung von unsicherem Wissen werden wahrscheinlichkeitstheore-

tische Methoden verwendet. Unsicheres Wissen beruht darauf, dass nicht im-

2.2. WISSENSMANAGEMENT 33

mer eindeutige Schlussfolgerungen aus Voraussetzungen gezogen werden k¨

onnen.

Meistens gibt es keine eindeutigen Zusammenh¨

ange. In der Sprache treten sie

meist als W¨

orter wie manchmal,beinahe usw. auf. Es wird dem System in der

Regel Wissen in Form von Unabh¨

angigkeitsannahmen hinzugef¨

ugt, die durch

Graphen repr¨

asentiert werden. Insbesondere verwendet man daher Markow- und

Bayessche Netze, aber auch Methoden der Fuzzy-Theorie [BKI00].

Kategoriebasierte Wissensbasen. Es gibt viele verschiedene Auspr¨

agun-

gen von semantischen Netzen. Allen gemeinsam ist, dass sie mittels Objekten,

Objektkategorien und Relationen Objekte repr¨

asentieren. Inferenzsysteme wer-

den bei semantischen Netzen durch Vererbungsmechanismen induziert. Diese

scheinbare Einfachheit kann zu komplexen Ph¨

anomenen f¨

uhren, sobald Mehr-

fachvererbung zugelassen wird. Ein weiterer Inferenzmechanismus ist die inverse

Verkn¨

upfung, die Vererbungsmechanismen gegebenenfalls umdrehen kann. Dies

bildet jedoch nur einen sehr primitiven Apparat f¨

ur Schlussfolgerungen. Es gibt

semantische Netze, die sehr viel komplexer sind und zus¨

atzlich prozedurale Me-

chanismen benutzen, wie z. B. partitionierte semantische Netze und existentielle

Graphen. Ein wichtiger Aspekt ist die Verwendung von Defaults bei Kategori-

en. F¨

ur solche Konstruktionen werden Beschreibungslogiken zur Beschreibung

von Definitionen und Eigenschaften von Kategorien verwendet. Die wichtigste

Inferenzaufgabe f¨

ur Beschreibungslogiken sind:

1. die Subsumption: ¨

Uberpr¨

ufung, ob eine Kategorie eine Untermenge einer

anderen ist, indem ihre Definitionen verglichen werden;

2. die Klassifizierung: ¨

Uberpr¨

ufungen, ob ein Objekt zu einer Kategorie

geh¨

ort;

3. die Konsistenzpr¨

ufung: ¨

Uberpr¨

ufung, ob die Zugeh¨

origkeitskriterien lo-

gisch erf¨

ullbar sind.

Allerdings fehlen den Beschreibungslogiken die Mechanismen der Negation und

Disjunktion.

Wissensakquisition. In irgendeiner Form m¨

ussen Informationen dem Sys-

tem zugef¨

uhrt und organisiert werden. Die Wissensakquisitionskomponente bie-

tet daf¨

ur eine Schnittstelle an. Sie kann einerseits ein Eingabeinstrumentarium

34 KAPITEL 2. DISZIPLINEN

f¨

ur Experten sein, anderseits auch eine (semi-) automatische Anwendung, welche

aus Datenanalysen geeignete Eintr¨

age erzeugt. Ein wichtiger Prozess ist auch

die fortlaufende Wartung der Wissensbasis.

Die Wissensakquisition beinhaltet Prozesse der Wissenserhebung, die relevantes

Wissen in Texten erkennt, der Wissensinterpretation, die das erhobene Wissen

interpretiert, und der Wissensformalisierung, die das Wissen computergerecht

aufbereitet.

Benutzerschnittstellen. Die Benutzerstellen bieten verschiedenste Arten

von Kommunikation zwischen einem Nutzer und dem System an. Einerseits

gibt es Instrumentarien f¨

ur die Wissensakquisition, anderseits geht es um die

Ausgaben der Wissensbasis aufgrund von Anfragen an das System. Dabei

kann es sich um graphische Ausgabe, men¨

ugesteuerte Dialoge, formalsprach-

liche oder nat¨

urlichsprachliche Mittel handeln. Diese Benutzerschnittstelle kann

auch einen Teil eines Information Retrieval Systems darstellen (Kapitel 2.5).

Ontologien. Eine neuere Entwicklung ist die Verwendung von Ontologien bei

der Erstellung von wissensbasierten Systemen. Ontologien stellen eine Grund-

lage f¨

ur viele innovative wissensbasierte Systeme bereit. Ein Vorteil bei der

Verwendung einer Ontologie besteht in der gemeinsamen und effizienten Kom-

munikationsbasis zwischen Nutzer und System und zwischen unterschiedlichen

Systemen.

Ontologiesprachen, die Ontologien beschreiben, verwenden Regeln auf Kon-

zepten, Eigenschaften von Konzepten und Relationen zwischen Konzepten sowie

zus¨

atzliche Sprachmittel. Es gibt eine ganze Reihe solcher Ontologiesprachen

(einfach, framebasiert, logikbasiert). Sie werden oftmals graphisch dargestellt.

Eine der bekanntesten Ontologiesprachen ist die Ressource Description Frame-

work (RDF) [RDF]. Eine weitere Sprache ist DAML+OIL, die sich aus den

beiden Sprachen DAML (DARPA Agent Markup Language) [DAR03] und OIL

(Ontology Inference Layer) [Ont] entwickelt hat. Sie baut auf dem RDF Schema

auf, bietet aber gr¨

oßere Ausdrucksm¨

oglichkeiten.

Eine im Rahmen des semantischen Webs entstandene Ontologiesprache ist OWL

(Web Ontology Language) [OWL]. Auch diese Sprache hat das RDF Schema zur

2.2. WISSENSMANAGEMENT 35

Grundlage. Sie ist eine durch das W3C standardisierte Sprache mit fest definier-

ter Syntax und Semantik. Sie basiert auf der Beschreibungslogik (description

logic) und auf Konzepten von DAML+OIL.

36 KAPITEL 2. DISZIPLINEN

2.3 Sprachverstehen

Die Grenzen meiner Sprache bedeuten die Grenzen meiner

Welt. Die Logik erf¨

ullt die Welt; die Grenzen der Welt

sind auch ihre Grenzen. [...] Was wir nicht denken k¨

onnen,

das k¨

onnen wir nicht denken; wir k¨

onnen also auch nicht sagen,

was wir nicht denken k¨

onnen.

(L. Wittgenstein, ¨

osterr. Philosoph, 1889 - 1951)

Das Sprachverstehen von geschriebenen Texten ist ein komplexer und vielschich-

tiger Konstruktionsprozess, der bis heute nicht vollst¨

andig verstanden ist. ”Bei

unseren allt¨

aglichen Gespr¨

achen verarbeiten und verstehen wir eine große An-

zahl von S¨

atzen; erfolgreiches Verstehen ist eine Voraussetzung f¨

ur eine effek-

tive Kommunikation und stellt die Grundlage unserer sozialen Interaktion dar.

Aus diesen Gr¨

unden ist es von besonderer Bedeutung, das Wissen und die Ver-

arbeitungsvorg¨

ange zu erforschen, die uns zu einem Verst¨

andnis der Sprache

bef¨

ahigen.“ [Wes94, S. 296]

W

iss

e

n

Text

syntaktisch semantisch

Parsing

lexikalisch pragmatisch

Abbildung 2.12: ¨

Uberblick Textverstehen

Sprachverstehen bzw. Textverstehen bedeutet nach M. Pinkal [GRS00, S. 739]

die ”Gewinnung von Bedeutungsinformationen aus einer gesprochenen oder ge-

schriebenen Eingabe¨

außerung“ und besteht aus einer Kombination von lexika-

lischen,syntaktischen,semantischen und pragmatischen Analysen. Der Prozess

2.3. SPRACHVERSTEHEN 37

der Analyse wird als Parsing bezeichnet, ”durch den die W¨

orter [ ...] in eine

mentale Repr¨

asentation ¨

uberf¨

uhrt werden [ ...].“ [And01, S. 389]

Beim Parsing treten allerdings Probleme auf, wann und wo einzelne Analy-

seschritte gemacht werden und wie mehrdeutige Strukturen aufgel¨

ost werden.

In den folgenden Betrachtungen sind die einzelnen Analysen nicht von der se-

mantischen Interpretation zu trennen, da jede experimentelle Anordnung zum

Sprachverstehen zwangsl¨

aufig auf die Semantik Bezug nehmen muss.

Semantische und pragmatische Analyse. Unter Textverstehen (semanti-

sche Interpretation) wird der ”Vorgang der Festlegung von Bedeutungen [ver-

standen]. Nach dieser Definition hat [ein Mensch] einen Satz nur dann verstan-

den, wenn er beispielsweise den in dem Satz enthaltenen Instruktionen folgen

kann oder eine angemessene Frage stellt.“ [Wes94, S. 311]. Bei der semanti-

schen Interpretation wird zwischen w¨

ortlicher und indentierter Bedeutung

unterschieden. Die w¨

ortliche Bedeutung bezieht sich allein auf die Aussage ei-

nes Satzes. Die indentierte Bedeutung dagegen beschreibt die Interpretation

der Aussage des Satzes (Kontextinformationen). Es muss daher w¨

ortliche und

indentiert Bedeutung gleichzeitig erfasst werden, um einen Satz zu verstehen.

Zweideutigkeiten (Ambiguit¨

aten) treten dann auf, wenn eine der beiden Be-

deutungen nicht erfasst wird.

Dennoch besitzen Menschen die F¨

ahigkeit, aus einzelnen W¨

ortern die Bedeutung

eines Satzes zu erkennen. So ist der Satz, ”Eis Kinder m¨

ogen“, verst¨

andlich.

Insbesondere verlassen sich Kinder eher auf semantische als auf syntaktische

Muster [SN74]. Erwachsene dagegen integrieren semantische und syntaktische

Komponenten, um S¨

atze zu interpretieren. Dies tun sie in einem kontinuierlichen

Prozess.

Es existieren viele W¨

orter und S¨

atze, die mehrere Interpretationen zulassen, da

es sich entweder um ambige W¨

orter oder um ambige syntaktische Konstruk-

tionen handelt. Dabei unterscheidet man zwischen lokalen (vor¨

ubergehenden)

und globalen (anhaltenden) Ambiguit¨

aten. Die lokale Ambiguit¨

at bezieht

sich auf Zweideutigkeiten, die sich im Satzverlauf wieder aufl¨

osen. Bei der glo-

balen Ambiguit¨

at k¨

onnen fr¨

uhstens am Ende des Satzes die Zweideutigkeiten

wieder aufgel¨

ost werden (Garden-Path-Satz). Die Garden-Path-S¨

atze sind ein

38 KAPITEL 2. DISZIPLINEN

wichtiger Beleg, dass Menschen versuchen, einen Satz unmittelbar zu interpre-

tieren.

Es gibt aber auch feststehende Wortgruppen (Phrasen), die als Ganzes inter-

pretiert werden [PF79]. So beziehen sich z. B. Quantifizierer (”weniger“, ”alle“

usw.) auf das nachfolgende Substantiv und tragen somit zu der semantischen

Interpretation des Substantivs bei und umgekehrt [H¨

o83, NC00]. Aber es gibt

auch viele Wortgruppen, die eine idiomatische Bedeutung haben, die sich nicht

unbedingt aus der Summierung der Einzelbedeutungen ergibt, wie z. B. ”blinder

Passagier“.

Aber nicht nur aus einzelnen S¨

atzen werden semantische Informationen ge-

wonnen, sondern auch satz¨

ubergreifend. ”Die Schwierigkeit der Integration von

Informationen aus verschiedenen S¨

atzen h¨

angt zum Teil von der Struktur der

Botschaft ab, die von dem Sprecher ausgeht.“ [Wes94, S. 320] Das Verstehen

eines Textes geschieht dann besser, wenn die einzelnen S¨

atze im gleichen Kon-

text zueinander stehen. F¨

ur die Zusammensetzung von S¨

atzen existieren Regeln

der Kommunikation zwischen zwei Kommunikationspartnern (”given-new con-

tract“) [CH77]. Diesem Ansatz zufolge schließen Kommunikationspartner einen

Vertrag, neue Informationen so zu ¨

ubertragen, dass der Zuh¨

orer diese leicht in

sein Vorwissen integrieren kann. Dabei gibt es augenf¨

allige syntaktische Kon-

struktionen, die neue Begriffe einf¨

uhren oder sich aus dem Kontext ergeben. So

bezieht sich z. B. ein Personalpronomen auf die genannte Person oder den Ge-

genstand im Satz davor. ”Das implizite Wissen dieser Regeln ist ein wichtiger

Bestandteil unseres pragmatischen Wissens.“ [Wes94, S. 321]

Lexikalische Analyse. In der lexikalischen Analyse geht es um die Identifizie-

rung des semantischen Inhalts eines einzelnen Wortes in einem Text. Dies kann

nur durch eine Kombination von morphologischen, syntaktischen und seman-

tischen Analysen geschehen. Als Resultat werden Wissensinhalte ¨

uber W¨

orter

und ihre Bezeichnung generiert.

In Untersuchungen [Wes94] wurde festgestellt, dass die lexikalische Analyse ein

nicht-trivialer Prozess ist. So k¨

onnen bei W¨

ortern wie Fliege Mehrdeutigkeiten

im Verst¨

andnis des Wortes (lexikalische Ambiguit¨

at) auftreten. Es kann nicht

eindeutig gekl¨

art werden, wie Menschen diese Ambiguit¨

aten aufl¨

osen. Untersu-

chungen zeigen, dass die Disambiguisierung einerseits durch die Kontextinfor-

2.3. SPRACHVERSTEHEN 39

mationen und anderseits durch pers¨

onliche Pr¨

aferenzen der einzelnen Personen

beeinflusst wird. Welcher Einfluss in bestimmten Situationen bevorzugt wird,

kann nicht gekl¨

art werden.

Syntaktische Analyse. Der Mensch besitzt trotz seines endlichen menta-

len Verm¨

ogens ein riesiges Reservoir an sprachlichem Wissen, mit dem er ei-

ne unendliche Anzahl von S¨

atzen bilden und verstehen kann. Noam Chomsky

[Cho57, Cho67] versuchte dieses Ph¨

anomen zu ergr¨

unden und zu schematisieren.

Er stellte eine endliche Anzahl von Regeln auf, mit denen korrekte sprachliche

S¨

atze gebildet werden. Das beschriebene Regelsystem nannte er generative

Grammatik, auch als Phrasenstrukturgrammatik bekannt.

Bei der Phrasenstrukturgrammatik werden Satzbausteine (Konstituenten) hier-

archisch organisiert. Die Konstituenten spiegeln dabei die innere syntaktische

Struktur eines Satzes wider und werden nach bestimmten Regeln (Phrasen-

strukturregeln) zu einem Satz zusammengef¨

ugt. In der Abbildung 2.13 werden

anhand des Satzes

”Ein Vektor ist ein Element eines linearen Raumes.“,

folgende Phrasenstrukturregeln angewendet, um den Satz zu strukturieren:

Ein Satz (S) besteht aus einer Nominalphrase (NP) und Verbalphrase (VP):

S ::= NP VP

Eine Nominalphrase besteht aus einem Substantiv (N), oder einem Artikel

(DET) und einem Substantiv, oder aus einem Adjektiv (ADJ) und einem Sub-

stantiv, oder aus einem Artikel, einem Adjektiv und einem Substantiv.

NP ::= [DET] [ADJ] N

Eine Verbalphrase besteht aus einem Verb (V) und einer Nominalphrase.

VP ::= V NP

Die Analyse des obigen Satzes erfordert ebenfalls eine Rekursion der Nomi-

nalphrase. Aus einer Konstituente NP wird eine Folge abgeleitet, die dieselbe

Konstituente wieder enth¨

alt.

40 KAPITEL 2. DISZIPLINEN

NP ::= NP NP

Die Zerlegung l¨

asst sich graphisch durch einen Ableitungsbaum (Phrasenstruk-

turbaum) darstellen.

Satz

Ein Vektor

N

Nominalphrase Verbalphrase

Nominalphrase

DET V

ist

Nominalphrase

ADJ N

Nominalphrase

DET N DET

ein Element eines linearen Raumes

Abbildung 2.13: Phrasenstrukturbaum

[S[NP [DET Ein ] [NVektor ] ] [VP [Vist ] [NP [DET ein] [NElement ] ]

[NP [DETeines ] [ADJ linearen ] [NRaumes ] ] ] ]

Allerdings k¨

onnen viele Satzarten [Dud98] nicht allein durch die Phrasenstruk-

turgrammatik beschrieben werden. Dies wurde von Chomsky erkannt, und er

f¨

uhrte daher die Transformationsgrammatik ein. Durch Transformations-

regeln k¨

onnen in dieser Grammatik z. B. S¨

atze im Passiv in S¨

atze im Aktiv

umgewandelt werden, ohne den semantischen Inhalt zu verlieren. Der Aktivsatz

l¨

asst sich dann durch die bekannten Phrasenstrukturregeln analysieren. S¨

atze

besitzen daher in der Transformationsgrammatik mindestens zwei strukturelle

Ebenen:

1. Oberfl¨

achenstruktur: Die Struktur eines Satzes, wie er normalerweise

in Texten auftritt.

2.3. SPRACHVERSTEHEN 41

2. Tiefenstruktur: Abstrakte syntaktische Basis eines Satzes oder Satzbau-

steins, die alle notwendigen semantischen und syntaktischen Informationen

enth¨

alt (Konstituentenstruktur).

S

NP VP

N V N

Paul kennt Paula

Tansformationsregeln

Passiv Fragen

Paula wird von Paul gekannt. Kennt Paul Paula?

Abbildung 2.14: Transformationsregeln

Dies bedeutet f¨

ur die Anwendung, dass S¨

atze von ihrer Oberfl¨

achenstruktur in

die zugrundeliegende Tiefenstruktur transformiert werden. Es wird somit deut-

lich, dass die Sprache eine komplexe Struktur besitzt, die sich nicht ohne weiteres

durch ein einfaches Modell beschreiben l¨

asst. Daher muss ein mehrschichtiges

Modell verwendet werden, um die Sprache ad¨

aquat darzustellen.

Auch bei syntaktischen Analysen treten Mehrdeutigkeiten (syntaktische Am-

biguit¨

at) auf. Hierbei gibt es wiederum unterschiedliche Meinungen zur Disam-

biguisierung [Wes94]. Die Satzteilhypothese besagt, dass zuerst die syntakti-

sche Struktur eines Satzes analysiert und dann dessen semantische Bedeutung

determiniert wird. In diesem Fall m¨

ussen einer lesenden Person alle m¨

oglichen

syntaktischen Ambiguit¨

aten eines Satzes bekannt sein. Im anderen Fall wer-

den Kontextinformationen verwendet, um eine eindeutige syntaktische Struktur

auszuw¨

ahlen.

Eine lesende Person m¨

usste daher alle anderen M¨

oglichkeiten von syntaktischen

Strukturen nicht bewusst wahrnehmen. Untersuchungen zeigen, dass die Satz-

teilhypothese sehr fragw¨

urdig ist. Vermutlich ist die syntaktische Disambigui-

sierung ein kontinuierlicher und fortlaufender Prozess und beeinflusst alle Teile

eines Satzes und nicht nur gr¨

oßere syntaktische Einheiten.

42 KAPITEL 2. DISZIPLINEN

2.3.1 Psychologische Modelle zum Textverstehen

Mentale Modelle. Um einen Text zu verstehen, muss der Text in ein Modell

¨

uberf¨

uhrt werden, das in das bestehende Modell einer Person (Vorwissen, Welt-

modelle) eingeordnet werden kann. Nach Johnson-Laird [JL83, JL95, JL00] exis-

tiert neben einer mentalen Repr¨

asentation eines Textes eine nicht-sprachliche

Repr¨

asentation (mentales Modell). Dieses mentale Modell ist eine personifi-

zierte Repr¨

asentation der im Text beschriebenen Situation, die ¨

uber den reinen

Inhalt des Textes hinausgeht [RS99]. Somit enth¨

alt das mentale Modell Inferenz-

schl¨

usse, die durch die Interaktion zwischen der mentalen Repr¨

asentation des

Textes und dem Weltwissen der Person entstehen (Koh¨

arenzbildung). Dadurch

beschreibt das mentale Modell den Prozess des Verstehens von nat¨

urlichsprach-

lichen Texten.

Untersuchungen zu der Best¨

atigung dieses Modells k¨

onnen bei [GML87, GL92,

OG96] gefunden werden. Allerdings werden keine genaue Angaben gemacht, wie

dieses Modell im Gehirn repr¨

asentiert wird. Sie beschreiben nur den Prozess der

Inferenzbildung beim Sprachverstehen.

Textverstehen mit propositionalen Modellen. Im Gegensatz zu den

mentalen Modellen wurden die propositionalen Modelle ([Kin74, KvD83, Kin88,

Kin98]) direkt im Hinblick auf das Sprachverstehen entwickelt2. Es wird davon

ausgegangen, dass der Mensch im Verlauf des Verarbeitungsprozesses den Text

in einzelne Aussagen (Propositionen) zerlegt. Diese Propositionen werden ex-

trahiert und miteinander in Relation (temporale, konditionale Relationen usw.)

gestellt (Textbasis) (Kapitel 2.2). Des Weiteren existiert eine erwartete seman-

tische Repr¨

asentation des Lesers gegen¨

uber dem gelesenen Text (Situationsmo-

dell) [Kin88]. Auf Grundlage dieser beiden Modelle, Textbasis und Situations-

modell, wird eine mentale Textrepr¨

asentation gebildet, die den Text interpre-

tiert. Untersuchungen zu diesem Modell k¨

onnen bei [KK73, WMF95] gefunden

werden.

Allerdings k¨

onnen dadurch keine semantischen oder syntaktischen Mehrdeu-

tigkeiten aufgel¨

ost werden. Dazu ist immer eine semantische Analyse notwen-

dig. Ebenfalls beschreiben propositionale Modelle nicht, dass das Textverstehen

2Sie wurden auf Grundlage der generativen Grammatik von Chomsky ¨

uber den ”case-

grammar“-Ansatz von Fillmore (1968) entwickelt.

2.3. SPRACHVERSTEHEN 43

ein dynamischer Prozess ist, in dem fortlaufend Inhalte umgearbeitet werden

m¨

ussen.

Textverstehen mit interaktiven Modellen Bei den interaktiven Modellen

wird davon ausgegangen, dass der Leser eines Textes ¨

uber bestimmte Situa-

tionen Modelle speichert. Diese Modelle beinhalten Hintergrundwissen und die

Erwartungen zum Informationsgehalt des Textes. Beide Modelle stehen mitein-

ander in Wechselwirkung. Aus dieser grundlegenden Betrachtungsweise entstan-

den z. B. die Skripttheorie von Schank und Abelson [AS77] und die konnektio-

nistischen Modelle [WP85].

Die mentalen und propositionalen Modelle sind zwei entgegengesetzte Darstel-

lungen der g¨

angigen Modelle [Sch93, RS99]. Tats¨

achlich gehen die meisten For-

scher davon aus, dass im Prozess der Sprachverarbeitung verschiedene Repr¨

asen-

tationen aufgebaut werden, die nebeneinander existieren [GMZ97, RSS02].

44 KAPITEL 2. DISZIPLINEN

2.4 Computerlinguistik

Er hat mit menschlichen Z¨

ugen ¨

uberrascht.

(G. Kasparow (*1963), aserbeidschanischer Schachspieler,

nachdem er gegen den Schachcomputer Deep Blue verloren hatte, 2002)

Die Linguistik ist die ”Wissenschaft, die sich mit der Struktur und dem Funktio-

nieren der Sprache befasst“ [Bro03, S. 536]. Linguisten betrachten zwei grundle-

gende Konzepte der Sprache, die Produktivit¨

at und die Regelhaftigkeit [And01].

Die Produktivit¨

at beschreibt die vielf¨

altigen Konstruktionen, mit denen aus

W¨

ortern S¨

atze gebildet werden k¨

onnen. Die Regelhaftigkeit schr¨

ankt die Pro-

duktivit¨

at ein, indem sie nur eine endliche Anzahl von Wortkombinationen

zul¨

asst. Diese Regelhaftigkeit einer Sprache wird durch ihr Regelsystem aus-

gedr¨

uckt, das als Grammatik bezeichnet wird. Die Grammatik unterteilt sich

in die Teilgebiete Phonologie,Syntax,Semantik und Morphologie (siehe Abbil-

dung 2.15).

Phonologie Syntax

Morphologie Semantik

Abbildung 2.15: Bausteine der Grammatik

Die Phonologie untersucht die Funktionen der einzelnen Laute und Lautgrup-

pen. Die Beziehungen der sprachlichen Elemente im Satz werden durch die Syn-

tax beschrieben. Mit der Vermittlung der Bedeutung der einzelnen Textbaustei-

ne befasst sich die Semantik. Die Morphologie beschreibt die Formver¨

anderung

der W¨

orter durch Deklination und Konjugation.

Nach Anderson [And01] ist es ein Ziel der Linguisten, ”ein Regelsystem [Gram-

matik] zu erstellen, das die strukturellen Regelhaftigkeiten einer Sprache er-

fasst.“ [And01, S. 356]

2.4. COMPUTERLINGUISTIK 45

2.4.1 Morphologie

Die Morphologie (Formenlehre) ”untersucht die systematischen Beziehungen

zwischen W¨

ortern und Wortformen bzw. Regeln, nach denen W¨

orter bzw. Wort-

formen gebildet werden“ [CEE+01, S. 175]. Die Ergebnisse aus der morphologi-

schen Analyse werden auch f¨

ur die syntaktische Analyse verwendet, so dass die

Morphologie einen wichtigen Beitrag zum gesamten Prozess des Sprachverste-

hens (Kapitel 2.3) liefert.

Das Wort (Lexem) bildet eine selbstst¨

andige lexikalische abstrakte Einheit, aus

der sich verschiedene Wortformen ableiten lassen. Die Menge aller Wortformen

wird als Paradigma bezeichnet. Diese Wortformen werden aus dem zu betrach-

tenden Wort durch folgende Transformationen gebildet [Hau00]:

1. Flexionsmorphologie:Die Bildung von W¨

ortern durch systematische Va-

riationen, durch die sich ein Wort an die verschiedenen syntaktischen

Umgebungen (Numerus, Person, Kasus, Tempus, Genus, Komparation,

Modus) anpasst.

”Buch“: ”Buch – es“, ”Buch – e“, ”B[¨

u]ch – er“, ...

2. Wortbildungsprozess:

•Komposition:Die Bildung eines neuen Wortes durch die Zusammen-

setzung von W¨

ortern.

”Eisen – T¨

ur“3,”Eintag(s) – Fliege “4

•Derivation:Die Bildung eines neuen Wortes auf Basis eines einzel-

nen Lexems mit Hilfe eines Affixes (Suffixes und/oder Pr¨

afixes).

”Zwerg“: ”Zwerg – lein“, ”zwergenhaft“, ”zwergenartig “, ...

Morpheme sind die kleinsten bedeutungstragenden (grammatischen) Einheiten,

die in endlicher Anzahl in einer Sprache auftreten. Zu einem Morphem existieren

Allomorphe.”So wie S¨

atze genau genommen aus Wortformen (und nicht aus

W¨

ortern) bestehen, so bestehen Wortformen genau genommen aus Allomorphen

3Nominalkompositionen machen 2/3 des dt. Wortschatzes aus [Dud98]

4Fugenlaut

46 KAPITEL 2. DISZIPLINEN

(und nicht aus Morphemen)“ [Hau00, S. 271]. Die Grundformen (Wurzeln) bil-

den die Grundlage f¨

ur die Derivation und Flexion. Die peripheren Morpheme

sind die Affixe.

Beispiel 2.4.1

buchMorphem ={buch, b¨

uch}Allomorphe

Morphologische Analyse. Eine zentrale Aufgabe der morphologischen Ana-

lyse ”besteht darin, die kleinsten sprachlichen Einheiten mit Bedeutung, die

Morpheme, zu ermitteln und ihre strukturellen Eigenschaften als Bausteine von

W¨

ortern zu beschreiben (strukturalistische Linguistik)“ [fLuLdUB04].

Die strukturalistische Linguistik zerlegt nicht nur die linguistische Analyse in

ihre Bestandteile — Semantik, Syntax und Morphologie — sondern stellt auch

Verfahren bereit, W¨

orter zu zerlegen. Dadurch k¨

onnen relevante Anteile von

W¨

ortern separiert und identifiziert werden. Daraus ergeben sich zwei Analyse-

schritte: Segmentierung und Klassifizierung [fLuLdUB04].

Aus der generativen Morphologie, die ebenfalls aus dem Strukturalismus her-

vorgeht, k¨

onnen weitere morphologische Analyseformen erschlossen werden. Die

Beschreibungsmethoden werden dabei stark durch die syntaktische Analyse ge-

pr¨

agt. Nach Spencer [SZ98] werden drei Ans¨

atze unterschieden:

1. Morphembasierter Ansatz:

Kombination von Morphemen zu einem Wort

Liste aller Morpheme

morphologische Regeln

sämtliche möglichen Wörter

Abbildung 2.16: Morphembasierter Ansatz

2.4. COMPUTERLINGUISTIK 47

2. Wortbasierter Ansatz:

Kombination von Grundmorphemen mit Affixen zu einem Wort

Wort

Wort Affix

keit

Grundmorphem

Grundmorphem Affix

feucht ig

Abbildung 2.17: Wortbasierter Ansatz

3. Realisierungsbasierter Ansatz:

Kombination von Allomorphen zu einem Wort

Realisierung. Anhand der Ans¨

atze von Spencer k¨

onnen verschiedene mor-

phologische Analysen auf dem Computer realisiert werden. Hierf¨

ur bieten sich

endliche Automaten an, die f¨

ur die morphologische Analyse durch die Finite-

State Transducer realisiert werden.

Definition 2.4.1 (Endlicher Automat)

Ein endlicher Automat wird durch ein 5-Tupel M= (Z, Σ, δ, S, F)dargestellt,

wobei

1. Z: endliche, nicht-leere Menge von m¨

oglichen Zust¨

anden,

2. Σ: endliches, nicht-leeres Eingabealphabet,

3. δ:Z×Σ−→ Z(¨

Uberf¨

uhrungsfunktionen),

4. S∈Z: Anfangszustand,

5. F⊆Z: Menge der Endzust¨

ande

bezeichnen. [Hed02, S. 57]

48 KAPITEL 2. DISZIPLINEN

Ein Alphabet Σ ist eine nicht-leere, endliche Menge. Elemente eines Alphabets

heißen Zeichen (Symbole, Buchstaben). Die n-Tupel (x1,...,xn) von Zeichen

xi∈Σ heißen Wort ¨

uber dem Alphabet Σ. Die Menge aller W¨

orter ¨

uber einem

Alphabet Σ heißt Σ∗. Die leere Folge (L¨

ange 0) wird mit bezeichnet und heißt

leeres Wort. Σ+ist die Menge aller nicht-leeren W¨

orter ¨

uber den Alphabet:

Σ+:= Σ∗\ {}. Die einfachste Operation auf W¨

ortern ist die Konkatenation

(Verkettung) •: Σ∗×Σ∗→Σ∗mit x•y=x1,...,xm, y1,...,ynmit x, y ∈Σ∗

012

"Hund"

"e"

"es"

"en"

Start

Abbildung 2.18: Darstellung eines endlichen Automaten

Das Zustandsdiagramm dieses endlichen Automaten ist ein gerichteter Graph

mit

1. Knoten entsprechen den Zust¨

anden (0, 1 und 2).

2. Jedes Paar (q, a)∈Z×Σ, f¨

ur das δdefiniert ist, entspricht einer gerich-

teten Kante von qnach q0:= δ(q, a) (δ(0,“Hund“) = 1, δ(1,“e“) = 2,

δ(1,“es“) = 2, δ(1,“en“) = 2).

3. Anfangszustand (0).

4. Endzustand (2).

Endliche Automaten sind sehr einfache Maschinenmodelle, die z. B. ein Wort

morphemweise abarbeiten. Nur wenn das Wort korrekt ist, erreicht der endliche

Automat seinen Endzustand.

Ein Finite-State Transducer ist ein endlicher Automat, der gleichzeitig zwei

Symbole (allgemein: nSymbole) bearbeitet und in entsprechende Zust¨

ande

¨

ubergeht.

Definition 2.4.2 (Finite-State Transducer (FST))

Ein Finite-State Transducer ist ein (deterministischer) endlicher Automat M=

(Z, Σ, δ, S, E)mit Σ⊂X1×X25.

2.4. COMPUTERLINGUISTIK 49

012

Start "es":gen

"en":pl

"e":dat

"Hund"

Abbildung 2.19: Darstellung eines Finite-State Transducer

Finite-State Transducer verarbeiten also geordnete Paare von Symbolen aus

zwei verschiedenen Alphabeten. Somit existiert die M¨

oglichkeit, ein Wort in

verschiedene Wortformen zu transformieren. Es ist aber auch m¨

oglich, den um-

gekehrten Weg zu betrachten, indem man das zu untersuchende Wort in seine

Bestandteile zerlegt.

Ein Modell, das die Morphologie mit Finite-State Transducern beschreibt, ist

die Zwei-Ebenen Morphologie [Kos83]. Die Zwei-Ebenen Morphologie besteht

aus zwei Ebenen der Analyse: Oberfl¨

achenebene und lexikalische Ebene. Die

Oberfl¨

achenebene enth¨

alt die Wortformen, die in einem Text vorkommen. Die

lexikalische Ebene enth¨

alt die morphologischen Informationen. Wie diese auf-

gebaut sind – Nennform, Morpheme usw. – ist nicht vorgeschrieben. Die Zwei-

Ebenenregeln konstruieren Abbildungen zwischen den Ebenen, die durch Finite-

State Transducer beschrieben werden. Somit besteht das System aus einem Le-

xikon und einem Regelsystem.

Eingabe: Oberfl¨

ache −→ Ausgabe: lexikalische Ebene

Hunde 7→ Hund + Plural + Maskulin + Nominativ

Eine weitere morphologische Analysemethode ist die vererbungsbasierte Re-

pr¨

asentationssprache DATR [EG96]. Diese speichert morphologische Informa-

tionen in einer Graphenstruktur. Knoten entsprechen W¨

ortern in Nennform.

Der Pfad ist durch morphosyntaktische Informationen – <form, pr¨

as, sg>: 1.

Person Singular Pr¨

asens – gegeben. Der Wert des Pfades entspricht dann der

Wortform. Die Pfade bilden grundlegende Regeln, mit denen ¨

uber Inferenzen

weitere Wortformen gebildet werden k¨

onnen.

5X1, X2sind Alphabete

50 KAPITEL 2. DISZIPLINEN

Beispiel 2.4.2

WATEN:

<wurzel>== wat

<endung pr¨

as sg eins >== e

<endung pr¨

as pl zwei >== et

[CEE+01, S. 191]

Beim Wortklassentagging werden allen W¨

ortern eines Textes Tags zugeordnet.

Tags enthalten morphosyntaktische Informationen. ”Beim Tagging sollen For-

men im Kontext morphosyntaktisch disambiguiert, d. h. mit der im Kontext in-

tendierten Beschreibung versehen werden.“ [GRS00, S. 678]

Ein Methode f¨

ur das Wortklassentagging ist das regelbasierte Tagging. Dabei

wird ein Regelsystem aus einem vorgegebenen Textkorpus erstellt. Diese einfa-

chen Regeln werden direkt auf einen Text angewendet. Der Vorteil dieser Me-

thode ist die einfache Erweiterbarkeit des Regelsystems. Allerdings m¨

ussen diese

Regeln von Hand erstellt werden. Die Betrachtung von neuen Dom¨

anen f¨

uhrt

meistens zu einer Neubildung des Regelsystems.

Ein weiteres Verfahren ist das statistische Tagging (z. B. Brill-Tagging [Bri92,

Bri94]). Bei diesem Lernverfahren werden aus bereits getaggten W¨

ortern auto-

matisch Regeln abgeleitet.

2.4.2 Syntax

Die Morphologie (Kapitel 2.4.1) beschr¨

ankt sich auf die Analyse der einzelnen

W¨

orter. Die Syntax nutzt die morphologische Analyse und macht Voraussagen

dar¨

uber, ob die S¨

atze einer Sprache grammatikalisch korrekte Formen besit-

zen oder welche Aneinanderreihungen von W¨

ortern und Satzzeichen syntaktisch

korrekte S¨

atze ergeben. Demnach besch¨

aftigt sie sich also mit dem ”Bau von

Wortgruppen und S¨

atzen“ [Dud98, S. 609].

Definition 2.4.3 (Satz)

”S¨

atze sind sprachliche Einheiten, die relativ selbstst¨

andig und abgeschlossen

sind. Sie bauen sich aus kleineren sprachlichen Einheiten auf, die ihrerseits auch

2.4. COMPUTERLINGUISTIK 51

schon einen gewissen Selbstst¨

andigkeitsgrad haben, aus W¨

ortern und geglieder-

ten Wortgruppen; und sie erscheinen normalerweise in gr¨

oßeren selbstst¨

andigen

und abgeschlossenen sprachlichen Einheiten.“ [Dud98, S. 609]

In der Einleitung wurde besprochen, dass die Regelhaftigkeit die Anzahl der

m¨

oglichen Kombinationen einschr¨

ankt und somit nur eine endliche Kombination

von Wortkombinationen zu S¨

atzen f¨

uhrt. So gibt es z. B. nach Helbig [HB01, S.

445] endlich viele ”morphologisch-syntaktische Satzstellungsglieder“:

1. Verbkonstruktionen: Finites Verb (”Ich gehe.“), Infinitiv des Verbs (”Ich

werde gehen.“), Partizip des Verbs (”Ich bin gegangen.“), Pr¨

aposition und

Verb (”Alle hielten die Regel f¨

ur gelungen.“)

2. Substantivkonstruktionen: Nominativ des Substantivs,Akkusativ des

Substantivs,Dativ des Substantivs,Genitiv des Substantivs,Pr¨

apositi-

on und Substantiv (”Die Mutter wartet vor der Schule.“)

3. Adjektivkonstruktionen: Adjektiv,Adjektiv und Pr¨

aposition (”Der Pro-

fessor h¨

alt das Thema f¨

ur interessant.“)

4. Adverbkonstruktionen: Adverb (”Es sitzt dort.“), Pr¨

aposition und Adverb

(”Sie kommt von dort.“)

Es gilt, solche syntaktischen Strukturen zu erkennen und zu schematisieren,

damit sie computergerecht nutzbar gemacht werden k¨

onnen. Ziel der Linguisten

ist es daher, Theorien zur Beschreibung von Gesetzm¨

aßigkeiten zu finden, die

die Syntax einer Sprache m¨

oglichst vollst¨

andig beschreiben k¨

onnen.

Syntaktische Analyse. Die syntaktische Analyse stellt methodische Prinzi-

pien bereit, um syntaktische Strukturen menschlicher Sprache zu erfassen. Nach

Carstensen [CEE+01] werden syntaktische Strukturen unter zwei Gesichtspunk-

ten betrachtet:

•Dependenzsyntax

•Konstituentenstruktursyntax

52 KAPITEL 2. DISZIPLINEN

Bei der Dependenzsyntax werden syntaktische Strukturen als Relationen zwi-

schen W¨

ortern betrachtet. Das Verb nimmt dabei eine Schl¨

usselposition ein, da

alle anderen W¨

orter im Satz vom ihm abh¨

angen. Die grammatikalischen Ur-

sachen liegen in der Valenz der Verben. Die Valenz beschreibt, ob Verben im

Satz erg¨

anzungslos gebraucht werden oder nicht. Je nach Art der Erg¨

anzungen

werden bestimmte Valenzklassen unterschieden (Akkusativobjekt, Dativobjekt

usw.). Inhaltlich beschreiben Verben T¨

atigkeiten, Zust¨

ande u. ¨

a. Dies beeinflusst

die Angaben von Personen und Dingen.

Aus den beschriebenen Betrachtungen leitet sich dann die Dependenzgrammatik

ab.

wieder

kamen

ihrem

Wohnungen

zu suchenSperlinge

die

altem

Als sie nun in ihren altem Glanze da stand, kamen die Sperlinge wieder, ihre alte Wohnung zu suchen.

stand

im Glanzesie nun da

altenihrem

"als"

Einleitewort: Konnektor

Abbildung 2.20: Dependenzgrammatik [CEE+01, S. 204]

Die Konstituentenstruktursyntax nimmt dagegen an, dass neben den W¨

ortern

noch weitere komplexere Strukturen existieren. Diese komplexen Strukturen

werden als Phrasen bzw. Konstituenten bezeichnet. Konstituenten lassen sich

dann wieder in einzelne W¨

orter zerlegen.

Konstituentenstrukturen sind schon im Kapitel 2.3 in der syntaktischen Ana-

lyse betrachtet worden (generative Grammatiken) [Cho57, Cho67]. Generati-

ve Grammatiken spiegeln den hierarchischen Konstituentenaufbau wider. Jede

Konstituente geh¨

ort zu einer syntaktischen Kategorie, die in einer bestimmten

Reihenfolge zusammengesetzt wird. Konstituenten sind: Nominalphrase (NP),

Verbalphrase (VP), Pr¨

apositionalphrase (PP) und Adjektivphrase (AP). Die

zugeh¨

origen Kategorien setzen sich zusammen aus:

2.4. COMPUTERLINGUISTIK 53

Satz: S: NP VP

Nominalphrase: NP: (Artikel) + (Adjektiv)

NP: Pronomen

Verbalphrase: VP: Verb + NP

VP: Verb + PP

Pr¨

apositionalphrase: PP: Pr¨

aposition + NP

Verb: V: Hilfsverb + Verb

Die Abbildung der Phrasen in die Kategorien bezeichnet man als Phrasenstruk-

turregel und die Abbildung der Kategorien (Substantiv, Verb usw.) auf termi-

nale W¨

orter heißt lexikalische bzw. terminale Regel. Probleme bei der syntak-

tischen Analyse treten durch strukturelle Ambiguit¨

aten auf. So kann z. B. ein

Nebensatz so eingebunden sein, dass es schwer ist, eine eindeutige Interpretation

zu erhalten.

Realisierung. F¨

ur die Analyse von Sprachen ist die Theorie der formalen

Sprache unerl¨

asslich und somit werden Sprachen ¨

uber ihre Grammatik beschrie-

ben. Eine formale Sprache L¨

uber einem Alphabet Σ ist eine beliebige Teilmenge

von Σ∗.

Definition 2.4.4 (Grammatik)

Eine Grammatik ist ein Quadrupel G= (ΣN,ΣT, S, R)bestehend aus:

1. ΣN,ΣT: endliche, nicht-leere Mengen mit ΣN∩ΣT=∅mit ΣNnicht-

terminale Symbole und ΣTterminale Symbole;

2. R: endliche Menge von Erzeugungsregeln (Grammatikregeln, Produkti-

onsregeln) der Form α→βmit α∈(ΣT∪ΣN)+und β∈(ΣT∪ΣN)∗;

3. einem Startsymbol S∈ΣN.

(nach [Hed02, S. 29])

Grammatikregeln beschreiben die Struktur der W¨

orter einer Sprache. Ausge-

hend von der Satzstruktur werden durch die Regeln die Strukturen immer wei-

ter verfeinert bis terminale Symbole entstehen. Die Zwischenstrukturen heißen

dann grammatikalische Kategorien ΣN.

54 KAPITEL 2. DISZIPLINEN

x = aB Aaa ab Aaa = y

bA Bab

Abbildung 2.21: Beispiel aus [Hed02, S. 32]

Nach Chomsky existieren verschiedene Typen von Grammatiken (Chomsky-

Hierarchie). Es werden im Rahmen dieser Arbeit nur kontextfreie Grammatiken

betrachtet, die sich dadurch auszeichnen, dass sie effiziente Parsingalgorithmen

erm¨

oglichen.

Definition 2.4.5 (Kontextfreie Grammatik)

Eine Grammatik G= (ΣN,ΣT, S, R)heißt kontextfrei (oder auch Typ-2), falls

alle Grammatikregeln von der Form A−→ αmit A∈Σ+

Nund α∈(ΣN∪ΣT)+

sind. [CEE+01, S. 72]

Ein graphisches Beispiel wird gegeben durch den Ableitungsbaum in Abbildung

2.22.

S

VP

die

NP

DET N V NP

DET N

der Hund sieht Katze

Abbildung 2.22: Ableitungsbaum

G=<{S, NP, VP, DET, N, V },{der,Hund,bellt,die,Katze }, S, R >

R={S→NP VP, NP →DET N, VP →V NP, DET →der,

DET →die, N →Hund, N →Katze, V →sieht }

2.4. COMPUTERLINGUISTIK 55

”Die Wurzel des Baumgraphen ist mit dem Startsymbol S (f¨

ur Satz) etiket-

tiert. Der Satz besteht aus zwei Teilstrukturen, der Nominalphrase (NP) ’der

Hund’ und der Verbalphrase (VP) ’sieht die Katze’. Die NP ’der Hund’ besteht

aus dem Determinierer (DET) ’der’ und dem Nomen (N) ’Hund’. Die VP be-

steht aus dem Verb (V) ’sieht’ und der NP ’die Katze’, die dieselbe interne

Struktur aufweist wie die Subjekts-NP.“ [CEE+01, S. 207]. Allerdings werden

durch die Verwendung von kontextfreien Grammatiken viele grammatikalisch

inkorrekte Konstruktionen zugelassen. Deshalb werden grammatikalischen Ka-

tegorien (Phrasen) etwas erweitert bzw. differenziert hinsichtlich des Tempus,

Kasus usw. (z. B. Genusinformationen: Nmaskulin,Nfeminin und Nneutrum ) und so-

mit entstehen auch neue Regeln. Das Problem ist hierbei allerdings, dass die

Regelmenge exponentiell anw¨

achst.

Ein Prototyp f¨

ur kontextfreie Grammatiken ist der ATN-Formalismus (aug-

mented transition network) [Woo80]. Hierbei handelt es sich um ein rekursives

Transitionsnetzwerk (RTN), das aus mehreren Teilnetzen besteht. Die Teilnet-

ze verk¨

orpern sowohl terminale (z. B. Nomen und Adjektive) als auch nicht-

terminale Anteile (z. B. NP und VP).

Der constraintbasierte bzw. unifikationsbasierte Ansatz basiert auf Merk-

malsstrukturen. Dadurch werden komplexe Objekte durch mehrere Eigenschaf-

ten charakterisiert6.

Akkusativ

Singular

Maskulin

Numerus

Genus

Kasus

ARG

KAT

Nomen

ARG Numerus

Genus

Kasus

Singular

Maskulin

Akkusativ

Abbildung 2.23: Merkmalsstruktur

Zu den prominentesten Vertretern dieses Ansatzes geh¨

oren die Generalized

Phrase Structure Grammar (GPSG) [GKPS85], die Lexical Functional Gram-

mar (LFG) [Bre82], Parsing and Translation [Shi86] sowie die Head Driven

Phrase Structure Grammar (HPSG) [PS94].

6Auch Chomsky verwendet schon Merkmalsstrukturen um Verben zu subkategorisieren.

56 KAPITEL 2. DISZIPLINEN

Die GPSG-Grammatik verwendet verschiedene Restriktions- und Regelfor-

mate. Es gibt ID-Regeln und LP-Statements. Die ID-Regeln ¨

ahneln den tra-

ditionellen Phrasenstrukturregeln, jedoch ist die Reihenfolge der W¨

orter nicht

festgelegt. So ist sowohl NP →DET N als auch NP →N DET m¨

oglich.

Erst durch die Anwendung eines LP-Statement DET < N wird die Reihenfol-

ge festgelegt. Die grammatikalischen Kategorien bestehen aus Merkmalsstruk-

turen. Die Werte von Merkmalen sind atomar. Hauptkategorien sind Verben,

Substantive, Adjektive und Pronomen; Nebenkategorien sind Konjunktionen,

Interjektionen und Gradpartikel. Die vier Hauptkategorien k¨

onnen den Kopf ei-

ner Phrase bilden. Bei der HPSG wird zus¨

atzlich davon ausgegangen, dass der

Kopf einer Phrase ein wichtiges Element ist. So ist der Kopf der Verbalphrase

das Verb. In der HPSG gibt es daf¨

ur keine Phrasenstrukturregeln mehr, sondern

allgemeine ”hierarchisch organisierte lexikalische Strukturen“ [CEE+01, S. 216].

Die lexikalisch-funktionale Grammatik ist ein Gegenmodell zu Chomskys

Standardtheorie der generativen Grammatik. Hierbei werden jeder grammati-

kalischen Beschreibung eines Satzes zwei Strukturen zugeordnet: die Konsti-

tuentenstruktur (C-Struktur) und die funktionale Struktur (F-Struktur). Die

C-Struktur wird durch Phrasenstrukturregeln erzeugt. Diese Strukturen wer-

den dann auf die F-Struktur abgebildet, die die grammatikalischen Funktionen

(z. B. Subjekt) als Merkmale repr¨

asentiert.

Eine wichtige Eigenschaft der LFG ist, dass grammatikalische Strukturen nicht

mehr durch syntaktische Regeln, sondern durch lexikalische Regeln bestimmt

werden.

Das Parsing and Translation (PATRII) ist der einfachste unifikationsba-

sierte Grammatikformalismus. PATRII besteht aus zwei Komponenten: einem

Lexikon und einen Regelsystem. Die Regeln bestehen aus kontextfreien Phra-

senstrukturregeln und einer Menge von Pfadgleichungen, die den kontextfreien

Regeln Restriktionen auferlegen. Dabei werden die syntaktischen Kategorien

durch Merkmalsstrukturen repr¨

asentiert.

Beispiel 2.4.3 (PATRII)

Aus dem Satz ”Der Hund bellt die Katze an.“ kann die Nominalphrase ”der

Hund“ mittels der Regel NP →DET N zerlegt werden. In PATRII kann diese

Regel beschrieben werden durch:

X0→X1X2

2.4. COMPUTERLINGUISTIK 57

mit den Pfadgleichungen:

R=









< X0CAT >=NP

< X1CAT >=DET

< X2CAT >=N

wobei CAT die Bezeichnung f¨

ur eine Kategorie ist (Abbildung 2.24).

In diesem Beispiel enthalten die Argumente ARG die Genus- und die Numerus-

Informationen. Es existiert die zus¨

atzliche Regel < X1ARG>=< X2ARG >

(Abbildung 2.24). Durch den Vergleich der Argumente der Merkmalsstrukturen

des Artikels (DET) und des Substantivs (N) wird bei ¨

Ubereinstimmung der

Argumente (Unifikation) angenommen, dass der Artikel zusammen mit dem

Substantiv verwendet werden kann.

CAT

ARG Numerus

Genus

Kasus

Singular

Maskulin

Nominativ

CAT

ARG Numerus

Genus

Kasus

Singular

Maskulin

Nominativ

Hundder

Determinator Substantiv

Unifikation

Abbildung 2.24: Beispiel Unifikation

In der probabilistischen kontextfreien Grammatik enth¨

alt jede Regel als

zus¨

atzliches Element eine Wahrscheinlichkeit.

Beispiel 2.4.4

Ein Satz muss immer aus einer Verbalphrase und einer Nominalphrase bestehen

und somit besitzt diese Regeln den Wahrscheinlichkeitswert 1. Eine Nominal-

phrase kann auf verschiedene Weise zerlegt werden, die Wahrscheinlichkeit, dass

die Zerlegung in Artikel und Substantiv erfolgt, ist 0.65 [CEE+01]

S−→ V P NP 1

NP −→ DET N 0,65

58 KAPITEL 2. DISZIPLINEN

Quellcode

Token

Ableitungsbaum

Ziel

semantische Analyse

syntaktische Analyse

lexikalische Analyse

PARSER

Abbildung 2.25: Parsing f¨

ur eine computerlinguistische Analyse

Die Wahrscheinlichkeit einer Ableitung relativ zu einer gegebenen Kette von ter-

minalen Symbolen wird als Produkt der Einzelwahrscheinlichkeiten aller Regeln

definiert, die in der Ableitung vorkommen.

Parsing. Da im Rahmen dieser Arbeit kontextfreie Grammatiken verwendet

werden, k¨

onnen Parsingformalismen f¨

ur diese Grammatiken verwendet werden.

Als Ergebnis des Parsens entsteht ein Ableitungsbaum, der dann durch die se-

mantische Analyse den Zielcode generiert.

Bei der Konstruktion solcher B¨

aume k¨

onnen Mehrdeutigkeiten auftreten. Eine

kontextfreie Grammatik Gheißt mehrdeutig, falls es ein Wort in der durch G

generierten Sprache Lgibt, das mindestens zwei verschiedene Ableitungsb¨

aume

hat. Beim Aufbau eines Ableitungsbaums durch den Parser gibt es verschiedene

Strategien. Nach [CEE+01, S. 225] existieren folgende M¨

oglichkeiten:

1. Verarbeitungsrichtung: Links-Rechts-Verarbeitung, Head-Corner Parsing

2. Analyserichtung: Top-down-Verarbeitung, Bottom-up-Verarbeitung

3. Suchstrategie: Tiefensuche, Breitensuche

Die Entwicklung von Parsingalgorithmen f¨

ur nat¨

urliche Sprache ist nicht ein-

fach, da komplexe Strukturen erkannt werden m¨

ussen und außerdem Ambi-

guit¨

aten auftreten k¨

onnen. Oft reichen daf¨

ur sequentielle Verfahren, bei denen

2.4. COMPUTERLINGUISTIK 59

die einzelnen Schritte getrennt und nacheinander ausgef¨

uhrt werden, nicht mehr

aus, und es ist n¨

otig, auf integrative Verfahren zur¨

uckzugreifen, in denen die

Schritte nebeneinander ausgef¨

uhrt werden und sich gegenseitig beeinflussen.

2.4.3 Semantik

Die Semantik ist eine grammatikalische Komponente, die sich mit der inhaltli-

chen Bedeutung von Sprachbausteinen besch¨

aftigt. Eine formale Definition ist

schwierig, da nicht eindeutig zu kl¨

aren ist, was eigentlich die Bedeutung eines

Wortes, Satzes oder Textes ist.

In den logischen Sprachen ist der Begriff Semantik eindeutig definiert. So ist die

Semantik in der Aussagenlogik gegeben durch eine Funktion, die jeder Aussage

die Werte wahr oder falsch zuordnet (Kapitel 3.2.2).

So ist die Aussage x∧ywahr, wenn xund ywahr sind, aber in allen anderen

F¨

allen falsch. Die Semantik definiert also Regeln, wie die Wahrheitswerte einer

Aussage im Hinblick auf ein zu betrachtendes Modell ermittelt werden.

”Ziel einer semantischen Theorie ist eine Analyse derjenigen Prozesse, die es

einem Rezipienten einer ¨

Außerung erm¨

oglichen, die Ideen und Gedanken hinter

diesen ¨

Außerungen zu verstehen “ [CEE+01, S. 246].

Zur Vereinfachung der semantischen Analyse werden verschiedene Semantikar-

ten nach ihren Anwendungsgebieten unterschieden. Die lexikalische Seman-

tik (Wortsemantik) besch¨

aftigt sich mit dem Bedeutungsinhalt der einzelnen

W¨

orter. Die Satzsemantik behandelt den Bedeutungsinhalt eines Satzes. Der

Bedeutungsinhalt eines ganzen Textes wird durch die Diskurssemantik be-

schrieben.

Semantische Analyse. Die semantische Analyse ist zweifellos die wichtigste,

aber auch schwierigste Analyse, die beim Textverstehen durchgef¨

uhrt werden

muss. Sie st¨

utzt sich bei der Ermittlung semantischer Informationen auf die

vorhergehenden morphologischen und syntaktischen Analysen.

Grundlage f¨

ur die Analyse des semantischen Inhalts der Sprache ist das Kom-

positionalit¨

atsprinzip von G. Frege:

60 KAPITEL 2. DISZIPLINEN

”Die Bedeutung eines komplexen Ausdrucks ist eine Funktion

der Bedeutungen seiner Teile und der Art ihrer Kombination.“

[CEE+01, S. 248]

Durch das Kompositionalit¨

atsprinzip besteht die M¨

oglichkeit, die durch die syn-

taktische Analyse entstandenen syntaktischen Einheiten (Phrasen und W¨

orter)

semantischen Komponenten zuzuordnen. Aus der Interpretation der einzelnen

Komponenten wird eine Gesamtinterpretation des semantischen Inhaltes kon-

struiert.

Menge

M

Zuordnungs−

algorithmus

syntaktische

Analyse

S

NP VP

NP = Namen

VP = Tätigkeiten

semantisches Netz

semantische Interpretation

Text

Abbildung 2.26: Grundlegendes Prinzip einer semantischen Analyse

Die formalen Semantiken, die auf logikbasierten Formalismen operieren, ver-

wenden das Kompositionalit¨

atsprinzip. Dabei wird nicht nur die Pr¨

adikatenlo-

gik verwendet, sondern auch Typenlogik, intensionale Logik, Modallogik usw.

Dadurch k¨

onnen auch Erkl¨

arungs- und Folgerungsbeziehungen (Inferenzmecha-

nismen) angewendet werden. Formale Logiken werden genutzt, um nat¨

urlich-

sprachliche Texte zu analysieren, da sie schematisierbar sind und somit einen

informationstechnischen Zugang erm¨

oglichen.

Nach Pinkal [GRS00, S. 740] muss eine semantische Analyse folgende elementa-

ren Aufgaben erf¨

ullen:

1. Semantikkonstruktion: Erstellung von semantischen Informationen auf

Grundlage syntaktischer und morphologischer Informationen;

2.4. COMPUTERLINGUISTIK 61

2. Semantische Resolution: Ermittlung von Disambiguisierungen und Kon-

textinformationen aus dem Text;

3. Semantische Auswertung: Extraktion von relevanten semantischen Infor-

mationen mit Hilfe von Deduktions- und Inferenzmechanismen;

Realisierung. Voraussetzung f¨

ur eine semantische Analyse ist ein semanti-

scher Formalismus, der informationstechnisch realisiert werden kann. Formale

Logiken erf¨

ullen diese Voraussetzung. Es stellt sich die Frage, welche Logiken

sprachliche Oberfl¨

achen semantisch beschreiben k¨

onnen. Die Pr¨

adikatenlogik

erster Stufe bietet solche M¨

oglichkeiten und wird daher h¨

aufig eingesetzt. Sie

ist auch die einfachste Form der semantischen Analyse.

Der Beschreibungsformalismus der Pr¨

adikatenlogik besteht aus Individualsym-

bolen (z. B. Eigennamen) und Pr¨

adikatensymbolen (z. B. Verben, Adjektive).

Pr¨

adikate entsprechen somit Eigenschaften von Objekten.

”Hansi rechnet“ = rechnen(Hansi)

Hansi = Individualsymbol

rechnen = Pr¨

adikat

Jedes Pr¨

adikat hat eine Stelligkeit, die die Anzahl der Argumente angibt. Zum

Beispiel ist schlafen(x) einstellig und gr¨

oßer als(x,y) zweistellig, wobei x

und yVariablen f¨

ur Individualsymbole sind. Satzbedeutungen werden mittels

pr¨

adikatenlogischer Formeln beschrieben. Aus aussagenlogischen Junktoren und

Quantoren (Kapitel 3.2.2) k¨

onnen weitere Formeln gebildet werden: z. B. schla-

fen(x) ∧schlafen(y). Konnektoren entsprechen dabei Konjunktionen (z. B.

”und“, ”oder“) und Quantoren Determinatoren (z. B. ”ein“, ”alle“).

Beispiel 2.4.5

”alle rechnen“⇒ ∀xRechnen(x)

Durch ∀x φ besitzt der Ausdruck φden Skopus (Wertebereich) des Quantors

∀xwird somit zu einer gebundenen Variable.

Eine Dom¨

ane wird in der Logik durch ein Modell repr¨

asentiert. Ein Modell der

Pr¨

adikatenlogik M= (D, F) besteht aus [CEE+01, S. 40]:

1. D: eine nicht-leere Menge (Dom¨

ane)

62 KAPITEL 2. DISZIPLINEN

2. F: eine Abbildung mit Eigenschaften:

(a) Jedem n-stelligen Pr¨

adikat wird eine n-stellige Relation zugeordnet.

(b) Jedem Individualsymbol wird ein Element aus Dzugeordnet.

”Hans rechnet.“ und ”Hansi liest ein Buch.“

D={Ha, Hi, MB}Pr¨

adikate = {Rechnen(x),Lesen(x,y)}

F(Ha) = ”Hans“ F(Rechnen) ={Hans},

F(Hi) = ”Hansi“ F(Lesen) ={Hansi, Mathebuch}

F(MB) = ”Mathebuch“

Eine semantische Interpretation [[ ]] einer Variablen voder eines Individualsym-

bols cbez¨

uglich eines Modells Mund einer Funktion gweist jeder Variablen

einen Wert aus Dzu. Die Interpretation wird formal beschrieben durch:

1. [[vi]]M

g=g(vi) f¨

ur alle Variablen vi;

2. [[ci]]M

g=F(ci) f¨

ur alle Konstanten ci;

3. Interpretationsregeln z. B. [[φ∧φ]]M

g= 1 gdw [[φ]] = 1 und [[ψ]] = 1;

4. aussagelogische Regeln und ¨

Aquivalenzregeln (Kapitel 3.2.2).

Das Problem der pr¨

adikatenlogischen Beschreibung ist offensichtlich. Der Re-

pr¨

asentationsmechanismus ist nicht ausdrucksstark genug, um die vielen Ph¨

ano-

mene der nat¨

urlichen Sprache zu beschreiben. So existiert keine eindeutige Zu-

weisung von Wahrheitswerten in der nat¨

urlichen Sprache. Die Variablen xund

ydes zweistelligen Pr¨

adikates lesen(x,y) k¨

onnen nicht zwischen Subjekt und

Objekt des Satzes unterscheiden und die Pr¨

adikatenmodifikatoren wie z B. ”sehr

schlaues Kind“ k¨

onnen nicht beschrieben werden.

Eine weitere Beschreibungsm¨

oglichkeit wird durch die Typenlogik gegeben. Die

Typenlogik besitzt einen Mechanismus, um syntaktische Strukturen bestimmten

Typen von semantischen Strukturen zuzuordnen. Solche semantischen Beschrei-

bungsm¨

oglichkeiten werden durch die Montague Semantik [Mon74] beschrie-

ben. Allerdings beschreibt sie nur den Bereich der Satzsemantik.

2.4. COMPUTERLINGUISTIK 63

In der Typenlogik werden Konstanten und Pr¨

adikaten Typen so zugeordnet,

dass sie sich intern unterscheiden. Dabei gibt es die Basistypen e(entity) und t

(truth value). Hat ein Ausdruck Aden Typ < α, β >, so bedeutet das: Animmt

Ausdr¨

ucke vom Typ αund bildet mit ihnen zusammen Ausdr¨

ucke vom Typ β.

Dies wird durch die folgenden Beispiele verdeutlicht:

1. Einstellige Pr¨

adikate wie z. B. Schlafen(x) nehmen Ausdr¨

ucke vom Typ

< e, t > an und bilden sie auf Wahrheitswerte ab:

Schlafen(x) + Peter = Schlafen(Peter)

< e, t > + e = t

2. Zweistellige Pr¨

adikate bilden Individualkonstanten auf einstellige Pr¨

adi-

kate ab.

Lieben(x,y) 7→ Lieben(Peter) →Lieben(Peter)(Maria)

< e, t > →< e, < e, t >>

Eine solche Typisierung ist nicht deterministisch, sondern zu einem Ausdruck

lassen sich unter Umst¨

anden viele verschiedene Typisierungen finden. F¨

ur jeden

Typ existiert eine Dom¨

ane Dtyp, wobei [CEE+01, S. 49]:

1. De=D

2. Dt={0,1}

3. D<α,β> ist die Menge aller Funktionen von Dαnach Dβ

Ein Modell f¨

ur die Typenlogik Mbesteht dann ebenfalls aus einer nicht-leeren

Menge Dund einer Abbildung F, die jeder Konstanten vom Typ αein Element

von Dαzuordnet.

”Hans schl¨

aft und Hansi schl¨

aft nicht.“

{Hans, Hansi }=De

F(Hans) = ”Hans“ ∈ De

F(Hansi) = ”Hansi“ ∈ De

F(Schlafen(x)) = D<e,t>

D<e,t> ={< Hans, 1>, < Hansi, 0>}

64 KAPITEL 2. DISZIPLINEN

Eine Erweiterung des Mechanismus der Typenlogik bietet der λ-Kalk¨

ul. Dies

erscheint notwendig, da z. B. aus der Aussage ”alle arbeiten“ Probleme entste-

hen. In der Typenlogik kann keine Aussage ¨

uber die Mengenbezeichnung alle

gemacht werden und somit nicht ¨

uber Mengen von Elementen in D. Dies wird

durch den λ-Operator erreicht, der eine Variable genau wie eine Quantor bin-

det, z. B. λx (Arbeiten(x)). Alle syntaktischen Kategorien (z. B. NP und VP)

m¨

ussen einem semantischen Typ zugeordnet werden. Daher existiert ein seman-

tisches Lexikon, das W¨

orter logischen Ausdr¨

ucken zuordnet. Zus¨

atzlich existie-

ren die semantischen Regeln, die zu jeder syntaktischen Regel eine semantische

Bedeutung angeben. Dadurch kann eine semantische Interpretation eines Satzes

erfolgen.

Ambiguit¨

aten k¨

onnen mit dieser Beschreibung zwar dargestellt, aber nicht auf-

gel¨

ost werden. Das Hauptproblem bleibt allerdings der variable Skopus. So ist

z. B. aus dem Satz ”Jeder Student hat ein Problem.“ nicht eindeutig zu erken-

nen, ob es sich um ein spezielles oder ein allgemeines Problem handelt. Dabei

kommt der Umstand zum tragen, dass die oben beschriebenen Mechanismen

Aufgaben der Semantik der Syntax zuordnen. Ein Verfahren, das die Skopus-

problematik behandelt, ist z. B. der Cooper-Skopus [GRS00, S. 753ff]. Dieser

betrachtet Skopuseigenschaften, die von den syntaktischen Strukturen abwei-

chen. Allerdings entsteht dabei das Problem, dass die Anzahl der m¨

oglichen

Kombinationen von Quantorverbindungen zu groß wird.

Die Analysen der vorhergehenden Methoden sind strikt satzgebunden. Aller-

dings gibt es viele Probleme, so ben¨

otigt z. B. ein Personalpronomen in einem

Satz einen Bezug auf den Kontext des vorhergehenden Satzes. Mit Satzsemanti-

ken l¨

asst sich dieses Problem nicht l¨

osen. Dazu m¨

ussen Methoden der Diskurs-

semantik verwendet werden.

Beispiel 2.4.6 (Anaphorische Beziehungen)

Eine anaphorische Beziehung ist ein referentieller Verweis auf einen vorher

ge¨

außerten sprachlichen Ausdruck.

Er ihn.hat einen Knochen. frisstDer Hund

Abbildung 2.27: Beispiel einer anaphorischen Beziehung

2.4. COMPUTERLINGUISTIK 65

Die Diskursrepr¨

asentationstheorie (DRT) [Kam81, Hei83] betrachtet daher

nicht nur einzelne S¨

atze, sie besitzt Mechanismen, die anaphorische Beziehun-

gen nachvollziehen k¨

onnen. So existieren in der Diskursrepr¨

asentationstheorie

Diskursrepr¨

asentationsstrukturen, die aus zwei Komponenten bestehen, n¨

amlich

aus Objekten, die sich auf anaphorische Pronomina beziehen (Menge von Dis-

kursreferenten), und aus einer Menge von Bedingungen, die f¨

ur die Diskursrefe-

renten die Wahrheitsbedingungen festlegen.

Beispiel 2.4.7

”Der Hund hat Fleisch. Er frisst es.“

Die Diskursreferenten sind xund y.

1. Bedingung: {x, y |(x=Hund)und (y=Knochen); (xhat y)}

2. Bedingung: {x, y |(x=er); (y=es); (xfrisst y)}

In diesem Fall ist die Auswahl der Diskursreferenten einfach, da der Hund m¨

ann-

lich ist und der Knochen s¨

achlich. Normalerweise ist die Auswahl der Diskursre-

ferenten jedoch nicht so leicht. Die syntaktische Analyse wird durch Konstrukti-

onsregeln in die Diskursrepr¨

asentationsstrukturen, Diskursreferenten und in die

Bedingungen zerlegt, so dass eine semantische Interpretation stattfinden kann.

Erweiterungen dieses Ansatzes sind z. B. die dynamische Pr¨

adikatenlogik [GS91]

und die λ-DRT [KKP96].

Die semantische Analyse der einzelnen W¨

orter erfolgt anders als die der Satzse-

mantik und der Diskurssemantik. Es gibt zahlreiche Methoden, um die Wortse-

mantik zu analysieren. Wortbedeutungen werden z. B. als strukturierte Objekte

dargestellt, die durch Regeln abgeleitet werden [CB95]. Lexikalische Einheiten

erhalten unterspezifizierte semantische Repr¨

asentationen, die allen Lesarten ge-

mein sind und zus¨

atzlich Regeln, die auf pragmatische Anteile Bezug nehmen.

Pragmatik. Die informationstechnische Realisierung der Semantik orientiert

sich an der wahrheitskonditionalen Semantik. Durch die Angabe von Wahr-

heitsbedingungen wird der Informationsgehalt extrahiert. Alle anderen bedeu-

tungsrelevanten Betrachtungen werden nicht untersucht, wie z. B. sprachliches

Handeln. Dies wird durch Mittel der Pragmatik untersucht. Untersuchungsge-

genst¨

ande sind Deixis, Pr¨

asuppositionen usw. [CEE+01, S. 306].

66 KAPITEL 2. DISZIPLINEN

Pr¨

asuppositionen sind Wissensvoraussetzungen, die ein menschlicher Leser

w¨

ahrend des Lesens annimmt. ”Es gibt in jeder Sprache W¨

orter, die weniger

einen semantischen Gehalt als vielmehr eine Zeigefunktion haben, die so ge-

nannten Deiktika. Hierzu geh¨

oren die W¨

orter wie hier und dort, jetzt und dann.

Es sind W¨

orter, die nicht z. B. einen absoluten Ort oder Zeitpunkt angeben, son-

dern einen solchen bezogen auf Sprecher/Schreiber oder H¨

orer/Leser.“ [Dud98,

848]

Diese Betrachtungsweisen treten im allgemeinen in der Mathematik nicht auf

und werden daher im n¨

achsten Schritt nicht weiter behandelt.

2.4.4 Fachsprache

Fachsprache ist ein weitgefasster Begriff und beschreibt einen speziellen Sprach-

stil. ”Zun¨

achst ist fraglich, ob bei dem Gegenstand, den man mit Fachsprache

meint, die Fachlichkeit wirklich das prim¨

are ist, oder nicht vielmehr textsorten-

spezifische, semantische, pragmatische oder sonstige Argumente. Zum zweiten,

nehmen wir einmal an, man wollte an der Fachlichkeit grunds¨

atzlich festhalten,

ist die Frage unklar, was eigentlich F¨

acher konstituiert, ob z. B. Naturwissen-

schaft ein Fach ist, oder Chemie, oder nur die organische Chemie oder gar nur

die Chemie der Aminos¨

auren. “ [vH83, S. 63]

”Fachsprachen sind erstaunlich vielseitig. Sie unterscheiden sich nicht nur nach

Fachbereichen oder im Hinblick darauf, ob sie gesprochen oder geschrieben wer-

den. Man muss auch die innere Differenzierung ber¨

ucksichtigen, den jeweili-

gen Grad der Fachsprachlichkeit, die verschiedenen Textsorten innerhalb einer

Fachsprache, die kulturellen Unterschiede und Konventionen fachlicher Kom-

munikation.“ [GHL02, S. 613] So wird in Lehrb¨

uchern eine andere Form der

Fachsprache geschrieben als in wissenschaftlichen Aufs¨

atzen.

Trotzdem enth¨

alt z. B. die schriftliche Textform h¨

aufig charakteristische Merk-

male. So werden S¨

atze gerne ”durch Zahlen oder Formeln, Abbildungen, Sche-

mata und Tabellen unterbrochen“ [GHL02, S. 618], oder es werden Spiegelstri-

che bzw. Klammern verwendet. Typographische Mittel sind z. B. die Hervor-

hebung von W¨

ortern durch Fett- oder Kursivdruck. Im sprachlichen Bereich

werden viele Verweise untereinander gemacht, so dass der Text koh¨

arent wirkt.

Dazu werden h¨

aufig Artikelw¨

orter (z. B. ”dieses“), Pronominaladverbien (z. B.

2.4. COMPUTERLINGUISTIK 67

”darauf“), feststehende Phrasen (z. B. ”im Folgenden“), logische Verkn¨

upfungen

durch nebenordnende Konjunktionen (z. B. ”ferner“), Quantifizierungen durch

Gradpartikel (z. B. ”wenige “), h¨

aufige Wiederholungen von Fachbegriffen usw.

verwendet [GHL02].

Jede Fachsprache besitzt einen f¨

ur sie typischen Wortschatz, der ein Schl¨

ussel zur

Kommunikation in der Fachsprache ist. Wie jedoch oben schon erw¨

ahnt wurde,

ist es schwierig Fachsprachen einzugrenzen. So gibt es in der Mathematik sehr

unterschiedliche Fachsprachen mit unterschiedlichen Wortsch¨

atzen. Allerdings

werden die Fachw¨

orter in eindeutiger Weise definiert, so dass die Kommuni-

kation wesentlich einfacher wird als in anderen Fachsprachen anderer Gebiete.

Vorsicht ist jedoch dabei geboten, die Fachw¨

orter auf die pr¨

azisen Ausf¨

uhrungen

in der Fachsprache zu ¨

ubertragen. So ist die Verwendung von Gradpartikeln ein

eindeutiges Zeichen f¨

ur die Verwendung von nicht eindeutigen Beschreibungen.

Des Weiteren darf aus dem Stamm von Fachw¨

ortern nicht auf ihre tats¨

achli-

che Bedeutung geschlossen werden. So gibt es z. B. Begriffe, die zun¨

achst den

Anschein erwecken, zu einer bestimmten Familie von Begriffen zu geh¨

oren. Im

weiteren Verlauf kann sich aber herausstellen, dass dem nicht so ist.

In der Syntax gibt es bei den Fachsprachen einige charakteristische Besonderhei-

ten. Die Satzstrukturen sind ”einfacher, k¨

urzer, klar ¨

uberschaubar gegliedert“,

aber es werden ”die Satzglieder immer l¨

anger, weil die Nomina mit Attributen

oder Komposita angereichert “ [GHL02, S. 622] werden. Generell k¨

onnen fol-

gende syntaktische Strukturen gefunden werden (Auswahl aus [GHL02, s. 622]):

•Verwendung von Nomina und nominalen Ausdr¨

ucken;

•Verwendung von Satzgliedern anstelle von Nebens¨

atzen;

•Verwendung von erweiterten Attribute anstelle von Attributs¨

atzen;

•Verwendung von substantivierten Verben;

•Verwendung von Pr¨

apositionalgef¨

ugen statt Vollverben;

•Verwendung von bestimmten Verben: ist,scheint,zeigt sich;

•Verwendung von Infinitiv- und Passivkonstruktionen: ”l¨

asst sich zeigen“;

•Verwendung von Depersonalisierungen: ”man definiert“;

68 KAPITEL 2. DISZIPLINEN

•Verwendung von Konditionals¨

atzen: ”wenn ..., dann“;

•Verwendung von Finals¨

atzen;

2.5. INFORMATION RETRIEVAL 69

2.5 Information Retrieval

Mache die Dinge so einfach wie m¨

oglich — aber nicht einfacher.

(Albert Einstein)

Nach Rijsbergen [vR79, S. 3] besteht folgendes Problem: ”Suppose there is a sto-

re of documents and a person (user of the store) formulates a question (request

or query) to which the answer is a set of documents satisfying the informa-

tion need expressed by his question. He can obtain the set by reading all the

documents in the store, retaining the relevant documents and discarding all the

others. In a sense, this constitutes ’perfect’ retrieval. This solution is obviously

impracticable. A user either does not have the time or does not wish to spend

the time reading the entire document collection, apart from the fact that it may

be physically impossible for him to do so.“

Information Retrieval besch¨

aftigt sich mit Verfahren zur Darstellung, Speiche-

rung und Organisation von sowie dem Zugriff auf Informationen. Es werden ”In-

formationssysteme in Bezug auf ihre Rolle des Wissenstransfers vom mensch-

lichen Wissensproduzenten zum Informations-Nachfragenden betrachtet.“ [fI04]

Information Retrieval Systeme dienen dem einfachen Zugang zu Informationen

f¨

ur Nutzer eines Systems [BYRN99, S. 1]. Daten sind haupts¨

achlich nat¨

urlich-

sprachliche Texte, die informationstechnisch unstrukturiert und ambig sind (Ka-

pitel 2.4).

Textdokumente werden z. B. in Datenbanken gespeichert und organisiert. In

einem Information Retrieval System werden diese Informationen in eine interne

Repr¨

asentation ¨

uberf¨

uhrt, die das System effizient verarbeiten kann. Dabei wird

ein Index erzeugt (Indextermgenerierung), der das Dokument durch Indexterme

darstellt. Dieser Prozess verh¨

alt sich ¨

ahnlich wie die Unix-Befehle ubdatedb und

locate.updatedb verwendet Methoden, um Informationen ¨

uber das Filesystem

in eine einfach zu durchsuchende Repr¨

asentation (z. B. Liste) abzubilden. Mittels

des Befehls locate k¨

onnen diese Informationen schnell abgerufen werden.

Anfragen des Nutzers (queries) an das System werden ebenfalls in eine interne

Repr¨

asentation ¨

uberf¨

uhrt, um sie dem System zug¨

anglich zu machen. Der Pro-

zess der Suche verbindet nun den Index mit der Abfrage und generiert mittels

geeigneter Methoden Dokumente, die der Abfrage entsprechen. Ein nachfolgen-

70 KAPITEL 2. DISZIPLINEN

Benutzer

Schnittstelle

Anfragenbearbeitung

Suche

Indexing DBMS

Index

Antworten

Text

bewertete Suchergebnisse

Feedback

Anfragen

DB: Texte

Text

Textbearbeitung

interne Repräsentation

gefundene Dokumente

Ranking

Abbildung 2.28: Architektur eines Information Retrieval Systems nach

[BYRN99]

des Rankingsystem sortiert dann die gefundenen Dokumente nach ihrer Rele-

vanz f¨

ur die Benutzeranfrage und liefert sie als bewertete Suchergebnisse an den

Nutzer zur¨

uck.

Es existieren zahlreiche Methoden, um m¨

oglichst effizient Antworten auf Anfra-

gen der Nutzer eines Information Retrieval Systems zu generieren. Klassische

Methoden wie das Boolesche Information Retrieval verwenden die Boolesche

Algebra. Es ist ein sehr einfacher Mechanismus, der Dokumente nur in relevant

oder nicht-relevant unterteilt. Eine weitere klassische Methode ist das Vektor-

raum Information Retrieval. Dieses weist den Indextermen in Anfragen und

Dokumenten ein nicht-bin¨

ares Gewicht zu. Diese Gewichte werden genutzt, um

den ¨

Ahnlichkeitsgrad (Degree of Similarity) zu berechnen, nach denen die In-

formationen sortiert werden. Das probabilistische Information Retrieval sucht

mittels wahrscheinlichkeitstheoretischer Methoden nach idealen Antworten.

Neben den klassischen Methoden existieren einige abgeleitete alternative Mo-

delle wie z. B. das Fuzzy Information Retrieval [OMK91] als Alternative zum

Booleschen Modell, das verallgemeinerte Vektormodell [WZW85], das Latent

Semantic Indexing Modell [DDF+90] und das Neuronale Netzwerkmodell als Al-

2.5. INFORMATION RETRIEVAL 71

ternativen zum Vektorraummodell sowie Inferenznetzwerkmodelle [Pea88] und

Bayesian Belief Modelle [BYRN99] als Alternativen zum probabilistischen Mo-

dell.

Die strukturierten Text Retrieval Modelle erm¨

oglichen dem Nutzer, komplexere

Anfragen an das Information Retrieval System zu stellen, im Gegensatz zu den

klassischen Methoden und ihren Erweiterungen, die nur Zeichenketten in ihren

Anfragen zulassen. Neben den Zeichenketten k¨

onnen zus¨

atzlich bei dieser Me-

thode strukturelle Umgebungsinformationen wie Positionen, Labeleigenschaften

usw. ¨

ubergeben werden, die dann von weiteren Analyseschritten genutzt werden

k¨

onnen. Die Non-Overlapping List Methode [Bur92] zerlegt einen Text auf ver-

schiedene Weisen in nicht-¨

uberlappende Regionen und legt diese in einer oder

mehreren Listen ab. Die Proximal Nodes Methode [NBY97] legt Textstrukturen

in einer hierarchischen Struktur und einem einfachen Wortindex ab.

Durch die Methode des Browsing besteht die M¨

oglichkeit, durch Kommunika-

tion zwischen Nutzer und System Suchanfragen zu ver¨

andern und anzupassen.

Hierbei wird davon ausgegangen, dass die Ziele des Nutzers nicht von Anfang

an bestimmbar sind. Browsing existiert in den drei Varianten flat,structure

guided und Hypertext. Beim flat browsing wird dem Benutzer das Suchergebnis

unstrukturiert angezeigt, z. B. als Dokumentenliste. Anhand dieses ¨

Uberblicks

kann der Benutzer dann seine urspr¨

ungliche Suchanfrage modifizieren, indem

z. B. die Suchkriterien eingeschr¨

ankt oder erweitert werden. Dieser Prozess wird

auch als relevance feedback bezeichnet. Um das Browsing zu erleichtern, wird

beim structure guided browsing anstelle einer flachen ¨

Ubersicht ¨

uber die Doku-

mente eine hierarchische Struktur gew¨

ahlt. Das Hypertext Modell erg¨

anzt die

existierenden Dokumentenstrukturen durch eine zus¨

atzliche, dokumenten¨

uber-

greifende Navigationsebene.

Eine formale Charakterisierung f¨

ur ein Information Retrieval Modell wird gege-

ben durch ([BYRN99], S. 23):

Definition 2.5.1 (Information Retrieval Modell)

Ein Information Retrieval Modell ist ein Quadrupel (D, Q, F, R(qi, dj)) mit:

1. Dist eine Menge von Repr¨

asentationen der zu betrachtenden Dokumente.

2. Qist eine Menge von Repr¨

asentationen von Benutzeranfragen. Solche Re-

pr¨

asentationen werden auch als Queries bezeichnet.

72 KAPITEL 2. DISZIPLINEN

U

e

r

T

a

s

k

sRetrieval:

Adhoc

Filtering

Browsing

Classic Models

boolean

vector

probabilistic

Set Theoretic

Fuzzy

Extended Boolean

Algebraic

Generalized Vector

Lat. Semantic Index

Neural Networks

Probabilistic

Inference Network

Belief Network

Non−Overlapping Lists

Proximal Nodes

Browsing

Flat

Structure Guided

Hypertext

Structured Models

Abbildung 2.29: Taxonomie von Information Retrieval Modellen [BYRN99]

3. Fist ein System zur Modellierung von Dokumentenrepr¨

asentationen, Que-

ries und ihren Abh¨

angigkeiten.

4. R(qi, dj)ist eine Ranking Funktion (Bewertungsfunktion), die von

Q×Dnach Rabbildet. Diese Bewertung definiert eine Ordnung der Do-

kumente dj∈Din Bezug auf einen Query qi∈Q.

Jedes Dokument wird durch eine Menge von Schl¨

usselw¨

ortern (index terms)

beschrieben, die durch ihre Semantik das Dokument charakterisieren (Defini-

tion 2.5.2). Dabei ist es m¨

oglich, jeden Indexterm in Bezug auf verschiedene

Dokumente unterschiedlich zu gewichten (Definition 2.5.3).

Definition 2.5.2 (Indexterm)

”An index term (keyword) is a pre-selected term which can be used to refer to

the content of a document. Usually, index terms are nouns or noun groups. In

the Web, however, some search engines use all the words in a document as index

terms.“ [BYRN99, S. 444]

Definition 2.5.3 (Gewichtung)

Sei K={k1,...,kt}die Menge aller Indexterme und Ddie Menge aller Doku-

mente. Dann heißt der Vektor ~wj= (w1,j ,··· , wt,j )∈RtIndextermvektor

2.5. INFORMATION RETRIEVAL 73

des Dokumentes dj∈Dmit den Gewichtungen

wi,j =(>0falls kiin djvorkommt

0sonst

Weiterhin definieren wir eine Funktion gi:Rt→Rmit gi(~wj) = wi,j (nach

[BYRN99, S. 25]).

¨

Ublicherweise wird vereinfachend davon ausgegangen, dass die Gewichtungen

wi,j paarweise unkorreliert sind.

2.5.1 Methoden des Information Retrieval

Boolesches Information Retrieval. Beim booleschen Information Retrie-

val besteht eine Anfrage aus der Verkn¨

upfung von atomaren Anfragen. Eine ato-

mare Anfrage pr¨

uft dabei, ob ein Indexterm in einem Dokument vorkommt. Mit

Hilfe der Booleschen Operatoren — AND,OR und NOT — k¨

onnen dabei aus ein-

fachen Anfragen komplexe Ausdr¨

ucke zusammengesetzt werden (Kapitel 3.2.2).

Definition 2.5.4 (Boolesches Information Retrieval Modell)

F¨

ur das boolesche Modell sind die Gewichte der Indexterme bin¨

ar, wi,j ∈ {0,1}.

Eine Anfrage qist ein boolescher Ausdruck. Sei ~qdnf die disjunkte Normalform

[Spi04, S. 51] von q. Des Weiteren, sei ~qcc eine beliebige konjunktive Komponente

von ~qdnf . Die ¨

Ahnlichkeit eines Dokumentes djzu der Abfrage qist definiert

als:

sim(dj, q) = (1falls ∃~qcc |(~qcc ∈~qdnf )∧(∀ki, gi(~wj) = gi(~qcc))

0sonst

F¨

ur sim(dj, q) = 1 sagt das Boolesche Modell aus, dass das Dokumente dj

relevant zu der Abfrage qist. Sonst ist das Dokument nicht relevant. (nach

[BYRN99, S. 26])

Das bedeutet jedoch, dass ein Dokument nur dann als relevant erkannt wird,

wenn die Anfrage vollst¨

andig erf¨

ullt ist. Eine teilweise ¨

Ubereinstimmung (partial

matching) ist daher nicht m¨

oglich. Ein solches System l¨

asst sich von unge¨

ubten

Nutzern nur schwer bedienen. Daher werden meistens zwei verschiedene Inter-

faces f¨

ur einfache bzw. erweiterte Suche angeboten.

74 KAPITEL 2. DISZIPLINEN

Fuzzy Information Retrieval. Das Fuzzy Information Retrieval basiert

auf der Theorie der Fuzzy-Mengen, verwendet aber trotzdem noch Methoden

des Booleschen Information Retrieval. Die Grundidee dieses Konzeptes ist es,

Mengenzuordnungen nicht mehr eindeutig Objekten zuzuordnen, sondern einer

Merkmalsklasse. Somit werden einem Dokument keine eindeutigen Indexterme,

sondern korrelierte Terme zugeordnet. Damit k¨

onnen auch Begriffe gefunden

werden, die eng mit dem zu suchenden Begriff im Dokument in Beziehung ste-

hen.

Bei der Indexierung wird eine Korrelationsmatrix zwischen den Indextermen

konstruiert. Das Retrieval besteht darin, die Dokumente mit dem h¨

ochsten Grad

an Zugeh¨

origkeit zu den in der Anfrage vorkommenden Termen oder ihren kor-

relierten Termen zu ermitteln [BYRN99, S. 35ff].

Erweitertes Boolesches Information Retrieval. Das Erweiterte Boole-

sche Information Retrieval erg¨

anzt die klassische boolesche Methode durch die

Einbeziehung von teilweise erf¨

ullten booleschen Ausdr¨

ucken. Dadurch wird das

”Alles-oder-Nichts“-Problem der klassischen Methode vermieden. Die Bewer-

tung erfolgt mit Hilfe von lp-Normen, wobei pdurch den Benutzer bei der An-

frage einstellbar ist. [BYRN99, S. 38ff]

Vektorraum Information Retrieval Das Vektorraum Information Retrie-

val ist ein Modell, das partial matching zul¨

asst. Alle Indexterme erhalten reelle

Gewichtsfaktoren f¨

ur alle Dokumente und die Anfrage. Diese Gewichte werden

genutzt, um die ¨

Ahnlichkeit zwischen einem Dokument und der Anfrage zu be-

rechnen.

Definition 2.5.5 (Vektorraum Information Retrieval Modell)

F¨

ur ein Vektorraum Information Retrieval Modell wird jedem Paar (ki, dj)mit

ki∈K,dj∈Dein Gewichtsfaktor wi,j ≥0zugeordnet. Jedem Indexterm ki

wird in der Anfrage qebenfalls ein Gewicht wi,q ≥0zugeordnet. Dann ist der

Anfragevektor ~q definiert als ~q = (w1,q ,...,wt,q)und der Dokumentenvektor

von dj definiert durch ~wj= (w1,t,...,wj,t). (nach [BYRN99, S. 27])

Aus ~q und ~wjkann nun der Grad der ¨

Ahnlichkeit sim(dj, q) zwischen der An-

frage qund dem Dokument djberechnet werden. Eine m¨

ogliches Maß daf¨

ur ist

2.5. INFORMATION RETRIEVAL 75

das Kosinusmaß:

sim(dj, q) = < ~wj, ~q >

|~wj| | ~q |

Es existieren zahlreiche Verfahren f¨

ur die Bestimmung der Indextermgewichte

wi,j . Die bekanntesten verwenden dabei so genannte tf-idf-schemes, die sich an

der H¨

aufigkeit der Indexterme orientieren:

wi,j =freqi,j

maxlfreql,j

log N

ni

wi,q =0.5 + 0.5 freqi,q

maxlfreql,q log N

ni

Dabei ist Ndie Anzahl der Dokumente, nidie Anzahl der Dokumente, in de-

nen der Indexterm kivorkommt, und freqi,j bzw. freqi,q ist die H¨

aufigkeit des

Indexterms kiim Dokument djbzw. in Query q.

Das Vektorraum Information Retrieval Modell ist ein sehr leistungsf¨

ahiges Ver-

fahren, das sich in der Praxis als nur schwer zu schlagen erwiesen hat. Dies und

seine Einfachheit sowie die hohe Geschwindigkeit haben es zu einem der am

meisten verwendeten Verfahren gemacht [BYRN99, S. 27].

Verallgemeinertes Vektorraum Information Retrieval Modell. Das

Verallgemeinerte Vektorraum Information Retrieval Modell ist eine Erweiterung

des klassischen Vektorraum Modells, bei dem zus¨

atzlich die Korrelation zwischen

den Indextermen ber¨

ucksichtigt wird. Dabei ist nicht klar, ob die Verwendung

dieser Korrelation zu einer Verbesserung des Ergebnisses f¨

uhrt [BYRN99, S. 41].

Probabilistisches Information Retrieval. Das probabilistische Informati-

on Retrieval verwendet wahrscheinlichkeitstheoretische Methoden zur Bestim-

mung der Wahrscheinlichkeit, dass ein Dokument als relevant eingestuft wird.

Definition 2.5.6 (Probabilistische Information Retrieval Modell)

F¨

ur das probabilistische Modell sind die Gewichtungen der Indexterme bin¨

ar,

d. h. wi,j ∈ {0,1},wi,q ∈ {0,1}. Eine Abfrage qist eine Untermenge von Index-

termen. Sei Rqdie Menge der f¨

ur qrelevanten Dokumente. Sei ¯

Rqdas Kom-

plement von Rq(Menge der nichtrelevanten Dokumente). Sei P(Rq|~wj)die

76 KAPITEL 2. DISZIPLINEN

Wahrscheinlichkeit, dass das Dokument djrelevant f¨

ur die Abfrage qist und

P(¯

Rq|~wj)die Wahrscheinlichkeit, dass das Dokument djnicht relevant f¨

ur q

ist. Die ¨

Ahnlichkeit sim(dj, q)des Dokumentes djzu der Abfrage qist definiert

durch:

sim(dj, q) = P(Rq|~wj)

P(¯

Rq|~wj).

(nach [BYRN99, S. 32])

Kapitel 3

Mathematische Strukturen

E: Zu welchen Menschen geh¨

oren die Lernenden, zu den Klugen oder

zu den Dummen?

K: Zu den Klugen.

E: Aber solange ihr noch lerntet, habt ihr noch nicht gewusst, was

ihr lerntet; wart ihr also klug, als ihr das noch nicht wusstet?

K: Nein.

E: Also wart ihr dumm, als ihr lerntet.

K: Ich muss es zugeben.

E: Wer von euch lernte, was der Lehrer euch sagte, die Klugen oder

die Dummen?

K: Die Klugen.

E: Also lernen doch die Klugen und nicht die Dummen [...].

(Platon; Euthydemos)

3.1 Einleitung

Einen ¨

Uberblick ¨

uber die Mathematik in Teilbereichen oder sogar als Ganzes

zu erlangen, ist ein schwieriges Problem. Die Mathematik ist eine sehr kom-

plexe Wissenschaft, in der verschiedene Spezielgebiete nebeneinander existie-

ren. In einigen Teilbereichen wird hingegen versucht, ¨

uber Abstraktionen von

bekannten Spezialgebieten, neue Theorien zu entwickeln. Ein Beispiel f¨

ur eine

solche Abstraktion ist der Zusammenschluss der Analysis und der Geometrie

77

78 KAPITEL 3. MATHEMATISCHE STRUKTUREN

zur Differentialgeometrie. Bei solch einem komplexen Gebiet sind selbst hervor-

ragende Mathematiker heute stets nur Spezialisten auf einem und einigen we-

nigen Teilbereichen und besitzen nur einen oberfl¨

achlichen ¨

Uberblick ¨

uber die

Mathematik als Ganzes. Auch innerhalb einer Fachdisziplin gibt es zahlreiche

Zusammenh¨

ange und Verkn¨

upfungen, die nur schwer zu ¨

uberblicken sind.

Es w¨

are vorteilhaft, wenn eine systematische Darstellungsform der Mathematik

gefunden werden k¨

onnte, die mathematisches Wissen zumindest teilweise kom-

pakt darstellt. Es handelt sich dabei um eine Taxonomie der Mathematik, d. h.

die Einordnung von mathematischen Begriffen in ein semantisches Netzwerk

(Kapitel 2.2). Dabei ist es unwahrscheinlich, dass eine vollst¨

andige Darstellung

der gesamten Mathematik realisiert werden kann. Daher m¨

ussen Teilausschnitte

der Mathematik so konstruiert werden, dass sie dann in geeigneter Weise zu-

sammenf¨

ugbar sind. Probleme, die bei Wissensdarstellungen auftreten, wurden

im Kapitel des Wissensmanagements (Kapitel 2.2) diskutiert.

Die Mathematik als Untersuchungsobjekt bietet zahlreiche Vorteile. Durch ihre

knappe und exakte Ausdrucksweise bietet sie sich an, Wissen maschinell zu ex-

trahieren. Diese Ausdrucksweise bezeichnet man als axiomatische Darstellung

oder Beschreibung. In der axiomatischen Darstellung werden aus Grundaus-

sagen, den Axiomen, weitere Aussagen entwickelt. Die Axiome bleiben dabei

unbewiesen und werden als wahr angenommen. Durch diesen Ansatz wird ein

formales Grundger¨

ust bereitgestellt, das eine mathematische Theorie in struk-

turierte Spracheinheiten zerlegt und das mathematische Wissen partitioniert.

Zum Beispiel sind die Definitionen solche Spracheinheiten. Sie determinieren

den terminologischen Rahmen der mathematischen Betrachtungen und verein-

fachen somit Strukturen. Weitere Spracheinheiten bilden die S¨

atze. Sie enthalten

wahre Aussagen ¨

uber mathematische Sachverhalte, die durch spezielle logische

Regeln erzeugt werden. Beweise begr¨

unden neue S¨

atze auf Grundlage der schon

vorhandenen S¨

atze und Axiome mithilfe von logischen Schlussregeln.

Der entscheidende Vorteil entsteht durch die grammatikalischen Konstruktio-

nen der mathematischen Sprache. Die S¨

atze werden meistens nach bestimmten

Mustern gebildet, so dass eine endliche Anzahl von Phrasen existiert, die im-

mer wieder verwendet werden. Die mathematische Sprache ist außerdem eine

reduzierte Sprache, die sehr viel weniger Ausdrucksm¨

oglichkeiten zul¨

asst als die

Alltagssprache.

3.1. EINLEITUNG 79

Auch ein menschlicher Leser muss die mathematische Sprache wie eine Fremd-

sprache erlernen. Sie hat mit den alltagssprachlichen Texten kaum Gemeinsam-

keiten. Allerdings findet in den letzten Jahrzehnten eine Mathematisierung der

Alltagssprache statt, die teilweise bedingt wird durch Verwendung von techni-

schen Begriffen, die aus der Informationstechnik stammen.

Die mathematische Sprache bildet den Schl¨

ussel zum Verst¨

andnis der Mathema-

tik. Wer die Semantik dieser Sprache nicht versteht, kann weder die Konzepte

verstehen noch mit Mathematikern kommunizieren. Dabei geht es nicht nur um

das Verst¨

andnis der einzelnen Formeln und Symbole, sondern auch um einfach

konstruierte nat¨

urlichsprachliche Texte.

In diesem Kapitel werden insbesondere zwei Aspekte unterschieden: Es sollen

auf der einen Seite die Sprachstrukturen (Kapitel 3.3) und auf der anderen Sei-

te die Wissensstrukturen (Kapitel 3.4) in der Mathematik betrachtet werden.

Damit verbunden sind die Fragen, wie sich die mathematische Sprache analy-

sieren l¨

asst und wie mathematisches Wissen sinnvoll dargestellt werden kann.

Um diese Fragen beantworten zu k¨

onnen, m¨

ussen die grundlegendsten Konzep-

te der Mathematik — mathematische Logik (Kapitel 3.2.2) und axiomatische

Mengenlehre (Kapitel 3.2.3) — zuallererst betrachtet werden.

80 KAPITEL 3. MATHEMATISCHE STRUKTUREN

3.2 Grundlagen

Man muss viel studiert haben, um wenig zu wissen.

(Montesquieu, franz. Schriftsteller, 1689–1755)

3.2.1 Einleitung

Die Mathematik ist in ihren Formulierungen strenger und genauer als andere

Fachsprachen (Kapitel 2.4.4). Grundlage der Strenge und Genauigkeit sind die

logische Betrachtungsweise und der axiomatische Aufbau der Mathematik.

Die ersten axiomatischen Beschreibungen der Mathematik entstanden schon in

der Antike. So beschrieb Euklid (350–275 v. Chr.) in dem Buch ”Die Elemente“

den axiomatischen Aufbau der Geometrie. Seit Ende des 19. Jahrhunderts gab es

zahlreiche Versuche, eine axiomatische Betrachtungsweise auf die ganze Mathe-

matik zu ¨

ubertragen (moderne Mathematik). Durch logische Paradoxien wurde

allerdings das Bild der Mathematik als ¨

uber alle Zweifel erhabene Wissenschaft

massiv gest¨

ort (Grundlagenkrise der Mathematik).

Schon durch Immanuel Kant (1724–1804) wurden die ersten Grundlagen f¨

ur

die Sichtweise der modernen Mathematik festgelegt. So unterschied er zwischen

analytischen und synthetischen Aussagen:

•analytisch wahre Aussage: Das Pr¨

adikat enth¨

alt nur, was im Subjekt be-

reits enthalten ist. Analytische Aussagen vermitteln demnach kein neues

Wissen. Die Aussage Alle Junggesellen sind unverheiratet ist wahr, weil

der Begriff Junggeselle unverheirateter Mann bedeutet.

•synthetische Aussage: Hier enth¨

alt das Pr¨

adikat immer etwas neues, im

Subjekt noch nicht enthaltenes. Damit vermitteln synthetische Aussagen

neues Wissen.

Synthetische Aussagen lassen sich nochmals unterteilen in Aussagen a prio-

ri und Aussagen a posteriori. Die synthetischen Aussagen a priori enthalten

dabei allgemeing¨

ultige Wahrheiten. Dazu geh¨

oren auch mathematische S¨

atze,

die nicht empirisch, sondern durch korrektes Schlussfolgern abgeleitet werden.

Allerdings ber¨

ucksichtigte Kant trotz seiner strikten Ausf¨

uhrungen nicht den

3.2. GRUNDLAGEN 81

informellen Charakter der menschlichen Sprache. So interpretieren Menschen

Sprache normalerweise mithilfe ihres inneren Weltbildes. Da dieses sich von

Mensch zu Mensch unterscheiden kann, ist eine solche Interpretation f¨

ur exakte

wissenschaftliche Aussagen ungeeignet. So beschreibt z. B. der unten stehende

Satz des deutschen Logikers Kurt Grelling den Fall von semantischen Wider-

spr¨

uchen.

”Einige Adjektive wie etwa kurz und deutsch treffen auf sich selbst

zu, andere etwa lang und englisch, nicht. Wir nennen jene der ers-

ten Gruppe autologisch und jene der zweiten Gruppe heterologisch.

Ist das Adjektiv heterologisch selbst heterologisch? Falls ja, trifft es

nach dieser Definition nicht auf sich selbst zu und muss heterologisch

sein.“ ([Bar94, S. 170])

Diese Erkenntnis f¨

uhrte zur Entwicklung einer exakten mathematischen Sprache

auf Basis der Logik und somit zur Trennung von Syntax und Semantik.

Einer der bekanntesten Wegbereiter ist David Hilbert (1884–1943), der den For-

malismus der Mathematik als ein strategisches Spiel mit Zeichenreihen sah, des-

sen Spielmaterial die Axiome und dessen Spielregeln die Schlussregeln waren.

Die gesamte Mathematik sollte auf Axiomen und mathematischen Grundaus-

sagen aufgebaut werden, ein Kalk¨

ul formalisiert die Logik und erlaubt es jede

korrekte mathematische Aussage herzuleiten (Syntax) und Aussagen auf ihren

Wahrheitsgehalt zu ¨

uberpr¨

ufen (Semantik). Das Kalk¨

ul sollte konsistent sein

und nur wahre Aussagen ableitbar machen. Und aus ihm sollten alle wahren

Aussagen herleitbar sein (Vollst¨

andigkeit). Dieser Plan wird als Hilbert Pro-

gramm bezeichnet.

Die Grundobjekte der mathematischen Sprache bilden die Mengen, die durch

Georg Cantor (1845–1916) eingef¨

uhrt wurden. Ein formales System ist u. a.

durch Russell und Whitehead [WR84] gegeben (Typentheorie). Des Weiteren

gibt es das Zermelo-Fraenkelsche Axiomensystem, aus dem die axiomatischen

Ableitungen aller Lehrs¨

atze der klassischen Analysis hergeleitet werden k¨

onnen.

Die Grundlage aller Beschreibungen der Mathematik liefert die mathematische

Logik. Dies ist die Pr¨

adikatenlogik 1. Stufe mit Identit¨

at (Kapitel 3.2.2). Ih-

re Basis ist die Aussagenlogik. Die Aussagenlogik beschreibt die Beziehungen,

82 KAPITEL 3. MATHEMATISCHE STRUKTUREN

die zwischen den Aussagen stehen. Die Pr¨

adikatenlogik beschreibt zus¨

atzlich

die innere Struktur der Aussagen mittels Quantoren. Wissenschaftlich gesehen

ist die mathematische Logik eine Sprache (Kapitel 2.4), die durch eine Syntax

und Semantik charakterisiert wird. Dar¨

uberhinaus spielt f¨

ur die Technik der

Beweisf¨

uhrung und f¨

ur die Konsistenz einer mathematischen Logik die Frage

der Entscheidbarkeit eine bedeutende Rolle (G¨

odel [G¨

o31]).

3.2.2 Mathematische Logiken

Die mathematische Sprache ist eine formalisierte k¨

unstliche Sprache (Kapitel

3.3) auf Basis der nat¨

urlichen Sprache und der mathematischen bzw. forma-

len Logik. In den S¨

atzen der mathematischen Sprache sind Aussagen enthalten:

”Aussagen sind sprachliche Objekte zur Mitteilung von Sachverhal-

ten.“ [Rau79, S. 6]

S¨

atze, die Aussagen enthalten, werden in der nat¨

urlichsprachlichen Gramma-

tik als Aussagens¨

atze bzw. Deklarativs¨

atze bezeichnet. Sie unterscheiden

sich von anderen Satzarten wie z. B. Interrogativ-, Desiderativ- oder Exklama-

tivsatz (Kapitel 3.3). So steht beispielsweise im Deklarativsatz das finite Verb

im Indikativ oder im Konjunktiv II, aber nie im Imperativ.

Mathematische Aussagen sind gegen¨

uber der nat¨

urlichen Sprache strukturierter

und setzen sich aus kurzen, pr¨

agnanten Satzkonstruktionen zusammen. Dabei

bestehen sie aus Grundelementen (atomaren Bausteinen):

”Atomar heißen Aussagen, deren innere Struktur nicht pr¨

azisiert

wird. In der Umgangssprache entsprechen solche Aussagen am ehe-

sten einfachen Aussagens¨

atzen ohne Nebens¨

atze.“ [Spi04, S. 5]

Einer atomaren Aussage wird eine (Aussage-) Variable, z. B. a,b,c,..., zugeord-

net. Nach Seiler ([Sei00, I.1.i]) werden mathematische Aussagen folgendermaßen

definiert:

Definition 3.2.1

Eine (mathematische) Aussage ist ein Satz, dem man nach einem abgespro-

chenen Verfahren genau einen der Wahrheitswerte (bzw. logische Werte einer

Aussage) ”w“ (wahr) oder ”f“ (falsch) zuordnen kann.

3.2. GRUNDLAGEN 83

Die Definition 3.2.1 beinhaltet ein Axiom, das Zweiwertigkeitsprinzip. Es be-

sagt, dass eine Aussage entweder wahr oder falsch sein muss, aber sie kann

nicht zugleich wahr und falsch sein. Die Wahrheitswerte k¨

onnen formal als eine

spezielle zweielementige Menge B:= {0,1}(boolesche Menge) dargestellt wer-

den. Dabei steht der Wert 0 f¨

ur eine falsche Aussage und der Wert 1 f¨

ur eine

wahre Aussage. Die Semantik [Fre94] des Deklarativsatzes reduziert sich auf die

Referenz der Wahrheitswerte (Kapitel 2.4).

Mit einzelnen Aussagen kann jedoch keine mathematische Theorie beschrie-

ben bzw. aufgebaut werden. Daher gibt es Operatoren (Junktoren), die ma-

thematische Aussagen im Sinne des Extensionalit¨

atsprinzips miteinander ver-

kn¨

upfen. Das Extensionalit¨

atsprinzip ist ein weiteres Axiom und bildet mit dem

Zweiwertigkeitsprinzip die Grundpfeiler einer formalen Sprache der mathema-

tischen Aussagen (Aussagenlogik). Das Extensionalit¨

atsprinzip besagt, dass

der Wahrheitswert von zusammengesetzten Aussagen sich nur aus den Wahr-

heitswerten der einzelnen Aussagen zusammensetzt. Diese Verkn¨

upfungen der

mathematischen Aussagen werden als Aussagenverkn¨

upfungen bzw. aussagen-

logische Verkn¨

upfungen bezeichnet [Rau79]. Dadurch entsteht die M¨

oglichkeit,

komplexe Aussagen aus einfachen Aussagen zu konstruieren.

Satz 3.2.1

Hat man eine oder mehrere Aussagen gegeben, dann kann man mit Junktoren

neue Aussagen erzeugen.([Sei00, I.1.ii])

In der Aussagenlogik werden vor allem f¨

unf Junktoren verwendet. Diese Junkto-

ren k¨

onnen auch als Funktionen beschrieben werden, die als boolesche Funk-

tionen Bn→B(n > 0) bezeichnet werden (Abbildung 3.1).

Junktor Funktion

Negation ¬:B→B

Konjunktion ∧:B2→B

Disjunktion ∨:B2→B

Implikation ⇒:B2→B

¨

Aquivalenz ⇔:B2→B

Abbildung 3.1: ¨

Uberblick ¨

uber die booleschen Funktionen

84 KAPITEL 3. MATHEMATISCHE STRUKTUREN

Diese Verkn¨

upfungen der Aussagen erfolgen nach einem bestimmten Muster,

das in den Wahrheitstafeln (Abbildung 3.2) festgelegt wird (Normierung der

booleschen Funktionen).

x y ¬x x ∧y x ∨y x ⇒y x ⇔y

0 0 1 0 0 1 1

0 1 1 0 1 1 0

1 0 0 0 1 0 0

1 1 0 1 1 1 1

Abbildung 3.2: Wahrheitstafeln

Formale Beschreibung der Aussagenlogik Nun soll die Aussagenlogik als

formale Sprache dargestellt werden. Zur Beschreibung werden ein Alphabet, eine

Syntax und eine Semantik ben¨

otigt. Die Syntax beschreibt Sprachen, die aus

Zeichen bestehen, wobei verschiedene Typen von Zeichen unterschieden werden.

Die Semantik beschreibt die Abbildung (Interpretation) der Syntax auf einer

vorgegebenen Struktur. Ein System, das die Syntax und Semantik zusammen

mit Schlussfolgerungsregeln beschreibt, wird als Kalk¨

ul bezeichnet.

Definition 3.2.2 (Alphabet der Aussagenlogik)

Das Vokabular der Aussagenlogik besteht aus einer fest definierten Menge von

Symbolen Σ = {A,¬,⇒,(,)}:

1. Ein Alphabet von atomaren Aussagen A={a, b, c, . . .},

2. Junktoren ¬,⇒und

3. technische Zeichen (linke und rechte Klammer).

(nach [Spi04, S. 14])

Durch die Verwendung der beiden logischen Operatoren ¬und ⇒k¨

onnen die

drei weiteren logischen Operatoren ∨,∧und ⇔definiert werden:

• A ∧ B := ¬(A ⇒ ¬B)

• A ∨ B := ¬A ⇒ B

3.2. GRUNDLAGEN 85

• A ⇔ B := ¬(A ⇒ B)⇒ ¬(B ⇒ A)

Die aus dem Alphabet der Aussagenlogik nach bestimmten Regeln gebildeten

Symbolfolgen werden als aussagenlogische Formeln bezeichnet. Die Bildungsre-

geln werden durch die Syntax (Definition 3.2.3) und die Bedeutung durch die

Semantik (Definition 3.2.4) beschrieben.

Definition 3.2.3 (Syntax der Aussagenlogik)

Die aussagenlogischen Formeln werden folgendermaßen gebildet:

1. Alle atomaren Aussagen aus Asind aussagenlogische Formeln.

2. Das Negationssymbol ¬gefolgt von einer aussagenlogischen Formel ist eine

aussagenlogische Formel.

3. Eine ¨

offnende Klammer (, gefolgt von einer aussagenlogischen Formel, ge-

folgt vom Junktor ⇒, gefolgt von einer aussagenlogischen Formel, gefolgt

von einer schließenden Klammer ), ist eine aussagenlogische Formel.

4. Bindungsregeln f¨

ur die Junktoren.

(nach [Spi04, S. 14])

Das durch die Syntax beschriebene formale System kann nun mit einer Semantik

verbunden werden:

Definition 3.2.4 (Semantik der Aussagenlogik)

1. Die Belegung ist eine Funktion g:D → {0,1}, wobei Ddie Menge aller

aussagenlogischen Formeln ist. Die Belegung wird durch die Wahrheitsta-

feln (Abbildung 3.2) beschrieben. [CEE+01, S. 32]

2. Eine Interpretation Ieiner aussagenlogischen Formel wird definiert

durch:

(a) Atomare Aussagen a:I(a) = g(a);

(b) Aussagenlogische Formeln A,B:

i. Negation: I(¬A) = 1, falls I(A) = 0, sonst I(¬A) = 0;

ii. Implikation: I(A ⇒ B) = 1, falls I(A) = 0 oder I(B) = 1, sonst

I(A ⇒ B) = 0;

(nach [CEE+01, S. 34])

86 KAPITEL 3. MATHEMATISCHE STRUKTUREN

3. F¨

ur eine aussagenlogische Formel Aund eine Belegung gschreibt man g|=

A, falls I(A) = 1. Man sagt, die Formel Agilt unter der Belegung

g. [CEE+01, S. 35]

Die eigentliche Aufgabe der Logik ist es, die Gesetze des logischen Schließens zu

untersuchen.

Definition 3.2.5 (Schluss)

Seien nun P1,...,Pn,Caussagenlogische Formeln1. Wenn P1∧...∧ Pn⇒ C

allgemeing¨

ultig ist, nennt man dies einen g¨

ultigen Schluss von P1, . . . , Pnnach

C. Man notiert dies durch P1,...,Pn|=C. Eine aussagenlogische Formel heißt

allgemeing¨

ultig (Tautologie), wenn sie bei jeder Belegung zu einer Aussage

mit Wahrheitswert ”wahr“ wird. (nach [Wue95, S. 4, 6])

Die wichtigste Schlussregel ist der modus ponens (P ⇒ C,P)|=C, d. h., wenn

eine Implikation und ihre Pr¨

amisse Pangenommen werden, folgt logisch die

Konklusion C.

Um ein vollst¨

andiges Beschreibungssystem f¨

ur die Aussagenlogik zu erhalten,

wird ein formales Axiomensystem aufgestellt.

Axiom 3.2.1 (Axiomensystem der Aussagenlogik)

Es seien A,Bund Caussagenlogische Formeln. Dann gilt folgendes:

1. aussagenlogische Annahmeneinf¨

uhrung:

C ⇒ (A ⇒ C)

2. aussagenlogische Verkettungsregel:

(A ⇒ (B ⇒ C)) ⇒((A ⇒ B)⇒(A ⇒ C))

3. Widerspruchsregel: (¬C ⇒ ¬A)⇒(A ⇒ C)

4. modus ponens

[Spi04, S. 66]2

1Psteht f¨

ur Pr¨

amisse und Cf¨

ur Konklusion.

2System von Lukasiewicz und Tarski

3.2. GRUNDLAGEN 87

Die Aussagenlogik beschreibt nur einen geringen Teil der Mathematik und reicht

deshalb nicht f¨

ur eine vollst¨

andige Beschreibung aus. Eine Erweiterung der Ideen

der Aussagenlogik ist durch die Pr¨

adikatenlogik erster Stufe gegeben. So verwen-

det die Pr¨

adikatenlogik Konzepte der traditionellen Logik wie z. B. die Subjekt-

Pr¨

adikat Beziehung. Damit k¨

onnen Individuen (Subjekte), deren Eigenschaften

(Pr¨

adikate) und Geltungsbereiche (Quantoren) abgefragt werden.

”In der Ausdrucksweise der modernen Linguistik entspricht dem

Subjekt ein Satzteil, der eine irgendwie geartete Benennung eines

Gegenstandes ausdr¨

uckt, daher spricht man von einer Nominalphra-

se. Demgegen¨

uber entspricht dem Pr¨

adikat gerade keine Benennung.

Linguisten nennen den Satzteil, der grammatisch das Pr¨

adikat re-

pr¨

asentiert, die Verbalphrase.“ [Spi04, S. 86]

Des Weiteren existieren Funktoren. Aus linguistischer Sicht k¨

onnen z. B. Funk-

toren beschrieben werden als Nominalphrasen, die nicht nur durch den Eigenna-

men eines Individuums angegeben werden, sondern eine funktionale Abh¨

angig-

keit beschreiben, z. B. das Blatt eines Baumes [Her72].

Nach diesen Betrachtung besteht dann das Alphabet der pr¨

adikatenlogischen

Sprache aus:

Definition 3.2.6 (Alphabet der Pr¨

adikatenlogik)

Das Alphabet der Pr¨

adikatenlogik setzt sich zusammen aus dem Alphabet der

aussagenlogischen Sprache (Definition 3.2.2) und folgenden Symbolen:

1. Pr¨

adikate: p, q, . . .;

2. Individuenkonstanten: k, k1,...;

3. Individuenvariablen: x1, x2,...;

4. Funktoren: f,g,...;

5. Quantorenzeichen: Allquantor ∀, Existenzquantor ∃.

Mit dem Alphabet k¨

onnen dann zul¨

assige Symbolfolgen — pr¨

adikatenlogische

Formeln — gebildet werden, die durch die Syntax der Pr¨

adikatenlogik beschrie-

ben werden3.

3Die Bildungsregeln bzw. die Syntax soll hier nicht n¨

aher erl¨

autert werden.

88 KAPITEL 3. MATHEMATISCHE STRUKTUREN

Wie in der Aussagenlogik gibt es auch in der Pr¨

adikatenlogik eine Interpretation,

die jedoch sehr viel reichhaltiger gestaltet ist (Semantik der Pr¨

adikatenlogik).

Dabei ist der grundlegende semantische Begriff das Modell. Ein Modell der

Pr¨

adikatenlogik ist ein Paar M= (D,F), wobei Deine Menge und Feine

Funktion ist , die die Elemente aus Dauf Individuenvariablen und die Pr¨

adi-

kate auf Relationen abbildet. Die Menge Dwird als Dom¨

ane (bzw. Struktur)

bezeichnet. Diese wird interpretiert als eine Menge von Individuen (z. B. Zah-

len, Vektoren, ...), die f¨

ur das zu betrachtende Problem relevant sind. Das Bild

eines Pr¨

adikates pist diejenige Relation R, f¨

ur die (x1,...,xn)∈Rgenau dann

gilt, wenn p(x1,...,xn) zutrifft.

Der Begriff der Interpretation bezeichnet die Deutung der Ausdr¨

ucke der Pr¨

adi-

katenlogik in Bezug auf ein Modell. F¨

ur die Interpretation von Individuen wer-

den Belegungen verwendet. Eine Belegung gzu einem Modell Mist eine Ab-

bildung mit der Menge aller Individuenvariablen als Definitionsbereich und D

als Wertebereich. Also bildet gIndividualvariablen auf Individuen aus Dab.

Eine Interpretation Iist dann ein Paar (M, g) aus dem Modell Mund der

Belegung gin M. F¨

ur eine Formel Cund eine Interpretation Ischreibt man

I |=C, falls Cf¨

ur die Interpretation Iwahr ist. Man sagt die Interpretation die

Formel Cgilt unter der Interpretation I[CEE+01, S. 40ff].

Axiom 3.2.2 (Axiomensystem der Pr¨

adikatenlogik 1. Stufe)

A,Bund Csind pr¨

adikatenlogische Formeln. Ein Allsatz behauptet, dass f¨

ur alle

Individuen die nachfolgenden Pr¨

adikate zutreffen. Ein Existenzsatz behauptet

die Existenz eines oder mehrerer Individuen mit den nachfolgend genannten

Pr¨

adikaten.

1. pr¨

adikatenlogische Annahmeneinf¨

uhrung:

C ⇒ (A ⇒ C)

2. pr¨

adikatenlogische Verkettungsregel:

((A ⇒ (B ⇒ C)) ⇒((A ⇒ B)⇒(A ⇒ C))

3. pr¨

adikatenlogische Widerspruchsregel:

(¬C ⇒ ¬A)⇒(C ⇒ A)

4. Partikularisierung: Ein Allsatz kann auf ein beliebiges Individuum an-

gewandt werden, sofern dessen Beschreibung keine Variablen enth¨

alt,

3.2. GRUNDLAGEN 89

die durch weitere Quantoren des Allsatzes gebunden werden. D. h.

(∀x)B(x)⇒B(t), wenn tfrei substituierbar f¨

ur xin Bist.

5. Versetzung des Quantors: Wenn ein Allquantor vor einer Implikation eine

Variable bindet, die nur im bedingten Teil vorkommt, darf der Quantor

direkt vor diesen Teil verschoben werden. D. h. ∀x(A(...)⇒C(...)) ⇒

(A(...)⇒(∀x)C(...)), wenn xnicht frei in Avorkommt.

6. Generalisierung: Wenn eine Aussage f¨

ur eine freie Variable mit einer be-

liebigen Durchlaufung dieser Variable gilt, dann darf diese Variable durch

einen Allquantor gebunden werden.

7. Inferenzregeln: modus ponens

(nach [Spi04, S. 133])

In Ebbinghaus [EJF96, S. 149] wird ¨

uber das Problem bei der Verwendung der

Pr¨

adikatenlogik 1. Stufe gesprochen.

3.2.3 Axiomatische Mengenlehre

Eine Analyse der mathematischen Sprache erfordert die Betrachtung der Men-

genlehre. Sie bildet ein einheitliches Ger¨

ust f¨

ur zahlreiche Disziplinen.

Nach Cantor wird unter einer Menge (naiver Mengenbegriff ) folgendes verstan-

den:

”Unter einer Menge verstehen wir jede Zusammenfassung Mvon

bestimmten wohlunterschiedenen Objekten unserer Anschauung oder

unseres Denkens (welche die Elemente von Mgenannt werden) zu

einem Ganzen.“([Ebb94, S. 1])

Allerdings f¨

uhrt eine solche Betrachtungweise zu Widerspr¨

uchen (Antinomien),

beispielsweise bei der Interpretation des Beispiels vom Barbier in Sevilla.:

”In Sevilla wird ein Mann genau dann vom Barbier von Sevilla

rasiert, wenn er sich nicht selbst rasiert. Rasiert sich der Barbier

selbst?“ [Bar94, S. 172]

90 KAPITEL 3. MATHEMATISCHE STRUKTUREN

Daher wurde die axiomatische Mengenlehre entwickelt, die nur spezielle axio-

matisch festgelegte Klassen von mathematischen Objekten (Mengen) betrachtet.

Nur diese speziellen Klassen sind zul¨

assig und sie werden als Mengen bezeichnet.

Bemerkung 3.2.1 (Bezeichnungen)

•Kleinbuchstaben x,y,... bezeichnen Mengen und Element von Mengen.

•Das Symbol x∈ybedeutet: ”xist ein Element von y“

•Das Symbol x6∈ ybedeutet: ”xist kein Element von y“

•Das Symbol {x|E(x)}bedeutet: ”Die Menge aller xmit der Eigenschaft

E(x), d. h. E(x)ist wahr.“

3.2.3.1 Axiomatische Mengenlehre nach ZFC

Es gibt verschiedene formale Systeme in der Mathematik; auf eine Diskussion,

welches das Beste ist, wollen wir uns an dieser Stelle nicht einlassen und w¨

ahlen

das Zermelo-Fraenkelsche Axiomensystem (ZFC) mit Auswahlaxiom aus. Die

Sprache der Mengenlehre basiert auf der Pr¨

adikatenlogik erster Stufe mit Iden-

tit¨

at (Kapitel 3.2.2). Hier ist das einzige nicht-logische Zeichen das ∈-Zeichen

(Axiome nach [Jap93]).

Axiom 3.2.3 (Extensionalit¨

atsaxiom)

Zwei Mengen aund bsind genau dann gleich, wenn sie dieselben Elemente

enthalten.

∀x(x∈a⇔x∈b)⇒a=b

Das Extensionalit¨

atsaxiom beschreibt die Bedeutung des Gleichheitszeichen und

legt implizit fest, dass Mengen eindeutig angegeben werden k¨

onnen. Der Aus-

druck ∀x(x∈a⇒x∈b) wird auch als a⊂bgeschrieben und bedeutet ”aist

Teilmenge von b“.

Axiom 3.2.4 (Paarungsmengenaxiom)

Wenn a,bMengen sind, dann gibt es eine Menge x, die genau aund bals

Element enth¨

alt.

∃x∀y(y∈x⇔y=a∨y=b)

3.2. GRUNDLAGEN 91

xheißt ungeordnetes Paar von aund b. Es wird als x={a, b}geschrieben. Aus

dem Axiom 3.2.4 kann die Definition des geordneten Paares gefolgert werden.

Definition 3.2.7 (Geordnetes Paar)

Nach Kuratowski [Ebb94, S. 54] ist ein geordnetes Paar gegeben durch:

(x, y) := {{x},{x, y}}

wobei (x, y)6= (y, x)mit x6=yist. Ein geordnetes n-Tupel x1, . . . , xnist ein

geordnetes Paar gegeben durch:

(x1,...,xn−1, xn) := {{(x1,...,xn−1)},{(x1,...,xn−1), xn}}

Axiom 3.2.5 (Vereinigungsmengenaxiom)

Zu jeder Menge agibt es eine Menge x, die alle Elemente der Elemente von a

enth¨

alt.

∃x∀y(y∈x⇔ ∃ z(z∈a∧y∈z))

Dieses Axiom beschreibt die Vereinigung von Mengen. Das xwird auch als Sa

geschrieben. Weiterhin ist a∪b=S{a, b}und a0:= a∪ {a, a}.

Axiom 3.2.6 (Potenzmengenaxiom)

Zu jeder Menge agibt es eine Menge x, die alle Teilmengen von aenth¨

alt.

∃x∀y(y∈x⇔ ∀ z(z∈y⇒z∈a))

Dieses Axiom erlaubt die Konstruktion verschieden m¨

achtiger, (¨

uberabz¨

ahlbar)

unendlich großer Mengen.

Axiom 3.2.7 (Leere Menge)

Es existiert eine leere Menge.

∃x∀y(¬(y∈x))

Die leere Menge wird als ∅bezeichnet.

Axiom 3.2.8 (Unendlichkeitsaxiom)

Es gibt eine Menge, die ∅enth¨

alt und mit jedem yauch y0.

∃x(∅ ∈ x∧ ∀ y(y∈x⇒y0∈x))

92 KAPITEL 3. MATHEMATISCHE STRUKTUREN

Dies garantiert die Existenz einer Menge, die alle nat¨

urlichen Zahlen enth¨

alt.

Dabei ist 0 = ∅, 1 = 00={0}, 2 = 10={0,1}, 3 = 20={0,1,2}usw.

Axiom 3.2.9 (Aussonderungsaxiom)

F¨

ur alle Mengen agibt es eine Menge x, die aus allen Elementen yvon abesteht,

die die Formel A(y)erf¨

ullen.

∃x∀y(y∈x⇔y∈a∧A(y))

Das Axiom 3.2.9 besagt, dass durch bestimmte Eigenschaften A(y) eine neue

Teilmenge xaus agebildet (ausgesondert) werden kann. Dies wird bezeichnet

durch: {y∈a|A(y)}. Das Aussonderungsaxiom ist eigentlich ein Axiomen-

schema f¨

ur eine unendliche Anzahl von Axiomen, da es unendlich viele A(y)

gibt.

Axiom 3.2.10 (Ersetzungsaxiom)

F¨

ur jede Menge aexistiert eine Menge xso, dass f¨

ur jedes Element yvon a,

f¨

ur das ein zexistiert, dass das Pr¨

adikat A(y, z)erf¨

ullt, ein solches zauch in x

existiert.

∃x(∀y∈a(∃z A(y, z)⇒ ∃ z∈x A(y, z)))

Das Axiom 3.2.10 garantieren die M¨

oglichkeit, Mengen in anderen Mengen nach

einer bestimmten Vorschrift abzubilden.

Axiom 3.2.11 (Fundierungsaxiom)

Wenn es eine Menge xgibt, die A(x)erf¨

ullt, dann existiert eine Menge x, die

A(x)erf¨

ullt, aber keines ihrer Elemente yerf¨

ullt A(y).

[∃x A(x)] ⇒[∃x(A(x)∧ ∀ y∈x(¬A(y)))]

Das Fundierungsaxiom f¨

uhrt bei den Mengen, die sich selbst enthalten, zum

Widerspruch und verhindert somit die Existenz solcher Mengen.

Axiom 3.2.12 (Auswahlaxiom)

Zu jeder Menge xvon nicht leeren, zueinander disjunkten Mengen gibt es eine

Menge, die von jedem Element von xgenau ein Element enth¨

alt.

Das Axiom 3.2.12 besagt, dass zu jeder Menge von nicht leeren, zueinander

disjunkten Mengen eine Auswahlmenge existiert. Jedoch beschreibt das Axiom

nicht, wie diese Auswahl aussieht und wird nicht f¨

ur endliche Mengen ben¨

otigt.

3.2. GRUNDLAGEN 93

Mit den Zermelo-Fraenkel Axiomen wird eine formale Sprache f¨

ur die Standard-

mathematik aufgebaut. Die Syntaxregeln sind durch die Pr¨

adikatenlogik erster

Stufe mit Identit¨

at (Kapitel 3.2.2) mit den Symbolen (∀,∃,⇒ ⇔,¬und ∈,

=) und den Mengenlehresymbolen gegeben. Im Folgenden soll der Begriff der

Zuordnung mengentheoretisch pr¨

azisiert werden.

Definition 3.2.8 (Kartesisches Produkt)

Das kartesische Produkt ist gegeben durch:

X×Y:= {(x, y)|x∈X∧y∈Y}

Des Weiteren wird eine Teilmengenbeziehung ben¨

otigt:

Definition 3.2.9

Die Menge Xheißt Teilmenge der Menge Y, wenn f¨

ur alle Elemente xgilt:

x∈X⇒x∈Y

F¨

ur beliebige Mengen sind die Eigenschaften der Teilmengenbeziehung:

1. X⊂X(reflexiv)

2. Wenn X⊂Yund Y⊂Z, dann X⊂Z(transitiv)

3. Wenn X⊂Yund Y⊂X, dann X=Y(antisymmetrisch)

[Sta00, S. 7]

Mit Hilfe des Begriffs des geordneten Paares und der Teilmengenbeziehung kann

nun der Begriff der Relation definiert werden.

Definition 3.2.10 (Relation)

Es seien X,YMengen. Eine Teilmenge Rvon X×Yheißt Relation zwischen

Xund Y.

Definition 3.2.11

Es sei R⊆X×Yeine Relation zwischen Xund Y.

1. Der Definitionsbereich von Rist die Menge DRder Elemente von X,

die R-Urbilder eines Elementes von Ysind:

DR:= {a∈X| ∃ bmit (a, b)∈R}

94 KAPITEL 3. MATHEMATISCHE STRUKTUREN

2. Der Bildbereich (Wertebereich) von Rist die Menge WRder Elemente

von Y, die R-Bild eines Elementes von Xsind:

WR:= {b∈X| ∃ amit (a, b)∈R}

[Sta00, S. 21]

Definition 3.2.12 (bin¨

are Relation)

Rwird bin¨

are (zweistellige) Relation in Xgenannt, wenn R⊆X×Xist.

(Bezeichnung: xRy :⇔(x, y)∈R)Rheißt:

reflexiv: wenn ∀x∈Xgilt xRx;

irreflexiv: wenn f¨

ur kein x∈Xgilt xRx;

transitiv: wenn ∀x, y, z ∈Xgilt: wenn xRy und yRz, so xRz;

antisymmetrisch: wenn ∀x, y ∈Xgilt: wenn xRy und yRx, so x=y;

asymmetrisch: wenn ∀x, y ∈Xgilt: wenn xRy, so nicht yRx;

symmetrisch: wenn ∀x, y ∈Xgilt: wenn xRy, so yRx;

reflexive Halbordnung: wenn Rreflexiv, transitiv und antisymmetrisch;

irreflexive Halbordnung: wenn Rirreflexiv, transitiv und asymmetrisch;

¨

Aquivalenzrelation: wenn Rreflexiv, transitiv und symmetrisch.

[Sta00, S. 22f]

Ein zentraler Begriff in der Mathematik ist der Begriff der Abbildung (Funktion,

Operator):

Definition 3.2.13 (Abbildung)

Es seien X,YMengen

1. fheißt Abbildung von X in Y, wenn

(a) feine Relation von Xin Yist;

(b) (x, y)∈f∧(x, z)∈f⇒y=zmit x∈Xund y, z ∈Y

2. Eine Abbildung fwird surjektiv genannt, wenn Wf=Yist.

3.2. GRUNDLAGEN 95

3. Eine Abbildung fwird injektiv genannt, wenn

((x1, y)∈f∧(x2, y)∈f)⇒x1=x2mit x1, x2∈Xund y∈Y.

4. Eine Abbildung fheißt bijektiv, wenn fsurjektiv und injektiv ist.

[Sta00, S. 25], [Wue95]

In der Literatur wird die Relation von Xin Yauch als Graph von fbezeichnet.

Dadurch wird zwischen dem Prozess des Abbildens von Xnach Yund der

mengentheoretischen Bedeutung unterschieden. Dies wird in dieser Arbeit im

Folgenden aber nicht getan, d. h. es wird f= Graph(f) angenommen.

96 KAPITEL 3. MATHEMATISCHE STRUKTUREN

3.3 Sprachstrukturen

Die Mathematik geh¨

ort zu jenen ¨

Außerungen

menschlichen Verstandes, die am wenigsten von

Klima, Sprache oder Traditionen abh¨

angen.

(Ilja Ehrenburg, russ. Autor, 1891-1967)

Die Sprache der Mathematik ist mehr als eine gew¨

ohnliche Fachsprache (Kapitel

2.4.4). Sie ist Vorbild f¨

ur viele Wissenschaften und somit auch deren Fachspra-

chen, da sie eine ”klare durchg¨

angige Strukturierung ihrer Inhalte/Erkenntnisse

und [ein] darauf operierende[s] Begriffs-Beziehungsgeflecht“ [Jes04, S. 94] auf-

weist. Sie besitzt dadurch eine strenge Systematik aus gewissenhaft hergeleiteten

S¨

atzen, die aus einem endlichen Theoremgeb¨

aude aufgebaut werden. Definitio-

nen sind dabei die Strukturierungselemente. Allerdings wird die Mathematisie-

rung in den Wissenschaften oft als Allheilmittel gesehen, was nicht unbedingt

deren Verstehensprozess und Genauigkeit f¨

ordert.

In diesem Kapitel werden die sprachlichen Strukturen der Mathematik und ihre

Besonderheiten herausgearbeitet. Um einen grundlegenden ¨

Uberblick ¨

uber eine

Dom¨

ane der Mathematik zu gew¨

ahrleisten, sollen Texte aus Lehrb¨

uchern ver-

wendet werden. Lehrb¨

ucher, insbesondere f¨

ur Studierende im Grundstudium,

nehmen f¨

ur sich in Anspruch, eine besonders strenge mathematische Sprache

zu benutzen [Fis00], [BF00], [BF96], [K¨

o01], [Rud02], [Wue95]. Es soll daher

haupts¨

achlich Lehrbuchliteratur aus dem Bereich der linearen Algebra verwen-

det werden, da diese sehr strukturiert aufgebaut ist. Es werden aber auch Bei-

spiele aus der Analysis vorgestellt.

Auf Grundlage der Strukturierungsmechanismen in der Mathematik ergeben

sich f¨

ur linguistische Betrachtungen der mathematischen Sprache vier Ebenen

(Abbildung 3.3), die in den nachfolgenden Kapiteln n¨

aher betrachtet werden:

1. Entit¨

atenebene (Pragmatik)

2. Binnenstrukturebene (Diskurssemantik)

3. Satzebene (Syntax und Satzsemantik)

4. Wort- und Symbolebene (Morphologie und lexikalische Semantik)

3.3. SPRACHSTRUKTUREN 97

Axiom

Satz

Definition

Beweis

















Entitäten

Binnenstruktur

Satz

Wort & Symbol

Wenn [...], dann [...]

Wort: Menge Symbol: M

Abbildung 3.3: Darstellungsebenen der mathematischen Sprache

3.3.1 Entit¨

atenebene

Mathematische Theorien werden deduktiv konstruiert. Aufbauend auf einer

m¨

oglichst geringen Anzahl von ”undefinierten Begriffen“ (Grundbegriffen) und

”unbewiesenen S¨

atzen“ (Grunds¨

atze4) werden weitere S¨

atze bewiesen [WR84].

”Jede mathematische Theorie ist eine Aneinanderreihung von

S¨

atzen, deren jeder aus den vorhergehenden abgeleitet wird: dies ge-

schieht im Einklang mit den Regeln jenes logischen Systems, das

unter dem Namen formale Logik bekannt ist.“ [Bou02, S. 143]

Die Grunds¨

atze werden in der Mathematik auch als Axiome bezeichnet. Die

Mengenlehre (Kapitel 3.2.3) bildet dabei das axiomatische Fundament der ma-

thematischen Theorien. Auf Grundlage der Axiome der Mengenlehre und der

Pr¨

adikatenlogik erster Stufe bzw. der elementaren Schlussregeln (Kapitel 3.2.2)

werden Aussagen der zu betrachtenden mathematischen Theorie bewiesen.

Durch den dadurch bedingten strukturellen Aufbau wird eine mathematische

Theorie in kompakte Einheiten — Entit¨

aten5— zerlegt, die untereinander in

vorgegebenen Beziehungen stehen [Jes04, S. 93]. Entit¨

aten entsprechen dann

4Russell und Whitehead verwendeten die Bezeichnung Grunds¨

atze [WR84]. Heutzutage

wird der Begriff Axiom verwendet.

5Sie werden auch als Konstrukte bezeichnet (Kapitel 2.2).

98 KAPITEL 3. MATHEMATISCHE STRUKTUREN

den Definitionen, Theoremen, S¨

atzen, Korollaren, Propositionen und Lemmata.

Hinzu kommen Beweise und Beispiele.

In der Abbildung 3.4 wird eine grobe hierarchische Anordnung der vorhan-

denen Entit¨

aten dargestellt. Auf der obersten Hierarchieebene (Axiomenebe-

ne) einer mathematischen Theorie befinden sich die Axiome und Definitionen

zu den grundlegendsten Begriffen. Diese beschreiben die Prinzipien einer zu

betrachtenden mathematischen Theorie. In der darunterliegenden Hauptebene

existiert eine stereotype Basisstruktur, bestehend aus Definition, Satz und Ko-

rollar. Das zentrale Element ist der Satz, der in verschiedensten Auspr¨

agungen

— als Fundamentalsatz, als Theorem oder als ”einfacher“ Satz — auftreten

kann. Jeder Satz muss aus vorhergehenden S¨

atzen oder den Axiomen bewiesen

werden. Unter der Ebene des Satzes existieren in der Hierarchie die Korollare

und Lemmata. Korollare folgen direkt aus einem Satz, Lemmata sind in Be-

weisen verwendete Hilfss¨

atze. Des Weiteren k¨

onnen auf S¨

atze und Definitionen

Propositionen6folgen, die ebenfalls wieder bewiesen werden7. Eine weitere En-

tit¨

atenstruktur bilden die Beispiele, die h¨

aufig in Lehrb¨

uchern zu finden sind.

Diese treten haupts¨

achlich nach Definitionen oder wichtigen S¨

atzen auf und

dienen der anschaulichen Erl¨

auterung der zu betrachtenden mathematischen

Aussage.

Bei genauerer Betrachtung der Entit¨

atenstruktur wird deutlich, dass diese

Struktur inh¨

arent die pragmatische Struktur widerspiegelt. Sowohl die En-

tit¨

atenstruktur als auch die verschiedenen Entit¨

aten zeigen eindeutig die In-

tention an, die ein mathematischer Text vermitteln soll. Die Bestimmung dieser

Intentionen ist sicherlich ein wichtiger Schritt f¨

ur die Analyse der mathema-

tischen Sprache. Problematisch sind mathematische Texte, in denen nicht expli-

zit die Entit¨

aten angegeben werden8. Hierbei m¨

ussen die Entit¨

aten zuerst aus

dem Text ermittelt werden.

6In der deutschsprachigen Literatur wird die Proposition auch h¨

aufig als Bemerkung be-

zeichnet.

7Wird in der deutschsprachigen Literatur die Bezeichnung Bemerkung verwendet, so

k¨

onnen, aber m¨

ussen nicht, Beweise folgen. Wenn kein Beweis angegeben wird, entspricht

dies dem in der angels¨

achsischen Literatur verwendeten Begriff remark. Dabei wird meistens

ein Hinweis auf einen mathematischen Satz gegeben, dessen Beweis in diesem Zusammenhang

nicht wichtig ist und daher ausgelassen werden kann.

8Zu solchen Texten geh¨

oren z. B. einleitende Textabschnitte zu Sachgebieten.

3.3. SPRACHSTRUKTUREN 99

Bemerkung

Axiomenebene

Definition

Satz

Korollar

Bemerkung

Korollar

Hauptebene

Beweis

Beispiel

Beweis

Axiom Definition von Grundbegriffen

Abbildung 3.4: Hierarchie der Entit¨

aten

In den weiteren Abschnitten sollen nun die Intentionen der einzelnen Entit¨

aten

und ihre Charakteristika beschrieben werden.

Axiom. Das Wort Axiom stammt aus dem gr.-lat. Wort ax´o ¯ma und bedeutet

Grundwahrheit [Dud01]. Ein Axiom ist eine als wahr angenommene Aussage

(bzw. ein als wahr angenommener Satz), die nicht innerhalb der zu betrachteten

mathematischen Theorie begr¨

undbar ist (Aristoteles). Es wird auch vom Satz 0.

Stufe gesprochen. Axiome dienen daher als Fundament f¨

ur deduktiv beweisbare

Theorien. Werden in einem Axiom mehrere Aussagen zusammengefasst, wird

ein solches Axiom als Axiomenschema bezeichnet.

F¨

ur die Beschreibung einer mathematischen Theorie werden mehrere Axiome

ben¨

otigt, die nicht im Widerspruch zueinander stehen d¨

urfen. Ein solches System

wird dann als Axiomensystem bezeichnet. Beispiele f¨

ur Axiomensysteme sind die

Mengenaxiome, Anordnungs- und Vollst¨

andigkeitsaxiome f¨

ur die reellen Zahlen

usw. Axiome bzw. Axiomensysteme treten nur in geringer Anzahl auf.

Definition. Definitionen nehmen in der mathematischen Theorie eine beson-

dere Stellung ein. Ihre Hauptaufgabe ist es, die ¨

Ubersichtlichkeit und somit

100 KAPITEL 3. MATHEMATISCHE STRUKTUREN

auch die Verst¨

andlichkeit einer Theorie zu gew¨

ahrleisten. Der Begriff Definition

stammt aus dem lat. d¯efin¯

ire und bedeutet abgrenzen bzw. bestimmen, wobei

f¯

inis f¨

ur Grenze steht [Dud01]. Eine Definition dient als Abk¨

urzung von Sach-

verhalten, die eine wichtige Bedeutung in der zu betrachtenden mathematischen

Theorie besitzen, wie z. B. Vektorraum,lineare Abbildung,Matrizen,Determi-

nante usw. In der Definition m¨

ussen Aussagen genau gekl¨

art und bestimmt

werden. Sie werden dabei mit Hilfe von anderen, schon vorher definierten Be-

griffen und Relationen beschrieben.

Zus¨

atzlich kann den Abk¨

urzungen ein Name, ein Symbol oder eine Symbolfolge

zugeordnet werden.

Beispiel

•Die Bezeichnung Gauss-Verfahren steht f¨

ur ein Verfahren, dass eine

Matrix in die Zeilenstufenform bringt.

•Der Vektorraum kann durch das Symbol Vbeschrieben werden.

Insbesondere hat eine Definition einen G¨

ultigkeitsbereich, der durch den Sach-

verhalt der mathematischen Theorie geregelt wird.

Es wird zwischen zwei grundlegenden Arten von Definitionen unterschieden:

1. Explizite Definitionen werden in der Mathematik sehr h¨

aufig verwen-

det, indem ein Oberbegriff und die zugeh¨

origen Eigenschaften angegeben

werden.

2. Implizite Definitionen werden h¨

aufig in Axiomen verwendet. Es wird

ein Begriff durch Angabe von Eigenschaften definiert, ohne ihn anzuge-

ben9.

Definitionen d¨

urfen nach Aristoteles keine logischen Widerspr¨

uche, Mehrdeutig-

keiten und Zirkelschl¨

usse enthalten. Sie charakterisieren die Merkmale, die nur

f¨

ur den zu definierenden Begriff existieren. Eine Definition besitzt daher keinen

Wahrheitswert, jedoch muss der Begriff ad¨

aquat beschrieben werden.

9Ein Beispiel sind die Axiome von Peano, die die nat¨

urlichen Zahlen implizit definieren.

3.3. SPRACHSTRUKTUREN 101

Satz. In der Mathematik sind S¨

atze bewiesene Aussagen. Es kann zwischen

S¨

atzen 1. Ordnung und S¨

atzen 2. Ordnung unterschieden werden. S¨

atze 1. Ord-

nung werden direkt aus Axiomen hergeleitet. S¨

atze 2. Ordnung werden aus

S¨

atzen 1. Ordnung abgeleitet. Faktisch wird dies aber nicht gegeneinander ab-

gegrenzt.

Des Weiteren werden drei verschiedene Funktionen von S¨

atzen differenziert, die

durch die pr¨

adikatenlogische Struktur induziert werden:

1. Einzelaussage: Einzelaussagen sind Aussagen ¨

uber ein konkretes Objekt.

”Die Menge aller rationalen Zahlen ist abz¨

ahlbar.“ [Rud02, S. 33]

2. Existenzaussage: Existenzaussagen werden durch den Existenzquantor

induziert und beschreiben die Behauptung ¨

uber die Existenz eines Objek-

tes mit bestimmten Eigenschaften. ”[...]Dann existiert ein k∈ {1, . . .}so,

dass b1,...,bk−1, a, bk+1,...,bnlinear unabh¨

angig sind. [...]“ [Wue95, S.

362]

3. Allaussage: Allaussagen werden durch den Allquantor induziert und be-

schreiben die Behauptung, dass eine Eigenschaft f¨

ur alle Elemente einer

Grundmenge gilt. ”Alle unendlichen Teilmenge einer abz¨

ahlbaren Menge

sind abz¨

ahlbar.“ [Rud02, S. 29]

Wichtige S¨

atze werden h¨

aufig mit Namen gekennzeichnet. Dies dient zur besser-

en Verst¨

andlichkeit des zu betrachenden Sachverhalts. Weniger ber¨

uhmte S¨

atze

werden schlicht nummeriert wie z. B ”Satz 1“. Diese Bezeichnung ist f¨

ur S¨

atze

nicht verbindlich und dient nur zur leichteren Orientierung.

In der deutschen Lehrbuchliteratur gibt es verschiedene Typen von S¨

atzen: Ein

Theorem ist ein Lehrsatz oder Grundsatz. Es steht f¨

ur besonders wichtige

S¨

atze, die in der mathematischen Theorie auftreten und deshalb ausgezeichnet

werden sollen (z. B.: ”Theorema egregium“). Ein Theorem, in dem ein ganzes

Teilgebiet der Mathematik gipfelt, wird als Fundamentalsatz bzw. Haupt-

satz bezeichnet. Er kommt meistens nur ein- oder zweimal pro Fachgebiet vor

(z. B. ”Fundamentalsatz der Algebra“, ”Hauptsatz der Differential- und Integral-

rechnung“). Entsprechend gibt es noch einfache S¨

atze, die wie oben beschrie-

ben je nach ihrer Wichtigkeit einen Namen erhalten oder namenlos bleiben. Ein

wichtiges Kennzeichen von S¨

atzen ist, dass nach ihnen fast immer die Entit¨

at

Beweis folgt.

102 KAPITEL 3. MATHEMATISCHE STRUKTUREN

Korollar. Der Begriff Korollar stammt aus dem lat. cor¯ollar und bedeutet

Kr¨

anzchen10. Ein Korollar im mathematischen Sinne ist eine ”triviale“ Schluss-

folgerung, d. h. eine Sammlung von Folgerungen, die sich aus einem vorherge-

hende Satz ohne großen Aufwand ergeben. In diesem Zusammenhang ist auch

der Hilfssatz zu nennen, der eine rein technische Aussage beschreibt. Dieser

wird in der Regel nur im Beweis eines Satzes verwendet und nicht mehr in der

weiteren Theorie.

Lemma. Der Begriff Lemma stammt ebenfalls aus dem gr.-lat. und bedeutet

Titel oder Stichwort [Dud01]. Ein Lemma ist ein Hilfssatz, der im Rahmen einer

Beweisf¨

uhrung erstellt wird, aber auch einen wichtigen Schl¨

usselgedanken kenn-

zeichnet (z. B.: ”Lemma von Zorn“, ”Lemma von Sperner“). Dies unterscheidet

es vom Hilfssatz.

Proposition. Propositionen stehen im Lat. f¨

ur Satz [Dud01]. In der deut-

schen Literatur werden sie auch h¨

aufig als Bemerkung bezeichnet. Damit sind

Aussagen gemeint, die nicht so wichtig wie ein Satz sind, aber auch nicht den

Rang eines Hilfssatzes besitzen.

Beweise. In einer deduktiven Theorie wie der Mathematik m¨

ussen Aussagen

bewiesen werden, wenn diese nicht dem Entit¨

atentyp Axiom oder Definition ent-

sprechen. Eine Definition besitzt keinen Wahrheitswert und ist somit im Sinne

der Logik keine Aussage, die bewiesen werden muss.

Der Vorgang des Beweisens bedeutet, aus bekannten Aussagen (Axiomen,

S¨

atzen) mittels Schlussregeln neue Aussagen zu best¨

atigen. Dabei werden in der

Mathematik grunds¨

atzlich zwei verschiedene Beweisarten unterschieden: direkte

und indirekte Beweise. Beim direkten Beweis wird ausgehend von Voraussetzun-

gen (Pr¨

amissen) die Behauptung gefolgert. Beim indirekten Beweis (Reductio

ad absurdum) wird das logische Gegenteil der zu betrachtenden Behauptung als

wahr angenommen. Eine solche Behauptung muss dann zu einem Widerspruch

zu den Voraussetzungen gef¨

uhrt werden.

Des Weiteren existieren noch einige spezielle Beweisbezeichnungen. Der Beweis

durch vollst¨

andige Induktion ist ein Beweisschema, bei dem die G¨

ultigkeit des

10Diminutivbildung des Wortes Korona [Dud01]

3.3. SPRACHSTRUKTUREN 103

Schemas vorausgesetzt wird. Dabei muss gezeigt werden, dass bestimmte Vor-

aussetzungen (Pr¨

amissen) erf¨

ullt werden, woraus in diesem Beweisschema dann

automatisch die Behauptung folgt. Existenzs¨

atze werden durch konstruktive

oder nicht-konstruktive Beweise nachgewiesen. Der konstruktive Beweis be-

schreibt eine L¨

osungsmethode, die entweder explizit vorgestellt oder skizziert

wird. Beim nicht-konstruktiven Beweis wird anhand von Eigenschaften auf die

Existenz einer L¨

osung geschlossen. Oft wird dies durch einen indirekten Be-

weis gezeigt. Bei ¨

Aquivalenzaussagen wird h¨

aufig eine Fallunterscheidung durch-

gef¨

uhrt, um zuerst eine Richtung einer Implikation und dann die umgekehrte

Richtung zu beweisen.

Eine tiefergehende Betrachtung von Beweisen soll hier nicht diskutiert werden.

Zur Vereinfachung der Analyse der mathematischen Sprache sollen Beweise in

einem ersten Schritt nicht verwendet werden. Somit sind sie nicht Gegenstand

dieser Arbeit. Jedoch wird im Kapitel 5 auf die Wichtigkeit der Beweise in der

Mathematik eingegangen.

Beispiel. Ein Beispiel steht f¨

ur einen speziellen bzw. einzelnen Fall, der etwas

Allgemeines n¨

aher erl¨

autert oder erkl¨

art. Durch den strukturellen Aufbau der

Mathematik kommt es in der Lehrbuchliteratur sehr h¨

aufig vor, dass Beispiele

im Textgef¨

uge ebenfalls eine Entit¨

at darstellen und somit eindeutig zu unter-

scheiden sind. Es gibt noch eine weitere Art von Beispielen die Gegenbeispiele.

Dies sind Beispiele, die eine Definition oder die Voraussetzung eines Satzes nur

fast erf¨

ullen. Auch dieser Typ der Entit¨

at soll zun¨

achst nicht weiter betrachtet

werden.

3.3.2 Binnenstrukturebene

Mathematische Texte besitzen durch die Existenz der oben beschriebenen En-

tit¨

aten einen strukturierten Textaufbau, der den gesamten Text in Bl¨

ocke zer-

legt. Aber auch die Entit¨

aten selbst weisen eine interne Struktur auf, die f¨

ur

die einzelnen Typen von Entit¨

aten charakteristisch sein k¨

onnen. Diese Struktur

wird als Binnenstruktur bezeichnet [Jes04]. Alle S¨

atze sowie Definitionen besit-

zen die grundlegende Struktur (Abbildung 3.5): Voraussetzungen,Aussagen

und Eigenschaften11.

11Eigenschaften k¨

onnen wieder Aussagen enthalten.

104 KAPITEL 3. MATHEMATISCHE STRUKTUREN





Voraussetzung

Eigenschaften

Aussage

Abbildung 3.5: Binnenstruktur von Definitionen und S¨

atzen

Die einzelnen Elemente der Binnenstruktur sind grammatikalisch an ihren Ver-

wendungszweck angepasst (Kapitel 3.3.3). In Voraussetzungen werden diejeni-

gen mathematischen Objekte festgelegt, die f¨

ur die Betrachtung der Entit¨

at

von Bedeutung sind. So werden z. B. Symbole oder Wertebereiche festgelegt.

Die syntaktischen Strukturen in den Aussagen sind an die entsprechenden En-

tit¨

atentypen (Kapitel 3.3.1) gebunden. In Definitionen wird eine Aussage in

Definiendum und Definiens zerlegt. Das Definiendum ist eine Bezeichung f¨

ur

das neu definierte mathematische Objekt oder den neu definierten mathema-

tischen Sachverhalt. Das Definiens ist derjenige Ausdruck, der das Definiendum

mithilfe der mathematischen Sprache beschreibt. Eine Definition kann weiter-

hin noch Eigenschaften auflisten, die das Definiendum besitzt (Abbildung 3.6).

Dabei k¨

onnen Eigenschaften selbst wieder Eigenschaftslisten enthalten.









[...] [...]

Voraussetzung Voraussetzung

Definiendum

Definiendum Definiens

Definiens

Definiendum Definiens

Eigenschaften

Abbildung 3.6: Binnenstruktur der Definition [Jes04, S. 120]

Beispiel 3.3.1 (Definition)

In der folgenden Definition sind die verschiedenen Binnenstrukturen ebenfalls

3.3. SPRACHSTRUKTUREN 105

farbig unterlegt. Gr¨

un steht f¨

ur die Voraussetzungen, Blau f¨

ur das Definiens und

Rot f¨

ur das Definiendum. Eine Eigenschaftsauflistung zeigt dieses Beispiel nicht.

Definition

Gegeben sei eine Folge {pn}.Man betrachte eine Folge {nk}positiver Zahlen

mit n1< n2....Dann heißt die Folge {pnk}eine Teilfolge von {pn}.[Rud02,

S. 59]

Die Satzbinnenstruktur kann nicht so einfach strukturiert werden wie die

Definitionsbinnenstruktur. In Kapitel 3.3.3 wird gezeigt, dass verschiedene En-

tit¨

atentypen, wie z. B. Satz und Korollar, nicht in ihren syntaktischen Struktu-

ren zu unterscheiden sind. Als gemeinsames Merkmal besitzen sie die syntakti-

sche Struktur der Pr¨

adikatenlogik (Kapitel 3.2.2). Die Aussagen werden daher

mithilfe der sprachlichen ¨

Aquivalente der logischen Operatoren aufgebaut. Ver-

wendung finden hierbei die Implikation (Abbildung 3.7) und die ¨

Aquivalenz

(Abbildung 3.8).









[...] [...]

Forderung Folgerung Forderung 1

Forderung 2

Forderung 3

Folgerung 1

Folgerung 2

Folgerung 3

Voraussetzung Voraussetzung

Abbildung 3.7: Binnenstruktur des Satzes f¨

ur Implikationen [Jes04, S. 121]

Beispiel 3.3.2 (Satz mit Implikation)

Im folgenden Satz sind die verschiedenen Binnenstrukturen farbig unterlegt.

Gr¨

un steht f¨

ur die Voraussetzung12, Blau f¨

ur die Forderung und Rot f¨

ur die

Folgerung.

12Diese kennzeichnet allgemeine Voraussetzungen, die f¨

ur den Satz gemacht werden. Meis-

tens werden diese einfach weggelassen.

106 KAPITEL 3. MATHEMATISCHE STRUKTUREN

Satz

Sei Aeine Algebra reeller stetiger Funktionen auf einer kompakten Menge K.

Separiert Adie Punkte auf Kund verschwindet in keinem Punkt von K,

dann besteht die gleichm¨

aßig abgeschlossene H¨

ulle Bvon Aaus allen stetigen

Funktionen auf K.[Rud02, S. 189]









[...] [...]

Aussage 1 Aussage 2 Aussage 1

Aussage 3

Aussage 2

Aussage 3

Aussage 4

Voraussetzung Voraussetzung

Abbildung 3.8: Binnenstruktur des Satzes f¨

ur ¨

Aquivalenzen [Jes04, S. 121]

Beispiel 3.3.3 (Satz mit ¨

Aquivalenz)

In dem folgenden Satz sind die verschiedenen Binnenstrukturen wieder farbig

unterlegt. Gr¨

un Kennzeichnung steht f¨

ur die Voraussetzung13, Blau f¨

ur die

Aussage 1 und Dunkelgrau f¨

ur die Aussage 2.

Satz

F¨

ur F∈End(V)sind folgende Bedingungen ¨

aquivalent:

1. Fist surjektiv.

2. detF 6= 0

[Fis00, S. 203]

Eine weitere einfache Satzbinnenstruktur ist die einfache Aussage. Außer den

Voraussetzungen besitzt die einfache Aussage keine weiteren inneren Struktu-

rierungen (Abbildung 3.9).

13Diese kennzeichnet allgemeine Voraussetzungen, die f¨

ur den Satz gemacht werden. Meis-

tens werden diese einfach weggelassen.

3.3. SPRACHSTRUKTUREN 107





Aussage

Voraussetzung

Abbildung 3.9: Binnenstruktur des einfachen Satzes

Beispiel 3.3.4 (Einfache Aussage)

Die Teilfolgengrenzwerte einer Folge {pn}in einem metrischen Raum Xbilden

eine abgeschlossene Teilmenge von X. [Rud02, S. 60]

Axiome zeigen eine eigenwillige Struktur. Sie sind zum Teil mit den S¨

atzen

verwandt, zeigen aber auch definitionscharakteristische Strukturierungen. Au-

ßerdem m¨

ussen Axiome zwangsl¨

aufig mit außermathematischen Begriffen ope-

rieren. Daher l¨

asst sich bei ihnen keine klare Binnenstruktur erkennen14.

Zwischen den einzelnen Binnenstrukturen existieren Abh¨

angigkeiten. So wer-

den in den Voraussetzungen Symbole und Bezeichnungen festgelegt, die f¨

ur ei-

ne Interpretation der Aussage wichtig sind. Die Identifikation solcher Zusam-

menh¨

ange wird dann durch die Diskurssemantik beschrieben (Kapitel 2.4).

3.3.3 Satzstrukturebene

Die Satzstrukturen in mathematischen Definitionen, S¨

atzen und Axiomen zeigen

stereotype syntaktische Konstruktionen wie z. B. Metaphern und Phrasen. So

sind Definitionen an ihrer syntaktischen Struktur und durch die Verwendung

von Schl¨

usselverben wie z B. heißen leicht zu erkennen. S¨

atze dagegen sind zwar

als solche wahrzunehmen, es existieren aber keine Unterscheidungsmerkmale

zwischen den einzelnen Satztypen (Satz,Korollar und Proposition).

In den hier betrachteten Texten k¨

onnen mathematische Aussagen stets als

wahr angenommen werden. Dementsprechend entf¨

allt der Teil der pragma-

tischen Analyse (Kapitel 2.4), welche der beabsichtigte Wirkung eines Sat-

zes bez¨

uglich eines Kommunikationspartners betrachtet. Die sprachlichen Kon-

struktionsm¨

oglichkeiten sind somit begrenzt.

14Beispiele f¨

ur Axiome im Kapitel 3.2.3

108 KAPITEL 3. MATHEMATISCHE STRUKTUREN

Mathematische Aussages¨

atze werden durch die Pr¨

adikatenlogik 1. Stufe cha-

rakterisiert. So werden mit Hilfe einer geringen Anzahl von verwendeten logi-

schen Operatoren (Junktoren) und Quantoren (Kapitel 3.2.2) syntaktisch ein-

fache S¨

atze konstruiert. F¨

ur diese logischen Operatoren und Quantoren steht

nur eine begrenzte Anzahl an syntaktischen Konstruktionen zur Verf¨

ugung. Die

dabei entstehenden Satzstrukturen sind meistens kurz, klar und leicht ¨

uber-

schaubar konstruiert. Durch die Verwendung von feststehenden Phrasen wer-

den somit viele syntaktische und semantische Ambiguit¨

aten vermieden, weil die

einzelnen Konstruktionen entsprechend festgelegte Bedeutungen besitzen. So-

mit wird eine syntaktische und semantische Analyse wesentlich vereinfacht. Ein

weiterer Hinweis f¨

ur die M¨

oglichkeit einer strafferen syntaktischen Analyse ist

die Verwendung nur einer Zeitform — des Pr¨

asens — und die Verwendung ei-

nes bestimmten Modus — entweder Indikativ oder Konjunktiv — wobei der

Konjunktiv in Voraussetzungen verwendet wird.

Der Genus Verbi — Passiv und Aktiv — wird in der deutschen Gegenwartss-

prache ungleich verwendet: 93% entfallen auf den Aktiv und 7% auf den

Passiv [Dud01, S. 172]. In der Mathematik dagegen tritt der Passiv h¨

ochst sel-

ten auf. So wird in Definition selten die Bezeichnung ”wird genannt“ verwendet.

Beispiel

[...]Dann wird der Ausdruck P∞

k=cakReihe genannt. [Wue95, S. 119]

Außerdem scheint die Anzahl der verwendeten Verben gering zu sein. Dabei

treten besonders h¨

aufig die W¨

orter ”sein“ sowie ”heißen“, ”existieren“, ”ge-

ben“, ”folgen“ usw. auf. Einige dieser W¨

orter stehen als ¨

Aquivalent f¨

ur logische

Operatoren (”folgen“) und Quantoren (”existieren“). Andere W¨

orter hingegen

sind an die Entit¨

aten gebunden. So findet man in [Fis00] bei ca. 34 explizit als

Entit¨

at angegebenen Definitionen 28 mal das Wort heißen (82 %). In [Wue95]

wird heißen bei 173 Definitionen 92 mal (53 %) gebraucht und ”:⇔“ 31 mal (15

%).

Durch die Verwendung von mathematischen Symbolen entstehen grundlegende

Schwierigkeiten f¨

ur die syntaktische und semantische Analyse. Mathematische

Symbolfolgen wie z. B. Formeln weisen eine ihnen eigene Syntax auf, die zwar

prinzipiell einfach ist und auch durch die Pr¨

adikatenlogik strukturiert wird,

3.3. SPRACHSTRUKTUREN 109

jedoch nicht kompatibel zur syntaktischen Struktur der nat¨

urlichsprachlichen

Texte ist.

Mathematische Zeichen werden h¨

aufig im Zusammenhang mit und als Nomi-

nalphrasen verwendet und stellen in mathematischen Texten eine ¨

aquivalente

Bezeichnung f¨

ur diese dar.

Beispiel

1. Jedes Polynom f∈C(f)zerf¨

allt in Linearfaktoren, [...] [Fis00, S. 63]

2. Rzusammen mit der Addition +ist eine abelsche Gruppe. [Fis00, S. 54]

Vielfach werden im weiteren Verlauf eines Textes nur noch diese Abk¨

urzun-

gen verwendet, so dass mathematische Zeichen in einer linguistischen Analyse

ber¨

ucksichtigt werden m¨

ussen. Die interne Struktur solcher Symbolfolgen kann

komplex sein. So kann es passieren, dass in ihnen weitere f¨

ur die linguistische

Analyse wertvolle Informationen enthalten sind.

Beispiel

{an}n∈Nbeschr¨

ankt :⇔es gibt ein c∈Rmit |an|≥ c(n∈N).

[Wue95, S. 108]

Des Weiteren enthalten mathematische Entit¨

aten auch grammatikalisch nicht

korrekte Strukturen, z. B. ”finjektiv.“. So fehlt h¨

aufig bei Aufz¨

ahlungen das

entsprechende Verb. Solche Strukturen gilt es zu erkennen und gegebenenfalls

zu behandeln.

Eine besondere Problematik entsteht durch die zahlreichen Unterschiede der

Sprachstile der verschiedenen Autoren. So verwendet jeder Autor eine f¨

ur ihn

spezifische Sammlung von Phrasen.

Ein mathematischer Text ist aber kein Schulaufsatz, bei dem die

Ausdrucksvielfalt die entscheidende Rolle spielt; dennoch steht dem

sensiblen Schreiber zur Formulierung eines logischen Schlusses eine

Vielfalt von Ausdrucksm¨

oglichkeiten offen. [Beu95, S. 33]

110 KAPITEL 3. MATHEMATISCHE STRUKTUREN

Basiskonstruktionen.

In der mathematischen Sprache treten immer wiederkehrende Satzkonstruktio-

nen auf, die als syntaktische Grundlage die Pr¨

adikatenlogik widerspiegeln. Hier-

bei werden den logischen Operatoren sprachliche Pendants zugeordnet. Sicher-

lich gibt es dabei eine Vielzahl an sprachlichen Ausdrucksm¨

oglichkeiten f¨

ur die

Formulierung der logischen Operatoren, die insbesondere in den Zwischentex-

ten wie z. B. in Motivationen in der mathematischen Literatur h¨

aufig verwendet

werden. In den festgelegten Entit¨

aten werden die Zuordnungen dagegen streng

gehandhabt, so dass nur eine geringe Anzahl von Standardformulierungen exis-

tiert.

Implikationen A⇒B.In Kapitel 3.3.2 wurde festgestellt, dass eine Impli-

kation stets aus einer Forderung und einer Folgerung besteht. Da Implikationen

in mathematischen Texten vielfach verwendet werden, gibt es zahlreiche Stan-

dardformulierungen f¨

ur diesen logischen Operator. Eine der h¨

aufigsten Stan-

dardkonstruktionen, die in S¨

atzen verwendet wird, ist:

[VERB1] A, (so/dann) [VERB2] B.

Die Bezeichnung [VERB] steht f¨

ur ein beliebiges Verb, das in der mathema-

tischen Sprache an dieser Stelle gesetzt wird. Dabei tritt das Verb ”sein“ beson-

ders h¨

aufig in beiden m¨

oglichen Positionen [VERB1] und [VERB2] auf. Dagegen

wird das Verb ”gelten“ h¨

aufig in der Position [VERB2] eingesetzt.

Beispiel 3.3.5 (Implikation I)

•Sind f, g ∈K[t]und ist g6= 0,so gibt es dazu eindeutig bestimmte

Polynome q, r ∈K[t]derart, dass f=q·g+rund deg r < deg g. [Lor96,

S. 15]

Der Satz besteht nach Abbildung 3.10 aus einer Folgerung und einer For-

derung. Jede dieser Binnenstrukturen besitzt einen Indikator, der sie als

Folgerung oder Forderung kennzeichnet, und einen mathematischen In-

halt.

3.3. SPRACHSTRUKTUREN 111

Satz

Forderung Folgerung

Indikator Inhalt Indikator Inhalt

notwendig und hinreichend dafür, dass [...][...] Dann

Abbildung 3.10: Basisstrukturanalyse f¨

ur Implikationskonstruktionen

•Konvergiert die Potenzreihe Pin einem Punkt z06= 0, so konvergiert sie

absolut in jedem Punkt z∈Cmit |z|<|z0|. [K¨

o01, S. 51]

Weitere Konstruktionen, die der obigen Standardformulierung sehr ¨

ahnlich sind,

aber nicht so oft verwendet werden, sind:

•wenn A[SEIN/GELTEN], dann [SEIN/GELTEN] B;

•wenn A[GELTEN], so [GELTEN] B;

•falls A[VERB], dann [VERB] B;

•B[VERB] (nur/h¨

ochstens) dann, wenn A;

Beispiel 3.3.6 (Implikation II)

Sei A⊂V.Falls f¨

ur ein a∈A Ta(A)Teilraum von V,dann ist Tb(A)Teilraum

f¨

ur alle b∈A, also Aein affiner Teilraum von V. [Wue95, S. 388 (2) – Satz]

Durch die Verwendung der W¨

orter hinreichend und notwendig entstehen fol-

gende Bedeutungen: Hinreichend steht daf¨

ur, dass die Forderung Aausreicht

damit auch die Folgerung Bwahr ist. Die Bezeichnung notwendig steht daf¨

ur,

dass ohne die Folgerung Bdie Forderung Anicht erf¨

ullt sein kann15.

15Ahinreichend f¨

ur B: A⇒B;Anotwendig f¨

ur B:B⇒A

112 KAPITEL 3. MATHEMATISCHE STRUKTUREN

Satz

Forderung Folgerung

Indikator Inhalt Indikator Inhalt

[...] dann [...]Falls

Abbildung 3.11: Basisstrukturanalyse f¨

ur Implikationskonstruktionen

•Aist hinreichend f¨

ur/ dies ist hinreichend f¨

ur/dies ist eine hinreichende

Bedingung f¨

ur B;

•Aist notwendig f¨

ur/ eine notwendige Bedingung daf¨

ur ist B;

Beispiel 3.3.7 (Implikation III)

Die offene Menge U⊂Rnsei wegzusammenh¨

angend und f:U−→ Rsei

differenzierbar.

Dann ist die Bedingung

f0(x,h) = 0 f¨

ur alle x∈Uund f¨

ur alle h∈Rn

notwendig und hinreichend daf¨

ur, dass fkonstant ist. [BF96, S.116]

Forderung

Satz

Folgerung

Indikator Inhalt Indikator Inhalt

Dann [...] notwendig und hinreichend dafür, dass [...]

Abbildung 3.12: Basisstrukturanalyse f¨

ur Implikationskonstruktionen

3.3. SPRACHSTRUKTUREN 113

In der deutschen Lehrbuchliteratur wird auch oftmals das Wort folgern anstel-

le von implizieren verwendet. Aus diesen beiden Verben k¨

onnen verschiedene

Konstruktionen gebildet werden:

•aus Afolgt B

•Adies hat zu Folge, dass/ man kann folgern, dass B

•Afolglich [VERB] B;

•A, dies impliziert B;

•A,daraus ergibt sich/ daraus erhalten wir/ das bedeutet B;

Beispiel 3.3.8 (Implikation IV)

Sei Vein K-Vektorraum. Eine endliche Familie (v1,...,vr)von Vektoren aus

Vheißt linear unabh¨

angig,falls gilt: Sind λ1,...,λr∈Kund ist

λ1v1+...+λrvr= 0,

so folgt

λ1=...=λr= 0.

[Fis00, S.77]

¨

Aquivalenz: A⇔B.Im Kapitel 3.3.2 wurde neben der Implikation auch die

¨

Aquivalenz als weiterer wichtiger logischer Operator f¨

ur die Konstruktion von

mathematischen S¨

atzen verwendet. Dabei wird eine Aussage zu einer anderen

Aussage ¨

aquivalent gesetzt. Auch f¨

ur die ¨

Aquivalenz gibt es Standardkonstruk-

tionen:

114 KAPITEL 3. MATHEMATISCHE STRUKTUREN

•Aist ¨

aquivalent zu/ gleichbedeutend mit B;

•A[gelten] genau dann, wenn B[gelten];

•A[gelten] dann und nur dann, wenn B[gelten];

•A[sein] hinreichend und notwendig f¨

ur B;

Beispiel 3.3.9 ( ¨

Aquivalenz)

•Eine Reihe Pkakmit Gliedern ak≥0konvergiert genau dann, wenn die

Folge ihrer Partialsummen beschr¨

ankt ist. [K¨

o01, S.61 – Satz]

Satz

Aussage 1 Aussage 2

Inhalt Indikator

genau dann, wenn

Inhalt

[...][...]

Abbildung 3.13: Basisstrukturanalyse f¨

ur ¨

Aquivalenzkonstruktionen

In der Abbildung 3.13 ist die Struktur des Satzes schematisch dargestellt.

Die beiden Aussagen werden durch den Indikator ”genau dann, wenn“

verbunden.

•Ist Xeine endliche Menge, so sind f¨

ur die Abbildung f:X−→ Xfolgende

Bedingungen ¨

aquivalent:

i) fist injektiv.

ii) fist surjektiv.

iii) fist bijektiv.

[Fis00, S.34]

In der Abbildung 3.14 werden drei Aussagen ¨

uber einen Indikator verbun-

den.

3.3. SPRACHSTRUKTUREN 115

Satz

Aussage 1

Inhalt Inhalt Inhalt

[...] [...]

Indikator

folgende Bedingungen äquivalent:

[...]

Aussage 2Aussage 2

Abbildung 3.14: Basisstrukturanalyse f¨

ur ¨

Aquivalenzkonstruktionen

Negation ¬, Konjunktion ∧und Disjunktion ∨.Diese drei Junktoren

werden im allgemeinen sehr einfach konstruiert. F¨

ur die Negation stehen sprach-

liche Konstrukte wie ”kein“ und ”nicht“ zur Verf¨

ugung. F¨

ur die Konjunktion

wird sehr h¨

aufig das Wort ”und“ verwendet. Man kann aber auch Konstruk-

tionen wie ”sowohl Aals auch B“ vorfinden. F¨

ur die Disjunktion findet man

haupts¨

achlich ”oder“-Konstruktionen16.

Beispiel 3.3.10 (Negation und Konjunktion)

•Sei f∈R[t]und λ∈Ceine nicht reelle Nullstelle von f,sowie

g:= (t−λ)(t−¯

λ)∈C[t].[...][Fis00, S. 64]

•Ist Kein K¨

orper, so ist char(K)entweder Null oder eine Primzahl17.

[Fis00, S. 57]

NP

ADJ

NEG NPNPNDET

eine nicht reelle Nullstelle

NP

Konjunktion

Disjunktion

Abbildung 3.15: Basisstrukturanalyse von Quantorenkonstruktionen

16Allerdings muss mit dem Wort oder vorsichtig umgegangen werden, so ist z. B. entweder

[. . .]oder keine Disjunktion

17Hier wird implizit sogar mehr gesagt: Null ist keine Primzahl.

116 KAPITEL 3. MATHEMATISCHE STRUKTUREN

In Abbildung 3.15 wird auf der linken Seite die Nominalphrase ”eine nicht reelle

Nullstelle“ in einen Artikel, ein Substantiv und ein getyptes Adjektiv zerlegt.

Der Typ NEG bedeutet, dass das Adjektiv verneint wird. Auf der rechten Seite

setzt sich eine Nominalphrase aus zwei weiteren Nominalphrasen zusammen, die

durch eine Konjunktion ”und“ oder eine Disjunktion ”oder“ verbunden sind.

Quantoren Durch die Verwendung von Quantoren der Pr¨

adikatenlogik wird

die syntaktische sowie die semantische Struktur reichhaltiger. Wir unterschei-

den zwei Arten von Quantoren, Allquantor und Existenzquantor, die ebenfalls in

ihrer sprachlichen Form Standardkonstruktionen besitzen. Folgende Standard-

konstruktionen werden f¨

ur den Allquantor verwendet:

•F¨

ur alle/jedes/ein beliebiges x[...]

•Jedes / zu jedem x[...]

•Alle x[...]

•Sei xbeliebig [...]

Beispiel 3.3.11 (Allquantor)

F¨

ur alle Regelfunktionen f1, f2, f und [...] [BF00, S.356]

Ein weiterer Quantor ist der Existenzquantor, der nur die Existenz eines be-

stimmten Objektes kennzeichnet. Auch daf¨

ur existieren Standardkonstruktio-

nen:

•Es gibt ein x[...];

•F¨

ur ein geeignetes xgilt [...];

•[SEIN/HABEN] ein x[...];

3.3. SPRACHSTRUKTUREN 117

Beispiel 3.3.12 (Existenzquantor)

Jedes Polynom f∈C[t]zerf¨

allt in Linearfaktoren, d. h. es gibt ein aund

λ1,...λn∈Cmit n= deg f, so dass f=a(t−λ1)·...·(t−λn).[Fis00,

S.63]

N

NP NP

QUANT

ALL N QUANT EX

Für alle Regelfunktionen Es gibt ein a

Abbildung 3.16: Basisstrukturenanalyse

In Abbildung 3.16 wird die Nominalphrase in einen Quantor (QUANT) und ein

Substantiv zerlegt. Der Allquantor wird durch ALL und der Existenzquantor

durch EX getypt.

Mengentheoretische Bezeichnungen. Auch f¨

ur das nicht-logische Zeichen

∈gibt es sprachliche Standardkonstruktionen. Man beachte jedoch, dass in Tex-

ten fast ausschließlich die Abk¨

urzung verwendet wird:

1. [...] ist Element von [...]

2. [...] kommt in [...] vor

Beispiel 3.3.13 (Elemente von Mengen)

F¨

ur alle Regelfunktionen f1, f2, f und alle c∈ R gilt [...]([BF00, S.356])

Voraussetzung. Jeder Satz und jede Definition in der Mathematik besitzt in

seiner Binnenstruktur die Festlegung von Voraussetzungen, d. h. die Festlegung

derjenigen mathematischen Objekten, die in der Entit¨

at verwendet werden. Die

Aufz¨

ahlung von Voraussetzungen erkennt man deutlich an der syntaktischen

Struktur, die im untenstehenden Kasten schematisch dargestellt wird. Dabei

118 KAPITEL 3. MATHEMATISCHE STRUKTUREN

wird sehr h¨

aufig das Verb ”sein“ mit den Verbformen ”sei“ und ”seien“ ver-

wendet.

(es) sei [...], ist [...], f¨

ur [...], gegeben (ist/sei) [...], es gelte [. . .]

Beispiel 3.3.14 (Voraussetzung)

1. ”Sei Vein Vektorraum ¨

uber den K¨

orper Kund Teine linear unabh¨

angige

Teilmenge von V.“ [Lor96]

2. ”Ist Fein Zwischenk¨

orper der algebraischen Erweiterung E/K, so gilt

[E:K]s= [E:F]s·[F:K]s“ [Lor96, S.87]

3. ”F¨

ur teilerfremde Ideale I1, I2von Rgilt I1I2=I1∩I2“ [Lor96, S.54]

4. ”Gegeben seien Abbildungen fi:Xi−→ Yi, i ∈I, Xi6=∅,zwischen to-

pologischen R¨

aumen Xiund Yi. Die Abbildung f:Qi∈IXi→Qi∈IYi

(xi)i∈I7→ (fi(xi))xi∈Iist genau dann stetig, wenn f¨

ur alle i∈Idie Abbil-

dungen fistetig sind.“ [vQ01, S.41]

5. ”Es gelte fk∈ L1(Rn)und ...“ [BF96, S.302]

In Abbildung 3.17 wird die Analyse des einfaches Satzes ”Sei Vein Vektorraum

¨

uber K“ aus Beispiel 3.3.14 skizziert. Das Verb ”sei“ wird auf die Position

2 hinter der Nominalphrase verschoben und in den Indikativ umgewandelt18.

Danach wird der Satz nach bekanntem Muster zerlegt (Kapitel 2.4). In einem

n¨

achsten Schritt werden die Nominalphrase als das Definiendum und das in der

Verbalphrase befindliche Definiens erkannt.

Satzstrukturen in Entit¨

aten

Axiom. An der Satzstruktur kann man Axiome nicht unbedingt erkennen, da

sie syntaktisch mit S¨

atzen und Definitionen gleichzusetzen sind. Daher findet

man beide syntaktischen Strukturen wieder, die miteinander vermischt werden.

18Im mArachna-Projekt werden Prepositionalphrasen (PP) ohne Ausnahme als spezielle

Nominalphrase verarbeitet, jedoch zur Zeit noch nicht gesondert aufgef¨

uhrt.

3.3. SPRACHSTRUKTUREN 119

Satz

NP VP

V NP

V ist ein Vektorraum über K.

Definiens

V ein Vektorraum über K.

ist

Sei V ein Vektorraum über K.

Vorverarbeitung

[ist, V , Vektorraum über K]

Definiendum

Abbildung 3.17: Analyse der Voraussetzungen

Beispiel 3.3.15 (Axiom 3.2.7)

Leere Menge: Es gibt eine leere Menge.

Definition. Definitionen sind relativ einfache Strukturen, die leicht ¨

uber das

verwendete Verb erkannt werden. Außerdem steht nur eine begrenzte Anzahl

von Verben zur Verf¨

ugung: ”heißen“, ”bezeichnen“, ”nennen“, ”definieren“, usw.

H¨

aufig ist das Definiendum gegen¨

uber den anderen W¨

orter in der Entit¨

at her-

vorgehoben. Ebenfalls sehr h¨

aufig werden Klammern verwendet, die eine Nomi-

nalphrase einschließen und somit auch ein Definiendum sein k¨

onnen. Diese Art

des Definierens wird h¨

aufig in der Eigenschaftsauflistung verwendet, die dann

eine Formel bzw. eine Aussage bezeichnet (Kapitel 3.3.4).

Eine h¨

aufige Grundstruktur ist:

120 KAPITEL 3. MATHEMATISCHE STRUKTUREN

Definiendum Symbol heißt Definiendum Bezeichnung wenn gilt:

•Eigenschaften

In den Eigenschaften werden mathematische Aussagen aufgelistet, die ihrerseits

auch wieder einen Namen bekommen k¨

onnen. Sie k¨

onnen aber auch nur mathe-

matische Formeln bzw. Aussagen sein.

Beispiel 3.3.16 (Gruppe)

Eine Menge Gzusammen mit einer Verkn¨

upfung ∗heißt Gruppe, wenn folgende

[Eigenschaften] erf¨

ullt sind:

G1 (a∗b)∗c=a∗(b∗c)f¨

ur alle a, b, c ∈G(Assoziativgesetz)

G2 Es gibt ein e∈G(neutrales Element genannt) mit den folgenden Eigen-

schaften:

–e∗a=af¨

ur alle g∈G

–Zu jedem a∈Ggibt ein a0∈G(inverses Element von a genannt)

mit a0∗a=e.

[Fis00, S.41]

Analyse des Beispiel 3.3.16 Die Definition aus dem Beispiel 3.3.16 kann in

Unterabschnitte zerlegt werden:

Teil 1: Eine Menge Gzusammen mit einer Verkn¨

upfung ∗heißt Gruppe, wenn

folgende Eigenschaften erf¨

ullt sind:;

Teil 2: (a∗b)∗c=a∗(b∗c)f¨

ur alle a, b, c ∈G(Assoziativgesetz);

Teil 3: Es gibt ein e∈G(neutrales Element genannt) mit den folgenden Ei-

genschaften:

Teil 4: e∗a=af¨

ur alle g∈G

Teil 5: Zu jedem a∈Ggibt ein a0∈Ginverses Element von a genannt) mit

a0∗a=e.

3.3. SPRACHSTRUKTUREN 121

Satz

Hauptsatz Nebensatz

heißt

NP VP

V NP NP NP

NP VP

folgende Axiome sind erfüllt

Verknüpfung [Symbol] GruppeEine Menge [Symbol]

Konjunktion: wenn

Abbildung 3.18: Syntaktische Analyse des Beispiels 3.3.16 — Teil 1

Teil 1 in der Definition l¨

asst sich in Hauptsatz und Nebensatz zerlegen. Der

Hauptsatz definiert die Gruppe, gekennzeichnet durch das Verb heißen. In Ab-

bildung 3.18 ist die syntaktische Analyse des Hauptsatzes auf der linken Seite

zu sehen. Die Struktur l¨

asst sich leicht aufl¨

osen. Der Nebensatz leitet die Ei-

genschaftsliste ein, gleichzeitig wird durch die Konstruktion ”wenn [. . .]erf¨

ullt

sind“ gesagt, dass die Definition nur gilt, wenn die folgenden Eigenschaften

erf¨

ullt werden.

Teil 2, 3 und 4 ist syntaktisch ebenfalls leicht zu analysieren. Eine Formel gefolgt

von einer Klammer deutet auf eine Definition hin. Daher wird der Satz durch

eine Vorverarbeitungsregel19 in eine Aussage und eine Definition zerlegt. Diese

werden dann getrennt syntaktisch analysiert. Des Weiteren wird hierbei eine

Formel [F1] wie ein Substantiv behandelt. Da es kein Substantiv ist, wird im

weiteren Verlauf eine Formel einen neuen Worttyp MathWord zugeordnet.

Eine weitere Konstruktionsm¨

oglichkeit wird durch mathematische Symbole ge-

geben. So kann der ¨

Aquivalenzoperator ”⇔“ verwendet werden, um ein Defi-

niendum zu definieren, wobei es dann leicht als solches zu erkennen ist wegen

”:“:

Beispiel 3.3.17

Sei A⊂R

(1) Aoffen :⇔zu x∈Aexistiert eine ε-Umgebung Uε(x)von xmit Uε(x)⊂A.

[...]

19Die Bildung der Vorverarbeitungsregeln werden anhand des Beispieles im Kapitel 4 n¨

aher

erl¨

autert.

122 KAPITEL 3. MATHEMATISCHE STRUKTUREN

[F1] für alle [F2] (Assoziativgesetz).

Für alle [F2] gilt [F1].

[F1] heißt Assoziativgesetz.

Satz

NP VP

V NPMW QUANT

NP VP

VMW

Für alle gilt [F1] [F1] heißt Assoziativgesetz

Satz

NP

[F2]

Vorverarbeitung

Abbildung 3.19: Syntaktische Analyse des Beispiels 3.3.16 — Teil 2

[Wue95, S.86]

In diesem Fall wird die linke Seite des Satzes als Definiendum angenommen. Der

Satz auf der rechten Seite ist das Definiens und muss weiter analysiert werden.

Weitere Beispiele f¨

ur Definitionen sind:

Beispiel 3.3.18 (Dimension eines Vektorraums)

Ist Vein K-Vektorraum,so definieren wir

dimK(V) = (∞,falls Vkeine endliche Basis besitzt,

r, falls Veine Basis der L¨

ange rbesitzt.

dimKVheißt die Dimension von V¨

uber K.[...][Fis00, S.86]

Beispiel 3.3.19 (Zeilenrang und Spaltenrang einer Matrix)

F¨

ur eine Matrix A∈M(m×n;K)sei

Zeilenrang A=dim ZR(A)und

Spaltenrang A=dim SR(A)

[Fis00, S.91]

3.3. SPRACHSTRUKTUREN 123

Satz

NP VP

V NP

NP VP

V NP MW

gibt [F1] neutrales Element

Satz

Es gibt ein [F3] mit folgenden Eigenschaften

P

Es

[F3] heißt neutrales Element

Es gibt ein [F3] (neutrales Element genannt) mit folgenden Eigenschaften:

[F1] mit folgenden Eigenschaften heißt

Vorverarbeitung

Abbildung 3.20: Syntaktische Analyse des Beispiels 3.3.16 — Teil 3

Satz

NP VP NP VP

V NP MW

gibt es heißt inveres Element von [F6]

Satz

Zu jedem [F4] gibt es ein [F5] (inverses Element vom [F6] genannt) mit [F7].

Zu jedem [F4] gibt es ein [F5] mit [F7].

[F5] heißt inverses Element von [F6]

QUANT MW V NP

Zu jedem [F4] ein [F5] mit [F7] [F5]

Vorverarbeitung

Abbildung 3.21: Syntaktische Analyse des Beispiels 3.3.16 — Teil 4

Beispiel 3.3.20 (Reihe)

Seien c∈Z,Zcein Zahlenabschnitt, und {az}z∈Zceine Folge. Dann wird der

Ausdruck

∞

X

k=c

ak

Reihe genannt.[Wue95, S.119]

Beispiel 3.3.21

F¨

ur a > 0, b ∈Rist die allgemeine Potenz definiert durch ab:= eblog a.[Wue95,

S.186]

124 KAPITEL 3. MATHEMATISCHE STRUKTUREN

Beispiel 3.3.22

Unter einer Stammfunktion zu einer Funktion fauf einem Intervall Iverstehen

wir eine Funktion F:I−→ Cwie folgt:

(i) Fist stetig;

(ii) Fist außerhalb einer h¨

ochstens abz¨

ahlbaren ,,Ausnahme“-Menge A⊂I

differenzierbar, und f¨

ur alle x∈I\Agilt F0(x) = f(x).

[K¨

o01, S.166]

Beispiel 3.3.23

Wir nennen eine Funktion f:I−→ Cfast ¨

uberall stetig differenzierbar,wenn

sie eine Stammfunktion einer Regelfunktion auf Iist. [K¨

o01, S.202]]

Satztypen. In der mathematischen Sprache sind S¨

atze bewiesene Aussagen,

die den Wahrheitswert wahr besitzen. Die gesamte Mathematik besteht aus einer

Menge von Aussagen, die sich aus Axiomen logisch ableiten lassen. Im Kapitel

3.3.2 wurde gezeigt, dass S¨

atze aus einer Voraussetzung und einer Aussage be-

stehen. Es existieren drei verschiedene Typen von Aussagen: einfache S¨

atze,

S¨

atze, die Implikationen beschreiben, und S¨

atze, die ¨

Aquivalenzen beschreiben.

Die typischen Standardkonstruktionen tauchen daher wieder in den S¨

atzen auf:

wenn [...] dann usw. Diese wurden im Kapitel 3.3.3 betrachtet. Allerdings

wurden dort nur die singul¨

aren Eigenschaften aufgelistet. Die Verwendung von

Standardkonstruktionen in S¨

atzen kann durch die zus¨

atzliche Verwendung von

logischen Operatoren und Quantoren komplex werden.

Wie in den vorherigen Abschnitten festgestellt wurde, weisen die verschiedenen

Satzentit¨

aten — Fundamentals¨

atze, Theoreme, S¨

atze, Propositionen, Korollare,

Lemmata und Hilfss¨

atze — keine charakteristischen Unterschiede auf. Daher

sollen diese in der weiteren Betrachtung gemeinsam analysiert werden.

Beispiel 3.3.24 (Fundamentalsatz der Algebra)

Jedes Polynom f∈C[t]mit deg f > 0hat mindestens eine Nullstelle. [Fis00, S.

63]

3.3. SPRACHSTRUKTUREN 125

VP

NP

S

NP

QUANT NP

ALL

Jedes

NP

Polynom [Symbol]

V

QUANTEX NP

Nullstelle.mindestens eine

P S

mit [Symbol]

hat

PP

Abbildung 3.22: Syntaktische Analyse des Fundamentalsatzes der Algebra

Analyse des Beispiels 3.3.24. In Abbildung 3.22 wird die syntaktische Ana-

lyse des Fundamentalsatzes dargestellt. Die Struktur des Satzes ist dabei relativ

einfach. Unter anderem treten in diesem Satz der Allquantor ”jedes“ und der

Existenzquantor ”mindestens eine“ auf. Etwas komplexer ist der in der Abbil-

dung gr¨

un markierte Bereich. Eine semantische Analyse l¨

asst sich daf¨

ur nicht

mehr so einfach nachvollziehen. Im Kapitel 3.4 soll dies n¨

aher betrachtet werden.

Beispiel 3.3.25 (Theorem)

Jeder Vektorraum besitzt eine Basis. [Fis00, S. 83]

S

NP

NQUANT

Jeder Vektorraum

VP

V

hat

NP

DET N

eine Basis

Abbildung 3.23: Syntaktische Analyse des Theorems

Beispiel 3.3.26 (Basisauswahlsatz)

Sei Beine Menge von Vektoren des Vektorraums V.Bist genau dann eine

Basis, wenn Bein minimales Erzeugendensystem ist. (nach [Beu94, S. 59])

126 KAPITEL 3. MATHEMATISCHE STRUKTUREN

ist

Basis minimales Erzeugendensystem

S

Konjunktion: wenn

Hauptsatz Nebensatz

NP VPNP VP

V NP V NP

ist Basis B

B istwennB

B minimales Erzeugendensystem

B ist genau dann eine Basis, wenn B ein minimales Erzeugendensystem ist.

ist

Vorverarbeitung

Abbildung 3.24: Analyse des Basisauswahlsatzes

Analyse des Beispiels 3.3.26. Die syntaktische Analyse des Basisauswahl-

satzes ist etwas komplizierter (Abbildung 3.24). Durch Transformationen wird

der Satz in seine Einzelbestandteile zerlegt, Phrasen ersetzt und Verben umsor-

tiert. Dadurch entstehen strukturierte Satzbausteine, die syntaktisch nach dem

Chomsky-Modell (Kapitel 2.4) analysiert werden k¨

onnen.

Beispiel 3.3.27 (Satz ohne Namen)

Der L¨

osungsraum des linearen Gleichungssystems A·x=bist genau dann nicht

leer, wenn rang A=rang (A, b). [Fis00, S. 123]

Beispiel 3.3.28 (Korollar)

Sei Kein beliebiger K¨

orper, f∈K[t]ein Polynom und kdie Anzahl der Null-

stellen von f. Ist fvom Nullpolynom verschieden, so gilt k≤deg f. [Fis00,

S.62]

Beispiel 3.3.29 (Lemma)

Jede konvergente Folge ist beschr¨

ankt. [K¨

o01, S. 46]

3.3. SPRACHSTRUKTUREN 127

Beispiel 3.3.30 (Proposition)

F¨

ur A∈M(m×n;K)und b∈Kmsind folgende Bedingungen gleichwertig:

1. Das lineare Gleichungssystem A·x=bist eindeutig l¨

osbar.

2. rang A=rang (A, b) = n.

[Fis00, S. 127]

3.3.4 Wortebene

Wie auch in anderen Fachsprachen (Kapitel 2.4.4) ist ein wesentliches Merk-

mal der Mathematik ihr Wortschatz. Die Vielfalt und die Variationsbreite der

W¨

orter ist groß. So w¨

achst der Wortschatz der Mathematik t¨

aglich durch neu

ver¨

offentlichte Publikationen. Durch die strenge Strukturierung und den An-

spruch, eine exakte Wissenschaft zu sein, l¨

asst sich diese Vielfalt strukturell

organisieren (Kapitel 3.4) und somit eine Terminologie der Mathematik aufbau-

en.

Bei der Betrachtung des Wortschatzes kann zwischen außerfachsprachlichen

W¨

ortern und W¨

ortern, die nur in der betrachteten Fachsprache verwendet wer-

den, unterschieden werden [GHL02, S. 618]. So verwendet auch die Mathematik

Begriffe aus dem allt¨

aglichen Wortschatz, wie z. B. Knoten,Quelle,Wurzel,

Raum usw., die jedoch fachspezifisch angewendet werden. Dies beinhaltet zwar

Gefahren f¨

ur den unge¨

ubten mathematischen Laien, der den Begriffen eine allzu

anschauliche Bedeutung beimisst. Jedoch besteht bei einer computergest¨

utzten

Analyse keine solche Gefahr, wenn diese nur f¨

ur die Fachsprache durchgef¨

uhrt

und somit auf die Dom¨

ane reduziert wird. Eine computergest¨

utzte linguistische

Analyse hat keine Anschauung ¨

uber die Bezeichnungen von mathematischen

Objekten. Probleme treten erst dann auf, wenn einem Begriff mehrere Bedeu-

tungen zugeordnet werden k¨

onnen.

Problematisch ist in der Mathematik, dass einem Sachverhalt oder dem Ge-

genstand der Betrachtungen mehreren Begriffe zugeordnet werden k¨

onnen. So

beschreiben die Bezeichnungen Multiplikation mit Skalaren und skalare Multi-

plikation denselben Sachverhalt. Vielfach werden alternative Bezeichnungen ge-

nannt, indem sie hinter dem eigentlichen Begriff in Klammern gesetzt werden,

128 KAPITEL 3. MATHEMATISCHE STRUKTUREN

wie z. B. ”Multiplikation mit Skalaren (auch skalare Multiplikation genannt)“.

Schwieriger wird es jedoch, wenn sich in einer Entit¨

at die Bezeichnung f¨

ur einen

Sachverhalt ¨

andert:

Beispiel 3.3.31 (...)

b) Das inverse Element a0ist eindeutig und hat auch die Eigenschaft a·a0=e

f¨

ur alle a∈G.

c) Da das Inverse nach b) eindeutig bestimmt ist, kann man es mit a−1be-

zeichnen. [...].

[Fis00, S. 45]

Die Begriffsbildung in der Mathematik ist sehr einfach. Eine terminologische

Bezeichnung besitzt meistens eine eindeutige Zuordnung. So lassen sich einige

der oben genannten Konstruktionen aufl¨

osen, indem standardisierte Konstruk-

tionsm¨

oglichkeiten vorgegeben werden, wie z. B. Kantengraph und Graph [Arti-

kel/Pr¨

aposition] Kante. Beide Konstruktionen k¨

onnen dann synonym verwendet

werden. Die Verwendung von zwei Substantiven zur Wortbildung (Komposition)

tritt h¨

aufig in anwendungsbezogener mathematischer Literatur auf.

In der Mathematik treten h¨

aufig Fremdw¨

orter aus dem Griechisch-Lateinischen

auf, wie z. B. ”linear“ (lat.: l¯

ine¯aris), ¨

aquivalent (lat.: aequival¯ens), Geometrie

(gr.-lat.: ge¯ometr´ıa) usw.

H¨

aufig werden Eigennamen f¨

ur die Entdecker von Sachverhalten verwendet. So

gibt es z. B. das Lemma von Zorn, die Cauchy-Folge und den Hilbertraum. Sel-

tener tritt dagegen die Verwendung von Symbolen und Ziffern in W¨

ortern auf,

z. B. in L-quadratintegrierbar,1.Ordnung und -Umgebung. Akronyme treten

z. B. in der Lineare Algebra und Analysis fast nicht auf.

In der mathematischen Sprache werden h¨

aufig Mehrwortbezeichnungen verwen-

det. Dabei wird meistens ein Adjektiv mit einem Substantiv verbunden, so

dass eine feststehende Nominalphrase konstruiert wird, die einen Sachverhalt

beschreibt, z. B. stetige Funktion,leere Menge,geometrische Reihe usw. Diese

Adjektive schr¨

anken damit den Geltungsbereich des Substantivs ein. In die-

sem Zusammenhang ist das Negationspartikel nicht zu nennen, das mit dem

Adjektiv in Verbindung tritt, z. B. nicht leere Menge. Allerdings gibt es f¨

ur

diese Wortverbindungen verschiedene Schreibweisen, wie nichtleere Menge oder

3.3. SPRACHSTRUKTUREN 129

nicht-leere Menge. Weitere Mehrwortbezeichnungen entstehen durch pr¨

apositio-

nale Erg¨

anzungen wie z. B. ¨

Aquivalenzrelation auf der Menge X,Homomorphis-

mus von Gruppen, wodurch eine enge semantische Beziehung zwischen Verb und

Objekt des Satzes ausgedr¨

uckt wird, sowie durch die Verwendung des Genitives

possessivus (Teilmenge Keines metrischen Raumes M). Bei der Bezeichnung

eines Sachverhaltes durch Adjektive k¨

onnen zwei Adjektive auch hintereinander

angeordnet werden, z. B. absolut konvergent,linear unabh¨

angig.

Die Komparation von Adjektiven erfolgt nicht. So gibt es nicht die Steigerung

– surjektiv – surjektiver – am surjektivsten. Adverbien werden nur in einge-

schr¨

anktem Maße verwendet. So werden modale Adverbien (gern,unverz¨

uglich

usw.) nicht verwendet. Dagegen werden kausale Adverbien eingesetzt, z. B. an-

dernfalls,somit usw. Die Ursache daf¨

ur ist, dass zahlreiche kausale Adverbien

auch konjunktionale Funktionen ¨

ubernehmen k¨

onnen, die durch Implikations-

aussagen verursacht werden.

So ist der Begriffs- und Wortbildungsprozess sehr viel eingeschr¨

ankter als in

anderen Fachsprachen, die deutlich mehr M¨

oglichkeiten bieten, um Begriffe und

W¨

orter zu konstruieren [GHL02, S. 619ff]

3.3.5 Symbolebene

Die mathematische Sprache enth¨

alt eine reichhaltige Sammlung von mathema-

tischen Zeichen. Diese Zeichen und Symbole k¨

onnen einerseits direkt hinter ei-

nem Begriff stehen, wie z. B. Ring R,Menge M, andererseits werden sie als

¨

aquivalente Bezeichnung f¨

ur den entsprechenden Begriff verwendet. So wird das

Symbol Rf¨

ur den Begriff reelle Zahlen eingesetzt.

Nicht nur einzelne Zeichen werden so verwendet, sondern auch Terme und For-

meln. So tritt im Text h¨

aufig die Bezeichnung x∈Xauf f¨

ur ”x ist ein Element

von X“. Wenn Vein Vektorraum ist, dann ist die Bezeichnung v∈Vgleichbe-

deutend mit ”v ist ein Element des Vektorraumes“ oder ”v ist ein Vektor“.

Diese Terme und Formeln k¨

onnen jedoch sehr kompliziert aufgebaut sein. So

ist der folgende Satz f¨

ur eine rein linguistische Analyse schwer zug¨

anglich: ”[. . .]

Eine Menge Zc:= {n|n∈Z, n ≥c}heißt Zahlenstrahl [...]“. In diesem Fall

m¨

usste zumindest erkannt werden, dass Zceine synonyme Bezeichnung f¨

ur den

130 KAPITEL 3. MATHEMATISCHE STRUKTUREN

Einige wichtige Symbole und ihre Auswertung

a∈A a ist ein Element von A

∀aF¨

ur alle a

∃aEs existiert ein a

A:= BDefiniens Bund Definiendum A

A <=> B A genau dann, wenn B

R,Nusw. reelle Zahlen, nat¨

urliche Zahlen

f:A−→ Bfist eine Abbildung von Anach B

Zahlenstrahl ist. Auch die Bezeichnung ”Abbildung f:A−→ B“ ist problema-

tisch, da es unter Umst¨

anden wichtig ist, welche Mengen Aund Bbezeichnen.

Daher ist es notwendig, zumindest die fundamentalsten mathematischen Zei-

chen zu erkennen und zu analysieren, um sie damit einer linguistischen Analyse

zug¨

anglich zu machen.

3.3.6 Zusammenfassung

In diesem Abschnitt sollen die in den vorherigen Abschnitten beschriebenen

Erkenntnisse zusammengefasst werden. Es wird aus den aufgef¨

uhrten Gr¨

unden

folgendes Modell f¨

ur die Analyse der mathematischen Sprache folgendes Modell

vorgeschlagen:

1. Schritt: Erkennung der Entit¨

atenstruktur.

2. Schritt: Aufl¨

osung der Binnenstruktur.

3. Schritt: Syntaktische Aufl¨

osung der S¨

atze.

4. Schritt: Analyse einzelner Satzbausteine

Erkennung der Entit¨

aten. Die Entit¨

aten m¨

ussen zuerst als solche erkannt

werden, damit weitere Analyseschritte getrennt f¨

ur jeden Entit¨

atentypen erfol-

gen k¨

onnen. Bei dieser Erkennung treten aber Schwierigkeiten auf. So wurde im

Rahmen dieser Arbeit festgestellt, dass es keine charakteristischen Merkmale

3.3. SPRACHSTRUKTUREN 131

f¨

ur die einzelnen Satzentit¨

aten gibt. Daher k¨

onnen diese nur durch die expli-

zite Angabe des Entit¨

atentyps korrekt erkannt werden. Eine weitere m¨

ogliche

Entit¨

atentyperkennung kann durch die Bestimmung der Position im Textgef¨

uge

erfolgen. Dies ist jedoch mit einigen Unsicherheiten behaftet. Gl¨

ucklicherweise

kennzeichnen jedoch Mathematiker h¨

aufig die S¨

atze mit der expliziten Angabe

des Entit¨

atennamens.

Aufl¨

osung der Binnenstruktur. Die Aufl¨

osung der Binnenstruktur hat vie-

le Vorteile. Der wichtigste Schritt ist dabei die Trennung der Voraussetzungen

von der eigentlichen Aussage der untersuchten Entit¨

at. In den Voraussetzun-

gen werden u. a. zahlreiche Bezeichnungen und Begriffe festgelegt, die f¨

ur eine

semantische Analyse der darauf folgenden Aussage von Bedeutung sind. Die

Voraussetzungen sind dabei meist gut zu erkennen, so dass die Binnenstruktu-

ren leicht zuzuordnen sind.

Am einfachsten ist diese Aufl¨

osung f¨

ur Definitionen, da in deren Aussageanteil

praktisch nur eine einzige Form der Binnenstruktur vorkommt. F¨

ur S¨

atze hat

sich gezeigt, dass es lediglich drei Satzstrukturen gibt, n¨

amlich den einfachen

Aussagesatz, die Implikation und die ¨

Aquivalenz. Diese drei Typen lassen sich

aufgrund ihres klaren Aufbaus relativ leicht erkennen. Axiome dagegen sind

problematisch, da sie keine einheitliche Binnenstruktur aufweisen.

Syntaktische Analyse der S¨

atze. Die syntaktische Analyse von S¨

atzen

kann nach dem in Kapitel 2.4 vorgestellte Modell von Chomsky erfolgen.

Trotz seiner Einfachheit ist es daf¨

ur ausreichend, da mathematische S¨

atze in

Lehrb¨

uchern weniger komplexe Strukturen aufweisen als S¨

atze in der Alltags-

sprache. Des Weiteren wurde festgestellt, das die syntaktische Struktur sehr

stark durch die Pr¨

adikatenlogik beeinflusst wird und somit meist einfache Satz-

strukturen auftreten.

Einige Satzstrukturen sind jedoch auf den ersten Blick nicht so einfach zu analy-

sieren. Sie k¨

onnen allerdings durch Vorverarbeitungsregeln in eine analysierbare

Form ¨

uberf¨

uhrt werden. Diese Vorverarbeitungsregeln wurden aus der Transfor-

mationsgrammatik nach Chomsky entwickelt. Sie ergeben sich aus einer relativ

geringen Anzahl feststehender Phrasen, die sich in Form eines syntaktischen

132 KAPITEL 3. MATHEMATISCHE STRUKTUREN

Lexikons f¨

ur eine Analyse zusammenfassen lassen. Ein Beispiel daf¨

ur ist die

Binnenstruktur Voraussetzung.

Analyse der Satzbausteine. Die bei der Analyse nach Chomsky entstehen-

den syntaktischen Strukturen weisen f¨

ur mathematische Texte einige Besonder-

heiten auf. So verwendet die mathematische Sprache Symbole und Formeln, die

direkt hinter dem Substantiv auftreten. Daher ist es sinnvoll, Symbole als einen

Teil der Nominalphrase zu sehen:

NP ::= [DET] [ADJ] N [SYM]

Des Weiteren werden Quantoren teilweise wie Artikel verwendet und k¨

onnen in

Nominalphrasen an deren Stelle treten.

NP ::= [DET/QUANT] [ADJ] N [SYM]

Es treten h¨

aufig rekursive Nominalphrasenstrukturen der Form

NP ::= NP NP

auf, die beliebig mit weiteren Nominal- und Pr¨

apositionalphrasen verschachtelt

sein k¨

onnen. Deren syntaktische Analyse ist einfach, die semantische Analy-

se jedoch außerordentlich komplex. Pr¨

apositionen hinter einer Nominalphrase

schr¨

anken diese in ihrem Wirkungsbereich ein. Diese Einschr¨

ankung wird auch

von Adjektiven f¨

ur ein darauf folgendes Substantiv erreicht.

In der mathematischen Sprache werden definierende Bezeichnungen in Eigen-

schaften h¨

aufig in Klammern hinter die betreffende Symbolfolge bzw. Aussage

gesetzt. Dies muss bei einer syntaktischen wie semantischen Analyse ber¨

ucksich-

tigt werden. Des Weiteren treten haupts¨

achlich bei Aufz¨

ahlungen S¨

atze ohne

Verbformen auf, wie z. B. f injektiv. Dies muss ebenfalls ber¨

ucksichtigt werden.

Eine semantische Analyse wurde bis jetzt nicht beschrieben. Das Problem be-

steht darin, dass die semantischen Informationen einer einzelnen Entit¨

at oh-

ne Kontextwissen nur einen geringen Informationsgehalt besitzen. Ohne eine

M¨

oglichkeit, mathematisches Hintergrundwissen einzubringen, ist eine semanti-

sche Analyse daher sinnlos. Dieses Hintergrundwissen soll in dieser Arbeit durch

eine Wissensbasis repr¨

asentiert werden (Kapitel 3.4).

3.4. WISSENSSTRUKTUREN 133

3.4 Wissensstrukturen

”In hierarchischen Strukturen kommt das Gute

nie von oben. Obenauf schwimmt der Abschaum.

Das Wertvolle ist der Bodensatz. “

(H. A. Pestalozzi, Schweizer Autor,

Manager und Gesellschaftskritiker, 1929-2004)

3.4.1 Ontologie der Mathematik

Einleitung. Im Kapitel 3.3 trat das Problem auf, dass eine semantische Ana-

lyse der mathematischen Sprache nicht einfach zu realisieren ist. Mathematische

Begriffe und Sachverhalte bilden ein großfl¨

achiges Beziehungsnetzwerk. Viele

dieser Begriffe und Sachverhalte werden von den Autoren der Texte vorausge-

setzt und nicht explizit definiert. Dies ist auch in anderen nat¨

urlichsprachlichen

Texten der Fall. Allerdings sind die terminologischen Strukturen in der Mathe-

matik klarer und strenger formalisiert, so dass die Begriffe und Sachverhalte

genau definiert werden k¨

onnen.

Wissensbasierte Systeme unterst¨

utzen die Organisation und Speicherung von

Begriffen und Sachverhalten. Gleichzeitig sind diese gespeicherten Informatio-

nen jederzeit wieder abrufbar. Als Repr¨

asentationsmechanismus f¨

ur diese Spei-

cherung eignen sich semantische Netze. Diese werden h¨

aufig bei der Untersu-

chung der Semantik von nat¨

urlichsprachlichen Texten verwendet, wie z. B. in

MultiNet [Hel00]. Durch den strukturierten Aufbau der mathematischen Termi-

nologie sollte auch bei der semantischen Analyse von mathematischen Texten

eine solche Konzeption hilfreich sein.

Zur Beschreibung von semantischen Netzen in wissensbasierten Systemen wer-

den heutzutage als formaler Beschreibungsmechanismus Ontologien verwendet.

Ontologien sind dabei reichhaltiger strukturiert als semantische Netze. Sie ver-

wenden Schemata, die im Kapitel 2.2.2.2 als Erweiterung von semantischen Net-

zen eingef¨

uhrt wurden.

Der Vorteil der Verwendung von Ontologien liegt in der Erzeugung eines Sys-

tems, das technisch umsetzbar und somit als Modell ¨

uberpr¨

ufbar ist. Daher

134 KAPITEL 3. MATHEMATISCHE STRUKTUREN

soll auch f¨

ur die Mathematik eine Ontologie entworfen werden, die insbesonde-

re Wissenstrukturen formalisiert, die durch eine vorherige semantische Analyse

aus mathematischen Texten extrahiert werden.

In den Kapiteln 2.2.1 und 2.2.3 wurde kurz auf die Struktur von Ontologien

eingegangen. Die Grundbausteine einer Ontologie sind Konzepte und Beziehun-

gen20 zwischen diesen Konzepten. Daher muss f¨

ur die Mathematik eine geeignete

Konzeptualisierung gefunden werden. Unter einer Konzeptualisierung wird ein

abstraktes Modell verstanden, das mathematische Strukturen abbilden kann.

In der hier zu betrachtenden mathematischen Ontologie sollen grundlegende ma-

thematische Strukturierungsprinzipien verwendet werden. Als Fundament die-

nen die folgenden Beschreibungmechanismen (Kapitel 3.2.2 und 3.2.3):

•Pr¨

adikatenlogik und axiomatische Mengenlehre

•Grundstrukturen nach Bourbaki

Pr¨

adikatenlogik und axiomatische Mengenlehre. Durch die Verwen-

dung der axiomatischen Mengenlehre (Kapitel 3.2.3) kann ein abstraktes mathe-

matisches Ontologiemodell konstruiert werden. Die axiomatische Mengenlehre

beruht auf dem allgemeinsten Begriff in der Mathematik: der Menge. Der Auf-

bau der Mengenlehre entspricht der einer ¨

ublichen mathematischen Theorie,

allerdings ist ihre Begriffs- und Sachverhaltsbildung wegweisend f¨

ur ”praktisch

alle“ [Ebb94, S. vii] mathematischen Fachdisziplinen. So bildet die Mengenleh-

re u. a. ein terminologisches Modell, aus dem sich viele mathematische Begriffe

ableiten lassen. Die Pr¨

adikatenlogik dient dabei als Beschreibungssprache der

Mengenlehre.

Im folgenden Abschnitt soll ein einfaches ontologisches Modell auf Grundlage

der axiomatischen Mengenlehre konstruiert werden. Dieses Modell erhebt keinen

Anspruch auf Vollst¨

andigkeit. In den weiteren Schritten soll dieses Modell f¨

ur

die semantische Analyse von einfachen mathematischen Entit¨

aten verwendet

werden, um die extrahierten Wissenstrukturen kontextuell zu binden. Es wird

20Beziehungen werden auch als Relationen bezeichnet. Allerdings wird der Begriff Relati-

on schon in der Mathematik verwendet. Daher wird in dieser Arbeit der Begriff Beziehung

bevorzugt, um Verwechselungen zu vermeiden.

3.4. WISSENSSTRUKTUREN 135

sich herausstellen, dass die konstruierte Ontologie einige Fragen aufwirft, die in

Kapitel 5 genauer diskutiert werden.

Konzepte in einer Ontologie fassen Objekte zusammen, die gemeinsame Eigen-

schaften21 aufweisen. Die axiomatische Mengenlehre nach Zermelo-Fraenkel be-

schreibt das fassbare, grundlegende ontologische Konzept Menge. Dabei defi-

niert sie nicht den Begriff der Menge, sondern beschreibt die Beziehungen zwi-

schen Mengen, ohne irgendeine Angabe zu machen, was dieses Konzept bein-

haltet. Aufgrund des Extensionalit¨

atsaxioms (Axiom 3.2.3) kann davon ausge-

gangen werden, dass alle mathematischen Objekte sich auf den Mengenbegriff

zur¨

uckf¨

uhren lassen [Ebb94].

Das gilt jedoch z. B. nicht f¨

ur das Elementzeichen ∈und die Teilmengenbezie-

hung ⊂. Diese sind keine Mengen im axiomatischen Sinne. In der Ontologie

entsprechen sie daher den Beziehungen zwischen den Konzepten: is element of

und is subset of.

Durch das Aussonderungsaxiom (Axiom 3.2.9) wird ein Konstruktionsprinzip

gegeben, durch das ”Untermengen“ gebildet werden k¨

onnen, die sich durch ge-

wisse Eigenschaften auszeichnen. Dies entspricht der Bildung neuer Konzepte

aus dem Konzept Menge durch eine is a Beziehung22, die dann noch zus¨

atzli-

che Eigenschaften besitzen.

Es gibt bestimmte Objekte in der Mathematik, die einen grundlegenden Charak-

ter besitzen, wie z. B. Relationen und Funktionen. F¨

ur die Konzeption dieser Ob-

jekte auf der Grundlage des Konzepts Menge muss der Begriff des geordneten

Paares (Definition 3.2.7) eingef¨

uhrt werden. In der axiomatischen Mengenlehre

wird dies als Paarmengenbildung (Axiom 3.2.4) mit der speziellen Eigenschaft

angesehen, dass die Reihenfolge der Objekte eindeutig festgelegt ist. Somit ist

auch das geordnete Paar eine spezielle Menge. Der Zuordnungsmechanismus,

der dem geordneten Paar den linken (∗, y) bzw. den rechten Eingang (x, ∗) zu-

ordnet, wird als Projektionsoperation [Ebb94, S. 55] bezeichnet. Dies soll nicht

direkt in dieser Ontologie ber¨

ucksichtigt werden (Kapitel 5).

21Eigenschaften werden auch als Attribute bezeichnet.

22Sie wird auch SUB-Relation genannt. ”Alle einem gemeinsamen Oberbegriff verm¨

oge der

SUB-Relation untergeordneten Begriffe bilden zusammen mit ersterem eine Begriffshierar-

chie und konstituieren damit einen Teilbaum im SN [semantischen Netz]. Der an der Spitze

der Hierarchie stehende Knoten ist eben dieser Oberbegriff. Die terminalen individuellen Be-

griffsknoten des Baums heißen Instanzen.“ [Hel00]

136 KAPITEL 3. MATHEMATISCHE STRUKTUREN

Aus dem geordneten Paar l¨

asst sich induktiv das Konzept Tupel ableiten,

das den mathematischen n-Tupeln entspricht. Es ist ¨

uber eine is a-Beziehung

mit dem Konzept geordnetesPaar verbunden, das wiederum ¨

uber eine is a-

Beziehung direkt mit dem Konzept Menge verkn¨

upft ist (Abbildung 3.25).

geordnetesPaar

Name: geordnetes Paar

Tupel

Name: n−Tupel

Name: Menge

is_a

Menge

Abbildung 3.25: Darstellung eines Tupels

Das Konzept geordnetesPaar wird vom kartesischen Produkt (Definition

3.2.8) verwendet. Wie das Tupel bildet auch das Konzept kartesischesPro-

dukt eine spezielle Menge (is a-Beziehung). Jedoch wird zus¨

atzlich die Eigen-

schaft gefordert, dass das kartesische Produkt das Konzept geordnetesPaar

verwendet. Dies wird durch eine neue Beziehung has part realisiert, die besagt,

dass ein Konzept (in diesem Fall geordnetesPaar) Bestandteil eines anderen

Konzeptes (in diesem Fall kartesischesProdukt) ist (Abbildung 3.26).

kartesischesProdukt

Name: kart. Produkt

Menge

Name: Menge

Name: geordnetes Paar

Tupel

Name: n−Tupel

is_a

geordnetesPaar

has_part

Abbildung 3.26: Darstellung eines kartesischen Produktes

Somit kann nun das Konzept Relation (Definition 3.2.10) in das bestehen-

de Modell eingef¨

ugt werden. Es besteht eine has part-Beziehung vom Konzept

Relation zum kartesischen Produkt (Abbildung 3.27).

3.4. WISSENSSTRUKTUREN 137

geordnetesPaar

Name: geordnetes Paar

Name: n−Tupel

Tupel

Menge

Name: Menge

Name: kart. Produkt

kartesischesProdukt

has_part

is_a

has_part

is_a

Name: Relation

Relation

Abbildung 3.27: Darstellung einer Relation

Die Abbildung (Definition 3.2.13) leitet sich durch eine is a-Beziehung vom

Konzept Relation ab (Abbildung 3.28).

geordnetesPaar

Name: geordnetes Paar

Name: n−Tupel

Tupel

Menge

Name: Menge

Name: kart. Produkt

kartesischesProdukt

has_part

is_a

has_part

is_a

Name: Relation

Relation

Name: Abbildung

Abbildung

Abbildung 3.28: Darstellung der Abbildung

Abbildung 3.29 zeigt eine in Teilen vereinfachte Form der bisher beschriebenen

Ontologie, die um die Konzepte der Assoziativit¨

at,Kommutativit¨

at und

Distributivit¨

at erweitert wurde. Diese stammen aus der Aussagenlogik und

spielen bei der Formulierung von Eigenschaften anderer Konzepte eine wichtige

Rolle. Sicherlich ist das nicht die einzig m¨

ogliche Struktur einer Ontologie der

Mathematik, aber sie ist f¨

ur die im mArachna-Projekt behandelten Fragestel-

lungen sinnvoll und ausreichend.

Beschreibung durch Bourbaki. Neben Hilbert gilt als wesentlicher Be-

gr¨

under und Bef¨

urworter der axiomatischen Theorie eine Gruppe franz¨

osischer

Mathematiker, die ihre Forschungsergebnisse ab 1935 unter dem Pseudonym

Nicolas Bourbaki ver¨

offentlichte. Bourbaki erweiterte den proklamierten Ansatz

138 KAPITEL 3. MATHEMATISCHE STRUKTUREN

Name: kart. Produkt

kartesischesProdukt

Relation

Name: Relation

Abbildung

Name: Abbildung

is_a

Menge

Name: Menge

Rule

assoziativ

Name: assoziativ

kommutativ

Name: kommutativ

distributiv

Name: distributiv

mathObject

is_a

Verknüpfung

Name: Verknüpfung

is_a

has_property

has_part

Abbildung 3.29: Konzeption mathematische Ontologie

von Hilbert. Sie verstanden die Mathematik als ein geordnetes Zusammenspiel

von Strukturen wie Mengen, Gruppen, K¨

orpern usw. Dabei existieren Kernge-

biete, die f¨

ur alle mathematischen Disziplinen unerl¨

asslich sind. Dies sind die

Mengenlehre, die Algebra, die Topologie und die Analysis. Als Fundament dient

die Logik und die Mengenlehre [Bou74].

Bourbaki definiert drei grundlegende Strukturierungselemente:

•Ordnungsstrukturen

•algebraische Strukturen

•topologische Strukturen

So lassen sich mathematische Objekte ¨

uber Mengen mit gewissen Strukturen

beschreiben. Eine Addition + : M×M−→ Mkann mittels des geordneten

Paares (M, +) beschrieben werden. Die Addition ist dabei das strukturbilden-

de Element auf der Menge M. Der Begriff der Gruppe wird durch das 2-Tupel

(G, ∗) beschrieben, wobei die Gruppe als Menge mit der strukturbildenden Ver-

kn¨

upfung ∗aufgefasst wird.

Das Konzept von Bourbaki l¨

asst sich sich jedoch nicht ohne Aufwand auf die

Analyse der mathematischen Sprache ¨

ubertragen. Der Hauptgrund daf¨

ur ist,

3.4. WISSENSSTRUKTUREN 139

dass Autoren in Lehrb¨

uchern dieses Konzept nicht durchg¨

angig verwenden. Da-

durch ist in vielen Definitionen und S¨

atzen der obige typische Konstruktionsme-

chanismus nicht vorhanden, so dass die in den Texten enthaltenen semantischen

Strukturen zun¨

achst in eine Struktur nach Bourbaki ¨

ubersetzt werden m¨

ussten.

Aus diesem Grund werden strikte Bourbaki-Strukturen in dieser Arbeit nicht

verwendet. Sie k¨

onnten sich in Zukunft jedoch als n¨

utzlich f¨

ur die Darstellung

gr¨

oßerer mathematischer Konzepte wie z. B. ganzer Disziplinen erweisen.

Aus diesen Betrachtungen wird deutlich, dass sich die verwendete einfache On-

tologie nur ungen¨

ugend f¨

ur die Beschreibung einiger mathematischer Konzepte

eignet. F¨

ur die im Rahmen dieser Arbeit durchgef¨

uhrten Analysen ist sie jedoch

ausreichend. Weiterf¨

uhrende Ans¨

atze werden im Kapitel 5 besprochen. Dabei

wird unter anderem das Konzept eines semantischen Hypergraphen diskutiert.

3.4.2 Taxonomie der Mathematik

Im ersten Abschnitt dieses Kapitels wurde eine Ontologie auf Basis der axiomati-

schen Mengenlehre entwickelt, die die Grundlage f¨

ur die weiteren Betrachtungen

bilden soll. Die Taxonomie der Mathematik beschreibt die Hierarchie der Be-

griffe und Sachverhalte der Mathematik und modelliert so ihre Strukturen. In

den folgenden Abschnitten soll anhand von einfachen Beispielen erl¨

autert wer-

den, wie mathematische Wissensstrukturen aus Entit¨

aten extrahiert und in die

konstruierte Ontologie eingeordnet werden k¨

onnen.

Vorbetrachtungen. Die Mathematik besteht aus einer Reihe von mathema-

tischen Fachdisziplinen, wie z. B. der Geometrie, der Arithmetik und der Zahlen-

theorie. Dabei k¨

onnen ¨

uber 3000 spezialisierte Einzeldisziplinen der Mathematik

[DHM95, S. 20] unterschieden werden.

”The Mathematics Books at Brown University are housed on the fifth

floor of the Science Library. In the trade, this is commonly regarded

as a fine mathematical collection, and a rough calculation shows that

this floor contains the equivalent of 60,000 average-sized volumes.

[...] This amount of knowledge and information is far beyond the

comprehension of any one person. “ [DHM95, S. 17]

140 KAPITEL 3. MATHEMATISCHE STRUKTUREN

Einen ¨

Uberblick ¨

uber die gesamte Mathematik mit ihren vielf¨

altigen Beziehun-

gen zu erhalten, erscheint hoffnungslos. In Abbildung 3.30 wird ein winziger Teil

eines Beziehungsnetzwerks der mathematischen Fachdisziplinen dargestellt. Es

Liesche

Gruppen

Räume stetiger

Funktionen

Integration

Haarsches Maß

und Faltung

Riemannsche

Geometrie

nicht lineare

Probleme

harmonische

Analyse

kompakte

Liesche Gruppen

Differential−

rechnung

analytische

Funktionen

Existenzsätze

elementare

Spektraltheorie

Mengenlehre

reelle Zahlen

metrische

Räume

normierte

Räume

Hilberträume

reelle

Zahlengerade

Topologie und

top. Algebra

norm. Algebren

Spektraltheorie differenzierbare

Mannigfaltigkeiten

differenzierbare

Systeme

Differentialoperatoren

Distributionen

lineare

Funktionalgleichung

elementare

Differentialtopologie

Abbildung 3.30: Ausschnitt der mathematischen Fachgebiete [Die75]

es leicht ersichtlich, dass eine solche ¨

Ubersicht durch Hinzunahme weiterer Fach-

disziplinen schnell schwer ¨

uberschaubar wird. V¨

ollig unm¨

oglich wird der Gedan-

ke aber erst, wenn in den Fachdisziplinen auch noch Unterstrukturen wie z. B.

grundlegende Konzepte einer Disziplin dargestellt werden sollen. Angesichts von

¨

uber 3000 Einzeldisziplinen erscheint dies utopisch.

Die ersten Schritte werden daher auf Fachdisziplinen — die lineare Algebra

und Algebra — beschr¨

ankt. Die Algebra nimmt eine zentrale Stellung in der

Mathematik ein und bildet somit die Grundlage f¨

ur viele mathematische Fach-

3.4. WISSENSSTRUKTUREN 141

disziplinen. Die Algebra l¨

asst sich nach Bourbaki folgendermaßen strukturieren

(sieht auch Abbildung 3.31):

1. Algebraisch strukturierte Mengen: Gruppe, Ring, K¨

orper, Vektor-

raum usw.

2. Algebraische Strukturen werden induziert durch: innere und ¨

auße-

re Verkn¨

upfung mit speziellen Eigenschaften: kommutativ, assoziativ, dis-

tributiv usw.

3. Algebraisch strukturierte Untermengen: Untergruppe, Unterring,

Ideal, Quotientenstruktur usw.

4. Strukturerhaltende Abbildungen: Homomorphismus, Isomorphis-

mus, lineare Abbildung usw.

assoziativ

kommutativ

distributiv

neutrales Element

inverses Element

Menge Struktur

Verknüpfung Eigenschaften

strukturerhaltenden Abbildungen

Vektorraum

innere

äußere

Untervektorraum

algebraisch strukturiert

Unterstrukturen

Ring

Gruppe

Körper

Untergruppe

Homomorphismus

lineare Abbildung

Abbildung 3.31: ¨

Uberblick Algebra

In Abbildung 3.31 ist eine Unterstrukturierung abgebildet. Diese deutet auf die

lineare Algebra hin, bei der der Begriff Vektorraum eine zentrale Rolle spielt.

142 KAPITEL 3. MATHEMATISCHE STRUKTUREN

Taxonomie der Entit¨

aten. Informationen werden in der Mathematik durch

die in Kapitel 3.3.1 diskutierten fundamentalen Entit¨

aten Axiom,Definition und

Satz23 dargestellt. Daher soll als erstes anhand eines Beispiels gezeigt werden,

wie aus Definitionen semantische Informationen extrahiert werden. Anschlie-

ßend sollen S¨

atze betrachtet werden.

Die Entit¨

at Definition.Eine Definition ist die Zusammenfassung von ma-

thematischen Begriffen und Sachverhalten, um einen neuen Begriff zu beschrei-

ben. Im Allgemeinen treten in der Mathematik nur abstrakte Begriffe ohne

direkte Entsprechung in der Alltagssprache auf. Daher werden in einer axio-

matisch aufgebauten Mathematik alle Begriffe definiert. Diese Begriffe bilden

dann ein grundlegendes Begriffsger¨

ust. Die Grundidee der semantischen Ana-

lyse ist es, Begriffe, die durch Definitionen beschrieben werden, nur dann in

die Wissensbasis zu integrieren, wenn die Sachverhalte und Begriffe, durch die

sie definiert werden, schon in der Wissensbasis vorhanden sind. Eine andere

Herangehensweise w¨

urde die Integrit¨

at der Wissensbasis gef¨

ahrden.

Die wichtigste Beziehung zwischen den Begriffen ist die is a-Beziehung. Die Ei-

genschaften des Oberbegriffs werden bei dieser Konstruktion auf den Unter-

begriff ¨

ubertragen. Dabei k¨

onnen die Eigenschaften entweder fest zugeordnete

Auspr¨

agungen oder Defaultwerte besitzen24. Das Problem bei der Verwendung

von Eigenschaften mit Defaultwerten ist, dass eine solche Strukturierung nicht

unbedingt aus der Analyse von Texten gewonnen werden kann. Der Sinn der

Wissensbasis ist es jedoch, Wissen aus der Extraktion von semantischen Infor-

mationen aus Texten zu integrieren. Daher kann in einem ersten Schritt davon

ausgegangen werden, dass Eigenschaften ohne Defaultwerte verwendet werden.

Die Begriffe entsprechen den Konzepten in der Ontologie. Der Konzeptname

wird durch den Begriffsnamen festgelegt. In erster Linie wird der neue Begriff

durch eine is a-Beziehung direkt mit den im Definiens angegebenen Begriffen

23Beweise und Beispiele sind nicht Untersuchungsgegenstand dieser Arbeit.

24In Ontologien werden h¨

aufig Mechanismen f¨

ur die Bildung von Prototypen bzw. proto-

typischen Wissens, d. h. von typischem Wissen mit Defaultangaben verwendet (Kapitel 2.2).

Diese sollen zun¨

achst nicht betrachtet werden. Jedoch stellen Prototypen eine interessante

Alternative dar, mathematisches Wissen st¨

arker zu strukturieren. So k¨

onnte z. B. der Begriff

lineare Algebra mit den Slots Definitionsbereich bzw. Wertebereich versehen werden. Die Slots

erhalten dann entsprechende Defaultwerte, die belegt werden d¨

urfen.

3.4. WISSENSSTRUKTUREN 143

neu eingebunden. Wenn das Definiendum Eigenschaften aufweist, werden diese

Eigenschaften ¨

uber eine has property-Beziehung an das Definiendum gebunden.

Es soll anhand des Beispiels 3.3.16 eine semantische Analyse exemplarisch durch-

gef¨

uhrt werden. Zuerst wird die Definition daf¨

ur zerlegt:

Erster Teil

Eine Menge Gzusammen mit einer Verkn¨

upfung ∗heißt Gruppe, wenn folgende

Eigenschaften erf¨

ullt sind:

Nach der syntaktischen Analyse wird das Verb heißen als Schl¨

usselwort f¨

ur ei-

ne Definition erkannt. Darauffolgend werden die syntaktischen Komponenten

wie z. B. die Nominalphrase semantischen Satzbausteinen — Pr¨

adikat, Subjekt

oder Objekt — zugeordnet. Dabei entspricht dem Definiendum das Objekt und

dem Definiens das Subjekt (siehe Abbildung 3.32). Somit entstehen folgende

Zuordnungen:

1. Pr¨

adikat ::= Subjekt Objekt

2. Subjekt ::= NP

3. V ::= Pr¨

adikat ∧NP ::= Objekt (aus VP)

Definiendum

Definiens

heißen

Prädikat

Subjekt Objekt

undMenge G Verknüpfung * Gruppe G

Abbildung 3.32: Zerlegung der Definition in semantische Satzbausteine

Daraus ergibt sich f¨

ur das Beispiel 3.3.16:

[ist, Menge, Gruppe] ∧[ist, Verkn¨

upfung, Gruppe]

144 KAPITEL 3. MATHEMATISCHE STRUKTUREN

Das Pr¨

adikat ist entspricht dann der is a-Beziehung. Der Nebensatz leitet die

Eigenschaften ein, d. h. alles, was nach dem Doppelpunkt folgt, wird im folgen-

den zweiten Teil behandelt und mittels einer has property-Beziehung an das

Definiendum gebunden.

Der Nebensatz leitet zu den Eigenschaften hin, d. h. alles was nach dem

Doppelpunkt folgt, wird nun durch den zweiten Teil behandelt und mit der

has property-Beziehung verkn¨

upft. Allerdings gibt es dabei einige Ausnahmen.

Zweiter Teil

G1 (a∗b)∗c=a∗(b∗c)f¨

ur alle a, b, c ∈G(Assoziativgesetz)

G2 Es gibt ein e∈G(neutrales Element genannt) mit den folgenden Eigen-

schaften:

–e∗a=af¨

ur alle a∈G

–Zu jedem a∈Ggibt es ein a0∈G(inverses Element von a genannt)

mit a0∗a=e.

Die Analyse von G1 bereitet einige Schwierigkeiten. Die semantische Information

steht ausschließlich in den Formeln, gefolgt von der Bezeichnung Assoziativge-

setz in Klammern. In der syntaktischen Analyse wird daher der Satz in zwei

S¨

atze zerlegt: Ein Satz beschreibt die mathematische Aussage, der andere den

zu definierenden Begriff (Kapitel 3.3). In dieser Form w¨

urde dann der Begriff

Assoziativgesetz direkt an den Begriff Gruppe gebunden werden. Bei dem As-

soziativgesetz handelt es sich aber um eine Eigenschaft, die die Verkn¨

upfung

besitzen kann. Dies k¨

onnte dadurch abgefangen werden, dass der Begriff Asso-

ziativgesetz nur mit dem Konzept Verkn¨

upfung eine Verbindung eingehen kann,

mit der zus¨

atzlichen Einschr¨

ankung, dass sich dies auf das Konzept Gruppe be-

zieht:

•Folgende Eigenschaft ist daher unvorteilhaft:

[Eigenschaft, Assoziativgesetz, Gruppe]

•Folgende Eigenschaft gilt:

[Eigenschaft, Assoziativgesetz, Verkn¨

upfungGruppe]

3.4. WISSENSSTRUKTUREN 145

Allerdings kann nach dieser Vorgehensweise die Formel (a∗b)∗c=a∗(b∗c)

nicht analysiert werden. Wie oben beschrieben, ist dies von Nachteil, da eine

Analyse der Formel eventuell zu einer Aufl¨

osung des Widerspruchs gef¨

uhrt h¨

atte.

Das mathematische Zeichen a, b, c ∈Gist allerdings aufl¨

osbar, da dies in eine

sprachliche Form gebracht werden kann: a, b und c sind Elemente der Gruppe.

In G2 werden ebenfalls die syntaktischen Komponenten der S¨

atze den semanti-

schen Komponenten zugeordnet25. Dabei wird dem neutralen Element die Be-

zeichnung e∈Gzugeordnet. Da wie oben beschrieben eine solche einfache

mathematische Zeichenkette analysierbar ist, kann dies ¨

ubersetzt werden in: e

[neutrales Element] ist ein Element von G [Gruppe]. Daher kann das neutrale

Element als Konzept mit einer is a-Beziehung direkt an das Konzept Gruppe

gebunden werden:

[is element of, Gruppe, neutrales Element]

Das neutrale Element weist weitere Eigenschaften auf. Die erste Eigenschaft ist

nicht weiter aufl¨

osbar, da sie im Wesentlichen nur aus einer Formel besteht, die

an dieser Stelle noch nicht analysierbar ist. Aus der zweiten Eigenschaft k¨

onnen

weitere Informationen gewonnen werden. Es existiert wiederum die definierende

Klammer ”inverses Element von a genannt“ und die Beschreibung ”a0ist ein

Element von G“.26. Es sind damit zwei m¨

ogliche Verbindungen konstruierbar.

•[is element of, Gruppe, inverses Element]

•[is property, neutrales Element, inverses Element]

Hierbei tritt wiederum ein Problem auf. Der gegenw¨

artige Analyseprozess er-

kennt den Zusammenhang zwischen neutralem und inversem Element nicht

vollst¨

andig.

Diese einzelnen semantischen Informationen lassen sich in die Wissensbasis in-

tegrieren, indem drei neue Konzepte gebildet werden: Gruppe,inverses Ele-

ment und neutrales Element. Die Wissensbasis muss dazu die Konzepte

25Da die S¨

atze relativ einfach sind, soll die Zuordnung von syntaktischen zu semantischen

Komponenten nicht explizit gezeigt werden.

26Zu den Schwierigkeiten f¨

ur eine genauere Analyse dieser S¨

atze, siehe Kapitel 5.

146 KAPITEL 3. MATHEMATISCHE STRUKTUREN

Menge,Verkn¨

upfung und Assoziativgesetz enthalten, wobei die Bezeich-

nung Assoziativgesetz durch das Konzept assoziativ mit der Eigenschaft, dass

die Bezeichnung auch Assoziativgesetz sein kann, realisiert wird. Dies wird in

Abbildung 3.33 dargestellt.

inverses Element

neutrales Element

Menge

Gruppe

assoziativ

Name2: Assoziativgesetz

Einschränkung auf die Gruppe

is_element_of

has_property

is_a

has_property

is_a

is_element_of

Verknüpfung

Abbildung 3.33: Darstellung in der Ontologie

Die Entit¨

at Satz.S¨

atze besitzen eine komplexere semantische Struktur, die

schwieriger zu analysieren ist als die von Definitionen. Es existieren verschiede-

ne Binnenstrukturen: Implikationen, ¨

Aquivalenzen und einfache Aussagen. Die

wichtigsten semantischen Tr¨

ager in den S¨

atzen sind die Verben und die Phra-

sen f¨

ur Implikationen und ¨

Aquivalenzen, die zu den entsprechenden logischen

Operatoren geh¨

oren. Alle Begriffe, die in einem Satz auftreten, m¨

ussen vor der

Analyse in der Wissensbasis vorhanden sein. Es fehlen also die Beziehungen

zwischen den Konzepten, die die Implikation is implication und die ¨

Aquiva-

lenz is equivalent repr¨

asentieren. Außerdem muss ein Satz anders gehandhabt

werden als das semantischen Netz, das durch Definitionen gebildet wird. Ei-

ne Vermischung der Sachverhalte und Begriffe w¨

urde sonst zu Komplikationen

f¨

uhren. So besteht z. B. eine ¨

Aquivalenz aus zwei Aussagen. Jede Aussage wird in

der Wissensbasis zusammengefasst bzw. eingekapselt (Aussagenkapselung).

Dabei ist auch die ¨

Aquivalenzbeziehung eine Aussage, die ebenfalls gekapselt

wird. Dadurch ist es m¨

oglich, komplexere Strukturen als einfache Aussagen zu

bilden und diese wieder mit anderen Strukturen in Beziehung zu setzen, ohne

das Begriffsnetz zu beeinflussen.

3.4. WISSENSSTRUKTUREN 147

Als erstes soll ein einfacher Aussagesatz aus Beispiel 3.3.25 betrachtet werden:

Jeder Vektorraum besitzt eine Basis.

Prädikat

Subjekt Objekt

jeder Vektorraum Basis

besitzen

Abbildung 3.34: Zerlegung des Theorems in semantische Bausteine

Dieser Satz ist relativ einfach zu analysieren. Vorausgesetzt, dass die Begrif-

fe Vektorraum und Basis in der Wissensbasis enthalten sind, wird durch das

Pr¨

adikat eine neue Beziehung belong induziert. In diesem Fall wird auch der

Allquantor (gekennzeichnet durch das Wort jeder) verwendet, der durch ein

Unterkonzept zum Konzept Vektorraum realisiert wird:

•[belong, Basis, VektorraumALL]

Damit wird die in Abbildung 3.35 Struktur in der Wissenbasis erzeugt.

Vektorraum

belomgs_to

Basis

Vektorraum

Quantor: ALL

has_allquantor

Aussagenkapselung

Abbildung 3.35: Darstellung in der Wissensbasis f¨

ur das Beispiel 3.3.25

Exemplarisch f¨

ur eine Implikation soll nun der Basiserg¨

angzungssatz 3.3.26 in

der Wissensbasis dargestellt werden.

Basisauswahlsatz

Sei Beine Menge von Vektoren des Vektorraums V.Bist genau dann eine

Basis, wenn Bein minimales Erzeugendensystem ist.

148 KAPITEL 3. MATHEMATISCHE STRUKTUREN

In diesem Fall muss zuerst die Voraussetzung ”Sei Beine Menge von Vekto-

ren des Vektorraums V.“ betrachtet werden. Voraussetzungen werden nicht in

die Wissensbasis integriert, sondern nur tempor¨

ar angelegt. Die einzige in ih-

nen enthaltene semantische Information ist, welchen Begriff sie einer mathema-

tischen Zeichenkette zuordnen. Dieses Symbol wird dann als Synonym des ma-

thematischen Begriffs innerhalb der Entit¨

at verwendet. Folgende semantischen

Informationen lassen sich aus der Voraussetzung des Basiserg¨

anzungssatzes ge-

winnen:

•[is a, Vektorraum, V]

•[is a, Menge von Vektoren des Vektorraums, B]

Anschließend wird die Implikation behandelt. Der Satz wird gem¨

aß seiner Bin-

nenstruktur aufgel¨

ost und in zwei Komponenten zerlegt: Bist genau dann eine

Basis und Bist ein minimales Erzeugendensystem. Diese Zerlegung wird in

Abbildung 3.36 dargestellt:

Forderung Folgerung

ist

Wenn

BasisB

minimales Erzeugendensystem

B

ist

Subjekt Objekt Subjekt Objekt

dann

Prädikat

B ist ein minimales Erzeugendensystem B ist Basis

Abbildung 3.36: Zerlegung des Satzes in semantische Bausteine

Nun m¨

ussen zun¨

achst Forderung und Folgerung intern aufgel¨

ost werden:

•[is a, minimal erzeugendes System, Menge von Vektoren] Forderung

•[is equivalent, Basis, Menge von Vektoren] Folgerung

•[is implication, Forderung, Folgerung]

In Abbildung 3.37 wird die Visualisierung des Basiserg¨

anzungssatzes in der

Wissensbasis dargestellt. Die gestrichelten Bereiche deuten die Kapselung an.

3.4. WISSENSSTRUKTUREN 149

Forderung, Folgerung und die gesamten Aussagen werden dabei gekapselt, wo-

bei die is implication-Beziehung in diesem Fall nur die Kapselungen verbindet.

Dementsprechend ist eine Kapselung ein spezielles Konzept in der Wissensbasis.

Menge von Vektoren

Vektor

Vektorraum

Basis

Vektor

is_element_of

is_equivalent

Erzeugendensystem

min. Erz.system

Eigenschaft: minimal

is_a

is_implication

Aussagenkapselung

Aussagenkapselung Aussagenkapselung

Abbildung 3.37: Darstellung in der Wissensbasis des Beispiels 3.3.26

Die Entit¨

at Axiom.Axiome sind unbeweisbare Tatsachen, die in Texten

nur sehr selten auftreten und die daher grunds¨

atzlich manuell in die Wissens-

basis integriert werden. Damit soll verhindert werden, dass die Integrit¨

at der

Ontologie gef¨

ahrdet wird.

3.4.3 Zusammenfassung

Die Grundstruktur der Wissensbasis besteht aus der axiomatischen Mengenlehre

und der Pr¨

adikatenlogik. Mithilfe dieser Theorien werden grundlegende mathe-

matische Strukturen in einer Ontologie als Konzepte und Beziehungen zusam-

mengestellt. Begriffe, die durch Definitionen eingef¨

uhrt werden, sind Konzepte

in der Wissensbasis. Der Konzeptname wird durch den Begriffsnamen festge-

legt. Die Konzepte werden dann ¨

uber is a-Beziehungen mit anderen Konzepten

150 KAPITEL 3. MATHEMATISCHE STRUKTUREN

verbunden. Eigenschaften werden mittels der has property-Beziehung an das

betreffende Konzept gebunden. In diesem Prozess k¨

onnen aber nur Begriffe bzw.

Konzepte aufgenommen werden, die sich auf Konzepte beziehen, die schon in

der Wissensbasis vorhanden sind.

Sachverhalte werden durch S¨

atze beschrieben. Die Integration von S¨

atzen ist un-

gleich schwerer als die von Definitionen. Es werden dabei keine neuen Konzepte

eingef¨

uhrt, sondern Sachverhalte miteinander verbunden. Dadurch entstehen

komplexe Strukturen in der Wissensbasis. Es werden dabei beispielsweise ¨

uber

¨

Aquivalenzbeziehungen Aussagen miteinander verkn¨

upft. Um das Gesamtgef¨

uge

eines Satze nicht zu zerst¨

oren, werden die Aussagen gekapselt. F¨

ur die einzelnen

Satztypen existieren verschiedene Beziehungen, die sich aus der Binnenstruktur

ableiten lassen: is implication und is equivalent. F¨

ur einfache Aussagen ist das

Pr¨

adikat der Tr¨

ager der semantischen Information. Daher ist das Verb f¨

ur die

Bildung von Beziehungen verantwortlich.

Kapitel 4

Architektur von mArachna

Das Unsympathische an Computern ist, dass sie

nur ja oder nein sagen k¨

onnen, aber nicht vielleicht.

(Brigitte Bardot)

4.1 Gesamtkonzeption

In Kapitel 1.2 wurden Hypothesen aufgestellt, die nun durch die Implementie-

rung eines Prototypen in Software ¨

uberpr¨

uft werden sollen. Dieser Prototyp —

mArachna — wird Entit¨

aten (Kapitel 3.3.1) semantisch analysieren und die ent-

haltenen semantischen Informationen einer mathematischen Wissensbasis zur

Verf¨

ugung stellen.

mArachna besteht im Wesentlichen aus drei Komponenten (Abbildung 4.1): der

nat¨

urlichsprachlichen Analyse, der Wissensbasis und dem Information

Retrieval System. Die Wissenbasis stellt das Herzst¨

uck von mArachna dar: Sie

verwaltet mathematische Informationen, unterst¨

utzt den semantischen Anteil

der nat¨

urlichsprachlichen Analyse und pr¨

apariert die mathematischen Informa-

tionen f¨

ur das Information Retrieval System. Die mathematischen Informatio-

nen generiert mArachna aus den eingelesenen mathematischen Texten, die aus

Entit¨

aten bestehen. Entit¨

aten sind nach Kapitel 3.3.1 Definitionen, Theoreme,

S¨

atze usw.

151

152 KAPITEL 4. ARCHITEKTUR VON MARACHNA

Abbildung 4.1: Architektur von mArachna

Dabei k¨

onnen die Eingabetexte in verschiedenen Formaten vorliegen, die dann

mit Hilfe eines Konverters in das XML-Format TEI (Text Encoding Initiative

[TEIa]) umgewandelt werden. In weiteren Analyseschritten werden die Texte

zerlegt, bis nur noch einzelne W¨

orter vorliegen. Dabei bleibt aber die Posi-

tion der einzelnen W¨

orter im Gesamttext erhalten, so dass auch S¨

atze bzw.

Texte komplett bearbeitet werden k¨

onnen. Die zerlegten Texte werden dann

morphologisch, syntaktisch und semantisch analysiert. Am Ende des Prozesses

werden semantische Einheiten f¨

ur die Wissensbasis generiert. Die ¨

Ubergabe der

semantischen Einheiten an die Wissensbasis erfolgt dann durch den Ontology

Feeder. Dabei sollen nur mathematische Informationen aufgenommen werden,

f¨

ur die bereits Voraussetzungen (mathematische Grundlagen) in der Wissensba-

sis existieren. Die Wissensbasis selbst ist eine Ontologie, die durch einen RDF-

[RDF] und einen OWL-Parser [OWL] erzeugt wird.

Das Information Retrieval System unterteilt sich in zwei Komponenten: das

klassische Benutzerfrontend (UserFrontEnd) und das Visualisierungsfrontend

4.1. GESAMTKONZEPTION 153

(VisuFrontEnd). Das VisuFrontEnd dient zur Darstellung der einzelnen Ana-

lyseschritte von mArachna. Administratoren des Prototypen k¨

onnen hier ¨

uber

ein graphisches Interface einzelne Analyseschritte einsehen und diese gegebe-

nenfalls korrigieren (semiautomatischer Ansatz). Das UserFrontEnd bietet dem

Benutzer die M¨

oglichkeit, Fragen an das System zu stellen und Antworten in

geeigneter Form zu pr¨

asentieren. Ein m¨

ogliches UserFrontEnd ist z. B. ein ma-

thematisches Lexikon.

Abbildung 4.2: Pakethierarchie

F¨

ur die Implementierung von mArachna wurde haupts¨

achlich die Programmier-

sprache Java verwendet. Die Software besteht aus zahlreichen einzelnen Anwen-

dungen, die jeweils eine bestimmte Aufgabe im Analyseprozess erf¨

ullen. Die Ge-

samtstruktur wird in Abbildung 4.2 dargestellt. Die f¨

ur die nat¨

urlichsprachliche

Analyse relevanten Teile sind im Paket wbs.lexana zusammengefasst:

•wbs.lexana.segment (WordTokenizer)

•wbs.lexana.morph (morphologische Analyse)

•wbs.lexana.syntax (syntaktische Analyse)

•wbs.lexana.semantic (semantische Analyse)

•wbs.lexana.summoner (OntologyFeeder)

Die Wissensbasis ist im Paket wbs.knowbase enthalten:

•wbs.lexana.rdf (RDF-Parser)

•wbs.lexana.owl (OWL-Parser)

154 KAPITEL 4. ARCHITEKTUR VON MARACHNA

Das Information Retrieval System ist eine webbasierte Benutzeroberfl¨

ache

(WebFrontEnd), die die Ausgaben von mArachna verarbeitet und darstellt.

In den folgenden Abschnitten werden die drei Komponenten nat¨

urlichsprach-

liche Analyse, Wissensbasis und Information Retrieval System genauer darge-

stellt.

4.2. NAT ¨

URLICHSPRACHLICHE ANALYSE 155

4.2 Nat¨

urlichsprachliche Analyse

Worte sind Gegenst¨

ande:

Man kann sich an ihnen stoßen.

(Wolfgang Herbst)

Die nat¨

urlichsprachliche Analyse umfasst die morphologische,syntaktische

und semantische Analyse. Diese Analysen sind nicht eindeutig voneinander zu

trennen und beeinflussen sich gegenseitig. Allerdings werden in mArachna zuerst

die morphologischen und syntaktischen Analysen durchgef¨

uhrt. Zum Schluss

erfolgt auf Basis dieser beiden Analysen die semantische Analyse. Somit ist eine

getrennte Betrachtung der einzelnen Komponenten m¨

oglich.

Die in der nat¨

urlichsprachlichen Analyse verwendeten Verfahren (Kapitel 2.4)

sind sehr einfache und zumeist regelbasiert. Im Folgenden wird anhand eines

Beispieltextes (Abbildung 4.3) die nat¨

urlichsprachliche Analyse diskutiert. Al-

lerdings soll nicht der gesamte Text betrachtet werden, da dadurch die Analyse

zu kompliziert wird, um sie auf Papier darzustellen.

4.2.1 Zerlegung von L

A

T

E

X in Satzteile, W¨

orter und For-

meln

Der mathematische Texte wird zun¨

achst vom L

A

T

EX-Format in das TEI-Format

konvertiert. TEI steht dabei f¨

ur Text Encoding Initiative [TEIa, SMB03a,

SMB03b, TEIb].

156 KAPITEL 4. ARCHITEKTUR VON MARACHNA

Definition

Seien Veine Menge und Kein K¨

orper mit den zwei Verkn¨

upfungen:

•V×V→VAddition mit < a, b >7→ a+b.

•K×V→VMultiplikation mit einem Skalar mit < α, b >7→ αb.

Vmit der Addition und Multiplikation heißt Vektorraum ¨

uber K. Die

Elemente aus Vheißen Vektoren und die Elemente aus Kheißen Skalare

oder Koeffizienten.

F¨

ur die Addition gilt:

•a+b=b+a,∀a, b ∈V(kommutativ)

•a+ (a+b) = (a+b) + c,∀a, b, c ∈V(assoziativ)

• ∃0∈V, so dass a+ 0 = a,∀a∈V(neutrales Element)

•Zu jedem a∈V∃ − a∈V, so dass a+ (−a) = 0 (inverses Element

zu a)

F¨

ur die Multiplikation mit Skalaren gilt:

•α(βa) = (αβ)a,∀a∈Vund α, β ∈K(assoziativ)

•1a=a,∀a∈V(neutrales Element)

Zwischen Addition und Multiplikation mit Skalaren gelten die Distribu-

tivgesetze:

•α(a+b) = αa +αb,∀a∈Vund α∈K

•(α+β)a=αa +βa,∀a∈Vund α, β ∈K

Abbildung 4.3: Beispieltext — Definition f¨

ur den Vektorraum [SJZ04]

4.2. NAT ¨

URLICHSPRACHLICHE ANALYSE 157

”TEI is an international and interdisciplinary standard that helps

libraries, museums, publishers, and individual scholars represent all

kinds of literary and linguistic texts for online research and teaching,

using an encoding scheme that is maximally expressive and minimal-

ly obsolescent.“ [TEIa]

Dieses Format wurde entwickelt, um ein standardisiertes Verfahren bereitzustel-

len, das auch semantische Strukturen (z. B. ¨

Uberschriften) und typographische

Informationen von Texten in elektronischen Medien kodieren kann und dabei

unabh¨

angig vom verwendeten Betriebssystem ist. Urspr¨

unglich wurde die Stan-

dard Generalized Markup Language (SGML) verwendet, mittlerweile gibt es

aber auch Versionen in XML.

”Interessant sind die TEI-Richtlinien f¨

ur jeden, der einen elektroni-

schen Text in einem dauerhaften Format speichern will. Insbesonde-

re Textwissenschaftler aller Art, z. B. Literaturwissenschaftler oder

Linguisten, werden in TEI eine M¨

oglichkeit finden, sich von pro-

priet¨

aren Systemen der Textspeicherung (wie z. B. MS-Word) oder

von offenen Standards, deren Komplexit¨

at den gestellten Aufgaben

nicht gewachsen ist (z. B. HTML), frei zu machen. “ [TEIb]

Das TEI-Format bietet sich daher als Standardschnittstelle f¨

ur die nat¨

urlich-

sprachliche Analyse an. Dadurch existiert eine Schnittstelle f¨

ur weitere Parser,

die z. B. mathematische Texte von HTML nach TEI ¨

ubersetzen k¨

onnen. TEI ist

aufgrund der Verwendung von XML sehr flexibel, so dass auch mathematische

Inhalte mittels MathML 2.0 ([W3C04], siehe unten) integriert werden k¨

onnen.

Aus den genannten Gr¨

unden wurde in mArachna die XML-Variante TEI P4

verwendet.

”MathML is an XML application for describing mathematical no-

tation and capturing both its structure and content. The goal of

MathML is to enable mathematics to be served, received, and proces-

sed on the World Wide Web, just as HTML has enabled this func-

tionality for text.“ [W3C03]

Mit MathML k¨

onnen also nicht nur mathematische Zeichen in Webseiten darge-

stellt (Presentation Markup), sondern auch mathematische Inhalte semantisch

158 KAPITEL 4. ARCHITEKTUR VON MARACHNA

ausgezeichnet werden (Content Markup). Die Interpretation von semantischen

Inhalten wird dann erforderlich, wenn z. B. verschiedene Notationen verwen-

det werden. Somit bietet MathML die M¨

oglichkeit, mathematische Formeln zu

interpretieren und sie somit f¨

ur die semantische Analyse von mathematischen

Texten zug¨

anglich zu machen. In Abbildung 4.4 ist ein Ausschnitt aus dem Bei-

spieltext 4.3 im TEI-Format mit integriertem MathML zu sehen. Der gesamte

Text ist in Anhang 6.1 angef¨

ugt.

Abbildung 4.4: TEI-MathML-Textausschnitt

Nach der Konvertierung des L

A

T

EX-Textes in das TEI-Format wird der Text

zun¨

achst in einzelne Entit¨

aten zerlegt. Dadurch entstehen Definitionen, S¨

atze

usw., die schon im Originaltext ausgezeichnete Strukturelemente waren. Somit

kann die straffe Struktur von mathematischen Texten (Kapitel 3.3.6) ausgenutzt

werden. Daraus k¨

onnen bereits erste semantische Schlussfolgerungen gezogen

werden, die in anderen fachsprachlichen Texten normalerweise nicht so stark

ausgepr¨

agt vorliegen. Anschließend werden die Texte in immer kleiner werdende

weitere Strukturelemente zerlegt. Dies geschieht ¨

uber ausgezeichnete Struktur-

elemente wie z.B. Listen, ¨

uber S¨

atze bis hin zu einzelnen W¨

ortern und Formeln.

Zu den W¨

ortern z¨

ahlen dabei auch Satzzeichen wie Punkte und Kommata.

Diese strukturelle Zerlegung (WordTokenizer) erfolgt in mArachna durch die

Klasse wbs.lexana.segment.XMLReader. Der XMLReader liest den in TEI ko-

dierten Text ein und zerlegt ihn in seine Strukturelemente. Aufbauend auf

4.2. NAT ¨

URLICHSPRACHLICHE ANALYSE 159

der Basisklasse wbs.lexana.segement.structure.Structure existieren f¨

unf

grundlegende Strukturelemente, deren Strukturhierarchie in Abbildung 4.5 dar-

gestellt ist:

•Environment: gesamtes Dokument, Entit¨

aten und Listeneintr¨

age

•ItemList: Listen

•MathEnvironment: mathematische Elemente wie z. B. Formeln

•Sentence: S¨

atze

•Word: W¨

orter

Environment

Word

ItemList

Word

MathEnvironment

Word

Sentence

Environment Sentence

Abbildung 4.5: Textstruktur

In Beispiel 4.2.1 wird vereinfacht die Zerlegung f¨

ur den Beispieltext vorgestellt1.

Das gesamte Dokument, die Entit¨

at (Definition) und die Listeneintr¨

age (z. B.:

”V×V−→ Vmit Addition [...]“) geh¨

oren der Strukturelementklasse Environ-

ment an, jedoch besitzen sie unterschiedliche Typen (document,definition und

item). Environments werden gekennzeichnet durch:

Inhalt des Environments

</enviroment>

1Die vollst¨

andige Datei befindet sich in Anhang 6.2

160 KAPITEL 4. ARCHITEKTUR VON MARACHNA

Der Tag <item> kennzeichnet Listen bzw. Auflistungen, die ihrerseits die oben

genannten Listeneintr¨

age enthalten. Listen geh¨

oren der Klassen wbs.lexana.

segment.structure.ItemList an. Listen werden gekennzeichnet durch:

<list>

<enviroment type="item">LISTENEINTRAG 1</environment>

<enviroment type="item">LISTENEINTRAG 2</environment>

</list>

S¨

atze werden durch die Klasse wbs.lexana.segment.structure.Sentence und

W¨

orter durch wbs.lexana.segment.structure.Word gekennzeichnet:

<word>WORTEINTRAG</word>

</sentence>

Als gesonderte Elemente werden mathematische Zeichen, wie Formeln und Sym-

bole, behandelt. Sie werden durch MathML-Code integriert.

Beispiel 4.2.1 (Zerlegung des Beispielstextes 4.3 in seine Strukturelemente)

<word>Seien</word>

</math>

<word>Menge</word>

[...]

</sentence>

<list>

[...]

4.2. NAT ¨

URLICHSPRACHLICHE ANALYSE 161

</sentence>

</environment>

[...]

</sentence>

</environment>

</list>

[...]

</sentence>

</environment>

Nach dieser Zerlegung werden die S¨

atze als Aneinanderreihungen von W¨

ortern

in Haupt- und Nebens¨

atze zerlegt:

•wbs.lexana.segment.sentence.MainClause (Hauptsatz)

•wbs.lexana.segment.sentence.SubClause (Nebensatz)

Dies geschieht in wbs.lexana.segment.structure.Sentence mit der Methode

getSentenceType() (Abbildung 4.6). In der Methode wird ¨

uber die einzelnen

W¨

orter iteriert und nach Kommata und Schl¨

usselw¨

ortern (unterordnende Kon-

junktion: wenn, dass usw.) gesucht. Die Schl¨

usselw¨

orter k¨

onnen entweder am

Satzanfang (Abb. 4.6 Kasten links) oder hinter einem Komma (Abb. 4.6 Kas-

ten rechts) stehen.

if (!comma)

if (comma)

handleComma();

else if (Schlüsselwort)

else

handleHauptsatz();

if (comma)

if (Schlüsselwort)

Nebensatz bis zum nächstenKomma

else

handleHauptsatz();

handleComma()

Nebensatz mit Schlüsselwort als Einleitung;

getSentenceType()

Abbildung 4.6: Funktionsweise von getSentenceType()

162 KAPITEL 4. ARCHITEKTUR VON MARACHNA

Diese Form der Verarbeitung von S¨

atzen ist sicherlich nicht vollst¨

andig, da u. a.

uneingeleitete Nebens¨

atze (ohne Konjunktion) und Pronominals¨

atze nicht als

solche und als Haupts¨

atze gekennzeichnet werden. Jedoch werden durch die

vorhandene Konstruktion viele mathematische S¨

atze korrekt verarbeitet. Au-

ßerdem k¨

onnen auf diese Art nichtgrammatikalische Konstruktionen, wie S¨

atze

ohne Verb oder S¨

atze, die nur aus mathematischen Zeichen bestehen, als Haupt-

satz gekennzeichnet werden.

4.2.2 Morphologische Analyse

Die morphologische Analyse, obwohl als Prozess unabh¨

angig von der syntakti-

schen Analyse, ist so ausgelegt, dass die syntaktische Analyse m¨

oglichst pro-

blemlos auf sie aufsetzen kann. Sie basiert auf einem W¨

orterbuch, in dem alle

in mathematischen Texten auftretenden W¨

orter manuell eingetragen werden.

Es ist anzunehmen, dass sich die mathematische Sprache durch einen kleineren

Wortschatz als andere Fachsprachen auszeichnet (Kapitel 2.4.4, Kapitel 1.2 Hy-

pothese 1.2.3). Insbesondere ist die Menge der W¨

orter, die nicht direkt der ma-

thematischen Terminologie angeh¨

oren, eng begrenzt. Zu diesen W¨

ortern z¨

ahlen

z. B. die Artikel, Konjunktionen, h¨

aufig gebrauchte Verben (z. B.: sein, besitzen,

existieren usw.). Der Rest der W¨

orter geh¨

ort der mathematischen Terminologie

an, die in Definitionen charakterisiert wird. Es handelt sich haupts¨

achlich um

Adjektive und Substantive. Beide W¨

ortergruppen bilden den mathematischen

Wortschatz.

Das W¨

orterbuch von mArachna besteht aus zwei XML-Dateien:

•eine W¨

orterliste mit Suffixzuordnungen

wbs/lexana/morph/verbosity.words.xml

•eine Liste mit Suffixregeln

wbs/lexana/morph/suffix.suffixes.xml

Diese beiden Dateien werden ¨

uber den entsprechenden Reader

•wbs.lexana.morph.WordReader f¨

ur words.xml

•wbs.lexana.morph.SuffixReader f¨

ur suffixes.xml

4.2. NAT ¨

URLICHSPRACHLICHE ANALYSE 163

durch den wbs.lexana.morph.WordAnalyzer eingelesen. Die so erzeugten

W¨

orter werden mit den einzelnen W¨

ortern des Textes verglichen.

Beispiele f¨

ur Eintr¨

age in der Datei words.xml:

•Substantiv: Abbildung

</word>

•regelm¨

aßiges Verb: beweisen

</word>

•unregelm¨

aßiges Verb: sein

</verb>

</word>

•Pr¨

aposition: auf

</word>

164 KAPITEL 4. ARCHITEKTUR VON MARACHNA

Beispiele f¨

ur Eintr¨

age in der Datei suffix.xml:

•F¨

ur Substantive:

</suffix>

•F¨

ur regelm¨

aßige Verben:

</suffix>

MorphAnalyzer

words.xml suffixes.xml

verbosity.Word

MorphWord

Adjective Bracket

Article

Conjunction

MathWord

Preposition

Pronoun

Substantive

SymbolVerb

WordReader SuffixReader

MathAnalyzer

ConjunctionPredicative

ConjunctionAdjective

ConjunctionMain

Abbildung 4.7: Struktur der semantischen Analyse

4.2. NAT ¨

URLICHSPRACHLICHE ANALYSE 165

Die W¨

orter aus den mathematischen Texten werden den entsprechenden Wort-

arten zugeordnet, die durch Java-Klassen repr¨

asentiert werden. Diese Klassen

sind von der Basisklasse wbs.lexana.morph.verbosity.Word abgeleitet und

entsprechen den bekannten Wortarten [Dud98]. Des Weiteren gibt es zus¨

atzli-

che Wortklassen, die sich als n¨

utzlich erwiesen haben:

•Wortarten:

1. wbs.lexana.morph.verbosity.Substantive (Substantiv)

2. wbs.lexana.morph.verbosity.Verb (Verb)

3. wbs.lexana.morph.verbosity.Adjective (Adjektiv)

4. wbs.lexana.morph.verbosity.Article (Artikel)

5. wbs.lexana.morph.verbosity.Pronoun (Pronomen)

6. wbs.lexana.morph.verbosity.Preposition (Pr¨

aposition)

7. wbs.lexana.morph.verbosity.Conjunction (Konjunktion)

•Zus¨

atzliche Word-Klassen:

1. wbs.lexana.morph.verbosity.MathWord

2. wbs.lexana.morph.verbosity.Symbol

3. wbs.lexana.morph.verbosity.Bracket

4. wbs.lexana.morph.verbosity.ConjunctionAdjective

5. wbs.lexana.morph.verbosity.ConjunctionMain

6. wbs.lexana.morph.verbosity.ConjunctionListBack

In mArachna werden nicht alle Formen von Partikeln (unflektierbare W¨

orter)

behandelt. Adverbien werden je nach ihrem Gebrauch den Adjektiven oder

Pr¨

apositionen zugeordnet. Das ist zwar grammatikalisch falsch, jedoch wird die

syntaktische Analyse dadurch vereinfacht. Interjektionen, eine weitere Art der

Partikel, treten im mathematischen Wortschatz (Kapitel 3.3) nicht auf.

Die zus¨

atzlichen Word-Klassen sind zur Vereinfachung der nat¨

urlichsprachlichen

Analyse konstruiert worden. Die MathWord-Klasse beinhaltet alle mathema-

tischen Zeichen und Formeln, die im wbs.lexana.morph.MathAnalyzer separat

166 KAPITEL 4. ARCHITEKTUR VON MARACHNA

verarbeitet werden. So k¨

onnen in mArachna einfache mathematische Symbo-

le und Konstruktionen erkannt werden. Die Symbol-Klasse handhabt einzelne

Buchstaben und Ziffern, die in der Mathematik hinter dem Substantiv auftre-

ten, und wichtige Satzzeichen (z. B.: ”:“, ”;“). Die Bracket-Klasse beschreibt die

Klammersymbole als besondere Symbole, da in der Mathematik h¨

aufig hinter

einer Formel (MathWord) definierende Begriffe in Klammern aufgef¨

uhrt werden.

Ein zus¨

atzliches Problem f¨

ur die syntaktische Analyse sind die verschiedenen

Konjunktionsverbindungen, die in der mathematischen Sprache insbesondere

in den Voraussetzungen (Kapitel 3.3.2) auftreten. Die Wortart Conjunction

wird in der morphologischen Analyse verwendet. Die letzten drei Word-Klassen

(ConjunctionAdjektive,ConjunctionMain und ConjunctionListBack) sind

in der syntaktischen Analyse von Bedeutung. Dort wird eine Conjunction ge-

gebenenfalls in eine dieser zus¨

atzlichen Klassen umgewandelt. Sie sind grob un-

terteilt nach der Verwendungsart der Konjunktion (Verbindung von W¨

ortern,

Wortgruppen oder S¨

atzen):

1. Verbindung von Adjektiven

wbs.lexana.morph.verbosity.ConjunctionAdjective

”f ist injektiv und surjektiv.“

2. Hauptsatzverbindungen:

wbs.lexana.morph.verbosity.ConjunctionMain

”A ist eine Menge und B ist eine Gruppe.“

3. Aufz¨

ahlungen zum Satzende2

wbs.lexana.morph.verbosity.ConjunctionListBack

”Ein Paar (A, ∗), bestehend aus einer Menge A und einer Verkn¨

upfung

∗.“

4. Sonstige unterordnende Konjunktionen

wbs.lexana.morph.verbosity.Conjunction

”A und B seien Mengen.“

Da Entit¨

aten verwendet werden und dort relativ strenge Regeln f¨

ur die Verwen-

dung von W¨

ortern gelten, werden morphologische Ambiguit¨

aten weitestgehend

2Diese Konstruktion wurde aus rein technischen Gr¨

unden gew¨

ahlt.

4.2. NAT ¨

URLICHSPRACHLICHE ANALYSE 167

vermieden oder in dieser Phrase der Analyse nicht erkannt. In einer sp¨

ateren

Phase der morphologischen Analyse werden alle W¨

orter einem allgemeinen Typ

bzw. einer Basisklasse wbs.lexana.morph.MorphWord zugeordnet. Die Instan-

zen dieser Basisklasse enthalten die Wortart und Zusatzinformationen, die f¨

ur

die semantische Analyse von Interesse sind (z. B. den Numerus).

In Beispiel 4.2.2 wird ein Ausschnitt der Protokolldatei der morphologischen

Analyse des Beispieltextes 4.3 dargestellt. Es kann daraus abgelesen werden, in

welchem der Zust¨

ande (Personal-, Tempus-, Kasus-, Numerus- und Genusfor-

men) das Wort m¨

oglicherweise steht. Allerdings kann keine eindeutige Aussage

¨

uber den Zustand gemacht werden. Jedoch werden in mArachna diese Zust¨

ande

nur als Zusatzinformationen betrachtet. Ausgenommen sind die Numerusformen

(Singular und Plural), die bereits verwendet werden.

Beispiel 4.2.2 (Morphologischen Analyse des Beispielsatzes 4.3)

”Seien V eine Menge [...]“

<morph>

<word>

<form>seien</form>

<verb>

</verb>

</word>

<word>

<math/>

</word>

<word>

</word>

<word>

<form>menge</form>

168 KAPITEL 4. ARCHITEKTUR VON MARACHNA

</substantive>

</word>

[...]

</morph>

4.2.3 Syntaktische Analyse

In der syntaktischen Analyse werden die S¨

atze in ihre Satzstrukturelemente

zerlegt, um diese f¨

ur die semantische Analyse zu pr¨

aparieren. Als grundlegende

Idee wurde dazu die von Chomsky (Kapitel 2.4.2) vorgeschlagene Phrasenstruk-

turgrammatik verwendet. Dabei sind zwei Teilschritte n¨

otig, die f¨

ur Haupt- und

Nebens¨

atze getrennt durchgef¨

uhrt werden.

•eine Vorverarbeitung

•die Generierung der Phrasenstruktur

Ein Transformer (wbs.lexana.segment.Transformer) bereitet typische mathe-

matische Konstruktionen anhand der Vorverarbeitungsregeln auf, die im Kapitel

3.3 aufgelistet wurden. Sie pr¨

apariert somit die einzelnen S¨

atze f¨

ur den Phra-

senstrukturgenerator. Daf¨

ur wurden eine Reihe von Regeln f¨

ur typische mathe-

matische Konstruktionen entwickelt (Kapitel 3.3), zum Beispiel:

•Verbvorverarbeitungsregeln:

–Stehen die Verben sei oder seien am Satzanfang, dann verschiebe sie

hinter das MathWord.

”Sei A eine Menge“−→ ”A ist eine Menge“

–Steht zwischen MathWord und Adjektiv kein Verb, so f¨

uge das Verb

sein ein.

”f injektiv.“−→ ”f sein injektiv.“

4.2. NAT ¨

URLICHSPRACHLICHE ANALYSE 169

•Konjunktionsvorverarbeitungsregeln:

–Werden zwei Haupts¨

atze durch ein und getrennt, so bilde zwei sepa-

rate S¨

atze.

”Sei A eine Menge und B eine Gruppe“−→ ”A ist eine Menge, B ist

eine Gruppe“

Im Rahmen der Verbvorverarbeitung werden dem Verb Zusatzinformationen

beigef¨

ugt. So ist das Verb sei am Satzanfang ein Kennzeichen f¨

ur eine Vor-

aussetzung (Kapitel 3.3.2) und erh¨

alt diese Zusatzinformation f¨

ur die semanti-

sche Analyse, auch wenn es w¨

ahrend der Vorverarbeitung innerhalb des Satzes

verschoben wird. Der Transformer enth¨

alt daf¨

ur eine Zusammenstellung von

typischen Konstruktionen der mathematischen Sprache.

Transformer PhraseGenerator

TransformerMain

TransformerSub

PhraseGeneratorMain

PhraseGeneratorSub

Nominalphrase

Verbphrase

phrase.Phrase

NominalConjunctionAdjectivephrase

Adjectivephrase

NominalConjunctionMainphrase

NominalConjunctionphrase

NominalConjunctionPredicativephrase

Hauptsatz

Nebensatz

NominalPrepositionphrase

AdjectivePredicativephrase

AdjectiveAttributivephrase

Abbildung 4.8: Struktur der syntaktischen Analyse

170 KAPITEL 4. ARCHITEKTUR VON MARACHNA

Nach der Vorverarbeitung werden die Phrasen gebildet. Neben den durch

Chomsky bekannten Phrasen (Kapitel 2.4.2) werden weitere Phrasentypen ver-

wendet, um die semantische Analyse zu vereinfachen:

1. Bekannte Phrase:

•Nominalphrase

•Verbalphrase

•Adjectivephrase

2. Zusatzphrasen:

•NominalPrepositionphrase

•AdjectivePredicativephrase

•AdjectiveAttributivephrase

•NominalConjunctionphrase

•NominalConjunctionMainphrase

•NominalConjunctionPredicativephrase

Nominalphrase

Eine grundlegende Phrase ist die Nominalphrase (NP). Sie besitzt die Kompo-

nenten bzw. Wortformen (Darstellungen in EBNF):

•Sub ::= SUBSTANTIVE (* Substantiv *)

•Art ::= ARTICLE (* Artikel*)

•Pro ::= PRONOUN (* Pronomen *)

•Sym ::= SYMBOL (* Symbol *)

•Mw ::= MATHWORD (* mathematische Zeichen *)

•Pre ::= PREPOSITON (* Pr¨

aposition *)

Eine Nominalphrase wird im Phrasegenerator durch die folgenden Regeln er-

zeugt:

4.2. NAT ¨

URLICHSPRACHLICHE ANALYSE 171

•NP ::= [Pre] [Art |Pro] Sub [Mw |Sym];

•NP ::= [Pre] [Art |Pro] Mw;

Sub Sym

NP NP

Art

Menge

Pre SubArt

für eine Menge Meine

Abbildung 4.9: Beispiele f¨

ur die Nominal-Phrase

Adjectivephrase

Die wbs.lexana.segment.phrase.Adjectivephrase ist die Basisklasse f¨

ur die

Verwendung von Adjektiven.

•AP ::= (Adj)+;

Es gibt eine weitere Klasse, die von der Adjectivephrase-Klasse abgeleitet

wird:

1. AdjectiveAttributivephrase: Adjektive stehen vor dem Substantiv

bzw. MathWord

•AAP ::= [Pre] [Art |Pro] (Adj)+ Sub [Mw |Sym];

•AAP ::= [Pre] [Art |Pro] (Adj)+ Mw;

AAP

Art Adj Sub

eine injektive Funktion

S

NP VP

Art Sub V AP

eine Funktion ist injektiv

Abbildung 4.10: Beispiele f¨

ur die Adjective-Phrasen

172 KAPITEL 4. ARCHITEKTUR VON MARACHNA

NominalConjunction-Konstruktionen

Die NominalConjunction-Konstruktionen sind und- oder oder-Verbindungen

von Satzteilen, die in der Mathematik sehr h¨

aufig verwendet werden. Auf-

grund der schon diskutierten Verwendung von verschiedenen Konjunktionen in

der morphologischen Analyse sind zwangsl¨

aufig auch verschiedene syntaktische

Phrasen notwendig.

1. NominalConjunctionMain: Haupts¨

atze, die durch eine Konjunktion ge-

trennt sind

•NCMP ::= P P Con;

•P ::= NP VP;

•Con ::= CONJUNCTION;

2. NominalCojunctionPredicativephrase: Aufz¨

ahlungen

•NCPP ::= P1 P2 Con;

•P1 ::= NP VP;

•P2 ::= NP |NPP;

•Con ::= CONJUNCTION;

3. NominalConjunctionAdjectivephrase: Adjektive werden durch ein und

getrennt

•NCAP ::= AP AP Con;

•AP ::= (Adj)+;

•Con ::= CONJUNCTION;

4. NominalConjunctionPhrase: sonstiges

•NCP ::= P P Con;

•P ::= NP |NP VP |NPP;

•Con ::= CONJUNCTION;

4.2. NAT ¨

URLICHSPRACHLICHE ANALYSE 173

NCAP

AP AP P

Adj Adj

NCMP

Con

NP

P P

VPNP VP

Con

NCPP

P P

NP VP NP

NCP

Con P

NP NP VP

Con

und und

Abbildung 4.11: Beispiele f¨

ur NominalConjunction-Phrasen

NominalPrepositionphrase

Die NominalPrepositionphrase ist eine Spezialkonstruktion f¨

ur die

Pr¨

apositional- und Konjunktionalgruppen.

1. NPP ::= {NP } | NP AAP

NPP

P P

NP NP

Sub Pre Mw

von fWertevorrat

Abbildung 4.12: Beispiele f¨

ur die NominalPreposition-Phrasen

Verbalphrase

Die Verbalphrase ist die zentrale Phrase. Sie besteht aus einem Verb und einer

Phrase, die in den weiteren Analysen als Objekt des Satzes erkannt werden

kann.

1. VP ::= Verb P;

174 KAPITEL 4. ARCHITEKTUR VON MARACHNA

2. Verb ::= VERB (* Verben*)

3. P ::= NP |NPP |NCAP |NCPP;

VAAP

VP

NP

VP

NPP

NP

Art SubV

ist eine Menge

Abbildung 4.13: Beispiele f¨

ur die Verb-Phrasen

Gesamtbetrachtung

Das Ergebnis ist eine Baumstruktur von Phrasen der einzelnen S¨

atze. In Abbil-

dung 4.14 wird die Analyse der Voraussetzung des Beispielsatzes 4.3 verdeut-

licht. Des Weiteren wird ein Ausschnitt der Protokolldatei der syntaktischen

Analyse vorgestellt. Die gesamte Protokolldatei f¨

ur den Beispielsatz findet sich

in Anhang 6.4.

Beispiel 4.2.3 (Syntaktische Analyse des Beispieltextes 4.3)

*******

** SATZ: Seien $ V $ eine Menge ,

$ K $ ein K¨orper mit den zwei Verkn¨upfungen :

** HAUPTSATZ[1]: Seien $ V $ eine Menge

** HAUPTSATZ[2]: $ K $ ein K¨orper mit den zwei Verkn¨upfungen :

Nominalphrase:

MathWord: V

Verbalphrase: Verb: sein

Nominalphrase:

Artikel: eine

Substantiv: menge

4.2. NAT ¨

URLICHSPRACHLICHE ANALYSE 175

Nominalphrase:

MathWord: K

Verbalphrase: Verb: sein

Nominalphrase mit Preposition:

Nominalphrase:

Artikel: ein

Substantiv: k¨orper

Attributive Adjektiv:

Adjektiv: zwei

Preposition: mit

Artikel: den

Substantiv: verkn¨upfung

Symbol: :

Abbildung 4.14: Analyse des Beispielsatzes

176 KAPITEL 4. ARCHITEKTUR VON MARACHNA

4.2.4 Semantische Analyse

Die semantische Analyse versucht unter Verwendung der Ergebnisse der mor-

phologischen und syntaktischen Analyse die Inhalte von mathematischen Texten

zu extrahieren. Dazu verwendet sie ein einfaches Modell der regelbasierten Ana-

lyse, das in drei Schichten aufgebaut ist:

1. Aufl¨

osung der Phrasenstruktur zu einer Satzbaustruktur

wbs.lexana.semantic.SemanticPhraseAnalyzer

2. Analyse der Satzstruktur

wbs.lexana.semantic.SemanticPredicateAnalyzer

3. Analyse der Entit¨

atenstruktur

wbs.lexana.semantic.SemanticEntityAnalzyer

SemanticAnalyzer

SemanticPhraseAnalyzerMain SemanticPhraseAnalyzerSub

SemanticPredicateAnalzyerMain SemanticPredicateAnalyzerSub

SemanticEntityAnalyzer

Hauptsatz Nebensatz

Abbildung 4.15: Semantische Analyse

Der Vorteil der mathematischen Sprache, die in den einzelnen Entit¨

aten auftritt,

ist die Einfachheit der Satzkonstruktionen. Es handelt sich um Aussages¨

atze.

Die Struktur eines einfachen Satzes wird durch das Verb bestimmt. Es wird auch

als Pr¨

adikat bezeichnet. Vom Pr¨

adikat aufgerufen stehen im Satz die Satzglie-

der. Neben dem Pr¨

adikat und den Satzgliedern existieren Verbindungselemente,

die die einzelnen S¨

atze miteinander verkn¨

upfen. S¨

atze k¨

onnen dadurch komplexe

Strukturen bilden, die in der Mathematik aber nur selten auftreten.

4.2. NAT ¨

URLICHSPRACHLICHE ANALYSE 177

4.2.4.1 Charakterisierung von Satzgliedern

In mArachna werden nur wenige Satzglieder verwendet. Es existieren:

•Pr¨

adikat

wbs.lexana.semantic.phrase.Predicate

•Subjekt

wbs.lexana.semantic.phrase.NominalSubject

•Objekt

wbs.lexana.semantic.phrase.ObjectPhrase

•Satzadjektive

wbs.lexana.semantic.phrase.AdjectiveObject

•Verbindungen

wbs.lexana.semantic.phrase.NominalConjunctionSubject

Insbesondere werden die Objekte nicht im Bezug auf ihr Genus betrachtet. Es

findet daher keine Unterscheidung zwischen Akkusativobjekt, Dativobjekt und

Genitivobjekt statt. Pr¨

apositionalobjekte werden ¨

uber das Objekt verarbeitet.

Der Satzgliedbau wird durch die Phrasenstruktur aus der syntaktischen Ana-

lyse simuliert. Die in mArachna getesteten S¨

atze aus der Beispieldefinition ha-

ben eine einfache Struktur, so dass bei der Identifizierung der Satzglieder keine

Schwierigkeiten auftreten.

Prädikat

Subjekt Objekt

Abbildung 4.16: Baumstruktur des Satzbaus

Die Transformation der Phrasenstruktur in die Satzbaustruktur erfolgt durch

den wbs.lexana.semantic.SemanticPhraseAnalyzer getrennt f¨

ur Haupt- und

Nebens¨

atze. Folgende Regeln werden f¨

ur die Analyse verwendet:

178 KAPITEL 4. ARCHITEKTUR VON MARACHNA

•S ::= NP VP;

•NP ::= Subjekt;

•VP ::= V NP mit V ::= Pr¨

adikat und NP ::= Objekt;

Beispiel: A ist ein Menge. −→ [A]Subjekt[ist]Pr¨

adikat[eine Menge]Objekt

4.2.4.2 Semantische Objekte

S¨

atze in Entit¨

aten werden durch charakteristische Phrasen und Verben gekenn-

zeichnet. Bei der Analyse der Satzstruktur werden diese Wortstrukturen (Kapi-

tel 2.4.2) genutzt, um der Satzbaustruktur semantische Objekte zuzuordnen.

Es gibt drei verschiedene Typen von semantischen Objekten f¨

ur die Verarbei-

tung von Definitionen:

1. wbs.lexana.semantic.semanticObject.DefinedObject:

Charakterisiert das Element des Satzes, das definiert wird.

2. wbs.lexana.semantic.semanticObject.DefiningObject:

Charakterisiert die Elemente des Satzes, die das DefinedObject definieren.

3. wbs.lexana.semantic.semanticObject.ConditionObject:

Charakterisiert Nebensatzkonstruktionen, z. B. Nebens¨

atze, die durch eine

Konjunktion eingeleitet werden.

Die Transformation der Satzbaustruktur in die semantischen Objekte erfolgt

durch den wbs.lexana.semantic.SemanticPredicateAnalyzer getrennt f¨

ur

Haupt- und Nebens¨

atze.

•Pr¨

adikat ::= SubjektObjekt;

•Subjekt ::= DefinedObjekt;

•Objekt ::= DefiningObjekt;

Beispiel: A ist ein Menge. −→

•[A]Subjekt DefinedObject

4.2. NAT ¨

URLICHSPRACHLICHE ANALYSE 179

•[M]Objekt DefiningObject

Das Pr¨

adikat bleibt erhalten und wird im n¨

achsten Schritt semantisch verarbei-

tet.

4.2.4.3 Entit¨

atenstruktur

Entit¨

aten bestehen nicht nur aus einem grammatikalischen Satz, sondern aus

einer Reihe von S¨

atzen, die meist in einer bestimmten Reihenfolge auftreten.

So zeigen z. B. Definitionen eine typische dreigeteilte Struktur, bestehend aus

Voraussetzung,Aussage und einer Eigenschaft oder oftmals auch einer Lis-

te von Eigenschaften (Kapitel 3.3.2). Diese Struktur wird in Abbildung 4.17

dargestellt.

Voraussetzungen listen die vorhandenen mathematischen Objekte auf und ord-

nen sie gegebenenfalls mathematischen Symbolen zu. Die Aussage beschreibt

das zu definierende Element und in welcher Beziehung es zu den Vorausset-

zungen steht. Zus¨

atzliche Angaben werden in der Eigenschaftenliste aufgef¨

uhrt.

Aufgrund der logischen Struktur der Entit¨

aten und der einfachen Konstrukti-

on der einzelnen S¨

atze k¨

onnen semantische Informationen extrahiert werden.

Phrasen, Verben und Satzbau charakterisieren die einzelnen Bausteine einer

Definition. Die Erkennung von Voraussetzung, Aussage und Eigenschaften ist

dadurch einfach.

Abbildung 4.17: Entit¨

atenstruktur

180 KAPITEL 4. ARCHITEKTUR VON MARACHNA

Voraussetzungen, die nach dem letzten Analyseschritt aus einer Liste von

DefinedObjects und DefiningObjects bestehen, werden durch die Klasse

wbs.lexana.semantic.theoremObject.AssumptionObject

analysiert, und die extrahierten Informationen in einem speziellen Objekt

gesammelt. Entsprechend werden auch Eigenschaften durch die Klasse

wbs.lexana.semantic.theoremObject. PropertyObject verarbeitet. Bei-

de Objekte, AssumptionObject und PropertyObject, werden der Klasse

wbs.lexana.semantic.theoremObject.DefinitionObject zur Verf¨

ugung

gestellt und regelbasiert analysiert.

Subjekt Pr¨

adikat Objekt

Vektorraum is a Menge

Vektorraum has a Addition

Vektorraum has a Multiplikation mit einem Skalar

Addition is a Verkn¨

upfung

Multiplikation mit einem Skalar is a Verkn¨

upfung

Abbildung 4.18: Endergebnis der semantischen Analyse des Beispieltextes

Das durch eine Liste von Tripeln (Subjekt, Pr¨

adikat, Objekt) in der Tabelle

4.18 dargestellte Ergebnis soll der Wissensbasis (Kapitel 4.3) ¨

ubergeben werden.

Subjekt, Pr¨

adikat und Objekt sind nicht zu verwechseln mit der Satzbautermi-

nologie, sondern kennzeichnen hier die Teile des Ergebnistripels. Die Pr¨

aposi-

tionalphrase Multiplikation mit einem Skalar wird in dieser Analyse noch nicht

aufgel¨

ost (Kapitel 4.3). Dies geschieht erst im Zusammenspiel mit der Wissens-

basis.

4.3. WISSENSBASIS 181

4.3 Wissensbasis

Wenn Menschen nur ¨

uber das spr¨

achen, was sie

begreifen, dann w¨

urde es sehr still auf der Welt sein.

(Albert Einstein)

4.3.1 Grundkonzept

Die Wissensbasis ist das Herzst¨

uck von mArachna. Sie dient einerseits der

Sammlung von mathematischen Informationen, andererseits unterst¨

utzt sie die

semantische Analyse.

Die Wissensbasis liegt in Form einer Ontologie (Kapitel 2.2) vor, die anfangs

nur eine geringe Menge im Programmcode vorgegebenen elementaren Grund-

lagenwissens der Mathematik enth¨

alt (Kapitel 3.4). Dabei handelt es sich um

die mathematische Pr¨

adikatenlogik und die axiomatische Mengenlehre (Kapitel

3.2.2 und 3.2.3). Auf Basis dieses Grundlagenwissens wird die Ontologie um

weitere mathematische Informationen erweitert. Diese Erweiterungen stammen

aus den Informationen, die durch die nat¨

urlichsprachliche Analyse der mathe-

matischen Texte extrahiert werden. Die semantischen Inhalte der einzelnen En-

tit¨

aten k¨

onnen jedoch nicht f¨

ur sich alleine stehen, da sie kontextuell gebunden

sind. Die Wissensbasis dient daher als Sammelbecken f¨

ur diese Informationen

und stellt diese in einen kontextuellen Zusammenhang. Sie nimmt dabei keine

mathematischen Informationen auf, die keinen Bezug zu einem Eintrag in der

Wissensbasis haben.

Die erzeugten Wissensstrukturen (Wissenrepr¨

asentation) besitzen eine kom-

plexe Struktur (Kapitel 2.2). Einerseits werden sie durch die semantischen Struk-

turen der mathematischen Texte charakterisiert, andererseits bilden sie mathe-

182 KAPITEL 4. ARCHITEKTUR VON MARACHNA

matische Wissensstrukturen ab. Vorteilhaft ist dabei, dass die mathematische

Sprache innerhalb der Entit¨

aten strukturiert ist (Kapitel 3.3.2), so dass die Aus-

sagen in diesen Entit¨

aten mathematisches Wissen skizzenhaft schematisieren.

Als Endergebnis wird eine Wissenrepr¨

asentation erzeugt, die Teilaspekte der

mathematischen Sprache und einen rudiment¨

aren ¨

Uberblick mathematischen

Wissens abbildet.

Abbildung 4.19: ¨

Uberblick Wissensbasis

4.3.2 Realisierung

F¨

ur die Realisierung der Wissensbasis wird die XML-basierte Ontologiesprache

OWL verwendet. Das W3C [OWL] beschreibt OWL folgendermaßen:

”OWL is a Web Ontology language. [...]OWL uses both URIs for

naming and the description framework for the Web provided by RDF

to add the following capabilities to ontologies:

•Ability to be distributed across many systems.

•Scalability to Web needs.

•Compatibility with Web standards for accessibility and interna-

tionalization.

•Openess and extensibility.

OWL builds on RDF and RDF Schema and adds more vocabulary for

describing properties and classes: among others, relations between

4.3. WISSENSBASIS 183

classes, cardinality, equality, richer typing of properties, character-

istics of properties, and enumerated classes.“

OWL bietet ein standardisiertes Verfahren f¨

ur die computergerechte Realisie-

rung einer Ontologie und insbesondere auch f¨

ur das Semantic Web. Die Onto-

logie wird in einer XML-Datei gespeichert. Bei mArachna ist die formale Be-

schreibung der Wissensbasis in der Datei math.owl zu finden, die in Abbildung

4.20 als Ausschnitt abgebildet ist. Die Konzeption dieser Ontologie wurde schon

Abbildung 4.20: Ausschnitt aus der math.owl

ausf¨

uhrlich in Kapitel 3.4 beschrieben (Abbildung 3.29).

Das Bindeglied zwischen der nat¨

urlichsprachlichen Analyse und der Wissens-

basis wird durch den wbs.lexana.summoner.OntologyFeeder dargestellt. Die

semantische Analyse der mathematischen Texte (Kapitel 4.2.4) erzeugt die in

Abbildung 4.18 f¨

ur den Beispieltext aufgelisteten Ergebnistripel. Der Ontology-

Feeder ¨

uberpr¨

uft, ob die verwendeten Begriffe in der Wissensbasis einen entspre-

chenden Eintrag besitzen. Wenn das der Fall ist, dann k¨

onnen die extrahierten

mathematischen Informationen der Wissensbasis ¨

ubergeben werden. Sind die

Informationen nicht in der Wissensbasis vorhanden, dann unterbricht der Onto-

logyFeeder den Vorgang und erzeugt eine Fehlermeldung. In einem solchen Fall

muss der aufgetretene Fehler mithilfe des VisuFrontEnds (Kapitel 4.4 manuell

korrigiert werden (halbautomatischer Ansatz). Eine solche ¨

Anderung kann auf

184 KAPITEL 4. ARCHITEKTUR VON MARACHNA

Verknüpfung

Addition

Multiplikation

Vektorraum

Menge

is_a

has_a

Multiplikation

mit einem Skalar

is_a

has_a

Abbildung 4.21: Visualisierung des Beispielsatzes

zwei Arten geschehen. Entweder werden weitere mathematische Texte eingele-

sen und somit das noch nicht vorhandene Wissen integriert, oder die ¨

Anderung

der Wissensbasis erfolgt durch die direkte ¨

Anderung der Datei math.owl. Dies

geschieht durch die entsprechenden writer-Klassen (Abbildung 4.19).

Analyse des Beispiels Die Analyse des Beispieltextes in Abbildung 4.3 ist

relativ einfach. Durch die in der Tabelle 4.18 erstellten semantischen Informatio-

nen werden der Wissensbasis mathematische Begriffe und Sachverhalte ¨

uberge-

ben. Die Subjekte und Objekte entsprechen den Konzepten in der Wissensbasis,

die Relationen sind die Beziehungen zwischen den Konzepten (Kapitel 4.19) und

werden in die entsprechenden Beziehungen transformiert:

•is a-Beziehung ≡ist-Relation

•has a-Beziehung ≡mit-Beziehung

Die Objekte m¨

ussen bereits in der Wissensbasis vorhanden sein, die Subjekte

k¨

onnen dagegen als neue Konzepte angelegt werden, m¨

ussen dies aber nicht. So

werden z B. in S¨

atzen ¨

ublicherweise keine neuen Begriffe eingef¨

uhrt.

Problematischer ist das Subjekt Multiplikation mit einem Skalar. Der Begriff

wird zerlegt in die Bestandteile Multiplikation und mit einem Skalar. Das Kon-

zept Multiplikation ist schon in der Wissensbasis vorhanden. Die Pr¨

aposition

mit deutet auf eine Einschr¨

ankung hin. Daher wird ein neues Konzept mit dieser

Einschr¨

ankung angelegt.

In der Abbildung 4.21 ist der Beispielsatz in der Wissensbasis visualisiert.

4.4. INFORMATION RETRIEVAL 185

4.4 Information Retrieval

Am Anfang war das Wort — am Ende die Phrase

(Stanis law Jerzy Lec)

Information Retrieval

Interface

UserFrontEnd VisuFrontEnd

4.4.1 Grundkonzept

Das Information Retrieval System setzt sich aus zwei Komponenten zusammen:

1. Visualisierungsfrontend (VisuFrontEnd)

2. Benutzerfrontend (UserFrontEnd)

Das VisuFrontEnd ist f¨

ur Administratoren und Entwickler des Prototypen kon-

struiert worden. In diesem FrontEnd k¨

onnen die einzelnen Phasen der nat¨

urlich-

sprachlichen Analyse und der Prozess der Wissensverarbeitung in der Wissens-

basis verfolgt werden. Zus¨

atzlich sollen in sp¨

ateren Versionen von mArachna

Schnittstellen integriert werden, in denen die Analyseschritte beeinflusst wer-

den k¨

onnen.

Das UserFrontEnd soll die Benutzeroberfl¨

ache f¨

ur Anwender von mArachna

werden. Zur Zeit ist es nur eine prototypische Darstellung des gew¨

unschten

FrontEnds. Ziel ist die Implementierung eines interaktiven mathematischen Le-

xikons. Der Inhalt des Lexikons sind die Inhalte der computerlinguistisch analy-

sierten mathematischen Texte. Das System soll auf verschiedenste Anfragen des

Anwenders reagieren k¨

onnen, die z. B. ¨

uber ein Eingabeformular an das System

gerichtet werden k¨

onnen. Antworten des Systems k¨

onnen dann entweder ¨

uber

eine textbasierte Ausgabeschnittstelle oder ¨

uber ein visualisiertes Wissensnetz

erfolgen.

186 KAPITEL 4. ARCHITEKTUR VON MARACHNA

4.4.2 Realisierungsstand

VisuFrontEnd. Das FrontEnd ist als webbasierte Anwendung realisiert und

zur Zeit noch sehr einfach gestaltet. Es werden die Protokolldateien der einzel-

nen Analyseschritte — L

A

T

EX-Parsing, Zerlegung in Satzteile, morphologische,

syntaktische und semantische Analyse und Integration in die Wissensbasis —

die in mArachna abgearbeitet werden, in graphischer Form dargestellt. Somit

kann der Prozess der Analyse Schritt f¨

ur Schritt verfolgt werden.

Abbildung 4.22: Analyseschritte des VisuFrontEnd

Folgende Analyseschritte werden im VisuFrontEnd dargestellt:

•L

A

T

EX: Eingabeformular f¨

ur mathematische L

A

T

EX-Texte, die durch

mArachna analysiert werden

•TEI und XHTML: Ausgabe der zu analysierenden Texte im TEI- oder

XHTML-Format

4.4. INFORMATION RETRIEVAL 187

•Textstruktur: Darstellung der Zerlegung der Texte in ihre einzelnen

Strukturen: Entit¨

aten, S¨

atze usw.

•Morphologie: Darstellung der Resultate der morphologischen Analyse

der Texte

•Syntax: Darstellung der Zerlegung der S¨

atze in ihre syntaktischen Ein-

heiten

•Semantik I und II: Darstellung der Resultate der einzelnen Schritte der

semantischen Analyse

•Ergebnistripel: Darstellung des Ergebnistripels der semantischen Ana-

lyse

•WBS: Graphisch orientierte Darstellung des Eintrags des analysierten

Textes in der Wissensbasis

UserFrontEnd. Das UserFrontEnd wird eine interessante Herausforderung

darstellen, die ¨

uber das Ziel dieser Arbeit weit hinausf¨

uhren w¨

urde. Die in der

Wissensbasis gesammelten mathematischen Informationen m¨

ussen wieder in ge-

eigneter Weise dem Anwender zur Verf¨

ugung gestellt werden. Auf Anfragen des

Anwenders m¨

ussen entsprechende Eintr¨

age aus der Wissensbasis extrahiert wer-

den. Ist die Wissensbasis groß und besitzt diese viele Eintr¨

age bzw. Konzepte

mit vielf¨

altigen Beziehungen untereinander, dann ist dieser Prozess des Infor-

mation Retrieval keine triviale Aufgabe.

In Abbildung 4.23 ist eine m¨

ogliche Darstellung skizziert, wie ein UserFront-

End f¨

ur ein mathematisches Lexikon, wie es in Kapitel 1.1 beschrieben wurde,

aussehen k¨

onnte. Dabei ist die zentrale Komponente die Navigation ¨

uber ein

Wissensnetz, das zu einem vom Anwender angefragten Begriff oder Sachverhalt

geh¨

ort. Die Knoten dieses Wissensnetzes enthalten die detaillierten Informatio-

nen ¨

uber den zu betrachtenden mathematischen Begriff und ¨

ahneln den Kon-

zepten in der Wissensbasis. Relationen entsprechen den Verbindungen zwischen

den Knoten und k¨

onnen somit, wie die Wissensbasis, Informationen vernetzen.

Daher erscheinen nach Anfragen an das System nicht nur der angefragte Begriff,

sondern auch Alternativvorschl¨

age, die mit diesem Begriff in Zusammenhang

stehen. Die Darstellung der Wissensnetze kann als Text oder visuell erfolgen.

188 KAPITEL 4. ARCHITEKTUR VON MARACHNA

Abbildung 4.23: Das UserFrontEnd

Die Wissensnetze sind dabei kein ¨

Aquivalent der gesamten Wissensbasis, son-

dern nur entsprechende Abbilder von Teilbereichen dieser. Dies ist erforderlich,

da die Wissensbasis ein sehr komplexes Gebilde ist. Um die Navigation sowohl

f¨

ur den Benutzer ¨

uberschaubar als auch technisch realisierbar zu halten, ist die

Entwicklung eines leistungsf¨

ahigen Navigations- und Anzeigesystems, beispiels-

weise auf Basis des structure guided browsing (Kapitel 2.5), notwendig.

Kapitel 5

Ergebnisse

5.1 Kritische Analyse

Die Fassung der Edelsteine erh¨

oht

ihren Preis, nicht ihren Wert.

(Ludwig B¨

orne)

Sprachanalyse. Die mathematische Theorie besitzt eine strenge Systema-

tik aus gewissenhaft hergeleiteten S¨

atzen, die aus einem endlichen Theorem-

geb¨

aude aufgebaut werden. Dadurch ist die Mathematik in kompakte Einheiten

— Entit¨

aten — zerlegbar, die miteinander in vorgegebenen Beziehungen stehen

(Kapitel 3.3.2). Diese Entit¨

aten sind Definitionen, Theoreme, S¨

atze, Korollare,

Propositionen, Lemmata und Beweise. Definitionen sind die Strukturierungs-

elemente einer mathematischen Theorie und die S¨

atze — Theoreme, einfache

S¨

atze, Korollare, Propositionen, Lemmata — beschreiben die mathematischen

Sachverhalte (Kapitel 3.3.1).

Die ausschließliche Betrachtung dieser Entit¨

aten bei einer linguistischen Analyse

ist eigentlich unzureichend. Einf¨

uhrende Texte zu mathematischen Themen ge-

rade in Lehrb¨

uchern enthalten oft Informationen, die f¨

ur das weitere Verst¨

andnis

eines Textes notwendig sind. Insbesondere enthalten solche Texte h¨

aufig Defini-

tionen. Diese Texte sind jedoch schwerer zu analysieren als die klar abgegrenzten

Entit¨

aten.

189

190 KAPITEL 5. ERGEBNISSE

F¨

ur ein vollst¨

andiges Verst¨

andnis der Mathematik sind Beweise notwendig, die

in dieser Arbeit nicht betrachtet wurden. Beweise haben sehr vielf¨

altige Kon-

struktionsm¨

oglichkeiten und sind deshalb schwerer zu analysieren als die ¨

ubrigen

Entit¨

aten. Dar¨

uberhinaus sind viele Beweise nur skizzenhafte Darstellungen des

tats¨

achlichen Beweises. Allerdings k¨

onnen in den Beweisen wichtige Informa-

tionen enthalten sein, die f¨

ur das Verst¨

andnis des weiteren Texten notwendig

sind. So kann innerhalb eines Beweises ein Begriff definiert werden, der auch

außerhalb des Beweises verwendet wird.

Mit Ausnahme von Beweisen und Axiomen haben mathematische Entit¨

aten

einen strikten Aufbau, bestehend aus Voraussetzung, Aussage und Eigenschaf-

ten (Kapitel 3.3.2, Abbildung 3.5). Jede auftretende Binnenstruktur besitzt ihre

eigene, typische syntaktische Struktur. So zeigen z. B. die Voraussetzungen einen

besonderen Aufbau, der leicht zu erkennen ist.

Bei den Definitionen existieren in den Aussagen weitere interne Binnenstruktu-

rierungen: Definiendum und Definiens. Die Verbindung zwischen diesen beiden

internen Binnenstrukturen wird unterschiedlich realisiert. So werden z. B. sehr

h¨

aufig das Verb ”heißen“ oder das mathematische Symbol ”:⇔“ genutzt (Kapi-

tel 3.3.3).

Die Satzbinnenstruktur ist etwas komplexer, aber trotzdem ¨

uberschaubar. Da-

bei existieren allerdings keine Unterscheidungsmerkmale zwischen den einzelnen

Satztypen. Als Binnenstrukturen treten Implikationen (Kapitel 3.3.2 Abbildung

3.7), ¨

Aquivalenzen (Kapitel 3.3.2 Abbildung 3.8) und die einfache Aussage (Ka-

pitel 3.3.2 Abbildung 3.9) auf. Die m¨

oglichen Verbindungen der internen Bin-

nenstrukturen sind zahlreich, aber noch handhabbar. Die am h¨

aufigsten ver-

wendeten Basiskonstruktionen sind ”[VERB1] AUSSAGE1, so/dann [VERB2]

AUSSAGE2“-Konstruktionen (Implikationen) und ”genau dann, wenn“ (¨

Aqui-

valenzen) (Kapitel 3.3.3).

Die S¨

atze der mathematischen Sprache besitzen eine einfache Struktur, die durch

die Pr¨

adikatenlogik beeinflusst wird. Logische Operatoren und Quantoren erhal-

ten dabei sprachliche Pendants, die meist eindeutig zu erkennen sind (Kapitel

3.3.3). Ambiguit¨

aten treten dabei nur in schlecht geschriebenen Texten auf, f¨

ur

die eine Disambiguisierung erst auf semantischer Ebene oder sogar ¨

uberhaupt

nicht m¨

oglich w¨

are. Somit kann man sagen, dass die Mathematik davon deutlich

weniger besitzt als die Alltagssprache (Kapitel 1.2, Hypothese 1.2.2). Durch die

5.1. KRITISCHE ANALYSE 191

Einfachheit der Struktur der S¨

atze ist eine syntaktische Analyse nach Chomsky

(Kapitel 2.4.2) m¨

oglich. Allerdings gibt es einige Strukturen, die sich nicht so

einfach durch die Phrasenstrukturgrammatik aufl¨

osen lassen. Diese m¨

ussen erst

durch Vorverarbeitungsregeln in eine geeignete Form umgewandelt werden, da-

mit sie analysiert werden k¨

onnen. Die Regeln, die f¨

ur diese Vorverarbeitung ver-

wendet werden, leiten sich aus typischen Phrasenkonstruktionen in der Mathe-

matik ab (Kapitel 3.3.3). Durch die Verwendung von mathematischen Symbolen

k¨

onnen z. B. S¨

atze entstehen, die keine Verben enthalten. Diese m¨

ussen dann

durch eine Vorverarbeitungsregel erg¨

anzt werden. Insgesamt ist dieser Ansatz

jedoch immer noch deutlich einfacher als die f¨

ur die Analyse von alltagssprachli-

chen Texten verwendeten Verfahren. Damit hat sich Hypothese 1.2.1 best¨

atigt.

F¨

ur die Analyse l¨

angerer Textpassagen w¨

are es trotzdem w¨

unschenswert, andere

Analyseformen einzusetzen.

Mathematische Zeichenketten bzw. Formeln haben eine eigene Struktur, die

zwar ebenfalls auf der Pr¨

adikatenlogik basiert, aber nicht kompatibel zu den

Strukturen der nat¨

urlichsprachlichen Texte ist. Einige mathematische Zeichen-

ketten lassen sich in die nat¨

urliche Sprache ¨

ubersetzen, wie z. B. ”∀“ und

”x∈X“. In mArachna werden zur Zeit nur wenige dieser Zeichenketten ¨

uber-

setzt (Kapitel 3.3.5, Tabelle 3.3.5). Des Weiteren werden in den Voraussetzungen

h¨

aufig mathematische Zeichenketten und Symbole als Synonym f¨

ur eine sprach-

liche Bezeichnung verwendet (Kapitel 3.3.2).

Die Struktur mathematischer Formeln ist relativ komplex und dadurch schwer

zu analysieren. Jedoch ist eine semantische Analyse der Formeln wichtig f¨

ur

das Verst¨

andnis von mathematischen Texten. Durch die zur Zeit unzureichende

Analyse der Formeln in mArachna gibt es Entit¨

aten, die nicht vollst¨

andig auf-

gel¨

ost werden k¨

onnen. So kann im Beispiel 3.3.16 das neutrale Element nicht

vollst¨

andig erfasst werden (Kapitel 3.4). Eine Alternative w¨

are die zus¨

atzliche

Verwendung eines Beweissystems, um die Strukturen der Formeln zu zerlegen

und zu analysieren. Dies erfordert jedoch einen ungleich gr¨

oßeren Aufwand.

Es gibt in der mathematischen Sprache spezielle sprachliche Konstruktionen,

die von der geschriebenen Alltagssprache abweichen. So kann eine bezeichnen-

de mathematische Zeichenkette direkt hinter der Nominalphrase stehen. Da-

durch werden in mArachna diese Zeichen und Symbole mit in die Nominalphra-

se einbezogen. Des Weiteren werden die Bezeichnungen der Quantoren h¨

aufig

192 KAPITEL 5. ERGEBNISSE

als ¨

Aquivalent zum Artikel gebraucht. Dadurch entstehen neue Formen der No-

minalphrase:

•NP::=[DET/QUANT][ADJ] N [SYM]

Dar¨

uber hinaus verhalten sich Formeln in der Nominalphrase wie Substantive,

so dass das Substantiv auch durch ein so genanntes MathWord (MW) ersetzt

werden kann.

•NP::=[DET/QUANT][ADJ] MW

In der mathematischen Sprache werden h¨

aufig Pr¨

apositionalphrasen gebraucht.

Die Verwendung von Pr¨

apositionen hat einen einschr¨

ankenden Charakter auf die

vorherige Nominalphrase, z. B. ist ein ”Vektorraum auf dem K¨

orper der reellen

Zahlen“ eingeschr¨

ankt auf den ”K¨

orper der reellen Zahlen“. Dies gilt ebenso

f¨

ur Adjektive. So ist der Begriff lineare Algebra eine auf linearen Prozessen

eingeschr¨

ankte Fachdisziplin der Algebra.

Abgesehen von der großen Anzahl der explizit durch Definitionen beschriebenen

Fachbegriffe besitzt die Mathematik anscheinend einen geringen Wortschatz,

um Sachverhalte und Definitionen zu konstruieren. Allerdings kann nicht wie

in Hypothese 1.2.3 (Kapitel 1.2) davon ausgegangen werden, dass andere Fach-

sprachen einen gr¨

oßeren Wortschatz besitzen. Aufgrund der großen Anzahl von

Fachdisziplinen ist vor allem der durch die Definitionen erzeugte Wortschatz sehr

groß. Zus¨

atzlich ist anzumerken, dass die Freiheiten der Konstruktionsm¨

oglich-

keiten der deutschen Sprache von den Autoren der mathematischen Texte aus-

genutzt werden. So kann ein und derselbe Begriff verschiedene sprachliche Aus-

pr¨

agungen besitzen (Kapitel 3.3.4).

Trotz der Strenge der mathematische Sprache ist diese nicht unabh¨

angig vom

Sprachstil des Autors. Jeder Autor besitzt einen f¨

ur ihn typischen Satz von

mathematischen Phrasen, die er h¨

aufig in seinen Texten verwendet. Allerdings

ist die Anzahl der m¨

oglichen Konstruktionen beschr¨

ankt, so dass die Hypothese

1.2.4 nur teilweise widerlegt ist.

Eine semantische Analyse ist ohne eine Wissensbasis nicht zu realisieren. Das

Problem besteht darin, dass die semantischen Informationen einer einzelnen

5.1. KRITISCHE ANALYSE 193

Entit¨

at ohne Kontextwissen nur einen geringen Informationsgehalt besitzt. Oh-

ne eine M¨

oglichkeit, mathematisches Hintergrundwissen einzubringen, ist eine

semantische Analyse daher sinnlos. Dieses Hintergrundwissen wird durch die

Wissensbasis bereitgestellt.

Wissensbasis. Die Mathematik als Ganzes zu erfassen wird umso schwieriger,

je detaillierter man diese zu beschreiben versucht. Mathematische Sachverhalte

und Begriffe bilden ein großfl¨

achiges Beziehungsnetzwerk. Viele dieser Begriffe

und Sachverhalte werden von den Autoren der Texte vorausgesetzt und nicht ex-

plizit in jedem Text definiert. Dabei sind die terminologischen Strukturen in der

Mathematik streng und klar formalisiert, so dass jeder Begriff und Sachverhalt

in der Mathematik als Ganzem genau definiert ist.

Um diese terminologischen Strukturen zu organisieren, wird in mArachna eine

Wissensbasis verwendet, deren Grundlage eine Ontologie ist. Die konstruierte

Ontologie der Mathematik besteht aus fundamentalen Erkenntnissen aus der

axiomatischen Mengenlehre und der Pr¨

adikatenlogik. Begriffe, die durch Defini-

tionen eingef¨

uhrt werden, sind Konzepte in der Wissensbasis. Der Konzeptname

wird durch den Begriffsnamen festgelegt. Die Konzepte sind dann ¨

uber is a-

Beziehungen mit anderen Konzepten verbunden. Eigenschaften werden mittels

der has property-Beziehung an das betreffende Konzept gebunden. Die Grund-

idee der Wissensbasis ist es, nur Konzepte zu integrieren, die sich schon auf

vorhandene Konzepte in der Wissensbasis beziehen.

Die so konstruierten Strukturen in der Wissensbasis werfen jedoch einige Fragen

auf: Viele Strukturen, die in S¨

atzen auftreten, k¨

onnen nicht eindeutig beschrie-

ben bzw. spezifiziert werden. So konnten bei der Konstruktion der Ontologie

den Begriffen geordnetes Paar,Abbildung und Relation keine genauen kenn-

zeichnenden Eigenschaften zugeordnet werden. Sie wurden daher durch einfa-

che is a-Beziehungen an den jeweiligen Oberbegriff gebunden (Kapitel 3.4.1).

Eine ad¨

aquate Beschreibungsmethode f¨

ur geordnete Paare sind die vorgeschla-

gen Projektionsoperatoren. Allerdings kann nicht vorausgesetzt werden, dass

Autoren solche Hilfskonstruktionen in ihren Texten beschreiben.

Eine elegantere Beschreibungsm¨

oglichkeit ist die Verwendung von Hypergra-

phenstrukturen im semantischen Netz. Viele Sachverhalte werden in der Ma-

thematik durch die Pr¨

adikatenlogik bestimmt. Zur Zeit ist die Ontologie der

194 KAPITEL 5. ERGEBNISSE

Mathematik so aufgebaut, dass die durch die Pr¨

adikatenlogik beschriebenen

Strukturen mit der sprachlichen Struktur und der Vererbungsstruktur vermischt

werden. So kann z. B. das Konzept injektiv in der Wissensbasis nicht ein-

deutig beschrieben werden. Durch die Verwendung von Hypergraphen k¨

onnten

verschiedene Sprach- und Wissensebenen realisiert werden. So k¨

onnte die De-

finition des Konzepts injektiv selbst ein kleines semantischen Netz enthalten,

das die Definition pr¨

adikatenlogisch kodiert. Inwieweit diese Strukturen dann

noch handhabbar in Hinsicht auf den Verarbeitungsaufwand sind, ist offen.

In der Mathematik werden Sachverhalte durch S¨

atze beschrieben. Allerdings

ist die Integration von S¨

atzen in die Wissensbasis komplexer als die von De-

finitionen. Dabei werden keine neuen Konzepte eingef¨

uhrt, sondern bekannte

Konzepte miteinander verbunden. Die Beziehungen zwischen den Konzepten,

die durch die S¨

atze gebildet werden, werden gekapselt, um diese von den ¨

ubri-

gen Beziehungen zu trennen. F¨

ur die einzelnen Verkn¨

upfungstypen existieren

verschiedene Beziehungen: is implication und is equivalent. F¨

ur einfache Aus-

sagen ist das Pr¨

adikat der Tr¨

ager der semantischen Information. Daher ist das

Verb f¨

ur die Bildung der Beziehung verantwortlich.

Problematisch sind die Ungenauigkeiten in den mathematischen Aussagen. Ins-

besondere beschreiben viele Autoren Sachverhalte nur ungenau. Es werden zahl-

reiche Begriffe weggelassen, die f¨

ur ein ungef¨

ahres Verst¨

andnis eines mathe-

matischen Sachverhaltes nicht notwendig sind. Problematisch ist dies, wenn in

einem weiteren Text der Sachverhalt genauer definiert wird und in die Wissens-

basis eingebaut werden soll. Dabei k¨

onnen Inkonsistenzen entstehen. Eine Idee

zur Vermeidung solcher Inkonsistenzen w¨

are die Konstruktion von verschiede-

nen Wissensbasen, die zun¨

achst getrennt von einer Hauptwissensbasis aufgebaut

werden. Anschließend werden die verschiedenen Wissensbasen mit der Haupt-

wissensbasis abgeglichen.

Trotz der beschriebenen Probleme l¨

asst sich die Hypothese 1.2.5 best¨

atigen.

Die vorgeschlagene Basisstruktur bietet eine gute Grundlage, um Wissen zu

organisieren. Sie reicht jedoch nicht aus, um große Strukturen zu organisieren.

Daf¨

ur m¨

ussen weitergehende Ans¨

atze entwickelt werden.

Information Retrieval. Durch die Komplexit¨

at der Wissensbasis ist ein In-

formation Retrieval System eine große Herausforderung. Auf Grund des proto-

5.1. KRITISCHE ANALYSE 195

typischen Charakters von mArachna k¨

onnen noch keine endg¨

ultigen Aussagen

¨

uber ein solches System gemacht werden. Allerdings ist anzunehmen, dass es

f¨

ur die Wissensbasis ein ebenso komplexes Problem ist wie die Integration von

semantischen Informationen in die Wissensbasis. Dies beinhaltet z. B. die Suche

nach geeigneten Methoden der Navigation in der Wissensbasis (Kapitel 5.3) so-

wie die Entwicklung effizienter Suchmechanismen in einer großen Wissensbasis.

196 KAPITEL 5. ERGEBNISSE

5.2 Zusammenfassung

Wenn andere glauben man ist am Ende,

dann muss man erst richtig anfangen.

(Konrad Adenauer)

Im Folgenden soll eine kurze Zusammenfassung der wichtigsten Erkenntnisse

dieser Arbeit gegeben werden.

Sprachstrukturen. In dieser Arbeit wurde ein Verfahren vorgestellt, dass die

mathematische Sprache computergest¨

utzt analysieren kann. Dazu wird die ma-

thematische Sprache in ihre Bestandteile (Entit¨

aten-, Binnenstruktur-, Satz-,

Word- und Symbolstruktur) zerlegt, d. h. sie wird schematisiert. Diese Schema-

tisierung wird von der computerlinguistischen Analyse genutzt. Eine derartige

Zerlegung der mathematischen Sprache und eine darauf basierende linguistische

Analyse wurde bisher nicht durchgef¨

uhrt.

Eine weitere wichtige Methode ist die Reduktion auf bestimmte Textbaustei-

ne der mathematischen Sprache (Entit¨

aten). In den Entit¨

aten wird die Sprache

der Mathematik pr¨

aziser verwendet. Dadurch k¨

onnen wichtige Strukturen in die-

sen Entit¨

aten isoliert und schematisiert werden. Komplexere Strukturen k¨

onnen

dann sukzessiv auf diesen Grundstrukturen aufbauen.

Die Festlegung von Vorverarbeitungsregeln schafft ein Sammelbecken von

Konstruktionen mathematischer Strukturen, die syntaktische mathematische

Grundstrukturen erkennen k¨

onnen. Diese gewonnenen Grundstrukturen sind f¨

ur

weitere Analyseverfahren von Interesse. So sind fehlende Verben in Aufz¨

ahlun-

gen, die in dieser Arbeit vorgestellt wurden, ein Beispiel f¨

ur eine solche Grund-

struktur.

Wissenstrukturen. Eine wichtige Idee ist die Verkn¨

upfung der semantischen

mathematischen Sprachanalyse mit dem mathematischen Hintergrundwissen.

Dieses Hintergrundwissen wird durch die Wissensbasis repr¨

asentiert. Sie wird

daher als Kontrollinstanz f¨

ur die semantische Analyse genutzt.

Insbesondere verwendet die Wissensbasis als grundlegende Prinzipien die Men-

genlehre und die mathematische Logik. Dies ist sicherlich nicht ausreichend f¨

ur

5.2. ZUSAMMENFASSUNG 197

die vollst¨

andige Beschreibung mathematischen Wissens, jedoch bilden diese bei-

den mathematischen Disziplinen ein solides Grundger¨

ust f¨

ur die Strukturierung

mathematischen Wissens.

mArachna. Um diese Ans¨

atze zu ¨

uberpr¨

ufen wurde ein Prototyp (mArachna)

entwickelt, der die oben genannten Ergebnisse verwendet. Im mArchna-Projekt

werden einzelne Entit¨

aten, wie z. B. Definitionen und ¨

Aquivalenzen, analysiert.

Die Analyse von Implikationen steht kurz vor der Fertigstellung. Analysiert

wird dabei zur Zeit eine eingeschr¨

ankte Auswahl von S¨

atzen, die in dieser Ar-

beit auch als Beispiele angef¨

uhrt wurden, wie z. B. die Vektorraumdefinition

(Kapitel 4) oder der Basisauswahlsatz (Kapitel 3.3.3). Diese Entit¨

aten werden

dann in (Subjekt, Pr¨

adikat, Objekt)-Tripel zerlegt und z. B. f¨

ur die Entit¨

at De-

finition in die Wissensbasis eingebaut. Allerdings k¨

onnen zur Zeit nur einfache

Satzkonstruktionen verarbeitet werden. Dies ist weniger ein Problem der syn-

taktischen als der semantischen Analyse und l¨

asst sich durch eine Verfeinerung

der semantischen Analyse l¨

osen, die bereits in Arbeit ist.

198 KAPITEL 5. ERGEBNISSE

5.3 Ausblick

Glaube ist Gewissheit ohne Beweise.

(Henri Fr´ed´eric Amiel)

Sprachanalyse. Eine automatische Analyse der mathematischen Sprache

kann nicht Aufgabe eines einzelnen Parsers sein. Die in mArachna verwende-

ten Methoden sind sehr einfach gehalten, da nur gezeigt werden sollte, dass eine

Analyse der mathematischen Sprache ¨

uberhaupt m¨

oglich ist. Daher erscheint es

sinnvoll, auch f¨

ur andere Methoden zu ¨

uberpr¨

ufen, ob diese auf Grundlage der

gefundenen Strukturen (Kapitel 3.3) anwendbar sind.

Zur Zeit m¨

ussen in der morphologischen Analyse neu definierte mathematische

Begriffe mit ihren entsprechenden grammatikalischen Informationen manuell in

ein morphologisches Lexikon eingetragen werden. Der Prozess dieser Erstellung

des Lexikons ist zur Zeit sehr einfach gestaltet, jedoch recht m¨

uhselig. Daher

w¨

are es w¨

unschenswert, ein vorhandenes morphologisches Lexikon zu verwen-

den. Die Verwendung eines eigenen Lexikons hat jedoch Vorteile, so k¨

onnen

bei der Analyse genau diejenigen W¨

orter gesammelt werden, die den mathema-

tischen Wortschatz repr¨

asentieren. In diesem Zusammenhang ist es interessant

zu erfahren, wie die genaue prozentuale Verteilung der verwendeten W¨

orter und

Phrasen in den einzelnen Entit¨

atentypen ist. Damit ist jedoch nicht gekl¨

art, was

mit neu definierten Begriffen geschieht. Aufgrund des etwas vereinfachten Wort-

bildungsprozesses in der mathematischen Sprache w¨

are es denkbar, ein automa-

tisiertes Verfahren zu erstellen, neu definierte Begriffe in ein morphologisches

Lexikon zu integrieren.

In mArachna wurde die deutsche Sprache verwendet, da im Rahmen des Projek-

tes Mumie deutschsprachige Studenten angesprochen werden sollen. Allerdings

besitzt die englische mathematische Sprache auf den ersten Blick noch einfache-

re und strengere Strukturen. Da die deutsche und die englische mathematische

Sprache viele ¨

Ubereinstimmungen zeigen, erscheint es sinnvoll, auch englisch-

sprachige mathematische Texte zu analysieren. Dies erscheint als sehr vielver-

sprechend, da insbesondere viele mathematische Texte vor allem auf Englisch

verfasst werden.

Des Weiteren ist die Erweiterung auf Prosatexte und Beweise eine interessante

5.3. AUSBLICK 199

Herausforderung, da in diesen viele Informationen enthalten sein k¨

onnen, die

f¨

ur das weitere Verst¨

andnis eines Textes notwendig sind. Dies beinhaltet aber

eine komplexere linguistische Analyse.

Wissensbasis. F¨

ur die Wissensbasis stellt sich auch weiterhin die Frage, in-

wieweit sich die Mathematik geeignet strukturieren l¨

asst, damit auch gr¨

oße-

re Teilgebiete der Mathematik in einer Datenstruktur erfasst werden k¨

onnen.

Sinnvolle Ans¨

atze daf¨

ur sind die Einteilung in verschiedene Dom¨

anen oder die

Strukturbildung von Bourbaki (Kapitel 3.4). In diesem Zusammenhang bleibt

zu kl¨

aren, wie detailreich eine solche Darstellung gew¨

ahlt werden muss, ohne

die Skalierbarkeit der Wissensbasis zu gef¨

ahrden.

Eine interessante Alternative w¨

are es, zu untersuchen, wie Menschen neu erwor-

benes mathematisches Wissen zu ihrem vorhandenen Wissen hinzuf¨

ugen, und

welche Strukturen dabei aufgebaut werden. Dies ist allerdings nicht einfach, da

einerseits die zugeh¨

origen Untersuchungen an Personen einen großen Aufwand

erfordern, und andererseits bisher nicht einmal eindeutig gekl¨

art werden konn-

te, wie Menschen ¨

uberhaupt Wissen organisieren (Kapitel 2.2, Kapitel 2.3). Des

Weiteren ist es unklar, ob die eventuell gefundenen Strukturen ¨

uberhaupt mit

Computern nachgebildet werden k¨

onnen.

Aufschlussreich w¨

are auch die Betrachtung der Speicherung von unvollst¨

andi-

gem Wissen in der Wissensbasis. Speziell die Integration von verschiedenen in

der Mathematik verwendeten symbolischen Notationssytemen erscheint dabei

interessant.

Information Retrieval. Ein leistungsf¨

ahiges Information Retrieval System

ist bis jetzt nicht in mArachna integriert. Dieses soll auf den in der Wissensbasis

vorhandenen Informationen effiziente Suchen zu einer gegebenen Problemstel-

lung durchf¨

uhren. Eine m¨

ogliche Anwendung daf¨

ur w¨

are ein mathematisches

Lexikon.

Dabei muss nicht nur das Skalierungsproblem auf der Wissensbasis untersucht

werden, sondern auch die m¨

oglichen Formen von Anfragen eines Anwenders

an ein solches System. Diese k¨

onnten z. B. als nat¨

urlichsprachliche Anfragen

verwirklicht werden. Eine M¨

oglichkeit w¨

are dabei, nur Anfragen zu erlauben,

die mathematisch exakt gestellt werden, um die Auswertung zu vereinfachen.

200 KAPITEL 5. ERGEBNISSE

Eine weitere ungekl¨

arte Frage ist die Darstellung der Ergebnisse von Anfra-

gen. Welche und wieviele Informationen ben¨

otigt ein Nutzer, um das gegebene

Problem zu l¨

osen bzw. die Antwort zu verstehen? In diesem Zusammenhang

k¨

onnte eventuell die Verwendung von Nutzerprofilen hilfreich sein, die den z. B.

Wissensstand eines Nutzers abbilden.

Kapitel 6

Anhang

6.1 TEI-Ausgabe

<?xml version="1.0" encoding="utf-8"?>

<TEI.2 xml:lang="de">

<resp>converted by</resp>

</respStmt>

</titleStmt>

</publicationStmt>

<p>Original filename: unknown</p>

</sourceDesc>

</fileDesc>

201

202 KAPITEL 6. ANHANG

Mon Oct 18 12:16:21 CEST 2004

</date>

<resp>Converter</resp>

</respStmt>

<item>

Automatically converted from LaTeX

by MuLex LaTeX2TEI.

</item>

</change>

</revisionDesc>

</teiHeader>

<text>

<body>

<div0>

<p>Seien

<math xmlns="http://www.w3.org/1998/Math/MathML"

display="inline">

</math>

eine Menge,

<math xmlns="http://www.w3.org/1998/Math/MathML"

display="inline">

</math>

ein K~

A¶rper mit den zwei Verkn~

A1

4pfungen:

</p>

<item>

<math xmlns="http://www.w3.org/1998/Math/MathML"

display="inline">

6.1. TEI-AUSGABE 203

<mrow>

</mrow>

</math>

Addition mit

<math xmlns="http://www.w3.org/1998/Math/MathML"

display="inline">

<mrow>

</mrow>

</math>.

</item>

<item>

<math xmlns="http://www.w3.org/1998/Math/MathML"

display="inline">

<mrow>

</mrow>

</math>

204 KAPITEL 6. ANHANG

Multiplikation mit einem Skalar mit

<math xmlns="http://www.w3.org/1998/Math/MathML"

display="inline">

<mrow>

</mrow>

</math>.

</item>

</list>

<p>

<math xmlns="http://www.w3.org/1998/Math/MathML"

display="inline">

</math>

mit der Addition und Multiplikation heißt

Vektorraum über

<math xmlns="http://www.w3.org/1998/Math/MathML"

display="inline">

</math>.

</p>

</div1>

</div0>

</body>

</text>

</TEI.2>

6.2 Zerlegung der Textstruktur

<?xml version="1.0"?>

6.2. ZERLEGUNG DER TEXTSTRUKTUR 205

<word>Seien</word>

<math xmlns="http://www.w3.org/1998/Math/MathML"

display="inline">

<mrow>

</mrow>

</math>

<word>Menge</word>

<math xmlns="http://www.w3.org/1998/Math/MathML"

display="inline">

<mrow>

</mrow>

</math>

<word>Körper</word>

<word>Verknüpfungen</word>

</sentence>

<list>

<math xmlns="http://www.w3.org/1998/Math/MathML"

display="inline">

<mrow>

206 KAPITEL 6. ANHANG

</mrow>

</math>

<word>Addition</word>

<math xmlns="http://www.w3.org/1998/Math/MathML"

display="inline">

<mrow>

</mrow>

</math>

</sentence>

</environment>

<math xmlns="http://www.w3.org/1998/Math/MathML"

display="inline">

<mrow>

</mrow>

6.2. ZERLEGUNG DER TEXTSTRUKTUR 207

</math>

<word>Multiplikation</word>

<word>einem</word>

<word>Skalar</word>

<math xmlns="http://www.w3.org/1998/Math/MathML"

display="inline">

<mrow>

</mrow>

</math>

</sentence>

</environment>

</list>

<math xmlns="http://www.w3.org/1998/Math/MathML"

display="inline">

<mrow>

</mrow>

</math>

<word>Addition</word>

<word>Multiplikation</word>

<word>heißt</word>

<word>Vektorraum</word>

208 KAPITEL 6. ANHANG

<math xmlns="http://www.w3.org/1998/Math/MathML"

display="inline">

<mrow>

</mrow>

</math>

</sentence>

</environment>

6.3 Morphologische Analyse

<?xml version="1.0"?>

<morph>

<word>

<form>seien</form>

<verb>

</verb>

</word>

<word>

<math/>

</word>

<word>

</word>

<word>

<form>menge</form>

6.3. MORPHOLOGISCHE ANALYSE 209

</substantive>

</word>

<word>

<math/>

</word>

<word>

</word>

<word>

<form>körper</form>

</substantive>

</word>

<word>

</word>

<word>

</word>

<word>

210 KAPITEL 6. ANHANG

</adjective>

</word>

<word>

<form>verknüpfungen</form>

</substantive>

</word>

<word>

</word>

<word>

<math/>

</word>

<word>

<form>addition</form>

</substantive>

</word>

<word>

</word>

6.3. MORPHOLOGISCHE ANALYSE 211

<word>

<math/>

</word>

<word>

<math/>

</word>

<word>

<form>multiplikation</form>

</substantive>

</word>

<word>

</word>

<word>

<form>einem</form>

</word>

<word>

<form>skalar</form>

</substantive>

</word>

<word>

212 KAPITEL 6. ANHANG

</word>

<word>

<math/>

</word>

<word>

<math/>

</word>

<word>

</word>

<word>

</word>

<word>

<form>addition</form>

</substantive>

</word>

<word>

</word>

<word>

<form>multiplikation</form>

6.3. MORPHOLOGISCHE ANALYSE 213

</substantive>

</word>

<word>

<form>heißt</form>

<verb>

</verb>

</word>

<word>

<form>vektorraum</form>

</substantive>

</word>

<word>

</word>

<word>

<math/>

</word>

</morph>

214 KAPITEL 6. ANHANG

6.4 Syntaktische Analyse

<?xml version="1.0"?>

<text>

Seien $ V $ eine Menge ,

$ K $ ein Körper mit den

zwei Verknüpfungen :

</text>

<text>

Seien $ V $ eine Menge

</text>

</mainclause>

<text>

$ K $ ein Körper mit den

zwei Verknüpfungen :

</text>

</mainclause>

</Nominalphrase>

<substantive>menge</substantive>

</Nominalphrase>

</verbphrase>

</analysis>

6.4. SYNTAKTISCHE ANALYSE 215

</Nominalphrase>

<substantive>körper</substantive>

</Nominalphrase>

<substantive>verknüpfung</substantive>

</AdjectiveAttributivePhrase>

</NominalPrepositionPhrase>

</verbphrase>

</analysis>

</sentence>

<text>

$ V×V→V $ Addition mit

$ <a,b>↦a+b $ .

</text>

<text>

$ V×V→V $ Addition mit

$ <a,b>↦a+b $ .

</text>

</mainclause>

</Nominalphrase>

216 KAPITEL 6. ANHANG

<substantive>addition</substantive>

</Nominalphrase>

</Nominalphrase>

</NominalPrepositionPhrase>

</verbphrase>

</analysis>

</sentence>

<text>

$ K×V→V $ Multiplikation mit

einem Skalar mit $ α,b↦αb $ .

</text>

<text>

$ K×V→V $ Multiplikation mit

einem Skalar mit $ α,b↦αb $ .

</text>

</mainclause>

</Nominalphrase>

<substantive>multiplikation</substantive>

</Nominalphrase>

6.4. SYNTAKTISCHE ANALYSE 217

<article>einem</article>

<substantive>skalar</substantive>

</Nominalphrase>

</Nominalphrase>

</NominalPrepositionPhrase>

</verbphrase>

</analysis>

</sentence>

<text>

$ V $ mit der Addition und Multiplikation

heißt Vektorraum über $ K $ .

</text>

<text>

$ V $ mit der Addition und Multiplikation

heißt Vektorraum über $ K $ .

</text>

</mainclause>

</Nominalphrase>

<substantive>addition</substantive>

218 KAPITEL 6. ANHANG

</Nominalphrase>

</NominalPrepositionPhrase>

<substantive>multiplikation</substantive>

</Nominalphrase>

</NominalConjunctionphrase>

<verb>heißen</verb>

<substantive>vektorraum</substantive>

</Nominalphrase>

</Nominalphrase>

</NominalPrepositionPhrase>

</verbphrase>

</analysis>

</sentence>

</syntax>

6.5 Semantische Analyse

<?xml version="1.0"?>

</Nominalphrase>

</NominalSubject>

</subject>

6.5. SEMANTISCHE ANALYSE 219

<substantive>menge</substantive>

</Nominalphrase>

</object>

</Nominalphrase>

</NominalSubject>

</subject>

<substantive>körper</substantive>

</Nominalphrase>

<substantive>verknüpfung</substantive>

</AdjectiveAttributivePhrase>

</NominalPrepositionPhrase>

</object>

</Nominalphrase>

</NominalSubject>

220 KAPITEL 6. ANHANG

</subject>

<substantive>addition</substantive>

</Nominalphrase>

</Nominalphrase>

</NominalPrepositionPhrase>

</object>

</Nominalphrase>

</NominalSubject>

</subject>

<substantive>multiplikation</substantive>

</Nominalphrase>

<article>einem</article>

<substantive>skalar</substantive>

</Nominalphrase>

</Nominalphrase>

</NominalPrepositionPhrase>

6.5. SEMANTISCHE ANALYSE 221

</object>

<predicate>heißen</predicate>

</Nominalphrase>

<substantive>addition</substantive>

</Nominalphrase>

</NominalPrepositionPhrase>

<substantive>multiplikation</substantive>

</Nominalphrase>

</NominalConjunctionphrase>

</NominalSubject>

</subject>

<substantive>vektorraum</substantive>

</Nominalphrase>

</Nominalphrase>

</NominalPrepositionPhrase>

</object>

</semantic>

222 KAPITEL 6. ANHANG

<?xml version="1.0"?>

</DefinedObject>

<substantive count="1">menge</substantive>

</DefiningObject>

</DefinedObject>

<substantive count="1">körper</substantive>

<substantive count="2">verknüpfung</substantive>

</DefiningObject>

</DefinedObject>

<substantive count="1">addition</substantive>

</DefiningObject>

</DefinedObject>

<substantive count="1">multiplikation</substantive>

<substantive count="2">skalar</substantive>

</DefiningObject>

<substantive count="1">multiplikation</substantive>

6.5. SEMANTISCHE ANALYSE 223

<substantive count="2">addition</substantive>

</DefiningObject>

<substantive>vektorraum</substantive>

</DefinedObject>

</summoner>

224 KAPITEL 6. ANHANG

Literaturverzeichnis

[And76] J. R. Anderson. Language memory and thought. Erlbaum, Hills-

dale, 1976.

[And83] J. R. Anderson. The architecture of cognition. Harvard Univ.

Press, 1983.

[And01] J. R. Anderson. Kognitive Psychologie. Spektrum Akademischer

Verlag, Heidelberg, Berlin, 3 edition, 2001.

[AS77] R. Abelson and R. C. Schank. Scripts, Plans, Goals, and Un-

derstanding: An Inquiry into Human Knowledge Structures. Erl-

baum, Hillsdale, 1977.

[Aut] Automath. http://www.cs.kun.nl/∼freek/aut/.

[Bar94] J. D. Barrow. Ein Himmel voller Zahlen. Spektrum Akademischer

Verlag, Heidelberg, Berlin, Oxford, 1994.

[Bau93] P. Baumgartner. Der Hintergrund des Wissens. Vorarbeiten zu

einer Kritik der programmierbaren Vernunft. K¨

arntner Druck-

und Verlagsgesellschaft, Klagenfurt, 1993.

[Bau99] J. Baur. Syntax und Semantik mathematischer Texte. Master’s

thesis, Universit¨

at des Saarlandes, Fachbereich Computerlinguis-

tik, November 1999.

[Beu94] A. Beutelspacher. Lineare Algebra. Vieweg, Braunschweig, Wies-

baden, 1994.

225

226 LITERATURVERZEICHNIS

[Beu95] A. Beutelspacher. Das ist o.B.d.A. trivial! Vieweg, Braunschweig,

Wiesbaden, 3 edition, 1995.

[BF71] J. D. Bransford and J. J. Franks. The abstraction of linguistic

ideas. Cognitive Psychologie, 2:331–350, 1971.

[BF96] M. Barner and F. Flohr. Analysis II. Walter de Gruyter, Berlin,

New York, 3 edition, 1996.

[BF00] M. Barner and F. Flohr. Analysis I. Walter de Gruyter, Berlin,

New York, 5 edition, 2000.

[BKI00] C. Beierle and G. Kern-Isberner. Methoden wissensbasierter Sys-

teme. Vieweg, Braunschweig, Wiesbaden, 2000.

[Bor77] L. Borkowski. Formale Logik. C. H. Beck, M¨

unchen, 1977.

[Bou66] L. E. Bourne. Human Conceptual Behavior. Allyn & Bacon,

Boston, 1966.

[Bou74] N. Bourbaki. Die Architektur der Mathematik. In M. Otte, editor,

Mathematiker ¨

uber die Mathematik. Springer, Berlin, Heidelberg,

New York, 1974.

[Bou02] N. Bourbaki. Elemente der Mathematik. In W. B¨

uttemeyer,

editor, Philosophie der Mathematik. Alber, Freiburg, M¨

unchen,

2002.

[Bre82] J. Bresnan, editor. The Mental Representation of Grammatical

Relations. MIT Press, Cambridge, 1982.

[Bre00] J. Bresnan. Lexical Functional Syntax. Blackwell, London, 2000.

[Bri92] E. Brill. A simple rule-based part-of-speech tagger. In Proceedings

of ANLP, pages 152–155, 1992.

[Bri94] E. Brill. A report of recent progress in transformation-based error-

driven learning. In Proceedings of ARPA, pages 722–727, 1994.

[Bro03] Der Brockhaus, Computer und Informationstechnologie, 2003.

LITERATURVERZEICHNIS 227

[BS85] R. J. Brachmann and J. G. Schmolze. An overview of the KL-ONE

knowledge representation system. Cognitive Science, 9:171–216,

1985.

[BT81] W. F. Brewer and J. C. Treyens. Role of schemata in memory for

places. Cognitive Psychology, 13:207–230, 1981.

[Bur92] F. Burkowski. Retrieval Activities in a Database consisting of

Heterogenous Collections of Structured Text. In Proceedings of the

15th Annual International ACM/SIGIR Conference on Research

and Development in Information Retrieval, pages 112–125, New

York, 1992. ACM Press.

[BWP97] H.-J. Bullinger, K. W¨

orner, and J. Prieto. Wissensmanagement

heute. Fraunhofer Institut f¨

ur Arbeitswissenschaft und Organisa-

tion, Stuttgart, 1997.

[BYRN99] R. Baeza-Yates and B. Ribeiro-Neto. Modern Information Re-

trieval. ACM Press, Edinburgh, 1 edition, 1999.

[Car98] B. Carpenter. Type-Logical Semantics. MIT Press, 1998.

[CB95] A. Copestake and T. Briscoe. Semi-productive polysemy and

sense extension. Journal of Semantics, 12:15–67, 1995.

[CEE+01] K.-U. Carstensen, C. Ebert, C. Endriss, S. Jekat, R. Klabunde,

and H. Langer. Computerlinguistik und Sprachtechnologie, Eine

Einf¨

uhrung. Spektrum Akademischer Verlag, Heidelberg, Berlin,

2001.

[CH77] H. H. Clark and S. E. Haviland. Comprehension and the given-

new contract. In R. O. Freedle, editor, Discourse production and

comprehension. Norwood, 1977.

[Cho57] N. Chomsky. Syntactic Structures. Mouton, Den Haag, 1957.

[Cho67] N. Chomsky. Aspects of the Theory of Syntax. MIT Press, Cam-

bridge, 1967.

[CQ69] A. M. Collins and M. R. Quillian. Retrieval time from semantic

memory. Journal of Verbal Learning and Verbal Behavior, 8:240–

248, 1969.

228 LITERATURVERZEICHNIS

[Cru96] D.A. Cruse. Lexical Semantics. Cambridge University Press, 1996.

[DAR03] DARPA. DAML - The DARPRA Agent Markup Language Home-

page. http://www.daml.org/, 2003.

[DDF+90] S. Deerwester, S. T. Dumais, G. W. Furnas, T. K. Landauer, and

R. Harshman. Indexing by latent semantic analysis. Journal of the

American Society for Information Science, 41(6):391–407, 1990.

[DHM95] P. J. Davis, R. Hersh, and E. A. Marchisotto. The Mathematical

Experience. Birkh¨

auser, Boston, Basel, Berlin, 2 edition, 1995.

[Die75] J. Dieudonn´e. Grundz¨

uge der modernen Analysis, Band 2. Friedr.

Vieweg & Sohn mbH, Braunschweig, 1975.

[Die00] R. Diestel. Graphentheorie. Springer-Lehrbuch, Berlin, Heidel-

berg, New York, 2 edition, 2000.

[DtH92] M. Domenig and P. ten Hacken. Word Manager: A System for

Morphological Dictionaries. Georg Olms Verlag AG, Hildesheim,

1992.

[Dud98] Dudenredaktion, editor. Duden, Grammatik der deutschen Ge-

genwartssprache. Dudenverlag, Mannheim, Leibzig, Wien, Z¨

urich,

6 edition, 1998.

[Dud01] Dudenredaktion. Duden, Fremdw¨

orterbuch. Dudenverlag, Mann-

heim, Leibzig, Wien, Z¨

urich, 5 edition, 2001.

[DWP81] D. R. Dowty, R. E. Wall, and S. Peters. Introduction to Montague

Semantics. Reidel, Dordrecht, 1981.

[Ebb94] H.-D. Ebbinghaus. Einf¨

uhrung in die Mengenlehre. Wissen-

schaftsverlag, Mannheim, 3 edition, 1994.

[Ede96] W. Edelmann. Lernpsychologie. BELTZ Psychologie Verlags Uni-

on, Weinheim, 5 edition, 1996.

[EG96] R. Evans and G. Gazdar. DATR: A language for lexical knowledge

representation. Computational Linguistics, 22(2):167–216, 1996.

LITERATURVERZEICHNIS 229

[EJF96] H.-D. Ebbinghaus and W. Thomas J. Flum. Einf¨

uhrung in die

mathematische Logik. Spektrum Akademischer Verlag, Heidel-

berg, 4 edition, 1996.

[Fen04] D. Fensel. Ontologies: A Silver Bullet for Knowledge Management

and Electronic Commerce. Springer, Berlin, Heidelberg, 2 edition,

2004.

[Fer03] R. Ferber. Information Retrieval. Suchmodelle und Data-Mining-

Verfahren f¨

ur Textsammlungen und das Web. dpunkt, Heidelberg,

2003.

[fI04] Gesellschaft f¨

ur Informatik. Ziele und Aufgaben der Fachgruppe

Information Retrieval, 2004.

[Fis00] G. Fischer. Lineare Algebra. Vieweg, Braunschweig, Wiesbaden,

12 edition, 2000.

[fLuLdUB04] Fakult¨

at f¨

ur Linguistik und Literaturwissenschaft der Univer-

sit¨

at Bielefeld. liOn – Linguistik Online. http://luna.lili.

uni-bielefeld.de/lion/, 2004.

[Fre94] G. Frege. ¨

Uber Sinn und Bedeutung. Funktion, Begriff, Bedeu-

tung. F¨

unf logische Studien, 1994.

[Geu99] B. Geurts. Presuppositions and Pronouns. Elsevier Science, 1999.

[GHL02] L. G¨

otze and E. W. B. Hess-L¨

uttich. Grammatik der deutschen

Sprache. Bertelsmann Lexikon Verlag, M¨

unchen, 2002.

[GHS99] G. Grewendorf, F. Hamm, and W. Sternefeld. Sprachliches Wis-

sen. Eine Einf¨

uhrung in die moderne Theorie der grammatischen

Beschreibung. Suhrkamp, Frankfurt a. M., 1999.

[GKPS85] G. Gazdar, E. Klein, G. K. Pullum, and I. A. Sag. Generalized

Phrase Structure Grammar. Blackwell, Oxford, 1985.

[GL92] A. M. Glenberg and W. E. Langston. Comprehension of illus-

trated text: Pictures help to build mental models. Journal of

Memory and Language, 31:129–151, 1992.

230 LITERATURVERZEICHNIS

[GML87] A. M. Glenberg, M. Mayer, and K. Lindem. Mental models con-

tribute to foregrounding during text comprehension. Journal of

Memory and Language, 26:69–83, 1987.

[GMZ97] A. C. Graesser, K. K. Millis, and R. A. Zwaan. Discourse com-

prehension. Annual Review of Psychology, 48:163–189, 1997.

[G¨

o31] K. G¨

odel. ¨

Uber formal unentscheidbare S¨

atze der Principia Ma-

thematica und verwandter Systeme I. Monatsh. Math. Phys,

38:173–198, 1931.

[Gro96] QED Group. QED. http://www.mcs.anl.gov/qed/, 1996.

[GRS00] G. G¨

orz, C.-R. Rollinger, and J. Schneeberger, editors. Handbuch

der K¨

unstliche Intelligenz. Oldenbourg, M¨

unchen, Wien, 2000.

[Gru93] T. R. Gruber. A translation approach to portable ontology spec-

ifications. Knowledge Acquisition, 5(2):199–221, 1993.

[GS91] J. Groenendijk and M. Stokhof. Dynamic Predicate Logic. Lin-

guistics and Philosophy, 14(1):39–100, 1991.

[Hau00] R. Hausser. Grundlagen der Computerlinguistik. Springer, Berlin,

Heidelberg, 2000.

[Hau02] M. Haun. Handbuch Wissensmanagement. Springer, Berlin, Hei-

delberg, 2002.

[HB01] G. Helbig and J. Buscha. Deutsche Grammatik. Handbuch f¨

ur

den Ausl¨

anderunterricht. Langenscheidt, Berlin, M¨

unchen, 2001.

[Hed02] U. Hedtst¨

uck. Formale Sprachen und Automatentheorie. Olden-

bourg Wissensschaftsverlag GmbH, M¨

unchen, 2002.

[Hei83] I. Heim. File change semantics and the familiarity theory of defi-

niteness. In R. B¨

auerle, C. Schwarze, and A. von Stechow, editors,

Meaning, Use and Interpretation of Language. de Gruyter, Berlin,

New York, 1983.

[Hel00] H. Helbig. Die semantische Struktur nat¨

urlicher Sprache. Wis-

sensrepr¨

asentation mit MultiNet. Springer, Berlin, Heidelberg,

2000.

LITERATURVERZEICHNIS 231

[Her72] H. Hermes. Einf¨

uhrung in die mathematische Logik. Teubner,

Stuttgart, 3 edition, 1972.

[Heu93] H. Heuser. Lehrbuch der Analysis, Teil 2. Teubner, Stuttgart, 8

edition, 1993.

[H¨

o83] H. H¨

ormann. Was tun die W¨

orter miteinander im Satz? Verlag

f¨

ur Psychologie, G¨

ottingen, 1983.

[Jap93] Mathematical Society Of Japan. Encyclopedic Dictionary of Ma-

thematics. MIT Press, Cambridge, 2 edition, 1993.

[JC87] M. A. Just and P. A. Carpenter. The Psychology of Reading and

Language Comprehension. Allyn and Bacon, Boston, 1987.

[Jes04] S. Jeschke. Mathematik in Virtuellen Wissensr¨

aumen – IuK-

Strukturen und IT-Technologien in Lehre und Forschung. PhD

thesis, Technische Universit¨

at Berlin, Berlin, April 2004.

[JL83] P. N. Johnson-Laird. Mental Models. Cambridge University Press,

Cambridge, 1983.

[JL95] P. N. Johnson-Laird. Mental models, deductive reasoning, and the

brain. In M. S. Gazzaniga, editor, The Cognitive Neurosciences,

pages 999–1008. MIT Press, Cambridge, 1995.

[JL00] P. N. Johnson-Laird. The current state of the mental model theo-

ry. In J. Garcia-Madruga, M. Carriedo, and M. J. Gonzalez-Labra,

editors, Mental Models in Reasoning, pages 17–40. UNED, Ma-

drid, 2000.

[JS02] S. Jeschke and R. Seiler. Strukturen in der multimedialen Didak-

tik – oder: Die Mumie im Legoland (Talk). http://www.math.

tu-berlin.de/∼sabina/Talks/Erlangen 2002, 2002.

[JZ03] S. Jeschke and E. Zorn. Moses meets Mumie at

Multiverse (Talk). http://www.math.tu-berlin.de/∼sabina/

Talks/Rhone Island 2003, 2003.

[Kam81] H. Kamp. A theory of truth and semantic representation. In

J. Groenendijk and M. Stokhof, editors, Formal Methods in

232 LITERATURVERZEICHNIS

the Study of Language, pages 277–322. Mathematisch Centrum

Tracts, Amsterdam, 1981.

[KD78] W. Kintsch and T. A. Dijk. Towards a model of text comprehen-

sion and production. Psychological Review, 85:363–394, 1978.

[Ker98] M. Kerres. Multimediale und telemediale Lernumgebung: Konzep-

tion und Entwicklung. Oldenbourg, 1998.

[KH02] L. Konieczny and B. Hemforth. S¨

atze und Texte verstehen und

produzieren. In J. M¨

ussler and W. Prinz, editors, Allgemeine

Psychologie. Spektrum Akademischer Verlag, Heidelberg, 2002.

[Kin74] W. Kintsch. The Representation of Meaning in Memory. Erl-

baum, Hillsdale, 1974.

[Kin88] W. Kintsch. The role of knowledge in discourse comprehension:

A construction integration model. Psychological Review, 95:163–

182, 1988.

[Kin98] W. Kintsch. Comprehension – A Paradigma for Cognition. Cam-

bridge University Press, Cambridge, 1998.

[KK73] W. Kintsch and J. M. Keenan. Reading rate and retention as a

function of the number of propositions in the base structure of

sentences. Cognitive Psychology, 5:257–274, 1973.

[KKP96] M. Kohlhase, S. Kuschert, and M. Pinkal. A type-theoretic seman-

tics for λ-DRT. In P. Dekker and M. Stokhof, editors, Proceedings

of the 10th Amsterdam Colloquium, pages 479–498, Amsterdam,

1996.

[K¨

o01] K. K¨

onigsberger. Analysis 1. Springer, Berlin, Heidelberg, New

York, 5 edition, 2001.

[K¨

o04] J. K¨

obler. Vorlesungsskript: Theoretische Informatik II – HU Ber-

lin. http://fachschaft.informatik.hu-berlin.de/service/,

2004.

[Koe04] P. Koepke. Projekt: Darstellungsformen mathematischen Wissen.

http://www.wissensformate.uni-bonn.de/projektkoepke.

htm, 2004.

LITERATURVERZEICHNIS 233

[Kos83] K. Koskenniemi. Two-level model for morphological analysis. In

A. Bundy, editor, Proceedings of the Eighth International Joint

Conference on Artificial Intelligence, pages 683–685, Karlsruhe,

August 1983.

[KP79] L. Karttunen and S. Peters. Conventional implicature. In C.-K.

Oh and D. Dinneen, editors, Syntax and Semantics 11, Presup-

position, pages 1–56. Academic Press, New York, 1979.

[KvD83] W. Kintsch and T. A. van Dijk. Strategies of Discourse Compre-

hension. Academic Press, New York, 1983.

[Lor96] F. Lorenz. Einf¨

uhrung in die Algebra I. Spektrum Akademischer

Verlag, Heidelberg, Berlin, Oxford, 3 edition, 1996.

[MBa] The MBase Mathematical Knowledge Base Home Page.

http://www.mathweb.org/mbase/.

[Min74] M. Minsky. A Framework for Representing Knowledge. MIT-AI

Laboratory Memo 306, Juni 1974.

[MK01] A. Franke M. Kohlhase. MBase: Representing Knowledge and

Context for the Integration of Mathematical Software Systems.

Journal of Symbolic computation, 23(4):365–402, 2001.

[Mon74] R. Montague. Formal Philosophy: Selected Papers of Richard

Montague. Yale University Press, Yale, 1974.

[MR92] G. McKoon and R. Ratcliff. Inference During Reading. Psycho-

logical Review, 99:440–466, 1992.

[Mus96] R. Muskens. Combining montague semantics and discourse re-

presenation. Linguistics and Philosphy, 19:143–186, 1996.

[NBY97] G. Navarro and R. Baeza-Yates. Proximal nodes: A model to

query document databases by content and structure. ACM Tran-

sactions on Information Systems, 15(4):400–435, 1997.

[NC00] S. E. Newstead and K. Coventry. The role of context und func-

tionality in the interpretation of quantifiers. European Journal of

Cognitive Psychologie, 12:243–259, 2000.

234 LITERATURVERZEICHNIS

[New81] A. Newell. The Knowledge Level. The AI Magazine, 2(2):1–20,

1981.

[OG96] J. Oakhill and A. Garnham. Mental models in cognitive science.

Erlbaum, Hove, 1996.

[OMK91] Y. Ogawa, T. Morita, and K. Kobayashi. A fuzzy document re-

trieval system using the keyword connection matrix and a learning

method. Fuzzy Sets and Systems, 39(2):163–179, 1991.

[Ont] Ontology Inference Layer Committee. Ontology Inference Layer.

http://www.ontoknowledge.org/oil/.

[Ope] OpenMath Society. OpenMath. http://www.openmath.org/.

[OWL] Web Ontology Language. http://www.w3.org/2004/OWL/.

[Pea88] J. Pearl. Probabilistic Reasoning in Intelligent Systems: Netword

of Plausible Inference. Morgan Kaufmann, San Mateo, 1988.

[PF79] M. C. Potter and B. A. Faulconer. Understanding noun phrases.

Journal of Verbal Learning and Verbal Behavior, 18:509 – 522,

1979.

[Pin96] M. Pinkal. Radical underspecification. In P. Dekker and M. Stok-

hof, editors, Proceedings of the 10th Amsterdam Colloquium, pages

587–606, Amsterdam, 1996.

[Pol85] M. Polanyi. Implizites Wissen. Suhrkamp, Frankfurt a. Main,

1985.

[PS94] C. Pollard and I. A. Sag. Head-Driven Phrase Structure Gram-

mar. University of Chicago Press, Chicago, 1994.

[Qui68] M. R. Quillian. Semantic memory. In M. Minsky, editor, Semantic

Information Processing, pages 227–270. MIT Press, Cambridge,

1968.

[Rau79] W. Rautenberg. Klassische und Nichtklassische Aussagenlogik.

Vieweg, Braunschweig, Wiesbaden, 1979.

LITERATURVERZEICHNIS 235

[RDF] Resource Description Framework. http://www.w3.org/2004/

RDF.

[Rei89] U. Reimer. FRM: Ein Frame-Repr¨

asentationsmodell und seine

formale Semantik. Springer-Verlag, Berlin, 1989.

[RS99] G. Rickheit and L. Sichelschmidt. Mental models: Some answers,

some questions, some suggestions. In G. Rickheit and C. Habel,

editors, Mental models in discourse processing and reasoning, pa-

ges 9–40. North-Holland, Amsterdam, 1999.

[RSS02] G. Rickheit, L. Sichelschmidt, and H. Strohner. Psycholinguistik.

Stauffenburg, T¨

ubingen, 2002.

[Rud02] W. Rudin. Analysis. Oldenbourg, M¨

unchen, Wien, 2 edition,

2002.

[Ryl69] G. Ryle. Der Begriff des Geistes. Reclam, Stuttgart, 1969.

[Saa] Saarland Universit¨

at, TU Eindhoven, RISC Linz. OMDoc.

http://www.mathweb.org/omdoc/.

[Sch93] W. Schnotz. Mentale Repr¨

asentationen beim Sprachverstehen.

Zeitschrift f¨

ur Psychologie, 201:237–259, 1993.

[Sei00] R. Seiler. Skript zur HM 1 f¨

ur Physiker. TU-Berlin, 2000. 25.

Mai 1999 (¨

uberarbeitet am 3.8.00).

[Sha92] S. C. Shapiro, editor. Encyclopedia of Artificial Intelligence. John

Wiley and Sons, 2 edition, 1992.

[Shi86] S. M. Shieber. An Introduction to Unification-Based Approaches

to Grammar. CSLI Lecture Notes, Stanford, 1986.

[SJZ04] R. Seiler S. Jeschke, L. Oeverdieck and E. Zorn. Mumie — Mul-

timediale Mathematikausbildung f¨

ur Ingenieure. http://www.

mumie.net/, 2004.

[SMB03a] C. M. Sperberg-McQueen and L. Burnard, editors. Guidelines for

Electronic Text Encoding and Interchange, Volumen One. TEI

Consortium, Oxford, Providence, Charlottesville, Bergen, 2003.

236 LITERATURVERZEICHNIS

[SMB03b] C. M. Sperberg-McQueen and L. Burnard, editors. Guidelines for

Electronic Text Encoding and Interchange, Volumen Two. TEI

Consortium, Oxford, Providence, Charlottesville, Bergen, 2003.

[SN74] H. Strohner and K. E. Nelson. The young child’s development of

sentence comprehension: Influence of event probability, nonver-

bal context, syntactic form, and strategies. Child Development,

45(3):567–576, 1974.

[Sow02] J. F. Sowa. Semantic Networks. http://www.jfsowa.com/pubs/

semnet.htm/, 2002.

[Spi04] M. Spies, editor. Einf¨

uhrung in die Logik. Werkzeuge f¨

ur Wissen-

repr¨

asentationen und Wissensmanagement. Spektrum Akademi-

scher Verlag, Heidelberg, Berlin, 2004.

[Sta00] P. H. Starke. Logische Grundlagen der Informatik, 2000.

[SZ98] A. Spencer and A. M. Zwicky, editors. The Handbook of Morpho-

logy. Blackwell, 1998.

[TEIa] Text Encoding Initiative. http://www.tei-c.org/.

[TEIb] TEI in der Praxis. http://computerphilologie.

uni-muenchen.de/praxis/teiprax.html.

[Tit03] P. Tittmann, editor. Graphentheorie. Eine anwendungsorientierte

Einf¨

uhrung. Hanser, M¨

unchen, Wien, 2003.

[TM] XML Topic Maps. http://www.topicmaps.org/.

[TMI] XML-Schema for ISO 13250 Topic Maps. http://www.diffuse.

org/TopicMaps/schema.html.

[Unia] Universit¨

at Erlangen (IMMD8). FERMAT (Unterst¨

utzungs-

systeme f¨

ur Mathematiker). http://www8.informatik.

uni-erlangen.de/IMMD8/Research/overview.html.

[Unib] Universit¨

at Saarbr¨

ucken, DFKI Saarbr¨

ucken. The ActiveMath

Learning Environment. http://www.activemath.org/.

LITERATURVERZEICHNIS 237

[V¨

a02] P. V¨

aterlein. Wenn wir w¨

ussten, was wir wissen ... . Physik

Journal, 1(5):25–28, 2002.

[vH83] W. von Hahn. Fachkommunikation. de Gruyter, Berlin, New

York, 1983.

[vQ01] B. von Querenburg. Mengentheoretische Topologie. Springer, Ber-

lin, Heidelberg, New York, 3 edition, 2001.

[vR79] C. J. van Rijsbergen. Information Retrieval. Butterworths, Lon-

don, 2 edition, 1979.

[W3C03] W3C. Mathematical Markup Language – Specification Version

2.0. http://www.w3c.org/TR/2003/REC-MathML2-20031021/,

2003.

[W3C04] W3C. W3C Math Home. http://www.w3c.org/Math/, 2004.

[Wes94] M. G. Wessels. Kognitive Psychologie. Reinhardt, M¨

unchen, 3

edition, 1994.

[WMF95] C. A. Weaver, S. Mannes, and C. R. Fletcher, editors. Discourse

Comprehension: Essays in Honor of Walter Kintsch. Erlbaum,

Hillsdale, 1995.

[Woo80] W. A. Woods. Cascaded ATN Grammars. American Journal of

Computational Linguistics, 6(1):1–12, 1980.

[WP85] D. L. Waltz and J. B. Pollack. Massively Parallel Parsing: A

Strongly Interactive Model of Natural Language Interpretation.

Cognitive Science, 9(1):57–84, 1985.

[WR84] A. N. Whitehead and B. Russell. Principia Mathematica. Medusa,

Wien, Berlin, 1984.

[Wue95] R. Wuest. H¨

ohere Mathematik f¨

ur Physiker. de Gruyter, Berlin,

New York, 1 edition, 1995.

[WZW85] S. K. M. Wong, W. Ziarko, and P. C. N. Wong. Generalized vector

spaces model in information retrieval. In Proceedings of the 8th

Annual International ACM SIGIR Conference on Research and

238 LITERATURVERZEICHNIS

Development in Information Retrieval, pages 18–25, New York,

1985.

[YB97] S. Young and G. Bloothooft, editors. Corpus-based Methods in

Language and Speech Processing. Kluwer, Dordrecht, 1997.