scieee Science in your language
[de] (orig)
mArachna
Eine semantische Analyse der mathematischen Sprache
f¨
ur ein computergest¨
utztes Information Retrieval System
vorgelegt von:
Dipl.-Phys. Nicole Natho
Berlin
Fakult¨
at II Mathematik und Naturwissenschaften
der Technischen Universit¨
at Berlin
zur Erlangung des akademischen Grades
Doktor der Naturwissenschaften
Dr. rer. nat.
genehmigte Dissertation
Promotionsausschuss:
Vorsitzender: Prof. Dr. Christian Thomsen
Berichter/Gutachter: Prof. Dr. Ruedi Seiler
Berichter/Gutachter: Prof. Dr. Manfred Stede
zus¨
atzliche Gutachterin: Prof. Dr. Christiane Fellbaum
Tag der wissenschaftlichen Aussprache:
17. Februar 2005
Berlin 2005
D 83
2
3
Danksagungen
An dieser Stelle m¨
ochte ich mich zu allererst bei meinen Doktorvater Ruedi Seiler
bedanken, der immer an meine Ideen glaubte und mir viel Freiraum verschaff-
te diese zu realisieren. Er unterst¨
utzte mich tatkr¨
aftig und hat keine M¨
uhen
gescheut mir weiter zu helfen.
Des Weiteren m¨
ochte ich mich bei Christiane Fellbaum bedanken, die mir durch
ihre Begeisterung viel Mut machte dieses Projekt zu bearbeiten und mir viele
wertvolle Ratschl¨
age gab. Bei Sabina Jeschke, die mir ebenfalls im Zuge des
Mumienprojektes Vertrauen, Zeit und wertvolle Tipps gab, meine Ideen zu ver-
wirklichen. Bei Sebastian Rittau, der viele Ideen mitverwirklichte und diese tech-
nisch umsetzte. Bei Sven Grottke, der zahlreiche Stunden mit mir ausharrte, um
dieses Werk zu vollenden. Bei Erhard Zorn, der all diese Seiten Korrektur lesen
musste und immer beruhigende Worte parat hatte. Und schließlich bei Thomas
Richter, der dieser Arbeit den letzten Schliff gab. Sowie an alle, die w¨
ahrend
dieser Zeit meine Launen tapfer ertragen mussten.
4
Inhaltsverzeichnis
1 Einleitung 9
1.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2 Ziele und Hypothesen . . . . . . . . . . . . . . . . . . . . . . . . 12
2 Disziplinen 15
2.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2 Wissensmanagement . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2.1 Daten, Informationen und Wissen . . . . . . . . . . . . . 18
2.2.2 Wissensorganisation und Wissensrepr¨
asentation . . . . . . 22
2.2.3 Wissensbasierte Systeme . . . . . . . . . . . . . . . . . . . 30
2.3 Sprachverstehen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.3.1 Psychologische Modelle zum Textverstehen . . . . . . . . 42
2.4 Computerlinguistik . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.4.1 Morphologie . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.4.2 Syntax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.4.3 Semantik . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.4.4 Fachsprache . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.5 Information Retrieval . . . . . . . . . . . . . . . . . . . . . . . . 69
2.5.1 Methoden des Information Retrieval . . . . . . . . . . . . 73
5
6INHALTSVERZEICHNIS
3 Mathematische Strukturen 77
3.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.2 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
3.2.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
3.2.2 Mathematische Logiken . . . . . . . . . . . . . . . . . . . 82
3.2.3 Axiomatische Mengenlehre . . . . . . . . . . . . . . . . . 89
3.3 Sprachstrukturen . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
3.3.1 Entit¨
atenebene . . . . . . . . . . . . . . . . . . . . . . . . 97
3.3.2 Binnenstrukturebene . . . . . . . . . . . . . . . . . . . . . 103
3.3.3 Satzstrukturebene . . . . . . . . . . . . . . . . . . . . . . 107
3.3.4 Wortebene . . . . . . . . . . . . . . . . . . . . . . . . . . 127
3.3.5 Symbolebene . . . . . . . . . . . . . . . . . . . . . . . . . 129
3.3.6 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . 130
3.4 Wissensstrukturen . . . . . . . . . . . . . . . . . . . . . . . . . . 133
3.4.1 Ontologie der Mathematik . . . . . . . . . . . . . . . . . . 133
3.4.2 Taxonomie der Mathematik . . . . . . . . . . . . . . . . . 139
3.4.3 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . 149
4 Architektur von mArachna 151
4.1 Gesamtkonzeption . . . . . . . . . . . . . . . . . . . . . . . . . . 151
4.2 Nat¨
urlichsprachliche Analyse . . . . . . . . . . . . . . . . . . . . 155
4.2.1 Zerlegung von L
A
T
EX in Satzteile, W¨
orter und Formeln . 155
4.2.2 Morphologische Analyse . . . . . . . . . . . . . . . . . . . 162
4.2.3 Syntaktische Analyse . . . . . . . . . . . . . . . . . . . . . 168
4.2.4 Semantische Analyse . . . . . . . . . . . . . . . . . . . . . 176
4.3 Wissensbasis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
INHALTSVERZEICHNIS 7
4.3.1 Grundkonzept . . . . . . . . . . . . . . . . . . . . . . . . 181
4.3.2 Realisierung . . . . . . . . . . . . . . . . . . . . . . . . . . 182
4.4 Information Retrieval . . . . . . . . . . . . . . . . . . . . . . . . 185
4.4.1 Grundkonzept . . . . . . . . . . . . . . . . . . . . . . . . 185
4.4.2 Realisierungsstand . . . . . . . . . . . . . . . . . . . . . . 186
5 Ergebnisse 189
5.1 Kritische Analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
5.2 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . 196
5.3 Ausblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
6 Anhang 201
6.1 TEI-Ausgabe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
6.2 Zerlegung der Textstruktur . . . . . . . . . . . . . . . . . . . . . 204
6.3 Morphologische Analyse . . . . . . . . . . . . . . . . . . . . . . . 208
6.4 Syntaktische Analyse . . . . . . . . . . . . . . . . . . . . . . . . . 214
6.5 Semantische Analyse . . . . . . . . . . . . . . . . . . . . . . . . . 218
8INHALTSVERZEICHNIS
Kapitel 1
Einleitung
Ein hinreichend klarer mathematischer Text kann
in einer konventionellen Sprache formuliert werden,
die nur aus einer kleinen Anzahl unver¨
anderlicher
W¨
orter besteht; diese W¨
orter werden gem¨
einer
Syntax kombiniert, die ihrerseits nur eine kleine
Anzahl unverletzlicher Regeln umfasst; ein so
formulierter Text heißt dann formalisiert.
(Nicolas Bourbaki1)
1.1 Motivation
Nicht nur durch das Internet, sondern auch durch wissenschaftliche Publika-
tionen w¨
achst in der Mathematik die Menge der verf¨
ugbaren Informationen
st¨
andig an. Um auf dem neuesten Stand der Forschung zu bleiben, m¨
ussen
Wissenschaftler und andere Interessenten viel Zeit f¨
ur Recherchen verwenden.
Leider liegt ein Großteil der vorhandenen Informationen in Form von nat¨
urlich-
sprachlichen mathematischen Texten vor, so dass Computer sie nicht unmittel-
bar verarbeiten k¨
onnen. Es bietet sich daher an, den Inhalt von mathematischen
Texten computergest¨
utzt zu analysieren, um relevante Informationen daraus zu
1[Bou02, S. 164]
9
10 KAPITEL 1. EINLEITUNG
gewinnen. Solche Informationsextraktionssysteme existieren in verschiedensten
Formen.
Im Projekt Mumie [SJZ04, Jes04] Multimediale Mathematikausbildung f¨
ur
Ingenieure wurde eine Lernplattform zum Einsatz von modernen Techno-
logien entwickelt, die mathematisches Wissen in vielf¨
altiger Weise Studenten
im Pr¨
asenzunterricht zur Verf¨
ugung stellt. In diesem Zusammenhang entstan-
den zahlreiche Unterprojekte, darunter auch das mArachna-Projekt, das Ge-
genstand dieser Arbeit ist. mArachna hat sich zum Ziel gesetzt, ein innovatives
Information Retrieval System in Form eines mathematischen Lexikons zu ent-
wickeln. Dazu sollen nat¨
urlichsprachliche mathematische Texte maschinell ver-
arbeitet und in ein ontologisches Modell der Mathematik eingeordnet werden.
Der Anwender erh¨
alt dadurch die M¨
oglichkeit, Anfragen zu mathematischen
Konzepten und Sachverhalten zu stellen. F¨
ur die Ausgabe der Suchergebnis-
se sind Wissensnetze denkbar, die eine kontextuelle Einordnung der einzelnen
Suchergebnisse erm¨
oglichen. Wissensnetze sind dabei graphische Darstellungen
zur Visualisierung von Begriffen und Sachverhalten und ihren Beziehungen un-
tereinander. Im Gegensatz zu herk¨
ommlichen Information Retrieval Systemen
ist es also m¨
oglich, nach Konzepten und Ideen anstatt z. B. nach in Texten auf-
tretenden W¨
ortern zu suchen. Der Schwerpunkt dieser Arbeit wird dabei nicht
auf dem eigentlichen Retrieval-Interface liegen, sondern auf den grundlegenden
Mechanismen zur Verarbeitung der urspr¨
unglichen mathematischen Texte und
ihrer Einordnung in eine Wissensbasis.
Mathematik
Analysis
Topologie
Algebra Geometrie
Mengenlehre & Logik
Abbildung 1.1: Wissensnetz
Zur manuellen Erstellung einer solchen mathematischen Lexikons h¨
atten Auto-
ren ihre Texte bereits mit den zur Vernetzung notwendigen Informationen ver-
sehen m¨
ussen. Dabei haben Autoren oft eine sehr unterschiedliche Auffassung,
1.1. MOTIVATION 11
wie mathematische Begriffe und Sachverhalte vernetzt werden k¨
onnten. Dies
ist nicht verwunderlich, da bei einem solch komplexen Fachgebiet wie der Ma-
thematik der Prozess der Metadatenerstellung nicht einfach zu schematisieren
ist.
Das Mumie-Projekt speichert mathematische Informationen in Form von nat¨
ur-
lichsprachlichen Texten in einer Datenbank. Die Grundidee der vorliegenden
Arbeit ist es, diese vorhandenen Informationen zu verwenden und computerlin-
guistisch zu analysieren, um aus den Ergebnissen dieser Analyse ein Lexikon
zu erstellen. Daher werden keine Metadaten in den betrachteten Dokumenten
ben¨
otigt. Bei einer solchen inhaltsbezogenen Analyse von Texten stellt sich die
Frage, wie die gew¨
unschten Informationen effizient extrahiert werden k¨
onnen.
Hierf¨
ur ist die mathematische Sprache gut geeignet, da sie in ihrer Struktur
typische Merkmale aufweist, die eine computergest¨
utzte Analyse vereinfachen
k¨
onnten. Die Sprache der Mathematik ist dabei weit mehr als nur eine Fach-
sprache mit charakteristischen Fachtermini. Sie ist ein k¨
unstliches Produkt des
Menschen, um mathematische Sachverhalte mit klaren und einfachen S¨
atzen
und exakt definierten Bezeichnungen darzustellen.
Die linguistische Analyse von mathematischen Texten liefert semantische Infor-
mationen in einer maschinenlesbaren Form. Zwischen semantischen Informatio-
nen und dem Aufbau von Wissensnetzen liegt ein weiter Weg. Jedoch besitzt die
Mathematik gl¨
ucklicherweise eine gut durchdachte, klar strukturierte Theorie,
die auf der Pr¨
adikatenlogik und der Mengenlehre aufbaut. Diese Theorie be-
steht aus einem großfl¨
achigen Beziehungsnetzwerk, in dem die mathematischen
Inhalte angeordnet werden. Dadurch entsteht eine durchg¨
ange Strukturierung,
die formalisiert werden kann. Daraus l¨
asst sich ein Klassifikationsmodell ablei-
ten: die Taxonomie der Mathematik. Daher sollte es m¨
oglich sein, zumindest
f¨
ur Teilgebiete mathematisches Wissen in Repr¨
asentationsschemata (Wissens-
basen) so zu organisieren, dass es auch durch ein Computersystem verarbeitet
werden kann.
Die Repr¨
asentationschemata werden dabei aus komplexen semantischen Netzen
bestehen. Durch diesen Aufbau ergibt sich die M¨
oglichkeit, ein Repr¨
asentati-
onsmodell zu konstruieren, das mathematische Inhalte selbstst¨
andig anordnet.
Voraussichtlich wird dabei keine vollst¨
andig automatisierte Analyse der Daten
m¨
oglich sein, jedoch soll diese Aufgabe in wesentlichen Teilen ohne manuelle
12 KAPITEL 1. EINLEITUNG
Unterst¨
utzung durch den Computer erfolgen.
1.2 Ziele und Hypothesen
Das Grobziel von mArachna ist der Aufbau eines intelligenten halbautoma-
tischen Information Retrieval Systems. Dazu sind Daten f¨
ur das Information
Retrieval erforderlich, aus denen die syntaktischen und semantischen Strukturen
der mathematischen deutschen Sprache erkannt, analysiert und schematisiert
werden k¨
onnen. Dazu notwendig ist die Konzeption eines Wissensrepr¨
asentati-
onsschemas (Ontologie), das mathematische Begriffe und Sachverhalte umfas-
send beschreiben und in einer Wissensbasis organisieren kann. Außerdem muss
ein Konzept entwickelt werden, wie Informationen wieder aus dieser Wissens-
basis extrahiert und dem Anwender in sinnvoller Art und Weise zur Verf¨
ugung
gestellt werden k¨
onnen.
Die vorangehenden Betrachtungen legen nahe, f¨
ur die Wissensextraktion und
die Wissensorganisation von folgenden Hypothesen auszugehen2:
Hypothese 1.2.1
Eine computerlinguistische Analyse der mathematischen Sprache ist einfacher
als die Analyse alltagssprachlicher Texte.
Diese Hypothese folgt aus der ¨
Uberlegung, dass mathematische Sprache in Tex-
ten normalerweise stark strukturiert ist und dabei immer wiederkehrende Phra-
senstrukturen verwendet. In diesem Zusammenhang folgt auch gleichzeitig die
n¨
achste Hypothese:
Hypothese 1.2.2
Fachsprachen wie die Mathematik besitzen wenige Ambiguit¨
aten.
Die Mathematik verwendet wenige Begriffe aus der Alltagssprache. Neue Be-
griffe werden meist formal eingef¨
uhrt, d. h. sie bauen auf bereits vorhandenen
Begriffen und Sachverhalten auf. Dies legt die folgende Hypothese nahe:
Hypothese 1.2.3
Der Wortschatz der Mathematik ist kleiner als bei anderen Fachsprachen.
2Einige der Hypothesen w¨
aren durchaus empirisch testbar. Dies ist jedoch nicht Gegenstand
dieser Arbeit.
1.2. ZIELE UND HYPOTHESEN 13
Da die mathematische Sprache stark strukturiert ist und auf einer einfachen
Logik beruht, ergeben sich f¨
ur Autoren nur wenige stilistische Freiheiten:
Hypothese 1.2.4
Stilistische Elemente spielen keine entscheidende Rolle bei der linguistischen
Analyse. Aufgrund des strengen Aufbaus der Mathematik ist anzunehmen, dass
die stilistischen Unterschiede zwischen verschiedenen Autoren gering sind.
Seit Anfang des zwanzigsten Jahrhunderts sind Mathematiker bestrebt, die Ma-
thematik zu axiomatisieren und zu formalisieren. Dieser Ansatz erscheint auch
sinnvoll f¨
ur eine Realisierung der genannten Ziele auf Computersystemen.
Hypothese 1.2.5
Das mathematische Grundlagenwissen, bestehend aus Pr¨
adikatenlogik und Men-
genlehre gen¨
ugt, um eine mathematische Wissensbasis aufzubauen, wie sie f¨
ur
ein halbautomatisches Information Retrieval System ben¨
otigt wird.
Aufgrund der vielf¨
altigen Beziehungen zu anderen Fachdisziplinen sollen in die-
ser Arbeit zuerst diejenigen Disziplinen betrachtet werden, die zur Behandlung
des Problems notwendig sind (Kapitel 2). Insbesondere soll dabei auf die Grund-
lagen der Mathematik eingegangen werden (Kapitel 3.2.2, 3.2.3). Kapitel 3.3
(Sprachstrukturen) und Kapitel 3.4 (Wissensstrukturen) sind die zentralen Ka-
pitel. Hier werden die Strukturen zum Aufbau eines innovativen Information
Retrieval Systems festgelegt. In einem letzten Schritt sollen dann anhand eines
Prototypen die Ergebnisse diskutiert werden.
14 KAPITEL 1. EINLEITUNG
Kapitel 2
Disziplinen
Das einzige Mittel gegen Aberglaube ist Wissenschaft.
(Henry Thomas Buckle, engl. Philosoph, 1821-1862)
2.1 Einleitung
Zweifellos geh¨
ort die Sprache zu den herausragendsten Eigenschaften mensch-
licher Kognition. Sie ist das wichtigste Medium, um Wissen zu kommunizieren
oder im Ged¨
achtnis zu speichern. Im Hinblick auf die zunehmende Bedeutung
des Computers ist es nicht verwunderlich, dass in den letzten Jahrzehnten zahl-
reiche Forschungsgruppen versucht haben, dem Computer das Lesen zu lehren.
Leider treten dabei zahlreiche Probleme auf, die u. a. durch die verschiedensten
Formen von sprachlichen Mehrdeutigkeiten (Ambiguit¨
aten) induziert werden.
Fachsprachen, insbesondere solche in denen Mathematik eine zentrale Stellung
einnimmt, besitzen weniger Ambiguit¨
aten (Kapitel 1.2, Hypothese 1.2.5). Der
mathematische Sprachstil ist dar¨
uber hinaus im Gegensatz zum geschriebenen
Sprachstil in Tageszeitungen, Belletristik, Gedichten usw. deutlich strukturier-
ter und hierarchischer. Er besitzt einen deduktiven logischen Aufbau und be-
steht damit aus ¨
uberschaubaren Satzstrukturen mit einfachen Aussages¨
atzen.
Durch die vereinfachten Strukturen wird eine reduzierte Grammatik induziert,
die sich leichter analysieren l¨
asst (Kapitel 1.2, Hypothese 1.2.1). Allerdings gibt
es individuelle Unterschiede zwischen verschiedenen Autoren mathematischer
15
16 KAPITEL 2. DISZIPLINEN
Texte (Individualstile), die die informationstechnische Verarbeitung erschweren
[Bau99].
Psychologie Mathematik Informatik
Textverstehen
Wissensverarbeitung
Mathematische Sprache
Mathematisches Wissen
Anwendung von mathematischem Wissen Information Retrieval System
Wissensbasierte Systeme
Computerlinguistik
Abbildung 2.1: ¨
Uberblick ¨
uber die notwendigen Disziplinen
Eine computergest¨
utzte Analyse der geschriebenen mathematischen Sprache er-
fordert trotz der genannten Vorteile einen großen Aufwand. Verschiedene Dis-
ziplinen sind notwendig, um ein solches Konzept zu realisieren. Das theoreti-
sche Fundament bildet die kognitive Psychologie, die u. a. die Extraktion von
Wissen aus Texten, die Speicherung von solchem Wissen und die Anwendung
des gespeicherten Wissens durch den Menschen betrachtet (Kapitel 2.2, Kapitel
2.3). Dabei werden nicht biologische und chemische Betrachtungen herangezo-
gen, sondern theoretische Modelle zur Wissensakquisition,Wissensorganisation
und Wissensnutzung entwickelt. Diese Modelle werden als Diskussionsgrundlage
verwendet, wie Wissen informationstechnisch verarbeitet werden kann. Insbe-
sondere ist das Sprachverstehen (Kapitel 2.3) f¨
ur die Computerlinguistik von
Interesse.
In einen weiteren Schritt sollen kurz Methoden und Probleme der Computer-
linguistik (Kapitel 2.4) dargestellt werden, die f¨
ur die maschinelle Analyse der
mathematischen Sprache von Bedeutung sind. Dar¨
uber hinaus ist die informa-
tionstechnische Wissensnutzung, die Wissen in geeigneter Weise dem Nutzer ei-
nes Computersystems zur Verf¨
ugung stellt, ein wichtiger Diskussionsgegenstand.
Die technische Realisierung wird durch das Information Retrieval (Kapitel 2.5)
gegeben, das interessante Konzepte und Analysemethoden bereitstellt.
2.1. EINLEITUNG 17
Aus der Diskussion der Disziplinen sollte es m¨
oglich sein, ein System zu entwi-
ckeln, das mathematische Sprache analysiert und das extrahierte Wissen orga-
nisiert.
18 KAPITEL 2. DISZIPLINEN
2.2 Wissensmanagement
Zu wissen, was man weiß, und zu wissen,
was man tut, das ist Wissen.
(Konfuzius, chin. Philosoph, 551 - 479 v. Chr.)
Wissen ist die Ressource der modernen Informationsgesellschaft, die zunehmend
an Bedeutung gewinnt. Dabei ist Wissen ein wenig fassbarer Wert (intellectual
capital) [V¨
a02], das in Archiven und Datenbanken in Form einer un¨
uberschau-
baren Flut von Informationen zumeist schlummert oder gar schwer zug¨
anglich
ist. Schlimmstenfalls besitzt nur ein einzelner Mensch das Wissen. Daher ist es
sinnvoll, Wissen in geeigneter Form f¨
ur verschiedene Personen zur Verf¨
ugung zu
stellen. Heutzutage besch¨
aftigt sich u. a. das Wissensmanagement (Knowledge
Management) mit dem Begriff Wissen und seiner Verarbeitung. Dabei werden
nicht fundamental neue Techniken generiert, sondern es werden bekannte Metho-
den aus den verschiedensten Disziplinen (Philosophie, Psychologie, Informatik
usw.) verwendet.
Definition 2.2.1 (Wissensmanagement)
Wissensmanagement [engl. knowledge management], in der modernen Or-
ganisationsf¨
uhrung die Gesamtheit der Modelle und Konzepte, mit denen sich
die Bedeutung von Wissen als Ressource herausarbeiten sowie Techniken und
Instrumente zur bewussten Gestaltung wissensrelevanter Prozesse in Organisa-
tionen entwickeln lassen. [...]Innerhalb der Datenverarbeitung bezeichnet der
Begriff Wissensmanagement den Umgang mit großen, unstrukturierten Daten-
mengen und die Extraktion des darin enthaltenen Wissens. [Bro03, S. 979]
2.2.1 Daten, Informationen und Wissen
Die Basis des Wissens sind Daten, d. h. quantitativ aufgezeichnete Wahrneh-
mungen der Realit¨
at [V¨
a02]. Beispiele f¨
ur Daten sind Texte, Bilder, T¨
one usw.
In der Informatik sind Daten Zeichen, die mit einer Syntax versehen sind. Da-
ten werden zu Informationen, indem sie in einen Kontext gestellt und zum
Erreichen eines konkreten Ziels verwendet werden [Hau02]. Daher sind Infor-
mationen Daten mit einer Semantik. Allerdings wird dadurch nicht gekl¨
art, wie
Informationen Wissen formen. Um Wissen im Computer zu repr¨
asentieren, ist
2.2. WISSENSMANAGEMENT 19
es notwendig zu definieren, was unter Wissen verstanden werden kann. Wie so
h¨
aufig ist auch der Wissensbegriff nicht eindeutig definierbar. Gepr¨
agt durch
Platon (im Werk Theaitetos) ist in der Philosophie der Begriff Wissen mit dem
Wahrheitsbegriff (Kapitel 3.2.2) verbunden. In der Psychologie entspricht Wis-
sen einer Menge von Kenntnissen (Erfahrungen), die eine Person aus ihrem
Ged¨
achtnis wiedergeben kann [And01]. Allgemein kann Wissen als gespeicherte
Information betrachtet werden, aus der Schl¨
usse gezogen werden k¨
onnen, die
selbst wieder als Information zum Wissen beitragen. Dabei spielt der Kontext
der Information eine besondere Rolle.
Wissen := Informationen im Kontext
Um Informationen als Wissen zu organisieren, erscheint es notwendig, verschie-
dene Arten von Wissen zu unterscheiden, die das breite Spektrum des Wissens-
begriffs eingrenzen, um somit eine ¨
ubersichtliche Darstellung zu erzeugen. Nach
Anderson [And01] wird in der kognitiven Psychologie menschliches Wissen in
zwei Arten unterteilt:
Deklaratives Wissen (Faktenwissen):
Terminologisches Wissen und Wissen ¨
uber Sachverhalte; leicht verbalisier-
bares Wissen
Prozedurales Wissen (Verarbeitungswissen):
Wissen ¨
uber die Art und Weise von verschiedenen kognitiven Handlungen;
schwer verbalisierbar.
Aus der Philosophie stammt ein Modell von Polanyi (Klassifikationssystem von
Polanyi) [Pol85], das zwischen zwei Arten von Wissen in Bezug auf den m¨
ogli-
chen subjektiven Charakter der Wissensaufnahme unterscheidet:
Explizites Wissen (disembodied knowledge):
Formalisierbares und digitalisierbares Wissen
Implizites Wissen (embodied knowledge):
Personifiziertes Wissen, das durch Erfahrung erworben wird
Ein weiteres Modell stammt von Ryle [Ryl69] und Baumgartner [Bau93] und
hat ebenfalls einen philosophischen Ursprung. Es wird zwischen drei Arten von
20 KAPITEL 2. DISZIPLINEN
Wissen unterschieden, wobei die dritte Art st¨
arker die Interpretationsf¨
ahigkeit
von vorhandenen Informationen hervorhebt:
Faktenwissen: deklaratives Wissen;
Anwendungswissen: prozedurales Wissen;
Handlungswissen:
Fertigkeiten, die sich in ausf¨
uhrbaren T¨
atigkeiten als praktisches Wissen
¨
außern.
Alle drei Beschreibungsmodelle von Wissenstypen weisen ¨
Ahnlichkeiten auf.
Sie unterteilen in leicht und schwer formalisierbares Wissen. Insbesondere wird
durch das Modell von Polanyi deutlich, dass die Wissensakquisition und die
Wissensnutzung einen subjektiven Charakter besitzen.
Auch in der k¨
unstlichen Intelligenz wird der Wissensbegriff ausf¨
uhrlich behan-
delt. Im Zuge der Entwicklung wurden Modelle erstellt, die versuchen menschli-
ches Wissen im Computer zu repr¨
asentieren. In diesem Zusammenhang befasste
sich Newell [New81] u. a. mit folgenden Fragenstellungen [GRS00, S. 7]:
Wie kann Wissen charakterisiert werden?
Wie steht eine solche Charakterisierung in Beziehung zur Repr¨
asentati-
on?
Was genau zeichnet ein System aus, wenn es ¨
uber Wissen verf¨
ugt?
Newell kam zu der Auffassung eines dreistufigen Ebenenmodells, bestehend aus
Programmierebene,Symbolebene und Wissensebene. Die Programmierebene ist
die unterste Ebene und wird durch die Hardware realisiert. Die Symbolebene
tr¨
agt die Repr¨
asentationen, die als Datenstrukturen und Prozesse existieren und
den Wissensbestand auf der Wissensebene realisieren [GRS00, S. 7]. Der zen-
trale Ansatz von Newell ist die Verwendung von Logiken als fundamentalem
Werkzeug (Mathematisierung des Wissens). Logiken werden einerseits f¨
ur die
2.2. WISSENSMANAGEMENT 21
Wissensebene
Symbolebene
Programmierebene
Domänenwissen
Software
Hardware
Abbildung 2.2: Newells dreistufige Ebenenmodell
Kodierung von vorhandenem Wissen verwendet, andererseits f¨
ur die Implemen-
tierung von Inferenzmechanismen, um menschliche Schlussfolgerungsprozesse zu
imitieren.
Die Kodierung von Wissen unter Verwendung einer logikbasierten Sprache (Wis-
sensrepr¨
asentationssprache) wird in der k¨
unstlichen Intelligenz als Wissensba-
sis bezeichnet. Die technischen Realisierungen sind jedoch immer an die Art
des untersuchten Problems gebunden. Eine allgemeinere Art, Wissen darzustel-
len, sind Ontologien, die ein formales allgemeing¨
ultiges Beschreibungsmodell f¨
ur
bestimmte Weltausschnitte bereitstellen. Dies ist eine Beschreibung von Kon-
zepten und ihren Beziehungen untereinander, die f¨
ur eine Gruppe von Personen
begriffsbildend sind.
An ontology is a formal, explicit specification of a shared concep-
tualization. A conceptualization refers to an abstract model of some
phenomenon. Explicit means that the type of concepts used and the
contraints on their use are explicitly defined. Formal refers to the
fact that the ontology should be machine readable. [Fen04, S. 7]
Wichtig ist der Aspekt des Informationsaustauschs. Einerseits muss eine On-
tologie eine Semantik von Informationen besitzen, die maschinenverst¨
andlich
ist. Anderseits muss diese Ontologie auch von Menschen akzeptiert werden. Je-
doch gibt es dabei Probleme. Selbst der Mensch hat in vielen Bereichen des
Lebens keine eindeutige Beschreibung f¨
ur Konzepte. So ist z. B. der Begriff der
Religionnicht eindeutig definierbar und somit ein einheitliches Modell nicht
m¨
oglich.
22 KAPITEL 2. DISZIPLINEN
Konzepte beschreiben einen Menge von Objekten aus dem betrachteten Weltaus-
schnitt, die gemeinsame Eigenschaften aufweisen. Die Instanzen sind spezielle
Auspr¨
agungen eines Konzeptes. So ist ein rotes Auto eine Instanz des Konzep-
tes Auto. Relationen stellen die Objekte des Weltausschnitts in Zusammenhang
zueinander, z. B. durch eine ist eine-Relation. Eigenschaften beschreiben die
benutzten Konzepte und Instanzen genauer. Die Nebenbedingungen k¨
onnen Ei-
genschaften weiter einschr¨
anken z. B. in der L¨
ange [Hel00].
Im weiteren Verlauf werden Modelle vorgestellt, die menschliches Wissen sche-
matisieren. H¨
aufig werden dabei assoziative Netzwerke verwendet. Wissen er-
scheint in diesen Modellen als Vernetzung von Informationen, die es dem Tr¨
ager
erm¨
oglichen, Handlungsverm¨
ogen aufzubauen und Aktionen in Gang zu brin-
gen. Fragen an die kognitive Psychologie betreffen dabei die Vernetzungen von
Informationen und ihre Konstruktionsm¨
oglichkeiten.
2.2.2 Wissensorganisation und Wissensrepr¨
asentation
Wahrnehmungen aus der Umwelt werden in ein mentales Modell umgewandelt.
Dabei handelt es sich um Prozesse der Klassifizierung und der Interpretation der
wahrgenommenen Inhalte. Um diese internen mentalen Modelle zu beschreiben,
werden in der Psychologie Konzepte entwickelt, die als Wissensrepr¨
asentationen
bezeichnet werden. Diese Form der menschlichen Informationsverarbeitung wird
bei Anderson [And01] durch den jeweiligen Typ der Information charakterisiert.
Es gibt die bedeutungsbezogene Wissensrepr¨
asentation, die sich in zwei weit-
ere Repr¨
asentationsformen unterteilt, die propositionale Wissensrepr¨
asentation
und die konzeptuelle Wissensrepr¨
asentation. Hierbei werden Informationen im
Kontext des vorhandenen Wissens aufgenommen (Interpretation der aufgenom-
menen Informationen). Außerdem gibt es die wahrnehmungsbasierte Wissensre-
pr¨
asentation, bei der Informationen vom System direkt wahrgenommen werden,
beispielsweise visuell oder verbal. Diese Form der Wissensrepr¨
asentation ist im
Gegensatz zur bedeutungsbezogenen Wissensrepr¨
asentation gut erforscht. Im
Hinblick auf die Betrachtung von mathematischem Wissen soll die bedeutungs-
bezogene Wissensrepr¨
asentation verwendet werden.
2.2. WISSENSMANAGEMENT 23
Wahrnehmungsbezogene Wissensrepräsentation
Wissensrepräsentation
Bedeutungsbezogene Wissensrepräsentation
Propositionale Wissensrepräsentation Konzeptuelle Wissensrepräsentation
Abbildung 2.3: Wissensrepr¨
asentationen in der kognitiven Psychologie
2.2.2.1 Propositionale Wissensrepr¨
asentationen
Die propositionale Wissensrepr¨
asentation ist in der kognitiven Psychologie zu
einem n¨
utzlichen Modell bei der Beschreibung der Informationsverarbeitung
insbesondere f¨
ur nat¨
urlichsprachliche S¨
atze geworden. Der aus der Logik und der
Linguistik ¨
ubernommene Begriff Proposition nimmt eine zentrale Rolle ein. Eine
Proposition ist die kleinste Wissenseinheit, die sich sinnvoll als wahr oder falsch
beurteilen l¨
asst. Sie entspricht somit einer Aussage. Es gibt unterschiedliche
propositionale Notationssysteme, wie z. B. die Pr¨
adikat-Argument-Struktur von
Kintsch [Kin74].
Pr¨
adikat-Argument-Struktur. Die Argumente entsprechen Personen, Ge-
genst¨
anden, Eigenschaften usw., die meistens durch Nomina beschrieben wer-
den. Die Pr¨
adikate entsprechen den Beziehungen der Argumente untereinander.
Sie werden vor allem durch Verben, Adjektive oder andere relationale Ausdr¨
ucke
gebildet. Dargestellt wird eine propositionale Wissensrepr¨
asentation durch eine
Liste, bestehend aus einem Pr¨
adikat und den zugeh¨
origen Argumenten.
Beispiel 2.2.1
Eine ¨
Aquivalenzrelation ist reflexiv, transitiv und symmetrisch.
Propositionale Wissensrepr¨
asentation:
(ist reflexiv, ¨
Aquivalenzrelation)
(ist transitiv, ¨
Aquivalenzrelation)
(ist symmetrisch, ¨
Aquivalenzrelation)
24 KAPITEL 2. DISZIPLINEN
Subjekt
Prädikat
Subjekt
Prädikat
Subjekt
Prädikat
Subjekt
Prädikat
Äquivalenzrelation
ist_symmetrisch
ÄquivalenzrelationÄquivalenzrelation
ist_reflexiv ist_transitiv
Äquivalenzrelation
ist_reflexiv
ist_symmetrisch
ist_transitiv
Abbildung 2.4: Graphische Realisierung eines propositionalen Netzwerks
Netzwerke aus Propositionen (propositionales Netz) beschreiben die Beziehun-
gen des betrachteten Sachverhaltes. Pr¨
adikate und Argumente werden in diesem
Netzwerk als Knoten und Pfeile als Verbindungen bezeichnet. Die r¨
aumliche
Anordnung spielt keine Rolle. Sie k¨
onnen aber in hierarchischer Beziehung zu-
einander stehen, wobei eine Proposition als eine Einheit innerhalb einer anderen
Proposition auftritt. Allerdings k¨
onnen sie keine allgemeinen Zusammenh¨
ange
beschreiben, die nicht explizit in dem Sachverhalt genannt werden. Experimen-
te ¨
uber die psychische Realit¨
at der propositionalen Einheiten werden in [BF71]
aufgef¨
uhrt.
2.2.2.2 Konzeptuelle Wissensrepr¨
asentationen
Menschen neigen dazu, Dinge, die uns umgeben, zu ordnen, zu klassifizieren
oder zu kategorisieren. Dabei werden allgemeine Merkmale einer gewonnenen
Erfahrung in Kategorien, Konzepte bzw. Begriffe zusammengefasst (Abstrakti-
on der Umwelt). Dies entspricht einer Art Mustererkennung, ohne die unsere
Informationsverarbeitung ¨
uberfordert w¨
are. Diese Mustererkennung beinhaltet
Prozesse wie Differenzierung und Generalisierung. Durch die Differenzierung
wird die Vielfalt der wahrgenommenen Informationen in handliche Einheiten
zerlegt. Die Generalisierung ordnet diese in ¨
uberschaubare Kategorien an. So-
mit ist die Kombination beider ein effektives kognitives Instrument.
2.2. WISSENSMANAGEMENT 25
Die einzelnen Kategorien werden basierend auf der Erfahrung des jeweiligen
Menschen erstellt. Es ist egal, ob diese der Wahrheit entsprechen oder welchen
Umfang sie besitzen. Kategorien sind auch nicht starr, sondern ver¨
anderbar.
Dies f¨
uhrt in der k¨
unstlichen Intelligenz zu Problemen, da dynamische Ka-
tegorien schwer zu realisieren sind. Psychologen beschreiben Kategorien mit
Attributen und Verkn¨
upfungsregeln [Bou66]. So wird die Kategorie Wasser
mit den Attributen farblos, geruchlos, fl¨
ussig usw. belegt. Attribute ent-
sprechen damit relevanten Merkmalen, die einen Gegenstand charakterisieren.
Verkn¨
upfungsregeln entsprechen logischen Regeln, um die Kategorien zu struk-
turieren (Wenn ..., dann, besitzt usw.).
Eine wichtige Eigenschaft von Kategorien ist die M¨
oglichkeit der Angabe einer
beliebigen Anzahl von Attributen. Dar¨
uber hinaus werden viele solcher Katego-
rien durch den Menschen nicht eindeutig definiert. Um diese Uneindeutigkeiten
zu modellieren, werden Ideale (repr¨
asentativste Beispiele) konstruiert, die Va-
riationen in der Interpretation zulassen (Prototypen) [BF71].
Zwischen den einzelnen Kategorien gibt es verschiedene Formen von Beziehun-
gen. Um globale Zusammenh¨
ange zu erfassen, werden Informationen in gr¨
oße-
ren kategorialen Einheiten organisiert. In konzeptuellen Wissensrepr¨
asentatio-
nen werden Methoden vorgestellt, wie Kategorien in Beziehung zueinander ste-
hen und wie diese im Einzelnen strukturiert sind. Hierbei wird u. a. zwischen
semantischen Netzen ([Qui68]) und Schemata [BT81] unterschieden. [Wes94]
Semantische Netze. Das menschliche Ged¨
achtnis zeichnet sich u. a. dadurch
aus, dass es eine große Anzahl von Verbindungen oder Assoziationen zwischen
Informationen bilden kann. Semantische Netze k¨
onnen solche Assoziationen be-
schreiben. Nach Quillian [Qui68, CQ69] speichert der Mensch Informationen
¨
uber verschiedene Kategorien in hierarchischen Netzwerkstrukturen z. B. mit-
tels is-a- oder instance-of-Beziehungen. Diese Beziehungen vermitteln die Se-
mantik. Eigenschaften, die f¨
ur Kategorien einmal angelegt werden, werden auf
die darunterliegenden Hierarchieebenen vererbt. Kategorien entsprechen in die-
sen Netzwerken Knoten, und die Beziehungen entsprechen den Kanten.
Informationen, die nicht direkt als Kategorien gespeichert werden, m¨
ussen ge-
schlussfolgert werden. Dazu gibt es Untersuchungen [And01, S. 155], wie sich
die Abrufzeiten von geschlussfolgerten Informationen verhalten. Unter anderem
26 KAPITEL 2. DISZIPLINEN
beißen
Hierarchieebene II
Hierachieebene I
Hierarchieebene III
Tier
Vogel Fisch
Kanarienvogel Strauß Hai Lachs
bewegen
atmen
fressen
Flügel
fliegen
Feder
nicht fliegengroß gefährlich essbar rosa
schwimmen
Kiemen
Flossen
singengelb
Abbildung 2.5: Graphische Realisierung einer semantischer Repr¨
asentation nach
Quillian1[CQ69]
ben¨
otigt der Mensch mehr Zeit, Informationen abzurufen, die nicht explizit als
Kategorie gespeichert werden.
Als geeignetes Darstellungsmittel eines einfachen semantischen Netzes bieten
sich Graphen an. Graphen sind abstrakte Strukturen, die relationale Beziehun-
gen oder Netzwerke modellieren.
Definition 2.2.2 (Graph)
Ein Graph ist ein Paar G= (V, E)disjunkter Mengen mit E[V]2; die
Elemente von Esind also 2-elementige Teilmengen von V. Die Element von V
nennt man die Ecken (Knoten) des Graphen G, die Elemente von Eseine
Kanten. Wir sagen, G= (V, E)sei ein Graph auf V[Die00, S. 4].
Ein gerichteter Graph ist ein Paar (V, E)disjunkter Mengen (von Ecken und
Kanten) zusammen mit zwei Funktionen init :EVund ter :EV, die
jeder Kante eeine Anfangsecke init(e)und eine Endecke ter(e)zuordnen; die
Kante von eheißt dann von init(e)nach ter(e)gerichtet. Ein gerichteter Graph
kann zwischen zwei Ecken x,ymehrere Kanten haben, solche Kanten nennt man
Mehrfachkanten. Ist init(e) = ter(e), so ist eeine Schlinge [Die00, S. 26].
Definition 2.2.3 (Weg, Zyklus)
Ein Weg ist ein nicht leerer Graph P= (V, E)der Form
V={x0, x1,...,xk}E={x0x1, x1x2,...,xk1xk},
1Der Graph in der Abbildung kann auch Ausnahmen darstellen. So wird V¨
ogeln die Eigen-
schaft fliegen zugeschrieben. Allerdings k¨
onnen z. B. Pinguine und Strauße nicht fliegen. Dies
wird in dieser Graphik ber¨
ucksichtigt.
2.2. WISSENSMANAGEMENT 27
1
2
4
3
c
a
d
b
e
f
5
Schlinge
Mehrfachkanten
ungerichteter Graph
G = {1, 2, 3, 4, 5}
V ={a, b, c, d, e, f}
a = {1,2}, b = {2,3}, c ={1,4}, d = {4,4}, e = {1,5}, f ={1,5}
gerichteter Graph
Abbildung 2.6: Darstellung verschiedener Graphen
wobei die xipaarweise verschieden sind. Die Ecken x0und xksind die Endecken
von P; sie sind durch Pverbunden. Die Ecken x1,...,xk1sind die inneren
Ecken von P. Die Anzahl der Kanten eines Weges ist seine L¨
ange [Die00, S.
7]. Ist P=x0...xk1ein Weg und k3, so ist der Graph C:= P+xk1x0
ein Kreis [Die00, S. 13]. Ein Graph, der keine Kreise enth¨
alt, heißt kreislos
(azyklisch).
Abbildung 2.7: Darstellung der Wege eines ungerichteten Graphen
Definition 2.2.4 (Semantischen Netze)
Ein semantisches Netz (K, σ, T, τ)ist ein endlicher, gerichteter azyklischer Graph,
bestehend aus:
einer Menge Kvon Kategorien (Knoten des Graphen),
einer Relation σK×K(Kanten des Graphen),
eine Menge Tvon Kantentypen (m¨
ogliche Relationen zwischen den Kate-
gorien) und
28 KAPITEL 2. DISZIPLINEN
einer Funktion τ:σ T, die jeder Kante einen Typ zuordnet.
[Rei89]
Knoten und Kanten k¨
onnen nicht nur Namen tragen, sondern auch Eigenschaf-
ten (Konfigurationen) haben. Komplexe Netze werden durch Hypergraphen be-
schrieben, d.h. durch Graphen mit Knoten, die selbst wieder Graphen sind.
Durch Partitionierung und Quantifizierung kann die Ausdruckskraft von seman-
tischen Netzen gesteigert werden.
1
F
S
S
G
GG
G
G
G
G
G
G
G
L
LL
L
L
L
L
L
L
R
R
R
R
R
R
R
R
R
RR
R
R
R
R
R
F
HR
1
1
GL
1
1
1
1
1
1
0
0
0
0
0
0
2
R
2
2
2
2
3
3
3
3
S
4
4
4
R5
5
5
5
6
6
7
77
1 0
9
9
8
8
9
6
8
KSV
KSV
KSV
Abbildung 2.8: Bild eines komplexen Netzwerks [HB01, S. 101]
Werden semantische Netze zur Modellierung unseres Wissen verwendet, so sto-
ßen diese bald an die Grenzen des M¨
oglichen. Dies macht es notwendig, sie durch
neue Methoden zu erweitern.
Schemata. Semantische Netze, die nur Eigenschaften von Konzepten abspei-
chern k¨
onnen, sind nicht in der Lage, die Komplexit¨
at des menschlichen Wis-
sens zu erfassen. In Schemata (z. B. Haus) wird kategoriales Wissen in Form
von strukturierenden Elementen (Slots) (z. B. Material) und deren Werten dar-
gestellt. Die Slots definieren typische Eigenschaften (z. B. Beton), die zur Be-
schreibung eines Begriffs verwendet werden. Die Werte entsprechen konkreten
Auspr¨
agungen dieser Eigenschaften. Dabei besitzen die Eigenschaften ¨
ublicher-
weise eine oder mehrere erwartete Belegungen, die standardm¨
aßig mit dem Sche-
ma assoziiert werden. Die Erwartungswerte k¨
onnen dabei zwischen verschiede-
2.2. WISSENSMANAGEMENT 29
nen Personen variieren, z. B. wird ein Stadtbewohner ein Haus eher aus Beton
annehmen, w¨
ahrend ein Bauer zuerst an Stein denkt.
Gebäude
Slotwerte
Zimmer
Stein, Holz
wohnen
Schema: Haus
Slot
Oberbegriffe
Teile
Material
Funktion
Abbildung 2.9: Darstellung eines Schema
Der Oberbegriffslot in der Abbildung 2.9 ist ein spezielle Form des Slots. Er
entspricht der is-a-Relation im semantischen Netzwerk und kennzeichnet die
oberste Objektklasse.
Nicht nur Gegenst¨
ande weisen eine konzeptuelle Struktur auf. Wir verf¨
ugen auch
¨
uber Konzepte f¨
ur verschiedene Ereignisarten, z. B. ins Kino gehen. Solche
Kategorien k¨
onnen auch mit einer Variante von Schemata dargestellt werden.
Abelson et al. [AS77] entwickelten diese Variante der Schemata, die auch als
Skripts bezeichnet werden.
In der k¨
unstlichen Intelligenz wird der Frame-Begriff [Min74] verwendet, er ent-
spricht dem Begriff der Schemata, allerdings wird hierbei st¨
arker das assoziative
Modell verwendet.
Definition 2.2.5 (Frames)
Ein Frame ist ein Tripel (N, SN, ST)bestehend aus
dem Frame-Namen N
einer Menge nicht-terminaler Slots SN ={sn1,...,snk},k1und
einer Menge terminaler Slots ST ={st1,...,stm},m1.
[Rei89]
Dabei sind nicht-terminale Slots SN die Slots, die wiederum Frames besitzen,
um sich zu beschreiben. So kann z. B. in Abbildung 2.9 der Slot Geb¨
aude durch
30 KAPITEL 2. DISZIPLINEN
ein weiteres Frame beschrieben werden. Die terminalen Slots ST weisen da-
gegen als Eintr¨
age Zeichenketten auf und k¨
onnen nicht durch weitere Frames
dargestellt werden.
Obwohl semantische Netze und Schemata ihre Vorz¨
uge aufweisen, gelten sie
nach der vorherrschende Forschungsmeinung als inad¨
aquat, jedoch sind sie f¨
ur
den Fokus dieser Arbeit ausreichend.
2.2.3 Wissensbasierte Systeme
Abbildung 2.10: Unterschied zwischen Programm und wissensbasierten System
Ein k¨
unstliches System, das Wissen speichert und verarbeitet wird als wissens-
basiertes System bezeichnet. Gew¨
ohnliche Computerprogramme speichern
implizit Wissen in Algorithmen. Wird Wissen ver¨
andert, so muss der Al-
gorithmus ge¨
andert werden. Bei wissensbasierten Systemen wird dagegen streng
zwischen anwendungsspezifischem Wissen (Wissensbasis, Wissensrepr¨
asentati-
on) und der Wissensverarbeitung (Probleml¨
osungsstrategien, Inferenzmaschine)
unterschieden. So muss bei ¨
Anderung von Wissen nicht die Wissensverarbei-
tungskomponente ge¨
andert werden (Abbildung 2.10).
Neben der Wissensverarbeitung und der Wissensbasis besteht ein wissensba-
siertes System aus weiteren Komponenten. Um Wissen in einer Wissensbasis zu
speichern gibt es eine Wissensakquisitionskomponente (Knowledge Engineer-
ing). Als Schnittstelle f¨
ur Nutzer eines wissensbasierten Systems existiert eine
Dialogkomponente [BKI00]. Der Begriff Dialogkomponente wird h¨
aufig im Zu-
sammenhang mit Expertensystemen genannt, daher erscheint es sinnvoll, diese
Komponente zu verallgemeinern und sie als Benutzerschnittstelle zu bezeichnen
(Abbildung 2.11).
2.2. WISSENSMANAGEMENT 31
Daten
Benutzerschnittstelle
Wissensakquisition
Wissensverarbeitung
Wissensbasis
Benutzerschnittstelle
Ergebnis einer Abfrage
Abbildung 2.11: Aufbau eines wissensbasierten Systems
Wissensbasis. Eine Wissensbasis enth¨
alt Wissensrepr¨
asentationen, die Wis-
sensinhalte computergerecht darstellen. Aufgrund der un¨
uberschaubaren Men-
ge an Informationen ist es n¨
utzlich, eine solche Darstellung auf Teilbereiche
(Dom¨
anen,Weltausschnitte) zu beschr¨
anken und nur diese Dom¨
anen zu mo-
dellieren.
Wissensbasen enthalten explizites Wissen. Explizites Wissen l¨
asst sich auf zwei
verschiedene Darstellungsarten im Computer realisieren: deklarative und pro-
zedurale Darstellung. Deklarative Darstellungen entsprechen objektorientierten
Repr¨
asentationsformen und logischen formalen Sprachen. So k¨
onnen die in der
kognitiven Psychologie (Kapitel 2.2) verwendeten Wissensrepr¨
asentationsmo-
delle semantische Netze, Frames und Propositionen deklarative Darstel-
lungen modellieren und somit auf Computersysteme ¨
ubertragen werden. Proze-
durale Darstellungen stellen Wissen mittels Prozeduren bzw. Anweisungen dar
32 KAPITEL 2. DISZIPLINEN
und werden durch regelbasierte System realisiert. Dabei wird Wissen mit Hilfe
einer Menge von Regeln (Produktionsregeln) dargestellt. Ein bekanntes Beispiel
sind die Phrasenstrukturregeln der generativen Grammatik (Kapitel 2.4.2).
Wissensverarbeitung. Die Wissensverarbeitungskomponente verk¨
orpert den
Schlussfolgerungs- und Probleml¨
osungsapparat. Sie wird auch als Inferenzsys-
tem bezeichnet. Die Vorstellung der Trennung von Wissensbasis und -verarbei-
tung ist dabei nicht wirklich korrekt. Tats¨
achlich ist ein Inferenzsystem sehr
wohl abh¨
angig von dem Wissensrepr¨
asentationsmechanismus in der Wissens-
basis. Je nach Art der Repr¨
asentation (z. B. semantische Netze, Produktions-
regeln) m¨
ussen entsprechende Inferenzsysteme konstruiert werden. So muss ein
Inferenzsystem auf einem semantischen Netz Suchalgorithmen auf Graphen ver-
arbeiten k¨
onnen, bei regelbasierten Systemen werden dagegen die Regeln mittels
Pr¨
adikatenlogik verarbeitet.
Das Inferenzsystem erlaubt es, aus vorhandenem Wissen in der Wissensbasis
neues Wissen abzuleiten. Dabei werden menschliche Schlussfolgerungsprozesse
imitiert. Die bekanntesten und einfachsten Systeme sind die regelbasierten In-
ferenzsysteme. Sie bestehen aus einem System von Inferenzregeln und einem
Inferenzschema. Das Inferenzschema enth¨
alt die Verarbeitungsvorschriften, wie
Daten aus der Wissensbasis auf die Regeln angewendet werden.
Diese Inferenzsysteme arbeiten mit der Pr¨
adikatenlogik, was gleichzeitig auch
ihre Schw¨
ache ist. Damit k¨
onnen keine nicht-monotonen Schlussfolgerungen ge-
zogen werden, die h¨
aufig auftreten. Hierbei k¨
onnen Schlussfolgerungen im Lau-
fe der Verarbeitung zur¨
uckgenommen werden. Defaultlogiken versuchen dieses
Ph¨
anomen zu formalisieren. Es werden sogenannte Defaultregeln angewendet,
die die eigentlichen Bedingungen ¨
uber ein Objekt speichern (z. B. V¨
ogel flie-
gen). Dazu kommen Ausnahmen, die durch Implikationen dargestellt werden
(z. B. Pinguine k¨
onnen nicht fliegen).
Ein weiteres, komplexeres System f¨
ur die Verwaltung von nicht-monotonen
Schlussfolgerungen ist das Truth Maintenance System [BKI00]. Dieses System
arbeitet mit Constraints und wird h¨
aufig als effizientes Wartungssystem f¨
ur
Wissensbasen verwendet.
Bei der Darstellung von unsicherem Wissen werden wahrscheinlichkeitstheore-
tische Methoden verwendet. Unsicheres Wissen beruht darauf, dass nicht im-
2.2. WISSENSMANAGEMENT 33
mer eindeutige Schlussfolgerungen aus Voraussetzungen gezogen werden k¨
onnen.
Meistens gibt es keine eindeutigen Zusammenh¨
ange. In der Sprache treten sie
meist als W¨
orter wie manchmal,beinahe usw. auf. Es wird dem System in der
Regel Wissen in Form von Unabh¨
angigkeitsannahmen hinzugef¨
ugt, die durch
Graphen repr¨
asentiert werden. Insbesondere verwendet man daher Markow- und
Bayessche Netze, aber auch Methoden der Fuzzy-Theorie [BKI00].
Kategoriebasierte Wissensbasen. Es gibt viele verschiedene Auspr¨
agun-
gen von semantischen Netzen. Allen gemeinsam ist, dass sie mittels Objekten,
Objektkategorien und Relationen Objekte repr¨
asentieren. Inferenzsysteme wer-
den bei semantischen Netzen durch Vererbungsmechanismen induziert. Diese
scheinbare Einfachheit kann zu komplexen Ph¨
anomenen f¨
uhren, sobald Mehr-
fachvererbung zugelassen wird. Ein weiterer Inferenzmechanismus ist die inverse
Verkn¨
upfung, die Vererbungsmechanismen gegebenenfalls umdrehen kann. Dies
bildet jedoch nur einen sehr primitiven Apparat f¨
ur Schlussfolgerungen. Es gibt
semantische Netze, die sehr viel komplexer sind und zus¨
atzlich prozedurale Me-
chanismen benutzen, wie z. B. partitionierte semantische Netze und existentielle
Graphen. Ein wichtiger Aspekt ist die Verwendung von Defaults bei Kategori-
en. F¨
ur solche Konstruktionen werden Beschreibungslogiken zur Beschreibung
von Definitionen und Eigenschaften von Kategorien verwendet. Die wichtigste
Inferenzaufgabe f¨
ur Beschreibungslogiken sind:
1. die Subsumption: ¨
Uberpr¨
ufung, ob eine Kategorie eine Untermenge einer
anderen ist, indem ihre Definitionen verglichen werden;
2. die Klassifizierung: ¨
Uberpr¨
ufungen, ob ein Objekt zu einer Kategorie
geh¨
ort;
3. die Konsistenzpr¨
ufung: ¨
Uberpr¨
ufung, ob die Zugeh¨
origkeitskriterien lo-
gisch erf¨
ullbar sind.
Allerdings fehlen den Beschreibungslogiken die Mechanismen der Negation und
Disjunktion.
Wissensakquisition. In irgendeiner Form m¨
ussen Informationen dem Sys-
tem zugef¨
uhrt und organisiert werden. Die Wissensakquisitionskomponente bie-
tet daf¨
ur eine Schnittstelle an. Sie kann einerseits ein Eingabeinstrumentarium
34 KAPITEL 2. DISZIPLINEN
f¨
ur Experten sein, anderseits auch eine (semi-) automatische Anwendung, welche
aus Datenanalysen geeignete Eintr¨
age erzeugt. Ein wichtiger Prozess ist auch
die fortlaufende Wartung der Wissensbasis.
Die Wissensakquisition beinhaltet Prozesse der Wissenserhebung, die relevantes
Wissen in Texten erkennt, der Wissensinterpretation, die das erhobene Wissen
interpretiert, und der Wissensformalisierung, die das Wissen computergerecht
aufbereitet.
Benutzerschnittstellen. Die Benutzerstellen bieten verschiedenste Arten
von Kommunikation zwischen einem Nutzer und dem System an. Einerseits
gibt es Instrumentarien f¨
ur die Wissensakquisition, anderseits geht es um die
Ausgaben der Wissensbasis aufgrund von Anfragen an das System. Dabei
kann es sich um graphische Ausgabe, men¨
ugesteuerte Dialoge, formalsprach-
liche oder nat¨
urlichsprachliche Mittel handeln. Diese Benutzerschnittstelle kann
auch einen Teil eines Information Retrieval Systems darstellen (Kapitel 2.5).
Ontologien. Eine neuere Entwicklung ist die Verwendung von Ontologien bei
der Erstellung von wissensbasierten Systemen. Ontologien stellen eine Grund-
lage f¨
ur viele innovative wissensbasierte Systeme bereit. Ein Vorteil bei der
Verwendung einer Ontologie besteht in der gemeinsamen und effizienten Kom-
munikationsbasis zwischen Nutzer und System und zwischen unterschiedlichen
Systemen.
Ontologiesprachen, die Ontologien beschreiben, verwenden Regeln auf Kon-
zepten, Eigenschaften von Konzepten und Relationen zwischen Konzepten sowie
zus¨
atzliche Sprachmittel. Es gibt eine ganze Reihe solcher Ontologiesprachen
(einfach, framebasiert, logikbasiert). Sie werden oftmals graphisch dargestellt.
Eine der bekanntesten Ontologiesprachen ist die Ressource Description Frame-
work (RDF) [RDF]. Eine weitere Sprache ist DAML+OIL, die sich aus den
beiden Sprachen DAML (DARPA Agent Markup Language) [DAR03] und OIL
(Ontology Inference Layer) [Ont] entwickelt hat. Sie baut auf dem RDF Schema
auf, bietet aber gr¨
oßere Ausdrucksm¨
oglichkeiten.
Eine im Rahmen des semantischen Webs entstandene Ontologiesprache ist OWL
(Web Ontology Language) [OWL]. Auch diese Sprache hat das RDF Schema zur
2.2. WISSENSMANAGEMENT 35
Grundlage. Sie ist eine durch das W3C standardisierte Sprache mit fest definier-
ter Syntax und Semantik. Sie basiert auf der Beschreibungslogik (description
logic) und auf Konzepten von DAML+OIL.
36 KAPITEL 2. DISZIPLINEN
2.3 Sprachverstehen
Die Grenzen meiner Sprache bedeuten die Grenzen meiner
Welt. Die Logik erf¨
ullt die Welt; die Grenzen der Welt
sind auch ihre Grenzen. [...] Was wir nicht denken k¨
onnen,
das k¨
onnen wir nicht denken; wir k¨
onnen also auch nicht sagen,
was wir nicht denken k¨
onnen.
(L. Wittgenstein, ¨
osterr. Philosoph, 1889 - 1951)
Das Sprachverstehen von geschriebenen Texten ist ein komplexer und vielschich-
tiger Konstruktionsprozess, der bis heute nicht vollst¨
andig verstanden ist. Bei
unseren allt¨
aglichen Gespr¨
achen verarbeiten und verstehen wir eine große An-
zahl von S¨
atzen; erfolgreiches Verstehen ist eine Voraussetzung f¨
ur eine effek-
tive Kommunikation und stellt die Grundlage unserer sozialen Interaktion dar.
Aus diesen Gr¨
unden ist es von besonderer Bedeutung, das Wissen und die Ver-
arbeitungsvorg¨
ange zu erforschen, die uns zu einem Verst¨
andnis der Sprache
bef¨
ahigen. [Wes94, S. 296]
W
iss
e
n
Text
syntaktisch semantisch
Parsing
lexikalisch pragmatisch
Abbildung 2.12: ¨
Uberblick Textverstehen
Sprachverstehen bzw. Textverstehen bedeutet nach M. Pinkal [GRS00, S. 739]
die Gewinnung von Bedeutungsinformationen aus einer gesprochenen oder ge-
schriebenen Eingabe¨
außerung und besteht aus einer Kombination von lexika-
lischen,syntaktischen,semantischen und pragmatischen Analysen. Der Prozess
2.3. SPRACHVERSTEHEN 37
der Analyse wird als Parsing bezeichnet, durch den die W¨
orter [ ...] in eine
mentale Repr¨
asentation ¨
uberf¨
uhrt werden [ ...]. [And01, S. 389]
Beim Parsing treten allerdings Probleme auf, wann und wo einzelne Analy-
seschritte gemacht werden und wie mehrdeutige Strukturen aufgel¨
ost werden.
In den folgenden Betrachtungen sind die einzelnen Analysen nicht von der se-
mantischen Interpretation zu trennen, da jede experimentelle Anordnung zum
Sprachverstehen zwangsl¨
aufig auf die Semantik Bezug nehmen muss.
Semantische und pragmatische Analyse. Unter Textverstehen (semanti-
sche Interpretation) wird der Vorgang der Festlegung von Bedeutungen [ver-
standen]. Nach dieser Definition hat [ein Mensch] einen Satz nur dann verstan-
den, wenn er beispielsweise den in dem Satz enthaltenen Instruktionen folgen
kann oder eine angemessene Frage stellt. [Wes94, S. 311]. Bei der semanti-
schen Interpretation wird zwischen w¨
ortlicher und indentierter Bedeutung
unterschieden. Die w¨
ortliche Bedeutung bezieht sich allein auf die Aussage ei-
nes Satzes. Die indentierte Bedeutung dagegen beschreibt die Interpretation
der Aussage des Satzes (Kontextinformationen). Es muss daher w¨
ortliche und
indentiert Bedeutung gleichzeitig erfasst werden, um einen Satz zu verstehen.
Zweideutigkeiten (Ambiguit¨
aten) treten dann auf, wenn eine der beiden Be-
deutungen nicht erfasst wird.
Dennoch besitzen Menschen die F¨
ahigkeit, aus einzelnen W¨
ortern die Bedeutung
eines Satzes zu erkennen. So ist der Satz, Eis Kinder m¨
ogen, verst¨
andlich.
Insbesondere verlassen sich Kinder eher auf semantische als auf syntaktische
Muster [SN74]. Erwachsene dagegen integrieren semantische und syntaktische
Komponenten, um S¨
atze zu interpretieren. Dies tun sie in einem kontinuierlichen
Prozess.
Es existieren viele W¨
orter und S¨
atze, die mehrere Interpretationen zulassen, da
es sich entweder um ambige W¨
orter oder um ambige syntaktische Konstruk-
tionen handelt. Dabei unterscheidet man zwischen lokalen (vor¨
ubergehenden)
und globalen (anhaltenden) Ambiguit¨
aten. Die lokale Ambiguit¨
at bezieht
sich auf Zweideutigkeiten, die sich im Satzverlauf wieder aufl¨
osen. Bei der glo-
balen Ambiguit¨
at k¨
onnen fr¨
uhstens am Ende des Satzes die Zweideutigkeiten
wieder aufgel¨
ost werden (Garden-Path-Satz). Die Garden-Path-S¨
atze sind ein
38 KAPITEL 2. DISZIPLINEN
wichtiger Beleg, dass Menschen versuchen, einen Satz unmittelbar zu interpre-
tieren.
Es gibt aber auch feststehende Wortgruppen (Phrasen), die als Ganzes inter-
pretiert werden [PF79]. So beziehen sich z. B. Quantifizierer (weniger, alle
usw.) auf das nachfolgende Substantiv und tragen somit zu der semantischen
Interpretation des Substantivs bei und umgekehrt [H¨
o83, NC00]. Aber es gibt
auch viele Wortgruppen, die eine idiomatische Bedeutung haben, die sich nicht
unbedingt aus der Summierung der Einzelbedeutungen ergibt, wie z. B. blinder
Passagier.
Aber nicht nur aus einzelnen S¨
atzen werden semantische Informationen ge-
wonnen, sondern auch satz¨
ubergreifend. Die Schwierigkeit der Integration von
Informationen aus verschiedenen S¨
atzen h¨
angt zum Teil von der Struktur der
Botschaft ab, die von dem Sprecher ausgeht. [Wes94, S. 320] Das Verstehen
eines Textes geschieht dann besser, wenn die einzelnen S¨
atze im gleichen Kon-
text zueinander stehen. F¨
ur die Zusammensetzung von S¨
atzen existieren Regeln
der Kommunikation zwischen zwei Kommunikationspartnern (given-new con-
tract) [CH77]. Diesem Ansatz zufolge schließen Kommunikationspartner einen
Vertrag, neue Informationen so zu ¨
ubertragen, dass der Zuh¨
orer diese leicht in
sein Vorwissen integrieren kann. Dabei gibt es augenf¨
allige syntaktische Kon-
struktionen, die neue Begriffe einf¨
uhren oder sich aus dem Kontext ergeben. So
bezieht sich z. B. ein Personalpronomen auf die genannte Person oder den Ge-
genstand im Satz davor. Das implizite Wissen dieser Regeln ist ein wichtiger
Bestandteil unseres pragmatischen Wissens. [Wes94, S. 321]
Lexikalische Analyse. In der lexikalischen Analyse geht es um die Identifizie-
rung des semantischen Inhalts eines einzelnen Wortes in einem Text. Dies kann
nur durch eine Kombination von morphologischen, syntaktischen und seman-
tischen Analysen geschehen. Als Resultat werden Wissensinhalte ¨
uber W¨
orter
und ihre Bezeichnung generiert.
In Untersuchungen [Wes94] wurde festgestellt, dass die lexikalische Analyse ein
nicht-trivialer Prozess ist. So k¨
onnen bei W¨
ortern wie Fliege Mehrdeutigkeiten
im Verst¨
andnis des Wortes (lexikalische Ambiguit¨
at) auftreten. Es kann nicht
eindeutig gekl¨
art werden, wie Menschen diese Ambiguit¨
aten aufl¨
osen. Untersu-
chungen zeigen, dass die Disambiguisierung einerseits durch die Kontextinfor-
2.3. SPRACHVERSTEHEN 39
mationen und anderseits durch pers¨
onliche Pr¨
aferenzen der einzelnen Personen
beeinflusst wird. Welcher Einfluss in bestimmten Situationen bevorzugt wird,
kann nicht gekl¨
art werden.
Syntaktische Analyse. Der Mensch besitzt trotz seines endlichen menta-
len Verm¨
ogens ein riesiges Reservoir an sprachlichem Wissen, mit dem er ei-
ne unendliche Anzahl von S¨
atzen bilden und verstehen kann. Noam Chomsky
[Cho57, Cho67] versuchte dieses Ph¨
anomen zu ergr¨
unden und zu schematisieren.
Er stellte eine endliche Anzahl von Regeln auf, mit denen korrekte sprachliche
S¨
atze gebildet werden. Das beschriebene Regelsystem nannte er generative
Grammatik, auch als Phrasenstrukturgrammatik bekannt.
Bei der Phrasenstrukturgrammatik werden Satzbausteine (Konstituenten) hier-
archisch organisiert. Die Konstituenten spiegeln dabei die innere syntaktische
Struktur eines Satzes wider und werden nach bestimmten Regeln (Phrasen-
strukturregeln) zu einem Satz zusammengef¨
ugt. In der Abbildung 2.13 werden
anhand des Satzes
Ein Vektor ist ein Element eines linearen Raumes.,
folgende Phrasenstrukturregeln angewendet, um den Satz zu strukturieren:
Ein Satz (S) besteht aus einer Nominalphrase (NP) und Verbalphrase (VP):
S ::= NP VP
Eine Nominalphrase besteht aus einem Substantiv (N), oder einem Artikel
(DET) und einem Substantiv, oder aus einem Adjektiv (ADJ) und einem Sub-
stantiv, oder aus einem Artikel, einem Adjektiv und einem Substantiv.
NP ::= [DET] [ADJ] N
Eine Verbalphrase besteht aus einem Verb (V) und einer Nominalphrase.
VP ::= V NP
Die Analyse des obigen Satzes erfordert ebenfalls eine Rekursion der Nomi-
nalphrase. Aus einer Konstituente NP wird eine Folge abgeleitet, die dieselbe
Konstituente wieder enth¨
alt.
40 KAPITEL 2. DISZIPLINEN
NP ::= NP NP
Die Zerlegung l¨
asst sich graphisch durch einen Ableitungsbaum (Phrasenstruk-
turbaum) darstellen.
Satz
Ein Vektor
N
Nominalphrase Verbalphrase
Nominalphrase
DET V
ist
Nominalphrase
ADJ N
Nominalphrase
DET N DET
ein Element eines linearen Raumes
Abbildung 2.13: Phrasenstrukturbaum
[S[NP [DET Ein ] [NVektor ] ] [VP [Vist ] [NP [DET ein] [NElement ] ]
[NP [DETeines ] [ADJ linearen ] [NRaumes ] ] ] ]
Allerdings k¨
onnen viele Satzarten [Dud98] nicht allein durch die Phrasenstruk-
turgrammatik beschrieben werden. Dies wurde von Chomsky erkannt, und er
f¨
uhrte daher die Transformationsgrammatik ein. Durch Transformations-
regeln k¨
onnen in dieser Grammatik z. B. S¨
atze im Passiv in S¨
atze im Aktiv
umgewandelt werden, ohne den semantischen Inhalt zu verlieren. Der Aktivsatz
l¨
asst sich dann durch die bekannten Phrasenstrukturregeln analysieren. S¨
atze
besitzen daher in der Transformationsgrammatik mindestens zwei strukturelle
Ebenen:
1. Oberfl¨
achenstruktur: Die Struktur eines Satzes, wie er normalerweise
in Texten auftritt.
2.3. SPRACHVERSTEHEN 41
2. Tiefenstruktur: Abstrakte syntaktische Basis eines Satzes oder Satzbau-
steins, die alle notwendigen semantischen und syntaktischen Informationen
enth¨
alt (Konstituentenstruktur).
S
NP VP
N V N
Paul kennt Paula
Tansformationsregeln
Passiv Fragen
Paula wird von Paul gekannt. Kennt Paul Paula?
Abbildung 2.14: Transformationsregeln
Dies bedeutet f¨
ur die Anwendung, dass S¨
atze von ihrer Oberfl¨
achenstruktur in
die zugrundeliegende Tiefenstruktur transformiert werden. Es wird somit deut-
lich, dass die Sprache eine komplexe Struktur besitzt, die sich nicht ohne weiteres
durch ein einfaches Modell beschreiben l¨
asst. Daher muss ein mehrschichtiges
Modell verwendet werden, um die Sprache ad¨
aquat darzustellen.
Auch bei syntaktischen Analysen treten Mehrdeutigkeiten (syntaktische Am-
biguit¨
at) auf. Hierbei gibt es wiederum unterschiedliche Meinungen zur Disam-
biguisierung [Wes94]. Die Satzteilhypothese besagt, dass zuerst die syntakti-
sche Struktur eines Satzes analysiert und dann dessen semantische Bedeutung
determiniert wird. In diesem Fall m¨
ussen einer lesenden Person alle m¨
oglichen
syntaktischen Ambiguit¨
aten eines Satzes bekannt sein. Im anderen Fall wer-
den Kontextinformationen verwendet, um eine eindeutige syntaktische Struktur
auszuw¨
ahlen.
Eine lesende Person m¨
usste daher alle anderen M¨
oglichkeiten von syntaktischen
Strukturen nicht bewusst wahrnehmen. Untersuchungen zeigen, dass die Satz-
teilhypothese sehr fragw¨
urdig ist. Vermutlich ist die syntaktische Disambigui-
sierung ein kontinuierlicher und fortlaufender Prozess und beeinflusst alle Teile
eines Satzes und nicht nur gr¨
oßere syntaktische Einheiten.
42 KAPITEL 2. DISZIPLINEN
2.3.1 Psychologische Modelle zum Textverstehen
Mentale Modelle. Um einen Text zu verstehen, muss der Text in ein Modell
¨
uberf¨
uhrt werden, das in das bestehende Modell einer Person (Vorwissen, Welt-
modelle) eingeordnet werden kann. Nach Johnson-Laird [JL83, JL95, JL00] exis-
tiert neben einer mentalen Repr¨
asentation eines Textes eine nicht-sprachliche
Repr¨
asentation (mentales Modell). Dieses mentale Modell ist eine personifi-
zierte Repr¨
asentation der im Text beschriebenen Situation, die ¨
uber den reinen
Inhalt des Textes hinausgeht [RS99]. Somit enth¨
alt das mentale Modell Inferenz-
schl¨
usse, die durch die Interaktion zwischen der mentalen Repr¨
asentation des
Textes und dem Weltwissen der Person entstehen (Koh¨
arenzbildung). Dadurch
beschreibt das mentale Modell den Prozess des Verstehens von nat¨
urlichsprach-
lichen Texten.
Untersuchungen zu der Best¨
atigung dieses Modells k¨
onnen bei [GML87, GL92,
OG96] gefunden werden. Allerdings werden keine genaue Angaben gemacht, wie
dieses Modell im Gehirn repr¨
asentiert wird. Sie beschreiben nur den Prozess der
Inferenzbildung beim Sprachverstehen.
Textverstehen mit propositionalen Modellen. Im Gegensatz zu den
mentalen Modellen wurden die propositionalen Modelle ([Kin74, KvD83, Kin88,
Kin98]) direkt im Hinblick auf das Sprachverstehen entwickelt2. Es wird davon
ausgegangen, dass der Mensch im Verlauf des Verarbeitungsprozesses den Text
in einzelne Aussagen (Propositionen) zerlegt. Diese Propositionen werden ex-
trahiert und miteinander in Relation (temporale, konditionale Relationen usw.)
gestellt (Textbasis) (Kapitel 2.2). Des Weiteren existiert eine erwartete seman-
tische Repr¨
asentation des Lesers gegen¨
uber dem gelesenen Text (Situationsmo-
dell) [Kin88]. Auf Grundlage dieser beiden Modelle, Textbasis und Situations-
modell, wird eine mentale Textrepr¨
asentation gebildet, die den Text interpre-
tiert. Untersuchungen zu diesem Modell k¨
onnen bei [KK73, WMF95] gefunden
werden.
Allerdings k¨
onnen dadurch keine semantischen oder syntaktischen Mehrdeu-
tigkeiten aufgel¨
ost werden. Dazu ist immer eine semantische Analyse notwen-
dig. Ebenfalls beschreiben propositionale Modelle nicht, dass das Textverstehen
2Sie wurden auf Grundlage der generativen Grammatik von Chomsky ¨
uber den case-
grammar-Ansatz von Fillmore (1968) entwickelt.
2.3. SPRACHVERSTEHEN 43
ein dynamischer Prozess ist, in dem fortlaufend Inhalte umgearbeitet werden
m¨
ussen.
Textverstehen mit interaktiven Modellen Bei den interaktiven Modellen
wird davon ausgegangen, dass der Leser eines Textes ¨
uber bestimmte Situa-
tionen Modelle speichert. Diese Modelle beinhalten Hintergrundwissen und die
Erwartungen zum Informationsgehalt des Textes. Beide Modelle stehen mitein-
ander in Wechselwirkung. Aus dieser grundlegenden Betrachtungsweise entstan-
den z. B. die Skripttheorie von Schank und Abelson [AS77] und die konnektio-
nistischen Modelle [WP85].
Die mentalen und propositionalen Modelle sind zwei entgegengesetzte Darstel-
lungen der g¨
angigen Modelle [Sch93, RS99]. Tats¨
achlich gehen die meisten For-
scher davon aus, dass im Prozess der Sprachverarbeitung verschiedene Repr¨
asen-
tationen aufgebaut werden, die nebeneinander existieren [GMZ97, RSS02].
44 KAPITEL 2. DISZIPLINEN
2.4 Computerlinguistik
Er hat mit menschlichen Z¨
ugen ¨
uberrascht.
(G. Kasparow (*1963), aserbeidschanischer Schachspieler,
nachdem er gegen den Schachcomputer Deep Blue verloren hatte, 2002)
Die Linguistik ist die Wissenschaft, die sich mit der Struktur und dem Funktio-
nieren der Sprache befasst [Bro03, S. 536]. Linguisten betrachten zwei grundle-
gende Konzepte der Sprache, die Produktivit¨
at und die Regelhaftigkeit [And01].
Die Produktivit¨
at beschreibt die vielf¨
altigen Konstruktionen, mit denen aus
W¨
ortern S¨
atze gebildet werden k¨
onnen. Die Regelhaftigkeit schr¨
ankt die Pro-
duktivit¨
at ein, indem sie nur eine endliche Anzahl von Wortkombinationen
zul¨
asst. Diese Regelhaftigkeit einer Sprache wird durch ihr Regelsystem aus-
gedr¨
uckt, das als Grammatik bezeichnet wird. Die Grammatik unterteilt sich
in die Teilgebiete Phonologie,Syntax,Semantik und Morphologie (siehe Abbil-
dung 2.15).
Phonologie Syntax
Morphologie Semantik
Abbildung 2.15: Bausteine der Grammatik
Die Phonologie untersucht die Funktionen der einzelnen Laute und Lautgrup-
pen. Die Beziehungen der sprachlichen Elemente im Satz werden durch die Syn-
tax beschrieben. Mit der Vermittlung der Bedeutung der einzelnen Textbaustei-
ne befasst sich die Semantik. Die Morphologie beschreibt die Formver¨
anderung
der W¨
orter durch Deklination und Konjugation.
Nach Anderson [And01] ist es ein Ziel der Linguisten, ein Regelsystem [Gram-
matik] zu erstellen, das die strukturellen Regelhaftigkeiten einer Sprache er-
fasst. [And01, S. 356]
2.4. COMPUTERLINGUISTIK 45
2.4.1 Morphologie
Die Morphologie (Formenlehre) untersucht die systematischen Beziehungen
zwischen W¨
ortern und Wortformen bzw. Regeln, nach denen W¨
orter bzw. Wort-
formen gebildet werden [CEE+01, S. 175]. Die Ergebnisse aus der morphologi-
schen Analyse werden auch f¨
ur die syntaktische Analyse verwendet, so dass die
Morphologie einen wichtigen Beitrag zum gesamten Prozess des Sprachverste-
hens (Kapitel 2.3) liefert.
Das Wort (Lexem) bildet eine selbstst¨
andige lexikalische abstrakte Einheit, aus
der sich verschiedene Wortformen ableiten lassen. Die Menge aller Wortformen
wird als Paradigma bezeichnet. Diese Wortformen werden aus dem zu betrach-
tenden Wort durch folgende Transformationen gebildet [Hau00]:
1. Flexionsmorphologie:Die Bildung von W¨
ortern durch systematische Va-
riationen, durch die sich ein Wort an die verschiedenen syntaktischen
Umgebungen (Numerus, Person, Kasus, Tempus, Genus, Komparation,
Modus) anpasst.
Buch: Buch es, Buch e, B[¨
u]ch er, ...
2. Wortbildungsprozess:
Komposition:Die Bildung eines neuen Wortes durch die Zusammen-
setzung von W¨
ortern.
Eisen T¨
ur3,Eintag(s) Fliege 4
Derivation:Die Bildung eines neuen Wortes auf Basis eines einzel-
nen Lexems mit Hilfe eines Affixes (Suffixes und/oder Pr¨
afixes).
Zwerg: Zwerg lein, zwergenhaft, zwergenartig , ...
Morpheme sind die kleinsten bedeutungstragenden (grammatischen) Einheiten,
die in endlicher Anzahl in einer Sprache auftreten. Zu einem Morphem existieren
Allomorphe.So wie S¨
atze genau genommen aus Wortformen (und nicht aus
W¨
ortern) bestehen, so bestehen Wortformen genau genommen aus Allomorphen
3Nominalkompositionen machen 2/3 des dt. Wortschatzes aus [Dud98]
4Fugenlaut
46 KAPITEL 2. DISZIPLINEN
(und nicht aus Morphemen) [Hau00, S. 271]. Die Grundformen (Wurzeln) bil-
den die Grundlage f¨
ur die Derivation und Flexion. Die peripheren Morpheme
sind die Affixe.
Beispiel 2.4.1
buchMorphem ={buch, b¨
uch}Allomorphe
Morphologische Analyse. Eine zentrale Aufgabe der morphologischen Ana-
lyse besteht darin, die kleinsten sprachlichen Einheiten mit Bedeutung, die
Morpheme, zu ermitteln und ihre strukturellen Eigenschaften als Bausteine von
W¨
ortern zu beschreiben (strukturalistische Linguistik) [fLuLdUB04].
Die strukturalistische Linguistik zerlegt nicht nur die linguistische Analyse in
ihre Bestandteile Semantik, Syntax und Morphologie sondern stellt auch
Verfahren bereit, W¨
orter zu zerlegen. Dadurch k¨
onnen relevante Anteile von
W¨
ortern separiert und identifiziert werden. Daraus ergeben sich zwei Analyse-
schritte: Segmentierung und Klassifizierung [fLuLdUB04].
Aus der generativen Morphologie, die ebenfalls aus dem Strukturalismus her-
vorgeht, k¨
onnen weitere morphologische Analyseformen erschlossen werden. Die
Beschreibungsmethoden werden dabei stark durch die syntaktische Analyse ge-
pr¨
agt. Nach Spencer [SZ98] werden drei Ans¨
atze unterschieden:
1. Morphembasierter Ansatz:
Kombination von Morphemen zu einem Wort
Liste aller Morpheme
morphologische Regeln
sämtliche möglichen Wörter
Abbildung 2.16: Morphembasierter Ansatz
2.4. COMPUTERLINGUISTIK 47
2. Wortbasierter Ansatz:
Kombination von Grundmorphemen mit Affixen zu einem Wort
Wort
Wort Affix
keit
Grundmorphem
Grundmorphem Affix
feucht ig
Abbildung 2.17: Wortbasierter Ansatz
3. Realisierungsbasierter Ansatz:
Kombination von Allomorphen zu einem Wort
Realisierung. Anhand der Ans¨
atze von Spencer k¨
onnen verschiedene mor-
phologische Analysen auf dem Computer realisiert werden. Hierf¨
ur bieten sich
endliche Automaten an, die f¨
ur die morphologische Analyse durch die Finite-
State Transducer realisiert werden.
Definition 2.4.1 (Endlicher Automat)
Ein endlicher Automat wird durch ein 5-Tupel M= (Z, Σ, δ, S, F)dargestellt,
wobei
1. Z: endliche, nicht-leere Menge von m¨
oglichen Zust¨
anden,
2. Σ: endliches, nicht-leeres Eingabealphabet,
3. δ:Z×Σ Z(¨
Uberf¨
uhrungsfunktionen),
4. SZ: Anfangszustand,
5. FZ: Menge der Endzust¨
ande
bezeichnen. [Hed02, S. 57]
48 KAPITEL 2. DISZIPLINEN
Ein Alphabet Σ ist eine nicht-leere, endliche Menge. Elemente eines Alphabets
heißen Zeichen (Symbole, Buchstaben). Die n-Tupel (x1,...,xn) von Zeichen
xiΣ heißen Wort ¨
uber dem Alphabet Σ. Die Menge aller W¨
orter ¨
uber einem
Alphabet Σ heißt Σ. Die leere Folge (L¨
ange 0) wird mit bezeichnet und heißt
leeres Wort. Σ+ist die Menge aller nicht-leeren W¨
orter ¨
uber den Alphabet:
Σ+:= Σ\ {}. Die einfachste Operation auf W¨
ortern ist die Konkatenation
(Verkettung) : Σ×ΣΣmit xy=x1,...,xm, y1,...,ynmit x, y Σ
012
"Hund"
"e"
"es"
"en"
Start
Abbildung 2.18: Darstellung eines endlichen Automaten
Das Zustandsdiagramm dieses endlichen Automaten ist ein gerichteter Graph
mit
1. Knoten entsprechen den Zust¨
anden (0, 1 und 2).
2. Jedes Paar (q, a)Z×Σ, f¨
ur das δdefiniert ist, entspricht einer gerich-
teten Kante von qnach q0:= δ(q, a) (δ(0,Hund) = 1, δ(1,e) = 2,
δ(1,es) = 2, δ(1,en) = 2).
3. Anfangszustand (0).
4. Endzustand (2).
Endliche Automaten sind sehr einfache Maschinenmodelle, die z. B. ein Wort
morphemweise abarbeiten. Nur wenn das Wort korrekt ist, erreicht der endliche
Automat seinen Endzustand.
Ein Finite-State Transducer ist ein endlicher Automat, der gleichzeitig zwei
Symbole (allgemein: nSymbole) bearbeitet und in entsprechende Zust¨
ande
¨
ubergeht.
Definition 2.4.2 (Finite-State Transducer (FST))
Ein Finite-State Transducer ist ein (deterministischer) endlicher Automat M=
(Z, Σ, δ, S, E)mit ΣX1×X25.
2.4. COMPUTERLINGUISTIK 49
012
Start "es":gen
"en":pl
"e":dat
"Hund"
Abbildung 2.19: Darstellung eines Finite-State Transducer
Finite-State Transducer verarbeiten also geordnete Paare von Symbolen aus
zwei verschiedenen Alphabeten. Somit existiert die M¨
oglichkeit, ein Wort in
verschiedene Wortformen zu transformieren. Es ist aber auch m¨
oglich, den um-
gekehrten Weg zu betrachten, indem man das zu untersuchende Wort in seine
Bestandteile zerlegt.
Ein Modell, das die Morphologie mit Finite-State Transducern beschreibt, ist
die Zwei-Ebenen Morphologie [Kos83]. Die Zwei-Ebenen Morphologie besteht
aus zwei Ebenen der Analyse: Oberfl¨
achenebene und lexikalische Ebene. Die
Oberfl¨
achenebene enth¨
alt die Wortformen, die in einem Text vorkommen. Die
lexikalische Ebene enth¨
alt die morphologischen Informationen. Wie diese auf-
gebaut sind Nennform, Morpheme usw. ist nicht vorgeschrieben. Die Zwei-
Ebenenregeln konstruieren Abbildungen zwischen den Ebenen, die durch Finite-
State Transducer beschrieben werden. Somit besteht das System aus einem Le-
xikon und einem Regelsystem.
Eingabe: Oberfl¨
ache Ausgabe: lexikalische Ebene
Hunde 7→ Hund + Plural + Maskulin + Nominativ
Eine weitere morphologische Analysemethode ist die vererbungsbasierte Re-
pr¨
asentationssprache DATR [EG96]. Diese speichert morphologische Informa-
tionen in einer Graphenstruktur. Knoten entsprechen W¨
ortern in Nennform.
Der Pfad ist durch morphosyntaktische Informationen <form, pr¨
as, sg>: 1.
Person Singular Pr¨
asens gegeben. Der Wert des Pfades entspricht dann der
Wortform. Die Pfade bilden grundlegende Regeln, mit denen ¨
uber Inferenzen
weitere Wortformen gebildet werden k¨
onnen.
5X1, X2sind Alphabete
50 KAPITEL 2. DISZIPLINEN
Beispiel 2.4.2
WATEN:
<form>== <wurzel> < endung >
<wurzel>== wat
<endung pr¨
as sg eins >== e
<endung pr¨
as pl zwei >== et
[CEE+01, S. 191]
Beim Wortklassentagging werden allen W¨
ortern eines Textes Tags zugeordnet.
Tags enthalten morphosyntaktische Informationen. Beim Tagging sollen For-
men im Kontext morphosyntaktisch disambiguiert, d. h. mit der im Kontext in-
tendierten Beschreibung versehen werden. [GRS00, S. 678]
Ein Methode f¨
ur das Wortklassentagging ist das regelbasierte Tagging. Dabei
wird ein Regelsystem aus einem vorgegebenen Textkorpus erstellt. Diese einfa-
chen Regeln werden direkt auf einen Text angewendet. Der Vorteil dieser Me-
thode ist die einfache Erweiterbarkeit des Regelsystems. Allerdings m¨
ussen diese
Regeln von Hand erstellt werden. Die Betrachtung von neuen Dom¨
anen f¨
uhrt
meistens zu einer Neubildung des Regelsystems.
Ein weiteres Verfahren ist das statistische Tagging (z. B. Brill-Tagging [Bri92,
Bri94]). Bei diesem Lernverfahren werden aus bereits getaggten W¨
ortern auto-
matisch Regeln abgeleitet.
2.4.2 Syntax
Die Morphologie (Kapitel 2.4.1) beschr¨
ankt sich auf die Analyse der einzelnen
W¨
orter. Die Syntax nutzt die morphologische Analyse und macht Voraussagen
dar¨
uber, ob die S¨
atze einer Sprache grammatikalisch korrekte Formen besit-
zen oder welche Aneinanderreihungen von W¨
ortern und Satzzeichen syntaktisch
korrekte S¨
atze ergeben. Demnach besch¨
aftigt sie sich also mit dem Bau von
Wortgruppen und S¨
atzen [Dud98, S. 609].
Definition 2.4.3 (Satz)
S¨
atze sind sprachliche Einheiten, die relativ selbstst¨
andig und abgeschlossen
sind. Sie bauen sich aus kleineren sprachlichen Einheiten auf, die ihrerseits auch
2.4. COMPUTERLINGUISTIK 51
schon einen gewissen Selbstst¨
andigkeitsgrad haben, aus W¨
ortern und geglieder-
ten Wortgruppen; und sie erscheinen normalerweise in gr¨
oßeren selbstst¨
andigen
und abgeschlossenen sprachlichen Einheiten. [Dud98, S. 609]
In der Einleitung wurde besprochen, dass die Regelhaftigkeit die Anzahl der
m¨
oglichen Kombinationen einschr¨
ankt und somit nur eine endliche Kombination
von Wortkombinationen zu S¨
atzen f¨
uhrt. So gibt es z. B. nach Helbig [HB01, S.
445] endlich viele morphologisch-syntaktische Satzstellungsglieder:
1. Verbkonstruktionen: Finites Verb (Ich gehe.), Infinitiv des Verbs (Ich
werde gehen.), Partizip des Verbs (Ich bin gegangen.), Pr¨
aposition und
Verb (Alle hielten die Regel f¨
ur gelungen.)
2. Substantivkonstruktionen: Nominativ des Substantivs,Akkusativ des
Substantivs,Dativ des Substantivs,Genitiv des Substantivs,Pr¨
apositi-
on und Substantiv (Die Mutter wartet vor der Schule.)
3. Adjektivkonstruktionen: Adjektiv,Adjektiv und Pr¨
aposition (Der Pro-
fessor h¨
alt das Thema f¨
ur interessant.)
4. Adverbkonstruktionen: Adverb (Es sitzt dort.), Pr¨
aposition und Adverb
(Sie kommt von dort.)
Es gilt, solche syntaktischen Strukturen zu erkennen und zu schematisieren,
damit sie computergerecht nutzbar gemacht werden k¨
onnen. Ziel der Linguisten
ist es daher, Theorien zur Beschreibung von Gesetzm¨
aßigkeiten zu finden, die
die Syntax einer Sprache m¨
oglichst vollst¨
andig beschreiben k¨
onnen.
Syntaktische Analyse. Die syntaktische Analyse stellt methodische Prinzi-
pien bereit, um syntaktische Strukturen menschlicher Sprache zu erfassen. Nach
Carstensen [CEE+01] werden syntaktische Strukturen unter zwei Gesichtspunk-
ten betrachtet:
Dependenzsyntax
Konstituentenstruktursyntax
52 KAPITEL 2. DISZIPLINEN
Bei der Dependenzsyntax werden syntaktische Strukturen als Relationen zwi-
schen W¨
ortern betrachtet. Das Verb nimmt dabei eine Schl¨
usselposition ein, da
alle anderen W¨
orter im Satz vom ihm abh¨
angen. Die grammatikalischen Ur-
sachen liegen in der Valenz der Verben. Die Valenz beschreibt, ob Verben im
Satz erg¨
anzungslos gebraucht werden oder nicht. Je nach Art der Erg¨
anzungen
werden bestimmte Valenzklassen unterschieden (Akkusativobjekt, Dativobjekt
usw.). Inhaltlich beschreiben Verben T¨
atigkeiten, Zust¨
ande u. ¨
a. Dies beeinflusst
die Angaben von Personen und Dingen.
Aus den beschriebenen Betrachtungen leitet sich dann die Dependenzgrammatik
ab.
wieder
kamen
ihrem
Wohnungen
zu suchenSperlinge
die
altem
Als sie nun in ihren altem Glanze da stand, kamen die Sperlinge wieder, ihre alte Wohnung zu suchen.
stand
im Glanzesie nun da
altenihrem
"als"
Einleitewort: Konnektor
Abbildung 2.20: Dependenzgrammatik [CEE+01, S. 204]
Die Konstituentenstruktursyntax nimmt dagegen an, dass neben den W¨
ortern
noch weitere komplexere Strukturen existieren. Diese komplexen Strukturen
werden als Phrasen bzw. Konstituenten bezeichnet. Konstituenten lassen sich
dann wieder in einzelne W¨
orter zerlegen.
Konstituentenstrukturen sind schon im Kapitel 2.3 in der syntaktischen Ana-
lyse betrachtet worden (generative Grammatiken) [Cho57, Cho67]. Generati-
ve Grammatiken spiegeln den hierarchischen Konstituentenaufbau wider. Jede
Konstituente geh¨
ort zu einer syntaktischen Kategorie, die in einer bestimmten
Reihenfolge zusammengesetzt wird. Konstituenten sind: Nominalphrase (NP),
Verbalphrase (VP), Pr¨
apositionalphrase (PP) und Adjektivphrase (AP). Die
zugeh¨
origen Kategorien setzen sich zusammen aus:
2.4. COMPUTERLINGUISTIK 53
Satz: S: NP VP
Nominalphrase: NP: (Artikel) + (Adjektiv)
NP: Pronomen
Verbalphrase: VP: Verb + NP
VP: Verb + PP
Pr¨
apositionalphrase: PP: Pr¨
aposition + NP
Verb: V: Hilfsverb + Verb
Die Abbildung der Phrasen in die Kategorien bezeichnet man als Phrasenstruk-
turregel und die Abbildung der Kategorien (Substantiv, Verb usw.) auf termi-
nale W¨
orter heißt lexikalische bzw. terminale Regel. Probleme bei der syntak-
tischen Analyse treten durch strukturelle Ambiguit¨
aten auf. So kann z. B. ein
Nebensatz so eingebunden sein, dass es schwer ist, eine eindeutige Interpretation
zu erhalten.
Realisierung. F¨
ur die Analyse von Sprachen ist die Theorie der formalen
Sprache unerl¨
asslich und somit werden Sprachen ¨
uber ihre Grammatik beschrie-
ben. Eine formale Sprache L¨
uber einem Alphabet Σ ist eine beliebige Teilmenge
von Σ.
Definition 2.4.4 (Grammatik)
Eine Grammatik ist ein Quadrupel G= N,ΣT, S, R)bestehend aus:
1. ΣN,ΣT: endliche, nicht-leere Mengen mit ΣNΣT=mit ΣNnicht-
terminale Symbole und ΣTterminale Symbole;
2. R: endliche Menge von Erzeugungsregeln (Grammatikregeln, Produkti-
onsregeln) der Form αβmit αTΣN)+und βTΣN);
3. einem Startsymbol SΣN.
(nach [Hed02, S. 29])
Grammatikregeln beschreiben die Struktur der W¨
orter einer Sprache. Ausge-
hend von der Satzstruktur werden durch die Regeln die Strukturen immer wei-
ter verfeinert bis terminale Symbole entstehen. Die Zwischenstrukturen heißen
dann grammatikalische Kategorien ΣN.
54 KAPITEL 2. DISZIPLINEN
x = aB Aaa ab Aaa = y
bA Bab
bA Bab
Abbildung 2.21: Beispiel aus [Hed02, S. 32]
Nach Chomsky existieren verschiedene Typen von Grammatiken (Chomsky-
Hierarchie). Es werden im Rahmen dieser Arbeit nur kontextfreie Grammatiken
betrachtet, die sich dadurch auszeichnen, dass sie effiziente Parsingalgorithmen
erm¨
oglichen.
Definition 2.4.5 (Kontextfreie Grammatik)
Eine Grammatik G= N,ΣT, S, R)heißt kontextfrei (oder auch Typ-2), falls
alle Grammatikregeln von der Form A αmit AΣ+
Nund αNΣT)+
sind. [CEE+01, S. 72]
Ein graphisches Beispiel wird gegeben durch den Ableitungsbaum in Abbildung
2.22.
S
VP
die
NP
DET N V NP
DET N
der Hund sieht Katze
Abbildung 2.22: Ableitungsbaum
G=<{S, NP, VP, DET, N, V },{der,Hund,bellt,die,Katze }, S, R >
R={SNP VP, NP DET N, VP V NP, DET der,
DET die, N Hund, N Katze, V sieht }
2.4. COMPUTERLINGUISTIK 55
Die Wurzel des Baumgraphen ist mit dem Startsymbol S (f¨
ur Satz) etiket-
tiert. Der Satz besteht aus zwei Teilstrukturen, der Nominalphrase (NP) ’der
Hund’ und der Verbalphrase (VP) ’sieht die Katze’. Die NP ’der Hund’ besteht
aus dem Determinierer (DET) ’der’ und dem Nomen (N) ’Hund’. Die VP be-
steht aus dem Verb (V) ’sieht’ und der NP ’die Katze’, die dieselbe interne
Struktur aufweist wie die Subjekts-NP. [CEE+01, S. 207]. Allerdings werden
durch die Verwendung von kontextfreien Grammatiken viele grammatikalisch
inkorrekte Konstruktionen zugelassen. Deshalb werden grammatikalischen Ka-
tegorien (Phrasen) etwas erweitert bzw. differenziert hinsichtlich des Tempus,
Kasus usw. (z. B. Genusinformationen: Nmaskulin,Nfeminin und Nneutrum ) und so-
mit entstehen auch neue Regeln. Das Problem ist hierbei allerdings, dass die
Regelmenge exponentiell anw¨
achst.
Ein Prototyp f¨
ur kontextfreie Grammatiken ist der ATN-Formalismus (aug-
mented transition network) [Woo80]. Hierbei handelt es sich um ein rekursives
Transitionsnetzwerk (RTN), das aus mehreren Teilnetzen besteht. Die Teilnet-
ze verk¨
orpern sowohl terminale (z. B. Nomen und Adjektive) als auch nicht-
terminale Anteile (z. B. NP und VP).
Der constraintbasierte bzw. unifikationsbasierte Ansatz basiert auf Merk-
malsstrukturen. Dadurch werden komplexe Objekte durch mehrere Eigenschaf-
ten charakterisiert6.
Akkusativ
Singular
Maskulin
Numerus
Genus
Kasus
ARG
KAT
KAT
Nomen
Nomen
ARG Numerus
Genus
Kasus
Singular
Maskulin
Akkusativ
Abbildung 2.23: Merkmalsstruktur
Zu den prominentesten Vertretern dieses Ansatzes geh¨
oren die Generalized
Phrase Structure Grammar (GPSG) [GKPS85], die Lexical Functional Gram-
mar (LFG) [Bre82], Parsing and Translation [Shi86] sowie die Head Driven
Phrase Structure Grammar (HPSG) [PS94].
6Auch Chomsky verwendet schon Merkmalsstrukturen um Verben zu subkategorisieren.
56 KAPITEL 2. DISZIPLINEN
Die GPSG-Grammatik verwendet verschiedene Restriktions- und Regelfor-
mate. Es gibt ID-Regeln und LP-Statements. Die ID-Regeln ¨
ahneln den tra-
ditionellen Phrasenstrukturregeln, jedoch ist die Reihenfolge der W¨
orter nicht
festgelegt. So ist sowohl NP DET N als auch NP N DET m¨
oglich.
Erst durch die Anwendung eines LP-Statement DET < N wird die Reihenfol-
ge festgelegt. Die grammatikalischen Kategorien bestehen aus Merkmalsstruk-
turen. Die Werte von Merkmalen sind atomar. Hauptkategorien sind Verben,
Substantive, Adjektive und Pronomen; Nebenkategorien sind Konjunktionen,
Interjektionen und Gradpartikel. Die vier Hauptkategorien k¨
onnen den Kopf ei-
ner Phrase bilden. Bei der HPSG wird zus¨
atzlich davon ausgegangen, dass der
Kopf einer Phrase ein wichtiges Element ist. So ist der Kopf der Verbalphrase
das Verb. In der HPSG gibt es daf¨
ur keine Phrasenstrukturregeln mehr, sondern
allgemeine hierarchisch organisierte lexikalische Strukturen [CEE+01, S. 216].
Die lexikalisch-funktionale Grammatik ist ein Gegenmodell zu Chomskys
Standardtheorie der generativen Grammatik. Hierbei werden jeder grammati-
kalischen Beschreibung eines Satzes zwei Strukturen zugeordnet: die Konsti-
tuentenstruktur (C-Struktur) und die funktionale Struktur (F-Struktur). Die
C-Struktur wird durch Phrasenstrukturregeln erzeugt. Diese Strukturen wer-
den dann auf die F-Struktur abgebildet, die die grammatikalischen Funktionen
(z. B. Subjekt) als Merkmale repr¨
asentiert.
Eine wichtige Eigenschaft der LFG ist, dass grammatikalische Strukturen nicht
mehr durch syntaktische Regeln, sondern durch lexikalische Regeln bestimmt
werden.
Das Parsing and Translation (PATRII) ist der einfachste unifikationsba-
sierte Grammatikformalismus. PATRII besteht aus zwei Komponenten: einem
Lexikon und einen Regelsystem. Die Regeln bestehen aus kontextfreien Phra-
senstrukturregeln und einer Menge von Pfadgleichungen, die den kontextfreien
Regeln Restriktionen auferlegen. Dabei werden die syntaktischen Kategorien
durch Merkmalsstrukturen repr¨
asentiert.
Beispiel 2.4.3 (PATRII)
Aus dem Satz Der Hund bellt die Katze an. kann die Nominalphrase der
Hund mittels der Regel NP DET N zerlegt werden. In PATRII kann diese
Regel beschrieben werden durch:
X0X1X2
2.4. COMPUTERLINGUISTIK 57
mit den Pfadgleichungen:
R=
< X0CAT >=NP
< X1CAT >=DET
< X2CAT >=N
wobei CAT die Bezeichnung f¨
ur eine Kategorie ist (Abbildung 2.24).
In diesem Beispiel enthalten die Argumente ARG die Genus- und die Numerus-
Informationen. Es existiert die zus¨
atzliche Regel < X1ARG>=< X2ARG >
(Abbildung 2.24). Durch den Vergleich der Argumente der Merkmalsstrukturen
des Artikels (DET) und des Substantivs (N) wird bei ¨
Ubereinstimmung der
Argumente (Unifikation) angenommen, dass der Artikel zusammen mit dem
Substantiv verwendet werden kann.
CAT
ARG Numerus
Genus
Kasus
Singular
Maskulin
Nominativ
CAT
ARG Numerus
Genus
Kasus
Singular
Maskulin
Nominativ
Hundder
Determinator Substantiv
Unifikation
Abbildung 2.24: Beispiel Unifikation
In der probabilistischen kontextfreien Grammatik enth¨
alt jede Regel als
zus¨
atzliches Element eine Wahrscheinlichkeit.
Beispiel 2.4.4
Ein Satz muss immer aus einer Verbalphrase und einer Nominalphrase bestehen
und somit besitzt diese Regeln den Wahrscheinlichkeitswert 1. Eine Nominal-
phrase kann auf verschiedene Weise zerlegt werden, die Wahrscheinlichkeit, dass
die Zerlegung in Artikel und Substantiv erfolgt, ist 0.65 [CEE+01]
S V P NP 1
NP DET N 0,65
58 KAPITEL 2. DISZIPLINEN
Quellcode
Token
Ableitungsbaum
Ziel
semantische Analyse
syntaktische Analyse
lexikalische Analyse
PARSER
Abbildung 2.25: Parsing f¨
ur eine computerlinguistische Analyse
Die Wahrscheinlichkeit einer Ableitung relativ zu einer gegebenen Kette von ter-
minalen Symbolen wird als Produkt der Einzelwahrscheinlichkeiten aller Regeln
definiert, die in der Ableitung vorkommen.
Parsing. Da im Rahmen dieser Arbeit kontextfreie Grammatiken verwendet
werden, k¨
onnen Parsingformalismen f¨
ur diese Grammatiken verwendet werden.
Als Ergebnis des Parsens entsteht ein Ableitungsbaum, der dann durch die se-
mantische Analyse den Zielcode generiert.
Bei der Konstruktion solcher B¨
aume k¨
onnen Mehrdeutigkeiten auftreten. Eine
kontextfreie Grammatik Gheißt mehrdeutig, falls es ein Wort in der durch G
generierten Sprache Lgibt, das mindestens zwei verschiedene Ableitungsb¨
aume
hat. Beim Aufbau eines Ableitungsbaums durch den Parser gibt es verschiedene
Strategien. Nach [CEE+01, S. 225] existieren folgende M¨
oglichkeiten:
1. Verarbeitungsrichtung: Links-Rechts-Verarbeitung, Head-Corner Parsing
2. Analyserichtung: Top-down-Verarbeitung, Bottom-up-Verarbeitung
3. Suchstrategie: Tiefensuche, Breitensuche
Die Entwicklung von Parsingalgorithmen f¨
ur nat¨
urliche Sprache ist nicht ein-
fach, da komplexe Strukturen erkannt werden m¨
ussen und außerdem Ambi-
guit¨
aten auftreten k¨
onnen. Oft reichen daf¨
ur sequentielle Verfahren, bei denen
2.4. COMPUTERLINGUISTIK 59
die einzelnen Schritte getrennt und nacheinander ausgef¨
uhrt werden, nicht mehr
aus, und es ist n¨
otig, auf integrative Verfahren zur¨
uckzugreifen, in denen die
Schritte nebeneinander ausgef¨
uhrt werden und sich gegenseitig beeinflussen.
2.4.3 Semantik
Die Semantik ist eine grammatikalische Komponente, die sich mit der inhaltli-
chen Bedeutung von Sprachbausteinen besch¨
aftigt. Eine formale Definition ist
schwierig, da nicht eindeutig zu kl¨
aren ist, was eigentlich die Bedeutung eines
Wortes, Satzes oder Textes ist.
In den logischen Sprachen ist der Begriff Semantik eindeutig definiert. So ist die
Semantik in der Aussagenlogik gegeben durch eine Funktion, die jeder Aussage
die Werte wahr oder falsch zuordnet (Kapitel 3.2.2).
So ist die Aussage xywahr, wenn xund ywahr sind, aber in allen anderen
F¨
allen falsch. Die Semantik definiert also Regeln, wie die Wahrheitswerte einer
Aussage im Hinblick auf ein zu betrachtendes Modell ermittelt werden.
Ziel einer semantischen Theorie ist eine Analyse derjenigen Prozesse, die es
einem Rezipienten einer ¨
Außerung erm¨
oglichen, die Ideen und Gedanken hinter
diesen ¨
Außerungen zu verstehen [CEE+01, S. 246].
Zur Vereinfachung der semantischen Analyse werden verschiedene Semantikar-
ten nach ihren Anwendungsgebieten unterschieden. Die lexikalische Seman-
tik (Wortsemantik) besch¨
aftigt sich mit dem Bedeutungsinhalt der einzelnen
W¨
orter. Die Satzsemantik behandelt den Bedeutungsinhalt eines Satzes. Der
Bedeutungsinhalt eines ganzen Textes wird durch die Diskurssemantik be-
schrieben.
Semantische Analyse. Die semantische Analyse ist zweifellos die wichtigste,
aber auch schwierigste Analyse, die beim Textverstehen durchgef¨
uhrt werden
muss. Sie st¨
utzt sich bei der Ermittlung semantischer Informationen auf die
vorhergehenden morphologischen und syntaktischen Analysen.
Grundlage f¨
ur die Analyse des semantischen Inhalts der Sprache ist das Kom-
positionalit¨
atsprinzip von G. Frege:
60 KAPITEL 2. DISZIPLINEN
Die Bedeutung eines komplexen Ausdrucks ist eine Funktion
der Bedeutungen seiner Teile und der Art ihrer Kombination.
[CEE+01, S. 248]
Durch das Kompositionalit¨
atsprinzip besteht die M¨
oglichkeit, die durch die syn-
taktische Analyse entstandenen syntaktischen Einheiten (Phrasen und W¨
orter)
semantischen Komponenten zuzuordnen. Aus der Interpretation der einzelnen
Komponenten wird eine Gesamtinterpretation des semantischen Inhaltes kon-
struiert.
Menge
M
Zuordnungs−
algorithmus
syntaktische
Analyse
S
NP VP
NP = Namen
VP = Tätigkeiten
semantisches Netz
semantische Interpretation
Text
Abbildung 2.26: Grundlegendes Prinzip einer semantischen Analyse
Die formalen Semantiken, die auf logikbasierten Formalismen operieren, ver-
wenden das Kompositionalit¨
atsprinzip. Dabei wird nicht nur die Pr¨
adikatenlo-
gik verwendet, sondern auch Typenlogik, intensionale Logik, Modallogik usw.
Dadurch k¨
onnen auch Erkl¨
arungs- und Folgerungsbeziehungen (Inferenzmecha-
nismen) angewendet werden. Formale Logiken werden genutzt, um nat¨
urlich-
sprachliche Texte zu analysieren, da sie schematisierbar sind und somit einen
informationstechnischen Zugang erm¨
oglichen.
Nach Pinkal [GRS00, S. 740] muss eine semantische Analyse folgende elementa-
ren Aufgaben erf¨
ullen:
1. Semantikkonstruktion: Erstellung von semantischen Informationen auf
Grundlage syntaktischer und morphologischer Informationen;
2.4. COMPUTERLINGUISTIK 61
2. Semantische Resolution: Ermittlung von Disambiguisierungen und Kon-
textinformationen aus dem Text;
3. Semantische Auswertung: Extraktion von relevanten semantischen Infor-
mationen mit Hilfe von Deduktions- und Inferenzmechanismen;
Realisierung. Voraussetzung f¨
ur eine semantische Analyse ist ein semanti-
scher Formalismus, der informationstechnisch realisiert werden kann. Formale
Logiken erf¨
ullen diese Voraussetzung. Es stellt sich die Frage, welche Logiken
sprachliche Oberfl¨
achen semantisch beschreiben k¨
onnen. Die Pr¨
adikatenlogik
erster Stufe bietet solche M¨
oglichkeiten und wird daher h¨
aufig eingesetzt. Sie
ist auch die einfachste Form der semantischen Analyse.
Der Beschreibungsformalismus der Pr¨
adikatenlogik besteht aus Individualsym-
bolen (z. B. Eigennamen) und Pr¨
adikatensymbolen (z. B. Verben, Adjektive).
Pr¨
adikate entsprechen somit Eigenschaften von Objekten.
Hansi rechnet = rechnen(Hansi)
Hansi = Individualsymbol
rechnen = Pr¨
adikat
Jedes Pr¨
adikat hat eine Stelligkeit, die die Anzahl der Argumente angibt. Zum
Beispiel ist schlafen(x) einstellig und gr¨
oßer als(x,y) zweistellig, wobei x
und yVariablen f¨
ur Individualsymbole sind. Satzbedeutungen werden mittels
pr¨
adikatenlogischer Formeln beschrieben. Aus aussagenlogischen Junktoren und
Quantoren (Kapitel 3.2.2) k¨
onnen weitere Formeln gebildet werden: z. B. schla-
fen(x) schlafen(y). Konnektoren entsprechen dabei Konjunktionen (z. B.
und, oder) und Quantoren Determinatoren (z. B. ein, alle).
Beispiel 2.4.5
alle rechnen xRechnen(x)
Durch x φ besitzt der Ausdruck φden Skopus (Wertebereich) des Quantors
xwird somit zu einer gebundenen Variable.
Eine Dom¨
ane wird in der Logik durch ein Modell repr¨
asentiert. Ein Modell der
Pr¨
adikatenlogik M= (D, F) besteht aus [CEE+01, S. 40]:
1. D: eine nicht-leere Menge (Dom¨
ane)
62 KAPITEL 2. DISZIPLINEN
2. F: eine Abbildung mit Eigenschaften:
(a) Jedem n-stelligen Pr¨
adikat wird eine n-stellige Relation zugeordnet.
(b) Jedem Individualsymbol wird ein Element aus Dzugeordnet.
Hans rechnet. und Hansi liest ein Buch.
D={Ha, Hi, MB}Pr¨
adikate = {Rechnen(x),Lesen(x,y)}
F(Ha) = Hans F(Rechnen) ={Hans},
F(Hi) = Hansi F(Lesen) ={Hansi, Mathebuch}
F(MB) = Mathebuch
Eine semantische Interpretation [[ ]] einer Variablen voder eines Individualsym-
bols cbez¨
uglich eines Modells Mund einer Funktion gweist jeder Variablen
einen Wert aus Dzu. Die Interpretation wird formal beschrieben durch:
1. [[vi]]M
g=g(vi) f¨
ur alle Variablen vi;
2. [[ci]]M
g=F(ci) f¨
ur alle Konstanten ci;
3. Interpretationsregeln z. B. [[φφ]]M
g= 1 gdw [[φ]] = 1 und [[ψ]] = 1;
4. aussagelogische Regeln und ¨
Aquivalenzregeln (Kapitel 3.2.2).
Das Problem der pr¨
adikatenlogischen Beschreibung ist offensichtlich. Der Re-
pr¨
asentationsmechanismus ist nicht ausdrucksstark genug, um die vielen Ph¨
ano-
mene der nat¨
urlichen Sprache zu beschreiben. So existiert keine eindeutige Zu-
weisung von Wahrheitswerten in der nat¨
urlichen Sprache. Die Variablen xund
ydes zweistelligen Pr¨
adikates lesen(x,y) k¨
onnen nicht zwischen Subjekt und
Objekt des Satzes unterscheiden und die Pr¨
adikatenmodifikatoren wie z B. sehr
schlaues Kind k¨
onnen nicht beschrieben werden.
Eine weitere Beschreibungsm¨
oglichkeit wird durch die Typenlogik gegeben. Die
Typenlogik besitzt einen Mechanismus, um syntaktische Strukturen bestimmten
Typen von semantischen Strukturen zuzuordnen. Solche semantischen Beschrei-
bungsm¨
oglichkeiten werden durch die Montague Semantik [Mon74] beschrie-
ben. Allerdings beschreibt sie nur den Bereich der Satzsemantik.
2.4. COMPUTERLINGUISTIK 63
In der Typenlogik werden Konstanten und Pr¨
adikaten Typen so zugeordnet,
dass sie sich intern unterscheiden. Dabei gibt es die Basistypen e(entity) und t
(truth value). Hat ein Ausdruck Aden Typ < α, β >, so bedeutet das: Animmt
Ausdr¨
ucke vom Typ αund bildet mit ihnen zusammen Ausdr¨
ucke vom Typ β.
Dies wird durch die folgenden Beispiele verdeutlicht:
1. Einstellige Pr¨
adikate wie z. B. Schlafen(x) nehmen Ausdr¨
ucke vom Typ
< e, t > an und bilden sie auf Wahrheitswerte ab:
Schlafen(x) + Peter = Schlafen(Peter)
< e, t > + e = t
2. Zweistellige Pr¨
adikate bilden Individualkonstanten auf einstellige Pr¨
adi-
kate ab.
Lieben(x,y) 7→ Lieben(Peter) Lieben(Peter)(Maria)
< e, t > < e, < e, t >>
Eine solche Typisierung ist nicht deterministisch, sondern zu einem Ausdruck
lassen sich unter Umst¨
anden viele verschiedene Typisierungen finden. F¨
ur jeden
Typ existiert eine Dom¨
ane Dtyp, wobei [CEE+01, S. 49]:
1. De=D
2. Dt={0,1}
3. D<α,β> ist die Menge aller Funktionen von Dαnach Dβ
Ein Modell f¨
ur die Typenlogik Mbesteht dann ebenfalls aus einer nicht-leeren
Menge Dund einer Abbildung F, die jeder Konstanten vom Typ αein Element
von Dαzuordnet.
Hans schl¨
aft und Hansi schl¨
aft nicht.
{Hans, Hansi }=De
F(Hans) = Hans De
F(Hansi) = Hansi De
F(Schlafen(x)) = D<e,t>
D<e,t> ={< Hans, 1>, < Hansi, 0>}
64 KAPITEL 2. DISZIPLINEN
Eine Erweiterung des Mechanismus der Typenlogik bietet der λ-Kalk¨
ul. Dies
erscheint notwendig, da z. B. aus der Aussage alle arbeiten Probleme entste-
hen. In der Typenlogik kann keine Aussage ¨
uber die Mengenbezeichnung alle
gemacht werden und somit nicht ¨
uber Mengen von Elementen in D. Dies wird
durch den λ-Operator erreicht, der eine Variable genau wie eine Quantor bin-
det, z. B. λx (Arbeiten(x)). Alle syntaktischen Kategorien (z. B. NP und VP)
m¨
ussen einem semantischen Typ zugeordnet werden. Daher existiert ein seman-
tisches Lexikon, das W¨
orter logischen Ausdr¨
ucken zuordnet. Zus¨
atzlich existie-
ren die semantischen Regeln, die zu jeder syntaktischen Regel eine semantische
Bedeutung angeben. Dadurch kann eine semantische Interpretation eines Satzes
erfolgen.
Ambiguit¨
aten k¨
onnen mit dieser Beschreibung zwar dargestellt, aber nicht auf-
gel¨
ost werden. Das Hauptproblem bleibt allerdings der variable Skopus. So ist
z. B. aus dem Satz Jeder Student hat ein Problem. nicht eindeutig zu erken-
nen, ob es sich um ein spezielles oder ein allgemeines Problem handelt. Dabei
kommt der Umstand zum tragen, dass die oben beschriebenen Mechanismen
Aufgaben der Semantik der Syntax zuordnen. Ein Verfahren, das die Skopus-
problematik behandelt, ist z. B. der Cooper-Skopus [GRS00, S. 753ff]. Dieser
betrachtet Skopuseigenschaften, die von den syntaktischen Strukturen abwei-
chen. Allerdings entsteht dabei das Problem, dass die Anzahl der m¨
oglichen
Kombinationen von Quantorverbindungen zu groß wird.
Die Analysen der vorhergehenden Methoden sind strikt satzgebunden. Aller-
dings gibt es viele Probleme, so ben¨
otigt z. B. ein Personalpronomen in einem
Satz einen Bezug auf den Kontext des vorhergehenden Satzes. Mit Satzsemanti-
ken l¨
asst sich dieses Problem nicht l¨
osen. Dazu m¨
ussen Methoden der Diskurs-
semantik verwendet werden.
Beispiel 2.4.6 (Anaphorische Beziehungen)
Eine anaphorische Beziehung ist ein referentieller Verweis auf einen vorher
ge¨
außerten sprachlichen Ausdruck.
Er ihn.hat einen Knochen. frisstDer Hund
Abbildung 2.27: Beispiel einer anaphorischen Beziehung
2.4. COMPUTERLINGUISTIK 65
Die Diskursrepr¨
asentationstheorie (DRT) [Kam81, Hei83] betrachtet daher
nicht nur einzelne S¨
atze, sie besitzt Mechanismen, die anaphorische Beziehun-
gen nachvollziehen k¨
onnen. So existieren in der Diskursrepr¨
asentationstheorie
Diskursrepr¨
asentationsstrukturen, die aus zwei Komponenten bestehen, n¨
amlich
aus Objekten, die sich auf anaphorische Pronomina beziehen (Menge von Dis-
kursreferenten), und aus einer Menge von Bedingungen, die f¨
ur die Diskursrefe-
renten die Wahrheitsbedingungen festlegen.
Beispiel 2.4.7
Der Hund hat Fleisch. Er frisst es.
Die Diskursreferenten sind xund y.
1. Bedingung: {x, y |(x=Hund)und (y=Knochen); (xhat y)}
2. Bedingung: {x, y |(x=er); (y=es); (xfrisst y)}
In diesem Fall ist die Auswahl der Diskursreferenten einfach, da der Hund m¨
ann-
lich ist und der Knochen s¨
achlich. Normalerweise ist die Auswahl der Diskursre-
ferenten jedoch nicht so leicht. Die syntaktische Analyse wird durch Konstrukti-
onsregeln in die Diskursrepr¨
asentationsstrukturen, Diskursreferenten und in die
Bedingungen zerlegt, so dass eine semantische Interpretation stattfinden kann.
Erweiterungen dieses Ansatzes sind z. B. die dynamische Pr¨
adikatenlogik [GS91]
und die λ-DRT [KKP96].
Die semantische Analyse der einzelnen W¨
orter erfolgt anders als die der Satzse-
mantik und der Diskurssemantik. Es gibt zahlreiche Methoden, um die Wortse-
mantik zu analysieren. Wortbedeutungen werden z. B. als strukturierte Objekte
dargestellt, die durch Regeln abgeleitet werden [CB95]. Lexikalische Einheiten
erhalten unterspezifizierte semantische Repr¨
asentationen, die allen Lesarten ge-
mein sind und zus¨
atzlich Regeln, die auf pragmatische Anteile Bezug nehmen.
Pragmatik. Die informationstechnische Realisierung der Semantik orientiert
sich an der wahrheitskonditionalen Semantik. Durch die Angabe von Wahr-
heitsbedingungen wird der Informationsgehalt extrahiert. Alle anderen bedeu-
tungsrelevanten Betrachtungen werden nicht untersucht, wie z. B. sprachliches
Handeln. Dies wird durch Mittel der Pragmatik untersucht. Untersuchungsge-
genst¨
ande sind Deixis, Pr¨
asuppositionen usw. [CEE+01, S. 306].
66 KAPITEL 2. DISZIPLINEN
Pr¨
asuppositionen sind Wissensvoraussetzungen, die ein menschlicher Leser
w¨
ahrend des Lesens annimmt. Es gibt in jeder Sprache W¨
orter, die weniger
einen semantischen Gehalt als vielmehr eine Zeigefunktion haben, die so ge-
nannten Deiktika. Hierzu geh¨
oren die W¨
orter wie hier und dort, jetzt und dann.
Es sind W¨
orter, die nicht z. B. einen absoluten Ort oder Zeitpunkt angeben, son-
dern einen solchen bezogen auf Sprecher/Schreiber oder H¨
orer/Leser. [Dud98,
848]
Diese Betrachtungsweisen treten im allgemeinen in der Mathematik nicht auf
und werden daher im n¨
achsten Schritt nicht weiter behandelt.
2.4.4 Fachsprache
Fachsprache ist ein weitgefasster Begriff und beschreibt einen speziellen Sprach-
stil. Zun¨
achst ist fraglich, ob bei dem Gegenstand, den man mit Fachsprache
meint, die Fachlichkeit wirklich das prim¨
are ist, oder nicht vielmehr textsorten-
spezifische, semantische, pragmatische oder sonstige Argumente. Zum zweiten,
nehmen wir einmal an, man wollte an der Fachlichkeit grunds¨
atzlich festhalten,
ist die Frage unklar, was eigentlich F¨
acher konstituiert, ob z. B. Naturwissen-
schaft ein Fach ist, oder Chemie, oder nur die organische Chemie oder gar nur
die Chemie der Aminos¨
auren. [vH83, S. 63]
Fachsprachen sind erstaunlich vielseitig. Sie unterscheiden sich nicht nur nach
Fachbereichen oder im Hinblick darauf, ob sie gesprochen oder geschrieben wer-
den. Man muss auch die innere Differenzierung ber¨
ucksichtigen, den jeweili-
gen Grad der Fachsprachlichkeit, die verschiedenen Textsorten innerhalb einer
Fachsprache, die kulturellen Unterschiede und Konventionen fachlicher Kom-
munikation. [GHL02, S. 613] So wird in Lehrb¨
uchern eine andere Form der
Fachsprache geschrieben als in wissenschaftlichen Aufs¨
atzen.
Trotzdem enth¨
alt z. B. die schriftliche Textform h¨
aufig charakteristische Merk-
male. So werden S¨
atze gerne durch Zahlen oder Formeln, Abbildungen, Sche-
mata und Tabellen unterbrochen [GHL02, S. 618], oder es werden Spiegelstri-
che bzw. Klammern verwendet. Typographische Mittel sind z. B. die Hervor-
hebung von W¨
ortern durch Fett- oder Kursivdruck. Im sprachlichen Bereich
werden viele Verweise untereinander gemacht, so dass der Text koh¨
arent wirkt.
Dazu werden h¨
aufig Artikelw¨
orter (z. B. dieses), Pronominaladverbien (z. B.
2.4. COMPUTERLINGUISTIK 67
darauf), feststehende Phrasen (z. B. im Folgenden), logische Verkn¨
upfungen
durch nebenordnende Konjunktionen (z. B. ferner), Quantifizierungen durch
Gradpartikel (z. B. wenige ), h¨
aufige Wiederholungen von Fachbegriffen usw.
verwendet [GHL02].
Jede Fachsprache besitzt einen f¨
ur sie typischen Wortschatz, der ein Schl¨
ussel zur
Kommunikation in der Fachsprache ist. Wie jedoch oben schon erw¨
ahnt wurde,
ist es schwierig Fachsprachen einzugrenzen. So gibt es in der Mathematik sehr
unterschiedliche Fachsprachen mit unterschiedlichen Wortsch¨
atzen. Allerdings
werden die Fachw¨
orter in eindeutiger Weise definiert, so dass die Kommuni-
kation wesentlich einfacher wird als in anderen Fachsprachen anderer Gebiete.
Vorsicht ist jedoch dabei geboten, die Fachw¨
orter auf die pr¨
azisen Ausf¨
uhrungen
in der Fachsprache zu ¨
ubertragen. So ist die Verwendung von Gradpartikeln ein
eindeutiges Zeichen f¨
ur die Verwendung von nicht eindeutigen Beschreibungen.
Des Weiteren darf aus dem Stamm von Fachw¨
ortern nicht auf ihre tats¨
achli-
che Bedeutung geschlossen werden. So gibt es z. B. Begriffe, die zun¨
achst den
Anschein erwecken, zu einer bestimmten Familie von Begriffen zu geh¨
oren. Im
weiteren Verlauf kann sich aber herausstellen, dass dem nicht so ist.
In der Syntax gibt es bei den Fachsprachen einige charakteristische Besonderhei-
ten. Die Satzstrukturen sind einfacher, k¨
urzer, klar ¨
uberschaubar gegliedert,
aber es werden die Satzglieder immer l¨
anger, weil die Nomina mit Attributen
oder Komposita angereichert [GHL02, S. 622] werden. Generell k¨
onnen fol-
gende syntaktische Strukturen gefunden werden (Auswahl aus [GHL02, s. 622]):
Verwendung von Nomina und nominalen Ausdr¨
ucken;
Verwendung von Satzgliedern anstelle von Nebens¨
atzen;
Verwendung von erweiterten Attribute anstelle von Attributs¨
atzen;
Verwendung von substantivierten Verben;
Verwendung von Pr¨
apositionalgef¨
ugen statt Vollverben;
Verwendung von bestimmten Verben: ist,scheint,zeigt sich;
Verwendung von Infinitiv- und Passivkonstruktionen: l¨
asst sich zeigen;
Verwendung von Depersonalisierungen: man definiert;
68 KAPITEL 2. DISZIPLINEN
Verwendung von Konditionals¨
atzen: wenn ..., dann;
Verwendung von Finals¨
atzen;
2.5. INFORMATION RETRIEVAL 69
2.5 Information Retrieval
Mache die Dinge so einfach wie m¨
oglich aber nicht einfacher.
(Albert Einstein)
Nach Rijsbergen [vR79, S. 3] besteht folgendes Problem: Suppose there is a sto-
re of documents and a person (user of the store) formulates a question (request
or query) to which the answer is a set of documents satisfying the informa-
tion need expressed by his question. He can obtain the set by reading all the
documents in the store, retaining the relevant documents and discarding all the
others. In a sense, this constitutes ’perfect’ retrieval. This solution is obviously
impracticable. A user either does not have the time or does not wish to spend
the time reading the entire document collection, apart from the fact that it may
be physically impossible for him to do so.
Information Retrieval besch¨
aftigt sich mit Verfahren zur Darstellung, Speiche-
rung und Organisation von sowie dem Zugriff auf Informationen. Es werden In-
formationssysteme in Bezug auf ihre Rolle des Wissenstransfers vom mensch-
lichen Wissensproduzenten zum Informations-Nachfragenden betrachtet. [fI04]
Information Retrieval Systeme dienen dem einfachen Zugang zu Informationen
f¨
ur Nutzer eines Systems [BYRN99, S. 1]. Daten sind haupts¨
achlich nat¨
urlich-
sprachliche Texte, die informationstechnisch unstrukturiert und ambig sind (Ka-
pitel 2.4).
Textdokumente werden z. B. in Datenbanken gespeichert und organisiert. In
einem Information Retrieval System werden diese Informationen in eine interne
Repr¨
asentation ¨
uberf¨
uhrt, die das System effizient verarbeiten kann. Dabei wird
ein Index erzeugt (Indextermgenerierung), der das Dokument durch Indexterme
darstellt. Dieser Prozess verh¨
alt sich ¨
ahnlich wie die Unix-Befehle ubdatedb und
locate.updatedb verwendet Methoden, um Informationen ¨
uber das Filesystem
in eine einfach zu durchsuchende Repr¨
asentation (z. B. Liste) abzubilden. Mittels
des Befehls locate k¨
onnen diese Informationen schnell abgerufen werden.
Anfragen des Nutzers (queries) an das System werden ebenfalls in eine interne
Repr¨
asentation ¨
uberf¨
uhrt, um sie dem System zug¨
anglich zu machen. Der Pro-
zess der Suche verbindet nun den Index mit der Abfrage und generiert mittels
geeigneter Methoden Dokumente, die der Abfrage entsprechen. Ein nachfolgen-
70 KAPITEL 2. DISZIPLINEN
Benutzer
Schnittstelle
Anfragenbearbeitung
Suche
Indexing DBMS
Index
Antworten
Text
bewertete Suchergebnisse
Feedback
Anfragen
DB: Texte
Text
Textbearbeitung
interne Repräsentation
gefundene Dokumente
Ranking
Abbildung 2.28: Architektur eines Information Retrieval Systems nach
[BYRN99]
des Rankingsystem sortiert dann die gefundenen Dokumente nach ihrer Rele-
vanz f¨
ur die Benutzeranfrage und liefert sie als bewertete Suchergebnisse an den
Nutzer zur¨
uck.
Es existieren zahlreiche Methoden, um m¨
oglichst effizient Antworten auf Anfra-
gen der Nutzer eines Information Retrieval Systems zu generieren. Klassische
Methoden wie das Boolesche Information Retrieval verwenden die Boolesche
Algebra. Es ist ein sehr einfacher Mechanismus, der Dokumente nur in relevant
oder nicht-relevant unterteilt. Eine weitere klassische Methode ist das Vektor-
raum Information Retrieval. Dieses weist den Indextermen in Anfragen und
Dokumenten ein nicht-bin¨
ares Gewicht zu. Diese Gewichte werden genutzt, um
den ¨
Ahnlichkeitsgrad (Degree of Similarity) zu berechnen, nach denen die In-
formationen sortiert werden. Das probabilistische Information Retrieval sucht
mittels wahrscheinlichkeitstheoretischer Methoden nach idealen Antworten.
Neben den klassischen Methoden existieren einige abgeleitete alternative Mo-
delle wie z. B. das Fuzzy Information Retrieval [OMK91] als Alternative zum
Booleschen Modell, das verallgemeinerte Vektormodell [WZW85], das Latent
Semantic Indexing Modell [DDF+90] und das Neuronale Netzwerkmodell als Al-
2.5. INFORMATION RETRIEVAL 71
ternativen zum Vektorraummodell sowie Inferenznetzwerkmodelle [Pea88] und
Bayesian Belief Modelle [BYRN99] als Alternativen zum probabilistischen Mo-
dell.
Die strukturierten Text Retrieval Modelle erm¨
oglichen dem Nutzer, komplexere
Anfragen an das Information Retrieval System zu stellen, im Gegensatz zu den
klassischen Methoden und ihren Erweiterungen, die nur Zeichenketten in ihren
Anfragen zulassen. Neben den Zeichenketten k¨
onnen zus¨
atzlich bei dieser Me-
thode strukturelle Umgebungsinformationen wie Positionen, Labeleigenschaften
usw. ¨
ubergeben werden, die dann von weiteren Analyseschritten genutzt werden
k¨
onnen. Die Non-Overlapping List Methode [Bur92] zerlegt einen Text auf ver-
schiedene Weisen in nicht-¨
uberlappende Regionen und legt diese in einer oder
mehreren Listen ab. Die Proximal Nodes Methode [NBY97] legt Textstrukturen
in einer hierarchischen Struktur und einem einfachen Wortindex ab.
Durch die Methode des Browsing besteht die M¨
oglichkeit, durch Kommunika-
tion zwischen Nutzer und System Suchanfragen zu ver¨
andern und anzupassen.
Hierbei wird davon ausgegangen, dass die Ziele des Nutzers nicht von Anfang
an bestimmbar sind. Browsing existiert in den drei Varianten flat,structure
guided und Hypertext. Beim flat browsing wird dem Benutzer das Suchergebnis
unstrukturiert angezeigt, z. B. als Dokumentenliste. Anhand dieses ¨
Uberblicks
kann der Benutzer dann seine urspr¨
ungliche Suchanfrage modifizieren, indem
z. B. die Suchkriterien eingeschr¨
ankt oder erweitert werden. Dieser Prozess wird
auch als relevance feedback bezeichnet. Um das Browsing zu erleichtern, wird
beim structure guided browsing anstelle einer flachen ¨
Ubersicht ¨
uber die Doku-
mente eine hierarchische Struktur gew¨
ahlt. Das Hypertext Modell erg¨
anzt die
existierenden Dokumentenstrukturen durch eine zus¨
atzliche, dokumenten¨
uber-
greifende Navigationsebene.
Eine formale Charakterisierung f¨
ur ein Information Retrieval Modell wird gege-
ben durch ([BYRN99], S. 23):
Definition 2.5.1 (Information Retrieval Modell)
Ein Information Retrieval Modell ist ein Quadrupel (D, Q, F, R(qi, dj)) mit:
1. Dist eine Menge von Repr¨
asentationen der zu betrachtenden Dokumente.
2. Qist eine Menge von Repr¨
asentationen von Benutzeranfragen. Solche Re-
pr¨
asentationen werden auch als Queries bezeichnet.
72 KAPITEL 2. DISZIPLINEN
U
e
r
T
a
s
k
sRetrieval:
Adhoc
Filtering
Browsing
Classic Models
boolean
vector
probabilistic
Set Theoretic
Fuzzy
Extended Boolean
Algebraic
Generalized Vector
Lat. Semantic Index
Neural Networks
Probabilistic
Inference Network
Belief Network
Non−Overlapping Lists
Proximal Nodes
Browsing
Flat
Structure Guided
Hypertext
Structured Models
Abbildung 2.29: Taxonomie von Information Retrieval Modellen [BYRN99]
3. Fist ein System zur Modellierung von Dokumentenrepr¨
asentationen, Que-
ries und ihren Abh¨
angigkeiten.
4. R(qi, dj)ist eine Ranking Funktion (Bewertungsfunktion), die von
Q×Dnach Rabbildet. Diese Bewertung definiert eine Ordnung der Do-
kumente djDin Bezug auf einen Query qiQ.
Jedes Dokument wird durch eine Menge von Schl¨
usselw¨
ortern (index terms)
beschrieben, die durch ihre Semantik das Dokument charakterisieren (Defini-
tion 2.5.2). Dabei ist es m¨
oglich, jeden Indexterm in Bezug auf verschiedene
Dokumente unterschiedlich zu gewichten (Definition 2.5.3).
Definition 2.5.2 (Indexterm)
An index term (keyword) is a pre-selected term which can be used to refer to
the content of a document. Usually, index terms are nouns or noun groups. In
the Web, however, some search engines use all the words in a document as index
terms. [BYRN99, S. 444]
Definition 2.5.3 (Gewichtung)
Sei K={k1,...,kt}die Menge aller Indexterme und Ddie Menge aller Doku-
mente. Dann heißt der Vektor ~wj= (w1,j ,··· , wt,j )RtIndextermvektor
2.5. INFORMATION RETRIEVAL 73
des Dokumentes djDmit den Gewichtungen
wi,j =(>0falls kiin djvorkommt
0sonst
Weiterhin definieren wir eine Funktion gi:RtRmit gi(~wj) = wi,j (nach
[BYRN99, S. 25]).
¨
Ublicherweise wird vereinfachend davon ausgegangen, dass die Gewichtungen
wi,j paarweise unkorreliert sind.
2.5.1 Methoden des Information Retrieval
Boolesches Information Retrieval. Beim booleschen Information Retrie-
val besteht eine Anfrage aus der Verkn¨
upfung von atomaren Anfragen. Eine ato-
mare Anfrage pr¨
uft dabei, ob ein Indexterm in einem Dokument vorkommt. Mit
Hilfe der Booleschen Operatoren AND,OR und NOT k¨
onnen dabei aus ein-
fachen Anfragen komplexe Ausdr¨
ucke zusammengesetzt werden (Kapitel 3.2.2).
Definition 2.5.4 (Boolesches Information Retrieval Modell)
F¨
ur das boolesche Modell sind die Gewichte der Indexterme bin¨
ar, wi,j {0,1}.
Eine Anfrage qist ein boolescher Ausdruck. Sei ~qdnf die disjunkte Normalform
[Spi04, S. 51] von q. Des Weiteren, sei ~qcc eine beliebige konjunktive Komponente
von ~qdnf . Die ¨
Ahnlichkeit eines Dokumentes djzu der Abfrage qist definiert
als:
sim(dj, q) = (1falls ~qcc |(~qcc ~qdnf )(ki, gi(~wj) = gi(~qcc))
0sonst
F¨
ur sim(dj, q) = 1 sagt das Boolesche Modell aus, dass das Dokumente dj
relevant zu der Abfrage qist. Sonst ist das Dokument nicht relevant. (nach
[BYRN99, S. 26])
Das bedeutet jedoch, dass ein Dokument nur dann als relevant erkannt wird,
wenn die Anfrage vollst¨
andig erf¨
ullt ist. Eine teilweise ¨
Ubereinstimmung (partial
matching) ist daher nicht m¨
oglich. Ein solches System l¨
asst sich von unge¨
ubten
Nutzern nur schwer bedienen. Daher werden meistens zwei verschiedene Inter-
faces f¨
ur einfache bzw. erweiterte Suche angeboten.
74 KAPITEL 2. DISZIPLINEN
Fuzzy Information Retrieval. Das Fuzzy Information Retrieval basiert
auf der Theorie der Fuzzy-Mengen, verwendet aber trotzdem noch Methoden
des Booleschen Information Retrieval. Die Grundidee dieses Konzeptes ist es,
Mengenzuordnungen nicht mehr eindeutig Objekten zuzuordnen, sondern einer
Merkmalsklasse. Somit werden einem Dokument keine eindeutigen Indexterme,
sondern korrelierte Terme zugeordnet. Damit k¨
onnen auch Begriffe gefunden
werden, die eng mit dem zu suchenden Begriff im Dokument in Beziehung ste-
hen.
Bei der Indexierung wird eine Korrelationsmatrix zwischen den Indextermen
konstruiert. Das Retrieval besteht darin, die Dokumente mit dem h¨
ochsten Grad
an Zugeh¨
origkeit zu den in der Anfrage vorkommenden Termen oder ihren kor-
relierten Termen zu ermitteln [BYRN99, S. 35ff].
Erweitertes Boolesches Information Retrieval. Das Erweiterte Boole-
sche Information Retrieval erg¨
anzt die klassische boolesche Methode durch die
Einbeziehung von teilweise erf¨
ullten booleschen Ausdr¨
ucken. Dadurch wird das
Alles-oder-Nichts-Problem der klassischen Methode vermieden. Die Bewer-
tung erfolgt mit Hilfe von lp-Normen, wobei pdurch den Benutzer bei der An-
frage einstellbar ist. [BYRN99, S. 38ff]
Vektorraum Information Retrieval Das Vektorraum Information Retrie-
val ist ein Modell, das partial matching zul¨
asst. Alle Indexterme erhalten reelle
Gewichtsfaktoren f¨
ur alle Dokumente und die Anfrage. Diese Gewichte werden
genutzt, um die ¨
Ahnlichkeit zwischen einem Dokument und der Anfrage zu be-
rechnen.
Definition 2.5.5 (Vektorraum Information Retrieval Modell)
F¨
ur ein Vektorraum Information Retrieval Modell wird jedem Paar (ki, dj)mit
kiK,djDein Gewichtsfaktor wi,j 0zugeordnet. Jedem Indexterm ki
wird in der Anfrage qebenfalls ein Gewicht wi,q 0zugeordnet. Dann ist der
Anfragevektor ~q definiert als ~q = (w1,q ,...,wt,q)und der Dokumentenvektor
von dj definiert durch ~wj= (w1,t,...,wj,t). (nach [BYRN99, S. 27])
Aus ~q und ~wjkann nun der Grad der ¨
Ahnlichkeit sim(dj, q) zwischen der An-
frage qund dem Dokument djberechnet werden. Eine m¨
ogliches Maß daf¨
ur ist
2.5. INFORMATION RETRIEVAL 75
das Kosinusmaß:
sim(dj, q) = < ~wj, ~q >
|~wj| | ~q |
Es existieren zahlreiche Verfahren f¨
ur die Bestimmung der Indextermgewichte
wi,j . Die bekanntesten verwenden dabei so genannte tf-idf-schemes, die sich an
der H¨
aufigkeit der Indexterme orientieren:
wi,j =freqi,j
maxlfreql,j
log N
ni
wi,q =0.5 + 0.5 freqi,q
maxlfreql,q log N
ni
Dabei ist Ndie Anzahl der Dokumente, nidie Anzahl der Dokumente, in de-
nen der Indexterm kivorkommt, und freqi,j bzw. freqi,q ist die H¨
aufigkeit des
Indexterms kiim Dokument djbzw. in Query q.
Das Vektorraum Information Retrieval Modell ist ein sehr leistungsf¨
ahiges Ver-
fahren, das sich in der Praxis als nur schwer zu schlagen erwiesen hat. Dies und
seine Einfachheit sowie die hohe Geschwindigkeit haben es zu einem der am
meisten verwendeten Verfahren gemacht [BYRN99, S. 27].
Verallgemeinertes Vektorraum Information Retrieval Modell. Das
Verallgemeinerte Vektorraum Information Retrieval Modell ist eine Erweiterung
des klassischen Vektorraum Modells, bei dem zus¨
atzlich die Korrelation zwischen
den Indextermen ber¨
ucksichtigt wird. Dabei ist nicht klar, ob die Verwendung
dieser Korrelation zu einer Verbesserung des Ergebnisses f¨
uhrt [BYRN99, S. 41].
Probabilistisches Information Retrieval. Das probabilistische Informati-
on Retrieval verwendet wahrscheinlichkeitstheoretische Methoden zur Bestim-
mung der Wahrscheinlichkeit, dass ein Dokument als relevant eingestuft wird.
Definition 2.5.6 (Probabilistische Information Retrieval Modell)
F¨
ur das probabilistische Modell sind die Gewichtungen der Indexterme bin¨
ar,
d. h. wi,j {0,1},wi,q {0,1}. Eine Abfrage qist eine Untermenge von Index-
termen. Sei Rqdie Menge der f¨
ur qrelevanten Dokumente. Sei ¯
Rqdas Kom-
plement von Rq(Menge der nichtrelevanten Dokumente). Sei P(Rq|~wj)die
76 KAPITEL 2. DISZIPLINEN
Wahrscheinlichkeit, dass das Dokument djrelevant f¨
ur die Abfrage qist und
P(¯
Rq|~wj)die Wahrscheinlichkeit, dass das Dokument djnicht relevant f¨
ur q
ist. Die ¨
Ahnlichkeit sim(dj, q)des Dokumentes djzu der Abfrage qist definiert
durch:
sim(dj, q) = P(Rq|~wj)
P(¯
Rq|~wj).
(nach [BYRN99, S. 32])
Kapitel 3
Mathematische Strukturen
E: Zu welchen Menschen geh¨
oren die Lernenden, zu den Klugen oder
zu den Dummen?
K: Zu den Klugen.
E: Aber solange ihr noch lerntet, habt ihr noch nicht gewusst, was
ihr lerntet; wart ihr also klug, als ihr das noch nicht wusstet?
K: Nein.
E: Also wart ihr dumm, als ihr lerntet.
K: Ich muss es zugeben.
E: Wer von euch lernte, was der Lehrer euch sagte, die Klugen oder
die Dummen?
K: Die Klugen.
E: Also lernen doch die Klugen und nicht die Dummen [...].
(Platon; Euthydemos)
3.1 Einleitung
Einen ¨
Uberblick ¨
uber die Mathematik in Teilbereichen oder sogar als Ganzes
zu erlangen, ist ein schwieriges Problem. Die Mathematik ist eine sehr kom-
plexe Wissenschaft, in der verschiedene Spezielgebiete nebeneinander existie-
ren. In einigen Teilbereichen wird hingegen versucht, ¨
uber Abstraktionen von
bekannten Spezialgebieten, neue Theorien zu entwickeln. Ein Beispiel f¨
ur eine
solche Abstraktion ist der Zusammenschluss der Analysis und der Geometrie
77
78 KAPITEL 3. MATHEMATISCHE STRUKTUREN
zur Differentialgeometrie. Bei solch einem komplexen Gebiet sind selbst hervor-
ragende Mathematiker heute stets nur Spezialisten auf einem und einigen we-
nigen Teilbereichen und besitzen nur einen oberfl¨
achlichen ¨
Uberblick ¨
uber die
Mathematik als Ganzes. Auch innerhalb einer Fachdisziplin gibt es zahlreiche
Zusammenh¨
ange und Verkn¨
upfungen, die nur schwer zu ¨
uberblicken sind.
Es w¨
are vorteilhaft, wenn eine systematische Darstellungsform der Mathematik
gefunden werden k¨
onnte, die mathematisches Wissen zumindest teilweise kom-
pakt darstellt. Es handelt sich dabei um eine Taxonomie der Mathematik, d. h.
die Einordnung von mathematischen Begriffen in ein semantisches Netzwerk
(Kapitel 2.2). Dabei ist es unwahrscheinlich, dass eine vollst¨
andige Darstellung
der gesamten Mathematik realisiert werden kann. Daher m¨
ussen Teilausschnitte
der Mathematik so konstruiert werden, dass sie dann in geeigneter Weise zu-
sammenf¨
ugbar sind. Probleme, die bei Wissensdarstellungen auftreten, wurden
im Kapitel des Wissensmanagements (Kapitel 2.2) diskutiert.
Die Mathematik als Untersuchungsobjekt bietet zahlreiche Vorteile. Durch ihre
knappe und exakte Ausdrucksweise bietet sie sich an, Wissen maschinell zu ex-
trahieren. Diese Ausdrucksweise bezeichnet man als axiomatische Darstellung
oder Beschreibung. In der axiomatischen Darstellung werden aus Grundaus-
sagen, den Axiomen, weitere Aussagen entwickelt. Die Axiome bleiben dabei
unbewiesen und werden als wahr angenommen. Durch diesen Ansatz wird ein
formales Grundger¨
ust bereitgestellt, das eine mathematische Theorie in struk-
turierte Spracheinheiten zerlegt und das mathematische Wissen partitioniert.
Zum Beispiel sind die Definitionen solche Spracheinheiten. Sie determinieren
den terminologischen Rahmen der mathematischen Betrachtungen und verein-
fachen somit Strukturen. Weitere Spracheinheiten bilden die S¨
atze. Sie enthalten
wahre Aussagen ¨
uber mathematische Sachverhalte, die durch spezielle logische
Regeln erzeugt werden. Beweise begr¨
unden neue S¨
atze auf Grundlage der schon
vorhandenen S¨
atze und Axiome mithilfe von logischen Schlussregeln.
Der entscheidende Vorteil entsteht durch die grammatikalischen Konstruktio-
nen der mathematischen Sprache. Die S¨
atze werden meistens nach bestimmten
Mustern gebildet, so dass eine endliche Anzahl von Phrasen existiert, die im-
mer wieder verwendet werden. Die mathematische Sprache ist außerdem eine
reduzierte Sprache, die sehr viel weniger Ausdrucksm¨
oglichkeiten zul¨
asst als die
Alltagssprache.
3.1. EINLEITUNG 79
Auch ein menschlicher Leser muss die mathematische Sprache wie eine Fremd-
sprache erlernen. Sie hat mit den alltagssprachlichen Texten kaum Gemeinsam-
keiten. Allerdings findet in den letzten Jahrzehnten eine Mathematisierung der
Alltagssprache statt, die teilweise bedingt wird durch Verwendung von techni-
schen Begriffen, die aus der Informationstechnik stammen.
Die mathematische Sprache bildet den Schl¨
ussel zum Verst¨
andnis der Mathema-
tik. Wer die Semantik dieser Sprache nicht versteht, kann weder die Konzepte
verstehen noch mit Mathematikern kommunizieren. Dabei geht es nicht nur um
das Verst¨
andnis der einzelnen Formeln und Symbole, sondern auch um einfach
konstruierte nat¨
urlichsprachliche Texte.
In diesem Kapitel werden insbesondere zwei Aspekte unterschieden: Es sollen
auf der einen Seite die Sprachstrukturen (Kapitel 3.3) und auf der anderen Sei-
te die Wissensstrukturen (Kapitel 3.4) in der Mathematik betrachtet werden.
Damit verbunden sind die Fragen, wie sich die mathematische Sprache analy-
sieren l¨
asst und wie mathematisches Wissen sinnvoll dargestellt werden kann.
Um diese Fragen beantworten zu k¨
onnen, m¨
ussen die grundlegendsten Konzep-
te der Mathematik mathematische Logik (Kapitel 3.2.2) und axiomatische
Mengenlehre (Kapitel 3.2.3) zuallererst betrachtet werden.
80 KAPITEL 3. MATHEMATISCHE STRUKTUREN
3.2 Grundlagen
Man muss viel studiert haben, um wenig zu wissen.
(Montesquieu, franz. Schriftsteller, 1689–1755)
3.2.1 Einleitung
Die Mathematik ist in ihren Formulierungen strenger und genauer als andere
Fachsprachen (Kapitel 2.4.4). Grundlage der Strenge und Genauigkeit sind die
logische Betrachtungsweise und der axiomatische Aufbau der Mathematik.
Die ersten axiomatischen Beschreibungen der Mathematik entstanden schon in
der Antike. So beschrieb Euklid (350–275 v. Chr.) in dem Buch Die Elemente
den axiomatischen Aufbau der Geometrie. Seit Ende des 19. Jahrhunderts gab es
zahlreiche Versuche, eine axiomatische Betrachtungsweise auf die ganze Mathe-
matik zu ¨
ubertragen (moderne Mathematik). Durch logische Paradoxien wurde
allerdings das Bild der Mathematik als ¨
uber alle Zweifel erhabene Wissenschaft
massiv gest¨
ort (Grundlagenkrise der Mathematik).
Schon durch Immanuel Kant (1724–1804) wurden die ersten Grundlagen f¨
ur
die Sichtweise der modernen Mathematik festgelegt. So unterschied er zwischen
analytischen und synthetischen Aussagen:
analytisch wahre Aussage: Das Pr¨
adikat enth¨
alt nur, was im Subjekt be-
reits enthalten ist. Analytische Aussagen vermitteln demnach kein neues
Wissen. Die Aussage Alle Junggesellen sind unverheiratet ist wahr, weil
der Begriff Junggeselle unverheirateter Mann bedeutet.
synthetische Aussage: Hier enth¨
alt das Pr¨
adikat immer etwas neues, im
Subjekt noch nicht enthaltenes. Damit vermitteln synthetische Aussagen
neues Wissen.
Synthetische Aussagen lassen sich nochmals unterteilen in Aussagen a prio-
ri und Aussagen a posteriori. Die synthetischen Aussagen a priori enthalten
dabei allgemeing¨
ultige Wahrheiten. Dazu geh¨
oren auch mathematische S¨
atze,
die nicht empirisch, sondern durch korrektes Schlussfolgern abgeleitet werden.
Allerdings ber¨
ucksichtigte Kant trotz seiner strikten Ausf¨
uhrungen nicht den
3.2. GRUNDLAGEN 81
informellen Charakter der menschlichen Sprache. So interpretieren Menschen
Sprache normalerweise mithilfe ihres inneren Weltbildes. Da dieses sich von
Mensch zu Mensch unterscheiden kann, ist eine solche Interpretation f¨
ur exakte
wissenschaftliche Aussagen ungeeignet. So beschreibt z. B. der unten stehende
Satz des deutschen Logikers Kurt Grelling den Fall von semantischen Wider-
spr¨
uchen.
Einige Adjektive wie etwa kurz und deutsch treffen auf sich selbst
zu, andere etwa lang und englisch, nicht. Wir nennen jene der ers-
ten Gruppe autologisch und jene der zweiten Gruppe heterologisch.
Ist das Adjektiv heterologisch selbst heterologisch? Falls ja, trifft es
nach dieser Definition nicht auf sich selbst zu und muss heterologisch
sein. ([Bar94, S. 170])
Diese Erkenntnis f¨
uhrte zur Entwicklung einer exakten mathematischen Sprache
auf Basis der Logik und somit zur Trennung von Syntax und Semantik.
Einer der bekanntesten Wegbereiter ist David Hilbert (1884–1943), der den For-
malismus der Mathematik als ein strategisches Spiel mit Zeichenreihen sah, des-
sen Spielmaterial die Axiome und dessen Spielregeln die Schlussregeln waren.
Die gesamte Mathematik sollte auf Axiomen und mathematischen Grundaus-
sagen aufgebaut werden, ein Kalk¨
ul formalisiert die Logik und erlaubt es jede
korrekte mathematische Aussage herzuleiten (Syntax) und Aussagen auf ihren
Wahrheitsgehalt zu ¨
uberpr¨
ufen (Semantik). Das Kalk¨
ul sollte konsistent sein
und nur wahre Aussagen ableitbar machen. Und aus ihm sollten alle wahren
Aussagen herleitbar sein (Vollst¨
andigkeit). Dieser Plan wird als Hilbert Pro-
gramm bezeichnet.
Die Grundobjekte der mathematischen Sprache bilden die Mengen, die durch
Georg Cantor (1845–1916) eingef¨
uhrt wurden. Ein formales System ist u. a.
durch Russell und Whitehead [WR84] gegeben (Typentheorie). Des Weiteren
gibt es das Zermelo-Fraenkelsche Axiomensystem, aus dem die axiomatischen
Ableitungen aller Lehrs¨
atze der klassischen Analysis hergeleitet werden k¨
onnen.
Die Grundlage aller Beschreibungen der Mathematik liefert die mathematische
Logik. Dies ist die Pr¨
adikatenlogik 1. Stufe mit Identit¨
at (Kapitel 3.2.2). Ih-
re Basis ist die Aussagenlogik. Die Aussagenlogik beschreibt die Beziehungen,
82 KAPITEL 3. MATHEMATISCHE STRUKTUREN
die zwischen den Aussagen stehen. Die Pr¨
adikatenlogik beschreibt zus¨
atzlich
die innere Struktur der Aussagen mittels Quantoren. Wissenschaftlich gesehen
ist die mathematische Logik eine Sprache (Kapitel 2.4), die durch eine Syntax
und Semantik charakterisiert wird. Dar¨
uberhinaus spielt f¨
ur die Technik der
Beweisf¨
uhrung und f¨
ur die Konsistenz einer mathematischen Logik die Frage
der Entscheidbarkeit eine bedeutende Rolle (G¨
odel [G¨
o31]).
3.2.2 Mathematische Logiken
Die mathematische Sprache ist eine formalisierte k¨
unstliche Sprache (Kapitel
3.3) auf Basis der nat¨
urlichen Sprache und der mathematischen bzw. forma-
len Logik. In den S¨
atzen der mathematischen Sprache sind Aussagen enthalten:
Aussagen sind sprachliche Objekte zur Mitteilung von Sachverhal-
ten. [Rau79, S. 6]
S¨
atze, die Aussagen enthalten, werden in der nat¨
urlichsprachlichen Gramma-
tik als Aussagens¨
atze bzw. Deklarativs¨
atze bezeichnet. Sie unterscheiden
sich von anderen Satzarten wie z. B. Interrogativ-, Desiderativ- oder Exklama-
tivsatz (Kapitel 3.3). So steht beispielsweise im Deklarativsatz das finite Verb
im Indikativ oder im Konjunktiv II, aber nie im Imperativ.
Mathematische Aussagen sind gegen¨
uber der nat¨
urlichen Sprache strukturierter
und setzen sich aus kurzen, pr¨
agnanten Satzkonstruktionen zusammen. Dabei
bestehen sie aus Grundelementen (atomaren Bausteinen):
Atomar heißen Aussagen, deren innere Struktur nicht pr¨
azisiert
wird. In der Umgangssprache entsprechen solche Aussagen am ehe-
sten einfachen Aussagens¨
atzen ohne Nebens¨
atze. [Spi04, S. 5]
Einer atomaren Aussage wird eine (Aussage-) Variable, z. B. a,b,c,..., zugeord-
net. Nach Seiler ([Sei00, I.1.i]) werden mathematische Aussagen folgendermaßen
definiert:
Definition 3.2.1
Eine (mathematische) Aussage ist ein Satz, dem man nach einem abgespro-
chenen Verfahren genau einen der Wahrheitswerte (bzw. logische Werte einer
Aussage) w (wahr) oder f (falsch) zuordnen kann.
3.2. GRUNDLAGEN 83
Die Definition 3.2.1 beinhaltet ein Axiom, das Zweiwertigkeitsprinzip. Es be-
sagt, dass eine Aussage entweder wahr oder falsch sein muss, aber sie kann
nicht zugleich wahr und falsch sein. Die Wahrheitswerte k¨
onnen formal als eine
spezielle zweielementige Menge B:= {0,1}(boolesche Menge) dargestellt wer-
den. Dabei steht der Wert 0 f¨
ur eine falsche Aussage und der Wert 1 f¨
ur eine
wahre Aussage. Die Semantik [Fre94] des Deklarativsatzes reduziert sich auf die
Referenz der Wahrheitswerte (Kapitel 2.4).
Mit einzelnen Aussagen kann jedoch keine mathematische Theorie beschrie-
ben bzw. aufgebaut werden. Daher gibt es Operatoren (Junktoren), die ma-
thematische Aussagen im Sinne des Extensionalit¨
atsprinzips miteinander ver-
kn¨
upfen. Das Extensionalit¨
atsprinzip ist ein weiteres Axiom und bildet mit dem
Zweiwertigkeitsprinzip die Grundpfeiler einer formalen Sprache der mathema-
tischen Aussagen (Aussagenlogik). Das Extensionalit¨
atsprinzip besagt, dass
der Wahrheitswert von zusammengesetzten Aussagen sich nur aus den Wahr-
heitswerten der einzelnen Aussagen zusammensetzt. Diese Verkn¨
upfungen der
mathematischen Aussagen werden als Aussagenverkn¨
upfungen bzw. aussagen-
logische Verkn¨
upfungen bezeichnet [Rau79]. Dadurch entsteht die M¨
oglichkeit,
komplexe Aussagen aus einfachen Aussagen zu konstruieren.
Satz 3.2.1
Hat man eine oder mehrere Aussagen gegeben, dann kann man mit Junktoren
neue Aussagen erzeugen.([Sei00, I.1.ii])
In der Aussagenlogik werden vor allem f¨
unf Junktoren verwendet. Diese Junkto-
ren k¨
onnen auch als Funktionen beschrieben werden, die als boolesche Funk-
tionen BnB(n > 0) bezeichnet werden (Abbildung 3.1).
Junktor Funktion
Negation ¬:BB
Konjunktion :B2B
Disjunktion :B2B
Implikation :B2B
¨
Aquivalenz :B2B
Abbildung 3.1: ¨
Uberblick ¨
uber die booleschen Funktionen
84 KAPITEL 3. MATHEMATISCHE STRUKTUREN
Diese Verkn¨
upfungen der Aussagen erfolgen nach einem bestimmten Muster,
das in den Wahrheitstafeln (Abbildung 3.2) festgelegt wird (Normierung der
booleschen Funktionen).
x y ¬x x y x y x y x y
0 0 1 0 0 1 1
0 1 1 0 1 1 0
1 0 0 0 1 0 0
1 1 0 1 1 1 1
Abbildung 3.2: Wahrheitstafeln
Formale Beschreibung der Aussagenlogik Nun soll die Aussagenlogik als
formale Sprache dargestellt werden. Zur Beschreibung werden ein Alphabet, eine
Syntax und eine Semantik ben¨
otigt. Die Syntax beschreibt Sprachen, die aus
Zeichen bestehen, wobei verschiedene Typen von Zeichen unterschieden werden.
Die Semantik beschreibt die Abbildung (Interpretation) der Syntax auf einer
vorgegebenen Struktur. Ein System, das die Syntax und Semantik zusammen
mit Schlussfolgerungsregeln beschreibt, wird als Kalk¨
ul bezeichnet.
Definition 3.2.2 (Alphabet der Aussagenlogik)
Das Vokabular der Aussagenlogik besteht aus einer fest definierten Menge von
Symbolen Σ = {A,¬,,(,)}:
1. Ein Alphabet von atomaren Aussagen A={a, b, c, . . .},
2. Junktoren ¬,und
3. technische Zeichen (linke und rechte Klammer).
(nach [Spi04, S. 14])
Durch die Verwendung der beiden logischen Operatoren ¬und k¨
onnen die
drei weiteren logischen Operatoren ,und definiert werden:
A B := ¬(A ¬B)
A B := ¬A B
3.2. GRUNDLAGEN 85
A B := ¬(A B) ¬(B A)
Die aus dem Alphabet der Aussagenlogik nach bestimmten Regeln gebildeten
Symbolfolgen werden als aussagenlogische Formeln bezeichnet. Die Bildungsre-
geln werden durch die Syntax (Definition 3.2.3) und die Bedeutung durch die
Semantik (Definition 3.2.4) beschrieben.
Definition 3.2.3 (Syntax der Aussagenlogik)
Die aussagenlogischen Formeln werden folgendermaßen gebildet:
1. Alle atomaren Aussagen aus Asind aussagenlogische Formeln.
2. Das Negationssymbol ¬gefolgt von einer aussagenlogischen Formel ist eine
aussagenlogische Formel.
3. Eine ¨
offnende Klammer (, gefolgt von einer aussagenlogischen Formel, ge-
folgt vom Junktor , gefolgt von einer aussagenlogischen Formel, gefolgt
von einer schließenden Klammer ), ist eine aussagenlogische Formel.
4. Bindungsregeln f¨
ur die Junktoren.
(nach [Spi04, S. 14])
Das durch die Syntax beschriebene formale System kann nun mit einer Semantik
verbunden werden:
Definition 3.2.4 (Semantik der Aussagenlogik)
1. Die Belegung ist eine Funktion g:D {0,1}, wobei Ddie Menge aller
aussagenlogischen Formeln ist. Die Belegung wird durch die Wahrheitsta-
feln (Abbildung 3.2) beschrieben. [CEE+01, S. 32]
2. Eine Interpretation Ieiner aussagenlogischen Formel wird definiert
durch:
(a) Atomare Aussagen a:I(a) = g(a);
(b) Aussagenlogische Formeln A,B:
i. Negation: I(¬A) = 1, falls I(A) = 0, sonst I(¬A) = 0;
ii. Implikation: I(A B) = 1, falls I(A) = 0 oder I(B) = 1, sonst
I(A B) = 0;
(nach [CEE+01, S. 34])
86 KAPITEL 3. MATHEMATISCHE STRUKTUREN
3. F¨
ur eine aussagenlogische Formel Aund eine Belegung gschreibt man g|=
A, falls I(A) = 1. Man sagt, die Formel Agilt unter der Belegung
g. [CEE+01, S. 35]
Die eigentliche Aufgabe der Logik ist es, die Gesetze des logischen Schließens zu
untersuchen.
Definition 3.2.5 (Schluss)
Seien nun P1,...,Pn,Caussagenlogische Formeln1. Wenn P1... Pn C
allgemeing¨
ultig ist, nennt man dies einen g¨
ultigen Schluss von P1, . . . , Pnnach
C. Man notiert dies durch P1,...,Pn|=C. Eine aussagenlogische Formel heißt
allgemeing¨
ultig (Tautologie), wenn sie bei jeder Belegung zu einer Aussage
mit Wahrheitswert wahr wird. (nach [Wue95, S. 4, 6])
Die wichtigste Schlussregel ist der modus ponens (P C,P)|=C, d. h., wenn
eine Implikation und ihre Pr¨
amisse Pangenommen werden, folgt logisch die
Konklusion C.
Um ein vollst¨
andiges Beschreibungssystem f¨
ur die Aussagenlogik zu erhalten,
wird ein formales Axiomensystem aufgestellt.
Axiom 3.2.1 (Axiomensystem der Aussagenlogik)
Es seien A,Bund Caussagenlogische Formeln. Dann gilt folgendes:
1. aussagenlogische Annahmeneinf¨
uhrung:
C (A C)
2. aussagenlogische Verkettungsregel:
(A (B C)) ((A B)(A C))
3. Widerspruchsregel: (¬C ¬A)(A C)
4. modus ponens
[Spi04, S. 66]2
1Psteht f¨
ur Pr¨
amisse und Cf¨
ur Konklusion.
2System von Lukasiewicz und Tarski
3.2. GRUNDLAGEN 87
Die Aussagenlogik beschreibt nur einen geringen Teil der Mathematik und reicht
deshalb nicht f¨
ur eine vollst¨
andige Beschreibung aus. Eine Erweiterung der Ideen
der Aussagenlogik ist durch die Pr¨
adikatenlogik erster Stufe gegeben. So verwen-
det die Pr¨
adikatenlogik Konzepte der traditionellen Logik wie z. B. die Subjekt-
Pr¨
adikat Beziehung. Damit k¨
onnen Individuen (Subjekte), deren Eigenschaften
(Pr¨
adikate) und Geltungsbereiche (Quantoren) abgefragt werden.
In der Ausdrucksweise der modernen Linguistik entspricht dem
Subjekt ein Satzteil, der eine irgendwie geartete Benennung eines
Gegenstandes ausdr¨
uckt, daher spricht man von einer Nominalphra-
se. Demgegen¨
uber entspricht dem Pr¨
adikat gerade keine Benennung.
Linguisten nennen den Satzteil, der grammatisch das Pr¨
adikat re-
pr¨
asentiert, die Verbalphrase. [Spi04, S. 86]
Des Weiteren existieren Funktoren. Aus linguistischer Sicht k¨
onnen z. B. Funk-
toren beschrieben werden als Nominalphrasen, die nicht nur durch den Eigenna-
men eines Individuums angegeben werden, sondern eine funktionale Abh¨
angig-
keit beschreiben, z. B. das Blatt eines Baumes [Her72].
Nach diesen Betrachtung besteht dann das Alphabet der pr¨
adikatenlogischen
Sprache aus:
Definition 3.2.6 (Alphabet der Pr¨
adikatenlogik)
Das Alphabet der Pr¨
adikatenlogik setzt sich zusammen aus dem Alphabet der
aussagenlogischen Sprache (Definition 3.2.2) und folgenden Symbolen:
1. Pr¨
adikate: p, q, . . .;
2. Individuenkonstanten: k, k1,...;
3. Individuenvariablen: x1, x2,...;
4. Funktoren: f,g,...;
5. Quantorenzeichen: Allquantor , Existenzquantor .
Mit dem Alphabet k¨
onnen dann zul¨
assige Symbolfolgen pr¨
adikatenlogische
Formeln gebildet werden, die durch die Syntax der Pr¨
adikatenlogik beschrie-
ben werden3.
3Die Bildungsregeln bzw. die Syntax soll hier nicht n¨
aher erl¨
autert werden.
88 KAPITEL 3. MATHEMATISCHE STRUKTUREN
Wie in der Aussagenlogik gibt es auch in der Pr¨
adikatenlogik eine Interpretation,
die jedoch sehr viel reichhaltiger gestaltet ist (Semantik der Pr¨
adikatenlogik).
Dabei ist der grundlegende semantische Begriff das Modell. Ein Modell der
Pr¨
adikatenlogik ist ein Paar M= (D,F), wobei Deine Menge und Feine
Funktion ist , die die Elemente aus Dauf Individuenvariablen und die Pr¨
adi-
kate auf Relationen abbildet. Die Menge Dwird als Dom¨
ane (bzw. Struktur)
bezeichnet. Diese wird interpretiert als eine Menge von Individuen (z. B. Zah-
len, Vektoren, ...), die f¨
ur das zu betrachtende Problem relevant sind. Das Bild
eines Pr¨
adikates pist diejenige Relation R, f¨
ur die (x1,...,xn)Rgenau dann
gilt, wenn p(x1,...,xn) zutrifft.
Der Begriff der Interpretation bezeichnet die Deutung der Ausdr¨
ucke der Pr¨
adi-
katenlogik in Bezug auf ein Modell. F¨
ur die Interpretation von Individuen wer-
den Belegungen verwendet. Eine Belegung gzu einem Modell Mist eine Ab-
bildung mit der Menge aller Individuenvariablen als Definitionsbereich und D
als Wertebereich. Also bildet gIndividualvariablen auf Individuen aus Dab.
Eine Interpretation Iist dann ein Paar (M, g) aus dem Modell Mund der
Belegung gin M. F¨
ur eine Formel Cund eine Interpretation Ischreibt man
I |=C, falls Cf¨
ur die Interpretation Iwahr ist. Man sagt die Interpretation die
Formel Cgilt unter der Interpretation I[CEE+01, S. 40ff].
Axiom 3.2.2 (Axiomensystem der Pr¨
adikatenlogik 1. Stufe)
A,Bund Csind pr¨
adikatenlogische Formeln. Ein Allsatz behauptet, dass f¨
ur alle
Individuen die nachfolgenden Pr¨
adikate zutreffen. Ein Existenzsatz behauptet
die Existenz eines oder mehrerer Individuen mit den nachfolgend genannten
Pr¨
adikaten.
1. pr¨
adikatenlogische Annahmeneinf¨
uhrung:
C (A C)
2. pr¨
adikatenlogische Verkettungsregel:
((A (B C)) ((A B)(A C))
3. pr¨
adikatenlogische Widerspruchsregel:
(¬C ¬A)(C A)
4. Partikularisierung: Ein Allsatz kann auf ein beliebiges Individuum an-
gewandt werden, sofern dessen Beschreibung keine Variablen enth¨
alt,
3.2. GRUNDLAGEN 89
die durch weitere Quantoren des Allsatzes gebunden werden. D. h.
(x)B(x)B(t), wenn tfrei substituierbar f¨
ur xin Bist.
5. Versetzung des Quantors: Wenn ein Allquantor vor einer Implikation eine
Variable bindet, die nur im bedingten Teil vorkommt, darf der Quantor
direkt vor diesen Teil verschoben werden. D. h. x(A(...)C(...))
(A(...)(x)C(...)), wenn xnicht frei in Avorkommt.
6. Generalisierung: Wenn eine Aussage f¨
ur eine freie Variable mit einer be-
liebigen Durchlaufung dieser Variable gilt, dann darf diese Variable durch
einen Allquantor gebunden werden.
7. Inferenzregeln: modus ponens
(nach [Spi04, S. 133])
In Ebbinghaus [EJF96, S. 149] wird ¨
uber das Problem bei der Verwendung der
Pr¨
adikatenlogik 1. Stufe gesprochen.
3.2.3 Axiomatische Mengenlehre
Eine Analyse der mathematischen Sprache erfordert die Betrachtung der Men-
genlehre. Sie bildet ein einheitliches Ger¨
ust f¨
ur zahlreiche Disziplinen.
Nach Cantor wird unter einer Menge (naiver Mengenbegriff ) folgendes verstan-
den:
Unter einer Menge verstehen wir jede Zusammenfassung Mvon
bestimmten wohlunterschiedenen Objekten unserer Anschauung oder
unseres Denkens (welche die Elemente von Mgenannt werden) zu
einem Ganzen.([Ebb94, S. 1])
Allerdings f¨
uhrt eine solche Betrachtungweise zu Widerspr¨
uchen (Antinomien),
beispielsweise bei der Interpretation des Beispiels vom Barbier in Sevilla.:
In Sevilla wird ein Mann genau dann vom Barbier von Sevilla
rasiert, wenn er sich nicht selbst rasiert. Rasiert sich der Barbier
selbst? [Bar94, S. 172]
90 KAPITEL 3. MATHEMATISCHE STRUKTUREN
Daher wurde die axiomatische Mengenlehre entwickelt, die nur spezielle axio-
matisch festgelegte Klassen von mathematischen Objekten (Mengen) betrachtet.
Nur diese speziellen Klassen sind zul¨
assig und sie werden als Mengen bezeichnet.
Bemerkung 3.2.1 (Bezeichnungen)
Kleinbuchstaben x,y,... bezeichnen Mengen und Element von Mengen.
Das Symbol xybedeutet: xist ein Element von y
Das Symbol x6∈ ybedeutet: xist kein Element von y
Das Symbol {x|E(x)}bedeutet: Die Menge aller xmit der Eigenschaft
E(x), d. h. E(x)ist wahr.
3.2.3.1 Axiomatische Mengenlehre nach ZFC
Es gibt verschiedene formale Systeme in der Mathematik; auf eine Diskussion,
welches das Beste ist, wollen wir uns an dieser Stelle nicht einlassen und w¨
ahlen
das Zermelo-Fraenkelsche Axiomensystem (ZFC) mit Auswahlaxiom aus. Die
Sprache der Mengenlehre basiert auf der Pr¨
adikatenlogik erster Stufe mit Iden-
tit¨
at (Kapitel 3.2.2). Hier ist das einzige nicht-logische Zeichen das -Zeichen
(Axiome nach [Jap93]).
Axiom 3.2.3 (Extensionalit¨
atsaxiom)
Zwei Mengen aund bsind genau dann gleich, wenn sie dieselben Elemente
enthalten.
x(xaxb)a=b
Das Extensionalit¨
atsaxiom beschreibt die Bedeutung des Gleichheitszeichen und
legt implizit fest, dass Mengen eindeutig angegeben werden k¨
onnen. Der Aus-
druck x(xaxb) wird auch als abgeschrieben und bedeutet aist
Teilmenge von b.
Axiom 3.2.4 (Paarungsmengenaxiom)
Wenn a,bMengen sind, dann gibt es eine Menge x, die genau aund bals
Element enth¨
alt.
xy(yxy=ay=b)
3.2. GRUNDLAGEN 91
xheißt ungeordnetes Paar von aund b. Es wird als x={a, b}geschrieben. Aus
dem Axiom 3.2.4 kann die Definition des geordneten Paares gefolgert werden.
Definition 3.2.7 (Geordnetes Paar)
Nach Kuratowski [Ebb94, S. 54] ist ein geordnetes Paar gegeben durch:
(x, y) := {{x},{x, y}}
wobei (x, y)6= (y, x)mit x6=yist. Ein geordnetes n-Tupel x1, . . . , xnist ein
geordnetes Paar gegeben durch:
(x1,...,xn1, xn) := {{(x1,...,xn1)},{(x1,...,xn1), xn}}
Axiom 3.2.5 (Vereinigungsmengenaxiom)
Zu jeder Menge agibt es eine Menge x, die alle Elemente der Elemente von a
enth¨
alt.
xy(yx z(zayz))
Dieses Axiom beschreibt die Vereinigung von Mengen. Das xwird auch als Sa
geschrieben. Weiterhin ist ab=S{a, b}und a0:= a {a, a}.
Axiom 3.2.6 (Potenzmengenaxiom)
Zu jeder Menge agibt es eine Menge x, die alle Teilmengen von aenth¨
alt.
xy(yx z(zyza))
Dieses Axiom erlaubt die Konstruktion verschieden m¨
achtiger, (¨
uberabz¨
ahlbar)
unendlich großer Mengen.
Axiom 3.2.7 (Leere Menge)
Es existiert eine leere Menge.
xy(¬(yx))
Die leere Menge wird als bezeichnet.
Axiom 3.2.8 (Unendlichkeitsaxiom)
Es gibt eine Menge, die enth¨
alt und mit jedem yauch y0.
x( x y(yxy0x))
92 KAPITEL 3. MATHEMATISCHE STRUKTUREN
Dies garantiert die Existenz einer Menge, die alle nat¨
urlichen Zahlen enth¨
alt.
Dabei ist 0 = , 1 = 00={0}, 2 = 10={0,1}, 3 = 20={0,1,2}usw.
Axiom 3.2.9 (Aussonderungsaxiom)
F¨
ur alle Mengen agibt es eine Menge x, die aus allen Elementen yvon abesteht,
die die Formel A(y)erf¨
ullen.
xy(yxyaA(y))
Das Axiom 3.2.9 besagt, dass durch bestimmte Eigenschaften A(y) eine neue
Teilmenge xaus agebildet (ausgesondert) werden kann. Dies wird bezeichnet
durch: {ya|A(y)}. Das Aussonderungsaxiom ist eigentlich ein Axiomen-
schema f¨
ur eine unendliche Anzahl von Axiomen, da es unendlich viele A(y)
gibt.
Axiom 3.2.10 (Ersetzungsaxiom)
F¨
ur jede Menge aexistiert eine Menge xso, dass f¨
ur jedes Element yvon a,
f¨
ur das ein zexistiert, dass das Pr¨
adikat A(y, z)erf¨
ullt, ein solches zauch in x
existiert.
x(ya(z A(y, z) zx A(y, z)))
Das Axiom 3.2.10 garantieren die M¨
oglichkeit, Mengen in anderen Mengen nach
einer bestimmten Vorschrift abzubilden.
Axiom 3.2.11 (Fundierungsaxiom)
Wenn es eine Menge xgibt, die A(x)erf¨
ullt, dann existiert eine Menge x, die
A(x)erf¨
ullt, aber keines ihrer Elemente yerf¨
ullt A(y).
[x A(x)] [x(A(x) yx(¬A(y)))]
Das Fundierungsaxiom f¨
uhrt bei den Mengen, die sich selbst enthalten, zum
Widerspruch und verhindert somit die Existenz solcher Mengen.
Axiom 3.2.12 (Auswahlaxiom)
Zu jeder Menge xvon nicht leeren, zueinander disjunkten Mengen gibt es eine
Menge, die von jedem Element von xgenau ein Element enth¨
alt.
Das Axiom 3.2.12 besagt, dass zu jeder Menge von nicht leeren, zueinander
disjunkten Mengen eine Auswahlmenge existiert. Jedoch beschreibt das Axiom
nicht, wie diese Auswahl aussieht und wird nicht f¨
ur endliche Mengen ben¨
otigt.
3.2. GRUNDLAGEN 93
Mit den Zermelo-Fraenkel Axiomen wird eine formale Sprache f¨
ur die Standard-
mathematik aufgebaut. Die Syntaxregeln sind durch die Pr¨
adikatenlogik erster
Stufe mit Identit¨
at (Kapitel 3.2.2) mit den Symbolen (,, ,¬und ,
=) und den Mengenlehresymbolen gegeben. Im Folgenden soll der Begriff der
Zuordnung mengentheoretisch pr¨
azisiert werden.
Definition 3.2.8 (Kartesisches Produkt)
Das kartesische Produkt ist gegeben durch:
X×Y:= {(x, y)|xXyY}
Des Weiteren wird eine Teilmengenbeziehung ben¨
otigt:
Definition 3.2.9
Die Menge Xheißt Teilmenge der Menge Y, wenn f¨
ur alle Elemente xgilt:
xXxY
F¨
ur beliebige Mengen sind die Eigenschaften der Teilmengenbeziehung:
1. XX(reflexiv)
2. Wenn XYund YZ, dann XZ(transitiv)
3. Wenn XYund YX, dann X=Y(antisymmetrisch)
[Sta00, S. 7]
Mit Hilfe des Begriffs des geordneten Paares und der Teilmengenbeziehung kann
nun der Begriff der Relation definiert werden.
Definition 3.2.10 (Relation)
Es seien X,YMengen. Eine Teilmenge Rvon X×Yheißt Relation zwischen
Xund Y.
Definition 3.2.11
Es sei RX×Yeine Relation zwischen Xund Y.
1. Der Definitionsbereich von Rist die Menge DRder Elemente von X,
die R-Urbilder eines Elementes von Ysind:
DR:= {aX| bmit (a, b)R}
94 KAPITEL 3. MATHEMATISCHE STRUKTUREN
2. Der Bildbereich (Wertebereich) von Rist die Menge WRder Elemente
von Y, die R-Bild eines Elementes von Xsind:
WR:= {bX| amit (a, b)R}
[Sta00, S. 21]
Definition 3.2.12 (bin¨
are Relation)
Rwird bin¨
are (zweistellige) Relation in Xgenannt, wenn RX×Xist.
(Bezeichnung: xRy :(x, y)R)Rheißt:
reflexiv: wenn xXgilt xRx;
irreflexiv: wenn f¨
ur kein xXgilt xRx;
transitiv: wenn x, y, z Xgilt: wenn xRy und yRz, so xRz;
antisymmetrisch: wenn x, y Xgilt: wenn xRy und yRx, so x=y;
asymmetrisch: wenn x, y Xgilt: wenn xRy, so nicht yRx;
symmetrisch: wenn x, y Xgilt: wenn xRy, so yRx;
reflexive Halbordnung: wenn Rreflexiv, transitiv und antisymmetrisch;
irreflexive Halbordnung: wenn Rirreflexiv, transitiv und asymmetrisch;
¨
Aquivalenzrelation: wenn Rreflexiv, transitiv und symmetrisch.
[Sta00, S. 22f]
Ein zentraler Begriff in der Mathematik ist der Begriff der Abbildung (Funktion,
Operator):
Definition 3.2.13 (Abbildung)
Es seien X,YMengen
1. fheißt Abbildung von X in Y, wenn
(a) feine Relation von Xin Yist;
(b) (x, y)f(x, z)fy=zmit xXund y, z Y
2. Eine Abbildung fwird surjektiv genannt, wenn Wf=Yist.
3.2. GRUNDLAGEN 95
3. Eine Abbildung fwird injektiv genannt, wenn
((x1, y)f(x2, y)f)x1=x2mit x1, x2Xund yY.
4. Eine Abbildung fheißt bijektiv, wenn fsurjektiv und injektiv ist.
[Sta00, S. 25], [Wue95]
In der Literatur wird die Relation von Xin Yauch als Graph von fbezeichnet.
Dadurch wird zwischen dem Prozess des Abbildens von Xnach Yund der
mengentheoretischen Bedeutung unterschieden. Dies wird in dieser Arbeit im
Folgenden aber nicht getan, d. h. es wird f= Graph(f) angenommen.
96 KAPITEL 3. MATHEMATISCHE STRUKTUREN
3.3 Sprachstrukturen
Die Mathematik geh¨
ort zu jenen ¨
Außerungen
menschlichen Verstandes, die am wenigsten von
Klima, Sprache oder Traditionen abh¨
angen.
(Ilja Ehrenburg, russ. Autor, 1891-1967)
Die Sprache der Mathematik ist mehr als eine gew¨
ohnliche Fachsprache (Kapitel
2.4.4). Sie ist Vorbild f¨
ur viele Wissenschaften und somit auch deren Fachspra-
chen, da sie eine klare durchg¨
angige Strukturierung ihrer Inhalte/Erkenntnisse
und [ein] darauf operierende[s] Begriffs-Beziehungsgeflecht [Jes04, S. 94] auf-
weist. Sie besitzt dadurch eine strenge Systematik aus gewissenhaft hergeleiteten
S¨
atzen, die aus einem endlichen Theoremgeb¨
aude aufgebaut werden. Definitio-
nen sind dabei die Strukturierungselemente. Allerdings wird die Mathematisie-
rung in den Wissenschaften oft als Allheilmittel gesehen, was nicht unbedingt
deren Verstehensprozess und Genauigkeit f¨
ordert.
In diesem Kapitel werden die sprachlichen Strukturen der Mathematik und ihre
Besonderheiten herausgearbeitet. Um einen grundlegenden ¨
Uberblick ¨
uber eine
Dom¨
ane der Mathematik zu gew¨
ahrleisten, sollen Texte aus Lehrb¨
uchern ver-
wendet werden. Lehrb¨
ucher, insbesondere f¨
ur Studierende im Grundstudium,
nehmen f¨
ur sich in Anspruch, eine besonders strenge mathematische Sprache
zu benutzen [Fis00], [BF00], [BF96], [K¨
o01], [Rud02], [Wue95]. Es soll daher
haupts¨
achlich Lehrbuchliteratur aus dem Bereich der linearen Algebra verwen-
det werden, da diese sehr strukturiert aufgebaut ist. Es werden aber auch Bei-
spiele aus der Analysis vorgestellt.
Auf Grundlage der Strukturierungsmechanismen in der Mathematik ergeben
sich f¨
ur linguistische Betrachtungen der mathematischen Sprache vier Ebenen
(Abbildung 3.3), die in den nachfolgenden Kapiteln n¨
aher betrachtet werden:
1. Entit¨
atenebene (Pragmatik)
2. Binnenstrukturebene (Diskurssemantik)
3. Satzebene (Syntax und Satzsemantik)
4. Wort- und Symbolebene (Morphologie und lexikalische Semantik)
3.3. SPRACHSTRUKTUREN 97
Axiom
Satz
Definition
Beweis


























Entitäten
Binnenstruktur
Satz
Wort & Symbol
Wenn [...], dann [...]
Wort: Menge Symbol: M
Abbildung 3.3: Darstellungsebenen der mathematischen Sprache
3.3.1 Entit¨
atenebene
Mathematische Theorien werden deduktiv konstruiert. Aufbauend auf einer
m¨
oglichst geringen Anzahl von undefinierten Begriffen (Grundbegriffen) und
unbewiesenen S¨
atzen (Grunds¨
atze4) werden weitere S¨
atze bewiesen [WR84].
Jede mathematische Theorie ist eine Aneinanderreihung von
S¨
atzen, deren jeder aus den vorhergehenden abgeleitet wird: dies ge-
schieht im Einklang mit den Regeln jenes logischen Systems, das
unter dem Namen formale Logik bekannt ist. [Bou02, S. 143]
Die Grunds¨
atze werden in der Mathematik auch als Axiome bezeichnet. Die
Mengenlehre (Kapitel 3.2.3) bildet dabei das axiomatische Fundament der ma-
thematischen Theorien. Auf Grundlage der Axiome der Mengenlehre und der
Pr¨
adikatenlogik erster Stufe bzw. der elementaren Schlussregeln (Kapitel 3.2.2)
werden Aussagen der zu betrachtenden mathematischen Theorie bewiesen.
Durch den dadurch bedingten strukturellen Aufbau wird eine mathematische
Theorie in kompakte Einheiten Entit¨
aten5 zerlegt, die untereinander in
vorgegebenen Beziehungen stehen [Jes04, S. 93]. Entit¨
aten entsprechen dann
4Russell und Whitehead verwendeten die Bezeichnung Grunds¨
atze [WR84]. Heutzutage
wird der Begriff Axiom verwendet.
5Sie werden auch als Konstrukte bezeichnet (Kapitel 2.2).
98 KAPITEL 3. MATHEMATISCHE STRUKTUREN
den Definitionen, Theoremen, S¨
atzen, Korollaren, Propositionen und Lemmata.
Hinzu kommen Beweise und Beispiele.
In der Abbildung 3.4 wird eine grobe hierarchische Anordnung der vorhan-
denen Entit¨
aten dargestellt. Auf der obersten Hierarchieebene (Axiomenebe-
ne) einer mathematischen Theorie befinden sich die Axiome und Definitionen
zu den grundlegendsten Begriffen. Diese beschreiben die Prinzipien einer zu
betrachtenden mathematischen Theorie. In der darunterliegenden Hauptebene
existiert eine stereotype Basisstruktur, bestehend aus Definition, Satz und Ko-
rollar. Das zentrale Element ist der Satz, der in verschiedensten Auspr¨
agungen
als Fundamentalsatz, als Theorem oder als einfacher Satz auftreten
kann. Jeder Satz muss aus vorhergehenden S¨
atzen oder den Axiomen bewiesen
werden. Unter der Ebene des Satzes existieren in der Hierarchie die Korollare
und Lemmata. Korollare folgen direkt aus einem Satz, Lemmata sind in Be-
weisen verwendete Hilfss¨
atze. Des Weiteren k¨
onnen auf S¨
atze und Definitionen
Propositionen6folgen, die ebenfalls wieder bewiesen werden7. Eine weitere En-
tit¨
atenstruktur bilden die Beispiele, die h¨
aufig in Lehrb¨
uchern zu finden sind.
Diese treten haupts¨
achlich nach Definitionen oder wichtigen S¨
atzen auf und
dienen der anschaulichen Erl¨
auterung der zu betrachtenden mathematischen
Aussage.
Bei genauerer Betrachtung der Entit¨
atenstruktur wird deutlich, dass diese
Struktur inh¨
arent die pragmatische Struktur widerspiegelt. Sowohl die En-
tit¨
atenstruktur als auch die verschiedenen Entit¨
aten zeigen eindeutig die In-
tention an, die ein mathematischer Text vermitteln soll. Die Bestimmung dieser
Intentionen ist sicherlich ein wichtiger Schritt f¨
ur die Analyse der mathema-
tischen Sprache. Problematisch sind mathematische Texte, in denen nicht expli-
zit die Entit¨
aten angegeben werden8. Hierbei m¨
ussen die Entit¨
aten zuerst aus
dem Text ermittelt werden.
6In der deutschsprachigen Literatur wird die Proposition auch h¨
aufig als Bemerkung be-
zeichnet.
7Wird in der deutschsprachigen Literatur die Bezeichnung Bemerkung verwendet, so
k¨
onnen, aber m¨
ussen nicht, Beweise folgen. Wenn kein Beweis angegeben wird, entspricht
dies dem in der angels¨
achsischen Literatur verwendeten Begriff remark. Dabei wird meistens
ein Hinweis auf einen mathematischen Satz gegeben, dessen Beweis in diesem Zusammenhang
nicht wichtig ist und daher ausgelassen werden kann.
8Zu solchen Texten geh¨
oren z. B. einleitende Textabschnitte zu Sachgebieten.
3.3. SPRACHSTRUKTUREN 99
Bemerkung
Axiomenebene
Definition
Satz
Korollar
Bemerkung
Bemerkung
Korollar
Hauptebene
Beweis
Beweis
Beweis
Beweis
Beispiel
Beispiel
Beweis
Beweis
Axiom Definition von Grundbegriffen
Abbildung 3.4: Hierarchie der Entit¨
aten
In den weiteren Abschnitten sollen nun die Intentionen der einzelnen Entit¨
aten
und ihre Charakteristika beschrieben werden.
Axiom. Das Wort Axiom stammt aus dem gr.-lat. Wort ax´o ¯ma und bedeutet
Grundwahrheit [Dud01]. Ein Axiom ist eine als wahr angenommene Aussage
(bzw. ein als wahr angenommener Satz), die nicht innerhalb der zu betrachteten
mathematischen Theorie begr¨
undbar ist (Aristoteles). Es wird auch vom Satz 0.
Stufe gesprochen. Axiome dienen daher als Fundament f¨
ur deduktiv beweisbare
Theorien. Werden in einem Axiom mehrere Aussagen zusammengefasst, wird
ein solches Axiom als Axiomenschema bezeichnet.
F¨
ur die Beschreibung einer mathematischen Theorie werden mehrere Axiome
ben¨
otigt, die nicht im Widerspruch zueinander stehen d¨
urfen. Ein solches System
wird dann als Axiomensystem bezeichnet. Beispiele f¨
ur Axiomensysteme sind die
Mengenaxiome, Anordnungs- und Vollst¨
andigkeitsaxiome f¨
ur die reellen Zahlen
usw. Axiome bzw. Axiomensysteme treten nur in geringer Anzahl auf.
Definition. Definitionen nehmen in der mathematischen Theorie eine beson-
dere Stellung ein. Ihre Hauptaufgabe ist es, die ¨
Ubersichtlichkeit und somit
100 KAPITEL 3. MATHEMATISCHE STRUKTUREN
auch die Verst¨
andlichkeit einer Theorie zu gew¨
ahrleisten. Der Begriff Definition
stammt aus dem lat. efin¯
ire und bedeutet abgrenzen bzw. bestimmen, wobei
f¯
inis f¨
ur Grenze steht [Dud01]. Eine Definition dient als Abk¨
urzung von Sach-
verhalten, die eine wichtige Bedeutung in der zu betrachtenden mathematischen
Theorie besitzen, wie z. B. Vektorraum,lineare Abbildung,Matrizen,Determi-
nante usw. In der Definition m¨
ussen Aussagen genau gekl¨
art und bestimmt
werden. Sie werden dabei mit Hilfe von anderen, schon vorher definierten Be-
griffen und Relationen beschrieben.
Zus¨
atzlich kann den Abk¨
urzungen ein Name, ein Symbol oder eine Symbolfolge
zugeordnet werden.
Beispiel
Die Bezeichnung Gauss-Verfahren steht f¨
ur ein Verfahren, dass eine
Matrix in die Zeilenstufenform bringt.
Der Vektorraum kann durch das Symbol Vbeschrieben werden.
Insbesondere hat eine Definition einen G¨
ultigkeitsbereich, der durch den Sach-
verhalt der mathematischen Theorie geregelt wird.
Es wird zwischen zwei grundlegenden Arten von Definitionen unterschieden:
1. Explizite Definitionen werden in der Mathematik sehr h¨
aufig verwen-
det, indem ein Oberbegriff und die zugeh¨
origen Eigenschaften angegeben
werden.
2. Implizite Definitionen werden h¨
aufig in Axiomen verwendet. Es wird
ein Begriff durch Angabe von Eigenschaften definiert, ohne ihn anzuge-
ben9.
Definitionen d¨
urfen nach Aristoteles keine logischen Widerspr¨
uche, Mehrdeutig-
keiten und Zirkelschl¨
usse enthalten. Sie charakterisieren die Merkmale, die nur
f¨
ur den zu definierenden Begriff existieren. Eine Definition besitzt daher keinen
Wahrheitswert, jedoch muss der Begriff ad¨
aquat beschrieben werden.
9Ein Beispiel sind die Axiome von Peano, die die nat¨
urlichen Zahlen implizit definieren.
3.3. SPRACHSTRUKTUREN 101
Satz. In der Mathematik sind S¨
atze bewiesene Aussagen. Es kann zwischen
S¨
atzen 1. Ordnung und S¨
atzen 2. Ordnung unterschieden werden. S¨
atze 1. Ord-
nung werden direkt aus Axiomen hergeleitet. S¨
atze 2. Ordnung werden aus
S¨
atzen 1. Ordnung abgeleitet. Faktisch wird dies aber nicht gegeneinander ab-
gegrenzt.
Des Weiteren werden drei verschiedene Funktionen von S¨
atzen differenziert, die
durch die pr¨
adikatenlogische Struktur induziert werden:
1. Einzelaussage: Einzelaussagen sind Aussagen ¨
uber ein konkretes Objekt.
Die Menge aller rationalen Zahlen ist abz¨
ahlbar. [Rud02, S. 33]
2. Existenzaussage: Existenzaussagen werden durch den Existenzquantor
induziert und beschreiben die Behauptung ¨
uber die Existenz eines Objek-
tes mit bestimmten Eigenschaften. [...]Dann existiert ein k {1, . . .}so,
dass b1,...,bk1, a, bk+1,...,bnlinear unabh¨
angig sind. [...] [Wue95, S.
362]
3. Allaussage: Allaussagen werden durch den Allquantor induziert und be-
schreiben die Behauptung, dass eine Eigenschaft f¨
ur alle Elemente einer
Grundmenge gilt. Alle unendlichen Teilmenge einer abz¨
ahlbaren Menge
sind abz¨
ahlbar. [Rud02, S. 29]
Wichtige S¨
atze werden h¨
aufig mit Namen gekennzeichnet. Dies dient zur besser-
en Verst¨
andlichkeit des zu betrachenden Sachverhalts. Weniger ber¨
uhmte S¨
atze
werden schlicht nummeriert wie z. B Satz 1. Diese Bezeichnung ist f¨
ur S¨
atze
nicht verbindlich und dient nur zur leichteren Orientierung.
In der deutschen Lehrbuchliteratur gibt es verschiedene Typen von S¨
atzen: Ein
Theorem ist ein Lehrsatz oder Grundsatz. Es steht f¨
ur besonders wichtige
S¨
atze, die in der mathematischen Theorie auftreten und deshalb ausgezeichnet
werden sollen (z. B.: Theorema egregium). Ein Theorem, in dem ein ganzes
Teilgebiet der Mathematik gipfelt, wird als Fundamentalsatz bzw. Haupt-
satz bezeichnet. Er kommt meistens nur ein- oder zweimal pro Fachgebiet vor
(z. B. Fundamentalsatz der Algebra, Hauptsatz der Differential- und Integral-
rechnung). Entsprechend gibt es noch einfache S¨
atze, die wie oben beschrie-
ben je nach ihrer Wichtigkeit einen Namen erhalten oder namenlos bleiben. Ein
wichtiges Kennzeichen von S¨
atzen ist, dass nach ihnen fast immer die Entit¨
at
Beweis folgt.
102 KAPITEL 3. MATHEMATISCHE STRUKTUREN
Korollar. Der Begriff Korollar stammt aus dem lat. cor¯ollar und bedeutet
Kr¨
anzchen10. Ein Korollar im mathematischen Sinne ist eine triviale Schluss-
folgerung, d. h. eine Sammlung von Folgerungen, die sich aus einem vorherge-
hende Satz ohne großen Aufwand ergeben. In diesem Zusammenhang ist auch
der Hilfssatz zu nennen, der eine rein technische Aussage beschreibt. Dieser
wird in der Regel nur im Beweis eines Satzes verwendet und nicht mehr in der
weiteren Theorie.
Lemma. Der Begriff Lemma stammt ebenfalls aus dem gr.-lat. und bedeutet
Titel oder Stichwort [Dud01]. Ein Lemma ist ein Hilfssatz, der im Rahmen einer
Beweisf¨
uhrung erstellt wird, aber auch einen wichtigen Schl¨
usselgedanken kenn-
zeichnet (z. B.: Lemma von Zorn, Lemma von Sperner). Dies unterscheidet
es vom Hilfssatz.
Proposition. Propositionen stehen im Lat. f¨
ur Satz [Dud01]. In der deut-
schen Literatur werden sie auch h¨
aufig als Bemerkung bezeichnet. Damit sind
Aussagen gemeint, die nicht so wichtig wie ein Satz sind, aber auch nicht den
Rang eines Hilfssatzes besitzen.
Beweise. In einer deduktiven Theorie wie der Mathematik m¨
ussen Aussagen
bewiesen werden, wenn diese nicht dem Entit¨
atentyp Axiom oder Definition ent-
sprechen. Eine Definition besitzt keinen Wahrheitswert und ist somit im Sinne
der Logik keine Aussage, die bewiesen werden muss.
Der Vorgang des Beweisens bedeutet, aus bekannten Aussagen (Axiomen,
S¨
atzen) mittels Schlussregeln neue Aussagen zu best¨
atigen. Dabei werden in der
Mathematik grunds¨
atzlich zwei verschiedene Beweisarten unterschieden: direkte
und indirekte Beweise. Beim direkten Beweis wird ausgehend von Voraussetzun-
gen (Pr¨
amissen) die Behauptung gefolgert. Beim indirekten Beweis (Reductio
ad absurdum) wird das logische Gegenteil der zu betrachtenden Behauptung als
wahr angenommen. Eine solche Behauptung muss dann zu einem Widerspruch
zu den Voraussetzungen gef¨
uhrt werden.
Des Weiteren existieren noch einige spezielle Beweisbezeichnungen. Der Beweis
durch vollst¨
andige Induktion ist ein Beweisschema, bei dem die G¨
ultigkeit des
10Diminutivbildung des Wortes Korona [Dud01]
3.3. SPRACHSTRUKTUREN 103
Schemas vorausgesetzt wird. Dabei muss gezeigt werden, dass bestimmte Vor-
aussetzungen (Pr¨
amissen) erf¨
ullt werden, woraus in diesem Beweisschema dann
automatisch die Behauptung folgt. Existenzs¨
atze werden durch konstruktive
oder nicht-konstruktive Beweise nachgewiesen. Der konstruktive Beweis be-
schreibt eine L¨
osungsmethode, die entweder explizit vorgestellt oder skizziert
wird. Beim nicht-konstruktiven Beweis wird anhand von Eigenschaften auf die
Existenz einer L¨
osung geschlossen. Oft wird dies durch einen indirekten Be-
weis gezeigt. Bei ¨
Aquivalenzaussagen wird h¨
aufig eine Fallunterscheidung durch-
gef¨
uhrt, um zuerst eine Richtung einer Implikation und dann die umgekehrte
Richtung zu beweisen.
Eine tiefergehende Betrachtung von Beweisen soll hier nicht diskutiert werden.
Zur Vereinfachung der Analyse der mathematischen Sprache sollen Beweise in
einem ersten Schritt nicht verwendet werden. Somit sind sie nicht Gegenstand
dieser Arbeit. Jedoch wird im Kapitel 5 auf die Wichtigkeit der Beweise in der
Mathematik eingegangen.
Beispiel. Ein Beispiel steht f¨
ur einen speziellen bzw. einzelnen Fall, der etwas
Allgemeines n¨
aher erl¨
autert oder erkl¨
art. Durch den strukturellen Aufbau der
Mathematik kommt es in der Lehrbuchliteratur sehr h¨
aufig vor, dass Beispiele
im Textgef¨
uge ebenfalls eine Entit¨
at darstellen und somit eindeutig zu unter-
scheiden sind. Es gibt noch eine weitere Art von Beispielen die Gegenbeispiele.
Dies sind Beispiele, die eine Definition oder die Voraussetzung eines Satzes nur
fast erf¨
ullen. Auch dieser Typ der Entit¨
at soll zun¨
achst nicht weiter betrachtet
werden.
3.3.2 Binnenstrukturebene
Mathematische Texte besitzen durch die Existenz der oben beschriebenen En-
tit¨
aten einen strukturierten Textaufbau, der den gesamten Text in Bl¨
ocke zer-
legt. Aber auch die Entit¨
aten selbst weisen eine interne Struktur auf, die f¨
ur
die einzelnen Typen von Entit¨
aten charakteristisch sein k¨
onnen. Diese Struktur
wird als Binnenstruktur bezeichnet [Jes04]. Alle S¨
atze sowie Definitionen besit-
zen die grundlegende Struktur (Abbildung 3.5): Voraussetzungen,Aussagen
und Eigenschaften11.
11Eigenschaften k¨
onnen wieder Aussagen enthalten.
104 KAPITEL 3. MATHEMATISCHE STRUKTUREN




















































Voraussetzung
Eigenschaften
Aussage
Abbildung 3.5: Binnenstruktur von Definitionen und S¨
atzen
Die einzelnen Elemente der Binnenstruktur sind grammatikalisch an ihren Ver-
wendungszweck angepasst (Kapitel 3.3.3). In Voraussetzungen werden diejeni-
gen mathematischen Objekte festgelegt, die f¨
ur die Betrachtung der Entit¨
at
von Bedeutung sind. So werden z. B. Symbole oder Wertebereiche festgelegt.
Die syntaktischen Strukturen in den Aussagen sind an die entsprechenden En-
tit¨
atentypen (Kapitel 3.3.1) gebunden. In Definitionen wird eine Aussage in
Definiendum und Definiens zerlegt. Das Definiendum ist eine Bezeichung f¨
ur
das neu definierte mathematische Objekt oder den neu definierten mathema-
tischen Sachverhalt. Das Definiens ist derjenige Ausdruck, der das Definiendum
mithilfe der mathematischen Sprache beschreibt. Eine Definition kann weiter-
hin noch Eigenschaften auflisten, die das Definiendum besitzt (Abbildung 3.6).
Dabei k¨
onnen Eigenschaften selbst wieder Eigenschaftslisten enthalten.










































































































[...] [...]
Voraussetzung Voraussetzung
Definiendum
Definiendum
Definiendum Definiens
Definiens
Definiens
Definiendum Definiens
Eigenschaften
Abbildung 3.6: Binnenstruktur der Definition [Jes04, S. 120]
Beispiel 3.3.1 (Definition)
In der folgenden Definition sind die verschiedenen Binnenstrukturen ebenfalls
3.3. SPRACHSTRUKTUREN 105
farbig unterlegt. Gr¨
un steht f¨
ur die Voraussetzungen, Blau f¨
ur das Definiens und
Rot f¨
ur das Definiendum. Eine Eigenschaftsauflistung zeigt dieses Beispiel nicht.
Definition
Gegeben sei eine Folge {pn}.Man betrachte eine Folge {nk}positiver Zahlen
mit n1< n2....Dann heißt die Folge {pnk}eine Teilfolge von {pn}.[Rud02,
S. 59]
Die Satzbinnenstruktur kann nicht so einfach strukturiert werden wie die
Definitionsbinnenstruktur. In Kapitel 3.3.3 wird gezeigt, dass verschiedene En-
tit¨
atentypen, wie z. B. Satz und Korollar, nicht in ihren syntaktischen Struktu-
ren zu unterscheiden sind. Als gemeinsames Merkmal besitzen sie die syntakti-
sche Struktur der Pr¨
adikatenlogik (Kapitel 3.2.2). Die Aussagen werden daher
mithilfe der sprachlichen ¨
Aquivalente der logischen Operatoren aufgebaut. Ver-
wendung finden hierbei die Implikation (Abbildung 3.7) und die ¨
Aquivalenz
(Abbildung 3.8).












































































































[...] [...]
Forderung Folgerung Forderung 1
Forderung 2
Forderung 3
Folgerung 1
Folgerung 2
Folgerung 3
Voraussetzung Voraussetzung
Abbildung 3.7: Binnenstruktur des Satzes f¨
ur Implikationen [Jes04, S. 121]
Beispiel 3.3.2 (Satz mit Implikation)
Im folgenden Satz sind die verschiedenen Binnenstrukturen farbig unterlegt.
Gr¨
un steht f¨
ur die Voraussetzung12, Blau f¨
ur die Forderung und Rot f¨
ur die
Folgerung.
12Diese kennzeichnet allgemeine Voraussetzungen, die f¨
ur den Satz gemacht werden. Meis-
tens werden diese einfach weggelassen.
106 KAPITEL 3. MATHEMATISCHE STRUKTUREN
Satz
Sei Aeine Algebra reeller stetiger Funktionen auf einer kompakten Menge K.
Separiert Adie Punkte auf Kund verschwindet in keinem Punkt von K,
dann besteht die gleichm¨
aßig abgeschlossene H¨
ulle Bvon Aaus allen stetigen
Funktionen auf K.[Rud02, S. 189]












































































































[...] [...]
Aussage 1 Aussage 2 Aussage 1
Aussage 3
Aussage 2
Aussage 3
Aussage 4
Aussage 4
Voraussetzung Voraussetzung
Abbildung 3.8: Binnenstruktur des Satzes f¨
ur ¨
Aquivalenzen [Jes04, S. 121]
Beispiel 3.3.3 (Satz mit ¨
Aquivalenz)
In dem folgenden Satz sind die verschiedenen Binnenstrukturen wieder farbig
unterlegt. Gr¨
un Kennzeichnung steht f¨
ur die Voraussetzung13, Blau f¨
ur die
Aussage 1 und Dunkelgrau f¨
ur die Aussage 2.
Satz
F¨
ur FEnd(V)sind folgende Bedingungen ¨
aquivalent:
1. Fist surjektiv.
2. detF 6= 0
[Fis00, S. 203]
Eine weitere einfache Satzbinnenstruktur ist die einfache Aussage. Außer den
Voraussetzungen besitzt die einfache Aussage keine weiteren inneren Struktu-
rierungen (Abbildung 3.9).
13Diese kennzeichnet allgemeine Voraussetzungen, die f¨
ur den Satz gemacht werden. Meis-
tens werden diese einfach weggelassen.
3.3. SPRACHSTRUKTUREN 107




































Aussage
Voraussetzung
Abbildung 3.9: Binnenstruktur des einfachen Satzes
Beispiel 3.3.4 (Einfache Aussage)
Die Teilfolgengrenzwerte einer Folge {pn}in einem metrischen Raum Xbilden
eine abgeschlossene Teilmenge von X. [Rud02, S. 60]
Axiome zeigen eine eigenwillige Struktur. Sie sind zum Teil mit den S¨
atzen
verwandt, zeigen aber auch definitionscharakteristische Strukturierungen. Au-
ßerdem m¨
ussen Axiome zwangsl¨
aufig mit außermathematischen Begriffen ope-
rieren. Daher l¨
asst sich bei ihnen keine klare Binnenstruktur erkennen14.
Zwischen den einzelnen Binnenstrukturen existieren Abh¨
angigkeiten. So wer-
den in den Voraussetzungen Symbole und Bezeichnungen festgelegt, die f¨
ur ei-
ne Interpretation der Aussage wichtig sind. Die Identifikation solcher Zusam-
menh¨
ange wird dann durch die Diskurssemantik beschrieben (Kapitel 2.4).
3.3.3 Satzstrukturebene
Die Satzstrukturen in mathematischen Definitionen, S¨
atzen und Axiomen zeigen
stereotype syntaktische Konstruktionen wie z. B. Metaphern und Phrasen. So
sind Definitionen an ihrer syntaktischen Struktur und durch die Verwendung
von Schl¨
usselverben wie z B. heißen leicht zu erkennen. S¨
atze dagegen sind zwar
als solche wahrzunehmen, es existieren aber keine Unterscheidungsmerkmale
zwischen den einzelnen Satztypen (Satz,Korollar und Proposition).
In den hier betrachteten Texten k¨
onnen mathematische Aussagen stets als
wahr angenommen werden. Dementsprechend entf¨
allt der Teil der pragma-
tischen Analyse (Kapitel 2.4), welche der beabsichtigte Wirkung eines Sat-
zes bez¨
uglich eines Kommunikationspartners betrachtet. Die sprachlichen Kon-
struktionsm¨
oglichkeiten sind somit begrenzt.
14Beispiele f¨
ur Axiome im Kapitel 3.2.3
108 KAPITEL 3. MATHEMATISCHE STRUKTUREN
Mathematische Aussages¨
atze werden durch die Pr¨
adikatenlogik 1. Stufe cha-
rakterisiert. So werden mit Hilfe einer geringen Anzahl von verwendeten logi-
schen Operatoren (Junktoren) und Quantoren (Kapitel 3.2.2) syntaktisch ein-
fache S¨
atze konstruiert. F¨
ur diese logischen Operatoren und Quantoren steht
nur eine begrenzte Anzahl an syntaktischen Konstruktionen zur Verf¨
ugung. Die
dabei entstehenden Satzstrukturen sind meistens kurz, klar und leicht ¨
uber-
schaubar konstruiert. Durch die Verwendung von feststehenden Phrasen wer-
den somit viele syntaktische und semantische Ambiguit¨
aten vermieden, weil die
einzelnen Konstruktionen entsprechend festgelegte Bedeutungen besitzen. So-
mit wird eine syntaktische und semantische Analyse wesentlich vereinfacht. Ein
weiterer Hinweis f¨
ur die M¨
oglichkeit einer strafferen syntaktischen Analyse ist
die Verwendung nur einer Zeitform des Pr¨
asens und die Verwendung ei-
nes bestimmten Modus entweder Indikativ oder Konjunktiv wobei der
Konjunktiv in Voraussetzungen verwendet wird.
Der Genus Verbi Passiv und Aktiv wird in der deutschen Gegenwartss-
prache ungleich verwendet: 93% entfallen auf den Aktiv und 7% auf den
Passiv [Dud01, S. 172]. In der Mathematik dagegen tritt der Passiv h¨
ochst sel-
ten auf. So wird in Definition selten die Bezeichnung wird genannt verwendet.
Beispiel
[...]Dann wird der Ausdruck P
k=cakReihe genannt. [Wue95, S. 119]
Außerdem scheint die Anzahl der verwendeten Verben gering zu sein. Dabei
treten besonders h¨
aufig die W¨
orter sein sowie heißen, existieren, ge-
ben, folgen usw. auf. Einige dieser W¨
orter stehen als ¨
Aquivalent f¨
ur logische
Operatoren (folgen) und Quantoren (existieren). Andere W¨
orter hingegen
sind an die Entit¨
aten gebunden. So findet man in [Fis00] bei ca. 34 explizit als
Entit¨
at angegebenen Definitionen 28 mal das Wort heißen (82 %). In [Wue95]
wird heißen bei 173 Definitionen 92 mal (53 %) gebraucht und : 31 mal (15
%).
Durch die Verwendung von mathematischen Symbolen entstehen grundlegende
Schwierigkeiten f¨
ur die syntaktische und semantische Analyse. Mathematische
Symbolfolgen wie z. B. Formeln weisen eine ihnen eigene Syntax auf, die zwar
prinzipiell einfach ist und auch durch die Pr¨
adikatenlogik strukturiert wird,
3.3. SPRACHSTRUKTUREN 109
jedoch nicht kompatibel zur syntaktischen Struktur der nat¨
urlichsprachlichen
Texte ist.
Mathematische Zeichen werden h¨
aufig im Zusammenhang mit und als Nomi-
nalphrasen verwendet und stellen in mathematischen Texten eine ¨
aquivalente
Bezeichnung f¨
ur diese dar.
Beispiel
1. Jedes Polynom fC(f)zerf¨
allt in Linearfaktoren, [...] [Fis00, S. 63]
2. Rzusammen mit der Addition +ist eine abelsche Gruppe. [Fis00, S. 54]
Vielfach werden im weiteren Verlauf eines Textes nur noch diese Abk¨
urzun-
gen verwendet, so dass mathematische Zeichen in einer linguistischen Analyse
ber¨
ucksichtigt werden m¨
ussen. Die interne Struktur solcher Symbolfolgen kann
komplex sein. So kann es passieren, dass in ihnen weitere f¨
ur die linguistische
Analyse wertvolle Informationen enthalten sind.
Beispiel
{an}nNbeschr¨
ankt :es gibt ein cRmit |an|≥ c(nN).
[Wue95, S. 108]
Des Weiteren enthalten mathematische Entit¨
aten auch grammatikalisch nicht
korrekte Strukturen, z. B. finjektiv.. So fehlt h¨
aufig bei Aufz¨
ahlungen das
entsprechende Verb. Solche Strukturen gilt es zu erkennen und gegebenenfalls
zu behandeln.
Eine besondere Problematik entsteht durch die zahlreichen Unterschiede der
Sprachstile der verschiedenen Autoren. So verwendet jeder Autor eine f¨
ur ihn
spezifische Sammlung von Phrasen.
Ein mathematischer Text ist aber kein Schulaufsatz, bei dem die
Ausdrucksvielfalt die entscheidende Rolle spielt; dennoch steht dem
sensiblen Schreiber zur Formulierung eines logischen Schlusses eine
Vielfalt von Ausdrucksm¨
oglichkeiten offen. [Beu95, S. 33]
110 KAPITEL 3. MATHEMATISCHE STRUKTUREN
Basiskonstruktionen.
In der mathematischen Sprache treten immer wiederkehrende Satzkonstruktio-
nen auf, die als syntaktische Grundlage die Pr¨
adikatenlogik widerspiegeln. Hier-
bei werden den logischen Operatoren sprachliche Pendants zugeordnet. Sicher-
lich gibt es dabei eine Vielzahl an sprachlichen Ausdrucksm¨
oglichkeiten f¨
ur die
Formulierung der logischen Operatoren, die insbesondere in den Zwischentex-
ten wie z. B. in Motivationen in der mathematischen Literatur h¨
aufig verwendet
werden. In den festgelegten Entit¨
aten werden die Zuordnungen dagegen streng
gehandhabt, so dass nur eine geringe Anzahl von Standardformulierungen exis-
tiert.
Implikationen AB.In Kapitel 3.3.2 wurde festgestellt, dass eine Impli-
kation stets aus einer Forderung und einer Folgerung besteht. Da Implikationen
in mathematischen Texten vielfach verwendet werden, gibt es zahlreiche Stan-
dardformulierungen f¨
ur diesen logischen Operator. Eine der h¨
aufigsten Stan-
dardkonstruktionen, die in S¨
atzen verwendet wird, ist:
[VERB1] A, (so/dann) [VERB2] B.
Die Bezeichnung [VERB] steht f¨
ur ein beliebiges Verb, das in der mathema-
tischen Sprache an dieser Stelle gesetzt wird. Dabei tritt das Verb sein beson-
ders h¨
aufig in beiden m¨
oglichen Positionen [VERB1] und [VERB2] auf. Dagegen
wird das Verb gelten h¨
aufig in der Position [VERB2] eingesetzt.
Beispiel 3.3.5 (Implikation I)
Sind f, g K[t]und ist g6= 0,so gibt es dazu eindeutig bestimmte
Polynome q, r K[t]derart, dass f=q·g+rund deg r < deg g. [Lor96,
S. 15]
Der Satz besteht nach Abbildung 3.10 aus einer Folgerung und einer For-
derung. Jede dieser Binnenstrukturen besitzt einen Indikator, der sie als
Folgerung oder Forderung kennzeichnet, und einen mathematischen In-
halt.
3.3. SPRACHSTRUKTUREN 111
Satz
Forderung Folgerung
Indikator Inhalt Indikator Inhalt
notwendig und hinreichend dafür, dass [...][...] Dann
Abbildung 3.10: Basisstrukturanalyse f¨
ur Implikationskonstruktionen
Konvergiert die Potenzreihe Pin einem Punkt z06= 0, so konvergiert sie
absolut in jedem Punkt zCmit |z|<|z0|. [K¨
o01, S. 51]
Weitere Konstruktionen, die der obigen Standardformulierung sehr ¨
ahnlich sind,
aber nicht so oft verwendet werden, sind:
wenn A[SEIN/GELTEN], dann [SEIN/GELTEN] B;
wenn A[GELTEN], so [GELTEN] B;
falls A[VERB], dann [VERB] B;
B[VERB] (nur/h¨
ochstens) dann, wenn A;
Beispiel 3.3.6 (Implikation II)
Sei AV.Falls f¨
ur ein aA Ta(A)Teilraum von V,dann ist Tb(A)Teilraum
f¨
ur alle bA, also Aein affiner Teilraum von V. [Wue95, S. 388 (2) Satz]
Durch die Verwendung der W¨
orter hinreichend und notwendig entstehen fol-
gende Bedeutungen: Hinreichend steht daf¨
ur, dass die Forderung Aausreicht
damit auch die Folgerung Bwahr ist. Die Bezeichnung notwendig steht daf¨
ur,
dass ohne die Folgerung Bdie Forderung Anicht erf¨
ullt sein kann15.
15Ahinreichend f¨
ur B: AB;Anotwendig f¨
ur B:BA
112 KAPITEL 3. MATHEMATISCHE STRUKTUREN
Satz
Forderung Folgerung
Indikator Inhalt Indikator Inhalt
[...] dann [...]Falls
Abbildung 3.11: Basisstrukturanalyse f¨
ur Implikationskonstruktionen
Aist hinreichend f¨
ur/ dies ist hinreichend f¨
ur/dies ist eine hinreichende
Bedingung f¨
ur B;
Aist notwendig f¨
ur/ eine notwendige Bedingung daf¨
ur ist B;
Beispiel 3.3.7 (Implikation III)
Die offene Menge URnsei wegzusammenh¨
angend und f:U Rsei
differenzierbar.
Dann ist die Bedingung
f0(x,h) = 0 f¨
ur alle xUund f¨
ur alle hRn
notwendig und hinreichend daf¨
ur, dass fkonstant ist. [BF96, S.116]
Forderung
Satz
Folgerung
Indikator Inhalt Indikator Inhalt
Dann [...] notwendig und hinreichend dafür, dass [...]
Abbildung 3.12: Basisstrukturanalyse f¨
ur Implikationskonstruktionen
3.3. SPRACHSTRUKTUREN 113
In der deutschen Lehrbuchliteratur wird auch oftmals das Wort folgern anstel-
le von implizieren verwendet. Aus diesen beiden Verben k¨
onnen verschiedene
Konstruktionen gebildet werden:
aus Afolgt B
Adies hat zu Folge, dass/ man kann folgern, dass B
Afolglich [VERB] B;
A, dies impliziert B;
A,daraus ergibt sich/ daraus erhalten wir/ das bedeutet B;
Beispiel 3.3.8 (Implikation IV)
Sei Vein K-Vektorraum. Eine endliche Familie (v1,...,vr)von Vektoren aus
Vheißt linear unabh¨
angig,falls gilt: Sind λ1,...,λrKund ist
λ1v1+...+λrvr= 0,
so folgt
λ1=...=λr= 0.
[Fis00, S.77]
¨
Aquivalenz: AB.Im Kapitel 3.3.2 wurde neben der Implikation auch die
¨
Aquivalenz als weiterer wichtiger logischer Operator f¨
ur die Konstruktion von
mathematischen S¨
atzen verwendet. Dabei wird eine Aussage zu einer anderen
Aussage ¨
aquivalent gesetzt. Auch f¨
ur die ¨
Aquivalenz gibt es Standardkonstruk-
tionen:
114 KAPITEL 3. MATHEMATISCHE STRUKTUREN
Aist ¨
aquivalent zu/ gleichbedeutend mit B;
A[gelten] genau dann, wenn B[gelten];
A[gelten] dann und nur dann, wenn B[gelten];
A[sein] hinreichend und notwendig f¨
ur B;
Beispiel 3.3.9 ( ¨
Aquivalenz)
Eine Reihe Pkakmit Gliedern ak0konvergiert genau dann, wenn die
Folge ihrer Partialsummen beschr¨
ankt ist. [K¨
o01, S.61 Satz]
Satz
Aussage 1 Aussage 2
Inhalt Indikator
genau dann, wenn
Inhalt
[...][...]
Abbildung 3.13: Basisstrukturanalyse f¨
ur ¨
Aquivalenzkonstruktionen
In der Abbildung 3.13 ist die Struktur des Satzes schematisch dargestellt.
Die beiden Aussagen werden durch den Indikator genau dann, wenn
verbunden.
Ist Xeine endliche Menge, so sind f¨
ur die Abbildung f:X Xfolgende
Bedingungen ¨
aquivalent:
i) fist injektiv.
ii) fist surjektiv.
iii) fist bijektiv.
[Fis00, S.34]
In der Abbildung 3.14 werden drei Aussagen ¨
uber einen Indikator verbun-
den.
3.3. SPRACHSTRUKTUREN 115
Satz
Aussage 1
Inhalt Inhalt Inhalt
[...] [...]
Indikator
folgende Bedingungen äquivalent:
[...]
Aussage 2Aussage 2
Abbildung 3.14: Basisstrukturanalyse f¨
ur ¨
Aquivalenzkonstruktionen
Negation ¬, Konjunktion und Disjunktion .Diese drei Junktoren
werden im allgemeinen sehr einfach konstruiert. F¨
ur die Negation stehen sprach-
liche Konstrukte wie kein und nicht zur Verf¨
ugung. F¨
ur die Konjunktion
wird sehr h¨
aufig das Wort und verwendet. Man kann aber auch Konstruk-
tionen wie sowohl Aals auch B vorfinden. F¨
ur die Disjunktion findet man
haupts¨
achlich oder-Konstruktionen16.
Beispiel 3.3.10 (Negation und Konjunktion)
Sei fR[t]und λCeine nicht reelle Nullstelle von f,sowie
g:= (tλ)(t¯
λ)C[t].[...][Fis00, S. 64]
Ist Kein K¨
orper, so ist char(K)entweder Null oder eine Primzahl17.
[Fis00, S. 57]
NP
ADJ
NEG NPNPNDET
eine nicht reelle Nullstelle
NP
Konjunktion
Disjunktion
Abbildung 3.15: Basisstrukturanalyse von Quantorenkonstruktionen
16Allerdings muss mit dem Wort oder vorsichtig umgegangen werden, so ist z. B. entweder
[. . .]oder keine Disjunktion
17Hier wird implizit sogar mehr gesagt: Null ist keine Primzahl.
116 KAPITEL 3. MATHEMATISCHE STRUKTUREN
In Abbildung 3.15 wird auf der linken Seite die Nominalphrase eine nicht reelle
Nullstelle in einen Artikel, ein Substantiv und ein getyptes Adjektiv zerlegt.
Der Typ NEG bedeutet, dass das Adjektiv verneint wird. Auf der rechten Seite
setzt sich eine Nominalphrase aus zwei weiteren Nominalphrasen zusammen, die
durch eine Konjunktion und oder eine Disjunktion oder verbunden sind.
Quantoren Durch die Verwendung von Quantoren der Pr¨
adikatenlogik wird
die syntaktische sowie die semantische Struktur reichhaltiger. Wir unterschei-
den zwei Arten von Quantoren, Allquantor und Existenzquantor, die ebenfalls in
ihrer sprachlichen Form Standardkonstruktionen besitzen. Folgende Standard-
konstruktionen werden f¨
ur den Allquantor verwendet:
F¨
ur alle/jedes/ein beliebiges x[...]
Jedes / zu jedem x[...]
Alle x[...]
Sei xbeliebig [...]
Beispiel 3.3.11 (Allquantor)
F¨
ur alle Regelfunktionen f1, f2, f und [...] [BF00, S.356]
Ein weiterer Quantor ist der Existenzquantor, der nur die Existenz eines be-
stimmten Objektes kennzeichnet. Auch daf¨
ur existieren Standardkonstruktio-
nen:
Es gibt ein x[...];
F¨
ur ein geeignetes xgilt [...];
[SEIN/HABEN] ein x[...];
3.3. SPRACHSTRUKTUREN 117
Beispiel 3.3.12 (Existenzquantor)
Jedes Polynom fC[t]zerf¨
allt in Linearfaktoren, d. h. es gibt ein aund
λ1,...λnCmit n= deg f, so dass f=a(tλ1)·...·(tλn).[Fis00,
S.63]
N
NP NP
QUANT
ALL N QUANT EX
Für alle Regelfunktionen Es gibt ein a
Abbildung 3.16: Basisstrukturenanalyse
In Abbildung 3.16 wird die Nominalphrase in einen Quantor (QUANT) und ein
Substantiv zerlegt. Der Allquantor wird durch ALL und der Existenzquantor
durch EX getypt.
Mengentheoretische Bezeichnungen. Auch f¨
ur das nicht-logische Zeichen
gibt es sprachliche Standardkonstruktionen. Man beachte jedoch, dass in Tex-
ten fast ausschließlich die Abk¨
urzung verwendet wird:
1. [...] ist Element von [...]
2. [...] kommt in [...] vor
Beispiel 3.3.13 (Elemente von Mengen)
F¨
ur alle Regelfunktionen f1, f2, f und alle c R gilt [...]([BF00, S.356])
Voraussetzung. Jeder Satz und jede Definition in der Mathematik besitzt in
seiner Binnenstruktur die Festlegung von Voraussetzungen, d. h. die Festlegung
derjenigen mathematischen Objekten, die in der Entit¨
at verwendet werden. Die
Aufz¨
ahlung von Voraussetzungen erkennt man deutlich an der syntaktischen
Struktur, die im untenstehenden Kasten schematisch dargestellt wird. Dabei
118 KAPITEL 3. MATHEMATISCHE STRUKTUREN
wird sehr h¨
aufig das Verb sein mit den Verbformen sei und seien ver-
wendet.
(es) sei [...], ist [...], f¨
ur [...], gegeben (ist/sei) [...], es gelte [. . .]
Beispiel 3.3.14 (Voraussetzung)
1. Sei Vein Vektorraum ¨
uber den K¨
orper Kund Teine linear unabh¨
angige
Teilmenge von V. [Lor96]
2. Ist Fein Zwischenk¨
orper der algebraischen Erweiterung E/K, so gilt
[E:K]s= [E:F]s·[F:K]s [Lor96, S.87]
3. F¨
ur teilerfremde Ideale I1, I2von Rgilt I1I2=I1I2 [Lor96, S.54]
4. Gegeben seien Abbildungen fi:Xi Yi, i I, Xi6=,zwischen to-
pologischen R¨
aumen Xiund Yi. Die Abbildung f:QiIXiQiIYi
(xi)iI7→ (fi(xi))xiIist genau dann stetig, wenn f¨
ur alle iIdie Abbil-
dungen fistetig sind. [vQ01, S.41]
5. Es gelte fk L1(Rn)und ... [BF96, S.302]
In Abbildung 3.17 wird die Analyse des einfaches Satzes Sei Vein Vektorraum
¨
uber K aus Beispiel 3.3.14 skizziert. Das Verb sei wird auf die Position
2 hinter der Nominalphrase verschoben und in den Indikativ umgewandelt18.
Danach wird der Satz nach bekanntem Muster zerlegt (Kapitel 2.4). In einem
n¨
achsten Schritt werden die Nominalphrase als das Definiendum und das in der
Verbalphrase befindliche Definiens erkannt.
Satzstrukturen in Entit¨
aten
Axiom. An der Satzstruktur kann man Axiome nicht unbedingt erkennen, da
sie syntaktisch mit S¨
atzen und Definitionen gleichzusetzen sind. Daher findet
man beide syntaktischen Strukturen wieder, die miteinander vermischt werden.
18Im mArachna-Projekt werden Prepositionalphrasen (PP) ohne Ausnahme als spezielle
Nominalphrase verarbeitet, jedoch zur Zeit noch nicht gesondert aufgef¨
uhrt.
3.3. SPRACHSTRUKTUREN 119
Satz
NP VP
V NP
V ist ein Vektorraum über K.
Definiens
V ein Vektorraum über K.
ist
Sei V ein Vektorraum über K.
Vorverarbeitung
[ist, V , Vektorraum über K]
Definiendum
Abbildung 3.17: Analyse der Voraussetzungen
Beispiel 3.3.15 (Axiom 3.2.7)
Leere Menge: Es gibt eine leere Menge.
Definition. Definitionen sind relativ einfache Strukturen, die leicht ¨
uber das
verwendete Verb erkannt werden. Außerdem steht nur eine begrenzte Anzahl
von Verben zur Verf¨
ugung: heißen, bezeichnen, nennen, definieren, usw.
H¨
aufig ist das Definiendum gegen¨
uber den anderen W¨
orter in der Entit¨
at her-
vorgehoben. Ebenfalls sehr h¨
aufig werden Klammern verwendet, die eine Nomi-
nalphrase einschließen und somit auch ein Definiendum sein k¨
onnen. Diese Art
des Definierens wird h¨
aufig in der Eigenschaftsauflistung verwendet, die dann
eine Formel bzw. eine Aussage bezeichnet (Kapitel 3.3.4).
Eine h¨
aufige Grundstruktur ist:
120 KAPITEL 3. MATHEMATISCHE STRUKTUREN
Definiendum Symbol heißt Definiendum Bezeichnung wenn gilt:
Eigenschaften
In den Eigenschaften werden mathematische Aussagen aufgelistet, die ihrerseits
auch wieder einen Namen bekommen k¨
onnen. Sie k¨
onnen aber auch nur mathe-
matische Formeln bzw. Aussagen sein.
Beispiel 3.3.16 (Gruppe)
Eine Menge Gzusammen mit einer Verkn¨
upfung heißt Gruppe, wenn folgende
[Eigenschaften] erf¨
ullt sind:
G1 (ab)c=a(bc)f¨
ur alle a, b, c G(Assoziativgesetz)
G2 Es gibt ein eG(neutrales Element genannt) mit den folgenden Eigen-
schaften:
ea=af¨
ur alle gG
Zu jedem aGgibt ein a0G(inverses Element von a genannt)
mit a0a=e.
[Fis00, S.41]
Analyse des Beispiel 3.3.16 Die Definition aus dem Beispiel 3.3.16 kann in
Unterabschnitte zerlegt werden:
Teil 1: Eine Menge Gzusammen mit einer Verkn¨
upfung heißt Gruppe, wenn
folgende Eigenschaften erf¨
ullt sind:;
Teil 2: (ab)c=a(bc)f¨
ur alle a, b, c G(Assoziativgesetz);
Teil 3: Es gibt ein eG(neutrales Element genannt) mit den folgenden Ei-
genschaften:
Teil 4: ea=af¨
ur alle gG
Teil 5: Zu jedem aGgibt ein a0Ginverses Element von a genannt) mit
a0a=e.
3.3. SPRACHSTRUKTUREN 121
Satz
Hauptsatz Nebensatz
heißt
NP VP
V NP NP NP
NP VP
folgende Axiome sind erfüllt
Verknüpfung [Symbol] GruppeEine Menge [Symbol]
Konjunktion: wenn
Abbildung 3.18: Syntaktische Analyse des Beispiels 3.3.16 Teil 1
Teil 1 in der Definition l¨
asst sich in Hauptsatz und Nebensatz zerlegen. Der
Hauptsatz definiert die Gruppe, gekennzeichnet durch das Verb heißen. In Ab-
bildung 3.18 ist die syntaktische Analyse des Hauptsatzes auf der linken Seite
zu sehen. Die Struktur l¨
asst sich leicht aufl¨
osen. Der Nebensatz leitet die Ei-
genschaftsliste ein, gleichzeitig wird durch die Konstruktion wenn [. . .]erf¨
ullt
sind gesagt, dass die Definition nur gilt, wenn die folgenden Eigenschaften
erf¨
ullt werden.
Teil 2, 3 und 4 ist syntaktisch ebenfalls leicht zu analysieren. Eine Formel gefolgt
von einer Klammer deutet auf eine Definition hin. Daher wird der Satz durch
eine Vorverarbeitungsregel19 in eine Aussage und eine Definition zerlegt. Diese
werden dann getrennt syntaktisch analysiert. Des Weiteren wird hierbei eine
Formel [F1] wie ein Substantiv behandelt. Da es kein Substantiv ist, wird im
weiteren Verlauf eine Formel einen neuen Worttyp MathWord zugeordnet.
Eine weitere Konstruktionsm¨
oglichkeit wird durch mathematische Symbole ge-
geben. So kann der ¨
Aquivalenzoperator verwendet werden, um ein Defi-
niendum zu definieren, wobei es dann leicht als solches zu erkennen ist wegen
::
Beispiel 3.3.17
Sei AR
(1) Aoffen :zu xAexistiert eine ε-Umgebung Uε(x)von xmit Uε(x)A.
[...]
19Die Bildung der Vorverarbeitungsregeln werden anhand des Beispieles im Kapitel 4 n¨
aher
erl¨
autert.
122 KAPITEL 3. MATHEMATISCHE STRUKTUREN
[F1] für alle [F2] (Assoziativgesetz).
Für alle [F2] gilt [F1].
[F1] heißt Assoziativgesetz.
Satz
NP VP
V NPMW QUANT
NP VP
VMW
Für alle gilt [F1] [F1] heißt Assoziativgesetz
Satz
NP
[F2]
Vorverarbeitung
Abbildung 3.19: Syntaktische Analyse des Beispiels 3.3.16 Teil 2
[Wue95, S.86]
In diesem Fall wird die linke Seite des Satzes als Definiendum angenommen. Der
Satz auf der rechten Seite ist das Definiens und muss weiter analysiert werden.
Weitere Beispiele f¨
ur Definitionen sind:
Beispiel 3.3.18 (Dimension eines Vektorraums)
Ist Vein K-Vektorraum,so definieren wir
dimK(V) = (,falls Vkeine endliche Basis besitzt,
r, falls Veine Basis der L¨
ange rbesitzt.
dimKVheißt die Dimension von V¨
uber K.[...][Fis00, S.86]
Beispiel 3.3.19 (Zeilenrang und Spaltenrang einer Matrix)
F¨
ur eine Matrix AM(m×n;K)sei
Zeilenrang A=dim ZR(A)und
Spaltenrang A=dim SR(A)
[Fis00, S.91]
3.3. SPRACHSTRUKTUREN 123
Satz
NP VP
V NP
NP VP
V NP MW
gibt [F1] neutrales Element
Satz
Es gibt ein [F3] mit folgenden Eigenschaften
P
Es
[F3] heißt neutrales Element
Es gibt ein [F3] (neutrales Element genannt) mit folgenden Eigenschaften:
[F1] mit folgenden Eigenschaften heißt
Vorverarbeitung
Abbildung 3.20: Syntaktische Analyse des Beispiels 3.3.16 Teil 3
Satz
NP VP NP VP
V NP MW
gibt es heißt inveres Element von [F6]
Satz
Zu jedem [F4] gibt es ein [F5] (inverses Element vom [F6] genannt) mit [F7].
Zu jedem [F4] gibt es ein [F5] mit [F7].
[F5] heißt inverses Element von [F6]
QUANT MW V NP
Zu jedem [F4] ein [F5] mit [F7] [F5]
Vorverarbeitung
Abbildung 3.21: Syntaktische Analyse des Beispiels 3.3.16 Teil 4
Beispiel 3.3.20 (Reihe)
Seien cZ,Zcein Zahlenabschnitt, und {az}zZceine Folge. Dann wird der
Ausdruck
X
k=c
ak
Reihe genannt.[Wue95, S.119]
Beispiel 3.3.21
F¨
ur a > 0, b Rist die allgemeine Potenz definiert durch ab:= eblog a.[Wue95,
S.186]
124 KAPITEL 3. MATHEMATISCHE STRUKTUREN
Beispiel 3.3.22
Unter einer Stammfunktion zu einer Funktion fauf einem Intervall Iverstehen
wir eine Funktion F:I Cwie folgt:
(i) Fist stetig;
(ii) Fist außerhalb einer h¨
ochstens abz¨
ahlbaren ,,Ausnahme“-Menge AI
differenzierbar, und f¨
ur alle xI\Agilt F0(x) = f(x).
[K¨
o01, S.166]
Beispiel 3.3.23
Wir nennen eine Funktion f:I Cfast ¨
uberall stetig differenzierbar,wenn
sie eine Stammfunktion einer Regelfunktion auf Iist. [K¨
o01, S.202]]
Satztypen. In der mathematischen Sprache sind S¨
atze bewiesene Aussagen,
die den Wahrheitswert wahr besitzen. Die gesamte Mathematik besteht aus einer
Menge von Aussagen, die sich aus Axiomen logisch ableiten lassen. Im Kapitel
3.3.2 wurde gezeigt, dass S¨
atze aus einer Voraussetzung und einer Aussage be-
stehen. Es existieren drei verschiedene Typen von Aussagen: einfache S¨
atze,
S¨
atze, die Implikationen beschreiben, und S¨
atze, die ¨
Aquivalenzen beschreiben.
Die typischen Standardkonstruktionen tauchen daher wieder in den S¨
atzen auf:
wenn [...] dann usw. Diese wurden im Kapitel 3.3.3 betrachtet. Allerdings
wurden dort nur die singul¨
aren Eigenschaften aufgelistet. Die Verwendung von
Standardkonstruktionen in S¨
atzen kann durch die zus¨
atzliche Verwendung von
logischen Operatoren und Quantoren komplex werden.
Wie in den vorherigen Abschnitten festgestellt wurde, weisen die verschiedenen
Satzentit¨
aten Fundamentals¨
atze, Theoreme, S¨
atze, Propositionen, Korollare,
Lemmata und Hilfss¨
atze keine charakteristischen Unterschiede auf. Daher
sollen diese in der weiteren Betrachtung gemeinsam analysiert werden.
Beispiel 3.3.24 (Fundamentalsatz der Algebra)
Jedes Polynom fC[t]mit deg f > 0hat mindestens eine Nullstelle. [Fis00, S.
63]
3.3. SPRACHSTRUKTUREN 125
VP
NP
S
NP
QUANT NP
ALL
Jedes
NP
Polynom [Symbol]
V
QUANTEX NP
Nullstelle.mindestens eine
P S
mit [Symbol]
hat
PP
Abbildung 3.22: Syntaktische Analyse des Fundamentalsatzes der Algebra
Analyse des Beispiels 3.3.24. In Abbildung 3.22 wird die syntaktische Ana-
lyse des Fundamentalsatzes dargestellt. Die Struktur des Satzes ist dabei relativ
einfach. Unter anderem treten in diesem Satz der Allquantor jedes und der
Existenzquantor mindestens eine auf. Etwas komplexer ist der in der Abbil-
dung gr¨
un markierte Bereich. Eine semantische Analyse l¨
asst sich daf¨
ur nicht
mehr so einfach nachvollziehen. Im Kapitel 3.4 soll dies n¨
aher betrachtet werden.
Beispiel 3.3.25 (Theorem)
Jeder Vektorraum besitzt eine Basis. [Fis00, S. 83]
S
NP
NQUANT
Jeder Vektorraum
VP
V
hat
NP
DET N
eine Basis
Abbildung 3.23: Syntaktische Analyse des Theorems
Beispiel 3.3.26 (Basisauswahlsatz)
Sei Beine Menge von Vektoren des Vektorraums V.Bist genau dann eine
Basis, wenn Bein minimales Erzeugendensystem ist. (nach [Beu94, S. 59])
126 KAPITEL 3. MATHEMATISCHE STRUKTUREN
ist
Basis minimales Erzeugendensystem
S
Konjunktion: wenn
Hauptsatz Nebensatz
NP VPNP VP
V NP V NP
ist Basis B
B istwennB
B minimales Erzeugendensystem
B ist genau dann eine Basis, wenn B ein minimales Erzeugendensystem ist.
ist
Vorverarbeitung
Abbildung 3.24: Analyse des Basisauswahlsatzes
Analyse des Beispiels 3.3.26. Die syntaktische Analyse des Basisauswahl-
satzes ist etwas komplizierter (Abbildung 3.24). Durch Transformationen wird
der Satz in seine Einzelbestandteile zerlegt, Phrasen ersetzt und Verben umsor-
tiert. Dadurch entstehen strukturierte Satzbausteine, die syntaktisch nach dem
Chomsky-Modell (Kapitel 2.4) analysiert werden k¨
onnen.
Beispiel 3.3.27 (Satz ohne Namen)
Der L¨
osungsraum des linearen Gleichungssystems A·x=bist genau dann nicht
leer, wenn rang A=rang (A, b). [Fis00, S. 123]
Beispiel 3.3.28 (Korollar)
Sei Kein beliebiger K¨
orper, fK[t]ein Polynom und kdie Anzahl der Null-
stellen von f. Ist fvom Nullpolynom verschieden, so gilt kdeg f. [Fis00,
S.62]
Beispiel 3.3.29 (Lemma)
Jede konvergente Folge ist beschr¨
ankt. [K¨
o01, S. 46]
3.3. SPRACHSTRUKTUREN 127
Beispiel 3.3.30 (Proposition)
F¨
ur AM(m×n;K)und bKmsind folgende Bedingungen gleichwertig:
1. Das lineare Gleichungssystem A·x=bist eindeutig l¨
osbar.
2. rang A=rang (A, b) = n.
[Fis00, S. 127]
3.3.4 Wortebene
Wie auch in anderen Fachsprachen (Kapitel 2.4.4) ist ein wesentliches Merk-
mal der Mathematik ihr Wortschatz. Die Vielfalt und die Variationsbreite der
W¨
orter ist groß. So w¨
achst der Wortschatz der Mathematik t¨
aglich durch neu
ver¨
offentlichte Publikationen. Durch die strenge Strukturierung und den An-
spruch, eine exakte Wissenschaft zu sein, l¨
asst sich diese Vielfalt strukturell
organisieren (Kapitel 3.4) und somit eine Terminologie der Mathematik aufbau-
en.
Bei der Betrachtung des Wortschatzes kann zwischen außerfachsprachlichen
W¨
ortern und W¨
ortern, die nur in der betrachteten Fachsprache verwendet wer-
den, unterschieden werden [GHL02, S. 618]. So verwendet auch die Mathematik
Begriffe aus dem allt¨
aglichen Wortschatz, wie z. B. Knoten,Quelle,Wurzel,
Raum usw., die jedoch fachspezifisch angewendet werden. Dies beinhaltet zwar
Gefahren f¨
ur den unge¨
ubten mathematischen Laien, der den Begriffen eine allzu
anschauliche Bedeutung beimisst. Jedoch besteht bei einer computergest¨
utzten
Analyse keine solche Gefahr, wenn diese nur f¨
ur die Fachsprache durchgef¨
uhrt
und somit auf die Dom¨
ane reduziert wird. Eine computergest¨
utzte linguistische
Analyse hat keine Anschauung ¨
uber die Bezeichnungen von mathematischen
Objekten. Probleme treten erst dann auf, wenn einem Begriff mehrere Bedeu-
tungen zugeordnet werden k¨
onnen.
Problematisch ist in der Mathematik, dass einem Sachverhalt oder dem Ge-
genstand der Betrachtungen mehreren Begriffe zugeordnet werden k¨
onnen. So
beschreiben die Bezeichnungen Multiplikation mit Skalaren und skalare Multi-
plikation denselben Sachverhalt. Vielfach werden alternative Bezeichnungen ge-
nannt, indem sie hinter dem eigentlichen Begriff in Klammern gesetzt werden,
128 KAPITEL 3. MATHEMATISCHE STRUKTUREN
wie z. B. Multiplikation mit Skalaren (auch skalare Multiplikation genannt).
Schwieriger wird es jedoch, wenn sich in einer Entit¨
at die Bezeichnung f¨
ur einen
Sachverhalt ¨
andert:
Beispiel 3.3.31 (...)
b) Das inverse Element a0ist eindeutig und hat auch die Eigenschaft a·a0=e
f¨
ur alle aG.
c) Da das Inverse nach b) eindeutig bestimmt ist, kann man es mit a1be-
zeichnen. [...].
[Fis00, S. 45]
Die Begriffsbildung in der Mathematik ist sehr einfach. Eine terminologische
Bezeichnung besitzt meistens eine eindeutige Zuordnung. So lassen sich einige
der oben genannten Konstruktionen aufl¨
osen, indem standardisierte Konstruk-
tionsm¨
oglichkeiten vorgegeben werden, wie z. B. Kantengraph und Graph [Arti-
kel/Pr¨
aposition] Kante. Beide Konstruktionen k¨
onnen dann synonym verwendet
werden. Die Verwendung von zwei Substantiven zur Wortbildung (Komposition)
tritt h¨
aufig in anwendungsbezogener mathematischer Literatur auf.
In der Mathematik treten h¨
aufig Fremdw¨
orter aus dem Griechisch-Lateinischen
auf, wie z. B. linear (lat.: l¯
ine¯aris), ¨
aquivalent (lat.: aequival¯ens), Geometrie
(gr.-lat.: ge¯ometr´ıa) usw.
H¨
aufig werden Eigennamen f¨
ur die Entdecker von Sachverhalten verwendet. So
gibt es z. B. das Lemma von Zorn, die Cauchy-Folge und den Hilbertraum. Sel-
tener tritt dagegen die Verwendung von Symbolen und Ziffern in W¨
ortern auf,
z. B. in L-quadratintegrierbar,1.Ordnung und -Umgebung. Akronyme treten
z. B. in der Lineare Algebra und Analysis fast nicht auf.
In der mathematischen Sprache werden h¨
aufig Mehrwortbezeichnungen verwen-
det. Dabei wird meistens ein Adjektiv mit einem Substantiv verbunden, so
dass eine feststehende Nominalphrase konstruiert wird, die einen Sachverhalt
beschreibt, z. B. stetige Funktion,leere Menge,geometrische Reihe usw. Diese
Adjektive schr¨
anken damit den Geltungsbereich des Substantivs ein. In die-
sem Zusammenhang ist das Negationspartikel nicht zu nennen, das mit dem
Adjektiv in Verbindung tritt, z. B. nicht leere Menge. Allerdings gibt es f¨
ur
diese Wortverbindungen verschiedene Schreibweisen, wie nichtleere Menge oder
3.3. SPRACHSTRUKTUREN 129
nicht-leere Menge. Weitere Mehrwortbezeichnungen entstehen durch pr¨
apositio-
nale Erg¨
anzungen wie z. B. ¨
Aquivalenzrelation auf der Menge X,Homomorphis-
mus von Gruppen, wodurch eine enge semantische Beziehung zwischen Verb und
Objekt des Satzes ausgedr¨
uckt wird, sowie durch die Verwendung des Genitives
possessivus (Teilmenge Keines metrischen Raumes M). Bei der Bezeichnung
eines Sachverhaltes durch Adjektive k¨
onnen zwei Adjektive auch hintereinander
angeordnet werden, z. B. absolut konvergent,linear unabh¨
angig.
Die Komparation von Adjektiven erfolgt nicht. So gibt es nicht die Steigerung
surjektiv surjektiver am surjektivsten. Adverbien werden nur in einge-
schr¨
anktem Maße verwendet. So werden modale Adverbien (gern,unverz¨
uglich
usw.) nicht verwendet. Dagegen werden kausale Adverbien eingesetzt, z. B. an-
dernfalls,somit usw. Die Ursache daf¨
ur ist, dass zahlreiche kausale Adverbien
auch konjunktionale Funktionen ¨
ubernehmen k¨
onnen, die durch Implikations-
aussagen verursacht werden.
So ist der Begriffs- und Wortbildungsprozess sehr viel eingeschr¨
ankter als in
anderen Fachsprachen, die deutlich mehr M¨
oglichkeiten bieten, um Begriffe und
W¨
orter zu konstruieren [GHL02, S. 619ff]
3.3.5 Symbolebene
Die mathematische Sprache enth¨
alt eine reichhaltige Sammlung von mathema-
tischen Zeichen. Diese Zeichen und Symbole k¨
onnen einerseits direkt hinter ei-
nem Begriff stehen, wie z. B. Ring R,Menge M, andererseits werden sie als
¨
aquivalente Bezeichnung f¨
ur den entsprechenden Begriff verwendet. So wird das
Symbol Rf¨
ur den Begriff reelle Zahlen eingesetzt.
Nicht nur einzelne Zeichen werden so verwendet, sondern auch Terme und For-
meln. So tritt im Text h¨
aufig die Bezeichnung xXauf f¨
ur x ist ein Element
von X. Wenn Vein Vektorraum ist, dann ist die Bezeichnung vVgleichbe-
deutend mit v ist ein Element des Vektorraumes oder v ist ein Vektor.
Diese Terme und Formeln k¨
onnen jedoch sehr kompliziert aufgebaut sein. So
ist der folgende Satz f¨
ur eine rein linguistische Analyse schwer zug¨
anglich: [. . .]
Eine Menge Zc:= {n|nZ, n c}heißt Zahlenstrahl [...]. In diesem Fall
m¨
usste zumindest erkannt werden, dass Zceine synonyme Bezeichnung f¨
ur den
130 KAPITEL 3. MATHEMATISCHE STRUKTUREN
Einige wichtige Symbole und ihre Auswertung
aA a ist ein Element von A
aF¨
ur alle a
aEs existiert ein a
A:= BDefiniens Bund Definiendum A
A <=> B A genau dann, wenn B
R,Nusw. reelle Zahlen, nat¨
urliche Zahlen
f:A Bfist eine Abbildung von Anach B
Zahlenstrahl ist. Auch die Bezeichnung Abbildung f:A B ist problema-
tisch, da es unter Umst¨
anden wichtig ist, welche Mengen Aund Bbezeichnen.
Daher ist es notwendig, zumindest die fundamentalsten mathematischen Zei-
chen zu erkennen und zu analysieren, um sie damit einer linguistischen Analyse
zug¨
anglich zu machen.
3.3.6 Zusammenfassung
In diesem Abschnitt sollen die in den vorherigen Abschnitten beschriebenen
Erkenntnisse zusammengefasst werden. Es wird aus den aufgef¨
uhrten Gr¨
unden
folgendes Modell f¨
ur die Analyse der mathematischen Sprache folgendes Modell
vorgeschlagen:
1. Schritt: Erkennung der Entit¨
atenstruktur.
2. Schritt: Aufl¨
osung der Binnenstruktur.
3. Schritt: Syntaktische Aufl¨
osung der S¨
atze.
4. Schritt: Analyse einzelner Satzbausteine
Erkennung der Entit¨
aten. Die Entit¨
aten m¨
ussen zuerst als solche erkannt
werden, damit weitere Analyseschritte getrennt f¨
ur jeden Entit¨
atentypen erfol-
gen k¨
onnen. Bei dieser Erkennung treten aber Schwierigkeiten auf. So wurde im
Rahmen dieser Arbeit festgestellt, dass es keine charakteristischen Merkmale
3.3. SPRACHSTRUKTUREN 131
f¨
ur die einzelnen Satzentit¨
aten gibt. Daher k¨
onnen diese nur durch die expli-
zite Angabe des Entit¨
atentyps korrekt erkannt werden. Eine weitere m¨
ogliche
Entit¨
atentyperkennung kann durch die Bestimmung der Position im Textgef¨
uge
erfolgen. Dies ist jedoch mit einigen Unsicherheiten behaftet. Gl¨
ucklicherweise
kennzeichnen jedoch Mathematiker h¨
aufig die S¨
atze mit der expliziten Angabe
des Entit¨
atennamens.
Aufl¨
osung der Binnenstruktur. Die Aufl¨
osung der Binnenstruktur hat vie-
le Vorteile. Der wichtigste Schritt ist dabei die Trennung der Voraussetzungen
von der eigentlichen Aussage der untersuchten Entit¨
at. In den Voraussetzun-
gen werden u. a. zahlreiche Bezeichnungen und Begriffe festgelegt, die f¨
ur eine
semantische Analyse der darauf folgenden Aussage von Bedeutung sind. Die
Voraussetzungen sind dabei meist gut zu erkennen, so dass die Binnenstruktu-
ren leicht zuzuordnen sind.
Am einfachsten ist diese Aufl¨
osung f¨
ur Definitionen, da in deren Aussageanteil
praktisch nur eine einzige Form der Binnenstruktur vorkommt. F¨
ur S¨
atze hat
sich gezeigt, dass es lediglich drei Satzstrukturen gibt, n¨
amlich den einfachen
Aussagesatz, die Implikation und die ¨
Aquivalenz. Diese drei Typen lassen sich
aufgrund ihres klaren Aufbaus relativ leicht erkennen. Axiome dagegen sind
problematisch, da sie keine einheitliche Binnenstruktur aufweisen.
Syntaktische Analyse der S¨
atze. Die syntaktische Analyse von S¨
atzen
kann nach dem in Kapitel 2.4 vorgestellte Modell von Chomsky erfolgen.
Trotz seiner Einfachheit ist es daf¨
ur ausreichend, da mathematische S¨
atze in
Lehrb¨
uchern weniger komplexe Strukturen aufweisen als S¨
atze in der Alltags-
sprache. Des Weiteren wurde festgestellt, das die syntaktische Struktur sehr
stark durch die Pr¨
adikatenlogik beeinflusst wird und somit meist einfache Satz-
strukturen auftreten.
Einige Satzstrukturen sind jedoch auf den ersten Blick nicht so einfach zu analy-
sieren. Sie k¨
onnen allerdings durch Vorverarbeitungsregeln in eine analysierbare
Form ¨
uberf¨
uhrt werden. Diese Vorverarbeitungsregeln wurden aus der Transfor-
mationsgrammatik nach Chomsky entwickelt. Sie ergeben sich aus einer relativ
geringen Anzahl feststehender Phrasen, die sich in Form eines syntaktischen
132 KAPITEL 3. MATHEMATISCHE STRUKTUREN
Lexikons f¨
ur eine Analyse zusammenfassen lassen. Ein Beispiel daf¨
ur ist die
Binnenstruktur Voraussetzung.
Analyse der Satzbausteine. Die bei der Analyse nach Chomsky entstehen-
den syntaktischen Strukturen weisen f¨
ur mathematische Texte einige Besonder-
heiten auf. So verwendet die mathematische Sprache Symbole und Formeln, die
direkt hinter dem Substantiv auftreten. Daher ist es sinnvoll, Symbole als einen
Teil der Nominalphrase zu sehen:
NP ::= [DET] [ADJ] N [SYM]
Des Weiteren werden Quantoren teilweise wie Artikel verwendet und k¨
onnen in
Nominalphrasen an deren Stelle treten.
NP ::= [DET/QUANT] [ADJ] N [SYM]
Es treten h¨
aufig rekursive Nominalphrasenstrukturen der Form
NP ::= NP NP
auf, die beliebig mit weiteren Nominal- und Pr¨
apositionalphrasen verschachtelt
sein k¨
onnen. Deren syntaktische Analyse ist einfach, die semantische Analy-
se jedoch außerordentlich komplex. Pr¨
apositionen hinter einer Nominalphrase
schr¨
anken diese in ihrem Wirkungsbereich ein. Diese Einschr¨
ankung wird auch
von Adjektiven f¨
ur ein darauf folgendes Substantiv erreicht.
In der mathematischen Sprache werden definierende Bezeichnungen in Eigen-
schaften h¨
aufig in Klammern hinter die betreffende Symbolfolge bzw. Aussage
gesetzt. Dies muss bei einer syntaktischen wie semantischen Analyse ber¨
ucksich-
tigt werden. Des Weiteren treten haupts¨
achlich bei Aufz¨
ahlungen S¨
atze ohne
Verbformen auf, wie z. B. f injektiv. Dies muss ebenfalls ber¨
ucksichtigt werden.
Eine semantische Analyse wurde bis jetzt nicht beschrieben. Das Problem be-
steht darin, dass die semantischen Informationen einer einzelnen Entit¨
at oh-
ne Kontextwissen nur einen geringen Informationsgehalt besitzen. Ohne eine
M¨
oglichkeit, mathematisches Hintergrundwissen einzubringen, ist eine semanti-
sche Analyse daher sinnlos. Dieses Hintergrundwissen soll in dieser Arbeit durch
eine Wissensbasis repr¨
asentiert werden (Kapitel 3.4).
3.4. WISSENSSTRUKTUREN 133
3.4 Wissensstrukturen
In hierarchischen Strukturen kommt das Gute
nie von oben. Obenauf schwimmt der Abschaum.
Das Wertvolle ist der Bodensatz.
(H. A. Pestalozzi, Schweizer Autor,
Manager und Gesellschaftskritiker, 1929-2004)
3.4.1 Ontologie der Mathematik
Einleitung. Im Kapitel 3.3 trat das Problem auf, dass eine semantische Ana-
lyse der mathematischen Sprache nicht einfach zu realisieren ist. Mathematische
Begriffe und Sachverhalte bilden ein großfl¨
achiges Beziehungsnetzwerk. Viele
dieser Begriffe und Sachverhalte werden von den Autoren der Texte vorausge-
setzt und nicht explizit definiert. Dies ist auch in anderen nat¨
urlichsprachlichen
Texten der Fall. Allerdings sind die terminologischen Strukturen in der Mathe-
matik klarer und strenger formalisiert, so dass die Begriffe und Sachverhalte
genau definiert werden k¨
onnen.
Wissensbasierte Systeme unterst¨
utzen die Organisation und Speicherung von
Begriffen und Sachverhalten. Gleichzeitig sind diese gespeicherten Informatio-
nen jederzeit wieder abrufbar. Als Repr¨
asentationsmechanismus f¨
ur diese Spei-
cherung eignen sich semantische Netze. Diese werden h¨
aufig bei der Untersu-
chung der Semantik von nat¨
urlichsprachlichen Texten verwendet, wie z. B. in
MultiNet [Hel00]. Durch den strukturierten Aufbau der mathematischen Termi-
nologie sollte auch bei der semantischen Analyse von mathematischen Texten
eine solche Konzeption hilfreich sein.
Zur Beschreibung von semantischen Netzen in wissensbasierten Systemen wer-
den heutzutage als formaler Beschreibungsmechanismus Ontologien verwendet.
Ontologien sind dabei reichhaltiger strukturiert als semantische Netze. Sie ver-
wenden Schemata, die im Kapitel 2.2.2.2 als Erweiterung von semantischen Net-
zen eingef¨
uhrt wurden.
Der Vorteil der Verwendung von Ontologien liegt in der Erzeugung eines Sys-
tems, das technisch umsetzbar und somit als Modell ¨
uberpr¨
ufbar ist. Daher
134 KAPITEL 3. MATHEMATISCHE STRUKTUREN
soll auch f¨
ur die Mathematik eine Ontologie entworfen werden, die insbesonde-
re Wissenstrukturen formalisiert, die durch eine vorherige semantische Analyse
aus mathematischen Texten extrahiert werden.
In den Kapiteln 2.2.1 und 2.2.3 wurde kurz auf die Struktur von Ontologien
eingegangen. Die Grundbausteine einer Ontologie sind Konzepte und Beziehun-
gen20 zwischen diesen Konzepten. Daher muss f¨
ur die Mathematik eine geeignete
Konzeptualisierung gefunden werden. Unter einer Konzeptualisierung wird ein
abstraktes Modell verstanden, das mathematische Strukturen abbilden kann.
In der hier zu betrachtenden mathematischen Ontologie sollen grundlegende ma-
thematische Strukturierungsprinzipien verwendet werden. Als Fundament die-
nen die folgenden Beschreibungmechanismen (Kapitel 3.2.2 und 3.2.3):
Pr¨
adikatenlogik und axiomatische Mengenlehre
Grundstrukturen nach Bourbaki
Pr¨
adikatenlogik und axiomatische Mengenlehre. Durch die Verwen-
dung der axiomatischen Mengenlehre (Kapitel 3.2.3) kann ein abstraktes mathe-
matisches Ontologiemodell konstruiert werden. Die axiomatische Mengenlehre
beruht auf dem allgemeinsten Begriff in der Mathematik: der Menge. Der Auf-
bau der Mengenlehre entspricht der einer ¨
ublichen mathematischen Theorie,
allerdings ist ihre Begriffs- und Sachverhaltsbildung wegweisend f¨
ur praktisch
alle [Ebb94, S. vii] mathematischen Fachdisziplinen. So bildet die Mengenleh-
re u. a. ein terminologisches Modell, aus dem sich viele mathematische Begriffe
ableiten lassen. Die Pr¨
adikatenlogik dient dabei als Beschreibungssprache der
Mengenlehre.
Im folgenden Abschnitt soll ein einfaches ontologisches Modell auf Grundlage
der axiomatischen Mengenlehre konstruiert werden. Dieses Modell erhebt keinen
Anspruch auf Vollst¨
andigkeit. In den weiteren Schritten soll dieses Modell f¨
ur
die semantische Analyse von einfachen mathematischen Entit¨
aten verwendet
werden, um die extrahierten Wissenstrukturen kontextuell zu binden. Es wird
20Beziehungen werden auch als Relationen bezeichnet. Allerdings wird der Begriff Relati-
on schon in der Mathematik verwendet. Daher wird in dieser Arbeit der Begriff Beziehung
bevorzugt, um Verwechselungen zu vermeiden.
3.4. WISSENSSTRUKTUREN 135
sich herausstellen, dass die konstruierte Ontologie einige Fragen aufwirft, die in
Kapitel 5 genauer diskutiert werden.
Konzepte in einer Ontologie fassen Objekte zusammen, die gemeinsame Eigen-
schaften21 aufweisen. Die axiomatische Mengenlehre nach Zermelo-Fraenkel be-
schreibt das fassbare, grundlegende ontologische Konzept Menge. Dabei defi-
niert sie nicht den Begriff der Menge, sondern beschreibt die Beziehungen zwi-
schen Mengen, ohne irgendeine Angabe zu machen, was dieses Konzept bein-
haltet. Aufgrund des Extensionalit¨
atsaxioms (Axiom 3.2.3) kann davon ausge-
gangen werden, dass alle mathematischen Objekte sich auf den Mengenbegriff
zur¨
uckf¨
uhren lassen [Ebb94].
Das gilt jedoch z. B. nicht f¨
ur das Elementzeichen und die Teilmengenbezie-
hung . Diese sind keine Mengen im axiomatischen Sinne. In der Ontologie
entsprechen sie daher den Beziehungen zwischen den Konzepten: is element of
und is subset of.
Durch das Aussonderungsaxiom (Axiom 3.2.9) wird ein Konstruktionsprinzip
gegeben, durch das Untermengen gebildet werden k¨
onnen, die sich durch ge-
wisse Eigenschaften auszeichnen. Dies entspricht der Bildung neuer Konzepte
aus dem Konzept Menge durch eine is a Beziehung22, die dann noch zus¨
atzli-
che Eigenschaften besitzen.
Es gibt bestimmte Objekte in der Mathematik, die einen grundlegenden Charak-
ter besitzen, wie z. B. Relationen und Funktionen. F¨
ur die Konzeption dieser Ob-
jekte auf der Grundlage des Konzepts Menge muss der Begriff des geordneten
Paares (Definition 3.2.7) eingef¨
uhrt werden. In der axiomatischen Mengenlehre
wird dies als Paarmengenbildung (Axiom 3.2.4) mit der speziellen Eigenschaft
angesehen, dass die Reihenfolge der Objekte eindeutig festgelegt ist. Somit ist
auch das geordnete Paar eine spezielle Menge. Der Zuordnungsmechanismus,
der dem geordneten Paar den linken (, y) bzw. den rechten Eingang (x, ) zu-
ordnet, wird als Projektionsoperation [Ebb94, S. 55] bezeichnet. Dies soll nicht
direkt in dieser Ontologie ber¨
ucksichtigt werden (Kapitel 5).
21Eigenschaften werden auch als Attribute bezeichnet.
22Sie wird auch SUB-Relation genannt. Alle einem gemeinsamen Oberbegriff verm¨
oge der
SUB-Relation untergeordneten Begriffe bilden zusammen mit ersterem eine Begriffshierar-
chie und konstituieren damit einen Teilbaum im SN [semantischen Netz]. Der an der Spitze
der Hierarchie stehende Knoten ist eben dieser Oberbegriff. Die terminalen individuellen Be-
griffsknoten des Baums heißen Instanzen. [Hel00]
136 KAPITEL 3. MATHEMATISCHE STRUKTUREN
Aus dem geordneten Paar l¨
asst sich induktiv das Konzept Tupel ableiten,
das den mathematischen n-Tupeln entspricht. Es ist ¨
uber eine is a-Beziehung
mit dem Konzept geordnetesPaar verbunden, das wiederum ¨
uber eine is a-
Beziehung direkt mit dem Konzept Menge verkn¨
upft ist (Abbildung 3.25).
geordnetesPaar
Name: geordnetes Paar
Tupel
Name: n−Tupel
Name: Menge
is_a
is_a
Menge
Abbildung 3.25: Darstellung eines Tupels
Das Konzept geordnetesPaar wird vom kartesischen Produkt (Definition
3.2.8) verwendet. Wie das Tupel bildet auch das Konzept kartesischesPro-
dukt eine spezielle Menge (is a-Beziehung). Jedoch wird zus¨
atzlich die Eigen-
schaft gefordert, dass das kartesische Produkt das Konzept geordnetesPaar
verwendet. Dies wird durch eine neue Beziehung has part realisiert, die besagt,
dass ein Konzept (in diesem Fall geordnetesPaar) Bestandteil eines anderen
Konzeptes (in diesem Fall kartesischesProdukt) ist (Abbildung 3.26).
kartesischesProdukt
Name: kart. Produkt
Menge
Name: Menge
Name: geordnetes Paar
Tupel
Name: n−Tupel
is_a
is_a
is_a
geordnetesPaar
has_part
Abbildung 3.26: Darstellung eines kartesischen Produktes
Somit kann nun das Konzept Relation (Definition 3.2.10) in das bestehen-
de Modell eingef¨
ugt werden. Es besteht eine has part-Beziehung vom Konzept
Relation zum kartesischen Produkt (Abbildung 3.27).
3.4. WISSENSSTRUKTUREN 137
geordnetesPaar
Name: geordnetes Paar
Name: n−Tupel
Tupel
Menge
Name: Menge
Name: kart. Produkt
kartesischesProdukt
has_part
is_a
has_part
is_a
Name: Relation
Relation
Abbildung 3.27: Darstellung einer Relation
Die Abbildung (Definition 3.2.13) leitet sich durch eine is a-Beziehung vom
Konzept Relation ab (Abbildung 3.28).
geordnetesPaar
Name: geordnetes Paar
Name: n−Tupel
Tupel
Menge
Name: Menge
Name: kart. Produkt
kartesischesProdukt
has_part
is_a
has_part
is_a
is_a
Name: Relation
Relation
Name: Abbildung
Abbildung
Abbildung 3.28: Darstellung der Abbildung
Abbildung 3.29 zeigt eine in Teilen vereinfachte Form der bisher beschriebenen
Ontologie, die um die Konzepte der Assoziativit¨
at,Kommutativit¨
at und
Distributivit¨
at erweitert wurde. Diese stammen aus der Aussagenlogik und
spielen bei der Formulierung von Eigenschaften anderer Konzepte eine wichtige
Rolle. Sicherlich ist das nicht die einzig m¨
ogliche Struktur einer Ontologie der
Mathematik, aber sie ist f¨
ur die im mArachna-Projekt behandelten Fragestel-
lungen sinnvoll und ausreichend.
Beschreibung durch Bourbaki. Neben Hilbert gilt als wesentlicher Be-
gr¨
under und Bef¨
urworter der axiomatischen Theorie eine Gruppe franz¨
osischer
Mathematiker, die ihre Forschungsergebnisse ab 1935 unter dem Pseudonym
Nicolas Bourbaki ver¨
offentlichte. Bourbaki erweiterte den proklamierten Ansatz
138 KAPITEL 3. MATHEMATISCHE STRUKTUREN
Name: kart. Produkt
kartesischesProdukt
Relation
Name: Relation
Abbildung
Name: Abbildung
is_a
is_a
Menge
Name: Menge
Rule
assoziativ
Name: assoziativ
kommutativ
Name: kommutativ
distributiv
Name: distributiv
mathObject
is_a
is_a
Verknüpfung
Name: Verknüpfung
is_a
is_a
has_property
has_part
Abbildung 3.29: Konzeption mathematische Ontologie
von Hilbert. Sie verstanden die Mathematik als ein geordnetes Zusammenspiel
von Strukturen wie Mengen, Gruppen, K¨
orpern usw. Dabei existieren Kernge-
biete, die f¨
ur alle mathematischen Disziplinen unerl¨
asslich sind. Dies sind die
Mengenlehre, die Algebra, die Topologie und die Analysis. Als Fundament dient
die Logik und die Mengenlehre [Bou74].
Bourbaki definiert drei grundlegende Strukturierungselemente:
Ordnungsstrukturen
algebraische Strukturen
topologische Strukturen
So lassen sich mathematische Objekte ¨
uber Mengen mit gewissen Strukturen
beschreiben. Eine Addition + : M×M Mkann mittels des geordneten
Paares (M, +) beschrieben werden. Die Addition ist dabei das strukturbilden-
de Element auf der Menge M. Der Begriff der Gruppe wird durch das 2-Tupel
(G, ) beschrieben, wobei die Gruppe als Menge mit der strukturbildenden Ver-
kn¨
upfung aufgefasst wird.
Das Konzept von Bourbaki l¨
asst sich sich jedoch nicht ohne Aufwand auf die
Analyse der mathematischen Sprache ¨
ubertragen. Der Hauptgrund daf¨
ur ist,
3.4. WISSENSSTRUKTUREN 139
dass Autoren in Lehrb¨
uchern dieses Konzept nicht durchg¨
angig verwenden. Da-
durch ist in vielen Definitionen und S¨
atzen der obige typische Konstruktionsme-
chanismus nicht vorhanden, so dass die in den Texten enthaltenen semantischen
Strukturen zun¨
achst in eine Struktur nach Bourbaki ¨
ubersetzt werden m¨
ussten.
Aus diesem Grund werden strikte Bourbaki-Strukturen in dieser Arbeit nicht
verwendet. Sie k¨
onnten sich in Zukunft jedoch als n¨
utzlich f¨
ur die Darstellung
gr¨
oßerer mathematischer Konzepte wie z. B. ganzer Disziplinen erweisen.
Aus diesen Betrachtungen wird deutlich, dass sich die verwendete einfache On-
tologie nur ungen¨
ugend f¨
ur die Beschreibung einiger mathematischer Konzepte
eignet. F¨
ur die im Rahmen dieser Arbeit durchgef¨
uhrten Analysen ist sie jedoch
ausreichend. Weiterf¨
uhrende Ans¨
atze werden im Kapitel 5 besprochen. Dabei
wird unter anderem das Konzept eines semantischen Hypergraphen diskutiert.
3.4.2 Taxonomie der Mathematik
Im ersten Abschnitt dieses Kapitels wurde eine Ontologie auf Basis der axiomati-
schen Mengenlehre entwickelt, die die Grundlage f¨
ur die weiteren Betrachtungen
bilden soll. Die Taxonomie der Mathematik beschreibt die Hierarchie der Be-
griffe und Sachverhalte der Mathematik und modelliert so ihre Strukturen. In
den folgenden Abschnitten soll anhand von einfachen Beispielen erl¨
autert wer-
den, wie mathematische Wissensstrukturen aus Entit¨
aten extrahiert und in die
konstruierte Ontologie eingeordnet werden k¨
onnen.
Vorbetrachtungen. Die Mathematik besteht aus einer Reihe von mathema-
tischen Fachdisziplinen, wie z. B. der Geometrie, der Arithmetik und der Zahlen-
theorie. Dabei k¨
onnen ¨
uber 3000 spezialisierte Einzeldisziplinen der Mathematik
[DHM95, S. 20] unterschieden werden.
The Mathematics Books at Brown University are housed on the fifth
floor of the Science Library. In the trade, this is commonly regarded
as a fine mathematical collection, and a rough calculation shows that
this floor contains the equivalent of 60,000 average-sized volumes.
[...] This amount of knowledge and information is far beyond the
comprehension of any one person. [DHM95, S. 17]
140 KAPITEL 3. MATHEMATISCHE STRUKTUREN
Einen ¨
Uberblick ¨
uber die gesamte Mathematik mit ihren vielf¨
altigen Beziehun-
gen zu erhalten, erscheint hoffnungslos. In Abbildung 3.30 wird ein winziger Teil
eines Beziehungsnetzwerks der mathematischen Fachdisziplinen dargestellt. Es
Liesche
Gruppen
Räume stetiger
Funktionen
Integration
Haarsches Maß
und Faltung
Riemannsche
Geometrie
nicht lineare
Probleme
harmonische
Analyse
kompakte
Liesche Gruppen
Differential−
rechnung
analytische
Funktionen
Existenzsätze
elementare
Spektraltheorie
Mengenlehre
reelle Zahlen
metrische
Räume
normierte
Räume
Hilberträume
reelle
Zahlengerade
Topologie und
top. Algebra
norm. Algebren
Spektraltheorie differenzierbare
Mannigfaltigkeiten
differenzierbare
Systeme
Differentialoperatoren
Distributionen
lineare
Funktionalgleichung
elementare
Differentialtopologie
Abbildung 3.30: Ausschnitt der mathematischen Fachgebiete [Die75]
es leicht ersichtlich, dass eine solche ¨
Ubersicht durch Hinzunahme weiterer Fach-
disziplinen schnell schwer ¨
uberschaubar wird. V¨
ollig unm¨
oglich wird der Gedan-
ke aber erst, wenn in den Fachdisziplinen auch noch Unterstrukturen wie z. B.
grundlegende Konzepte einer Disziplin dargestellt werden sollen. Angesichts von
¨
uber 3000 Einzeldisziplinen erscheint dies utopisch.
Die ersten Schritte werden daher auf Fachdisziplinen die lineare Algebra
und Algebra beschr¨
ankt. Die Algebra nimmt eine zentrale Stellung in der
Mathematik ein und bildet somit die Grundlage f¨
ur viele mathematische Fach-
3.4. WISSENSSTRUKTUREN 141
disziplinen. Die Algebra l¨
asst sich nach Bourbaki folgendermaßen strukturieren
(sieht auch Abbildung 3.31):
1. Algebraisch strukturierte Mengen: Gruppe, Ring, K¨
orper, Vektor-
raum usw.
2. Algebraische Strukturen werden induziert durch: innere und ¨
auße-
re Verkn¨
upfung mit speziellen Eigenschaften: kommutativ, assoziativ, dis-
tributiv usw.
3. Algebraisch strukturierte Untermengen: Untergruppe, Unterring,
Ideal, Quotientenstruktur usw.
4. Strukturerhaltende Abbildungen: Homomorphismus, Isomorphis-
mus, lineare Abbildung usw.
assoziativ
kommutativ
distributiv
neutrales Element
inverses Element
Menge Struktur
Verknüpfung Eigenschaften
strukturerhaltenden Abbildungen
Vektorraum
innere
äußere
Untervektorraum
algebraisch strukturiert
Unterstrukturen
Ring
Gruppe
Körper
Untergruppe
Homomorphismus
lineare Abbildung
Abbildung 3.31: ¨
Uberblick Algebra
In Abbildung 3.31 ist eine Unterstrukturierung abgebildet. Diese deutet auf die
lineare Algebra hin, bei der der Begriff Vektorraum eine zentrale Rolle spielt.
142 KAPITEL 3. MATHEMATISCHE STRUKTUREN
Taxonomie der Entit¨
aten. Informationen werden in der Mathematik durch
die in Kapitel 3.3.1 diskutierten fundamentalen Entit¨
aten Axiom,Definition und
Satz23 dargestellt. Daher soll als erstes anhand eines Beispiels gezeigt werden,
wie aus Definitionen semantische Informationen extrahiert werden. Anschlie-
ßend sollen S¨
atze betrachtet werden.
Die Entit¨
at Definition.Eine Definition ist die Zusammenfassung von ma-
thematischen Begriffen und Sachverhalten, um einen neuen Begriff zu beschrei-
ben. Im Allgemeinen treten in der Mathematik nur abstrakte Begriffe ohne
direkte Entsprechung in der Alltagssprache auf. Daher werden in einer axio-
matisch aufgebauten Mathematik alle Begriffe definiert. Diese Begriffe bilden
dann ein grundlegendes Begriffsger¨
ust. Die Grundidee der semantischen Ana-
lyse ist es, Begriffe, die durch Definitionen beschrieben werden, nur dann in
die Wissensbasis zu integrieren, wenn die Sachverhalte und Begriffe, durch die
sie definiert werden, schon in der Wissensbasis vorhanden sind. Eine andere
Herangehensweise w¨
urde die Integrit¨
at der Wissensbasis gef¨
ahrden.
Die wichtigste Beziehung zwischen den Begriffen ist die is a-Beziehung. Die Ei-
genschaften des Oberbegriffs werden bei dieser Konstruktion auf den Unter-
begriff ¨
ubertragen. Dabei k¨
onnen die Eigenschaften entweder fest zugeordnete
Auspr¨
agungen oder Defaultwerte besitzen24. Das Problem bei der Verwendung
von Eigenschaften mit Defaultwerten ist, dass eine solche Strukturierung nicht
unbedingt aus der Analyse von Texten gewonnen werden kann. Der Sinn der
Wissensbasis ist es jedoch, Wissen aus der Extraktion von semantischen Infor-
mationen aus Texten zu integrieren. Daher kann in einem ersten Schritt davon
ausgegangen werden, dass Eigenschaften ohne Defaultwerte verwendet werden.
Die Begriffe entsprechen den Konzepten in der Ontologie. Der Konzeptname
wird durch den Begriffsnamen festgelegt. In erster Linie wird der neue Begriff
durch eine is a-Beziehung direkt mit den im Definiens angegebenen Begriffen
23Beweise und Beispiele sind nicht Untersuchungsgegenstand dieser Arbeit.
24In Ontologien werden h¨
aufig Mechanismen f¨
ur die Bildung von Prototypen bzw. proto-
typischen Wissens, d. h. von typischem Wissen mit Defaultangaben verwendet (Kapitel 2.2).
Diese sollen zun¨
achst nicht betrachtet werden. Jedoch stellen Prototypen eine interessante
Alternative dar, mathematisches Wissen st¨
arker zu strukturieren. So k¨
onnte z. B. der Begriff
lineare Algebra mit den Slots Definitionsbereich bzw. Wertebereich versehen werden. Die Slots
erhalten dann entsprechende Defaultwerte, die belegt werden d¨
urfen.
3.4. WISSENSSTRUKTUREN 143
neu eingebunden. Wenn das Definiendum Eigenschaften aufweist, werden diese
Eigenschaften ¨
uber eine has property-Beziehung an das Definiendum gebunden.
Es soll anhand des Beispiels 3.3.16 eine semantische Analyse exemplarisch durch-
gef¨
uhrt werden. Zuerst wird die Definition daf¨
ur zerlegt:
Erster Teil
Eine Menge Gzusammen mit einer Verkn¨
upfung heißt Gruppe, wenn folgende
Eigenschaften erf¨
ullt sind:
Nach der syntaktischen Analyse wird das Verb heißen als Schl¨
usselwort f¨
ur ei-
ne Definition erkannt. Darauffolgend werden die syntaktischen Komponenten
wie z. B. die Nominalphrase semantischen Satzbausteinen Pr¨
adikat, Subjekt
oder Objekt zugeordnet. Dabei entspricht dem Definiendum das Objekt und
dem Definiens das Subjekt (siehe Abbildung 3.32). Somit entstehen folgende
Zuordnungen:
1. Pr¨
adikat ::= Subjekt Objekt
2. Subjekt ::= NP
3. V ::= Pr¨
adikat NP ::= Objekt (aus VP)
Definiendum
Definiens
heißen
Prädikat
Subjekt Objekt
undMenge G Verknüpfung * Gruppe G
Abbildung 3.32: Zerlegung der Definition in semantische Satzbausteine
Daraus ergibt sich f¨
ur das Beispiel 3.3.16:
[ist, Menge, Gruppe] [ist, Verkn¨
upfung, Gruppe]
144 KAPITEL 3. MATHEMATISCHE STRUKTUREN
Das Pr¨
adikat ist entspricht dann der is a-Beziehung. Der Nebensatz leitet die
Eigenschaften ein, d. h. alles, was nach dem Doppelpunkt folgt, wird im folgen-
den zweiten Teil behandelt und mittels einer has property-Beziehung an das
Definiendum gebunden.
Der Nebensatz leitet zu den Eigenschaften hin, d. h. alles was nach dem
Doppelpunkt folgt, wird nun durch den zweiten Teil behandelt und mit der
has property-Beziehung verkn¨
upft. Allerdings gibt es dabei einige Ausnahmen.
Zweiter Teil
G1 (ab)c=a(bc)f¨
ur alle a, b, c G(Assoziativgesetz)
G2 Es gibt ein eG(neutrales Element genannt) mit den folgenden Eigen-
schaften:
ea=af¨
ur alle aG
Zu jedem aGgibt es ein a0G(inverses Element von a genannt)
mit a0a=e.
Die Analyse von G1 bereitet einige Schwierigkeiten. Die semantische Information
steht ausschließlich in den Formeln, gefolgt von der Bezeichnung Assoziativge-
setz in Klammern. In der syntaktischen Analyse wird daher der Satz in zwei
S¨
atze zerlegt: Ein Satz beschreibt die mathematische Aussage, der andere den
zu definierenden Begriff (Kapitel 3.3). In dieser Form w¨
urde dann der Begriff
Assoziativgesetz direkt an den Begriff Gruppe gebunden werden. Bei dem As-
soziativgesetz handelt es sich aber um eine Eigenschaft, die die Verkn¨
upfung
besitzen kann. Dies k¨
onnte dadurch abgefangen werden, dass der Begriff Asso-
ziativgesetz nur mit dem Konzept Verkn¨
upfung eine Verbindung eingehen kann,
mit der zus¨
atzlichen Einschr¨
ankung, dass sich dies auf das Konzept Gruppe be-
zieht:
Folgende Eigenschaft ist daher unvorteilhaft:
[Eigenschaft, Assoziativgesetz, Gruppe]
Folgende Eigenschaft gilt:
[Eigenschaft, Assoziativgesetz, Verkn¨
upfungGruppe]
3.4. WISSENSSTRUKTUREN 145
Allerdings kann nach dieser Vorgehensweise die Formel (ab)c=a(bc)
nicht analysiert werden. Wie oben beschrieben, ist dies von Nachteil, da eine
Analyse der Formel eventuell zu einer Aufl¨
osung des Widerspruchs gef¨
uhrt h¨
atte.
Das mathematische Zeichen a, b, c Gist allerdings aufl¨
osbar, da dies in eine
sprachliche Form gebracht werden kann: a, b und c sind Elemente der Gruppe.
In G2 werden ebenfalls die syntaktischen Komponenten der S¨
atze den semanti-
schen Komponenten zugeordnet25. Dabei wird dem neutralen Element die Be-
zeichnung eGzugeordnet. Da wie oben beschrieben eine solche einfache
mathematische Zeichenkette analysierbar ist, kann dies ¨
ubersetzt werden in: e
[neutrales Element] ist ein Element von G [Gruppe]. Daher kann das neutrale
Element als Konzept mit einer is a-Beziehung direkt an das Konzept Gruppe
gebunden werden:
[is element of, Gruppe, neutrales Element]
Das neutrale Element weist weitere Eigenschaften auf. Die erste Eigenschaft ist
nicht weiter aufl¨
osbar, da sie im Wesentlichen nur aus einer Formel besteht, die
an dieser Stelle noch nicht analysierbar ist. Aus der zweiten Eigenschaft k¨
onnen
weitere Informationen gewonnen werden. Es existiert wiederum die definierende
Klammer inverses Element von a genannt und die Beschreibung a0ist ein
Element von G.26. Es sind damit zwei m¨
ogliche Verbindungen konstruierbar.
[is element of, Gruppe, inverses Element]
[is property, neutrales Element, inverses Element]
Hierbei tritt wiederum ein Problem auf. Der gegenw¨
artige Analyseprozess er-
kennt den Zusammenhang zwischen neutralem und inversem Element nicht
vollst¨
andig.
Diese einzelnen semantischen Informationen lassen sich in die Wissensbasis in-
tegrieren, indem drei neue Konzepte gebildet werden: Gruppe,inverses Ele-
ment und neutrales Element. Die Wissensbasis muss dazu die Konzepte
25Da die S¨
atze relativ einfach sind, soll die Zuordnung von syntaktischen zu semantischen
Komponenten nicht explizit gezeigt werden.
26Zu den Schwierigkeiten f¨
ur eine genauere Analyse dieser S¨
atze, siehe Kapitel 5.
146 KAPITEL 3. MATHEMATISCHE STRUKTUREN
Menge,Verkn¨
upfung und Assoziativgesetz enthalten, wobei die Bezeich-
nung Assoziativgesetz durch das Konzept assoziativ mit der Eigenschaft, dass
die Bezeichnung auch Assoziativgesetz sein kann, realisiert wird. Dies wird in
Abbildung 3.33 dargestellt.
inverses Element
neutrales Element
Menge
Gruppe
assoziativ
Name2: Assoziativgesetz
Einschränkung auf die Gruppe
is_element_of
has_property
is_a
has_property
is_a
is_element_of
Verknüpfung
Abbildung 3.33: Darstellung in der Ontologie
Die Entit¨
at Satz.S¨
atze besitzen eine komplexere semantische Struktur, die
schwieriger zu analysieren ist als die von Definitionen. Es existieren verschiede-
ne Binnenstrukturen: Implikationen, ¨
Aquivalenzen und einfache Aussagen. Die
wichtigsten semantischen Tr¨
ager in den S¨
atzen sind die Verben und die Phra-
sen f¨
ur Implikationen und ¨
Aquivalenzen, die zu den entsprechenden logischen
Operatoren geh¨
oren. Alle Begriffe, die in einem Satz auftreten, m¨
ussen vor der
Analyse in der Wissensbasis vorhanden sein. Es fehlen also die Beziehungen
zwischen den Konzepten, die die Implikation is implication und die ¨
Aquiva-
lenz is equivalent repr¨
asentieren. Außerdem muss ein Satz anders gehandhabt
werden als das semantischen Netz, das durch Definitionen gebildet wird. Ei-
ne Vermischung der Sachverhalte und Begriffe w¨
urde sonst zu Komplikationen
f¨
uhren. So besteht z. B. eine ¨
Aquivalenz aus zwei Aussagen. Jede Aussage wird in
der Wissensbasis zusammengefasst bzw. eingekapselt (Aussagenkapselung).
Dabei ist auch die ¨
Aquivalenzbeziehung eine Aussage, die ebenfalls gekapselt
wird. Dadurch ist es m¨
oglich, komplexere Strukturen als einfache Aussagen zu
bilden und diese wieder mit anderen Strukturen in Beziehung zu setzen, ohne
das Begriffsnetz zu beeinflussen.
3.4. WISSENSSTRUKTUREN 147
Als erstes soll ein einfacher Aussagesatz aus Beispiel 3.3.25 betrachtet werden:
Jeder Vektorraum besitzt eine Basis.
Prädikat
Subjekt Objekt
jeder Vektorraum Basis
besitzen
Abbildung 3.34: Zerlegung des Theorems in semantische Bausteine
Dieser Satz ist relativ einfach zu analysieren. Vorausgesetzt, dass die Begrif-
fe Vektorraum und Basis in der Wissensbasis enthalten sind, wird durch das
Pr¨
adikat eine neue Beziehung belong induziert. In diesem Fall wird auch der
Allquantor (gekennzeichnet durch das Wort jeder) verwendet, der durch ein
Unterkonzept zum Konzept Vektorraum realisiert wird:
[belong, Basis, VektorraumALL]
Damit wird die in Abbildung 3.35 Struktur in der Wissenbasis erzeugt.
Vektorraum
belomgs_to
Basis
Vektorraum
Quantor: ALL
has_allquantor
Aussagenkapselung
Abbildung 3.35: Darstellung in der Wissensbasis f¨
ur das Beispiel 3.3.25
Exemplarisch f¨
ur eine Implikation soll nun der Basiserg¨
angzungssatz 3.3.26 in
der Wissensbasis dargestellt werden.
Basisauswahlsatz
Sei Beine Menge von Vektoren des Vektorraums V.Bist genau dann eine
Basis, wenn Bein minimales Erzeugendensystem ist.
148 KAPITEL 3. MATHEMATISCHE STRUKTUREN
In diesem Fall muss zuerst die Voraussetzung Sei Beine Menge von Vekto-
ren des Vektorraums V. betrachtet werden. Voraussetzungen werden nicht in
die Wissensbasis integriert, sondern nur tempor¨
ar angelegt. Die einzige in ih-
nen enthaltene semantische Information ist, welchen Begriff sie einer mathema-
tischen Zeichenkette zuordnen. Dieses Symbol wird dann als Synonym des ma-
thematischen Begriffs innerhalb der Entit¨
at verwendet. Folgende semantischen
Informationen lassen sich aus der Voraussetzung des Basiserg¨
anzungssatzes ge-
winnen:
[is a, Vektorraum, V]
[is a, Menge von Vektoren des Vektorraums, B]
Anschließend wird die Implikation behandelt. Der Satz wird gem¨
seiner Bin-
nenstruktur aufgel¨
ost und in zwei Komponenten zerlegt: Bist genau dann eine
Basis und Bist ein minimales Erzeugendensystem. Diese Zerlegung wird in
Abbildung 3.36 dargestellt:
Forderung Folgerung
ist
Wenn
BasisB
minimales Erzeugendensystem
B
ist
Subjekt Objekt Subjekt Objekt
dann
Prädikat
Prädikat
B ist ein minimales Erzeugendensystem B ist Basis
Abbildung 3.36: Zerlegung des Satzes in semantische Bausteine
Nun m¨
ussen zun¨
achst Forderung und Folgerung intern aufgel¨
ost werden:
[is a, minimal erzeugendes System, Menge von Vektoren] Forderung
[is equivalent, Basis, Menge von Vektoren] Folgerung
[is implication, Forderung, Folgerung]
In Abbildung 3.37 wird die Visualisierung des Basiserg¨
anzungssatzes in der
Wissensbasis dargestellt. Die gestrichelten Bereiche deuten die Kapselung an.
3.4. WISSENSSTRUKTUREN 149
Forderung, Folgerung und die gesamten Aussagen werden dabei gekapselt, wo-
bei die is implication-Beziehung in diesem Fall nur die Kapselungen verbindet.
Dementsprechend ist eine Kapselung ein spezielles Konzept in der Wissensbasis.
Menge von Vektoren
Vektor
Vektorraum
Basis
Vektor
is_element_of
is_equivalent
Erzeugendensystem
min. Erz.system
Eigenschaft: minimal
is_a
is_implication
Aussagenkapselung
Aussagenkapselung Aussagenkapselung
Abbildung 3.37: Darstellung in der Wissensbasis des Beispiels 3.3.26
Die Entit¨
at Axiom.Axiome sind unbeweisbare Tatsachen, die in Texten
nur sehr selten auftreten und die daher grunds¨
atzlich manuell in die Wissens-
basis integriert werden. Damit soll verhindert werden, dass die Integrit¨
at der
Ontologie gef¨
ahrdet wird.
3.4.3 Zusammenfassung
Die Grundstruktur der Wissensbasis besteht aus der axiomatischen Mengenlehre
und der Pr¨
adikatenlogik. Mithilfe dieser Theorien werden grundlegende mathe-
matische Strukturen in einer Ontologie als Konzepte und Beziehungen zusam-
mengestellt. Begriffe, die durch Definitionen eingef¨
uhrt werden, sind Konzepte
in der Wissensbasis. Der Konzeptname wird durch den Begriffsnamen festge-
legt. Die Konzepte werden dann ¨
uber is a-Beziehungen mit anderen Konzepten
150 KAPITEL 3. MATHEMATISCHE STRUKTUREN
verbunden. Eigenschaften werden mittels der has property-Beziehung an das
betreffende Konzept gebunden. In diesem Prozess k¨
onnen aber nur Begriffe bzw.
Konzepte aufgenommen werden, die sich auf Konzepte beziehen, die schon in
der Wissensbasis vorhanden sind.
Sachverhalte werden durch S¨
atze beschrieben. Die Integration von S¨
atzen ist un-
gleich schwerer als die von Definitionen. Es werden dabei keine neuen Konzepte
eingef¨
uhrt, sondern Sachverhalte miteinander verbunden. Dadurch entstehen
komplexe Strukturen in der Wissensbasis. Es werden dabei beispielsweise ¨
uber
¨
Aquivalenzbeziehungen Aussagen miteinander verkn¨
upft. Um das Gesamtgef¨
uge
eines Satze nicht zu zerst¨
oren, werden die Aussagen gekapselt. F¨
ur die einzelnen
Satztypen existieren verschiedene Beziehungen, die sich aus der Binnenstruktur
ableiten lassen: is implication und is equivalent. F¨
ur einfache Aussagen ist das
Pr¨
adikat der Tr¨
ager der semantischen Information. Daher ist das Verb f¨
ur die
Bildung von Beziehungen verantwortlich.
Kapitel 4
Architektur von mArachna
Das Unsympathische an Computern ist, dass sie
nur ja oder nein sagen k¨
onnen, aber nicht vielleicht.
(Brigitte Bardot)
4.1 Gesamtkonzeption
In Kapitel 1.2 wurden Hypothesen aufgestellt, die nun durch die Implementie-
rung eines Prototypen in Software ¨
uberpr¨
uft werden sollen. Dieser Prototyp
mArachna wird Entit¨
aten (Kapitel 3.3.1) semantisch analysieren und die ent-
haltenen semantischen Informationen einer mathematischen Wissensbasis zur
Verf¨
ugung stellen.
mArachna besteht im Wesentlichen aus drei Komponenten (Abbildung 4.1): der
nat¨
urlichsprachlichen Analyse, der Wissensbasis und dem Information
Retrieval System. Die Wissenbasis stellt das Herzst¨
uck von mArachna dar: Sie
verwaltet mathematische Informationen, unterst¨
utzt den semantischen Anteil
der nat¨
urlichsprachlichen Analyse und pr¨
apariert die mathematischen Informa-
tionen f¨
ur das Information Retrieval System. Die mathematischen Informatio-
nen generiert mArachna aus den eingelesenen mathematischen Texten, die aus
Entit¨
aten bestehen. Entit¨
aten sind nach Kapitel 3.3.1 Definitionen, Theoreme,
S¨
atze usw.
151
152 KAPITEL 4. ARCHITEKTUR VON MARACHNA
Abbildung 4.1: Architektur von mArachna
Dabei k¨
onnen die Eingabetexte in verschiedenen Formaten vorliegen, die dann
mit Hilfe eines Konverters in das XML-Format TEI (Text Encoding Initiative
[TEIa]) umgewandelt werden. In weiteren Analyseschritten werden die Texte
zerlegt, bis nur noch einzelne W¨
orter vorliegen. Dabei bleibt aber die Posi-
tion der einzelnen W¨
orter im Gesamttext erhalten, so dass auch S¨
atze bzw.
Texte komplett bearbeitet werden k¨
onnen. Die zerlegten Texte werden dann
morphologisch, syntaktisch und semantisch analysiert. Am Ende des Prozesses
werden semantische Einheiten f¨
ur die Wissensbasis generiert. Die ¨
Ubergabe der
semantischen Einheiten an die Wissensbasis erfolgt dann durch den Ontology
Feeder. Dabei sollen nur mathematische Informationen aufgenommen werden,
f¨
ur die bereits Voraussetzungen (mathematische Grundlagen) in der Wissensba-
sis existieren. Die Wissensbasis selbst ist eine Ontologie, die durch einen RDF-
[RDF] und einen OWL-Parser [OWL] erzeugt wird.
Das Information Retrieval System unterteilt sich in zwei Komponenten: das
klassische Benutzerfrontend (UserFrontEnd) und das Visualisierungsfrontend
4.1. GESAMTKONZEPTION 153
(VisuFrontEnd). Das VisuFrontEnd dient zur Darstellung der einzelnen Ana-
lyseschritte von mArachna. Administratoren des Prototypen k¨
onnen hier ¨
uber
ein graphisches Interface einzelne Analyseschritte einsehen und diese gegebe-
nenfalls korrigieren (semiautomatischer Ansatz). Das UserFrontEnd bietet dem
Benutzer die M¨
oglichkeit, Fragen an das System zu stellen und Antworten in
geeigneter Form zu pr¨
asentieren. Ein m¨
ogliches UserFrontEnd ist z. B. ein ma-
thematisches Lexikon.
Abbildung 4.2: Pakethierarchie
F¨
ur die Implementierung von mArachna wurde haupts¨
achlich die Programmier-
sprache Java verwendet. Die Software besteht aus zahlreichen einzelnen Anwen-
dungen, die jeweils eine bestimmte Aufgabe im Analyseprozess erf¨
ullen. Die Ge-
samtstruktur wird in Abbildung 4.2 dargestellt. Die f¨
ur die nat¨
urlichsprachliche
Analyse relevanten Teile sind im Paket wbs.lexana zusammengefasst:
wbs.lexana.segment (WordTokenizer)
wbs.lexana.morph (morphologische Analyse)
wbs.lexana.syntax (syntaktische Analyse)
wbs.lexana.semantic (semantische Analyse)
wbs.lexana.summoner (OntologyFeeder)
Die Wissensbasis ist im Paket wbs.knowbase enthalten:
wbs.lexana.rdf (RDF-Parser)
wbs.lexana.owl (OWL-Parser)
154 KAPITEL 4. ARCHITEKTUR VON MARACHNA
Das Information Retrieval System ist eine webbasierte Benutzeroberfl¨
ache
(WebFrontEnd), die die Ausgaben von mArachna verarbeitet und darstellt.
In den folgenden Abschnitten werden die drei Komponenten nat¨
urlichsprach-
liche Analyse, Wissensbasis und Information Retrieval System genauer darge-
stellt.
4.2. NAT ¨
URLICHSPRACHLICHE ANALYSE 155
4.2 Nat¨
urlichsprachliche Analyse
Worte sind Gegenst¨
ande:
Man kann sich an ihnen stoßen.
(Wolfgang Herbst)
Die nat¨
urlichsprachliche Analyse umfasst die morphologische,syntaktische
und semantische Analyse. Diese Analysen sind nicht eindeutig voneinander zu
trennen und beeinflussen sich gegenseitig. Allerdings werden in mArachna zuerst
die morphologischen und syntaktischen Analysen durchgef¨
uhrt. Zum Schluss
erfolgt auf Basis dieser beiden Analysen die semantische Analyse. Somit ist eine
getrennte Betrachtung der einzelnen Komponenten m¨
oglich.
Die in der nat¨
urlichsprachlichen Analyse verwendeten Verfahren (Kapitel 2.4)
sind sehr einfache und zumeist regelbasiert. Im Folgenden wird anhand eines
Beispieltextes (Abbildung 4.3) die nat¨
urlichsprachliche Analyse diskutiert. Al-
lerdings soll nicht der gesamte Text betrachtet werden, da dadurch die Analyse
zu kompliziert wird, um sie auf Papier darzustellen.
4.2.1 Zerlegung von L
A
T
E
X in Satzteile, W¨
orter und For-
meln
Der mathematische Texte wird zun¨
achst vom L
A
T
EX-Format in das TEI-Format
konvertiert. TEI steht dabei f¨
ur Text Encoding Initiative [TEIa, SMB03a,
SMB03b, TEIb].
156 KAPITEL 4. ARCHITEKTUR VON MARACHNA
Definition
Seien Veine Menge und Kein K¨
orper mit den zwei Verkn¨
upfungen:
V×VVAddition mit < a, b >7→ a+b.
K×VVMultiplikation mit einem Skalar mit < α, b >7→ αb.
Vmit der Addition und Multiplikation heißt Vektorraum ¨
uber K. Die
Elemente aus Vheißen Vektoren und die Elemente aus Kheißen Skalare
oder Koeffizienten.
F¨
ur die Addition gilt:
a+b=b+a,a, b V(kommutativ)
a+ (a+b) = (a+b) + c,a, b, c V(assoziativ)
0V, so dass a+ 0 = a,aV(neutrales Element)
Zu jedem aV aV, so dass a+ (a) = 0 (inverses Element
zu a)
F¨
ur die Multiplikation mit Skalaren gilt:
α(βa) = (αβ)a,aVund α, β K(assoziativ)
1a=a,aV(neutrales Element)
Zwischen Addition und Multiplikation mit Skalaren gelten die Distribu-
tivgesetze:
α(a+b) = αa +αb,aVund αK
(α+β)a=αa +βa,aVund α, β K
Abbildung 4.3: Beispieltext Definition f¨
ur den Vektorraum [SJZ04]
4.2. NAT ¨
URLICHSPRACHLICHE ANALYSE 157
TEI is an international and interdisciplinary standard that helps
libraries, museums, publishers, and individual scholars represent all
kinds of literary and linguistic texts for online research and teaching,
using an encoding scheme that is maximally expressive and minimal-
ly obsolescent. [TEIa]
Dieses Format wurde entwickelt, um ein standardisiertes Verfahren bereitzustel-
len, das auch semantische Strukturen (z. B. ¨
Uberschriften) und typographische
Informationen von Texten in elektronischen Medien kodieren kann und dabei
unabh¨
angig vom verwendeten Betriebssystem ist. Urspr¨
unglich wurde die Stan-
dard Generalized Markup Language (SGML) verwendet, mittlerweile gibt es
aber auch Versionen in XML.
Interessant sind die TEI-Richtlinien f¨
ur jeden, der einen elektroni-
schen Text in einem dauerhaften Format speichern will. Insbesonde-
re Textwissenschaftler aller Art, z. B. Literaturwissenschaftler oder
Linguisten, werden in TEI eine M¨
oglichkeit finden, sich von pro-
priet¨
aren Systemen der Textspeicherung (wie z. B. MS-Word) oder
von offenen Standards, deren Komplexit¨
at den gestellten Aufgaben
nicht gewachsen ist (z. B. HTML), frei zu machen. [TEIb]
Das TEI-Format bietet sich daher als Standardschnittstelle f¨
ur die nat¨
urlich-
sprachliche Analyse an. Dadurch existiert eine Schnittstelle f¨
ur weitere Parser,
die z. B. mathematische Texte von HTML nach TEI ¨
ubersetzen k¨
onnen. TEI ist
aufgrund der Verwendung von XML sehr flexibel, so dass auch mathematische
Inhalte mittels MathML 2.0 ([W3C04], siehe unten) integriert werden k¨
onnen.
Aus den genannten Gr¨
unden wurde in mArachna die XML-Variante TEI P4
verwendet.
MathML is an XML application for describing mathematical no-
tation and capturing both its structure and content. The goal of
MathML is to enable mathematics to be served, received, and proces-
sed on the World Wide Web, just as HTML has enabled this func-
tionality for text. [W3C03]
Mit MathML k¨
onnen also nicht nur mathematische Zeichen in Webseiten darge-
stellt (Presentation Markup), sondern auch mathematische Inhalte semantisch
158 KAPITEL 4. ARCHITEKTUR VON MARACHNA
ausgezeichnet werden (Content Markup). Die Interpretation von semantischen
Inhalten wird dann erforderlich, wenn z. B. verschiedene Notationen verwen-
det werden. Somit bietet MathML die M¨
oglichkeit, mathematische Formeln zu
interpretieren und sie somit f¨
ur die semantische Analyse von mathematischen
Texten zug¨
anglich zu machen. In Abbildung 4.4 ist ein Ausschnitt aus dem Bei-
spieltext 4.3 im TEI-Format mit integriertem MathML zu sehen. Der gesamte
Text ist in Anhang 6.1 angef¨
ugt.
Abbildung 4.4: TEI-MathML-Textausschnitt
Nach der Konvertierung des L
A
T
EX-Textes in das TEI-Format wird der Text
zun¨
achst in einzelne Entit¨
aten zerlegt. Dadurch entstehen Definitionen, S¨
atze
usw., die schon im Originaltext ausgezeichnete Strukturelemente waren. Somit
kann die straffe Struktur von mathematischen Texten (Kapitel 3.3.6) ausgenutzt
werden. Daraus k¨
onnen bereits erste semantische Schlussfolgerungen gezogen
werden, die in anderen fachsprachlichen Texten normalerweise nicht so stark
ausgepr¨
agt vorliegen. Anschließend werden die Texte in immer kleiner werdende
weitere Strukturelemente zerlegt. Dies geschieht ¨
uber ausgezeichnete Struktur-
elemente wie z.B. Listen, ¨
uber S¨
atze bis hin zu einzelnen W¨
ortern und Formeln.
Zu den W¨
ortern z¨
ahlen dabei auch Satzzeichen wie Punkte und Kommata.
Diese strukturelle Zerlegung (WordTokenizer) erfolgt in mArachna durch die
Klasse wbs.lexana.segment.XMLReader. Der XMLReader liest den in TEI ko-
dierten Text ein und zerlegt ihn in seine Strukturelemente. Aufbauend auf
4.2. NAT ¨
URLICHSPRACHLICHE ANALYSE 159
der Basisklasse wbs.lexana.segement.structure.Structure existieren f¨
unf
grundlegende Strukturelemente, deren Strukturhierarchie in Abbildung 4.5 dar-
gestellt ist:
Environment: gesamtes Dokument, Entit¨
aten und Listeneintr¨
age
ItemList: Listen
MathEnvironment: mathematische Elemente wie z. B. Formeln
Sentence: S¨
atze
Word: W¨
orter
Environment
Word
Word
Word
ItemList
Word
MathEnvironment
Word
Sentence
Environment Sentence
Abbildung 4.5: Textstruktur
In Beispiel 4.2.1 wird vereinfacht die Zerlegung f¨
ur den Beispieltext vorgestellt1.
Das gesamte Dokument, die Entit¨
at (Definition) und die Listeneintr¨
age (z. B.:
V×V Vmit Addition [...]) geh¨
oren der Strukturelementklasse Environ-
ment an, jedoch besitzen sie unterschiedliche Typen (document,definition und
item). Environments werden gekennzeichnet durch:
<environment type="TYPNAME">
Inhalt des Environments
</enviroment>
1Die vollst¨
andige Datei befindet sich in Anhang 6.2
160 KAPITEL 4. ARCHITEKTUR VON MARACHNA
Der Tag <item> kennzeichnet Listen bzw. Auflistungen, die ihrerseits die oben
genannten Listeneintr¨
age enthalten. Listen geh¨
oren der Klassen wbs.lexana.
segment.structure.ItemList an. Listen werden gekennzeichnet durch:
<list>
<enviroment type="item">LISTENEINTRAG 1</environment>
<enviroment type="item">LISTENEINTRAG 2</environment>
</list>
S¨
atze werden durch die Klasse wbs.lexana.segment.structure.Sentence und
W¨
orter durch wbs.lexana.segment.structure.Word gekennzeichnet:
<sentence>
<word>WORTEINTRAG</word>
<word>WORTEINTRAG</word>
</sentence>
Als gesonderte Elemente werden mathematische Zeichen, wie Formeln und Sym-
bole, behandelt. Sie werden durch MathML-Code integriert.
Beispiel 4.2.1 (Zerlegung des Beispielstextes 4.3 in seine Strukturelemente)
<environment type="document">
<environment type="definition">
<sentence>
<word>Seien</word>
<math xmlns="http://www.w3.org/1998/Math/MathML" display="inline">
<mrow><mi>V</mi></mrow>
</math>
<word>eine</word>
<word>Menge</word>
<word>,</word>
[...]
</sentence>
<list>
<environment type="item">
<sentence>
[...]
4.2. NAT ¨
URLICHSPRACHLICHE ANALYSE 161
</sentence>
</environment>
<environment type="item">
<sentence>
[...]
</sentence>
</environment>
</list>
<sentence>
[...]
</sentence>
</environment>
</environment>
Nach dieser Zerlegung werden die S¨
atze als Aneinanderreihungen von W¨
ortern
in Haupt- und Nebens¨
atze zerlegt:
wbs.lexana.segment.sentence.MainClause (Hauptsatz)
wbs.lexana.segment.sentence.SubClause (Nebensatz)
Dies geschieht in wbs.lexana.segment.structure.Sentence mit der Methode
getSentenceType() (Abbildung 4.6). In der Methode wird ¨
uber die einzelnen
W¨
orter iteriert und nach Kommata und Schl¨
usselw¨
ortern (unterordnende Kon-
junktion: wenn, dass usw.) gesucht. Die Schl¨
usselw¨
orter k¨
onnen entweder am
Satzanfang (Abb. 4.6 Kasten links) oder hinter einem Komma (Abb. 4.6 Kas-
ten rechts) stehen.
if (!comma)
if (comma)
handleComma();
else if (Schlüsselwort)
else
handleHauptsatz();
if (comma)
if (Schlüsselwort)
Nebensatz bis zum nächstenKomma
else
handleHauptsatz();
handleComma()
Nebensatz mit Schlüsselwort als Einleitung;
getSentenceType()
Abbildung 4.6: Funktionsweise von getSentenceType()
162 KAPITEL 4. ARCHITEKTUR VON MARACHNA
Diese Form der Verarbeitung von S¨
atzen ist sicherlich nicht vollst¨
andig, da u. a.
uneingeleitete Nebens¨
atze (ohne Konjunktion) und Pronominals¨
atze nicht als
solche und als Haupts¨
atze gekennzeichnet werden. Jedoch werden durch die
vorhandene Konstruktion viele mathematische S¨
atze korrekt verarbeitet. Au-
ßerdem k¨
onnen auf diese Art nichtgrammatikalische Konstruktionen, wie S¨
atze
ohne Verb oder S¨
atze, die nur aus mathematischen Zeichen bestehen, als Haupt-
satz gekennzeichnet werden.
4.2.2 Morphologische Analyse
Die morphologische Analyse, obwohl als Prozess unabh¨
angig von der syntakti-
schen Analyse, ist so ausgelegt, dass die syntaktische Analyse m¨
oglichst pro-
blemlos auf sie aufsetzen kann. Sie basiert auf einem W¨
orterbuch, in dem alle
in mathematischen Texten auftretenden W¨
orter manuell eingetragen werden.
Es ist anzunehmen, dass sich die mathematische Sprache durch einen kleineren
Wortschatz als andere Fachsprachen auszeichnet (Kapitel 2.4.4, Kapitel 1.2 Hy-
pothese 1.2.3). Insbesondere ist die Menge der W¨
orter, die nicht direkt der ma-
thematischen Terminologie angeh¨
oren, eng begrenzt. Zu diesen W¨
ortern z¨
ahlen
z. B. die Artikel, Konjunktionen, h¨
aufig gebrauchte Verben (z. B.: sein, besitzen,
existieren usw.). Der Rest der W¨
orter geh¨
ort der mathematischen Terminologie
an, die in Definitionen charakterisiert wird. Es handelt sich haupts¨
achlich um
Adjektive und Substantive. Beide W¨
ortergruppen bilden den mathematischen
Wortschatz.
Das W¨
orterbuch von mArachna besteht aus zwei XML-Dateien:
eine W¨
orterliste mit Suffixzuordnungen
wbs/lexana/morph/verbosity.words.xml
eine Liste mit Suffixregeln
wbs/lexana/morph/suffix.suffixes.xml
Diese beiden Dateien werden ¨
uber den entsprechenden Reader
wbs.lexana.morph.WordReader f¨
ur words.xml
wbs.lexana.morph.SuffixReader f¨
ur suffixes.xml
4.2. NAT ¨
URLICHSPRACHLICHE ANALYSE 163
durch den wbs.lexana.morph.WordAnalyzer eingelesen. Die so erzeugten
W¨
orter werden mit den einzelnen W¨
ortern des Textes verglichen.
Beispiele f¨
ur Eintr¨
age in der Datei words.xml:
Substantiv: Abbildung
<word base="abbildung" root="abbildung">
<substantive genus="f" declination="IX" />
</word>
regelm¨
aßiges Verb: beweisen
<word base="beweisen" root="beweis">
<verb conjugation="reg" type="full"/>
</word>
unregelm¨
aßiges Verb: sein
<word base="sein" root="" >
<verb conjugation="irr" type="full">
<irregular person="3" [...] form="ist"/>
<irregular person="3" [...] form="sind"/>
<irregular person="3" [...] form="seien"/>
<irregular person="3" [...] form="sei"/>
</verb>
</word>
Pr¨
aposition: auf
<word base="auf" root="auf">
<preposition/>
</word>
164 KAPITEL 4. ARCHITEKTUR VON MARACHNA
Beispiele f¨
ur Eintr¨
age in der Datei suffix.xml:
F¨
ur Substantive:
<suffix verbosity="substantive" type="IX">
<declination casus="n|g|d|a" numerus="s" suffix="*" />
<declination casus="n|g|d|a" numerus="p" suffix="en" />
<declination casus="n|g|d|a" numerus="p" suffix="n" />
</suffix>
F¨
ur regelm¨
aßige Verben:
<suffix verbosity="verb" type="reg">
<conjugation person="3" [...] suffix="t"/>
<conjugation person="3" [...] suffix="en"/>
</suffix>
MorphAnalyzer
words.xml suffixes.xml
verbosity.Word
MorphWord
Adjective Bracket
Article
Conjunction
MathWord
Preposition
Pronoun
Substantive
SymbolVerb
WordReader SuffixReader
MathAnalyzer
ConjunctionPredicative
ConjunctionAdjective
ConjunctionMain
Abbildung 4.7: Struktur der semantischen Analyse
4.2. NAT ¨
URLICHSPRACHLICHE ANALYSE 165
Die W¨
orter aus den mathematischen Texten werden den entsprechenden Wort-
arten zugeordnet, die durch Java-Klassen repr¨
asentiert werden. Diese Klassen
sind von der Basisklasse wbs.lexana.morph.verbosity.Word abgeleitet und
entsprechen den bekannten Wortarten [Dud98]. Des Weiteren gibt es zus¨
atzli-
che Wortklassen, die sich als n¨
utzlich erwiesen haben:
Wortarten:
1. wbs.lexana.morph.verbosity.Substantive (Substantiv)
2. wbs.lexana.morph.verbosity.Verb (Verb)
3. wbs.lexana.morph.verbosity.Adjective (Adjektiv)
4. wbs.lexana.morph.verbosity.Article (Artikel)
5. wbs.lexana.morph.verbosity.Pronoun (Pronomen)
6. wbs.lexana.morph.verbosity.Preposition (Pr¨
aposition)
7. wbs.lexana.morph.verbosity.Conjunction (Konjunktion)
Zus¨
atzliche Word-Klassen:
1. wbs.lexana.morph.verbosity.MathWord
2. wbs.lexana.morph.verbosity.Symbol
3. wbs.lexana.morph.verbosity.Bracket
4. wbs.lexana.morph.verbosity.ConjunctionAdjective
5. wbs.lexana.morph.verbosity.ConjunctionMain
6. wbs.lexana.morph.verbosity.ConjunctionListBack
In mArachna werden nicht alle Formen von Partikeln (unflektierbare W¨
orter)
behandelt. Adverbien werden je nach ihrem Gebrauch den Adjektiven oder
Pr¨
apositionen zugeordnet. Das ist zwar grammatikalisch falsch, jedoch wird die
syntaktische Analyse dadurch vereinfacht. Interjektionen, eine weitere Art der
Partikel, treten im mathematischen Wortschatz (Kapitel 3.3) nicht auf.
Die zus¨
atzlichen Word-Klassen sind zur Vereinfachung der nat¨
urlichsprachlichen
Analyse konstruiert worden. Die MathWord-Klasse beinhaltet alle mathema-
tischen Zeichen und Formeln, die im wbs.lexana.morph.MathAnalyzer separat
166 KAPITEL 4. ARCHITEKTUR VON MARACHNA
verarbeitet werden. So k¨
onnen in mArachna einfache mathematische Symbo-
le und Konstruktionen erkannt werden. Die Symbol-Klasse handhabt einzelne
Buchstaben und Ziffern, die in der Mathematik hinter dem Substantiv auftre-
ten, und wichtige Satzzeichen (z. B.: :, ;). Die Bracket-Klasse beschreibt die
Klammersymbole als besondere Symbole, da in der Mathematik h¨
aufig hinter
einer Formel (MathWord) definierende Begriffe in Klammern aufgef¨
uhrt werden.
Ein zus¨
atzliches Problem f¨
ur die syntaktische Analyse sind die verschiedenen
Konjunktionsverbindungen, die in der mathematischen Sprache insbesondere
in den Voraussetzungen (Kapitel 3.3.2) auftreten. Die Wortart Conjunction
wird in der morphologischen Analyse verwendet. Die letzten drei Word-Klassen
(ConjunctionAdjektive,ConjunctionMain und ConjunctionListBack) sind
in der syntaktischen Analyse von Bedeutung. Dort wird eine Conjunction ge-
gebenenfalls in eine dieser zus¨
atzlichen Klassen umgewandelt. Sie sind grob un-
terteilt nach der Verwendungsart der Konjunktion (Verbindung von W¨
ortern,
Wortgruppen oder S¨
atzen):
1. Verbindung von Adjektiven
wbs.lexana.morph.verbosity.ConjunctionAdjective
f ist injektiv und surjektiv.
2. Hauptsatzverbindungen:
wbs.lexana.morph.verbosity.ConjunctionMain
A ist eine Menge und B ist eine Gruppe.
3. Aufz¨
ahlungen zum Satzende2
wbs.lexana.morph.verbosity.ConjunctionListBack
Ein Paar (A, ), bestehend aus einer Menge A und einer Verkn¨
upfung
.
4. Sonstige unterordnende Konjunktionen
wbs.lexana.morph.verbosity.Conjunction
A und B seien Mengen.
Da Entit¨
aten verwendet werden und dort relativ strenge Regeln f¨
ur die Verwen-
dung von W¨
ortern gelten, werden morphologische Ambiguit¨
aten weitestgehend
2Diese Konstruktion wurde aus rein technischen Gr¨
unden gew¨
ahlt.
4.2. NAT ¨
URLICHSPRACHLICHE ANALYSE 167
vermieden oder in dieser Phrase der Analyse nicht erkannt. In einer sp¨
ateren
Phase der morphologischen Analyse werden alle W¨
orter einem allgemeinen Typ
bzw. einer Basisklasse wbs.lexana.morph.MorphWord zugeordnet. Die Instan-
zen dieser Basisklasse enthalten die Wortart und Zusatzinformationen, die f¨
ur
die semantische Analyse von Interesse sind (z. B. den Numerus).
In Beispiel 4.2.2 wird ein Ausschnitt der Protokolldatei der morphologischen
Analyse des Beispieltextes 4.3 dargestellt. Es kann daraus abgelesen werden, in
welchem der Zust¨
ande (Personal-, Tempus-, Kasus-, Numerus- und Genusfor-
men) das Wort m¨
oglicherweise steht. Allerdings kann keine eindeutige Aussage
¨
uber den Zustand gemacht werden. Jedoch werden in mArachna diese Zust¨
ande
nur als Zusatzinformationen betrachtet. Ausgenommen sind die Numerusformen
(Singular und Plural), die bereits verwendet werden.
Beispiel 4.2.2 (Morphologischen Analyse des Beispielsatzes 4.3)
Seien V eine Menge [...]
<morph>
<word>
<form>seien</form>
<verb>
<conjugation conj="full"/>
<person person="3p"/>
<tempus tempus="praesens"/>
<mode mode="pre"/>
</verb>
</word>
<word>
<form>V</form>
<math/>
</word>
<word>
<form>eine</form>
<article/>
</word>
<word>
<form>menge</form>
168 KAPITEL 4. ARCHITEKTUR VON MARACHNA
<substantive>
<declination type="IX"/>
<genus type="f"/>
<numerus num="s"/>
<casus casus="n|g|d|a"/>
</substantive>
</word>
[...]
</morph>
4.2.3 Syntaktische Analyse
In der syntaktischen Analyse werden die S¨
atze in ihre Satzstrukturelemente
zerlegt, um diese f¨
ur die semantische Analyse zu pr¨
aparieren. Als grundlegende
Idee wurde dazu die von Chomsky (Kapitel 2.4.2) vorgeschlagene Phrasenstruk-
turgrammatik verwendet. Dabei sind zwei Teilschritte n¨
otig, die f¨
ur Haupt- und
Nebens¨
atze getrennt durchgef¨
uhrt werden.
eine Vorverarbeitung
die Generierung der Phrasenstruktur
Ein Transformer (wbs.lexana.segment.Transformer) bereitet typische mathe-
matische Konstruktionen anhand der Vorverarbeitungsregeln auf, die im Kapitel
3.3 aufgelistet wurden. Sie pr¨
apariert somit die einzelnen S¨
atze f¨
ur den Phra-
senstrukturgenerator. Daf¨
ur wurden eine Reihe von Regeln f¨
ur typische mathe-
matische Konstruktionen entwickelt (Kapitel 3.3), zum Beispiel:
Verbvorverarbeitungsregeln:
Stehen die Verben sei oder seien am Satzanfang, dann verschiebe sie
hinter das MathWord.
Sei A eine Menge A ist eine Menge
Steht zwischen MathWord und Adjektiv kein Verb, so f¨
uge das Verb
sein ein.
f injektiv. f sein injektiv.
4.2. NAT ¨
URLICHSPRACHLICHE ANALYSE 169
Konjunktionsvorverarbeitungsregeln:
Werden zwei Haupts¨
atze durch ein und getrennt, so bilde zwei sepa-
rate S¨
atze.
Sei A eine Menge und B eine Gruppe A ist eine Menge, B ist
eine Gruppe
Im Rahmen der Verbvorverarbeitung werden dem Verb Zusatzinformationen
beigef¨
ugt. So ist das Verb sei am Satzanfang ein Kennzeichen f¨
ur eine Vor-
aussetzung (Kapitel 3.3.2) und erh¨
alt diese Zusatzinformation f¨
ur die semanti-
sche Analyse, auch wenn es w¨
ahrend der Vorverarbeitung innerhalb des Satzes
verschoben wird. Der Transformer enth¨
alt daf¨
ur eine Zusammenstellung von
typischen Konstruktionen der mathematischen Sprache.
Transformer PhraseGenerator
TransformerMain
TransformerSub
PhraseGeneratorMain
PhraseGeneratorSub
Nominalphrase
Verbphrase
phrase.Phrase
NominalConjunctionAdjectivephrase
Adjectivephrase
NominalConjunctionMainphrase
NominalConjunctionphrase
NominalConjunctionPredicativephrase
Hauptsatz
Nebensatz
NominalPrepositionphrase
AdjectivePredicativephrase
AdjectiveAttributivephrase
Abbildung 4.8: Struktur der syntaktischen Analyse
170 KAPITEL 4. ARCHITEKTUR VON MARACHNA
Nach der Vorverarbeitung werden die Phrasen gebildet. Neben den durch
Chomsky bekannten Phrasen (Kapitel 2.4.2) werden weitere Phrasentypen ver-
wendet, um die semantische Analyse zu vereinfachen:
1. Bekannte Phrase:
Nominalphrase
Verbalphrase
Adjectivephrase
2. Zusatzphrasen:
NominalPrepositionphrase
AdjectivePredicativephrase
AdjectiveAttributivephrase
NominalConjunctionphrase
NominalConjunctionMainphrase
NominalConjunctionPredicativephrase
Nominalphrase
Eine grundlegende Phrase ist die Nominalphrase (NP). Sie besitzt die Kompo-
nenten bzw. Wortformen (Darstellungen in EBNF):
Sub ::= SUBSTANTIVE (* Substantiv *)
Art ::= ARTICLE (* Artikel*)
Pro ::= PRONOUN (* Pronomen *)
Sym ::= SYMBOL (* Symbol *)
Mw ::= MATHWORD (* mathematische Zeichen *)
Pre ::= PREPOSITON (* Pr¨
aposition *)
Eine Nominalphrase wird im Phrasegenerator durch die folgenden Regeln er-
zeugt:
4.2. NAT ¨
URLICHSPRACHLICHE ANALYSE 171
NP ::= [Pre] [Art |Pro] Sub [Mw |Sym];
NP ::= [Pre] [Art |Pro] Mw;
Sub Sym
NP NP
Art
Menge
Pre SubArt
für eine Menge Meine
Abbildung 4.9: Beispiele f¨
ur die Nominal-Phrase
Adjectivephrase
Die wbs.lexana.segment.phrase.Adjectivephrase ist die Basisklasse f¨
ur die
Verwendung von Adjektiven.
AP ::= (Adj)+;
Es gibt eine weitere Klasse, die von der Adjectivephrase-Klasse abgeleitet
wird:
1. AdjectiveAttributivephrase: Adjektive stehen vor dem Substantiv
bzw. MathWord
AAP ::= [Pre] [Art |Pro] (Adj)+ Sub [Mw |Sym];
AAP ::= [Pre] [Art |Pro] (Adj)+ Mw;
AAP
Art Adj Sub
eine injektive Funktion
S
NP VP
Art Sub V AP
eine Funktion ist injektiv
Abbildung 4.10: Beispiele f¨
ur die Adjective-Phrasen
172 KAPITEL 4. ARCHITEKTUR VON MARACHNA
NominalConjunction-Konstruktionen
Die NominalConjunction-Konstruktionen sind und- oder oder-Verbindungen
von Satzteilen, die in der Mathematik sehr h¨
aufig verwendet werden. Auf-
grund der schon diskutierten Verwendung von verschiedenen Konjunktionen in
der morphologischen Analyse sind zwangsl¨
aufig auch verschiedene syntaktische
Phrasen notwendig.
1. NominalConjunctionMain: Haupts¨
atze, die durch eine Konjunktion ge-
trennt sind
NCMP ::= P P Con;
P ::= NP VP;
Con ::= CONJUNCTION;
2. NominalCojunctionPredicativephrase: Aufz¨
ahlungen
NCPP ::= P1 P2 Con;
P1 ::= NP VP;
P2 ::= NP |NPP;
Con ::= CONJUNCTION;
3. NominalConjunctionAdjectivephrase: Adjektive werden durch ein und
getrennt
NCAP ::= AP AP Con;
AP ::= (Adj)+;
Con ::= CONJUNCTION;
4. NominalConjunctionPhrase: sonstiges
NCP ::= P P Con;
P ::= NP |NP VP |NPP;
Con ::= CONJUNCTION;
4.2. NAT ¨
URLICHSPRACHLICHE ANALYSE 173
NCAP
AP AP P
Adj Adj
NCMP
Con
NP
P P
VPNP VP
Con
NCPP
P P
NP VP NP
NCP
Con P
NP NP VP
Con
und und
und und
Abbildung 4.11: Beispiele f¨
ur NominalConjunction-Phrasen
NominalPrepositionphrase
Die NominalPrepositionphrase ist eine Spezialkonstruktion f¨
ur die
Pr¨
apositional- und Konjunktionalgruppen.
1. NPP ::= {NP } | NP AAP
NPP
P P
NP NP
Sub Pre Mw
von fWertevorrat
Abbildung 4.12: Beispiele f¨
ur die NominalPreposition-Phrasen
Verbalphrase
Die Verbalphrase ist die zentrale Phrase. Sie besteht aus einem Verb und einer
Phrase, die in den weiteren Analysen als Objekt des Satzes erkannt werden
kann.
1. VP ::= Verb P;
174 KAPITEL 4. ARCHITEKTUR VON MARACHNA
2. Verb ::= VERB (* Verben*)
3. P ::= NP |NPP |NCAP |NCPP;
VAAP
VP
NP
VP
NPP
NP
Art SubV
ist eine Menge
Abbildung 4.13: Beispiele f¨
ur die Verb-Phrasen
Gesamtbetrachtung
Das Ergebnis ist eine Baumstruktur von Phrasen der einzelnen S¨
atze. In Abbil-
dung 4.14 wird die Analyse der Voraussetzung des Beispielsatzes 4.3 verdeut-
licht. Des Weiteren wird ein Ausschnitt der Protokolldatei der syntaktischen
Analyse vorgestellt. Die gesamte Protokolldatei f¨
ur den Beispielsatz findet sich
in Anhang 6.4.
Beispiel 4.2.3 (Syntaktische Analyse des Beispieltextes 4.3)
*******
** SATZ: Seien $ V $ eine Menge ,
$ K $ ein orper mit den zwei Verkn¨upfungen :
** HAUPTSATZ[1]: Seien $ V $ eine Menge
** HAUPTSATZ[2]: $ K $ ein orper mit den zwei Verkn¨upfungen :
Nominalphrase:
MathWord: V
Verbalphrase: Verb: sein
Nominalphrase:
Artikel: eine
Substantiv: menge
4.2. NAT ¨
URLICHSPRACHLICHE ANALYSE 175
Nominalphrase:
MathWord: K
Verbalphrase: Verb: sein
Nominalphrase mit Preposition:
Nominalphrase:
Artikel: ein
Substantiv: orper
Attributive Adjektiv:
Adjektiv: zwei
Preposition: mit
Artikel: den
Substantiv: verkn¨upfung
Symbol: :
Abbildung 4.14: Analyse des Beispielsatzes
176 KAPITEL 4. ARCHITEKTUR VON MARACHNA
4.2.4 Semantische Analyse
Die semantische Analyse versucht unter Verwendung der Ergebnisse der mor-
phologischen und syntaktischen Analyse die Inhalte von mathematischen Texten
zu extrahieren. Dazu verwendet sie ein einfaches Modell der regelbasierten Ana-
lyse, das in drei Schichten aufgebaut ist:
1. Aufl¨
osung der Phrasenstruktur zu einer Satzbaustruktur
wbs.lexana.semantic.SemanticPhraseAnalyzer
2. Analyse der Satzstruktur
wbs.lexana.semantic.SemanticPredicateAnalyzer
3. Analyse der Entit¨
atenstruktur
wbs.lexana.semantic.SemanticEntityAnalzyer
SemanticAnalyzer
SemanticPhraseAnalyzerMain SemanticPhraseAnalyzerSub
SemanticPredicateAnalzyerMain SemanticPredicateAnalyzerSub
SemanticEntityAnalyzer
Hauptsatz Nebensatz
Abbildung 4.15: Semantische Analyse
Der Vorteil der mathematischen Sprache, die in den einzelnen Entit¨
aten auftritt,
ist die Einfachheit der Satzkonstruktionen. Es handelt sich um Aussages¨
atze.
Die Struktur eines einfachen Satzes wird durch das Verb bestimmt. Es wird auch
als Pr¨
adikat bezeichnet. Vom Pr¨
adikat aufgerufen stehen im Satz die Satzglie-
der. Neben dem Pr¨
adikat und den Satzgliedern existieren Verbindungselemente,
die die einzelnen S¨
atze miteinander verkn¨
upfen. S¨
atze k¨
onnen dadurch komplexe
Strukturen bilden, die in der Mathematik aber nur selten auftreten.
4.2. NAT ¨
URLICHSPRACHLICHE ANALYSE 177
4.2.4.1 Charakterisierung von Satzgliedern
In mArachna werden nur wenige Satzglieder verwendet. Es existieren:
Pr¨
adikat
wbs.lexana.semantic.phrase.Predicate
Subjekt
wbs.lexana.semantic.phrase.NominalSubject
Objekt
wbs.lexana.semantic.phrase.ObjectPhrase
Satzadjektive
wbs.lexana.semantic.phrase.AdjectiveObject
Verbindungen
wbs.lexana.semantic.phrase.NominalConjunctionSubject
Insbesondere werden die Objekte nicht im Bezug auf ihr Genus betrachtet. Es
findet daher keine Unterscheidung zwischen Akkusativobjekt, Dativobjekt und
Genitivobjekt statt. Pr¨
apositionalobjekte werden ¨
uber das Objekt verarbeitet.
Der Satzgliedbau wird durch die Phrasenstruktur aus der syntaktischen Ana-
lyse simuliert. Die in mArachna getesteten S¨
atze aus der Beispieldefinition ha-
ben eine einfache Struktur, so dass bei der Identifizierung der Satzglieder keine
Schwierigkeiten auftreten.
Prädikat
Subjekt Objekt
Abbildung 4.16: Baumstruktur des Satzbaus
Die Transformation der Phrasenstruktur in die Satzbaustruktur erfolgt durch
den wbs.lexana.semantic.SemanticPhraseAnalyzer getrennt f¨
ur Haupt- und
Nebens¨
atze. Folgende Regeln werden f¨
ur die Analyse verwendet:
178 KAPITEL 4. ARCHITEKTUR VON MARACHNA
S ::= NP VP;
NP ::= Subjekt;
VP ::= V NP mit V ::= Pr¨
adikat und NP ::= Objekt;
Beispiel: A ist ein Menge. [A]Subjekt[ist]Pr¨
adikat[eine Menge]Objekt
4.2.4.2 Semantische Objekte
S¨
atze in Entit¨
aten werden durch charakteristische Phrasen und Verben gekenn-
zeichnet. Bei der Analyse der Satzstruktur werden diese Wortstrukturen (Kapi-
tel 2.4.2) genutzt, um der Satzbaustruktur semantische Objekte zuzuordnen.
Es gibt drei verschiedene Typen von semantischen Objekten f¨
ur die Verarbei-
tung von Definitionen:
1. wbs.lexana.semantic.semanticObject.DefinedObject:
Charakterisiert das Element des Satzes, das definiert wird.
2. wbs.lexana.semantic.semanticObject.DefiningObject:
Charakterisiert die Elemente des Satzes, die das DefinedObject definieren.
3. wbs.lexana.semantic.semanticObject.ConditionObject:
Charakterisiert Nebensatzkonstruktionen, z. B. Nebens¨
atze, die durch eine
Konjunktion eingeleitet werden.
Die Transformation der Satzbaustruktur in die semantischen Objekte erfolgt
durch den wbs.lexana.semantic.SemanticPredicateAnalyzer getrennt f¨
ur
Haupt- und Nebens¨
atze.
Pr¨
adikat ::= SubjektObjekt;
Subjekt ::= DefinedObjekt;
Objekt ::= DefiningObjekt;
Beispiel: A ist ein Menge.
[A]Subjekt DefinedObject
4.2. NAT ¨
URLICHSPRACHLICHE ANALYSE 179
[M]Objekt DefiningObject
Das Pr¨
adikat bleibt erhalten und wird im n¨
achsten Schritt semantisch verarbei-
tet.
4.2.4.3 Entit¨
atenstruktur
Entit¨
aten bestehen nicht nur aus einem grammatikalischen Satz, sondern aus
einer Reihe von S¨
atzen, die meist in einer bestimmten Reihenfolge auftreten.
So zeigen z. B. Definitionen eine typische dreigeteilte Struktur, bestehend aus
Voraussetzung,Aussage und einer Eigenschaft oder oftmals auch einer Lis-
te von Eigenschaften (Kapitel 3.3.2). Diese Struktur wird in Abbildung 4.17
dargestellt.
Voraussetzungen listen die vorhandenen mathematischen Objekte auf und ord-
nen sie gegebenenfalls mathematischen Symbolen zu. Die Aussage beschreibt
das zu definierende Element und in welcher Beziehung es zu den Vorausset-
zungen steht. Zus¨
atzliche Angaben werden in der Eigenschaftenliste aufgef¨
uhrt.
Aufgrund der logischen Struktur der Entit¨
aten und der einfachen Konstrukti-
on der einzelnen S¨
atze k¨
onnen semantische Informationen extrahiert werden.
Phrasen, Verben und Satzbau charakterisieren die einzelnen Bausteine einer
Definition. Die Erkennung von Voraussetzung, Aussage und Eigenschaften ist
dadurch einfach.
Abbildung 4.17: Entit¨
atenstruktur
180 KAPITEL 4. ARCHITEKTUR VON MARACHNA
Voraussetzungen, die nach dem letzten Analyseschritt aus einer Liste von
DefinedObjects und DefiningObjects bestehen, werden durch die Klasse
wbs.lexana.semantic.theoremObject.AssumptionObject
analysiert, und die extrahierten Informationen in einem speziellen Objekt
gesammelt. Entsprechend werden auch Eigenschaften durch die Klasse
wbs.lexana.semantic.theoremObject. PropertyObject verarbeitet. Bei-
de Objekte, AssumptionObject und PropertyObject, werden der Klasse
wbs.lexana.semantic.theoremObject.DefinitionObject zur Verf¨
ugung
gestellt und regelbasiert analysiert.
Subjekt Pr¨
adikat Objekt
Vektorraum is a Menge
Vektorraum has a Addition
Vektorraum has a Multiplikation mit einem Skalar
Addition is a Verkn¨
upfung
Multiplikation mit einem Skalar is a Verkn¨
upfung
Abbildung 4.18: Endergebnis der semantischen Analyse des Beispieltextes
Das durch eine Liste von Tripeln (Subjekt, Pr¨
adikat, Objekt) in der Tabelle
4.18 dargestellte Ergebnis soll der Wissensbasis (Kapitel 4.3) ¨
ubergeben werden.
Subjekt, Pr¨
adikat und Objekt sind nicht zu verwechseln mit der Satzbautermi-
nologie, sondern kennzeichnen hier die Teile des Ergebnistripels. Die Pr¨
aposi-
tionalphrase Multiplikation mit einem Skalar wird in dieser Analyse noch nicht
aufgel¨
ost (Kapitel 4.3). Dies geschieht erst im Zusammenspiel mit der Wissens-
basis.
4.3. WISSENSBASIS 181
4.3 Wissensbasis
Wenn Menschen nur ¨
uber das spr¨
achen, was sie
begreifen, dann w¨
urde es sehr still auf der Welt sein.
(Albert Einstein)
4.3.1 Grundkonzept
Die Wissensbasis ist das Herzst¨
uck von mArachna. Sie dient einerseits der
Sammlung von mathematischen Informationen, andererseits unterst¨
utzt sie die
semantische Analyse.
Die Wissensbasis liegt in Form einer Ontologie (Kapitel 2.2) vor, die anfangs
nur eine geringe Menge im Programmcode vorgegebenen elementaren Grund-
lagenwissens der Mathematik enth¨
alt (Kapitel 3.4). Dabei handelt es sich um
die mathematische Pr¨
adikatenlogik und die axiomatische Mengenlehre (Kapitel
3.2.2 und 3.2.3). Auf Basis dieses Grundlagenwissens wird die Ontologie um
weitere mathematische Informationen erweitert. Diese Erweiterungen stammen
aus den Informationen, die durch die nat¨
urlichsprachliche Analyse der mathe-
matischen Texte extrahiert werden. Die semantischen Inhalte der einzelnen En-
tit¨
aten k¨
onnen jedoch nicht f¨
ur sich alleine stehen, da sie kontextuell gebunden
sind. Die Wissensbasis dient daher als Sammelbecken f¨
ur diese Informationen
und stellt diese in einen kontextuellen Zusammenhang. Sie nimmt dabei keine
mathematischen Informationen auf, die keinen Bezug zu einem Eintrag in der
Wissensbasis haben.
Die erzeugten Wissensstrukturen (Wissenrepr¨
asentation) besitzen eine kom-
plexe Struktur (Kapitel 2.2). Einerseits werden sie durch die semantischen Struk-
turen der mathematischen Texte charakterisiert, andererseits bilden sie mathe-
182 KAPITEL 4. ARCHITEKTUR VON MARACHNA
matische Wissensstrukturen ab. Vorteilhaft ist dabei, dass die mathematische
Sprache innerhalb der Entit¨
aten strukturiert ist (Kapitel 3.3.2), so dass die Aus-
sagen in diesen Entit¨
aten mathematisches Wissen skizzenhaft schematisieren.
Als Endergebnis wird eine Wissenrepr¨
asentation erzeugt, die Teilaspekte der
mathematischen Sprache und einen rudiment¨
aren ¨
Uberblick mathematischen
Wissens abbildet.
Abbildung 4.19: ¨
Uberblick Wissensbasis
4.3.2 Realisierung
F¨
ur die Realisierung der Wissensbasis wird die XML-basierte Ontologiesprache
OWL verwendet. Das W3C [OWL] beschreibt OWL folgendermaßen:
OWL is a Web Ontology language. [...]OWL uses both URIs for
naming and the description framework for the Web provided by RDF
to add the following capabilities to ontologies:
Ability to be distributed across many systems.
Scalability to Web needs.
Compatibility with Web standards for accessibility and interna-
tionalization.
Openess and extensibility.
OWL builds on RDF and RDF Schema and adds more vocabulary for
describing properties and classes: among others, relations between
4.3. WISSENSBASIS 183
classes, cardinality, equality, richer typing of properties, character-
istics of properties, and enumerated classes.
OWL bietet ein standardisiertes Verfahren f¨
ur die computergerechte Realisie-
rung einer Ontologie und insbesondere auch f¨
ur das Semantic Web. Die Onto-
logie wird in einer XML-Datei gespeichert. Bei mArachna ist die formale Be-
schreibung der Wissensbasis in der Datei math.owl zu finden, die in Abbildung
4.20 als Ausschnitt abgebildet ist. Die Konzeption dieser Ontologie wurde schon
Abbildung 4.20: Ausschnitt aus der math.owl
ausf¨
uhrlich in Kapitel 3.4 beschrieben (Abbildung 3.29).
Das Bindeglied zwischen der nat¨
urlichsprachlichen Analyse und der Wissens-
basis wird durch den wbs.lexana.summoner.OntologyFeeder dargestellt. Die
semantische Analyse der mathematischen Texte (Kapitel 4.2.4) erzeugt die in
Abbildung 4.18 f¨
ur den Beispieltext aufgelisteten Ergebnistripel. Der Ontology-
Feeder ¨
uberpr¨
uft, ob die verwendeten Begriffe in der Wissensbasis einen entspre-
chenden Eintrag besitzen. Wenn das der Fall ist, dann k¨
onnen die extrahierten
mathematischen Informationen der Wissensbasis ¨
ubergeben werden. Sind die
Informationen nicht in der Wissensbasis vorhanden, dann unterbricht der Onto-
logyFeeder den Vorgang und erzeugt eine Fehlermeldung. In einem solchen Fall
muss der aufgetretene Fehler mithilfe des VisuFrontEnds (Kapitel 4.4 manuell
korrigiert werden (halbautomatischer Ansatz). Eine solche ¨
Anderung kann auf
184 KAPITEL 4. ARCHITEKTUR VON MARACHNA
Verknüpfung
Addition
Multiplikation
Vektorraum
Menge
is_a
is_a
is_a
has_a
Multiplikation
mit einem Skalar
is_a
has_a
Abbildung 4.21: Visualisierung des Beispielsatzes
zwei Arten geschehen. Entweder werden weitere mathematische Texte eingele-
sen und somit das noch nicht vorhandene Wissen integriert, oder die ¨
Anderung
der Wissensbasis erfolgt durch die direkte ¨
Anderung der Datei math.owl. Dies
geschieht durch die entsprechenden writer-Klassen (Abbildung 4.19).
Analyse des Beispiels Die Analyse des Beispieltextes in Abbildung 4.3 ist
relativ einfach. Durch die in der Tabelle 4.18 erstellten semantischen Informatio-
nen werden der Wissensbasis mathematische Begriffe und Sachverhalte ¨
uberge-
ben. Die Subjekte und Objekte entsprechen den Konzepten in der Wissensbasis,
die Relationen sind die Beziehungen zwischen den Konzepten (Kapitel 4.19) und
werden in die entsprechenden Beziehungen transformiert:
is a-Beziehung ist-Relation
has a-Beziehung mit-Beziehung
Die Objekte m¨
ussen bereits in der Wissensbasis vorhanden sein, die Subjekte
k¨
onnen dagegen als neue Konzepte angelegt werden, m¨
ussen dies aber nicht. So
werden z B. in S¨
atzen ¨
ublicherweise keine neuen Begriffe eingef¨
uhrt.
Problematischer ist das Subjekt Multiplikation mit einem Skalar. Der Begriff
wird zerlegt in die Bestandteile Multiplikation und mit einem Skalar. Das Kon-
zept Multiplikation ist schon in der Wissensbasis vorhanden. Die Pr¨
aposition
mit deutet auf eine Einschr¨
ankung hin. Daher wird ein neues Konzept mit dieser
Einschr¨
ankung angelegt.
In der Abbildung 4.21 ist der Beispielsatz in der Wissensbasis visualisiert.
4.4. INFORMATION RETRIEVAL 185
4.4 Information Retrieval
Am Anfang war das Wort am Ende die Phrase
(Stanis law Jerzy Lec)
Information Retrieval
Interface
UserFrontEnd VisuFrontEnd
4.4.1 Grundkonzept
Das Information Retrieval System setzt sich aus zwei Komponenten zusammen:
1. Visualisierungsfrontend (VisuFrontEnd)
2. Benutzerfrontend (UserFrontEnd)
Das VisuFrontEnd ist f¨
ur Administratoren und Entwickler des Prototypen kon-
struiert worden. In diesem FrontEnd k¨
onnen die einzelnen Phasen der nat¨
urlich-
sprachlichen Analyse und der Prozess der Wissensverarbeitung in der Wissens-
basis verfolgt werden. Zus¨
atzlich sollen in sp¨
ateren Versionen von mArachna
Schnittstellen integriert werden, in denen die Analyseschritte beeinflusst wer-
den k¨
onnen.
Das UserFrontEnd soll die Benutzeroberfl¨
ache f¨
ur Anwender von mArachna
werden. Zur Zeit ist es nur eine prototypische Darstellung des gew¨
unschten
FrontEnds. Ziel ist die Implementierung eines interaktiven mathematischen Le-
xikons. Der Inhalt des Lexikons sind die Inhalte der computerlinguistisch analy-
sierten mathematischen Texte. Das System soll auf verschiedenste Anfragen des
Anwenders reagieren k¨
onnen, die z. B. ¨
uber ein Eingabeformular an das System
gerichtet werden k¨
onnen. Antworten des Systems k¨
onnen dann entweder ¨
uber
eine textbasierte Ausgabeschnittstelle oder ¨
uber ein visualisiertes Wissensnetz
erfolgen.
186 KAPITEL 4. ARCHITEKTUR VON MARACHNA
4.4.2 Realisierungsstand
VisuFrontEnd. Das FrontEnd ist als webbasierte Anwendung realisiert und
zur Zeit noch sehr einfach gestaltet. Es werden die Protokolldateien der einzel-
nen Analyseschritte L
A
T
EX-Parsing, Zerlegung in Satzteile, morphologische,
syntaktische und semantische Analyse und Integration in die Wissensbasis
die in mArachna abgearbeitet werden, in graphischer Form dargestellt. Somit
kann der Prozess der Analyse Schritt f¨
ur Schritt verfolgt werden.
Abbildung 4.22: Analyseschritte des VisuFrontEnd
Folgende Analyseschritte werden im VisuFrontEnd dargestellt:
L
A
T
EX: Eingabeformular f¨
ur mathematische L
A
T
EX-Texte, die durch
mArachna analysiert werden
TEI und XHTML: Ausgabe der zu analysierenden Texte im TEI- oder
XHTML-Format
4.4. INFORMATION RETRIEVAL 187
Textstruktur: Darstellung der Zerlegung der Texte in ihre einzelnen
Strukturen: Entit¨
aten, S¨
atze usw.
Morphologie: Darstellung der Resultate der morphologischen Analyse
der Texte
Syntax: Darstellung der Zerlegung der S¨
atze in ihre syntaktischen Ein-
heiten
Semantik I und II: Darstellung der Resultate der einzelnen Schritte der
semantischen Analyse
Ergebnistripel: Darstellung des Ergebnistripels der semantischen Ana-
lyse
WBS: Graphisch orientierte Darstellung des Eintrags des analysierten
Textes in der Wissensbasis
UserFrontEnd. Das UserFrontEnd wird eine interessante Herausforderung
darstellen, die ¨
uber das Ziel dieser Arbeit weit hinausf¨
uhren w¨
urde. Die in der
Wissensbasis gesammelten mathematischen Informationen m¨
ussen wieder in ge-
eigneter Weise dem Anwender zur Verf¨
ugung gestellt werden. Auf Anfragen des
Anwenders m¨
ussen entsprechende Eintr¨
age aus der Wissensbasis extrahiert wer-
den. Ist die Wissensbasis groß und besitzt diese viele Eintr¨
age bzw. Konzepte
mit vielf¨
altigen Beziehungen untereinander, dann ist dieser Prozess des Infor-
mation Retrieval keine triviale Aufgabe.
In Abbildung 4.23 ist eine m¨
ogliche Darstellung skizziert, wie ein UserFront-
End f¨
ur ein mathematisches Lexikon, wie es in Kapitel 1.1 beschrieben wurde,
aussehen k¨
onnte. Dabei ist die zentrale Komponente die Navigation ¨
uber ein
Wissensnetz, das zu einem vom Anwender angefragten Begriff oder Sachverhalt
geh¨
ort. Die Knoten dieses Wissensnetzes enthalten die detaillierten Informatio-
nen ¨
uber den zu betrachtenden mathematischen Begriff und ¨
ahneln den Kon-
zepten in der Wissensbasis. Relationen entsprechen den Verbindungen zwischen
den Knoten und k¨
onnen somit, wie die Wissensbasis, Informationen vernetzen.
Daher erscheinen nach Anfragen an das System nicht nur der angefragte Begriff,
sondern auch Alternativvorschl¨
age, die mit diesem Begriff in Zusammenhang
stehen. Die Darstellung der Wissensnetze kann als Text oder visuell erfolgen.
188 KAPITEL 4. ARCHITEKTUR VON MARACHNA
Abbildung 4.23: Das UserFrontEnd
Die Wissensnetze sind dabei kein ¨
Aquivalent der gesamten Wissensbasis, son-
dern nur entsprechende Abbilder von Teilbereichen dieser. Dies ist erforderlich,
da die Wissensbasis ein sehr komplexes Gebilde ist. Um die Navigation sowohl
f¨
ur den Benutzer ¨
uberschaubar als auch technisch realisierbar zu halten, ist die
Entwicklung eines leistungsf¨
ahigen Navigations- und Anzeigesystems, beispiels-
weise auf Basis des structure guided browsing (Kapitel 2.5), notwendig.
Kapitel 5
Ergebnisse
5.1 Kritische Analyse
Die Fassung der Edelsteine erh¨
oht
ihren Preis, nicht ihren Wert.
(Ludwig B¨
orne)
Sprachanalyse. Die mathematische Theorie besitzt eine strenge Systema-
tik aus gewissenhaft hergeleiteten S¨
atzen, die aus einem endlichen Theorem-
geb¨
aude aufgebaut werden. Dadurch ist die Mathematik in kompakte Einheiten
Entit¨
aten zerlegbar, die miteinander in vorgegebenen Beziehungen stehen
(Kapitel 3.3.2). Diese Entit¨
aten sind Definitionen, Theoreme, S¨
atze, Korollare,
Propositionen, Lemmata und Beweise. Definitionen sind die Strukturierungs-
elemente einer mathematischen Theorie und die S¨
atze Theoreme, einfache
S¨
atze, Korollare, Propositionen, Lemmata beschreiben die mathematischen
Sachverhalte (Kapitel 3.3.1).
Die ausschließliche Betrachtung dieser Entit¨
aten bei einer linguistischen Analyse
ist eigentlich unzureichend. Einf¨
uhrende Texte zu mathematischen Themen ge-
rade in Lehrb¨
uchern enthalten oft Informationen, die f¨
ur das weitere Verst¨
andnis
eines Textes notwendig sind. Insbesondere enthalten solche Texte h¨
aufig Defini-
tionen. Diese Texte sind jedoch schwerer zu analysieren als die klar abgegrenzten
Entit¨
aten.
189
190 KAPITEL 5. ERGEBNISSE
F¨
ur ein vollst¨
andiges Verst¨
andnis der Mathematik sind Beweise notwendig, die
in dieser Arbeit nicht betrachtet wurden. Beweise haben sehr vielf¨
altige Kon-
struktionsm¨
oglichkeiten und sind deshalb schwerer zu analysieren als die ¨
ubrigen
Entit¨
aten. Dar¨
uberhinaus sind viele Beweise nur skizzenhafte Darstellungen des
tats¨
achlichen Beweises. Allerdings k¨
onnen in den Beweisen wichtige Informa-
tionen enthalten sein, die f¨
ur das Verst¨
andnis des weiteren Texten notwendig
sind. So kann innerhalb eines Beweises ein Begriff definiert werden, der auch
außerhalb des Beweises verwendet wird.
Mit Ausnahme von Beweisen und Axiomen haben mathematische Entit¨
aten
einen strikten Aufbau, bestehend aus Voraussetzung, Aussage und Eigenschaf-
ten (Kapitel 3.3.2, Abbildung 3.5). Jede auftretende Binnenstruktur besitzt ihre
eigene, typische syntaktische Struktur. So zeigen z. B. die Voraussetzungen einen
besonderen Aufbau, der leicht zu erkennen ist.
Bei den Definitionen existieren in den Aussagen weitere interne Binnenstruktu-
rierungen: Definiendum und Definiens. Die Verbindung zwischen diesen beiden
internen Binnenstrukturen wird unterschiedlich realisiert. So werden z. B. sehr
h¨
aufig das Verb heißen oder das mathematische Symbol : genutzt (Kapi-
tel 3.3.3).
Die Satzbinnenstruktur ist etwas komplexer, aber trotzdem ¨
uberschaubar. Da-
bei existieren allerdings keine Unterscheidungsmerkmale zwischen den einzelnen
Satztypen. Als Binnenstrukturen treten Implikationen (Kapitel 3.3.2 Abbildung
3.7), ¨
Aquivalenzen (Kapitel 3.3.2 Abbildung 3.8) und die einfache Aussage (Ka-
pitel 3.3.2 Abbildung 3.9) auf. Die m¨
oglichen Verbindungen der internen Bin-
nenstrukturen sind zahlreich, aber noch handhabbar. Die am h¨
aufigsten ver-
wendeten Basiskonstruktionen sind [VERB1] AUSSAGE1, so/dann [VERB2]
AUSSAGE2-Konstruktionen (Implikationen) und genau dann, wenn (¨
Aqui-
valenzen) (Kapitel 3.3.3).
Die S¨
atze der mathematischen Sprache besitzen eine einfache Struktur, die durch
die Pr¨
adikatenlogik beeinflusst wird. Logische Operatoren und Quantoren erhal-
ten dabei sprachliche Pendants, die meist eindeutig zu erkennen sind (Kapitel
3.3.3). Ambiguit¨
aten treten dabei nur in schlecht geschriebenen Texten auf, f¨
ur
die eine Disambiguisierung erst auf semantischer Ebene oder sogar ¨
uberhaupt
nicht m¨
oglich w¨
are. Somit kann man sagen, dass die Mathematik davon deutlich
weniger besitzt als die Alltagssprache (Kapitel 1.2, Hypothese 1.2.2). Durch die
5.1. KRITISCHE ANALYSE 191
Einfachheit der Struktur der S¨
atze ist eine syntaktische Analyse nach Chomsky
(Kapitel 2.4.2) m¨
oglich. Allerdings gibt es einige Strukturen, die sich nicht so
einfach durch die Phrasenstrukturgrammatik aufl¨
osen lassen. Diese m¨
ussen erst
durch Vorverarbeitungsregeln in eine geeignete Form umgewandelt werden, da-
mit sie analysiert werden k¨
onnen. Die Regeln, die f¨
ur diese Vorverarbeitung ver-
wendet werden, leiten sich aus typischen Phrasenkonstruktionen in der Mathe-
matik ab (Kapitel 3.3.3). Durch die Verwendung von mathematischen Symbolen
k¨
onnen z. B. S¨
atze entstehen, die keine Verben enthalten. Diese m¨
ussen dann
durch eine Vorverarbeitungsregel erg¨
anzt werden. Insgesamt ist dieser Ansatz
jedoch immer noch deutlich einfacher als die f¨
ur die Analyse von alltagssprachli-
chen Texten verwendeten Verfahren. Damit hat sich Hypothese 1.2.1 best¨
atigt.
F¨
ur die Analyse l¨
angerer Textpassagen w¨
are es trotzdem w¨
unschenswert, andere
Analyseformen einzusetzen.
Mathematische Zeichenketten bzw. Formeln haben eine eigene Struktur, die
zwar ebenfalls auf der Pr¨
adikatenlogik basiert, aber nicht kompatibel zu den
Strukturen der nat¨
urlichsprachlichen Texte ist. Einige mathematische Zeichen-
ketten lassen sich in die nat¨
urliche Sprache ¨
ubersetzen, wie z. B. und
xX. In mArachna werden zur Zeit nur wenige dieser Zeichenketten ¨
uber-
setzt (Kapitel 3.3.5, Tabelle 3.3.5). Des Weiteren werden in den Voraussetzungen
h¨
aufig mathematische Zeichenketten und Symbole als Synonym f¨
ur eine sprach-
liche Bezeichnung verwendet (Kapitel 3.3.2).
Die Struktur mathematischer Formeln ist relativ komplex und dadurch schwer
zu analysieren. Jedoch ist eine semantische Analyse der Formeln wichtig f¨
ur
das Verst¨
andnis von mathematischen Texten. Durch die zur Zeit unzureichende
Analyse der Formeln in mArachna gibt es Entit¨
aten, die nicht vollst¨
andig auf-
gel¨
ost werden k¨
onnen. So kann im Beispiel 3.3.16 das neutrale Element nicht
vollst¨
andig erfasst werden (Kapitel 3.4). Eine Alternative w¨
are die zus¨
atzliche
Verwendung eines Beweissystems, um die Strukturen der Formeln zu zerlegen
und zu analysieren. Dies erfordert jedoch einen ungleich gr¨
oßeren Aufwand.
Es gibt in der mathematischen Sprache spezielle sprachliche Konstruktionen,
die von der geschriebenen Alltagssprache abweichen. So kann eine bezeichnen-
de mathematische Zeichenkette direkt hinter der Nominalphrase stehen. Da-
durch werden in mArachna diese Zeichen und Symbole mit in die Nominalphra-
se einbezogen. Des Weiteren werden die Bezeichnungen der Quantoren h¨
aufig
192 KAPITEL 5. ERGEBNISSE
als ¨
Aquivalent zum Artikel gebraucht. Dadurch entstehen neue Formen der No-
minalphrase:
NP::=[DET/QUANT][ADJ] N [SYM]
Dar¨
uber hinaus verhalten sich Formeln in der Nominalphrase wie Substantive,
so dass das Substantiv auch durch ein so genanntes MathWord (MW) ersetzt
werden kann.
NP::=[DET/QUANT][ADJ] MW
In der mathematischen Sprache werden h¨
aufig Pr¨
apositionalphrasen gebraucht.
Die Verwendung von Pr¨
apositionen hat einen einschr¨
ankenden Charakter auf die
vorherige Nominalphrase, z. B. ist ein Vektorraum auf dem K¨
orper der reellen
Zahlen eingeschr¨
ankt auf den K¨
orper der reellen Zahlen. Dies gilt ebenso
f¨
ur Adjektive. So ist der Begriff lineare Algebra eine auf linearen Prozessen
eingeschr¨
ankte Fachdisziplin der Algebra.
Abgesehen von der großen Anzahl der explizit durch Definitionen beschriebenen
Fachbegriffe besitzt die Mathematik anscheinend einen geringen Wortschatz,
um Sachverhalte und Definitionen zu konstruieren. Allerdings kann nicht wie
in Hypothese 1.2.3 (Kapitel 1.2) davon ausgegangen werden, dass andere Fach-
sprachen einen gr¨
oßeren Wortschatz besitzen. Aufgrund der großen Anzahl von
Fachdisziplinen ist vor allem der durch die Definitionen erzeugte Wortschatz sehr
groß. Zus¨
atzlich ist anzumerken, dass die Freiheiten der Konstruktionsm¨
oglich-
keiten der deutschen Sprache von den Autoren der mathematischen Texte aus-
genutzt werden. So kann ein und derselbe Begriff verschiedene sprachliche Aus-
pr¨
agungen besitzen (Kapitel 3.3.4).
Trotz der Strenge der mathematische Sprache ist diese nicht unabh¨
angig vom
Sprachstil des Autors. Jeder Autor besitzt einen f¨
ur ihn typischen Satz von
mathematischen Phrasen, die er h¨
aufig in seinen Texten verwendet. Allerdings
ist die Anzahl der m¨
oglichen Konstruktionen beschr¨
ankt, so dass die Hypothese
1.2.4 nur teilweise widerlegt ist.
Eine semantische Analyse ist ohne eine Wissensbasis nicht zu realisieren. Das
Problem besteht darin, dass die semantischen Informationen einer einzelnen
5.1. KRITISCHE ANALYSE 193
Entit¨
at ohne Kontextwissen nur einen geringen Informationsgehalt besitzt. Oh-
ne eine M¨
oglichkeit, mathematisches Hintergrundwissen einzubringen, ist eine
semantische Analyse daher sinnlos. Dieses Hintergrundwissen wird durch die
Wissensbasis bereitgestellt.
Wissensbasis. Die Mathematik als Ganzes zu erfassen wird umso schwieriger,
je detaillierter man diese zu beschreiben versucht. Mathematische Sachverhalte
und Begriffe bilden ein großfl¨
achiges Beziehungsnetzwerk. Viele dieser Begriffe
und Sachverhalte werden von den Autoren der Texte vorausgesetzt und nicht ex-
plizit in jedem Text definiert. Dabei sind die terminologischen Strukturen in der
Mathematik streng und klar formalisiert, so dass jeder Begriff und Sachverhalt
in der Mathematik als Ganzem genau definiert ist.
Um diese terminologischen Strukturen zu organisieren, wird in mArachna eine
Wissensbasis verwendet, deren Grundlage eine Ontologie ist. Die konstruierte
Ontologie der Mathematik besteht aus fundamentalen Erkenntnissen aus der
axiomatischen Mengenlehre und der Pr¨
adikatenlogik. Begriffe, die durch Defini-
tionen eingef¨
uhrt werden, sind Konzepte in der Wissensbasis. Der Konzeptname
wird durch den Begriffsnamen festgelegt. Die Konzepte sind dann ¨
uber is a-
Beziehungen mit anderen Konzepten verbunden. Eigenschaften werden mittels
der has property-Beziehung an das betreffende Konzept gebunden. Die Grund-
idee der Wissensbasis ist es, nur Konzepte zu integrieren, die sich schon auf
vorhandene Konzepte in der Wissensbasis beziehen.
Die so konstruierten Strukturen in der Wissensbasis werfen jedoch einige Fragen
auf: Viele Strukturen, die in S¨
atzen auftreten, k¨
onnen nicht eindeutig beschrie-
ben bzw. spezifiziert werden. So konnten bei der Konstruktion der Ontologie
den Begriffen geordnetes Paar,Abbildung und Relation keine genauen kenn-
zeichnenden Eigenschaften zugeordnet werden. Sie wurden daher durch einfa-
che is a-Beziehungen an den jeweiligen Oberbegriff gebunden (Kapitel 3.4.1).
Eine ad¨
aquate Beschreibungsmethode f¨
ur geordnete Paare sind die vorgeschla-
gen Projektionsoperatoren. Allerdings kann nicht vorausgesetzt werden, dass
Autoren solche Hilfskonstruktionen in ihren Texten beschreiben.
Eine elegantere Beschreibungsm¨
oglichkeit ist die Verwendung von Hypergra-
phenstrukturen im semantischen Netz. Viele Sachverhalte werden in der Ma-
thematik durch die Pr¨
adikatenlogik bestimmt. Zur Zeit ist die Ontologie der
194 KAPITEL 5. ERGEBNISSE
Mathematik so aufgebaut, dass die durch die Pr¨
adikatenlogik beschriebenen
Strukturen mit der sprachlichen Struktur und der Vererbungsstruktur vermischt
werden. So kann z. B. das Konzept injektiv in der Wissensbasis nicht ein-
deutig beschrieben werden. Durch die Verwendung von Hypergraphen k¨
onnten
verschiedene Sprach- und Wissensebenen realisiert werden. So k¨
onnte die De-
finition des Konzepts injektiv selbst ein kleines semantischen Netz enthalten,
das die Definition pr¨
adikatenlogisch kodiert. Inwieweit diese Strukturen dann
noch handhabbar in Hinsicht auf den Verarbeitungsaufwand sind, ist offen.
In der Mathematik werden Sachverhalte durch S¨
atze beschrieben. Allerdings
ist die Integration von S¨
atzen in die Wissensbasis komplexer als die von De-
finitionen. Dabei werden keine neuen Konzepte eingef¨
uhrt, sondern bekannte
Konzepte miteinander verbunden. Die Beziehungen zwischen den Konzepten,
die durch die S¨
atze gebildet werden, werden gekapselt, um diese von den ¨
ubri-
gen Beziehungen zu trennen. F¨
ur die einzelnen Verkn¨
upfungstypen existieren
verschiedene Beziehungen: is implication und is equivalent. F¨
ur einfache Aus-
sagen ist das Pr¨
adikat der Tr¨
ager der semantischen Information. Daher ist das
Verb f¨
ur die Bildung der Beziehung verantwortlich.
Problematisch sind die Ungenauigkeiten in den mathematischen Aussagen. Ins-
besondere beschreiben viele Autoren Sachverhalte nur ungenau. Es werden zahl-
reiche Begriffe weggelassen, die f¨
ur ein ungef¨
ahres Verst¨
andnis eines mathe-
matischen Sachverhaltes nicht notwendig sind. Problematisch ist dies, wenn in
einem weiteren Text der Sachverhalt genauer definiert wird und in die Wissens-
basis eingebaut werden soll. Dabei k¨
onnen Inkonsistenzen entstehen. Eine Idee
zur Vermeidung solcher Inkonsistenzen w¨
are die Konstruktion von verschiede-
nen Wissensbasen, die zun¨
achst getrennt von einer Hauptwissensbasis aufgebaut
werden. Anschließend werden die verschiedenen Wissensbasen mit der Haupt-
wissensbasis abgeglichen.
Trotz der beschriebenen Probleme l¨
asst sich die Hypothese 1.2.5 best¨
atigen.
Die vorgeschlagene Basisstruktur bietet eine gute Grundlage, um Wissen zu
organisieren. Sie reicht jedoch nicht aus, um große Strukturen zu organisieren.
Daf¨
ur m¨
ussen weitergehende Ans¨
atze entwickelt werden.
Information Retrieval. Durch die Komplexit¨
at der Wissensbasis ist ein In-
formation Retrieval System eine große Herausforderung. Auf Grund des proto-
5.1. KRITISCHE ANALYSE 195
typischen Charakters von mArachna k¨
onnen noch keine endg¨
ultigen Aussagen
¨
uber ein solches System gemacht werden. Allerdings ist anzunehmen, dass es
f¨
ur die Wissensbasis ein ebenso komplexes Problem ist wie die Integration von
semantischen Informationen in die Wissensbasis. Dies beinhaltet z. B. die Suche
nach geeigneten Methoden der Navigation in der Wissensbasis (Kapitel 5.3) so-
wie die Entwicklung effizienter Suchmechanismen in einer großen Wissensbasis.
196 KAPITEL 5. ERGEBNISSE
5.2 Zusammenfassung
Wenn andere glauben man ist am Ende,
dann muss man erst richtig anfangen.
(Konrad Adenauer)
Im Folgenden soll eine kurze Zusammenfassung der wichtigsten Erkenntnisse
dieser Arbeit gegeben werden.
Sprachstrukturen. In dieser Arbeit wurde ein Verfahren vorgestellt, dass die
mathematische Sprache computergest¨
utzt analysieren kann. Dazu wird die ma-
thematische Sprache in ihre Bestandteile (Entit¨
aten-, Binnenstruktur-, Satz-,
Word- und Symbolstruktur) zerlegt, d. h. sie wird schematisiert. Diese Schema-
tisierung wird von der computerlinguistischen Analyse genutzt. Eine derartige
Zerlegung der mathematischen Sprache und eine darauf basierende linguistische
Analyse wurde bisher nicht durchgef¨
uhrt.
Eine weitere wichtige Methode ist die Reduktion auf bestimmte Textbaustei-
ne der mathematischen Sprache (Entit¨
aten). In den Entit¨
aten wird die Sprache
der Mathematik pr¨
aziser verwendet. Dadurch k¨
onnen wichtige Strukturen in die-
sen Entit¨
aten isoliert und schematisiert werden. Komplexere Strukturen k¨
onnen
dann sukzessiv auf diesen Grundstrukturen aufbauen.
Die Festlegung von Vorverarbeitungsregeln schafft ein Sammelbecken von
Konstruktionen mathematischer Strukturen, die syntaktische mathematische
Grundstrukturen erkennen k¨
onnen. Diese gewonnenen Grundstrukturen sind f¨
ur
weitere Analyseverfahren von Interesse. So sind fehlende Verben in Aufz¨
ahlun-
gen, die in dieser Arbeit vorgestellt wurden, ein Beispiel f¨
ur eine solche Grund-
struktur.
Wissenstrukturen. Eine wichtige Idee ist die Verkn¨
upfung der semantischen
mathematischen Sprachanalyse mit dem mathematischen Hintergrundwissen.
Dieses Hintergrundwissen wird durch die Wissensbasis repr¨
asentiert. Sie wird
daher als Kontrollinstanz f¨
ur die semantische Analyse genutzt.
Insbesondere verwendet die Wissensbasis als grundlegende Prinzipien die Men-
genlehre und die mathematische Logik. Dies ist sicherlich nicht ausreichend f¨
ur
5.2. ZUSAMMENFASSUNG 197
die vollst¨
andige Beschreibung mathematischen Wissens, jedoch bilden diese bei-
den mathematischen Disziplinen ein solides Grundger¨
ust f¨
ur die Strukturierung
mathematischen Wissens.
mArachna. Um diese Ans¨
atze zu ¨
uberpr¨
ufen wurde ein Prototyp (mArachna)
entwickelt, der die oben genannten Ergebnisse verwendet. Im mArchna-Projekt
werden einzelne Entit¨
aten, wie z. B. Definitionen und ¨
Aquivalenzen, analysiert.
Die Analyse von Implikationen steht kurz vor der Fertigstellung. Analysiert
wird dabei zur Zeit eine eingeschr¨
ankte Auswahl von S¨
atzen, die in dieser Ar-
beit auch als Beispiele angef¨
uhrt wurden, wie z. B. die Vektorraumdefinition
(Kapitel 4) oder der Basisauswahlsatz (Kapitel 3.3.3). Diese Entit¨
aten werden
dann in (Subjekt, Pr¨
adikat, Objekt)-Tripel zerlegt und z. B. f¨
ur die Entit¨
at De-
finition in die Wissensbasis eingebaut. Allerdings k¨
onnen zur Zeit nur einfache
Satzkonstruktionen verarbeitet werden. Dies ist weniger ein Problem der syn-
taktischen als der semantischen Analyse und l¨
asst sich durch eine Verfeinerung
der semantischen Analyse l¨
osen, die bereits in Arbeit ist.
198 KAPITEL 5. ERGEBNISSE
5.3 Ausblick
Glaube ist Gewissheit ohne Beweise.
(Henri Fr´ed´eric Amiel)
Sprachanalyse. Eine automatische Analyse der mathematischen Sprache
kann nicht Aufgabe eines einzelnen Parsers sein. Die in mArachna verwende-
ten Methoden sind sehr einfach gehalten, da nur gezeigt werden sollte, dass eine
Analyse der mathematischen Sprache ¨
uberhaupt m¨
oglich ist. Daher erscheint es
sinnvoll, auch f¨
ur andere Methoden zu ¨
uberpr¨
ufen, ob diese auf Grundlage der
gefundenen Strukturen (Kapitel 3.3) anwendbar sind.
Zur Zeit m¨
ussen in der morphologischen Analyse neu definierte mathematische
Begriffe mit ihren entsprechenden grammatikalischen Informationen manuell in
ein morphologisches Lexikon eingetragen werden. Der Prozess dieser Erstellung
des Lexikons ist zur Zeit sehr einfach gestaltet, jedoch recht m¨
uhselig. Daher
w¨
are es w¨
unschenswert, ein vorhandenes morphologisches Lexikon zu verwen-
den. Die Verwendung eines eigenen Lexikons hat jedoch Vorteile, so k¨
onnen
bei der Analyse genau diejenigen W¨
orter gesammelt werden, die den mathema-
tischen Wortschatz repr¨
asentieren. In diesem Zusammenhang ist es interessant
zu erfahren, wie die genaue prozentuale Verteilung der verwendeten W¨
orter und
Phrasen in den einzelnen Entit¨
atentypen ist. Damit ist jedoch nicht gekl¨
art, was
mit neu definierten Begriffen geschieht. Aufgrund des etwas vereinfachten Wort-
bildungsprozesses in der mathematischen Sprache w¨
are es denkbar, ein automa-
tisiertes Verfahren zu erstellen, neu definierte Begriffe in ein morphologisches
Lexikon zu integrieren.
In mArachna wurde die deutsche Sprache verwendet, da im Rahmen des Projek-
tes Mumie deutschsprachige Studenten angesprochen werden sollen. Allerdings
besitzt die englische mathematische Sprache auf den ersten Blick noch einfache-
re und strengere Strukturen. Da die deutsche und die englische mathematische
Sprache viele ¨
Ubereinstimmungen zeigen, erscheint es sinnvoll, auch englisch-
sprachige mathematische Texte zu analysieren. Dies erscheint als sehr vielver-
sprechend, da insbesondere viele mathematische Texte vor allem auf Englisch
verfasst werden.
Des Weiteren ist die Erweiterung auf Prosatexte und Beweise eine interessante
5.3. AUSBLICK 199
Herausforderung, da in diesen viele Informationen enthalten sein k¨
onnen, die
f¨
ur das weitere Verst¨
andnis eines Textes notwendig sind. Dies beinhaltet aber
eine komplexere linguistische Analyse.
Wissensbasis. F¨
ur die Wissensbasis stellt sich auch weiterhin die Frage, in-
wieweit sich die Mathematik geeignet strukturieren l¨
asst, damit auch gr¨
oße-
re Teilgebiete der Mathematik in einer Datenstruktur erfasst werden k¨
onnen.
Sinnvolle Ans¨
atze daf¨
ur sind die Einteilung in verschiedene Dom¨
anen oder die
Strukturbildung von Bourbaki (Kapitel 3.4). In diesem Zusammenhang bleibt
zu kl¨
aren, wie detailreich eine solche Darstellung gew¨
ahlt werden muss, ohne
die Skalierbarkeit der Wissensbasis zu gef¨
ahrden.
Eine interessante Alternative w¨
are es, zu untersuchen, wie Menschen neu erwor-
benes mathematisches Wissen zu ihrem vorhandenen Wissen hinzuf¨
ugen, und
welche Strukturen dabei aufgebaut werden. Dies ist allerdings nicht einfach, da
einerseits die zugeh¨
origen Untersuchungen an Personen einen großen Aufwand
erfordern, und andererseits bisher nicht einmal eindeutig gekl¨
art werden konn-
te, wie Menschen ¨
uberhaupt Wissen organisieren (Kapitel 2.2, Kapitel 2.3). Des
Weiteren ist es unklar, ob die eventuell gefundenen Strukturen ¨
uberhaupt mit
Computern nachgebildet werden k¨
onnen.
Aufschlussreich w¨
are auch die Betrachtung der Speicherung von unvollst¨
andi-
gem Wissen in der Wissensbasis. Speziell die Integration von verschiedenen in
der Mathematik verwendeten symbolischen Notationssytemen erscheint dabei
interessant.
Information Retrieval. Ein leistungsf¨
ahiges Information Retrieval System
ist bis jetzt nicht in mArachna integriert. Dieses soll auf den in der Wissensbasis
vorhandenen Informationen effiziente Suchen zu einer gegebenen Problemstel-
lung durchf¨
uhren. Eine m¨
ogliche Anwendung daf¨
ur w¨
are ein mathematisches
Lexikon.
Dabei muss nicht nur das Skalierungsproblem auf der Wissensbasis untersucht
werden, sondern auch die m¨
oglichen Formen von Anfragen eines Anwenders
an ein solches System. Diese k¨
onnten z. B. als nat¨
urlichsprachliche Anfragen
verwirklicht werden. Eine M¨
oglichkeit w¨
are dabei, nur Anfragen zu erlauben,
die mathematisch exakt gestellt werden, um die Auswertung zu vereinfachen.
200 KAPITEL 5. ERGEBNISSE
Eine weitere ungekl¨
arte Frage ist die Darstellung der Ergebnisse von Anfra-
gen. Welche und wieviele Informationen ben¨
otigt ein Nutzer, um das gegebene
Problem zu l¨
osen bzw. die Antwort zu verstehen? In diesem Zusammenhang
k¨
onnte eventuell die Verwendung von Nutzerprofilen hilfreich sein, die den z. B.
Wissensstand eines Nutzers abbilden.
Kapitel 6
Anhang
6.1 TEI-Ausgabe
<?xml version="1.0" encoding="utf-8"?>
<TEI.2 xml:lang="de">
<teiHeader>
<fileDesc>
<titleStmt>
<title/>
<respStmt>
<resp>converted by</resp>
<name>www-data</name>
</respStmt>
</titleStmt>
<publicationStmt>
<authority>www-data</authority>
</publicationStmt>
<sourceDesc>
<p>Original filename: unknown</p>
</sourceDesc>
</fileDesc>
<revisionDesc>
201
202 KAPITEL 6. ANHANG
<change>
<date value="2004-10-18">
Mon Oct 18 12:16:21 CEST 2004
</date>
<respStmt>
<name>www-data</name>
<resp>Converter</resp>
</respStmt>
<item>
Automatically converted from LaTeX
by MuLex LaTeX2TEI.
</item>
</change>
</revisionDesc>
</teiHeader>
<text>
<body>
<div0>
<div1 type="definition">
<p>Seien
<math xmlns="http://www.w3.org/1998/Math/MathML"
display="inline">
<mrow><mi>V</mi></mrow>
</math>
eine Menge,
<math xmlns="http://www.w3.org/1998/Math/MathML"
display="inline">
<mrow><mi>K</mi></mrow>
</math>
ein K~
Arper mit den zwei Verkn~
A1
4pfungen:
</p>
<list type="bulleted">
<item>
<math xmlns="http://www.w3.org/1998/Math/MathML"
display="inline">
6.1. TEI-AUSGABE 203
<mrow>
<mi>V</mi>
<mo>&times;</mo>
<mi>V</mi>
<mo>&#8594;</mo>
<mi>V</mi>
</mrow>
</math>
Addition mit
<math xmlns="http://www.w3.org/1998/Math/MathML"
display="inline">
<mrow>
<mo>&lt;</mo>
<mi>a</mi>
<mo>,</mo>
<mi>b</mi>
<mo>&gt;</mo>
<mo>&#8614;</mo>
<mi>a</mi>
<mo>+</mo>
<mi>b</mi>
</mrow>
</math>.
</item>
<item>
<math xmlns="http://www.w3.org/1998/Math/MathML"
display="inline">
<mrow>
<mi>K</mi>
<mo>&times;</mo>
<mi>V</mi>
<mo>&#8594;</mo>
<mi>V</mi>
</mrow>
</math>
204 KAPITEL 6. ANHANG
Multiplikation mit einem Skalar mit
<math xmlns="http://www.w3.org/1998/Math/MathML"
display="inline">
<mrow>
<mi>&#945;</mi>
<mo>,</mo>
<mi>b</mi>
<mo>&#8614;</mo>
<mi>&#945;</mi>
<mi>b</mi>
</mrow>
</math>.
</item>
</list>
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML"
display="inline">
<mrow><mi>V</mi></mrow>
</math>
mit der Addition und Multiplikation hei&szlig;t
Vektorraum &uuml;ber
<math xmlns="http://www.w3.org/1998/Math/MathML"
display="inline">
<mrow><mi>K</mi></mrow>
</math>.
</p>
</div1>
</div0>
</body>
</text>
</TEI.2>
6.2 Zerlegung der Textstruktur
<?xml version="1.0"?>
6.2. ZERLEGUNG DER TEXTSTRUKTUR 205
<environment>
<environment>
<sentence>
<word>Seien</word>
<math xmlns="http://www.w3.org/1998/Math/MathML"
display="inline">
<mrow>
<mi>V</mi>
</mrow>
</math>
<word>eine</word>
<word>Menge</word>
<word>,</word>
<math xmlns="http://www.w3.org/1998/Math/MathML"
display="inline">
<mrow>
<mi>K</mi>
</mrow>
</math>
<word>ein</word>
<word>K&#xF6;rper</word>
<word>mit</word>
<word>den</word>
<word>zwei</word>
<word>Verkn&#xFC;pfungen</word>
<word>:</word>
</sentence>
<list>
<environment>
<sentence>
<math xmlns="http://www.w3.org/1998/Math/MathML"
display="inline">
<mrow>
<mi>V</mi>
<mo>&#xD7;</mo>
206 KAPITEL 6. ANHANG
<mi>V</mi>
<mo>&#x2192;</mo>
<mi>V</mi>
</mrow>
</math>
<word>Addition</word>
<word>mit</word>
<math xmlns="http://www.w3.org/1998/Math/MathML"
display="inline">
<mrow>
<mo>&lt;</mo>
<mi>a</mi>
<mo>,</mo>
<mi>b</mi>
<mo>&gt;</mo>
<mo>&#x21A6;</mo>
<mi>a</mi>
<mo>+</mo>
<mi>b</mi>
</mrow>
</math>
<word>.</word>
</sentence>
</environment>
<environment>
<sentence>
<math xmlns="http://www.w3.org/1998/Math/MathML"
display="inline">
<mrow>
<mi>K</mi>
<mo>&#xD7;</mo>
<mi>V</mi>
<mo>&#x2192;</mo>
<mi>V</mi>
</mrow>
6.2. ZERLEGUNG DER TEXTSTRUKTUR 207
</math>
<word>Multiplikation</word>
<word>mit</word>
<word>einem</word>
<word>Skalar</word>
<word>mit</word>
<math xmlns="http://www.w3.org/1998/Math/MathML"
display="inline">
<mrow>
<mi>&#x3B1;</mi>
<mo>,</mo>
<mi>b</mi>
<mo>&#x21A6;</mo>
<mi>&#x3B1;</mi>
<mi>b</mi>
</mrow>
</math>
<word>.</word>
</sentence>
</environment>
</list>
<sentence>
<math xmlns="http://www.w3.org/1998/Math/MathML"
display="inline">
<mrow>
<mi>V</mi>
</mrow>
</math>
<word>mit</word>
<word>der</word>
<word>Addition</word>
<word>und</word>
<word>Multiplikation</word>
<word>hei&#xDF;t</word>
<word>Vektorraum</word>
208 KAPITEL 6. ANHANG
<word>&#xFC;ber</word>
<math xmlns="http://www.w3.org/1998/Math/MathML"
display="inline">
<mrow>
<mi>K</mi>
</mrow>
</math>
<word>.</word>
</sentence>
</environment>
</environment>
6.3 Morphologische Analyse
<?xml version="1.0"?>
<morph>
<word>
<form>seien</form>
<verb>
<conjugation conj="full"/>
<person person="3p"/>
<tempus tempus="praesens"/>
<mode mode="pre"/>
</verb>
</word>
<word>
<form> V </form>
<math/>
</word>
<word>
<form>eine</form>
<article/>
</word>
<word>
<form>menge</form>
6.3. MORPHOLOGISCHE ANALYSE 209
<substantive>
<declination type="IX"/>
<genus type="f"/>
<numerus num="s"/>
<casus casus="n|g|d|a"/>
</substantive>
</word>
<word>
<form> K </form>
<math/>
</word>
<word>
<form>ein</form>
<article/>
</word>
<word>
<form>k&#xF6;rper</form>
<substantive>
<declination type="II"/>
<genus type="m"/>
<numerus num="p"/>
<casus casus="n|g|a"/>
</substantive>
</word>
<word>
<form>mit</form>
<preposition/>
</word>
<word>
<form>den</form>
<article/>
</word>
<word>
<form>zwei</form>
<adjective>
210 KAPITEL 6. ANHANG
<declination type="cardinal"/>
<numerus num="*"/>
<casus casus="*"/>
</adjective>
</word>
<word>
<form>verkn&#xFC;pfungen</form>
<substantive>
<declination type="IX"/>
<genus type="f"/>
<numerus num="p"/>
<casus casus="n|g|d|a"/>
</substantive>
</word>
<word>
<form>:</form>
<symbol/>
</word>
<word>
<form> V&#xD7;V&#x2192;V </form>
<math/>
</word>
<word>
<form>addition</form>
<substantive>
<declination type="IX"/>
<genus type="f"/>
<numerus num="s"/>
<casus casus="n|g|d|a"/>
</substantive>
</word>
<word>
<form>mit</form>
<preposition/>
</word>
6.3. MORPHOLOGISCHE ANALYSE 211
<word>
<form> &lt;a,b&gt;&#x21A6;a+b </form>
<math/>
</word>
<word>
<form> K&#xD7;V&#x2192;V </form>
<math/>
</word>
<word>
<form>multiplikation</form>
<substantive>
<declination type="IX"/>
<genus type="f"/>
<numerus num="s"/>
<casus casus="n|g|d|a"/>
</substantive>
</word>
<word>
<form>mit</form>
<preposition/>
</word>
<word>
<form>einem</form>
<article/>
</word>
<word>
<form>skalar</form>
<substantive>
<declination type="II"/>
<genus type="s"/>
<numerus num="p"/>
<casus casus="n|g|a"/>
</substantive>
</word>
<word>
212 KAPITEL 6. ANHANG
<form>mit</form>
<preposition/>
</word>
<word>
<form> &#x3B1;,b&#x21A6;&#x3B1;b </form>
<math/>
</word>
<word>
<form> V </form>
<math/>
</word>
<word>
<form>mit</form>
<preposition/>
</word>
<word>
<form>der</form>
<article/>
</word>
<word>
<form>addition</form>
<substantive>
<declination type="IX"/>
<genus type="f"/>
<numerus num="s"/>
<casus casus="n|g|d|a"/>
</substantive>
</word>
<word>
<form>und</form>
<conjunction/>
</word>
<word>
<form>multiplikation</form>
<substantive>
6.3. MORPHOLOGISCHE ANALYSE 213
<declination type="IX"/>
<genus type="f"/>
<numerus num="s"/>
<casus casus="n|g|d|a"/>
</substantive>
</word>
<word>
<form>hei&#xDF;t</form>
<verb>
<conjugation conj="full"/>
<person person="nullnull"/>
<tempus tempus="null"/>
<mode mode="null"/>
</verb>
</word>
<word>
<form>vektorraum</form>
<substantive>
<declination type="I"/>
<genus type="m"/>
<numerus num="s"/>
<casus casus="n|d|a"/>
</substantive>
</word>
<word>
<form>&#xFC;ber</form>
<preposition/>
</word>
<word>
<form> K </form>
<math/>
</word>
</morph>
214 KAPITEL 6. ANHANG
6.4 Syntaktische Analyse
<?xml version="1.0"?>
<syntax>
<sentence>
<text>
Seien $ V $ eine Menge ,
$ K $ ein K&#xF6;rper mit den
zwei Verkn&#xFC;pfungen :
</text>
<mainclause count="1">
<text>
Seien $ V $ eine Menge
</text>
</mainclause>
<mainclause count="2">
<text>
$ K $ ein K&#xF6;rper mit den
zwei Verkn&#xFC;pfungen :
</text>
</mainclause>
<analysis>
<Nominalphrase>
<MathWord> V </MathWord>
</Nominalphrase>
<verbphrase>
<verb>sein</verb>
<Nominalphrase>
<article>eine</article>
<substantive>menge</substantive>
</Nominalphrase>
</verbphrase>
</analysis>
<analysis>
<Nominalphrase>
6.4. SYNTAKTISCHE ANALYSE 215
<MathWord> K </MathWord>
</Nominalphrase>
<verbphrase>
<verb>sein</verb>
<NominalPrepositionPhrase>
<Nominalphrase>
<article>ein</article>
<substantive>k&#xF6;rper</substantive>
</Nominalphrase>
<AdjectiveAttributivePhrase>
<adjective>zwei</adjective>
<preposition>mit</preposition>
<article>den</article>
<substantive>verkn&#xFC;pfung</substantive>
<symbol>:</symbol>
</AdjectiveAttributivePhrase>
</NominalPrepositionPhrase>
</verbphrase>
</analysis>
</sentence>
<sentence>
<text>
$ V&#xD7;V&#x2192;V $ Addition mit
$ &lt;a,b&gt;&#x21A6;a+b $ .
</text>
<mainclause count="1">
<text>
$ V&#xD7;V&#x2192;V $ Addition mit
$ &lt;a,b&gt;&#x21A6;a+b $ .
</text>
</mainclause>
<analysis>
<Nominalphrase>
<MathWord> V&#xD7;V&#x2192;V </MathWord>
</Nominalphrase>
216 KAPITEL 6. ANHANG
<verbphrase>
<verb>sein</verb>
<NominalPrepositionPhrase>
<Nominalphrase>
<substantive>addition</substantive>
</Nominalphrase>
<Nominalphrase>
<preposition>mit</preposition>
<MathWord> &lt;a,b&gt;&#x21A6;a+b </MathWord>
</Nominalphrase>
</NominalPrepositionPhrase>
</verbphrase>
</analysis>
</sentence>
<sentence>
<text>
$ K&#xD7;V&#x2192;V $ Multiplikation mit
einem Skalar mit $ &#x3B1;,b&#x21A6;&#x3B1;b $ .
</text>
<mainclause count="1">
<text>
$ K&#xD7;V&#x2192;V $ Multiplikation mit
einem Skalar mit $ &#x3B1;,b&#x21A6;&#x3B1;b $ .
</text>
</mainclause>
<analysis>
<Nominalphrase>
<MathWord> K&#xD7;V&#x2192;V </MathWord>
</Nominalphrase>
<verbphrase>
<verb>sein</verb>
<NominalPrepositionPhrase>
<Nominalphrase>
<substantive>multiplikation</substantive>
</Nominalphrase>
6.4. SYNTAKTISCHE ANALYSE 217
<Nominalphrase>
<preposition>mit</preposition>
<article>einem</article>
<substantive>skalar</substantive>
</Nominalphrase>
<Nominalphrase>
<preposition>mit</preposition>
<MathWord> &#x3B1;,b&#x21A6;&#x3B1;b </MathWord>
</Nominalphrase>
</NominalPrepositionPhrase>
</verbphrase>
</analysis>
</sentence>
<sentence>
<text>
$ V $ mit der Addition und Multiplikation
hei&#xDF;t Vektorraum &#xFC;ber $ K $ .
</text>
<mainclause count="1">
<text>
$ V $ mit der Addition und Multiplikation
hei&#xDF;t Vektorraum &#xFC;ber $ K $ .
</text>
</mainclause>
<analysis>
<NominalConjunctionphrase>
<conjunction>und</conjunction>
<NominalPrepositionPhrase>
<Nominalphrase>
<MathWord> V </MathWord>
</Nominalphrase>
<Nominalphrase>
<preposition>mit</preposition>
<article>der</article>
<substantive>addition</substantive>
218 KAPITEL 6. ANHANG
</Nominalphrase>
</NominalPrepositionPhrase>
<Nominalphrase>
<substantive>multiplikation</substantive>
</Nominalphrase>
</NominalConjunctionphrase>
<verbphrase>
<verb>hei&#xDF;en</verb>
<NominalPrepositionPhrase>
<Nominalphrase>
<substantive>vektorraum</substantive>
</Nominalphrase>
<Nominalphrase>
<preposition>&#xFC;ber</preposition>
<MathWord> K </MathWord>
</Nominalphrase>
</NominalPrepositionPhrase>
</verbphrase>
</analysis>
</sentence>
</syntax>
6.5 Semantische Analyse
<?xml version="1.0"?>
<semantic>
<predicate>sein</predicate>
<subject>
<NominalSubject>
<Nominalphrase>
<MathWord> V </MathWord>
</Nominalphrase>
</NominalSubject>
</subject>
<object>
6.5. SEMANTISCHE ANALYSE 219
<Nominalphrase>
<article>eine</article>
<substantive>menge</substantive>
</Nominalphrase>
</object>
<predicate>sein</predicate>
<subject>
<NominalSubject>
<Nominalphrase>
<MathWord> K </MathWord>
</Nominalphrase>
</NominalSubject>
</subject>
<object>
<NominalPrepositionPhrase>
<Nominalphrase>
<article>ein</article>
<substantive>k&#xF6;rper</substantive>
</Nominalphrase>
<AdjectiveAttributivePhrase>
<adjective>zwei</adjective>
<preposition>mit</preposition>
<article>den</article>
<substantive>verkn&#xFC;pfung</substantive>
<symbol>:</symbol>
</AdjectiveAttributivePhrase>
</NominalPrepositionPhrase>
</object>
<predicate>sein</predicate>
<subject>
<NominalSubject>
<Nominalphrase>
<MathWord> V&#xD7;V&#x2192;V </MathWord>
</Nominalphrase>
</NominalSubject>
220 KAPITEL 6. ANHANG
</subject>
<object>
<NominalPrepositionPhrase>
<Nominalphrase>
<substantive>addition</substantive>
</Nominalphrase>
<Nominalphrase>
<preposition>mit</preposition>
<MathWord> &lt;a,b&gt;&#x21A6;a+b </MathWord>
</Nominalphrase>
</NominalPrepositionPhrase>
</object>
<predicate>sein</predicate>
<subject>
<NominalSubject>
<Nominalphrase>
<MathWord> K&#xD7;V&#x2192;V </MathWord>
</Nominalphrase>
</NominalSubject>
</subject>
<object>
<NominalPrepositionPhrase>
<Nominalphrase>
<substantive>multiplikation</substantive>
</Nominalphrase>
<Nominalphrase>
<preposition>mit</preposition>
<article>einem</article>
<substantive>skalar</substantive>
</Nominalphrase>
<Nominalphrase>
<preposition>mit</preposition>
<MathWord> &#x3B1;,b&#x21A6;&#x3B1;b </MathWord>
</Nominalphrase>
</NominalPrepositionPhrase>
6.5. SEMANTISCHE ANALYSE 221
</object>
<predicate>hei&#xDF;en</predicate>
<subject>
<NominalSubject>
<NominalConjunctionphrase>
<conjunction>und</conjunction>
<NominalPrepositionPhrase>
<Nominalphrase>
<MathWord> V </MathWord>
</Nominalphrase>
<Nominalphrase>
<preposition>mit</preposition>
<article>der</article>
<substantive>addition</substantive>
</Nominalphrase>
</NominalPrepositionPhrase>
<Nominalphrase>
<substantive>multiplikation</substantive>
</Nominalphrase>
</NominalConjunctionphrase>
</NominalSubject>
</subject>
<object>
<NominalPrepositionPhrase>
<Nominalphrase>
<substantive>vektorraum</substantive>
</Nominalphrase>
<Nominalphrase>
<preposition>&#xFC;ber</preposition>
<MathWord> K </MathWord>
</Nominalphrase>
</NominalPrepositionPhrase>
</object>
</semantic>
222 KAPITEL 6. ANHANG
<?xml version="1.0"?>
<summoner>
<DefinedObject>
<MathWord> V </MathWord>
</DefinedObject>
<DefiningObject>
<article>eine</article>
<substantive count="1">menge</substantive>
</DefiningObject>
<DefinedObject>
<MathWord> K </MathWord>
</DefinedObject>
<DefiningObject>
<article>ein</article>
<substantive count="1">k&#xF6;rper</substantive>
<substantive count="2">verkn&#xFC;pfung</substantive>
<adjective>zwei</adjective>
<preposition>mit</preposition>
<symbol>:</symbol>
</DefiningObject>
<DefinedObject>
<MathWord> V&#xD7;V&#x2192;V </MathWord>
</DefinedObject>
<DefiningObject>
<substantive count="1">addition</substantive>
</DefiningObject>
<DefinedObject>
<MathWord> K&#xD7;V&#x2192;V </MathWord>
</DefinedObject>
<DefiningObject>
<substantive count="1">multiplikation</substantive>
<substantive count="2">skalar</substantive>
</DefiningObject>
<DefiningObject>
<substantive count="1">multiplikation</substantive>
6.5. SEMANTISCHE ANALYSE 223
<conjunction>und</conjunction>
<substantive count="2">addition</substantive>
<preposition>mit</preposition>
<MathWord> V </MathWord>
</DefiningObject>
<DefinedObject>
<substantive>vektorraum</substantive>
<MathWord> K </MathWord>
<preposition>&#xFC;ber</preposition>
</DefinedObject>
</summoner>
224 KAPITEL 6. ANHANG
Literaturverzeichnis
[And76] J. R. Anderson. Language memory and thought. Erlbaum, Hills-
dale, 1976.
[And83] J. R. Anderson. The architecture of cognition. Harvard Univ.
Press, 1983.
[And01] J. R. Anderson. Kognitive Psychologie. Spektrum Akademischer
Verlag, Heidelberg, Berlin, 3 edition, 2001.
[AS77] R. Abelson and R. C. Schank. Scripts, Plans, Goals, and Un-
derstanding: An Inquiry into Human Knowledge Structures. Erl-
baum, Hillsdale, 1977.
[Aut] Automath. http://www.cs.kun.nl/freek/aut/.
[Bar94] J. D. Barrow. Ein Himmel voller Zahlen. Spektrum Akademischer
Verlag, Heidelberg, Berlin, Oxford, 1994.
[Bau93] P. Baumgartner. Der Hintergrund des Wissens. Vorarbeiten zu
einer Kritik der programmierbaren Vernunft. K¨
arntner Druck-
und Verlagsgesellschaft, Klagenfurt, 1993.
[Bau99] J. Baur. Syntax und Semantik mathematischer Texte. Master’s
thesis, Universit¨
at des Saarlandes, Fachbereich Computerlinguis-
tik, November 1999.
[Beu94] A. Beutelspacher. Lineare Algebra. Vieweg, Braunschweig, Wies-
baden, 1994.
225
226 LITERATURVERZEICHNIS
[Beu95] A. Beutelspacher. Das ist o.B.d.A. trivial! Vieweg, Braunschweig,
Wiesbaden, 3 edition, 1995.
[BF71] J. D. Bransford and J. J. Franks. The abstraction of linguistic
ideas. Cognitive Psychologie, 2:331–350, 1971.
[BF96] M. Barner and F. Flohr. Analysis II. Walter de Gruyter, Berlin,
New York, 3 edition, 1996.
[BF00] M. Barner and F. Flohr. Analysis I. Walter de Gruyter, Berlin,
New York, 5 edition, 2000.
[BKI00] C. Beierle and G. Kern-Isberner. Methoden wissensbasierter Sys-
teme. Vieweg, Braunschweig, Wiesbaden, 2000.
[Bor77] L. Borkowski. Formale Logik. C. H. Beck, M¨
unchen, 1977.
[Bou66] L. E. Bourne. Human Conceptual Behavior. Allyn & Bacon,
Boston, 1966.
[Bou74] N. Bourbaki. Die Architektur der Mathematik. In M. Otte, editor,
Mathematiker ¨
uber die Mathematik. Springer, Berlin, Heidelberg,
New York, 1974.
[Bou02] N. Bourbaki. Elemente der Mathematik. In W. B¨
uttemeyer,
editor, Philosophie der Mathematik. Alber, Freiburg, M¨
unchen,
2002.
[Bre82] J. Bresnan, editor. The Mental Representation of Grammatical
Relations. MIT Press, Cambridge, 1982.
[Bre00] J. Bresnan. Lexical Functional Syntax. Blackwell, London, 2000.
[Bri92] E. Brill. A simple rule-based part-of-speech tagger. In Proceedings
of ANLP, pages 152–155, 1992.
[Bri94] E. Brill. A report of recent progress in transformation-based error-
driven learning. In Proceedings of ARPA, pages 722–727, 1994.
[Bro03] Der Brockhaus, Computer und Informationstechnologie, 2003.
LITERATURVERZEICHNIS 227
[BS85] R. J. Brachmann and J. G. Schmolze. An overview of the KL-ONE
knowledge representation system. Cognitive Science, 9:171–216,
1985.
[BT81] W. F. Brewer and J. C. Treyens. Role of schemata in memory for
places. Cognitive Psychology, 13:207–230, 1981.
[Bur92] F. Burkowski. Retrieval Activities in a Database consisting of
Heterogenous Collections of Structured Text. In Proceedings of the
15th Annual International ACM/SIGIR Conference on Research
and Development in Information Retrieval, pages 112–125, New
York, 1992. ACM Press.
[BWP97] H.-J. Bullinger, K. W¨
orner, and J. Prieto. Wissensmanagement
heute. Fraunhofer Institut f¨
ur Arbeitswissenschaft und Organisa-
tion, Stuttgart, 1997.
[BYRN99] R. Baeza-Yates and B. Ribeiro-Neto. Modern Information Re-
trieval. ACM Press, Edinburgh, 1 edition, 1999.
[Car98] B. Carpenter. Type-Logical Semantics. MIT Press, 1998.
[CB95] A. Copestake and T. Briscoe. Semi-productive polysemy and
sense extension. Journal of Semantics, 12:15–67, 1995.
[CEE+01] K.-U. Carstensen, C. Ebert, C. Endriss, S. Jekat, R. Klabunde,
and H. Langer. Computerlinguistik und Sprachtechnologie, Eine
Einf¨
uhrung. Spektrum Akademischer Verlag, Heidelberg, Berlin,
2001.
[CH77] H. H. Clark and S. E. Haviland. Comprehension and the given-
new contract. In R. O. Freedle, editor, Discourse production and
comprehension. Norwood, 1977.
[Cho57] N. Chomsky. Syntactic Structures. Mouton, Den Haag, 1957.
[Cho67] N. Chomsky. Aspects of the Theory of Syntax. MIT Press, Cam-
bridge, 1967.
[CQ69] A. M. Collins and M. R. Quillian. Retrieval time from semantic
memory. Journal of Verbal Learning and Verbal Behavior, 8:240–
248, 1969.
228 LITERATURVERZEICHNIS
[Cru96] D.A. Cruse. Lexical Semantics. Cambridge University Press, 1996.
[DAR03] DARPA. DAML - The DARPRA Agent Markup Language Home-
page. http://www.daml.org/, 2003.
[DDF+90] S. Deerwester, S. T. Dumais, G. W. Furnas, T. K. Landauer, and
R. Harshman. Indexing by latent semantic analysis. Journal of the
American Society for Information Science, 41(6):391–407, 1990.
[DHM95] P. J. Davis, R. Hersh, and E. A. Marchisotto. The Mathematical
Experience. Birkh¨
auser, Boston, Basel, Berlin, 2 edition, 1995.
[Die75] J. Dieudonn´e. Grundz¨
uge der modernen Analysis, Band 2. Friedr.
Vieweg & Sohn mbH, Braunschweig, 1975.
[Die00] R. Diestel. Graphentheorie. Springer-Lehrbuch, Berlin, Heidel-
berg, New York, 2 edition, 2000.
[DtH92] M. Domenig and P. ten Hacken. Word Manager: A System for
Morphological Dictionaries. Georg Olms Verlag AG, Hildesheim,
1992.
[Dud98] Dudenredaktion, editor. Duden, Grammatik der deutschen Ge-
genwartssprache. Dudenverlag, Mannheim, Leibzig, Wien, Z¨
urich,
6 edition, 1998.
[Dud01] Dudenredaktion. Duden, Fremdw¨
orterbuch. Dudenverlag, Mann-
heim, Leibzig, Wien, Z¨
urich, 5 edition, 2001.
[DWP81] D. R. Dowty, R. E. Wall, and S. Peters. Introduction to Montague
Semantics. Reidel, Dordrecht, 1981.
[Ebb94] H.-D. Ebbinghaus. Einf¨
uhrung in die Mengenlehre. Wissen-
schaftsverlag, Mannheim, 3 edition, 1994.
[Ede96] W. Edelmann. Lernpsychologie. BELTZ Psychologie Verlags Uni-
on, Weinheim, 5 edition, 1996.
[EG96] R. Evans and G. Gazdar. DATR: A language for lexical knowledge
representation. Computational Linguistics, 22(2):167–216, 1996.
LITERATURVERZEICHNIS 229
[EJF96] H.-D. Ebbinghaus and W. Thomas J. Flum. Einf¨
uhrung in die
mathematische Logik. Spektrum Akademischer Verlag, Heidel-
berg, 4 edition, 1996.
[Fen04] D. Fensel. Ontologies: A Silver Bullet for Knowledge Management
and Electronic Commerce. Springer, Berlin, Heidelberg, 2 edition,
2004.
[Fer03] R. Ferber. Information Retrieval. Suchmodelle und Data-Mining-
Verfahren f¨
ur Textsammlungen und das Web. dpunkt, Heidelberg,
2003.
[fI04] Gesellschaft f¨
ur Informatik. Ziele und Aufgaben der Fachgruppe
Information Retrieval, 2004.
[Fis00] G. Fischer. Lineare Algebra. Vieweg, Braunschweig, Wiesbaden,
12 edition, 2000.
[fLuLdUB04] Fakult¨
at f¨
ur Linguistik und Literaturwissenschaft der Univer-
sit¨
at Bielefeld. liOn Linguistik Online. http://luna.lili.
uni-bielefeld.de/lion/, 2004.
[Fre94] G. Frege. ¨
Uber Sinn und Bedeutung. Funktion, Begriff, Bedeu-
tung. F¨
unf logische Studien, 1994.
[Geu99] B. Geurts. Presuppositions and Pronouns. Elsevier Science, 1999.
[GHL02] L. G¨
otze and E. W. B. Hess-L¨
uttich. Grammatik der deutschen
Sprache. Bertelsmann Lexikon Verlag, M¨
unchen, 2002.
[GHS99] G. Grewendorf, F. Hamm, and W. Sternefeld. Sprachliches Wis-
sen. Eine Einf¨
uhrung in die moderne Theorie der grammatischen
Beschreibung. Suhrkamp, Frankfurt a. M., 1999.
[GKPS85] G. Gazdar, E. Klein, G. K. Pullum, and I. A. Sag. Generalized
Phrase Structure Grammar. Blackwell, Oxford, 1985.
[GL92] A. M. Glenberg and W. E. Langston. Comprehension of illus-
trated text: Pictures help to build mental models. Journal of
Memory and Language, 31:129–151, 1992.
230 LITERATURVERZEICHNIS
[GML87] A. M. Glenberg, M. Mayer, and K. Lindem. Mental models con-
tribute to foregrounding during text comprehension. Journal of
Memory and Language, 26:69–83, 1987.
[GMZ97] A. C. Graesser, K. K. Millis, and R. A. Zwaan. Discourse com-
prehension. Annual Review of Psychology, 48:163–189, 1997.
[G¨
o31] K. G¨
odel. ¨
Uber formal unentscheidbare S¨
atze der Principia Ma-
thematica und verwandter Systeme I. Monatsh. Math. Phys,
38:173–198, 1931.
[Gro96] QED Group. QED. http://www.mcs.anl.gov/qed/, 1996.
[GRS00] G. G¨
orz, C.-R. Rollinger, and J. Schneeberger, editors. Handbuch
der K¨
unstliche Intelligenz. Oldenbourg, M¨
unchen, Wien, 2000.
[Gru93] T. R. Gruber. A translation approach to portable ontology spec-
ifications. Knowledge Acquisition, 5(2):199–221, 1993.
[GS91] J. Groenendijk and M. Stokhof. Dynamic Predicate Logic. Lin-
guistics and Philosophy, 14(1):39–100, 1991.
[Hau00] R. Hausser. Grundlagen der Computerlinguistik. Springer, Berlin,
Heidelberg, 2000.
[Hau02] M. Haun. Handbuch Wissensmanagement. Springer, Berlin, Hei-
delberg, 2002.
[HB01] G. Helbig and J. Buscha. Deutsche Grammatik. Handbuch f¨
ur
den Ausl¨
anderunterricht. Langenscheidt, Berlin, M¨
unchen, 2001.
[Hed02] U. Hedtst¨
uck. Formale Sprachen und Automatentheorie. Olden-
bourg Wissensschaftsverlag GmbH, M¨
unchen, 2002.
[Hei83] I. Heim. File change semantics and the familiarity theory of defi-
niteness. In R. B¨
auerle, C. Schwarze, and A. von Stechow, editors,
Meaning, Use and Interpretation of Language. de Gruyter, Berlin,
New York, 1983.
[Hel00] H. Helbig. Die semantische Struktur nat¨
urlicher Sprache. Wis-
sensrepr¨
asentation mit MultiNet. Springer, Berlin, Heidelberg,
2000.
LITERATURVERZEICHNIS 231
[Her72] H. Hermes. Einf¨
uhrung in die mathematische Logik. Teubner,
Stuttgart, 3 edition, 1972.
[Heu93] H. Heuser. Lehrbuch der Analysis, Teil 2. Teubner, Stuttgart, 8
edition, 1993.
[H¨
o83] H. H¨
ormann. Was tun die W¨
orter miteinander im Satz? Verlag
f¨
ur Psychologie, G¨
ottingen, 1983.
[Jap93] Mathematical Society Of Japan. Encyclopedic Dictionary of Ma-
thematics. MIT Press, Cambridge, 2 edition, 1993.
[JC87] M. A. Just and P. A. Carpenter. The Psychology of Reading and
Language Comprehension. Allyn and Bacon, Boston, 1987.
[Jes04] S. Jeschke. Mathematik in Virtuellen Wissensr¨
aumen IuK-
Strukturen und IT-Technologien in Lehre und Forschung. PhD
thesis, Technische Universit¨
at Berlin, Berlin, April 2004.
[JL83] P. N. Johnson-Laird. Mental Models. Cambridge University Press,
Cambridge, 1983.
[JL95] P. N. Johnson-Laird. Mental models, deductive reasoning, and the
brain. In M. S. Gazzaniga, editor, The Cognitive Neurosciences,
pages 999–1008. MIT Press, Cambridge, 1995.
[JL00] P. N. Johnson-Laird. The current state of the mental model theo-
ry. In J. Garcia-Madruga, M. Carriedo, and M. J. Gonzalez-Labra,
editors, Mental Models in Reasoning, pages 17–40. UNED, Ma-
drid, 2000.
[JS02] S. Jeschke and R. Seiler. Strukturen in der multimedialen Didak-
tik oder: Die Mumie im Legoland (Talk). http://www.math.
tu-berlin.de/sabina/Talks/Erlangen 2002, 2002.
[JZ03] S. Jeschke and E. Zorn. Moses meets Mumie at
Multiverse (Talk). http://www.math.tu-berlin.de/sabina/
Talks/Rhone Island 2003, 2003.
[Kam81] H. Kamp. A theory of truth and semantic representation. In
J. Groenendijk and M. Stokhof, editors, Formal Methods in
232 LITERATURVERZEICHNIS
the Study of Language, pages 277–322. Mathematisch Centrum
Tracts, Amsterdam, 1981.
[KD78] W. Kintsch and T. A. Dijk. Towards a model of text comprehen-
sion and production. Psychological Review, 85:363–394, 1978.
[Ker98] M. Kerres. Multimediale und telemediale Lernumgebung: Konzep-
tion und Entwicklung. Oldenbourg, 1998.
[KH02] L. Konieczny and B. Hemforth. S¨
atze und Texte verstehen und
produzieren. In J. M¨
ussler and W. Prinz, editors, Allgemeine
Psychologie. Spektrum Akademischer Verlag, Heidelberg, 2002.
[Kin74] W. Kintsch. The Representation of Meaning in Memory. Erl-
baum, Hillsdale, 1974.
[Kin88] W. Kintsch. The role of knowledge in discourse comprehension:
A construction integration model. Psychological Review, 95:163–
182, 1988.
[Kin98] W. Kintsch. Comprehension A Paradigma for Cognition. Cam-
bridge University Press, Cambridge, 1998.
[KK73] W. Kintsch and J. M. Keenan. Reading rate and retention as a
function of the number of propositions in the base structure of
sentences. Cognitive Psychology, 5:257–274, 1973.
[KKP96] M. Kohlhase, S. Kuschert, and M. Pinkal. A type-theoretic seman-
tics for λ-DRT. In P. Dekker and M. Stokhof, editors, Proceedings
of the 10th Amsterdam Colloquium, pages 479–498, Amsterdam,
1996.
[K¨
o01] K. K¨
onigsberger. Analysis 1. Springer, Berlin, Heidelberg, New
York, 5 edition, 2001.
[K¨
o04] J. K¨
obler. Vorlesungsskript: Theoretische Informatik II HU Ber-
lin. http://fachschaft.informatik.hu-berlin.de/service/,
2004.
[Koe04] P. Koepke. Projekt: Darstellungsformen mathematischen Wissen.
http://www.wissensformate.uni-bonn.de/projektkoepke.
htm, 2004.
LITERATURVERZEICHNIS 233
[Kos83] K. Koskenniemi. Two-level model for morphological analysis. In
A. Bundy, editor, Proceedings of the Eighth International Joint
Conference on Artificial Intelligence, pages 683–685, Karlsruhe,
August 1983.
[KP79] L. Karttunen and S. Peters. Conventional implicature. In C.-K.
Oh and D. Dinneen, editors, Syntax and Semantics 11, Presup-
position, pages 1–56. Academic Press, New York, 1979.
[KvD83] W. Kintsch and T. A. van Dijk. Strategies of Discourse Compre-
hension. Academic Press, New York, 1983.
[Lor96] F. Lorenz. Einf¨
uhrung in die Algebra I. Spektrum Akademischer
Verlag, Heidelberg, Berlin, Oxford, 3 edition, 1996.
[MBa] The MBase Mathematical Knowledge Base Home Page.
http://www.mathweb.org/mbase/.
[Min74] M. Minsky. A Framework for Representing Knowledge. MIT-AI
Laboratory Memo 306, Juni 1974.
[MK01] A. Franke M. Kohlhase. MBase: Representing Knowledge and
Context for the Integration of Mathematical Software Systems.
Journal of Symbolic computation, 23(4):365–402, 2001.
[Mon74] R. Montague. Formal Philosophy: Selected Papers of Richard
Montague. Yale University Press, Yale, 1974.
[MR92] G. McKoon and R. Ratcliff. Inference During Reading. Psycho-
logical Review, 99:440–466, 1992.
[Mus96] R. Muskens. Combining montague semantics and discourse re-
presenation. Linguistics and Philosphy, 19:143–186, 1996.
[NBY97] G. Navarro and R. Baeza-Yates. Proximal nodes: A model to
query document databases by content and structure. ACM Tran-
sactions on Information Systems, 15(4):400–435, 1997.
[NC00] S. E. Newstead and K. Coventry. The role of context und func-
tionality in the interpretation of quantifiers. European Journal of
Cognitive Psychologie, 12:243–259, 2000.
234 LITERATURVERZEICHNIS
[New81] A. Newell. The Knowledge Level. The AI Magazine, 2(2):1–20,
1981.
[OG96] J. Oakhill and A. Garnham. Mental models in cognitive science.
Erlbaum, Hove, 1996.
[OMK91] Y. Ogawa, T. Morita, and K. Kobayashi. A fuzzy document re-
trieval system using the keyword connection matrix and a learning
method. Fuzzy Sets and Systems, 39(2):163–179, 1991.
[Ont] Ontology Inference Layer Committee. Ontology Inference Layer.
http://www.ontoknowledge.org/oil/.
[Ope] OpenMath Society. OpenMath. http://www.openmath.org/.
[OWL] Web Ontology Language. http://www.w3.org/2004/OWL/.
[Pea88] J. Pearl. Probabilistic Reasoning in Intelligent Systems: Netword
of Plausible Inference. Morgan Kaufmann, San Mateo, 1988.
[PF79] M. C. Potter and B. A. Faulconer. Understanding noun phrases.
Journal of Verbal Learning and Verbal Behavior, 18:509 522,
1979.
[Pin96] M. Pinkal. Radical underspecification. In P. Dekker and M. Stok-
hof, editors, Proceedings of the 10th Amsterdam Colloquium, pages
587–606, Amsterdam, 1996.
[Pol85] M. Polanyi. Implizites Wissen. Suhrkamp, Frankfurt a. Main,
1985.
[PS94] C. Pollard and I. A. Sag. Head-Driven Phrase Structure Gram-
mar. University of Chicago Press, Chicago, 1994.
[Qui68] M. R. Quillian. Semantic memory. In M. Minsky, editor, Semantic
Information Processing, pages 227–270. MIT Press, Cambridge,
1968.
[Rau79] W. Rautenberg. Klassische und Nichtklassische Aussagenlogik.
Vieweg, Braunschweig, Wiesbaden, 1979.
LITERATURVERZEICHNIS 235
[RDF] Resource Description Framework. http://www.w3.org/2004/
RDF.
[Rei89] U. Reimer. FRM: Ein Frame-Repr¨
asentationsmodell und seine
formale Semantik. Springer-Verlag, Berlin, 1989.
[RS99] G. Rickheit and L. Sichelschmidt. Mental models: Some answers,
some questions, some suggestions. In G. Rickheit and C. Habel,
editors, Mental models in discourse processing and reasoning, pa-
ges 9–40. North-Holland, Amsterdam, 1999.
[RSS02] G. Rickheit, L. Sichelschmidt, and H. Strohner. Psycholinguistik.
Stauffenburg, T¨
ubingen, 2002.
[Rud02] W. Rudin. Analysis. Oldenbourg, M¨
unchen, Wien, 2 edition,
2002.
[Ryl69] G. Ryle. Der Begriff des Geistes. Reclam, Stuttgart, 1969.
[Saa] Saarland Universit¨
at, TU Eindhoven, RISC Linz. OMDoc.
http://www.mathweb.org/omdoc/.
[Sch93] W. Schnotz. Mentale Repr¨
asentationen beim Sprachverstehen.
Zeitschrift f¨
ur Psychologie, 201:237–259, 1993.
[Sei00] R. Seiler. Skript zur HM 1 f¨
ur Physiker. TU-Berlin, 2000. 25.
Mai 1999 (¨
uberarbeitet am 3.8.00).
[Sha92] S. C. Shapiro, editor. Encyclopedia of Artificial Intelligence. John
Wiley and Sons, 2 edition, 1992.
[Shi86] S. M. Shieber. An Introduction to Unification-Based Approaches
to Grammar. CSLI Lecture Notes, Stanford, 1986.
[SJZ04] R. Seiler S. Jeschke, L. Oeverdieck and E. Zorn. Mumie Mul-
timediale Mathematikausbildung f¨
ur Ingenieure. http://www.
mumie.net/, 2004.
[SMB03a] C. M. Sperberg-McQueen and L. Burnard, editors. Guidelines for
Electronic Text Encoding and Interchange, Volumen One. TEI
Consortium, Oxford, Providence, Charlottesville, Bergen, 2003.
236 LITERATURVERZEICHNIS
[SMB03b] C. M. Sperberg-McQueen and L. Burnard, editors. Guidelines for
Electronic Text Encoding and Interchange, Volumen Two. TEI
Consortium, Oxford, Providence, Charlottesville, Bergen, 2003.
[SN74] H. Strohner and K. E. Nelson. The young child’s development of
sentence comprehension: Influence of event probability, nonver-
bal context, syntactic form, and strategies. Child Development,
45(3):567–576, 1974.
[Sow02] J. F. Sowa. Semantic Networks. http://www.jfsowa.com/pubs/
semnet.htm/, 2002.
[Spi04] M. Spies, editor. Einf¨
uhrung in die Logik. Werkzeuge f¨
ur Wissen-
repr¨
asentationen und Wissensmanagement. Spektrum Akademi-
scher Verlag, Heidelberg, Berlin, 2004.
[Sta00] P. H. Starke. Logische Grundlagen der Informatik, 2000.
[SZ98] A. Spencer and A. M. Zwicky, editors. The Handbook of Morpho-
logy. Blackwell, 1998.
[TEIa] Text Encoding Initiative. http://www.tei-c.org/.
[TEIb] TEI in der Praxis. http://computerphilologie.
uni-muenchen.de/praxis/teiprax.html.
[Tit03] P. Tittmann, editor. Graphentheorie. Eine anwendungsorientierte
Einf¨
uhrung. Hanser, M¨
unchen, Wien, 2003.
[TM] XML Topic Maps. http://www.topicmaps.org/.
[TMI] XML-Schema for ISO 13250 Topic Maps. http://www.diffuse.
org/TopicMaps/schema.html.
[Unia] Universit¨
at Erlangen (IMMD8). FERMAT (Unterst¨
utzungs-
systeme f¨
ur Mathematiker). http://www8.informatik.
uni-erlangen.de/IMMD8/Research/overview.html.
[Unib] Universit¨
at Saarbr¨
ucken, DFKI Saarbr¨
ucken. The ActiveMath
Learning Environment. http://www.activemath.org/.
LITERATURVERZEICHNIS 237
[V¨
a02] P. V¨
aterlein. Wenn wir w¨
ussten, was wir wissen ... . Physik
Journal, 1(5):25–28, 2002.
[vH83] W. von Hahn. Fachkommunikation. de Gruyter, Berlin, New
York, 1983.
[vQ01] B. von Querenburg. Mengentheoretische Topologie. Springer, Ber-
lin, Heidelberg, New York, 3 edition, 2001.
[vR79] C. J. van Rijsbergen. Information Retrieval. Butterworths, Lon-
don, 2 edition, 1979.
[W3C03] W3C. Mathematical Markup Language Specification Version
2.0. http://www.w3c.org/TR/2003/REC-MathML2-20031021/,
2003.
[W3C04] W3C. W3C Math Home. http://www.w3c.org/Math/, 2004.
[Wes94] M. G. Wessels. Kognitive Psychologie. Reinhardt, M¨
unchen, 3
edition, 1994.
[WMF95] C. A. Weaver, S. Mannes, and C. R. Fletcher, editors. Discourse
Comprehension: Essays in Honor of Walter Kintsch. Erlbaum,
Hillsdale, 1995.
[Woo80] W. A. Woods. Cascaded ATN Grammars. American Journal of
Computational Linguistics, 6(1):1–12, 1980.
[WP85] D. L. Waltz and J. B. Pollack. Massively Parallel Parsing: A
Strongly Interactive Model of Natural Language Interpretation.
Cognitive Science, 9(1):57–84, 1985.
[WR84] A. N. Whitehead and B. Russell. Principia Mathematica. Medusa,
Wien, Berlin, 1984.
[Wue95] R. Wuest. H¨
ohere Mathematik f¨
ur Physiker. de Gruyter, Berlin,
New York, 1 edition, 1995.
[WZW85] S. K. M. Wong, W. Ziarko, and P. C. N. Wong. Generalized vector
spaces model in information retrieval. In Proceedings of the 8th
Annual International ACM SIGIR Conference on Research and
238 LITERATURVERZEICHNIS
Development in Information Retrieval, pages 18–25, New York,
1985.
[YB97] S. Young and G. Bloothooft, editors. Corpus-based Methods in
Language and Speech Processing. Kluwer, Dordrecht, 1997.