
Interoperability of Geo-information in
Remote Sensing-based Biodiversity
Monitoring
vorgelegt von
Mag. rer. nat.
Simon Nieland
geb. in München
Von der Fakultät VI - Planen Bauen Umwelt der
Technischen Universität Berlin
zur Erlangung des akademischen Grades
Doktor der Naturwissenschaften
Dr. rer. nat
genehmigte Dissertation
Promotionsausschuss:
Vorsitzender: Prof. Dr. Dieter
Scherer
Gutachterin: Prof. Dr. Birgit
Kleinschmit
Gutachter: Prof. Dr. Joseph
Strobl
Tag der wissenschaftlichen Aussprache: 06. Dezember 2016
Berlin 2017

II
Summary
Rapid technological advances coupled with modern analysis methods has
increased the quantity of geographical data and has therefore improved
monitoring of local, regional and global environmental phenomena at
much ner detail. Despite these advances, insucient data interoperability
remains to be a barrier to reusability, discovery and access to geographical
information. To overcome this heterogeneity it is crucial to generate syntactic
interoperability, which determines xed standards in data exchange, but also
semantic interoperability, a possibility to generate comparability by using
shared descriptions with unambiguous meaning stored in semantic systems.
In the eld of nature conservation, semantic heterogeneity is a big challenge
since national and regional data acquisition methodologies vary broadly.
Moreover, trans-national data (which are required for multi-national legal
processes like the EU Habitats Directive (HabDir), the Water Framework
Directive or INSPIRE) are generated bottom-up, using mostly national or
regional acquisition guidelines.
This dissertation addresses four aspects of interoperability in nature
conservation. The rst part provides a methodology for semantic mediation
of remote-sensing based data products, which were generated in dierent
countries in Europe by taking into account diering sensor types
and base classication schemes. The results indicate that automated,
semantic-based data transformation is feasible, but is highly dependent on
the conceptualisation of the respective nomenclatures. Therefore transparent,
hierarchical nomenclatures are far more important for transferability than the
sensor or study area.
The second part applies the developed method in an up-scaling application
to generate a comparable automated delineation of selected habitats in
dierent countries by generating transferable aggregation rules. For the
dierent habitats in the two sites an accuracy of above 70% was achieved in
regard to a manual, expert-based delineation. This meets approximately the
percentages of the comparison of two manual delineations since the process of
manual delineation is always subjective and highly dependent on the personal
qualication and perception of the surveyor and therefore inherits a high
degree of uncertainty.
The third part addresses the challenge of generating reproducible
and formalised information in remote-sensing analysis in a semantic,
ontology-based classication approach. This approach combines advanced
machine learning algorithms and ontological data management and
classication. It produces results with similar quality to established machine
learning algorithms like Extra Tree Classier (ET) but preserves transferable
classication rules and ontological formalism.
The fourth part evaluates the automated aggregation approach of part two
in respect to manual, expert-based delineation and gives recommendations
for the international guidelines in terms of scale eects, minimum mapping

III
units and the potential of the usage of remote sensing-based data sets in
automated up-scaling procedures for European legal purposes.
Semantic systems inherit great potential for nature conservation in terms
of data storage, information retrieval and derivation and comparability
of data. This thesis shows this potential by proving feasibility of
semantic transformation between dierent nature conservation data sets, the
application of this transformation procedure in up-scaling processes, and
the ability to use semantic-based technologies in classication procedures.
It therefore indicates that using semantic systems for data interoperability in
nature conservation is possible but underlies, up to now, certain limitations.
From a technical point of view the main restrictions are the absence of
theme-specic controlled vocabularies and semantic infrastructures which are
increasingly developed and provided by regional and international authorities.
With regard to the content of the nature conservation data, limitations
occur because of the high degree of uncertainty in data acquisition, semantic
impreciseness of data descriptions and natural gradients in the composition
of habitats.

IV
Zusammenfassung
Technologische Veränderungen gepaart mit modernen Analysemethoden
haben die Menge an geographischen Daten in den letzten Jahren erheblich
erhöht. Diese Entwicklung hat das Potential, lokale, regionale und globale
Umweltphänomene in einem verbesserten Detaillierungsgrad zu erfassen.
Trotz dieser Fortschritte bleibt ungenügende Dateninteroperabilität ein
Hemmnis für die Wiederverwendbarkeit, die Aundbarkeit und den
Zugang zu geographischer Information. Um diese Datenheterogenität zu
überwinden ist es zunehmend entscheidend semantische Interoperabilität zu
gewährleisten. Semantische Systeme geben die Möglichkeit Vergleichbarkeit
zwischen Datenpaketen zu generieren indem sie gemeinsame eindeutige
Beschreibungen nutzen. Im Bereich des Naturschutzes ist semantische
Heterogenität eine groÿe Herausforderung, da sich nationale und
internationale Erhebungsvorschiften zwischen den verschiedenen Ländern
erheblich unterscheiden. Darüber hinaus werden transnationale Richtlinien
wie die Flora-Fauna-Habitat Richtlinie oder die Wasserrahmenrichtlinie mit
buttom-up Ansätzen erstellt, wobei mehrheitlich nationale und regionale
Erhebungsrichtlinien verwendet werden.
Diese Dissertation adressiert vier Aspekte von Interoperabilität im
Naturschutz. Der erste Teil stellt eine Methode zur semantischen Mediation
von fernerkundungsbasierten Datenprodukt vor, die in unterschiedlichen
Ländern Europas mit unterschiedlichen Sensortypen und Nomenklaturen
erstellt wurden. Die Ergebnisse zeigen, dass eine automatisierte semantische
Datentransformation möglich, die Qualität der Ergebnisse allerdings
stark von der Konzeptualisierung der zugehörigen Nomenklaturen
abhängig ist. Daher sind transparente, hierarchische Nomenklaturen
für die Vergleichbarkeit wesentlich wichtiger als Sensoren oder das
Untersuchungsgebiet.
Der zweite Teil wendet die entwickelte Methode in einer räumlichen
Hochskalierungsanwendung an, um mit Hilfe von überführbaren
Generalisierungsregeln vergleichbare, automatisierte Abgrenzungen von
ausgewählten Habitattypen in unterschiedlichen Ländern zu erzeugen. Für
die verschiedenen Habitattypen in den zwei Untersuchungsgebieten konnte
eine Übereinstimmung von über 70% zu einer manuellen, expertenbasierten
Habitatabgrenzung erreicht werden. Das entspricht etwa einem Vergleich
von zwei manuellen Abgrenzungen da der Prozess der manuellen Kartierung
immer Subjektiv ist, stark von der persönlichen Qualikation und
Wahrnehmung des Kartierers abhängig ist und somit einen hohes Maÿ
an Ungenauigkeit beinhaltet.
Der dritte Teil adressiert die Herausforderung, reproduzierbare
und formalisierte Information mit Hilfe von Fernerkundung in einem
semantischen, ontologiebasierten Klassikationsansatz herzustellen. Dieser
Ansatz kombiniert fortschrittliche Methoden des maschinellen Lernens mit
ontologischem Datenmanagement und Klassikation. Er erstellt Ergebnisse

V
mit vergleichbarer Qualität wie etablierte Algorithmen des maschinellen
lernens, bewahrt aber transferierbare Klassikationsregeln und ontologischen
Formalismus.
Der vierte Teil evaluiert den automatisierten Aggregationsansatz
des zweiten Teils hinsichtlich einer manuellen, expertenbasierten
Habitatabgrenzung und gibt Empfehlungen für internationale Richtlinien
in Form von Skaleneekten, Mindestkartiereinheiten und dem Potential der
Nutzung von Fernerkundungsdatensätzen in automatisierten räumlichen
Hochskalierungsanwendungen.
Semantische Systeme beinhalten ein groÿes Potential für den Naturschutz
in Form von Datenspeicherung, Informationsgewinnung und der Ableitung
von Datenvergleichbarkeit. Diese Arbeit zeigt dieses Potential auf
indem sie die Machbarkeit semantischer Transformation zwischen
verschiedenen Naturschutzdatensätzen belegt und deren Anwendung
in räumlichen Hochskalierungsanwendungen aufzeigt. Darüber hinaus
werden Möglichkeiten zur Nutzung von semantischen Systemen für
Klassikationsprozesse aufgezeigt. Die Arbeit zeigt daher, dass semantische
Systeme für Dateninteroperabilität im Naturschutz nutzbar sind, aber
bislang einigen Einschränkungen unterliegen. Von einem technischen
Punkt sind die maÿgeblichen Restriktionen nicht vorhandene thematische,
kontrollierte Vokabulare und semantische Infrastruktur, die zunehmend
von nationalen und internationalen Behörden entwickelt und bereitgestellt
werden. Hinsichtlich des Inhalts von Naturschutzdaten ergeben sich
Einschränkungen aufgrund der Unsicherheiten in der Datenaufnahme, der
semantischen Ungenauigkeit bei der Datenbeschreibung und natürlicher
Verläufe der Panzenzusammensetzungen von Habitaten.
Loading more pages...