Heft 66/2000

Schriftenreihe
des Instituts für Geodäsie



Heft 66/2000

JOOS, Gerhard

Zur Qualität von objektstrukturierten Geodaten

Dissertation
IV, 141 S.

Auflage:  450

ISSN:  0173-1009

Inhaltsverzeichnis

Zusammenfassung


 


Vollständiger Abdruck der von der Fakultät für Bauingenieur- und Vermessungswesen der Universität der Bundeswehr München zur Erlangung des akademischen Grades eines Doktors-Ingenieurs (Dr.-Ing.) genehmigten Dissertation.

Promotionsausschuß:  
Vorsitzender: Univ.-Prof. Dr.-Ing. Wolfgang Reinhardt
1. Berichterstatter: Univ.-Prof. Dr.-Ing. habil. Wilhelm Caspary
2. Berichterstatter: o. Prof. Dr.-Ing. Wolfgang Möhlenbrink
(Universität Stuttgart)

Diese Dissertation wurde am 16. September 1998 bei der Universität der Bundeswehr München eingereicht.

Tag der mündlichen Prüfung:  30. März 1999
 



Inhaltsverzeichnis

1   Einleitung und Problemstellung 1
 
2   Modellierung der realen Welt 4
     2.1  Beschreibung der verschiedenen Modellierungsebenen 5
     2.2  Konzeptionelle Modellierung 7
            2.2.1  Inhalt 7
                  2.2.1.1  Definition 7
                  2.2.1.2  Erfassungskriterien 8
                  2.2.1.3  Gebiet 9
                  2.2.1.4  Attribute 9
            2.2.2  Struktur 10
                  2.2.2.1  Hierarchische Gliederung 10
                  2.2.2.2  Indirekte Positionsangabe 10
                  2.2.2.3  Dimension 11
                  2.2.2.4  Repräsentationsformen der Geometrie 11
                  2.2.2.5  Geodätisches Bezugssystem 12
                  2.2.2.6  Geometrische Primitive 13
                  2.2.2.7  Topologische Primitive 13
                  2.2.2.8  Auflösung 13
                  2.2.2.9  Attributtyp 14
            2.2.3  Regeln 14
                  2.2.3.1  Objektbildung 14
                  2.2.3.2  Objektschlüssel 15
                  2.2.3.3  Beziehungen zwischen Objekten 15
                  2.2.3.4  Wertebereich für Attribute 16
                  2.2.3.5  Zuordnung von geometrischen Primitiven
                               in Abhängigkeit von der Form des Objekts

17
     2.3  Logische Modellierung 18
            2.3.1  Raumbezug 18
            2.3.2  Sachdaten 19
            2.3.3  GIS-Architektur 19
            2.3.4  Datenbankverwaltungssysteme 20
                  2.3.4.1  Hierarchisches Datenmodell 20
                  2.3.4.2  Netzwerk-Datenmodell 21
                  2.3.4.3  Relationales Datenmodell 21
                  2.3.4.4  Objektorientiertes Datenmodell 22
                  2.3.4.5  Objektrelationales Datenmodell 22
     2.4  Physikalische Modellierung 23
     2.5  Datenschemata 23
 
3   Metadaten 25
     3.1  Das Modell der Daten 26
     3.2  Die Herkunft der Daten 26
            3.2.1  Urheber 26
            3.2.2  Datenquellen 26
            3.2.3  Erfassungsmethoden 28
            3.2.4  Vorverarbeitung und Transformationen 28
            3.2.5  Sprache der Sachdaten 28
            3.2.6  Aktualität 29
            3.2.7  Fortführung 30
     3.3  Angaben zur Qualität der Daten 30
     3.4  Verfügbarkeit 30
            3.4.1  Flächendeckung 31
            3.4.2  Abgabeeinheiten 31
            3.4.3  Abgabeformate 31
            3.4.4  Kosten 32
            3.4.5  Abgabebeschränkung 32
            3.4.6  Nutzungsrechte 33
            3.4.7  Haftung 33
            3.4.8  Vertrieb 33
     3.5  Referenzprojekte 33
     3.6  Öffentliche und interne Metadaten 33
 
4   Qualitätsmodell 35
     4.1  Modellqualität 36
     4.2  Datenqualität 38
            4.2.1  Motivation für das Festlegen von Qualitätskriterien 39
            4.2.2  Einführendes Beispiel 40
            4.2.3  Klassifizierung der Fehler 42
     4.3  Verbale und formale Definition der Qualitätskriterien 44
            4.3.1  Vollständigkeit 44
            4.3.2  Richtigkeit 44
            4.3.3  Konsistenz 44
            4.3.4  Genauigkeit 45
                  4.3.4.1  Meßunsicherheit 45
                  4.3.4.2  Vertrauensbereich 46
     4.4  Verletzung der Qualitätskriterien 47
            4.4.1  Vollständigkeit 47
            4.4.2  Richtigkeit 48
            4.4.3  Konsistenz 48
            4.4.4  Genauigkeit 48
     4.5  Qualitätsmaße 49
            4.5.1  Fehlermaße für individuelle Objekte oder Attribute 49
                  4.5.1.1  Vollständigkeit, Richtigkeit und Konsistenz 50
                  4.5.1.2 Genauigkeit 50
            4.5.2  Ein Gebiet als Bezugsgröße für Fehlermaße 50
                  4.5.2.1  Vollständigkeit 51
                  4.5.2.2  Richtigkeit (Objekt und Attribut) 53
                  4.5.2.3  Konsistenz 54
                  4.5.2.4  Genauigkeit 54
            4.5.3  Fehlerdichte 55
     4.6  Speicherung von Qualitätsdaten und Metadaten 56
            4.6.1  Verwaltung der Metadaten getrennt von dem
                      Datenbestand

56
            4.6.2  Objektbezogene Metadatenhaltung 57
            4.6.3  Berücksichtigung des Raumbezuges von Metadaten 57
 
5   Qualitätsmanagement bei der Datenerfassung 59
     5.1  Methoden zur Einhaltung von Qualitätszielen 59
     5.2  Qualitätsziele 59
     5.3  Qualitätsmanagement 60
            5.3.1    Verantwortung der obersten Leitung 61
            5.3.2    Qualitätssicherungssystem (QS-System) 61
            5.3.3    Vertragsüberprüfung 62
            5.3.4    Designlenkung 62
                  5.3.4.1  Design- und Entwicklungsplanung 63
                  5.3.4.2  Designvorgaben 63
                  5.3.4.3  Designergebnis 63
                  5.3.4.4  Designverifizierung 63
                  5.3.4.5  Designänderung 64
            5.3.5    Lenkung der Dokumente 64
            5.3.6    Beschaffung 64
            5.3.7    Vom Auftraggeber beigestellte Produkte 64
            5.3.8    Identifikation und Rückverfolgbarkeit von Produkten 65
            5.3.9    Prozeßlenkung 65
            5.3.10  Prüfungen 65
                  5.3.10.1  Eingangsprüfungen 65
                  5.3.10.2  Zwischenprüfungen 66
                  5.3.10.3  Endprüfungen 66
            5.3.11  Prüfmittel 66
            5.3.12  Prüfstatus 66
            5.3.13  Lenkung fehlerhafter Produkte 66
            5.3.14  Korrekturmaßnahmen 67
            5.3.15  Handhabung, Lagerung, Verpackung und Versand 67
            5.3.16  Qualitätsaufzeichnungen 67
            5.3.17  Interne Qualitätsaudits 68
            5.3.18  Schulung 68
            5.3.19  Kundendienst 68
            5.3.20  Gebrauch statistischer Methoden 68
 
6   Konsistenzprüfungen 69
     6.1  Prüfung der logischen Konsistenz 69
            6.1.1  Konsistenz der Attributwerte 69
            6.1.2  Konsistenz der Topologie 70
                  6.1.2.1  Geometrische Konstellationen mit hoher
                               Wahrscheinlichkeit einer topologischen
                               Inkonsistenz


70
                  6.1.2.2  Konsistenzbedingungen für planbare
                               Graphen

70
     6.2  Prüfung der konzeptionellen Konsistenz 72
            6.2.1  Attributregeln bezogen auf ein Objekt 72
                  6.2.1.1  Zwingend erforderliche Attributeinträge 72
                  6.2.1.2  Eindeutigkeit von Identifikatoren 73
                  6.2.1.3  Wertebereiche von Attributen 73
                  6.2.1.4  Bedingungen zwischen Attributwerten
                               eines Objekts
75
            6.2.2  Attributregeln mit hierarchischen Beziehungen
                      von Objekten

75
            6.2.3  Attributregeln mit topologischen Beziehungen
                      zwischen Objekten

76
            6.2.4  Objektregeln mit topologischen Beziehungen
                      zwischen Objekten

78
     6.3  Einfluß der Datenverwaltung auf Konsistenzprüfungen 79
            6.3.1  Kachelung 80
            6.3.2  Abgabeeinheiten 80
     6.4  Formaler Regelkatalog FRACAS 81
            6.4.1  Struktur des Regelkatalogs 82
            6.4.2  Das Regelwerk 82
            6.4.3  Beispiele 84
 
7   Stichprobenprüfung 87
     7.1    Ziel der Stichprobenkontrolle 88
     7.2    Der Begriff einer Stichprobe 89
     7.3    Voraussetzungen zur Durchführung einer Stichproben-
              kontrolle

89
     7.4    Auswahl von Stichproben 90
              7.4.1  Ziehung von Objektidentifikatoren 91
              7.4.2  Landkartenverfahren 91
              7.4.3  Flächenstichprobe 92
     7.5    Verteilungsfunktionen 92
              7.5.1  Binominalverteilung 92
              7.5.2  Hypergeometrische Verteilung 93
              7.5.3  Approximation der hypergeometrischen
                        Verteilung durch andere Verteilungen

94
     7.6    Verschiedene Begriffe der Testtheorie 93
     7.7    Stichprobenplan 99
              7.7.1  Einstufiger Stichprobenplan 100
              7.7.2  Annehmbare (AQL) und rückzuweisende
                        Qualitätsgrenzlage (LQ)

101
              7.7.3  Stichprobenumfang 103
              7.7.4  Abgebrochene Kontrolle 107
              7.7.5  Mehrstufige und sequentielle Stichprobenpläne 109
              7.7.6  Mittlerer Stichprobenumfang bei mehrstufigen
                        Stichprobenplänen

111
              7.7.7  Mittlerer Durchschlupf 114
              7.7.8  Kostenoptimale Prüfpläne 115
     7.8    Normale, verschärfte und reduzierte Prüfung 118
     7.9    Test auf Homogenität 122
     7.10  Stichprobenuntersuchungen bei besonderen Objekt-
              klassen

124
 
8   Normentwürfe zu Datenqualität und Metadaten 125
 
9   Zusammenfassung und Ausblick 128
 
10  Summary 130
 
11  Glossar 131
12  Abkürzungen 132
13  Literaturverzeichnis 133
14  Verwendete Normen 138
 
A   Topologische Beziehungen von Objekten im 139

Lebenslauf

141
Dank 141
 

 
Zusammenfassung und Ausblick

Der Einsatz eines GIS für die Planung, für Verwaltung von rechtsverbindlichen Objekten, z.B. Flurstücke oder Schutzgebiete, für Fahrzeugnavigation und Flottenmanagement, für Geomarketing und für Leitungsdokumentation bringt nicht nur Vorteile in Form von Kosteneinsparung, schnellere Verfügbarkeit, höhere Aktualität und vor allem Analysemöglichkeiten, sondern birgt auch Gefahren in sich. Auf der Basis der Geodaten werden Entscheidungen gefällt, die sowohl Einfluß auf Investitionen haben, als auch auf unsere Umwelt, und somit auch auf unsere Lebensqualität. Die Qualität der Daten ist deshalb besonders wichtig. Um qualitativ hochwertige Daten zu erhalten, muß ein der Anwendung angemessener Aufwand getrieben werden. Dieser Aufwand darf nicht nur mit den Kosten der Datenerfassung in Relation gestellt werden, sondern auch mit den Auswirkungen, die fehlerhafte Objekte in einem Geoinformationssystem bewirken können.

Um die Qualität von Geodaten ermitteln oder beurteilen zu können, muß zuerst klar definiert sein, welche Objekte der realen Welt wie in einem Geoinformatioonssystem repräsentiert werden sollen. Dazu muß ein Datenmodell aufgestellt werden, das aus den Teilen konzeptionelles, logisches und physikalisches Datenmodell besteht. Das Datenmodell legt die Objektauswahl, deren Eigenschaften, die Struktur und Regeln fest.

Die Beschreibung der Daten erfolgt durch Metadaten. Sie beinhalten nicht nur das Datenmodell, sondern auch alle Informationen über den Entstehungsprozeß der Daten und ein Qualitätsmodell, das einem potentiellen Anwender von Geodaten ein Urteil ermöglicht, ob die Geodaten für eine beabsichtigte Anwendung geeignet sind. Zur Beschreibung des Qualitätsmodells müssen Qualitätskriterien und Qualitätsmaße eingeführt werden. Die Kriterien sind erforderlich, um Datenfehler taxieren zu können, da nicht alle Fehlerarten gleiche Auswirkungen für die Anwendungen haben. Es wurde gezeigt, daß die vier Kriterien „Vollständigkeit”, „Richtigkeit”, „Genauigkeit” und „Konsistenz” zur Einordnung von Datenfehlern ausreichend, aber nicht immer eindeutig sind. Wenn keine Mehrdeutigkeiten zugelassen sind, müssen Zusatzregeln als Entscheidungshilfen bei der Behandlung aller anwendungsspezifischer Spezialfälle angegeben werden.

Auf Basis dieser vier Kriterien werden die Qualitätsmaße eingeführt, die entweder objektbezogen oder bezogen auf Gebiete definiert werden können. Die Qualitätsmaße können durch Festlegung von Grenzwerten zur Formulierung von Qualitätszielen verwendet werden. Qualitätsziele sind insbesondere im Rahmen eines Qualitätsmanagements erforderlich. Das Qualitätsmanagement dient zur Überwachung und zur Dokumentation, daß die Ziele eingehalten und mögliche Fehlerursachen früh erkannt werden, damit die Erfassung und Fortführung von Geodaten auf einem hohen Qualitätsniveau erfolgen und durch ständige Rückkopplungen weiter verbessert werden. Das Qualitätsmanagement kann durch 20 QS-Elemente in Anlehnung an ISO 9000 ff. beschrieben werden. Kernstück des Qualitätsmanagements sind regelmäßige Prüfungen. Zur Prüfung von Geodaten können zwei Arten der Prüfung unterschieden werden. Prüfungen können automatisch ablaufen oder interaktiv durch einen menschlichen Prüfer und sie können auf den gesamten Datenbestand angewandt werden oder nur auf Stichproben, deren Prüfergebnisse auf den Gesamtdatenbestand hochgerechnet werden.

Automatische Prüfungen können nur zur Kontrolle der Konsistenz, d.h. der Einhaltung von Regeln des Datenmodells, herangezogen werden. Die Regeln beziehen sich auf die konzeptionelle, logische oder physikalische Ebene der Datenmodellierung. Zur Überprüfung der konzeptionellen Konsistenz wurde ein Regelwerk aufgestellt, mit dem Konsistenzbedingungen für topographische Daten formuliert werden können. Eine Prüfsoftware, die diejenigen Objekte und Konstellationen aufdeckt, die diesen Regeln widersprechen, wurde entwickelt. Die Prüfung wird von einem implementierungsunabhängigen Regelkatalog gesteuert. Zur Anpassung an Änderungen und Erweiterungen des Datenschemas braucht nur der Regelkatalog fortgeführt zu werden. Die Bedingungen zur Suche nach Inkonsistenzen werden mit Hilfe der Prädiktenlogik und des 9-Intersection-Modells zur Beschreibung von topologischen Beziehungen formuliert. Automatische Prüfungen müssen auf dem gesamten Datenbestand durchgeführt und entdeckte Fehler korrigiert werden, bevor die Daten einer Anwendung zugeführt werden dürfen.

Wenn eine vollständige Prüfung des gesamten Datenbestandes mit zu großem Aufwand verbunden ist, weil diese z.B. zu lange dauert und die Daten schnell benötigt werden oder die Kosten für die Prüfung das Budget oder den Nutzen übersteigen, so kann unter bestimmten Voraussetzungen eine Stichprobenkontrolle durchgeführt werden. Die Wahrscheinlichkeit, eine bestimmte Anzahl von fehlerhaften Objekten in einer Stichprobe zu finden, errechnet sich nach der hypergeometrischen Verteilung. Zur Aufstellung eines Stichprobenplanes, bestehend aus dem erforderlichen Stichprobenumfang und einer zugehörigen Annahmezahl, wird eine annehmbare Qualitätsgrenzlage und rückzuweisende Qualitätsgrenzlage benötigt. Diese kann entweder durch Absprache zwischen Produzent und Anwender der Daten festgelegt oder nach wirtschaftlichen Gesichtspunkten ermittelt werden. Verschiedene Strategien zur Reduzierung des durchschnittlichen Stichprobenumfanges werden diskutiert.

Die Dokumentation der durchgeführten Kontrollen und deren Ergebnisse ist für die Einschätzung der Zuverlässigkeit der Geodaten wichtig. Verschiedene Ansätze zur Verwaltung dieser Informationen zusammen mit weiteren Metadaten wurden diskutiert. Abhängig davon, ob das einzelne Objekt oder eine Gruppe von Objekten die Bezugsgröße für Qualitätsinformationen darstellt, sind unterschiedliche Konzepte zur Verwaltung der qualitätsbezogenen Metadaten möglich.

In dieser Arbeit wurden die Aspekte der Datenqualität behandelt. An verschiedenen Stellen wurde deutlich, wie wichtig das Modell für die Verwendbarkeit von Geodaten ist. Die Aspekte der Modellqualität wurden nur gestreift. Der Autor ist sich bewußt, daß in diesem Bereich noch weiterer Forschungsbedarf besteht. Die Crux besteht darin, daß die Bewertung von Modellen sehr eng an die jeweilige Anwendung gebunden ist, und somit ein allgemein gültiger Formalismus zur Bewertung der Modellqualität kaum angegeben werden kann.

Wenn die Qualität von Geoinformationssystemen oder von aus GIS abgeleiteten Informationen beurteilt werden soll, müssen alle Komponenten eines GIS betracht werden (JOOS, 1994). Dabei kommen Aspekte wie Ausfallsicherheit von Hardware, Antwortzeitverhalten bei Datenzugriffen, Effizienz und Richtigkeit von Algorithmen zur Analyse von Geodaten sowie Auswirkungen oder Sensibilitätsuntersuchungen von Datenfehlern zum Tragen. Dazu ist ein Qualitätsmodell für Arbeitsergebnisse und Entscheidungen, die mit einem GIS erzeugt wurden, wünschenswert. Da ein solches Modell nicht verfügbar ist, besteht auch hier Forschungsbedarf. Mit den in dieser Arbeit vorgeschlagenen Kriterien erscheint eine Berechnung oder Abschätzung der Auswirkung von der Datenqualität auf die Ergebnisqualität möglich. Unter dieses Thema fällt auch die Beurteilung der Qualität von Diensten mit Geodaten, wie sie durch die Interoperabilität von GIS möglich werden.

Die Aktualität von Geodaten wurde nicht als Qualitätskriterium behandelt, sondern als Element der Metadaten betrachtet. Sie ist ein entscheidendes Indiz für die Verwendbarkeit der Geodaten in den meisten Anwendungen. Durch die Dokumentation des Entstehungs- und Änderungsdatums, welches die Daten tragen, ist noch kein aktueller Datenbestand gewährleistet. Im Bereich der Fortführung durch Einrichtung von Meldediensten oder durch automatisierte Erkennung von Objekten aus Fernerkundungsdaten sowie durch Fortführung von Datenbeständen einer Maßstabsebene und Propagierung der Änderungen in die anderen Maßstabsebenen durch Generalisierung sind nur Teilaspekte gelöst.

Um Informationen über die Qualität von Geodaten einem Anwender zugänglich zu machen, insbesondere wenn die Informationen nicht nur allgemeiner, beschreibender Natur sind, sondern in enger Verknüpfung mit den Daten stehen oder selbst einen Raumbezug haben, wie in dieser Arbeit vorgeschlagen, werden standardisierte Zugriffsmechanismen oder Austauschformate erforderlich. Verschiedene Organisationen und Gremien arbeiten teils konkurrierend teils kooperierend zum Zeitpunkt der Fertigstellung dieser Arbeit an Normen für Geoinformation. Zum Wohle der Nutzer von Geoinformationssystemen ist es wichtig, daß erstens diese Normen vollständig und anwendbar sind, zweitens die Systemhersteller Mechanismen bereitstellen, damit diese Normen angewandt werden können, und drittens die Datenproduzenten die ermittelten Qualitätsmaße den Endnutzern zugänglich machen.
 


 
Literatur:

JOOS, G. 1994: Quality aspects of geo-information. In: Proceedings of the fifth European conference on geographical information systems, EGIS in Paris, March 29 - April 1, 1994, Vol. II, pp. 1147-1153.
 


 
zurück zum Heft-Verzeichnis
 


 

 

DOWNLOAD



"Heft-66.pdf"

(5,12 MB)