Zur Integration von heterogenen Geodatenbanken

Zur Integration von heterogenen Geodatenbanken

Integration von Datenquellen ist immer notwendig, wenn für ein Anwendungsszenario mehr als eine Datenbank oder Datenbestand als Datengrundlage benutzt werden muß.
Die Zusammenführung dieser unterschiedlichen Datenquellen geschieht entweder beim Benutzer des Informationssystems, beispielsweise durch die Überlagerung von Vektor und Rasterdaten bei der Darstellung von Geodaten am Bildschirm, oder durch das System.
Die Zusammenführung der Datenquellen durch das System wird dynamisch beim Zugriff auf die Daten oder in einem Vorverarbeitungsschritt zu einer dadurch neu entstehenden Datenquelle realisiert.

In dieser Arbeit werden Lösungen für die Aufgabenstellung der Integration von bestehenden und unabhängig voneinander entstandenen Geodatenbanken in eine dadurch neu entstehende Geodatenbank untersucht. Bestehende Lösungen aus den Forschungsbereichen Datawarehousing und föderierte Datenbanken sind der Ausgangspunkt der Untersuchungen.

Die für Geodaten charakteristischen Besonderheiten für die Aufgabenstellung der Integration sind zuerst die geometrischen und topologischen Eigenschaften der Objekte der Datenbanken. In der praktischen Umsetzung stellt man aber schnell fest, daß diese beiden Besonderheiten von Geodaten nicht die einzigen Aspekte sind, die bei der Integration heterogener Geodatenbanken besondere Probleme machen.

Bei der Zusammenführung von Objekten aus mehreren Datenquellen, die zumindest einen gleichen Teil des modellierten Weltausschnitts abdecken, sind in der Regel unterschiedliche Semantiken der Elemente der Datenbanken miteinander zu verbinden. Diese Konflikte entstehen durch unterschiedliche Sichtweisen der Modelleure, unterschiedliche Auflösungsstufen der Daten- quellen ("Maßstab") und unterschiedliche qualitative Anforderungen beim Aufbau der Daten- quellen. Die Lösung der Integrationsaufgabe für unterschiedliche Semantiken hängt von der anvisierten Anwendung des integrierten Datenbestand. Es gibt also keine allgemeingültig beste Lösung, vielmehr ist die Qualität der Lösung direkt von der Anwendung, die die integrierten Daten verwendet, abhängig.

Wir stellen einen Ansatz für die Lösung der Integrationsaufgabe der Semantik vor, der den Schritt der Zusammenführung auf der semantischen Ebene anwendungsgesteuert zum Anwendungszeitpunkt verlagert. Das Wissen, wie die Datenquellen zusammenzuführen sind, wird mit den modifizierten Datenquellen mitgeführt.

Dem Integrationsprozeß müssen ausreichend Informationen zum Inhalt und Aufbau der Quelldatenbanken vorliegen. Der vorgestellte Ansatz wird von Metadaten gesteuert, die die Instanzen der Datenbasen begleiten.

Die zeitlich verlagerte Integration der Semantik der Datenquellen ermöglicht einen sehr flexibel einsetzbaren Integrationsansatz. Die Vorteile dieses Ansatzes werden an Beispielen realer Datensätze veranschaulicht.