Heft 59/1997

Schriftenreihe
des Instituts für Geodäsie


 
Heft 59/1997

JIANG, Ting

Digitale Bildzuordnung mittels Wavelet-Transformation

Dissertation
II, 133 S.

Auflage:  450

ISSN:  0173-1009

Inhaltsverzeichnis

Zusammenfassung

 


Vollständiger Abdruck der von der Fakultät für Bauingenieur- und Vermessungswesen der Universität der Bundeswehr München zur Erlangung des akademischen Grades eines Doktor-Ingenieurs (Dr.-Ing.) genehmigten Dissertation.

Promotionsausschuß:  
Vorsitzender: Univ.-Prof. Dr. rer.nat. K. Wichmann
1. Berichterstatter: Univ.-Prof. Dr.-Ing. E. Dorrer
2. Berichterstatter: Univ.-Prof. Dr.-Ing. F. S. Kröll

Die Dissertation wurde am 20. Februar 1997 bei der Universität der Bundeswehr München, Werner-Heisenberg-Weg 39, D-85577 Neubiberg eingereicht.

Tag der mündlichen Prüfung:  27. Juni 1997
 



Verkürztes Inhaltsverzeichnis

1  Einleitung 1
    1.1  Allgemeines 1
    1.2  Bildzuordnung 2
    1.3  Wavelet-Theorie 3
    1.4  Zielsetzung und Einordnung der Arbeit 4
 
2  Abriß der Wavelet-Theorie 7
    2.1  Einleitung 7
    2.2  Wavelets 9
    2.3  Kontinuierliche Wavelet-Transformation 12
    2.4  Multi-Skalen-Repräsentation mit Wavelets 13
 
3  Konzeption einer Bildzuordnung mittels Wavelet-
    Transformation

43
    3.1  Einleitung 43
    3.2  Aufbau der Bildpyramiden 52
    3.3  Interessensoperator 61
    3.4  Merkmalsbasierte Punktauswahl 66
    3.5  Flächenhafte Bildzuordnung 71
    3.6  Ablaufdiagramm 72
 
4  Anwendungen auf Luft- und Weltraumbilddaten 75
    4.1  Anwendung auf Luftbilddaten 75
    4.2  Anwendung auf Weltraumbilddaten 87
 
5  Zusammenfassung und Ausblick 107
 
6  Literaturverzeichnis 111
 
Anhang: Softwarepakete 119
    A1  Bildeingabe 120
    A2  Bilddarstellung 120
    A3  Photogrammetrische Vorverarbeitung 121
    A4  Bildzuordnung 125
    A5  Photogrammetrische Nachbearbeitung 129
 
Lebenslauf 132
Dank 133
 

 
Zusammenfassung und Ausblick

Beim Übergang von der analytischen zur digitalen Photogrammetrie bildet die digitale Bildzuordnung ein unentbehrliches Kernstück. Die vorliegende Arbeit will mit Hilfe eines neuen mathematischen Ansatzes einen Beitrag zu einer genauen, zuverlässigen und schnellen digitalen Bildzuordnung leisten.

Das in dieser Arbeit entwickelte Bildzuordnungsverfahren mittels Wavelet-Transformation bzw. mittels Multi-Skalen-Repräsentation kombiniert intensitäts- und merkmalsbasierte Bildzuordnungsmethoden. Mit Hilfe der Multi-Skalen-Repräsentation mit Wavelets werden zunächst drei Merkmalspyramiden, die jeweils waagerechte, senkrechte und diagonale Eigenschaften der Objekte darstellen, zusammen mit einer Approximationspyramide ohne Vermehrung des Speicherungsbedarfs gleichzeitig aufgebaut. Die Bildzuordnung wird dann mit einer Grob-Fein-Strategie hierarchisch durchgeführt. Es wurde gezeigt, daß hierzu die Multi-Skalen-Repräsentation mit Wavelets vorteilhaft eingesetzt werden kann. Zur Punktauswahl wurde ein neuer Interessensoperator entwickelt, der auf den Merkmalspyramiden und der Approximationspyramide beruht und einen effektiven Kantendetektor darstellt. Der Ähnlichkeitsvergleich innerhalb der Bildzuordnung stützt sich auf die Bildkorrelation, die zur Steigerung der Zuverlässigkeit bidirektional durchgeführt wird. Zur Steigerung der Genauigkeit wird zusätzlich die Bildzuordnung nach der Methode der kleinsten Quadrate in den Originalbildern angewandt. Das Verfahren sollte damit möglichst die Vorteile der flächenhaften, merkmalsbasierten und hierarchischen Bildzuordnungsmethoden ausnützen.

Als Voraussetzung für diese Arbeit wurden in Kapitel 2 die Grundlagen der Wavelet-Transformation vorgestellt. Zunächst wurde der Begriff „Wavelet” definiert und mit zwei Beispielen erläutert, wobei ein Weg gezeigt wurde, wie ein Wavelet konstruiert werden kann. Danach wurde die kontinuierliche Wavelet-Transformation definiert und die kontinuierliche inverse Wavelet-Transformation durch einer Satz aufgestellt. Der Schwrepunkt des Kapitels ist die Beschreibung der Multi-Skalen-Repräsentation mit Wavelets; auf ihr beruht diese Arbeit. Dabei wurden zunächst eine Multi-Skalen-Analyse und die ihr entsprechende Wavelet-Repräsentation erstellt, die zusammen eine vollständige Multi-Skalen-Repräsentation mit Wavelets bilden. Dann wurde ausführlich dargelegt, wie eine Skalierungsfunktion und die aus ihr abgeleiteten Quadratspiegelfilter einer Multi-Skalen-Repräsentation berechnet werden können und wie ein Signal bei einer Multi-Skalen-Repräsentation mit Wavelets zum Aufbau der Approximations- und Merkmalspyramiden hierarchisch zerlegt und wieder hergestellt werden kann. Der gesamte Algorithmus der Multi-Skalen-Repräsentation mit Wavelets wurde der Einfachheit halber zunächst in einer Dimension beschrieben und dann auf zwei Dimensionen erweitert.

Die neue Methode der digitalen Bildzuordnung mittels Wavelet-Transformation wurde vollständig in Kapitel 3 beschrieben. Ihre Konzeption wurde zunächst charakterisiert und dann im Detail aufgeführt. Für die Multi-Skalen-Repräsentation, die zum Aufbau der Bildpyramiden dient und damit einen hierarchischen Prozeß ermöglicht, wurde das Haar-Wavelet verwendet. Die Ableitung der Quadratspiegelfilter aus den Haar-Wavelets wurde ausführlich beschrieben, wobei auch ihre Eigenschaften diskutiert wurden. Anschließend wurde ein schneller Algorithmus zur Zerlegung und Wiederherstellung eines Bildes vorgestellt. Zur Punktauswahl wurde in neuer Interessensoperator definiert, der auf Grauwertgradienten und Merkmalen der Multi-Skalen-Repräsentation basiert. Es wurde gezeigt, daß die mit diesem Interessensoperator ausgewählten zuzuordnenden Punkte wesentlich im konturstarken Bereich liegen. Schließlich wurde ein Ablaufdiagramm der Bildzuoprdnung gegeben, um die vorgestellte Konzeption zu verdeutlichen.

Kapitel 4 zeigt zwei Anwendungsbeispiele der in Kapitel 3 vorgestellten Bildzuordnungsmethode jeweils auf Luft- und Weltraumbilddaten. Beidemale wurde eine sehr hohe Genauigkeit der Bildzuordnung erreicht. Bei der Anwendung auf Luftbilddaten (OEEPE-Luftbilder) lag die Standardabweichung der y-Parallaxen im Bereich zwischen 3,2 und 3,5 µm bzw. zwischen 0,11 und 0,12 Pixel im Bild. Bei der Anwendung auf Weltraumbilddaten (MOMS-02-Szenen mit 13,5 m Bodenauflösung) lag die Standardabweichung der Parallaxen Pxy im Bereich zwischen 2,16 und 2,26 m im Gelände, entsprechend zwischen 0,16 und 0,17 Pixel im Bild, in einer mit GPS kontrollierten Australien-Szene, 3,42 m im Gelände, entsprechend 0,25 Pixel im Bild, in einer nur über Kartenpunkte 1:50.000 kontrollierten Bolivien-Szene. Im gesamten Bereich der Australien-Szene wurde ein digitales Geländemodell aus 354 x 131 Gitterpunkten mit der Gittergröße von 200 x 200 m² durch die automatische zugeordneten Punkte erzeugt. Seine Höhengenauigkeit, untersucht durch 39 mit GPS gemessenen Paßpunkten, betrug 5,27 m. Diese hohe Genauigkeit bestätigt, daß die in dieser Arbeit entwickelte Bildzuordnungsmethode hoch genaue und zuverlässige Ergebnisse zu liefern vermag. In einem Ausschnitt C der Bolivien-Szene wurde ein hoch auflösendes digitales Geländemodell aus 216 x 233 Gitterpunkten mit einer Gittergröße von 20 x 20 m² erstellt. Aus diesem DGM wurden die Höhenlinien im 20- m-Intervall abgeleitet. Es zeigt sich, daß das DGM die Geländeform recht gut wiedergbit. Auch die Geschwindigkeit der Bildzuordnung ist relativ hoch. Bei den dichten Punktmengen braucht die Bildzuordnung für ein Punktepaar nur knapp 0,2 Sekunden, davon über 80% aber von der Bildzuordnung nach der Methode der kleinsten Quadrate verbraucht wird. Diese Ergebnisse zeigen, daß die in dieser Arbeit entwickelte Bildzuordnungsmethode leistungsfähig ist und erfolgreich angewandt werden kann. Die Genauigkeit der Bildzuordnung kann die Genauigkeit der Messung durch den menschlichen Operateur erreichen.

In dieser Arbeit wurde eine großartige Leistungsfähigkeit der digitalen Bildzuordnung mittels Wavelet-Transformation dargestellt. Es wurde gezeigt, daß sie sowohl bei großmaßstäbigen Luftbilddaten wie auch bei kleinmaßstäbigen Weltraumbilddaten erfolgreich eingesetzt werden kann. Wegen der Vielfalt der abgebildeten Objekte und der damit verbundenen Probleme sollte diese Methode noch weiter entwickelt werden.

Generell wurde in dieser Methode angenommen, daß die abgebildete Objektoberfläche regulär ist, d.h., in dieser Methode wurde keine spezielle Behandlung der Unstetigkeit der Objektoberfläche genommen. Zur Lösung dieses Problems ist es vorzustellen, daß Bruchkanten bzw. Bruchlinien vor der Bildzuordnung extrahiert, dies nicht schwierig sein sollte, da vielfältige Merkmale bei der Multi-Skalen-Repräsentation gegeben wurden, und dann bei der Bildzuordnung berücksichtigt werden. Diese Bruchkanten bzw. Bruchlinien sind auch für DGM-Generierung bzw. für Oberflächenrekonstruktion von großer Bedeutung.

Wegen mangelhafter Grauwertänderung gab es in der Bildzuordnung bei den MOMS-02-Bilddaten noch einige Löcher, in denen kein Punkt zugeordnet wurde. Es ist vorzustellen, daß die Bildzuordnung in solchen Fällen durch „shape from shading” ergänzt werden könnte, wenn es da genügende Schatten gibt.

Weiterhin können geometrische Zusatzbedingungen, z.B. Kollinearitätsbedingung, in den Bildzuordnungsprozeß eingeführt werden. Mit dieser Maßnahme sollte die Genauigkeit und die Zuverlässigkeit der Bildzuordnung weiter gesteigert werden.
 


 
zurück zum Heft-Verzeichnis