sil

Prof. Dr. Ulf Schmerl

Institut für Mathematik und Theoretische Informatik



                               Forschungsbericht


Prof. U. Schmerl: Forschungsprogramm

Beabsichtigt sind Untersuchungen über Möglichkeiten der Entwicklung einer formalen Sprache, aus deren Ausdrücken natürlichsprachige Texte in mehreren Zielsprachen, z.B. Deutsch, Englisch, Französisch, maschinell erzeugt werden können. Die zu entwickelnde formale Sprache kann somit als Programmiersprache zur Generierung entsprechender Texte aufgefaßt werden. Zu diesem Zweck sollen geeignete Logikformalismen untersucht werden, deren Formeln zur sprachunabhängigen Formalisierung der Information natürlichsprachiger Sätze dienen können. Gedacht ist dabei insbesondere an Systeme der getypten Prädikatenlogik höherer Stufen. Gleichzeitig mit der Untersuchung geeigneter Logikformalismen sind die zugehörigen Synthesealgorithmen zu entwickeln, die eine Liste von Formeln in einen Text der beabsichtigten Zielsprache übersetzen. Im einzelnen sind dazu folgende Arbeiten vorgesehen:
  1. Untersuchung von Logikformalismen, die zur Formalisierung natürlicher Sprache und für das Generierungsproblem geeignet sind. Erste Kandidaten dafür sind:
    • R. Montague's intensionale Typenlogik [1], [2], [3]
    • Kategorialsprachen, vgl. etwa M. Cresswell [4], Bar-Hillel [5], J. Lambek [6] oder J. v. Benthem [7]
    • Modallogiksysteme, z.B. G. Hughes, M. J. Cresswell [8]
    • spezielle Temporallogiksysteme zur Formalisierung zeitlicher Aspekte, z.B. Åqvist u. Guenthner [9]
  2. Konstruktion sprachspezifischer Synthesealgorithmen, die aus formalen Ausdrücken einen natürlichsprachigen Text der betreffenden Sprache erzeugen. Ein wichtiges Kriterium für die Verwendbarkeit der untersuchten Logiksysteme wird die Konstruierbarkeit von Synthesealgorithmen sein.
  3. Abgrenzung natürlicher Sprachfragmente: Da sich nicht jeder Satz in einer der vorgesehenen Zielsprachen durch einen formalen Ausdruck darstellen läßt, sind Sprachfragmente zu untersuchen, bei denen dies möglich ist. Für die Abgrenzung solcher Fragmente ist zu untersuchen
    • welche allgemeinen Sprachkonstrukte in der formalen Sprache ausgedrückt werden können; natürlich sollte das Fragment nicht zu eng sein, um eine einigermaßen flüssige Formulierung von Texten sicherzustellen,
    • welche inhaltlichen Abgrenzungen für ein Fragment vorteilhaft sind. Da wissenschaftlich-technische Spezialgebiete oft nur einen kleinen Teilbereich einer natürlichen Sprache verwenden, kann die Beschränkung auf einen solchen Teilbereich den Entwurf einer passenden formalen Sprache erleichtern. Gute Kandidaten für Gebiete mit kleinem Sprachfragment sind:
      • Wettermeldungen für Seefahrt, Luftfahrt, Landwirtschaft
      • Wartungshandbücher für Maschinen
      • Notams (Notices to airmen), Nachrichten für Seefahrer
      • eventuell mathematische Texte.
  4. Beim Entwurf der formalen Sprache ist auf deren Benutzerfreundlichkeit (Handhabbarkeit, Lesbarkeit) zu achten. Interessant wären deshalb Untersuchungen, ob disambiguierte Sprachfragmente, die leicht automatisch in die eigentliche formale Sprache zu übersetzen sind, als Benutzeroberfläche verwendet werden können.


Vorarbeiten und laufende Projekte

  • eigene Forschungstätigkeit mit Schwerpunkt Mathematische Logik, insbesondere Beweistheorie
  • Diplomarbeiten zum Thema Textgenerierung aus formalen Sprachen an der Universität der Bundeswehr München
  • Forschungskooperation über formale Sprachen zur Textgenerierung mit Prof. Dr. A. Preller, CNRS und Universität Paul Valéry, Montpellier, dazu Gastprofessur in Montpellier August-September 1993 sowie ein Forschungsaufenthalt im September 1996
  • laufendes Dissertationsprojekt:
    B. Buchin: Generierung natürlichsprachiger Texte aus formalen Ausdrücken


Dissertationsthemen

  • Kodierung natürlicher Sprache in Logikformalismen
  • Generierung natürlichsprachiger Texte aus formalen Ausdrücken


Veröffentlichungen

  • U. Schmerl: Herleitungen als Programme: Ihre Kompilation und Interpretation, in: M. Broy (ed.), Mathematik und Informatik, Springer Verlag 1990
  • U. Schmerl: A cut-elimination procedure designed for evaluating proofs as programs, CSL 91, Bern 1991, Springer Lecture Notes in Computer Science 626, S. 316 - 325
  • U. Schmerl: Clause reduction in resolution calculi by Herbrand substitution of depth one, Bericht 9107, Universität der Bundeswehr München 1991
  • U. Schmerl: A resolution calculus giving definite answers, Bericht 9108, Universität der Bundeswehr München, 1991
  • R. Berghammer, B. Elbl, U. Schmerl: Formalizing Dijkstra's Predicate Transformer wp in weak second-order logic, zur Veröffentlichung angenommen in Theoretical Computer Science, Konferenzversion erschienen in: Proc. Rex Workshop ,,Semantics: Foundations and Applications``, Springer Lecture Notes in Computer Science 666, S. 51 - 72


Literatur



1
R. Montague, Universal Grammar, Theoria 36 (1970) 373-398
2
R. Montague, The Proper Treatment of Quantification in Ordinary English, in: Hintikka et a. (eds.): Approaches to Natural Language, Dordrecht 1973,
3
R. Montague, Formal Philosophy. Selected Papers of Richard Montague, R.H.Thomason (ed), New Haven-London 1974
4
M.J. Cresswell, Logic and Languages, London 1973
5
Y. Bar-Hillel, Language and Information, Reading-Mass. 1964
6
J. Lambek, Categorial and Categorical Grammars, in : R.Oehrle et al. (eds.), Categorial Grammars and Natural Language Structures, Dordrecht 1978
7
J. v. Benthem: Language in Action, Amsterdam 1991
8
G. Hughes, M.J. Cresswell, An Introduction to Modal Logic
9
Åqvist u. Guenthner, Fundamentals of a Theory of Verb Aspect and Events within a Setting of an Improved Tense-Logic, in: Studies in Formal Semantics, Amsterdam 1976




B. Buchin: Arbeitsbericht

Ziel meiner Arbeit ist die Generierung natürlichsprachlicher Texte aus formalen Ausdrücken. Dafür muß eine formale Sprache konstruiert werden, deren Ausdrücke sich in Sätze verschiedener natürlicher Sprachen transformieren lassen. Das durch die formale Sprache beschriebene Sprachfragment soll ausreichen, um flüssige mathematische Texte in den Zielsprachen Deutsch, Englisch und Französisch zu generieren.

Es existieren bereits Formalisierungen natürlicher Sprache, die unter verschiedensten Vorgaben entwickelt wurden. Einige von ihnen habe ich in der ersten Phase meiner Arbeit untersucht. Die für unser Vorhaben interessantesten sind R. Montague's Logikformalismus der Intensionalen Typenlogik [1, 2], N. Chomsky's Generative Syntax [3], Arbeiten aus dem Bereich der Kognitionswissenschaft über den ,,Sprachinstinkt`` [4] sowie die Grammatikbeschreibungen einzelner natürlicher Sprachen, wie sie im Duden und Lehrbüchern zu finden sind [5, 6]. Die Kriterien, nach denen ich diese Formalismen untersucht habe, sind ihre Nähe zum natürlichen Sprachgebrauch und die Eindeutigkeit ihrer Ausdrücke. Die Nähe zum natürlichen Sprachgebrauch ist aus zweierlei Aspekten wichtig: zum einen soll die formale Sprache ,,benutzerfreundlich`` sein, zum anderen sollten alle notwendigen Sprachkonstrukte abgedeckt werden. Die Eindeutigkeit der Ausdrücke ist für ihre korrekte Generierung notwendig.

In der zweiten Phase meiner Arbeit habe ich mich mit der Repräsentation und Transformation von formalen Sprachen im Rechner beschäftigt. Diese Problemstellung ist eng mit der Wahl der Programmiersprache verknüpft. Dabei habe ich u. a. ein kleines System in einer funktionalen Programmiersprache implementiert, das die ersten Seiten von O. Forsters Analysis I in die oben aufgeführten natürlichen Sprachen generiert. Die hierbei gewonnenen Erfahrungen fließen in die Konstruktion unserer formalen Sprache ein.

In der jetzigen Phase der Arbeit lege ich die formale Sprache in Form einer kontextfreien Grammatik fest. Hierbei gestaltet sich vor allem die Abwägung zwischen möglicherweise entstehenden Ambiguitäten bei der Generierung und der sprachlichen Vollständigkeit schwierig.



Literatur



1
G. Link, Montague-Grammatik, Die logischen Grundlagen, München 1979
2
R. Montague, H. Schnelle, Universale Grammatik, Braunschweig 1972
3
M. Immler, Generative Syntax - Generative Semantik, München 1974
4
S. Pinker, Der Sprachinstinkt, München 1996
5
G. Drosdowski, Duden, Grammatik der deutschen Gegenwartsprache, Mannheim 1995
6
R. Quirk, S. Greenbaum, A University Grammar of English, London 1973