Eingeladener Vortrag des Instituts für Softwaretechnologie


Jan Scheffczyk
International Computer Science Institute, Berkeley

FrameNet: Eine lexikographische Datenbank für Englisch

Dienstag, 21. März 2006


Am International Computer Science Institute in Berkeley wird FrameNet, eine lexikographische Datenbank für Englisch, entwickelt. FrameNet basiert auf der Fillmore'schen Frame Semantik: Ein Frame stellt eine konzeptuelle Situation dar, deren spezifische Beteiligte durch Frame Elemente modelliert werden. Lexical Units binden Worte an Frames und definieren so mögliche Interpretationen dieser Worte, also deren Semantik. Frames sind über zahlreiche Relationen miteinander verbunden. Beispielsweise gibt es eine Vererbungshierarchie oder die Unterteilung eines Szenarios (z.B. Gerichtsprozess) in mehrere Unterszenarios (z.B. Anklage, Plädoyer, Verurteilung etc.). Im Gegensatz zu WordNet bildet FrameNet die Prädikat-Argument Struktur von Sätzen nach. Die über 135.000 handannotierten Beispielsätze stellen somit eine gute Basis für das Training von selbstlernenden Algorithmen im Bereich der künstlichen Intelligenz dar. Diese Algorithmen werden z.B. für Question Answering oder das Zusammenfassen von Texten genutzt.

Der Vortrag gibt zunächst einen Überblick über FrameNet und seine Anwendungsmöglichkeiten. Im zweiten Teil widmet sich der Vortrag der Fragestellung, wie die Qualität der aktuellen FrameNet Version erhöht werden konnte. Hierbei ist es uns gelungen, viele formale Kriterien der Frame Relationen zu erfüllen. Dies hilft Anwendungen, logische Schlussfolgerungen auf Basis der Frame Annotationen zu ziehen. Der dritte Teil des Vortrages beschäftigt sich mit der Kopplung von FrameNet an Ontologien. Dies ermöglicht die Verknüpfung von linguistischer Information in FrameNet mit dem Wissen und Inferenzregeln in Ontologien. Eine konkrete Anwendung ist Question Answering im Bereich Massenvernichtungswaffen und Terrorismus: Das Wissen über terroristische Organisationen, Personen und Aktivitäten ist in Ontologien hinterlegt; die linguistische Analyse von Dokumenten und Fragen geschieht mittels FrameNet.

Mehr Informationen über FrameNet enthält die FrameNet Internet Seite: http://framenet.icsi.berkeley.edu