shutterstock_674387635_edited_v2.png

NAWI: News-Artikel und Wissen

(2021 – 2024)

Das Ziel von NAWI ist es, dynamisch und in Echtzeit nachrichtliche Narrative aus diversen Nachrichten-Artikeln zu extrahieren. Hierfür werden Methoden der Named Entity Recognition und Relation Extraction genutzt, um sogenannte RDF-Tripel zu erstellen, mit deren Hilfe ein temporaler Wissensgraph erstellt werden soll. Der Graph soll dann dem Endnutzer in einer Web-UI Oberfläche individuell abfragbar und nutzbar gemacht werden.

Aufgaben und Ziele

Täglich werden weltweit Unmengen an News-Artikeln im World Wide Web zur Verfügung gestellt, welche ein immenses Informationspotenzial in sich bergen. Jedoch handelt es sich bei diesen Artikeln um sogenannte unstrukturierte Daten, welche zunächst mithilfe automatischer Verfahren aufbereitet werden müssen, um sinnvolle Informationen extrahieren zu können.

Im Rahmen des Vorhabens sollen zuerst benannte Entitäten wie z. B. Personennamen, Firmenname, Ortsnamen etc. mittels Named Entity Recognition (NER) in den Nachrichten erkannt und extrahiert werden. Zudem müssen mit SpotLight-Detection sogenannte Konzepte in den Meldungen erkannt und extrahiert werden. Zur Erkennung der Konzepte wird auf den DBpedia Knowledge Graphen zurückgegriffen. Die Konzepte und Entitäten sollen dann für den jeweiligen Satz des Nachrichten-Artikels in einen Syntaxbaum überführt werden.

Nach der erfolgreichen Extraktion sollen anschließend Relationen zwischen Entitäten bzw. Konzepten gefunden werden und in Aussagen-Tripel der Form Subjekt – Prädikat – Objekt zusammengeführt werden. Gleichzeitig soll für jedes Tripel immer nachvollziehbar sein, aus welchem Nachrichten-Artikel es stammt.

Final soll untersucht werden, wie die extrahierten Tripel mit einem Knowledge Graphen verknüpft werden können und folglich der Knowledge Graph entsprechend erweitert werden kann. Daraufhin soll zur Steigerung der Transparenz eine Analyse von zeitlichen Änderungen im Knowledge Graph vollzogen werden.

In Hinblick auf die grafische Oberfläche müssen geeignete Visual Analytics-Methoden erprobt werden.

< Zurück zur Übersicht Grafik: Inspiring/Shutterstock