DECRYPT – Entschlüsselung historischer Manuskripte

Ansprechpartner an der Professur: Prof. Dr. Arno Wacker
Projektstart: 01.01.2019, Laufzeit 6 Jahre
Finanzierung:
Swedish Research Council (SRC)
Projektwebseite: https://de-crypt.org/

Für unser kollektives Gedächtnis spielen handgeschriebene historische Aufzeichnungen eine Schlüsselkomponente, ohne die ein Verständnis stark eingeschränkt wäre. Ein besonderer Typ von handgeschriebenen historischen Aufzeichnungen sind verschlüsselte Manuskripte, so genannte Chiffrate (Geheimtexte). Nach Schätzungen von Historikern ist ein Prozent des Materials in Archiven und Bibliotheken verschlüsselt oder kodiert, und viele dieser Dokumente sind immer noch nicht entschlüsselt. Folglich, während ein Schlüsselaspekt unseres kollektiven Gedächtnisses noch immer verborgen ist, bedarf es einer großen Forschungsanstrengung, um sicherzustellen, dass dieses fehlende Wissen ans Licht gebracht und zur Förderung eines tieferen Verständnisses unserer gemeinsamen Geschichte genutzt wird.

Bisher arbeiteten Historiker und Sprachwissenschaftler zumeist individuell und unkoordiniert an der Identifizierung und Entschlüsselung dieser Dokumente. Dies ist ein zeitaufwendiger Prozess, da die Forscher oft ohne Zugang zu automatischen Methoden arbeiten, die die Entschlüsselung unterstützen und beschleunigen können. Zur gleichen Zeit entwickeln Informatiker, Kryptologen und Computerlinguisten automatische Entschlüsselungsalgorithmen zur Identifizierung und Entschlüsselung verschiedener Chiffrentypen ohne Zugang zu echten Geheimtexten zu haben.

Ziel des Projekts ist es, ein neues interdisziplinäres wissenschaftliches Feld der historischen Kryptologie zu etablieren und zwar durch das Zusammenbringen des Fachwissens der verschiedenen Disziplinen für das Sammeln von Daten und den Austausch von Methoden für schnellere Fortschritte beim Entschlüsseln und Kontextualisieren historischer Manuskripte, die bisher in den Archiven und Bibliotheken verborgen sind.

Konkret wird das Projekt zu einer öffentlich zugänglichen Datenbank führen mit tausenden von verschlüsselten Manuskripten und Verschlüsselungsschlüsseln mit Informationen über ihre Herkunft und anderen relevanten Dokumenten. Dem Benutzer der Datenbank wird die Möglichkeit geboten, ein verschlüsseltes Manuskript als Bild hochzuladen und vom System den Text automatisch transkribieren und dekodieren zu lassen. Dies ist zurückzuführen auf Bildverarbeitungs- und Entschlüsselungsalgorithmen, die während des Projekts entwickelt und mit der Datenbank verknüpft werden. Zusätzlich entsteht eine große Sammlung historischer Texte aus verschiedenen Zeitperioden und Sprachmodellen für 15 europäische Sprachen in einem standardisierten Format, das Recherchen und Studien von Sprachvariationen und Veränderungen im Laufe der Zeit ermöglicht.

Durch das Zusammenbringen des Fachwissens der verschiedenen Disziplinen werden historische verschlüsselte Quellen digitalisiert, verarbeitet und entschlüsselt sowie Werkzeuge für die (halb-)automatische Entschlüsselung dieser Manuskripte über einen Webservice bereitgestellt.