Seminar Document Engineering HT 2004

Seminar Document Engineering HT 2004

 

Themen

1.1 Langzeitarchivierungsaspekte im Dokumentenlebenszyklus

Phasen und Werkzeuge im Dokumentenlebenszyklus

Einfluss auf die Langzeitarchivierung (Wahl der Formate, Anlegen und Weitergeben von Metadaten, Standardisierung)

Allgemeine Literatur zum Dokumentenmanagement

z.B. Jürgen Gulbins, Dokumenten-Management, Springer, 2002

Seiten der Anbieter von DMS/Archivierungssystemen (Begriff: ILM - Information Lifecycle Management)

z.B. ECM

1.2 Aufbewahrungs- und Dokumentationspflichten

Domainen, in denen diese Pflichten vorkommen (national und international)

Sind technische Anforderungen formuliert? In welcher Form?

Wie könnten techn. Lösungen aussehen (grobe Architektur)

Sabine Dauen, Aufbewahrungspflichten, Haufe Verlag, 2004

Seiten der Anbieter von Archivierungssystemen

1.3 Betreiber-/Outsourcing-Modelle für Dokumentenmanagement und Archivierung

Szenarien für Anwendung dieser Modelle (privater Auftraggeber/ öffentlicher Auftraggeber)

Welche Leistungen (Infrastruktur, Dienste) sind hierfür geeignet?

Wie sieht der Anbietermarkt aus?

Wie könnte ein Kostenmodell aussehen?

Peter Bräutigam, IT-Outsourcing, Schmidt, 2003 (u. ?.)

Heike Koch, Olaf Jüptner, ASP: Mehr als nur Mietsoftware, Hessisches Ministerium für Wirtschaft, Verkehr und Landesentwicklung, 2002

2.1 Metadatenmodelle

Metadatenmodelle (DC, LOM, MARC, ...)

Zweck, Syntax, Semantik, Anpassungsmechanismen, Abhängigkeiten von anderen Modellen, Standards

Erstellung einer Synopse (Wahl geeigneter Vergleichseigenschaften)

Was ist wichtig für eine langfristige Reproduktion von Dokumenten?

2.2 Extraktion expliziter Metadaten

Welche Metadaten können in wichtigen Dateiformaten (PDF, TIFF, MS-Word, ...) gespeichert werden?

Gibt es Erweiterungsmöglichkeiten?

Werkzeuge zur Analyse und Extraktion (Jhove, file, ...)

Welche Metadaten könnten für die langfristige Reproduktion der Inhalte wichtig sein?

www.adobe.com

Handbuch file

hul.harvard.edu/jhove/jhove.html

3.1 Methoden zur Analyse natürlichsprachlicher Texte

Darstellung der Grundkonzepte der Methoden

Darstellung der Anwendungszwecke (Rechtschreibprüfung, Generierung von Zusammenfassungen, Generierung semantischer Links, übersetzungen, ...)

Reginald Ferber, Information Retrieval - Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web, dpunkt.verlag, 2003

www.kuenstliche-intelligenz.de/Thema/ServiceText-Mining.htm (Literaturhinweise, Links)

3.2 Methoden zur Klassifikation von Dokumenten

Diskussion des Begriffs Klassifikation

Darstellung grundsätzlicher Methoden

Die Rolle von Ontologien im Klassifikationsprozess

Sprachen und Werkzeuge (Topic Maps, RDF, OWL, ...)

Grenzen der Methoden

Reginald Ferber, Information Retrieval - Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web, dpunkt.verlag, 2003

www.kuenstliche-intelligenz.de/Thema/ServiceText-Mining.htm (Literaturhinweise, Links)

www.topicmaps.org

www.w3c.org (RDF, OWL)

Ching Kang Cheng, Xiao Shan Pan, Franz Kurfess, Ontology-based Semantic Classification of Unstructured Documents, Department of Civil and Environmental Engineering Stanford University, www.stanford.edu/~xpan/Cheng-Pan-Kurfess-2003.pdf

R. Wilkinson, A. F. Smeaton, Automatic link generation, doi.acm.org/10.1145/345966.346024

A. Macedo and M. Pimentel and J. Guerrero, Latent Semantic Linking over Homogeneous Repositories, portal.acm.org/citation.cfm?id=502209&coll=portal&dl=ACM&ret=1#Fulltext

A. Fentechi, S. Gnesi,G. Lami, A. Maccari, Application of Linguistic Techniques for Use Case Analysis, 10th Anniversary IEEE Joint Int. Conf. on Requirements Engineering, 2002

K. Böhm, G. Heyer, U. Quasthoff, C.Wolff, Topic Map Generation Using Text Mining, J. UCS, 2002

C. Biemann, U. Quasthoff , K. Böhm and C. Wolff, Automatic Discovery and Aggregation of Compound Names for the Use in Knowledge Representations, J. UCS, 2003

www.topicmaps.org

www.w3c.org

4.1 Fontmanagement

Einordnung von Schriftarten in Typografie

Darstellung grundsätzlicher Eigenschaften von Schriftarten

Technische Realisierung in Betriebssystemen und wichtigen Dateitypen (auch Grafikformate)

Migrationsrelevante Aspekte (von Betriebssystem zu Betriebssystem, von Dateityp zu Dateityp)

Archivierungsrelevante Aspekte (Reproduktion, Authentizität, Weiterverarbeitung)

www.wikipedia.de (Typographie)

www.dante.de (Latex: Metafonts, Font Types ...)

coli.lili.uni-bielefeld.de/~eva/ Textgestaltung/01_Latex_Einfuehrung/einfuehrung.pdf

www.adobe.com (PS, PDF, Distiller)

Handbücher dvips, ps2pdf, sonst. Konvertierungstools, Betriebssysteme (Windows, Unix/Linux, MacOS)

4.2 Dynamische Inhalte und Formate

Darstellung der wesentliche Konzepte von XSL

Vergleich mit anderen Methoden: "generisches" Markup (Latex), CSS

Archivierungsrelevante Aspekte

www.w3c.org

www.dante.org