Seminar Document Engineering HT 2004

 

Themen

 

1.1 Langzeitarchivierungsaspekte im Dokumentenlebenszyklus

Phasen und Werkzeuge im Dokumentenlebenszyklus

Einfluss auf die Langzeitarchivierung (Wahl der Formate, Anlegen und Weitergeben von Metadaten, Standardisierung)

 

Allgemeine Literatur zum Dokumentenmanagement

z.B. Jürgen Gulbins, Dokumenten-Management, Springer, 2002

Seiten der Anbieter von DMS/Archivierungssystemen (Begriff: ILM - Information Lifecycle Management)

z.B. ECM

 

1.2 Aufbewahrungs- und Dokumentationspflichten

Domänen, in denen diese Pflichten vorkommen (national und international)

Sind technische Anforderungen formuliert? In welcher Form?

Wie könnten techn. Lösungen aussehen (grobe Architektur)

 

Sabine Dauen, Aufbewahrungspflichten, Haufe Verlag, 2004

Seiten der Anbieter von Archivierungssystemen

 

1.3 Betreiber-/Outsourcing-Modelle für Dokumentenmanagement und Archivierung

Szenarien für Anwendung dieser Modelle (privater Auftraggeber/ öffentlicher Auftraggeber)

Welche Leistungen (Infrastruktur, Dienste) sind hierfür geeignet?

Wie sieht der Anbietermarkt aus?

Wie könnte ein Kostenmodell aussehen?

 

Peter Bräutigam, IT-Outsourcing, Schmidt, 2003 (u. ä.)

Heike Koch, Olaf Jöptner, ASP: Mehr als nur Mietsoftware, Hessisches Ministerium für Wirtschaft, Verkehr und Landesentwicklung, 2002

 

2.1 Metadatenmodelle

Metadatenmodelle (DC, LOM, MARC, ...)

Zweck, Syntax, Semantik, Anpassungsmechanismen, Abhängigkeiten von anderen Modellen, Standards

Erstellung einer Synopse (Wahl geeigneter Vergleichseigenschaften)

Was ist wichtig für eine langfristige Reproduktion von Dokumenten?

 

2.2 Extraktion expliziter Metadaten

Welche Metadaten können in wichtigen Dateiformaten (PDF, TIFF, MS-Word, ...) gespeichert werden?

Gibt es Erweiterungsmgölichkeiten?

Werkzeuge zur Analyse und Extraktion (Jhove, file, ...)

Welche Metadaten könnten für die langfristige Reproduktion der Inhalte wichtig sein?

 

www.adobe.com

Handbuch file

hul.harvard.edu/jhove/jhove.html

 

3.1 Methoden zur Analyse natürlichsprachlicher Texte

Darstellung der Grundkonzepte der Methoden

Darstellung der Anwendungszwecke (Rechtschreibprüfung, Generierung von Zusammenfassungen, Generierung semantischer Links, Übersetzungen, ...)

 

Reginald Ferber, Information Retrieval - Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web, dpunkt.verlag, 2003

www.kuenstliche-intelligenz.de/Thema/ServiceText-Mining.htm (Literaturhinweise, Links)

 

3.2 Methoden zur Klassifikation von Dokumenten

Diskussion des Begriffs Klassifikation

Darstellung grundsätzlicher Methoden

Die Rolle von Ontologien im Klassifikationsprozess

Sprachen und Werkzeuge (Topic Maps, RDF, OWL, ...)

Grenzen der Methoden

 

Reginald Ferber, Information Retrieval - Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web, dpunkt.verlag, 2003

www.kuenstliche-intelligenz.de/Thema/ServiceText-Mining.htm (Literaturhinweise, Links)

www.topicmaps.org

www.w3c.org (RDF, OWL)

Ching Kang Cheng, Xiao Shan Pan, Franz Kurfess, Ontology-based Semantic Classification of Unstructured Documents, Department of Civil and Environmental Engineering Stanford University, www.stanford.edu/~xpan/Cheng-Pan-Kurfess-2003.pdf

R. Wilkinson, A. F. Smeaton, Automatic link generation, doi.acm.org/10.1145/345966.346024

A. Macedo and M. Pimentel and J. Guerrero, Latent Semantic Linking over Homogeneous Repositories, portal.acm.org/citation.cfm?id=502209&coll=portal&dl=ACM&ret=1#Fulltext

A. Fentechi, S. Gnesi,G. Lami, A. Maccari, Application of Linguistic Techniques for Use Case Analysis, 10th Anniversary IEEE Joint Int. Conf. on Requirements Engineering, 2002

K. Böhm, G. Heyer, U. Quasthoff, C.Wolff, Topic Map Generation Using Text Mining, J. UCS, 2002

C. Biemann, U. Quasthoff , K. Böhm and C. Wolff, Automatic Discovery and Aggregation of Compound Names for the Use in Knowledge Representations, J. UCS, 2003

www.topicmaps.org

www.w3c.org

 

4.1 Fontmanagement

Einordnung von Schriftarten in Typografie

Darstellung grundsätzlicher Eigenschaften von Schriftarten

Technische Realisierung in Betriebssystemen und wichtigen Dateitypen (auch Grafikformate)

Migrationsrelevante Aspekte (von Betriebssystem zu Betriebssystem, von Dateityp zu Dateityp)

Archivierungsrelevante Aspekte (Reproduktion, Authentizität, Weiterverarbeitung)

 

www.wikipedia.de (Typographie)

www.dante.de (Latex: Metafonts, Font Types ...)

coli.lili.uni-bielefeld.de/~eva/ Textgestaltung/01_Latex_Einfuehrung/einfuehrung.pdf

www.adobe.com (PS, PDF, Distiller)

Handbücher dvips, ps2pdf, sonst. Konvertierungstools, Betriebssysteme (Windows, Unix/Linux, MacOS)

 

4.2 Dynamische Inhalte und Formate

Darstellung der wesentliche Konzepte von XSL

Vergleich mit anderen Methoden: "generisches" Markup (Latex), CSS

Archivierungsrelevante Aspekte

 

www.w3c.org

www.dante.org

Seminar Document Engineering HT 2004 - Prof. Dr. Uwe M. Borghoff

Name Vortrag / Ausarbeitung E-Mail Winf/Inf
Thema
 
Oesterreich Dominik
[pdf] / ---
dominik.oesterreich@unibw-muenchen.de
Inf
1.1
Langzeitarchivierungsaspekte im Dokumentenlebenszyklus 22.11.2004
Aßhauer Alexander alexander.asshauer@unibw-muenchen.de
Winf
1.2
Aufbewahrungs- und Dokumentationspflichten 22.11.2004
Müller Thomas
 
thomas.mueller@unibw-muenchen.de
Winf
1.3
Betreiber-/Outsourcingmodelle für Dokumentenmanagement und Archivierung 22.11.2004
Stahr Jörg
[pdf] / ---
joerg.stahr@unibw-muenchen.de
Winf
2.1
Metadatenmodelle 29.11.2004
Seibert Thomas thomas-armin.seibert@unibw-muenchen.de
Winf
2.2
Extraktion expliziter Metadaten 29.11.2004
Schulz Jörn-Hendrik
 
joern-hendrik.schulz@unibw-muenchen.de
Winf
3.1
Methoden zur Analyse natürlichsprachlicher Texte 06.12.2004
Jung Matthias
 
matthias.jung@unibw-muenchen.de
Winf
3.2
Methoden zur Klassifikation von Dokumenten 06.12.2004
Boehnke Michael
[pdf] / ---
michael.boehnke@unibw-muenchen.de
Winf
4.1
Fontmanagement 13.12.2004
Busch Dennis
[pdf] / ---
dennis.busch@unibw-muenchen.de
Winf
4.2
Dynamische Inhalte und Formate 13.12.2004
Uhrzeit: 13.00 - 16.00
Ort: Geb. 41 BT 400 Raum 2417
Vorbesprechung nach Vereinbarung: ca. 1 Woche vorher (Ausarbeitung und Vortrag sollten dann weitgehend fertig sein)
Ansprechpartner: Peter Rödig, Tel. 2649, Geb. 41 BT 300 Raum 0323, peter.roedig@informatik.unibw-muenchen.de / Themen 3.1 und 3.2 betreut Jan Scheffczyk
Themenbeschreibung und Quellen
Hinweise und Vorlagen zur Erstellung der Ausarbeitung (21.10.2004)