Praktikum Dokumentenbeschreibungssprachen

Praktikum Dokumentenbeschreibungssprachen WT 2005

PD Dr. Lothar Schmitz

Ziel dieses Praktikums ist es, die Techniken und Werkzeuge, die derzeit für das künftige Semantic Web entwickelt werden, zu verstehen, zu erlernen und auf dieser Grundlage in Gruppenarbeit ein eigenes, relativ kleines Projekt zu bearbeiten. Was Sie dabei im Einzelnen für Ihren Schein leisten müssen, den Zeitplan, die behandelten Themen sowie Einstiegspunkte für Ihre eigene Materialsuche finden Sie auf dieser Seite. Die Seite wird während des Praktikums weiter ergänzt. Insbesondere sollen hier auch Ihre Arbeitsergebnisse erscheinen.

Inhalt

  1. Scheinerwerb
  2. Ort und Zeit
  3. Die Vision des Semantic Web
  4. XML-Hintergrund
  5. Techniken, Sprachen, Anwendungen
  6. Eigenes Projekt
  7. Weitere Quellen und Einstiegspunkte

Scheinerwerb

Das Praktikum ist in drei Phasen gegliedert: In der Vorbereitungsphase setzen Sie sich mit der Vision des Semantic Web auseinander und erhalten einen Überblick über die später benötigten Grundlagen aus dem Bereich XML. Darauf folgt die Einarbeitungsphase, in der Sie sich mit Ontologien sowie Sprachen und Werkzeugen zu ihrer Erstellung vertraut machen werden. In der Projektphase bearbeiten Sie schließlich ein eigenes Projekt.
 
Während der drei Phasen arbeiten Sie in wechselnden Gruppierungen zusammen, damit sich das erworbene Know-How gleichmäßig verteilt. Die Einteilung für die Vorbereitungs- und die Projektphase nimmt der Praktikumsleiter vor, die für die Einarbeitungsphase Sie selbst.
 
Zum Scheinerwerb sind neben der aktiven Teilnahme (Fragen, Diskussion) an allen fünf Praktikumsterminen die folgenden schriftlichen und mündlichen Beiträge zu den drei Phasen erforderlich.

  • Vorbereitungsphase: Diese Phase beginnt mit einer Hausaufgabe. Das Thema und die Teilnehmer, mit denen Sie zusammen arbeiten sollen, werden Ihnen per email mitgeteilt. In allen Fällen sollen Sie einen der unter Die Vision des Semantic Web aufgeführten Beiträge gründlich lesen und als Gruppe schriftlich auf deutsch (mit den in der email geforderten Erläuterungen bzw. Überlegungen) wiedergeben. Der Beitrag jedes Bearbeiters (innerhalb der von der Gruppe gemeinsam eingereichten Ausarbeitung) soll zwei Seiten betragen.
     
    Beim ersten Praktikumstermin werden Ihnen vom Praktikumsleiter die Grundlagen der XML-Technologie vorgestellt, die für das Praktikum vorausgesetzt werden. Im Abschnitt XML-Hintergrund finden Sie neben den Vortragsfolien Links auf XML-Einführungen und Tutorien, die zur Vertiefung empfohlen werden. Ein eigener Beitrag hierzu wird nicht verlangt, aber ggfs. selbständige Nacharbeit, wenn Sie später detailliertere Kenntnisse benötigen.

  • Einarbeitungsphase: In dieser Phase geht es darum, die verschiedenen Sprachen und Werkzeuge, die zur Implementierung von SemanticWeb-Anwendungen eingesetzt werden, nebst dem notwendigen theoretischen Hintergrund zu verstehen. Sie arbeiten hier in Gruppen von 2-3 Personen zusammen, wobei der einzelne Teilnehmer im Praktikum ein Teilthema vorträgt, aber Erfahrungen aus dem gesamten Themenkomplex in die nächste Phase mitbringt. Details unter Techniken, Sprachen, Anwendungen.
     
    Die Phase umfasst zwei Praktikumstermine; jeder Teilnehmer trägt in dieser Phase einmal vor. Die Gruppe gestaltet gemeinsam Vortragsserien (i.d.R drei Vorträge), in denen einzelne Vorträge 20 Minuten dauern, 10-12 Folien und eine schriftliche Ausarbeitung von 8-10 Seiten umfassen. Je Vortragsserie sollten 5-10 Minuten Demozeit hinzukommen (Beispiel, Ontologie, Werkzeug, Applikation o.ä.). Einreichungseinheit sind die Materialien zu einer Vortragsserie (als gemeinsames zip-Archiv).

  • Projektphase: In neu zusammengestellten Gruppen soll jeweils Know-how aus den verschiedenen Gruppen der vorigen Phase zusammengebracht werden und zur Bearbeitung eines kleinen Projekts verwendet werden. Details unter Eigenes Projekt
     
    Diese Phase umfasst die beiden letzten Praktikumstermine. Die erste Hälfte der Gruppen berichtet am ersten Termin über das erreichte Gruppenergebnis, die andere Hälfte am letzten Termin. Die Teilprojekte sollen u.a. zu einem Gesamtergebnis integriert werden. Die Anteile der Teilnehmer an Präsentationszeit und schriftlicher Ausarbeitung sollen in dieser Phase insgesamt genauso hoch sein wie in der vorangegangenen Phase. Die Materialien zum Gruppenergebnis sind rechtzeitig (s.u.) vor den jeweiligen Präsentationen einzureichen (ein zip-Archiv je Gruppe).

Damit die Ergebnisse in einem einheitlichen Format erscheinen und die genannten Seitenangaben eindeutig sind, müssen alle schriftlichen Ausarbeitungen in MS Word und alle Vortragsfolien in MS PowerPoint erstellt werden. Vorlagen dazu erhalten Sie vom Praktikumsleiter bei der Aufgabenverteilung per email. Im Sinne der Einheitlichkeit dürfen die Vorlageformate nicht verändert werden. Insbesondere müssen die Folien "schmucklos" und ohne visuelle Effekte (dynamisches Aufblenden der Teile einer Folie) gestaltet sein; Abbildungen sind aber durchaus erwünscht.
 
Als besonders positiv werden Präsentations- und Ausarbeitungsbeiträge gesehen, die erkundete Materialien aus dem Netz (Ontologien, Werkzeuge, Applikationen) (anhand selbst ausprobierter, eigener Beispiele) zur Illustration verwenden. Die Beiträge sollen natürlich nicht nur aus solchen Beispielen bestehen!
 
Die Ergebnisse müssen bis spätestens zum dritten Kalendertag vor dem nächsten Praktikumstermin per email beim Praktikumsleiter eingehen, damit evtl. Verbesserungen noch vor der Präsentation vorgenommen werden können.
 
Um dem Praktikumsleiter die Arbeit zu erleichtern, packen Sie bitte jeweils die Ergebnisse in ein zip-Archiv und verwenden Sie für alle Dateinamen folgendes Format: Nachname-Phase-Inhalt.Dateiendung , wobei Phase für einen der Werte (VOR, EIN, GRP) und Inhalt für eine Angabe wie (Folien, Ausarbeitung, Beispiel) steht.

Zurück zum Anfang

Ort und Zeit

Das Praktikum findet im Electronic Classroom der Fakultät statt. Individueller Zugang zum EC zwecks Installation o.ä. wird voraussichtlich nicht notwendig sein, da Sie alle Materialien frühzeitig (s.o.) beim Praktikumsleiter einreichen. Umfangreichere Installationen nehmen Sie bitte auf eigenen Notebooks vor, die Sie mitbringen. Sollte das nicht möglich sein, treffen Sie mit dem Praktikumsleiter frühzeitig eine geeignete Absprache!
 
Damit verschiedene Jahrgänge und Studiengänge am Praktikum teilnehmen können, findet es an den folgenden fünf Blockterminen statt (Achtung, kurzfristige Änderungen können wegen mil. Veranstaltungen notwendig werden):

  1. Mittwoch, 26. Januar, von 13.00 Uhr bis 18.00 Uhr
  2. Mittwoch, 16. Februar, von 13.00 Uhr bis 18.00 Uhr
  3. Samstag, 19. Februar, von 9.00 Uhr bis 14.00 Uhr
  4. Mittwoch, 9. März, von 13.00 Uhr bis 18.00 Uhr
  5. Mittwoch, 16. März, von 13.00 Uhr bis 18.00 Uhr

Zurück zum Anfang

Die Vision des Semantic Web

Die folgenden Artikel und Buchkapitel stellen die Vision eines SemanticWeb schlaglichtartig dar:

Ergänzend dazu sind folgende Einführungen und Überblicksartikel zum technischen Hintergrund empfehlenswert:

Hier die gesammelten Ausarbeitungen der Vorbereitungsphase (in pdf).

Zurück zum Anfang

XML-Hintergrund

Am ersten Blocktermin werden die relevanten Grundlagen von XML vorgestellt. Dazu die Folien (in pdf):

Ein paar nützliche XML-Links:

Zurück zum Anfang

Techniken, Sprachen, Anwendungen

Die folgenden acht Themenbereiche werden von jeweils einer Gruppe von drei oder zwei Bearbeitern in einer Vortragsserie von einer Stunde vorgestellt. Alle Gruppenteilnehmer arbeiten sich gemeinsam in das Thema ein und regeln die Aufteilung der Vortragsanteile untereinander.

  1. Ontologien (drei Bearbeiter): Hier soll vor allem dargestellt werden, wie man eine Ontologie aufstellt.
    Einschlägige Quellen sind u.a.: Ergebnis als zip-Archiv

  2. RDF und RDFS (drei Bearbeiter):
    Einschlägige Quellen sind u.a.: Ergebnis als zip-Archiv

  3. RSS und FOAF (drei Bearbeiter):
    Einschlägige Quellen sind u.a.: Ergebnis als zip-Archiv

  4. OWL (zwei Bearbeiter):
    Einschlägige Quellen sind u.a.: Ergebnis als zip-Archiv




 
  1. Prote'ge' mit RACER (drei Bearbeiter):
    Einschlägige Quellen sind u.a.: Ergebnis als zip-Archiv

  2. Chimaera (drei Bearbeiter):
    Einschlägige Quellen sind u.a.: Ergebnis als zip-Archiv

  3. Theoretischer Hintergrund (zwei Bearbeiter):
    Einschlägige Quellen sind u.a.:

  4. Anwendungen (drei Bearbeiter):
    Zur Auswahl stehen u.a.: Ergebnis als zip-Archiv

Zurück zum Anfang

Eigenes Projekt

Am Ende des Kapitels 7 über Ontology Engineering des Buchs A Semantic Web Primer von Grigoris Antoniou and Frank van Harmelen wird ein Projekt vorgeschlagen, das 2-3 Bearbeiter ca 2-3 Wochen beschäftigen soll. In der Projektphase orientieren wir uns an dem dort beschriebenen Projektablauf, wobei von den Teams folgende Aufgaben zu bearbeiten sind:

  1. Stellen Sie in OWL eine Ontologie zum genannten Thema auf und ergänzen Sie sie mit passenden Fakten. Verwenden Sie dabei die Werkzeuge Prote'ge' und RACER.

  2. Exportieren Sie die Ontologie von OWL nach RDFS (dabei geht Information verloren) und die zugehörigen Fakten nach RDF.

  3. Definieren Sie über RDF-Anfragen interessante Sichten auf die Daten. Erzeugen Sie entweder über RSS oder allein mit XSLT systematisch verlinkte HTML-Darstellungen dieser Sichten.

Vier Teams bearbeiten parallel mehrere einander ergänzende Teilontologien, für die die Lösungen der Aufgaben 1 und 2 am 9. März vorgestellt werden. Drei andere Teams übernehmen das Zusammenführen der Teilontologien bzw. die Erzeugung der HTML-Ergebnisse. Damit dies alles rechtzeitig vor dem 16. März bearbeitet werden kann, müssen die ersten vier Teams ihre Arbeitsergebnisse frühzeitig den Folgeteams zur Verfügung stellen. Die Übergabe soll daher Ende Februar erfolgen.

Das gemeinsame Rahmenthema ist die Organisation von Fahrradtouren. Je drei Personen (davon je eine aus den Einarbeitungsgruppen Ontologien, OWL/Prote'ge' und RDF/RDFS) sollen die folgenden Teilontologien erarbeiten:

  1. Fahrräder: Fahrräder und ihre Ausrüstungsbestandteile lassen sich offenbar ähnlich klassifizieren wie Weine oder Pizzas. Eventuell können Sie Werkzeuge wie ConvertToRDF nutzen, um Fakten aus im Web vorhandenen Daten zu gewinnen.

    Ergebnis als zip-Archiv
  2. Personen: Das ist ein weites Feld und erfordert eine Einschränkung auf Aspekte, die mit dem Rahmenthema zusammenhängen: Beispielsweise haben Studenten, Selbständige, Angestellte und Arbeitslose unterschiedliche Zeitrestriktionen. Vorzugsweise werden sich Gruppen zu Fahrradtouren zusammenfinden, deren Mitglieder sich kennen - bei Ehepartnern und Freunden kann man dies voraussetzen. Mitfahren kann nur, wer entweder selbst ein Fahrrad besitzt oder sich ein passendes von einem Freund oder Familienmitglied ausleihen kann. Wer zu weit vom Treffpunkt entfernt wohnt oder über kein geeignetes Transportmittel verfügt, kann nicht mitfahren ... Beschränken Sie sich beim Aufstellen der Ontologie auf eine überschaubare Anzahl relevanter Personenarten und Beziehungen! Beispiele für Ontologien (sowohl OWL als auch RDF/S) finden Sie unter den Online-Materialien zum Buch A Semantic Web Primer.

    Ergebnis als zip-Archiv
  3. Touren: Fahrradtouren können sehr unterschiedlicher Art sein:

    • Familientouren, die (fast) jeder mit einem verkehrstauglichen Fahrrad bewältigt.
    • Lange Straßentouren, die gute Kondition und eine geeignete Ausrüstung voraussetzen.
    • Bergtouren, entweder auf der Straße oder auf Pfaden. Auch hier ist eine gute Kondition und Ausrüstung erforderlich. Der Schwierigkeitsgrad wird neben der Streckenlänge vor allem von den zu überwindenden Höhenunterschieden beeinflusst.

    Für die An- und Abreise muss man Start- und Zielort kennen. Genießer werden auf Naturschönheiten, Einkehrmöglichkeiten und Sehenswürdigkeiten Wert legen.

    Ergebnis als zip-Archiv
  4. Erreichbarkeit: Hier geht es um Verbindungen zwischen Orten (Straße, Eisenbahn, Schiff, Seilbahn, etc.) mit Entfernungen, Fahrtdauern, Fahrplänen regelmäßig verkehrender Verkehrsmittel, anfallenden Kosten u.s.w. Untersuchen Sie, ob Sie für die Behandlung von Raum und Zeit passende Ausgangsontologien im Netz finden und ob Sie Werkzeuge wie ConvertToRDF nutzen können, um Fakten aus im Web vorhandenen Daten zu gewinnen.

    Ergebnis als zip-Archiv

Da es uns nicht um die Entwicklung einer vollständigen Anwendung geht, sondern um Erfahrungen mit der Technologie und den Werkzeugen des Semantic Web, sollen die Ontologien nicht alles Denkbare zum Thema erfassen, sondern eher klein gehalten werden, aber die Formulierung interessanter Fragen und Beziehungen zu formulieren gestatten!

Jedes Team hat eine Stunde Präsentationszeit. Als schriftliche Arbeitsegebnisse fallen (je Team!!) an:

  • Die Ontologie und Fakten in OWL.

  • Die Ontologie und Fakten in RDF/S.

  • Ein Arbeitsbericht, der die inhaltlichen Schritte am Beispiel erläutert. Vermeiden Sie "Erlebnisberichte". Es muss nicht jedes Detail beschrieben werden, sondern interessante Konstruktionen, Ergebnisse, Erfahrungen exemplarisch. Beschreiben Sie, wie Sie im Prinzip vorgegangen sind, welche Werkzeuge Sie eingesetzt haben, was sich dabei als nützlich erwies und was weniger nützlich war. Der Beitrag jedes Bearbeiters zum Arbeitsbericht des Teams soll etwa 10 Seiten umfassen.




 
  1. Das Chimeara-Team aus der Einarbeitungsphase erhält den Auftrag, die Teilontologien A-D zusammenzuführen. Präsentationszeit und Arbeitsergebnisse wie gerade beschrieben.

    Ergebnis als zip-Archiv
  2. Die beiden letzten Teams haben jeweils mindestens ein Gruppenmitglied des RSS-Teams aus der Einarbeitungsphase. Sie wählen Ende Februar in Absprache mit dem Praktikumsleiter je eine der Teilontologien A-D aus und generieren aus der RDF-Darstellung werkzeuggestützt verlinkte HTML-Darstellungen (siehe Aufgabe 3 oben). Für die Erzeugung der Sichten schlägt das Buch A Semantic Web Primer vor, eines der Werkzeuge Sesame, KAON oder JENA zu verwenden.

    Ergebnis von Team 6 als zip-Archiv
    Ergebnis von Team 7 als zip-Archiv
Zurück zum Anfang

Der Leitfaden für das Praktikum ist das Buch A Semantic Web Primer von Grigoris Antoniou and Frank van Harmelen. Wichtige Begleitinformationen zum Buchinhalt sind online über diesen Link verfügbar (links unten unter Related Links: Companion Site).

Die offizielle Quelle ist die Semantic Web Homepage des W3.org.

Und die alte SemanticWeb.org (alt) und die neue SemanticWeb.org (im Aufbau) Homepage von SemanticWeb.org.

Zurück zum Anfang




      Seite erstellt am 13. Januar 2005 (zuletzt ergänzt am 14. März 2005) von Dr. Lothar Schmitz