Unser Lehrangebot

Herbsttrimester 2020

Modul 3850: Natural Language Processing

 

Zuordnung zum Studiengang:  M.Sc. Cyber-Sicherheit 2020
Modulverantwortliche: Univ.-Prof. Dr. phil. Michaela Geierhos
Modultyp: Wahlpflicht
Empfohlenes Trimester: 3
Workload: 180 Std.
- davon Präsenzzeit: 72 Std.
- davon Selbststudium: 108 Std.
ECTS-Punkte: 6

 

Zugehörige Lehrveranstaltungen

Nr. Art Veranstaltungsname Teilnahme TWS
38501 Natural Language Processing Pflicht 3
38502 P Praktikum Natural Language Processing Pflicht 3
Summe (Pflicht und Wahlpflicht) 6

 

Inhalt

Die Studierenden lernen die wichtigsten Phänomene in natürlichen Sprachen auf verschiedenen Granularitätsebenen kennen, angefangen bei der Kombination von Lauten bis hin zur Bedeutung von Wörtern, Sätzen und Texten.

Sie erhalten eine Einführung in die wichtigsten symbolischen und statistischen Ansätze des Natural Language Processing (NLP) zur Modellierung dieser Phänomene. Alle theoretischen Themen werden von Übungen begleitet, die sich mit diesen Phänomenen befassen und die ihre Anwendung in praktischen Szenarien demonstrieren, wie z. B. Rechtschreibkorrektur, automatische Vervollständigung, Schlüsselwortextraktion, Themenerkennung, Erkennung von benannten Entitäten (Eigennamen), Relationsextraktion, Synonymerkennung, etc.

Im Praktikum werden die Inhalte der Vorlesung im Rahmen eines exemplarischen NLP-Projekts zur Anwendung gebracht.

 

Leistungsnachweis

Das gesamte Modul wird per Notenschein geprüft, mit Anteilen von je 3 ECTS zur Vorlesung (mit Übung) und zum Praktikum.

 

Dauer und Häufigkeit

Das Modul dauert 2 Trimester und beginnt jedes Jahr im HT.

Modul 3851: Information Retrieval

 

Zuordnung zum Studiengang:  M.Sc. Cyber-Sicherheit 2020
Modulverantwortliche: Univ.-Prof. Dr. phil. Michaela Geierhos
Modultyp: Wahlpflicht
Empfohlenes Trimester: 3
Workload: 180 Std.
- davon Präsenzzeit: 72 Std.
- davon Selbststudium: 108 Std.
ECTS-Punkte: 6

 

Zugehörige Lehrveranstaltungen

Nr. Art Veranstaltungsname Teilnahme TWS
38511 Information Retrieval Pflicht 6
Summe (Pflicht und Wahlpflicht) 6

 

Inhalt

Diese Modul gibt einen Einblick in die wichtigsten Themen des Information Retrieval. Hierfür werden die Grundlagen der wichtigsten Modelle aus dem Bereich des Information Retrieval vermittelt. Außerdem werden Techniken und Verfahren wie z. B. Term-Gewichtungen, Ähnlichkeitsmaße und Rankingmechanismen, Evaluierungsprinzipien, Benutzerinteraktion und Feedbackmechanismen sowie Indexierung und computerlinguistische Hilfsmittel für dem Bereich des Information Retrieval detailliert behandelt.

In der Übung werden theoretische und praktische Fragestellungen gleichermaßen behandelt. Der theoretische Teil dient zur Wiederholung der Vorlesungsinhalte. Im praktischen Teil sind die Studierenden aufgefordert, ausgewählte Verfahren aus dem Information Retrieval eigenständig zu implementieren. Für die Übungen sind Programmierkenntnisse erforderlich.

 

Leistungsnachweis

Schriftliche Prüfung von 60 Minuten oder mündliche Prüfung von 30 Minuten.

 

Dauer und Häufigkeit

Das Modul dauert ein Trimester und beginnt jedes Jahr im HT.

Modul 3852: Anwendungsgebiete der Data Science

 

Zuordnung zum Studiengang:  M.Sc. Cyber-Sicherheit 2020
Modulverantwortliche: Univ.-Prof. Dr. phil. Michaela Geierhos
Modultyp: Wahlpflicht
Empfohlenes Trimester: 3
Workload: 180 Std.
- davon Präsenzzeit: 72 Std.
- davon Selbststudium: 108 Std.
ECTS-Punkte: 6

 

Zugehörige Lehrveranstaltungen

Nr. Art Veranstaltungsname Teilnahme TWS
38521 Sentiment Analysis Wahlpflicht 3
38522 Social Media Mining Wahlpflicht 3
38523 Semantische Technologien Wahlpflicht 3
38524 PRO Modulprojekt Anwendungsgebiete der Data Science Wahlpflicht 3
Summe (Pflicht und Wahlpflicht) 6

 

Inhalt

In der Vorlesung „Sentiment Analysis“ soll die schon umfangreiche Forschungsliteratur zum Opinion Mining aufgearbeitet werden. Dabei reichen die Ansätze von der Text- bis zur Wortebene, die Aufgaben sind das Erkennen von Subjektivität vs. Objektivität, das Bestimmen der Perspektive von Autoren, das Extrahieren ihrer Meinung. Datenquellen können Review-Seiten aus dem Internet sein, Blog-Posts und -kommentare, Nachrichten auf Twitter, gesprochene Sprache, usw.

In der Vorlesung „Social Media Mining“ wird exemplarisch die Entwicklung eines Systems besprochen, welches über soziale Netzwerke direkt oder indirekt an Unternehmen adressierte Meldungen, Nachrichten oder Kommentare erfasst, klassifiziert und auswertet. Hierbei werden Textmining- und Klassifikationsverfahren mit Fokus auf Kurztexten diskutiert und der begleitenden Übung praktisch vertieft.

Die Vorlesung „Semantische Technologien“ gibt einen Einblick in Grundlagen und praktische Anwendungen wissensbasierter Softewarelösung. Sie gibt einen breiten Überblick über den Nutzen und die Möglichkeiten dieser Technologien. Semantische Technologien versetzen uns nicht nur in die Lage, Informationen zu speichern und wiederzufinden, sondern sie gemäß ihrer Bedeutung und Funktion entsprechend auszuwerten, zu verbinden, zu Neuem zu verknüpfen und so flexibel und zielgerichtet anzuwenden.

Im Modulprojekt setzen sich Studierende unter Anleitung selbständig mit Texten und Aufgaben zum Modulthema auseinander und präsentieren ihre Ergebnisse geeignet in mündlicher und/oder schriftlicher Form. Zu Beginn des Modulprojekts werden die geplanten Einzelthemen angekündigt und festgelegt, in welcher Form die Ergebnisse zu präsentieren sind.

 

Leistungsnachweis

Das gesamte Modul wird per Notenschein geprüft, mit Anteilen von je 3 ECTS-LP zu jeder der Vorlesungen (mit Übung) und im Modulprojekt. Die Studierenden können (je nach Angebot) entweder zwei Vorlesungen mit Übungen oder eine Vorlesung mitÜbungen und ein Modulprojekt einbringen – was insgesamt die 6 ECTS-LP des Moduls ergibt.

 

Dauer und Häufigkeit

Das Modul dauert 1-2 Trimester und beginnt jedes Jahr im HT.

 

Sonstige Bemerkungen

Die Vorlesungen und das Praktikum werden nicht alle jedes Jahr angeboten, aber in jedem Jahr mindestens so viele Lehrveranstaltungen, dass 6 ECTS-Leistungspunkte erreichbar sind. Jeweils zu Beginn des Moduls wird den Studierenden das konkrete Angebot erläutert.

Modul 3853: Analyse unstrukturierter Daten

 

Zuordnung zum Studiengang:  M.Sc. Cyber-Sicherheit 2020
Modulverantwortliche: Univ.-Prof. Dr. phil. Michaela Geierhos
Modultyp: Wahlpflicht
Empfohlenes Trimester: 3
Workload: 180 Std.
- davon Präsenzzeit: 72 Std.
- davon Selbststudium: 108 Std.
ECTS-Punkte: 6

 

Zugehörige Lehrveranstaltungen

Nr. Art Veranstaltungsname Teilnahme TWS
38531 Analyse unstrukturierter Daten Pflicht 6
Summe (Pflicht und Wahlpflicht) 6

 

Inhalt

Dieses Modul gibt einen Einblick in die Herausforderungen und Verfahren, die bei der Analyse unstrukturierter Daten zum Einsatz kommen. Unstrukturierte Informationen sind in der Regel sehr textlastig, weshalb viele vorhersagende Analyse-Verfahren den Informationswert dieser Daten nicht nutzen können. Allerdings können textbasierte Medien (E-Mails, Webseiten-Inhalte, Fachartikel, Social Media Beiträge, etc.) u. a. dabei helfen, Trends zu erkennen, Wissen zu gewinnen und Fake News aufzudecken. Hierfür müssen Informationen identifiziert, extrahiert, aufbereitet und interpretiert werden. Die Herausforderung besteht darin, relevante Informationen zu erkennen, aus unstrukturierten Texten zu extrahieren und fehlende Informationen ggf. hinzufügen. In der Veranstaltung werden auch Themen wie die Informationsgewinnung aus unterschiedlichen Quellen sowie Fragen der Qualitätssicherung bei der Datenspeicherung und des Datenmanagements in wissensbasierten Strukturen behandelt.

In der Übung werden theoretische und praktische Fragestellungen gleichermaßen adressiert. Der theoretische Teil dient zur Wiederholung der Vorlesungsinhalte. Im praktischen Teil sind die Studierenden aufgefordert, ausgewählte Verfahren zur Analyse unstrukturierter Daten eigenständig zu implementieren. Für die Übungen sind Programmierkenntnisse erforderlich.

 

Leistungsnachweis

Schriftliche Prüfung von 60 Minuten oder mündliche Prüfung von 30 Minuten.

 

Dauer und Häufigkeit

Das Modul dauert ein Trimester und beginnt jedes Jahr im HT.