Unser Lehrangebot

Wintertrimester 2024

Information Retrieval

Diese Lehrveranstaltung gibt einen Einblick in die wichtigsten Themen des Information Retrieval. Hierfür werden die Grundlagen der wichtigsten Modelle aus dem Bereich des Information Retrieval vermittelt. Außerdem werden Techniken und Verfahren wie z. B. Term-Gewichtungen, Ähnlichkeitsmaße und Rankingmechanismen, Evaluierungsprinzipien, User Interaction und Feedbackmechanismen sowie Indexierung und computerlinguistische Hilfsmittel für dem Bereich des Information Retrieval detailliert behandelt.

In der Übung werden theoretische und praktische Fragestellungen gleichermaßen behandelt. Der theoretische Teil dient zur Wiederholung der Vorlesungsinhalte. Im praktischen Teil sind die Studierenden aufgefordert, ausgewählte Verfahren aus dem Information Retrieval eigenständig zu implementieren. Für die Übungen sind Programmierkenntnisse erforderlich.

 

Modulzugehörigkeit:

3851 Information Retrieval

Veranstaltungsart:

Vorlesung (4 TWS) + Übung (2 TWS)

Veranstaltungszeitraum:

t.b.a.

Termine:

t.b.a.

 

Dozierende:

Prof. Dr. Michaela Geierhos (Vorlesung)

Alle aktuellen Informationen finden Sie auf der Lernplattform ILIAS >

Natural Language Processing

In der Veranstaltung Natural Language Processing lernen die Studierenden zunächst die Grundlagen der natürlichen Sprachen kennen, angefangen bei der Kombination von Lauten bis hin zur Bedeutung von Wörtern, Sätzen und Texten. Basierend auf den Grundlagen werden diverse NLP-Anwendungen vorgestellt.

Die Modellierung dieser Anwendungen erfolgt mithilfe statistischer Ansätze als auch Methoden des Machine Learning / Deep Learning. Alle Themen werden von Übungen begleitet, welche die praktischen Szenarien demonstrieren. Grundkenntnisse in Python werden vorausgesetzt.

 

Modulzugehörigkeit:

3850 Natural Language Processing

Veranstaltungsart:

Vorlesung (2 TWS) + Übung (1 TWS)

Veranstaltungszeitraum:

t.b.a.

Termin:

t.b.a.

Dozentin:

Dr. Nina Seemann

Alle aktuellen Informationen finden Sie auf der Lernplattform ILIAS >

Social Media Mining

In der Vorlesung „Social Media Mining“ wird exemplarisch die Entwicklung eines Systems besprochen, welches über soziale Netzwerke direkt oder indirekt an Unternehmen adressierte Meldungen, Nachrichten oder Kommentare erfasst, klassifiziert und auswertet. Hierbei werden Textmining- und Klassifikationsverfahren mit Fokus auf Kurztexten diskutiert und der begleitenden Übung praktisch vertieft.

 

Modulzugehörigkeit:

3852 Anwendungsgebiete der Data Science

Veranstaltungsart:

Vorlesung (2 TWS) + Übung (1 TWS)

Veranstaltungszeitraum:

t.b.a.

Termin:

t.b.a.

Dozierende:

Prof. Dr. Michaela Geierhos (Vorlesung)

Alle aktuellen Informationen finden Sie auf der Lernplattform ILIAS >

Übersicht der angebotenen Module

Modul 1144: Knowledge Discovery in Big Data


Zuordnung zum Studiengang:  M.Sc. Cyber-Sicherheit
M.Sc. Informatik
Modulverantwortliche: Univ.-Prof. Dr. phil. Michaela Geierhos
Modultyp: Wahlpflicht
Empfohlenes Trimester: 2
Workload: 180 Std.
- davon Präsenzzeit: 72 Std.
- davon Selbststudium: 108 Std.
ECTS-Punkte: 6

 

Zugehörige Lehrveranstaltungen

Nr. Art Veranstaltungsname Teilnahme TWS
11441 Knowledge Discovery Wahlpflicht 3
11443 SE Research Topics in Data Science Wahlpflicht 3
11444 Big Data Management Wahlpflicht 3
11446 P Data Science Praktikum Wahlpflicht 3
Summe (Pflicht und Wahlpflicht) 6

 

Empfohlene Voraussetzungen

Die Studierenden sollen grundlegende Kenntnisse in Programmierung und Software-Entwurf sowie ein Grundverständnis von Algorithmen und Datenstrukturen haben.

 

Qualifikationsziele

Lernziele sind das kompetente Beherrschen grundlegender Verfahren und Methoden sowie ihrer praktischen Anwendung in den unter Inhalte dargestellten Bereichen (siehe nachfolgend).

 

Inhalt

In der Vorlesung „Knowledge Discovery“ geht es um den Umgang mit heterogenen Datenquellen, deren Kategorisierung sowie deren Analyse. Hierfür werden Methoden wie u.a. Visual Analytics/Knowledge sowie Techniken des Discovery & Data Mining und die explorative Datenanalyse unter Zuhilfenahme von KI-Methoden wie z. B. Machine Learning oder Computational Intelligence vorgestellt und in den Übungen praktisch vertieft.

Im Seminar „Research Topics in Data Science“ werden ausgewählte, aktuelle Methoden aus dem Bereich Data Science, Machine Learning und Deep Learning vorgestellt. Das Seminar soll den Studierenden einen Einblick in State-of-the-Art Forschungsthemen geben. Die behandelten Themen orientieren sich am aktuellen Gartner Hyper Cycle for Artificial Intelligence (wie bspw. Decision Intelligence, Responsible AI, Knowledge Graphs) und dem Gartner Hype Cycle for Emerging Technologies (wie bspw. Self-Supervised Learning, Explainable AI, Social Data).

In der Vorlesung „Big-Data-Management“ lernen die Studierenden Architekturen kennen, die für die Erfassung, Verarbeitung und Analyse von Big Data konzipiert sind, wofür sich herkömmliche Datenbanksysteme nicht mehr eignen. In diesem Zusammenhang wird nicht nur die verteilte Big-Data-Infrastruktur behandelt, sondern auch Themen wie Datenstrukturierung, Datensynchronisation/Parallelität und Speicherverwaltung in den Fokus gerückt. In der Übung werden erste Erfahrungen mit Big-Data-Architekturen gemacht.

Im „Data Science Praktikum” wir das in der Theorie gelernte Wissen in einem Projekt praktisch implementiert. Die Studierenden werden in Kleingruppen an einem größeren Projekt im Bereich Data Science arbeiten und dies am Ende des Trimesters präsentieren. Das Projekt umfasst dabei einen gesamten Projektzyklus – von der Idee und Konzeption, über die Datensammlung und deren Aufbereitung bis hin zum Tainieren eines Machine Learning-Modells und Auswertung der Ergebnisse. Das Plenum bietet dabei einen regelmäßigen Austausch und Feedback zwischen den Gruppen. Themen der Projekte beziehen sich auf die kennengelernten Forschungsbereiche aus „Research Topics in Data Science“. Es wird dringend empfohlen diesen Kurs zuvor besucht zu haben.

 

Leistungsnachweis

Das gesamte Modul wird per Notenschein geprüft, mit Anteilen von je 3 ECTS-LP zu jeder der Vorlesungen (mit Übung) und im Modulprojekt. Die Studierenden können (je nach Angebot) entweder zwei Vorlesungen mit Übungen oder eine Vorlesung mitÜbungen und ein Modulprojekt einbringen – was insgesamt die 6 ECTS-LP des Moduls ergibt.

 

Verwendbarkeit

Die hier erworbenen Kenntnisse und Fertigkeiten ergänzen die Ausbildung im Bereich der Softwaretechnik um einen Aspekt von hoher praktischer Bedeutung. Die Teilnahme an den Lehrveranstaltungen dieses Wahlpflichtmoduls ermöglicht den Studierenden die Übernahme einer Master-Arbeit im Bereich Data Science.

 

Dauer und Häufigkeit

Das Modul dauert 2 bis 3 Trimester und beginnt jedes Jahr im FT.

 

Sonstige Bemerkungen

Die Vorlesungen, Seminare und das Praktikum werden nicht alle jedes Jahr angeboten, aber in jedem Jahr mindestens so viele Lehrveranstaltungen, dass 6 ECTS-Leistungspunkte erreichbar sind. Jeweils zu Beginn des Moduls wird den Studierenden das konkrete Angebot erläutert.

Modul 3850: Natural Language Processing


Zuordnung zum Studiengang:  M.Sc. Cyber-Sicherheit
M.Sc. Informatik
Modulverantwortliche: Univ.-Prof. Dr. phil. Michaela Geierhos
Modultyp: Wahlpflicht
Empfohlenes Trimester: 4
Workload: 180 Std.
- davon Präsenzzeit: 72 Std.
- davon Selbststudium: 108 Std.
ECTS-Punkte: 6

 

Zugehörige Lehrveranstaltungen

Nr. Art Veranstaltungsname Teilnahme TWS
38501 Natural Language Processing Pflicht 3
38502 P Praktikum Natural Language Processing Pflicht 3
Summe (Pflicht und Wahlpflicht) 6

 

Empfohlene Voraussetzungen

Die Studierenden sollten Grundkenntnisse in Informatik besitzen, insbesondere Erfahrung mit Algorithmen sowie Programmierkenntnisse in Python haben.

 

Qualifikationsziele

Ziel der Lehrveranstaltungen dieses Moduls ist es, die Studierenden mit speziellen Techniken des Natural Language Processing vertraut zu machen. Insbesondere sollen die Studierenden dabei lernen, wie Qualität, Zuverlässigkeit und Leistungsfähigkeit komplexer Sprachmodellle durch Auswahl entsprechender Entwicklungs- und Evaluationsmethoden gewährleistet werden können.

 

Inhalt

Die Studierenden lernen die wichtigsten Phänomene in natürlichen Sprachen auf verschiedenen Granularitätsebenen kennen, angefangen bei der Kombination von Lauten bis hin zur Bedeutung von Wörtern, Sätzen und Texten.

Sie erhalten eine Einführung in die wichtigsten symbolischen und statistischen Ansätze des Natural Language Processing (NLP) zur Modellierung dieser Phänomene. Alle theoretischen Themen werden von Übungen begleitet, die sich mit diesen Phänomenen befassen und die ihre Anwendung in praktischen Szenarien demonstrieren, wie z. B. Rechtschreibkorrektur, automatische Vervollständigung, Schlüsselwortextraktion, Themenerkennung, Erkennung von benannten Entitäten (Eigennamen), Relationsextraktion, Synonymerkennung, etc.

Im Praktikum werden die Inhalte der Vorlesung im Rahmen eines exemplarischen NLP-Projekts zur Anwendung gebracht.

 

Leistungsnachweis

Das gesamte Modul wird per Notenschein geprüft, mit Anteilen von je 3 ECTS zur Vorlesung (mit Übung) und zum Praktikum.

 

Verwendbarkeit

Die Teilnahme an den Lehrveranstaltungen dieses Wahlpflichtmoduls ermöglicht den Studierenden die Übernahme einer Master-Arbeit im Bereich Data Science mit Fokus auf Natural Language Processing.

 

Dauer und Häufigkeit

Das Modul dauert 2 Trimester und beginnt jedes Jahr im WT.

Modul 3851: Information Retrieval


Zuordnung zum Studiengang:  M.Sc. Cyber-Sicherheit
M.Sc. Informatik
Modulverantwortliche: Univ.-Prof. Dr. phil. Michaela Geierhos
Modultyp: Wahlpflicht
Empfohlenes Trimester: 1
Workload: 180 Std.
- davon Präsenzzeit: 72 Std.
- davon Selbststudium: 108 Std.
ECTS-Punkte: 6

 

Zugehörige Lehrveranstaltungen

Nr. Art Veranstaltungsname Teilnahme TWS
38511 Information Retrieval Pflicht 6
Summe (Pflicht und Wahlpflicht) 6

 

Empfohlene Voraussetzungen

Die Studierenden sollen grundlegende Programmierkenntnisse sowie ein Grundverständnis von Algorithmen und Datenstrukturen haben.

 

Qualifikationsziele

Studierende lernen Aufgabenstellung, Modelle und Methoden des Information Retrieval kennen. Dabei soll die Fähigkeit zur Nutzung und zur Mitwirkung bei der Konzeption und Konfiguration von Suchmaschinenlösungen für Web und Enterprise Search vermittelt werden. Darüber hinaus sollen die Vor- und Nachteile der zugrundeliegenden Konzepte und Modelle sowie der verschiedenen Implementierungstechniken verstanden werden.

 

Inhalt

Dieses Modul gibt einen Einblick in die wichtigsten Themen des Information Retrieval. Hierfür werden die Grundlagen der wichtigsten Modelle aus dem Bereich des Information Retrieval vermittelt. Außerdem werden Techniken und Verfahren wie z. B. Term-Gewichtungen, Ähnlichkeitsmaße und Rankingmechanismen, Evaluierungsprinzipien, Benutzerinteraktion und Feedbackmechanismen sowie Indexierung und computerlinguistische Hilfsmittel für dem Bereich des Information Retrieval detailliert behandelt.

In der Übung werden theoretische und praktische Fragestellungen gleichermaßen behandelt. Der theoretische Teil dient zur Wiederholung der Vorlesungsinhalte. Im praktischen Teil sind die Studierenden aufgefordert, ausgewählte Verfahren aus dem Information Retrieval eigenständig zu implementieren. Für die Übungen sind Programmierkenntnisse erforderlich.

 

Leistungsnachweis

Schriftliche Prüfung von 60 Minuten oder mündliche Prüfung von 30 Minuten.

 

Verwendbarkeit

Die Teilnahme an den Lehrveranstaltungen dieses Wahlpflichtmoduls ermöglichen den Studierenden die Übernahme einer Master-Arbeit im Bereich Data Science mit Fokus aus Information Retrieval.

 

Dauer und Häufigkeit

Das Modul dauert ein Trimester und beginnt jedes Jahr im WT.

Modul 3852: Anwendungsgebiete der Data Science


Zuordnung zum Studiengang:  M.Sc. Cyber-Sicherheit
Modulverantwortliche: Univ.-Prof. Dr. phil. Michaela Geierhos
Modultyp: Wahlpflicht
Empfohlenes Trimester: 3
Workload: 180 Std.
- davon Präsenzzeit: 72 Std.
- davon Selbststudium: 108 Std.
ECTS-Punkte: 6

 

Zugehörige Lehrveranstaltungen

Nr. Art Veranstaltungsname Teilnahme TWS
38521 Sentiment Analysis Wahlpflicht 3
38522 Social Media Mining Wahlpflicht 3
38523 Semantische Technologien Wahlpflicht 3
38524 PRO Modulprojekt Anwendungsgebiete der Data Science Wahlpflicht 3
Summe (Pflicht und Wahlpflicht) 6

 

Empfohlene Voraussetzungen

Die Studierenden sollen grundlegende Kenntnisse in Programmierung und Software-Entwurf sowie ein Grundverständnis von Algorithmen und Datenstrukturen haben.

 

Qualifikationsziele

Die Studierenden lernen Herausforderungen und Methoden beim Text Mining kennen und lernen die besprochenen Techniken anzuwenden. Zudem lernen sie theoretische Ansätze auf konkrete, praxisrelevante Fragestellungen zu übertragen. Für exemplarische Aufgabenstellungen können die Studierenden bestehende methodische Ansätze beurteilen und Weiterentwicklungen anregen respektive eigenständig umsetzen. Sie können begründet argumentieren und eine von ihnen selbstständig gefundene Lösung vertreten und reflektiv bewerten.

 

Inhalt

In der Vorlesung „Sentiment Analysis“ soll die schon umfangreiche Forschungsliteratur zum Opinion Mining aufgearbeitet werden. Dabei reichen die Ansätze von der Text- bis zur Wortebene, die Aufgaben sind das Erkennen von Subjektivität vs. Objektivität, das Bestimmen der Perspektive von Autoren, das Extrahieren ihrer Meinung. Datenquellen können Review-Seiten aus dem Internet sein, Blog-Posts und -kommentare, Nachrichten auf Twitter, gesprochene Sprache, usw.

In der Vorlesung „Social Media Mining“ wird exemplarisch die Entwicklung eines Systems besprochen, welches über soziale Netzwerke direkt oder indirekt an Unternehmen adressierte Meldungen, Nachrichten oder Kommentare erfasst, klassifiziert und auswertet. Hierbei werden Textmining- und Klassifikationsverfahren mit Fokus auf Kurztexten diskutiert und der begleitenden Übung praktisch vertieft.

Die Vorlesung „Semantische Technologien“ gibt einen Einblick in Grundlagen und praktische Anwendungen wissensbasierter Softewarelösung. Sie gibt einen breiten Überblick über den Nutzen und die Möglichkeiten dieser Technologien. Semantische Technologien versetzen uns nicht nur in die Lage, Informationen zu speichern und wiederzufinden, sondern sie gemäß ihrer Bedeutung und Funktion entsprechend auszuwerten, zu verbinden, zu Neuem zu verknüpfen und so flexibel und zielgerichtet anzuwenden.

Im Modulprojekt setzen sich Studierende unter Anleitung selbständig mit Texten und Aufgaben zum Modulthema auseinander und präsentieren ihre Ergebnisse geeignet in mündlicher und/oder schriftlicher Form. Zu Beginn des Modulprojekts werden die geplanten Einzelthemen angekündigt und festgelegt, in welcher Form die Ergebnisse zu präsentieren sind.

 

Leistungsnachweis

Das gesamte Modul wird per Notenschein geprüft, mit Anteilen von je 3 ECTS-LP zu jeder der Vorlesungen (mit Übung) und im Modulprojekt. Die Studierenden können (je nach Angebot) entweder zwei Vorlesungen mit Übungen oder eine Vorlesung mitÜbungen und ein Modulprojekt einbringen – was insgesamt die 6 ECTS-LP des Moduls ergibt.

 

Verwendbarkeit

Die hier erworbenen Kenntnisse und Fertigkeiten ergänzen die Ausbildung im Bereich der Softwaretechnik um einen Aspekt von hoher praktischer Bedeutung. Die Teilnahme an den Lehrveranstaltungen dieses Wahlpflichtmoduls ermöglicht den Studierenden die Übernahme einer Master-Arbeit im Bereich Data Science.

 

Dauer und Häufigkeit

Das Modul dauert 1-2 Trimester und beginnt jedes Jahr im HT.

 

Sonstige Bemerkungen

Die Vorlesungen und das Praktikum werden nicht alle jedes Jahr angeboten, aber in jedem Jahr mindestens so viele Lehrveranstaltungen, dass 6 ECTS-Leistungspunkte erreichbar sind. Jeweils zu Beginn des Moduls wird den Studierenden das konkrete Angebot erläutert.

Modul 3853: Analyse unstrukturierter Daten


Zuordnung zum Studiengang:  M.Sc. Cyber-Sicherheit
Modulverantwortliche: Univ.-Prof. Dr. phil. Michaela Geierhos
Modultyp: Wahlpflicht
Empfohlenes Trimester: 3
Workload: 180 Std.
- davon Präsenzzeit: 72 Std.
- davon Selbststudium: 108 Std.
ECTS-Punkte: 6

 

Zugehörige Lehrveranstaltungen

Nr. Art Veranstaltungsname Teilnahme TWS
38531 Analyse unstrukturierter Daten Pflicht 6
Summe (Pflicht und Wahlpflicht) 6

 

Empfohlene Voraussetzungen

Die Studierenden sollen grundlegende Programmierkenntnisse sowie ein Grundverständnis von Algorithmen und Datenstrukturen haben.

 

Qualifikationsziele

Die Studierenden lernen Herausforderungen und Methoden bei der Informationsbeschaffung und -extraktion kennen und lernen die besprochenen Analyse-Methoden anzuwenden. Sie lernen Verfahren der Analyse unstrukturierter Daten auf konkrete, praxisrelevante Fragestellungen (insbesondere im Bereich Wissensgewinnung) anzuwenden und können für exemplarische Aufgabenstellungen existierende Ansätze beurteilen und Weiterentwicklungen anregen respektive eigenständig umsetzen.

 

Inhalt

Dieses Modul gibt einen Einblick in die Herausforderungen und Verfahren, die bei der Analyse unstrukturierter Daten zum Einsatz kommen. Unstrukturierte Informationen sind in der Regel sehr textlastig, weshalb viele vorhersagende Analyse-Verfahren den Informationswert dieser Daten nicht nutzen können. Allerdings können textbasierte Medien (E-Mails, Webseiten-Inhalte, Fachartikel, Social Media Beiträge, etc.) u. a. dabei helfen, Trends zu erkennen, Wissen zu gewinnen und Fake News aufzudecken. Hierfür müssen Informationen identifiziert, extrahiert, aufbereitet und interpretiert werden. Die Herausforderung besteht darin, relevante Informationen zu erkennen, aus unstrukturierten Texten zu extrahieren und fehlende Informationen ggf. hinzufügen. In der Veranstaltung werden auch Themen wie die Informationsgewinnung aus unterschiedlichen Quellen sowie Fragen der Qualitätssicherung bei der Datenspeicherung und des Datenmanagements in wissensbasierten Strukturen behandelt.

In der Übung werden theoretische und praktische Fragestellungen gleichermaßen adressiert. Der theoretische Teil dient zur Wiederholung der Vorlesungsinhalte. Im praktischen Teil sind die Studierenden aufgefordert, ausgewählte Verfahren zur Analyse unstrukturierter Daten eigenständig zu implementieren. Für die Übungen sind Programmierkenntnisse erforderlich.

 

Leistungsnachweis

Schriftliche Prüfung von 60 Minuten oder mündliche Prüfung von 30 Minuten.

 

Verwendbarkeit

Die Teilnahme an den Lehrveranstaltungen dieses Wahlpflichtmoduls ermöglicht den Studierenden die Übernahme einer Master-Arbeit im Bereich Data Science mit Fokus auf die Analyse unstrukturierter Daten.

 

Dauer und Häufigkeit

Das Modul dauert ein Trimester und beginnt jedes Jahr im HT.

Übersicht_Modulangebot_Data_Science.png