Zuordnung zum Studiengang:  M.Sc. Cyber-Sicherheit
M.Sc. Informatik
Modulverantwortliche: Univ.-Prof. Dr. phil. Michaela Geierhos
Modultyp: Wahlpflicht
Empfohlenes Trimester: 2
Workload: 180 Std.
- davon Präsenzzeit: 72 Std.
- davon Selbststudium: 108 Std.
ECTS-Punkte: 6

 

Zugehörige Lehrveranstaltungen

Nr. Art Veranstaltungsname Teilnahme TWS
11441 Knowledge Discovery Wahlpflicht 3
11442 Methoden der Data Science Wahlpflicht 3
11443 SE Research Topics in Data Science Wahlpflicht 3
11444 Big Data Management Wahlpflicht 3
11445 SE Datenethik und -sicherheit Wahlpflicht 3
11446 P Data Science Praktikum Wahlpflicht 3
Summe (Pflicht und Wahlpflicht) 6

 

Empfohlene Voraussetzungen

Die Studierenden sollen grundlegende Kenntnisse in Programmierung und Software-Entwurf sowie ein Grundverständnis von Algorithmen und Datenstrukturen haben.

 

Qualifikationsziele

Lernziele sind das kompetente Beherrschen grundlegender Verfahren und Methoden sowie ihrer praktischen Anwendung in den unter Inhalte dargestellten Bereichen (siehe nachfolgend).

 

Inhalt

In der Vorlesung „Knowledge Discovery“ geht es um den Umgang mit heterogenen Datenquellen, deren Kategorisierung sowie deren Analyse. Hierfür werden Methoden wie u.a. Visual Analytics/Knowledge sowie Techniken des Discovery & Data Mining und die explorative Datenanalyse unter Zuhilfenahme von KI-Methoden wie z. B. Machine Learning oder Computational Intelligence vorgestellt und in den Übungen praktisch vertieft.

In der Vorlesung „Methoden der Data Science” werden grundlegende Konzepte und Methoden entlang eines Data Science Projektzyklus, von der Formulierung der Problemstellung über die Sammlung, Vorbereitung und Visualisierung der Daten bis hin zur Erkennung von Mustern und Trends in diesen mittels Verfahren des maschinellen Lernens (z. B. Regression, Klassifikation, Clustering) vermittelt. Das erlernte Methodenwissen wird kontinuierlich durch praxisnahe Übungen mit der Programmiersprache Python angewandt und vertieft.

Im Seminar „Research Topics in Data Science“ werden ausgewählte, aktuelle Methoden aus dem Bereich Data Science, Machine Learning und Deep Learning vorgestellt. Das Seminar soll den Studierenden einen Einblick in State-of-the-Art Forschungsthemen geben. Die behandelten Themen orientieren sich am aktuellen Gartner Hyper Cycle for Artificial Intelligence (wie bspw. Decision Intelligence, Responsible AI, Knowledge Graphs) und dem Gartner Hype Cycle for Emerging Technologies (wie bspw. Self-Supervised Learning, Explainable AI, Social Data).

In der Vorlesung „Big DataManagement“ lernen die Studierenden Architekturen kennen, die für die Erfassung, Verarbeitung und Analyse von Big Data konzipiert sind, wofür sich herkömmliche Datenbanksysteme nicht mehr eignen. In diesem Zusammenhang wird nicht nur die verteilte Big-Data-Infrastruktur behandelt, sondern auch Themen wie Datenstrukturierung, Datensynchronisation/Parallelität und Speicherverwaltung in den Fokus gerückt. In der Übung werden erste Erfahrungen mit Big-Data-Architekturen gemacht.

Im Seminar „Datenethik und -sicherheit“ werden u.a. Fragen der Datenethik diskutiert, um einen kritischen und verantwortungsvollen Umgang mit Daten und dem daraus gewonnenen Wissen zu erlernen. Behandelt werden ethische und legale Fragen in Bezug auf AI- und Data Science-Anwendungen, welche einen großen Einfluss auf die Gesellschaft haben (z. B. autonomes Fahren, Social Media Plattformen, Tools zur medizinischen und juristischen Entscheidungsfindung). Ferner lernen die Studierenden, wie man AI- und Data Science-Applikationen kontrolliert anwendet, um der Gesellschaft und individuellen Personen zu nutzen, und möglichen Schaden in Bezug auf Datensicherheit und Datenschutz zu vermeiden. In der Übung soll das Wissen zu ethischen Implikationen genutzt werden, um Strategien und Konzepte für ethische Anwendungen zu entwickeln.

Im „Data Science Praktikum” wird das in der Theorie gelernte Wissen in einem Projekt praktisch implementiert. Die Studierenden werden in Kleingruppen an einem größeren Projekt im Bereich Data Science arbeiten und dies am Ende des Trimesters präsentieren. Das Projekt umfasst dabei einen gesamten Projektzyklus – von der Idee und Konzeption, über die Datensammlung und deren Aufbereitung bis hin zum Tainieren eines Machine Learning-Modells und Auswertung der Ergebnisse. Das Plenum bietet dabei einen regelmäßigen Austausch und Feedback zwischen den Gruppen. Themen der Projekte beziehen sich auf die kennengelernten Forschungsbereiche aus „Research Topics in Data Science“ und „Methoden der Data Science“. Es wird dringend empfohlen einen der o. g. Kurse besucht zu haben.

 

Leistungsnachweis

Das gesamte Modul wird per Notenschein geprüft, mit Anteilen von je 3 ECTS-LP zu jeder der Vorlesungen (mit Übung) und im Modulprojekt. Die Studierenden können (je nach Angebot) entweder zwei Vorlesungen mit Übungen oder eine Vorlesung mit Übung und ein Modulprojekt einbringen – was insgesamt die 6 ECTS-LP des Moduls ergibt.

 

Verwendbarkeit

Die hier erworbenen Kenntnisse und Fertigkeiten ergänzen die Ausbildung im Bereich der Softwaretechnik um einen Aspekt von hoher praktischer Bedeutung. Die Teilnahme an den Lehrveranstaltungen dieses Wahlpflichtmoduls ermöglicht den Studierenden die Übernahme einer Master-Arbeit im Bereich Data Science.

 

Dauer und Häufigkeit

Das Modul dauert 2 bis 3 Trimester und beginnt jedes Jahr im FT.

 

Sonstige Bemerkungen

Die Vorlesungen, Seminare und das Praktikum werden nicht alle jedes Jahr angeboten, aber in jedem Jahr mindestens so viele Lehrveranstaltungen, dass 6 ECTS-Leistungspunkte erreichbar sind. Jeweils zu Beginn des Moduls wird den Studierenden das konkrete Angebot erläutert.