Forschung_Riedl

Datenerfassung im SmartHome

Aktuelle Forschung von Dr. Jasmin Riedl

Datenschutz und Sicherheit für mobile Applikationen

Informationen zum Forschungsprojekt finden Sie unter http://mcir.digital/projects/datsec4app/


Datenerfassung im SmartHome

Dr. Jasmin Riedl und Dr.-Ing. Martin Riedl

Das Projekt analysiert, welche (personenbezogenen und personenbeziehbaren) Daten bei der Nutzung von Smart-Home-Lösungen erfasst werden. Es geht insbesondere um die Unterschiede bei der Datenerhebung zwischen (quell-) offener Hard- und Software einerseits und proprietären Smart-Home-Konfigurationen andererseits. Hierfür wird in einer ersten Projektrunde eine offene Smart-Home-Variante konfiguriert. Ab Januar 2017 kommt eine kommerzielle Variante hinzu.

Das Projekt zielt darauf ab, mögliche Unterschiede zwischen beiden Varianten hinsichtlich Art und Umfang der anfallenden Daten aufzuzeigen und daraus resultierenden Möglichkeiten zur (kriminellen) Weiterverwendung zu klären.

Aktuell ist eine (quell-) offene Smart-Home-Lösung eingerichtet, die kontinuierlich erweitert wird. Es wurden TinkerForge Module, das Heimautomatisierungssystem OpenHAB und das Amazon Sprachassistenzsystem Alexa integriert: TinkerForge Module wurden zur Automation verwendet (bspw. Anbindung von Sensoren für die Raumtemperatur, Feuchtigkeit, Luftdruck oder Aktoren z. B. zur Schaltung von Lampen). TinkerForge erlaubt durch ein sog. OpenHAB Binding eine Verknüpfung mit dem Open-Home-Automation-Bus (OpenHAB). Hierzu ist OpenHAB2 Beta3 auf einem Raspberry Pi2 installiert. Dies ermöglicht es, Sensoren und Aktoren durch eine REST-API anzusprechen, die dem OpenHAB Standard entspricht. Für die Anbindung z. B. von Smart-Home-Produkten an Amazon Alexa werden sogenannte Skills eingebunden. Zur Integration von Alexa und OpenHAB ist AlexaHA installiert. AlexaHA greift auf die REST-API von OpenHAB zu und macht die Smart-Home-Komponenten für Amazon Alexa (über ein Schema und sog. Utterances) zugänglich.



Digitialisierung der Gesetzgebungstätigkeit

Teilautomatisierte Datenextraktion und -transformation der bundesdeutschen Gesetzesmaterialien in eine maschinenlesbare Repräsentation

Dr. Jasmin Riedl und Dr.-Ing. Martin Riedl

Die politikwissenschaftliche Forschung lenkt ihren Blick zunehmend auf Fragen zur Zeitlichkeit politischer Prozesse und Inhalte: Timing, Dauer, Sequenz, Rhythmus oder Intensität entwickeln sich zu relevanten Konzepten der Staatstätigkeitsforschung.

Für die quantitative Analyse der bundesdeutschen Gesetzgebungstätigkeit im Hinblick auf Zeitlichkeit oder sog. politische Eigenzeiten bedarf es jedoch einer maschinenlesbaren Datenbank, die jedes Datum aufführt, das im Rahmen einer Gesetzgebung entsteht. Eine solche Datenbank ist bisher nicht verfügbar.

Das Projekt schließt diese Lücke und extrahiert Daten aus den Übersichten der sog. Gesetzesmaterialien wie sie das Parlamentsarchiv des Deutschen Bundestages (derzeit ab der 8. LP) zur Verfügung stellt:

Die PDF-Übersichten zu den Gesetzesmaterialien werden zunächst auf Layout und Struktur untersucht und in eine Tabellendarstellung (CSV) überführt. Die Tabelleneinträge werden durch spezifische Muster der PDF-Übersichten erneut automatisiert analysiert, ihrer Semantik zugeordnet und in eine strukturierte Darstellung (im JSON-Format) gebracht. Diese Darstellung folgt einem festen Schema, das sich aus dem Datenmaterial ergibt. Durch diesen Vorgang wird jedes einzelne Datum eines Gesetzgebungsprozesses maschinenlesbar und steht für statistische Auswertungen zur Verfügung.