
Utility Meets Privacy: Beitrag im IEEE Access Journal veröffentlicht
12 März 2025
Der Schutz sensibler Daten war schon immer ein Anliegen und ist mit der zunehmenden Erfassung und Analyse digitaler Daten noch wichtiger geworden. Sensible Informationen werden als Informationen definiert, die zur direkten oder indirekten Identifizierung einer Person verwendet werden können. Gleichzeitig wird die gemeinsame Nutzung von Daten für Analysen, insbesondere maschinelles Lernen, zu einem entscheidenden Aspekt innovativer geschäftlicher und sozialer Anwendungen.
Sensible Daten werden von Regierungen, dem Militär, Geheimdiensten, dem Gesundheitswesen und Industrieorganisationen gesammelt und geschützt. Insbesondere im Gesundheitswesen verspricht das maschinelle Lernen bahnbrechende Vorteile, aber Bedenken hinsichtlich des Datenschutzes stehen der gemeinsamen Nutzung von Daten entgegen und behindern den Fortschritt von Forschern und Industrieexperten.
Synthetische Daten werden daher zunehmend als praktikable Lösung für die Schaffung künstlicher Analoga sensibler Datensätze anerkannt, um den Datenaustausch zu Analysezwecken zu erleichtern, ohne die Privatsphäre zu gefährden oder gegen Datenschutzbestimmungen zu verstoßen. Die Grundvoraussetzung ist, dass synthetische Daten nicht mit realen Personen oder Subjekten übereinstimmen, wodurch das Risiko der Offenlegung sensibler Informationen verringert wird. Um die Nützlichkeit synthetischer Daten zu gewährleisten, muss ihre Leistung bewertet werden, indem ihre Genauigkeit bei bestimmten Analyseaufgaben mit der des realen Datensatzes verglichen wird. Je genauer die Ergebnisse der synthetischen Daten mit denen des realen Datensatzes übereinstimmen, desto größer ist ihr Nutzen. In seiner Studie analysiert Julian Höllig viele Gesundheitsdatensätze und Synthesizer, um groß angelegte, vergleichbare Bewertungsergebnisse zu erhalten. Zudem führt er einen neuartigen Nutzer-Datenschutz-Score ein, welcher ein Datenschutzmaß in die Bewertung integriert und den Kompromiss zwischen beiden quantifiziert.
Mehr zu diesem Beitrag: https://ieeexplore.ieee.org/document/10918632
Bildquelle: AdobeStock/Anatthaphon (Generiert mit KI)