Am 16. und 17.4.2024 fand in Lübeck die Konferenz für Anonymisierung zur sicheren Datennutzung „AnoSiDat“ statt. Insbesondere waren hier die Projekte des Forschungsnetzwerks Anonymisierung des Bundesministeriums für Bildung und Forschung aufgerufen, ihre Projektstände zu präsentieren und einem interessiertem Fachpublikum vorzustellen. Organisiert wurde das Treffen vom Unitransferklinikum Lübeck, herzlichen Dank dafür!
Ich hatte das Vergnügen, in dieser Runde Softwaretechnologien vorzustellen, die wir als zentrale Bausteine des AVATAR-Systems zur Bereitstellung von anonymen Forschungsdaten nutzen möchten und mit denen wir als AVATAR-Team der Navimatix GmbH dementsprechend intensiv arbeiten.
Das AVATAR-System soll sich als föderiertes System aus verschiedenen Diensten zusammensetzen. Um einen sinnvollen Ablauf zwischen diesen Diensten zu ermöglichen und den Datenfluss zwischen den Diensten zu realisieren, setzen wir auf eine Modellierung der Prozessabläufe mittels Business Process Modelling Notation (BPMN).
BPMN ermöglicht die Verknüpfung verschiedener „Aufgaben“-Knoten zu einem Gesamtablauf. Dabei besteht die Möglichkeit mit Hilfe von Ereignissen auf unerwartete Situationen, wie z.B. die nicht erfolgte Ausführung einer Aufgabe zu reagieren. Weiterhin lassen sich mittels Variablen Informationen von einer Aufgabe zur nächsten übertragen. Aufgaben können sowohl vollautomatische Durchführungen sein als auch menschliche Aktivitäten repräsentieren.
Mittels einer Process-Engine wie Camunda lassen sich die modellierten Prozesse automatisiert ausführen. Dabei durchlaufen Token nach definierten Regeln die entsprechenden Aufgaben. Automatisierte Aufgaben werden sogenannten „Workern“ gemäß einer definierten Schnittstelle zur Verfügung gestellt. Zur Abfrage der Ergebnisse der vom Nutzer durchzuführenden Aufgaben können Formulare bereitgestellt werden.
Vorteil der Modellierung auf Prozessebene ist die leichtere Abstimmung und Verbesserung der Prozesse durch eine intuitive visuelle Darstellung. Weiterhin bietet die Process-Engine eine klare Schnittstelle zwischen den verschiedenen Diensten, die bilateral zwischen sich bedingenden Diensten über die Variablen weiter ausgestaltet werden kann.
Daten, die im AVATAR-System genutzt werden sollen, sind, wie medizinische Informationen generell, in vielfältigen und verteilten Datenquellen abgelegt. Um diese Informationen zusammenzuführen und einen Konsens zu schaffen auf dessen Grundlage die Daten vertrauensvoll geteilt werden können, nutzen wir das Konzept von Datenräumen. Es wurde ursprünglich vom Fraunhofer ISST zur Verbesserung des Datenaustauschs innerhalb von Zulieferketten entwickelt. Unsere Projektpartner vom Fraunhofer IOSB arbeiten daran, das Konzept für die Energiewirtschaft nutzbar zu machen.
Datenräume stellen das Vertrauen zwischen ihren Teilnehmern her, indem sie einen zentralen Identitätsprüfer bereitstellen, der allen Teilnehmern Zertifikate ausstellt. So können unbekannte Teilnehmer Vertrauen untereinander herstellen und sensible Daten austauschen. Mit der Festlegung einer sogenannten Konnektor-Schnittstelle wird das Datenaustauschformat auf einem sehr hohen Abstrahierungsgrad festgelegt, der aber die Automatisierung des gesamten Datenaustauschprozesses ermöglicht. Daneben können bereitgestellte Daten und andere Dienste bei einem Broker eingetragen und so für Datennutzende auffindbar gemacht werden.
Datenbereitsteller können Richtlinien zur Nutzung ihrer Daten festlegen. Diese formalisierten Richtlinien können automatisiert überprüft werden. Je nach Festlegung ist das schon auf Seiten des Datenbereitstellers oder erst auf der Seite des Datennutzers möglich.
Datenraum-Konnektoren können auch eine Sandbox zur Ausführung von „Apps“ anderer Datenraum-Teilnehmer bereitstellen. Wir möchten prüfen, ob das genutzt werden kann um verteilte Anonymisierungen („multi-party computations“) und föderiertes, also verteiltes, maschinelles Lernen durchzuführen.
Natürlich ist das System nicht auf die Aspekte der Prozessausführung und Datenteilung beschränkt. So gehören unter anderem effiziente Datenbankabfragen durch neue Matchingverfahren und Indizierung und eventuelle Umwandlung verschiedener medizinischer Metadatenmodelle zu den weiteren Themen, die von unseren Partnern im AVATAR-Projekt bearbeitet werden.
Dr. Florian Rasche
Projektleiter