Bessere Dokumentierbarkeit und Reproduzierbarkeit von Datenprozessen

08.10.2020

Die aktuelle COVID-19 Epidemie führt eindrucksvoll vor Augen, dass nachhaltige Datenprozesse (standardisiert, dokumentiert und reproduzierbar) ein absolutes Muss sind um komplexe und vernetzte Systeme analysieren und bewerten zu können und somit deren Herausforderungen zu meistern. Die beiden FFG-geförderten Forschungsprojekte DataPrepHealth und ReproHealth zielen genau auf diese Problematik ab: Datenprozesse dokumentierbar und reproduzierbar zu gestalten. Mit der Abgabe des letzten Zwischenberichtes gehen diese DEXHELPP-Forschungsprojekte in ihr finales Jahr und somit in die Zielgerade.

Das spannendende an diesen Projekten ist ihre gegenseitige Ergänzung. Während sich DataPrepHealth mit der reinen Datenaufbereitung beschäftigt, baut ReproHealth auf den so aufbereiteten und gesäuberten Daten auf. Diese werden genutzt um Prognosen zu treffen oder Entscheidungsfindungsprozesse zu unterstützen. Das Ziel des Gesamtprojekts ist also, zunächst Rohdaten anhand des Prozesses des ersten Projekts aufzubereiten und diese anschließend mithilfe des zweiten Projektes in ein passendes Modell zu gießen. Dieser Vorgang ermöglicht auch eine einheitliche Dokumentation beider Schritte und somit des ganzen Prozesses.

Bei beiden Projekten ist die Reproduzierbarkeit und Dokumentierbarkeit der einzelnen Schritte von zentraler Bedeutung. Außerdem gehen beide Projekte auf die wichtigen, zusätzlichen Anforderungen des Gesundheitssystems (wie z.B. Anonymisierung der Daten) ein.

Die Projekte werden durch den FFG Call "Industrienahe Dissertationen" gefördert und von Melanie Zechmeister (DataPrepHealth) und Nadine Weibrecht (ReproHealth) durchgeführt.

Schematische Darstellung des durch DataPrepHealth und ReproHealth modellierten Datenaubereitungsprozesses
Schematische Darstellung des durch DataPrepHealth und ReproHealth modellierten Datenaubereitungsprozesses