Entwicklung neuer Methoden für ATC-ICD-Klassifikation

27.02.2020

Eine Analyse der Krankheitslast in Österreich ist nur schwer durchzuführen. Der Grund dafür ist, dass im niedergelassenen Bereich Diagnosen nicht codiert werden – eine Diagnose wird nur dann codiert, wenn sie im Rahmen eines Krankenhausaufenthaltes oder einer Krankschreibung gestellt wurde. Generell werden Diagnosen nicht für eine strukturierte Auswertung gesammelt. Verschriebene Medikamente hingegen werden immer dokumentiert, da dies für die Abrechnung relevant ist.

Um ein (ungefähres) Krankheitsbild der österreichischen Bevölkerung zu erhalten, wurde ein neues Modell entwickelt, welches auf Basis der Krankenhaus- und Krankschreibungsdaten den Zusammenhang zwischen verschriebenen Medikamenten und Diagnosen beschreibt. Dieses Modell soll im nächsten Schritt auf die dokumentierten Medikamente angewandt werden, um somit Rückschlüsse auf wahrscheinliche Erkrankungen dieser PatientInnen zu erhalten.

Dies klingt im ersten Moment trivial, ist es bei genaueren Hinsehen aber nicht. Denn einerseits kann ein Medikament oftmals mehreren Diagnosen zugeordnet werden und umgekehrt. Andererseits spielen persönliche Daten der PatientInnen, wie Alter und Geschlecht, eine Rolle. Auch kann eine Kombination von Medikamenten eine ganz andere Diagnose bedeuten als die Medikamente einzeln betrachtet.

Der beschriebene Zusammenhang zwischen Medikamenten und Diagnosen soll mittels Künstlicher Intelligenz, genauer: einer Methode aus dem Bereich Machine Learning, selbstständig erkannt werden. Grob umschrieben werden dafür die chronologisch sortierten Medikamente und Diagnosen aller Patienten als ein „Satz“ interpretiert und von einer Natural Language Processing (NLP) Methode verarbeitet. Das Ergebnis ist eine Darstellung der Elemente (d.h. der Medikamente und Diagnosen) in einem abstrakten Raum, so dass häufig zusammen vorkommende Elemente nah beieinander stehen. In diesem Raum werden nicht nur ähnliche Medikamente und ähnliche Diagnosen in Cluster sortiert, sondern auch jene Medikamente nah bei den Diagnosen angeordnet, für deren Behandlung sie häufig verwendet werden. Durch ein spezielles Distanzmaß kann somit abgeschätzt werden, welche Diagnosen am besten zu den einzelnen PatientInnen passen.

Die Entwicklung der entsprechenden Methoden sowie die anschließenden Datenanalyse wurden in Kooperation mit dem Dachverband der österreichischen Sozialversicherungen durchgeführt. Eine entsprechende Publikation ist in Vorbereitung und wird gemeinsam mit dem Dachverband veröffentlicht.

Visualisierung der KI-Klassifikation
Visualisierung der KI-Klassifikation