ATC-ICD New Models

Im Jahr 2019 wurde im Projekt ATC-ICD New Models eine neue Methode zur Prävalenzschätzung entwickelt. Im neuen Modell wird Word2Vec, eine Methode aus dem Bereich Machine Learning, verwendet, um den einzelnen Personen Diagnosen zuzuordnen. Es wird ein „Medical Concept Embedding“ erlernt, welches die ATC- und ICD-Codes in einem mehrdimensionalen Raum so anordnet, dass ähnliche Codes nah beieinanderliegen. Als Grundlage werden „Patient Histories“ verwendet, also die abgerechneten Medikamente und Diagnosen der Patienten in chronologischer Reihenfolge, sowie Alter (in 10-Jahres-Gruppen) und Geschlecht. Codes, die häufig gemeinsam in „Patient Histories“ vorkommen, werden somit durch das Modell nah beieinander angeordnet.

Innerhalb dieses Embeddings kann eine Ähnlichkeit zwischen zwei Codes angegeben werden. Diese nimmt einen Wert zwischen -1 und 1 an. Anschließend wird für jede Person aus dieser Ähnlichkeit zu einer ICD-Gruppe ein Zugehörigkeitswert bestimmt. Für die Prävalenzschätzung werden nun für jede ICD-Gruppe die Zugehörigkeitswerte aller Personen summiert.