close

- 30.10.2025 - 08:23 

Neue Publikation Lehrstuhl Health Economics, Policy and Management

Kernaussage
Positive und unlabeled (PU) Learning-Methoden können genutzt werden, um die Qualität von administrativen Spitaldaten zu verbessern. Ihre Wirksamkeit hängt jedoch stark von der Wahl des Lernansatzes und des Klassifikators ab. Die Ergebnisse eines PU-Lerners können potenziell Spitalvergütungssysteme, das Erlös- und Profitabilitätsmanagement von Spitälern sowie Sensitivitätsanalysen in den Bereichen Gesundheitsmanagement, Gesundheitsökonomie, Versorgungsforschung und Krankheitsüberwachung verbessern.

Hintergrund
Bei PU-Lernproblemen sind nur positive Beispiele gelabelt. Die ungelabelten Daten enthalten sowohl positive als auch negative Beispiele. Studien zeigen, dass positive Beispiele sekundärer Diagnosen und klinischer Zustände – wie Sepsis – in ungelabelten administrativen Krankenhausdaten vorkommen. Dies kann Spitalvergütungssysteme verzerren und sich negativ auf die Erlöse und Profitabilität von Spitälern auswirken.

Methoden
Wir untersuchen, ob PU Learning zur Verbesserung der Qualität administrativer Spitaldaten geeignet ist. Dazu trainieren wir drei Modelle auf 313‘434 Spitalfällen unter Verwendung von Kostendatenmerkmalen: zwei Modelle basieren auf dem zweistufigen „Spy“-Ansatz und eines verwendet eine robuste PU-Learning-Methode. Für die Modellevaluierung stützen wir uns aufgrund der PU-Konstellation ausschließlich auf positive Beispiele. Um die Modellleistung weiter zu überprüfen, führen wir eine externe Validitätsprüfung durch: Wir relabeln ungelabelte Sepsisfälle, leiten neue Sepsisraten ab und vergleichen diese mit den in medizinischen Aktenprüfungen berichteten Sepsisraten.

Ergebnisse
Alle Modelle können richtig positive Beispiele in Testdatensätzen gut identifizieren. Die externen Validitätsprüfungen zeigen jedoch, dass nur der robuste PU-Learner effektiv zwischen richtig positiven und negativen Beispielen in den ungelabelten Daten unterscheidet und neue Sepsisraten liefert, die im Bereich der in medizinischen Aktenprüfungen berichteten Sepsisraten liegen.

Publikation
Vogel, Justus & Cordier, Johannes (2025). Positive and unlabeled learning from hospital administrative data: a novel approach to identify sepsis cases. Health Care Management Science.

Zur Veröffentlichung geht es hier.

north