Organisierte Sitzung

Unangemessene Versorgung mithilfe von GKV-Routinedaten messen – Ergebnisse des Forschungsprojekts „IndiQ“

Unangemessene Versorgung (Überversorgung) zu vermeiden wird angesichts des wachsenden Fachkräftemangels im Gesundheitssektor und der steigenden Gesundheitsausgaben immer wichtiger. Auch aus Patientensicht ist es essentiell, dass die erbrachten Gesundheitsleistungen einen (nachgewiesenen) Nutzen bieten. Internationale Studien und erste Befragungen in Deutschland deuten auf ein hohes Einsparpotential aufgrund von unangemessenen Versorgungsleistungen hin. Die Ansätze zur Messung der Prävalenz dieser Leistungen im deutschen Gesundheitssystem konzentrieren sich jedoch auf spezifische Versorgungsaspekte (wie z.B. bildgebende Verfahren bei Rückenschmerzen) und die externe verpflichtende Qualitätssicherung. Eine umfassende Übersicht über messbare Überversorgung im deutschen Gesundheitssystem fehlt bisher. In dieser Sitzung sollen Ergebnisse des vom Innovationsfonds geförderten Versorgungsforschungsprojektes „Entwicklung eines Tools zur Messung von Indikationsqualität in Routinedaten und Identifikation von Handlungsbedarfen und -strategien (IndiQ)“ vorgestellt werden. Das Projekt zielt darauf ab, erste deutschlandweite und fachgruppenübergreifende Ergebnisse zum Status quo der Überversorgung zu erheben. Dies erfolgt auf Grundlage einer systematischen Suche nach Indikatoren zur Messung von potentiell unangemessener Versorgung (Vortrag 1) und deren anschließender Bewertung durch medizinische Expert*innen mittels eines Delphi-Panels (Vortrag 2). Die 24 im Rahmen des Projektes entwickelten Indikatoren werden auf Basis von GKV-Routinedaten erhoben (Vortrag 3), um mögliche Handlungsbedarfe zu identifizieren und Empfehlungen zur Verbesserung der Versorgung abzuleiten (Vortrag 4).

Vorträge

International herangezogene Indikatoren zur Messung unangemessener Versorgung mithilfe von Routinedaten: Eine systematische Literaturrecherche und Sichtung erforderlicher Daten
Lotte Dammertz, Department of Epidemiology & Health Care Atlas, Central Research Institute for Ambulatory

Einleitung

Hintergrund Ziel dieser Studie ist es, zu untersuchen, wie unangemessene Versorgung mithilfe von Routinedaten gemessen werden kann. Dafür wurden systematisch Indikatoren recherchiert, welche international bereits zur Messung von potentiell unangemessener Versorgung angewendet wurden. Außerdem wurde exploriert und kategorisiert, welche Informationen (deutsche) Routinedaten umfassen müssten, um die identifizierten Indikatoren messen zu können. Methode Die Literaturrecherche wurde am 30. September 2020 in den Datenbanken MEDLINE (via Ovid), EMBASE (via Ovid), PubMed Central (via PubMed), Cochrane Library (via Cochrane) und am 5. Oktober 2020 in Livivo (via Web of Science) durchgeführt. Die folgenden Indikatorspezifischen Informationen wurden aus den einbezogenen Artikeln extrahiert: Definition von Nenner und Zähler, Leistung und Indikation, auf die sich die Maßnahme bezieht, Ausschluss, Art und Quelle der verwendeten Daten, Setting bzw. Sektor der Gesundheitsversorgung, Begründung der Unangemessenheit, Evidenzgrundlage. Im nächsten Schritt wurden die Informationen, die zur Messung der extrahierten Indikatoren erforderlich sind, anhand eines zuvor erstellten Schemas gesichtet und kategorisiert. Dann wurde ermittelt, welche zusätzlichen Daten für eine Messung der Indikatoren in deutschen Routinedaten benötigt würden. Ergebnisse Die Literaturrecherche ergab 10.086 Treffer. 1.056 Artikel kamen für ein Volltextscreening in Frage. Aus 53 eingeschlossenen Artikeln wurden die Indikatoren extrahiert. Alle Indikatoren, die dieselbe unangemessene Versorgung messen, wurden zusammengefasst. Insgesamt wurden 409 Indikatoren extrahiert, welche zu 171 Indikatoren zusammengefasst wurden. Sich wiederholende Kombinationen von Diagnosen und Leistungen wurden aggregiert und Unterschiede in Bezug auf die Patientenpopulation (z. B. Alter oder ausgeschlossene Diagnosen) aufgelistet. Die zusammengefassten Indikatoren verteilen sich auf die Themenbereiche Verordnungen von Arzneimitteln (n=59), Behandlungsleistungen (n=56) und diagnostische Tests (n=46). Die 60 Indikatoren, die sich auf Früherkennungsuntersuchungen beziehen, wurden in 10 Indikatoren zusammengefasst. Insgesamt wurden 42 Indikatoren identifiziert, die als in deutschen Routinedaten potentiell messbar eingestuft werden können. Diskussion Die Studie konnte den aktuellen Stand zur Messung von potentiell unangemessener Gesundheitsversorgung systematisch erfassen und einen Einblick in international bereits eingesetzte Indikatoren geben. Die systematische Sichtung der Indikatoren konnte zeigen, dass eine Erweiterung der Daten (z.B. um eine Verlinkung zwischen Diagnose zu Leistung im ambulanten Sektor oder um detaillierte zeitliche Informationen) die Messung weiterer relevanter Indikatoren ermöglichen würde.

Auswahl von Indikatoren zur Messung potentiell unangemessener Versorgung in GKV-Routinedaten: Ein modifiziertes Delphi-Panel
Carolina Pioch, Fachgebiet Management im Gesundheitswesen, Technische Universität Berlin

Einleitung

Hintergrund und Ziel: Durch die Reduzierung von medizinischen Leistungen mit geringem Nutzen oder sogar potentiellem Schaden für die Patient*innen (unangemessene Versorgung) können die Effizienz des Gesundheitssystems sowie die Behandlungsergebnisse verbessert werden. Ziel war es, Indikatoren zur Messung von unangemessener Versorgung im Gesundheitswesen von medizinischen Expert*innen mithilfe eines Delphi-Panels bzgl. ihrer Messbarkeit in deutschen Routinedaten bewerten zu lassen. Methode: In einer zuvor durchgeführten systematischen Literaturrecherche wurden 42 Indikatoren, die potentiell unangemessene Versorgung abbilden, identifiziert. Für nahezu jeden Indikator wurden zwei Versionen operationalisiert: eine mit höherer Sensitivität und eine mit höherer Spezifität. Die Indikatoren wurden im Rahmen eines dreistufigen Delphi-Panels angelehnt an die RAND/UCLA Appropriateness Methodik bewertet. In der ersten Stufe wurde in einer Umfrage jeder Indikator hinsichtlich seiner Angemessenheit und Messbarkeit in deutschen Routinedaten beurteilt, gefolgt von einer moderierten Online-Diskussion unter den Expert*innen in der zweiten Stufe. Anschließend wurden die Indikatoren gemäß den Kommentaren der Expert*innen angepasst und in der dritten Stufe durch eine zweite Umfrage bezüglich ihrer Messbarkeit bewertet. Ergebnisse: Von 52 kontaktierten medizinischen Fachgesellschaften, Berufsverbänden und kassenärztlichen Vereinigungen wurden 68 Expert*innen, einschließlich Patientenvertreter*innen, nominiert. Es nahmen 62 an dem Delphi-Panel teil. Von insgesamt 42 Indikatoren wurden 27 sensitive und 29 spezifische Definitionen identifiziert und als geeignet bewertet, um unangemessene Versorgung zu messen. Einige dieser Indikatoren waren unter den Expert*innen umstritten und wurden in weiteren Diskussionen überarbeitet. Dies führte zu einem Set von 24 Indikatoren, die das Gebiet der Pharmazeutika (z.B. Opioide bei akuten unspezifischen Rückenschmerzen), diagnostischen Tests (z.B. Tumormarker bei Personen ohne Krebsdiagnose), Screening (z.B. Darmkrebs-Früherkennungsuntersuchung bei älteren Personen) und Therapie (z.B. Husten- und Erkältungsmittel bei Kindern) abdecken. Diskussion: Das Delphi-Panel unterstützte die Auswahl der Indikatoren zur Messung von unangemessener Versorgung in deutschen Routinedaten. Die Expert*innen konnten insbesondere ihre klinische Expertise, Erfahrungen zum Kodierverhalten in der Praxis und ihre Einschätzungen zur relativen Häufigkeit der jeweiligen potentiell unangemessenen Leistung in der Praxis zu dem Entwicklungsprozess der Indikatoren beitragen. Aufgrund mangelnder Kodiergenauigkeit, fehlenden Verknüpfungsmöglichkeiten und weiteren Limitationen der GKV Routinedaten ist die Messbarkeit vieler Indikatoren jedoch stark eingeschränkt.

Prävalenz und Trends unangemessener Versorgungsleistungen in GKV-Routinedaten
Meik Hildebrandt, Fachgebiet Management im Gesundheitswesen, Technische Universität Berlin

Einleitung

Hintergrund und Ziel: Medizinische Leistungen, die keinen Nutzen für Patient*innen aufweisen bzw. deren Potential für Schaden größer ist als der potentielle Nutzen, gelten als unangemessen und nicht indiziert. Die Quantifikation der Prävalenz und Trends unangemessener Versorgung im deutschen Gesundheitswesen kann Handlungsbedarfe aufdecken und somit Interventionsstrategien motivieren, mittels derer die Effizienz des Gesundheitssystems erhöht und potentielle Schäden vermieden werden. Methode: 24 Indikatoren wurden für die Messung nicht indizierter Versorgung in deutschen GKV-Routinedaten operationalisiert und durch medizinische Expert*innen bewertet. Für die Berechnung der Indikatoren wird die Schnittmenge aus als unangemessen klassifizierten Leistungen und zugehörigen Diagnosen, zeitlichen Abhängigkeiten, Altersgrenzen und möglichen weiteren relevanten Leistungen gebildet. Als Datengrundlage dienen die sektorenübergreifenden Abrechnungsdaten der Techniker Krankenkasse von 2018 bis 2021. Falls inhaltlich sinnvoll, wurden die Indikatoren in einer weit gefassten, sensitiven, und einer enger gefassten, spezifischen, Version formuliert. Innerhalb des resultierenden Intervalls kann das Ausmaß der jeweiligen potentiell unangemessenen Versorgungsleistung eingegrenzt werden. Aus der Prävalenz der identifizierten Leistungen können Trends, Schwerpunkte (u.a. Alter und Geschlecht), regionale Variationen, assoziierte Kosten und schlussendlich Handlungsempfehlungen zur Verbesserung der Indikationsqualität abgeleitet werden. Ergebnisse: Sowohl das absolute Ausmaß unangemessener Versorgungsleistungen, als auch die Prävalenz unterscheidet sich zwischen den gemessenen Indikatoren deutlich. Die Indikatoren zu unangemessener Bestimmung der freien Schilddrüsenhormone und Verordnungen von Benzodiazepinen haben mit etwa jeweils 300.000 jährlichen Fällen in der sensitiven Definition die höchste Prävalenz. Die höchsten assoziierten Kosten werden für Chemotherapien im letzten Lebensmonat aufgewendet (ca. 4.5 Mio. Euro p.a.). Die Alters- und geschlechtsspezifischen Anteile unangemessener Versorgung variieren ebenfalls deutlich zwischen den Indikatoren. Diskussion: Unangemessene Versorgung in GKV-Routinedaten zu messen ist mit Limitationen bzgl. der Datenverknüpfung und Datenverfügbarkeit verbunden, und daher nur für eine eingeschränkte Auswahl an Indikatoren möglich. Die Ergebnisse werden in Handlungsempfehlungen übertragen, um mögliche Interventionen zur Reduktion von Überversorgung in Deutschland zu formulieren, etwa um nicht indizierte Laboruntersuchungen bei Schilddrüsenerkrankungen zu minimieren.

Interventionen zur Vermeidung unangemessener Versorgung: Ein systematisches Review zu evidenzbasierter Diagnostik bei Schilddrüsenerkrankungen
Carolina Pioch, Fachgebiet Management im Gesundheitswesen, Technische Universität Berlin

Einleitung

Hintergrund und Ziel: Die Bestimmung der freien Schilddrüsenhormone fT3 und fT4 gilt bei Personen mit (bekannter) Schilddrüsenunterfunktion als potentiell unangemessen. Im Rahmen des Projekts IndiQ werden zwischen 24,8 und 35,5 % aller verordneten Schilddrüsenfunktionstests als unangemessen klassifiziert. Ziel dieses Beitrags ist es, Interventionen zur Reduzierung von unangemessenen Schilddrüsenfunktionstests zu identifizieren. Dabei soll die Effektivität von Verhaltensänderungsinterventionen, Kontextfaktoren, die den Erfolg von Maßnahmen zur Verbesserung der evidenzbasierten Schilddrüsendiagnostik beeinflussen, sowie die theoretischen Grundlagen, die diesen Interventionen zugrunde liegen, untersucht werden. Methode: Um diese Forschungsfragen zu beantworten, wird ein Update eines systematischen Reviews aus dem Jahr 2016 durchgeführt [1] und um die Extraktion der Kontextfaktoren und theoretischen Fundierung der Interventionen ergänzt. Im November 2023 werden folgende Datenbanken umfassend durchsucht: Medline (Ovid), Embase (Ovid), Central (Cochrane) und Scopus. Die Suchstrategie kombiniert Begriffe aus zwei Themen: (1) Schilddrüsenfunktionstests und (2) unangemessene Tests. Die eingeschlossenen Artikel sind auf Deutsch und Englisch beschränkt. Ergebnisse: Die Analyse basiert auf einer bereits bestehenden Typologie von Verhaltensänderungsinterventionen: Aufklärungsmaßnahmen - Entwicklung und Umsetzung von Leitlinien und Protokollen - Änderungen in der Finanzierungspolitik - Erinnerungen an bestehende Leitlinien und Protokolle - Entscheidungshilfen, einschließlich Testanforderungsformularen und computergestützter Entscheidungsunterstützung - Audit und Feedback. Die erste Sichtung der Ergebnisse lässt darauf schließen, dass seit Veröffentlichung des ersten Reviews weitere Interventionen zur Reduzierung von Schilddrüsenfunktionstests evaluiert wurden. Allerdings mangelt es an einer theoretischen Grundlage zur Erklärung der Wirkung ebendieser. Diskussion: Die Reduzierung unangemessener Schilddrüsenfunktionstests kann Ressourcen für indizierte Versorgungsleistungen freisetzen und Kosteneinsparungen im Gesundheitswesen bewirken. Jedoch müssen Interventionen wirksam sein, um Verhaltensänderungen bei Ärzt*innen herbeizuführen und unangemessene Schilddrüsenfunktionstests zu reduzieren. Häufig fehlen Informationen zu der theoretischen Fundierung und zu den Kontextfaktoren, unter denen die Intervention erfolgreich umgesetzt wurde. Daher sind Aussagen zu der Übertragbarkeit der Verhaltensinterventionen in die Praxis nur eingeschränkt möglich. 1. Zhelev Z, Abbott R, Rogers M, et al. Effectiveness of interventions to reduce ordering of thyroid function tests: a systematic review. BMJ Open 2016;6:e010065. doi:10.1136/bmjopen-2015- 010065