Home Gesetze & Hintergrundinformationen Gerichtsurteile & -verfahren Hirntod Organspende & Organspender Organempfänger Organhandel Erfahrungsberichte Allg. Informationen Veröffentlichungen Forum Organspende

Veröffentlichung zur Intensivmedizin

Intensiv - Fachzeitschrift für Intensivpflege und Anästhesie
Heft 5, 5. Jahrgang, September 1997, S. 210-212

Thieme Verlag Stuttgart

Score-Systeme für die Intensivmedizin.

Überwindung der Subjektivität des Arztes durch objektive Entscheidungen eines Computerprogramms?

Von Roberto Rotondo, Hamburg

Inhaltsverzeichnis

Zusammenfassung
Aktuelle Diskussion über Score-Systeme für Krankenhäuser
Was sind eigentlich Score-Systeme?
Wie soll sichergestellt werden, dass das Programm misst, was es vorgibt zu messen?
Zweifel und Kritik
Anwendung auch im Individualfall?
Zukünftige Entwicklungen
Literatur

Das RIYADH-Program für Intensivstationen hat in den letzten Wochen für Aufregung gesorgt. In Bremen wurde ein Test gestoppt. Das Programm wird jedoch in Fachkreisen kaum erwähnt. Andere Systeme (z.B. das APACHE-Programm) gelten in Fachkreisen als relativ sicher, und ihre Einführung als Routinediagnostik für Intensivstationen wird von Medizinern gefordert. In Deutschland werden unterschiedliche Score-Systeme (Punktsummensysteme) in der Intensivmedizin schon lange verwendet. Sie werden u.a. vor Hubschraubertransporten, zur Bewertung von Therapiemaßnahmen, zum Erstellen von Effektivitäts- und Qualitätskontrollen, zur Rationalisierung, zum Erstellen von Kosten-/Nutzenanalysen und in den USA zur Triage von Patienten verwendet. Es wird eine quantitative Aussage über den Schweregrad einer Erkrankung, deren Prognose und Verlauf gemacht, um von der subjektiven Sichtweise eines Arztes zu einer objektiven Aussage eines Computers über die Überlebens- bzw. Letalitätsrate von Patientengruppen – aber auch einzelnen Patienten – zu kommen. Die Entwicklung in unserem Gesundheitswesen, der Zwang zum Sparen und entsprechende Entwicklungen im Ausland (USA, Großbritannien) lassen den Schuss zu, dass Score-Systeme zu einem Mittel werden, ganzen Patientengruppen bzw. einzelnen Patienten die für sie notwendige Therapie zu verweigern, da die Chance auf den Erfolg dieser Therapie und deren Kosten den Aufwand übersteigen. Diverse Forschungsarbeiten belegen jedoch, dass diese Systeme nicht das halten, was sie versprechen. Sie sind nicht geeignet, um im Individualfall eine Entscheidung über den Abbruch einer Therapie zu treffen.

Aktuelle Diskussion über Score-Systeme für Krankenhäuser

Das Riyadh Intensiv Care Unit Program (RIP) des Chirurgen René Chang erregte in der letzten Woche Aufsehen. Es gibt vor, den letalen Verlauf einer Erkrankung zuverlässig berechnen zu können und eine Vorhersage über die Kosten einer Behandlung eines Intensivpatienten treffen zu können.¹

Das Programm wird im Bremen Krankenhaus „Links der Weser“, in der Berliner „Charité“ und in der Uniklinik Köln getestet. Auf Anordnung von Gesundheitssenatorin Christine Wischer (SPD) beendete das Bremer Krankenhaus vorerst den Test mit dem RIYADH-Programm. Das Programm ist – zurecht – als „Todescomputer“² bezeichnet worden, da war die Rede vom „virtuellen Todesstoß“.³ Jetzt soll die Anwendung des Programms durch die Ethikkommission der Bremer Ärztekammer geklärt werden.

Weshalb diese jedoch nicht eingeschaltet wurde, bevor das Programm angewendet wurde, bleibt unklar. Außerdem heißt dies auch noch lange nicht, dass das Programm nicht weiter verwendet werden wird. Prof. Kuckelt, Intensivmediziner im Bremer Krankenhaus „Links der Weser“, sieht einer Überprüfung durch die Ethikkommission „gelassen entgegen“⁴.

Erstaunlich ist die Aufregung einzelner Mediziner, z.B. des Präsidenten der Hamburg Ärztekammer , Prof. Montgomery oder von Prof. H. Hoffmann, dem Präsidenten des Verbandes der leitenden Krankenhausärzte Deutschlands. Beide sollen „entsetzt“ reagiert haben⁵. Nun ist es nicht so, dass mich ihr Entsetzten in Erstaunen versetzt hat, sondern, dass sie so schlecht informiert sind. Immerhin hat die Deutsche Gesellschaft für Unfallchirurgie (DGU) schon im Januar 1992 eine „Arbeitsgemeinschaft Scoring“ gegründet, an deren Arbeitssitzungen sich vor allem die Kliniken in Hannover, Celle, München, Essen, Frankfurt und Köln beteiligten. Obendrein hat die DGU ein zentrales Traumaregister errichtet.⁶ Auch ein Blick in die MEDLINE einer gut ausgestatteter medizinischen Bibliothek zeigt, dass es seit 1990 mehrere Hundert Veröffentlichungen allein zu einzelnen Score-Systemen (z.B. APACHE) gibt.

Das RIYADH-Programm ist nur eines unter vielen sogenannten Score-Systemen, die in Deutschland verwendet werden. Das RIYADH-Programm wird unter Medizinern nicht als das qualitativ Beste gehandelt. In der Fachliteratur wird es kaum erwähnt, und es gibt diverse andere Software-Programme, die schon längst Einzug in die Krankenhäuser gefunden haben. Im Unterschied zu anderen Programmen wird beim RIYADH-Programm der tägliche therapeutische Aufwand auf der Basis des Therapeutic Intervention Scoring Systems (TISS) umgewandelt in sogenannte „Cost-Performance-Profile“. Nicht nur der Leistungsaufwand kann somit dokumentiert werden, sondern die Kosten können im Verhältnis zum „Outcome“ bestimmt werden. Der tägliche therapeutische Aufwand wird in Scorewerte (Punktwerte) umgewandelt und in DM umgerechnet. In Köln entsprach 1994 ein TISS-Punkt DM 50⁷. In Verbindung mit dem TISS-Programm können theoretisch mit jedem anderen Software-Programm Kosten-/Nutzenanalysen erstellt werden. Aus diesem Grund ist es sinnvoll, die vermeintlich „besten“ Score-Systeme kritisch zu betrachten.

Was sind eigentlich Score-Systeme?

Score-Systeme wurden entwickelt, um die subjektive Entscheidung eines Arztes durch die „objektive“ Entscheidung eines Computers zu ersetzen.

Die Entwicklung von Score-Systemen begann in den USA.⁸ Score-Systeme sind sogenannte Schweregradklassifikationssysteme oder Punktsummensysteme, die vorgeben, eine quantitative Aussage über den Schweregrad einer Erkrankung, ihrer Prognose und deren Verlauf treffen zu können. Neben dem RIYADH ICU Programm gibt es diverse Softwareprogramme, die jeweils unterschiedlich aufgebaut sind und auch unterschiedlich verwendet werden:

APACHE: Acute Physiology And Chronic Health Evaluation Score;
SAPS: Simplified Acute Physiology Score;
TISS: Therapeutic Intervention Scoring System;
HIS: Hannover Intensiv Score;
KISS: Kombiniertes Intensiv Scoring System;
TS: Trauma Score;
TI: Trauma Index;
HTI: Hospital Trauma Index;
ISS: Injury Severity Score;
AIS: Abbreviated Injury System;
MOFS: Multi-Organ-Failure-Score;
MPI: Mannheimer Peritonitis Index;
GCS: Glasgow Coma Scale.

Das „Beste“ derzeit auf dem Markt befindliche Score-System ist das Acute Physiology And Chronic Health Evaluation-System (APACHE). Es wird mittlerweile in drei verschiedenen Versionen erprobt.

Das APACHE-Programm wird beispielsweise in der Uniklinik Hamburg, in Regensburg, Würzburg, München, Ulm und Hildesheim verwendet. Als hauptsächliches Kriterium wird im APACHE-Programm die Letalität berechnet. Es berechnen also, mit welcher Wahrscheinlichkeit ein Patient versterben wird.

Es gibt bereits diverse Anwendungsschwerpunkte dieser Programme:

Zur Berechnung des Letalitätsrisikos,
Zum Vergleich zwischen Patientengruppen,
Zur Einschätzung der Erkrankungsschwere von Intensivpatienten,
Zur Beurteilung von polytraumatisierten Patienten vor Hubschraubertransporten,
Zur Identifikation von besonders gefährdeten Patienten,
Zur Dokumentation des Leistungsaufwands,
Zur Bewertung der Therapiemaßnahmen,
Zum Erstellen von Effektivitäts- und Qualitätskontrollen,
Zum Erstellen von Risikoprofilen,
Zur Rationalisierung,
Für Wissenschaftliche Untersuchungen, Beispiel: Multicenterstudien,
Zum Erstellen von Kosten--/Nutzenanalysen,
In den USA: zur Triage von Patienten - bezogen auf die Wahl des Transportmittels oder des Versorgungszentrums⁹ und zur Triage bei Massenunfällen, um die Reihenfolge der Primärversorgung festzulegen.¹⁰

Wie soll sichergestellt werden, dass das Programm misst, was es vorgibt zu messen?

Es wird üblicherweise so verfahren, dass einzelnen Parametern (z.B. Temperatur, Herzfrequenz, arterieller Blutdruck, best. Blutwerten, dem neurologischen Status usw.) Punktwerte zugewiesen werden, die dann zu einem Gesamtpunktwert des Scores addiert werden. Im APACHE-II-Score werden Punkte für akut physiologische Parameter, für das Alter, zur Bewertung chronischer Vorerkrankungen und zur Bewertung der Bewusstseinslage (Glasgow Coma Scale, GCS) verteilt. Es wird angenommen, dass eine steigende Punktzahl einen höheren Schweregrad der Erkrankung markiert und somit eine schlechtere Prognose für die Patienten gegeben ist.¹¹

Das APACHE-II Programm vergleicht die Punktwerte der Patienten mit den Daten von 17440 Patienten, die auf den Intensivstationen amerikanischer Kliniken gelegen hatten und errechnet die Letalitätswahrscheinlichkeit.¹² Das APACHE-II Programm wurde an ca. 6000 Intensivpatienten prospektiv validiert.¹³ 1991 wurde das APACHE-III-Programm eingeführt. Diese Version enthält mehr Parameter als die APACHE-II-Version und die Glasgow Coma Scale (GCS) wurde erweitert und modifiziert. Auch diese Version wurde in einer prospektiven Studie an einem großen Patientenkollektiv (ca. 17000 Patienten) validiert. ¹⁴

Die vorhergesagte Qualität eines Scores soll um so besser sein, je größer die Übereinstimmung zwischen geschätzter und eingetretener Letalität ist. Dies wird mittels eines statistischen Verfahrens, der Receiver-Operating Charakteristics Analysis (ROC) versucht. Die sogenannte „Sensitivität“ (= die Eignung, das Versterben während des Krankenhausaufenthalts richtig vorherzusagen) und die sogenannte „Spezifität“ (= Eignung, bei denen, die versterben, nicht das Überleben vorherzusagen) werden statistisch berechnet und können dann graphisch dargestellt werden. Die ROC-Analysen werden sogar „zum >golden standard< der Beschreibung von Scoresystemen“ erklärt.¹⁵

Zweifel und Kritik

Aus vielerlei Gründen sind Zweifel an den Programmen angebracht. Zwar suggeriert die große Anzahl von Patientendaten, mit denen das APACHE-Programm die aktuellen Daten eines Patientenkollektivs oder einzelner Patienten abgleicht, dass hier große Objektivität vorhanden zu sein scheint. Aber es gibt Forschungsergebnisse, die an der verbesserten Objektivität des Computerprogramms gegenüber der subjektiven Entscheidung eines Menschen - dem Arzt - Bedenken zulassen.

Beispielsweise haben Patienten überlebt, bei denen ein 100%iges Sterberisiko - nach entsprechend hohem Scorewert - prognostiziert wurde.¹⁶ Außerdem müssen bestimmte Werte (z.B. GCS oder Blutdruck) im APACHE-Programm von Menschen erhoben werden, was mit Fehlern behaftet sein kann. Ein weiteres Problem in der Anwendung von Score-Systemen besteht im hohen Dokumentationsaufwand und im Fehlen des nötigen Engagements bei der Dokumentation.¹⁷

Ein wesentlich gravierenderes Problem speziell des APACHE-Scores stellt meiner Ansicht nach die Glasgow Coma Skala dar. Die neurologische Beurteilung von Patienten, die aufgrund ihrer Grunderkrankung (z.B. kranielle Verletzung) dauernd sediert werden müssen, ist problematisch. Bei diesen Patienten wird der Grad der Bewusstseinsstörung geschätzt, wie er ohne sedierende Maßnahmen zu vermuten wäre.¹⁸ Dies verdeutlicht die Unsicherheit des Programms, weil hier der Mensch die entscheidende Rolle bei der Beurteilung spielt. Wie hoch die Fehlerwerte sind, wenn Ärzte, die mit der GCS vertraut sind, eine Prognose abgeben, belegt eine Dissertation von A. Weikenmeier von 1995¹⁹. Zur prognostischen Wertigkeit von Koma-Skalen bei Schädel-Hirn-Verletzten wurden die Glasgow Coma Skala und die Brüssler Coma Skala mit anderen neuen Skalen verglichen. Die höchste Korrektheit bezogen auf die Prognose richtig vorausgesagter Tod betrug bei der Glasgow Coma Skala nur 86%.²⁰ Die höchste Korrektheit bezogen auf die Prognose richtig vorausgesagtes Überleben betrug bei der Glasgow Coma Skala etwa 72%.²¹ Diese doch sehr hohen Fehlerquoten gehen natürlich auch in den APACHE-II- bzw. -III-Score mit ein.

Ein weiteres Beispiel, dass meiner Ansicht nach sehr gut herausstellt, dass das APACHE-Programm unsicher ist, ist in der Dissertation von H. Schröter von 1993 dokumentiert. „Am 2. Tag zeigte der - eigentlich für die ersten 24 Stunden konzipierte - APACHE-II seine größte Aussagekraft und Trennschärfe, vom 4. Tag an fällt die Aussagekraft bis unter die Zufallswahrscheinlichkeit, der APACHE-II liefert folglich von diesem Zeitpunkt an keine prognostisch verwertbaren Informationen mehr.“²²

Und auch Prof. Schuster aus dem Städtischen Krankenhaus Hildesheim, Lehrkrankenhaus der Medizinischen Hochschule Hannover, stellt in einem Artikel der Zeitschrift „Der Internist“ heraus, dass „Aussagen zur Letalität, die sich auf Punktwerte aus Schweregradscores beziehen, [...] eher verwirrend und weitgehend manipulierbar [sind].“²³

Trotz der oben erwähnten Mängel des APACHE-Programms werden seine Vorzüge hervorgehoben und in den schon erwähnten Kliniken benutzt. Im Ausland werden sie schon sehr häufig verwendet. In den USA wurde schon 1994 in 400 Kliniken das APACHE-Programm zum Softwarestückpreis von damals 650 000 Dollar verwendet.²⁴ Und auch in über 50 britischen Kliniken vertrauen die Mediziner der Computersoftware (RIYADH).²⁵^,²⁶

Anwendung auch im Individualfall?

Es kann nicht bestritten werden, dass das APACHE-II- und auch das APACHE-III-Programm - wie auch andere - für den Individualfall verwendet werden oder zukünftig Anwendung finden sollen.²⁷

Eine Entscheidung auf Therapieabbruch oder Nichteinsatz von Intensivmedizin im Individualfall auf der Basis eines Computerprogramms, ist jedoch - aus vielerlei Gründen - sehr fragwürdig. Selbst in den Reihen der Anwender ist man sich relativ einig, dass Scores-Systeme für den Einzelfall mit einer so hohen Unsicherheit behaftet sind, dass sie als Entscheidungsgrundlage für den individuellen Patienten nicht einsetzbar sind.²⁸

Es ist interessant, dass selbst die Anwender des Programms einer individuellen Prognose eher skeptisch oder ablehnend gegenüberstehen, womit das Hauptanwendungsfeld dieser Programme wegfallen würde und gleichzeitig die Frage auftaucht, welchen Sinn Gruppenvergleiche zwischen Patientenkollektiven machen sollen. Therapieabbruch für ganze Patientengruppen (z.B. HIV), obwohl dies im Einzelfall bedeuten kann, dass Patienten versterben, die eine reelle Chance auf ein Überleben hatten? Ausschluss bestimmter Patientengruppen von medizinischen Leistungen, wenn die Computerprognose zu schlecht ausfällt?

Zukünftige Entwicklungen

In den mir bekannten Fachartikeln fordern die Anwender der Computerprogramme, trotz ihrer Zweifel am Einsatz der Score-Systeme für den Individualfall, ihre Einführung als Routinediagnostik für Intensivstationen. Nun frage ich mich, ob dies in der Hauptsache zum Wohl der Patienten geschehen soll. Schon 1994 stellten E. Neugebauer & B. Bouillon in einem Artikel der Fachzeitschrift „Der Unfallchirurg“ heraus, dass in den USA Score-Systeme zur Triage für die Verlegung oder Nichtverlegung eines Patienten von der Normal- auf die Intensivstation genutzt wurden. Ein Patient, der ein „Sterberisiko“ von <10% hatte, wurde aus „ökonomischen Gründen“ nicht auf die Intensivstation verlegt. Sie sahen schon damals die „Gefahr“, dass „ökonomische Zwänge auch in Deutschland relevant werden“ könnten.²⁹ Angesichts der Entwicklungen in unserem Gesundheitswesen (z.B. Budgetierung der Krankenhäuser) muss sich meiner Einschätzung nach jeder Anwender der Score-Systeme, der heute noch der Meinung ist, dass hier nur im Sinne des Patienten gehandelt wird, fragen lassen, ob Naivität, Eigeninteresse, Verdrängung oder Absicht hinter dieser „Selbst-Täuschung“ steht. Möglicherweise werden ärztliche Entscheidungen schneller als manchem lieb sein werden, nicht mehr nach dem Stand der medizinischen Möglichkeiten oder moralischen und ethischen Werten bzw. Normen getroffen.

Prof. Röse von der Otto-Guericke-Universität Magdeburg stellte 1996 in der Zeitschrift „Intensiv“ die Frage: „Intensivmedizin – Hilfe zum Leben um jeden Preis? (...) nein! Wer aber stellt den Maßstab, bildet das Preisgericht?“ Er kommt zu dem Schluss, dass der Patient dies sein wird.

Ich bin anderer Meinung. Wenn Krankenhäuser mit dem APACHE-, dem RIYADH-Programm oder einem anderem Score-System ausgerüstet werden, dann wird zukünftig der Computer den Maßstab, das „Preisgericht“ bilden. Finanzielle Aspekte werden dazu führen, dass Score-Systeme die Beurteilung der Prognose einzelner Patienten und auch von Patientenkollektiven übernehmen werden. Auch die weitere Entscheidung über den Beginn und den Abbruch einer Behandlung oder der Verlegung eines Patienten werden dann vom Computer getroffen. Für manchen Patienten wird das „Urteil“ des Computers tödlich enden, obwohl eine Überlebenschance gegeben war, weil diese Programme eine individuelle Prognose der Letalität nicht zulassen.

Den besten Schutz für die Patienten stellt demnach die Abschaffung dieser Programme (siehe Bremen) und ein generelles Verbot dieser Programme dar.

Dipl. Psych. Roberto Rotondo

Rappstr.9

20146 Hamburg

Ein Link zum Vortrag "Patienteneinschätzung - Score-Systeme"

zurück zum Anfang

Literatur

1Chang, R., D. Bihari: Outcome prediction for the individual patient in the ICU. Der Unfallchirurg 97 (1994) 199-204

2Frankfurter Rundschau: 1. März 1997. S. 26

3Ebd. S. 3

4Hamburger Abendblatt vom 1./2. März 1997; Nr. 51, S. 3.

5Hamburger Morgenpost. 28.2.97, S. 20 und Hamburger Abendblatt vom 28.2.97, S. 24

6Neugebauer, E., B. Bouillon: Scoring beim Schwerverletzten. Einführung zum Thema. Der Unfallchirurg 97 (1994) 171

7Neugebauer, E., B. Bouillon: Was können Scoresysteme leisten? Der Unfallchirurg 97 (1994) 172-176

8Bein, T., K. Unertl: Möglichkeiten und Grenzen von Score-Systemen in der Intensivmedizin. Anästhesiologie, Intensivmedizin, Notfallmedizin, Schmerztherapie 28 (1993) 476-483

9Bein, T., K. Taeger: Score-Systeme in der Notfallmedizin. Anästhesiologie, Intensivmedizin, Notfallmedizin, Schmerztherapie 28 (1993) 222-227

10Ebd. S. 226

11Schröter, H.: Score-Systeme in der Intensivmedizin. Inaugural-Dissertation zur Erlangung der Doktorwürde der Medizinischen Fakultät der Bayrischen Julius-Maximilians-Universität zu Würzburg. Promoviert im Juli 1993. S. 1

12Der Spiegel: Noten in 20 Fächern. 2/1994. S. 158

13Bein, T., u.a.: Vergleich von APACHE-II und APACHE-III zur Einschätzung der Erkrankungsschwere von Intensivpatienten. Anaesthesist 44 (1995) 37-42

14Ebd. S. 37

15Ebd. S. 37

16Bein, T., K. Unertl: Möglichkeiten und Grenzen von Score-Systemen in der Intensivmedizin. Anästhesiologie, Intensivmedizin, Notfallmedizin, Schmerztherapie 28 (1993) 476-483

17Regel, G., u.a.: Scores als Entscheidungshilfe. Der Unfallchirurg 97 (1994) 211-216

18Bein, T., u.a.: Vergleich von APACHE-II und APACHE-III zur Einschätzung der Erkrankungsschwere von Intensivpatienten. Anaesthesist 44 (1995) 37-42. Springer-Verlag (1995) 38

19Weikenmeier, A.: Die prognostische Wertigkeit von Koma-Skalen bei Schädel-Hirn-Verletzten. Glasgow Coma-Score und Brüsseler Koma-Skala im Vergleich zu zwei neu erstellten Skalen. Inaugural-Dissertation zur Erlangung der Doktorwürde der Medizinischen Fakultät der Universität zu Köln. Promoviert am 11. Mai 1995.

20Ebd. S. 98

21Ebd. S. 100

22Schröter, H.: Score-Systeme in der Intensivmedizin. Inaugural-Dissertation zur Erlangung der Doktorwürde der Medizinischen Fakultät der Bayrischen Julius-Maximilians-Universität zu Würzburg. Promoviert im Juli 1993, S. 21

23Schuster, H.-P.: Die Bedeutung von Score-Systemen für die Voraussage von Behandlungsergebnissen in der Intensivmedizin. Internist 37 (1996) 1237-1243

24Der Spiegel: Noten in 20 Fächern. 2/1994, S. 158

25Die Woche. 28.2.97. Der digitale Todesbote. S. 26

26Heinz, L. (Regie): Geld oder Leben. ARD 2.12.96 21.00-22.30. BR & MDR Gemeinschaftsproduktion (1996).

27Bein, T., K. Unertl: Möglichkeiten und Grenzen von Score-Systemen in der Intensivmedizin. Anästhesiologie, Intensivmedizin, Notfallmedizin, Schmerztherapie 28 (1993) 476-483

28Schuster, H.-P.: Die Bedeutung von Score-Systemen für die Voraussage von Behandlungsergebnissen in der Intensivmedizin. Internist 37 (1996) 1237-1243

29Neugebauer, E., B. Bouillon: Was können Scoresysteme leisten? Der Unfallchirurg 97 (1994) 172-176

zurück zum Anfang

Startseite

update: 10.01.2004 by: Roberto Rotondo

Veröffentlichung zur Intensivmedizin

Intensiv - Fachzeitschrift für Intensivpflege und Anästhesie Heft 5, 5. Jahrgang, September 1997, S. 210-212

Thieme Verlag Stuttgart

Überwindung der Subjektivität des Arztes durch objektive Entscheidungen eines Computerprogramms?

Intensiv - Fachzeitschrift für Intensivpflege und Anästhesie
Heft 5, 5. Jahrgang, September 1997, S. 210-212