Home Gesetze & Hintergrundinformationen Gerichtsurteile & -verfahren Hirntod Organspende & Organspender Organempfänger Organhandel Erfahrungsberichte Allg. Informationen Veröffentlichungen Forum Organspende

Veröffentlichung zur Intensivmedizin


Intensiv - Fachzeitschrift für Intensivpflege und Anästhesie

Heft 5, 5. Jahrgang, September 1997, S. 210-212

Thieme Verlag Stuttgart

Score-Systeme für die Intensivmedizin.

Überwindung der Subjektivität des Arztes durch objektive Entscheidungen eines Computerprogramms?

Von Roberto Rotondo, Hamburg

Inhaltsverzeichnis

  1. Zusammenfassung
  2. Aktuelle Diskussion über Score-Systeme für Krankenhäuser
  3. Was sind eigentlich Score-Systeme?
  4. Wie soll sichergestellt werden, dass das Programm misst, was es vorgibt zu messen?
  5. Zweifel und Kritik
  6. Anwendung auch im Individualfall?
  7. Zukünftige Entwicklungen
  8. Literatur

Zusammenfassung

Das RIYADH-Program für Intensivstationen hat in den letzten Wochen für Aufregung gesorgt. In Bremen wurde ein Test gestoppt. Das Programm wird jedoch in Fachkreisen kaum erwähnt. Andere Systeme (z.B. das APACHE-Programm) gelten in Fachkreisen als relativ sicher, und ihre Einführung als Routinediagnostik für Intensivstationen wird von Medizinern gefordert. In Deutschland werden unterschiedliche Score-Systeme (Punktsummensysteme) in der Intensivmedizin schon lange verwendet. Sie werden u.a. vor Hubschraubertransporten, zur Bewertung von Therapiemaßnahmen, zum Erstellen von Effektivitäts- und Qualitätskontrollen, zur Rationalisierung, zum Erstellen von Kosten-/Nutzenanalysen und in den USA zur Triage von Patienten verwendet. Es wird eine quantitative Aussage über den Schweregrad einer Erkrankung, deren Prognose und Verlauf gemacht, um von der subjektiven Sichtweise eines Arztes zu einer objektiven Aussage eines Computers über die Überlebens- bzw. Letalitätsrate von Patientengruppen – aber auch einzelnen Patienten – zu kommen. Die Entwicklung in unserem Gesundheitswesen, der Zwang zum Sparen und entsprechende Entwicklungen im Ausland (USA, Großbritannien) lassen den Schuss zu, dass Score-Systeme zu einem Mittel werden, ganzen Patientengruppen bzw. einzelnen Patienten die für sie notwendige Therapie zu verweigern, da die Chance auf den Erfolg dieser Therapie und deren Kosten den Aufwand übersteigen. Diverse Forschungsarbeiten belegen jedoch, dass diese Systeme nicht das halten, was sie versprechen. Sie sind nicht geeignet, um im Individualfall eine Entscheidung über den Abbruch einer Therapie zu treffen.

Aktuelle Diskussion über Score-Systeme für Krankenhäuser

Das Riyadh Intensiv Care Unit Program (RIP) des Chirurgen René Chang erregte in der letz­ten Woche Aufsehen. Es gibt vor, den letalen Verlauf einer Erkrankung zuverlässig berechnen zu können und eine Vorher­sage über die Kosten einer Behandlung eines Intensivpatienten treffen zu können.1

Das Programm wird im Bremen Krankenhaus „Links der Weser“, in der Berliner „Charité“ und in der Uniklinik Köln getestet. Auf Anordnung von Gesundheitssenatorin Christine Wischer (SPD) beendete das Bremer Krankenhaus vorerst den Test mit dem RIYADH-Programm. Das Programm ist – zurecht – als „Todescomputer“2 bezeichnet worden, da war die Rede vom „virtuellen To­desstoß“.3 Jetzt soll die Anwendung des Programms durch die Ethikkommission der Bremer Ärztekammer geklärt werden.

Weshalb diese jedoch nicht eingeschaltet wurde, bevor das Programm angewendet wurde, bleibt unklar. Außerdem heißt dies auch noch lange nicht, dass das Programm nicht weiter verwendet werden wird. Prof. Kuckelt, Intensivmediziner im Bremer Krankenhaus „Links der Weser“, sieht einer Überprüfung durch die Ethikkommission „gelassen entgegen“4.

Erstaunlich ist die Aufregung einzelner Mediziner, z.B. des Präsidenten der Hamburg Ärztekammer , Prof. Montgomery oder von Prof. H. Hoffmann, dem Präsidenten des Verbandes der leitenden Krankenhausärzte Deutschlands. Beide sol­len „entsetzt“ reagiert haben5. Nun ist es nicht so, dass mich ihr Entsetzten in Erstaunen versetzt hat, sondern, dass sie so schlecht informiert sind. Immerhin hat die Deutsche Gesellschaft für Unfallchirurgie (DGU) schon im Januar 1992 eine „Arbeitsgemeinschaft Scoring“ gegründet, an deren Arbeitssitzun­gen sich vor allem die Kliniken in Hannover, Celle, München, Essen, Frankfurt und Köln be­teiligten. Obendrein hat die DGU ein zentrales Traumaregister errichtet.6 Auch ein Blick in die MEDLINE einer gut ausgestatteter medizinischen Bibliothek zeigt, dass es seit 1990 mehrere Hundert Veröffent­lichungen allein zu einzelnen Score-Systemen (z.B. APACHE) gibt.

Das RIYADH-Programm ist nur eines unter vielen sogenannten Score-Systemen, die in Deutschland verwendet werden. Das RIYADH-Programm wird unter Medizinern nicht als das qualitativ Beste gehandelt. In der Fachliteratur wird es kaum erwähnt, und es gibt diverse andere Software-Programme, die schon längst Einzug in die Krankenhäuser gefunden haben. Im Unterschied zu anderen Programmen wird beim RIYADH-Programm der tägliche therapeutische Aufwand auf der Basis des Therapeutic Intervention Scoring Systems (TISS) umgewandelt in sogenannte „Cost-Performance-Profile“. Nicht nur der Leistungsaufwand kann somit dokumentiert werden, sondern die Kosten können im Verhältnis zum „Outcome“ bestimmt werden. Der tägliche therapeutische Aufwand wird in Score­werte (Punktwerte) umgewandelt und in DM umgerechnet. In Köln entsprach 1994 ein TISS-Punkt DM 507. In Verbindung mit dem TISS-Programm können theoretisch mit jedem anderen Software-Programm Kosten-/Nutzenanalysen erstellt werden. Aus diesem Grund ist es sinnvoll, die vermeintlich „besten“ Score-Systeme kritisch zu betrachten.

Was sind eigentlich Score-Systeme?

Score-Systeme wurden entwickelt, um die subjektive Entscheidung eines Arztes durch die „objektive“ Entscheidung eines Computers zu ersetzen.

Die Entwicklung von Score-Systemen begann in den USA.8 Score-Systeme sind sogenannte Schweregradklassifikationssysteme oder Punktsummensysteme, die vorgeben, ei­ne quantita­tive Aus­sage über den Schweregrad einer Erkrankung, ihrer Pro­gnose und deren Verlauf tref­fen zu können. Neben dem RIYADH ICU Programm gibt es diverse Softwareprogramme, die jeweils unterschiedlich aufgebaut sind und auch unterschiedlich verwendet werden:

  1. APACHE: Acute Physiology And Chronic Health Evaluation Score;

  2. SAPS: Simplified Acute Physiology Score;

  3. TISS: Therapeutic Intervention Scoring System;

  4. HIS: Hannover Intensiv Score;

  5. KISS: Kombiniertes Intensiv Scoring System;

  6. TS: Trauma Score;

  7. TI: Trauma Index;

  8. HTI: Hospital Trauma Index;

  9. ISS: Injury Severity Score;

  10. AIS: Abbreviated Injury System;

  11. MOFS: Multi-Organ-Failure-Score;

  12. MPI: Mannheimer Peritonitis Index;

  13. GCS: Glasgow Coma Scale.

Das „Beste“ derzeit auf dem Markt befindliche Score-System ist das Acute Physiology And Chronic Health Evaluation-System (APACHE). Es wird mittlerweile in drei verschiedenen Versionen erprobt.

Das APACHE-Programm wird beispielsweise in der Uniklinik Hamburg, in Regensburg, Würzburg, München, Ulm und Hildesheim verwen­det. Als hauptsächliches Kriterium wird im APACHE-Programm die Letalität berechnet. Es berechnen also, mit welcher Wahr­scheinlichkeit ein Patient versterben wird.

Es gibt bereits diverse Anwendungsschwerpunkte dieser Programme:

  1. Zur Berechnung des Letalitätsrisikos,

  2. Zum Vergleich zwischen Patientengruppen,

  3. Zur Einschätzung der Erkrankungsschwere von Intensivpatienten,

  4. Zur Beurteilung von polytraumatisierten Patienten vor Hubschraubertransporten,

  5. Zur Identifikation von besonders gefährdeten Patienten,

  6. Zur Doku­mentation des Leistungsaufwands,

  7. Zur Bewertung der Therapiemaßnahmen,

  8. Zum Erstellen von Effektivitäts- und Qualitätskontrollen,

  9. Zum Er­stellen von Risikoprofilen,

  10. Zur Rationalisierung,

  11. Für Wissenschaftliche Untersuchungen, Beispiel: Multicenterstudien,

  12. Zum Erstellen von Kosten--/Nutzenanalysen,

  13. In den USA: zur Triage von Patienten - bezogen auf die Wahl des Transportmittels oder des Versorgungszentrums9 und zur Triage bei Massenunfällen, um die Reihenfolge der Pri­märversorgung festzulegen.10

Wie soll sichergestellt werden, dass das Programm misst, was es vorgibt zu messen?

Es wird üblicherweise so verfahren, dass einzelnen Parametern (z.B. Tempe­ratur, Herzfre­quenz, arterieller Blutdruck, best. Blutwerten, dem neurologischen Status usw.) Punktwerte zuge­wiesen werden, die dann zu einem Gesamtpunkt­wert des Scores addiert werden. Im APACHE-II-Score werden Punkte für akut physiologische Parameter, für das Alter, zur Be­wertung chronischer Vorerkrankungen und zur Bewertung der Bewusstseinslage (Glas­gow Coma Scale, GCS) verteilt. Es wird angenommen, dass eine steigende Punktzahl einen höheren Schweregrad der Erkrankung markiert und somit eine schlechtere Prognose für die Patienten gegeben ist.11

Das APACHE-II Programm vergleicht die Punktwerte der Patienten mit den Daten von 17440 Patienten, die auf den Intensivstationen amerikanischer Kliniken gelegen hatten und errech­net die Letalitätswahr­scheinlichkeit.12 Das APACHE-II Programm wurde an ca. 6000 Intensiv­patienten prospektiv validiert.13 1991 wurde das APACHE-III-Programm eingeführt. Diese Version enthält mehr Parameter als die APACHE-II-Version und die Glasgow Coma Scale (GCS) wurde erweitert und modifiziert. Auch diese Ver­sion wurde in einer prospektiven Studie an einem großen Patien­tenkollektiv (ca. 17000 Patienten) validiert. 14

Die vor­hergesagte Qualität eines Scores soll um so besser sein, je größer die Übereinstim­mung zwi­schen geschätzter und eingetretener Letali­tät ist. Dies wird mittels eines statisti­schen Verfah­rens, der Receiver-Operating Charakteristics Analysis (ROC) versucht. Die soge­nannte „Sensitivi­tät“ (= die Eignung, das Versterben während des Krankenhausaufenthalts richtig vor­herzusagen) und die sogenannte „Spezifität“ (= Eignung, bei denen, die versterben, nicht das Überle­ben vorherzusagen) werden statistisch berechnet und können dann graphisch dargestellt wer­den. Die ROC-Ana­lysen werden sogar „zum >golden standard< der Beschreibung von Scoresyste­men“ erklärt.15

Zweifel und Kritik

Aus vielerlei Gründen sind Zweifel an den Programmen angebracht. Zwar suggeriert die gro­ße Anzahl von Patientendaten, mit denen das APACHE-Programm die aktu­ellen Daten eines Patientenkollektivs oder einzelner Patienten abgleicht, dass hier große Ob­jektivität vorhanden zu sein scheint. Aber es gibt Forschungsergebnisse, die an der verbesser­ten Objektivität des Computerprogramms gegenüber der subjektiven Entscheidung eines Menschen - dem Arzt - Bedenken zulassen.

Beispielsweise haben Patienten überlebt, bei denen ein 100%iges Sterberisiko - nach entspre­chend hohem Scorewert - prognostiziert wurde.16 Außerdem müssen bestimmte Werte (z.B. GCS oder Blutdruck) im APACHE-Programm von Menschen erhoben werden, was mit Fehlern behaftet sein kann. Ein weiteres Problem in der Anwendung von Score-Systemen besteht im hohen Dokumentationsaufwand und im Fehlen des nötigen Engagements bei der Dokumentation.17

Ein wesentlich gravierenderes Problem speziell des APACHE-Scores stellt meiner Ansicht nach die Glasgow Coma Skala dar. Die neurologische Beurteilung von Patienten, die auf­grund ihrer Grunderkrankung (z.B. kranielle Verletzung) dauernd sediert werden müssen, ist problematisch. Bei diesen Patienten wird der Grad der Bewusstseinsstörung geschätzt, wie er ohne sedierende Maßnahmen zu vermuten wäre.18 Dies verdeutlicht die Unsi­cherheit des Programms, weil hier der Mensch die entscheiden­de Rolle bei der Beurteilung spielt. Wie hoch die Fehlerwerte sind, wenn Ärzte, die mit der GCS vertraut sind, eine Pro­gnose abgeben, belegt eine Dissertation von A. Weikenmeier von 199519. Zur prognostischen Wertigkeit von Koma-Skalen bei Schädel-Hirn-Verletzten wurden die Glasgow Coma Skala und die Brüssler Coma Skala mit anderen neuen Skalen verglichen. Die höchste Korrektheit bezogen auf die Progno­se richtig vorausgesagter Tod betrug bei der Glasgow Coma Skala nur 86%.20 Die höchste Korrektheit bezogen auf die Prognose richtig vorausgesagtes Überleben betrug bei der Glasgow Coma Skala etwa 72%.21 Diese doch sehr hohen Fehlerquoten gehen natürlich auch in den APACHE-II- bzw. -III-Score mit ein.

Ein weiteres Beispiel, dass meiner Ansicht nach sehr gut herausstellt, dass das APACHE-Pro­gramm unsicher ist, ist in der Dissertation von H. Schröter von 1993 dokumentiert. „Am 2. Tag zeigte der - eigentlich für die ersten 24 Stunden konzipierte - APACHE-II seine größte Aussagekraft und Trennschärfe, vom 4. Tag an fällt die Aussagekraft bis unter die Zufallswahrscheinlichkeit, der APACHE-II liefert folglich von diesem Zeitpunkt an keine prognostisch verwertbaren Informationen mehr.“22

Und auch Prof. Schuster aus dem Städtischen Krankenhaus Hildesheim, Lehrkrankenhaus der Medizinischen Hochschule Hannover, stellt in einem Artikel der Zeitschrift „Der Internist“ heraus, dass „Aussagen zur Letalität, die sich auf Punkt­werte aus Schweregradscores beziehen, [...] eher verwirrend und weitgehend manipulierbar [sind].“23

Trotz der oben erwähnten Mängel des APACHE-Programms werden seine Vorzüge hervorge­hoben und in den schon erwähnten Kliniken benutzt. Im Ausland werden sie schon sehr häu­fig verwendet. In den USA wurde schon 1994 in 400 Kliniken das APACHE-Programm zum Softwarestückpreis von damals 650 000 Dollar verwendet.24 Und auch in über 50 britischen Kliniken vertrauen die Mediziner der Computersoftware (RIYADH).25,26

Anwendung auch im Individualfall?

Es kann nicht bestritten werden, dass das APACHE-II- und auch das APACHE-III-Programm - wie auch andere - für den Individualfall verwendet werden oder zukünftig Anwendung fin­den sollen.27

Eine Entscheidung auf Therapieabbruch oder Nichteinsatz von Intensivmedizin im Individual­fall auf der Basis eines Computerprogramms, ist jedoch - aus vielerlei Gründen - sehr frag­würdig. Selbst in den Reihen der Anwender ist man sich relativ einig, dass Scores-Systeme für den Einzelfall mit einer so hohen Unsicherheit be­haftet sind, dass sie als Entscheidungsgrund­lage für den individuellen Patienten nicht einsetzbar sind.28

Es ist interessant, dass selbst die Anwender des Programms einer individuellen Prognose eher skeptisch oder ablehnend gegenüberstehen, womit das Hauptanwendungsfeld dieser Pro­gramme wegfallen würde und gleichzeitig die Frage auftaucht, welchen Sinn Gruppenverglei­che zwischen Patientenkollektiven machen sollen. Therapieabbruch für ganze Patientengruppen (z.B. HIV), obwohl dies im Einzelfall bedeuten kann, dass Patienten versterben, die eine reelle Chance auf ein Überleben hatten? Ausschluss bestimmter Patientengruppen von medizinischen Leistungen, wenn die Computerprognose zu schlecht ausfällt?

Zukünftige Entwicklungen

In den mir bekannten Fachartikeln fordern die Anwender der Computerprogramme, trotz ihrer Zweifel am Einsatz der Score-Systeme für den Individualfall, ihre Einführung als Routinediagnostik für Intensivstationen. Nun frage ich mich, ob dies in der Hauptsache zum Wohl der Patienten geschehen soll. Schon 1994 stellten E. Neugebauer & B. Bouillon in einem Artikel der Fachzeitschrift „Der Unfallchirurg“ heraus, dass in den USA Score-Systeme zur Triage für die Verlegung oder Nichtverlegung eines Patienten von der Normal- auf die Intensivstation genutzt wurden. Ein Patient, der ein „Sterberisiko“ von <10% hatte, wurde aus „ökonomischen Gründen“ nicht auf die Intensivstation verlegt. Sie sahen schon damals die „Gefahr“, dass „ökonomische Zwänge auch in Deutsch­land relevant werden“ könnten.29 Angesichts der Entwicklungen in unserem Gesundheits­wesen (z.B. Budgetierung der Krankenhäuser) muss sich meiner Einschätzung nach jeder An­wender der Score-Systeme, der heute noch der Meinung ist, dass hier nur im Sinne des Patien­ten gehan­delt wird, fragen lassen, ob Naivität, Eigeninteresse, Verdrängung oder Absicht hin­ter die­ser „Selbst-Täuschung“ steht. Möglicherweise werden ärztliche Entscheidungen schnel­ler als manchem lieb sein werden, nicht mehr nach dem Stand der medizinischen Möglichkei­ten oder moralischen und ethischen Werten bzw. Normen getroffen.

Prof. Röse von der Otto-Guericke-Universität Magdeburg stellte 1996 in der Zeitschrift „Intensiv“ die Frage: „Intensivmedizin – Hilfe zum Leben um jeden Preis? (...) nein! Wer aber stellt den Maßstab, bildet das Preisgericht?“ Er kommt zu dem Schluss, dass der Patient dies sein wird.

Ich bin anderer Meinung. Wenn Krankenhäuser mit dem APACHE-, dem RIYADH-Programm oder einem anderem Sco­re-System ausgerüstet werden, dann wird zukünftig der Compu­ter den Maßstab, das „Preisgericht“ bilden. Finanzielle Aspekte werden dazu führen, dass Score-Systeme die Beurteilung der Prognose einzelner Patienten und auch von Patien­tenkollektiven übernehmen werden. Auch die weitere Entscheidung über den Beginn und den Abbruch einer Behandlung oder der Verlegung eines Patienten werden dann vom Computer getroffen. Für manchen Patienten wird das „Urteil“ des Computers tödlich enden, obwohl eine Überlebenschance gegeben war, weil diese Program­me eine individuelle Progno­se der Letalität nicht zulassen.

Den besten Schutz für die Patienten stellt demnach die Abschaffung dieser Programme (siehe Bremen) und ein generelles Verbot die­ser Programme dar.



Dipl. Psych. Roberto Rotondo

Rappstr.9

20146 Hamburg

Ein Link zum Vortrag "Patienteneinschätzung - Score-Systeme"
zurück zum Anfang

Literatur

1Chang, R., D. Bihari: Outcome prediction for the individual patient in the ICU. Der Unfallchirurg 97 (1994) 199-204

2Frankfurter Rundschau: 1. März 1997. S. 26

3Ebd. S. 3

4Hamburger Abendblatt vom 1./2. März 1997; Nr. 51, S. 3.

5Hamburger Morgenpost. 28.2.97, S. 20 und Hamburger Abendblatt vom 28.2.97, S. 24

6Neugebauer, E., B. Bouillon: Scoring beim Schwerverletzten. Einführung zum Thema. Der Unfallchir­urg 97 (1994) 171

7Neugebauer, E., B. Bouillon: Was können Scoresysteme leisten? Der Unfallchirurg 97 (1994) 172-176

8Bein, T., K. Unertl: Möglichkeiten und Grenzen von Score-Systemen in der Intensivmedi­zin. Anästhe­siologie, Intensivmedizin, Notfallmedizin, Schmerztherapie 28 (1993) 476-483

9Bein, T., K. Taeger: Score-Systeme in der Notfallmedizin. Anästhesiologie, Intensiv­medizin, Notfallme­dizin, Schmerztherapie 28 (1993) 222-227

10Ebd. S. 226

11Schröter, H.: Score-Systeme in der Intensivmedizin. Inaugural-Dissertation zur Erlangung der Doktorwürde der Medizinischen Fakultät der Bayrischen Julius-Maximilians-Universi­tät zu Würzburg. Promoviert im Juli 1993. S. 1

12Der Spiegel: Noten in 20 Fächern. 2/1994. S. 158

13Bein, T., u.a.: Vergleich von APACHE-II und APACHE-III zur Einschätzung der Erkran­kungsschwere von In­tensivpatienten. Anaesthesist 44 (1995) 37-42

14Ebd. S. 37

15Ebd. S. 37

16Bein, T., K. Unertl: Möglichkeiten und Grenzen von Score-Systemen in der Intensivmedi­zin. Anästhe­siologie, Intensivmedizin, Notfallmedizin, Schmerztherapie 28 (1993) 476-483

17Regel, G., u.a.: Scores als Entscheidungshilfe. Der Unfallchirurg 97 (1994) 211-216

18Bein, T., u.a.: Vergleich von APACHE-II und APACHE-III zur Einschätzung der Erkran­kungsschwere von In­tensivpatienten. Anaesthesist 44 (1995) 37-42. Springer-Verlag (1995) 38

19Weikenmeier, A.: Die prognostische Wertigkeit von Koma-Skalen bei Schädel-Hirn-Ver­letzten. Glasgow Coma-Score und Brüsseler Koma-Skala im Vergleich zu zwei neu erstell­ten Skalen. Inaugural-Dissertation zur Erlangung der Doktorwürde der Medizinischen Fa­kultät der Universität zu Köln. Promoviert am 11. Mai 1995.

20Ebd. S. 98

21Ebd. S. 100

22Schröter, H.: Score-Systeme in der Intensivmedizin. Inaugural-Dissertation zur Erlangung der Doktorwürde der Medizinischen Fakultät der Bayrischen Julius-Maximilians-Universi­tät zu Würzburg. Promoviert im Juli 1993, S. 21

23Schuster, H.-P.: Die Bedeutung von Score-Systemen für die Voraussage von Behandlungs­ergebnissen in der Intensivmedizin. Internist 37 (1996) 1237-1243

24Der Spiegel: Noten in 20 Fächern. 2/1994, S. 158

25Die Woche. 28.2.97. Der digitale Todesbote. S. 26

26Heinz, L. (Regie): Geld oder Leben. ARD 2.12.96 21.00-22.30. BR & MDR Gemeinschafts­produktion (1996).

27Bein, T., K. Unertl: Möglichkeiten und Grenzen von Score-Systemen in der Intensivmedi­zin. Anästhesiologie, Intensivmedizin, Notfallmedizin, Schmerztherapie 28 (1993) 476-483

28Schuster, H.-P.: Die Bedeutung von Score-Systemen für die Voraussage von Behandlungser­gebnissen in der Intensivmedizin. Internist 37 (1996) 1237-1243

29Neugebauer, E., B. Bouillon: Was können Scoresysteme leisten? Der Unfallchirurg 97 (1994) 172-176


zurück zum Anfang


Startseite

update: 10.01.2004    by: Roberto Rotondo