Wie gut ist ein Test?
Am Beispiel Früherkennung von Brustkrebs mit der Mammographie soll erläutert werden, wie ein Testergebnis bewertet werden kann. Dazu nutzen wir die Ergebnisse einer großen Studie aus den USA. In dieser Untersuchung wurden etwa 26000 Frauen erstmals mit einer Mammographie auf Brustkrebs untersucht. Die Studie wurde in Kalifornien durchgeführt. Weil die Frauen über das Land verstreut leben, ist ein Untersuchungsbus durch die Regionen gefahren. Die Frauen wurden dann an ihrem Wohnort in diesem Bus untersucht. Ähnliche Untersuchungsbusse gibt es auch in Deutschland, hier heißen sie Mammobile. Auf diese Weise soll auch Frauen auf dem Land erleichtert werden, am Screening teilzunehmen.
Die Frauen in der amerikanischen Studie waren 30 bis über 70 Jahre alt. Sie hatten bis zum Zeitpunkt der Untersuchung keine Diagnose Brustkrebs erhalten. Für diese Frauen war das die erste Screening-Mammographie.
Über den Zeitraum der folgenden 13 Monate wurde dokumentiert, bei welchen Frauen ein Brustkrebs diagnostiziert worden war. Nach 13 Monaten wurde sozusagen abgerechnet. Es wurde Bilanz gezogen: Bei wie vielen Frauen war der Mammographie-Befund positiv, bei wie vielen war er negativ, bei wie vielen wurde ein Brustkrebs diagnostiziert, durch die Untersuchung oder im Jahr nach der Untersuchung? So kann festgestellt werden, ob die Mammographie Brustkrebs korrekt angezeigt hatte. Wenn Brustkrebs vorhanden war, sollte die Mammographie positiv ausfallen, wenn kein Brustkrebs vorlag, sollte der Befund negativ, also normal sein. Die Untersuchung der Gewebeprobe gab schließlich den Ausschlag für die Diagnose.
Ein perfekter Test würde bei Vorliegen von Brustkrebs in 100 Prozent positiv und bei gesunden Frauen in 100 Prozent negativ ausfallen.
Die Ergebnisse der Studie sind in einer sogenannten 4-Felder-Tafel zusammengestellt. Die Zahlen geben die Anzahl der Frauen zu den jeweiligen Ergebnissen:
Mammographie-Befund ist positiv | 179 | 1671 | 1850 |
Mammographie-Befund ist negativ | 20 | 24187 | 24207 |
Erklärungen zu dieser 4-Felder-Tafel:
Insgesamt wurden 26057 Frauen untersucht. Von diesen hatten 199 Brustkrebs. Bei 179 hatte die Mammographie korrekt einen Verdacht angezeigt, der Befund war positiv. Bei 20 Frauen war die Mammographie jedoch negativ. Bei diesen 20 Frauen wurde dennoch in den darauffolgenden 13 Monaten Brustkrebs diagnostiziert. Die Mammographie war also falsch negativ. Insgesamt hatten 1850 Frauen, das sind etwa 7 Prozent aller untersuchter Frauen, einen positiven Befund. Bei diesen Frauen wurde ein Verdacht auf Brustkrebs ausgesprochen. Es mussten weitere Untersuchungen durchgeführt werden. Letztlich hatten aber nur 179 der 1850 Frauen wirklich Brustkrebs, das sind etwa 10 Prozent. Die übrigen 1671 Frauen hatten falsch positive Mammographie-Befunde. Sie wurden unnötig beunruhigt.
Wie gut ist also nun das Testverfahren Mammographie als Screening-Untersuchung? Was kann die Mammographie letztlich leisten?
Bei 179 der 199 Frauen war der Befund korrekt positiv. Die Mammographie hat den Krebs richtig erkannt. Der Fachausdruck heißt Sensitivität, in diesem Fall ist sie 90 Prozent.
Bei 24187 von 25858 Frauen, das sind etwa 94 Prozent der Frauen, die keinen Brustkrebs haben, war die Mammographie richtig negativ. Der Fachausdruck heißt Spezifität, in diesem Fall beträgt sie 94 Prozent.
Insgesamt ist der Test recht zuverlässig. Er hat eine hohe Sensitivität und eine hohe Spezifität. Nur wenige Tests in der Medizin sind so gut. Trotzdem kann die Mammographie als Screeningtest nicht allzu viel erreichen. Warum?
Eigentlich möchte man ja genau jene Frauen finden, die einen Brustkrebs haben. Das kann die Mammographie aber nicht leisten. Vor dem Screening wissen wir nicht, welche von den Frauen Brustkrebs hat und welche nicht. Letztlich wird sich erst in der Bilanz zeigen, dass es 199 der 26057 Frauen sind, also 0,8 Prozent oder 8 von 1000 Frauen. 26059 gehen in das Mammobil, den Untersuchungsbus. Wenn sie den Bus verlassen, haben 1850 dieser Frauen einen positiven Befund, aber nur 199 dieser 1850 werden schließlich wirklich eine Brustkrebsdiagnose erhalten, das sind etwa 10 Prozent. Der Fachausdruck heißt positiv prädiktiver Wert, also der positive Vorhersagewert. Nur etwa 10 Prozent der positiv getesteten Frauen haben wirklich Brustkrebs.
Im Fazit bedeutet das: Die Mammographie Screening-Untersuchung kann die Wahrscheinlichkeit für das Vorliegen von Brustkrebs von 0,8 Prozent vor der Untersuchung auf 10 Prozent nach der Untersuchung erhöhen.
Das Hauptproblem beim Screening von gesunden beschwerdefreien Menschen ist, dass viele Personen falsche Verdachtsbefunde erhalten. Sie werden beunruhigt, und es müssen weitere medizinische Untersuchungen gemacht werden, bis Entwarnung gegeben werden kann. Schließlich ist dann immer noch nicht geklärt, ob die frühere Diagnose tatsächlich von Nutzen ist. Dazu muss gezeigt werden, dass die frühere Behandlung die Sterblichkeit an Krebs vermindern kann.
Je seltener die Erkrankung ist, umso weniger nützt das Testen, selbst wenn es sich um einen sehr guten Test handelt. Das soll in der folgenden Tabelle veranschaulicht werden.
Was sagt ein positives Testergebnis?
Die folgende Tabelle zeigt, wie wahrscheinlich es ist, dass die Erkrankung bei einem positiven Testergebnis tatsächlich vorliegt. Das hängt von 2 Faktoren ab: Einerseits davon, wie gut der Test ist, der angewendet wird, und andererseits von der Häufigkeit der Erkrankung in der Gruppe der Personen, die untersucht werden soll.
Tabelle: Beispiel für einen sehr guten Test, die Sensitivität und die Spezifität sind 95 Prozent.
Häufigkeit der Erkrankung | Wahrscheinlichkeit, dass die Erkrankung bei einem positiven Testergebnis tatsächlich vorliegt |
Erklärung:
Wird mit diesem sehr guten Test in einer Gruppe von Personen nach einer Krankheit gesucht, die eher selten ist, also mit einer Häufigkeit von 0,1 Prozent vorliegt (bei einer von 1000 Personen), dann ist die Nachtestwahrscheinlichkeit 2 Prozent. Das heißt, nur bei 2 Prozent der positiv getesteten Personen liegt die Krankheit, die gesucht wird, tatsächlich vor. Beispiele dafür wären Brustkrebs bei jungen Frauen oder schwarzer Hautkrebs. Sie sind selten. Selbst mit einem sehr guten Test kann man dann nicht viel erreichen.
Wenn hingegen die Vortest-Wahrscheinlichkeit schon sehr hoch ist, führt der Test auch nicht weiter, weil die Diagnose ohnehin schon klar ist. Ein Beispiel hierfür wäre ein offener Knochenbruch nach einem Skiunfall. Wenn der Knochen schon durch die Haut sticht, ist die Diagnose klar, ein Röntgenbild kann dann nicht mehr viel zur Diagnosesicherung beitragen. Das Bild hilft hier lediglich dem Chirurgen, um die beste Reparaturmethode anzuwenden.
Am meisten hilft ein guter Test, wenn es etwa 50 zu 50 steht. Wenn beispielsweise ein 60-jähriger Mann, der seit seiner Jugend ein Raucher ist, mit starken Brustschmerzen in die Notaufnahme kommt, dann spricht einiges dafür, dass er einen akuten Herzinfarkt hat. Ein EKG, das die Herzströme aufzeichnet, oder ein Bluttest können hier weiterhelfen. Ist der Test positiv, erhöht sich die Wahrscheinlichkeit deutlich, dass ein Herzinfarkt vorliegt.
Die nächste Tabelle zeigt der Vollständigkeit halber auch noch die Ergebnisse für einen Test, der zwar noch gut, aber nicht sehr gut ist.
Tabelle: Beispiel für einen Test mit einer Sensitivität und Spezifität von 70 Prozent.
Häufigkeit der Erkrankung | Wahrscheinlichkeit, dass die Erkrankung bei einem positiven Testergebnis tatsächlich vorliegt |
Die meisten Tests zur Krebsfrüherkennung liegen bestenfalls in diesem Bereich oder sind noch schlechter. Viele Krebsarten, nach denen beim Screening gesucht wird, sind selten, mit Häufigkeiten...