Glossar

Schätzung der Überlebensraten nach Kaplan-Meier

In der Medizin werden häufig Merkmale vom Typ einer Überlebenszeit betrachtet. Man versteht darunter Merkmale, die wie eine Überlebenszeit durch ein Anfangs- und ein Enddatum charakterisiert sind.

Beide Angaben sind jeweils durch das Eintreten eines Ereignisses gekennzeichnet. Bei den eigentlichen Überlebenszeiten ist das Anfangsdatum z. B. das Datum der Erstdiagnose einer Erkrankung, das Enddatum ist das Todesdatum. Es kann aber auch das Anfangsdatum das Datum einer Operation, und das Enddatum das Datum der Entlassung aus dem Krankenhaus sein. Die Überlebenszeit ist jeweils die Zeitspanne zwischen beiden Daten.

Man spricht von einer zensierten Überlebenszeit, wenn das Endereignis am Stichtag der Auswertung noch nicht eingetreten ist. In diesem Fall steht für die Auswertung nur eine untere Schranke für die noch nicht bekannte tatsächliche Überlebenszeit zur Verfügung.

Unter der Überlebensrate S(t) versteht man den Anteil der Individuen, deren Überlebenszeit größer als t ist (S für engl.: survival). Es besteht die Aufgabe, diesen Anteil aus den Daten zu schätzen. Den errechneten Schätzwert bezeichnet man üblicherweise mit Ŝ(t).

Die zensierten Überlebenszeiten bilden ein Problem bei der Berechnung von Ŝ(t). Ein Verfahren, das es gestattet, die zensierten Überlebenszeiten sinnvoll einzubeziehen, ist das Schätzverfahren von E. Kaplan und P. Meier.

Das Verfahren soll anhand der Beispieldaten aus Tabelle 2.1 beschrieben werden. Die Tabelle enthält in Spalte (2) die Überlebenszeiten von 20 Tieren aus einem Tierversuch. Die Überlebenszeiten sind bereits als Differenz von Anfangs- und Enddatum ausgerechnet und in Tagen angegeben. Da die Tiere im Allgemeinen nicht alle am gleichen Tag in den Versuch aufgenommen werden, müssen die Versuchstage für jedes Tier individuell gezählt werden. Versuchstag 20 für Tier A kann z. B. für Tier B der Versuchstag 5 sein. Zensierte Zeiten sind durch "+" gekennzeichnet. Die Zeiten sind - gleichgültig ob zensiert oder nicht - der Größe nach geordnet:

 

t0 = 0 < t1 < t2 < ... < tn .

 

Die verschiedenen Zeiten sind in Spalte (1) durchnummeriert. Zwei Tiere sind zum Beispiel gleichzeitig an Versuchstag 70 eingegangen. Spalte (3) enthält die Anzahl ni derjenigen Versuchstiere, die den jeweiligen Versuchstag ti lebend erreichen, man sagt auch, die zum Zeitpunkt ti im Risiko stehen.

Diese Zahlen


n1, n2, n3, ...


errechnet man sukzessive mit Hilfe der Angaben in Spalte (4). Dort steht die Anzahl di der zum Zeitpunkt ti eingegangenen Tiere. Immer wenn ti nicht zensiert ist, ist ein Tier eingegangen. Daher ist z. B. d3=0, denn t3=43 ist eine zensierte Überlebenszeit. Zum Zeitpunkt t6=70 sind 2 Versuchstiere eingegangen, d.h. d6=2.

Offenbar gilt


ni = ni-1 - di-1   (i = 1, 2, ...),


das heisst zum Beispiel für den zweiten Zeitpunkt t2=40:


n2 = n1 - d1 = 20 - 1 = 19.

Nach diesen Vorbereitungen besteht die Grundidee des Kaplan-Meier-Verfahrens darin, zunächst für jeden Zeitpunkt ti die bedingten Überlebensraten qi auszurechnen:
Abhängigkeit zu untersuchen, braucht man andere Methoden.

das heisst zum Beispiel für den zweiten Zeitpunkt t2=40:

Das ist der Anteil derer, die den Zeitpunkt t2 überleben, von all denen, die ihn erreichen. Die qi werden in Spalte (5) berechnet. Die geschätzte Überlebensrate Ŝ(t) erhält man durch Aufmultiplizieren aller qi. Dies ist in Spalte (6) notiert:

das heisst zum Beispiel für den zweiten Zeitpunkt t2=40:

Beispiel 2.1

Tabelle 2.1 enthält aus einem Tierversuch 20 Überlebenszeiten in Tagen. Die Zeiten sind bereits aufsteigend sortiert. An den mit (+) gekennzeichneten Zeitpunkten endet die Beobachtungszeit, ohne dass das betrachtete Ereignis (hier Tod des Versuchstiers) eingetreten ist. Solche am Stichtag der Auswertung noch anhaltenden Überlebenszeiten nennt man zensiert.

Tabelle 2.1: Rechenschema zum Kaplan-Meier-Schätzer

(1)

i
(2)
Tage
ti
(3)
im Risiko
ni
(4)
Ereignisse
di
(5)
Anteil Überlebender
qi=(ni-di)/ni
(6)
kumulative Überlebensrate
q1 * q2 * ... * qi
0 0 20 0 20/20=1 1.0000
1 30 20 1 19/20=0.9500 0.9500
2 40 19 1 18/19=0.9474 0.9000
3 43+ 18 0 18/18=1 0.9000
4 50 17 1 16/17=0.9412 0.8471
5 65+ 16 0 16/16=1 0.8471
6 70 15 2 13/15=0.8667 0.7341
7 85 13 1 12/13=0.9231 0.6776
8 90 12 1 11/12=0.9167 0.6212
9 120 11 1 10/11=0.9091 0.5647
10 125+ 10 0 10/10=1 0.5647
11 135+ 9 0 9/9=1 0.5647
12 140+ 8 0 8/8=1 0.5647
13 150 7 1 6/7=0.8571 0.4840
14 160 6 1 5/6=0.8333 0.4034
15 175+ 5 0 5/5=1 0.4034
16 220+ 4 0 4/4=1 0.4034
17 225+ 3 0 3/3=1 0.4034
18 235+ 2 0 2/2=1 0.4034
19 250+ 1 0 1/1=1 0.4034
Aus Tabelle 2.1 kann man ablesen, dass der empirische Median der Überlebenszeiten Tage beträgt.

Abbildung 2.1 zeigt die geschätzte Überlebensrate Ŝ(t) in Abhängigkeit von der Überlebenszeit als Treppenfunktion. Es ist üblich, die Zensierungszeitpunkte durch einen senkrechten Strich zu markieren. Den empirischen Median Tage kann man am Schnittpunkt der waagerechten Linie mit der Treppenfunktion ablesen.


Abbildung 2.1: Kaplan-Meier-Plot für zensierte Überlebenszeiten

Die bisherigen Auswertungsmethoden beschränkten sich auf die Betrachtung eines Merkmals. Will man gleichzeitig mehrere Merkmale in die Auswertung einbeziehen, um deren Abhängigkeit zu untersuchen, braucht man andere Methoden.