Glossar

Kontingenztafel

Zur Untersuchung der Abhängigkeit zweier qualitativer Merkmale eignet sich die Kontingenztafel, in der die gemeinsame Häufigkeitsverteilung zweier Merkmale tabellarisch dargestellt wird. Sind A und B zwei qualitative Merkmale mit den Ausprägungen A1, A2, ..., Ak bzw. B1, B2, ..., Bl, dann ist die zugehörige Kontingenztafel ein rechteckiges Zahlenschema, das in der i-ten Zeile und der j-ten Spalte die absolute Häufigkeit nij enthält, mit der die Ausprägungskombination AiBj bei den n Beobachtungseinheiten einer Stichprobe beobachtet wurde.

Ergänzt wird das Schema um je zwei Zeilen und zwei Spalten, die die Ausprägung der Merkmale und die Spaltensummen bzw. die Zeilensummen enthalten.

Tabelle 2.2: Allgemeine Kontingenztafel

B
A
B1 B2 ... Bj ... Bl Zeilensumme
A1 n11 n12 ... n1j ... n1l n1.
A2 n21 n22 ... n2j ... n2l n2.
... ... ... ... ... ... ... ...
Ai ni1 ni2 ... nij ... nil ni.
... ... ... ... ... ... ... ...
Ak nk1 nk2 ... nkj ... nkl nk.
Spaltensumme n.1 n.2 ... n.j ... n.l n=n..

Tabelle 2.2 kann man die allgemein üblichen Bezeichnungen entnehmen. Mit den Zeilen- bzw. den Spaltensummen erhält man wieder die absoluten Häufigkeiten des Merkmals A bzw. die des Merkmals B. In analoger Weise stellt man Kontingenztafeln für diskrete und klassierte stetige Merkmale auf. Häufig werden zusätzlich zu den absoluten Häufigkeiten auch die relativen Häufigkeiten in die Kontingenztafel eingetragen. Je nach Fragestellung interessiert man sich für die

  • Gesamtprozente, das sind die relativen Häufigkeiten bezogen auf den Stichprobenumfang n
  • Zeilenprozente, das sind die relativen Häufigkeiten bezogen auf die jeweiligen Zeilensummen. Sie müssen sich in jeder Zeile zu 100 % addieren
  • Spaltenprozente, das sind die relativen Häufigkeiten bezogen auf die jeweilige Spaltensumme. Sie addieren sich in jeder Spalte zu 100 %.


Beispiel 2.2
Tabelle 2.3 enthält von 20 Patienten einer klinischen Studie die Daten zu den Merkmalen Therapie (TAD/TAD, TAD/HAM), Therapieergebnis (CR=complete Remission, PR=Partial Remission, NR= Non responder, ED=Early Death), Geschlecht und Alter.

Tabelle 2.3: Therapie, Therapieergebnis, Geschlecht und Alter für 20 Patienten

Lfd. Nr. Therapie Therapieergebnis Geschlecht Alter
1 TAD/TAD PR WEIBLICH 19
2 TAD/HAM ED MÄNNLICH 55
3 TAD/TAD NR WEIBLICH 48
4 TAD/TAD CR WEIBLICH 49
5 TAD/HAM PR MÄNNLICH 32
6 TAD/HAM CR WEIBLICH 22
7 TAD/TAD CR WEIBLICH 43
8 TAD/TAD CR MÄNNLICH 44
9 TAD/HAM CR WEIBLICH 24
10 TAD/TAD CR WEIBLICH 36
11 TAD/HAM ED MÄNNLICH 38
12 TAD/TAD CR MÄNNLICH 55
13 TAD/TAD CR WEIBLICH 28
14 TAD/HAM CR MÄNNLICH 48
15 TAD/HAM NR WEIBLICH 35
16 TAD/TAD CR WEIBLICH 43
17 TAD/HAM CR WEIBLICH 37
18 TAD/HAM CR WEIBLICH 49
19 TAD/TAD CR WEIBLICH 36
20 TAD/HAM ED WEIBLICH 29

Mit den Angaben aus Tabelle 2.3 erhält man für die beiden qualitativen Merkmale ?Therapie? und ?Therapieergebnis? die folgende Kontingenztafel.

Tabelle 2.4: Therapie und Therapieergebnis

Therapie Ergebnis       Zeilensumme
  CR PR NR ED  
TAD/TAD
Zeilenprozent
8
80
1
10
1
10
0
0
10
100
TAD/HAM
Zeilenprozent
5
50
1
10
1
10
3
30
10
100
Spaltensumme
Zeilenprozent
13
65
2
10
2
10
3
15
20
100

Tabelle 2.5 enthält die Daten für die Merkmale ?Therapie? und ?Therapieergebnis? von allen 140 Patienten.

Tabelle 2.5: Therapie und Therapieergebnis bei 140 Patienten einer klinischen Studie

Therapie Ergebnis       Zeilensumme
  CR PR NR ED  
TAD/TAD
Zeilenprozent
48
65.75
5
6.85
13
17.81
7
9.59
73
100
TAD/HAM
Zeilenprozent
47
70.15
3
4.48
12
17.91
5
7.46
67
100
Spaltensumme
Zeilenprozent
95
67.86
8
5.71
25
17.86
12
8.57
140
100

Bei gleich guten Therapien würde man gleiche Zeilenprozente in beiden Therapiearmen erwarten. Bei der vorliegenden Tabelle müsste man untersuchen, ob die Abweichungen von der Gleichheit so groß sind, dass sie vernünftigerweise nicht mehr durch den Zufall erklärt werden können. Diese Untersuchung ist Gegenstand des Chi-Quadrat-Tests.