Glossar

Tabellarische und grafische Darstellung bei quantitativen Merkmalen

Die Darstellung für ein quantitativ diskretes Merkmal folgt im Wesentlichen der bei den qualitativen Merkmalen. Zusätzlich werden die absoluten und die relativen Häufigkeitssummen betrachtet, die definiert sind als

absolute Häufigkeitssumme,

relative Häufigkeitssumme.

Diese Definition benutzt, dass die Ausprägungen eines quantitativ diskreten Merkmals stets in natürlicher Weise von den kleinen zu den großen Werten geordnet sind. Ni bzw. Hi geben dann Antwort auf die Frage, wie groß die Anzahl bzw. der Anteil der Beobachtungseinheiten mit Ausprägungen kleiner oder gleich der i-ten ist (i=1,2,...,k). Die geeignete grafische Darstellung für die Häufigkeiten bei einem diskreten Merkmal ist das im Wesentlichen dem Blockdiagramm entsprechende Stabdiagramm.
 
Beispiel 1.14
In einer Therapiestudie wurden die Häufigkeiten für das diskrete Merkmal "Anzahl der gemeldeten Nebenwirkungen" ermittelt. Tabelle 1.3 enthält das Ergebnis. In Abbildung 1.3 sind die Häufigkeiten als Stabdiagramm dargestellt.

Tabelle 1.3: Häufigkeiten für das quantitativ diskrete Merkmal "Anzahl der Nebenwirkungen"

Anzahl der Nebenwirkungen absolute Häufigkeit relative Häufigkeit absolute Häufigkeitssumme relative Häufigkeitssumme
0 209 41.8 % 209 41.8 %
1 122 24.4 % 331 66.2 %
2 108 21.6 % 439 87.8 %
3 44 8.8 % 483 96.6 %
4 13 2.6 % 496 99.2 %
5 0 0.0 % 496 99.2 %
6 4 0.8 % 500 100.0 %

Abbildung 1.3: Stabdiagramm für das Merkmal "Anzahl gemeldeter Nebenwirkungen"

Wenn man die Häufigkeitsverteilung eines quantitativ stetigen Merkmals tabellarisch oder grafisch darstellen will, muss man das Merkmal klassieren. Das bedeutet, man zerlegt den gesamten Wertebereich des Merkmals in k Klassen. Die Klassengrenzen bezeichnet man mit a0 < a1 < ... < ak.
 
ai - ai-1 (i=1,2,...,k) ist die Breite der i-ten Klasse, die man normalerweise für alle Klassen gleich groß wählt. Wenn der Wertebereich des Merkmals allerdings nach links bzw. rechts unbegrenzt ist, führt man eine linke bzw. eine rechte Restklasse ein, die nach links bzw. rechts unbegrenzt ist. Die Anzahl k der Klassen sollte nicht zu groß und nicht zu klein sein. Als Faustregel für die Wahl von k gilt

Die zugehörige grafische Darstellung ist das Histogramm. Hier werden die absoluten oder die relativen Häufigkeiten als Höhe eines Rechtecks über der gesamten Klasse dargestellt.
 
Beispiel 1.15
In Tabelle 1.4 liegen die bereits klassierten Altersangaben von 25 Patienten einer klinischen Studie vor.

Tabelle 1.4: Häufigkeitsverteilung des klassierten stetigen Merkmals "Alter in Jahren"

Klasse Alter in Jahren Klassenmitte Häufigkeiten absolut Häufigkeiten relativ
1 (45,55] 50 2 2/24=0.08
2 (55,65] 60 8 8/24=0.33
3 (65,75] 70 11 11/24=0.46
4 (75,85] 80 2 2/24=0.08
5 (85,95] 90 1 1/24=0.04
Summe ----- ------ 24 1

Die runde Klammer besagt, dass die entsprechende Klassengrenze selbst nicht zur Klasse gehört, die eckige Klammer zeigt an, dass die entsprechende Klassengrenze dazugehört.
 
Das zugehörige Histogramm ist in Abbildung 1.4 zu sehen.
 
Abbildung 1.4: Histogramm für das Merkmal "Alter in Jahren"