Glossar

Boxplot

Der Boxplot ist eine grafische Darstellung, mit der man sich einen guten Überblick über die Verteilung der Daten einer Stichprobe verschaffen kann.
 
In einem Koordinatensystem, an dessen y-Achse eine Skala für das betrachtete Merkmal angetragen ist, wird der Interquartilsabstand qi als Kasten (engl.: box) eingezeichnet. Vom oberen Ende des Kastens wird eine Strecke bis zum maximalen Wert gezeichnet, die aber nicht länger als das 1.5-fache des Interquartilsabstandes gezogen wird. Falls es Werte gibt, die mehr als 1,5 * q vom oberen Ende entfernt sind, so werden diese einzeln als Punkte eingetragen.
 
Entsprechend verfährt man am unteren Ende des Kastens mit dem minimalen Wert. Zusätzlich wird die Position des empirischen Medians und manchmal auch die des Mittelwertes markiert. In dieser Definition umfasst der Kasten gerade die mittleren 50% der Daten. Es gibt auch andere Varianten des Boxplots. Wenn man statistische Software benutzt, muss man prüfen, ob diese oder eine andere Definition benutzt wird.
 
Die Darstellung als Boxplot ist sehr nützlich, insbesondere dann, wenn man Untergruppen der Stichprobe vergleichen will.
 
Beispiel 1.17
Tabelle 1.6 enthält die statistischen Angaben für alle 140 Patienten (59 männliche, 81 weibliche) einer Studie.

Größe nach Maßzahl Geschlecht: Männlich Geschlecht: Weiblich
N 57 76
fehlend 2 5
xmin 160.00 148.00
x0.25 171.00 160.00
176.00 165.00
x0.75 180.00 170.00
xmax 190.00 180.00
176.12 164.87
Spannweite R 30.00 32.00
empirischer Interquartilsabstand q 9.00 10.00
empirische Varianz s2 49.72 44.76
empirische Standardabweichung s 7.05 6.69

Aus den Angaben in Tabelle 1.6 erhält man in Abbildung 1.6 einen nach Geschlecht getrennten Boxplot für die Körpergröße. Hierbei wird die Lage des arithmetischen Mittels durch einen Punkt dargestellt.

Abbildung 1.6: Boxplot für das Merkmal "Körpergröße"

Die Quantile werden in der Medizin häufig angewandt z.B. zur Festlegung von Normbereichen. Abbildung 1.7 zeigt ein Diagramm, in das bei den Säuglingsvorsorgeuntersuchungen die Körpergröße in Abhängigkeit vom Alter eingetragen wird. Dargestellt sind das 0.03-Quantil, der Median und das 0.97-Quantil der Körpergröße in Abhängigkeit vom Alter des Kindes. Im Bereich zwischen den Quantilen befinden sich etwa 94% der Grundgesamtheit. Kinder, deren Körpergröße dauerhaft nicht in diesen Bereich fällt, gelten als auffällig groß bzw. auffällig klein. Bei ihnen wird untersucht, ob eine Entwicklungsstörung vorliegt.
 
 
Abbildung 1.7: Somatogramm