Wann und warum
gekerbte Box-Plots verwenden?
Gekerbte Box-Plots (Notched Box Plots) fügen ein Konfidenzintervall um den Median hinzu, sodass Sie visuell beurteilen können, ob Unterschiede zwischen Gruppen statistisch signifikant sind. Lernen Sie, wie man sie liest und wann man sie einsetzt.
1. Was sind gekerbte Box-Plots?
Ein gekerbter Box-Plot (Notched Box Plot) ist eine Variante des Standard-Box-Plots mit einem zusätzlichen Merkmal: einer Kerbe (oder Taille) um den Median. Diese Kerbe visualisiert die Unsicherheit der Median-Schätzung und ermöglicht es Ihnen, zu beurteilen, ob Unterschiede zwischen Gruppen statistisch signifikant sind.
Die Kerbe erscheint als Verengung der Box um die Medianlinie. Wenn Sie mehrere Gruppen in einem gruppierten Box-Plot vergleichen, helfen Ihnen die Kerben, schnell zu erkennen, welche Gruppen signifikant unterschiedliche Mediane haben.
💡 Wichtige Erkenntnis
Faustregel: Wenn sich die Kerben zweier Gruppen nicht überlappen, sind ihre Mediane mit hoher Wahrscheinlichkeit statistisch signifikant unterschiedlich. Wenn sich die Kerben überlappen, ist der Unterschied wahrscheinlich nicht statistisch signifikant.
2. Wie Kerben funktionieren: Die Mathematik dahinter
Die Kerbe repräsentiert ein ungefähres 95%-Konfidenzintervall für den Median. Es wird unter Verwendung des Interquartilsabstands (IQR) und der Stichprobengröße berechnet:
Formel
Standardfehler (SE) = 1.57 × (IQR / √n)
wobei n die Stichprobengröße ist
Der Bereich der Kerbe ist:
- Untere Grenze: Median - SE
- Obere Grenze: Median + SE
Der Faktor 1.57 wurde gewählt, um unter der Annahme einer Normalverteilung ein 95%-Konfidenzintervall für den Median anzunähern.
📊 Beispiel
Wenn Median = 80, IQR = 15, n = 20:
Standardfehler = 1.57 × (15 / √20) = 1.57 × 3.35 ≈ 5.26
Die Kerbe reicht von 80 - 5.26 = 74.74 bis 80 + 5.26 = 85.26
3. Kerben interpretieren: Statistische Signifikanz lesen
Der Schlüssel zur Interpretation von gekerbten Box-Plots ist das Verständnis, was überlappende (oder nicht überlappende) Kerben bedeuten:
✅ Keine Überlappung = Wahrscheinlich Signifikant
Wenn sich die Kerben zweier Gruppen nicht überlappen, sind ihre Mediane mit hoher Wahrscheinlichkeit auf einem 95%-Niveau statistisch signifikant unterschiedlich.
Beispiel: Wenn die Kerbe von Gruppe A von 75-85 reicht und die von Gruppe B von 90-100, gibt es keine Überlappung. Dies deutet darauf hin, dass der Median von Gruppe B signifikant höher ist als der von Gruppe A.
⚠️ Überlappung = Wahrscheinlich Nicht Signifikant
Wenn sich die Kerben zweier Gruppen überlappen, ist der Unterschied zwischen ihren Medianen wahrscheinlich nicht statistisch signifikant. Dies ist jedoch eine visuelle Näherung – ein formaler Test wird empfohlen.
Beispiel: Wenn die Kerbe von Gruppe A von 75-85 reicht und die von Gruppe B von 80-90, überlappen sie sich (im Bereich 80-85). Dies deutet darauf hin, dass der Unterschied möglicherweise nicht signifikant ist.
📊 Vergleich mehrerer Gruppen
Wenn Sie mehrere Gruppen in einem gruppierten Box-Plot vergleichen, suchen Sie nach Gruppen, deren Kerben sich nicht mit anderen überlappen. Diese Gruppen sind wahrscheinlich signifikant verschieden.
4. Wann gekerbte Box-Plots verwenden
✅ Ideal für:
- Visuellen Vergleich mehrerer Gruppen
- Schnelle Beurteilung der statistischen Signifikanz
- Explorative Datenanalyse (EDA)
- Präsentationen, bei denen visuelle Klarheit zählt
- Wenn die Stichprobengröße mittel bis groß ist (n ≥ 10)
- Wenn Sie formale Tests zunächst vermeiden wollen
⚠️ Alternativen erwägen:
- Sehr kleine Stichprobengrößen (n < 10)
- Wenn Sie genaue p-Werte benötigen
- Formale Hypothesentest-Anforderungen
- Wenn die Kerbe zu breit ist (geringe Präzision)
- Wenn nur zwei Gruppen verglichen werden (t-Test oft klarer)
💡 Best Practice
Verwenden Sie gekerbte Box-Plots als visuelles Screening-Tool, um potenzielle signifikante Unterschiede zu identifizieren. Für formale Schlussfolgerungen führen Sie geeignete statistische Tests durch (z. B. ANOVA, Kruskal-Wallis oder t-Test).
5. Praxisbeispiele
Beispiel 1: Klassenarbeiten
Szenario: Vergleich der Testergebnisse von drei Klassen, um zu sehen, ob signifikante Leistungsunterschiede bestehen.
Daten:
Klasse A: 85, 87, 88, 90, 92, 93, 95 Klasse B: 75, 78, 80, 82, 85, 87, 90 Klasse C: 70, 72, 74, 76, 78, 80, 82
Ergebnis mit Kerben: Die Kerbe von Klasse A wird wahrscheinlich nicht mit der von Klasse B oder C überlappen, was auf eine signifikant bessere Leistung hinweist. Klasse B und C könnten überlappende Kerben haben.
→ Probieren Sie dieses Beispiel in PlotNerd (Kerben aktivieren) →6. Einschränkungen und Überlegungen
⚠️ Stichprobengröße ist wichtig
Kerben sind bei mittleren bis großen Stichproben (n ≥ 10) am zuverlässigsten. Bei sehr kleinen Stichproben können die Kerben extrem breit sein und wenig Aussagekraft haben.
⚠️ Annäherung, kein exakter Test
Gekerbte Box-Plots bieten eine visuelle Annäherung an statistische Signifikanz. Sie basieren auf Annahmen (z.B. Normalverteilung), die möglicherweise nicht auf Ihre Daten zutreffen.
7. FAQ
Frage: Was bedeutet die Kerbe im Box-Plot?
Antwort: Die Kerbe repräsentiert das 95%-Konfidenzintervall um den Median. Sie bietet einen visuellen Test auf statistische Signifikanz.
Frage: Sollte ich immer gekerbte Box-Plots verwenden?
Antwort: Nein. Verwenden Sie sie, wenn Sie Signifikanz visuell beurteilen wollen. Für einfache Beschreibungen oder den Vergleich von nur zwei Gruppen sind Standard-Box-Plots oft klarer.
8. Fazit
Gekerbte Box-Plots sind ein leistungsstarkes Werkzeug zur intuitiven Beurteilung statistischer Signifikanz. Durch die Anzeige von Konfidenzintervallen um den Median helfen sie Ihnen, schnell zu erkennen, welche Gruppen wahrscheinlich signifikant unterschiedlich sind.
Bereit, Signifikanz zu visualisieren?
Probieren Sie die Notched-Box-Plot-Funktion von PlotNerd aus.
Gekerbten Box-Plot erstellen