Tukey-Scharniere vs. R-7 Quantile
So wählen Sie die richtige Quartil-Methode
Zwei anerkannte Quartil-Definitionen können deutlich unterschiedliche erste und dritte Quartile ergeben. Dieser Leitfaden erklärt, warum Tukey-Scharniere und die R-7-Interpolationsmethode voneinander abweichen, wie die Wahl Boxplots beeinflusst und wie PlotNerd Ihr Team synchron hält.
1. Schneller Vergleich auf einen Blick
Nutzen Sie die folgende Tabelle als schnelle Erinnerung, wo jeder Algorithmus glänzt. Beide Methoden beschreiben das 25. und 75. Perzentil, verwenden jedoch unterschiedliche Logik, wenn die Quartilposition zwischen beobachteten Datenpunkten liegt.
| Methode | Standard-Software | Formelzusammenfassung | Am besten für | Zu beachten |
|---|---|---|---|---|
| Tukey-Scharniere | AP Statistik, SPSS (Tukey-Option), explorative Datenanalyse-Lehrbücher | Median der unteren/oberen Hälfte (schließt globalen Median bei ungeradem n aus) | Lehre, einfache Berichte, robuste explorative Zusammenfassungen | Erzeugt Viertelschritt-Sprünge; weniger glatt bei großem n |
| R-7 Quantil | R `quantile()`, Python `numpy.quantile` (Standard), Excel `PERCENTILE.INC` | `h = (n - 1) * p + 1`, interpoliert linear zwischen benachbarten Werten | Data-Science-Workflows, reproduzierbare Forschung, glatte Vergleiche | Erfordert Erklärung der Interpolation für Stakeholder, die neu bei Quantilen sind |
2. Tukey-Scharniere erklärt
Der Statistiker John Tukey setzte sich für robuste Zusammenfassungen ein, die mit Papier und Bleistift berechnet werden konnten. Tukey-Scharniere teilen den geordneten Datensatz in zwei Hälften und nehmen den Median jeder Hälfte. Wenn die Stichprobengröße ungerade ist, wird der globale Median aus beiden Hälften ausgeschlossen. Dieser Ansatz hält die Quartile mit tatsächlich beobachteten Werten in Einklang.
Schritt-für-Schritt-Anleitung
- Sortieren Sie den Datensatz aufsteigend.
- Finden Sie den globalen Median (Q2). Wenn der Datensatz eine ungerade Anzahl hat, entfernen Sie Q2 aus beiden Hälften.
- Berechnen Sie den Median der unteren Hälfte für Q1.
- Berechnen Sie den Median der oberen Hälfte für Q3.
Da die Quartile immer existierende Werte sind, sprechen Tukey-Scharniere Unterrichtsräume und Berichte an, die diskrete, leicht überprüfbare Zahlen bevorzugen. Der Nachteil ist, dass Quartile abrupt springen, wenn neue Daten in die Stichprobe aufgenommen werden.
3. R-7 Lineare Interpolation
Die R-7-Definition (auch Typ 7 in der Taxonomie von Hyndman und Fan genannt) behandelt die zugrunde liegende Verteilung als kontinuierlich. Sie berechnet einen Bruchindex für das gewünschte Perzentil und interpoliert zwischen benachbarten Beobachtungen. Diese Methode ist der Standard in R, NumPy, Pandas und Excels inklusiven Perzentilfunktionen, was sie zu einer sicheren Wahl für softwareübergreifende Zusammenarbeit macht.
Formelauffrischung
h = (n - 1) * p + 1
j = floor(h)
gamma = h - j
Q_p = (1 - gamma) * x_(j) + gamma * x_(j + 1)
Wenn h genau auf eine ganze Zahl fällt, ist gamma = 0 und das Quartil entspricht dem beobachteten Wert x_(j).
R-Beispiel
scores <- c(6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49)
quantile(scores, probs = c(0.25, 0.5, 0.75), type = 7)
# 25% 50% 75%
# 25.5 40.0 43.0 Python-Beispiel
import numpy as np
scores = np.array([6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49])
np.quantile(scores, [0.25, 0.5, 0.75], method="linear")
# array([25.5, 40. , 43. ])
Die interpolierten Werte sind besonders hilfreich beim Plotten mehrerer Gruppen nebeneinander: Die Quartile ändern sich glatt mit inkrementellen Datenaktualisierungen und halten Vergleiche intuitiv.
4. Fallstudien: Unterricht vs. Geschäftsdaten
Echte Daten zeigen, wo die Unterschiede wichtig sind. PlotNerd macht es einfach, zwischen Algorithmen zu wechseln, SVG-Boxplots zu exportieren und Stakeholdern transparente Berechnungen zu liefern. Probieren Sie die folgenden Datensätze lokal aus oder fügen Sie sie direkt in den PlotNerd-Rechner ein.
Datensatz A: Einführungs-Statistik-Quiz (n = 11)
6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49 | Kennzahl | Tukey-Scharniere | R-7 Quantil |
|---|---|---|
| Q1 | 15,0 | 25,5 |
| Median | 40,0 | 40,0 |
| Q3 | 43,0 | 43,0 |
Erkenntnis: Tukey orientiert sich am 15-Punkte-Cluster nahe dem unteren Ende, während R-7 die Lücke zwischen 15 und 36 durch Interpolation berücksichtigt. Ihre Algorithmuswahl kann beeinflussen, ob Q1 in ein Benotungsband fällt.
Datensatz B: Wöchentliche Lieferzeit (n = 36)
48, 50, 51, 52, 52, 53, 53, 54, 54, 55, 55, 56, 57, 57, 58, 59, 59, 60,
61, 61, 62, 62, 63, 64, 65, 65, 66, 68, 70, 71, 72, 74, 75, 77, 78, 82 | Kennzahl | Tukey-Scharniere | R-7 Quantil |
|---|---|---|
| Q1 | 54,5 | 54,5 |
| Median | 61,0 | 61,0 |
| Q3 | 68,5 | 68,7 |
Erkenntnis: Größere Stichproben mit mäßiger Schiefe zeigen minimale Unterschiede. Die Verwendung beider Methoden ist akzeptabel, solange der gewählte Standard dokumentiert wird.
5. Entscheidungsrahmen für Ihr Team
Die Abstimmung auf Quartil-Definitionen eliminiert endlose Diskussionen in Dashboards und akademischen Einreichungen. Verwenden Sie diese Checkliste, um eine Methode auszuwählen, die den Erwartungen der Stakeholder entspricht.
Quartil-Auswahl-Checkliste
- Bildung zuerst? Wählen Sie Tukey-Scharniere für AP-Statistik, Einführungskurse und Prüfungen, bei denen das Quartil ein beobachteter Wert sein muss.
- Tool-übergreifende Reproduzierbarkeit? Wählen Sie R-7 bei der Zusammenarbeit mit Teams, die R, NumPy, pandas oder Excels Perzentilfunktionen verwenden.
- Regulatorische Anforderung? Folgen Sie dem vorgeschriebenen Algorithmus (einige Gesundheitsaudits zitieren Tukey; viele Finanzberichte spezifizieren R-7).
- Erklärbarkeit vs. Glätte? Scharniere sind mündlich einfacher zu erklären; R-7 vermeidet Sprünge, wenn eine neue Beobachtung eingefügt wird.
- Dokumentieren Sie die Wahl. Notieren Sie die Methode in Ihrer Dashboard-Legende, im technischen Anhang oder im PlotNerd-Export, um spätere Verwirrung zu vermeiden.
6. Implementierung in PlotNerd
PlotNerds Multi-Algorithmus-Engine ermöglicht es Ihnen, beide Methoden in Sekunden zu validieren. Wechseln Sie zwischen Tukey-Scharnieren und R-7 im Ergebnisbereich, vergleichen Sie Q1/Q3 und exportieren Sie abgestimmte Visualisierungen für das Team.
Probieren Sie den Vergleich live
Fügen Sie einen beliebigen Datensatz ein, wechseln Sie die Algorithmen und laden Sie den SVG-Boxplot für Ihren Bericht herunter.
Tukey-Scharniere-Rechner starten
Beim Aktualisieren der statistischen Logik führen Sie npm run test:coverage aus, um zu bestätigen, dass die Vitest-Suite die in
vitest.config.ts definierten 90/95%-Schwellenwerte einhält.
Die Tests stellen sicher, dass Tukey- und R-7-Ausgaben über Updates von
src/lib/plotnerd-engine.ts und src/lib/multi-algorithm-engine.ts konsistent bleiben.
7. FAQ
Verwendet Excel Tukey-Scharniere oder R-7?
Excels moderne Funktionen (QUARTILE.INC und PERCENTILE.INC) entsprechen der R-7-Methode. Die veraltete QUARTILE-Funktion verhält sich für die meisten Datensätze gleich, wird
aber für die Abwärtskompatibilität beibehalten.
Ändern sich meine Ausreißer, wenn ich die Methode wechsle?
Manchmal. Da der IQR auf Q1 und Q3 basiert, kann Tukey einen etwas engeren Mittelbereich ergeben und mehr Ausreißer am unteren Ende markieren. Dokumentieren Sie immer, welcher Algorithmus den Boxplot erzeugt hat, bevor Sie Schlussfolgerungen ziehen.
Welche Methode ist für standardisierte Prüfungen erforderlich?
Die meisten Abitur- und Bachelor-Prüfungen erwarten Tukey-Scharniere, da die Quartile in Lehrbüchern erscheinen. Angewandte Statistik auf Master-Niveau nimmt typischerweise R-7 an oder gibt den Quantiltyp explizit an.
Wie exportiere ich beide Ergebnisse aus PlotNerd?
Generieren Sie den Datensatz einmal, wechseln Sie die Algorithmen und laden Sie separate SVG-Exporte herunter. Benennen Sie die Dateien um, um die Methode einzuschließen, und hängen Sie sie dann an Ihren Bericht oder Ihr Lernmanagementsystem an.
8. Zusammenfassung & Weiterführende Lektüre
Tukey-Scharniere und R-7 quantifizieren dieselbe Intuition – wo die unteren und oberen Viertel Ihrer Daten liegen – doch ihre Annahmen unterscheiden sich. Wählen Sie Scharniere für Transparenz im Unterricht und R-7 für plattformübergreifende Reproduzierbarkeit. Welche Methode Sie auch wählen, bleiben Sie konsistent und zitieren Sie sie in jeder Lieferung.
Lernen Sie weiter mit diesen PlotNerd-Ressourcen:
Sehen Sie den Unterschied mit Ihren Daten
Verwenden Sie unseren Interaktiven Leitfaden zu Quartil-Berechnungsunterschieden, um Tukey-Scharniere und R-7-Methoden Seite an Seite mit Schritt-für-Schritt-Berechnungen und visuellen Vergleichen zu vergleichen.
Interaktiven Leitfaden öffnen →- Interaktiver Leitfaden zu Quartil-Berechnungsunterschieden – vergleichen Sie alle Methoden mit Ihren Daten
- Wie man mehrere Gruppen mit gruppierten Boxplots vergleicht – lernen Sie, mehrere Datengruppen nebeneinander in einem einzigen Diagramm zu vergleichen.
- MAD vs. Tukey: Die richtige Ausreißer-Erkennungsmethode wählen – vergleichen Sie Ausreißer-Erkennungsmethoden für verschiedene Datenverteilungen.
- Gekerbte Boxplots verstehen – visualisieren Sie statistische Signifikanz mit Median-Konfidenzintervallen.
- Warum gibt es so viele Quartil-Methoden? Ein tiefer Einblick in Tukey-Scharniere – erkunden Sie die Geschichte und Philosophie hinter verschiedenen Quartil-Methoden.
- Wie man einen Boxplot liest: Ein einfacher Leitfaden – interpretieren Sie jedes Element des Box-and-Whisker-Diagramms.