📚 Statistik-Geschichte & Methoden

Warum gibt es so viele Quartilsmethoden?
Ein tiefer Einblick in Tukey's Hinges

Vielleicht ist Ihnen schon aufgefallen, dass Excel, R, Python und Ihr Statistik-Lehrbuch Quartile unterschiedlich berechnen. Das ist kein Fehler – das ist eine Eigenheit der statistischen Entwicklung. Begleiten Sie uns durch die faszinierende Geschichte der Quartilsmethoden, mit besonderem Fokus auf Tukey's Hinges und warum sie der Goldstandard für die explorative Datenanalyse bleiben.

Veröffentlicht: 26. September 2025
Aktualisiert: 3. Februar 2026
Lesezeit: 15 Min.
Niveau: Mittel

1. Das Problem: Warum so viele Methoden?

Wenn Sie jemals Quartile in Excel berechnet und dann dieselben Daten in R oder Python überprüft haben, sind Sie wahrscheinlich auf ein frustrierendes Ergebnis gestoßen: Die Zahlen stimmen nicht überein. Das liegt nicht daran, dass eine Software fehlerhaft ist – sondern daran, dass es mindestens neun verschiedene Methoden zur Berechnung von Quartilen gibt, von denen jede ihre eigene mathematische Rechtfertigung hat.

Die grundlegende Herausforderung ist: Quartile sind Perzentile (das 25., 50. und 75. Perzentil), aber wenn sich Ihre Datensatzgröße nicht gleichmäßig teilen lässt, benötigen Sie eine Regel, um zu bestimmen, welcher Wert das 25. Perzentil darstellt. Sollte es ein tatsächlicher Datenpunkt sein? Sollte zwischen zwei Punkten interpoliert werden? Und wenn ja, wie?

💡 Wichtige Erkenntnis

Die Existenz mehrerer Quartilsmethoden spiegelt unterschiedliche philosophische Ansätze in der Statistik wider: Resistente Methoden (wie die von Tukey) priorisieren Robustheit und Interpretierbarkeit, während Interpolationsmethoden (wie R-7) Glätte und rechnerische Konsistenz priorisieren.

2. Die Geburt von Tukey's Hinges: Historische Perspektive

John Tukey (1915-2000) war einer der einflussreichsten Statistiker des 20. Jahrhunderts. Als Mathematiker an der Princeton University und den Bell Labs revolutionierte Tukey die Datenanalyse durch die Einführung von Konzepten, die wir heute als selbstverständlich betrachten: Explorative Datenanalyse (EDA), den Box-Plot und die Fünf-Punkte-Zusammenfassung.

In seinem Buch "Exploratory Data Analysis" von 1977 führte Tukey das ein, was er "Hinges" (Scharniere) nannte – Werte, die die Daten in Viertel teilen. Im Gegensatz zu Interpolationsmethoden ergeben Tukey's Hinges immer Werte, die im ursprünglichen Datensatz vorhanden sind (oder den Durchschnitt einer Teilmenge). Dies macht sie:

  • Interpretierbar: Sie können auf den genauen Datenpunkt zeigen, der Q1 oder Q3 repräsentiert.
  • Resistent: Weniger empfindlich gegenüber Ausreißern als mittelwertbasierte Methoden.
  • Lehrreich: Einfach zu erklären und manuell zu überprüfen.

Tukeys Ansatz wurde zum Standard in der statistischen Ausbildung, weil er damit übereinstimmt, wie Menschen natürlich über das Teilen von Daten denken: Finde die Mitte, dann finde die Mitte jeder Hälfte.

3. Tukey's Hinges erklärt: So funktioniert es

Tukeys Methode ist elegant einfach:

  1. Daten sortieren von klein nach groß.
  2. Median finden (Q2) des gesamten Datensatzes.
  3. Daten am Median teilen:
    • Wenn n gerade ist: Untere Hälfte = die ersten n/2 Werte, Obere Hälfte = die letzten n/2 Werte.
    • Wenn n ungerade ist: Die untere Hälfte beinhaltet den Median, die obere Hälfte beinhaltet ebenfalls den Median (Tukey's inclusive methode).
  4. Q1 = Median der unteren Hälfte
  5. Q3 = Median der oberen Hälfte

Schauen wir uns den Prozess an einem konkreten Beispiel an:

Beispiel: Berechnung von Tukey's Hinges

Daten: [12, 15, 18, 20, 22, 25, 28, 30, 35, 40] (n=10)

  1. Sortiert: Bereits sortiert ✓
  2. Median (Q2): (22 + 25) / 2 = 23.5
  3. Untere Hälfte: [12, 15, 18, 20, 22] → Q1 = 18
  4. Obere Hälfte: [25, 28, 30, 35, 40] → Q3 = 30

Probieren Sie es selbst: Nutzen Sie den PlotNerd Box-Plot-Ersteller, geben Sie diese Daten ein und wählen Sie "Lehrbuchmethode (Tukey's Hinges)", um diese Ergebnisse zu verifizieren.

4. Methodenübersicht: R-7, Excel, WolframAlpha & Co.

Während Tukey's Hinges der Bildungsstandard bleiben, haben verschiedene Softwarepakete aus praktischen Gründen unterschiedliche Ansätze gewählt:

Methode Verwendet von Hauptmerkmale Wann verwenden
Tukey's Hinges Statistik-Lehrbücher, AP Statistics, SPSS (Option Tukey) Ergibt immer tatsächliche Datenwerte Lehre, explorative Analyse, wenn Interpretierbarkeit zählt
R-7 (Lineare Interpolation) R (Standard), Python NumPy (Standard), Google Sheets QUARTILE.EXC Glatte Interpolation: h = (n-1) × p + 1 Data-Science-Workflows, reproduzierbare Forschung
Excel QUARTILE.INC Microsoft Excel, LibreOffice Calc Inklusive Methode: h = (n+1) × p Geschäftsberichte, Excel-basierte Workflows
WolframAlpha (R-5) WolframAlpha, Mathematica Hydrologische Methode: h = n × p + 0.5 Mathematische Verifikation, akademische Forschung

Die Vermehrung der Methoden ist kein Chaos – es ist Evolution. Jede Methode entstand, um ein bestimmtes Problem zu lösen:

  • R-7 wurde zum Data-Science-Standard, weil sie rechnerisch effizient ist und glatte, kontinuierliche Ergebnisse liefert.
  • Die Excel-Methode priorisiert die Kompatibilität mit Geschäftsanwendern, die inklusive Perzentile erwarten.
  • WolframAlphas R-5 stimmt mit mathematischer Software überein, die Präzision priorisiert.
  • Tukey's Hinges bleiben der Lehrstandard, weil sie intuitiv und überprüfbar sind.

5. Wann Tukey's Hinges verwenden: Praktische Anwendung

Tukey's Hinges glänzen in spezifischen Szenarien, in denen Interpretierbarkeit und Resistenz gegenüber Ausreißern wichtiger sind als rechnerische Glätte:

✅ Nutzen Sie Tukey's Hinges wenn:

  • Sie Statistik oder Datenanalyse unterrichten
  • Bei der explorativen Datenanalyse (EDA)
  • Kleine bis mittlere Datensätze, bei denen jeder Punkt zählt
  • Wenn Sie Ergebnisse nicht-technischen Stakeholdern erklären müssen
  • Wenn Ausreißer ein Problem sind und Sie resistente Statistiken wollen
  • Wenn Sie Berechnungen manuell überprüfen müssen

⚠️ Erwägen Sie andere Methoden wenn:

  • Sie sehr große Datensätze verarbeiten (n > 10.000)
  • Integration in R/Python Data-Science-Pipelines
  • Wenn glatte, kontinuierliche Quartilswerte benötigt werden
  • Wenn Excel-Kompatibilität entscheidend ist
  • Wenn Sie Ergebnisse einer spezifischen Software matchen müssen

6. Praxisbeispiel: Sehen Sie den Unterschied

Schauen wir uns an, wie verschiedene Methoden unterschiedliche Ergebnisse für denselben Datensatz liefern:

Beispieldatensatz: Schüler-Testergebnisse

Daten: [65, 72, 75, 78, 80, 82, 85, 88, 90, 95, 100] (n=11)

Methode Q1 Q2 (Median) Q3
Tukey's Hinges 75 82 90
R-7 (Linear) 74.5 82 90.5
Excel QUARTILE.INC 75.5 82 90.5
WolframAlpha (R-5) 74.25 82 90.75

Hinweis: Alle Methoden stimmen beim Median (82) überein, unterscheiden sich aber bei Q1 und Q3. Tukey's Hinges ergeben Ganzzahlen (75, 90), die tatsächliche Datenpunkte sind, während Interpolationsmethoden Dezimalwerte liefern.

Probieren Sie es selbst: Kopieren Sie diese Daten in den PlotNerd Box-Plot-Ersteller, um zwischen den Algorithmen zu wechseln und die Unterschiede live zu sehen.

7. Methoden vergleichen mit PlotNerd

Eine der Herausforderungen bei mehreren Quartilsmethoden ist sicherzustellen, dass Ihr Team dieselben Methoden verwendet, um Konsistenz zu wahren. PlotNerd löst dies, indem es alle modernen Quartilsalgorithmen an einem Ort unterstützt und Ihnen ermöglicht:

  • Vergleichen Sie Ergebnisse sofort zwischen verschiedenen Methoden
  • Verifizieren Sie Berechnungen gegen Excel, R, Python oder WolframAlpha
  • Teilen Sie Permalinks, die Ihre Daten und die gewählte Methode beibehalten
  • Exportieren Sie Ergebnisse mit Methoden-Wasserzeichen für die Dokumentation

🎯 Bereit, Quartilsmethoden zu erkunden?

Jetzt, da Sie verstehen, warum es so viele Quartilsmethoden gibt und die Geschichte hinter Tukey's Hinges kennen, warum wenden Sie dieses Wissen nicht an?

8. Häufig gestellte Fragen (FAQ)

Frage: Welche Quartilsmethode ist die "richtige"?

Antwort: Alle Methoden sind mathematisch gültig – sie treffen lediglich unterschiedliche Annahmen darüber, wie Werte zwischen Datenpunkten behandelt werden sollen. Die "richtige" Methode hängt von Ihrem Kontext ab: Nutzen Sie Tukey's Hinges für Lehre und EDA, R-7 für Data Science, und die Excel-Methode für Geschäftsberichte.

Frage: Warum liefert Tukeys Methode immer Ganzzahlen?

Antwort: Tukey's Hinges ergeben immer Werte, die im Datensatz vorhanden sind (oder den Durchschnitt einer Teilmenge). Das ist beabsichtigt (Design) – es macht die Methode interpretierbarer und robuster, aber weniger "glatt" als Interpolationsmethoden.

Frage: Sollte ich Tukey's Hinges in einer Forschungsarbeit verwenden?

Antwort: Das hängt von Ihrem Fachgebiet und Publikum ab. In der statistischen Ausbildung und explorativen Datenanalyse sind Tukey's Hinges Standard. In Data Science und rechnergestützten Feldern ist R-7 üblicher. Geben Sie im Methodenteil immer an, welche Methode Sie verwendet haben.

9. Fazit: Das richtige Werkzeug wählen

Die Vielfalt der Quartilsmethoden ist kein Fehler der Statistik – sie ist ein Feature. Jede Methode hat ihren Platz:

  • Tukey's Hinges für Interpretierbarkeit und Robustheit.
  • R-7 Interpolation für rechnerische Glätte und Data-Science-Kompatibilität.
  • Excel-Methoden für Geschäftsanforderungen.
  • WolframAlpha (R-5) für mathematische Präzision.

Zu verstehen warum diese Methoden existieren und wann man welche verwendet, verwandelt die Quartilsberechnung von einer Quelle der Verwirrung in ein mächtiges Analysewerkzeug.

📚 Kernaussage

Die beste Quartilsmethode ist diejenige, die zu Ihrem Kontext passt: Nutzen Sie Tukey's Hinges wenn Interpretierbarkeit wichtig ist, und R-7 für Data-Science-Pipelines. Dokumentieren Sie immer Ihre Wahl.

📖 Verwandte Artikel & Tools