📌 Zusammenfassung

Verschiedene Statistik-Software berechnet Quartile unterschiedlich, was zu verwirrenden Diskrepanzen führt. Dieser Leitfaden erklärt die Hyndman-Fan Klassifikation, vergleicht Methoden Kopf-an-Kopf und hilft Ihnen bei der Auswahl der richtigen Methode.

Warum das wichtig ist: Wenn Sie denselben Datensatz in R, Excel und Python laufen lassen, könnten Sie drei verschiedene Q1-Werte erhalten.

1. Das Problem: Warum Quartil-Ergebnisse variieren

Angenommen, Sie haben diesen einfachen Datensatz:

Daten: [1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25]
N = 13 Werte

Sie berechnen Q1 mit verschiedenen Tools:

Tool	Funktion	Q1 Ergebnis
R	quantile(data, 0.25)	6.0
Python	np.percentile(data, 25)	6.0
Excel	=QUARTILE.INC(range, 1)	7.0
Lehrbuch	Tukey Methode	5.0

⚠️ Gleiche Daten, drei verschiedene Antworten!

Die Antwort: Alle sind "richtig" – sie verwenden nur unterschiedliche Interpolationsmethoden. Keine Methode ist grundsätzlich besser; sie dienen unterschiedlichen Anwendungsfällen.

2. Die Hyndman-Fan Klassifikation

In ihrer bahnbrechenden Arbeit von 1996 identifizierten Hyndman und Fan 9 verschiedene Methoden zur Berechnung von Stichprobenquantilen. Diese werden als Typ 1 bis Typ 9 bezeichnet.

Die häufigsten Methoden

Typ	Name	Verwendet von	Popularität
Typ 6	Tukey Hinges	Lehrbücher, Minitab	Bildung
Typ 7	Lineare Interpolation	R, Julia, NumPy	Data Science Standard
Typ 8	Median Unverzerrt	Excel, Google Sheets	Business Standard
Typ 5	Stückweise Linear	SPSS, SAS	Statistik-Software

Warum so viele?

Jede Methode macht unterschiedliche Annahmen darüber:

Wie Positionen zwischen Datenpunkten behandelt werden (Interpolation)
Ob der Median beim Teilen der Daten ein- oder ausgeschlossen wird
Wie benachbarte Werte gewichtet werden

💡 Wichtige Erkenntnis: Bei großen Datensätzen (N > 100) konvergieren alle Methoden zu fast identischen Ergebnissen. Die Unterschiede betreffen hauptsächlich kleine bis mittlere Datensätze (10 < N < 50).

3. Typ 6: Tukey Hinges (Lehrbuch)

Entwickler

John Tukey (1977)

Philosophie

"Median einschließen"

Mathematik

Median jeder Hälfte

Wie es funktioniert

Beispiel: [1, 3, 5, 7, 9, 11, 13]

Finden Sie den Median: 7 (mittlerer Wert bei N=7)
Untere Hälfte inklusive Median: [1, 3, 5, 7]
Obere Hälfte inklusive Median: [7, 9, 11, 13]
Q1 = Median von [1, 3, 5, 7] = 4
Q3 = Median von [7, 9, 11, 13] = 10

✅ Wann verwenden

Statistik-Hausaufgaben und Lehrbuchprobleme
Erklärung von Quartilen für Anfänger
Manuelle Berechnungen
Befolgung von Einführungskursen in Statistik

❌ Vermeiden

Veröffentlichung von Forschungsergebnissen (nutzen Sie Typ 7)
Arbeit in R/Python (andere Standards)
Konsistenz mit modernen Tools erforderlich

Code-Beispiel

# R (muss explizit type = 6 angeben)

data <- c(1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25)
Q1_tukey <- quantile(data, 0.25, type = 6)
Q3_tukey <- quantile(data, 0.75, type = 6)

print(paste("Q1:", Q1_tukey))  # Output: Q1: 5
print(paste("Q3:", Q3_tukey))  # Output: Q3: 21

🚀 Keine Lust von Hand zu rechnen?

Kostenlosen Tukey-Rechner nutzen →

4. Typ 7: R/Python Standard (Data Science)

Status

Moderner Standard

Philosophie

Lineare Interpolation

Mathematik

q = (1-γ) × x[j] + γ × x[j+1]

Warum Typ 7 der Standard wurde

Glatt und stetig - Keine Sprünge wie bei diskreten Methoden
Unverzerrte Schätzung - Verhält sich gut in der statistischen Theorie
Von R übernommen (1990er) → wurde akademischer Standard
NumPy folgte → wurde Data Science Standard

✅ Perfekt für

Data Science und Machine Learning Projekte
Wissenschaftliche Forschung und Publikationen
Arbeit in R, Python oder Julia
Maximale Präzision und Glätte
Quantil-Regression

⚠️ Alternativen erwägen

Zusammenarbeit mit Excel-Nutzern (nutzen Sie QUARTILE.INC / QUARTILE.EXC)
Muss exakt mit Lehrbüchern übereinstimmen (nutzen Sie Tukey-Scharniere)

Code-Beispiel

# R (Standard)

data <- c(1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25)
Q1 <- quantile(data, 0.25)  # type = 7 ist Standard
Q3 <- quantile(data, 0.75)
print(paste("Q1:", Q1))  # Output: Q1: 6

# Python NumPy (Standard)

import numpy as np
data = [1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25]
Q1 = np.percentile(data, 25)  # default method = 'linear'
print(f"Q1: {'{'}Q1{'}'}")  # Q1: 6.0

5. Excel QUARTILE.INC vs QUARTILE.EXC (Typ 7 vs Typ 6)

QUARTILE.INC

Typ 7 (R-7)

QUARTILE.EXC

Typ 6

Hinweis

Gleiche Daten, andere Indexregel

✅ Perfekt für

Business-Analyse und Reporting
Excel-zentrierte Workflows
Google Sheets Kompatibilität
Zusammenarbeit mit nicht-technischen Teams
Unternehmensumgebungen

⚠️ Alternativen erwägen

Veröffentlichung akademischer Forschung (nutzen Sie Typ 7)
Hauptsächlich Code-basierte Arbeit (R/Python Standards weichen ab)

Code-Beispiel

' Excel

=QUARTILE.INC(A1:A13, 1)  ' Q1 (Typ 7)
=QUARTILE.INC(A1:A13, 2)  ' Q2 (Median)
=QUARTILE.INC(A1:A13, 3)  ' Q3

=QUARTILE.EXC(A1:A13, 1)  ' Q1 (Typ 6)
=QUARTILE.EXC(A1:A13, 2)  ' Q2 (Median)
=QUARTILE.EXC(A1:A13, 3)  ' Q3

📊 Überprüfen Sie Ihre Excel-Ergebnisse sofort

Excel-Quartil-Rechner öffnen →

6. Kopf-an-Kopf-Vergleich

Vergleichen wir fünf Methoden an einem konkreten Beispiel.

SAT Mathe Scores: [480, 510, 530, 560, 600, 620, 650, 680, 710, 750] (N = 10)

Metrik	Tukey-Scharniere	R/Python (Typ 7)	Excel INC (Typ 7)	Excel EXC (Typ 6)	WolframAlpha (R-5)
Q1	530.0	537.5	537.5	525.0	530.0
Median	610.0	610.0	610.0	610.0	610.0
Q3	680.0	672.5	672.5	687.5	680.0
IQR	150.0	135.0	135.0	162.5	150.0

📊 Beobachtungen

Median (Q2) ist meist konsistent über alle Methoden
Q1 variiert von 530 bis 545 (15 Punkte Unterschied!)
IQR variiert von 130 bis 150 (Beeinflusst Ausreißer-Erkennung!)

7. Entscheidungsmatrix: Welche Methode?

Wählen Sie Typ 7 (R/Python Standard)

Schreiben von Data-Science-Code
Veröffentlichung wissenschaftlicher Forschung
Verwendung von R, Python, Julia oder modernen Tools
Reproduzierbarkeit über Plattformen hinweg erforderlich
Arbeit mit kontinuierlichen Daten

Beispiele: Machine-Learning-Pipelines, Akademische Paper, Quantil-Regression

Wählen Sie Typ 8 (Excel)

Business Analyse und Reporting
Zusammenarbeit mit Excel-Nutzern
Workflows im Unternehmensumfeld
Google Sheets Kompatibilität
Nicht-technische Stakeholder

Beispiele: Sales Dashboards, Finanzberichte, Executive Summaries