PlotNerd vs The Rest: Warum unsere Berechnungen genauer sind
Viele Statistik-Rechner sehen identisch aus. Der Unterschied steckt in den “langweiligen” Details: Floating-Point-Arithmetik, Quantil-Definitionen (Type 6/7) und Verifizierbarkeit. Dieser Artikel macht die technische Grundlage sichtbar—damit Ergebnisse nicht nur schnell, sondern auch nachvollziehbar und reproduzierbar sind.
TL;DR
- Abweichungen zwischen Rechnern sind normal, weil „Quartile“ eine Familie von Definitionen sind (Typ 6 vs Typ 7 usw.) — keine einzige universelle Formel.
- Floating-Point-Fehler sind real. PlotNerd nutzt Kahan-Summation (kompensierte Summation), um Präzisionsverlust beim Aggregieren zu reduzieren.
- PlotNerd ist für Verifizierung gebaut: Excel
QUARTILE.INC/QUARTILE.EXC, Rquantile(..., type=7)/type=6und WolframAlpha-ähnliche Ergebnisse sind verfügbar und vergleichbar.
1) Warum Rechner abweichen
Wenn du denselben Datensatz in Excel, R, Python/NumPy und einige Online- Rechner kopierst, ist es üblich, unterschiedliche Q1/Q3 zu sehen — selbst wenn alle „Quartile“ berechnen.
Ursache A: Unterschiedliche Quantil-Definitionen
Die Hyndman–Fan-Taxonomie (1996) definiert mehrere Algorithmen für Stichproben-Quantile. „Typ 6“ und „Typ 7“ sind beide gültig — nur unterschiedlich.
Ursache B: Floating-Point-Arithmetik
Computer stellen die meisten Dezimalzahlen nur näherungsweise dar. Summieren oder Interpolieren vieler Werte kann winzige Fehler verstärken — es sei denn, man nutzt numerisch stabile Verfahren.
Wenn du erst das Gesamtbild willst, starte mit: Quartil-Berechnungsmethoden im Vergleich und dem Algorithmus-Auswahlleitfaden.
2) Kahan-Summation: Genauigkeit für Summen & Mittelwerte
Eine naive Summe (reduce((a,b) => a + b)) kann kleine
Werte verlieren, wenn die laufende Summe sehr groß wird. Kahan-Summation
führt einen „Kompensations“-Term, um einen Teil dieser verlorenen
Präzision zurückzuholen.
// Ein klassisches Cancellation-Pattern
values = [1e16, 1, 1, -1e16]
naiveSum(values) // -> 0 (verliert die zwei 1er)
kahanSum(values) // -> 2 (holt sie zurück) PlotNerd nutzt kompensierte Summation für zentrale Aggregate (wie Summe und Mittelwert), damit du seltener „mysteriöses“ Rundungsdriften siehst — besonders in Datensätzen mit stark gemischten Größenordnungen (z.B. Messdaten oder Finanzdaten mit großen Totals und kleinen Korrekturen).
3) Typ 6 vs Typ 7: QUARTILE.EXC vs QUARTILE.INC
Wenn Leute „Excel-Quartile“ sagen, meinen sie oft QUARTILE.INC.
Excel hat aber auch QUARTILE.EXC. Diese entsprechen
unterschiedlichen Quantil-Typen und können auf kleinen Stichproben
sichtbar unterschiedliche Q1/Q3 liefern.
| Methode | Indexregel | Typischer Match |
|---|---|---|
| Typ 7 (R/Python Standard) | h = (n − 1) · p + 1 |
R type=7, NumPy method="linear",
Excel QUARTILE.INC |
| Typ 6 (Excel-EXC-Stil) | h = (n + 1) · p |
Excel QUARTILE.EXC, ältere Spreadsheet-Templates
|
Wenn dein Ziel Reproduzierbarkeit über Software hinweg ist, solltest du die Methode benennen — nicht nur „Quartile“ schreiben. PlotNerd zeigt beide Excel-Modi, damit Teams Berichtskonventionen ohne Rätselraten treffen können.
Direkt ausprobieren: Excel-Quartil-Rechner (INC/EXC) und Perzentil-Rechner (Typ 6/7).
4) Wie PlotNerd Ergebnisse verifizierbar macht
Den richtigen Algorithmus wählen
Nutze den Methodenselektor passend zu deiner Umgebung: R/Python (Typ 7), Excel INC/EXC, Tukey-Hinges oder WolframAlpha-Stil.
Software-Vergleich öffnen →Extern verifizieren (falls nötig)
PlotNerd kann Verifizierungsformeln/-Snippets erzeugen, damit du Quartile in Excel/R/Python reproduzieren oder mit WolframAlpha abgleichen kannst.
Über Software-Unterschiede lesen →Praktischer Workflow (empfohlen)
- Lege die Zielumgebung fest (Excel-Report vs. R/Python-Analyse).
- Wähle die passende Methode in PlotNerd.
- Wenn Ergebnisse auditierbar sein müssen, klicke „Verify Results“ und speichere Formel/Code in deinen Analyse-Notizen.
5) FAQ
Ist QUARTILE.INC Typ 7 oder Typ 6?
In PlotNerd entspricht QUARTILE.INC der Typ-7-Regel (R-7)
mit linearer Interpolation. QUARTILE.EXC entspricht einer
Typ-6-ähnlichen Regel.
Warum unterscheiden sich Typ 6 und Typ 7 bei kleinen Datensätzen stärker?
Bei kleinem n verschiebt eine andere Indexregel die
Zielposition über diskrete Ränge hinweg, sodass die Interpolation
auf unterschiedlichen Segmenten der sortierten Daten landet.
Macht Kahan-Summation Ergebnisse „exakt“?
Nein. Sie reduziert numerische Fehler in Summen/Mittelwerten, kann aber nicht alle Floating-Point-Grenzen beseitigen. Denk an „stabiler“, nicht „perfekt“.
Welche Methode sollte ich für wissenschaftliche Publikationen verwenden?
Wenn dein Pipeline-Standard R/Python ist, ist Typ 7 der häufigste Default. Wichtig ist, die Methode im Methodenteil explizit anzugeben.
Welche Methode sollte ich für Excel-basierte Reports verwenden?
Nutze QUARTILE.INC, wenn dein Spreadsheet das verwendet.
Wenn du ein Template geerbt hast, das QUARTILE.EXC nutzt,
dann match das stattdessen.
Kann ich Methoden nebeneinander vergleichen?
Ja — nutze die Vergleichsmodule und sieh, wie sich Q1/Q3/IQR je nach Methode verschieben. Starte mit Quartil-Methoden im Vergleich.
Was ist, wenn mein Datensatz Wiederholungen hat oder diskret ist (z.B. 1–5 Umfragen)?
Diskrete Daten haben oft „flache“ Bereiche, in denen viele Ränge gleich sind. Quartil-Differenzen können kleiner werden oder verschwinden; der IQR kann 0 sein, wenn Q1 = Q3.
Wo kann ich lernen, die Ausgabe zu interpretieren?
Starte mit Boxplots lesen lernen und Tukey vs R-7.
6) Methodik & Randfälle (EEAT)
- Input-Validierung: PlotNerd benötigt mindestens 4 endliche numerische Werte für Quartile.
- Rundung: Die UI rundet für Lesbarkeit (epsilon-aware). Intern wird die volle Floating-Point-Präzision genutzt und erst am Ende gerundet.
- Degenerierte Fälle: Wenn alle Werte identisch sind, kollabieren Quartile (Q1 = Median = Q3).
- Auditierbarkeit: Wenn du einen Prüfpfad brauchst, speichere den generierten Verifizierungscode/die Formel zusammen mit deinem Datensatz.
Disclaimer: Dieser Artikel ist edukativ und ersetzt keine domänenspezifische statistische Begutachtung. Folge immer den Konventionen deines Kurses, Journals oder deiner Organisation.
7) Quellen
- Kahan-Summation (kompensierte Summation) — klassische Technik zur Verbesserung der Summationsgenauigkeit in Floating-Point.
- Hyndman, R. J., & Fan, Y. (1996) — Sample Quantiles und die Type-1–9- Taxonomie.
-
Microsoft-Excel-Dokumentation — Definitionen von
QUARTILE.INCundQUARTILE.EXC.
8) Update-Log
- 2026-02-24: Veröffentlicht. Kahan-Summation ergänzt und Zuordnung Typ 6 vs Typ 7 für Excel INC/EXC klargestellt.