Statistische Methoden

MAD vs. Tukey:
Die richtige Methode wählen

Nicht alle Methoden zur Ausreißererkennung sind gleich. Erfahren Sie, wann Sie MAD (Mittlere absolute Abweichung) und wann Tukeys 1,5×IQR Methode nutzen sollten, wie sie funktionieren und welche sich besser für verschiedene Datenverteilungen eignet.

Veröffentlicht: 27. August 2025
Aktualisiert: 3. Februar 2026
Lesezeit: 14 Min.
Niveau: Mittel

1. Was sind Ausreißer und warum sind sie wichtig?

Ausreißer sind Datenpunkte, die signifikant vom Rest des Datensatzes abweichen. Sie können Folgendes darstellen:

  • Eingabefehler: Tippfehler, falsche Dezimalstellen oder Messfehler.
  • Seltene Ereignisse: Legitime, aber ungewöhnliche Beobachtungen (z.B. ein Schüler mit 100% in einer schweren Prüfung).
  • Messfehler: Gerätefehlfunktionen oder Umweltfaktoren.
  • Echte Anomalien: Wahre, aber außergewöhnliche Werte, die untersucht werden müssen.

Das Erkennen von Ausreißern ist entscheidend, denn sie können:

  • Ihre Statistiken verzerren: Ausreißer können Mittelwert und Standardabweichung drastisch ändern.
  • Ihre Analyse fehlleiten: Sie können Muster verbergen oder falsche Muster erzeugen.
  • Untersuchungen anstoßen: Den Grund für einen Ausreißer zu verstehen, kann wichtige Erkenntnisse liefern.

2. Tukeys 1,5×IQR Methode im Detail

Die Tukey-Methode (auch 1,5×IQR-Regel) ist die am häufigsten verwendete Methode in Box-Plots. Sie wurde in den 1970ern von John Tukey für die explorative Datenanalyse entwickelt.

Funktionsweise

  1. Berechnen Sie Q1 (1. Quartil) und Q3 (3. Quartil)
  2. Berechnen Sie den IQR (Interquartilsabstand) = Q3 - Q1
  3. Berechnen Sie den Unteren Zaun = Q1 - 1,5 × IQR
  4. Berechnen Sie den Oberen Zaun = Q3 + 1,5 × IQR
  5. Jeder Punkt, der kleiner als der untere oder größer als der obere Zaun ist, ist ein Ausreißer.

Beispiel

Wenn Q1 = 20, Q3 = 40, dann ist IQR = 20

Unterer Zaun = 20 - 1,5 × 20 = -10

Oberer Zaun = 40 + 1,5 × 20 = 70

Jeder Wert unter -10 oder über 70 ist ein Ausreißer.

Vor- und Nachteile

Vorteile

  • Einfach und intuitiv
  • Weit verbreitet und akzeptiert
  • Gut für symmetrische Daten
  • Standard für Box-Plots
  • Schnell zu berechnen

Grenzen

  • Setzt symmetrische Verteilung voraus
  • Markiert evtl. zu viele Punkte bei schiefen Daten
  • Empfindlich bei extremen Ausreißern
  • Kann Ausreißer bei schiefen Verteilungen übersehen

3. MAD (Mittlere absolute Abweichung) im Detail

MAD (Median Absolute Deviation) ist eine robuste Methode, die oft besser für schiefe oder asymmetrische Daten geeignet ist als Tukey. Sie basiert auf dem Median statt Quartilen, was sie widerstandsfähiger gegen Ausreißer macht.

Funktionsweise

  1. Berechnen Sie den Median der Daten
  2. Berechnen Sie die absolute Abweichung jedes Werts vom Median: |Wert - Median|
  3. Berechnen Sie die MAD = Median der absoluten Abweichungen
  4. Nutzen Sie MAD als Skalierung für modifizierte Z-Scores
  5. Jeder Punkt mit |modifiziertem Z-Score| > Schwellenwert (meist 3,5) ist ein Ausreißer

Beispiel

Wenn Median = 25, MAD = 5, Schwelle = 3,5

Für Wert 45: Mod. Z-Score = (45 - 25) / 5 = 4,0

Da |4,0| > 3,5 ist dieser Wert ein Ausreißer.

Vor- und Nachteile

Vorteile

  • Robust gegen Ausreißer (nutzt Median)
  • Gut für schiefe Daten
  • Weniger empfindlich bei Extremwerten
  • Besser für asymmetrische Verteilungen
  • Genauer bei nicht-normalen Daten

Grenzen

  • Weniger bekannt als Tukey
  • Etwas komplexer zu erklären
  • Schwellenwert-Wahl nötig (meist 3,5)
  • Für manche Anwendungen zu konservativ

4. Direkter Vergleich

Aspekt Tukey (1,5×IQR) MAD
Basis Quartile (Q1, Q3) Median & Absolute Abw.
Ideal für Symmetrische, fast normale Verteilung Schiefe, asymmetrische Verteilung
Robustheit Mittel (nutzt Quartile) Hoch (nutzt Median)
Komplexität Einfach (leicht erklärbar) Mittel (benötigt Schwellenwert)
Verbreitung Sehr häufig (Box-Plot Standard) Seltener (steigend)
Schwelle Fest (1,5 × IQR) Konfigurierbar (meist 3,5)

5. Wann welche Methode nutzen?

Nutzen Sie Tukey, wenn:

  • Ihre Daten grob symmetrisch sind
  • Sie Standard-Box-Plots erstellen
  • Sie eine einfache, bekannte Methode brauchen
  • Ihr Publikum traditionelle Box-Plots erwartet
  • Sie normalverteilte Daten haben
  • Sie Industriestandards folgen wollen

Nutzen Sie MAD, wenn:

  • Ihre Daten schief oder asymmetrisch sind
  • Sie viele Ausreißer haben, die Quartile verzerren könnten
  • Sie eine robustere Methode brauchen
  • Sie nicht-normale Daten analysieren
  • Sie bessere Genauigkeit bei Schiefe brauchen
  • Sie potenziell kontaminierte Daten analysieren

6. Praxisbeispiele

Beispiel 1: Symmetrische Daten (Tukey bevorzugt)

Szenario: Gut gestaltete Prüfungsergebnisse (ca. normal).

Daten:

75, 78, 80, 82, 85, 87, 90, 92, 95, 98

Ergebnis: Beide Methoden funktionieren, aber Tukey ist hier einfacher und standardisierter.

→ Im Ausreißer-Rechner testen (Methoden umschalten) →

Beispiel 2: Schiefe Daten (MAD bevorzugt)

Szenario: Einkommensdaten (rechtsschief, wenige Top-Verdiener).

Daten:

30, 35, 40, 45, 50, 55, 60, 65, 70, 200

Ergebnis: MAD ist hier robuster. Tukey könnte 200 als Ausreißer markieren, aber MAD berücksichtigt die Gesamtverteilung besser.

→ Beispiel im Rechner vergleichen →

Beispiel 3: Viele Ausreißer

Szenario: Sensorwerte mit möglichen Messfehlern.

Daten:

12,1; 12,3; 12,5; 12,7; 12,9; 13,1; 13,3; 50,0; 55,0; 60,0

Ergebnis: MAD ist robuster, da es den Median nutzt, der weniger von Ausreißern beeinflusst wird. Es erkennt echte Ausreißer in kontaminierten Daten besser.

→ Im Rechner testen (beide Methoden) →

7. Häufig gestellte Fragen (FAQ)

F: Welche Methode ist genauer?

A: Keine ist immer "genauer". Tukey ist besser bei symmetrischen, beinahe normalen Daten. MAD ist besser bei schiefen oder nicht-symmetrischen Daten. Die "beste" Methode hängt von Ihrer Datenverteilung ab.

F: Kann ich beide Methoden in PlotNerd nutzen?

A: Ja! PlotNerds Ausreißer-Rechner erlaubt das Umschalten zwischen Tukey und MAD in Echtzeit. So können Sie vergleichen, wie jede Methode Ausreißer erkennt.

F: Welchen MAD-Schwellenwert nutzt PlotNerd?

A: PlotNerd nutzt standardmäßig 3,5 für die MAD-Erkennung, wie in der Literatur oft empfohlen. Jeder Punkt mit einem modifizierten Z-Score über 3,5 gilt als Ausreißer.

8. Fazit

Die Wahl zwischen Tukey (1,5×IQR) und MAD hängt von Ihren Daten ab:

  • Tukey für symmetrische, fast normale Daten und Standard-Box-Plots.
  • MAD für schiefe, asymmetrische Daten oder wenn Sie sehr robuste Erkennung brauchen.

Mit PlotNerd können Sie beide Methoden live vergleichen und sehen, wie sie auf Ihre speziellen Daten reagieren.

Bereit, Methoden zu testen?

Probieren Sie PlotNerds Ausreißer-Rrechner aus und sehen Sie, wie Tukey und MAD bei Ihren Daten abschneiden.

Ausreißer-Rechner starten

Verwandte Artikel

Verwandte Tools

Auch interessant