Ausreißer finden mit der
IQR-Methode (Anleitung)
Verstehen Sie, wie die Interquartilsabstands-Methode (IQR) Quartile und Tukey-Zäune nutzt, um Ausreißer zu identifizieren. Folgen Sie den Schritt-für-Schritt-Berechnungen und vergleichen Sie IQR mit anderen robusten Erkennungstechniken.
1. Was ist die IQR-Methode?
Die Interquartilsabstands-Methode (IQR) erkennt Ausreißer, indem sie die mittleren 50% eines Datensatzes misst. Sie nutzt Quartile (Q1 und Q3), um Datenpunkte zu identifizieren, die signifikant unter oder über dem Großteil der Werte liegen.
Die IQR-basierte Erkennung ist weit verbreitet, da sie nicht-parametrisch ist (keine Normalverteilung voraussetzt) und robust gegenüber Extremwerten ist.
Wichtige Formel
IQR = Q3 - Q1
Q1 ist das 25. Perzentil, Q3 ist das 75. Perzentil.
2. Schritt-für-Schritt-Berechnung
Der Arbeitsablauf
- Datensatz sortieren: Aufsteigend ordnen.
- Q1 berechnen (Unteres Quartil): Der Median der unteren Datenhälfte.
- Q3 berechnen (Oberes Quartil): Der Median der oberen Datenhälfte.
- IQR berechnen: Subtrahieren Sie Q1 von Q3.
Beispieldaten
Daten: [12, 14, 16, 19, 22, 24, 27, 35]
Q1 = Median von [12, 14, 16, 19] = (14 + 16) / 2 = 15
Q3 = Median von [22, 24, 27, 35] = (24 + 27) / 2 = 25,5
IQR = 25,5 - 15 = 10,5
3. Tukey-Zäune und Klassifizierung
Tukey-Zäune definieren die Grenzen, jenseits derer Datenpunkte als Ausreißer gelten. Der Standardmultiplikator ist 1,5×IQR für "mäßige" Ausreißer und 3,0×IQR für "extreme" Ausreißer.
Standard-Zäune (Mäßig)
- Unterer Zaun: Q1 - 1,5 × IQR
- Oberer Zaun: Q3 + 1,5 × IQR
- Punkte außerhalb = Potenzielle Ausreißer
Erweiterte Zäune (Extrem)
- Unterer extremer Zaun: Q1 - 3 × IQR
- Oberer extremer Zaun: Q3 + 3 × IQR
- Punkte außerhalb = Extreme Ausreißer
Hinweis
Der 1,5×IQR Multiplikator ist eine Konvention, keine feste Regel. Für sensible Bereiche wie Finanzen oder Medizin sollten Sie den Multiplikator anpassen oder mit robusten Methoden wie der MAD-Ausreißererkennung vergleichen.
4. Rechenbeispiele
Beispiel 1: Qualitätskontrolle
Szenario: Sensor-Messwerte (in mm): [10,1; 10,3; 10,4; 10,5; 10,6; 10,7; 10,9; 12,0]
- Q1 = 10,35; Q3 = 10,8 → IQR = 0,45
- Unterer Zaun = 10,35 - 1,5 × 0,45 = 9,675
- Oberer Zaun = 10,8 + 1,5 × 0,45 = 11,475
- Wert 12,0 ist größer als Oberer Zaun → Ausreißer
Beispiel 2: Kundenausgaben
Szenario: Monatsausgaben von 12 Kunden (USD): [120, 140, 155, 160, 170, 175, 180, 190, 205, 210, 225, 500]
- Q1 = 157,5; Q3 = 205 → IQR = 47,5
- Oberer Zaun = 205 + 1,5 × 47,5 = 276,25
- Wert 500 ist ein Ausreißer → Auffällige Ausgabe untersuchen
5. Vorteile & Grenzen
Vorteile
- Robust gegenüber Extremwerten
- Keine Verteilungsannahmen (nicht-parametrisch)
- Einfach zu interpretieren und implementieren
- Basis für Standard-Box-Plots
- Funktioniert bei schiefen Verteilungen
Grenzen
- Setzt konsistente Skalierung voraus
- Schwellenwert (1,5×IQR) muss evtl. angepasst werden
- Kann gültige Cluster von Extremwerten verfehlen
- Nicht ideal für sehr kleine Stichproben
6. IQR vs. Andere Methoden
| Methode | Ideal für | Stärke | Hinweis |
|---|---|---|---|
| IQR (1,5×) | Allzweck, schiefe Daten | Robust, verständlich | Schwellenwert anpassbar |
| MAD | Stark schiefe Daten | Sehr robust (Median-basiert) | Weniger intuitiv, benötigt Z-Score-Korrektur |
| Z-Score | Normalverteilte Daten | Einfach zu berechnen | Empfindlich gegenüber Ausreißern |
| Perzentil-Regel | Feste Grenzen (z.B. 1%/99%) | Flexibel | Benötigt Fachwissen |
Kombinieren Sie IQR mit MAD-Erkennung, oder aktivieren Sie gekerbte Box-Plots in PlotNerd, um statistische Signifikanz hervorzuheben.
7. Checkliste zur Umsetzung
- Stellen Sie sicher, dass Daten numerisch und valide sind
- Entscheiden Sie: Ausreißer behalten oder ausschließen?
- Dokumentieren Sie den verwendeten Multiplikator (1,5× oder anders)
- Berichten Sie zentrale Tendenz und Streuung (siehe Mittelwert vs Median vs Modus).
- Vergleichen Sie bei "Heavy-Tail"-Daten IQR mit MAD
- Visualisieren Sie Ergebnisse in PlotNerd
8. Häufig gestellte Fragen (FAQ)
Frage: Kann ich den 1,5× Multiplikator ändern?
Antwort: Ja. Passen Sie ihn basierend auf Ihrer Toleranz an. Für stark regulierte Branchen eventuell 1,0×. Für explorative Analysen kann 2,0× Fehlalarme reduzieren.
Frage: Funktioniert IQR bei kleinen Datensätzen?
Antwort: Bei Stichproben unter 8 ist IQR weniger zuverlässig. Nutzen Sie hier besser Fachwissen oder sammeln Sie mehr Daten.
Frage: Wie geht IQR mit schiefen Daten um?
Antwort: IQR funktioniert gut bei Schiefe, da es auf Quartilen basiert. Bei extremer Schiefe vergleichen Sie die Ergebnisse mit der MAD-Erkennung.
Frage: Kann ich die IQR-Erkennung automatisieren?
Antwort: Ja. Nutzen Sie PlotNerds Rechner oder implementieren Sie IQR-Logik in Code (R, Python, Excel). Dokumentieren Sie Multiplikatoren für Audits.
9. Fazit
Die IQR-Methode ist ein verlässlicher Startpunkt für die Ausreißererkennung. Sie balanciert Einfachheit mit Robustheit und ist ideal für explorative Datenanalyse, Berichte und automatisierte Qualitätschecks.
Kombinieren Sie IQR mit Visualisierungen wie Box-Plots und anderen Metriken (MAD, Z-Score), um Erkenntnisse effektiv zu validieren und zu kommunizieren.
Bereit, Ausreißer zu erkennen?
Nutzen Sie PlotNerds IQR-Ausreißer-Rechner, um Quartile, IQR und Zäune sofort nach der Tukey-Methode zu berechnen. Unterstützt auch die robuste MAD-Methode.
IQR-Ausreißer-Rechner öffnenVerwandte Artikel
- → MAD vs. Tukey: Die richtige Methode wählen
- → Was sind Quartile? Einsteigerleitfaden
- → Gekerbte Box-Plots verstehen
- → Gruppenvergleich mit Box-Plots
- → Wie man einen Box-Plot liest
- → Box-Plots in Excel (2026)
Nützliche Tools
- → Ausreißer-Rechner – Tukey & MAD Methoden vergleichen
- → Quartil-Rechner – Box-Plots erstellen