异常值检测计算器

使用 IQRMAD 方法 快速识别数据集中的离群点

🔍 检测方法对比

IQR 规则

  • • 下界: Q1 - 1.5×IQR
  • • 上界: Q3 + 1.5×IQR
  • • 简单直观,广泛使用

MAD 方法

  • • 基于中位数绝对偏差
  • • 对极端值更稳健
  • • 适合偏斜分布数据
等待数据输入...
🔒 100% 本地计算,数据绝不离开您的浏览器

支持的数据格式:

  • 逗号分隔:1.5, 2.8, 9.1, 16.2
  • 空格分隔:1.5 2.8 9.1 16.2
  • 换行分隔:每行一个数字
  • 科学计数法:1.23e-4, 5.67E+8
  • 多序列模式:使用「组名: 数值1, 数值2, 数值3」格式,每行一组
  • 自动忽略文本和特殊字符

Universal Standard (R, Python, Google Sheets)

Linear interpolation method, default standard for modern data science software

R (type=7) Python NumPy Google Sheets QUARTILE.EXC
Interpolated Values
Medium Complexity

计算结果和箱线图将在这里实时展示

请在上方输入至少 4 个数字开始计算

什么是异常值?

异常值(Outlier)是指与数据集中其他观测值差异显著的数据点。 异常值可能由测量误差、数据录入错误或真实的极端情况造成。

IQR 异常值检测方法

IQR(四分位距)方法是最常用的异常值检测技术之一:

  1. 计算 Q1(第一四分位数)和 Q3(第三四分位数)
  2. 计算 IQR = Q3 - Q1
  3. 确定下边界 = Q1 - 1.5 × IQR
  4. 确定上边界 = Q3 + 1.5 × IQR
  5. 任何超出这些边界的值都是潜在异常值

MAD 异常值检测方法

MAD(中位数绝对偏差)是一种更稳健的异常值检测方法:

  • 计算数据的中位数
  • 计算每个数据点与中位数的绝对偏差
  • MAD = 这些偏差的中位数
  • 异常值阈值通常设为 3 × MAD

何时使用哪种方法?

场景 推荐方法
正态分布数据 IQR 或 MAD 均可
高度偏斜数据 MAD 更稳健
多个异常值集群 MAD 更可靠
与箱线图配合使用 IQR(标准方法)

常见问题解答

用通俗易懂的语言解释统计学概念

数学公式

查看计算背后的标准数学公式