支持的数据格式:
- 逗号分隔:1.5, 2.8, 9.1, 16.2
- 空格分隔:1.5 2.8 9.1 16.2
- 换行分隔:每行一个数字
- 科学计数法:1.23e-4, 5.67E+8
- 多序列模式:使用「组名: 数值1, 数值2, 数值3」格式,每行一组
- 自动忽略文本和特殊字符
Universal Standard (R, Python, Google Sheets)
Linear interpolation method, default standard for modern data science software
了解更多数据分布知识
什么是 IQR 方法?
IQR 方法(四分位距方法)是一种稳健的统计技术,用于测量数据的离散程度和检测异常值。与标准范围(最大值 - 最小值)不同,标准范围容易被极端值影响,IQR 方法专注于数据集的中间 50%。
它通过计算第三四分位数 ($Q3$) 和第一四分位数 ($Q1$) 之间的差值得出:
IQR = Q3 - Q1
为什么 IQR 很重要?
IQR 被认为是一种稳健统计量,因为它对异常值具有抵抗力。
- 抗偏斜性:如果一个房间里有一位亿万富翁和一群工厂工人,"平均"收入会飙升,但中位数和 IQR 仍然稳定。
- 数据分散程度:IQR 值大表示中间数据点分布较广;IQR 值小表示它们聚集在中位数附近。
使用 IQR 检测异常值
IQR 最常见的应用是"1.5 × IQR 规则"用于异常值检测,通常归功于 John Tukey。
- 计算 IQR ($Q3 - Q1$)。
- 将 IQR 乘以 1.5。
- 下栅栏:$Q1 - (1.5 \times IQR)$
- 上栅栏:$Q3 + (1.5 \times IQR)$
任何低于下栅栏或高于上栅栏的数据点都被视为温和异常值。如果使用 3.0 而不是 1.5 作为乘数,则被视为极端异常值。
PlotNerd 的 IQR 计算器使用稳健的四分位距方法,让异常值检测和数据离散程度测量变得简单。
何时使用此工具
使用 1.5×IQR 规则检测异常值
识别超出 Q1 - 1.5×IQR 和 Q3 + 1.5×IQR 边界的数据点。
测量数据离散程度(对极端值稳健)
IQR 不受异常值影响,非常适合偏斜分布。
箱线图可视化的补充
箱线图使用 IQR 确定须线长度和异常值标记。
不太适合:正态分布数据
对于正态分布,标准差比 IQR 更合适。
常见问题解答
用通俗易懂的语言解释统计学概念
数学公式
查看计算背后的标准数学公式
四分位数计算 (方法2)
第一四分位数 (Q1):
中位数 (Q2):
第三四分位数 (Q3):
四分位距与异常值检测
四分位距 (IQR):
异常值边界:
算法说明
PlotNerd 使用统计学标准的“方法 2 (中位数四分位法)”进行四分位数计算,结果与主流统计软件(如 R, SPSS)一致。所有计算结果均经过严格验证以确保准确性。