支持的数据格式:
- 逗号分隔:1.5, 2.8, 9.1, 16.2
- 空格分隔:1.5 2.8 9.1 16.2
- 换行分隔:每行一个数字
- 科学计数法:1.23e-4, 5.67E+8
- 多序列模式:使用「组名: 数值1, 数值2, 数值3」格式,每行一组
- 自动忽略文本和特殊字符
Universal Standard (R, Python, Google Sheets)
Linear interpolation method, default standard for modern data science software
计算结果和箱线图将在这里实时展示
请在上方输入至少 4 个数字开始计算
计算结果
基本统计量
四分位数
五数概括
检测到异常值
以下数据点被 方法识别为异常值:
分组序列汇总
输入数据以生成箱线图
请在上方输入至少 4 个数字开始计算
箱线图可视化
此箱线图可视化了您的数据分布。箱体显示包含中间 50% 数据的四分位距 (IQR)。箱内的线代表中位数。须线延伸显示范围,红点表示异常值。
异常值检测: Tukey 法 (1.5×IQR)
箱体 (IQR) / Legend
- 箱体 (IQR)
- 中位数线
- 须线
- 异常值
综合摘要
什么是 Tukey 铰链法?
Tukey 铰链法是一种由传奇统计学家 John Tukey 开发的特定四分位数计算方法。它广泛用于统计学入门教科书,是手动绘制箱线图的标准方法。
Tukey 方法的工作原理
与 R(Type 7)或 Python NumPy 使用的现代线性插值方法不同,Tukey 方法基于"铰链"概念,本质上是数据下半部分和上半部分的中位数。
- 排序数据:将数据集按升序排列。
- 找到中位数:在中位数处将数据分成两半。
- 包含与排除:
- 如果数据集有奇数个值,中位数会被同时包含在下半部分和上半部分(包含法)。
- 如果数据集有偶数个值,数据集会被均匀地从中间分开。
- 计算铰链值:
- 下铰链 (Q1):下半部分的中位数。
- 上铰链 (Q3):上半部分的中位数。
为什么我的结果与 Excel 或 R 不同?
这是统计学学生最常见的困惑来源。
- Excel (QUARTILE.EXC) 使用 (N+1) 插值方法,通常会产生离中位数更远的结果。
- R 和 Python(默认)使用线性插值(Type 7),对于连续分布数学上更严谨,但手动计算更难。
- Tukey 铰链法专为探索性数据分析(EDA)和手动计算设计。如果您的教科书要求您"找出下半部分的中位数",您应该使用此 Tukey 计算器。
PlotNerd 的 Tukey 铰链法计算器专门按照这种教科书逻辑编程,确保您为作业或手动验证获得正确答案。
何时使用此工具
统计学作业
当您的教科书要求您"找出下半部分的中位数"或使用包含法时,非常适合。
手动计算验证
在提交作业前,验证您手算的四分位数与 Tukey 方法是否一致。
2000年前的教材示例
大多数2000年前出版的统计学入门教材都使用这种方法。
不推荐:生产环境数据科学
对于 R/Python 项目,请使用 Type 7 (excel_inclusive) 以获得更好的软件兼容性。
常见问题解答
用通俗易懂的语言解释统计学概念
数学公式
查看计算背后的标准数学公式
四分位数计算 (方法2)
第一四分位数 (Q1):
中位数 (Q2):
第三四分位数 (Q3):
四分位距与异常值检测
四分位距 (IQR):
异常值边界:
算法说明
PlotNerd 使用统计学标准的“方法 2 (中位数四分位法)”进行四分位数计算,结果与主流统计软件(如 R, SPSS)一致。所有计算结果均经过严格验证以确保准确性。