支持的数据格式:
- 逗号分隔:1.5, 2.8, 9.1, 16.2
- 空格分隔:1.5 2.8 9.1 16.2
- 换行分隔:每行一个数字
- 科学计数法:1.23e-4, 5.67E+8
- 多序列模式:使用「组名: 数值1, 数值2, 数值3」格式,每行一组
- 自动忽略文本和特殊字符
Universal Standard (R, Python, Google Sheets)
Linear interpolation method, default standard for modern data science software
计算结果和箱线图将在这里实时展示
请在上方输入至少 4 个数字开始计算
计算结果
基本统计量
四分位数
五数概括
检测到异常值
以下数据点被 方法识别为异常值:
分组序列汇总
输入数据以生成箱线图
请在上方输入至少 4 个数字开始计算
箱线图可视化
此箱线图可视化了您的数据分布。箱体显示包含中间 50% 数据的四分位距 (IQR)。箱内的线代表中位数。须线延伸显示范围,红点表示异常值。
异常值检测: Tukey 法 (1.5×IQR)
箱体 (IQR) / Legend
- 箱体 (IQR)
- 中位数线
- 须线
- 异常值
综合摘要
什么是五数概括?
五数概括(Five-Number Summary)是一组描述性统计量,提供数据集分布的简明快照。它由数学家 John Tukey 作为探索性数据分析(EDA)工具包的一部分引入。
五个组成部分
- 最小值(Minimum):数据集中最小的值。代表范围的下界(不包括异常值)。
- 第一四分位数(Q1):第 25 百分位数。25% 的数据低于此值。它标志着数据"中间 50%"的开始。
- 中位数(Q2):第 50 百分位数。将数据的上半部分与下半部分分开的中间值。
- 第三四分位数(Q3):第 75 百分位数。75% 的数据低于此值。它标志着"中间 50%"的结束。
- 最大值(Maximum):数据集中最大的值。代表范围的上界。
用箱线图可视化
五数概括是构建箱须图的原始数据:
- 箱体从 Q1 延伸到 Q3。
- 箱体内的线条代表中位数。
- 须线从箱体延伸到最小值和最大值。
为什么使用五数概括?
它优于仅使用均值(平均值),因为它提供了数据的偏斜度和离散程度信息。
- 如果中位数更接近 Q1 而非 Q3,数据呈正偏斜(右偏)。
- 如果中位数更接近 Q3 而非 Q1,数据呈负偏斜(左偏)。
- 如果最小值和最大值与四分位数距离很远,说明存在异常值。
PlotNerd 的 五数概括计算器可即时生成五个关键统计量,用于快速探索性数据分析。
💡 何时使用此工具
快速探索性数据分析(EDA)
在深入分析之前,5 秒内获取数据分布的快照。
手绘箱线图
五数概括提供绘制箱线图所需的所有数据。
一眼检测偏斜度
如果 Q2 更接近 Q1 或 Q3,您的数据就是左偏或右偏的。
不适用于:详细分布分析
对于精细的形状分析,请改用直方图或密度图。
常见问题解答
用通俗易懂的语言解释统计学概念
数学公式
查看计算背后的标准数学公式
四分位数计算 (方法2)
第一四分位数 (Q1):
中位数 (Q2):
第三四分位数 (Q3):
四分位距与异常值检测
四分位距 (IQR):
异常值边界:
算法说明
PlotNerd 使用统计学标准的“方法 2 (中位数四分位法)”进行四分位数计算,结果与主流统计软件(如 R, SPSS)一致。所有计算结果均经过严格验证以确保准确性。