Name: PlotNerd
Availability: InStock
Author: PlotNerd

速读总结

“四分位数不一致”是正常现象：分位数并不是一个公式，而是一组定义（例如 Hyndman–Fan Type 6 vs Type 7）。
浮点误差真实存在：PlotNerd 对核心聚合（sum/mean）使用 Kahan 求和（补偿求和）来减少精度损失。
PlotNerd 以可验证性为第一原则：Excel QUARTILE.INC / QUARTILE.EXC、R quantile(..., type=7) / type=6，以及 WolframAlpha 风格结果都能并排对照。

1) 为什么不同计算器会算出不同结果？

同一份数据，在 Excel、R、Python/NumPy，以及不同在线计算器里，Q1/Q3 不一致非常常见。这不一定是谁“算错了”，通常是因为大家使用了不同的定义。

原因 A：分位数有多种“公认算法”

Hyndman–Fan（1996）把常见分位数算法归类为 9 种类型。 Type 6 和 Type 7 都是“合理定义”，只是定位规则不同。

原因 B：浮点数不是“真实小数”

计算机对大多数小数只能近似表示；当你做大量加法、插值时，误差会累积。如果不做数值稳定性处理，就更容易漂移。

建议先读：四分位数计算方法对比（Type 6/7/8）以及算法选择指南。

2) Kahan 求和：为什么 sum/mean 也会“不准”？

朴素求和（例如 reduce((a,b) => a + b)）在“数值规模差异很大” 的情况下会吞掉小数。Kahan 求和会维护一个补偿项（compensation），尽量把丢掉的低位精度补回来。

// 经典“抵消”例子
values = [1e16, 1, 1, -1e16]

naiveSum(values)  // -> 0  （两个 1 被吞掉）
kahanSum(values)  // -> 2  （补偿求和能恢复）

PlotNerd 在核心聚合（sum/mean）采用补偿求和，减少“看起来像随机”的舍入漂移，尤其适用于：科学测量（大数 + 微小修正）、财务数据（大额 + 细碎增量）等混合尺度数据。

3) Type 6 vs Type 7：QUARTILE.EXC vs QUARTILE.INC

很多人说“Excel 四分位数”，默认指 QUARTILE.INC。但 Excel 还提供 QUARTILE.EXC。这两者对应不同的分位数类型，在小样本时差异会被放大。

方法	定位规则（Index rule）	常见匹配
Type 7（R/Python 默认）	h = (n − 1) · p + 1	R `type=7`，NumPy `method="linear"`， Excel `QUARTILE.INC`
Type 6（Excel EXC 风格）	h = (n + 1) · p	Excel `QUARTILE.EXC`，部分旧模板/惯例

想要跨软件复现，最重要的是：写清楚你用的是哪种算法，而不是笼统写“quartiles”。PlotNerd 暴露了 Excel 的 INC/EXC 两种模式，让团队不用靠猜也能对齐报表口径。

直接上手： Excel 四分位数计算器（INC/EXC）和百分位数计算器（Type 6/7）。

4) PlotNerd 如何让结果可验证

选择正确算法（匹配你的软件环境）

你可以选择：R/Python（Type 7）、Excel INC/EXC、Tukey 铰链法、WolframAlpha 风格等。

打开算法对比页 →

外部验证（需要审计/复核时）

PlotNerd 可生成 Excel 公式、R/Python 代码片段，或 WolframAlpha 查询，用于复现或交叉验证。

阅读：软件差异与兼容性 →

实用工作流（推荐）

先确定目标环境（Excel 报表 vs R/Python 分析）。
在 PlotNerd 中选择与目标环境匹配的算法。
若结果需要审计/复核，点击 “Verify Results”，并把生成的公式/代码与数据一并保存到分析备注中。

5) 常见问题 FAQ

QUARTILE.INC 对应 Type 7 还是 Type 6？

在 PlotNerd 中，QUARTILE.INC 对应 Type 7（R-7）； QUARTILE.EXC 对应 Type 6 风格定位规则。

为什么小样本时 Type 6/7 差异更大？

因为定位规则改变会让目标位置跨越不同秩（rank）区间，插值落点不同，差异就更明显。

Kahan 求和能让结果“完全精确”吗？

不能。它能显著降低求和误差，但不能消除所有浮点限制。更准确的表述是 “更稳定、更可靠”。

学术论文/研究更推荐哪种？

若你的环境是 R/Python，Type 7 是最常见默认。关键是：在方法部分写清楚你使用的分位数类型。

Excel 报表应该用 INC 还是 EXC？

以你的模板/团队口径为准：如果表格使用 QUARTILE.INC，就选 INC；如果继承了使用 QUARTILE.EXC 的模板，就选 EXC。

我可以并排比较不同方法吗？

可以。你可以直接对比不同算法下的 Q1/Q3/IQR 变化。建议从四分位数方法对比开始。

如果数据有大量重复值或是离散数据（例如 1–5 问卷）会怎样？

离散数据常见“平台”（很多秩对应同一个值）。这会让不同算法之间的差异缩小甚至消失；在极端情况下，当 Q1 = Q3 时 IQR 会变成 0。

去哪里学习如何解读输出？

建议先看如何解读箱线图，以及 Tukey vs R-7。

6) 方法论与边界条件（EEAT）

输入要求：至少 4 个有限数值（非 NaN/Infinity）。
舍入策略：界面展示会做 epsilon-aware rounding 以提升可读性；内部计算保留双精度浮点，最后再舍入。
退化情况：当所有值相同，Q1 = Q2 = Q3。
可审计性：若需要审计，请把验证公式/代码与数据一起存档。

免责声明：本文用于教育与工程解释，不替代领域统计审稿。请以课程、期刊或组织的规范为准。

7) 参考资料

Kahan summation（补偿求和）—— 提升浮点求和精度的经典方法。
Hyndman & Fan (1996) —— 分位数 Type 1–9 分类体系。
Microsoft Excel 文档 —— QUARTILE.INC / QUARTILE.EXC 定义。

8) 更新日志

2026-02-24：发布。补充 Kahan 求和与 Excel INC/EXC（Type 6/7）映射说明。

PlotNerd vs 其他工具：为什么我们的计算更准