stddev_pop:总体标准差
速查结论
stddev_pop(expr) 是 Spark SQL 中用于计算一组值中总体标准差的聚合函数。
语法
stddev_pop(expr)
stddev_pop(expr) - 返回根据一个组中的值计算出的总体标准差。
参数说明
| 参数 | 说明 |
|---|---|
| expr | 数值表达式,通常为列名 |
示例
> SELECT stddev_pop(col) FROM VALUES (1), (2), (3) AS tab(col);
0.816496580927726
常见报错与避坑指南
- 与样本标准差的区别:
stddev_pop除以 n(总体大小),而stddev_samp/stddev/std除以 n-1。当数据量较大时两者差异不大,小数据集差异显著。 - 单条记录时:当分组内只有一条记录时,总体标准差返回 0.0(而非 NULL),因为总体均值等于该记录本身。
- NULL 值处理:计算时会自动忽略 NULL 值。
Since: 1.6.0
📱关注公众号
「数据仓库技术」文章同步更新,不错过每一篇干货

💬加群交流
备注「数据仓库技术」加入社群,每日一道大厂SQL真题
