std:样本标准差
速查结论
std(expr) 是 Spark SQL 中用于计算一组值中样本标准差的聚合函数,是 stddev_samp 的别名。
语法
std(expr)
std(expr) - 返回根据一个组中的值计算出的样本标准差。
参数说明
| 参数 | 说明 |
|---|---|
| expr | 数值表达式,通常为列名 |
示例
> SELECT std(col) FROM VALUES (1), (2), (3) AS tab(col);
1.0
常见报错与避坑指南
- 别名关系:
std是stddev_samp的别名,两者计算的是样本标准差(除以 n-1),不是总体标准差。总体标准差请使用stddev_pop。 - 单条记录时:当分组内只有一条记录时,样本标准差返回 NULL(因为分母 n-1=0)。
- NULL 值处理:计算时会自动忽略 NULL 值。
Since: 1.6.0
📱关注公众号
「数据仓库技术」文章同步更新,不错过每一篇干货

💬加群交流
备注「数据仓库技术」加入社群,每日一道大厂SQL真题
