跳到主要内容

std:样本标准差

速查结论

std(expr) 是 Spark SQL 中用于计算一组值中样本标准差的聚合函数,是 stddev_samp 的别名。

语法

std(expr)

std(expr) - 返回根据一个组中的值计算出的样本标准差。

参数说明

参数说明
expr数值表达式,通常为列名

示例

> SELECT std(col) FROM VALUES (1), (2), (3) AS tab(col);
1.0

常见报错与避坑指南

  • 别名关系stdstddev_samp 的别名,两者计算的是样本标准差(除以 n-1),不是总体标准差。总体标准差请使用 stddev_pop
  • 单条记录时:当分组内只有一条记录时,样本标准差返回 NULL(因为分母 n-1=0)。
  • NULL 值处理:计算时会自动忽略 NULL 值。

Since: 1.6.0

📱关注公众号

「数据仓库技术」文章同步更新,不错过每一篇干货

微信公众号二维码
💬加群交流

备注「数据仓库技术」加入社群,每日一道大厂SQL真题

交流微信二维码

你可能还想看