跳到主要内容

variance:计算样本方差

速查结论

variance(expr) 是 Spark SQL 中用于计算一组值的样本方差的统计函数,是 var_samp() 的别名。

语法

variance(expr)

参数说明

参数说明
expr数值表达式,指定要计算样本方差的列或表达式

示例

> SELECT variance(col) FROM VALUES (1), (2), (3) AS tab(col);
1.0

常见报错与避坑指南

  • 与 var_samp 的关系variance()var_samp() 的别名,二者功能完全相同,均计算样本方差(分母为 N-1)。如需总体方差(分母为 N),请使用 var_pop()
  • NULL 值处理variance() 会自动忽略 NULL 值。如果非空值数量少于 2 个,返回 NULL。
  • 数据类型要求:输入必须是数值类型。对非数值列使用 variance() 会报错。

Since: 1.6.0

📱关注公众号

「数据仓库技术」文章同步更新,不错过每一篇干货

微信公众号二维码
💬加群交流

备注「数据仓库技术」加入社群,每日一道大厂SQL真题

交流微信二维码

你可能还想看