跳到主要内容

var_pop:计算总体方差

速查结论

var_pop(expr) 是 Spark SQL 中用于计算一组值的总体方差的统计函数。

语法

var_pop(expr)

参数说明

参数说明
expr数值表达式,指定要计算总体方差的列或表达式

示例

> SELECT var_pop(col) FROM VALUES (1), (2), (3) AS tab(col);
0.6666666666666666

常见报错与避坑指南

  • 总体方差 vs 样本方差var_pop() 计算总体方差(分母为 N),而 var_samp() 计算样本方差(分母为 N-1)。根据数据是总体还是样本选择正确的函数。
  • NULL 值处理var_pop() 会自动忽略 NULL 值。如果非空值数量不足(少于 2 个),返回 NULL。
  • 数据类型要求:输入必须是数值类型。对非数值列使用 var_pop() 会报错。

Since: 1.6.0

📱关注公众号

「数据仓库技术」文章同步更新,不错过每一篇干货

微信公众号二维码
💬加群交流

备注「数据仓库技术」加入社群,每日一道大厂SQL真题

交流微信二维码

你可能还想看