var_pop:计算总体方差
速查结论
var_pop(expr) 是 Spark SQL 中用于计算一组值的总体方差的统计函数。
语法
var_pop(expr)
参数说明
| 参数 | 说明 |
|---|---|
| expr | 数值表达式,指定要计算总体方差的列或表达式 |
示例
> SELECT var_pop(col) FROM VALUES (1), (2), (3) AS tab(col);
0.6666666666666666
常见报错与避坑指南
- 总体方差 vs 样本方差:
var_pop()计算总体方差(分母为 N),而var_samp()计算样本方差(分母为 N-1)。根据数据是总体还是样本选择正确的函数。 - NULL 值处理:
var_pop()会自动忽略 NULL 值。如果非空值数量不足(少于 2 个),返回 NULL。 - 数据类型要求:输入必须是数值类型。对非数值列使用
var_pop()会报错。
Since: 1.6.0
📱关注公众号
「数据仓库技术」文章同步更新,不错过每一篇干货

💬加群交流
备注「数据仓库技术」加入社群,每日一道大厂SQL真题
