variance:计算样本方差
速查结论
variance(expr) 是 Spark SQL 中用于计算一组值的样本方差的统计函数,是 var_samp() 的别名。
语法
variance(expr)
参数说明
| 参数 | 说明 |
|---|---|
| expr | 数值表达式,指定要计算样本方差的列或表达式 |
示例
> SELECT variance(col) FROM VALUES (1), (2), (3) AS tab(col);
1.0
常见报错与避坑指南
- 与 var_samp 的关系:
variance()是var_samp()的别名,二者功能完全相同,均计算样本方差(分母为 N-1)。如需总体方差(分母为 N),请使用var_pop()。 - NULL 值处理:
variance()会自动忽略 NULL 值。如果非空值数量少于 2 个,返回 NULL。 - 数据类型要求:输入必须是数值类型。对非数值列使用
variance()会报错。
Since: 1.6.0
📱关注公众号
「数据仓库技术」文章同步更新,不错过每一篇干货

💬加群交流
备注「数据仓库技术」加入社群,每日一道大厂SQL真题
