var_samp:计算样本方差
速查结论
var_samp(expr) 是 Spark SQL 中用于计算一组值的样本方差的统计函数。
语法
var_samp(expr)
参数说明
| 参数 | 说明 |
|---|---|
| expr | 数值表达式,指定要计算样本方差的列或表达式 |
示例
> SELECT var_samp(col) FROM VALUES (1), (2), (3) AS tab(col);
1.0
常见报错与避坑指南
- 样本方差 vs 总体方差:
var_samp()计算样本方差(分母为 N-1),而var_pop()计算总体方差(分母为 N)。对同一组数据(1, 2, 3),var_samp()返回 1.0,var_pop()返回约 0.667。 - NULL 值处理:
var_samp()会自动忽略 NULL 值。如果非空值数量少于 2 个,返回 NULL。 - 与 variance 的关系:
var_samp()与variance()功能完全相同,二者互为别名。
Since: 1.6.0
📱关注公众号
「数据仓库技术」文章同步更新,不错过每一篇干货

💬加群交流
备注「数据仓库技术」加入社群,每日一道大厂SQL真题
