跳到主要内容

var_samp:计算样本方差

速查结论

var_samp(expr) 是 Spark SQL 中用于计算一组值的样本方差的统计函数。

语法

var_samp(expr)

参数说明

参数说明
expr数值表达式,指定要计算样本方差的列或表达式

示例

> SELECT var_samp(col) FROM VALUES (1), (2), (3) AS tab(col);
1.0

常见报错与避坑指南

  • 样本方差 vs 总体方差var_samp() 计算样本方差(分母为 N-1),而 var_pop() 计算总体方差(分母为 N)。对同一组数据 (1, 2, 3)var_samp() 返回 1.0,var_pop() 返回约 0.667。
  • NULL 值处理var_samp() 会自动忽略 NULL 值。如果非空值数量少于 2 个,返回 NULL。
  • 与 variance 的关系var_samp()variance() 功能完全相同,二者互为别名。

Since: 1.6.0

📱关注公众号

「数据仓库技术」文章同步更新,不错过每一篇干货

微信公众号二维码
💬加群交流

备注「数据仓库技术」加入社群,每日一道大厂SQL真题

交流微信二维码

你可能还想看