skewness:计算偏度
速查结论
skewness(expr) 是 Spark SQL 中用于计算一组值的偏度的统计函数。
语法
skewness(expr)
参数说明
| 参数 | 说明 |
|---|---|
| expr | 数值表达式,指定要计算偏度的列或表达式 |
示例
> SELECT skewness(col) FROM VALUES (-10), (-20), (100), (1000) AS tab(col);
1.1135657469022011
> SELECT skewness(col) FROM VALUES (-1000), (-100), (10), (20) AS tab(col);
-1.1135657469022011
常见报错与避坑指南
- 偏度含义:偏度衡量分布的不对称性。正值表示右偏(长尾在右侧),负值表示左偏(长尾在左侧),0 表示对称分布。
- NULL 值处理:
skewness()会自动忽略 NULL 值。如果非空值数量不足以计算偏度,则返回 NULL。 - 数据类型要求:输入必须是数值类型。对非数值列使用
skewness()会报错。
Since: 1.6.0
📱关注公众号
「数据仓库技术」文章同步更新,不错过每一篇干货

💬加群交流
备注「数据仓库技术」加入社群,每日一道大厂SQL真题
