kurtosis:计算峰度
速查结论
kurtosis(expr) 是 Spark SQL 中用于**计算一组值的峰度(峰态)**的统计函数。
语法
kurtosis(expr)
参数说明
| 参数 | 说明 |
|---|---|
| expr | 数值表达式,指定要计算峰度的列或表达式 |
示例
> SELECT kurtosis(col) FROM VALUES (-10), (-20), (100), (1000) AS tab(col);
-0.7014368047529627
> SELECT kurtosis(col) FROM VALUES (1), (10), (100), (10), (1) as tab(col);
0.19432323191699075
常见报错与避坑指南
- 峰度含义:峰度衡量分布的"尖峭"程度。正值表示分布比正态分布更尖(厚尾),负值表示更平坦(薄尾)。接近 0 表示接近正态分布的峰度。
- NULL 值处理:
kurtosis()会自动忽略 NULL 值。如果非空值数量不足(少于 4 个),返回 NULL。 - 数据类型要求:输入必须是数值类型。对非数值列使用
kurtosis()会报错。
Since: 1.6.0
📱关注公众号
「数据仓库技术」文章同步更新,不错过每一篇干货

💬加群交流
备注「数据仓库技术」加入社群,每日一道大厂SQL真题
