bitmap_bucket_number:位图桶编号
速查结论
bitmap_bucket_number(child) 是 Spark SQL 中用于返回给定输入子表达式的桶编号的函数。
语法
bitmap_bucket_number(child)
参数说明
| 参数 | 类型 | 说明 |
|---|---|---|
| child | 数值表达式 | 需要计算桶编号的输入表达式。函数会对该值进行哈希计算,返回对应的桶编号。 |
Examples
> SELECT bitmap_bucket_number(123);
1
> SELECT bitmap_bucket_number(0);
0
常见报错与避坑指南
输入为 NULL 时返回值也为 NULL。 在对可能包含 NULL 的列使用 bitmap_bucket_number 时,建议通过 WHERE col IS NOT NULL 过滤空值,或使用 COALESCE 设置默认值。
桶编号的范围取决于内部哈希算法,不可预设。 bitmap_bucket_number 返回的桶编号由哈希结果的高 8 位决定,不同版本的 Spark 可能返回不同的桶编号值,不宜对桶编号范围做硬编码假设。
Since: 3.5.0
📱关注公众号
「数据仓库技术」文章同步更新,不错过每一篇干货

💬加群交流
备注「数据仓库技术」加入社群,每日一道大厂SQL真题
