hll_sketch_estimate:HLL基数估计
速查结论
hll_sketch_estimate(expr) 是 Spark SQL 中用于从 HLL 草图二进制表示中估算去重值数量的函数。
语法
hll_sketch_estimate(expr)
参数说明
| 参数 | 说明 |
|---|---|
| expr | HllSketch 的二进制表示,通常由 hll_sketch_agg 或 hll_union 产生 |
函数解析 HLL 草图的内部结构,返回近似去重计数值(近似 NDV,即 Number of Distinct Values)。
示例
> SELECT hll_sketch_estimate(hll_sketch_agg(col)) FROM VALUES (1), (1), (2), (2), (3) tab(col);
3
常见报错与避坑指南
- 输入必须是有效的 HLL 草图:如果传入的不是 hll_sketch_agg 或 hll_union 产生的二进制草图,会返回 NULL 或报错。
- 结果是近似值:返回的是估计值而非精确计数。对于精确去重需求,应使用
COUNT(DISTINCT col)。
Since: 3.5.0
📱关注公众号
「数据仓库技术」文章同步更新,不错过每一篇干货

💬加群交流
备注「数据仓库技术」加入社群,每日一道大厂SQL真题
