跳到主要内容

hll_sketch_estimate:HLL基数估计

速查结论

hll_sketch_estimate(expr) 是 Spark SQL 中用于从 HLL 草图二进制表示中估算去重值数量的函数。

语法

hll_sketch_estimate(expr)

参数说明

参数说明
exprHllSketch 的二进制表示,通常由 hll_sketch_agg 或 hll_union 产生

函数解析 HLL 草图的内部结构,返回近似去重计数值(近似 NDV,即 Number of Distinct Values)。

示例

> SELECT hll_sketch_estimate(hll_sketch_agg(col)) FROM VALUES (1), (1), (2), (2), (3) tab(col);
3

常见报错与避坑指南

  • 输入必须是有效的 HLL 草图:如果传入的不是 hll_sketch_agg 或 hll_union 产生的二进制草图,会返回 NULL 或报错。
  • 结果是近似值:返回的是估计值而非精确计数。对于精确去重需求,应使用 COUNT(DISTINCT col)

Since: 3.5.0

📱关注公众号

「数据仓库技术」文章同步更新,不错过每一篇干货

微信公众号二维码
💬加群交流

备注「数据仓库技术」加入社群,每日一道大厂SQL真题

交流微信二维码

你可能还想看