regr_count:非空对计数
速查结论
regr_count(y, x) 是 Spark SQL 中用于统计组内 y 和 x 均非 NULL 的行数的聚合函数。
语法
regr_count(y, x)
参数说明
| 参数 | 说明 |
|---|---|
| y | 因变量(dependent variable),数值类型 |
| x | 自变量(independent variable),数值类型 |
函数返回组内 y 和 x 均非 NULL 的行对总数。仅当 y 和 x 同时非 NULL 时,该行才被计入。
示例
> SELECT regr_count(y, x) FROM VALUES (1, 2), (2, 2), (2, 3), (2, 4) AS tab(y, x);
4
> SELECT regr_count(y, x) FROM VALUES (1, 2), (2, null), (2, 3), (2, 4) AS tab(y, x);
3
> SELECT regr_count(y, x) FROM VALUES (1, 2), (2, null), (null, 3), (2, 4) AS tab(y, x);
2
常见报错与避坑指南
- 与 COUNT(*) 的区别:regr_count 只统计两个参数均非空的列对,不会计入包含 NULL 的行。
- 作为回归辅助函数:该函数通常是其他回归聚合函数(regr_sxx、regr_sxy 等)计算的基础,独立使用场景较少。
Since: 3.3.0
📱关注公众号
「数据仓库技术」文章同步更新,不错过每一篇干货

💬加群交流
备注「数据仓库技术」加入社群,每日一道大厂SQL真题
