跳到主要内容

regr_count:非空对计数

速查结论

regr_count(y, x) 是 Spark SQL 中用于统计组内 y 和 x 均非 NULL 的行数的聚合函数。

语法

regr_count(y, x)

参数说明

参数说明
y因变量(dependent variable),数值类型
x自变量(independent variable),数值类型

函数返回组内 y 和 x 均非 NULL 的行对总数。仅当 y 和 x 同时非 NULL 时,该行才被计入。

示例

> SELECT regr_count(y, x) FROM VALUES (1, 2), (2, 2), (2, 3), (2, 4) AS tab(y, x);
4
> SELECT regr_count(y, x) FROM VALUES (1, 2), (2, null), (2, 3), (2, 4) AS tab(y, x);
3
> SELECT regr_count(y, x) FROM VALUES (1, 2), (2, null), (null, 3), (2, 4) AS tab(y, x);
2

常见报错与避坑指南

  • 与 COUNT(*) 的区别:regr_count 只统计两个参数均非空的列对,不会计入包含 NULL 的行。
  • 作为回归辅助函数:该函数通常是其他回归聚合函数(regr_sxx、regr_sxy 等)计算的基础,独立使用场景较少。

Since: 3.3.0

📱关注公众号

「数据仓库技术」文章同步更新,不错过每一篇干货

微信公众号二维码
💬加群交流

备注「数据仓库技术」加入社群,每日一道大厂SQL真题

交流微信二维码

你可能还想看