跳到主要内容

regr_slope:回归斜率

速查结论

regr_slope(y, x) 是 Spark SQL 中用于计算单变量线性回归线的斜率的聚合函数。

语法

regr_slope(y, x)

参数说明

参数说明
y因变量(dependent variable),数值类型
x自变量(independent variable),数值类型

函数拟合 y = slope * x + intercept 形式的线性回归线,返回斜率值。仅计算 y 和 x 均非 NULL 的行对。

示例

> SELECT regr_slope(y, x) FROM VALUES (1,1), (2,2), (3,3) AS tab(y, x);
1.0
> SELECT regr_slope(y, x) FROM VALUES (1, null) AS tab(y, x);
NULL
> SELECT regr_slope(y, x) FROM VALUES (null, 1) AS tab(y, x);
NULL

常见报错与避坑指南

  • 配合 regr_intercept 构建回归方程:斜率和截距共同确定回归线 y = slope * x + intercept。
  • x 值全相同时斜率未定义:若所有有效行的 x 值均相同,方差为零,斜率计算无意义。

Since: 3.3.0

📱关注公众号

「数据仓库技术」文章同步更新,不错过每一篇干货

微信公众号二维码
💬加群交流

备注「数据仓库技术」加入社群,每日一道大厂SQL真题

交流微信二维码

你可能还想看