regr_intercept:回归截距
速查结论
regr_intercept(y, x) 是 Spark SQL 中用于计算单变量线性回归线的 y 轴截距的聚合函数。
语法
regr_intercept(y, x)
参数说明
| 参数 | 说明 |
|---|---|
| y | 因变量(dependent variable),数值类型 |
| x | 自变量(independent variable),数值类型 |
函数拟合 y = slope * x + intercept 形式的线性回归线,返回截距值。仅计算 y 和 x 均非 NULL 的行对。
示例
> SELECT regr_intercept(y, x) FROM VALUES (1,1), (2,2), (3,3) AS tab(y, x);
0.0
> SELECT regr_intercept(y, x) FROM VALUES (1, null) AS tab(y, x);
NULL
> SELECT regr_intercept(y, x) FROM VALUES (null, 1) AS tab(y, x);
NULL
常见报错与避坑指南
- 配合 regr_slope 使用:regr_intercept 返回截距,regr_slope 返回斜率,两者组合可得到完整的 y = slope * x + intercept 回归方程。
- 数据点过少时结果不可靠:当组内有效数据对少于 2 时,回归无意义;如果所有 x 值相同,方差为零,回归线未定义。
Since: 3.4.0
📱关注公众号
「数据仓库技术」文章同步更新,不错过每一篇干货

💬加群交流
备注「数据仓库技术」加入社群,每日一道大厂SQL真题
