rand:均匀分布随机数
速查结论
rand([seed]) 是 Spark SQL 中用于返回一个在 [0, 1) 范围内独立同分布的均匀分布随机值的函数。
语法
rand([seed])
参数说明
| 参数 | 说明 |
|---|---|
| seed | 可选,随机种子。指定相同 seed 可产生可重复的随机数序列 |
示例
> SELECT rand();
0.9629742951434543
> SELECT rand(0);
0.7604953758285915
> SELECT rand(null);
0.7604953758285915
提示:
该函数在一般情况下是非确定性的。
常见报错与避坑指南
- 在不指定
seed时,rand()每次调用返回不同值,该函数是非确定性的,不适合用于需要可重现结果的场景。 - 指定
seed后,相同seed值始终产生相同的随机数序列,可用于测试或需要可重现的场景。 - 当
seed为NULL时,行为等同于不指定seed,即生成非确定性随机值。
Since: 1.5.0
📱关注公众号
「数据仓库技术」文章同步更新,不错过每一篇干货

💬加群交流
备注「数据仓库技术」加入社群,每日一道大厂SQL真题
