跳到主要内容

rand:均匀分布随机数

速查结论

rand([seed]) 是 Spark SQL 中用于返回一个在 [0, 1) 范围内独立同分布的均匀分布随机值的函数。

语法

rand([seed])

参数说明

参数说明
seed可选,随机种子。指定相同 seed 可产生可重复的随机数序列

示例

> SELECT rand();
0.9629742951434543
> SELECT rand(0);
0.7604953758285915
> SELECT rand(null);
0.7604953758285915

提示:

该函数在一般情况下是非确定性的。

常见报错与避坑指南

  • 在不指定 seed 时,rand() 每次调用返回不同值,该函数是非确定性的,不适合用于需要可重现结果的场景。
  • 指定 seed 后,相同 seed 值始终产生相同的随机数序列,可用于测试或需要可重现的场景。
  • seedNULL 时,行为等同于不指定 seed,即生成非确定性随机值。

Since: 1.5.0

📱关注公众号

「数据仓库技术」文章同步更新,不错过每一篇干货

微信公众号二维码
💬加群交流

备注「数据仓库技术」加入社群,每日一道大厂SQL真题

交流微信二维码

你可能还想看