跳到主要内容

random:均匀分布随机数

速查结论

random([seed]) 是 Spark SQL 中用于返回一个在 [0, 1) 范围内独立同分布(i.i.d.)的均匀分布随机值的函数。

语法

random([seed])

参数说明

参数说明
seed可选,随机种子。指定相同 seed 可产生可重复的随机数序列

示例

> SELECT random();
0.9629742951434543
> SELECT random(0);
0.7604953758285915
> SELECT random(null);
0.7604953758285915

提示:

该函数在一般情况下是非确定性的。

常见报错与避坑指南

  • randomrand 功能完全等价,两者可以互换使用。
  • 在不指定 seed 时,函数是非确定性的,每次调用返回不同值。
  • 指定 seed 后,相同 seed 值始终产生相同的随机数序列,可用于测试或需要可重现的场景。
  • seedNULL 时,行为等同于不指定 seed

Since: 1.5.0

📱关注公众号

「数据仓库技术」文章同步更新,不错过每一篇干货

微信公众号二维码
💬加群交流

备注「数据仓库技术」加入社群,每日一道大厂SQL真题

交流微信二维码

你可能还想看