跳到主要内容

array_distinct:数组去重

速查结论

array_distinct(array) 是 Spark SQL 中用于移除数组中重复的元素的函数。

语法

array_distinct(array)

参数说明

参数说明
array输入的数组表达式

示例

> SELECT array_distinct(array(1, 2, 3, null, 3));
[1,2,3,null]

常见报错与避坑指南

  • NULL 元素的处理:array_distinct 会保留数组中的 NULL 值(多个 NULL 去重后保留一个),不会将其移除。
  • 返回新数组:函数返回去重后的新数组,原数组不受影响。

Since: 2.4.0

📱关注公众号

「数据仓库技术」文章同步更新,不错过每一篇干货

微信公众号二维码
💬加群交流

备注「数据仓库技术」加入社群,每日一道大厂SQL真题

交流微信二维码

你可能还想看