跳到主要内容

substring_index:按分隔符截取

速查结论

substring_index(str, delim, count) 是 Spark SQL 中用于按分隔符出现次数截取子字符串的函数。

语法

substring_index(str, delim, count)

返回在分隔符delim出现count次之前的str的子字符串。如果count是正数,返回最右边分隔符(从左边开始计数)左侧的所有内容。如果count是负数,返回最右边分隔符(从右边开始计数)右侧的所有内容。函数substring_index在搜索delim时执行区分大小写的匹配。

参数说明

参数类型说明
strSTRING源字符串
delimSTRING分隔符,大小写敏感
countINT正数表示从左向右计数,负数表示从右向左计数

示例

> SELECT substring_index('www.apache.org', '.', 2);
www.apache

常见报错与避坑指南

  • 分隔符大小写敏感substring_index对分隔符delim执行区分大小写的匹配,使用'.''.'是相同的,但字母类分隔符需确保大小写正确。
  • count超出分隔符数量:如果count的绝对值大于分隔符实际出现次数,则返回整个字符串。

Since: 1.5.0

📱关注公众号

「数据仓库技术」文章同步更新,不错过每一篇干货

微信公众号二维码
💬加群交流

备注「数据仓库技术」加入社群,每日一道大厂SQL真题

交流微信二维码

你可能还想看