跳到主要内容

xpath:XPath节点匹配

速查结论

xpath(xml, xpath) 是 Spark SQL 中用于返回匹配 XPath 表达式的 XML 节点值的字符串数组的函数。

语法

xpath(xml, xpath)

参数说明

参数类型说明
xmlSTRING待解析的 XML 格式字符串。
xpathSTRINGXPath 表达式,用于匹配 XML 中的节点。

示例

> SELECT xpath('<a><b>b1</b><b>b2</b><b>b3</b><c>c1</c><c>c2</c></a>','a/b/text()');
["b1","b2","b3"]

常见报错与避坑指南

  • XML 格式错误:如果 xml 参数不是合法的 XML 字符串,解析会失败并抛出异常。请确保传入的 XML 格式完整且标签闭合。
  • XPath 表达式无匹配:当 XPath 表达式未匹配到任何节点时,返回空数组 [],而不会报错。若需要用 xpath 结果做进一步处理,请注意检查数组是否为空。
  • 返回值类型:xpath 始终返回 ARRAY<STRING> 类型(字符串数组),即使匹配的内容是数值,也需要手动转换类型。

Since: 2.0.0

📱关注公众号

「数据仓库技术」文章同步更新,不错过每一篇干货

微信公众号二维码
💬加群交流

备注「数据仓库技术」加入社群,每日一道大厂SQL真题

交流微信二维码

你可能还想看