xpath:XPath节点匹配
速查结论
xpath(xml, xpath) 是 Spark SQL 中用于返回匹配 XPath 表达式的 XML 节点值的字符串数组的函数。
语法
xpath(xml, xpath)
参数说明
| 参数 | 类型 | 说明 |
|---|---|---|
| xml | STRING | 待解析的 XML 格式字符串。 |
| xpath | STRING | XPath 表达式,用于匹配 XML 中的节点。 |
示例
> SELECT xpath('<a><b>b1</b><b>b2</b><b>b3</b><c>c1</c><c>c2</c></a>','a/b/text()');
["b1","b2","b3"]
常见报错与避坑指南
- XML 格式错误:如果 xml 参数不是合法的 XML 字符串,解析会失败并抛出异常。请确保传入的 XML 格式完整且标签闭合。
- XPath 表达式无匹配:当 XPath 表达式未匹配到任何节点时,返回空数组
[],而不会报错。若需要用xpath结果做进一步处理,请注意检查数组是否为空。 - 返回值类型:xpath 始终返回
ARRAY<STRING>类型(字符串数组),即使匹配的内容是数值,也需要手动转换类型。
Since: 2.0.0
📱关注公众号
「数据仓库技术」文章同步更新,不错过每一篇干货

💬加群交流
备注「数据仓库技术」加入社群,每日一道大厂SQL真题
