xpath_string:XPath文本提取
速查结论
xpath_string(xml, xpath) 是 Spark SQL 中用于返回第一个匹配 XPath 表达式的 XML 节点的文本内容的函数。
语法
xpath_string(xml, xpath)
参数说明
| 参数 | 类型 | 说明 |
|---|---|---|
| xml | STRING | 待解析的 XML 格式字符串。 |
| xpath | STRING | XPath 表达式。返回第一个匹配节点的文本内容。 |
示例
> SELECT xpath_string('<a><b>b</b><c>cc</c></a>','a/c');
cc
常见报错与避坑指南
- 多个匹配只返回第一个:xpath_string 仅返回第一个匹配节点的文本内容,而非全部。如需获取所有匹配节点,请使用 xpath 函数获取
ARRAY<STRING>。 - 空匹配返回空字符串:当 XPath 表达式未匹配到任何节点时,返回空字符串 "",不会抛出异常。
- XML 格式错误:xml 参数必须是合法的 XML 字符串,否则解析失败会抛出异常。
Since: 2.0.0
📱关注公众号
「数据仓库技术」文章同步更新,不错过每一篇干货

💬加群交流
备注「数据仓库技术」加入社群,每日一道大厂SQL真题
