跳到主要内容

xpath_string:XPath文本提取

速查结论

xpath_string(xml, xpath) 是 Spark SQL 中用于返回第一个匹配 XPath 表达式的 XML 节点的文本内容的函数。

语法

xpath_string(xml, xpath)

参数说明

参数类型说明
xmlSTRING待解析的 XML 格式字符串。
xpathSTRINGXPath 表达式。返回第一个匹配节点的文本内容。

示例

> SELECT xpath_string('<a><b>b</b><c>cc</c></a>','a/c');
cc

常见报错与避坑指南

  • 多个匹配只返回第一个:xpath_string 仅返回第一个匹配节点的文本内容,而非全部。如需获取所有匹配节点,请使用 xpath 函数获取 ARRAY<STRING>
  • 空匹配返回空字符串:当 XPath 表达式未匹配到任何节点时,返回空字符串 "",不会抛出异常。
  • XML 格式错误:xml 参数必须是合法的 XML 字符串,否则解析失败会抛出异常。

Since: 2.0.0

📱关注公众号

「数据仓库技术」文章同步更新,不错过每一篇干货

微信公众号二维码
💬加群交流

备注「数据仓库技术」加入社群,每日一道大厂SQL真题

交流微信二维码

你可能还想看