encode:字符串编码
速查结论
encode(str, charset) 是 Spark SQL 中用于使用指定字符集对字符串进行编码的函数。
语法
encode(str, charset)
参数说明
| 参数 | 类型 | 说明 |
|---|---|---|
| str | STRING | 待编码的字符串 |
| charset | STRING | 目标字符集名称,如 'utf-8'、'gbk' 等 |
示例
SELECT encode('abc', 'utf-8');
abc
常见报错与避坑指南
- 字符集支持:
encode依赖 JVM 支持的字符集。传入不支持的字符集名称将导致运行时错误。常用字符集包括 'utf-8'、'gbk'、'iso-8859-1' 等。 - NULL 输入:如果任一参数为 NULL,函数返回 NULL。
- 与 decode 配合:
encode和decode互为逆操作。decode(encode(str, charset), charset)应还原为原始字符串。
Since: 1.5.0
📱关注公众号
「数据仓库技术」文章同步更新,不错过每一篇干货

💬加群交流
备注「数据仓库技术」加入社群,每日一道大厂SQL真题
