跳到主要内容

Spark SQL 专题:窗口函数、行列转换、连续问题

全方位对高频、相似问题的梳理,一次性彻底解决一类问题。目前涵盖三大核心方向:

  • 窗口函数:ROW_NUMBER、RANK、DENSE_RANK、SUM OVER、LAG/LEAD 等 16 种函数详解
  • 行列转换:行转列(collect_list/PIVOT)、列转行(EXPLODE/Lateral View)、横表竖表互转
  • 连续问题:连续登录、连续活跃、Gaps and Islands 经典解法
标签 34 个项目
OR
1Spark SQL 连续问题专题:连续相同数据分组与 Gaps and Islands 解法2数据分箱3数据抽样4行转列-collect_list,collect_set进行简单行转列5行转列-使用transform进行有序行转列6列转行-EXPLODE + Lateral View 多列一一对应7列转行-多行转多列(竖表转横表)| CASE WHEN + PIVOT 实现8列转行-多列转多行(横表变竖表)| stack + UNION ALL 方案9列转行-lateral view explode列转行10Spark SQL Lateral View Outer 与 explode_outer:保留NULL行的列转行11列转行-posexplode多列对应转行12列转行-explode_outer处理NULL值与空数组13列转行-lateral view outer posexplode及posexplode_outer多列对应转行14列转行-EXPLODE炸裂函数详解 | 数组拆分与 Lateral View15Spark SQL Lateral View 详解:配合 explode 实现列转行16行转列-sparksql-pivot子句17列转行-sparksql-unpivot子句18SQL 行列转换终极指南 | 横表竖表互相转换实战19Spark SQL 窗口函数详解:从入门到精通20ROW_NUMBER 窗口函数详解:分组排序与 Top N 实战21RANK 窗口函数详解:并列排名与跳过机制22DENSE_RANK 窗口函数:连续排名与面试陷阱23NTILE 窗口函数:数据分桶与均匀分组实战24SUM OVER 窗口函数详解:累计求和与移动求和实战25AVG OVER 窗口函数详解:滑动平均与移动趋势分析26COUNT OVER 窗口函数详解:累计计数与分组统计27MAX/MIN OVER 窗口函数详解:窗口内极值查找实战28LAG 窗口函数详解:上一行取值与环比计算实战29LEAD 窗口函数详解:下一行取值与同比分析实战30FIRST_VALUE 窗口函数详解:窗口首行取值实战31LAST_VALUE 窗口函数详解:窗口末行取值与帧陷阱32NTH_VALUE 窗口函数详解:窗口内第 N 行取值实战33PERCENT_RANK 窗口函数详解:百分比排名与相对位置计算34CUME_DIST 窗口函数详解:累积分布与分位数计算
📱关注公众号

「数据仓库技术」文章同步更新,不错过每一篇干货

微信公众号二维码
💬加群交流

备注「数据仓库技术」加入社群,每日一道大厂SQL真题

交流微信二维码