数据仓库技术

关于大数据、数据仓库、Hive、Spark、SQL、数仓建模、数据分析的技术

lag() 和 lead() 函数都是基于窗口的函数,它们将被处理的数据集分成窗口,并为每个窗口中的记录返回一个结果。这些函数通常用于时间序列数据,以便比较当前记录与先前或后续记录之间的值。

阅读全文 »

Hive 中的 row_number 函数是一个非常有用的窗口函数,它会对查询结果进行编号,并按照指定的排序方式对这些编号进行排序。在本文中,我们将介绍 row_number 函数的语法、样例及常用应用场景。

阅读全文 »
0%