数据仓库技术

关于大数据、数据仓库、Hive、Spark、SQL、数仓建模、数据分析的技术

有一张用户操作行为记录表 t_act_log_035 包含用户ID(user_id),操作编号(op_id),操作时间(op_time)要求:(1)统计每天符合以下条件的用户数:A操作之后是B操作,AB操作必须相邻;(2)统计每天用户行为序列为A-B-D的用户数;其中:A-B之间可以有任何其他浏览记录(如C,E等),B-D之间除了C记录可以有任何其他浏览记录(如A,E等)

阅读全文 »

前两篇,给大家分享了Lateral View、Lateral View Outer、explode和posexplode的用法,但是在群里大家有更加深入的讨论,讨论posexplode的应用场景,感觉之前的分享不是很尽兴,于是再加一篇。

阅读全文 »
0%