数据分箱
常见的三种分箱方式,基于规则的分箱、等频分箱、等距分箱
现有用户订单表,请计算用户完成订单数的众数
有学生每科科目成绩,找出所有科目成绩都大于对应学科的平均成绩的学生
有一张用户操作行为记录表 t_act_log_035 包含用户ID(user_id),操作编号(op_id),操作时间(op_time)要求:(1)统计每天符合以下条件的用户数:A操作之后是B操作,AB操作必须相邻;(2)统计每天用户行为序列为A-B-D的用户数;其中:A-B之间可以有任何其他浏览记录(如C,E等),B-D之间除了C记录可以有任何其他浏览记录(如A,E等)
已知有表中含有两列数据id,val,数据内容如下,请按照id的大小将val进行拼接
现有用户登录记录表,已经按照用户日期进行去重处理。以用户登录的最早日期作为新增日期,请计算次日留存率是多少
现有用户登录记录表,已经按照用户日期进行去重处理。请查询出用户连续登录中出现断点的所有日期
现有用户登录记录表,已经按照用户日期进行去重处理。请查询出用户所有连续三天登录的数据记录
现有用户登录记录表,已经按照用户日期进行去重处理。请查询出用户连续登录中出现断点的所有日期
现有订单表,包含订单ID,订单时间,下单用户,当前订单是否有效,请查询出每笔订单的上一笔有效订单
前两篇,给大家分享了Lateral View、Lateral View Outer、explode和posexplode的用法,但是在群里大家有更加深入的讨论,讨论posexplode的应用场景,感觉之前的分享不是很尽兴,于是再加一篇。
今天我将向大家介绍Hive中两个常用且强大的函数:explode和posexplode,它们在处理复杂的数据类型时有着不可替代的作用。下面我们就来一起看看它们的用法和实例。