深入理解Hive中的Lateral View及Lateral View Outer的用法
Lateral View是配合表生成函数(如explode)一起使用,对array或者map类型的列进行展开。Hive的lateral view是用来连接生成的虚拟表的。
Lateral View是配合表生成函数(如explode)一起使用,对array或者map类型的列进行展开。Hive的lateral view是用来连接生成的虚拟表的。
有用户关注列表,用户喜欢的音乐表,音乐名字,请给用户推荐其好友喜欢的音乐
有学生每科科目成绩,求不及格课程数大于2的学生的平均成绩及其成绩平均值后所在的排名。
有一张订单记录表包含 订单ID(order_id),商户ID(shop_id),订单时间(order_time)和订单金额(order_amt),请查询出过去至少存在3天销售额连续增长的商户
现有用户登录日志表,记录了每个用户登录的IP地址,请查询共同使用过3个及以上IP的用户对;
有好友关系表,记录了user1_id,user2_id的好友关系对。现定义用户受欢迎程度=用户拥有的朋友总数/平台上的用户总数,请计算出每个用户的受欢迎程度。
有一张表t_id_030记录了id,id不重复,但是会存在间断,求出连续段的起始位置和结束位置。
有一张表t_id_029记录了id,id不重复,但是会存在间断,求出连续段的最后一个数及每个连续段的个数。
有某城市网吧上网记录表,包含字段:网吧id,访客id(身份证号),上线时间,下线时间。- 规则1:如果两个用户在同一个网吧上线时间或者下线时间间隔在10分钟以内,则两个用户可能认识;- 规则2:如果两个用户在三家以上的网吧出现过【规则1】可能认识的情况,则两人一定认识;请计算该市中两人一定认识的组合数
有用户登录日志表,包含日期、用户ID,当天是否登录,请查询出当天活跃的用户当前连续活跃天数;
有员工薪资表,包含员工ID(emp_id),部门ID(depart_id),薪水(salary),请计算去除最高最低薪资后的平均薪水;(每个部门员工数不少于3人)
有用户点击日志记录表,包含user_id(用户ID),click_time(点击时间),请查询出连续点击三次的用户数