温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

分组求排名rank,row_number,dense_rank的区别是什么

发布时间:2022-01-04 10:17:48 来源:亿速云 阅读:135 作者:iii 栏目:大数据

本篇内容介绍了“分组求排名rank,row_number,dense_rank的区别是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

分组求排名

  • 相信好多使用Mysql的用户一定对分组求排名的需求感到发怵.

  • 但是在hive或者oracle来说就能简单实现.

  • 采用窗口函数:rank() over() / row_number() over() / dense_rank() over()函数就能轻松完成.

窗口函数

  • 我们可以理解为我们先把需要分析的字段select出来,然后通过窗口函数进行分析.

  • 所以窗口函数产生的结果一定是一对一的,即便在窗口中使用分组操作产生相同的值也每行数据都有.

示例

select 
    user_id,user_type,sales, --窗口函数的分析字段
    RANK() over (partition by user_type order by sales desc) as rank,
    ROW_NUMBER() over (partition by user_type order by sales desc) as row_number,    DENSE_RANK() over (partition by user_type order by sales desc) as dense_rankfrom
    order_detail;
  • 根据窗口函数的理解,我们来看上述例子

    • 要分析的字段有 user_type,sales,执行过程对这些字段select出来(可能select不太准确,但是要先取得这些要用于分析的字段)

    • 使用窗口函数进行分析 over() 是窗口函数,over()里面一般要写partition by 和 order by来对分析的数据进行分组和排序

    • over() 函数前边要定义分析策略,比如 rank(), row_number(),dense_rank()都是不同的分析策略.

结果

user_iduser_typesalesrankrow_numberdense_rank
wutongnew6111
qishilinew5222
lilisinew5232
wangernew3443
zhangsanew2554
qibaqiunew1665
liiunew1675
liweiold3111
wangshiold2222
lisiold1333
  • 如上述表格,rank() / row_number() / dense_rank() 都是进行排名.

    • rank()在处理相同排名的时候根据同排名数据数量进行顺延排名

    • dense_rank()在处理相同排名的时候不会顺延排名

    • row_number()如函数名,就是单单是排名后的行数

HIVE2.10以后over()函数支持对聚合函数的支持

SELECT rank() OVER (ORDER BY sum(b))FROM tableGROUP BY a;

上面等于于

SELECT sum_b rank() OVER (ORDER BY sum_b)FROM(    SELECT SUM(b) AS sum_b    FROM table
    GROUP BY a
) t;

“分组求排名rank,row_number,dense_rank的区别是什么”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI