在Hive中,RANK()
函数用于计算每一行在结果集中的排名。它根据指定的排序规则对结果进行排序,并为每行分配一个排名值。如果多行具有相同的排序值,则它们将被分配相同的排名值,并且下一个排名将会跳过相应数量的位置。
RANK()
函数的语法如下:
RANK() OVER (
[ PARTITION BY col1, col2, ... ]
ORDER BY col3 [ASC|DESC]
)
其中,PARTITION BY
子句可选,用于指定分组的列,如果不指定,则将整个结果集分组。ORDER BY
子句用于指定排序的列以及排序的顺序。
以下是一个示例:
SELECT id, name, score,
RANK() OVER (ORDER BY score DESC) AS rank
FROM students;
上述示例中,RANK()
函数根据score
列的值降序排列结果集,并为每行分配一个排名值。最高分的学生将被分配排名1,其次是排名2,以此类推。