Hive中的grouping聚合函数主要包括以下几种:
- AVG():计算某个数值字段的平均值。
- COUNT():计算某个字段的非空值数量。
- COUNT(DISTINCT column_name):计算某个字段的非空值的不同取值的数量。
- FIRST()和LAST():返回某个字段的第一个值和最后一个值。
- MAX()和MIN():分别返回某个字段的最大值和最小值。
- SUM():计算某个数值字段的总和。
- SUM(DISTINCT column_name):计算某个字段的不同取值的总和。
- GROUP_CONCAT(column_name [SEP sep] [ORDER BY order_by] [LIMIT limit]):将某个字段的所有值按照指定的分隔符连接成一个字符串,并可以指定排序和限制返回的结果数量。
- HAVING:对分组后的结果进行筛选,使用条件表达式来过滤分组。注意,HAVING子句不能单独使用,必须配合GROUP BY子句一起使用。
这些聚合函数可以与GROUP BY子句一起使用,以便对数据进行分组和汇总。请注意,在使用这些函数时,应确保数据类型与函数参数相匹配,以避免类型错误。