Hive中的GROUP BY语句用于将相同数据行的数据进行聚合
customer_id
对订单进行分组。SELECT customer_id, COUNT(*) as order_count
FROM orders
GROUP BY customer_id;
SELECT customer_id, COUNT(*) as order_count
FROM orders
GROUP BY customer_id;
在上面的示例中,输出格式如下:
customer_id | order_count |
---|---|
1 | 5 |
2 | 3 |
3 | 7 |
每个分组列的值将用于将数据分组,而聚合列的值是对分组数据进行计算的聚合结果。
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
推荐阅读:hive的split的输出格式是怎样的