Hive 是一个基于 Hadoop 的数据仓库工具,它可以将结构化的数据文件映射为数据库表,并提供 SQL 查询功能
以下是一个简单的 Hive SQL 查询示例,用于根据某个字段对数据进行分组:
SELECT column_name, COUNT(*) as count
FROM table_name
GROUP BY column_name;
在这个示例中,column_name
是你想要根据其进行分组的字段,table_name
是你要查询的数据表名。COUNT(*)
函数用于计算每个分组中的行数。
如果你想要根据多个字段进行分组,可以使用逗号分隔的列名列表,如下所示:
SELECT column1, column2, COUNT(*) as count
FROM table_name
GROUP BY column1, column2;
在这个示例中,我们根据 column1
和 column2
这两个字段对数据进行分组。
注意:在使用 GROUP BY 子句时,SELECT 子句中的非聚合列必须包含在 GROUP BY 子句中。否则,Hive 会抛出一个错误。
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
推荐阅读:hive grouping有哪些用法