在Hive中,可以使用COLLECT_LIST
和COLLECT_SET
函数结合DISTINCT
关键字来实现去重。以下是两种方法的示例:
方法1:使用COLLECT_LIST
和DISTINCT
SELECT
key,
COLLECT_LIST(DISTINCT value) as unique_values
FROM
your_table
GROUP BY
key;
方法2:使用COLLECT_SET
SELECT
key,
COLLECT_SET(value) as unique_values
FROM
your_table
GROUP BY
key;
在这两个示例中,我们首先根据key
列对数据进行分组。然后,我们使用COLLECT_LIST
或COLLECT_SET
函数来收集每个分组中的唯一值。COLLECT_LIST
会保留所有值(包括重复值),而COLLECT_SET
会自动去除重复值。最后,我们将结果列命名为unique_values
。