Hive的存储格式主要有TextFile、SequenceFile、RCFile、ORC和Parquet等,其中ORC和Parquet都支持数据压缩。
在Hive中,你可以通过在创建表时指定存储格式为ORC或Parquet来启用压缩。例如:
CREATE TABLE example_table (
id INT,
name STRING
)
STORED AS ORC;
或者
CREATE TABLE example_table (
id INT,
name STRING
)
STORED AS PARQUET;
请注意,启用压缩可能会增加一些额外的存储空间开销,并且在读取压缩数据时可能会增加一些CPU负载。因此,在决定是否启用压缩时,需要综合考虑数据的访问模式、存储空间和性能需求等因素。