Hive中的表抽样(Table Sample)是一种用于查询部分数据的方法,而不是一种数据压缩技术
STORED AS
子句,例如:CREATE TABLE example_table (
id INT,
name STRING
) STORED AS TEXTFILE
OPTIONS ('compression'='SNAPPY');
这将在创建表时将数据存储为Snappy压缩的文本文件。
STORED AS
子句,例如:CREATE TABLE example_table (
id INT,
name STRING
) STORED AS PARQUET;
这将在创建表时将数据存储为Parquet压缩的列式文件。
总之,虽然Hive的表抽样功能本身不涉及数据压缩,但你可以通过选择合适的压缩格式和列式存储格式来实现数据压缩。
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
推荐阅读:hive tablesample怎样删除