温馨提示×

hive外部表如何进行数据格式化

小樊
85
2024-12-21 13:43:52
栏目: 大数据
开发者测试专用服务器限时活动,0元免费领,库存有限,领完即止! 点击查看>>

在Hive中,可以使用FROM 'file_path' [OPTIONS]语句来读取外部文件,并通过ROW FORMATSTORED AS子句来指定数据的格式

  1. CSV格式:
CREATE EXTERNAL TABLE table_name (
    column1 datatype,
    column2 datatype,
    ...
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE;
  1. JSON格式:
CREATE EXTERNAL TABLE table_name (
    column1 datatype,
    column2 datatype,
    ...
)
ROW FORMAT SERDE 'org.openx.data.jsonserde.JsonSerDe'
WITH SERDEPROPERTIES (
    "serialization.format" = "1"
)
STORED AS TEXTFILE;
  1. Parquet格式:
CREATE EXTERNAL TABLE table_name (
    column1 datatype,
    column2 datatype,
    ...
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe'
WITH SERDEPROPERTIES (
    "serialization.format" = "1"
)
STORED AS PARQUET;
  1. ORC格式:
CREATE EXTERNAL TABLE table_name (
    column1 datatype,
    column2 datatype,
    ...
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.ql.io.orc.OrcSerde'
WITH SERDEPROPERTIES (
    "serialization.format" = "1"
)
STORED AS ORC;

请将table_namecolumn1column2datatype等替换为实际的表名、列名和数据类型。同时,根据需要修改OPTIONSSERDEPROPERTIES中的参数。

亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>

推荐阅读:hdfs hive如何进行数据格式化

0