Hive通过HiveQL语言可以读取HDFS文件。在Hive中,可以使用CREATE EXTERNAL TABLE语句来创建外部表,然后使用SELECT语句来读取HDFS文件中的数据。以下是一个简单的示例:
CREATE EXTERNAL TABLE my_table (
id INT,
name STRING
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
LOCATION '/user/hive/data';
SELECT * FROM my_table;
在上面的示例中,首先创建了一个名为my_table的外部表,该外部表包含id和name两个字段,并且数据是以逗号分隔的。然后通过SELECT语句来读取my_table表中的数据。
需要注意的是,Hive中的外部表是与HDFS文件直接关联的,数据并不会被复制到Hive的存储中,因此对于HDFS文件的修改也会直接影响到Hive表的数据。