要在Java中读取Hadoop文件,可以使用Hadoop的FileSystem API。以下是一种常见的方法:
Configuration conf = new Configuration();
conf.addResource(new Path("/path/to/hadoop/conf/core-site.xml"));
conf.addResource(new Path("/path/to/hadoop/conf/hdfs-site.xml"));
FileSystem fs = FileSystem.get(conf);
Path filePath = new Path("/path/to/hadoop/file");
FSDataInputStream in = fs.open(filePath);
BufferedReader reader = new BufferedReader(new InputStreamReader(in));
String line;
while ((line = reader.readLine()) != null) {
System.out.println(line);
}
注意:在读取文件后,记得关闭输入流和文件系统实例。
in.close();
fs.close();
以上就是在Java中读取Hadoop文件的基本步骤。可以根据实际需求进行适当的修改和扩展。