在RHadoop中使用rhdfs包进行HDFS操作需要先安装rhdfs包。可以使用以下命令安装rhdfs包:
install.packages("rhdfs", repos = c("http://archive.linux.duke.edu/cran"))
安装完成后,可以按照以下步骤进行HDFS操作:
library(rhdfs)
hdfs.init()
hdfs.ls(path)
:列出HDFS指定路径下的文件和文件夹hdfs.mkdir(path)
:创建HDFS中的文件夹hdfs.put(local_path, hdfs_path)
:将本地文件上传到HDFShdfs.get(hdfs_path, local_path)
:将HDFS中的文件下载到本地hdfs.rm(path)
:删除HDFS中的文件或文件夹例如,上传本地文件到HDFS的示例代码如下:
hdfs.put("local_file.txt", "/hdfs_folder/local_file.txt")
这样就可以利用rhdfs包进行基本的HDFS操作了。
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
推荐阅读:RHadoop中怎么用rmr包进行MapReduce编程