温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

R语言-如何读写带分隔符的文件

发布时间:2021-04-26 14:05:46 来源:亿速云 阅读:425 作者:小新 栏目:开发技术

这篇文章给大家分享的是有关R语言-如何读写带分隔符的文件的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。

什么是R语言

R语言是用于统计分析、绘图的语言和操作环境,属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。

有众多的格式和文本文件标准可用于存储数据。用于存储数据的通用格式为分隔符值(即CSV或制表符分割文件)、可扩展标记语言(XML)、JavaScript对象表示法(JSON)

将数据存储在文本文件中的主要优点是:他们可被几乎所有的其他数据分析软件或人读取

R语言提供丰富的函数来读取不同格式的数据,包括:

文本文件(TXT文件)

逗号分隔文件(CSV文件)

TXT文件——read.table()

矩形(类似电子表格的)数据通常存储在带有分隔符的文件中,特别是逗号分隔值(CSV)和制表符分隔值文件。read.table将读取这些分隔符文件,并将结果存储在一个数据框中。其格式如下:

read.table(file,header = FALSE,sep = “”,quote = “”'",
dec = “.”,numerals = c(“allow.loss”,“warn.loss”,“no.loss”),
row.name,col.name,as.is = !stringsAsFactors,
na.strings = “NA”,colClasses = NA,nrow = -1,
skip = 0,check.names = TRUE,fill = !blank.lines.skip,
strip.white = FALSE,bla nk.lines.skip = TRUE,
comment.char = “#”,
allowEscapes = FALSE,flush = FALSE,
stringsAsFactors = default.stringsAsFactors(),
fileEncoding = “”,encoding = “unknown”,text,skipNul = FALSE)

read.table 函数的常用参数描述

参数描述
file文件名(包含在“”内,或使用一个字符型变量),可能需要全路径(即使是在Windows下,符号 \ 也不允许包含在内,必须用 / 或者 \ \ 替换)或者一个URL(Uniform Resource Location,统一资源定位符)链接(用URL对文件远程访问)
header一个逻辑值,用来反映这个文件的第1行是否包含变量名,为TRUE时表示文件的第1行为变量名
sep文件中的字段分隔符,例如,对用制表符分隔的文件使用sep=“\t”
quote指定用于包围字符型数据的字符
dec用来标识小数点的字符
fill如果为TRUE且所有行中的变量数目并不相同,则用空白填补
row.names保存着行名的向量,或文件中一个变量的序号或名字,默认时行号取为1、2、3···
col.names指定列名的字符型向量,默认值为V1、V2、V3···
encoding若文件中包含非ASCII字符字段,则使用此参数进行设置,可确保以正确的编码方式读取,避免出现乱码

更多高级选项包括:覆盖默认的行名、列名和类,指定输入文件的字符编码,以及输入的字符串格式的列如何声明

R语言-如何读写带分隔符的文件 R语言-如何读写带分隔符的文件

CSV文件——read.csv()

read.csv函数可读入一个逗号分隔文件并将其保存为一个数据框,其格式如下:

read.csv(file,header = TRUE,sep = “,”,quote = “” “,dec=” . ",fill = TRUE,comment.char = " ",ecoding = "unknown ",…)
参数描述
file文件名(包含在“”内,或使用一个字符型变量),可能需要全路径(即使是在Windows下,符号 \ 也不允许包含在内,必须用 / 或者 \ \ 替换)或者一个URL链接(用URL对文件远程访问)
header一个逻辑值,用来反映这个文件的第1行是否包含变量名,为TRUE时表示文件的第1行为变量名
sep文件中的字段分隔符,CSV文件默认为sep=","
quote指定用于包围字符型数据的字符
dec用来标识小数点的字符
fill如果为TRUE且所有行中的变量数目并不相同,则用空白填补
comment.char包含单个字符或空字符串的长度为1的字符向量,以这个字符开头的行将被忽略(要禁用这个参数,可使用comment.char=""
encoding若文件中包含非ASCII字符字段,则使用此参数进行设置,可确保以正确的编码方式读取,避免出现乱码

R语言-如何读写带分隔符的文件

与此相反的任务是写入文件,write.table和write.csv分别对应着read.table和read.csv的读操作

感谢各位的阅读!关于“R语言-如何读写带分隔符的文件”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI