这篇文章主要介绍“r语言怎么合并列数不一致的多个数据集”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“r语言怎么合并列数不一致的多个数据集”文章能帮助大家解决问题。
Q:多个数据集,列数不一致,列名也不一致,如何按行合并,然后保留全部文件的变量并集呢?
A:使用 rbind.fill 函数试试!
数据集按列合并时,可以根据merge 或者 dplyr函数包的merge系列函数决定连接方式,达到数据合并的需求。
但是按行合并时常用的rbind,限制条件有点多,发现plyr包的rbind.fill 函数能比较好的解决这个问题。
一 生成数据
#生成随机数据
data1<- data.frame(x1=runif(5),x2= runif(5),x3= runif(5))
data2<- data.frame(x1=rnorm(5),x4= runif(5))
data3<- data.frame(x3=rnorm(5),x5= rnorm(5))
data1,data2,data3 列数不一致,列名也不一致,现在需要按行合并,可能的问题:
1)rbind: 是根据行进行合并(行叠加)但是要求rbind(a, c)中矩阵a、c的列数必需相等。
2)列数相同的时候,变量名不一致也会合并,导致出错
二 rbind.fill“智能”合并
rbind.fill
函数library(plyr)
rbind.fill(data1,data2,data3)
呐,就是这样,rbind.fill
函数会自动对应数据列名,不存在的会补充列,缺失时NA填充。
关于“r语言怎么合并列数不一致的多个数据集”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注亿速云行业资讯频道,小编每天都会为大家更新不同的知识点。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。