这篇文章主要介绍了R语言怎么删除重复数据的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇R语言怎么删除重复数据文章都会有所收获,下面我们一起来看看吧。
R 删除重复数据的方法,包括duplicated 和unique 针对duplicated, 对向量的元素或数据框的行进行操作的时候,返回逻辑值,以下面的数据框为例: dat A B C D1 a b a c2 c k b d3 c k c c4...
R 删除重复数据的方法,包括duplicated 和unique
针对duplicated, 对向量的元素或数据框的行进行操作的时候,返回逻辑值,以下面的数据框为例:
dat A B C D 1 a b a c 2 c k b d 3 c k c c 4 d e q k 5 e f g l 6 h g h q 7 j f q k 8 a b a c 9 e f g l 10 o o l m duplicated(dat) [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE TRUE FALSE
dat是一个十行的数据框,其中第8行和第1行重复,第9行和第5行的数据重复,所以,返回值的第8和第9是TRUE,因此,可以按照如下操作,排除为TRUE,也就是重复的数据,只取数据第一次出现的结果。
dat[!duplicated(dat),] A B C D 1 a b a c 2 c k b d 3 c k c c 4 d e q k 5 e f g l 6 h g h q 7 j f q k 10 o o l m
duplicated可以针对具体区域进行重复数据的判断,例如:
dat[!duplicated(dat[,c("A","B")]),] A B C D 1 a b a c 2 c k b d 4 d e q k 5 e f g l 6 h g h q 7 j f q k 10 o o l m dat[!duplicated(dat[1:8,]),] A B C D 1 a b a c 2 c k b d 3 c k c c 4 d e q k 5 e f g l 6 h g h q 7 j f q k 9 e f g l 10 o o l m dat[!duplicated(dat[1:8,c("A","B")]),] A B C D 1 a b a c 2 c k b d 4 d e q k 5 e f g l 6 h g h q 7 j f q k 9 e f g l 10 o o l m
unique 针对向量和着数据框进行处理,会直接将删除重复后的结果进行返回,返回结果取首次出现结果:
unique(dat) A B C D 1 a b a c 2 c k b d 3 c k c c 4 d e q k 5 e f g l 6 h g h q 7 j f q k 10 o o l m
两种处理结果,原行名都未发生变化。
关于“R语言怎么删除重复数据”这篇文章的内容就介绍到这里,感谢各位的阅读!相信大家对“R语言怎么删除重复数据”知识都有一定的了解,大家如果还想学习更多知识,欢迎关注亿速云行业资讯频道。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。