这篇文章主要讲解了“R语言apply系列函数如何使用”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“R语言apply系列函数如何使用”吧!
R语言的循环效率并不高,所以并不推荐循环以及循环嵌套。为了实现循环功能的情况下,兼顾效率,R语言提供了apply系列函数,用于对规则的数据进行函数式的迭代处理。
apply函数作用于两个维度以上的数组或矩阵,其必要的输入参数有三,分别是待处理数据、用于循环的维度、处理函数,示例如下
data <- matrix(c(1:20), 5, 4) apply(data, 1, mean) # [1] 8.5 9.5 10.5 11.5 12.5
上述代码的含义是,对data的第一个维度,执行平均值mean操作,换言之,对每一行取平均值。data是5行4列的矩阵,每行取平均值,可得到拥有4个元素的向量。
apply也支持对多个坐标轴的数据进行操作,仍以data为例,若想对所有元素取根号,则可以写为下面这样,其结果于sqrt(data)相同
> apply(data, 1:2, sqrt) [,1] [,2] [,3] [,4] [1,] 1.000000 2.449490 3.316625 4.000000 [2,] 1.414214 2.645751 3.464102 4.123106 [3,] 1.732051 2.828427 3.605551 4.242641 [4,] 2.000000 3.000000 3.741657 4.358899 [5,] 2.236068 3.162278 3.872983 4.472136
apply不能作用于一维数组,lapply和sapply补充了这一功能
> arr <- apply(data, 1, mean) > apply(arr, 1, sqrt) Error in apply(arr, 1, sqrt) : dim(X)的值必需是正数 > sapply(arr, sqrt) [1] 2.915476 3.082207 3.240370 3.391165 3.535534 > lapply(arr, sqrt) [[1]] [1] 2.915476 [[2]] [1] 3.082207 [[3]] [1] 3.24037 [[4]] [1] 3.391165 [[5]] [1] 3.535534
从上面代码可知,二者主要区别是返回值,sapply会根据实际情况调整返回值,其返回逻辑为
1个列表->向量
多个长度相同的列表->矩阵,
多个长度不同的列表->列表
相比之下,vapply可以更加灵活地选择输出数据类型
> vapply(arr, sqrt, numeric(1)) [1] 2.915476 3.082207 3.240370 3.391165 3.535534
rapply可以处理嵌套列表,其与lappy的区别试一下就知道
> x <- list(1,2,c(1:5)) > sapply(x, sqrt) [[1]] [1] 1 [[2]] [1] 1.414214 [[3]] [1] 1.000000 1.414214 1.732051 2.000000 2.236068 > rapply(x, sqrt) [1] 1.000000 1.414214 1.000000 1.414214 1.732051 2.000000 2.236068
换言之,rapply在执行的过程中,会不断地检查是否存在列表,如果存在列表,就把这个列表打开,其可用参数除了x, fun之外,还可指定处理的类别classes,以及处理方法how,how可选三个参数
"replace" 直接替换list中原来的元素
"list" 新建一个列表,元素类型复合classes则调用FUN
"unlist" 相当于对"list"模式下的结果调用unlist(recursive=TRUE)
tapply可对输入数据进行分组操作,下面以鸢尾花数据作为示例,来体验一下tapply的用法
> tapply(iris$Sepal.Length, iris$Species, mean) setosa versicolor virginica 5.006 5.936 6.588
iris提供了三种鸢尾花的长度、宽度等数据,其中iris$Species为其种类信息。上面代码的含义是,对iris的长度,按照相同的Species取平均值。
mapply的使用逻辑是,对两组相同维度的数据进行某种函数操作,类似于执行下面的操作
for(i in 1:N){ func(L1[i], L2[i]) }
下面以两种不同类别的鸢尾花做个示例
L1<-iris[iris$Species=="setosa",] L2<-iris[iris$Species=="virginica",] max(L1$Sepal.Length, L2$Sepal.Length) # 返回值为7.9,计算了所有数据中的最大值
下面通过mapply,可以发现对每种类别的50组数据进行了以一比对,并选择出了最大值
> mapply(max, L1$Sepal.Length, L2$Sepal.Length) [1] 6.3 5.8 7.1 6.3 6.5 7.6 4.9 7.3 6.7 7.2 6.5 6.4 6.8 5.7 5.8 [16] 6.4 6.5 7.7 7.7 6.0 6.9 5.6 7.7 6.3 6.7 7.2 6.2 6.1 6.4 7.2 [31] 7.4 7.9 6.4 6.3 6.1 7.7 6.3 6.4 6.0 6.9 6.7 6.9 5.8 6.8 6.7 [46] 6.7 6.3 6.5 6.2 5.9
感谢各位的阅读,以上就是“R语言apply系列函数如何使用”的内容了,经过本文的学习后,相信大家对R语言apply系列函数如何使用这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是亿速云,小编将为大家推送更多相关知识点的文章,欢迎关注!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。