温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

R语言中编辑器的相关性分析是怎样的

发布时间:2021-11-22 09:38:44 来源:亿速云 阅读:142 作者:柒染 栏目:大数据

本篇文章为大家展示了R语言中编辑器的相关性分析是怎样的,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。


R语言中cor函数,只能计算相关系数,如果想要计算显著性,需要两两用cor.test进行,如果是多列数据,操作比较麻烦。这里介绍两个包,非常方便的进行多列数据的相关系数及其显著性的检验,并且给出可视化。

 

1. 模拟数据

这里模拟出10列数据,转化为数据库,是100行10列的数据,目的是为了计算这10列的相关系数及其显著性,虽然随机数没有显著性可言,但是作为一个演示,还是很可以说明问题的。

> set.seed(123)
> dd = as.data.frame(matrix(rnorm(1000),100,10))
> head(dd)
          V1          V2         V3         V4          V5          V6          V7         V8         V9        V10
1 -0.56047565 -0.71040656  2.1988103 -0.7152422 -0.07355602 -0.60189285  1.07401226 -0.7282191  0.3562833 -1.0141142
2 -0.23017749  0.25688371  1.3124130 -0.7526890 -1.16865142 -0.99369859 -0.02734697 -1.5404424 -0.6580102 -0.7913139
3  1.55870831 -0.24669188 -0.2651451 -0.9385387 -0.63474826  1.02678506 -0.03333034 -0.6930946  0.8552022  0.2995937
4  0.07050839 -0.34754260  0.5431941 -1.0525133 -0.02884155  0.75106130 -1.51606762  0.1188494  1.1529362  1.6390519
5  0.12928774 -0.95161857 -0.4143399 -0.4371595  0.67069597 -1.50916654  0.79038534 -1.3647095  0.2762746  1.0846170
6  1.71506499 -0.04502772 -0.4762469  0.3311792 -1.65054654 -0.09514745 -0.21073418  0.5899827  0.1441047 -0.6245675
   

2. 计算相关系数及显著性

首先要载入Hmisc这个包,因为我们要用这个包里面的rcorr函数,如果没有这个包,那就运行命令install.packages("Hmisc")安装即可。

❝  

题外话,这种蓝色的代码高亮,真是太好看了,我进而想到王者荣耀的皮肤那么多人购买真的是有很多人在乎颜值的,进而推测出我钻石五星段位的持久性与我没有氪金有很强的关联性,因为充钱的快乐只能N连胜的喜悦才可以体会。顺便说一句,当你N连跪之后就把游戏卸了洗洗睡吧,我今天都把腾讯的企业微信给投诉了,是截图投诉的,然后领导告诉我“知道为什么腾讯把你公众号封一个月吧?打游戏不氪金还瞎比比。。。”

❞  
> # 计算相关系数及显著性
> library(Hmisc)#加载包
> res2 <- rcorr(as.matrix(dd))
> res2
      V1    V2    V3    V4    V5    V6    V7    V8    V9   V10
V1   1.00 -0.05 -0.13 -0.04 -0.19 -0.06 -0.03  0.18 -0.02  0.01
V2  -0.05  1.00  0.03  0.04 -0.13  0.11  0.08 -0.03 -0.05 -0.09
V3  -0.13  0.03  1.00 -0.04 -0.02  0.02  0.01 -0.12 -0.05 -0.01
V4  -0.04  0.04 -0.04  1.00 -0.02 -0.09 -0.06  0.17 -0.17  0.25
V5  -0.19 -0.13 -0.02 -0.02  1.00  0.21 -0.01 -0.14 -0.04 -0.02
V6  -0.06  0.11  0.02 -0.09  0.21  1.00 -0.06  0.09  0.07 -0.03
V7  -0.03  0.08  0.01 -0.06 -0.01 -0.06  1.00  0.00 -0.13 -0.02
V8   0.18 -0.03 -0.12  0.17 -0.14  0.09  0.00  1.00  0.00  0.02
V9  -0.02 -0.05 -0.05 -0.17 -0.04  0.07 -0.13  0.00  1.00 -0.02
V10  0.01 -0.09 -0.01  0.25 -0.02 -0.03 -0.02  0.02 -0.02  1.00

n= 100


P
   V1     V2     V3     V4     V5     V6     V7     V8     V9     V10
V1         0.6246 0.2002 0.6632 0.0547 0.5767 0.7343 0.0706 0.8234 0.9135
V2  0.6246        0.7626 0.6650 0.1952 0.2567 0.4398 0.7435 0.6543 0.3653
V3  0.2002 0.7626        0.6576 0.8061 0.8573 0.9317 0.2544 0.5985 0.8866
V4  0.6632 0.6650 0.6576        0.8492 0.3737 0.5284 0.0950 0.1008 0.0139
V5  0.0547 0.1952 0.8061 0.8492        0.0392 0.9488 0.1628 0.6958 0.8741
V6  0.5767 0.2567 0.8573 0.3737 0.0392        0.5225 0.3515 0.4622 0.8046
V7  0.7343 0.4398 0.9317 0.5284 0.9488 0.5225        0.9979 0.2012 0.8398
V8  0.0706 0.7435 0.2544 0.0950 0.1628 0.3515 0.9979        0.9936 0.8107
V9  0.8234 0.6543 0.5985 0.1008 0.6958 0.4622 0.2012 0.9936        0.8225
V10 0.9135 0.3653 0.8866 0.0139 0.8741 0.8046 0.8398 0.8107 0.8225
   

3. 显著性的可视化

上面有相关系数,有对应的显著性,但是R语言做完统计如果没有可视化,就像吃完饭没有喝汤,总感觉少了什么,那就可视化吧!

> library(PerformanceAnalytics)#加载包
> chart.Correlation(dd, histogram=TRUE, pch=19)
 
R语言中编辑器的相关性分析是怎样的  
 

4. 完整代码

set.seed(123)
dd = as.data.frame(matrix(rnorm(1000),100,10))

head(dd)

# 计算相关系数及显著性
library(Hmisc)#加载包
res2 <- rcorr(as.matrix(dd))
res2

# 可视化
library(PerformanceAnalytics)#加载包
chart.Correlation(dd, histogram=TRUE, pch=19)


 

上述内容就是R语言中编辑器的相关性分析是怎样的,你们学到知识或技能了吗?如果还想学到更多技能或者丰富自己的知识储备,欢迎关注亿速云行业资讯频道。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI