本篇文章为大家展示了如何进行R语言探索约基奇数据的分析,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。
掘金又赢了,硬生生把系列赛从3比1打成了3:3,于是大家都来调侃说
我 约基奇(约G7)的名号可不是白叫的!哈哈哈哈
那作为一个喜欢篮球的R语言初学者,当然不能只看比赛了,还要把约基奇的常规数据探索学起来!
数据来源
https://www.statmuse.com/nba/player/nikola-jokic-9226/career-stats
library(xml2)
library(rvest)
library(reshape2)
library(ggplot2)
library(dplyr)
打开数据来源的链接,鼠标点击右键检查,将内容复制到文本文件中,我这里命名为new1.txt
page<-read_html("new1.txt")
Jokic<-html_table(page,fill=T)
Jokic[[9]]
list(Jokic)
df1<-Jokic[[9]]
colnames(df1)
散点图加折线图
df1_1<-df1[1:5,]%>%
select(Season,GS,MIN,FGA,"FG%")
df1_1
df1_1<-melt(df1_1)
head(df1_1)
ggplot(df1_1,aes(x=Season,y=value,color=variable))+
geom_point(size=5)+
geom_line(aes(group=1))+
facet_wrap(~variable,scales = "free")+
theme_bw()+
theme(legend.position = "none")+
labs(x="",y="")
从上图我们可以看到约基奇的命中率在17-18赛季最低,最近两个赛季在稳步上升,出手次数在19-20赛季略有下降,但出手次数整体是上升趋势,侧面反映约基奇从一个二轮秀到逐渐成为掘金队进攻核心的过程。场均出场时间17-18赛季达到最大值,恰好也是命中率最低的一个赛季,那我们可以合理猜测一下,要想最大效率的发挥约基奇的作用,应该合理安排他的出场时间。毕竟这桶行走的百岁山体力问题可能是一个较大的困扰。
df1_2<-df1[1:5,]%>%
select(Season,PTS,REB,AST,TOV,BLK)
df1_2<-melt(df1_2)
ggplot(df1_2,aes(x=Season,y=value,color=variable))+
geom_point(size=5)+
geom_line(aes(group=1))+
facet_wrap(~variable,scales = "free",ncol=3,nrow=2)+
theme_bw()+
theme(legend.position = "none",
axis.text.x = element_text(angle=60,vjust=0.5))+
labs(x="",y="")
从上图我们可以看到约基奇的得分、篮板、助攻数据在18-19赛季达到最大值,19-20赛季略呈下降趋势。可能的原因有很多,这里我猜可能是休赛季参加世界杯没有得到充足的休息导致的。
数据来源是 https://www.basketball-reference.com/players/j/jokicni01/gamelog-playoffs/
df2<-read.csv("new2.txt",header=F,
stringsAsFactors = F)
df2_1<-df2%>%
select(V3,V9,V11,V13,V14,V24,V29)
colnames(df2_1)<-c("Game","w_or_l","MIN","FGA","FG%","AST","PTS")
head(df2_1)
df2_1$w_or_l<-stringr::str_sub(df2_1$w_or_l,1,1)
df2_1$MIN<-stringr::str_sub(df2_1$MIN,1,2)
df2_1$MIN<-as.numeric(df2_1$MIN)
head(df2_1)
df2_1<-melt(df2_1,ids=c("Game",'w_or_l'))
head(df2_1)
ggplot(df2_1,aes(x=Game,y=value,color=w_or_l))+
geom_point(size=5)+
geom_line(aes(group=1))+
facet_grid(variable~.,scales = "free")+
theme_bw()+
theme(
legend.title = element_blank(),
axis.text.x = element_text(angle=60,vjust=0.5))+
labs(x="",y="")
比赛的胜负是诸多因素共同作用的结果,单纯从得分、及助攻等数据很难看出对比赛胜负的影响,除非你的队中有一位叫做波普的运动员。
list(Jokic)
df3<-Jokic[[7]]
df3
colnames(df3)[1]<-"Game"
colnames(df3)
df3_1<-df3[1:2,]%>%
select(Game,MPG,PPG,RPG,APG,BPG,TPG,"FG%","3P%","FT%")
df3_2<-melt(df3_1)
df3_2
df3_2$Game<-stringr::str_replace(df3_2$Game,"2019-20 ","")
ggplot(df3_2,aes(x=Game,y=value,fill=Game))+
geom_bar(stat="identity",width=0.5)+
facet_wrap(~variable,scales = "free")+
theme_minimal()+labs(x="",y="")+
theme(legend.position = "top",
legend.title = element_blank())
从上图可以看到 场均上场时间(MPG),场均得分(PPG)、场均盖帽(BPG)、三分命中率(3P%)季后赛的表现均高于常规赛。场均助攻数(APG)略少于常规赛,场均失误(TPG)也略多于常规赛。
上述内容就是如何进行R语言探索约基奇数据的分析,你们学到知识或技能了吗?如果还想学到更多技能或者丰富自己的知识储备,欢迎关注亿速云行业资讯频道。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。