这篇文章主要介绍了在R语言中如何将ENSEMBL ID转换成Gene ID或者Symbol,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。
AnnotationDbi 和 结合物种对应的注释文件,将ENSEMBL ID转换成Gene ID(ENTREZID)
在R中如何利用ENSEMBL ID获得Gene ID(ENTREZID), 又或者转换为Gene Symbol,以人为例:
预先安装AnnotationDbi 和 org.Hs.eg.db
加载org.Hs.eg.db
> library(org.Hs.eg.db)
获取所有的ENSEMBL ID,并查看前五个ID
> k=keys(org.Hs.eg.db,keytype = "ENSEMBL") > head(k,5) [1] "ENSG00000121410" "ENSG00000175899" "ENSG00000256069" "ENSG00000171428" "ENSG00000156006"
基于提取的ENSEMBL ID,提取对应的所有Gene ID(ENTREZID),(以及Symbol),并查看一下提取的内容。
> list=select(org.Hs.eg.db,keys=k,columns = c("ENTREZID","SYMBOL"), keytype="ENSEMBL") 'select()' returned 1:many mapping between keys and columns > dim(list) [1] 29140 3 > head(list,5) ENSEMBL ENTREZID SYMBOL 1 ENSG00000121410 1 A1BG 2 ENSG00000175899 2 A2M 3 ENSG00000256069 3 A2MP1 4 ENSG00000171428 9 NAT1 5 ENSG00000156006 10 NAT2
预先准备的ENSEMBL ID,如何找到他们对应的Gene ID(ENTREZID)和Symbol,例如ID 中的,获得的对应关系:ID_list
> ID [1] "ENSG00000256069" "ENSG00000127837" "ENSG00000129673" "ENSG00000276016" "ENSG00000075624" "ENSG00000204262" [7] "ENSG00000149294" "ENSG00000069943" "ENSG00000173992" "ENSG00000166171" "ENSG00000177201" > ID_list=list[match(ID,list[,"ENSEMBL"]),] > ID_list ENSEMBL ENTREZID SYMBOL 3 ENSG00000256069 3 A2MP1 8 ENSG00000127837 14 AAMP 9 ENSG00000129673 15 AANAT 30 ENSG00000276016 29 ABR 59 ENSG00000075624 60 ACTB 1017 ENSG00000204262 1290 COL5A2 3856 ENSG00000149294 4684 NCAM1 7605 ENSG00000069943 9488 PIGB 8058 ENSG00000173992 9973 CCS 10155 ENSG00000166171 25911 DPCD 17531 ENSG00000177201 127064 OR2T12
感谢你能够认真阅读完这篇文章,希望小编分享的“在R语言中如何将ENSEMBL ID转换成Gene ID或者Symbol”这篇文章对大家有帮助,同时也希望大家多多支持亿速云,关注亿速云行业资讯频道,更多相关知识等着你来学习!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。