温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

如何将TCGA的ENSG编号转换成gene symbol

发布时间:2022-03-19 09:42:57 来源:亿速云 阅读:1952 作者:小新 栏目:开发技术

这篇文章给大家分享的是有关如何将TCGA的ENSG编号转换成gene symbol的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。

TCGA的ENSG编号转换成gene symbol

TCGA 数据库中的基因编号采用的Esembl 的编号,但是有些分析软件,需要输入的基因编号是 gene symbol ,这就需要将Esemble 的ID 转换成gene symbol  。 
采用clusterProfiler 进行转换:

# 加载相关软件包
> library(clusterProfiler)
> library(org.Hs.eg.db)

# org.Hs.eg.db 包提供的ID转换类型
> keytypes(org.Hs.eg.db)
 [1] "ACCNUM"       "ALIAS"        "ENSEMBL"      "ENSEMBLPROT"  "ENSEMBLTRANS" "ENTREZID"     "ENZYME"       "EVIDENCE"     "EVIDENCEALL" 
[10] "GENENAME"     "GO"           "GOALL"        "IPI"          "MAP"          "OMIM"         "ONTOLOGY"     "ONTOLOGYALL"  "PATH"        
[19] "PFAM"         "PMID"         "PROSITE"      "REFSEQ"       "SYMBOL"       "UCSCKG"       "UNIGENE"      "UNIPROT"     

# 测试ID
> test_id <- c("ENSG00000000971", "ENSG00000001084", "ENSG00000001460", "ENSG00000001461", "ENSG00000001626", "ENSG00000001630") 

# 采用bitr 命令进行ID的转换
> gene_ids <- bitr(test_id, fromType="ENSEMBL", toType=c("SYMBOL", "GENENAME"), OrgDb="org.Hs.eg.db")
'select()' returned 1:1 mapping between keys and columns

# 查看转换的结果
> gene_ids
          ENSEMBL  SYMBOL                                            GENENAME
1 ENSG00000000971     CFH                                 complement factor H
2 ENSG00000001084    GCLC         glutamate-cysteine ligase catalytic subunit
3 ENSG00000001460   STPG1              sperm tail PG-rich repeat containing 1
4 ENSG00000001461  NIPAL3                       NIPA like domain containing 3
5 ENSG00000001626    CFTR cystic fibrosis transmembrane conductance regulator
6 ENSG00000001630 CYP51A1      cytochrome P450 family 51 subfamily A member 1

感谢各位的阅读!关于“如何将TCGA的ENSG编号转换成gene symbol”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI