这篇文章主要介绍“怎么下载TCGA中指定Primary Site的样本数据”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“怎么下载TCGA中指定Primary Site的样本数据”文章能帮助大家解决问题。
代码:
# 筛选primary_site对应的癌症样本 library(GenomicDataCommons) resp = cases() %>% filter(~ project.project_id=='TCGA-HNSC' & primary_site =='Larynx') %>% GenomicDataCommons::select(c(default_fields(cases()),'samples.sample_type')) %>% response_all() resp %>% count() case_name <- resp$results$submitter_id # 之后对下载的samplesDown 进行过滤,获得需要下载的sample_download download_name = substr(samplesDown,1,12) sample_download <- samplesDown[download_name %in% case_name]
有了sample_download ,就可以采用TCGAbiolinks进行下载了。
把要下载的数据筛选出来之后重新得到query,添加barcode选项指定下载想要的数据:
query <- GDCquery(project = project, data.category = data_category, data.type = data_type, workflow.type = workflow_type, barcode = sample_download, # sample.type = sample_type, legacy = legacy)
关于“怎么下载TCGA中指定Primary Site的样本数据”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注亿速云行业资讯频道,小编每天都会为大家更新不同的知识点。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。