怎么用GDC下载TCGA肿瘤患者的临床信息,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。
在GDC中,对肿瘤患者的临床信息进行了标准化,分成了以下7个类别
Demographic
Diagnosis
Exposure
Family History
Follow Up
Molecular Test
Treatment
其中有20项临床信息是必须的,展示如下
在GDC中,临床信息的下载和普通文件是类似的,在Repository
中,数据类型选择Clinical
, 示意如下
当然可以根据Cases
的属性在进行过滤,过滤之后,在右侧可以看到文件的列表,示意如下
可以看到,原始的临床信息采用了XML
格式来存储,在改文件中保存的信息更加全面。将对应的文件添加到Cart
中,可以进行下载,示意如下
如果需要下载原始的文件,可以通过点击Download
, 下载manifest文件,通过gdc-client来下载,这样做需要后期自己读取XML文件中的信息,在进行整理。
对于临床信息,同时还提供了TSV
和JSON
的下载格式,其中TSV
格式特别的友好,用Excel打开即可查看,示意如下
列数较多,这里只截取了部分。需要注意,这种方式得到的临床信息相比XML文件会少一点,但是对于生存分析等常用场景来说,也足够了。
看完上述内容,你们掌握怎么用GDC下载TCGA肿瘤患者的临床信息的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注亿速云行业资讯频道,感谢各位的阅读!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。