温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

TCGA临床信息如何正确的保存格式

发布时间:2022-03-19 11:23:10 来源:亿速云 阅读:177 作者:小新 栏目:开发技术

这篇文章主要为大家展示了“TCGA临床信息如何正确的保存格式”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“TCGA临床信息如何正确的保存格式”这篇文章吧。

TCGA临床信息如何正确的保存格式, 避免错行,错列的情况

TCGA的临床数据,经过TCGAbiolinks 下载之后,需要保存到文件中,一般大家都希望保存的文件能够采用excel 打开。

但是临床数据中存在几个问题:

1. 一些值缺失,没有值填充

2, 一些字段中存在空格,逗号等

如果直接采用R中的 write.table进行读写,经常会存在数据错行,字段错列的情况,主要的原因是该函数默认采用tab格式 :“\t” 进行数据分割,而excel 无法区分 空格和tab。

这就需要采用一个临床信息中没有的分隔符,对数据进行分割 ,比如,采用星号(*)去分割。

# 将数据保存到文件
clinical_file <- paste0(DataDirectory, "_","clinical",".txt")
write.table(clinical, file = clinical_file, row.names = F, col.names=T,quote = T,sep='*',na = "NA")

之后打开excel 时,对数据进行分列,同样选用星号(*) 即可。

以上是“TCGA临床信息如何正确的保存格式”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注亿速云行业资讯频道!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI