这篇文章给大家分享的是有关vcftools如何计算snp缺失率的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。
vcftools计算snp缺失率
vcftools中有两个参数可以计算vcf文件中snp的缺失率。
分别是:
--missing-indv 生成一个文件,报告每个样品的缺失情况,该文件的后缀为“.imiss”。
--missing-site 生成一个文件,报告每个snp位点的缺失情况,该文件的后缀为“.lmiss”。
具体用法:
vcftools --vcf snp.vcf. --missing-site
运行以上命令后会在当前目录生成一个 out.lmiss 文件,其格式如下:
CHR POS N_DATA N_GENOTYPE_FILTERED N_MISS F_MISS chr01 194921 988 0 368 0.37247 chr01 384714 988 0 204 0.206478 chr01 384719 988 0 202 0.204453 chr01 518438 988 0 488 0.493927 chr01 518473 988 0 452 0.45749 chr01 518579 988 0 418 0.423077 chr01 518635 988 0 428 0.433198 chr01 680786 988 0 346 0.350202 chr01 680834 988 0 412 0.417004
前两列为snp所在位置,第三列为等位基因总数,第5列为缺失的总数,最后一列为缺失率。
vcftools --vcf snp.vcf. --missing-indv
运行以上命令后会在当前目录生成一个 out.imiss 文件,其格式如下:
INDV N_DATA N_GENOTYPES_FILTERED N_MISS F_MISS
1 8747 0 3632 0.415228
10 8747 0 1264 0.144507
102 8747 0 2016 0.230479
105 8747 0 6322 0.722762
106 8747 0 2365 0.270378
107 8747 0 4376 0.500286
108 8747 0 5682 0.649594
109 8747 0 1877 0.214588
11 8747 0 1039 0.118784
第一列为样品名称,第二列为总的snp数,第4列为缺失的总数,最后一列为缺失率。
感谢各位的阅读!关于“vcftools如何计算snp缺失率”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。