这篇“怎么用bedtools统计VCF文件中各染色体不同区域中的变异数量”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“怎么用bedtools统计VCF文件中各染色体不同区域中的变异数量”文章吧。
1.获得基因组的各染色体的长度信息
$ samtools faidx genome.fa #生成gemome.fa.fai文件第一列为染色体,第二列为对应染色体长度 chr01 44488843 7 44488843 44488844 chr02 38522657 44488858 38522657 38522658 chr03 34302425 83011523 34302425 34302426 chr04 31904921 117313956 31904921 31904922 chr05 31465669 149218885 31465669 31465670 chr06 29481096 180684562 29481096 29481097 chr07 26142479 210165666 26142479 26142480 chr08 23295356 236308153 23295356 23295357 chr09 21309744 259603517 21309744 21309745 chr10 20413421 280913269 20413421 20413422
2.根据染色体的长度产出区域文件:
$ bedtools makewindows -g genome.fa.fai -w 100000 >region.bed $ head region.bed chr01 0 100000 chr01 100000 200000 chr01 200000 300000 chr01 300000 400000 chr01 400000 500000
3.输入vcf文件统计不同区域里面变异个数
$ bedtools coverage -a region.bed -b q4.vcf -counts >result.txt
以上就是关于“怎么用bedtools统计VCF文件中各染色体不同区域中的变异数量”这篇文章的内容,相信大家都有了一定的了解,希望小编分享的内容对大家有帮助,若想了解更多相关的知识内容,请关注亿速云行业资讯频道。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。