这篇文章主要介绍了AWK怎么提取所有基因位置信息的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇AWK怎么提取所有基因位置信息文章都会有所收获,下面我们一起来看看吧。
从基因组注释信息GFF文件中提取所有基因位置信息
gff文件当中存储了基因组当中所有基因的注释信息,如果想得到基因组当中所有基因的位置信息可以利用awk命令批量的提取,命令如下:
$ grep -v '#' Arabidopsis_thaliana.TAIR10.41.gff3|awk -F "[\t=:;]" 'BEGIN{OFS="\t"}$3=="gene"{print $1,$4,$5,$10}' |head 1 3631 5899 AT1G01010 1 6788 9130 AT1G01020 1 11649 13714 AT1G01030 1 23121 31227 AT1G01040 1 31170 33171 AT1G01050 1 33365 37871 AT1G01060 1 38444 41017 AT1G01070 1 44970 47059 AT1G01080 1 47234 49304 AT1G01090 1 49909 51210 AT1G01100
关于“AWK怎么提取所有基因位置信息”这篇文章的内容就介绍到这里,感谢各位的阅读!相信大家对“AWK怎么提取所有基因位置信息”知识都有一定的了解,大家如果还想学习更多知识,欢迎关注亿速云行业资讯频道。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。