本篇内容主要讲解“perl怎么从gff文件中提取对应转录本ID的基因结构信息”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“perl怎么从gff文件中提取对应转录本ID的基因结构信息”吧!
脚本源代码:
use Getopt::Long;
my %opts;
use Data::Dumper;
GetOptions( \%opts, "in1=s", "in2=s", "out=s", "h" );
if ( !defined( $opts{in1} )
|| !defined( $opts{in2} )
|| !defined( $opts{out} )
|| defined( $opts{h} ) )
{
&USAGE;
}
open( IN1, "$opts{in1}" ) || die "open $opts{in1} failed\n";
open( IN2, "$opts{in2}" ) || die "open $opts{in2} failed\n";
open( OUT, ">$opts{out}" ) || die "open $opts{out} failed\n";
my %gffs;
while (<IN1>) {
chomp;
next if /^#/;
my @b = split/\t/, $_;
$gffs{$b[0]} = 1;
}
#print Dumper(\%gffs);
while (<IN2>) {
chomp;
next if (/^#/);
my @a = split /\t/, $_;
next if $a[2]=~/exon/i;
if ($a[2] =~/^mRNA$/i or $a[2] =~/^transcript$/i ) {
($id1) = ($a[8] =~ m/ID=([^;]*)/);
}elsif ( $a[2] =~/^CDS$/i or $a[2] =~/utr/i ) {
($id1) = ($a[8] =~ m/Parent=([^;]*)/);
}else{
next;
}
if ( exists $gffs{$id1} ) {
print OUT "$_\n";
}
}
close OUT;
close IN1;
close IN2;
sub USAGE {
print "usage: perl $0 -in1 mRNA_id.txt -in2 genome.gff3 -out gene_location.txt ";
exit;
}
到此,相信大家对“perl怎么从gff文件中提取对应转录本ID的基因结构信息”有了更深的了解,不妨来实际操作一番吧!这里是亿速云网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。