温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

HLAreporter软件有什么用

发布时间:2022-01-17 11:01:38 来源:亿速云 阅读:146 作者:小新 栏目:大数据

这篇文章主要为大家展示了“HLAreporter软件有什么用”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“HLAreporter软件有什么用”这篇文章吧。

在前面的文章中,我们详细介绍了HLA Allel的命名格式,示意图如下

HLAreporter软件有什么用

从示意图可以看出,一个HLA Allel 可以分成四个字段,在加上最后的修饰后缀,共5个字段;在定义HLA 分型结果的分辨率时,会根据分型结果的最大位数来判断,如果只给出了字段一,即血清学分类的信息,代表是2位的分型结果;如果最多给出了字段二,即对应的蛋白信息,代表是4位的分型结果;如果最多给出了字段三,即CDS区信息,代表是8位的分型结果;如果分型结果给出了最后的后缀,代表是9位的分型结果。

HLA分型的技术手段很多,比如芯片,高通量测序等;不同手段识别到的HLA Allel 分辨率不同,如果只能给出2位的分型结果,则属于低分辨率;如果给出4位分型结果,属于中分辨率;能够给出8位或以上分型结果,属于高分辨率。

本篇文章主要介绍HLA  reporter 软件,该软件可以利用高通量测序的结果进行HLA 分型。其分型结果分辨率高,最多可到9位。下图是该软件与其他同类软件的比较结果

HLAreporter软件有什么用

可以看到,在测试样本中,HLAreporter 软件分型结果由于HLAminer 的结果。该截图来自于官方文献,链接如下

https://genomemedicine.biomedcentral.com/articles/10.1186/s13073-015-0145-3

软件的官网如下

http://paed.hku.hk/genome/software.html

安装过程如下

wget http://paed.hku.hk/genome/software/HLAreporter.zip
unzip HLAreporter.zip
cd HLAreporter.v103

HLAreporter.sh就是该软件的运行脚本。其原理如下

HLAreporter软件有什么用

由于HLA的多态性,直接比对reads到参考基因组是不行的 ,HLAreporter 设计了一个CRP(comprehensive reference panel)参考基因组 , CRP 构建时参考了IMGT/HLA 数据库中已知的HLA  Allel信息,通过bwa将reads与CRP比对,提取比对到某个HLA基因的reads,然后进行组装,将组装的contig与数据库比较,确定最终的Allel。

该软件的用法如下

bash HLAreporter.sh test HLA_B test.R1.fq test.R2.fq

第一个参数test代表样本名称;第二个参数代表检测的HLA基因,第三个和第四个参数代表双端测序的fastq序列。

整个pipeline 分成了3个部分

1. bwa 比对 CRP 数据库

当你提供了原始的fastq 数据时,会自动调用4digit_map_HLA.sh脚本进行比对
该脚本核心内容如下

bwa aln exon23_high_resolution_multi_ref.fa $1 > $3_1_exon23_high_resolution_multi_ref.sai
bwa aln exon23_high_resolution_multi_ref.fa $2 > $3_2_exon23_high_resolution_multi_ref.sai
bwa sampe exon23_high_resolution_multi_ref.fa $3_1_exon23_high_resolution_multi_ref.sai $3_2_exon23_high_resolution_multi_ref.sai $1 $2 > $3_exon23_high_resolution_multi_ref.sam
samtools view -bS $3_exon23_high_resolution_multi_ref.sam > $3_exon23_high_resolution_multi_ref.bam
samtools view -b -F 4 $3_exon23_high_resolution_multi_ref.bam > $3_exon23_high_resolution_multi_ref_mappedreads.bam
samtools sort $3_exon23_high_resolution_multi_ref_mappedreads.bam $3_exon23_high_resolution_multi_ref_mappedreads_sorted
samtools index $3_exon23_high_resolution_multi_ref_mappedreads_sorted.bam

$1$2分别对应双端测序的R1和R2端reads, $3表示样本名称,通过调用bwa sampe,将原始的双端reads与exon23_high_resolution_multi_ref.fa比对,生成exon23_high_resolution_multi_ref_mappedreads_sorted.bam 文件。

2. 识别HLA Allel

对于HLA-A , HLA-B, HLA-C 这三个I型基因而言,调用4digit_predict_classI_ssake.sh脚本;对于HLA II 型基因,调用4digit_predict_classII_main.sh脚本。

3. 给出Allel 在不同人群中的频率

利用ANFD数据库中的信息,给出每个Allel在不同人群中的频率,通过脚本HLAfreq.sh实现。

最终输出结果保存在results目录下,示意如下

------------------------------------------------------------------
HLAreporter version 1.03
Report created
Fri Apr 17 11:24:24 HKT 2015
------------------------------------------------------------------
Allele
    DRB1*01:01:01G
Allele
    DRB1*04:07:01G
Phase
    DRB1*04:08:01
Alleles detected
DRB1*01:01:01G
DRB1*01:17
DRB1*04:08:01
DRB1*04:07:01G
Gap location:
97    208
Non-polymorphic gap:
111 bp
HLA data quality profile:
10xcov%    100    20xcov%    100    30xcov%    97    50xcov%    89
------------------------------------------------------------------
HLA allele frequency
Four populations in Europe China Japan Africa are shown
By allele frequency net database (www.allelefrequencies.net)
------------------------------------------------------------------
[Allele]    [EUR]    [CHN]    [JPN]    [AFR]
DRB1*01:01    0.0860    0.0230    0.0582    0.0130
DRB1*04:07    0.0112    0.0030    0.0057    0.0030
DRB1*04:08    0.0039    0.0020    0.0000    0.0000
DRB1*01:17    0.0000    0.0000    0.0000    0.0000

HLAreporter目前只支持对以下11个基因的分型

  1. HLA_A

  2. HLA_B

  3. HLA_C

  4. HLA_DRB1

  5. HLA_DRB2

  6. HLA_DRB3

  7. HLA_DRB4

  8. HLA_DRB5

  9. HLA_DQB1

  10. HLA_DPB1

  11. HLA_DQA1

以上是“HLAreporter软件有什么用”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注亿速云行业资讯频道!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI