温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

qiime2如何建立分类器

发布时间:2022-03-21 10:24:56 来源:亿速云 阅读:369 作者:iii 栏目:开发技术

本篇内容主要讲解“qiime2如何建立分类器”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“qiime2如何建立分类器”吧!

建立或获取分类器

这种方法要求事先基于参考数据库训练分类器。QIIME 2 团队建议为不同的引物组合建立专门的分类器。对于一些大家常用的引物组合,可直接在仓库中下载( http://kronos.pharmacology.dal.ca/public_files/taxa_classifiers/qiime2-2020.2_classifiers/ ),没有的话则需要自己手动建立分类器:

•16S V4/V5 region (classifier_silva_132_99_16S_V4.V5_515F_926R.qza)


16S V3/V4 region (classifier_silva_132_99_16S_V3.V4_341F_805R.qza)


16S V6/V8 region (classifier_silva_132_99_16S_V6.V8_B969F_BA1406R.qza)


16S V6/V8 region targeting archaea (classifier_silva_132_99_16S_V6.V8_A956F_A1401R.qza)


16S V3/V4 region targeting cyanobacteria (classifier_silva_132_99_16S_V3.V4_CYA359F_CYA781R.qza)


18S V4 region (classifier_silva_132_99_18S_V4_E572F_E1009R.qza)


Full ITS - fungi only (classifier_sh_refs_qiime_ver8_99_s_02.02.2019_ITS.qza)


Full ITS - all eukaryotes (classifier_sh_refs_qiime_ver8_99_s_all_02.02.2019_ITS.qza)


此外,在使用这些自定义分类器时,我们应仔细检查它们在数据集上是否正确执行,手动检查分类器对 ASV 的分类尤为重要。理论上,使用特定于引物的分类器,可以改进物种注释的效果,但仍建议你在首次运行自定义 16S 分类器时同时运行全长 16S 分类器进行比较。

自己手动建立分类器代码示例: 这里以V3-V4区引物为例:

338F (5′-ACTCCTACGGGAGGCAGCAG-3′) and. 806R (5′-GGACTACHVGGGTWTCTAAT-3′)

# 下载数据库文件(greengenes)

wget -c ftp://greengenes.microbio.me/greengenes_release/gg_13_5/gg_13_8_otus.tar.gz

# 解压

tar -zxvf gg_13_8_otus.tar.gz

# 使用rep_set文件中的99_otus.fasta数据和taxonomy中的99_OTU_taxonomy.txt数据作为参考物种注释

# 导入参考序列

qiime tools import \

  --type 'FeatureData[Sequence]' \

  --input-path gg_13_8_otus/rep_set/99_otus.fasta \

  --output-path 99_otus.qza

# 导入物种分类信息

qiime tools import \

  --type 'FeatureData[Taxonomy]' \

  --input-format HeaderlessTSVTaxonomyFormat \

  --input-path gg_13_8_otus/taxonomy/99_otu_taxonomy.txt \

  --output-path ref-taxonomy.qza

# 本次使用  338F (5′-ACTCCTACGGGAGGCAGCAG-3′) and. 806R (5′-GGACTACHVGGGTWTCTAAT-3′)

#It has been shown that taxonomic classification accuracy of 16S rRNA gene sequences improves when a Naive Bayes classifier is trained on only the region of the target sequences that was sequenced (Werner et al., 2012). 

qiime feature-classifier extract-reads \

  --i-sequences 99_otus.qza \

  --p-f-primer ACTCCTACGGGAGGCAGCAG \

  --p-r-primer GGACTACHVGGGTWTCTAAT \

  --o-reads ref-seqs.qza

# Train the classifier(分类器)

# 基于筛选的指定区,生成实验特异的分类器

time qiime feature-classifier fit-classifier-naive-bayes \

  --i-reference-reads ref-seqs.qza \

  --i-reference-taxonomy ref-taxonomy.qza \

  --o-classifier classifier_gg_13_8_99_V3-V4.qza

#Classification of fungal ITS sequences

#In our experience, fungal ITS classifiers trained on the UNITE reference database do NOT benefit from extracting/trimming reads to primer sites. We recommend training UNITE classifiers on the full reference sequences. Furthermore, we recommend the “developer” sequences (located within the QIIME-compatible release download) because the standard versions of the sequences have already been trimmed to the ITS region (excluding portions of flanking rRNA genes that may be present in amplicons generated with standard ITS primers).

到此,相信大家对“qiime2如何建立分类器”有了更深的了解,不妨来实际操作一番吧!这里是亿速云网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI