如何使用cell ranger进行单细胞转录组定量分析

发布时间：2021-11-10 16:41:48 阅读：431 作者：柒染栏目：大数据

开发者测试专用服务器限时活动，0元免费领，库存有限，领完即止！点击查看>>

如何使用cell ranger进行单细胞转录组定量分析，针对这个问题，这篇文章详细介绍了相对应的分析和解答，希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

在RNA_seq数据的定量分析中，都是首先将reads比对到参考基因组，然后再使用定量软件进行定量，比如经典的hisat+stringTie的分析策略，对于单细胞转录组而言，其定量的原理也是一样的，只不过由于引入了UMI标签的设计，在定量时需要考虑相同UMI标签来自同一个转录本，直接使用传统的分析软件就不合适了。

官方提供的cell ranger软件不仅提供了数据拆分，也提供了定量等分析内容。

定量的前提都是需要将reads比对到参考基因组上，对于比对而言，第一步都是先对参考基因组建立索引，官网提供了人和小鼠的参考基因组供下载，网址如下

https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/latest

如何使用cell ranger进行单细胞转录组定量分析

对于其他物种，我们只需要有基因组的fasta文件和转录本的gtf文件，就可以自定义参考基因组，步骤如下

1. 对GTF文件进行过滤

在原始的GTF文件中，会包含非常多类型的基因，可以通过mkgtf子命令，筛选其中感兴趣的基因，用法如下

cellranger mkgtf \
hg38.ensembl.gtf \
hg38.ensembl.filtered.gtf \
--attribute=gene_biotype:protein_coding

通过attribute属性来筛选，上述例子中只筛选出蛋白编码基因对应的记录。

2. 建立索引

通过mkref子命令来建索引，用法如下

cellranger mkref \
--genome=output_genome \
--nthreads=10 \
--fasta=input.fa \
--genes=input.gtf

genome参数指定输出结果的目录，建好索引之后的目录结构如下

.
├── fasta
│   ├── genome.fa
│   └── genome.fa.fai
├── genes
│   └── genes.gtf
├── pickle
│   └── genes.pickle
├── reference.json
└── star

可以看到，cell ranger对基因组建立了STAR的索引，然后通过STAR将reads比对到参考基因组上。

定量分析通过count子命令实现，用法如下

cellranger count \
--id=sample345 \
--transcriptome=database_path \
--fastqs=fastq_path \
--sample=mysample \

id参数指定输出目录的名字,transcriptome参数指定基因组索引所在目录，fastqs指定mkfastq命令产生的序列文件所在目录，sample参数指定需要分析的样本，在fastq_path下对应一个子目录。

count子命令不仅可以进行定量分析，还提供了聚类，PCA, tSNE等一系列分析结果，输出结果目的录下文件很多，在后续我们会详细解读该命令的输出结果。

关于如何使用cell ranger进行单细胞转录组定量分析问题的解答就分享到这里了，希望以上内容可以对大家有一定的帮助，如果你还有很多疑惑没有解开，可以关注亿速云行业资讯频道了解更多相关知识。

亿速云「云服务器」，即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘，价格低至29元/月。点击查看>>

向AI问一下细节

如何使用cell ranger进行单细胞转录组定量分析

1. 对GTF文件进行过滤

2. 建立索引

猜你喜欢

最新资讯

相关推荐

开发者交流群：

相关标签