如何使用cell ranger进行单细胞转录组定量分析,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。
在RNA_seq数据的定量分析中,都是首先将reads比对到参考基因组,然后再使用定量软件进行定量,比如经典的hisat+stringTie的分析策略,对于单细胞转录组而言,其定量的原理也是一样的,只不过由于引入了UMI
标签的设计,在定量时需要考虑相同UMI
标签来自同一个转录本,直接使用传统的分析软件就不合适了。
官方提供的cell ranger软件不仅提供了数据拆分,也提供了定量等分析内容。
定量的前提都是需要将reads比对到参考基因组上,对于比对而言,第一步都是先对参考基因组建立索引,官网提供了人和小鼠的参考基因组供下载,网址如下
https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/latest
对于其他物种,我们只需要有基因组的fasta文件和转录本的gtf文件,就可以自定义参考基因组,步骤如下
在原始的GTF文件中,会包含非常多类型的基因,可以通过mkgtf
子命令,筛选其中感兴趣的基因,用法如下
cellranger mkgtf \ hg38.ensembl.gtf \ hg38.ensembl.filtered.gtf \ --attribute=gene_biotype:protein_coding
通过attribute
属性来筛选,上述例子中只筛选出蛋白编码基因对应的记录。
通过mkref
子命令来建索引,用法如下
cellranger mkref \ --genome=output_genome \ --nthreads=10 \ --fasta=input.fa \ --genes=input.gtf
genome
参数指定输出结果的目录,建好索引之后的目录结构如下
. ├── fasta │ ├── genome.fa │ └── genome.fa.fai ├── genes │ └── genes.gtf ├── pickle │ └── genes.pickle ├── reference.json └── star
可以看到,cell ranger对基因组建立了STAR
的索引,然后通过STAR
将reads比对到参考基因组上。
定量分析通过count
子命令实现,用法如下
cellranger count \ --id=sample345 \ --transcriptome=database_path \ --fastqs=fastq_path \ --sample=mysample \
id
参数指定输出目录的名字,transcriptome
参数指定基因组索引所在目录,fastqs
指定mkfastq
命令产生的序列文件所在目录,sample
参数指定需要分析的样本,在fastq_path
下对应一个子目录。
count
子命令不仅可以进行定量分析,还提供了聚类,PCA, tSNE等一系列分析结果,输出结果目的录下文件很多,在后续我们会详细解读该命令的输出结果。
关于如何使用cell ranger进行单细胞转录组定量分析问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注亿速云行业资讯频道了解更多相关知识。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。