温馨提示×

温馨提示×

您好，登录后才能下订单哦！

密码登录×

忘记密码？

登录注册×

获取短信验证码

其他方式登录

点击登录注册即表示同意《亿速云用户服务条款》

用户登录×

账户密码登录

请使用微信扫描上方二维码

使用帮助

请求超时！

请点击重新获取二维码

如何使用cell ranger拆分10X单细胞转录组原始数据

发布时间：2021-11-10 16:43:03 阅读：227 作者：柒染栏目：大数据

开发者测试专用服务器限时活动，0元免费领，库存有限，领完即止！点击查看>>

如何使用cell ranger拆分10X单细胞转录组原始数据，相信很多没有经验的人对此束手无策，为此本文总结了问题出现的原因和解决方法，通过这篇文章希望你能解决这个问题。

cell ranger是10X genomics公司提供的，专门用于分析10X 单细胞转录组数据的pipeline, 包含了原始数据拆分，表达定量，聚类分析等多个功能，本文主要介绍如何使用该软件来拆分原始数据。

直接从官网下载最新版的软件即可，网址如下

https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/latest

该软件由多个子命令构成，通过mkfastq命令拆分数据，流程示意如下

如何使用cell ranger拆分10X单细胞转录组原始数据

有以下两种使用方式

cellranger mkfastq \
--id test \
--run run_directory \
--csv simple.csv

cellranger mkfastq \
--id test \
--run  run_directory \
--samplesheet samplesheet.csv

id参数指定输出目录的名字，run参数指定下机的原始bcl文件所在的目录，该命令其实是对illumina提供的拆分数据的bcl2fastq命令的一个封装，需要样本名称，index等信息，支持两种格式，一种就是illlumina常规的samplesheet.csv文件，格式如下

如何使用cell ranger拆分10X单细胞转录组原始数据

另外一种是10X genomics定制的一种简化版的csv格式，内容如下

Lane,Sample,Index
1,test_sample,SI-GA-A3

只有3列，第一列指定lane ID, 第二列指定样本名称，第三列指定index的名称，10X genomics的每个index代表4条具体的oligo序列，示意如下

如何使用cell ranger拆分10X单细胞转录组原始数据

在根据index确定样本时，允许1到2个碱基的错配。在实际拆分数据时，更加推荐使用三列的CSV文件，因为samplesheet文件中需要根据不同版本的试剂盒修改对应的Reads信息。

V2试剂盒产生的文库结构如下所示

如何使用cell ranger拆分10X单细胞转录组原始数据

V3试剂盒产生的文库结构如下所示

如何使用cell ranger拆分10X单细胞转录组原始数据

和V2相比，V3试剂盒中所用的UMI和PolyT的长度都发生了变化，从而导致测序得到的R1和R2端的序列长度也不一致，V2试剂盒的R1端长度为26bp, 包含16bp的barcode和10bp的UMI序列，V3试剂盒的R1端长度为28bp, 包含16bp的barcode和12bp的UMI序列；V2试剂盒的R2端为98bp, V3试剂盒的R2端为91bp。

如果使用samplesheet文件，需要调整[Reads]中的序列长度，而使用简化版的csv文件，cell ranger可以识别所用试剂盒版本，然后自动化的调整reads长度。
拆分好之后的目录结构如下所示

├── fastq_path
│   ├── H35KCBCXY
│   │   └── test_sample
│   │       ├── test_sample_S1_L001_I1_001.fastq.gz
│   │       ├── test_sample_S1_L001_R1_001.fastq.gz
│   │       └── test_sample_S1_L001_R2_001.fastq.gz

对于每个样本，除了常见的R1和R2端序列，还多出来一个I1序列文件，该文件中保存的是index序列，示意如下

@D00547:905:H35KCBCXY:1:1101:19188:87078 1:N:0:AGATCGGG
AGATCGGG
+
.<<....<

后续的子命令也是通过这种特定的目录结构来进行分析，如果你有从其他地方下载的原始数据，也可以整理成这种目录结构，方便后续使用cell ranger进行分析。

看完上述内容，你们掌握如何使用cell ranger拆分10X单细胞转录组原始数据的方法了吗？如果还想学到更多技能或想了解更多相关内容，欢迎关注亿速云行业资讯频道，感谢各位的阅读！

亿速云「云服务器」，即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘，价格低至29元/月。点击查看>>

向AI问一下细节

推荐阅读：

免责声明：本站发布的内容（图片、视频和文字）以原创、转载和分享为主，文章观点不代表本网站立场，如果涉及侵权请联系站长邮箱：is@yisu.com进行举报，并提供相关证据，一经查实，将立刻删除涉嫌侵权内容。

原文链接：https://my.oschina.net/u/4580290/blog/4616005

上一篇新闻：
PostgreSQL中pgmetrics有什么作用
下一篇新闻：
Django中的unittest应用是什么

猜你喜欢

AI
助
手

产品服务

地区划分

专题活动

帮助支持

关于我们

售后咨询

7*24小时在线电话：400-100-2938

7*24小时在线 QQ：800811969

关注亿速云

亿速云公众号

手机网站二维码