这篇文章跟大家分析一下“环状RNA数据库circBase怎么理解”。内容详细易懂,对“环状RNA数据库circBase怎么理解”感兴趣的朋友可以跟着小编的思路慢慢深入来阅读一下,希望阅读后能够对大家有所帮助。下面跟着小编一起深入学习“环状RNA数据库circBase怎么理解”的知识吧。
circBase是一个环状RNA的数据库,收录了人类,小鼠等多个物种的环状RNA信息,采用了find_circ软件来预测去核糖体文库中的环状RNA,该数据库的 网址如下
http://www.circbase.org/
在该数据库中,环状RNA的ID以物种的三字母缩写开头,比如hsa_circ_0018046
,记录了circRNA的头尾在染色体上的为位置,来源基因,序列等信息。通过以下3种方式可以检索该数据库
在主页的检索框中,可以根据环状RNA的ID, 来源基因的名称,转录本名称等多种方式进行检索
检索结果示意如下
软件通过检测覆盖连接点两侧的reads来识别环状RNA,对于一个环状RNA,只能够给出其头尾在染色体上的位置和正负链信息, 检索结果中的genomic length对应的就是基因组上环状RNA头尾之间的长度。
同时还提供了环状RNA对应的染色体区域上的重复元件和基因组特征的注释。
对于环状RNA的序列信息,根据头尾的染色体位置去和已知的转录本进行比较,选择一个最佳的转录本,即best transciprt作为参照,然后确定剪切之后环状RNA的序列,从而得到spliced length。 需要注意的是,这种方式得到的序列只是一个生信预测的结果,后续还是需要实验手段来验证的。
检索结果支持导出xlsx, txt, csv等多种格式,也可以导出环状RNA的序列,示意如下
支持导出基因组序列和剪切之后的序列,还可以向上下游延伸。
通过导航栏的list search, 可以依次检索多条记录,示意如下
选择对应的物种,然后输入多个需要检索的ID即可。
和UCSC的table browser类似,提供了更加灵活的筛选策略,检索框示意如下
通过blat按钮,可以输入fasta格式的查询序列,然后和数据库中的circRNA序列进行比较,示意如下
查询结果如下所示
该数据库是免费下载的,可以下载物种对应的环状RNA的列表,也可以下载对应的序列,同时还提供了find_circ软件的源代码,可以用于分析自己的测序数据中的circRNA。
关于环状RNA数据库circBase怎么理解就分享到这里啦,希望上述内容能够让大家有所提升。如果想要学习更多知识,请大家多多留意小编的更新。谢谢大家关注一下亿速云网站!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。