温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

怎么理解ArrayExpress数据库

发布时间:2021-11-23 10:49:07 来源:亿速云 阅读:342 作者:柒染 栏目:大数据

本篇文章给大家分享的是有关怎么理解ArrayExpress数据库,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。

和GEO数据库类似,ArrayExpress是属于EBI旗下的公共数据库,用于存放芯片和高通量测序的相关数据。

数据来源于下图所示的两个部分

怎么理解ArrayExpress数据库

第一部分是由科研工作者提交的数据,第二部分是从GEO数据库自动导入的数据,在该数据库中,数据以实验experiments为单位,每个实验对应一个唯一的编号,如下图所示

怎么理解ArrayExpress数据库

第一列的Accession代表每个实验设计对应的编号,Assays表示该实验对应的样本总数,Raw代表原始数据。当前版本数据量如下

怎么理解ArrayExpress数据库

通过该数据库,我们可以

  1. 检索数据,根据关键字,编号等查找感兴趣的数据集

  2. 下载数据,基于公共数据进行分析挖掘

  3. 提交数据,上传自己的数据到该数据库中


点击每个实验编号,可以显示详细信息,示意如下

怎么理解ArrayExpress数据库

红框标记的部分是通常会关注的3个部分,第一部分展示该实验包含的样本的详细信息,点击之后可以查看样本相关的metadata, 示意如下

怎么理解ArrayExpress数据库

第二部分用于下载数据,第三部分用于将该结果导入到其他软件,比如GenomeSpace中进行分析和查看。

除了下载和分析公共数据集,也可以上传自己的数据到该数据库。除了宏基因组/宏转录组, 转录组组装的相关结果数据,其他绝大部分数据都是可以上传到该数据库的,比如SNP分型,基因表达谱,chip_seq, atac_seq, 甲基化测序等结果都可以。

该数据库还配套了对应的API和R包,可以批量化,流程化地检索和下载数据,在没有数据的情况下,也可以基于ArrayExpress的公共数据进行深入挖掘。

以上就是怎么理解ArrayExpress数据库,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注亿速云行业资讯频道。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI