今天就跟大家聊聊有关GEO数据库中的platform信息是怎样的,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
GEO数据库中的platform代表测序平台或者芯片平台,每一个platform用GPL
开头的编号唯一标识。对于一个platform而言,通常包含以下3种文件
soft
miniml
suppl
以GPL20814
为例,链接如下
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL20814
soft
和miniml
都是表示该platform的基础信息,比如GPL编号,上传日期等,soft
文件的部分内容如下
^DATABASE = GeoMiame
!Database_name = Gene Expression Omnibus (GEO)
!Database_institute = NCBI NLM NIH
!Database_web_link = http://www.ncbi.nlm.nih.gov/geo
!Database_email = geo@ncbi.nlm.nih.gov
^PLATFORM = GPL20814
!Platform_title = Human miRNA Array miRbase release 19
!Platform_geo_accession = GPL20814
!Platform_status = Public on Jun 12 2017
!Platform_submission_date = Aug 18 2015
!Platform_last_update_date = Jun 12 2017
在soft
文件中,每种类别的信息以^
开头,常见的类别如下所示
DATABASE
PLATFORM
SAMPLE
SERIES
DATABASE
代表GEO数据库的基本信息,PLATFORM
代表该平台的基本信息,SAMPLE
代表用该平台得到的样本信息,SERIES
代表使用该平台得到的一组样本。
在每种类别中,!
开头代表一种类型的信息,常规格式为key = value
, 比如
Platform_geo_accession = GPL20814
对于芯片平台而言,还会提供探针和基因之间的对应关系等信息,在对应的网页上,我们可以看到如下的表格
这部分内容在soft
文件中也是存在的,示意如下
!platform_table_begin
ID Reporter Name miRNA_ID SPOT_ID
272 hsa-miR-99b-5p MIMAT0000689
271 hsa-miR-99b-3p MIMAT0004678
270 hsa-miR-99a-5p MIMAT0000097
269 hsa-miR-99a-3p MIMAT0004511
268 hsa-miR-98-5p MIMAT0000096
...
!platform_table_end
采用配对的两个!
叹号来表示数据的开始和结束,在中间存放对应的表格数据。
miniml
中的内容和soft
是一样的,只是用XML
格式来存储上述信息,而supplement file则是由提交者自己上传的一些补充文件,没有明确的格式。
看完上述内容,你们对GEO数据库中的platform信息是怎样的有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注亿速云行业资讯频道,感谢大家的支持。
亿速云「云数据库 MySQL」免部署即开即用,比自行安装部署数据库高出1倍以上的性能,双节点冗余防止单节点故障,数据自动定期备份随时恢复。点击查看>>
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。
原文链接:https://my.oschina.net/u/4580290/blog/4616010