这期内容当中小编将会给大家带来有关如何解析IMex和IntAct数据库,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。
蛋白质相互作用的数据库非常的多,比如DIP, MINT, IntAct, BioGRID等,不同数据库中的信息存在了大量的冗余,而且在不同数据库之间进行检索也非常的费力。
为了减少不同数据库的冗余,最大化提升数据存储和检索的效率,由多个数据库的开发团队和维护者共同参与成立了一个委员会,名字叫做international molecular exchange consortium, 简称IMEx, 该委员会致力于将不同数据库中的信息合并,减少冗余并提供了一个统一的查询工具
该委员会的成员示意如下
该项目的地址如下
http://www.imexconsortium.org/
通过官网的检索框,可以方便的检索各个成员数据库中的内容,示意如下
以tp53
为例,检索结果如下
点击IMEx
的链接,可以看到如下所示的表格
采用了MITAB
格式来展示蛋白质相互作用信息,通过左上角的Download
按钮可以进行下载,通过IMEx的官网,我们可以方便的查询某个蛋白的相关作用网络信息的,但是下载数据并不是非常的方便,如果要下载数据,还是要借助IntAct
数据库。
IntAct
数据库是IMEx的成员数据库之一,目前该数据也整合了IMEx的所有数据,网址如下
https://www.ebi.ac.uk/intact/
在线检索功能肯定是有的,如下所示,支持多种查询方式
在检索结果的页面,可以自定义展示的列信息,也可以选择对应的格式进行下载,示意如下
通过Graph
按钮,还可以显示查询蛋白的相互作用网络
和string数据库相比,IntAct的检索功能也有其局限性,只适用于查询单个蛋白的相互作用网络,无法查询输入的多个蛋白之间的相互作用网络。如果要查询多个蛋白之间的相互作用网络,只能自己写脚本从整个相互作用网络中提取信息,官网提供了下载功能,示意如下
提供了多种格式的下载,主要有XML
和TAB
两种格式, PSI-MI
格式就是xml格式的文件,PSI-MI TAB
就是\t
分隔的文件,TAB
格式的内容相对直观,而XML
格式适用于程序处理。
对于蛋白质相互作用网络而言,String数据库的使用更加简单,更加的人性化,所以知名度更高,而IMEx和IntAct的使用有一定的技术门槛,但是可以作为String数据库的一种补充,能够得到更加丰富的信息。
上述就是小编为大家分享的如何解析IMex和IntAct数据库了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注亿速云行业资讯频道。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。