agilent表达谱芯片注释信息提取的方法

发布时间：2022-03-19 14:26:03 阅读：506 作者：iii 栏目：开发技术

开发者测试专用服务器限时活动，0元免费领，库存有限，领完即止！点击查看>>

本文小编为大家详细介绍“agilent表达谱芯片注释信息提取的方法”，内容详细，步骤清晰，细节处理妥当，希望这篇“agilent表达谱芯片注释信息提取的方法”文章能帮助大家解决疑惑，下面跟着小编的思路慢慢深入，一起来学习新知识吧。

不规范的表达谱芯片注释信息提取

1、GEO数据库中 agilent表达谱芯片由与其设计往往比较个性化，涉及的芯片型号很多，使用的Cy5/Cy3的双色芯片或者仅使用Cy3的单色芯片，数据上比较混乱，而GEO中提供的GPL信息文件格式和affymetrix 、illumina 的表达谱芯片对应的GPL格式差别较大，虽然格式整齐，并不完全规范（相对于直接利用GEOquery下载芯片注释文件而言）。

2、若直接下载标准化数据的同时，利用GEOquery下载对应的GPL芯片平台信息往往出现报错，或者提取信息过程中出现提取错误，这里针对格式相对整齐统一的这种agilent表达谱芯片GPL信息提供一种获取的方法，在进行芯片原始数据标准化的过程中直接获得其中的注释信息：探针和基因等对应关系。

3、此处仅以单通道芯片数据为例：案例数据GSE83902 基于limma包读取数据，并进行预处理，标准化之后，获取的结果时一个EList对象，这个对象中包含了探针和基因之间的对应关系，先对芯片中重复的探针检测值取均值之后，获取的还是一个EList（此处用averEList向量表示取均值后的返回结果）：

查看averEList 中对应的genes信息，这个矩阵中包括了每一列信息如下涉及探针ProbeName 和GeneName以及描述信息，之后提取保存即可：

> colnames(averEList$genes)
 [1] "Row"            "Col"            "Start"          "Sequence"       "ProbeUID"      
 [6] "ControlType"    "ProbeName"      "GeneName"       "SystematicName" "Description"   
> Probe=averEList$genes[,c("ProbeName","GeneName","SystematicName","Description")]
> head(Probe,5)
        ProbeName        GeneName  SystematicName
1 GE_BrightCorner GE_BrightCorner GE_BrightCorner
2      DarkCorner      DarkCorner      DarkCorner
4    A_23_P117082           HEBP1       NM_015987
5   A_33_P3246448           KCNE4       NM_080671
6   A_33_P3318220          BPIFA3       NM_178466
                                                                                               Description
1                                                                                                         
2                                                                                                         
4                                        ref|Homo sapiens heme binding protein 1 (HEBP1), mRNA [NM_015987]
5 ref|Homo sapiens potassium voltage-gated channel, Isk-related family, member 4 (KCNE4), mRNA [NM_080671]
6 ref|Homo sapiens BPI fold containing family A, member 3 (BPIFA3), transcript variant 1, mRNA [NM_178466]

注意：不同芯片获取的EList结果中可以EList$genes 获取的矩阵涉及的列名不一致，具体情况具体对待

读到这里，这篇“agilent表达谱芯片注释信息提取的方法”文章已经介绍完毕，想要掌握这篇文章的知识点还需要大家自己动手实践使用过才能领会，如果想了解更多相关内容的文章，欢迎关注亿速云行业资讯频道。

亿速云「云服务器」，即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘，价格低至29元/月。点击查看>>

向AI问一下细节

agilent表达谱芯片注释信息提取的方法

猜你喜欢

最新资讯

相关推荐

开发者交流群：

相关标签