这篇文章主要介绍了GDSC与CELL数据库的药物基因组学一致性实例分析的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇GDSC与CELL数据库的药物基因组学一致性实例分析文章都会有所收获,下面我们一起来看看吧。
Fig 1a: CCLE和GDSC药物筛选数据。
Fig 1b-1c:使用半数抑制浓度(IC50)和曲线下面积(AUC;1-AUC称为CCLE中的活性面积)对CCLE和GDSC药敏指标进行pearson相关性分析。全部结果见补充图。
Fig 1d-1e: pearson相关性(y轴)较spearson相关性(x轴)分析的相关性更强。
Fig 1f: 使用瀑布图对耐药株和敏感株进行分类,并将此研究(y轴)与haibe-kains研究的Cohen’kappa系数(两个变量的一致性系数)进行比较。
探究CCLE和GDSC细胞系集合在何种程度上能够阐明抗癌药功效的常见遗传学或分子基础。
使用CCLE和GDSC上的重叠细胞系进行了方差分析(ANOVA),从而确定两个数据集之间药物反应的分子相关性是否一致。总共使用两个模型,预测变量分别为IC50或活性面积(即1-AUC)得分,两个模型均将起源组织视为协变量,将71个癌基因的突变状态视为独立变量。
Fig 2A: ANOVA分析在13个化合物(GDSC或者CELL满足)、8个化合物(GDSC和CELL同时满足)鉴定出与耐药或者敏感最相关的已知基因标志。
扩展数据图6:对21,013个基因组特征(包括表达,拷贝数变化和突变)进行了多变量分析,更全面地评估基因组预测因子的一致性。
使用每个研究可用的完整数据集或仅使用重叠数据集进行弹性网络回归。该分析产生了强劲的预测分子,并且预测分子的重叠非常显着(χ2 P <10-8)。在至少一个数据集的13个化合物中,药物反应的已知预测因子作为最相关的分子。在两个数据集的10个化合物都显示出这种相关性,与CCLE和GDSC各自数据集所报告的结果一致。
对两个数据集中重叠药物的IC50值的弹性网络回归分析确定了其他预测因子。在nutlin-3敏感性的情况下,MDM2表达和TP53突变就是一个例子。在每个数据集上单独使用弹性网模型发现的4,957个药物基因关联中,仅观察到一个分歧的结果(占比0.02%,在两数据集中具有相反的权重系数)。
Fig 2B-2D:一个数据集用弹性回归以确定预测因子,另一个数据集用岭回归以验证预测因子的作用,探索确定药物敏感性的基因组预测因子。
CCLE和GDSC研究中确定的预测基因组特征具有高度一致性,即使对于很少有重叠细胞系的药物也是如此。> 80%的这些特征被确定为具有一致的方向性(标准化效应同为正或同为负)。在某些情况下,初始弹性网络回归无法确定预测变量,这通常部分归因于少量的药物敏感性细胞系。另一方面,一些基于AUC或IC50表现出低相关性的药物仍然能够识别一致的预测因子(例如,nutlin-3)。
关于“GDSC与CELL数据库的药物基因组学一致性实例分析”这篇文章的内容就介绍到这里,感谢各位的阅读!相信大家对“GDSC与CELL数据库的药物基因组学一致性实例分析”知识都有一定的了解,大家如果还想学习更多知识,欢迎关注亿速云行业资讯频道。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。