IBS在遗传分析中的运用是怎样的

发布时间：2021-11-23 15:54:51 阅读：205 作者：柒染栏目：大数据

开发者测试专用服务器限时活动，0元免费领，库存有限，领完即止！点击查看>>

这篇文章给大家介绍IBS在遗传分析中的运用是怎样的，内容非常详细，感兴趣的小伙伴们可以参考借鉴，希望对大家能有所帮助。

遗传学中，在描述等位基因的同源关系时，会有IBD和IBS两个概念。

IBD 全称 Identity By Descent, 又叫做血缘同源，指的是两个个体中共有的等位基因来源于共同祖先；IBS全称Identity By Descent, 又叫做状态同源，指的是两个个体中共有的等位基因序列相同。

在家系数据中，由于有父代的分型数据， IBD运用的很多，在自然群体中，则通常使用IBS。本篇文章主要介绍IBS在数据分析中的运用。

IBS 本身只是个定性的概念，为了定量，提出了IBS state的概念。对于一个SNP位点而言，IBS state 的值为两个个体中相同的allel个数。对于二倍体生物而言，IBS 取值包括0，1，2 三种，示意图如下

IBS在遗传分析中的运用是怎样的

基于SNP分型结果，我们可以计算样本间的IBS距离。IBS距离的计算公式如下

IBS在遗传分析中的运用是怎样的

距离可以衡量样本间的相似性，根据IBS distance距离矩阵，可以对样本进行MDS分析。

以下截图来自一篇文献，在该文献中，基于样本间的IBS距离矩阵，通过MDS分析，对样本组成进行了探究。文献链接如下

https://www.ncbi.nlm.nih.gov/pubmed/21347369

IBS在遗传分析中的运用是怎样的

通过MDS 分析对样本构成可以有一个清楚的认识，也可以用于剔除明显偏离群体的样本。

在实际的数据分析中，可以借助plink软件来计算IBS距离矩阵，用法如下

plink --file hapmap1 --cluster --matrix --noweb

默认情况下会生成plink.mibs文件，是一个距离矩阵，可以用R语言读取，然后进行MDS分析。

R语言中MDS分析的代码如下

m <- as.matrix(read.table("plink.mibs"))
mds <- cmdscale(as.dist(1-m))
k <- c( rep("green",45) , rep("blue",44) )
plot(mds,pch=20,col=k)
legend("topleft", legend = c("CHB", "JPB"), pch = 20, col = c("green", "blue"))

最终会生成如下的图片

IBS在遗传分析中的运用是怎样的

不同的群体用不同颜色表示，可以看到，所有样本分成了两大类。

享。

关于IBS在遗传分析中的运用是怎样的就分享到这里了，希望以上内容可以对大家有一定的帮助，可以学到更多知识。如果觉得文章不错，可以把它分享出去让更多的人看到。

亿速云「云服务器」，即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘，价格低至29元/月。点击查看>>

向AI问一下细节

IBS在遗传分析中的运用是怎样的

猜你喜欢

最新资讯

相关推荐

开发者交流群：

相关标签