这篇文章给大家介绍IBS在遗传分析中的运用是怎样的,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。
遗传学中,在描述等位基因的同源关系时,会有IBD和IBS两个概念。
IBD 全称 Identity By Descent, 又叫做血缘同源,指的是两个个体中共有的等位基因来源于共同祖先;IBS全称Identity By Descent, 又叫做状态同源,指的是两个个体中共有的等位基因序列相同。
在家系数据中,由于有父代的分型数据, IBD运用的很多,在自然群体中,则通常使用IBS。本篇文章主要介绍IBS在数据分析中的运用。
IBS 本身只是个定性的概念,为了定量, 提出了IBS state的概念。对于一个SNP位点而言,IBS state 的值为两个个体中相同的allel个数。对于二倍体生物而言,IBS 取值包括0,1,2 三种,示意图如下
基于SNP分型结果, 我们可以计算样本间的IBS距离。IBS距离的计算公式如下
距离可以衡量样本间的相似性,根据IBS distance距离矩阵,可以对样本进行MDS分析。
以下截图来自一篇文献,在该文献中,基于样本间的IBS距离矩阵,通过MDS分析,对样本组成进行了探究。文献链接如下
https://www.ncbi.nlm.nih.gov/pubmed/21347369
通过MDS 分析对样本构成可以有一个清楚的认识,也可以用于剔除明显偏离群体的样本。
在实际的数据分析中,可以借助plink
软件来计算IBS距离矩阵,用法如下
plink --file hapmap1 --cluster --matrix --noweb
默认情况下会生成plink.mibs
文件,是一个距离矩阵,可以用R语言读取,然后进行MDS分析。
R语言中MDS分析的代码如下
m <- as.matrix(read.table("plink.mibs")) mds <- cmdscale(as.dist(1-m)) k <- c( rep("green",45) , rep("blue",44) ) plot(mds,pch=20,col=k) legend("topleft", legend = c("CHB", "JPB"), pch = 20, col = c("green", "blue"))
最终会生成如下的图片
不同的群体用不同颜色表示,可以看到, 所有样本分成了两大类。
享。
关于IBS在遗传分析中的运用是怎样的就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。