通过Eigen score衡量变异位点的功能重要性

网友投稿 1200 2022-11-25

通过Eigen score衡量变异位点的功能重要性

通过Eigen score衡量变异位点的功能重要性

欢迎关注"生信修炼手册"!

变异位点的注释是突变分析中最重要的一项分析内容,在过去的十几年中,各个组织和团队开发了大量的软件和数据库,对变异位点进行注释。现阶段对于变异位点的注释而言,最大的挑战之一就是相关的软件和数据库太多了。不同软件有着不同的标准和阈值,在实际筛选时,往往无从下手。

针对这一情况,相关科学家发明了一个软件​​Eigen​​​, 它综合了多种变位点注释信息,采用了一种打分机制,对变异位点的功能重要程度进行打分,打分越高,说明该变异的生物学功能更加显著。和CADD score 类似,它也有raw score 和 phred score 两种scoer 值,在实际筛选中,通常使用phred score作为阈值。ANNOVAR 软件中, 使用​​phred score > 2​​作为筛选条件,认为score 值大于2的变异位点更有重要的生物学意义和功能。

软件的官网如下

​​score​​值。, 链接如下:

区分了编码区的变异位点和非编码区的变异位点,对于非编码区的变异位点,由于数量巨大,按照不同染色体进行了拆分。同时提供了原始文件和tabix建立的索引。

文件中记录了每个变异为位点的​​Eigen score​​值,由于列数较多,我截取了部分列展示如下

​​Eigen​​​和​​Eigen-PC​​​可以看做是两种不同的打分模型,在不同的打分模型中,各参考数据的比重不同。在实际的文件中,还可以看到​​SIFT​​​, ​​Polyphen​​​, ​​MA​​​, ​​GERP​​​, ​​PhyloP​​​等列,这些列其实就是各种参考数据。在计算​​Eigen score​​​时,​​Polyphen​​​, ​​MA​​​等数据具有最高权重;在计算​​Eigen-PC score​​​时,​​GERP​​​和​​PhyloP​​等数据具有最高权重。

更多的信息可以参考对应的文献,链接如下

​​https://ncbi.nlm.nih.gov/pmc/articles/PMC4731313/pdf/nihms742074​​

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:COSMIC数据库简介
下一篇:HLAforest:使用RNA-seq数据进行HLA分型
相关文章

 发表评论

暂时没有评论,来抢沙发吧~