洞察掌握android电视app开发中的安全与合规策略,提升企业运营效率
1862
2022-11-25
eggNOG:从COG延伸出来的同源蛋白数据库
欢迎关注”生信修炼手册”!
直系同源蛋白的预测在系统发育,比较基因组学等多个领域都占用重要地位,COG数据库开创了同源蛋白数据库的先河,后续又不断有新的数据库涌现,而eggNOG就是目前使用最广泛的数据库之一。
官网如下
genealogy of genes:Non-supervised Orthologous, 在COG算法的基础上进行了拓展和延伸,采用基于图状结构的非监督聚类算法,构建了真核,原核,病毒等不同物种的同源蛋白簇。
该数据库最新版本为eggNOG 4.5.1, 涵盖了2031种真核和原核生物,352种病毒,构建了19万个同源蛋白簇。
和COG类似,eggNOG对于orthology group的功能也进行了分类整理,每个类别用一个字母表示,在以下链接可以查看具体的分类信息
Mobilome: prophages, transposons
其他的分类和COG数据库完全一致。在官网的搜索框中可以对OG编号进行检索
在检索结果中,可以查看该orthology group下包含的蛋白序列和物种信息,也可以-对应的序列。除此之外,还提供了GO, KEGG, pfam, SMRT等相关的功能注释信息。
除了在线检索外,官方还提供了API服务,方便程序抓取对应数据,示例如下
group下的所有蛋白序列,更多用法请参考官方文档。
官网还提供了以下两种注释服务
1. search
一次只支持一条序列的查询,输入fasta格式的蛋白序列,选择对应物种即可
2. eggNOG-mapper
支持多条序列的NOG注释,提供了在线服务,也可以-软件到本地运行。
支持diamond和hmmer两种比对软件,当序列条数少于1000条时,选择hmmer,当序列多余1000条时,选择diamond, 速度更快。本地版的eggNOG-mapper 的安装和使用可以参考如下文档
挖掘其功能。
·end·
—如果喜欢,快分享给你的朋友们吧—
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~