发布网友 发布时间:2024-09-27 18:13
共1个回答
热心网友 时间:2024-09-27 19:09
EggNOG数据库,专为直系同源蛋白分组比对提供服务,由EMBL机构创建并持续维护,它扩展了NCBI的COG数据库,增添了对真核、原核和病毒蛋白的分类信息。最新版本EggNOG 5.0的发布,带来了显著的数据增量。尽管主页上的部分功能尚未完全整合,用户仍可下载蛋白序列数据,如9天前更新的e5.proteomes.faa和e5.viruses.faa,用于本地注释分析,如通过Diamond或Blast。
新版本的一个重要变化是,它采用NCBI Taxid替代物种名称缩写,以提升分类的规范性。例如,对应的下载链接已提供。为了进行注释,用户需要蛋白序列ID与NOG group的对应信息,这些信息在members.tsv文件中,例如bacteria的2_members.tsv,它包含了Taxid、NOG group、序列和物种信息。
在下载并配置好Diamond数据库后,用户可以开始在本地进行NOG注释。尽管新版本5.0尚在完善中,但这并不妨碍其在生信分析中的应用。对于更详细的生信技巧和更新,可关注“微生态与微进化”公众号。