希腊基础生物医学研究所副教授Georgios Pavlopoulos等通过全球宏基因组学揭示了功能性暗物质。相关研究成果10月11日发表于《自然》。
研究人员开发了一种计算方法,从宏基因组的序列空间生成无参考蛋白家族。他们分析了26931个宏基因组,鉴定出11.7亿个长度超过35个氨基酸的蛋白质序列,与来自102491个参考基因组或Pfam数据库的任何序列没有相似性。
使用大规模并行图基聚类技术,研究人员将这些蛋白质分组到106198个超过100个成员的新序列中,这比利用相同方法从参考基因组聚类得到的蛋白质家族数量翻了一番。
研究人员根据它们的分类、栖息地、地理和基因邻近分布对其进行了注释,在序列多样性充足的情况下预测了蛋白质的三维模型,并揭示了新的结构。
总的来说,这些结果揭示了一个极其多样化的功能空间,并突出了进一步探索微生物功能暗物质的重要性。
宏基因组编码了多种多样的蛋白质,反映出多种功能和活性。对这一巨大序列空间的探索来自对参考微生物基因组和这些基因组的蛋白质家族的比较分析。
相关论文信息:
https://doi.org/10.1038/s41586-023-06583-7