AI破译生命演化密码:我国团队利用蛋白语言模型揭示适应性趋同机制

发布时间: 访问量:8

一、“高阶特征”突破传统研究瓶颈

自然界中存在令人惊叹的趋同演化现象:亲缘关系甚远的蝙蝠与齿鲸,竟各自独立演化出回声定位能力。长期以来,科学家试图从分子层面解释这类现象,但传统研究多聚焦于蛋白质序列中单个氨基酸的趋同变异,存在明显局限性。

研究显示,即便缺乏明确的位点趋同,同源蛋白质仍可能通过高阶结构或理化性质的趋同,实现功能上的相似性。团队成员形象比喻:“如同用不同材质建造结构相似的桥梁——虽然基础单元不同,但整体构架和功能趋于一致。”

二、人工智能赋能演化机制解析

面对这一挑战,邹征廷团队创新开发出名为“ACEP”的计算分析框架,其核心突破在于引入预训练的蛋白语言模型。

该类模型通过对海量蛋白质序列进行深度学习,能够捕捉序列中隐含的复杂上下文信息和高阶特征,进而将氨基酸序列转化为富含演化信息的高维向量。研究人员指出:“蛋白语言模型如同掌握蛋白质‘语法’的智能系统,可解读序列背后的结构与功能规律。”

ACEP框架涵盖三大关键环节:首先测算目标类群同源蛋白嵌入向量的实际距离,随后通过模拟中性演化构建背景距离分布,最终基于统计检验识别是否存在显著的高阶特征趋同信号。

三、系统验证凸显方法可靠性

为检验ACEP的实用性,研究团队开展了多维度实证分析。在Prestin蛋白(回声定位哺乳动物)和PEPC/PPCK蛋白(景天酸代谢植物)等经典案例中,ACEP均有效探测到明确的高阶特征趋同信号。

更具突破性的是,全基因组扫描发现,蝙蝠与齿鲸中存在数百个呈现趋同特征的候选基因。功能分析显示,部分基因显著富集于“感官感知”等与回声定位密切相关的通路。这些新发现基因中,不乏获得正选择分析佐证的案例,进一步支持其参与适应性演化的可能性。

四、推动演化生物学研究范式革新

该研究首次系统论证蛋白质高阶特征趋同是适应性演化的重要机制,突破了以往仅关注氨基酸位点的传统思路。

邹征廷研究员强调:“本项成果不仅深化了对生命演化规律的理解,也彰显人工智能技术在解析复杂生物学问题中的巨大价值。我们期待AI未来能在演化生物学领域实现更广泛的应用。”

ACEF框架为在全基因组尺度系统挖掘复杂适应性趋同模式提供了创新工具。学界认为,这一方法论的进步为探索生物适应性演化的分子基础开辟了新路径,有望推动演化生物学研究范式的转型。相关成果对生物医学、生态保护等学科亦具有重要参考意义。

本研究得到国家自然科学基金与中国科学院战略性先导科技专项资助。ACEP分析框架的源代码已在HuggingFace平台开源,供全球科研同仁使用。

更多文章