当前位置:首页 > 生活 > 正文

蛋白质设计的新型人工智能方法

发布时间:2024-08-08 15:00:31 编辑:左纨龙 来源:

导读 EPFL研究人员开发了一种新型人工智能驱动模型,旨在结合复杂的分子环境预测骨架支架中的蛋白质序列。它有望在蛋白质工程和医学、生物技术等...

EPFL研究人员开发了一种新型人工智能驱动模型,旨在结合复杂的分子环境预测骨架支架中的蛋白质序列。它有望在蛋白质工程和医学、生物技术等各个领域的应用方面取得重大进展。

设计能够发挥特定功能的蛋白质需要了解和操纵其序列和结构。这项任务对于开发疾病的针对性治疗方法和创造用于工业应用的酶至关重要。

蛋白质工程的一大挑战是从头设计蛋白质,即从零开始设计蛋白质,以根据特定任务定制其特性。这对生物学、医学和材料科学具有深远的影响。例如,工程蛋白质可以高精度地针对疾病,为传统小分子药物提供有竞争力的替代品。

此外,定制设计的酶可充当天然催化剂,促进自然界中罕见或不存在的反应。这种能力在制药行业合成复杂药物分子和环境技术中尤其有价值,可以更有效地分解污染物或塑料。

目前,由EPFL的MatteoDalPeraro领导的科学家团队开发出了CARBonAra(从主链原子和杂原子中进行情境感知氨基酸恢复),这是一种人工智能驱动的模型,可以预测蛋白质序列,但同时考虑到不同分子环境施加的限制——这是一项独特的成就。

CARBonAra在约370,000个亚基的数据集上进行训练,另外还有来自蛋白质数据库(PDB)的100,000个用于验证,70,000个用于测试。该研究发表在《自然通讯》杂志上。

CARBonAra以蛋白质结构变换器(PeSTo)框架的架构为基础,该框架也是由DalPeraro团队的LucienKrapp开发的。它使用几何变换器,这是一种深度学习模型,可以处理点之间的空间关系(例如原子坐标),以学习和预测复杂结构。

CARBonAra可以根据主链支架(蛋白质分子的结构框架)预测氨基酸序列。然而,CARBonAra的突出特点之一是其上下文感知能力,这尤其体现在它如何提高序列恢复率——与已知参考序列相比,蛋白质序列中每个位置预测的正确氨基酸的百分比。

当CARBonAra包含分子“背景”时,例如蛋白质与其他蛋白质、核酸、脂质或离子的界面,回收率会显著提高。“这是因为该模型是用各种分子进行训练的,并且只依赖于原子坐标,因此它不仅可以处理蛋白质,”DalPeraro解释道。这一特性反过来又增强了模型在现实复杂生物系统中的预测能力和适用性。

该模型不仅在合成基准测试中表现良好,而且已通过实验验证。研究人员利用CARBonAra设计了​​TEM-1β-内酰胺酶的新变体,该酶参与了抗菌素耐药性的产生。

一些预测序列与野生型序列相差约50%,但折叠正确,并且在高温下保留了一些催化活性,而野生型酶此时已经失活。

CARBonAra的灵活性和准确性为蛋白质工程开辟了新途径。它能够考虑复杂的分子环境,使其成为设计具有特定功能的蛋白质的宝贵工具,可增强未来的药物发现活动。此外,CARBonAra在酶工程方面的成功证明了其在工业应用和科学研究方面的潜力。


免责声明:本文由用户上传,如有侵权请联系删除!

上一篇:揭开APE1的神秘面纱DNA单链断裂直接激活ATM信号的新发现

下一篇:最后一页