蛋白质AI生成模型发布,阻断癌症靶点在望

这是首个用于设计新型高强度蛋白质粘合剂(Protein Binder)的AI模型,也是谷歌从2017年起陆续推出AlphaFold系列生物学预测工具以来,在蛋白质结构预测之外为生物学界带来的又一个突破性的AI工具。

责任编辑:黄金萍

“如果你认为AI进展放缓,那只是因为你对它关注不够。”2024年9月5日一大早,谷歌AI Studio产品总监Logan Kilpatrick在社交媒体上发了一条推文。

当天,谷歌DeepMind团队发布蛋白质AI生成模型AlphaProteo,可为多种靶蛋白生成新的蛋白结合剂,帮助科学家更好地理解生物系统是如何运作的,节约研究时间,加快药物的设计研发等。

这是首个用于设计新型高强度蛋白质粘合剂(Protein Binder)的AI模型,也是谷歌从2017年起陆续推出AlphaFold系列生物学预测工具以来,在蛋白质结构预测之外为生物学界带来的又一个突破性的AI工具。

AlphaFold 1 在2018年第13届蛋白质结构预测技术关键评估(CASP)中获得最高分,一鸣惊人;AlphaFold 2 2020年在CASP上以高于90%的准确率,再次将其他选手远远甩在身后;2023年,Alphafold-latest进一步预测蛋白质结构的能力泛化到核酸、任意小分子配体等其他的生物分子结构的预测上;2024年5月,AlphaFold 3可预测“几乎所有分子类型”的蛋白质复合物结构,并在预测药物相互作用上实现了前所未有的准确性。

这些工具,已经在科学界广泛使用开来。比如,2024年9月4日,《自然》(Nature)刊发英国MRC-格拉斯哥大学和澳大利亚悉尼大学科研团队成果,他们利用AlphaFold和ESMFold成功预测了黄病毒科数百种病毒的蛋白质结构,包括导致登革热、寨卡病毒和丙型肝炎等疾病的病原体,揭示了病毒如何进入体内并在细胞中复制的关键进入机制,不仅为疫苗开发铺平了道路,还为应对当前Mpox等病毒的威胁和防范未来的大流行病等提供了基础。

AlphaFold可以帮助科研人员深入了解了蛋白质如何相互作用以发挥其功能,但无法创建新的蛋白质来直接操纵这些相互作用。科学家已经创造出成功结合目标分子的新型蛋白质,但这种蛋白质设计机器学习方法依然十分费力,仍需大量的实验测试。

AlphaProteo的训练数据,包括全球结构生物学界科学家们多年积累的蛋白质数据库(PDB)中的蛋白质数据,以及AlphaFold中的1亿多个预测结构,从而了解分子之间结合的方式,只要给定目标分子结构和首选结合位置,就能生成在这些位置与目标分子结合的候选蛋白质。

具体来看,AlphaProteo可为多种靶蛋白生成新的蛋白结合剂,包括与癌症和糖尿病并发症相关的VEGF-A(血管内皮生长因子A)。在团队测试的七种目标蛋白质上,AlphaProteo实现了更高的结合成功率,并且比现有方法提高了3-300倍的结合亲和力。

例如,病毒蛋白BHRF1这一特定靶标在湿实验室测试时,88%的候选分子都能成功结合。根据测试目标,AlphaProteo的结合强

登录后获取更多权限

立即登录

校对:赵立宇

欢迎分享、点赞与留言。本作品的版权为南方周末或相关著作权人所有,任何第三方未经授权,不得转载,否则即为侵权。

{{ isview_popup.firstLine }}{{ isview_popup.highlight }}

{{ isview_popup.secondLine }}

{{ isview_popup.buttonText }}