新创公司 Evozyne 使用 NVIDIA 预先训练好的人工智慧(AI)模型,创造出在医疗照护与洁净能源方面皆有大好发展潜力的两种蛋白质。在今(13)日发表的一篇合着论文中,描述该过程及其产生的生物构成原料。一个旨在治疗先天性疾病,另一个则是用於消耗二氧化碳以减缓全球暖化。这些初步成果展现出科学家们找到一种能够加快开发药物及进行其他研发的新方法。
|
Evozyne 的 ProT-VAE 流程使用 NVIDIA BioNeMo 中Transformer 模型来生成用於药物开发和能源永续的有用蛋白质。 |
Evozyne 公司共同创办人、也是叁与该合着论文的 Andrew Ferguson 表示:「即使首次研发,AI 模型同样能产生跟天然蛋白质一样优质的合成蛋白质,这不仅鼓舞了我们团队的士气,也让我们知道这个模型正确地学习了大自然的设计规则。」
Evozyne 使用 NVIDIA 的 ProtT5 执行整个专案。ProtT5 是 NVIDIA BioNeMo 里的部分 Transformer 模型,用於协助医疗照护领域建立AI 模型的软体架构与服务。
跨足化学与机器学习领域的分子工程师 Ferguson 表示:「BioNeMo 的确提供我们进行模型训练所需的一切,并以非常低的成本在模型上运行各项作业,我们可以在短短几秒钟内生成数百万个序列组合。」
该模型是 Evovyne 旗下名为 ProT-VAE 的工作流程核心,可将 BioNeMo 与充当筛检器的变分自动编码器结合。
NVIDIA 的 Transformer 模型读取蛋白质中的数百万种氨基酸序列的技术类似阅读,都是使用神经网路来理解文字的意涵。藉由此方式能够进一步了解与掌握大自然如何组成这些强大生物。然後,该模型能够接着预测要如何配合 Evozyne,进而找出解决的功能以生成新的蛋白质。
机器学习有助於一一排查可以使用的海量蛋白质序列,并有效地识别出最有用的序列。传统的蛋白质生成方式称为定向进化,用的是一种碰运气的缓慢方法,且通常一次只能改变几个氨基酸的序列。相较之下,Evozyne 的方法可以在同一轮中改变蛋白质里半数以上的氨基酸。这相当於进行了数百次突变。Evozyne 打算使用这个新进展来生成一系列的蛋白质,用来对抗疾病和气候变迁。
Evozyne 的资料科学家 Joshua Moller 说道:「他们运用多个 GPU 进行训练及加速处理庞大的作业流程。我们现在每一分钟,都能够处理完一整个资料库的资料。」这将训练大型 AI 模型的时间,从几个月缩减至短短一周。
Ferguson也指出最近扩散模型的崛起。AI 加速推动蛋白质生成的未来发展精彩可期。