EN

推进蛋白质在工业上的应用:新型深度学习算法加速蛋白质工程

   日期:2021-11-02     来源:贤集网    浏览:166    
核心提示:蛋白质是所有活细胞的分子机器,已被开发用于许多应用,包括治疗和工业催化剂。为了克服天然存在的蛋白质的局限性,蛋白质工程用
 
蛋白质是所有活细胞的“分子机器”,已被开发用于许多应用,包括治疗和工业催化剂。为了克服天然存在的蛋白质的局限性,蛋白质工程用于改善蛋白质特性,例如稳定性和功能性。在一项新研究中,研究人员展示了一种加速蛋白质工程过程的机器学习算法,这项研究发表在《自然通讯》杂志上。


机器学习算法通过减少定向进化等方法的实验负担来协助蛋白质工程,这涉及多轮诱变和高通量筛选。他们通过在蛋白质序列数据库上训练后模拟和预测目标蛋白质的所有可能序列的适合度来工作。



尽管存在许多机器学习算法,但其中很少包含目标蛋白质的进化历史。这就是深度学习算法ECNet(进化上下文集成神经网络)的用武之地。


“使用 ECNet,我们能够查看目标蛋白质及其所有同源物,以了解哪些残基耦合在一起,因此对特定蛋白质很重要,”领导者/CABBI/CGD/GSE/MMG),也是美国国家科学基金会 (NSF) 资助的分子制造实验室研究所所长Steven L. Miller 化学与生物分子工程讲座教授赵慧敏 (BSD) 说:“然后我们结合这些信息并使用深度学习框架来确定哪种突变对目标蛋白质功能很重要。”


在一项基准研究中,研究人员表明 ECNet 在几个深度诱变数据集上的表现优于当前方法。作为后续工作,ECNet 被用于设计 TEM-1 β-内酰胺酶(一种赋予对 β-内酰胺抗生素抗性的酶),并鉴定出适应性改善的变体,因此对氨苄青霉素更具抗性。


此外,ECNet 在分析中优先考虑高阶和新颖的突变体。拥有可以成功预测高阶相互作用的计算工具可以减少实验工作。



“我们正在将数据库中的所有蛋白质与目标蛋白质的特定进化历史相结合,以提高预测效率,”赵说:“然后我们可以使用我们从实验中产生的突变体来进一步改进和训练模型。该算法仍在进行中,但它是对文献中已知内容的全面改进。”


研究人员目前正在使用 ECNet 开发选择性更高的酶催化剂。


这项研究是与计算机科学教授简鹏 (CABBI) 共同努力的。该研究的其他作者包括 Yunan Luo、Guide Jiang、Tianhao Yu、Yang Liu、Lam Vo、Hantian Ding、Yufeng Su 和 Wesley Wei Qian。



著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

 
打赏
 
更多>同类欧宝娱乐平台靠谱吗