编辑

首页 2024-07-05 18:57:55

KX

蛋白质动力学对理解其机制至关重要。然而,通过计算和预测蛋白质动力学信息是具有挑战性的。

这里来自山东大学和百图生科(BioMap)、北京理工大学、湖北医学院、宁夏医科大学、阿卜杜拉国王科技大学(KAUST)研究团队提出了神经网络模型 RMSF-net,它优于以前的方法,在大规模蛋白质动力学数据集中产生最佳结果;该模型可以在几秒钟内准确地推断出蛋白质动力学信息。

通过实验蛋白结构数据和低温电子显微镜 (cryo-EM) 在数据集成中有效学习,能准确识别低温电子显微镜图和 PDB 为了最大限度地提高动力学预测效率,模型之间的交互式双向约束和监督。

RMSF-net 在蛋白质动力学研究中发挥重要作用是一种免费工具。

该研究以「Accurate Prediction of Protein Structural Flexibility by Deep Learning Integrating Intricate Atomic Structures and Cryo-EM Density Information」为题,于 7 月 2 日发布在《Nature Communications》上。

论文链接:
  • https://www.nature.com/articles/s41467-024-49858-x

RMSF-net GitHub 地址:

  • https://github.com/XintSong/RMSF-net

蛋白质动力学

蛋白质动力学在理解其机制中至关重要。低温电子显微镜 (cryo-EM) 该技术可以分析大多数蛋白质,其中大分子结构是由 3D 密度图表示。

低温电子显微镜局限性

由于原始二维粒子图像的分辨率和信噪较低,在重建过程中,低温电子显微镜分析无法区分小的构象变化。

深度学习在低温电子显微镜中的应用

深度学习方法广泛应用于低温电子显微镜图的自动分析。蛋白质数据库可以从低温电子显微镜图中构建高分辨率低温电子显微镜图谱 (PDB) 模型。

RMSF-net 概述

RMSF-net 低温电子显微镜密度图采用神经网络模型。采用低温电子显微镜密度和 PDB 模型信息可以在几秒钟内准确推断蛋白质的动力学信息。

RMSF

RMSF 对分子动力学进行评估是一种广泛使用的测量方法 (MD) 分析分子结构的灵活性。其主要目的是预测蛋白质的局部结构 (残基、原子) 的 RMSF。

图示:RMSF-net。(来源:论文)

除低温电子显微镜图外,RMSF-net 还利用 PDB 作为额外输入,模型非常接近 MD 模拟结果的 RMSF 预测。

RMSF-net 它是一种包含两个相互连接的模块的三维卷积神经网络。主模块采用 Unet (L3) 架构编码和解码输入密度框的特征。使用另一个模块 1x1 卷积对 Unet 回归主干生成的特征图的通道。然后将中心切割应用于回归模块输出,以获得中心切割 RMSF 子框,包括体素(voxel)与原子中包含的原子相对应的值 RMSF。最后,使用合并算法将 RMSF 在空间上合并子框 RMSF 图。

此外,研究人员还建立了一个大规模的蛋白质动力学数据集 RMSF-net 选择了训练和验证 335 个具有拟合 PDB 模型的低温电子显微镜结构条目,并执行相应的 MD 模拟。综合实验结果证明 RMSF-net 效率和有效性。

表:不同 RMSF 数据集中预测方法的性能。(来源:论文)

动力学预测的准确性

RMSF-net 在严格的 5 在双交叉验证中表现出色,与 MD 模拟结果的相关系数达到 0.746±0.127。与 DEFMap 相比,RMSF-net 相关系数有所提高 与基线方法相比,15%增加了 10%。

动力学预测的可解释性

通过比较实验,研究人员得到了加强 RMSF-net 动力学预测的可解释性。他们将 RMSF 预测过程分为两步:

  1. 结构信息提取(OCC2RMSF-net)
  2. 动力学预测基于提取的结构信息

研究表明,基于低温电子显微镜图谱的模型(如 DEFMap 或 RMSF-net_cryo)动力学预测主要通过解释蛋白质结构来实现。这突出了蛋白质拓扑结构与动力学之间的联系,符合结构-功能关系的第一原则。

图示:RMSF-net 比较其他相关方法的性能。(来源:论文)

另外,通过对 RMSF-net_cryo、RMSF-net_pdb 和最后的双组合 RMSF-net 综合比较证明:一方面,它来自 PDB 模型的结构信息在 RMSF-net 其中,深度模型起着主要作用 MD 另一方面,在模拟中学习结构拓扑与灵活性之间的模式,低温电子显微镜图谱异质密度分布中包含的动力学信息进一步增强了模型。这些结果验证了低温电子显微镜图和 PDB 模型信息正确 RMSF-net 蛋白质动力学预测的互补作用。

局限性和未来方向

不可否认的是,RMSF-net 它主要局限于预测溶液中纯蛋白及其复合物的灵活性。该方法在某些局部区域可能表现出不准确性,因为该方法结合了小分子或膜环境中的动态特性。

RMSF-net 卓越的性能揭示了进一步研究这一方向的可行性。该研究尚未扩展到核酸和蛋白质-核酸复合物。综合表征大分子动力学的各个方面,包括多构象预测和转换分析,需要在未来进一步的广泛和深入的研究。

尽管如此,作为预测蛋白质动力学的工具,RMSF-net 由于其优越的性能和超快的处理速度,在蛋白质结构和动力学研究中仍有很大的应用前景。

注:封面来自网络

以上是人工智能模型RMSF-net登Nature子刊的详细内容,只需几秒钟就能准确推断蛋白动力学信息。请关注其他相关文章!


p