分子动力学模拟在药物设计中的洗剪吹介绍

2018年12月24日

分子动力学模拟,即利用物理、化学、数学等原理模拟粒子运动的一种方法。在药物设计中,通常用来优化药物与受体的结合模型、评价药物与受体的结合、鉴定活性口袋中的关键氨基酸等等。当然在比较不同药物的结合差异、指出构效关系,模拟受体的变构调节、分析受体调节机制等方面有着不可替代的作用。尽管粒子体系微观运动的复杂,但分子动力学模拟可以采集样本信息更是多种多样。因此,主流的分子动力学软件包大多有着数百甚至更多的结果分析工具。今天我们简要介绍下在药物设计中最基础、最常见的洗剪吹组合。

 

1、RMSD

RMSD,英文全称Root Mean Square Deviation,即通常所说的均方根偏差。用来描述粒子(组)与参考位置的偏差平均大小,因此在分子模拟中也叫位置均方根偏差。

假定所选粒子组具有n个粒子,计算状态的体系坐标为vi,参考状态的体系坐标为wi,那么RMSD的计算方式则为:

由以上计算式不难看出,RMSD实际上就是评价前后两个状态坐标的差异。大家在文献中通常看到使用RMSD来评价粒子组的目标状态与参考状态的差异大小,并说明该粒子组是否稳定。

RMSD的大小实际上是由粒子组坐标的位置偏差直接决定的。在粒子运动中除了包含粒子组在前后的空间结构上的差异外,还包含了粒子组的平移所带来的坐标值的变化。这种平移虽然可以影响RMSD的大小,但对于我们需要评价的差异来说,却是没有任何意义的。因此,在实际计算RMSD中,通常需要将目标状态与参考状态的坐标进行叠合,以消除粒子组的平移对RMSD数值的影响。在需要考虑平移时,则通过计算距离来评价。

上图即为RMSD图,在分子动力学膜拟中常常计算粒子组在模拟时间尺度上的RMSD变化。

 

2、RMSF

RMSF,英文全称Root Mean Square Fluctuation,即均方根波动。用来描述粒子组在一定时间内的位置波动的平均大小。其实就物理意义来讲,RMSD和RMSF都是描述粒子的目标状态与参考状态的偏差,RMSD和RMSF分析也统称为RMS分析。只是在分子动力学模拟中,RMSF分析专门用来描述粒子组在时间T内位置波动的大小,参考坐标一般为时间T内的平均坐标。假定在t时刻时粒子的坐标为x(t)i,则RMSF的计算公式如下:

计算结果如下:

如上图所示,RMSF表示蛋白中每个残基在一定时间内的位置波动大小。

 

3、平均结构

时间T内系统中体系坐标的平均位置所构成的结构,即是该体系的平均结构。可想而知,运动的体系的平均结构有时会显得不合理。因此平均结构只能代表体系的大概位置,并不是实际结构。如下所示:

这是因为平均结构的计算中,只计算了各粒子的平均位置而并未考虑体系结构在化学上合理性。上图中这些比较“混乱”的原子,其实就是波动比较大的位置,也就是通常所说的柔性比较大的部分。仔细观察他们,可以得到很多有用的信息。

上面左图中甲基的H-C-H间的夹角变小,说明甲基可围绕后面的C-C键旋转,C-H键长变短,说明还存在其他位置变化;上面右图中苯环变扁,则说明,该苯环可以围绕前面的C-C键发生一定程度的转动;等等。当您需要讨论的位置(如结合口袋附近等)存在这些现象,或者本可以自由旋转的苯环在平均结构中显得非常整齐时,就应该重点分析其原因。说不定会有意外收获哦~

 

4、结合自由能

结合自由能,即原子组A与B之间的结合自由能大小,通常用来评价他们之间的亲和力大小。结合自由能又与平衡常数直接相关,因此在药物设计中,常常用结合自由能来评价药物配体(Ligand)与受体蛋白(Protein)的结合能力。

关于结合自由能的计算,相信大家在很多药物计算相关的文献中都有见到。这里就不在赘述,一般计算方式如下:

当然,结合能的高低并不能直接代表药物活性的强弱,毕竟还会涉及到药物在细胞或动物模型中的药代动力学等因素。但与药物的激酶活性的比较上,还是具有不错的相关性的,可作为药物活性的参考。

 

5、结合自由能分解

结合自由能分解,顾名思义,是将计算得到的结合自由能分解开来。通常是将结合自由能分解到其中的各个氨基酸和小分子上。为了便于理解,我们将上面的结合自由能计算公式写为:

那么就有:

式中的含义就像其名称一样直白,计算的结果中会给出体系中的每个残基和配体对于体系结合自由能的贡献值。他们直接说明各自对结合模型中亲和力大小的影响,常常作为关键残基的一个重要参考指标。

 

6、氢键

氢键相互作用作为药物与受体结合的一种重要相互作用,是受体-配体结合模型中非常常见的讨论项目。某些关键氢键的有无,常常可直接影响药物活性。在分子模拟中,可通过氢键供体(Donor)原子和氢键受体(Acceptor)原子的距离及其与H原子的夹角来查找体系中的氢键。图示如下:

一般的搜索标准为:

氢键分析时,不同的软件可能给出不同的结果呈现方式,有的给出一段时间内每个氢键的供体和受体原子、键长、甚至键能、占有率。有的则给出了整体氢键数目随模拟时间的变化。这些都是氢键分析中非常重要的参数。

 

7、二级结构

二级结构,即蛋白质的二级结构,主要包含α螺旋、β折叠、β转角、无规则卷曲四种,在分子动力学分析工具中,通常会给出更加详细的分类。可以给出在模拟时间内,蛋白中各氨基酸残基所在的二级结构变化,以佐证蛋白在某段时间内的平衡性,或者验证某些残基的二级结构与微观运动或结构稳定性的关系。下图是一个常见的结果示例:

图中给出了各氨基酸在这段时间内所处二级结构的时间占比。

 

8、温度因子

温度因子,实际上是Debye–Waller factor,概念来源于晶体研究。用来描述晶体中原子构象状态的一种模糊度,也称为B-factor。反映了蛋白质分子在晶体中的构象状态,B-factor越高,模糊度越大,相应部位的构象就越不稳定或柔性越强。在文献中,可能经常看到带有温度因子的蛋白质结构图,如下:

如图上所示,蓝色结构是柔性较小,比较稳定的部分,而红色部分则是柔性较大,在模拟过程中不太稳定的部分。这常常作为评价蛋白质稳定性或选取感兴趣的部分的依据。

 

结语

在分子动力学模拟中,常用的分析方法并不复杂,都是基于基本的物理或化学概念。但是,如何选取合适的分析工具分析合适的原子组才是需要基础理论与经验的难点所在。这就是在我们这个方向中您经常看到的“为什么感觉别人没有什么特别的分析方法却总能给出特别的机理解释,发表不错的杂志?”。在分子模拟中,不同人分析同样的数据所得到结果的价值差异真的不小。多看文献,多做范例,才是唯一的成功之路。

最后,送上约里奥•居里的一句话:“实验结果离理论越远,那就离诺贝尔奖越近。”:)

祝大家科研愉快!

版权声明:本文由Seif Joe于2018/12/24整理发表 | 原文由Seif Joe于2018/03/15发表于微信公众号“博士苑”

转载请注明:分子动力学模拟在药物设计中的洗剪吹介绍 | Seif Joe

分享: