分子对接概述

分子对接一些原理概述

Workflow

分子对接流程:

  1. 准备输入文件(质子化状态,转化为特殊的文件格式)
  2. 结合口袋得配体构象采样
  3. 对生成的对接构象打分
  4. 后处理(储存对接构象以便进一步分析)

Docking workflow

采样算法

大多数分子对接工具使用以下一个或者多个算法采样配体构象

Matching algorithms (MA)

__MA__比较配体构象的形状相似性和蛋白质结合口袋,通常还包括化学信息,例如: 氢键受体和供体。使用MA进行抽样构象的程序通常属于最快的对接程序。但是,这些程序需要先计算形状比较过程中使用的配体构象。
如果库中不存在与生物学相关的构象,则该算法将失败。

Incremental instruction

在__Incremental instruction__方法中,首先通过打断其可旋转键将配体解构为较小的片段。其中一个碎片,例如最大的片段,首先放入结合口袋中。随后,通过在合适位置连接片段,逐步将完整的配体构造在结合口袋中。__Incremental instruction__方法属于最快的算法类,但仅限于中型配体,因为越来越多的片段会导致组合选择性变多,计算量增大,从而极大地减慢了对接速度。

Stochastic methods

随机方法通过刚体旋转和平移以及键旋转来采样配体构象

Monte Carlo methods

__MC__生成配体随机位置,然后基于能量选择标准评估生成构象。如果构象达到了一定的阈值,构象会被保存。保存的构象会被用于随机生成另一种构象。MC过程会在生成指定数量的构象之后停止

Genetic algorithms

遗传算法的灵感来自于达尔文进化论的自由选择概念。基于此,配体的构象被储存在所谓的染色体熵,即该染色体定义了配体的构象。突变和跨界等遗传操作被用于采样配体的构象空间。打分函数被用于评估结合口袋内的构象质量。用于最高打分的构象被用于下一轮采样。

打分函数

打分函数被用于判断对接的正确与否。i.e. 优先考虑活性分子。打分函数在高准确度的情况下,需要满足耗费较少的计算时间。

Force field-based

基于力场的打分函数通过计算蛋白-配体的非键相互作用强度(e.g. 范德华力 静电相互作用 )来评估结合能。该方法的发展方向: 配体结合时的熵以及脱溶剂效应的惩罚函数。该打分函数最大的缺点是相当贵。

Empirical

经验打分函数基于系数 用于计算不同相互作用的贡献(氢键、疏水相互作用、离子相互作用)。这些系数是从具有已知结合亲和力的蛋白质配体复合物的回归分析中获得。

Knowledge-based

此打分函数整合了对蛋白质配体复合物的统计分析结果,该分析收集了有关蛋白质和配体之间观察到的原子间接触频率和距离的信息。如果它们显示出在统计分析中经常观察到的接触特征,则打分将更高。

ML/DL-based

基于机器学习和深度学习的打分函数通过训练已知亲和力的蛋白配体复合物数据集获得。蛋白配体复合物模型将以计算机可读的格式编码( interaction fingerprints or graph)。在后处理过程中应用此类评分功能,以更准确或在姿势评估步骤中进行排名。

限制

  • 对接程序在对接计算过程中可以考虑一柔性残基侧链,以说明结合口袋的柔韧性。
    然而,蛋白质 - 配体对接不能探索蛋白-配体的动态,自适应结合过程。这可能会导致误报:即使配体在结合口袋中找到合适的姿势,但是该构象在蛋白探索到最小构象之前不会被保存。因此,建议进行简短的分子动力学模拟来评估预测构象的稳定性。
  • 对接程序使用的打分功能必须便宜才能计算。虽然准确性足以将好构象与坏构象区分开,但它在排序最佳构象时可能会遇到问题。例如,尽管大多数受欢迎的对接程序能够在其计算中找到实验构象,但该构象很少是对接构象集合中的最好的构象。此外,一些研究表明,对接得分通常与结合亲和力相关。
  • 为了降低计算成本,对接程序仅在蛋白质的部分区域执行(通常在已知的结合口袋周围)。如果结合口带位置,选择正确的结合位点可能会成为另一个问题。
  • 为了最大化计算的准确性,必须预先将配体和蛋白质结构摆放在可能的位置。氨基酸和配体的质子化状态是较难处理的。

我的眼睛就是尺

由于采样算法以及对接打分函数的限制。在大多数打分方案中,通过经验检查结构合理性是必要的。有趣的是,有专家支持对接打分对于选择合适的配体构象来说是最没用的。因此,选择对接构象时遵循以下准则。

  • 如果已经存在解析出来的晶体结构,优先使用该结合模式
  • 配体和蛋白质的空间、静电、疏水相互作用互补性
    • 氢键供体受体
    • 溶剂暴露的疏水配体部分
  • 配体与侧链或者金属离子的相互作用
  • 氢键的位置
    • 在封闭的疏水蛋白环境中与蛋白质主链形成的氢键被认为是有利的
    • 带电和溶剂暴露的蛋白质侧链形成的氢键被认为是有害的
  • 与结合口袋中的水分子形成相互作用

常用对接软件

$$$$$$

  • GOLD
  • Glide
  • FlexX

Academic Free

  • AutoDock
  • AutoDock Vina
  • DOCK
  • OpenEye
  • Smina