RosettaLigand 补充
对于精确建模时,需要在<MOVERS>
模块中进行更加精细的设置,一般有以下选项
StartFrom
在之前的教程中已经有了阐述,在此重复一下。 为配体提供一系列可能的xyz初始坐标,随机选择其中一个坐标,通过链标识符指定的配体居中在此位置
1 | <StartFrom name=(string) chain=(string)/> |
Translate
在任意方向上,从初始位置开始随机移动配体指定距离。如果配体初始位置很荷力,只需要微调此位置,可以选择gaussian
分布,angstroms
表示移动的标准差。如果随机移动将配体放置在蛋白顶部(由排斥打分项评估),那么就使用另一个随机移动。此步骤将会重复cycles
次,如失败则返回初始坐标。
1 | <Translate name=(string) chain=(string) distribution=[uniform|gaussian] angstroms=(float) cycles=(int)/> |
Rotate
在允许的旋转自由度内旋转配体。360为全旋转自由度。执行cycles
次数随机配体旋转,只有通过LJ吸引和排斥打分
的旋转才会被储存。同时,在RMSD中与其他旋转接近的旋转不被存储。一旦收集到最少数量的不同结构(这
最小值为配体可旋转键数的5倍)之一,随机选择这些结构作为起始结构。如果没有结构通过吸引和排斥打分过滤器那就选择具有最好的吸引力和排斥性评分的旋转构象。
这个有点复杂的旋转选择方案旨在充分搜寻那些难以找到的姿势,适合在狭窄的活性口袋进行对接。通过只存储通过能量过滤器的旋转构象,我们把旋转限制在接近蛋白质但不与蛋白质接触的地方。如果你愿意接受第一个
旋转,无需过滤,只需使用cycles=1
。
1 | <Rotate name=(string) chain=(string) |
SlideTogether
在配体的初始构象生成之后,配体必须被移到蛋白质附近。SlideTogether
将配体向蛋白质移动,每次2埃,直到生成排斥(由正排斥分数证明)。步长每次减半(1,0.5,和0.25埃),以使配体和蛋白质之间的距离最小化。这一步证明了对Rosetta ligand docking
至关重要。氨基酸侧链和配体之间没有交互作用的情况很少有。
1 | <SlideTogether name="&string" chain="&string"/> |
HighResDocker
高精度对接时,rotamers trails
(侧链rotamers的采样,每次一条侧链)以及repacking
(多条侧链rotamers的持续采样)的次数与配体的微量移动结合。移动的程度由LIGAND_AREAS
中的high_res_angstroms
和high_res_degrees
设定。LIGAND_AREAS
为
INTERFACE_BUILDERs
的一部分。
movemap_builder
定义了rotamers采样、repacking和minimization的蛋白残残基,如果提供resfile
,界面残基将根据文件的设置被允许重新设置(更改残基类型)。Resfiles
也能够通过命令行-packing:resfile
指定。Resfile
支持蛋白界面根据特定配体进行优化。
用户指定了对接次数(`cycles
)和full
repack的周期(repack_every_Nth
),在每个循环之后,结构都被最小化。如果minimize_ligand
在LIGAND_AREAS
中指定,配体的旋转角也会被最小化。蒙特卡罗采样与玻尔兹曼准则用于判断是否接受或拒绝新生成的结构。LIGAND_AREAS
中指定的tether_ligand
值大于0,配体将保持在指定距离(埃)。tether_ligand
禁止在同一方向上多次进行小的位移,以防止配体远离预期位置。
1 | <HighResDocker name="string" cycles=(int) repack_every_Nth=(&int) |
FinalMinimizer
最小化对接之后的蛋白/配体复合物结构。该过程包括侧链旋转角采样。movermap_builder
制定了最小化的残基范围。如果Calpha_restraints
在LIGAND_AREAS
中指定,那么骨架\(\Phi/ \ \Psi\)角也会最小化。
1 | <FinalMinimizer name=(string) chain=(string) scorefxn=(string) movemap_builder=(string)> |
InterfaceScoreCalculator
该标签计算特定配体打分分数并将它们追加到输出文件。在对复合物打分之后,配体将会移动到距离蛋白1000埃的位置,然后重新对模型进行打分。界面分数通过提取分解复合物能量计算。如果native
结构被指定,四个额外的打分项会被计算:
ligand_centroid_travel
:对接配体与native配体之间的距离ligand_radious_of_gyration
:配体的旋转半径。配体倾向于以伸展的结构结合ligand_rms_no_super
:native
配体和对接配体之间的RMSDligand_rms_with_super
:native
配体和对接配体align之后的RMSD
1 | <InterfaceScoreCalculator name=(string) chains=(comma separated chars) scorefxn=(string) native=(string)/> |
小结
Score Term reweighting
数据库文件" new.ligand.wts "中指定的配体权重,在不同蛋白质/配体复合物的对接测试上表现良好。可以通过优化蛋白/配体相互作用项的权重来优化对接结果。
模型生成个数 生成的对接构象数由采样的界面大小决定,通过调整界面的size和shape能够在节省大量计算时间的情况下获得较好的对接结果。 通过调整
Translate
的angstroms
参数和添加更多的StartFrom
,用户可以将采样限制在更小的区域。另一种策略是创建有限数量的模型,然后根据RMSD对结果进行聚类。选择几个低能量的聚类进行进一步分析。选择每个聚类的模型。将这些模型应用于配体对接研究中,在Translate
中减小angstroms
的大小。
对接耗时主要在
full-repack