同源建模(CLC Drug Discovery Workbench版)

一，为什么需要同源建模

药物与蛋白靶点识别、蛋白－蛋白相互作用等是发生于3D结构水平，因此，获得蛋白3D结构是非常重要的。同时，靶点蛋白质三级结构是进行基于结构药物设计的基础：比如分子对接、基于结构的药效团识别等；蛋白质的3D结构也是分子动力学模拟等很多计算的起点。遗憾的是，并非所有您感兴趣的靶点都有合适的3D结构可以利用。这时，蛋白质3D结构的预测就可以帮上忙：同源建模是其中成功率最高、最重要的一种方法。

二，CLC Drug Discovery Workbench自带同源建模工具

CLC Drug Discovery Workbench (CLC DD)是CLC Bio公司合并Molegro公司后，将分子对接软件Molegro与其自身强大的生物信息学结合后开发的新产品：整合生物信息学（序列比对、蛋白结构分析、同源建模）与分子对接技术于一体。本教材从一个序列出发，演示如何用CLC DD进行同源建模。

三，同源建模流程

同源建模分两步：1）同源识别：通过序列比对来实现；2）3D结构预测。

前期准备：待预测3D结构的序列，保存为fasta格式（点此下载：query.fasta）。

第一步：同源识别

1,导入序列

File>>Import>>Standard Import
出现导入对话框，确认Format为fasta,从文件夹里选中query.fasta
点击next按钮，选择一个Navigation Area的文件夹，比如demo以保存文件，点Finish按钮。

现在，Navigation Area的demo目录下多了个蛋白序列文件,P1:Query

双击P1:Query,可以展示出序列信息

2，序列比对

在Navigation Area右键点击P1:QUERY,弹出右键菜单,点击：
Toolbox>>Sequence Analysis>>Find and Model Structure…

弹出Find and Model Structure对话框。

确认Selected element栏里有P1:QUERY。

点击Next按钮，会问结果处理方式，这里用默认值，再点击Next按钮，然后点Finish按钮。

稍等便刻，序列比对结束，在Navigation Area里会生成一个新的文件Structures found for P1:QUERY。

3，序列比对结果分析与同源识别

在Navigation Area里双击Structures found for P1:QUERY，展示结果。

本例里命中了1812个3D结构，已经按E-Value、百分一致性匹配、百分覆盖度等排序。

一般来说，E-Value越低，百分一致性匹配越高的蛋白与我们提交的序列同源的概率越大。

同源建模：3D模型预测

选择其中一个3D结构，即点击Available Structures例的一个4字母PDB结构，弹出菜单，点击Download and Create Model，建模自动开始。在ToolBox的Processes栏会展示建模进度。

建模结束后，会自动弹出预测的3D模型，以及对应的比对结果。您可以分析生成的3D模型，保存生成的模型。

四，后续工作

您可以进行进一步用CLC Drug Discovery Workbench进行分子对接，或Ligandscout进行药效团识别、虚拟筛选等。

同源建模