由蛋白结构快速预测配体结合位点的最新平台PrankWeb

根据蛋白质结构预测配体结合位点在阐明蛋白质功能和药物设计方面有许多应用,具体包括药物副作用预测、基于片段的药物发现、对接优先级排序、基于结构的虚拟筛选和基于结构的靶标预测(或称为反向虚拟筛选)等方面。它通常是复杂的计算药物设计工程中的关键步骤。鉴定可与蛋白质结合的配体或小分子也是预测蛋白质功能的重要线索。可以直接在蛋白质的3D结构内确定配体和其他小分子,或者可以使用蛋白质的3D结构预测配体结合位点,从而帮助注释蛋白质。

迄今为止,只有少数几种稳定和快速的方法适合用于自动化运行或用于处理大型数据集。在这里,我将介绍一款配体结合位点预测的最新在线平台PrankWeb,它是P2Rank软件的在线版,用户可以轻松地进行预测并通过集成的序列结构视图直观地查看预测的结合位点。

P2Rank是一种无需模板、基于机器学习的配体结合位点预测方法,采用随机森林来预测蛋白质溶剂可及表面上的点的局部化学邻域配体性。这些点表示结合配体接触原子的潜在位置,并根据局部几何邻域计算出的特征向量描述,其特征向量包括根据周围的原子和残基计算得出的物理化学和几何特性(例如疏水性,芳香性或表面突起),然后将具有高配体性得分的点聚集成形成配体结合位点。

1.打开PrankWeb的主页:

1620

2.指定要分析的蛋白质

分析蛋白质的输入有两种选择:(1)上传蛋白质PDB格式文件;(2)提供PDB蛋白质识别号。

1620

3.同源性分析

除了选择要分析的蛋白质外,还可以通过选中Run conservation analysis(运行保守性分析)复选框来指定是否在预测模型中考虑进化保守性。PrankWeb包含两个用于口袋预测的预训练模型。但是除了指定其PDB识别码或上载多个序列比对以进行同源性计算,否则为用户定义的蛋白质文件计算保守评分会大大增加分析时间。

有三种方法可以计算蛋白质的保守评分:

(1)指定自定义比对文件,PrankWeb将使用该文件计算蛋白质的保守性得分。

(2)如果您知道蛋白质的PDB识别码,则可以在文本框中指定,PrankWeb将从数据库中的比对计算出同源性。

(3)后备方法:如果上述方法不可行,或者未指定PDB识别码或比对文件,则PrankWeb将使用类似蛋白质的比对自动计算保守评分。

4.可视化

加载蛋白质可视化后,将出现三个主要面板:结构可视化、序列可视化和口袋面板。

1620

4.1结构可视化

最大的面板显示了蛋白质的三维可视化,PrankWeb嵌套的LiteMol软件的可视化功能非常强大。

(1)默认情况下,显示蛋白质表面,并用不同的颜色突出显示各个口袋区域,配体以黄色显示;

(2)如果存在保守性,则根据每个残基的保守性评分,蛋白质原子会用11种灰色阴影着色,较深的颜色表示较高的保守性;

(3)单击右侧口袋面板顶部的最右侧按钮可以在蛋白质视图(表面,卡通,原子样式)之间切换。

4.1.1控制项

按住鼠标左键可通过移动鼠标来旋转分子(不同预测出的口袋标以不同颜色)。

99hy027cv6

可以按住鼠标右键的同时移动鼠标进行放大或缩小。

esn6r055zc

通过滚动鼠标滚轮可以对蛋白质进行切片。

通过切换高级控制面板,可以完全控制可视化内容。首先,在左侧的树控件中选择要编辑的可视化部分,然后使用右侧面板编辑其属性。

1620

通过隐藏默认的蛋白质表面并为各个口袋创建小的表面。

1620

4.2序列可视化

蛋白质3D可视化上方的面板显示蛋白质序列。

(1)蛋白的所有链均被串联并可视化,链可以通过在主序列上标记的区域来识别。

(2)彩色矩形描绘了具有预期口袋和实际结合区域的区域。

(3)真正的结合位点是距配体原子4个以内的残基。

(4)保守性得分将使用灰色条形图描绘。

随着鼠标悬停在序列上,残基在3D可视化图中突出显示。此功能可以从结构和顺序的角度分析蛋白质。可以捕获序列的快照,并使用最右边的按钮将其导出SVG(可缩放矢量图形)文件。

1620

4.3口袋面板

右侧面板包含几个控制按钮和预测的口袋列表。使用控制按钮下载PrankWeb报告,共享网站,隐藏序列视图或在结构视图之间切换。

在口袋列表中,将显示每个口袋的口袋名称、分数排名、大小和平均保守性分数。此外,通过悬停按钮可以突出显示口袋的3D可视化。

543w0n9o6y

PrankWeb的结果报告是一个ZIP包,其中包含以下文件:

(1)已上传原始pdb文件,或从PDB下载的蛋白质文件。

(2)预测JSON文件,其中包含袋的列表,它们的分数和位置,即构成该袋的原子和残基的列表。

(3)用于离线可视化的PyMol文件(P2Rank的输出)。

(4)使用JSD方法计算的蛋白质每个残基的保守性得分。该文件为tsv(制表符分隔值)格式。第一列标识索引,第二列包含得分,最后一列包含来自多个序列比对的残基。最后一列中的第一个字符是分析的蛋白质文件的残基。

(5)用于计算保守评分的FASTA格式的多个序列比对。

PrankWeb的功能如此强大,做出的图如此酷炫,小伙伴们快去试一下吧![来源腾讯]

PrankWeb官网:http://prankweb.cz

参考文献:Lukas Jendele, Radoslav Krivak, Petr Skoda, Marian Novotny, DavidHoksza, PrankWeb: a web server for ligand binding site prediction andvisualization,Nucleic Acids Research(IF=11), Volume 47, Issue W1, 02 July 2019, Pages W345–W349,https://doi.org/10.1093/nar/gkz424

你可能感兴趣的文章:

上一篇:

下一篇:


标签