Autodock Vina多对多分子对接并筛选结果绘制热图

本文实现了多个配体与多个受体之间的对接批处理程序。一般这种结果会比较多，那么我们用python查看结果，并绘制热图，好看一点。

懒的很

19939人浏览 · 2021-11-28 22:05:07

懒的很 · 2021-11-28 22:05:07 发布

之前发过一个一对多的批量对接批处理程序（点我看一个受体对多个配体的程序），有小伙伴提出要做个多对多的程序，而且多对多也更常用一些。本文就此需求实现一下，同时还整合了数据结果的可视化，用热图的形式将多对多对接结果呈现出来。

这里所用的vina是老版本，如果用的是vina1.2.3或者vina1.2.5或者数字再大的，取消了–log参数，也可以批量对接，保存的参数稍微改变了一下，看我的另一篇文章(点我直达)

我的文章已经发表，希望大家可以多多引用，谢谢，PMID：38910191 ，链接点我直达。

另外，如果不想安装python，也可用批处理在批量对接完成后生成excel可读的文件，进行后续的排序和筛选（点我看）。

多对多批量对接

一、新建一个文件夹

新建一个文件夹，将我们整理好的配体和受体文件分别放在receptor和ligand两个文件夹内。将vina相关程序也放进来。在这里插入图片描述
受体对接口袋的信息包括了xyz坐标等，要自己找到并写入到一个txt文件中，对接口袋信息举例如下

center_x = 187.9
center_y = -10.8
center_z = 61.7
 
size_x = 24.4
size_y = 23.6 
size_z = 37.3

num_modes = 9

需要注意的是将受体的对接口袋信息也放入receptor文件中，并与pdbqt文件的文件名一致。
在这里插入图片描述

二、建立批处理程序

回到新建的文件夹中，新建一个txt文件，将以下代码复制进去

@echo
for %%r in (receptor\*.pdbqt) do (
	for %%l in (ligand\*.pdbqt) do (
		if not exist results mkdir results
		vina --config receptor\%%~nr.txt --receptor %%r --ligand %%l --out results\%%~nr_2_%%~nl.pdbqt --log results\%%~nr_2_%%~nl.txt
		timeout 10))
exit

如果不需要电脑休息，可将timeout 10删去，最外面的括号一定注意不要删掉。

保存后，任意给他一个名字dock.txt也很，其他也好，这不重要。重要的是要把后缀名.txt改为.bat。有的人不喜欢显示后缀名，需要进入到文件夹选项中，把后缀名显示以便更改。

三、双击运行

然后，双击这个.bat，你的电脑就开始起飞了。

运行结束后，结果会保存在一个叫results的文件夹中。如图所示。
在这里插入图片描述
结果的文件名命名规则是受体_2_配体。结合能的结果在txt文件里，分子位置的结果在pdbqt文件里。

四、利用python查看和筛选结果

txt文件太多了，需要批量的查看和处理，这里我选用了python。因为之前发过一篇结果利用python处理结果的（点我看）。阅读量竟然是最高的，也是令人震惊。所以这里也还用python，最后绘制个热图，好看一点。

首先，载入所需的包

import pandas as pd
import numpy as np
import os

定义获取结合能的函数

def getmaxaffinity(fpath):
    m = []
    try:
        with open (fpath, encoding = "utf-8") as f:
            for i in f.readlines()[-10]:
                if i!= ' ' and i != '\n':
                    m.append(i)
        return ''.join(m[1:5])  
    except:
        return ''

设置文件路径，也就是对接结果存放的results文件夹的路径，读取其中的txt文件。

f = r'C:\\Users\\O_O\\Desktop\\dock\\results'
receptors = []
ligands = []
affinity = []
for root,dirs,files in os.walk(f):
    for file in files:
        if os.path.splitext(file)[1]== '.txt':
            try:
            	fn = os.path.splitext(file)[0]
            	receptor,ligand = fn.split('_2_')
            	receptors.append(receptor)
            	ligands.append(ligand)
            	fpath = os.path.join(f,file)
            	affinity.append(getmaxaffinity(fpath))
            except:
            	continue

这里利用了结果命名的规则，获得受体和配体的信息。所以在对受体和配体的进行命名的时候尽量不要出现_2_这个字符。
（其实出现也没事，把批处理的命名规则改一下就行，代码小白忽略括号内的内容）

将受体、配体和结合能的信息做出表格以供筛选

df = pd.DataFrame()
df['receptor'] = receptors
df['ligand'] = ligands
df['affinity'] = affinity

数据整理一下，主要是将结合能变成数字。

df['ligand'] = df['ligand'].str.split('_',expand = True)[2]
df = df.replace('', np.nan)
df = df.dropna(axis = 0)
df['affinity'] = df['affinity'].astype(float)

筛选<-0.7的结果

df_h = df.loc[df['affinity'] < -7.0]

五、绘制热图

载入绘图所需要的包

import matplotlib
import matplotlib.pyplot as plt
import seaborn as sns

将对接结果变成一个宽数据以便绘图

df_a = df_h.pivot(index = 'ligand', columns = 'receptor', values = 'affinity')

设置绘图参数，绘图并保存

ax = sns.heatmap (df_a,cmap = 'OrRd',annot = True)
ax.tick_params(top=True, bottom=False,
                   labeltop=True, labelbottom=False)
heatmap = ax.get_figure()
heatmap.savefig("heat.png",dpi = 300)