JCTC封面文章 | 深势科技Uni-Dock：支持极大规模数据库虚拟筛选的高性能对接引擎

2023-06-20 05:06

导语

分子对接（Docking），通过计算模拟对候选分子与目标靶点的结合亲和力进行快速评估的一种方法，由于具有通量大、速度快、富集能力好的特点，被广泛应用于药物设计的早期阶段虚拟筛选中，用来在大规模分子库中寻找潜在的活性分子[1]。然而，随着化学分子库的急剧扩大，传统的分子对接已经难以在合理成本下处理千万级、亿级数据库的虚拟筛选工作[2]；同时，Covid-19新冠肺炎疫情、猴痘病毒感染等紧急公共卫生事件，也让人们对虚拟筛选的速度提出了更高的要求[3]。总的来说，分子对接方法的计算效率亟待取得质的突破。

2023年6月13日，深势科技在Journal of Chemical Theory and Computation上发表封面文章Uni-Dock: GPU-Accelerated Docking Enables Ultralarge Virtual Screening^[4]，发布了基于GPU加速的高性能分子对接引擎Uni-Dock，在保持原始计算精度的前提下，在NVIDIA V100 GPU上实现了分子对接计算速度对比单核CPU超过1600倍的加速比。研发团队使用Uni-Dock，在100张NVIDIA V100显卡的计算集群上，仅花费11.3小时即完成在KRAS G12D靶点上对Enamine Diverse Real类药数据库3820万的多级虚拟筛选，平均速度超过3.7万次分子对接/卡时。这项工作显著降低了超大规模分子库的虚拟筛选所需要的时间和经济成本，为新药研发早期阶段中高效探索更大化学空间提供了可靠能力。

方法

传统的分子对接过程如下：用蒙特卡洛方法（Monte Carlo method，MC）对蛋白-配体复合物构象开展全局搜索，进行配体可旋转键二面角和配体位置的组合；计算当前复合物构象下配体的能量和受力，使用BFGS算法梯度下降开展局部优化，获取局部能量最低的复合物构象；重复若干次如是过程，直至搜索步骤耗尽；将所有低能复合物构象比对，返回最低能的蛋白-配体复合物构象和对应的能量。

Uni-Dock基于GPU的并行计算能力，实现了多构象并行搜索和多配体并行分子对接来充分利用GPU的并行计算性能。同时，通过计算逻辑优化、host-device数据传输优化、单精度/双精度混合优化、CPU/GPU异步计算机制设计和显存自适应机制设计等细致的进阶调优，进一步提升了Uni-Dock的计算性能。

AutoDock Vina 1.2（左）和Uni-Dock（右）的算法架构比较

（阶段一）首先，Uni-Dock实现了单配体多构象并行搜索。在GPU中，同时启动单个配体多个构象搜索线程，来充分利用GPU的并行计算能力（Kernel 2）。由于并行的搜索线程增加了构象多样性，覆盖了更大的化学空间，所以适当减小每个搜索线程的Monte Carlo迭代步数来进一步降低每个搜索线程的计算量。通过搜索线程数的增加和MC迭代步数减少，在构象空间的有效覆盖的前提下，实现了单个配体分子对接的有效加速。

（阶段二）其次，Uni-Dock实现了多配体并行分子对接。在GPU中，同时启动多个配体的分子对接计算，来充分利用GPU的并行计算能力（Kernel 1）。同时，基于显存空间，动态分配并行配体数，使一次分子对接计算的配体吞吐量尽可能大，平摊启动计算核心的额外消耗。在常见的GPU型号中，Uni-Dock通常会同时启动上百个配体的分子对接计算，充分利用GPU的计算能力和显存空间，显著缩短了单个配体的平均计算时间。

（阶段三）同时，Uni-Dock通过计算逻辑优化将部分会产生大量信息的计算迁移至GPU中，并通过优化数据结构，显著降低了host-device数据传输；然后，Uni-Dock将一些精度要求不高的计算调整为单精度计算，通过单精度/双精度混合优化来加速计算的同时降低对显存空间的占用；接着，Uni-Dock通过异步机制合理分配CPU读写文件和GPU计算模拟的时间；最后，为了在各型号GPU上都能充分利用GPU计算性能，我们设计了显存自适应机制来实现显存的智能调度和动态分配。

效果

Uni-Dock三个优化阶段在与AutoDock Vina（exhaustiveness=32）保持精度可比较的情况下，实现120倍、925倍和1627倍的速度提升

研发团队以AutoDock Vina 1.2^[5]在DUD-E^[6]中8个靶点的富集能力的表现作为精度衡量标准（相关参数设置为：exhaustiveness=32、Vina打分函数、半柔性对接），实验证明Uni-Docking的三个优化阶段均保持了可比较的精度。相比于AutoDock Vina（使用单个Intel® Xeon® Platinum 8269CY〔Cascade Lake〕2.5 GHz CPU核心）分子对接引擎，Uni-Dock（使用NVIDIA V100 32G GPU）在三阶段优化后实现了1627倍的加速比。

Uni-Dock与AutoDock Vina在DUD-E数据集和CASF-2016数据集上的分子对接精度比对

为了验证Uni-Dock在不同维度上的分子对接精度，研发团队比较了Uni-Dock和AutoDock Vina在DUD-E数据集（共计102个蛋白靶点，根据蛋白类型分为8类）上的筛选能力（Screening power，用enrichment factor表征），以及在CASF-2016数据集^[7]（共计285个蛋白配体复合物）上的对接能力（Docking power，用预测结构和晶体结构的RMSD表征）。实验证明Uni-Dock的计算精度在各层次上都保持了AutoDock Vina的一致。

Uni-Dock与Autodock-GPU、Vina-GPU的分子对接效率和精度比对

研发团队还比较了Uni-Dock与另外两款利用GPU加速的分子对接软件，Autodock-GPU^[8]和Vina-GPU^[9]的分子对接效率和精度。为了合理比较三款分子对接引擎的效果，研发团队定义了三种计算复杂度级别，从低到高分别命名为Fast Mode，Balanced Mode和Detailed Mode。从效率上看，Uni-Dock的计算速度在各个级别比其它两款软件要快10倍以上，三种级别的对接速度分别约0.10s/ligand, 0.32s/ligand和0.38s/ligand。从精度上看，由于Uni-Dock和Vina-GPU都基于AutoDock Vina开发，因此具有可比较的精度；而Autodock-GPU在精度上的表现较差。

Uni-Dock随GPU数目线性扩展能力（左）和Uni-Dock对不同型号/架构GPU的适配能力（右）

进一步的实验证明，Uni-Dock随GPU数目的增加有线性扩展能力，能充分利用大规模集群的计算能力，实现高通量的虚拟筛选。同时，Uni-Dock也能良好适配不同型号、不同架构的GPU，实现不同计算资源上的有效部署。

^‍‍‍

案例

深势科技的研发团队使用Uni-Dock在KRAS G12D靶点上对Enamine Diverse REAL类药数据库3820万分子开展了虚拟筛选。为兼顾速度和精度，研发团队采用了分层虚拟筛选的方法。首先使用Uni-Dock Fast模式（速度较快，精度稍低）对REAL类药数据库全集约3820万个分子开展分子对接。然后，使用Uni-Dock Balanced模式（兼顾速度和精度）对第一步对接得分排名前10％的小分子（约382万个）开展分子对接。最后，使用Uni-Dock Detailed模式（速度稍低，精度较高）对第二步对接得分排名前10％的分子（约38.2万个）开展分子对接，得到最终结果。

在Enamine Diverse REAL数据集上针对KRAS G12D靶点进行分层虚拟筛选的时间消耗

研发团队在计算机集群使用100张NVIDIA V100 GPU的开展了上述的虚拟对接流程。仅消耗11.27小时，即完成上述的分层虚拟筛选全流程，平均速度超过3.7万次分子对接/卡时。三步不同层级的分子对接分别花费了7.88小时、2.52小时和0.87小时。这展现了Uni-Dock分子对接引擎的高效筛选能力。

总结

深势科技研发团队发布了Uni-Dock高性能分子对接引擎。通过充分利用GPU并行计算性能和显存空间，结合细致的流程设计调优，在保持与传统分子对接可比较的精度的前提下，Uni-Dock在NVIDIA V100 GPU上实现了对比AutoDock Vina单核计算超1600倍的加速比率，是其他GPU加速的分子对接引擎的10倍以上，以0.1s/ligand的分子对接效率，仅花费不到12小时就能完成超3820万分子数据库的虚拟筛选工作。

深势科技发布的Uni-Dock高性能分子对接引擎将超千万规模分子数据库的虚拟筛选工作带入了可及、可用、可靠的实用时代。极致的分子对接速度，意味着药物研发项目在研发早期能以可接受的成本探索更大的化学空间，有更多的机会发现优良命中物分子，为新药研发提供了更多可能性和更好的基础。同时，作为药物研发的基础工具，Uni-Dock给例如结合姿势预测、打分函数调优等场景提供了有效的数据标注工具，也能很容易地与主动学习策略、预训练模型等方法相结合，创造更多的可能性。

One More Thing

Uni-Dock高性能分子对接引擎现面向学术用户开放免费获取！在遵循使用协议的前提下，学术用户可以从深势科技GitHub仓库（ https://github.com/dptech-corp/Uni-Dock ）获取Uni-Dock的最新发行版，使用极致加速的Uni-Dock高效推进科研进程。

如果您是一个初学者，想学习Uni-Dock的使用方法，完成虚拟筛选从批量提交筛选任务到结果回收分析等一系列工作，可以按照Bohrium® Notebook上的Uni-Dock使用案例（ https://nb.bohrium.dp.tech/detail/1288 ），一步一步地学习如何完成这些工作。

如果您想用Uni-Dock完成一个虚拟筛选工作，但手头没有GPU机器，您可以在深势科技Launching平台（ https://app.bohrium.dp.tech/uni-dock ）上提交您的虚拟筛选作业，Launching平台会将您的任务自动分配计算资源，快速完成虚拟筛选并返回结果。

如果您不仅想使用Uni-Dock开展虚拟筛选，还想在可视化界面上查看和分析蛋白-配体复合物的结合姿势，并开展例如蛋白结构预测、MM-GB/PBSA、自由能微扰FEP计算、分子性质预测、抗体人源化设计与性质预测等进一步评估和分析工作，您可以登录深势科技药物计算设计平台Hermite®（hermite.dp.tech），获取一站式药物设计解决方案。Hermite®提供了基于网页的交互式全新分子展示体验，为药物研发科学家带来了跨窗口智能化协作，多样的分子展示和操作功能，方便了使用者对蛋白、药物分子及其模拟数据的查看、分析和分享，同时支持本地和云上的私有化部署。

参考文献

[1] Prieto-Martínez FD, Arciniega M, Medina-Franco JL. Molecular docking: current advances and challenges. TIP. Revista especializada en ciencias químico-biológicas. 2018;21.

[2] Lyu, J., Wang, S., Balius, T.E., Singh, I., Levit, A., Moroz, Y.S., O’Meara, M.J., Che, T., Algaa, E., Tolmachova, K. and Tolmachev, A.A., 2019. Ultra-large library docking for discovering new chemotypes. Nature, 566(7743), pp.224-229.

[3] Gorgulla, C., Boeszoermenyi, A., Wang, Z.F., Fischer, P.D., Coote, P.W., Padmanabha Das, K.M., Malets, Y.S., Radchenko, D.S., Moroz, Y.S., Scott, D.A. and Fackeldey, K., 2020. An open-source drug discovery platform enables ultra-large virtual screens. Nature, 580(7805), pp.663-668.

[4] Yu, Y., Cai, C., Wang, J., Bo, Z., Zhu, Z., & Zheng, H. (2023). Uni-Dock: GPU-Accelerated Docking Enables Ultralarge Virtual Screening. Journal of Chemical Theory and Computation.

[5] J. Eberhardt, D. Santos-Martins, A. F. Tillack, and S. Forli. (2021). AutoDock Vina 1.2.0: New Docking Methods, Expanded Force Field, and Python Bindings. Journal of Chemical Information and Modeling.

[6] Mysinger, M. M., Carchia, M., Irwin, J. J., & Shoichet, B. K. (2012). Directory of useful decoys, enhanced (DUD-E): better ligands and decoys for better benchmarking. Journal of medicinal chemistry, 55(14), 6582-6594.

[7] Su, M., Yang, Q., Du, Y., Feng, G., Liu, Z., Li, Y., & Wang, R. (2018). Comparative assessment of scoring functions: the CASF-2016 update. Journal of chemical information and modeling, 59(2), 895-913.

[8] Santos-Martins, D., Solis-Vasquez, L., Tillack, A. F., Sanner, M. F., Koch, A., & Forli, S. (2021). Accelerating AutoDock4 with GPUs and gradient-based local search. Journal of chemical theory and computation, 17(2), 1060-1073.

[9] Tang, S., Chen, R., Lin, M., Lin, Q., Zhu, Y., Ding, J., ... & Wu, J. (2022). Accelerating autodock vina with gpus. Molecules, 27(9), 3041.

关于深势科技

深势科技是“AI for Science”科学研究范式的引领者和践行者，致力于运用人工智能和分子模拟算法，结合先进计算手段求解重要科学问题，为人类文明最基础的生物医药、能源、材料和信息科学与工程研究打造新一代微尺度工业设计和仿真平台。

我们开创性地提出了「多尺度建模+机器学习+高性能计算」的革命性科学研究新范式，并推出了Bohrium®微尺度科学计算云平台、Hermite®药物计算设计平台、RiDYMO™强化动力学平台及电池材料计算设计平台等微尺度工业设计基础设施，颠覆了现有研发模式，打造“计算引导实验、实验优化设计”的全新范式。

深势科技是国家高新技术企业、北京市“专精特新”中小企业，总部位于北京，并在上海、深圳等城市布局研发中心。科研技术团队由中国科学院院士领衔，汇集了超百位数学、物理、化学、生物、材料、计算机等多个领域的优秀青年科学家和工程师，其中公司的博士及博士后占比超过35%。核心成员获得过2020年全球计算机高性能计算领域的最高奖项“戈登贝尔奖”，相关工作当选2020年中国十大科技进展和全球AI领域十大技术突破。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章