JCTC封面文章 | 深势科技Uni-Dock:支持极大规模数据库虚拟筛选的高性能对接引擎
2023年6月13日,深势科技在Journal of Chemical Theory and Computation上发表封面文章Uni-Dock: GPU-Accelerated Docking Enables Ultralarge Virtual Screening[4],发布了基于GPU加速的高性能分子对接引擎Uni-Dock,在保持原始计算精度的前提下,在NVIDIA V100 GPU上实现了分子对接计算速度对比单核CPU超过1600倍的加速比。研发团队使用Uni-Dock,在100张NVIDIA V100显卡的计算集群上,仅花费11.3小时即完成在KRAS G12D靶点上对Enamine Diverse Real类药数据库3820万的多级虚拟筛选,平均速度超过3.7万次分子对接/卡时。这项工作显著降低了超大规模分子库的虚拟筛选所需要的时间和经济成本,为新药研发早期阶段中高效探索更大化学空间提供了可靠能力。
方法
传统的分子对接过程如下:用蒙特卡洛方法(Monte Carlo method,MC)对蛋白-配体复合物构象开展全局搜索,进行配体可旋转键二面角和配体位置的组合;计算当前复合物构象下配体的能量和受力,使用BFGS算法梯度下降开展局部优化,获取局部能量最低的复合物构象;重复若干次如是过程,直至搜索步骤耗尽;将所有低能复合物构象比对,返回最低能的蛋白-配体复合物构象和对应的能量。
Uni-Dock基于GPU的并行计算能力,实现了多构象并行搜索和多配体并行分子对接来充分利用GPU的并行计算性能。同时,通过计算逻辑优化、host-device数据传输优化、单精度/双精度混合优化、CPU/GPU异步计算机制设计和显存自适应机制设计等细致的进阶调优,进一步提升了Uni-Dock的计算性能。
(阶段一)首先,Uni-Dock实现了单配体多构象并行搜索。在GPU中,同时启动单个配体多个构象搜索线程,来充分利用GPU的并行计算能力(Kernel 2)。由于并行的搜索线程增加了构象多样性,覆盖了更大的化学空间,所以适当减小每个搜索线程的Monte Carlo迭代步数来进一步降低每个搜索线程的计算量。通过搜索线程数的增加和MC迭代步数减少,在构象空间的有效覆盖的前提下,实现了单个配体分子对接的有效加速。
(阶段二)其次,Uni-Dock实现了多配体并行分子对接。在GPU中,同时启动多个配体的分子对接计算,来充分利用GPU的并行计算能力(Kernel 1)。同时,基于显存空间,动态分配并行配体数,使一次分子对接计算的配体吞吐量尽可能大,平摊启动计算核心的额外消耗。在常见的GPU型号中,Uni-Dock通常会同时启动上百个配体的分子对接计算,充分利用GPU的计算能力和显存空间,显著缩短了单个配体的平均计算时间。
(阶段三)同时,Uni-Dock通过计算逻辑优化将部分会产生大量信息的计算迁移至GPU中,并通过优化数据结构,显著降低了host-device数据传输;然后,Uni-Dock将一些精度要求不高的计算调整为单精度计算,通过单精度/双精度混合优化来加速计算的同时降低对显存空间的占用;接着,Uni-Dock通过异步机制合理分配CPU读写文件和GPU计算模拟的时间;最后,为了在各型号GPU上都能充分利用GPU计算性能,我们设计了显存自适应机制来实现显存的智能调度和动态分配。
效果
Uni-Dock三个优化阶段在与AutoDock Vina(exhaustiveness=32)保持精度可比较的情况下,实现120倍、925倍和1627倍的速度提升
Uni-Dock与AutoDock Vina在DUD-E数据集和CASF-2016数据集上的分子对接精度比对
为了验证Uni-Dock在不同维度上的分子对接精度,研发团队比较了Uni-Dock和AutoDock Vina在DUD-E数据集(共计102个蛋白靶点,根据蛋白类型分为8类)上的筛选能力(Screening power,用enrichment factor表征),以及在CASF-2016数据集[7](共计285个蛋白配体复合物)上的对接能力(Docking power,用预测结构和晶体结构的RMSD表征)。实验证明Uni-Dock的计算精度在各层次上都保持了AutoDock Vina的一致。
Uni-Dock与Autodock-GPU、Vina-GPU的分子对接效率和精度比对
进一步的实验证明,Uni-Dock随GPU数目的增加有线性扩展能力,能充分利用大规模集群的计算能力,实现高通量的虚拟筛选。同时,Uni-Dock也能良好适配不同型号、不同架构的GPU,实现不同计算资源上的有效部署。
案例
深势科技的研发团队使用Uni-Dock在KRAS G12D靶点上对Enamine Diverse REAL类药数据库3820万分子开展了虚拟筛选。为兼顾速度和精度,研发团队采用了分层虚拟筛选的方法。首先使用Uni-Dock Fast模式(速度较快,精度稍低)对REAL类药数据库全集约3820万个分子开展分子对接。然后,使用Uni-Dock Balanced模式(兼顾速度和精度)对第一步对接得分排名前10%的小分子(约382万个)开展分子对接。最后,使用Uni-Dock Detailed模式(速度稍低,精度较高)对第二步对接得分排名前10%的分子(约38.2万个)开展分子对接,得到最终结果。
在Enamine Diverse REAL数据集上针对KRAS G12D靶点进行分层虚拟筛选的时间消耗
研发团队在计算机集群使用100张NVIDIA V100 GPU的开展了上述的虚拟对接流程。仅消耗11.27小时,即完成上述的分层虚拟筛选全流程,平均速度超过3.7万次分子对接/卡时。三步不同层级的分子对接分别花费了7.88小时、2.52小时和0.87小时。这展现了Uni-Dock分子对接引擎的高效筛选能力。
总结
深势科技发布的Uni-Dock高性能分子对接引擎将超千万规模分子数据库的虚拟筛选工作带入了可及、可用、可靠的实用时代。极致的分子对接速度,意味着药物研发项目在研发早期能以可接受的成本探索更大的化学空间,有更多的机会发现优良命中物分子,为新药研发提供了更多可能性和更好的基础。同时,作为药物研发的基础工具,Uni-Dock给例如结合姿势预测、打分函数调优等场景提供了有效的数据标注工具,也能很容易地与主动学习策略、预训练模型等方法相结合,创造更多的可能性。
One More Thing
如果您想用Uni-Dock完成一个虚拟筛选工作,但手头没有GPU机器,您可以在深势科技Launching平台( https://app.bohrium.dp.tech/uni-dock )上提交您的虚拟筛选作业,Launching平台会将您的任务自动分配计算资源,快速完成虚拟筛选并返回结果。
如果您不仅想使用Uni-Dock开展虚拟筛选,还想在可视化界面上查看和分析蛋白-配体复合物的结合姿势,并开展例如蛋白结构预测、MM-GB/PBSA、自由能微扰FEP计算、分子性质预测、抗体人源化设计与性质预测等进一步评估和分析工作,您可以登录深势科技药物计算设计平台Hermite®(hermite.dp.tech),获取一站式药物设计解决方案。Hermite®提供了基于网页的交互式全新分子展示体验,为药物研发科学家带来了跨窗口智能化协作,多样的分子展示和操作功能,方便了使用者对蛋白、药物分子及其模拟数据的查看、分析和分享,同时支持本地和云上的私有化部署。
参考文献
关于深势科技
深势科技是“AI for Science”科学研究范式的引领者和践行者,致力于运用人工智能和分子模拟算法,结合先进计算手段求解重要科学问题,为人类文明最基础的生物医药、能源、材料和信息科学与工程研究打造新一代微尺度工业设计和仿真平台。
我们开创性地提出了「多尺度建模+机器学习+高性能计算」的革命性科学研究新范式,并推出了Bohrium®微尺度科学计算云平台、Hermite®药物计算设计平台、RiDYMO™强化动力学平台及电池材料计算设计平台等微尺度工业设计基础设施,颠覆了现有研发模式,打造“计算引导实验、实验优化设计”的全新范式。
深势科技是国家高新技术企业、北京市“专精特新”中小企业,总部位于北京,并在上海、深圳等城市布局研发中心。科研技术团队由中国科学院院士领衔,汇集了超百位数学、物理、化学、生物、材料、计算机等多个领域的优秀青年科学家和工程师,其中公司的博士及博士后占比超过35%。核心成员获得过2020年全球计算机高性能计算领域的最高奖项“戈登贝尔奖”,相关工作当选2020年中国十大科技进展和全球AI领域十大技术突破。
微信扫码关注该文公众号作者