Nature重磅!打破科研生涯天花板,药学领域在创新高!
众所周知,传统药物的研发需要多年时间且成本高昂。据报道,一种药物平均需要10~15年才能上市,成本估计约为588亿美元,10000种经过测试的药物中,约只有250种将接受额外的药物试验,而在人体上进行测试的数量往往不超过10种;此外,Tufts药物开发研究中心1995-2007年的研究发现,进入临床试验一期的药物最终只有11.83%获得批准出售,2006-2021年,进行临床试验的药物只有8.8%获得成功。由于传统药物发现和开发的方法成本高昂且失败率高,因此常需要应用计算工具,例如计算机辅助药物设计(computer-aided drug design,CADD),它结合了基于配体、基于结构和基于系统的药物设计。在计算机模拟药物发现和药物信息学中,几个术语与CADD的意思相同,例如:基于结构的药物设计(structure-based drug design,SBDD)、基于配体的药物设计(ligand-based drug design,LBDD)和基于片段的药物设计(fragment-based drug design,FBDD)都是指CADD,通过使用计算机研究受体和分子之间的相互作用来开发新药物。
基于片段的药物设计(FBDD)方法是一种通过筛选碎片库得到苗头片段,然后采用基于结构的设计策略对苗头片段进行优化和改造获得先导化合物的研究。其研究过程分为 3 个部分 : 1)设计并构建片段库 ; 2)片段库的筛选 ; 3)利用基于结构的药物设计策略对苗头片段进行优化设计,最终得到类药性的先导化合物或候选化合物。通过结合已经上市的 3 个抗肿瘤药物(vemurafenib、venetoclax 和 erdafitinib)和目前处于Ⅱ期临床的 KRASG12C 抑制剂 AMG510 的研究为实例对 FBDD 的最新研究进展进行综述与展望。
基于片段的药物设计(fragment-based drugdesign,FBDD)是一种通过筛选碎片库得到苗头片段,随后基于结构的设计策略对片段进行优化和改造获得先导化合物的研究方法。FBDD 方法是为了克服传统高通量筛选的缺陷而逐步发展起来的新技术。高通量筛选由于盲目性大,命中率低,成本高,对于部分药物靶点很难筛选得到理想的化合物。FBDD 方法基于药物靶标的活性位点是由多个子口袋组成,首先筛选得到各个子口袋的特异性结合片段,再将与靶蛋白各个子口袋特异结合的片段以合适的连接子连接起来,组装成为高活性的化合物。FBDD方法与传统的高通量筛选获得苗头化合物方法相比,具有特异性高、类药性高、效率高等优势。
FBDD 作为发现苗头化合物的一种关键技术,逐渐成为药物研发的主流方法。其研究过程可以分成 3 个步骤:1)片段库的设计构建(片段通常符合“3 规则”,即:相对分子质量≤ 300;氢键供体数目≤ 3;氢键受体数目≤ 3;计算脂水分配系数cLogP ≤ 3;旋转键数目≤ 3;极性表面积≤ 60 Å2);2)片段筛选(使用多种生物物理技术方法筛选获得与靶标具有结合能力的苗头片段);3)片段优化(基于靶标结构特征,通过迭代优化策略将苗头片段优化成为先导化合物)(见图 1)。至今已有数十个采用基于片段药物设计方法的药物进入临床试验研究,其中已有 3 个药物(vemurafenib、venetoclax和 erdafitinib)被美国 FDA 批准上市。
人工智能与组学和药物设计以及基因编辑技术的研究到底有多热,以及为何要举办培训,下面的内容给出了答案
近两年国内外顶尖课题组MIT、Harvard University、UPenn、清华大学、复旦大学、西湖大学等都在从事人工智能与组学与药物和基因编辑技术以及蛋白质晶体结构解析的研究,这一研究成果更是多次发表在Nature Reviews Genetics、Nature Methods、Science Advances、Cancer Cell、Nature Biotechnology等知名国际顶刊上,为我们发表顶刊鉴定了基础
由于该项研究资料和学习平台较少,信息技术不公开,培训学习迫在眉睫,特此诚挚邀请您参加线上培训课,参会会员已达3000余名!助力学员发表Nature、Science、Cell等正刊及子刊!(在新技术加持下,用更少的经费,发更高质量的文章)
MONDAY
专题一:CADD计算机辅助药物设计
专题二:深度学习基因组学
专题三:AIDD人工智能辅助药物发现
专题四:机器学习代谢组学
专题五:机器学习单细胞转录组表观组学
专题六:CRISPR-Cas9基因编辑技术
专题一、CADD计算机辅助药物设计课程
第一天
上午
背景与理论知识以及工具准备
1.PDB数据库的介绍和使用
1.1数据库简介
1.2靶点蛋白的结构查询与选取
1.3靶点蛋白的结构序列下载
1.4靶点蛋白的下载与预处理
1.5批量下载蛋白晶体结构
2.Pymol的介绍与使用
2.1软件基本操作及基本知识介绍
2.2蛋白质-配体相互作用图解
2.3蛋白-配体小分子表面图、静电势表示
2.4蛋白-配体结构叠加与比对
2.5绘制相互作用力
3.notepad的介绍和使用
3.1优势及主要功能介绍
3.2界面和基本操作介绍
3.3插件安装使用
下午
一般的蛋白
-配体分子对接讲解
1.对接的相关理论介绍
1.1分子对接的概念及基本原理
1.2分子对接的基本方法
1.3分子对接的常用软件
1.4分子对接的一般流程
2.常规的蛋白-配体对接
2.1收集受体与配体分子
2.2复合体预构象的处理
2.3准备受体、配体分子
2.4蛋白-配体对接
2.5对接结果的分析
以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例
第二天
虚拟筛选
1.小分子数据库的介绍与下载
2.相关程序的介绍
2.1 openbabel的介绍和使用
2.2 chemdraw的介绍与使用
3.虚拟筛选的前处理
4.虚拟筛选的流程及实战演示
案例:筛选新冠病毒主蛋白酶抑制剂
5.结果分析与作图
6.药物ADME预测
6.1ADME概念介绍
6.2预测相关网站及软件介绍
6.3预测结果的分析
第三天
拓展对接的使用方法
1.蛋白-蛋白对接
1.1蛋白-蛋白对接的应用场景
1.2相关程序的介绍
1.3目标蛋白的收集以及预处理
1.4使用算例进行运算
1.5关键残基的预设
1.6结果的获取与文件类型
1.7结果的分析
以目前火热的靶点
PD-1/PD-L1等为例。
2.涉及金属酶蛋白的对接
2.1金属酶蛋白-配体的背景介绍
2.2蛋白与配体分子的收集与预处理
2.3金属离子的处理
2.4金属辅酶蛋白-配体的对接
2.5结果分析
以人类法尼基转移酶及其抑制剂为例
3.蛋白-多糖分子对接
4.1蛋白-多糖相互作用
4.2对接处理的要点
4.3蛋白-多糖分子对接的流程
4.4蛋白-多糖分子对接
4.5相关结果分析
以α-糖苷转移酶和多糖分子对接为例
5.核酸-小分子对接
5.1核酸-小分子的应用现状
5.2相关的程序介绍
5.3核酸-小分子的结合种类
5.4核酸-小分子对接
5.5相关结果的分析
以人端粒
g -四链和配体分子对接为例。
操作流程介绍及实战演示
第四天
拓展对接的使用方法
1.柔性对接
1.1柔性对接的使用场景介绍
1.2柔性对接的优势
1.3蛋白-配体的柔性对接
重点:柔性残基的设置方法
1.4相关结果的分析
以周期蛋白依赖性激酶
2(CDK2)与配体1CK为例
2.共价对接
2.1两种共价对接方法的介绍
2.1.1柔性侧链法
2.1.2两点吸引子法
2.2蛋白和配体的收集以及预处理
2.3共价药物分子与靶蛋白的共价对接
2.4结果的对比
以目前火热的新冠共价药物为例。
3.蛋白-水合对接
3.1水合作用在蛋白-配体相互作用中的意义及方法介绍
3.2蛋白和配体的收集以及预处理
3.3对接相关参数的准备
重点:水分子的加入和处理
3.4蛋白-水分子-配体对接
3.5结果分析
以乙酰胆碱结合蛋白
(AChBP)与尼古丁复合物为例
第五天
分子动力学模拟(linux与gromacs使用安装)
1. linux系统的介绍和简单使用
1.1 linux常用命令行
1.2 linux上的常用程序安装
1.3体验:如何在linux上进行虚拟筛选
2.分子动力学的理论介绍
2.1分子动力学模拟的原理
2.2分子动力学模拟的方法及相关程序
2.3相关力场的介绍
3.gromacs使用及介绍
重点:主要命令及参数的介绍
4.origin介绍及使用
第六天
溶剂化分子动力学模拟的执行
1.一般的溶剂化蛋白的处理流程
2.蛋白晶体的准备
3.结构的能量最小化
4.对体系的预平衡
5.无限制的分子动力学模拟
6.分子动力学结果展示与解读
以水中的溶菌酶为例
第七天
蛋白-配体分子动力学模拟的执行
1.蛋白-配体在分子动力学模拟的处理流程
2.蛋白晶体的准备
3.蛋白-配体模拟初始构象的准备
4.配体分子力场拓扑文件的准备
4.1高斯的简要介绍
4.2 ambertool的简要介绍
4.3生成小分子的力场参数文件
5.对复合物体系温度和压力分别限制的预平衡
6.无限制的分子动力学模拟
7.分子动力学结果展示与解读
8.轨迹后处理及分析
以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例
案例图片:
专题二、深度学习基因组学
第一天
理论部分
深度学习算法介绍
1.有监督学习的神经网络算法
1.1全连接深度神经网络DNN在基因组学中的应用举例
1.2卷积神经网络CNN在基因组学中的应用举例
1.3循环神经网络RNN在基因组学中的应用举例
1.4图卷积神经网络GCN在基因组学中的应用举例
2.无监督的神经网络算法
2.1自动编码器AE在基因组学中的应用举例
2.2生成对抗网络GAN在基因组学中的应用举例
实操内容
1.Linux操作系统
1.1常用的Linux命令
1.2 Vim编辑器
1.3基因组数据文件管理, 修改文件权限
1.4查看探索基因组区域
2.Python语言基础
2.1.Python包安装和环境搭建
2.2.常见的数据结构和数据类型
第二天
理论部分
基因组学基础
1.基因组数据库
2.表观基因组
3.转录基因组
4.蛋白质组
5.功能基因组
实操内容
基因组常用深度学习框架
1.安装并介绍深度学习工具包tensorflow, keras,pytorch
2.在工具包中识别深度学习模型要素
2.1.数据表示
2.2.张量运算
2.3.神经网络中的“层”
2.4.由层构成的模型
2.5.损失函数与优化器
2.6.数据集分割
2.7.过拟合与欠拟合
3.基因组数据处理
3.1安装并使用keras_dna处理各种基因序列数据如BED、 GFF、GTF、BIGWIG、BEDGRAPH、WIG等
3.2使用keras_dna设计深度学习模型
3.3使用keras_dna分割训练集、测试集
3.4使用keras_dna选取特定染色体的基因序列等
4.深度神经网络DNN在识别基序特征中应用
4.1实现单层单过滤器DNN识别基序
4.2实现多层单过滤器DNN识别基序
4.3实现多层多过滤器DNN识别基序
第三天
理论部分
卷积神经网络CNN在基因调控预测中的应用
1.Chip-Seq中识别基序特征G4,如DeepG4
2.Chip-Seq中预测DNA甲基化,DeepSEA
3.Chip-Seq中预测转录调控因子结合,DeepSEA
4.DNase-seq中预测染色体亲和性,Basset
5.DNase-seq中预测基因表达eQTL,Enformer
实操内容
复现卷积神经网络CNN识别基序特征DeepG4、非编码基因突变DeepSEA,预测染色体亲和性Basset,基因表达eQTL
1.复现DeepG4从Chip-Seq中识别G4特征
2.安装selene_sdk,复现DeepSEA从Chip-Seq中预测DNA甲基化,非编码基因突变
3.复现Basset,从Chip-Seq中预测染色体亲和性
4.复现Enformer,从Chip-Seq中预测基因表达eQTL
第四天
理论部分
深度学习在识别拷贝数变异DeepCNV、调控因子DeepFactor上的应用
1.SNP微阵列中预测拷贝数变异CNV,DeepCNV
2.RNA-Seq中预测premiRNA,dnnMiRPre
3.从蛋白序列中预测调控因子蛋白质,DeepFactor
实操内容
1.复现DeepCNV利用SNP微阵列联合图像分析识别拷贝数变异
2.复现循环神经网络RNN工具 dnnMiRPre,从RNA-Seq中预测premiRNA
3.复现DeepFactor,从蛋白序列中识别转录调控因子蛋白质
第五天
理论部分
深度学习在识别及疾病表型及生物标志物上的应用
1.从基因表达数据中识别乳腺癌分型的深度学习工具DeepType
2.从高维多组学数据中识别疾病表型,XOmiVAE
3.基因序列及蛋白质相互作用网络中识别关键基因的深度学习工具DeepHE
实操内容
1.复现DeepType,从METABRIC乳腺癌数据中区分乳腺癌亚型
2.复现XOmiVAE,从TCGA多维数据库中识别乳腺癌亚型
3.复现DeepHE利用基因序列及蛋白质相互作用网络识别关键基因
第六天
理论部分
深度学习在预测药物反应机制上的应用
1.联合肿瘤基因标记及药物分子结构预测药物反应机制的深度学习工具SWnet
实操内容
1.预处理药物分子结构信息
2.计算药物相似性
3.在不同数据集上构建self-attention SWnet
4.评估self-attention SWnet
5.构建多任务的SWnet
6.构建单层SWnet
7.构建带权值层的SWnet
案例图片:
专题三、AIDD人工智能药物发现
案例实操图片:
专题四、机器学习代谢组学
案例图片:
专题五、机器学习单细胞转录组表观组学
案例图片:
专题六、CRISPR-Cas9基因编辑技术
全国各大高校、企业、科研院所从事人工智能、生命科学、代谢工程、有机合成、抗体工程、酶工程、 天然产物、蛋白质、药物、生物信息学、植物学 ,动物学、食品、化学化工 , 医学、疾病、机器学习、基因组学、农业科学、植物学、动物学 ,临床医学、食品科学与工程、植物基因组、动物传染病、肿瘤免疫与靶向治疗、全基因组泛癌分析、人黏连蛋白折叠基因组机、有机合成、生物化学、病毒检测、高通量测序、分子生物学、功能基因组、遗传图谱、基因挖掘变异、代谢组学、蛋白质组学、转录组学、生物医学、 转化研究、蛋白质、癌症、核酸、毒物学研究、生物计算、生态、肿瘤、遗传、基 因改造、细胞分化、微生物、生物医学大数据分析与挖掘、数学类专业、计算机科学、 医学、疾病等研究的科研人员以及人工智能爱好者
1、课程特色--全面的课程技术应用、原理流程、实例联系全贯穿
2、学习模式--理论知识与上机操作相结合,让零基础学员快速熟练掌握
3、课程服务答疑--主讲老师将为您实际工作中遇到的问题提供专业解答
授课方式:通过腾讯会议线上直播,理论+实操的授课模式,老师手把手带着操作,从零基础开始讲解,电子PPT和教程开课前一周提前发送给学员,所有培训使用软件都会发送给学员,有什么疑问采取开麦共享屏幕和微信群解疑,学员和老师交流、学员与学员交流,培训完毕后老师长期解疑,培训群不解散,往期培训学员对于培训质量和授课方式一致评价极高!
腾讯会议实时直播解答|手把手带着操作
学员对于培训给予高度评价
学员培训后投顶刊
CADD计算机辅助药物设计
2023.12.23----2023.12.24全天授课(上午9:30-11:30 下午13:30-17:00)
2023.12.25----2023.12.26晚上授课(晚上19:00-22:00)
2023.12.30----2023.12.31全天授课(上午9:30-11:30 下午13:30-17:00)
2024.01.03----2024.01.04晚上授课19:00-22:00)
2024.01.06全天授课(上午9:30-11:30 下午13:30-17:00)
深度学习基因组学
2023.12.23----2023.12.24全天授课(上午9:30-11:30 下午13:30-17:00)
2023.12.30----2023.12.31全天授课(上午9:30-11:30 下午13:30-17:00)
2024.01.06----2024.01.07全天授课(上午9:30-11:30 下午13:30-17:00)
AIDD人工智能药物发现与设计
2023.12.27----2023.12.28晚上授课(晚上19:00-22:00)
2023.12.30----2023.12.31全天授课(上午9:30-11:30 下午13:30-17:00)
2024.01.03----2024.01.04晚上授课(晚上19:00-22:00)
2024.01.06全天授课(上午9:30-11:30 下午13:30-17:00)
机器学习代谢组学
2023.12.25----2023.12.26晚上授课(晚上19:00-22:00)
2023.12.27----2023.12.28晚上授课(晚上19:00-22:00)
2024.01.03----2024.01.04晚上授课(晚上19:00-22:00)
2024.01.06----2024.01.07全天授课(上午9:30-11:30 下午13:30-17:00)
机器学习单细胞转录组表观组学
2023.12.23全天授课(上午9:30-11:30 下午13:30-17:00)
2023.12.30全天授课(上午9:30-11:30 下午13:30-17:00)
2024.01.13----2024.01.14全天授课(上午9:30-11:30 下午13:30-17:00)
2024.01.16----2024.01.17晚上授课(晚上19:00-22:00)
CRISPR-Cas9基因编辑技术
2023.12.25----2023.12.26晚上授课(晚上19:00-22:00)
2023.12.27----2023.12.28晚上授课(晚上19:00-22:00)
2024.01.03----2024.01.04晚上授课(晚上19:00-22:00)
2024.01.06----2024.01.07全天授课(上午9:30-11:30 下午13:30-17:00)
培训费用及福利
课程报名费用:
公费价:每人每班¥5880元 (含报名费、培训费、资料费、提供课后全程回放资料)
自费价:每人每班¥5480元 (含报名费、培训费、资料费、提供课后全程回放资料)
重磅优惠:
报二送一(同时报名两个班免费赠送一个学习名额赠送班任选)
报四送二(同时报名四个班免费赠送两个学习名额赠送班任选)
优惠1:两班同报:9880元
三班同报:13880元
四班同报:17680元
五班同报:21680元
六班同报:24680元
特惠:(28880元可免费学习两整年本单位举办的任意课程)
优惠2:提前报名缴费可享受300元优惠(仅限十五名)
证书:参加培训并通过考试的学员,可以申请获得工业和信息化部工业文化发展中心颁发的“工业强国建设素质素养提升尚工行动”岗位能力适应评测证书。该证书可在中心官网查询,可作为能力评价,考核和任职的重要依据。评测证书查询网址:www.miit-icdc.org(自愿申请,须另行缴纳考试费500元/人)
报名学习课程可赠送往期课程回放(可点击跳转详情链接):
回放一:机器学习生物医学
回放二:机器学习单细胞分析专题
回放三:单细胞空间转录组专题
回放四:比较基因组学专题
回放五:机器学习蛋白组学专题
回放六:机器学习微生物专题
回放七:蛋白质晶体结构解析
等视频回放,需要可咨询下方联系老师
报名联系方式
联系人:陈老师
联系方式:18339237911(微信同号)
QQ:529201149
引用本次参会学员的一句话:
微信扫码关注该文公众号作者