2023国自然医学领域研究热点:[IF37] 基础科研人员发高分文献
科研背景
细胞生物学的相关研究一直受限于数据的完整性和表型的完整性,对应激状态和稳态下的细胞区别观察不够充分。过去五年中,计算机视觉和语音识别领域通过对大量的无标签数据进行学习、建模,很好的解决了数据不足的问题。同样在最近的研究中,机器学习方法使用单细胞数据进行扰动建模也推动了细胞生物领域前进。对于生物学家来讲,无论研究基因、转录本、修饰、蛋白功能,都要频繁的进行人为干预,实现对感兴趣变量的正向或者反向改变,观察细胞表型的变化。整个过程需要对干预工具的构建、导入、实验观察,从而得出表型结论。扰动建模的目的就是想要通过数学模型的建立,通过对已有数据的分析、归纳和总结,对一个分子的功能在没有实验时做出预判,对于生物学家和药物研发者来讲,好的模型一定能够帮助加深对生物机制的理解,推动药物的研发进程
“单细胞多组学技术”和“空间转录组技术”先后在2019年和2020年被Nature Methods评为年度技术方法。时间和空间维度多维研究技术结合,将以全新研究思路出发,既能够获得单个细胞间异质性,又能获得细胞在组织空间上的结构位置信息,发现更多未知且精细化结果。总而言之,单细胞测序+空间转录组测序:优势互补,同时获得细胞类型群体,以及基因表达和细胞的空间位置信息。空间转录组能够定位和区分功能基因在特定组织区域内的活跃表达,为研究和诊断提供宝贵见解。10x Visium 的推出使空间转录组成为了新的研究热点,受到广大研究者的青睐,其不仅可以提供研究对象的转录组等数据信息,同时还能定位其在组织中的空间位置,这对于癌症发病机制、神经科学、发育生物学等众多领域的研究都有重要意义。
深度学习已经被广泛应用于基因组学研究中,利用已知的训练集对数据的类型和应答结果进行预测,深度学习,可以进行预测和降维分析。深度学习模型的能力更强且更灵活,在适当的训练数据下,深度学习可以在较少人工参与的情况下自动学习特征和规律。调控基因组学,变异检测,致病性评分成功应用。深度学习可以提高基因组数据的可解释性,并将基因组数据转化为可操作的临床信息。深度学习通过强大的深度神经网络模型从高维大数据中自动挖掘数据潜在特征得以实现,过去10年,深度学习在计算机视觉、语音识别、自然语言处理领域取得了巨大成功。基因组学大数据与疾病表型间的复杂关系难以解析,运用深度学习挖掘多组学数据探索复杂疾病致病机制及药物反应机制将会极大的提升精准医学和转化医学的进度。,近两年国内外顶尖课题组MIT、Harvard University、UPenn、清华大学、复旦大学等都在从事深度学习基因组学的研究,这一研究成果更是多次发表在Nature Reviews Genetics、Nature Methods、Science Advances、Cancer Cell、Nature Biotechnology 等知名国际顶刊上,为我们发表顶刊鉴定了基础。
比较基因组学(Comparative Genomics)利用模式生物基因组与人类基因组之间编码顺序上和结构上的同源性,克隆人类疾病基因,揭示基因功能和疾病分子机制,阐明物种进化关系,及基因组的内在结构。比较不同物种的整个基因组,增强对各个基因组功能及发育相关性的认识。比较不同物种的整个基因组,增强对各个基因组功能及发育相关性的认识。比较基因组学分析已成为生物学尤其是遗传学相关研究的重要手段。通过对生物基因组上遗传信息的挖掘与研究能够促进对不同生物具有的生物学形状下的遗传机制差异、性状演化历史等生物学问题进行深入的了解与研究。
由于学习平台文献、视频教程资料较少,技术不公开,对于有相应科研任务和发高质量文章的科研人员极度困扰,而培训学习迫在眉睫, 应广大科研人员要求,本单位经过数月调研,决定联合专家共同举办“机器学习单细胞分析+单细胞空间转录组+深度学习基因组学+比较基因组学”专题培训班,本单位已经举办十一期培训,参会人员高达1200余人,对于培训安排和培训质量一致评价极高 !将内容全部学懂、学会、学透彻、学以致用,完成科研任务和高质量文章!
一、 本课程让初学多组学联合机器学习体系课程的学员们快速掌握多组学以及机器学习基础理论和在单细胞数据分析中的简单应用。适用于前期无编程基础,对机器学习,包括深度学习和单细胞数据分析感兴趣的学员。同时在帮助学员提升与掌握多组学联合分析以及深度学习神经网络的应用。课程通过基础入门+进阶实例演练的讲授思路,从初学及应用研究角度出发,带大家实战演练机器学习在单细胞多组学整合分析中的数据处理、预测模型以及生物学意义阐述等,助力大家掌握多种机器学习算法模型的构建以及在单细胞多组学联合分析在具体科学研究中的实际应用,并介绍当下深度学习算法高维组学数据处理,生物网络挖掘的前沿方法,有助于研究创新机器学习算法解决生物学及临床疾病问题与需求。
二、 适于对深度学习、基因组学、转录组学、蛋白组学、药物基因组学等多组学分析感兴趣的学员。课程通过基础入门+应用案例实操演练的方式,从初学及应用研究的角度出发,带大家实战演练多种深度学习模型(深度神经网络DNN、卷积神经网络CNN、循环神经网络RNN、可变自动编码器VAE、图卷积神经网络GCN)通过对这些深度学习在基因组学中的应用案例进行深度讲解和实操,让学员能够掌握深度学习分析高维基因组学、转录组学、蛋白组学等多组学数据流程,系统学习深度学习及基因组学理论知识及熟悉软件代码实操,熟练掌握这些前沿的分析工具的使用以及研究创新深度学习算法解决生物学及临床疾病问题与需求。
刘老师,生物信息学博士,有十余年的测序数据分析经验。研究领域涉及人工智能、自然语言处理、功能基因组学、转录组学、miRNA及靶基因网络分析,单细胞测序数据分析,基因调控网络时序分析,蛋白质互作网络分析,多组学联合分析等。主持省自然科学基金等项目4项,出版医学实用教材《Python医学实战分析》,发表SCI论文22篇,其中一作及并列一作9篇。
主讲老师来自中山大学海洋生物学博士三亚市引进人才,近6年来主要从事动植物基因组、转录组和重测序相关的分析研究工作,尤其关注鱼类适应性演化相关研究。已在Science of The Total Environment、Fish andShellfish lmmunology、BMC genomics等专业期刊发表论文10余篇。
主讲老师来自国内高校陈老师和张老师授课。在国内外学术刊物发表论文数篇,包括Nature Communication, Cell Regeneration等知名期刊,研究方向为生物信息学,发育生物学和遗传学等。利用多组学数据,通过深度学习算法进行数据分析和挖掘,包括ChIP-seq,ATAC-seq,RNA-seq,CNV等。
第一天
深度学习算法介绍
理论内容:
1.有监督学习的神经网络算法
1.1全连接深度神经网络DNN在基因组学中的应用举例
1.2卷积神经网络CNN在基因组学中的应用举例
1.3循环神经网络RNN在基因组学中的应用举例
1.4图卷积神经网络GCN在基因组学中的应用举例
2.无监督的神经网络算法
2.1自动编码器AE在基因组学中的应用举例
2.2生成对抗网络GAN在基因组学中的应用举例
实操内容
1.Linux操作系统
1.1常用的Linux命令
1.2 Vim编辑器
1.3基因组数据文件管理, 修改文件权限
1.4查看探索基因组区域
2.Python语言基础
2.1.Python包安装和环境搭建
2.2.常见的数据结构和数据类型
第二天
基因组学基础
理论内容
1.基因组数据库
2.表观基因组
3.转录基因组
4.蛋白质组
5.功能基因组
实操内容
基因组常用深度学习框架
1.安装并介绍深度学习工具包tensorflow, keras,pytorch
2.在工具包中识别深度学习模型要素
2.1.数据表示
2.2.张量运算
2.3.神经网络中的“层”
2.4.由层构成的模型
2.5.损失函数与优化器
2.6.数据集分割
2.7.过拟合与欠拟合
3.基因组数据处理
3.1安装并使用keras_dna处理各种基因序列数据如BED、 GFF、GTF、BIGWIG、BEDGRAPH、WIG等
3.2使用keras_dna设计深度学习模型
3.3使用keras_dna分割训练集、测试集
3.4使用keras_dna选取特定染色体的基因序列等
4.深度神经网络DNN在识别基序特征中应用
4.1实现单层单过滤器DNN识别基序
4.2实现多层单过滤器DNN识别基序
4.3实现多层多过滤器DNN识别基序
第三天
卷积神经网络CNN在基因调控预测中的应用
理论内容
1.Chip-Seq中识别基序特征G4,如DeepG4
2.Chip-Seq中预测DNA甲基化,DeepSEA
3.Chip-Seq中预测转录调控因子结合,DeepSEA
4.DNase-seq中预测染色体亲和性,Basset
5.DNase-seq中预测基因表达eQTL,Enformer
实操内容
复现卷积神经网络CNN识别基序特征DeepG4、非编码基因突变DeepSEA,预测染色体亲和性Basset,基因表达eQTL
1.复现DeepG4从Chip-Seq中识别G4特征
2.安装selene_sdk,复现DeepSEA从Chip-Seq中预测DNA甲基化,非编码基因突变
3.复现Basset,从Chip-Seq中预测染色体亲和性
复现Enformer,从Chip-Seq中预测基因表达eQT
第四天
深度学习在识别拷贝数变异DeepCNV、调控因子DeepFactor上的应用
理论内容
1.SNP微阵列中预测拷贝数变异CNV,DeepCNV
2.RNA-Seq中预测premiRNA,dnnMiRPre
3.从蛋白序列中预测调控因子蛋白质,DeepFactor
实操内容
1.复现DeepCNV利用SNP微阵列联合图像分析识别拷贝数变异
2.复现循环神经网络RNN工具 dnnMiRPre,从RNA-Seq中预测premiRNA
复现DeepFactor,从蛋白序列中识别转录调控因子蛋白质
第五天
深度学习在识别及疾病表型及生物标志物上的应用
理论内容
1.从基因表达数据中识别乳腺癌分型的深度学习工具DeepType
2.从高维多组学数据中识别疾病表型,XOmiVAE
3.基因序列及蛋白质相互作用网络中识别关键基因的深度学习工具DeepHE
实操内容
1.复现DeepType,从METABRIC乳腺癌数据中区分乳腺癌亚型
2.复现XOmiVAE,从TCGA多维数据库中识别乳腺癌亚型
复现DeepHE利用基因序列及蛋白质相互作用网络识别关键基因
第六天
深度学习在预测药物反应机制上的应用
理论部分
联合肿瘤基因标记及药物分子结构预测药物反应机制的深度学习工具SWnet
实操内容
预处理药物分子结构信息
计算药物相似性
在不同数据集上构建self-attention SWnet
评估self-attention SWnet
构建多任务的SWnet
构建单层SWnet
构建带权值层的SWnet
机器学习微生物
第一天
机器学习及微生物学简介
1. 机器学习基本概念介绍
2. 常用机器学习模型介绍(GLM,BF,SVM,lasso,KNN等等)
3. 混淆矩阵
4. ROC曲线
5. 主成分分析(PCA)
6. 微生物学基本概念
7. 微生物学常用分析介绍
R语言简介及实操
1.R语言概述
2.R软件及R包安装
3.R语言语法及数据类型
4.条件语句
5.循环
第二天
机器学习在微生物学中的应用案例分享
1.利用机器学习基于微生物组学数据预测宿主表
2.利用机器学习基于微生物组学数据预测疾病状态
3.利用机器学习预测微生物风险
4.机器学习研究饮食对肠道微生物的影响
微生物学常用分析(实操)
1. 微生物丰度分析
2. α-diversity,β-diversity分析
3. 进化树构建
4. 降维分析
5. 基于OTU的差异表达分析,热图,箱型图绘制微生物biomarker鉴定
第三天(实操)
零代码工具利用机器学习分析微生物组学数据
1. 加载数据及数据归一化
2. 构建训练模型(GLM, RF, SVM)
3. 模型参数优化
4. 模型错误率曲线绘制
5. 混淆矩阵计算
6. 重要特征筛选
7. 模型验证,ROC曲线绘制利用模型进行预测
第四天(实操)
利用机器学习基于微生物组学数据预测宿主表型(二分类变量以及连续变量)
1. 加载数据(三套数据)
2. 数据归一化
3. OUT特征处理
4. 机器学习模型构建(RF, KNN, SVM, Lasso等9种机器学习方法)
5. 5倍交叉验证
6. 绘制ROC 曲线,比较不同机器学习模型模型性能评估
第五天(实操)
利用机器学习预测微生物风险(多分类)
1. 加载数据
2. 机器学习模型构建(RF, gbm, SVM, LogitBoost等等)
3. 10倍交叉验证
4. 模型性能评估
利用机器学习预测刺激前后肠道菌群变化
1. 数据加载及预处理
2. α-diversity,β-diversity分析
3. RF模型构建(比较分别基于OUT,KO,phylum的模型效果)
4. 10倍交叉验证, 留一法验证
5. 特征筛选及重要特征可视化外部数据测试模型
04
机器学习单细胞分析
2023.03.11----2023.03.12全天授课(上午 09.00-11.30 下午 13.30-17.00)
2023.03.18----2023.03.19全天授课 (上午 09.00-11.30 下午 13.30-17.00)
2023.03.25----2023.03.26全天授课(上午 09.00-11.30 下午 13.30-17.00)
单细胞空间转录组
2023.03.18----2023.03.19全天授课 (上午 09.00-11.30 下午 13.30-17.00)
2023.03.25----2023.03.26全天授课 (上午 09.00-11.30 下午 13.30-17.00)
深度学习在基因组学培训时间
2023.03.23----2023.03.24晚上授课 (晚上 19.00-22.00)
2023.03.25----2023.03.26全天授课(上午 09.00-11.30 下午 13.30-17.00)
2023.04.02----2023.04.03晚上授课 (晚上 19.00-22.00)
2023.04.04----2023.04.05全天授课(上午 09.00-11.30 下午 13.30-17.00)
比较基因组学培训时间
2023.03.18----2023.03.19全天授课 (上午 09.00-11.30 下午 13.30-17.00)
2023.03.25----2023.03.26全天授课(上午 09.00-11.30 下午 13.30-17.00)
机器学习微生物
2023.03.18----2023.03.19全天授课(上午09.00-11.30下午13.30-17.00)
2023.03.21---2023.03.22晚上授课(晚上19.00-22.00)
2023.03.25----2023.03.26全天授课(上午09.00-11.30下午13.30-17.00)
(腾讯会议直播上课 线上实操,提供录像回放 录像永久观看)
机器学习单细胞分析;深度学习基因组学
公费价:每人每班¥5880元 (含报名费、培训费、资料费)
自费价:每人每班¥5480元 (含报名费、培训费、资料费)
单细胞空间转录组; 比较基因组学 机器学习微生物
公费价:每人每班¥4680元 (含报名费、培训费、资料费)
自费价:每人每班¥4480元 (含报名费、培训费、资料费)
优惠
优惠1:两班同报:9880元 三班同报:13880元 四班同报:17880元
优惠2:提前报名缴费学员+转发到朋友圈或者到学术交流群可享受每人300元优惠(仅限15名)
优惠3:同时报名两个班免费赠送一个学习名额(赠送班任选)
优惠4: 报名五个培训班以上,免费赠送三个培训名额(赠送班任选)
证书:参加培训并通过考试的学员,可以申请获得工业和信息化部工业文化发展中心颁发的“工业强国建设素质素养提升尚工行动”岗位能力适应评测证书。该证书可在中心官网查询,可作为能力评价,考核和任职的重要依据。评测证书查询网址:www.miit-icdc.org(自愿申请,须另行缴纳考试费500元/人)
报名缴费成功赠送报名班型全套预习视频,课后学习完毕提供全程录像视频回放,针对与培训课程内容 进行长期答疑,微信解疑群永不解散,参加本次课程的学员可免费再参加一次本单位后期组织的相同的 专题培训班(任意一期都可以)
通过腾讯会议线上直播,理论+实操的授课模式,老师手把手带着操作,从零基础开始讲解,800余页电子PPT和教程+预习视频开课前一周提前发送给学员,所有培训使用软件都会发送给学员,有什么疑问采取开麦共享屏幕和微信群解疑,学员和老师交流、学员与学员交流,培训完毕后老师长期解疑,培训群不解散,往期培训学员对于培训质量和授课方式一致评价极高
腾讯会议问题实时解答
(二)学员对培训非常认可,而且我们保证二次学习是免费的
联系人:周老师
电话: 18071419317
对此内容感兴趣可点击关注公众号!长期发布各种科研培训,及前沿资讯!
往期学员参会单位及报名流程
国外院系高校;有来自麻省理工大学、University of Bristol (布里斯托大学)、加州伯克利大学、Osaka University(大版大学)、乔治梅森大学、加州理工大学、曼彻斯特大学 、莱斯大学、波士顿大学、德州 农工大学、德雷克大学、美国联合大学、普林斯顿大学、斯坦福大学、Imperial College London、 KAUSTuniversity、理海大学、TheUniversityofQueensland、澳大利亚昆士兰大学、耶鲁大学、牛 津大学、剑桥大学、匹兹堡大学、悉尼大学、多伦多大学、西雅图华盛顿大学、伦敦大学、杜克大学、东 京大学、哥伦比亚大学、康奈尔大学、纽约大学、西北大学、布朗大学、华盛顿大学
国内院系高校;有来自中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所)、中山大 学、北京大学第一医院、中国医学科学院北京协和医院、西北民族大学、西南大学、山东大学、加州伯克 利大学、启元实验室、中国人民解放军总医院第一医学中心、河南师范大学、南京工业大学、南方科技大 学、南京大学、中国医学科学院基础医学研究所、青海省农林科学院、天津中医药大学第一附属医院、山东大学、黑龙江八一农垦大学、南昌大学第二附属医院、台州市中心医院(台州学院附属医院)、宁波大 学附属人民医院、新疆农业大学、北京林业大学、广西医科大学、湖南文理学院、滨州医学院、滨州医学 院烟台附属医院、华南师范大学、中国环境科学研究院、云南师范大学、昆明理工大学、湖北医药学院、 苏州大学、福州大学、南方医院、南昌大学第二附属医院、深圳市中医院、湖南文理学院、河南科技学 院、福建省立医院、中南大学湘雅医院、深圳市中医院、省立同德医院、内蒙古科技大学包头师范学院、 乌鲁木齐市疾病预防控制中心、中国林业科学研究院林业研究所、中国农业科学院兰州畜牧与兽药研究 所、鲁东大学、河北工程大学、南方医科大学珠江医院、首都医科大学附属北京妇产医院、重庆医科大学 附属第二医院、北京普利智诚生物技术有限公司、复旦大学上海医学院、陕西中医药大学附属医院、中国 医学科学院血液病医院(中国医学科学院血液学研究所)、滨州康达欣医疗器械有限公司、深圳北京大学 香港科技大学医学中心、天津市肿瘤医院、陆军特色医学中心、空军军医大学第一附属医院、江南大学、 中国科学院深圳先进技术研究院、中国科学院上海营养与健康研究所、北京阅众时刻文化传媒有限公司、 北京慧康健怡医疗器械有限公司、杭州奥明基因科技有限公司、亦欣生物科技无锡有限公司、广州市肖悦 生物科技有限公司、张家口泽涵生物科技有限公司、平安科技。感谢对我们培训的认可!还有许多因为时 间冲突无法参加。这次我们诚挚邀请您来参加!
报名参会流程
引用往期参会学员的一句话:
非常感谢各位对我们培训的认可! 祝愿各位学业事业有成!
Hanson声明:本培训由第三方提供
微信扫码关注该文公众号作者