2分+非肿瘤生信文章全文复现,6张图满满干货!
大家好,我是猕猴桃。今天我们带来一篇最新发表的2分+非肿瘤生信文章的全文复现,满满干货!话不多说,直奔主题。题目是:
于2022年发表,最新的影响因子2.70。
通过生物信息学分析探究皮肤利什曼病潜在hub genes
思路:
通过将数据集GSE55664和GSE63931进行清洗,获得DEGs(|logfc|>2 padj<0.05)获得差异表达基因,进行GOKEGG及GESA富集分析。通过string数据库获得蛋白互作网络。通过Cytoscape软件从蛋白相互作用(PPI)网络中鉴定了前10个枢纽基因(MCC算法)。并浸润免疫浸润分析,以及hub gene与免疫细胞的相关性。
使用工具:
1,仙桃生信工具(https://www.xiantao.love/login)
2,String数据库(https://cn.string-db.org/)
3,Cibersortx(cibersortx.stanford.edu)
Figure2差异分析及hub gene的筛选
仙桃生信-数据集检索
将数据集ID输入到检索栏
样本界面选择样本
将样本为了参考组实验组。提交分析。
等待分析结果完成
差异分析结果
火山图
热图
将两个数据集的差异分析|logfc|>2 p<0.05筛选后,分别上调下调交集。
分别将上调和下调取交集(为了防止某基因再一个数据集是上调,再另一个数据集是下调则会中情况)
整理好两列后
基础绘图-韦恩图
这里展示的是四列数据的韦恩图,如果是两列数据为两个圆形。
Figure3GOKEGG
功能聚类-GOKEGG分析
将两个数据集交集的DEGs复制到分子列表
结果下载(一定要保存结果,才可进行可视化)
筛选pvalue<0.25 padjust<0.05,筛选明星通路(比如IL开头等)
保存结果后会保存到云端
将选好的功能或通路复制到ID列表
E-G,GSEA经典可视化
将第一步中差异分析的结果整理
选出gene和logfc
功能聚类-GSEA富集分析
可以选择基因集和分析参数
提交到历史记录查看
筛选pvalue<0.25 padjust<0.05,筛选明星通路(比如IL开头等)
功能聚类-经典可视化
将选好的通路复制到ID列表
结果下载
Figure4ppi互作网络及hub gene的一维柱状图
使用string数据库
将获得的DEGs
下载TSV格式的
将STRING下载的文件上传到cytoscape
再APPs栏下载cytohubba插件
选择算法top多少基因,可以5 10等等
展示MCC算法top10
将关键基因的表达量对应分组整理再一个新的表格
基础绘图-分组比较图
将整理的文件上传
Figure5免疫浸润
PAC图
表达差异-PCA图
将对应的分组添入表达矩阵第一行
上传数据调整参数
接下来使用cibersortx在线分析数据库(需要注册登录)
Upload files(上传文件,注意文件txt格式,大小100mb以内比较好,上传文件有0容易保存)
添加文件
上传后回到主页RUN
选择LM22及上传的文件
等待分析
结果下载
回到仙桃生信工具
交互网络-相关性热图
上传在线分析下载的结果
调整参数
整理数据
将样本名对应到分组
基础绘图-分组比较图
上传文件调整参数
结果下载
Figure6免疫细胞相关性分析
交互网络-棒棒糖图
选择免疫细胞
结果下载
微信扫码关注该文公众号作者