仙桃学术 | 生信怎么加湿实验?手把手教你4+干湿结合零代码复现
各位小伙伴大家好我是Mira~又来跟大家分享生信文章零代码复现啦~今天我们分享的文章也是刚出炉不久,热乎的,而且充满了仙桃风!
文章题目是:《Expression characteristic, immune signature, and prognosis value of EFNA family identified by multi-omics integrative analysis in pan-cancer》,2022年发表在《BMC Cancer》上,影响因子4.43分。这是一篇干湿结合的文章,很多小伙伴还对生信文章怎么加湿实验有点疑惑,这一篇就是很好的示范~
一、期刊简介
二、使用工具
仙桃学术https://www.xiantao.love
HPA((Human Protein Atlas) https://www.proteinatlas.org
STRING
https://www.string-db.org/
GSCA数据库http://bioinfo.life.hust.edu.cn/web/GSCALite/)
TISIDB数据库
http://cis.hku.hk/TISIDB/index.php
Cbioportal数据库
https://www.cbioportal.org
Timer2.0数据库
http://timer.cistrome.org/
三、复现步骤
Fig1 EFNA家族的功能预测高度相关。EFNA1,EFNA2,EFNA3,EFNA4
先来看图1A,EFNA家族在泛癌中的表达相关性分析。分子相关性分析,上仙桃。
找到“分子相关性分析”的“相关性热图”,仙桃云分析里目前还没有泛癌的数据,咱们就随手选一个癌种,把分子输入进去,按照上图设置一遍,直接出图:
这里我选的结直肠癌,大家就选择自己研究的癌种就行啦~
再来看图1B,PPI网络,String数据库大家应该都非常熟悉了吧~上!
点击Search,
按照如上,填入分子后再点击Search:
得到结果。这里我已经选择最低的可信度了,但是还是只得到5个分子间相互关联,所以就算是同样的分子,同样的数据库,不同时间去分析都还是会有不同的结果,大家复现文章的时候也不必纠结于完全复现,重在掌握方法~
但是咱们文章里String数据库得到的这个图是不太能直接用的,接下来我们就来美化一下~首先下载结果文件。
只需要前两列,后面的都可以删掉。然后进入仙桃,找到“高级网络图”
上传我们整理好的文件,选好图片类型
就是这样了,跟文中的预测结果有很大出入,由于作者并没有描述PPI网络构建的具体信息,咱们也只能复现到这种程度了,还是掌握方法~
接下来图1C,作者对PPI网络中的分子进行了GO/KEGG富集分析,这里因为我没有得到其他的分子,直接用作图1B中展示的基因进行分析。继续上仙桃~
选择GO/KEGG富集分析,填入分子,确定
分析完成后保存结果
进入可视化模块,选择本次分析结果(注意不要选错啦~),选气泡图
图1完成!
来看图2
EFNA家族在泛癌中的表达
图2整个都是EFNA家族在泛癌中的表达差异,来看A图~先进入GSCALite数据库:
按照红框中选择,填好分子,选择好癌中和研究内容,这次咱们是研究这五个基因在所有肿瘤中的表达情况,开始分析
分析完成后就可以找到左边功能模块里的TCGA mRNA基因表达分析的模块,页面下拉
酱酱,泛癌表达差异图就出来啦~
咱们再来复现图2B,以EFNA1为例,还是仙桃:
选择“配对样本”,泛癌,填入分子,确认
其他四个兄弟再每个来一遍,就能得到图2B啦
之后的蛋白表达结果是HPA数据库中得到的
以EFNA1为例:
选择Pathology
结果页面下拉就能找到EFNA1蛋白在不同癌症中的表达情况~
图3 泛癌中EFNA家族的变异和DNA甲基化。
来看图3A,直接进入cbioportal,
选择泛癌,按基因查找
我们要分析的是突变数据,输入分子,提交
选择EFNA1为例
就得到啦~其他的分子也是一样的~
接下来是B图,先进入GSCA数据库
选择突变分析,填入分子,选择所有癌症,最后勾选需要分析的内容
就能看见结果啦,首先是CNV信息,就是右边那张图
这就是B图
然后是甲基化的图
点击可下载,这就是C图
接下来是甲基化差异,右边的小图可以直接作为结果使用,也可以下载左边的表格自己进行可视化,这就是图3D啦~
然后是图4: 泛癌中EFNA家族表达与肿瘤微环境的相关性分析。
这个图虽然仙桃暂时还不能零代码直接得到,但是这三个评分咱们可以先用仙桃算出来:
在免疫浸润模块选择散点图,以EFNA1为例,选好三个评分,确认
可以在结果的部分得到每个评分的相关系数,每一个癌症中做一遍,这个基因的三个评分在癌症中的相关性就能得到啦
最后手动整理一下,可以在仙桃的相关性热图里进行可视化,虽然麻烦一点,但是也还是不需要用到代码~
接下来是图5: EFNA家族的肿瘤浸润免疫细胞。
这个图就是用Xcell和Timer两种算法对EFNA基因家族与免疫细胞浸润进行分析。零代码的免疫分析咱们可以利用Timer2.0:
选择免疫相关的基因模块
以EFNA1为例,选好免疫细胞,提交分析:
分析完成后下载结果:
就可以得到这样的图,这里面就有基因在每个癌症以及每个细胞的多种算法集合,大家可以根据Table结果进行可视化~
然后图6
图六咱们零代码还暂时没法完成。但是这里A图用到的分型来自TISIDB数据库:
填好分子后:
以EFNA1为例:
选择subtype
就可以看到这6种免疫亚型了,文章就是根据这个结果分析的~
之后的EFNAs表达与RNAss/DNAss肿瘤干度之间的相关性分析以及雷达图显示EFNA表达式与TMB/MSI之间的相关性暂时应该还没法零代码完成,可以催催仙桃后台小哥哥~
最后图7, EFNA家族在癌症中的临床价值
图A和B是基因表达泛癌中与每个癌症OS/DFI/PFI的关系。这个咱们暂时也不能一件出图,但是有了仙桃,咱们也只是需要整理一下数据而已~
在预后分析的KM曲线图里,1⃣️EFNA1为例,三种预后指标的计算都有,我们以OS为例:
就能得到基因在癌症中的HR值
同样重复做几次,把得到的HR值整理一下,就可以到“表达差异”的热图板块可视化了~
C图之后是在肺腺癌中的分析,仙桃痕迹非常明显~
先来C图,直接上仙桃:
在ROC板块里,选择肺腺癌TCGA联合GTEx的数据,选好5个分子
图就来啦~
D图是GEO数据集的生存曲线,这个虽然不能一键出,但是大家下载好这三个数据集的临床信息,然后找到基础绘图的生存曲线部分:
如果不知道需要把数据整理成什么样,可以查看教程文档:
就这样,就能做图啦~
E图:nomogram。这里作者只用了EFNA5,结合临床数据
在预后列线图模块,选择肺腺癌,EFNA5,以及临床分期等,跟文章一样:
加上预测年限
出图~
F图,Calibration校准曲线,废话不说直接仙桃:
找到预后calibration分析
选择肺腺癌,选好分子和临床信息,预测时间
等待结果
在Calibration可视化模块:
选好刚才的分析:
直接出图~不得不说这个校准度结果非常的nice!与理想的线非常接近!
生信部分最后一张森林图!EFNA5在不同亚族中的生存分析,这个图也可以通过整理数据在仙桃零代码得到:
就以性别为例:
在亚组KM曲线中选择上图选项
就可以得到该基因在女性中的HR值等数据
照着文章的每个分组做一遍,把得到的结果整理成下面这样:
然后到基础绘图的森林图模块:
上传文件就可以啦~
虽说本篇文章生信部分有一些图不用代码还是有点工作量,得重复很多遍操作,整理数据,但是,对于没有代码基础的小伙伴,这些只需要花一些机械的时间去整理,对很多小伙伴来说不会有学代码需要的那么多时间成本。所以虽说不会代码,用好数据库和分析工具,也一样可以做出复杂又美观的图片~
接下来就是基础实验了:
作者做了哪些湿实验呢?
作者只选择了EFNA5,在细胞中验证了表达差异,做了western blot、免疫组化、RT-qPCR,并收集了临床标本进行生存分析。其实就是一些基础的分子表达差异验证,所以大家想要干湿结合也不用迷茫,干为主的文章咱们就验证一下基因表达即可~
扫描下方二维码
回复“生信”免费邀您进入【复现营】(名额有限)
开启高质量零代码复现教学!
微信扫码关注该文公众号作者