开学在即,如何趁假期最后一个月冲击一下10分文章,惊艳整个课题组!
什么?科研经费不够?不会生信?
那我还能抓住时代红利,冲击10分SCI,实现个人梦想吗?
不要慌,肠道菌群加孟德尔随机化轻轻松松秒上10分,简直不要泰裤辣!
大家好,我是闪电,上期带大家解读了一篇系统性红斑狼疮和抑郁症的MR文章(可点击文末往期推荐),是否还记得七步解读法呢?今天继续为小伙伴们分享一篇最近的孟德尔随机化文章,看看孟德尔随机化如何抱肠道菌群“大腿”,轻松发到1区。最近肠道菌群孟德尔随机化热度持续狂飙,堪称蓝海中的蓝海,在pubmed上以“microbiota”(微生物群)和“mendelian randomization”(孟德尔随机化)为关键词进行检索,一共有118篇SCI,光2023年就已经发了65篇,几乎全部是中科院2区及以上,均影响因子超过6分。 图1: 2023年孟德尔随机化的发文量(肠道菌群)近3月以肠道菌群为主题的孟德尔随机化文章都有4篇影响因子≥10,一路浏览下来,几乎全是1、2区。面对如此高性价比的机会,大家一定要把握住!图3: 近3月IF>10的孟德尔随机化研究(肠道菌群)那面对肠道菌群这样的爆点,如何能为己用,快速成文发表呢?接下来闪电带大家学习一下这篇于2023年4月28日发表在《BMC Med》(IF:11.150)上题为《Cross-talks between gut microbiota and tobacco smoking: a two-sample Mendelian randomization study》(肠道微生物群与吸烟之间的交互:两样本孟德尔随机化研究)的文章,如果看完前几期关于孟德尔随机化的推文后,还有疑惑的小伙伴,相信在看完这期文献分享后,会对孟德尔随机化的理解更加深刻。
6种神经递质相关代谢物,包括色氨酸、酪氨酸、苯丙氨酸、谷氨酸、甘氨酸和戊酸
STROBE-MR(加强流行病学-孟德尔随机化观察性研究的报告)注:STROBE-MR(https://www.strobe-mr.org/)本质就是一张清单,上面一共20个项目,从标题摘要到研究设计、统计分析,再到结果、讨论,全流程定义孟德尔随机化研究的写作规范,如果要发影响因子高的期刊,往往会要求提供该表,有余力的小伙伴都可以加上奥,能给文章有效提分哦!
全文分了两部分:图A是单变量孟德尔随机化设计,图B是多变量孟德尔随机化设计第一部分:单变量孟德尔随机化(图A)遵循MR的最基本的3个假设①关联性假设:工具变量(即SNP)必须与暴露因素强相关(P<5×10-8)
②独立性假设:工具变量(即SNP)不能与混杂因素相关
③排他性假设:工具变量(即SNP)必须仅通过暴露影响结果,而不是通过其他途径。
简单来说,就是在单变量孟德尔随机化的基础上,将调整变量(即6种血液代谢物)一同输入方程式,得到的最终效应评估。
肠道菌群(包含211种菌群):
均来自MiBioGen联盟(https://mibiogen.gcc.rug.nl/)(n=18,340),该数据集一共包含211种肠道菌群,从界、门、纲、目、科、属、种去定义一种肠道菌群,该数据集包含了9个门(phyla)、16个纲(class)、20个目(order)、35个科(family)和131个属(genus)。
吸烟表型(一共5项):
①开始吸烟年龄(Age of initiation,连续型变量);
②开始吸烟(Smoking initiation,二分类变量);
③每天吸烟(Cigarettes per day,连续型变量);
④戒烟(Smoking cessation,二分类变量);
⑤终身吸烟(Lifetime smoking,连续型复合变量);
①-④来源于GSCAN财团( https://conservancy.umn.edu/handle/11299/201564 ),而⑤则来源于UK Biobank(目前世界上已建成最全的大规模人类信息资源库)神经递质相关或细菌代谢物表型(一共5项):
①色氨酸;②酪氨酸;③苯丙氨酸;④谷氨酸;⑤甘氨酸;⑥戊酸①-⑥均来自于Shin’s 实验室(https://metabolomics.helmholtz-muenchen.de/)可见,数据均来源于当下样本量相对最大的权威性数据库最新数据统计,全球约有22.3%的人口经常吸烟,且吸烟具有高度遗传性,遗传率约为44%。目前,越来越多研究证实,烟草使用习惯与肠道微生物群组成的改变有关,同时吸烟也能反过来影响肠道菌群。然而,上述结果并不能排除后天混杂因素的影响,同时目前仍缺乏基于大样本人群研究的因果关系证据。首先剔除次要等位基因频率大于0.4的回文变异,然后选取达到全基因组显著水平的SNPs(P<5×10-6),去除连锁不平衡的阈值为r2 < 0.01同时clumping distance = 250 kb。逆方差加权(IVW)方法(金标准,本研究为主方法)基于约束最大似然和模型平均的MR方法(cML-MA,本研究为共同主方法)加权中位数法(weighted median method)MR多效性残差和和异常值方法(MR-PRESSO)TwoSampleMR
MRcML
MendelianRandomization
由于本研究为双向的两样本孟德尔随机化研究,因此吸烟和肠道菌群依次作为暴露和结局,分别进行了两样本孟德尔随机化。
表1:开始吸烟(smoking initiation)对于肠道菌群的影响
注:图中蓝色框代表负相关,红色代表正相关(截取部分表格)对于结果表格,我们首先找到金标准方法(IVW),当Pivw<0.05时,一般认为暴露和结局之间存在因果联系。接着看β值,β>0意味着暴露与结局风险的增加呈正相关。β<0则为负相关。最后再看水平多效性(Horizontal pleiotropy)和异质性(heterogeneity),如果P>0.05则表明结果稳健。
由于结果表格太长,这里仅截取部分,大家可以去原文中进行查看,主要结果如下:
1.吸烟表型(暴露)对于肠道菌群(结局)的影响:
IVW结果显示开始吸烟(smoking initiation)与Intestinimonas[g]的菌群丰度增加,以及Pasteurellales[o]、Pasteurellaceae[f]、Christensenellaceae[f]、ChristensenellaceaeR[g]和Romboutsia[g]等菌群的丰度降低之间存在因果关联。终生吸烟(Lifetime smoking)则与更高丰度的Catenibacterium[g]和更低丰度的RuminococcaceaeNK4A214[g]之间存在因果联系。同时,cML-MA方法估计的结果与IVW的估计结果高度一致,也并不存在异质性和多效性。
2.肠道菌群(暴露)对于吸烟表型(结局)的影响:
IVW结果显示Actinobacteria[p]、Actinobacteria[c]、Bifidobacteriales[o]、Bifidobacteriaceae[f] 和Bifidobacterium[g] 等菌群丰度与每日吸烟量呈负相关(Cigarette per day)。而Actinobacteria[p]、Bifidobacteriales[o]、Bifidobacteriaceae[f]和Bifidobacterium[g]等菌群丰度的增加可能会推迟初始吸烟年龄(age of initiation)。
同时,作者在文中也把主要结果进行了整理(如图6),黑色箭头代表先前的研究,而红色箭头则代表本研究中孟德尔随机化首次发现的证据。 常规的孟德尔随机化分析到这儿基本上就结束了,然而本研究作者考虑到血清代谢物可能会对吸烟与肠道菌群间的因果评估产生影响,而得出错误的结论,再加上脑肠轴可能在肠道菌群与吸烟表型间起到了重要作用。因此作者随后找到了六种神经递质相关代谢物(色氨酸,酪氨酸,苯丙氨酸,谷氨酸,甘氨酸和戊酸),进行多变量的孟德尔随机化分析。表2-1: 多变量孟德尔随机化(同时调整6个变量)
图注:①暴露因素(菌群);②结局事件(吸烟表型);③多变量孟德尔随机化的调整因素,(一次只单独调整一种代谢物);④多变量孟德尔随机化方法(包含IVW和Egger2种);⑤风险效应:beta>0,正相关;beta<0,负相关;⑥标准差;⑦检验P值:P<0.05,具有统计学意义;⑧水平多效性检验(Egger截距法):P>0.05,说明不存在水平多效性。
首先,作者对这6种代谢物同时进行了调整后,多变量孟德尔显示多数结果仍然稳健(表2-1),然而放线菌(Actinobacteria[c],P = 0.242)和消化球菌(Peptococcus[g]:P = 0.502)与终生吸烟风险效应的关联性显著减弱(即P值变化明显,统计学意义发生改变),同时效应值的绝对值较调整前也略有降低。接下来作者对这2个菌群进行深入挖掘,探究到底是对哪几个代谢物的调整,导致该关联性显著减弱,同时也是全文最精彩的部分。 表2-2: 多变量孟德尔随机化(一次只调整一个代谢物)
图注:①暴露因素(菌群);②结局事件(吸烟表型);③多变量孟德尔随机化的调整因素,(一次只单独调整一种代谢物);④多变量孟德尔随机化方法(包含IVW和Egger2种);⑤风险效应:beta>0,正相关;beta<0,负相关;⑥标准差;⑦检验P值:P<0.05,具有统计学意义;⑧水平多效性检验(Egger截距法):P>0.05,说明不存在水平多效性
在这里作者结合了中介孟德尔随机化的思路,做了一个堪称教科书级别的操作。特意针对放线菌(Actinobacteria[c])和消化球菌(Peptococcus[g])再次进行多变量孟德尔随机化,但不同的是,这次作者是对6种代谢物依次单独进行调整,即一次只调整一种代谢物。结果发现,针对色氨酸、酪氨酸和戊酸单独调整后的关联性显著减弱(即P值增大,统计学意义改变),意味着这3种氨基酸驱动了微生物群对吸烟表型的潜在代谢依赖机制(换句话说,肠道菌群可能通过这3种氨基酸来影响吸烟表型)因此,最后作者结合其他研究,作出稳健推测:色氨酸、酪氨酸和戊酸可能在Actinobacteria[c]和Peptococcus[g]菌群对终身吸烟的影响中起到重要作用。这一步不少小伙伴可能会有疑问,这里实际隐藏着中介孟德尔的思路,在之后推文中我们会再详细介绍。 图7: (多变量)孟德尔随机化结果与相关临床研究对比本研究是最新发表的两样本孟德尔随机化分析,套路成型易上手,分析流程清晰明了,规矩中暗含着创新作者首次创新性的揭示了肠道菌群和吸烟之间的双向因果关系,数据量大,来源权威。不仅蹭到了肠道菌群的热点,而且选题idea新颖,同时也为我们的未来选题提供了思考方向。
本研究在常规的IVW结果外,加入了cML-MA方法,属于方法上的创新。此外,作者从临床实际出发,考虑到了常见代谢物的干扰,从而进行了多变量的孟德尔随机化方法,结果更加详实,设计全面,也为文章增分不少。在多变量孟德尔随机化分析结果中,对于调整变量后不再具备统计学差异的菌群,大家的选择往往是放弃掉,不写入结果与讨论。然而作者另辟蹊径,融入部分中介孟德尔的思路,反其道而行之,逐一调整变量,筛选出了在其中起到关键作用的代谢物,思路十分值得学习,以上这些因素叠加一起,使得本研究能冲上10分。如果小伙伴想要复现的话,会发现神经递质相关或细菌代谢物表型的GWAS网址已失效Shin’s实验室(https://metabolomics.helmholtz-muenchen.de/)不用担心奥!其实在mrcieu数据库(https://gwas.mrcieu.ac.uk/datasets)中也可以找到奥。撰文丨闪 电
审核丨 暁
排版丨阿 洛