什么是孟德尔随机化研究,如何发表相关SCI?

时间 : 2023-04-24
如果说最近临床科研领域中最火的是什么,除了chatGPT,应该就是孟德尔随机化了,到底什么是孟德尔随机化研究,

 什么是孟德尔随机化

孟德尔随机化(Mendelian randomization,简称MR)是一种基于遗传变异的因果推断方法,其基本原理是利用自然界中的随机分配的基因型对表型的影响来推断生物学因素对疾病的影响。 

在MR中,研究者通过对GWAS(全基因组关联研究)进行分析,找到与生物学因素相关联的基因变异SNP(称为“工具变量”),然后利用这些工具变量来推断生物学因素对疾病的影响。因为基因是随机分配的,而不受混杂因素的影响,因此利用基因变异来研究因果关系可以避免混淆因素对结果的影响,提高了因果推断的可靠性。 

    一个简单的例子

假设我们想知道体重对卒中的影响,但是我们不能直接通过对比肥胖和正常体重人群卒中发生率就说明这种关系。因为除了肥胖,可能还有其他因素导致了卒中,比如肥胖的人可能血压都偏高,可能是高血压引起了卒中。

为了解决这个问题,我们可以利用基因来进行MR分析。通过在GWAS中检索,发现基因A的变异与人们的体重有关,并且与卒中无关,那么基因A就可以作为工具变量。

因为理论上基因A的变异在卒中和非卒中发生的概率是完全随机的,所以,如果发现基因A的变异还是和卒中高度相关,那么就可以推断体重对卒中的影响可能是因果关系,而不是其他因素的混杂效应。

    三个关键的假设条件

通过上面的案例我们不难推断出来,想要实现孟德尔随机化的推理过程,必须要满足三个关键的假设条件。

  • 关联性假设:工具变量与暴露因素之间存在稳定的强相关关系。对应上面的例子就是基因A与体重之间在GWAS中存在强相关性。

  • 独立性假设:工具变量与影响“暴露-结局”关系的混杂因素相互独立。对应案例就是基因A与其他“体重-卒中”的混杂因素相互独立,没有相关性。

  • 排他性假设:遗传因素只能通过“暴露”因素影响结局发生,而不能通过其他途径对结果产生作用。对应案例就是基因A只能通过影响体重来影响卒中,而不能直或间接作用到卒中

图片

    SCI文章的分析流程

利用孟德尔随机化方法撰写论文,分析套路也已经比较标准化,主要流程如下:

1. 确定与体重/卒中的相关SNP
首先需要从公开的GWAS数据库中筛选出与体重和卒中相关的SNP。可以使用现成的在线工具(如MR-Base,MendelianRandomization Package for R等)来检索相关SNP,并记录其效应量和标准误差。
2. 确定工具SNP
从相关SNP中筛选出符合MR假设的工具SNP。具体来说,这些工具SNP需要满足三个条件:与体重(暴露因素)相关,与卒中(结果变量)不相关,且不与任何潜在混杂因素相关。
图片
3. 估计工具SNP与卒中的效应量
利用工具SNP和卒中数据,使用MR分析方法估计工具SNP与卒中的效应量。这里一般采用两阶段最小二乘法(Two-sample Mendelian randomization,2SMR)或借助MR软件(如MendelianRandomization Package for R,MR-Base等)进行分析。估计出来的效应量可用于检验体重对卒中的因果效应。
4. 进行MR分析
使用估计出来的工具SNP与卒中效应量,进行MR分析,计算出体重对卒中的因果效应量(通常为OR或HR)及其置信区间。此处需要注意,MR分析的假设条件需要满足,包括MR假设、双向因果、不会发生反向因果和混杂因素的假设等。
图片
5. 进行敏感性分析
进行敏感性分析,探讨可能的混杂因素或偏倚对结果的影响。例如,可以通过将工具SNP的阈值设为不同的p值来检验结果的稳健性。还可以进行基于Egger回归或MR-Egger方法的因果效应评估,以检验因果效应的鲁棒性。
6. 解释结果
最后,需要解释MR分析的结果。如果体重对卒中的因果效应被证实,就可以认为体重是卒中的潜在因素之一。如果结果不支持因果关系,就需要进一步探讨其他可能的解释,如混杂因素、因果路径中断等。
孟德尔随机化的分析不算难,但是过程比较繁琐,需要掌握一定的编程能力,感兴趣的可以关注一下EasyR软件,我们后期可能会开发MR相关的模块(目前还没有哦)。

 

    孟德尔随机化文献看单

上面就是关于孟德尔随机化的解析了,作为一个重分析、重概念的研究方法,只看这一篇解析肯定是不够的。因此,我们联合pubmed.pro团队整理了39篇孟德尔随机化的文献原文,点击文末“阅读原文”,关注看单,即可在线查看下载全文PDF,我们今后也会动态更新。

图片