上海锐翌生物科技有限公司

服务电话:021-51001612

邮箱:support@realbio.cn

技术课堂

多重假设检验在宏基因组研究领域的应用
发布时间:2018-03-20 11:38   点击率:
目前,在宏基因组学研究领域,很多研究人员会通过非参数检验来找出有显著性差异的物种。通常,物种间是否具有显著性差异,一般会通过比较P值与P值阈值来判断。

鉴于该领域的数据都属于高维数据,而不是单纯的研究一个物种间的差异,这就使得兴起于上世纪五十年代的多重假设检验又有了用武之地。在差异分析中,经常会用多重假设检验对P值进行校正。

常用的多重假设检验方法有FDR(False Discovery Rate)、FWER(Family-Wise Error Rate)、PCER(Per-comparison Error Rate)、PFER(Per-Family Error Rate)等。
 
有研究者会疑问,已经用P值完成了差异基因或物种的挑选,为什么还要进行P值校正,本来找出来的一堆差异基因或物种,校正了之后就没有一个差异基因或物种了?接下来通过2个例子,简单明了地阐述P值和FDR校正。
 

单个假设检验
 
例1:临床某医生研究白癜风病人的白介素IL-6水平(pg/ml)在白斑部位和正常部位有无差异,调查的结果如下:
白癜风病人不同部位白介素IL-6指标(u/ml)
解答问题前,大家需要先了解一下零假设(null hypothesis);
 零假设(null hypothesis),通常用H0来表示,又称原假设(null hypothesis)。


本案例中的H0假设(零假设)是白斑部位和正常部位的白介素IL-6指标没有差异,即H0:差值的总体中位数Md=0,H1:Md不等于0,且α=0.05 。接着计算统计量T,确定P值。拿P(p-value)值与0.05或0.01比较,最后判断是拒绝或接受原假设。其实是当p-value越小时,表示此时试验得到的统计量越会落在拒绝域,即拒绝原假设的信心越大。

在上述的例子中,查表n(病人数)=8,T0.05,8=3~33,T=2落在3~33界值外,所以P<0.05,按照α=0.05水准,拒绝H0,接受H1白斑部位和正常部位的白介素有差异。

但是这种情况也不是绝对的,也会存在极小的概率会出现判断错误的。p-value的本质是控制FPR (false positive rate), 在上述问题中,p-value的阈值为0.05。代表允许的最大错误率为5%。


多重假设检验

例2:研究某种疾病下患者肠道微生物的结构情况,C组为某疾病组,D组为健康组。通过秩和检验,发现下图中methanomicrobia的P值小于0.05。

这时我们就可以说,在健康和患病人群中,methanomicrobia菌存在显著性差异?

其实这是不准确的,就像前面介绍的单个假设检验例子一样,实验会存在假阳性的概率。更不能因此就说:健康组和疾病组的微生物存在差异,因为单靠一个假设检验来判断两组间的差异,假阳性太高了。为了减少假阳性的发生,就需要引入多个菌一起来做假设检验。这就运用了多重假设检验:

多重假设检验是将多个单一假设检验作为一个检验族,对检验族整体中各假设进行同时检验的问题。在宏基因组数据分析中,基因和物种丰度都是高维的数据,为了判断某种疾病下人的肠道菌群和正常人的肠道菌群是否一致,就需要用到多重假设检验。
引入多个菌一起来做假设检验是能减少假阳性的,那能否引入大量的菌来做假设检验?

答案是不能的,进行多重假设检验时,如果不进行任何的控制,随着假设检验的个数增加,总体错误概率也会增加。
举个例子:有一种诊断艾滋病的试剂, 试验验证其准确性为99%(每100次诊断就有一次假阳性). 对于一个被检测的人(single test) 来说, 这种准确性够了. 但对于医院 (multiple test) 来说, 这种准确性远远不够, 因为每诊断10000个体, 就会有100个人被误诊为艾滋病。所以0.01的阈值对于某些实际问题是不够严格的。

一般研究会想尽量多找出些差异的基因或物种,同时又能够控制总体错误率较小。所以,就需要在假阳性率和总体错误率之间寻找一种平衡点。
多重假设检验方法
有FDR(False Discovery Rate错误发现率)、FWER(Family-Wise Error Rate 总I型错误率)、PCER(Per-comparison Error Rate)、PFER(Per-Family Error Rate)等。目前使用较多的是FWER和FDR。

FWER:指总体中的第I类错误率,即在多次检验中至少出现一次检验犯第I类错误的概率。它是一种相对比较传统的检验方法。

FDR:指错误发现率,其意义为错误拒绝(拒绝真的(原)假设)的个数占所有被拒绝的原假设个数的比例的期望值。

FDR检验在可接受的程度上放松了对错误的控制,相比FWER方法,能大幅度的提高功效。


多重假设检验问题中关于FWER,FDR各个指标的统计方法,适用情况等又有什么不同,这些错误校正的方法有哪些可以使用的R包呢,如何使用这些包呢?且听下回分解。


锐翌原创文章,未经授权严禁转载。