上海锐翌生物科技有限公司

服务电话:021-51001612

邮箱:support@realbio.cn

技术课堂

【划重点】锐翌微生物多样性分析耀眼升级!(一)
发布时间:2017-09-30 18:03   点击率:
1. MicroPITA:一款用于挑选代表性样品软件

我们常常推荐客户实验设计,条件允许的情况下,尽可能多地设置组内样品的生物学重复数,因为设置生物学重复,①能够消除组内误差,测量变异程度;②能降低背景差异,增加结果可信度;③能检测离群样本,将其排除。

那么重点来了,如何排除离群的样本使结果更可靠,如何从众多样本中挑选更具代表性的样本进行深入研究,例如HMP(人类微生物组计划)对5516例样本进行了16S微生物多样性测序,选取其中682例样本进行宏基因组测序,那么这682例样本是如何选取出来的呢?

针对此需求,锐翌升级了新产品--MicroPITA软件,一款筛选代表性样本的软件,用于交叉学科,即不同组学的研究。


MicroPITA软件筛选代表性样本标准
(1)Maximum diversity,挑选α多样性最高的样本;
(2)Most dissmilar,根据β多样性挑选最极端的样本;
(3)Most representative,根据β多样性挑选最能反应整体差异特征的代表性样本;
(4)Targeted feature,给定一组特征物种等,作为主要参考指标,挑选特征样本;
(5)Distinct,根据表型/分组特征,挑选表型/分组之间β多样性距离最大的样本;
(6)Discriminant,根据表型/分组特征,挑选各表型/分组中距离中心点最近的样本;
(7)Random,在所有样本中,随机挑选出 n 个样本,适合大样本量样本筛选。
参考文献:Timothy L Tickle, Nicola Segata, Levi Waldron, et al. Two-stage microbial community experimental design[J]. The ISME journal, 2013, 7(12):2330.


2. 疾病检测模型构建(Random Forest—ROC曲线)

一篇高影响因子的文章总是有吸引读者眼球的部分,或是实验设计,或是结论,或是作者文章整体的部署和构思。今天小编给大家介绍一款研究疾病的常用分析方法--ROC曲线,建立疾病检测的新模型,通过与医学疾病诊断的金标准比较,研究新的标准对疾病诊断的准确性。这款分析频频出现在Nature、Science等高分杂志上,如果您研究疾病的样本量足够,就可以建立疾病检测的模型,那么该款软件的分析结果将无形中提升您论文的水平。


 
在文章中,这款分析长这个样子


Qin et al. Nature.2014 Sep 4;513(7516):59-64


Wen C et al. Genome Biology, 2017 , 18 (1) :142

ROC曲线分析及意义

ROC曲线分析
(1) 微生物多样性分析过程中,通过随机森林分布,找出对分组贡献度大的物种,构建ROC曲线。

(2) ROC曲线评价统计量计算。ROC曲线下的面积值在1.0和0.5之间。在AUC>0.5的情况下,AUC越接近于1,说明诊断效果越好。AUC在0.5~0.7时有较低准确性,AUC在0.7~0.9时有一定准确性,AUC在0.9以上时有较高准确性。AUC=0.5时,说明诊断方法完全不起作用,无诊断价值。AUC<0.5不符合真实情况,在实际中极少出现。

(3) 两种诊断方法的统计学比较。两种诊断方法比较时,根据不同的试验设计可采用以下两种方法:①当两种诊断方法分别在不同受试者身上进行时,采用成组比较法;②如果两种诊断方法在同一受试者身上进行时,采用配对比较法。


ROC曲线的意义
(1) 查出任意界限值时对疾病的识别能力。

(2) 选择最佳的诊断界限值。ROC曲线越靠近左上角,试验的准确性就越高。最靠近左上角的ROC曲线的点是错误最少的最好阈值,其假阳性和假阴性的总数最少。

(3) 两种或两种以上不同诊断试验对疾病识别能力的比较。在对同一种疾病的两种或两种以上诊断方法进行比较时,可将各试验的ROC曲线绘制到同一坐标中,以直观地鉴别优劣,靠近左上角的ROC曲线所代表的受试者工作最准确。亦可通过分别计算各个试验的ROC曲线下的面积(AUC)进行比较,哪一种试验的 AUC最大,则哪一种试验的诊断价值最佳。