我的网站

服务电话:021-51001612

邮箱:support@realbio.cn

公司新闻

锐翌生信团队在《IDTM》发表综述文章——人类肠道微生物组研究的生物信息学方法
发布时间:2016-07-12 14:40   点击率:
近日,锐翌基因信息分析团队与军事医学科学院崔玉军博士、浙江大学秦楠博士联合打造的综述文章——《人类肠道微生物组研究的生物信息学方法》在Infectious Diseased and Translational Medicine(简称IDTM)期刊成功发表!该文章的发表展示出锐翌基因在微生物组生物信息分析领域和同行中的领先分析能力和技术优势。

首先,来看一下文章介绍了哪些“干货”。


全面概括和介绍了微生物组信息分析流程和常用软件
 
根据锐翌团队多年的项目经验以及市场调查结果,文章系统地概括和介绍了目前国内外在微生物组研究领域中的常用分析流程和软件。具体包括:
1. 序列比对数据库和软件。如NCBI、HMP、GOLD等数据库,SOAP、BWA和bowtie等软件。
2. 物种丰度表计算方法。
3. Enterotypes(肠型)分析。


4. 物种多样性展示方法。主要有α多样性和β多样性。
5. 差异物种筛选方法。如曼-惠特尼检验、秩和检验、LEfSe分析等。


6. 序列拼接组装。非单一物种的混合序列片段,通常用De Brujin方法进行组装。
7. 基因预测。常用软件包括MetaGeneMark、Glimmer-MG、MetaGene、Orphelia、FragGeneScan等。
8. 非冗余基因集构建方法。
9. 基因丰度表计算。通常,在计算基因丰度之前需要先构建基因集,常用软件有SOAPaligner、BLAST、BLAT、bwa等。
10. 差异基因筛选。
11. 功能分析。常用数据库包括KEGG、EggNOG、GO、CAZy、ARDB等。
12. MGS分析和CAG分析。当样品数量足够多时,应用这2种分析方法可以找到一些新物种或新基因。

13. Markers标记物的筛选和验证。利用markers标记物可以构建疾病监测和诊断模型,分类常用算法包括SVM、随机森林模型、人工神经网络和朴素贝叶斯分类,验证则主要通过ROC曲线和AUC完成。
那么,这篇综述文章的发表,有何意义呢?

 


微生物组是火热的学术研究前沿领域
 
微生物组(Microbiome)是近年来国际最为热门的学术前沿领域之一,与其相关的研究成果在Nature、Science、Cell、柳叶刀等几大顶尖期刊上以不间断之势轮流发表。

这一现象主要由微生物组的重要性和未知性促成。

一方面,微生物组虽曾被人类健康研究长期忽视,但最近研究发现它们和人体消化、代谢、免疫、神经、心血管等众多系统密切相关。

另一方面,许多关于微生物组的谜团尚未解开,为科研人员提供了大量有意义的研究契机,如复杂多样的微生物组如何与宿主相互作用,如何参与宿主健康,如何受饮食、药物的调节和改变,其中的内在机理是什么,是否有一些规律等。



为本领域科研工作者提供重要借鉴
 
文章非常全面且详细地介绍了微生物组研究所需的生物信息分析内容,为正在开展或是未来想要开展微生物组与某些疾病相互关系研究的科研人员提供尽可能详细的借鉴。

 
作者简介
 
本文第一作者是锐翌基因的首席信息官郑智俊,本项目的指导老师和通讯作者是浙江大学秦楠博士和军事医学科学院崔玉军博士。

秦楠
锐翌基因首席科学家,山东基因科学研究院发起人,2016年美国人体微生物组大会中国区总协调人。曾任华大基因(BGI)微生物基因组部门负责人,浙江大学医学院特聘研究员,博士生导师。国际人体微生物组协会前秘书长等职务。参与组织了2010年、2013年、2015年三届国际人体微生物组大会。其多项研究成果发表在Nature、Science、Nature Genetics、PNAS、Plos Biology、Nature Communications等国际顶尖学术期刊上。目前研究领域涵盖感染性疾病、肿瘤、代谢类疾病、自身性免疫疾病、精神类疾病与肠道菌群的关系,承担多项国家级研究课题。

崔玉军
军事医学科学院微生物流行病研究所副研究员,硕士生导师。研究方向为细菌基因组学和群体遗传学。多年来致力于将新一代测序技术应用于病原菌检测鉴定和进化溯源研究中,发表SCI论文48篇,影响因子计281,累计他引千余次。代表性论文发表于NEJM、PNAS、MBE、Nat Commun等杂志。参加编写中英文专著八部。曾获军队科技进步一等奖、青海省自然科学优秀学术论文奖一等奖、全国微生物学术年会优秀论文奖等。

郑智俊
毕业于南开大学物理学专业,曾任深圳华大基因研究院科技体系动植物贯穿组学研究员,现负责锐翌基因多个重大宏基因组项目以及信息分析方面研发工作,至今已有六年生物信息分析经验。参与多个大型科研项目,文章发表于Nature genetics, Genome Biology, Plant Cell等一系列高水平杂志上,累计影响因子51.44。