上海锐翌生物科技有限公司

服务电话:021-51001612

邮箱:support@realbio.cn

技术课堂

论方法学的重要性:宏基因组到菌株研究的直通车
发布时间:2017-07-28 16:25   点击率:
“目前,重大慢性疾病不能说与消化道微生物没有关系,但是消化道微生物对每个疾病的贡献度多大,病因和结果的相互转化及机制是什么;在不同疾病的阶段,哪些微生物在里面起了多大的作用,是否一致等尚不清楚。”解放军总医院消化病中心杨云生主任如是说。

宏基因作为微生物组研究的重要工具,能够获取微生物群落的物种信息和功能信息,但难以知晓物种对应的功能。同一种水平上的物种包含很多不同菌株,这些菌株编码的基因和每个基因的拷贝数可能差别很大,这种种内变异赋予不同菌株潜在的功能差异,包括耐药性、毒力、从环境摄取生化分子、分解物质获得能量、移动方式等。宏基因组由于组装技术、数据库比对等在菌株水平上的分析受限制,Borenstein的研究团队基于许多已报道的人体微生物组大数据,开发了在微生物组菌株水平上分析的复杂计算方法。


算法分析流程图

分析步骤
1、下载260个人类肠道微生物菌株水平上的参考基因组数据,与KEGG功能数据库进行比对,得到KO分布的功能基因簇。
2、使用BWA的方法将109个宏基因组数据(丹麦和西班牙健康、肥胖和IBD患者的数据)与参考基因组聚类,参考基因组依据40个marker基因的相似性聚成101个基因簇。
3、计算各样品中比对到数据库的功能基因拷贝数,比较各样品间拷贝数的变异程度。
(1)Highly Variable Genes,即拷贝数变异几乎存在于所有样品中;
(2)Set-Specific Variable Genes,即拷贝数变异存在于少量样品中,这部分变异与环境有关;
(3)Host-State Associated Variable Genes,即拷贝数变异与某种疾病相关,文献中发现24个KCs拷贝数变异与IBD相关,3个KCs拷贝数变异与肥胖相关。
高影响因子(30.41)的文章的独特性,
一张图诠释整篇文章的核心分析。

未知菌株的鉴定
研究各个样品在每个基因簇比对上的拷贝数,使用线性分析解释这些拷贝数数据与参考基因组的线性关系。R2≥76%说明这些拷贝数可用参考基因组解释;R2越小,甚至出现负值说明有新菌株的存在。


参考文献:

Greenblum S, Carr R, Borenstein E. Extensive strain-level copy-number variation across human gut microbiome species[J]. Cell, 2015, 160(4):583–594.