上海锐翌生物科技有限公司

服务电话:021-51001612

邮箱:support@realbio.cn

技术课堂

教程 | 用MetaPhlAn2分析微生物物种丰度
发布时间:2017-11-24 16:36   点击率:
MetaPhlAn2是分析微生物群落(细菌、古菌、真核生物和病毒)组成的工具,它在宏基因组研究中非常有用,通过分析能获得微生物的物种丰度信息。老规矩,小锐将从安装到使用,教你解锁这款软件。

1. 安装MetaPhlAn2软件

1.1 依赖的软件
① Python (version >= 2.7)
② Bowtie2
③ Numpy
④ Pandas (optional, only required by utility scripts)
⑤ BioPython (optional, only required by utility scripts)
⑥ SciPy (optional, only required by utility scripts)
⑦ Matplotlib (optional, only required by utility scripts)
⑧ biom (optional, only required for biom format input/output)

1.2 安装
Step 1:下载 MetaPhlAn2软件并解压
(下载地址:https://bitbucket.org/biobakery/metaphlan2/get/default.zip)
tar xzvf biobakery-metaphlan2-<versioned>.tar.gz
cd biobakery-metaphlan2-<versioned>/

Step 2:添加环境变量
把变量export PATH=$MDIR:$MDIR/UTILS/:$PATH添加到变量文件$HOME/.bashrc中,其中$MDIR是软件MetaPhlAn2的安装路径。

Step 3:安装MetaPhlAn2依赖软件
安装bowtie2软件并添加到环境变量中。

2. 运行MetaPhlAn2软件

metaphlan2.py  $SAMPLE  --input_type fasta > $OUTPUT_profile.txt
其中$SAMPLE可以是.fasta、.fastq和.tar.bz2格式的宏基因组序列文件;
运行结果主要输出两个文件bowtie2out.txt 和_profile.txt;
其中_profile.txt是物种丰度的结果。

如果样品较多,可以修改参数进行多线程运行MetaPhlAn2软件
metaphlan2.py  $SAMPLE  --input_type fasta  --nproc 4 > $OUTPUT_profile.txt
其中nproc 4是指线程数为4。


3. 物种丰度结果的可视化

3.1 热图可视化丰度结果
热图能有效显示MetaPhlAn2软件输出的物种丰度结果,其中制作热图主要应用hclust2脚本(其下载路径为https://bitbucket.org/nsegata/hclust2/get/tip.zip)。
Step 1: 把所有样品结果的物种丰度合并成一个表格
grep -E "(s__)|(^ID)" merged_abundance_table.txt | grep -v "t__" | sed 's/^.*s__//g' > merged_abundance_table_species.txt

Step 2: 生成热图
hclust2.py -i merged_abundance_table_species.txt -o abundance_heatmap_species.png --ftop 25 --f_dist_f braycurtis --s_dist_f braycurtis --cell_aspect_ratio 0.5 -l --flabel_size 6 --slabel_size 6 --max_flabel_len 100 --max_slabel_len 100 --minv 0.1 --dpi 300
其效果图为:



3.2 进化分枝图可视化丰度结果
你也可以在进化树上进行可视化物种丰度结果图,这里主要应用GraPhlAn工具制作,可以用微生物的名字或物种丰度给树枝添加注释。
Step 1:生成GraPhlAn的输入文件
export2graphlan.py --skip_rows 1,2 -i merged_abundance_table.txt --tree merged_abundance.tree.txt --annotation merged_abundance.annot.txt --most_abundant 100 --abundance_threshold 1 --least_biomarkers 10 --annotations 5,6 --external_annotations 7 --min_clade_size 1

Step 2:生成进化分枝图
graphlan_annotate.py --annot merged_abundance.annot.txt merged_abundance.tree.txt merged_abundance.xml
graphlan.py --dpi 300 merged_abundance.xml merged_abundance.png --external_legends
其效果图为:


对于生信分析者来说,分析软件就像是他的第二个大脑。选择一款适合自己的软件,总能达到事半功倍的效果。MetaPhlAn2能否成为你的神助攻呢?要亲自试了才知道哦~感兴趣的小伙伴们,赶紧动起来吧。