上海锐翌生物科技有限公司

服务电话:021-51001612

邮箱:support@realbio.cn

技术课堂

Prokka,加速你的原核生物基因组注释
发布时间:2018-01-19 17:33   点击率:
Prokka是一个命令行软件工具,在一台典型台式机上充分注释一个细菌基因组草图的时间不到10分钟。它产生标准兼容的输出文件,以进行后续分析或者在基因组浏览器中查看。Prokka是用Perl实现的,在遵循开源GPLv2许可证下,可以从官网免费获得。

http://www.vicbioinformatics.com/software.prokka.shtml

依赖的软件

BioPerl >= 1.6.2
BLAST+ >= 2.2
HMMER >= 3.1
Aragorn >= 1.2
Prodigal >= 2.0 and <= 2.7
tbl2asn >= 23.0
GNU Parallel >= 20130422
Infernal >= 1.1


安装

#下载并提取最新版的Prokka
cd ~/
git clone https://github.com/tseemann/prokka.git

#安装依赖关系
sudo apt-get -y install bioperl libdatetime-perl libxml-simple-perl libdigest-md5-perl

#需要perl的XML包
sudo bash
export PERL_MM_USE_DEFAULT=1
export PERL_EXTUTILS_AUTOINSTALL="--defaultdeps"
perl -MCPAN -e 'install "XML::Simple"'
exit

#添加环境变量和设置数据库
export PATH=$PATH:$HOME/prokka/bin
prokka --setupdb

#展示已经安装了哪些数据库
prokka --listdb

Prokka使用Uniprot数据库作为参考数据库,也可以通过添加命令行参数指定额外的数据库,如:肠球菌属数据库通过添加参数–usegenus –genus Enterococcus实现。


运行

#为注释创建一个新目录
cd ~/
mkdir annotation
cd annotation

#将宏基因组组装结果文件subset_assembly.fa链接到该目录
ln -fs ~/mapping/subset_assembly.fa

#运行Prokka
prokka --outdir prokka_annotation --prefix metagG subset_assembly.fa

命令行参数:
--outdir:输出目录
--prefix:输出文件名前缀
--kingdom:注释模式:古生菌、细菌、线粒体或病毒,默认细菌
详细参考:
https://github.com/tseemann/prokka/blob/master/README.md#command-line-options

结果说明参考:
https://github.com/tseemann/prokka/blob/master/README.md#output-files

结果文件夹中包括一系列文件,所有输出结果的格式说明:


主要参考:

Prokka官网:http://www.vicbioinformatics.com/software.prokka.shtml

https://2017-cicese-metagenomics.readthedocs.io/en/latest/prokka_tutorial.html

https://github.com/tseemann/prokka/blob/master/README.md

Seemann T. Prokka: rapid prokaryotic genome annotation. Bioinformatics. 2014 Jul 15;30(14):2068-9. PMID:24642063

锐翌原创文章,未经授权严禁转载。