上海锐翌生物科技有限公司

服务电话:021-51001612

邮箱:support@realbio.cn

技术课堂

生信分析神器Biopython之分析环境搭建
发布时间:2017-05-17 14:54   点击率:
众所周知,python在数据分析领域十分常用,而作为数据科学的一个分支,生物信息学也是对python偏爱有加。今天我们就来看看一个功能强大的python生信分析包——Biopython。
 
 
预备工作—学点语言  装好python
作为入门,python语言基础还是要会一点点的,不过不需要很深。工具嘛,我们只用关心怎么用得溜,平时也没人追究勺子咋造的只管拿来用,是吧~Biopython是一个包含大量实用功能模块的集合,它支持的数据结构可谓非常广泛:
> Blast结果 – standalone和在线Blast
> Clustalw
> FASTA
> GenBank
> PubMed和Medline
……
太多了,这里就不一一列举了,更多详情访问项目主页就可以,介绍非常详细。
项目主页:https://github.com/biopython/biopython

安装python
Windows平台的用户请先安装好python。喏,在这里下载:
https://www.python.org/ftp/python/2.7.13/python-2.7.13.msi
一路next就可以安装好(python版本随意,2.X和3.X都有对应的Biopython包,上面的链接是2.X版本的)。


进入正题—搭建分析环境  
下面,小编来教大家搭建虚拟的Linux分析环境。
 
啥叫虚拟环境呢?举个不恰当的栗子:假如你是一个工作兢兢业业的好员工,平时没有时间收拾屋子,突然想大扫除一下,那么多家具怎么办呢?突然你大手一挥,家里变得空空如也,这下可以随意规划收拾了!……,先打住哈,上文后来出现的“空空的屋子”其实就是个虚拟的环境啦,你可以随意在这个房间里放任何东西,跟新家一样儿样儿的。小编现在就是要教你建一个“新家!”——生物信息分析专用虚拟环境,之后放进去的第一个“家具”就是本文的主人公Biopython啦。
 
下载安装Anaconda
首先下载Anaconda——python的一个集成发行版(你可以认为这是全副武装的python,当然核心的部分仍然是python~)。
# wget https://repo.continuum.io/archive/Anaconda2-4.3.1-Linux-x86_64.sh

下载完以后,执行安装:
# sh Anaconda2-4.3.1-Linux-x86_64.sh
执行后会提示你安装,遇到enter,就enter确认,遇到许可说明什么的也确认yes,然后就到达安装界面。


红圈内代表默认安装位置,如果想自己指定安装路径,那可以输入相应的路径>>>/XXX/XXX/anaconda之类的。
然后等待执行完就可以开始正式创建安装环境!
 
虚拟环境创建及启动
# conda create -n test_biopython python==2.7.13
小小地解释一下上面的命令:
conda create命令创建虚拟的python环境;
参数-n后面跟的是你要创建的环境名称,比如test_biopython,当然你想叫ABCD,shuaigeshiwo我也拦不住,但最好跟你想做的项目相关;
后面是python版本。
执行命令后,需要下载一些基本的包,提示需要你输入y,输入就可以。
 
# source activate test_biopython
执行上面的命令后,你创建的虚拟环境就激活了!标志就是你的命令行前面会有一个圆括号包围的(test_biopython),就像下面这样:

Biopython安装
现在我们来在刚刚创建的虚拟环境里放第一个“家具”——Biopython:
# pip install biopython

剩下的安装过程小编表示围观就可以,等到以下界面出现,就代表这个工具可以使用了~


打开解释器,导入一下biopython试试(导入的时候记得要用Bio)
# python
>>> import Bio


没问题,可以使用了!