admin 管理员组

文章数量: 887069


2024年1月18日发(作者:transport police woman)

window系统下本地blast+安装与使用教程

一、blast的下载与安装

1.程序下载:访问blast本地软件包链接 blast_latest 下载适合自己系统的blast版本,这里我选择 ncbi-blast-2.2.28+-。

2.安装流程:下载完毕后,双击安装到C:Blast,生成bin和doc两个子目录,其中bin是程序目录, doc是文档目录,这样就安装完成。

3.用户环境变量设置:右键点击“我的电脑”-属性,然后“高级系统设置”选项-“环境变量”,在用户变量下方点击“新建”-变量名:BLASTDB,变量值:C:Blastdb(即数据库路径)。在系统变量下方“Path”添加变量值:C:Blastbin。

4.查看程序版本信息:点击window的"开始"菜单,在运行中输入cmd,调出MS-DOS命令行,转到blast安装目录,输入命令“ blastn -version"即可查看版本。

二、blast本地数据库的构建

1.数据的获取

1.1 直接从NCBI或者其他数据库网站下载所需序列做成数据库,或者自己已有的测序数据(格式必须是fasta,名字可以自己随便命名)。

1.2 从NCBI中的ftp库下载所需要的某一个库或几个库(其链接为ftp:///blast/db/FASTA/)其中为非冗余的数据库,为核酸数据库,为最近一个月的核酸序列数据。

1.3 利用新版blast自带的update_进行下载,这需要安装perl程序。

上述三种方法各有优缺点:前两种下载速度较快,但是检索前都需要对数据库进行格式化(转化成二进制数据),第三种方法下载速度较慢,但是是NCBI中已经格式化好的,在进行本地检索时不需再进行格式化,直接用即可。

2.数据的格式化

以作为查询序列,以作为数据库文件为例。首先将放到C:Blastdb文件夹下,然后调出MS-DOS命令行,转到C:Blastdb文件夹下运行格式化命令。

格式化命令:

C:Blastdb>makeblastdb -in nr -dbtype prot -title "nr" -out NR

Building a new DB, current time: 08/28/2013 08:59:17

New DB name: T

New DB title: nr

Sequence type: Protein

Keep Linkouts: T

Keep MBits: T

Maximum file size: 1000000000B

Adding sequences from FASTA; added 32044604 sequences in 3134.69 seconds.

因此,本地数据库已经建立完毕。

三、blast的使用方法

以作为查询序列,以作为数据库文件为例。

blsat运行命令:

C:Blast> -db NR -query –out -evalue 0.00001

-max_target_seqs 5 -num_threads 4 -outfmt 11

注:将核酸序列比对到蛋白库需要用blastx,outfmt的格式选择11,11为ans.格式,此格式可以转化为其他格式文件。其他参数可以通过-h选择。

如果一切运行良好的话,待运行完毕,你将在blast文件下看到一个的结果。


本文标签: 数据库 安装 下载