转录组组装软件--SPAdes--安装和使用
这是一个组装软件,运行很快。
spades这款de novo基因组组装软件, 适用于细菌/真菌等小型基因组的组装,不推荐用于动植物基因组的组装。该软件主要用于illumina,IonTorrent reads的组装,也可以进行PacBio, Oxford nanopore, Sanger reads的组装。
spades是一套软件,类似office办公软件系列,我主要使用的是这个可执行文件
rnaSPAdes:rnaSPAdes用于RNA-seq数据的组装
1、安装SPAdes
$ wget http://cab.spbu.ru/files/release3.15.4/SPAdes-3.15.4-Linux.tar.gz
$ tar -xzf SPAdes-3.15.4-Linux.tar.gz
$ cd SPAdes-3.15.4-Linux/bin/
$ pwd #显示你的bin所在目录,配置环境要用
在这种情况下,您不需要运行任何安装脚本——SPAdes已经可以使用了(不同的版本安装方式不同,可以读软件解压的说明书-----REANDME )
2、配置环境
配置环境,方便全局调用
$ cd
$ ls -a #显示所以文件,找到 .bash_profile 文件
$ vi .bash_profile
$ i #进入编辑状态。用键盘的上下左右控制文本编辑
# 内容如下
# .bash_profile
# Get the aliases and functions
if [ -f ~/.bashrc ]; then
. ~/.bashrc
fi
PATH=$PATH:$HOME/.local/bin:$HOME/bin:/data2/users/biosoft/quast:/home/miniconda3/bin:
/data/users/biosoft/SPAdes-3.15.4-Linux/bin:$PATH
export PATH
# 输入完毕后,按Esc键退出编辑模式
$ :wq! #保存并退出
$ source .bash_profile #使环境生效。这样就可以全局调用了
其中的 /data/users/biosoft/SPAdes-3.15.4-Linux/bin: 就是插入PATH的部分。
#补充说明:其实在每次修改的.bash_profile 文件,我都是在一个bash_profile.txt 文件中修改的,修改后再用cp bash_profile.txt .bash_profile 命令复制文件,最后在source .bash_profile 使环境生效。为了方便表达,我就直接在.bash_profile 中修改了。
3、测试软件自带文件
$ cd SPAdes-3.15.4-Linux/bin/
$ ./spades.py --test
4、rnaSPAdes v3.15.4 组装使用方法
spades.py --rna -1 GD_S001_clean_1.fastq.gz -2 GD_S001_clean_2.fastq.gz \
-1 GX_S020_clean_1.fastq.gz -2 GX_S020_clean_2.fastq.gz \
-k 25 -m 100 -t 18 -o rnaSPAdes_out_01test
参数说明:使用 spades.py -h 可以查看各个参数的说明。这里不在详细介绍
关于多个数据的并列,用上面的样本测试过可以成功。
我的样本比较大,一个样本的就有10G。
图一文献:Hölzer M, Marz M. De novo transcriptome assembly: A comprehensive cross-species comparison of short-read RNA-Seq assemblers[J]. Gigascience, 2019, 8(5): giz039.
更多推荐
所有评论(0)