spades这款de novo基因组组装软件, 适用于细菌/真菌等小型基因组的组装,不推荐用于动植物基因组的组装。该软件主要用于illumina,IonTorrent reads的组装,也可以进行PacBio, Oxford nanopore, Sanger reads的组装。

spades是一套软件,类似office办公软件系列,我主要使用的是这个可执行文件

rnaSPAdes:rnaSPAdes用于RNA-seq数据的组装

1、安装SPAdes

$ wget http://cab.spbu.ru/files/release3.15.4/SPAdes-3.15.4-Linux.tar.gz

$ tar -xzf SPAdes-3.15.4-Linux.tar.gz

$ cd SPAdes-3.15.4-Linux/bin/

$ pwd        #显示你的bin所在目录,配置环境要用

在这种情况下,您不需要运行任何安装脚本——SPAdes已经可以使用了(不同的版本安装方式不同,可以读软件解压的说明书-----REANDME )

2、配置环境

配置环境,方便全局调用


$ cd 

$ ls -a         #显示所以文件,找到  .bash_profile   文件

$ vi  .bash_profile 

$ i             #进入编辑状态。用键盘的上下左右控制文本编辑

#  内容如下

# .bash_profile

# Get the aliases and functions
if [ -f ~/.bashrc ]; then
        . ~/.bashrc
fi

PATH=$PATH:$HOME/.local/bin:$HOME/bin:/data2/users/biosoft/quast:/home/miniconda3/bin:
/data/users/biosoft/SPAdes-3.15.4-Linux/bin:$PATH

export PATH

#  输入完毕后,按Esc键退出编辑模式

$ :wq!           #保存并退出

$ source .bash_profile         #使环境生效。这样就可以全局调用了


其中的 /data/users/biosoft/SPAdes-3.15.4-Linux/bin: 就是插入PATH的部分。

        #补充说明:其实在每次修改的.bash_profile 文件,我都是在一个bash_profile.txt 文件中修改的,修改后再用cp bash_profile.txt  .bash_profile 命令复制文件,最后在source .bash_profile 使环境生效。为了方便表达,我就直接在.bash_profile 中修改了。

3、测试软件自带文件

$ cd SPAdes-3.15.4-Linux/bin/

$ ./spades.py --test 

 4、rnaSPAdes v3.15.4 组装使用方法

spades.py --rna  -1 GD_S001_clean_1.fastq.gz -2 GD_S001_clean_2.fastq.gz \
                 -1 GX_S020_clean_1.fastq.gz -2 GX_S020_clean_2.fastq.gz \
                 -k 25 -m 100 -t 18 -o rnaSPAdes_out_01test

参数说明:使用 spades.py -h   可以查看各个参数的说明。这里不在详细介绍

关于多个数据的并列,用上面的样本测试过可以成功。

我的样本比较大,一个样本的就有10G。

图一文献:Hölzer M, Marz M. De novo transcriptome assembly: A comprehensive cross-species comparison of short-read RNA-Seq assemblers[J]. Gigascience, 2019, 8(5): giz039.

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐