跳转至

Fastp 质控 +过滤数据

常规的质控和过滤数据是fastqc+trimmomatic,据说fastp更快,而且一次完成质控过滤和出图。 fastp的github fastp的出版地址

1.Fastp 软件安装

wget http://opengene.org/fastp/fastp
chmod a+x ./fastp
./fastp

本地路径/home/chaim/disk/soft/fastp/fastp 添加环境变量

vim ~/.bash_profile
export PATH=$home/disk/soft/fastp:PATH

之后即可全局调用fastp。

2.使用参数

2.1 快速处理

单端测序single end(SE)

fastp -i in.fq -o out.fq

双端测序paired end(PE)

fastp -i in.R1.fq.gz -I in.R2.fq.gz -o our.R1.fq.gz -O  out.R2.fq.gz

参数设定: -w 8 设置进程数8,默认2,max=16,或者是--thread 8 -z 5 设置gzip压缩级别,默认4,1~9 1快-9小 --json 设置输出json文件名 --html 设置输出html文件名

2.2 使用循环批量处理

注意:一定要修改默认的输出文件名,不然后面的输出会覆盖前面的默认文件名

#!/bin/bash
for i in 71 72 75 76 78 79;do
  {
  fastp -i ~/RNAseq/SRR190242${i}_1.fastq.gz -o SRR190242${i}_1.fastq.gz -I  ~/RNAseq/SRR190242${i}_2.fastq.gz -O SRR190242${i}_2.fastq.gz -w 8 --html ${i}.html --json ${i}.json
  } 
done
回到页面顶部