结构变异SV分析(WGS WES)和融合基因检测(RNA)
69种工具检测SV对比 https://www.jianshu.com/p/85ff211b4b4e
https://zhuanlan.zhihu.com/p/87408242?utm_campaign=rss&utm_medium=rss&utm_source=rss&utm_content=title 最终决定使用wham和Manta组合,其实最优组合应该是wham,inGAP-SV组合或者inGAP-sv,PBHoney-NGM组合。
安装wham(现在实际是whamg) github
git clone --recursive https://github.com/zeeev/wham.git
cd wham
make
安装Manta github
#强烈推荐使用二进制版本,不用编译,少了很多麻烦(虽然是centos6但是其他版本的linux也能使用)
wget https://github.com/Illumina/manta/releases/download/v1.6.0/manta-1.6.0.centos6_x86_64.tar.bz2
tar -jxvf manta-1.6.0.centos6_x86_64.tar.bz2
cd manta-1.6.0.centos6_x86_64/bin
./configManta.py -h
#Manta是基于python2,如果你的默认python是python3,可以这样调用。
python2 configManta.py
##我直接把上述命令和路径加进path
alias Manta="python2 /share/home/software/manta/manta-1.6.0.centos6_x86_64/bin/configManta.py"
#直接运行Manta 就行了。
运行Manta
Manta \
--bam NA12878_S1.bam \
--bam NA12891_S1.bam \
--bam NA12892_S1.bam \
--callRegions hg38.bed \
--referenceFasta hg38.fa \
--runDir ${MANTA_ANALYSIS_PATH}
参数说明:
要求输入的bam和fa必须有samtool的fai索引文件,bam还需要sort过。 --callRegions 适用于指定染色体,通过这种方式来只分析chr上的,而不分析scaffold。 hg38.bed内容如下
chr1 0 248956422
chr2 0 242193529
chr3 0 198295559
chr4 0 190214555
chr5 0 181538259
chr6 0 170805979
chr7 0 159345973
chr8 0 145138636
chr9 0 138394717
chr10 0 133797422
chr11 0 135086622
chr12 0 133275309
chr13 0 114364328
chr14 0 107043718
chr15 0 101991189
chr16 0 90338345
chr17 0 83257441
chr18 0 80373285
chr19 0 58617616
chr20 0 64444167
chr21 0 46709983
chr22 0 50818468
chrX 0 156040895
chrY 0 57227415
chrM 0 16569
运行whamg
目前无法成功安装wham
融合基因检测 http://www.bio-info-trainee.com/7258.html Comparative assessment of methods for the fusion transcripts detection from RNA-Seq data 2016年 测评12个工具 Accuracy assessment of fusion transcript detection via read-mapping and de novo fusion transcript assembly-based methods 2019年测评 23个工具论文 决定使用STAR-fusion检测融合基因。 STAR-fusion是基于STAR比对的结果进行检测融合基因的。
#安装START-fusion
conda install -c bioconda star-fusion
注意:STAR和STAR-fusion的不同版本的兼容性有较大问题,开始分析前,一定先确定使用的版本之间产出的文件是否兼容。 参考:STAR-fusion的使用 STAR-fusion检出融合基因的后续分析
WGS和RNA-seq联合分析参考文章 2019 NC https://www.nature.com/articles/s41467-019-10680-5#Sec10