cite Zeng Jianming 全基因范围内的染色体reads覆盖图
1. trackViewer文章链接nature methods
2019年最新的全基因组范围可视化工具,biocon trackViewer的使用说明bioconductor地址
2. ggplot2实现全基因组可视化
https://mp.weixin.qq.com/s/1qFslOpx-Yzugf_zliuZHw 目标是实现可视化,每条染色体的测序的深度分布情况。 从这个图中可以看出:
- 1号染色体中间的测序深度有点不稳定,中间出现的异常的峰
- 9号染色体的中间有一段测序深度明显降低。
- 13,14,15,21,22号染色体开头处有大段的覆盖度为0的情况。可能是端粒处没有测到,也可能这些位置就是N碱基。 R的实现方法如下:
rm(list=ls())
file <- 'GC_stat.100k.txt'
data <- read.table(file,sep="\t",fill=TRUE,stringsAsFactors = F)
colnames(dat)=c('chr','number','length','GC','counts')
keep_chr <- dat$chr %in% c(paste0('chr',c(1:22,'X','Y')))
dat <- dat[keep_chr,]
dat$depth <- dat$counts/dat$length
library(ggplot2)
head(dat)
# To change plot order of facet wrap,
# change the order of varible levels with factor()
dat$chr <- factor(dat$chr , levels =c(paste0('chr',c(1:22,'X','Y'))) )
png('coverage.png',height = 1000,width = 1000)
p <- ggplot(dat,aes(number,depth))+geom_area(aes(fill=chr))+ylim(0, 100)
p <- p+facet_wrap( ~ chr,ncol=2)
print(p)
dev.off()
- ChromHeatMap包实现可视化 健明教程