基因组不同版本之间的转换工具常用的有: CrossMap(各种转换),liftover(bed转换),picard(VCF转换) 详细讲解各组工具的地址 https://www.biostars.org/p/65558/ 基因坐标转换工具合集 CrossMap使用教程官网
CrossMap软件版本目录 下载原始的tar.gzw文件 安装
tar -zxvf CrossMap-0.4.0.tar.gz
cd CrossMap-0.4.0
python3 setup.py install --root=/public//home/tang/soft/CrossMap
安装完成后,根据链接,修改path,或者直接使用。
#找到文件的路径
which CrossMap.py
#直接运行
python3 /public//home/tang/soft/CrossMap/CrossMap-0.3.9/bin/CrossMap.py
##/public//home/tang/soft/CrossMap/路径是我存放CrossMap-0.3.9.tar.gz的目录位置。
自己修改上述的安装目录,毕竟大多数人都不是root管理员。
方法二:(需要自行解决依赖包安装)
pip3 install CrossMap --user
CrossMap依赖其他的包
pyBigWig
pysam
bx
bx.intervals
依赖比较多,根据提示在安装3-5个依赖后,基本可以解决。目前使用的是0.3.9版本。下载地址
一定要注意,这些版本不支持python2,必须要python3。
* CrossMap (version 0.2.3 to 0.2.9) supports Python2.7.*
* CrossMap (>= 0.3.0) supports Python3
#conda create --name CrossMap
source activate CrossMap
pip install CrossMap
which CrossMap.py
python3 <path>/CrossMap.py
可能会遇到numpy的错误,
解决方法:
pip uninstall numpy
pip install numpy
pip uninstall CrossMap
pip3 install CrossMap
jian书的链接不支持ftp地址,直接复制链接访问 对于非模式生物的chain文件下载:可以直接到对应物种ensembl站点,选择Assembly_chain。 玉米的Assembly_chain地址ftp://ftp.gramene.org/pub/gramene/CURRENT_RELEASE/assembly_chain/zea_mays/
使用CrossMap转换vcf坐标
#此处是将hg19转换为hg38
CrossMap.py vcf GRCh37_to_GRCh38.chain.gz genes_noINS.vcf hg38.fa hg38.genes_noINS.vcf