人类基因组的下载
人类基因组和GTF文件
- NCBI:
gff3
hg38 wget ftp://ftp.ncbi.nlm.nih.gov/genomes/Homo_sapiens/GFF/ref_GRCh38.p7_top_level.gff3.gz hg19 wget ftp://ftp.ncbi.nlm.nih.gov/genomes/Homo_sapiens/ARCHIVE/BUILD.37.3/GFF/ref_GRCh37.p5_top_level.gff3.gz
- ensembl:
gtf
wget ftp://ftp.ensembl.org/pub/current_gtf/homo_sapiens/Homo_sapiens.GRCh38.90.gtf.gz ## hg38 wget ftp://ftp.ensembl.org/pub/release-75/gtf/homo_sapiens/Homo_sapiens.GRCh37.75.gtf.gz ## hg19
变换中间的release就可以拿到所有版本信息:ftp://ftp.ensembl.org/pub/
UCSC下载GTF文件
下载地址 从中选择需要的下载。
不要再从http://genome.ucsc.edu/cgi-bin/hgTables页面手动选了,现在已经整合到https://hgdownload.soe.ucsc.edu/goldenPath/hg38/bigZips/genes/这个地址下面了
基因组下载
UCSC里面下载:
wegt http://hgdownload.cse.ucsc.edu/goldenPath/hg19/bigZips/chromFa.tar.gz ##hg19 wget http://hgdownload.cse.ucsc.edu/goldenPath/hg38/bigZips/chromFa.tar.gz ##hg38
tar -zxvf chromFa.tar.gz cd chroms cat *.fa >hg19.fa
NCBI下载
##hg19:
for i in $(seq 1 22) X Y M;
do wget ftp://ftp.ncbi.nlm.nih.gov/genomes/Homo_sapiens/ARCHIVE/BUILD.37.3/Assembled_chromosomes/seq/hs_ref_GRCh37.p5_chr${i}.fa.gz;
gzip -d hs_ref_GRCh37.p5_chr${i}.fa.gz;
cat hs_ref_GRCh37.p5_chr${i}.fa.gz >>hg19.fa;
done;
##hg38:
同理,只要找到下载地址,改动一下即可。
### ftp://ftp.ncbi.nlm.nih.gov/genomes/Homo_sapiens/Assembled_chromosomes/seq/hs_ref_GRCh38.p7_chr${i}.fa.gz
ensembl中选择基因组一般选择toplevel-sm版本的。 修改其中的release 号,就能获得对应的版本 ftp://ftp.ensembl.org/pub/release-100/fasta/homo_sapiens/dna/