跳转至

人类基因组的下载

参考地址1 参考地址2

人类基因组和GTF文件
  • NCBI:

gff3

hg38 wget ftp://ftp.ncbi.nlm.nih.gov/genomes/Homo_sapiens/GFF/ref_GRCh38.p7_top_level.gff3.gz           hg19 wget ftp://ftp.ncbi.nlm.nih.gov/genomes/Homo_sapiens/ARCHIVE/BUILD.37.3/GFF/ref_GRCh37.p5_top_level.gff3.gz  

  • ensembl:
gtf

wget ftp://ftp.ensembl.org/pub/current_gtf/homo_sapiens/Homo_sapiens.GRCh38.90.gtf.gz ## hg38 wget ftp://ftp.ensembl.org/pub/release-75/gtf/homo_sapiens/Homo_sapiens.GRCh37.75.gtf.gz ## hg19

变换中间的release就可以拿到所有版本信息:ftp://ftp.ensembl.org/pub/

UCSC下载GTF文件

下载地址 从中选择需要的下载。

不要再从http://genome.ucsc.edu/cgi-bin/hgTables页面手动选了,现在已经整合到https://hgdownload.soe.ucsc.edu/goldenPath/hg38/bigZips/genes/这个地址下面了
基因组下载

UCSC里面下载:

wegt http://hgdownload.cse.ucsc.edu/goldenPath/hg19/bigZips/chromFa.tar.gz ##hg19 wget http://hgdownload.cse.ucsc.edu/goldenPath/hg38/bigZips/chromFa.tar.gz ##hg38

tar -zxvf chromFa.tar.gz cd chroms cat *.fa >hg19.fa

NCBI下载
##hg19:
for i in $(seq 1 22) X Y M;
do wget ftp://ftp.ncbi.nlm.nih.gov/genomes/Homo_sapiens/ARCHIVE/BUILD.37.3/Assembled_chromosomes/seq/hs_ref_GRCh37.p5_chr${i}.fa.gz; 
gzip -d hs_ref_GRCh37.p5_chr${i}.fa.gz;
cat hs_ref_GRCh37.p5_chr${i}.fa.gz >>hg19.fa;
done;
##hg38:
同理,只要找到下载地址,改动一下即可。
### ftp://ftp.ncbi.nlm.nih.gov/genomes/Homo_sapiens/Assembled_chromosomes/seq/hs_ref_GRCh38.p7_chr${i}.fa.gz

ensembl中选择基因组一般选择toplevel-sm版本的。 修改其中的release 号,就能获得对应的版本 ftp://ftp.ensembl.org/pub/release-100/fasta/homo_sapiens/dna/

各种基因组版本的差异

回到页面顶部