@team.bank Installation de gnomAD dans bank?

Bonjour,
serait-il possible d'avoir les data de gnomAD 2.1 et gnomAD 3 dans le dossier bank partagé ?
En gardant les data exomes et genomes séparées pour gnomAD 2.1, si possible.

Merci beaucoup d'avance :slight_smile:

Sandrine

Bonjour @scaburet

Nous ne serions pas contre d'un peu plus de précision. Je ne suis pas coutumier de cette banque (et tant d'autre)
Pouvez-vous m'indiquer pour 2.1 et 3, les fichiers ou groupes de fichiers à vous mettre à disposition ?
Merci par avance

Bonjour @gildaslecorguille,
merci de votre réponse, et oui bien sûr, voici quelques infos :
il s'agit d'une banques des variations du génome humain, telles que observées par les séquençages d'exomes et de génomes. C'est la source la plus complète pour connaître la fréquence d'un variant dans les différentes populations humaines analysées.
La version 2.1 de gnomad contient des variants trouvés dans des seq d'exomes et des seq de génomes complets, la v3 des variants trouvés seulement dans des seq de génomes, mais en plus grand nombre.
Les fichiers sont à récupérer ici : ftp://ftp.ensembl.org/pub/data_files/homo_sapiens/GRCh38/variation_genotype/gnomad/
avec 3 dossiers :

  • 2.1 exomes
  • 2.1 genomes
  • 3.0 génomes
    avec à chaque fois un fichier vcf par chromosome et l'index tabix correspondant.

L'idéal pour notre projet serait d'avoir au moins le dossier 2.1 exomes et le dossier 3.0 genomes.

J'espère que c'est un peu plus clair, mais si ce n'est pas le cas, je suis disponible.

Merci d'avance,

Sandrine

Hop :
/shared/bank/homo_sapiens/GRCh38/gnomad

Dites-moi si il manque quelque chose.

Bonjour @gildaslecorguille,
Merci beaucoup, mais j'aurais dû vous prévenir de ne pas dezipper les fichiers vcf.gz ou vcf.bgz, car là les index tabix ne peuvent plus être utilisés.
My bad, j'aurais dû y penser...
On peut bien sûr rezipper les fichiers et les réindexer en tabix, mais c'est peut-être plus simple de tout recharger :confused:

D'autre part, dans le dossier /shared/bank/homo_sapiens/GRCh38/gnomad/3.0/genomes/, serait-il possible de rajouter le fichier contenant tous les chromosomes :
https://storage.googleapis.com/gnomad-public/release/3.0/vcf/genomes/gnomad.genomes.r3.0.sites.vcf.bgz
(en le laissant zippé, donc)
et son tabix correspondant :
https://storage.googleapis.com/gnomad-public/release/3.0/vcf/genomes/gnomad.genomes.r3.0.sites.vcf.bgz.tbi

Désolée encore pour n'avoir pas été plus claire.

Sandrine

J'ai eu un doute :slight_smile:
Je fais ça asap

Désolé pour le délais mais, c'est bon, les données compressées sont disponibles.

Merci beaucoup @gildaslecorguille !

Serait-il possible de mettre également celui-ci avec tous les chromosomes ?

Bonne journée

Oups, done !

Merci, ça fonctionne bien !

SC

1 « J'aime »