Bonjour,
serait-il possible d'avoir les data de gnomAD 2.1 et gnomAD 3 dans le dossier bank partagé ?
En gardant les data exomes et genomes séparées pour gnomAD 2.1, si possible.
Merci beaucoup d'avance
Sandrine
Bonjour,
serait-il possible d'avoir les data de gnomAD 2.1 et gnomAD 3 dans le dossier bank partagé ?
En gardant les data exomes et genomes séparées pour gnomAD 2.1, si possible.
Merci beaucoup d'avance
Sandrine
Bonjour @scaburet
Nous ne serions pas contre d'un peu plus de précision. Je ne suis pas coutumier de cette banque (et tant d'autre)
Pouvez-vous m'indiquer pour 2.1 et 3, les fichiers ou groupes de fichiers à vous mettre à disposition ?
Merci par avance
Bonjour @gildaslecorguille,
merci de votre réponse, et oui bien sûr, voici quelques infos :
il s'agit d'une banques des variations du génome humain, telles que observées par les séquençages d'exomes et de génomes. C'est la source la plus complète pour connaître la fréquence d'un variant dans les différentes populations humaines analysées.
La version 2.1 de gnomad contient des variants trouvés dans des seq d'exomes et des seq de génomes complets, la v3 des variants trouvés seulement dans des seq de génomes, mais en plus grand nombre.
Les fichiers sont à récupérer ici : ftp://ftp.ensembl.org/pub/data_files/homo_sapiens/GRCh38/variation_genotype/gnomad/
avec 3 dossiers :
L'idéal pour notre projet serait d'avoir au moins le dossier 2.1 exomes et le dossier 3.0 genomes.
J'espère que c'est un peu plus clair, mais si ce n'est pas le cas, je suis disponible.
Merci d'avance,
Sandrine
Hop :
/shared/bank/homo_sapiens/GRCh38/gnomad
Dites-moi si il manque quelque chose.
Bonjour @gildaslecorguille,
Merci beaucoup, mais j'aurais dû vous prévenir de ne pas dezipper les fichiers vcf.gz ou vcf.bgz, car là les index tabix ne peuvent plus être utilisés.
My bad, j'aurais dû y penser...
On peut bien sûr rezipper les fichiers et les réindexer en tabix, mais c'est peut-être plus simple de tout recharger
D'autre part, dans le dossier /shared/bank/homo_sapiens/GRCh38/gnomad/3.0/genomes/
, serait-il possible de rajouter le fichier contenant tous les chromosomes :
https://storage.googleapis.com/gnomad-public/release/3.0/vcf/genomes/gnomad.genomes.r3.0.sites.vcf.bgz
(en le laissant zippé, donc)
et son tabix correspondant :
https://storage.googleapis.com/gnomad-public/release/3.0/vcf/genomes/gnomad.genomes.r3.0.sites.vcf.bgz.tbi
Désolée encore pour n'avoir pas été plus claire.
Sandrine
J'ai eu un doute
Je fais ça asap
Désolé pour le délais mais, c'est bon, les données compressées sont disponibles.
Merci beaucoup @gildaslecorguille !
Serait-il possible de mettre également celui-ci avec tous les chromosomes ?
Bonne journée
Oups, done !
Merci, ça fonctionne bien !
SC