Télécharger fichiers plats banque au format Genbank

Bonjour,

Dans le cadre d'une analyse de metabarcoding avec obitools4, j'ai besoin des fichiers "plats" format genbank pour faire une pcr in silico (avec obipcr). Ces fichiers (fichiers gb*.seq.gz )sont disponibles à l'URL :
https://ftp.ncbi.nlm.nih.gov/genbank/
Ces données sont assez volumineuses et je pense qu'il serait utile qu'elles soient disponibles pour toute la communauté. Pourriez-vous les télécharger pour tout le monde SVP ?
Merci
Sophie
PS : Actuellement les données de genbank partagées dans /shared/bank/ ne sont disponibles qu'en format fasta (ou formatées pour blast) et ne permettent pas de faire le lien avec la taxonomy (taxid) pour le metabarcoding (entre autres).

Bonjour,
Je me permets de relancer cette demande de téléchargement et mise en commum des fichiers Genbank. Cela devient critique pour mon projet et je trouverais dommage d'utiliser cet espace disque à mon seul usage.
bien cordialement,
Sophie

Est-ce que quelqu'un de la @team.bank a la possibilité de prendre en charge cette demande ?

Bonjour,
Ma demande de mise en commun des fichiers format Genbank demeure toujours sans réponse. Pourriez-vous m'indiquer si ma requête pose un problème quelconque. Si vous ne pouvez pas y donner suite merci de m'en informer également.
Bien cordialement,

Sophie

Bonjour Sophie,

Simple manque de temps / ressource humaine.

Le plus direct est peut-être que vous les téléchargiez vous-même.
Je les mettrais à disposition sur /bank.
Ou si vous le voulez bien, je vous inclus dans le (petit) groupe de gestion des banque de données ?
Vous auriez les permissions de mettre à jour le dossier /shared/bank/ et seriez notifié des demandes sur ce forum concernant les banques.

Le fonctionnement est détaillé dans ce port Banques de données /shared/bank - #2 par dbenaben et dans des fichiers README.

Bonjour,

Merci pour votre réponse, je comprends bien les raisons. Je veux bien être inclus dans le groupe et participer à mettre à jour les banques.

Sophie

Merci ! C'est fait.

Dites-nous si vous avez des difficultés.

Bonjour,

Quel account dois-je utiliser pour lancer avec sbatch le script de download des fichiers genbank ?
J'ai vu du "taskforce" dans les scripts dispos dans /shared/bank/_scripts/ mais je n'y suis peut-être pas autorisée (?)

Sophie

Bonjour,

Quel account dois-je utiliser pour lancer avec sbatch le script de download des fichiers genbank ?

Peu importe. Cela peut se faire aussi en direct si besoin (ou à l'aide de screen/tmux si besoin).

J'ai vu du "taskforce" dans les scripts dispos dans /shared/bank/_scripts/ mais je n'y suis peut-être pas autorisée (?)

Pas de souçis pour utiliser/déposer/modifer si besoin dans ce dossier (vous y êtes autorisés).

Il est important de bien documenter (commentaires, fichier README) que l'on puisse à notre tour le faire si besoin.

Merci :wink:

Merci pour votre réponse. Je me suis mal fait comprendre.
"taskforce" est un account qui est utilisé dans les scripts sbatch de mise à jour des banques (#SBATCH -A taskforce).
Je peux télécharger les fichiers avec le temps de calcul de mon propre account mais pour le script de mise à jour (du wget) que je vais mettre à dispo pour laisser une trace de la marche à suivre, je ne vais pas mettre mon propre account.
Y-a-t-il un account à utiliser pour imputer le temps de calcul des mises à jour à la team.bank ?
J'espère avoir été plus claire.
Merci
Sophie

Bonjour Sophie,

Je comprends mieux. Je viens de créer l'account slurm: bank_admin
Vous pouvez donc utiliser ce compte dans les scripts (et lors de la création/maj des bases).

Bonne journée