Gestion des bases de données courantes

Bonjour les admins

j'ai une question concernant la gestion des bases de données (de séquences) les plus courantes.

Dans le dossier /shared/bank/, il y a plusieurs versions de nr, nt, uniref, etc.

Aucune ne semble véritablement à jour, probablement personne n'utilise les versions encore plus anciennes qui sont toujours stockées.

Pour ma part, je n'utilise jamais ces bases de données partagées à cause de leur vétusté ou de leur formatage incomplet (manque info taxonomique par ex.). J'ai créé des versions locales à jour qui me bouffent la moitié de mon espace disque ce qui est problématique. Je parie que d'autres utilisateurs font de même, du coup il doit exister diverses copies d'une même base de données un peu partout sur l'espace stockage.

Peut être qu'on pourrait instaurer une politique de mise à jour plus régulière (et plus complète) pour que l'ensemble des utilisateurs utilisent les bases partagées sans besoin de dupliquer en local et ainsi sauver de l'espace disque individuel

Bonne soirée
Guillaume

1 « J'aime »

Bonjour Guillaume,

Nous en sommes conscient.
Nous manquons simplement de temps d'humain pour traiter çà et nous regardons plusieurs solutions (CVMFS, biomaj, etc.).

Bonne soirée également

1 « J'aime »

@Guillaume Seriez-vous ok pour participer à ces mises à jours (i.e. avoir les permissions pour mettre à jour le dossier /shared/bank/) ?

Oui absolument, j'allais vous le proposer.

1 « J'aime »

Bonjour,

@Guillaume @lgueguen vous avez maintenant la possibilité de modifier les banques en place sur l'IFB (/shared/bank).

Je vous ai également intégrer dans la @team.bank.
Vous serez donc potentiellement notifié si besoin.

Je vous propose de suivre le fonctionnement ci-dessous.


Gestion du dossier /shared/bank :

  • 1 dossier par banque de données

Dans chacun de ces dossiers :

  • 1 fichier README, dérivant la banque et comment la mettre a jour (commandes à exécuter)
  • 1 dossier par version installée avec pour nom de dossier <version> ou <date-iso>
  • 1 lien "current" qui pointe vers la dernière version du dossier en date

Exemple:

/shared/bank/nt
├─ current -> 2022-O1-18
├─ 2021-01-29
├─ 2022-01-18
└─ README.txt

Rien n'est figé dans le marbre. A adapter ou discuter au besoin

Bonne soirée

1 « J'aime »