Stockage de base de données pour KrakenUniq

Bonjour,

Je travaille sur de la méta-transcriptomique et j'utilise krakenuniq. J'ai réussi à utiliser une base de données fournies par les concepteurs: "MicrobialDB" (384Gb) sur Index zone by BenLangmead.
Serait-il possible de la stocker dans /shared/bank à l'IFB s'il-vous-plaît ?
Elle est facilement téléchargeable avec un wget:
wget https://genome-idx.s3.amazonaws.com/kraken/uniq/MicrobialDB_202008/database.kdb

C'est une base de données indexée pour KrakenUniq qui contient:

  • refseq (Virus, Bacteria Archeae) (déja à l'IFB) ==> env. 1.2Tb
  • EuPathDB ==> env. 15Gb
  • UniVec_core ==> quelques Mb
  • Génome humain GRCh38 (déja à l'IFB) ==> quelques Gb

Dans l'optique de comparer différents outils à partir de la même base de données, je voudrais pouvoir faire les index pour Kraken2 ou KMCP par exemple, mais au vu de la taille des fichiers je ne saurais pas vraiment comment procéder. Pensez-vous que le projet serait faisable ?

En vous remerciant d'avance,
Antonin Colajanni

Bonjour Antonin,

Les bases pour krakenuniq sont en cours de téléchargement. Ce sera terminé demain normalement.

Dans l'optique de comparer différents outils à partir de la même base de données, je voudrais pouvoir faire les index pour Kraken2 ou KMCP par exemple, mais au vu de la taille des fichiers je ne saurais pas vraiment comment procéder. Pensez-vous que le projet serait faisable ?`

Côté espace disque, c'est possible. Si besoin et sur demande (le temps du traitement) nous pouvons monter l'espace projet (/shared/projects/<myproject>) à plusieurs To.
Vous pourriez alors travailler dans cet espace pour créer vos bases et tester.

Côté "faisabilité", cela me dépasse mais on me souffle dans l'oreille:

  • de bien vérifier que les outils offrent la possibilité de créer leur base de données (+ index) à partir des banques refseq, eupathdb, etc.
  • de tester sur une jeu de données réduit (par exemple commencer sur EuPathDB)

Les bases de données pour KrakenUniq sont disponibles:

  • /shared/bank/krakenuniq/microbialdb/2020-08-16
  • /shared/bank/krakenuniq/standard/2022-06-16

Super, merci pour votre réactivité !