Usage de Kraken : BD?

Bonjour,
Je vois que le logiciel Kraken est disponible en module load sur le cluster.
Est-ce qu'il y a une DB associée ou il faut se la créer soi-même ?
Merci d'avance,
Claire

Certaines DB précalculées sont téléchargeables depuis le github de kraken2 : https://benlangmead.github.io/aws-indexes/k2

Tu as combien d'identités @clairetn @ctn :stuck_out_tongue:

Est-ce que je peux me contenter de télécharger chaque archives et de les décompresser ?

Bonjour,

j'aurais aimé savoir si les bases de données avaient été téléchargées. Et si ces dernières étaient compatibles avec Kraken2 ? Car je ne pense pas que ça soit le cas...

Comme je dois utiliser Kraken2, je dois également utiliser une base de données spécifique au logiciel... Mais cette dernière est trop grande pour que je la télécharge provisoirement sur mon espace de projet :slightly_frowning_face:

Si nécessaire voici les lignes de commande pour la base de données :

kraken2-build --download-library nt --threads 20 --db {chemin_de_stockage}/nt --use-ftp
kraken2-build --download-taxonomy --threads 20 --db {chemin_de_stockage}/nt --use-ftp

En vous remerciant par avance,
Aurélie

Jobs en cours

:clock10:

Merci beaucoup ! :slight_smile:

(re)Bonjour,

Je m'excuse de vous déranger mais j'aurais aimé savoir si la base de données avait été téléchargée sans problème.
Serait-il également possible de m'indiquer l'emplacement de cette dernière sur le serveur ? J'ai supposé qu'elle serait placée dans /shared/bank/nt/current mais ce n'est pas le cas... :slight_smile:

En vous remerciant d'avance,
Aurélie

Ah oui, désolé, j'ai oublié de vérifier.
Je crois que le job s'arrêté car il a passé les 24h :confused:

Je relance sur la partition long

Pour suivre le job :

sacct -j 1491929

L'emplacement : /shared/bank/nt/nt_2021-01-29/kraken2

Merci !
Le job s'est terminé sans retourner d'erreurs. :slight_smile:

Seulement la base de données ne semble toujours pas fonctionner... Lorsque je teste ma commande Kraken2, le logiciel me retourne l'erreur suivante :

kraken2: database ("/shared/bank/nt/nt_2021-01-29/kraken2/library/nt") does not contain necessary file taxo.k2d

Et j'ai beau rechercher dans les fichiers, je ne trouve pas ce fichier non plus.

Il semblerait que je me sois trompée dans l'ordre des commandes. Il faudrait apparemment faire [Lien] :

kraken2-build --download-taxonomy --db $DBNAME --use-ftp

puis

kraken2-build --download-library nt --db $DBNAME --use-ftp
kraken2-build --build --db $DBNAME

En m'excusant de mon erreur et en vous remerciant encore pour votre aide,
Aurélie

J'ai juste relancer la dernière étape vu que les 2 autres avait à priori tourné

Super merci !
Par contre il semblerait y avoir eu un soucis avec la mémoire vive ? :slight_smile:

Failed attempt to allocate 243640340480bytes;
you may not have enough free memory to build this database.
Perhaps increasing the k-mer length, or reducing memory usage from
other programs could help you build this database?
build_db: unable to allocate hash table memory
xargs: cat: terminated by signal 13

sacct -j 15039003

Voyons si ça passe avec 500GB :crossed_fingers:

Sinon, on augmentera en effet la taille des k-mers

Croisons les doigts :crossed_fingers: :crossed_fingers: :crossed_fingers: :crossed_fingers: :crossed_fingers:

Désolée de vous embêter autant avec cette base de données !

$ ll /shared/bank/nt/nt_2021-01-29/kraken2
total 240866252
-rw-rw-r-- 1 glecorguille glecorguille 243640340512 Feb 21 17:08 hash.k2d
drwxrwxr-x 3 glecorguille glecorguille         4096 Feb 15 18:35 library
-rw-rw-r-- 1 glecorguille glecorguille           56 Feb 21 17:08 opts.k2d
-rw-rw-r-- 1 glecorguille glecorguille   2828369642 Feb 18 11:19 seqid2taxid.map
-rw-rw-r-- 1 glecorguille glecorguille    174637780 Feb 21 13:28 taxo.k2d
drwxrwxr-x 2 glecorguille glecorguille         4096 Feb 18 11:08 taxonomy
-rw-rw-r-- 1 glecorguille glecorguille      3537616 Feb 18 11:19 unmapped.txt

On a ce fameux taxo.k2d :+1: