Installation metaWRAP

Bonjour,

Serait-il possible d'installer metaWRAP et les bases de données correspondantes (surtout Checkm_DB, indexed hg38)?

Il permet l'analyse de données métagénomiques comprenant toutes les étapes essentielles comme read quality control, assembly, binning et annotation.

Dans le cas où il serait plus conseillé de l'installer dans un environnement conda privé, comment puis-je le faire au mieux ?

Merci!

Bonjour @microp ,

Installation en cours :

Merci @gildaslecorguille !

Bonjour,

L'outil est installé mais je crois qu'il faut des banques. Et je n'ai pas encore eu le temps de m'y mettre :confused:

Je tente de m'y mettre.
J'ai trouvé ça :

Pouvez-vous me guider un peu sur ce que vous souhaitez comme banques et indexes ?
J'ai l'impression que ça dépend de l'usage !?

Bonjour,

Pour utiliser tous les modules de metawrap, il faut toutes les banques et indexes qu'ils indiquent dans les instructions (c'est-à-dire CheckM, Kraken1, Kraken2, NCBI_nt, NCBI_tax, Indexed hg38)

Nous utilisons principalement CheckM et Indexed hg38 s'il n'est pas possible de tout installer :slightly_smiling_face:

:white_check_mark: /shared/bank/checkm/2015-01-16
:white_check_mark: /shared/bank/nt/nt_2022-1-18
:white_check_mark: /shared/bank/ncbi_taxonomy/2022-05-20
:white_check_mark: /shared/bank/homo_sapiens/hg38/bmtool
:white_check_mark: /shared/bank/homo_sapiens/hg38/srprism

Kraken[2] peut indexer différentes banques.
J'ai sur l'étagère nt
:orange_circle: /shared/bank/nt/kraken2/2021-02-02

Bonjour,

Merci beaucoup pour l'installation !!

J'ai rencontré un problème avec checkm, est-ce que checkm data setRoot a été exécuté ? Malheureusement je ne semble pas avoir la permission de le faire moi-même

Selon le tutoriel :

Now you need to tell CheckM where to find this data before running anything:

checkm data setRoot # CheckM will prompt to to chose your storage location

On newer versions of CheckM, you would run:

checkm data setRoot /path/to/your/dir/MY_CHECKM_FOLDER

C'est fait :crossed_fingers:

J'ai malheureusement toujours le même problème :confused: (checkm ne semble pas pouvoir accéder aux profils hmm, qui sont cependant installés sous /shared/bank/checkm/2015-01-16)

Quelque chose ne semble pas aller avec checkm lui-même, j'obtiens le message d'erreur suivant:

[Errno 13] Permission denied: '/shared/ifbstor1/software/miniconda/envs/metawrap-1.2/lib/python2.7/site-packages/checkm/DATA_CONFIG'

Sorry, CheckM cannot run without a valid data folder.

Bonjour @microp ,

Nous avons modifié la configuration de checkm. Ca devrait mieux fonctionner maintenant.

Bonne journée

Merci beaucoup, ça a l'air de fonctionner maintenant !

Bonne soirée à vous

Bonjour,

Il y a un problème avec la base de données Kraken:
message d'erreur:

The folder /shared/home/emendes/KRAKEN_DB doesnt exist. Please consult the metaWRAP *****
***** database guite to download and build the KRAKEN database

Bonjour @emendes,

Il n'y a pas encore de base de données installées pour Kraken.
Il convient donc pour l'instant de télécharger ou construire la base qui vous convient dans votre home (~/KRAKEN_DB).

Bonjour,

il semble qu'il y ait aussi un problème avec la banque hg38

/shared/home/rpopall/BMTAGGER_DB/hg38.bitmask file doesnt exist. Please configure your *****bmtagger genome index *****

Selon le tutoriel :

Making host genome index for bmtagger

If you want to remove human (see end of instrutions for non-human hosts) reads from tour sequencing in the READ_QC module, you will need to dowlnoad and index the human genome. See the official bmtagger manual for detailed instructions: https://www.hmpdacc.org/hmp/doc/HumanSequenceRemoval_SOP.pdf

First, lets download and merge the human genome hg38:

mkdir BMTAGGER_INDEX cd BMTAGGER_INDEX wget ftp://hgdownload.soe.ucsc.edu/goldenPath/hg38/chromosomes/*fa.gz gunzip *fa.gz cat fa > hg38.fa rm chr.fa

Now lets index the human genome. Note that the file names of the indeces must be exactly as specified for metaWRAP to recognize them! Also note that indexing will take considerable memory and time (here I pass 100GB of RAM as a -M parameter).

bmtool -d hg38.fa -o hg38.bitmask srprism mkindex -i hg38.fa -o hg38.srprism -M 100000

Note: metaWRAP looks for files hg38.bitmask and hg38.srprism - make sure they are names exactly like this. Done! Now dont forget to specify the BMTAGGER_DB variable in the config-metawrap file! Run which config-metawrap to find it.

BMTAGGER_DB=/path/to/your/index/BMTAGGER_INDEX

Bonjour,

Idem, il n'y a pas de base pour bmtagger.
Il convient donc pour l'instant de la créer (ou simplement indexer une base existante type /shared/bank/homo_sapiens/hg38 avec bmtool) dans votre home (~/BMTAGGER_DB).

Merci ! J'ai crée la base de données dans ~/BMTAGGER_INDEX, mais je n'arrive pas à accéder au fichier config-metawrap pour spécifier BMTAGGER_DB=/path/to/your/index/BMTAGGER_INDEX

La configuration est commune à tout le monde.
Par défaut, le base doit se trouver dans votre home directory sous ~/BMTAGGER_DB

Essayer-donc simplement en renommant votre dossier ou en faisant un lien symbolique vers votre dossier (ln -s BMTAGGER_INDEX BMTAGGER_DB).

1 « J'aime »