Bonjour,
Je semble rencontrer un probleme avec les noeuds gpu.
J'utilise un pipeline snakemake qui fonctionne habituellement sans problème, et l'une des etapes (basecalling) fait appel à un noeud gpu (j'utilise tout le même) via le paramètre slurm_extra="--gres=gpu:3g.20gb:1"
mais j'obtient actuellement l'erreur suivante :
SLURM job submission failed. The error message was sbatch: error: Batch job submission failed: Requested node configuration is not available
J'ai aussi essayé en demandant: --gres=gpu:7g:40gb:1
et même erreur.
Le seul qui semble fonctionner de prime abord c'est --gres=gpu:2g:10gb:1
mais quand je regarde le job avec squeue je vois :
52174530 gpu c404b386 fbernard PD 0:00 1 (ReqNodeNotAvail, May be reserved for other job)
J'imagine donc qu'il ne va jamais démarrer.
Pourriez vous me dire s'il y a un soucis sur les noeuds gpu et/ou si ça vient de moi ?
Merci par avance.