Launch failed requeued held jobs

Bonjour,

Depuis le retour après la maintenance du 7 octobre, et comme d'autres utilisateurs, j'ai des problèmes de jobs qui restent dans l'état "launch failed requeued held". Je ne peux lançer aucun job.

Bonne journée,
Marie

1 « J'aime »

Bonjour,
J'ai également la même chose, et une grande liste de jobs ont le même statut.
J'ai eu l'occasion de lancer un job avec les commandes suivantes :

$ sbatch my_program.sbatch
$ scontrol release <jobid>

Mais maintenant, j'ai le statut BeginTime ...

Bonne journée,
Céline

Bonjour,

J'ai eu la même chose ce matin (launch failed requeued held).

Bonne journée,

Abdeljalil

Bonjour,

À priori, tous les jobs en requeued held sont passés sur le noeud 34. Je l'ai mis en quarantaine en attendant d'identifier le problème.

J'ai remis dans la queue les jobs qui étaient bloqués

JC

2 « J'aime »