Problème pour soumettre sur partition Long

Bonjour,
je voulais exécuter Spades sur la partition long mais le job s'annule immédiatement. scontrol show job m'indique que le job est JobState=FAILED Reason=NonZeroExitCode. De plus je n'ai aucun sortie Output ou Error alors que mon script /shared/home/tduge/vmi_genome/spades.sh contient bien
#SBATCH --output=/shared/home/tduge/vmi_genome/out.spades_%j
#SBATCH --error=/shared/home/tduge/vmi_genome/err.spades_%j
Il doit bien y avoir une erreur, mais je ne vois pas où!

Merci d'avance!

Bonjour Thomas,

Je n'arrive pas à reproduire l'erreur systématiquement.
Ce qui m'étonne c'est que j'ai bien constaté, comme vous, des jobs "JobState=FAILED Reason=NonZeroExitCode" (en reprenant vos paramètres).
Je m'explique pas trop le problème pour l'instant.

Constater-vous toujours le problème ?

Bonjour,
le job s'est finalement exécuté. c'est étrange, je n'ai rien changé au script de soumission! la différence est le noeud d'exécution, là il tourne sur le cpu-node-13. Les échecs concernaient à chaque fois le cpu-node-14.

Merci!

Ah oui, bien vu !
Je constate la même chose, tous les jobs échoués étaient attribués à cpu-node-14.

On va pousser les recherches dans ce sens. Merci :slight_smile:

Bonjour,

Le stockage était inaccessible sur le nœud de calcul cpu-node-14, causant le crash des jobs lancés sur ce nœud.
C'est résolu.

Merci @TDDB pour le signalement et l'aide.

Bonne journée.

Pas de souci, merci à vous pour votre réactivité!