Node & job submission fails

bonjour, j'ai utilisé de façon un peu intensive le cluster ces dernières 24h (nombre de jobs soumis et mémoire requise importants). Un certain nombre de jobs ont crashé (node fail). Depuis ce matin je ne peux soumettre de job, ils restent pending sans node assigné et ne se lancent pas.

Est-ce que tous les nodes fonctionnent correctement (ou suis-je blacklisté)? MErci d'avance


Bonjour,

Pas de blacklist. Simplement une erreur sur un noeud au moment de votre soumission.

Pour les jobs "pending", en cas de charge importante sur le cluster, les jobs peuvent mettre un peu de temps à être lancés. De prime abord, je ne vois pas d'anomalie sur votre job.

Avez-vous toujours le problème ?

merci pour la réponse rapide. Tous les jobs que j'ai lancés cet aprem se sont finis en secondes/minutes (devraient prendre au moins 1h), ont des stderr et out vides mais n'ont pas l'air d'avoir tourné. Par exemple 40086972_* Je viens de les relancer

Le job s'est terminé sans erreur en quelques secondes. Pas d'erreur de mon point de vue côté cluster.
A priori une erreur dans le script. Je peux regarder si vous nous donner le chemin de votre script.

Merci bien, le script est /shared/home/rcoux/ptf_in_neural_crest_dvp/ChIP/bam2sam.sh
Je ne vois pas d'erreur pourtant...

Pour moi le script fonctionne.
Attention, dans votre script $name contient aussi un chemin (par exemple = inputs/i16_3_mapq30) la sortie ${name}.sam sera donc aussi dans ce dossier (par exemple inputs/i16_3_mapq30.sam).
J'y trouve d'ailleurs vos sorties.

Merci d'avoir jeté un oeil et effectivement j'ai oublié d'enlever le prefixe à ${name}. Je l'ai changé pour l'executer directement du dossier inputs et ça a l'air d'avoir tourné, merci pour l'aide!