Problème execution de commande

Hello,

je n'arrive plus depuis mardi à executer des commandes sur le core cluster. je peux me déplacer dans mes dossiers, charger des modules mais dès que je lance un srun sur une commande simple et normalement rapide (un fastqc sur un fastq par ex), je n'ai pas de retour et pas possibilité de faire quoi que soit sans faire de ctrl C. je n'ai plus la main et je ne sais pas ce qui se passe !

voici les résultats d'un fichier log après avoir essayé de trimmer deux fastq avec sickle et ça ne m’a pas rendue la main. j'ai du tuer le job .

srun: Job step aborted: Waiting up to 32 seconds for job step to finish.

slurmstepd: error: *** STEP 3341492.0 ON cpu-node-14 CANCELLED AT 2019-11-21T10:46:25

merci par avance pour votre retour !

Chloé

Bonjour Chloe,

Tout semble normal et nous ne constatons pas d'anomalie particulière.
Un simple srun hostname fonctionne.
Je pense que la commande que vous lancé est longue simplement.
Pouvez-vous exécuter srun hostname ?
Et nous donner éventuellement la commande exécutée qui semble poser problème ?

bonjour,

je viens de travailler simplement avec des commandes telles que mv, cp, mkdir … ça fonctionne.
je viens de lancer mon script en sbatch et voici la réponse

sbatch: error: Slurm temporarily unable to accept job, sleeping and retrying

j'ai vérifié ma connection avec mobaxterm et je suis connectée …
je ne comprends tjrs pas je suis désolée de vous embêter avec ce type de problème mais je reste bloquée et ne sais pas pourquoi …

merci d'avance pour votre retour

Chloé

Bonjour Chloé,

Nous rencontrons un problème d'où cette nouvelle erreur...
On regarde ce qui pose problème et on revient vers vous dès que possible.

Merci pour le signalement

Nous avons apporté une modification (paramètre MaxJobCount de Slurm).

Pouvez-vous réessayer à l'occasion et nous confirmer que c'est bon pour vous ?

oui super !!!!

merci beaucoup !!

Chloé