je n'arrive plus depuis mardi à executer des commandes sur le core cluster. je peux me déplacer dans mes dossiers, charger des modules mais dès que je lance un srun sur une commande simple et normalement rapide (un fastqc sur un fastq par ex), je n'ai pas de retour et pas possibilité de faire quoi que soit sans faire de ctrl C. je n'ai plus la main et je ne sais pas ce qui se passe !
voici les résultats d'un fichier log après avoir essayé de trimmer deux fastq avec sickle et ça ne m’a pas rendue la main. j'ai du tuer le job .
srun: Job step aborted: Waiting up to 32 seconds for job step to finish.
slurmstepd: error: *** STEP 3341492.0 ON cpu-node-14 CANCELLED AT 2019-11-21T10:46:25
Tout semble normal et nous ne constatons pas d'anomalie particulière.
Un simple srun hostname fonctionne.
Je pense que la commande que vous lancé est longue simplement.
Pouvez-vous exécuter srun hostname ?
Et nous donner éventuellement la commande exécutée qui semble poser problème ?
je viens de travailler simplement avec des commandes telles que mv, cp, mkdir … ça fonctionne.
je viens de lancer mon script en sbatch et voici la réponse
sbatch: error: Slurm temporarily unable to accept job, sleeping and retrying
j'ai vérifié ma connection avec mobaxterm et je suis connectée …
je ne comprends tjrs pas je suis désolée de vous embêter avec ce type de problème mais je reste bloquée et ne sais pas pourquoi …