Cancelled du to time limit

Bonjour,

Je suis débutante en programmation et je suis un peu perdu.

J'ai exécuté hier un code sur mon projet aisegmentaion qui s'est stoppé avec le message d'erreur : *** JOB 37590727 ON cpu-node-4 CANCELLED AT 2024-01-29T19:12:01 DUE TO TIME LIMIT ***.

Aujourd'hui j'ai voulu le relancer mais mon code est en PENDING depuis 5heures.

Est-ce normal ? Est-ce lié à mon erreur ? Dois-je faire quelque chose pour que mon code puisse s'exécuter ?

Merci d'avance pour votre aide !

Julie

Normalement au login que le serveur, status_bars devrait afficher quelque chose comme ça :

/!\ Your current default is demo with limited resources.
If you already have a project/account, check status_bars --help to change it as default. Otherwise, you have to request one from the platform.

Suivre ce Troubleshooting devrait régler le problème :

https://ifb-elixirfr.gitlab.io/cluster/doc/troubleshooting/#slurm-invalid-account-or-accountpartition-combination-specified

Bonjour @gildaslecorguille ,

J'ai la même erreur depuis une semaine, j'ai un script avec des outils réputés pour leur temps d'exécution pouvant aller jusqu'à une semaine, mais à chaque fois après quelques jours d'exécution, il s'arrête avec cette erreur.: JOB...CANCELLED AT ... DUE TO TIME LIMIT

Pourriez vous svp m'aider

Merci par avance
Olivier

Peux-tu me donner un numéro de job SLURM que je vérifie les réglages ?

@gildaslecorguille Merci pour votre retour, le numero slurm: 40077586

Nous nous sommes mal compris.

Avez-vous un numéro de job où vous avez eu cet erreur : JOB...CANCELLED AT ... DUE TO TIME LIMIT ?

J'ai passé cette commande et il m'a renvoyé les IDS et je crois que c'est le premier avec State=TIMEOUT

--user=myname --starttime=now-14days --format=JobID,JobName,State,Elapsed
JobID           JobName      State    Elapsed
------------ ---------- ---------- ----------
39937644     nextflow_+    TIMEOUT 1-00:00:11
39937644.ba+      batch  CANCELLED 1-00:00:14
39939371     macs2_rep+  COMPLETED   00:00:05

j'ai relancé et rajouté un partition=long et un nombre de jours limit et visiblement il continue de tourner sans soucis

Merci

j'ai relancé et rajouté un partition=long

:ok_hand: