Job cancelled due to time limit ***

Bonjour,
j'essaye d'aligner des reads genomiques sur un genome de reference, j'utilise snakemake mais à chaque fois l'alignement s’arrête avant d être fini :

slurmstepd-cpu-node-5: error: *** JOB 44178531 ON cpu-node-5 CANCELLED AT 2025-02-20T12:08:18 DUE TO TIME LIMIT ***

c'est du paired end illumina environ 2x 50Go / ~90 Gbp / 606265439 séquences
et j'ai 4 échantillons, mais même 1 à la fois ca ne se termine pas.

je peut jouer sur :

nombre de nœuds

nombre de cœurs

mémoire vive pour l'ensemble des cœurs

ou c'est autre chose ?

autre question --rerun-incomplete ca reprend au début de la derniere règle inachevée ? mais pas là ou l'assemblage s'était arrété je suppose ?

merci d'avance
Marina

Bonjour Marina,

La réponse est souvent dans le message d'erreur :wink:

Job [...] cancelled [...] due to time limit

Il faut donc augmenter le temps demandé.

C'est une bonne pratique d'indiquer une limite du temps d’exécution via --time (Slurm Workload Manager - sbatch). Limite correspondant au temps d’exécution estimé + une bonne marge.

De même essayer d'indiquer le projet à utiliser via --account (Slurm Workload Manager - sbatch)

Ca n’empêche pas non plus si possible d'augmenter les ressources (nombre de cœurs) demandés tant que le logiciel gère la parallélisation (thread, multiprocessing, etc). Mais ça c'est très dépendant de l'outil (des options de l'outil).

Bonjour,
merci bien, j'essaye. Il y a t il une méthode pour estimer le temps d'exécution théorique ? parce que je n'en sais rien du tout... :S

Malheureusement non.

C'est l'expérience ou l'experience des collègues qui peuvent aider.
A défaut, les premières fois, on peut être "très large" (plusieurs jours, voire dizaine de jours).

C'est aussi pour ça que c'est une bonne idée d'indiquer le time dans les scripts.
Cela donne une indication quand on reprends ses scripts des mois plus tard ou quand on donne son script au collègue.
De base, c'est indispensable pour l'ordonnanceur pour gérer au mieux les jobs (pro tips: un job "court" sera souvent exécuté rapidement et attendra moins).

ok merci , j vais essayer 3jours, et si ca coupe encore j'allongerais :slight_smile: