J'ai un petit soucis j'exécute un de mes workflows il a l'air de lancer des les jobs mais quand je fais sur une autre fenêtre squeue -u lkhamvongsacharbonnier je ne vois aucun job c'est comme si avec mon workflow on mouline dans de l'air.
Je vous mets un exemple de ce que j'ai en stdout de snakemake (enfin une partie).
Dans snakemake on peut spécifier des paramètres d'exécution pour le job scheduler. Lucie, pourrais-tu paramétrer slurm pour envoyer les messages d'output et d'erreur vers deux fichiers séparés [prefix]_out.txt et [prefix]_err.txt ?
Ensuite ce sera dans ces fichiers-là qu'il faudra vérifier ce que fait le workflow.
Par ailleurs tu pourrais utiliser squeue en précisant le job qui est en train de tourner (snakemake t'affiche le numéro, dans ton exemple c'est 4751918) plutôt que d'utiliser l'option -u. Ca te permettra de savoir si ce job-là tourne encore ou s'il a réussi ou échoué.
(samtools index -b data/MCF-7/All/SRR5676509.ESR1.MCF-7_vehicle_60min/SRR5676509.ESR1.MCF-7_vehicle_60min.bam data/MCF-7/All/SRR5676509.ESR1.MCF-7_vehicle_60min/SRR5676509.ESR1.MCF-7_vehicle_60min.bam.bai) &> data/MCF-7/All/SRR5676509.ESR1.MCF-7_vehicle_60min/SRR5676509.ESR1.MCF-7_vehicle_60min_bai.log
Submitted job 352 with external jobid 'Submitted batch job 4787272'.
`
squeue avec mon username ou job id voici ce que j'ai :
(base) [lkhamvongsacharbonnier@clust-slurm-client Remap]$ squeue -u lkhamvongsacharbonnier JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON) (base) [lkhamvongsacharbonnier@clust-slurm-client Remap]$ squeue -j 4787272 JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON)
D'après la base d'accounting de slurm, tes jobs (4787272) ont planté instantanément. C'est pour ça que tu ne les voies pas dans squeue qui ne présente que les jobs en attente ou en cours d'execution.
Pour consulter la base d'accounting, tu peux utiliser la commande sacct. Par exemple :
La différence entre tes deux lignes de commande (en plus de --drmaa) est que tu ne précises plus les chemins -o et -e pour les log SLURM.
tu pourrais faire un head de ton cluster-config: metadata/MCF-7/cluster.yaml
Une piste au pif, est ce que le(s) dossier(s) de ces log existe(nt) ?
De mon expérience de SLURM, à chaque fois que mes jobs ont planté sans même les avoir vu en squeue et sans avoir aucune trace ensuite c'est parce que je demandais à écrire des logs dans un dossier qui n'existait pas.