Problème (core dump)

Bonjour,
Suite au lancement d'un script avec l'outil samtools (script très simple), dans lequel il y avait sûrement une bêtise...Et qui a engendré de grosses erreurs que je ne comprends peut-être pas bien:

srun: error: cpu-node-19: task 0: Segmentation fault (core dumped)
[W::bam_hdr_read] EOF marker is absent. The input is probably truncated
samtools sort: truncated file. Aborting
srun: error: cpu-node-19: task 0: Exited with exit code 1
samtools index: "/shared/projects/dubii2021/eflaven/Projet_tutor_EF_2021/rawdata/runALL/samtools/align_hapl1_hapl2.sort.bam" is in a format that cannot be usefully indexed
srun: error: cpu-node-19: task 0: Exited with exit code 1
samtools idxstats: failed to read header for "/shared/projects/dubii2021/eflaven/Projet_tutor_EF_2021/rawdata/runALL/samtools/align_hapl1_hapl2.sort.bam"
srun: error: cpu-node-19: task 0: Exited with exit code 1
Failed to read header for "/shared/projects/dubii2021/eflaven/Projet_tutor_EF_2021/rawdata/runALL/samtools/align_hapl1_hapl2.sort.bam"
srun: error: cpu-node-19: task 0: Exited with exit code 1
samtools coverage: Could not read header for "/shared/projects/dubii2021/eflaven/Projet_tutor_EF_2021/rawdata/runALL/samtools/align_hapl1_hapl2.sort.bam": Broken pipe
srun: error: cpu-node-19: task 0: Segmentation fault (core dumped)
srun: Job step aborted: Waiting up to 32 seconds for job step to finish.
srun: got SIGCONT
slurmstepd: error: *** JOB 16864580 ON cpu-node-19 CANCELLED AT 2021-05-26T09:10:06 ***
srun: forcing job termination
srun: error: cpu-node-19: task 0: Terminated

Je ne peux plus rien lancer même des choses simples, j'ai toujours le même message et un core.out qui sort...

srun: error: cpu-node-19: task 0: Bus error (core dumped)

Je suis désolée je pense que dans mon script les tasks lancées comme indépendantes ne l'étaient pas, c'est plus ou moins ce que je comprends...
En tout cas je suis bloquée et bien embêtée,
Merci de votre aide,
Elodie

@eflaven , peux-tu nous donner ton script sbatch ou ta ligne de commande ?

Oui voici mon script sbatch : J'ai peut-être modifié les demandes de ressources car j'avais réessayé de lancer juste quelques lignes.

#!/bin/bash
#SBATCH -p fast
#SBATCH --cpus-per-task=20
#SBATCH --mem=30G

module load samtools/1.10

file_path="/shared/projects/dubii2021/eflaven/Projet_tutor_EF_2021/rawdata/"

srun samtools view --threads 10 -S -b "${file_path}"runALL/minimap2/align_asmhapl1hapl2_ChloroCd.sam > "${file_path}"runALL/samtools/align_asmhapl1hapl2_ChloroCd.bam

srun samtools view --threads 20 -S -b "${file_path}"runALL/minimap2/align_hapl1_hapl2.sam > "${file_path}"runALL/samtools/align_hapl1_hapl2.bam

srun samtools sort "${file_path}"runALL/samtools/align_asmhapl1hapl2_ChloroCd.bam -o "${file_path}"runALL/samtools/align_asmhapl1hapl2_ChloroCd.sort.bam

srun samtools sort "${file_path}"runALL/samtools/align_hapl1_hapl2.bam > "${file_path}"runALL/samtools/align_hapl1_hapl2.sort.bam

srun samtools index "${file_path}"runALL/samtools/align_asmhapl1hapl2_ChloroCd.sort.bam

srun samtools index "${file_path}"runALL/samtools/align_hapl1_hapl2.sort.bam

srun samtools idxstats "${file_path}"runALL/samtools/align_hapl1_hapl2.sort.bam > "${file_path}"runALL/samtools/results_flagstat_idxstats/align_hapl1_hapl2.sort.bam.idxstats

srun samtools flagstat "${file_path}"runALL/samtools/align_hapl1_hapl2.sort.bam > "${file_path}"runALL/samtools/results_flagstat_idxstats/align_hapl1_hapl2.sort.bam.flagstat

srun samtools idxstats "${file_path}"runALL/samtools/minimap2_asmtotVSrunallCCS.sort.bam > "${file_path}"runALL/samtools/minimap2_asmtotVSrunallCCS.sort.bam.idxstats

srun samtools flagstat "${file_path}"runALL/samtools/minimap2_asmtotVSrunallCCS.sort.bam > "${file_path}"runALL/samtools/minimap2_asmtotVSrunallCCS.sort.bam.flagstat


srun samtools coverage -m "${file_path}"runALL/samtools/minimap2_asmtotVSrunallCCS.sort.bam 

srun samtools coverage -m "${file_path}"runALL/samtools/align_hapl1_hapl2.sort.bam 

srun samtools depth -X -aa -d 1000000 "${file_path}"runALL/samtools/minimap2_asmtotVSrunallCCS.sort.bam "${file_path}"runALL/samtools/minimap2_asmtotVSrunallCCS.sort.bam.bai > minimap2_asmtotVSrunallCCS_depth.txt

srun samtools depth -X -aa -d 1000000 "${file_path}"runALL/samtools/align_hapl1_hapl2.sort.bam "${file_path}"runALL/samtools/align_hapl1_hapl2.sort.bam.bai > align_hapl1_hapl2_depth.txt

Merci,
Elodie

@eflaven, avez-vous toujours ce problème (je ne constate pas d'erreur pour lancer des srun) ?
L'erreur de base vient probablement du fichier d'entrée, en effet, la lecture du fichier BAM semble échouer ([W::bam_hdr_read] EOF marker is absent. EOF = "End Of File").

Merci,
J'ai depuis relancé des jobs qui ont fonctionné. Je n'ai pas vraiment compris le problème, mais apparemment il est résolu... :sweat_smile:
Bonne journée,
Elodie

Ok. Tant mieux !

Bonne journée