Bonjour,
J'ai lancé en fin Avril-début Mai plusieurs scripts pour faire tourner Treemix sur la partition long.
Je fais tourner deux types de script, appelés treemix-Step1 et treemix-Step3.
Le problème concerne les jobs avec Treemix-Step3.
sbatch sh_TRMX_CD_SC_GR_Step3.sh : lance lui-même le script
Alors que les premiers runs de Step3 (fin Avril -début Mai, environ jusqu'au 15 Mai) ont bien tourné, avec des durées de 7h à 4j suivant les fichiers input, tous les jobs lancés depuis tournent sans s'arrêter et sans génération de résultats.
Pourtant, aucun message d'erreur ne s'affiche dans .err.
J'ai fait plusieurs tentatives, en changeant le nbre de cpus (entre 6 et 15), la mem (entre 8 et 20G), en changeant en partition (long et fast), sans résultat.
Je suis d'autant plus étonné que ces scripts avaient très bien tourné en 2023 sur ce cluster, sans aucun problème.
Merci d'avance pour votre aide,
Emmanuel
NB: le script sh_TRMX_CD_SC_GR_Step3.sh (je ne peux pas joindre en .txt)
#!/usr/bin/env bash
#SBATCH -o slurm.%N.%j.out
#SBATCH -e slurm.%N.%j.err
#SBATCH --mail-type ALL
#SBATCH --mail-user emmanuel.wicker@cirad.fr
#SBATCH --partition long
#SBATCH --cpus-per-task 6
#SBATCH --mem 8GB
##TREEMIX: RUN FINAL (STEP 3 Carolin DAHMS) ###
##############################################
Rappel des arguments
#infile=$1 # TreeMix input file
#ncore=$2 # maximum number of cores to use
#blockk=$3 # SNP block size
#outgroup=$4 # set outgroup, for an unrooted ML tree put here 'noRoot' (without quotes)
#nboot=$5 # number of bootstrap replicates of tree with migration
#mig=$6 # number of migration events
#outname=$7 # name for output file
#runs=$8 # number of independent runs (N)
#tree=$9 # name of consensus tree build without migration events (in newick format) built in Step 1
#pathP=${10} # path to Phylip consense program
##Script principal
module load treemix/1.13
module load parallel/20190322
module load phylip/3.697
#SUR SC-GR, le m optimal est 9, d'après la meth linéaire.
#Nb cores = nbre de m testés (6 suite à l'optimisation). Ici on teste avec blocs de 500, et 500 boostraps, m =6, 30 runs
Script: dans ./TR4_CAV180/SC-GR
sh /shared/projects/pop_genomics_of_fusarium_foc/TREEMIX/TR4_CAV180/TreeMix-main_CarolinDahms/Step3_TreeMix.sh
/shared/ifbstor1/projects/pop_genomics_of_fusarium_foc/TREEMIX/TR4_CAV180/SC-GR/sc-gr_o_input.gz
9
500
OUTGROUP
500
9
sc-gr_o_M9_out_fin
30
/shared/ifbstor1/projects/pop_genomics_of_fusarium_foc/TREEMIX/TR4_CAV180/SC-GR/sc-gr_outg_constree.newick
/shared/software/miniconda/envs/phylip-3.697/share/phylip-3.697-0/exe/consense
module purge