discoSNP - problem with graph construction - error

Bonjour,

J'ai un problème avec DiscoSNP.

J'ai déjà essayé plusieurs solutions mais j'ai à chaque fois la même erreur :

[vdaric@cpu-node-27 DiscoSnp]$ run_discoSnp++.sh -r test/fof.txt -T


 Running discoSnp++ 2.3.X, in directory /shared/ifbstor1/software/miniconda/envs/discosnp-2.4.3/bin with following parameters:
         read_sets=test/fof.txt
         prefix=discoRes_k_31_c_3
         c=3
         C=2147483647
         k=31
         b=0
         d=1
         D=100
         s=
         P=3
         p=discoRes
         G=
         e=
         starting date=jeu. janv. 27 16:23:28 CET 2022


 ############################################################
 #################### GRAPH CREATION  #######################
 ############################################################
/shared/ifbstor1/software/miniconda/envs/discosnp-2.4.3/bin/dbgh5 -in test/fof.txt_discoRes_k_31_c_3_D_100_P_3_b_0_removemeplease -out discoRes_k_31_c_3 -kmer-size 31 -abundance-min 3 -abundance-max 2147483647 -solidity-kind one -verbose 1 -skip-bcalm -skip-bglue -no-mphf
[DSK: Pass 1/1, Step 1: partitioning     ]  0    %   elapsed:   0 min 0  sec   remaining:   0 min 0  sec   cpu:  -1.0 %   mem: [  44,   44,   44] MB /shared/ifbstor1/software/miniconda/envs/discosnp-2.4.3/bin/run_discoSnp++.sh : ligne 528 : 30825 Processus arrêté      ${graphCmd}
 there was a problem with graph construction $ reset

J'ai cette erreur quelque soit la version que je charge par module (module load discosnp/2.4.3 ou 2.3.0) ou si j'utilise celle que j'ai installé moi même dans un environnement conda. Je le lance sur les données test fournies par les auteurs dans le sous-repeoire test.

Please help !

Merci !

Bonjour @VDaric ,

J'ai réussit à reproduire le problème qui est dû à l'usage de la mémoire.
Au délà de la mémoire demandée (par défaut 2Go/CPU, cf Slurm at IFB - IFB Core Cluster Documentation), si le programme demande plus de mémoire, il est tué (pour éviter de perturber les autres usages en allouant plus de ressources que celles demandées).

En demandant par exemple 10G (--mem 10G) ça tourne correctement.

Output
$ srun --mem 10G --pty bash
$ module load discosnp/2.4.3
$ run_discoSnp++.sh -r test/fof.txt -T


 Running discoSnp++ 2.3.X, in directory /shared/ifbstor1/software/miniconda/envs/discosnp-2.4.3/bin with following parameters:
	 read_sets=test/fof.txt
	 prefix=discoRes_k_31_c_3
	 c=3
	 C=2147483647
	 k=31
	 b=0
	 d=1
	 D=100
	 s=
	 P=3
	 p=discoRes
	 G=
	 e=
	 starting date=Fri Jan 28 10:35:18 CET 2022


 ############################################################
 #################### GRAPH CREATION  #######################
 ############################################################
/shared/ifbstor1/software/miniconda/envs/discosnp-2.4.3/bin/dbgh5 -in test/fof.txt_discoRes_k_31_c_3_D_100_P_3_b_0_removemeplease -out discoRes_k_31_c_3 -kmer-size 31 -abundance-min 3 -abundance-max 2147483647 -solidity-kind one -verbose 1 -skip-bcalm -skip-bglue -no-mphf
[DSK: nb solid kmers found : 1057        ]  100  %   elapsed:   0 min 3  sec   remaining:   0 min 0  sec   cpu:  89.1 %   mem: [2349, 2352, 2352] MB 
[Bloom: read solid kmers                 ]  99.3 %   elapsed:   0 min 0  sec   remaining:   0 min 0  sec   cpu:  50.0 %   mem: [2350, 2350, 2352] MB 
[Debloom: build extension                ]  100  %   elapsed:   0 min 0  sec   remaining:   0 min 0  sec   cpu:  87.5 %   mem: [2349, 2349, 2352] MB 
[Debloom: finalization                   ]  100  %   elapsed:   0 min 0  sec   remaining:   0 min 0  sec   cpu: 100.0 %   mem: [2349, 2349, 2352] MB 
[Debloom: cascading                      ]  100  %   elapsed:   0 min 0  sec   remaining:   0 min 0  sec   cpu:  33.3 %   mem: [2349, 2350, 2352] MB 
[Graph: nb branching found : 8           ]  99.3 %   elapsed:   0 min 0  sec   remaining:   0 min 0  sec   cpu:  66.7 %   mem: [2350, 2350, 2352] MB 
graph                                   
    gatb-core-library                       
        version                                  : 1.4.1
        git_sha1                                 : notset
        build_date                               : 2020-01-15/00:02:35
        build_system                             : Linux-4.4.0-96-generic
        build_compiler                           : /opt/conda/conda-bld/discosnp_1579046427941/_build_env/bin/x86_64-conda_cos6-linux-gnu-cc  (7.3.0)
        build_kmer_size                          : 32 64 96 128
    host                                    
        name                                     : cpu-node-16.ifb.local
        nb_cores                                 : 56
        memory                                   : 251.6
        disk_current_dir                         : 1762495.3
        max_file_nb                              : 131072
        pid                                      : 43056
    configuration                           
        config                                  
            kmer_size                                : 31
            mini_size                                : 10
            solidity_kind                            : one
            abundance_min                            : 3
            abundance_max                            : 2147483647
            available_space                          : 1804795238
            estimated_sequence_number                : 622
            estimated_sequence_volume                : 0
            estimated_kmers_number                   : 43540
            estimated_kmers_volume                   : 1
            max_disk_space                           : 1804793238
            max_memory                               : 5000
            nb_passes                                : 1
            nb_partitions                            : 56
            nb_bits_per_kmer                         : 64
            nb_cores                                 : 56
            minimizer_type                           : lexicographic (kmc2 heuristic)
            repartition_type                         : unordered
            nb_cores_per_partition                   : 1
            nb_partitions_in_parallel                : 56
            nb_cached_items_per_core_per_part        : 32768
            nb_banks                                 : 2
        system                                  
            cpu                                      : 0.0
    repartition                             
        system                                  
            cpu                                      : 100.0
    dsk                                     
        bank                                    
            bank_uri                                 : test/fof.txt_discoRes_k_31_c_3_D_100_P_3_b_0_removemeplease
            bank_size                                : 107604
            bank_total_nt                            : 200000
            sequences                               
                seq_number                               : 2000
                seq_size_min                             : 100
                seq_size_max                             : 100
                seq_size_mean                            : 100.0
                seq_size_deviation                       : 0.0
            kmers                                   
                kmers_nb_valid                           : 140000
                kmers_nb_invalid                         : 0
        stats                                   
            temp_files                              
                nb_superkmers                            : 13324
                avg_superk_length                        : 10.51
                minimizer_density                        : 2.19
            histogram                               
                cutoff                                   : 5
                nb_ge_cutoff                             : 1057
                ratio_weak_volume                        : 0.00
                first_peak                               : 154
            kmers                                   
                solidity_kind                            : one
                thresholds                               : 3 3 
                kmers_nb_distinct                        : 1062
                kmers_nb_solid                           : 1057
                kmers_nb_weak                            : 5
                kmers_percent_weak                       : 0.5
            partitions                              
                nb_partitions                            : 56
                nb_items                                 : 1057
                part_biggest                             : 39
                part_smallest                            : 6
                part_mean                                : 18.9
                kind                                    
                    vector                                   : 56
            fillsolid_time                           : 0.095
                1.read                                   : 0.067
                2.sort                                   : 0.028
                3.dump                                   : 0.000
        time                                     : 2.875
            fill_partitions                          : 2.645
            fill_solid_kmers                         : 0.230
        system                                  
            cpu                                      : 85.3
    bloom                                   
        stats                                   
            kind                                     : neighbor
            bitsize                                  : 6378
            nb_hash                                  : 4
            nbits_per_kmer                           : 6.034370
        time                                     : 0.022
            build_from_kmers                         : 0.022
        system                                  
            cpu                                      : 33.3
    debloom                                 
        stats                                   
            kind                                     : cascading
            impl                                     : DebloomMinimizerAlgorithm
            bitsize                                  : 7662
            nbits_per_kmer                           : 7.248817
            cfp                                      : 1284
                bloom2                                   : 868
                bloom3                                   : 362
                bloom4                                   : 54
                set                                      : 0
                nb                                       : 144
        time                                     : 0.238
            cascading                                : 0.034
            fill_debloom_file                        : 0.168
            finalize_debloom_file                    : 0.036
        system                                  
            cpu                                      : 90.6
    branching                               
        stats                                   
            nb_branching                             : 8
            percentage                               : 0.8
            checksum_branching                       : c26285a84228c6e7
        time                                    
            build                                    : 0.026
        system                                  
            cpu                                      : 66.7

 Graph creation time in seconds: 4

rm -rf trashme_*

 ############################################################
 #################### KISSNP2 MODULE  #######################
 ############################################################
/shared/ifbstor1/software/miniconda/envs/discosnp-2.4.3/bin/kissnp2 -in discoRes_k_31_c_3.h5 -out discoRes_k_31_c_3_D_100_P_3_b_0 -b 0 -l -P 3 -D 100 -T -coverage_file discoRes_k_31_c_3_cov.h5 -max_ambigous_indel 20 -verbose 1
Input is h5 or _gatb/ (we assume that kmer counting has already been done), we will complete it into a graph if necessary.
[nodes                                   ]  100  %   elapsed:   0 min 0  sec   remaining:   0 min 0  sec
    config                                  
        kmer_size                                : 31
        auth_branch                              : 0
        max_indel_size                           : 100
        max_polymorphism                         : 3
        low                                      : 1
        rad                                      : 0
        traversal                                : contig
    nodes                                   
        nb                                       : 8
    SNP bubbles                             
        nb                                       : 3
            nb truncated (among all)                 : 0
            nb_high                                  : 3
            nb_low                                   : 0
        extensions                              
            none                                     : 0
            left                                     : 0
            right                                    : 0
            left|right                               : 3
    Indel bubbles                           
        nb                                       : 0
        nb_high                                  : 0
        nb_low                                   : 0
        extensions                              
            none                                     : 0
            left                                     : 0
            right                                    : 0
            left|right                               : 0
    time                                    
        find                                     : 47
 Bubble detection time in seconds: 0
 #############################################################
 #################### KISSREADS MODULE #######################
 #############################################################
 /shared/ifbstor1/software/miniconda/envs/discosnp-2.4.3/bin/kissreads2 -predictions discoRes_k_31_c_3_D_100_P_3_b_0.fa -reads test/fof.txt -co discoRes_k_31_c_3_D_100_P_3_b_0_coherent -unco discoRes_k_31_c_3_D_100_P_3_b_0_uncoherent -k 31 -size_seeds 26 -index_stride 6 -hamming 1 -genotype -coverage_file discoRes_k_31_c_3_cov.h5 -verbose 1 
Indexing bank discoRes_k_31_c_3_D_100_P_3_b_0.fa
Mapping of 622 reads
[Mapping read set 0                      ]  321  %   elapsed:   0 min 0  sec   remaining:   0 min 0  sec   cpu: 100.0 %   mem: [   8,    8,    8] MB 
[Mapping read set 1                      ]  321  %   elapsed:   0 min 0  sec   remaining:   0 min 0  sec   cpu: 100.0 %   mem: [  22,   22,   22] MB 
    Stats                                   
        Total Number of Mapped reads             : 642
        Minimal coverage per read set            : 3 3 
    Outputs                                 
        Number of read coherent predictions      : 3
        Number of read uncoherent predictions    : 0
    Time                                     : 0.177
        indexing                                 : 0.003
        mapping reads                            : 0.174
        print results                            : 0.000

 ###############################################################
 #################### SORT AND FORMAT  RESULTS #################
 ###############################################################
 ###############################################################
 #################### CREATE VCF         #######################
 ############################################################### 
/shared/ifbstor1/software/miniconda/envs/discosnp-2.4.3/bin/../scripts/run_VCF_creator.sh -p discoRes_k_31_c_3_D_100_P_3_b_0_coherent.fa -o discoRes_k_31_c_3_D_100_P_3_b_0_coherent.vcf
	##use disco SNPS : discoRes_k_31_c_3_D_100_P_3_b_0_coherent.fa
	##output : discoRes_k_31_c_3_D_100_P_3_b_0_coherent.vcf
...Ghost mode...
...Creation of a vcf without alignment...
... Creation of the vcf file : done ...==> discoRes_k_31_c_3_D_100_P_3_b_0_coherent.vcf

 Vcf creation time in seconds: 0
 ###############################################################
 #################### DISCOSNP++ FINISHED ######################
 ###############################################################
DiscoSnp++ total time in seconds: 5
################################################################################################################
 fasta of predicted variant is "discoRes_k_31_c_3_D_100_P_3_b_0_coherent.fa"
 Ghost VCF file (1-based) is "discoRes_k_31_c_3_D_100_P_3_b_0_coherent.vcf"
 Thanks for using discoSnp++ - http://colibread.inria.fr/discoSnp/ - Forum: http://www.biostars.org/t/discoSnp/
################################################################################################################

Dites-nous si ça fonctionne bien de votre côté.

Merci d'avoir regardé. :ok_hand:

Je m'y repenche dès que j'ai un moment et vous dis. Mais, j'avais lancé mon script en demandant 8 CPUs et 20Go de RAM. :thinking:

Merci beaucoup !

En effet, le problème était dû à un manque de RAM. J'en ai demandé plus et ça a fonctionné ! :slight_smile:

State: COMPLETED (exit code 0)
Nodes: 1
Cores per node: 8
CPU Utilized: 08:12:25
CPU Efficiency: 89.31% of 09:11:20 core-walltime
Job Wall-clock time: 01:08:55
Memory Utilized: 10.24 GB
Memory Efficiency: 51.20% of 20.00 GB

1 « J'aime »