Projet Hi-C NovaSeq

Bonjour, nous avons généré 4 Fastq d'Hi-C (R1 et R2 sur 2 lignées) à l'aide d'un NovaSeq6000.
Les Fastq sont comprimés (fastq.gz) et pèsent entre 116 et 96Go.
Sachant qu'il faut trimmer et aligner ces fastq, comment gérer le stockage et la gestion des fichiers intermédiaires générés ?

En vous remerciant d'avance pour votre aide

Thibaut

Bonjour Thibaut,

L'IFB Core ne dispose pas encore d'espace de type "scratch" (espace temporaire dédié au calcul).
Du coup, il faut utiliser/demander un espace projet avec une taille suffisante (une estimation même grossière en fonction de la taille des données d'entrée et des fichiers générées).
Il faut bien sûr limiter autant que possible, en supprimant les fichiers intermédiaires dont on a plus besoin au fur et à mesure, etc.

Je vous invite donc à nous indiquer le nom de votre projet et la taille estimée (on peut augmenter par la suite si c'est insuffisant) ou à créer un nouveau projet, via https://my.cluster.france-bioinformatique.fr/ et le bouton "Request a new project" en indiquant la taille souhaitée.

Salut,
Quand les fichiers sont si volumineux, il est aussi souvent possible de ne pas les décompresser sur le disque en exploitant soit des logiciels capables de traiter directement des fichiers compressés, soit de faire la décompression à la volée en RAM, par ex avec zcat, zgrep etc
Happy I/O :slight_smile:
Pascal

1 « J'aime »