Bonsoir à tous,
Etudiant en M2 CCB4 (Compétences Complémentaires en Bioinformatique Biostatistique
pour la Biologie et les sciences Biomédicales) à l'université de Rouen, je dois réaliser un projet d'analyse Bioinformatique.
J'ai décidé consacrer ce projet à la construction d'un graphe pangénome de la famille des Brassicacées, mais centré sur l'utilisation d'un chromosome uniquement par génome. La construction de ce graphe serait basé sur les outils du début de Pipeline Panzone qui sont les suivants :
- Minimap2
- SamTools
- PanGenomeGraphBuilder (PGGB)
- Minicactus2
- Optionnellement Giraffe
Je travaillerai sur un groupe d'un seul chromosome (75 Mb) par génome, pour un total de 6 génomes, soit 450 Mb au total.
Le schéma de mon workflow est présent à cette addresse : Workflow graphe pangénome Brassicacées
Concernant les spécificités de RAM et de stockage estimées pour chaque outil (précisées également sur le schéma), les voici :
- Minimap2 (RAM : 4-8 Gb / Stockage : 10 Gb)
- SamTools (RAM : 2-4 Gb / Stockage : 12 Gb)
- PanGenomeGraphBuilder (PGGB) (RAM : 64 -128 Gb / Stockage : 100 - 200 Gb
- Minicactus2 (RAM : 16-32 Gb / Stockage : 50 - 100 Gb)
- Giraffe (RAM : 10-15 Gb / Stockage : 20-50 Gb)
Ma responsable m'a conseillé de m'adresser à ce forum dans le cadre de l'installation des outils nécessaires à ce projet.
Je n'ai pas encore créé mon projet sur mon compte IFB, ayant préféré demandé la disponibilité de ces outils auparavant, et s'il était possible de les installer.
Je vous remercie par avance de votre aide et m'excuse si il s'avérait que mes informations soient insuffisantes ou mon sujet non-adapté.
Cordialement,