J'aurais besoin de vérifier si ces différents outils sont bien installé sur le cluster pour l'ecole thématique bioinfoTE
samtools
bowtie2
bwa
TEtools https://github.com/l-modolo/TEtools
il y a deux modules, l'un est un script python et l'autre un
script R. Il faut que bowtie et bowtie2 soient installés. Il a besoin
de DESeq2 mais je crois qu'il l'appelle directement dans le script R.
dnapipeTE https://github.com/clemgoub/dnaPipeTE
il faut python 3, perl5 et R version 3 minimum. Les autres
dépendances sont incluses (Java 1.8, TRF (Tandem Repeat Finder), GNU
Parallel version 3, Trinity vers. 2.5.1, RepeatMasker, including
RMblastn, et blastn (from blast+ suite). A lyon, on installe le
programme dans son home et on le fait tourner à partir de la sur le
cluster.
outils alignement et phylogenie (phyML, Mafft, trimAL, seaview)
=> Pas forcément nécessaire, pas sure qu'on ait le temps pour un TP
De plus, nous faudrait un espace data partagé accessibles aux apprenants pour
récupérer les données initiales, en 755 si possible (sinon je mettrais
dans mon propre /home)
C'est noté @francoissabot, nous allons faire au mieux avec cette liste la semaine prochaine (cette semaine a été déjà pas mal chargé en installation pour d'autres formations)
Dans l'env Python 3.7 matplotlib dans conda à l'air de fournir pylab et pyplot, ca conviendrait ?
tkinter
tk dans conda fourni les librairies tcl et tk, on pourrait y rajouter le module python tkinter (installé avec pip), ca conviendrait ? (Attention tcl et tk sont des librairies graphiques)
@francoissabot Avez-vous déjà testé un singularity pull pour voir si ça pourrait fonctionner ?
singularity pull docker://urgi/docker_vre_aio
Car vu qu'on est root dans un container, beaucoup de dévelopeur de container garde cette logique jusqu'au bout et vont considérer que l'utilitsateur est root dans le container. Hors, ça n'est pas le cas sous singularity (et c'est pour ça qu'on l').
D'autre vont espérer d'ouvrir un shell dans le container pour l'utiliser ...
Si c'est bon, on pourra vous proposer une image singularity sans soucis si vous nous donner la liste des exécutables auxquels vous faite appel.
Je n'ai pas vraiment trouver d'information concernant la permission ou non de diffuser cette base de donnée, cependant sur leur site ils ont l'air un peu énervé:
Du coup et à priori, nous ne sommes pas autorisés à la mettre a disposition de nos utilisateurs sur le cluster.
@francoissabot un espace /shared/projects/bioinfo_te_2020 a été créé. Seuls les apprenants doivent y avoir accès ? De combien d'espace avez vous besoin ?
Les étudiants peuvent ils conserver le stockage par défaut hard limit: 150 GB sur leurs home?
J'ai essayé de tester les outils TEtools (TEcount.py et TEdiff.R)
Je n'arrive pas à les lancer. Peut etre que je ne le fais pas correctement ?
Le 1er est un script python3 et l'autre un script R.
oui en effet. En ce qui me concerne, c'est l'outil de Laurent Modolo dont j'ai besoin. Il est utilisable en ligne de commande bien qu'il existe comme wrapper galaxy.
REPET
At least, désolé mais c’est quand même un très gros docker.
Par contre, comme je ne connais pas le fonctionnement de REPET, je ne sais pas si il est fonctionnel