Hello,
j'aimerais faire des analyses GWAS sur le cluster, avec cet outils en python :
Je bloque sur la configuration du docker. Je ne suis pas familière avec ça.
J'ai lu que ca devait être possible via la commande singularity, mais cela ne fonctionne pas pour moi.
singularity exec docker build -t IMAGENAME .
Est ce que c'est possible de faire ca ?
Si quelqu'un a une idée pour m'aider, merci d'avance
Marina
A noter que pour créer une image, il faut des droits root. On pourra donc, par exemple, créer l'image sur son poste et transférer l'image à utiliser sur le cluster.
A tester aussi, mais je pense que le module python/3.9 devrait être suffisant pour exécuter permGWAS
Je suis pas sûr d'avoir bien répondu mais c'est les infos que je voulais donner.
mferrand pour le login utilisateur
sur /shared/ifbstor1/home/mferrand/
pour utiliser permGWAS avec l'interface ondemand // Rstudio
je pourrais faire des chunks bash et python, dans un Rmd, si j'ai bien compris, ca doit etre faisable comme ca.
merci d'avance !
C'est noté pour le login.
Pour la partie "projet" je voulais dire pour quel "projet" enregistré sur l'IFB Core on doit vous donner l'accès GPU. Plus d'infos sur la notion de projet sur l'IFB: https://ifb-elixirfr.gitlab.io/cluster/doc/data/project/
Par exemple stressnet2 ou 2329_fair_bioinfo dans votre cas.
Si cela ne corresponds pas, n'hésitez pas à demander un nouveau projet (via https://my.cluster.france-bioinformatique.fr/ et le bouton "Request a new project").
Dites-moi le nom du projet, on vous donnera l'accès GPU en suivant.
Hello,
non pas stressnet2 ca n'a rien avoir,
et 2329_fair_bioinfo je ne sais pas si ca va rester longtemps ouvert puisque c était la formation de la semaine derniere. Y a pas possibilité de le mettre dans un autre dossier de mon compte le droit ?
merci d'avance
Les espaces de formations sont utiles le temps de la formation.
Je vous invite à demander un nouveau projet via https://my.cluster.france-bioinformatique.fr/ et le bouton "Request a new project", correspondant à votre projet en question (cela facilite la gestion et corresponds à une bonne pratique)
Du coup, je viens de vous donner accès au GPU pour ce projet.
N'oubliez pas de préciser le nom du projet et la partition lorsque vous lancez votre job (--partition=gpu et --account=roothair).
Pensez également à vérifier le bon usage des ressources, notamment du GPU (Troubleshooting - IFB Core Cluster Documentation)
question subsidiaire: pourquoi faire du RStudio pour lancer un module python ? Il me semble qu'un notebook Jupyter serait plus adapté dans ce cas.
Module Environment nécessite d'être charger dans Bash. Ce qui est fait par défaut... excepté dans certains cas. Et dans le cas d'un RMarkdown, je ne sais pas trop comment faire. Il faut qu'on fouille si c'est vraiment nécessaire.
Non c'est pas obligatoirement necessaire, juste on m'a dit que j avais cas utiliser le truc avec lequel j'étais le plus à l'aise, donc Rstudio, vu que j croyais qu 'on pouvait lancer des commande bash et python dans des chunks.
Ok pour Jupyter.
J'ai lancé le script avec les data de démo;
Hello,
j'ai mis les lignes dans le terminal de Jupyter.
mferrand@gpu-node-01:roothair$ module load python/3.9
mferrand@gpu-node-01:permGWAS$ python3 permGWAS.py -x ./data/x_matrix.h5 -y ./data/y_matrix.csv
Traceback (most recent call last):
File "/shared/ifbstor1/projects/roothair/permGWAS/permGWAS.py", line 4, in
from preprocessing import prepare_data as prep
File "/shared/ifbstor1/projects/roothair/permGWAS/preprocessing/prepare_data.py", line 6, in
from preprocessing import load_files
File "/shared/ifbstor1/projects/roothair/permGWAS/preprocessing/load_files.py", line 7, in
from pandas_plink import read_plink1_bin
ModuleNotFoundError: No module named 'pandas_plink'