Bonjour à tous,
Je rencontre une erreur au moment de la relaxation en utilisant AlphaFold 2.3.2 pour modéliser une protéine d'environ 250aa :
I0528 01:37:39.007138 47911190556352 amber_minimize.py:408] Minimizing protein, attempt 1 of 100.
I0528 01:37:39.463769 47911190556352 amber_minimize.py:69] Restraining 1880 / 3786 particles.
I0528 01:37:39.544041 47911190556352 amber_minimize.py:418] No compatible CUDA device is available
[...]
ValueError: Minimization failed after 100 attempts.
Il y a égalements ces erreurs qui s'affichent au lancement du script :
I0527 13:09:12.870732 47911190556352 templates.py:857] Using precomputed obsolete pdbs /shared/bank/alphafold2/current/pdb_mmcif/obsolete.dat.
I0527 13:09:13.354506 47911190556352 xla_bridge.py:353] Unable to initialize backend 'tpu_driver': NOT_FOUND: Unable to find driver in registry given worker:
I0527 13:09:14.422935 47911190556352 xla_bridge.py:353] Unable to initialize backend 'rocm': NOT_FOUND: Could not find registered platform with name: "rocm". Available platform names are: Interpreter Host CUDA
I0527 13:09:14.423310 47911190556352 xla_bridge.py:353] Unable to initialize backend 'tpu': module 'jaxlib.xla_extension' has no attribute 'get_tpu_client'
I0527 13:09:14.423387 47911190556352 xla_bridge.py:353] Unable to initialize backend 'plugin': xla_extension has no attributes named get_plugin_device_client. Compile TensorFlow with //tensorflow/compiler/xla/python:enable_plugin_device set to true (defaults to false) to enable this.
Pour référence, voici le script utilisé :
#!/bin/bash
#SBATCH -A abca4_g1961e
#SBATCH -p gpu
#SBATCH --gres=gpu:1g.5gb:1
#SBATCH --cpus-per-task=8
#SBATCH --mem=50G
#SBATCH --job-name=abca4_human_nbd2
#SBATCH -o %x.o%j
#SBATCH -t 24:0:0
module load alphafold/2.3.2
run_alphafold.sh
[...]
En lançant le script sur un autre nœud avec ces paramètres : --gres=gpu:3g.20gb:1 ; j'obtiens les mêmes erreurs au lancement (unable to initialize backend '...')
Avez-vous déjà rencontré ce problème ?
Merci d'avance,
Clément