Lecture de fichier xlsx sur Jupyterhub

Bonjour,

Quand je double-clique sur un fichier xlsx avec Jupyterhub il tente de l'ouvrir (je ne sais aps avec quelle appli) puis affiche un message d'erreur:

File Load Error for [file].xlsx
/[path]/[file].xlsx is not UTF-8 encoded

Est-ce qu'il y a une appli qui permet de lire et éventuellement d'éditer des fichiers xlsx ?

Merci

Jacques

Bonjour Jacques,

Par défaut, il n'y a pas d'appli permettant d'ouvrir ou d'éditer des fichiers xlsx (si ce n'est dans python/R pour traitement).
Parmi les extensions il existe des viewers (tel que jupyterlab-spreadsheet) ou des editeurs de fichiers csv/tsv (tel que "spreadsheet-editor") mais cela reste très rudimentaire et je ne le conseillerais pas.

L'erreur renvoyé par Jupyter n'est pas très explicite. Par défaut, il essaie d'ouvrir le fichier avec l'éditeur de texte mais échoue...

Bonne journée

Merci David.
Que recommandes-tu pour pouvoir visualiser, ou même éditer, des fichiers .xlsx ou .docx qui sont dans un espace-projet partagé ? En particulier les .xlsx peuvent être très utiles pour gérer des tableaux de métadonnées associées à un projet. Même des fonctionnalités d'édition rudimentaires peuvent dépanner, en empêchant de devoir transférer les fichiers entre le cluster et son ordi perso.

Le problème ici me semble être le format "xlsx". Peut-être envisager de promouvoir d'autre format comme du "csv" facilement éditable ?

On peut aussi imaginer avoir un éditeur en ligne (type OpenOffice) mais ça me semble trop lourd à mettre en place et maintenir.

Le plus simple est peut-être de monter localement l'espace de stockage avec SSHFS.
Cela permets de voir le dossier distant stocké sur les serveurs de l'IFB comme un dossier local.
On peut ainsi visualiser ou éditer les fichier directement depuis son poste de travail (notamment des fichier "xslx").
C'est très simple sous Linux: Manage your data (get/put/edit/view) - IFB Core Cluster Documentation
Et possible sous Windows notamment via "SSHFS-Win" (SSHFS For Windows):

  1. Installer WinFsp: Release WinFsp 2021 · billziss-gh/winfsp · GitHub
  2. Installer SSHFS-Win: Release SSHFS-Win 2021 · billziss-gh/sshfs-win · GitHub
  3. "Connecter le lecteur réseau"
    connecter-lecteur-reseau
    Puis indiquer l'URL composé de son nom d'utilisateur (user), le serveur (core.cluster.france-bioinformatique.fr) et éventuellement le chemin (en relatif depuis son home) vers son projet (myproject).
    Par exemple, pour accéder à:
    • son espace home: \\sshfs\user@core.cluster.france-bioinformatique.fr
    • son espace projet: \\sshfs\user@core.cluster.france-bioinformatique.fr\..\..\projects\myproject\
      connecter-lecteur-reseau_parametre-thin2
      Maintenant le dossier distant apparaît dans l’explorateur de fichier. Il peut être parcouru et utilisé comme un dossier local.

Il existe peut-être plus simple/évident.
En tout cas, je suis aussi preneur d'idées.

Merci pour ce conseil, David,

J'utilise le format tsv pour la plupart de mes travaux, mais dans certains cas on désire partager des tableaux avec plusieurs onglets, avec du formatage, avec des contraintes de format sur certaines colonnes, ... notamment quand on échange des données avec les biologistes.

Si c'est compliqué pas de problème, il existe d'autres moyens d'accéder à ces fichiers

  1. les transférer (un peu chipo quand même
  2. monter un dossier sur son propre ordi

Je pense que je vais utiliser la seconde option, plus directe.

## Create a mounting moint
mkdir -p ~/mnt/test

## Mount the cluster folder on my computer
sshfs -o allow_other,defer_permissions \
   [login]@core.cluster.france-bioinformatique.fr:path/on/the/cluster \
   ~/mnt/test

## Check the content of the mount point
ls -ltr ~/mnt/test/

Pour moi ça fonctionne (en adaptant le point de montage bien entendu).

A bientôt, et bonnes vacances.

Jacques