Format fichier de metadonnées et export

Bonjour,
le format excel n'est pas idéal à intégrer dans une pipeline pour un rendu des résultats, est-ce qu’un second format serait envisageable ? Par ailleurs, l'api permet-elle de soumettre les données en phase 2 (métadonnées et fasta) depuis R ou seulement en bash ?

Cordialement.

Bonjour, un autre format que excel n'est pas pris en charge pour l'instant.
Quel autre format auriez vous préféré utiliser?
Vous pouvez soumettre vous données via l'api d'emergen-db (EMERGEN-DB - Login). Un exemple de ligne de commande pour l'upload est affiché dans la partie "Soumission de données" de cette page. Vous pouvez utiliser le language de votre choix afin de soumettre via l'api Emergen-db

Bonjour,

Merci pour la réponse, je souhaitais un format plus simple du type csv ou ficher txt en tabulaire pour exporter mes données depuis R. Pour la soumissions des données via l'API, c'est très bien, mais est-ce que le fichier doit être strictement identique au template de base ? Je produis un fichier .xlsx qui contient une seule feuille avec les métadonnées requises, en gardant les noms des colonnes, mais pas l'esthétiques et pas les autres feuilles du classeur.

Le format xlslx et la structure du fichier de métadonnées ont été définis au début du projet EMERGEN, en concertation avec Santé Publique France, les 4 plateformes rattachées au Centre National de Référence (CNR) et les 43 équipes du réseau ARNS|MIE.

Nous avions initialement envisagé des formats pur texte (qui sont effectivement plus faciles à gérer en traitement automatisé) mais le format Excel était plus approprié pour différentes raisons

  • facilitation de la saisie pour certains laboratoires de séquençage
  • contrôle de conformité sur le contenu de certaines colonnes
  • lisibilité des messages d'erreurs rapportés ligne par ligne lors des tentatives infructueuses de soumission (ce système fonctionne très bien : en pratique les laboratoires corrigent rapidement les erreurs et au 2ème essai les métadonnées passent les tests de conformité).

Dans l'état actuel, les tests de conformité reposent sur le fait que les données soient saisies directement dans le fichier-trame, car certains champs sont générés automatiquement (le champ SI-DEP, sur base d'une formule), et nous vérifions au passage la cohérence entre l'en-tête des colonnes et les spécifications de l'onglet de description de ces colonnes.

R permet de traiter des fichiers excel multi-onglets, une possibilité pour vous serait donc de tenter d'injecter vos valeurs directement dans un fichier-trame. Cette solution serait-elle envisageable ?

Nous pourrions évaluer l'intérêt pour le consortium et la faisabilité pour notre équipe d'une modalité parallèle de soumission basée sur des fichiers texte (csv ou tsv) mais ceci demanderait du temps de développement, que nous ne pourrons pas mobiliser avant d'avoir recruté du personnel en renfort sur EMERGEN.

Cordialement,

Jacques

Bonjour,

Effectivement si sous R je peux injecter les informations dans un fichier trame je suis preneur, cela résout le problème.
Avez vous des packages sous R pour faire cela ?

Cordialement.