Dépôt séquences qualité prof <1000X et/ou couv<99%

Bonjour,

Concernant le dépôt des données de séquençage du SARS-CoV-2, que doit-on faire des données avec une profondeur <1000X et/ou couverture <99% ?
Doit-on les déposer également sur Emergen ?
Doit-on les enlever de nos données avant le dépôt ?
Existe-t-il des seuils de qualité en dessous desquels nos séquences ne doivent pas être déposées ?
Doit-on déposer tout ce qu’on séquence quelque soit la qualité ?

Merci d'avance pour votre réponse,

Bien cordialement

Bonjour

Toutes les séquences produites doivent être déposées sur EMERGEN, d'une part pour pouvoir assurer la traçabilité des séquençages réalisés (et effectuer un rétrocontrôle vers les agences commanditaires), et d'autre part parce que certaines informations de séquence pourraient éventuellement servir dans le cadre de questions spécifiques.

Au cas où les régions couvertes ne permettent pas à nextclade ou pangolin de déterminer la nomenclature des variants, il faut indiquer VAR_IND dans la colonne Résultat des métadonnées. Les résultats VAR_IND ne seront pas soumis aux dépôts internationaux.

Le seul cas où EMERGEN ne prend pas de séquence est pour les prélèvements non-conformes (PREL_NC dans la colonne Résultats), qui correspondent à des échantillons dont le volume est insuffisant pour procéder au séquençage.

Indépendamment de la nomenclature des variants, il est important de convenir entre toutes les plateformes de seuils de couverture, profondeur et de qualité qu'EMERGEN appliquera pour soumettre des séquences aux dépôts internationaux (GISAID et EBI-ENA).

Je vais solliciter les responsables du WP séquençage dans le consortium afin d'obtenir leurs recommandations.

Cordialement,

Jacques van Helden

Bonsoir,

Si je comprends bien, quand le résultat est VAR_IND, une séquence (même de mauvaise qualité) est attendue (sinon => non conformité) mais ne sera pas soumise plus tard. C'est bien ça ?
Pour les échantillons pour lesquels nous n'obtenons même pas une séquence consensus, comment faire si une séquence est attendue ?

Pour information, nous indiquons également VAR_IND quand la couverture est insuffisante alors même que NextClade ou Pangolin ont permis de déterminer la nomenclature des variants. Un consensus est absolument nécessaire.

Merci,

Cordialement,

Audrey Mirand
Virologie CHU Clermont-Ferrand

Si je comprends bien, quand le résultat est VAR_IND, une séquence (même de mauvaise qualité) est attendue (sinon => non conformité) mais ne sera pas soumise plus tard. C'est bien ça ?

Exactement. Nous venons d'en discuter hier avec le CNR de Pasteur et avec Santé publique France.
Pour différentes raisons (traçabilité, analyse statistique de la qualité, remontée vers le ministère, remboursement des actes de séquençage) il est nécessaire que toutes les séquences produites soient soumises à EMERGEN-DB.

Par contre, il est clair que seules les séquences de qualité suffisante pour avoir donné lieu à une identification de variants seront soumises aux dépôts internationaux.

Nous allons communiquer cette information à l'ensemble des laboratoires séquenceurs.

Pour les échantillons pour lesquels nous n'obtenons même pas une séquence consensus, comment faire si une séquence est attendue ?

Excellente question. Actuellement le système requiert une séquence pour pouvoir prendre en considération.

Nous envisageons d'ajouter au fichier-trame une colonne supplémentaire pour que les laboratoires séquenceurs puissent signaler ce type de problème. Ceci demande un accord de l'ensemble des acteurs concernés : SpF, l'IFB (pour adapter la DB) et les laboratoires séquenceurs (qui devront adapter leurs scripts pour générer les fichiers de métadonnées conformes à ce changemnet du fichier-trame).

Ceci ne sera pas possible dans l'immédiat, mais nous reviendrons sur la question dès la rentrée.

Pour information, nous indiquons également VAR_IND quand la couverture est insuffisante alors même que NextClade ou Pangolin ont permis de déterminer la nomenclature des variants. Un consensus est absolument nécessaire.

Ceci mériterait une discussion lors d'une prochaine réunion du consortium. Il y a plusieurs façons de gérer ce type de situation, et il faudra faire un choix en tenant compte des avantages et inconvénients des différentes solutions.

Cordialement

Jacques

Bonsoir,

Merci pour vos réponses.
Pour information, nous procédons de la façon suivante : pour toutes les séquences pour lesquelles nous avons soit une séquence de moindre qualité (séquence consensus obtenue mais qualité insuffisante pour assignation fiable du clade et donc rendue VAR_IND) soit absence de séquence consensus (échec du séquençage et rendue VAR-IND), l'en-tête de la séquence apparaît bien dans le fichier fasta mais sans séquence nucléotidique associée.
Cordialement,

Audrey Mirand