Chaque mois, un membre de l’AEEMA met en avant un article scientifique de son choix.IDLucie

Ce mois-ci, Lucie Collineau, post-doctorante à l’Agence de Santé Publique du Canada, vous propose l’article «First step in using molecular data for microbial food safety risk assessment; hazard identification of Escherichia coli O157:H7 by coupling genomic data with in vitro adherence to human epithelial cells» écrit par Pielaat et al. et publié dans International Journal of Food Microbiology en 2015.

Cet article est disponible ici.

Pouvez-vous nous résumer brièvement l’article ?

L’utilisation de données de séquençage complet du génome (whole genome sequencing ou WGS) promet d’améliorer la surveillance épidémiologique et l’évaluation des risques liés aux dangers microbiologiques dans les aliments. La méthode d’intégration de données de WGS dans un modèle d’évaluation des risques reste cependant à développer. Cet article propose une utilisation concrète de données de WGS pour l’identification du danger lié aux E. coli productrices de Shiga toxines (STEC). 38 souches de STEC d’origine humaine et bovine collectées aux Pays-Bas ont été séquencées et leurs variations nucléotidiques (Single Nucleotid Polymorphism ou SNPs) identifiées par comparaison à un génome de référence. La virulence de chaque souche a d’autre part été quantifiée à l’aide d’un modèle in-vitro d’adhésion aux cellules intestinales humaines. Un premier modèle de régression linéaire univarié a permis d’identifier 38 SNPs significativement associés à une augmentation de virulence parmi les 27,980 SNPs présents. Après correction de l’effet population (modèle de régression mixte), un seul SNP avait un effet significatif. L’étude a souligné trois défis majeurs pour ce type d’analyse : i) le nombre très élevé de SNPs à tester par rapport au nombre d’observations (souches) disponibles, conduisant à un risque élevé d’erreur de type I, ii) une faible fréquence des allèles mineurs et iii) la difficulté d’interpréter la signification biologique des associations observées (notamment pour les mutations synonymes).

Pourquoi avoir choisi de mettre en avant cet article ?

De plus en plus d’articles soulignent l’incroyable potentiel des données de WGS, et la façon dont celles-ci vont révolutionner nos méthodes de surveillance épidémiologique et d’évaluation des risques. Peu d’études en revanche en présentent une application concrète, et l’article de Pielaat et al. est unique en ce sens. En appliquant des méthodes d’analyse statistique classiques (modèles de régression) à des données innovantes (WGS), cette étude souligne la difficulté d’analyser et d’interpréter ce type de données, et donc de les intégrer à nos systèmes actuels de surveillance et d’analyse de risque. Il s’agit en effet de traduire une information multi-dimensionnelle (de l’ordre de 10^4 SNPs) en un nombre restreint de variables d’intérêt sur le plan phénotypique (e.g. virulence, survie, résistance), qui elles-mêmes pourront être agrégées en une mesure unique du niveau de risque (e.g. nombre de cas). Les méthodes pour y parvenir en sont encore à leur balbutiement. Nous travaillons actuellement au développement de ces méthodes à l’Agence de Santé Publique du Canada. Je travaille plus particulièrement sur l’intégration de données de WGS dans un modèle d’évaluation du risque de salmonelles résistantes aux antibiotiques chez les poulets de chair.

Y a-t-il des points abordés dans l’article qui vous ont laissé perplexe ou que vous auriez aimé voir plus développés ?

La méthode présentée dans l’article repose sur l’analyse des SNPs des souches de STEC. Une analyse gène par gène (qui étudie les variations des allèles des gènes plutôt que les variations de chaque nucléotide pris individuellement) est évoquée rapidement dans la discussion mais peu développée. Elle semble pourtant une approche prometteuse pour réduire le nombre de biomarqueurs d’intérêt à tester, qui a été identifié comme une des difficultés majeures de l’analyse. Certains SNPs identifiés étaient en effet situés à des positions voisines sur le génome et pourraient être regroupés au sein des mêmes gènes. Il serait donc intéressant de répéter l’étude en utilisant cette fois une approche de type cgMLST (core genome multilocus sequence typing), afin d’identifier les gènes significativement associés à la virulence des STEC.

 

Merci à Lucie Collineau ( Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.) pour sa contribution.

Vous aussi souhaitez proposer un article scientifique pour cette rubrique ? Consultez les recommandations et envoyez-nous votre contribution.

A noter qu’il n’y a pas de comité de lecture pour cette rubrique et que le contenu n’engage que le contributeur du mois.