Les chercheurs de la Northeastern University se servent de Google Cloud Platform pour modéliser la propagation du virus Zika

Le laboratoire de modélisation des systèmes biologiques et socio-techniques (MoBS) de la Northeastern University recherchait une solution pour modéliser rapidement le virus Zika. Grâce à GCE et aux machines virtuelles préemptives, il a réussi à effectuer plus de 10 millions de simulations et à analyser des données dans un temps record.

Le Zika est un virus transmis par les moustiques qui s'est propagé à vitesse grand V sur tout le continent américain au cours de l'année 2015. Il a donné lieu à des interdictions de voyager, des mises en quarantaine et des mouvements de contestation pour interdire les Jeux olympiques au Brésil en 2016. Suite à la déclaration d'urgence de santé publique internationale de l'Organisation mondiale de la santé (OMS), il était impératif que les gouvernements des pays touchés réussissent à prédire précisément le nombre de nouvelles infections et leur localisation. Un défi particulièrement complexe étant donné que 20 % seulement des cas sont symptomatiques.

En janvier 2016, l'équipe du laboratoire MoBS de la Northeastern University, avec le soutien du CIDID (Center for Inference and Dynamics of Infectious Diseases), lance un projet de modélisation du Zika. Son objectif : éclairer les autorités publiques et les chercheurs sur la manière dont le virus évolue et se propage.

"Grâce au Big Data et à la puissance de calcul phénoménale du système, nous comptons bien aider les chercheurs et les autorités sanitaires."

Matteo Chinazzi, Chercheur associé, Northeastern University

GCP : des outils essentiels de prédiction, d'analyse, et plus encore

L'équipe s'est appuyée sur l'approche mathématique et informatique de Google Cloud Platform (GCP) pour étudier différents scénarios de propagation et réaliser une projection de leur impact sur les populations affectées. Le modèle se base sur la première vague de propagation du Zika au Brésil, là où le virus s'est déclaré en 2015. Dorénavant, les chercheurs savent prédire l'impact des nouvelles infections touchant d'autres zones en introduisant des paramètres supplémentaires, comme la température, la quantité de moustiques, la taille de la population ainsi que ses habitudes de déplacement.

GCP permet d'effectuer plusieurs simulations simultanées et d'analyser les téraoctets de données générées par les différents scénarios modélisés. "Nous avons utilisé plusieurs produits GCP", explique Matteo Chinazzi, chercheur associé à la Northeastern University. "Google Cloud Storage renferme toutes nos données de modélisation et le site Web. Pour simuler la propagation de la maladie, nous utilisons Google Compute Engine (GCE) et des machines virtuelles préemptives. Quant à Google BigQuery, il sert pour l'examen des scénarios, chacun étant basé sur des variables propres (des dates, des chiffres sur les infections, etc.). À ce jour, nous avons déjà passé à la moulinette une quantité colossale de données, des centaines de téraoctets en tout. Et Google Cloud Storage réussit parfaitement à absorber ce volume."

Des résultats pour une réaction rapide et d'envergure

Grâce à GCE et aux machines virtuelles préemptives, l'équipe du MoBS a effectué plus de 10 millions de simulations. GCE et BigQuery ont considérablement accéléré les simulations et l'analyse des données (les deux processus prennent désormais quelques heures, contre plusieurs semaines auparavant). Matteo Chinazzi poursuit : "Plusieurs milliers d'instances virtuelles indépendantes peuvent tourner en parallèle. En une journée à peine, nous sommes capables de générer une analyse complète d'un scénario épidémique comportant pas moins de 250 000 simulations."

Le modèle permet de cerner la façon dont le Zika se propage, mais il peut aussi servir de référence pour analyser d'autres épidémies comme la dengue. Même si le virus Zika n'est plus considéré comme une urgence internationale par l'OMS, il reste encore beaucoup à faire en matière de prévention des éruptions de maladies transmises par les moustiques. Grâce au Big Data et à la puissance de calcul sans limites de son système, le laboratoire MoBS compte bien aider les chercheurs et les autorités sanitaires dans cette mission.

"Le facteur temps est crucial en période d'épidémie", ajoute Matteo Chinazzi, "et GCP nous apporte les outils indispensables pour réagir vite et à grande échelle."

Pour en savoir plus sur les recherches et les analyses sur le Zika menées par le laboratoire MoBS, lisez l'article "Spread of Zika virus in the Americas" (Propagation du virus Zika en Amérique) publié dans la revue Proceedings of the National Academy of Sciences of the United States of America.

"Plusieurs milliers d'instances virtuelles indépendantes peuvent tourner en parallèle. En une journée à peine, nous sommes capables de générer une analyse complète d'un scénario épidémique comportant pas moins de 250 000 simulations."

Matteo Chinazzi, Chercheur associé, Northeastern University

Merci de vous être inscrit !

Parlez-nous de vos centres d'intérêt.