IBM

L’objectif est d’aider chercheurs et développeurs à modéliser plus facilement l’épidémie de COVID-19.

En quelques mots :

  • Open data. IBM a annoncé jeudi le lancement de COVID notebooks, une base de données open source construite sur Jupyter, à destination des chercheurs, professionnels de la santé et développeurs cherchant à bâtir des modèles autour du coronavirus.
  • Des données fiables et faciles à exploiter. Accessible sur GitHub, COVID notebooks contient des données issus de sources fiables, dont l’université John Hopkins, le New York Times et le Centre européen de prévention et contrôle des maladies. Les développeurs d’IBM se sont également chargés de fournir les données dans un format facilement analysable, à l’aide d’outils comme Pandas et Scikit-Learn, et de mettre en place des premiers graphiques et analyses. En effectuant ces tâches préliminaires, les développeurs veulent donner aux chercheurs et professionnels de la santé la possibilité de réaliser des analyses et modélisations avancées sans avoir à se soucier de la fiabilité et de la qualité des données.
  • Rester à la page. COVID notebooks est le fruit du travail du Center for Open Source Data and AI Technologies (CODAIT), un groupe de scientifiques des données et de développeurs d’IBM qui mettent au point des solutions open source, notamment autour de l’intelligence artificielle. Analyse de données et modélisation sont capitales pour comprendre l’épidémie de COVID-19 et anticiper son évolution future, mais sont rendues complexes par le fait que l’épidémie étant encore en cours, les jeux de données évoluent quotidiennement. Pour cette raison, COVID notebooks utilise Elyra Notebook Pipelines Visual Editor et KubeFlow Pipelines, deux outils qui permettent de mettre à jour son modèle en un clic avec des données actualisées.