Crise sanitaire du Coronavirus Covid-19 (Rediffusion d’un article publié le 30 mars 2020)

Modélisation d’une épidémie, partie 1

Comment les maths aident à la prise de décision

Piste rouge Le 6 août 2020  - Ecrit par  Corentin Bayette, avec la participation de Marc Monticelli pour les simulations Voir les commentaires (3)
Lire l'article en  

La crise sanitaire mondiale du Coronavirus Covid-19 a démontré le rôle des modélisations mathématiques dans la prise de décisions politiques et sanitaires. Mais comment sont faites ces modélisations ? Sur quels paramètres se basent-elles ? Afin de répondre à ces questions, nous allons modéliser l’évolution d’une épidémie dans une population donnée. Nous nous concentrerons sur un modèle en particulier : le modèle SIR. Nous discuterons également du rôle des différents paramètres et leur traduction en termes de politique de santé publique. Le but de cet article est aussi d’illustrer quelques termes aujourd’hui omniprésents dans les médias tels que « étaler le pic » ou « limiter la hauteur du pic ». Un second article détaillera d’autres modèles (SEIR et SEIR en âge principalement) ainsi que leur résolution numérique.

Rediffusion d’un article publié le 30 mars 2020.

Pour les États et pour les organisations internationales, comme l’Organisation mondiale de la santé (OMS) ou l’Union européenne (UE), connaître l’évolution d’une épidémie humaine (grippe H1N1, virus Ebola, coronavirus), animale (grippe aviaire, peste porcine, rage) ou végétale est primordial.

En cas de menace sanitaire grave appelant des mesures d’urgence, notamment en cas de menace d’épidémie, le ministre chargé de la santé peut, par arrêté motivé, prescrire dans l’intérêt de la santé publique toute mesure proportionnée aux risques courus et appropriée aux circonstances de temps et de lieu afin de prévenir et de limiter les conséquences des menaces possibles sur la santé de la population.

Article L3131-1 du code de santé publique

Cette étude permet en effet de prédire l’évolution de la maladie au cours du temps et a pour but principal de guider les dirigeants dans la prise de décision en termes de santé publique. La vaccination, la mise en quarantaine, la protection de certaines populations à risque (personnes âgées, personnes immunodéprimées ou enfants) sont des exemples de politiques sanitaires à mettre en place pour répondre à ces crises.

Il convient dès à présent de préciser que les modèles mathématiques sont des modèles simplifiés, ayant des limites dont il faut être conscient. Ils restent toutefois utiles pour tenter de prévoir l’évolution d’une épidémie.
Ces décisions sont donc « motivées » par de tels modèles, nous commençons par le modèle SIR.

Le modèle SIR

Le modèle SIR est un exemple de modèle à compartiments, c’est à dire que l’on divise la population en plusieurs catégories.
Pour une population donnée, on étudie la taille de trois sous-populations au cours du temps $t$ : $S(t)$ représente les personnes saines (susceptible en anglais) au temps $t$, $I(t)$ les personnes infectées (infected), et $R(t)$ les personnes retirées (removed) [1] ; $N=S(t)+I(t)+R(t)$ représente alors la population constante totale au cours du temps. Il convient de bien différencier les personnes saines des personnes retirées : les personnes saines n’ont pas encore été touchées par le virus, alors que les personnes retirées sont guéries, et donc immunisées. Autrement dit, les personnes retirées ne sont plus prises en compte. Par conséquent, le modèle SIR ne s’occupe pas directement de prédire la mortalité de l’épidémie, pour cela il faut un autre modèle : le modèle SEIR qui est introduit dans le second article Modélisation d’une épidémie, partie 2. Le modèle SIR peut donc être représenté par le schéma suivant :

Ici, $\beta$ représente le taux de transmission, c’est à dire le taux de personnes saines qui deviennent infectées et $\gamma$ le taux de guérison, c’est à dire le taux de personnes infectées qui deviennent retirées [2]. Mathématiquement, le modèle SIR est donné par le système suivant :

\[ \begin{cases} \displaystyle \frac{dS(t)}{dt} &=& -\beta S(t)I(t)&(1.1)\\ \displaystyle \frac{dI(t)}{dt} &=& \beta S(t)I(t)-\gamma I(t)&(1.2)\\ \displaystyle \frac{dR(t)}{dt} &=& \gamma I(t)&(1.3) \end{cases} \]


Comment lire ce système ?

Les dérivées $\frac{d}{dt}$ permettent de connaître la variation (c’est à dire si c’est croissant ou décroissant) des fonctions $S$, $I$ et $R$ en fonction du temps $t$, afin d’en décrire l’évolution au cours du temps. Le terme $S(t)I(t)$ représente le nombre de contacts entre des personnes saines et des personnes infectées. $\beta$ étant le taux de transmission, il y a dès lors $\beta S(t)I(t)$ personnes nouvellement infectées. Celles-ci se soustraient des personnes saines (1.1), et s’ajoutent aux personnes infectées (1.2). De même, parmi les personnes infectées, certaines vont guérir : $\gamma$ étant le taux de guérison, il a $\gamma I(t)$ personnes nouvellement guéries qui s’enlèvent des personnes infectées (1.2) et s’ajoutent aux personnes retirées (1.3).


Voici ce que l’on peut obtenir grâce à une résolution numérique :

PNG - 70.8 ko
Solution du modèle SIR
Le taux de transmission est de 0,8 et le taux de guérison est de 0,05.

Datant de 1927 [ST], ce modèle peut paraître simple, trop simple même, mais il est efficace : il a aidé à la politique sanitaire de vaccination contre la variole au début du XX$^{e}$ siècle. Les personnes saines vaccinées deviennent en effet directement retirées, et à terme l’épidémie s’arrête. Or, une politique de vaccination visant à vacciner 100% de la population est quasiment impossible : il faut donc trouver le bon équilibre pour vacciner une partie de la population assez importante pour ralentir, puis arrêter l’épidémie. C’est ce qu’a permis le modèle SIR.
Une complexification de ce modèle est le modèle SEIR qui permet de prendre en compte plus de paramètres de la population ou du virus et qui fait l’objet de la partie 2 de cet article. Faisons maintenant un tout petit peu de théorie mathématique.

Un petit peu de maths : taux de reproduction et théorème du seuil

De manière purement mathématique, nous pouvons dire que : les limites des fonctions $S(t),I(t)$ et $R(t)$ existent lorsque $t$ tend vers $+\infty$ (voir [HW]). De plus, \[\lim_{t \to +\infty}I(t)=0,\] c’est à dire que l’épidémie s’arrête forcément. Ce point de vue est purement mathématique, il prend en compte le cas extrême où l’épidémie s’arrête puisque la population est totalement décimée... Il prend aussi en compte le cas où la population est vaccinée ou immunisée (immunité naturelle ou collective). C’est pourquoi, des mesures politiques sont prises pour arriver à diminuer le temps avant l’arrêt de l’épidémie. Pour cela, il est nécessaire de réduire ce qu’on appelle le taux de reproduction $R_0$ :

Définition : Le taux de reproduction $R_0$ est le nombre moyen de cas secondaires produits par un individu infectieux au cours de sa période d’infection.

Au début de l’épidémie, l’expression de $R_0$ est $\beta/\gamma$ puisque $1/\gamma$ représente la durée moyenne de la maladie et qu’au début, les personnes rencontrées sont presque toutes saines.

Petit schéma pour illustrer

Ici, on prend $R_0=3$ : cela signifie que chaque personne contaminée va en contaminer 3 autres.
Illustration du taux de reproduction pour $R_0=3$
Réaction en chaîne : Le premier contaminé va contaminer 3 personnes, donc 4 personnes de contaminées. Ces trois nouvelles personnes contaminées vont en contaminer CHACUNE trois autres : 9 nouvelles personnes sont contaminées. Il y a donc 13 personnes contaminées au total. Ces 9 personnes vont à leur tour contaminer chacune trois personnes pour un total de 40 contaminées ; et ainsi de suite...

Avant d’être utilisé en épidémiologie, ce concept a été à l’origine utilisé en démographie. Pour un historique plus complet, une définition plus précise mais aussi plus difficile du taux de reproduction, lisez l’article Dynamique des populations (piste rouge) publié sur ce site au moment de la grippe H1N1.

Nous pouvons alors énoncer le théorème du seuil :

Théorème : Si $R_0>1$, alors $I(t)$ croît, atteint son maximum puis décroît vers 0 quand $t$ tend vers $+\infty$ : c’est une épidémie.

Sinon, $I(t)$ décroît directement vers 0 quand $t$ tend vers $+\infty$ : il n’y a pas d’épidémie.

C’est sur ce théorème que se basent les scientifiques et les politiques lorsqu’ils disent, pour l’épidémie de Covid-19 notamment, qu’il faut à tout prix réduire $R_0$ pour le rendre le plus proche possible de 1 [3]. Voici deux cas un peu extrêmes qui illustrent le théorème du seuil sur le modèle SIR :

PNG - 118.4 ko
Illustration du théorème du seuil
Le taux de reproduction est de 16 pour le graphe de gauche et de 0,8 pour celui de droite. De plus, on a pris 0,8 comme taux de transmission et 0,05 comme taux de guérison.

La définition de $R_0$, la démonstration du théorème et d’autres résultats sont disponibles dans [HW].

Restons encore un peu sur le modèle SIR pour illustrer comment la modification des paramètres peut impacter le tracé de la courbe.

Efficacité des mesures prises et effets sur la courbe

Au final, à quoi sert cette modélisation ? Comment voir l’effet des décisions sur l’évolution d’une épidémie ? Voici quelques exemples simples où nous avons modifié un paramètre (et fixé les autres) :

Modification du taux de transmission

Ce taux peut être abaissé par des mesures comme la distanciation sociale, le confinement ou la fermeture de certains lieux.

PNG - 33.7 ko
Comparaison du pic en modifiant le taux de transmission
Le taux de transmission est de 0,9 à gauche et de 0,2 à droite. Le taux de guérison est fixé à 0,1.

On observe très clairement que le pic de courbe de $I$ (en orange) est moins haut (0,8 contre 0,6) et que la courbe est plus étalée. De plus, la courbe de $S$ (en bleu) décroit beaucoup plus rapidement à gauche qu’à droite.

Modification du taux de guérison

L’état d’un système de santé ou l’existence d’un traitement peuvent permettre d’augmenter ce taux.

PNG - 30.7 ko
Comparaison du pic en modifiant le taux de guérison
Le taux de guérison est de 0,01 à gauche contre 0,09 à droite. Le taux de transmission est fixé à 0,7.

Comme précédemment, on voit clairement l’effet sur le pic de la courbe de $I$ (infectés, en orange) : de 90% de la population infectée à 60%.

Modification des deux à la fois

La combinaison de mesures permettant de baisser le taux de transmission (mesures sanitaires) et d’augmenter le taux de guérison (mesures médicales et recherche) permettent de modifier le pic de la manière suivante :

PNG - 30.2 ko
Comparaison du pic en modifiant les deux taux
A gauche, une situation dramatique avec des taux de 0,9 (transmission) et 0,01 (guérison) contre une situation plus optimiste à droite : 0,2 (transmission) et 0,09 (guérison).

L’effet sur le pic de la courbe de $I$ (orange) est indiscutable : on passe d’une hauteur de 0,9 (avec une courbe qui « descend lentement ») à une hauteur de 0,5 (avec une courbe qui « descend » quasiment directement et très rapidement). En outre, le nombre de personnes saines (courbe bleue) décroit très rapidement vers 0 à gauche contrairement à la courbe de $S$ (en bleu) à droite qui reste au-dessus de 0,1.

Modification interactive

Vous pouvez vous-même illustrer l’effet de la modification des paramètres avec cette simulation interactive.


Remarque importante : Les taux considérés ci-dessus le sont à des fins pédagogiques et pour illustrer au mieux : ils ont été choisis arbitrairement. Ces courbes ne reflètent pas la situation actuelle du Covid-19, contrairement à la suite de l’article.


Une autre simulation interactive : discrète et aléatoire

La simulation suivante illustre la propagation du Coronavirus Covid-19 et est interactive, elle n’est pas basée directement sur le modèle SIR mais sur un modèle plus compliqué (qui prend en compte plus de paramètres). Cette simulation a en effet des points communs avec le modèle SIR (3 sous-populations : saines, infectées, retirées) mais également des différences majeures : elle est discrète (chaque point représente une personne) et aléatoire (afin de modéliser les déplacements des personnes et leurs potentiels contacts). Elle permet ainsi de voir plus précisément l’impact de la modification des paramètres sur l’évolution du virus. Vous pouvez à nouveau simuler la propagation du virus en modifiant des paramètres comme le temps de guérison ou le nombre d’individus infectés initialement.

Pour les tablettes : ça se passe ici sur le site du CNRS pour une version pleine page.

Les personnes saines (S - pas encore infectées), infectées (I) et retirées (R - guéries et donc immunisées) sont représentées par des points gris, rouges et verts respectivement.

Une simulation interactive plus riche en paramètres (mortalité, confinement) est disponible dans la seconde partie.

Efficacité des mesures : l’exemple du Royaume-Uni

Modifier les paramètres sur nos simulations proches du modèle SIR nous a permis de tirer quelques conclusions quant à la modification de la courbe. Des simulations plus complexes existent : les épidémiologistes utilisent également des modèles, plus réalistes et plus sophistiqués, pour essayer d’évaluer les différentes mesures de santé publique. Aussi, pour les plus motivés et bilingues, ce papier (format PDF) du Imperial College London daté du 16 mars 2020 étudie l’impact des décisions non-pharmaceutiques pour réduire la mortalité du Covid-19 au Royaume-Uni et aux États-Unis. Y sont notamment discutées les mesures de fermeture des écoles, de quarantaine des personnes infectées, de la distanciation sociale et du confinement. Le modèle utilisé est sensiblement plus compliqué que le modèle SIR : il prend en compte l’espace (l’emplacement des écoles et des lieux de travail notamment) et est basé sur les interactions entre individus dans la population. On considère qu’il y a transmission lorsqu’il y a contact entre une personne infectée et une personne saine, que ce soit à la maison, à l’école, au travail ou de manière aléatoire dans l’espace public. Les paramètres utilisés (taux de reproduction, taux d’incubation, durée de contagiosité, etc.) sont choisis d’après les premiers travaux chinois étudiant le Coronavirus à Wuhan. Le virus se propageant, les données sur le virus se précisent et les paramètres utilisés pour les modélisations sont donc modifiés en conséquence.
L’effet des mesures sanitaires sur l’évolution de l’épidémie au Royaume-Uni est principalement étudié dans ce texte, on peut entre autres y trouver ce graphique :

PNG - 41.8 ko
Comparaison du nombre de lits occupés au Royaume-Uni selon différentes mesures prises

Il illustre l’effet des décisions sur le nombre de lits en réanimation/soins intensifs occupés pour 100 000 personnes. On voit très bien que la courbe bleu clair (confinement, quarantaine et distanciation sociale des personnes de plus de 70 ans) est beaucoup plus « étalée » et avec un pic moins « haut » que la courbe noire (aucune mesure) : ce qui est très important pour l’hôpital. Dans le premier cas, le nombre de malades graves est très élevé et sur un temps très court, dépassant largement les capacités de l’hôpital. A l’inverse, avec l’ensemble des mesures prises, le nombre de malades graves est plus faible et sur un temps plus long, ce qui peut permettre à l’hôpital de se préparer, d’adapter sa capacité et de prendre en charge plus de personnes. Il y est également écrit que, dans un cas idéal, ces mesures peuvent permettre de réduire le pic de l’épidémie de deux tiers et de diviser le nombre de morts par 2 !

Conclusion et mise en garde

Le modèle SIR, pourtant relativement simple, permet donc d’obtenir une première modélisation d’une épidémie et d’observer l’impact des mesures sanitaires sur son l’évolution. Nous verrons dans un second article comment le modifier pour prendre en compte des paramètres supplémentaires comme l’âge des personnes ou la démographie de la population.
Il convient de rappeler pour conclure que les modélisations restent des outils mathématiques qui aident à prévoir l’évolution d’une épidémie donnée ; ils sont certes précis et rigoureux, mais calculés à un moment donné, avec des paramètres donnés et dans un contexte plutôt idéal. Modéliser la réaction et le comportement des gens, l’évolution du virus (mutation éventuelle) et tous les autres paramètres à la situation est extrêmement difficile. C’est pourquoi, à l’image des sondages et des statistiques, il est nécessaire de les utiliser, de savoir les lire mais aussi de les comprendre. Il faut ainsi trouver le bon équilibre entre : considérer sérieusement les modèles d’épidémies obtenus après modélisation et prendre du recul sur la situation.

La suite ici : Modélisation d’une épidémie, partie 2

Références

[HW]
Howard Weiss, The SIR model and the Foundations of Public Health, MATerials MATemàtics, Publicació electrònica de divulgació del Departament de Matemàtiques de la Universitat Autònoma de Barcelona, 2013.

[ST]
Suzanne Touzeau, Modèles épidémiologiques, AgroParisTech (cours au format PDF), 2010.

Post-scriptum :

L’auteur souhaite remercier Nils Berglund d’avoir accepté et accompagné l’écriture de cet article.

Il remercie également les relecteurs Jérôme Buzzi, Pierre-Antoine Guihéneuf et Clément Caubel pour leurs nombreuses remarques qui ont permis de rendre cet article plus complet, plus précis et plus clair.

Enfin, il remercie particulièrement Marc Monticelli pour sa participation, sa disponibilité et sa réactivité pour la création des simulations.

Article édité par Nils Berglund

Notes

[1Par personnes « retirées », on entend les personnes soit guéries, et donc immunisées, soit décédées. Pour l’évolution du nombre de personnes saines ou infectées, la distinction entre guéries et décédées ne joue pas de rôle. Par ailleurs, cela permet de garder l’initiale R, pouvant être interprétée à la fois comme removed (retirées) et recovered (guéries).

[2Les lettres grecques $\beta$ et $\gamma$ se nomment et se prononcent respectivement « beta » et « gamma ».

[3Au moment de la rédaction de l’article, le taux de reproduction $R_0$ du Covid-19 est estimé entre 2,2 et 2,4.

Partager cet article

Pour citer cet article :

Corentin Bayette, avec la participation de Marc Monticelli pour les simulations — «Modélisation d’une épidémie, partie 1» — Images des Mathématiques, CNRS, 2020

Crédits image :

Image à la une - Le logo de l’article est une image libre de droit représentant un coronavirus.

Commentaire sur l'article

  • Comment approcher la variable I

    le 24 avril à 15:50, par curieuxdenaissance

    Bonjour,
    Un immense merci à vous !
    Je suis impressionné par la qualité pédagogique de votre article sur les 2 modèles SIR et SEIR incluant ses déclinaisons. Moi le nul en math, il me semble avoir compris quelques petites choses. Merci.

    N’étant pas mathématicien, je ne suis en aucun cas apte à discuter l’outil mathématique.

    Ceci étant vous dites que les pouvoirs publics peuvent en partie pour prendre des décisions, utiliser ces modèles SIR, SIR plus complexes, SEIR et SEIR plus complexes.
    Pour l’illustrer, le chapitre Efficacité des mesures : l’exemple du Royaume-Uni : « Il illustre l’effet des décisions sur le nombre de lits en réanimation/soins intensifs occupés pour 100 000 personnes. On voit très bien que la courbe bleu clair (confinement, quarantaine et distanciation sociale des personnes de plus de 70 ans) est beaucoup plus « étalée » et avec un pic moins « haut » que la courbe noire (aucune mesure) : ce qui est très important pour l’hôpital. Dans le premier cas, le nombre de malades graves est très élevé et sur un temps très court, dépassant largement les capacités de l’hôpital. A l’inverse, avec l’ensemble des mesures prises, le nombre de malades graves est plus faible et sur un temps plus long, ce qui peut permettre à l’hôpital de se préparer, d’adapter sa capacité et de prendre en charge plus de personnes. Il y est également écrit que, dans un cas idéal, ces mesures peuvent permettre de réduire le pic de l’épidémie de deux tiers et de diviser le nombre de morts par 2 ! »

    Je remarque que nous avons changé de logique passant d’une problématique de circulation virale au sein d’une population avec son évolution dans le temps au sein de trois sous populations S, I et R à une justification sanitaire de capacité hospitalière à un temps t, ce que je peux comprendre.

    Je note aussi une conclusion en terme de mortalité « cela divise le nombre de morts par 2 » issue du modèle SIR alors que vous écrivez en exergue que « le modèle SIR ne s’occupe pas de prédire directement la mortalité »

    Si R peut être assez rapidement documenté, si S peut l’être en fonction du temps (t) où l’on se place, comment peut-on établir I dans un ordre de grandeur acceptable et cohérent avec le phénomène auquel on assiste ?

    Merci de votre réponse.

    Répondre à ce message
    • Comment approcher la variable I

      le 28 avril à 16:19, par Corentin Bayette

      Bonjour,

      Merci beaucoup pour votre commentaire. J’ai essayé d’écrire cet article pour qu’il soit le plus accessible possible, je suis donc content que vous ayez pu en comprendre quelques points.

      Il est vrai que le modèle utilisé pour la modélisation du Covid-19 au Royaume-Uni (que je ne connais pas en détails, j’ai juste lu l’article de l’équipe de recherche daté de mars 2020) est assez éloigné du modèle SIR-SEIR. Je souhaitais en fait en rédigeant cet article donner une idée aux lecteurs de ce qu’est une modélisation mathématique d’une épidémie (d’où les modèles SIR-SEIR) ; je souhaitais également donner un exemple de modélisation beaucoup plus complexe et liée avec la situation actuelle (d’où cette étude). C’est pour cela qu’il y a des « différences » entre les deux approches (mortalité, transports, etc) : c’est un choix que j’ai fait lors de la rédaction et j’espère qu’il ne vous a pas trop perdu pendant votre lecture...

      Par rapport à $I$ : on voit (encore aujourd’hui) que c’est justement ce qui est le plus difficile à connaitre...
      Les trois variables/populations $S$, $I$ et $R$ sont très liées : si on en connait deux, on peut connaitre la troisième. Plus la modélisation est complexe et précise (taux de transmission, prise en compte de l’âge, mortalité, confinement, transports, etc.), plus l’approche de $I$ est précise. J’en parle un peu à la fin du second article. Mais tout ça reste une modélisation mathématique, avec ses avantages et ses incertitudes...

      Encore merci.

      Répondre à ce message
  • Questions !

    le 19 mai à 18:16, par BilDataScience

    Bonjour,

    Premièrement, je vous remercie pour cet article pédagogique de qualité !
    Pouvez m’indiquer quel est le modèle illustré dans le paragraphe intitulé « Une autre simulation interactive : discrète et aléatoire » et c’est quoi la référence liée (référence de l’article ou papier journal) ?
    En effet, je veux essayer d’implémenter ce modèle. Sinon, si vous disposer du code open source Python du modèle, pouvez vous me procurer le lien pour le code afin de l’étudier et essayer de le faire évoluer ?

    Cette épidémie à révélé pour tout le monde l’importe de la recherche scientifique fondamentale et appliquée, dont certains doutent depuis un moment et hésite à y investir.

    Je vous remercie encore une fois.

    Répondre à ce message

Laisser un commentaire

Forum sur abonnement

Pour participer à ce forum, vous devez vous enregistrer au préalable. Merci d’indiquer ci-dessous l’identifiant personnel qui vous a été fourni. Si vous n’êtes pas enregistré, vous devez vous inscrire.

Connexions’inscriremot de passe oublié ?

Dossiers

Cet article fait partie du dossier «Épidémies» voir le dossier