[Rediffusion d’un article publié en avril 2020]

Épidémie et logarithme

Piste rouge Le 4 juin 2021  - Ecrit par  Jérôme Buzzi Voir les commentaires (1)
Lire l'article en  

« Un bon croquis vaut mieux qu’un long discours » : on sait qu’une courbe peut révéler instantanément ce qu’une longue série de chiffres peut masquer. De plus en plus de médias utilisent une échelle logarithmique pour représenter le nombre de cas. Dans cet article on expliquera pourquoi cette présentation est utile et comment ces courbes peuvent être lues.

Récemment, la fonction logarithme est apparue dans les médias comme outil de visualisation de la vitesse de propagation de l’épidémie de COVID-19 : on peut consulter cette page du journal Le Monde pour y trouver deux graphes avec échelle logarithmique.

Le logarithme est une fonction mathématique qu’on découvre à la fin du lycée. Le logarithme $\log(x)$ [1] de base $2$ d’un nombre strictement positif $x$ se définit comme l’unique nombre $\ell$ tel que $x=2^\ell$ : autrement dit $x=2^{\log x}$. C’est donc l’occasion de se servir de son cours de maths (ou de le revoir !).

Logarithme népérien, de base $2$ ou de base $10$

Il sera un peu plus pratique pour nous d’utiliser le logarithme de base $2$. Le logarithme décimal ou logarithme de base $10$ noté $\log_{10}(x)$ se définit par $x=10^\ell$. Les deux sont liés par $\log(x)=\log_{10}(x)/\log_{10}(2)\approx 3,3 \log_{10}(x)$, ce qui permet de calculer l’un grâce à l’autre.

Le logarithme népérien est le logarithme de base $e=2,71828\dots$. Il est souvent appelé naturel car la dérivée de la fonction logarithme vérifie : $(\log(x))' = 1/x$.

Cette fonction étonnante transforme les produits en sommes :
\[ \log(ab) = \log(a) + \log(b) \]
En effet, $2^{\log(a)+\log(b)} = 2^{\log(a)} \times 2^{\log(b)}=a \times b =2^{\log(ab)}$. On peut consulter par exemple Wikipedia.
Mais que vient-elle faire dans l’étude des épidémies ?

Explosions exponentielles

Les phénomènes de contagion comme les épidémies sont caractérisés par leur caractère multiplicatif : l’accroissement pendant une unité de temps est proportionnel au nombre de malades contagieux. Dans le modèle le plus simple, chaque jour le nombre de malades est multiplié par un certain facteur $k$ plus grand que $1$. L’effectif des malades suit dans ce modèle une série géométrique de raison $k$ :

Evolution d’une suite géométrique
Jour 0 1 2 3 4 5 $\dots$ $N$
Nombre 1 $k$ $k\times k$ $k\times k \times k$ $k^4$ $k^5$ $\dots$ $k^N$

Ceci amène des croissances vertigineuses. Par exemple, pour $k=2$, la fonction $f(n)=2^n$ a le graphe suivant :

La légende de Sissa

Selon la légende, l’inventeur du jeu d’échecs aurait demandé pour seule récompense qu’on pose un grain de blé sur la première case de l’échiquier, deux sur la deuxième, quatre sur la troisième, et ainsi de suite. Le roi s’était d’abord étonné de la modestie d’une telle demande avant qu’un de ses conseillers lui fasse remarquer son énormité. Le nombre total de grains s’élève à :
\[ 1+2+4+8+\dots+2^{63} = 2^{64}-1 \approx 2\cdot 10^ {19}. \]
c’est-à-dire 600 milliards de tonnes de blé (en comptant 30mg par grain), environ 1.000 ans de production mondiale au niveau actuel.

Temps de doublement $t$

On mesure la vitesse de ces croissances exponentielles en considérant leur temps de doublement. C’est le temps qu’il faut pour observer un doublement de l’effectif. Dans le cas exponentiel, ce temps est en effet constant, indépendant de l’effectif initial.

Ce temps se calcule grâce à notre fonction $\log$ ou logarithme de base 2. Rappelons que le logarithme $\log k$ d’un nombre $k$ vaut $\ell$ si : $k=2^{\ell}$.

On voit qu’en $N$ jours, les effectifs seront multipliés par
\[ k^N=\underbrace{2^{\ell}\times \dots\times 2^{\ell}}_{N \text{ facteurs}} = 2^{N \ell} \]
Autrement dit, on observera pendant un temps $N$ environ $N\ell$ doublements, soit un doublement tous les $1/\ell$ jours. Le temps de doublement vaut donc $t=1/\ell$ jours.

Si $k=4$, le nombre de malades est multiplié par $4$ chaque jour : par exemple chaque malade contamine en moyenne 3 personnes par jour. Le logarithme vaut $\log(4)=2$ car $4=2^2$ — on observe un doublement deux fois par jour.

Si $k=\sqrt{\sqrt{2}}\approx 1.2$, on peut imaginer que chaque malade a à peu près une chance sur cinq de contaminer une autre personne chaque jour et le logarithme vaut $\log(\sqrt{\sqrt{2}})=1/4$ car $2^{1/4}\times 2^{1/4}\times2^{1/4}\times 2^{1/4}=2$. On observe un doublement du nombre de malades tous les 4 jours.

La quantité à mesurer est donc ce temps de doublement $t=1/\log k$. [2] Comment peut-on le faire apparaître graphiquement ?

Visualisation du temps de doublement

C’est ce que permet l’utilisation d’une échelle logarithmique, c’est-à-dire qu’on trace le graphe de la fonction $g(n) = \log (f(n))$ au lieu de celle de la fonction étudiée $f(n)=k^n$.

La courbe obtenue est une droite. En effet, le logarithme transformant les produits en sommes, il simplifie les puissances $f(n)=k^n$ en :
\[ g(n)=n\cdot\log k \]
qui est une fonction linéaire de $n$ dont le graphe est une droite. Ce logarithme $\log k$ est $1/t$, l’inverse du temps de doublement. On peut donc « lire » le temps de doublement en mesurant la pente de la courbe et en prenant son inverse.

Au-delà du cas exponentiel

Les épidémies réelles ne suivent pas des suites géométriques, pas plus que les modèles qui tentent de comprendre leur propagation. Leur représentation même dans une échelle logarithmique ne sera donc pas linéaire. Mais on peut encore définir un temps de doublement « autour d’un temps donné » en approximant ce graphe par bout de droite exactement comme on le fait pour définir la vitesse instantanée.

Par exemple, le nombre de cas de coronavirus confirmés en Italie (extrait de 31 jours se terminant le 24 mars 2020 depuis la page maintenue par la John Hopkins University) définit la courbe suivante [3]

En prenant une échelle logarithmique, on obtient un graphe qu’on peut découper en quatres morceaux très proches de segments de droites (qui sont les graphes avec échelle logarithmique de fonctions exponentielles) :

On en déduit un temps de doublement croissant :

Estimation graphique du temps de doublement
Date 23/02-01/03 01/03-09/03 09/03-17/03 17/03-24/03
Temps 2,1 3,3 4,2 6,0

On observe donc un ralentissement de la croissance exponentielle de l’épidémie, difficilement visible sur le premier graphe n’utilisant pas l’échelle logarithmique. Attention : l’interprétation de ce résultat numérique nécessite d’en savoir davantage sur cette maladie [4]

On peut constater le bon accord entre la série réelle et la décomposition en quatre fonctions exponentielles successives en revenant à l’échelle linéaire :

Conclusion

On comprend maintenant pourquoi les échelles exponentielles ont fait leur apparition dans les médias : on peut y lire le temps de doublement de l’épidémie, un déterminant crucial de l’évolution de l’épidémie.

Post-scriptum :

L’auteur remercie Nils Berglund et Phillipe Colliard pour leurs commentaires sur une première version de ce texte.

Il remercie également les relecteurs dont les noms ou les pseudos sont Daniel Massart, reynald.thelliez, P. Levallois et projetmbc pour leur relecture attentive et efficace et pour leurs commentaires.

Article édité par Philippe Colliard

Notes

[1On utilise parfois d’autres notations comme $\lg(x)$ et un célèbre logiciel de feuille de calcul emploie LOG($x$ ;2) pour désigner le logarithme de $x$ de base $2$.

[2Bien que ce ne soit pas usuel, on pourrait tout aussi bien considérer le temps de décuplement $T$, i.e., le temps au bout duquel l’effectif est multiplié par $10$. Le temps $T$ est celui qu’il faut à la courbe pour passer d’une puissance de $10$ à la suivante (c’est facile à visualiser puisque, comme c’est l’usage, nous avons utilisé un axe gradué par les puissances de $10$). Ce temps de décuplement se calcule par $T=\log(10)\cdot t=\log(10)/\log k$, autrement dit c’est l’inverse du logarithme décimal de $k$.

[3Attention : j’ai remplacé les deux valeurs des 11 et 12 mars qui sont de 0 et 24.924 par leur moyenne soit 12.462.

[4Mathématiquement, on peut facilement construire des modèles où ce ralentissement provient d’une distanciation sociale croissante ou bien est un simple effet transitoire des durées variables pendant lesquelles un malade est contagieux. N’étant pas épidémiologiste, nous ne pouvons pas aller plus loin.

Partager cet article

Pour citer cet article :

Jérôme Buzzi — «Épidémie et logarithme» — Images des Mathématiques, CNRS, 2021

Commentaire sur l'article

  • Épidémie et logarithme - complément du 26 novembre

    le 26 novembre 2020 à 22:56, par Jérôme Buzzi

    Les courbes logarithmiques semblent avoir reflué dans les médias, c’est bien dommage. On peut poursuivre l’analyse ébauchée dans l’article, les tests ont été pratiqués à grande échelle et les statistiques sont facilement consultables.

    Utilisation de Géodès (Santé publique France)

    On peut récupérer sur le site Géodes de Santé publique France le nombre de tests positifs quotidiens depuis le 13 mai 2020 et jusqu’à aujourd’hui (moyennant un délai de 3 jours permettant la remontée des statistiques). On peut tracer le graphe du logarithme de la moyenne sur 7 jours du nombre de tests positifs (plus précisément, on affecte au jour J la moyenne des valeurs des jours J-6, J-5,.., J-1 et J).

    Que voit-on ? (le graphe est disponible en versions ordinaire et logarithmique ici)

    - du 20 juillet au 27 octobre cette courbe logarithmique est pratiquement linéaire, avec une pente correspondant à un doublement tous les 12-13 jours, à l’exception de la période du 8 au 29 septembre où la croissance est fortement ralentie (seulement +10% en 21 jours) ;

    - à partir du 6 novembre, la courbe logarithmique est encore linéaire, mais cette fois-ci avec une pente à la baisse correspondant à une division par 2 tous les 9 jours.

    La deuxième vague correspond donc au prolongement de la tendance visible fin juillet. On ne voit aucune « explosion soudaine » comme on a pu le lire ici ou là. Au contraire, la seule surprise vient de l’interruption de la croissance exponentielle pendant le mois de septembre. Pourquoi ? C’est là qu’il ne suffit plus de calculer mais qu’il faut aller chercher un épidémiologiste.

    Répondre à ce message

Laisser un commentaire

Forum sur abonnement

Pour participer à ce forum, vous devez vous enregistrer au préalable. Merci d’indiquer ci-dessous l’identifiant personnel qui vous a été fourni. Si vous n’êtes pas enregistré, vous devez vous inscrire.

Connexions’inscriremot de passe oublié ?

Dossiers

Cet article fait partie du dossier «Épidémies» voir le dossier