Si le rôle des modèles mathématiques dans les sciences de la vie est en plein essor (voir par exemple les articles de Bernard Prum sur ce site [1]), ce rôle ne date pas d’hier. Nous nous proposons ici d’évoquer un travail datant de 1760, dû à Daniel Bernoulli (1700-1782), qui propose un modèle pour estimer les avantages de l’inoculation variolique. C’est aussi la naissance d’un sujet, voire d’une attitude, celle qui veut qu’un mathématicien peut avoir des choses à dire sur des sujets médicaux.
L’exemple a récemment servi d’introduction à un cours « Quelques sujets de biomathématiques », donné à Lausanne par Jean-Pierre Gabriel et Christian Mazza, dans le cadre du « Troisième cycle romand de mathématiques » .
Cet article est divisé en deux parties. La première décrit quelques résultats de Bernoulli avec un minimum de technique mathématique et sans reproduire aucun des calculs originaux ; elle s’adresse donc à un large public (piste verte). Les lecteurs coutumiers des pistes coloriées pourront croire sans risque les conclusions de ces calculs, ET IGNORER LA SECONDE PARTIE. Celle-ci est consacrée à des détails techniques (hors-piste) ; elle présuppose du lecteur une certaine maîtrise du calcul différentiel et intégral, cet outil mathématique mis au point dans la seconde moitié du XVIIe siècle par Newton, Leibniz, et bien d’autres.
Le 16 avril 1760, l’Académie Royale des Sciences de Paris présente en lecture publique un travail de Daniel Bernoulli : son Essai d’une nouvelle analyse de la mortalité causée par la petite vérole, & des avantages de l’inoculation pour la prévenir, qui sera publié en 1766 seulement [2]. Il s’agit vraisemblablement du premier modèle mathématique en épidémiologie.
La variole, ou petite vérole (en anglais smallpox), qu’on sait aujourd’hui être une maladie virale, ne doit pas être confondue avec la « grande vérole », ou syphilis, maladie bactérienne. La variole se manifeste par une fièvre suivie d’une forte éruption cutanée ; c’est une maladie d’une grande sévérité, souvent mortelle, ou pouvant entraîner, entre autres joyeusetés, la défiguration ou la cécité. Elle est aussi très contagieuse entre humains, mais ne s’attaque pas, telle quelle, à d’autres mammifères (il importe de distinguer la variole de ses variantes animales, dont celle des vaches, « cowpox » en anglais et justement « vaccine » en français, qui peut jouer le rôle de variole atténuée, ce qui a eu son importance dans le long processus historique de mise au point d’un vaccin). On ne connaît pas de traitement curatif de la variole ; les seules possibilités de lutte sont la vaccination préventive [3] et l’isolement des malades. C’est une maladie auto-immunisante : on ne l’attrape pas deux fois.
Aujourd’hui, grâce à de longues luttes à grande échelle, la variole n’est plus d’actualité. Pourtant, vers 1950, on estimait à 50 millions le nombre de cas de variole qui survenaient chaque année dans le monde. Des campagnes mondiales furent organisées par l’Organisation Mondiale de la Santé (OMS), reposant sur la vaccination, la surveillance et l’isolation. Elles furent couronnées de succès au point que, le 29 octobre 1979, l’OMS a pu déclarer la variole éradiquée de la surface de la terre [4].
La variole fut un problème majeur de santé publique en Europe dès sa recrudescence au début du XVIe siècle. Au temps de Bernoulli, on lui attribuait environ un treizième de toutes les morts. Elle touchait bien davantage les enfants car les individus atteignaient le plus souvent l’âge adulte en étant immunisés (après avoir subi la variole et y avoir survécu). En Europe occidentale, les premières inoculations datent de 1721. L’inoculation d’un individu consiste à l’infecter avec une forme atténuée de la maladie. Le procédé fut rapporté de l’empire ottoman par Lady Mary Wortley Montagu, épouse de l’ambassadeur de Grande-Bretagne à Constantinople et personnage haut en couleur [5]. L’inoculation n’était pas sans danger, et elle donna lieu à de très intenses débats, notamment sur la difficulté d’effectuer un choix entre le risque d’une mort immédiate due à l’inoculation et le risque de mourir dans un avenir indéfini en attrapant « naturellement » la maladie.
Daniel Bernoulli était idéalement formé pour étudier ce problème. A l’Université de Bâle, il enseigna successivement l’anatomie, la botanique et la physique. Contemporain et ami d’Euler, il fut aussi professeur de mathématiques à Saint-Pétersbourg. Il reçut dix fois le prix annuel de l’Académie des sciences de Paris, compléments appréciés à ses modestes revenus, qui dépendaient du bon vouloir de mécènes. Pour la variole, son apport immensément original fut de proposer un modèle mathématique permettant d’évaluer l’efficacité de l’inoculation.
Bernoulli avait à sa disposition les chiffres de la cohorte de Halley [6], auteur en 1693 d’une table de survie [7]. Les données en avaient été recueillies à Breslau (en polonais Wroclaw), ville connue à l’époque pour avoir un minimum d’immigration et d’émigration, et donc considérée comme représentant bien l’évolution naturelle d’une population humaine ; il y avait à l’époque environ 34 000 habitants à Breslau. Bernoulli eut l’idée de filtrer mathématiquement la table de Halley pour en extraire l’information cachée concernant la variole. Il s’agissait d’établir ce que serait cette table d’abord sans les méfaits de la variole, puis sans ces méfaits et en tenant compte des risques de l’inoculation. Insistons sur l’absence totale de toute mention de la variole chez Halley, dont la table indique en tout et pour tout le nombre de survivants après $x$ années ($1 \le x \le 84$) d’une population initiale de 1000 individus.
Bernoulli a extrait des données de Halley ce qui convenait à sa démonstration, et plus précisément une table, reproduite ci-dessous, indiquant pour chaque année de 1 à 24 (colonne 1) le nombre de survivants d’une population initiale de 1300 nouveaux-nés (colonne 2). On voit par exemple 1000 à un an, 646 à 12 ans, et 572 à 24 ans (Bernoulli justifie le nombre initial de 1300, qu’on ne trouve pas chez Halley, par une extrapolation).
Les autres colonnes résultent du modèle et des calculs de Bernoulli. La colonne 3 indique le nombre de sensibles ; on appelle « sensible » un individu qui n’a pas été atteint par la variole et qui n’est donc pas immunisé. On lit, dans la colonne 4, le nombre de survivants à la variole, puis, dans la colonne 5, le nombre d’individus qui contractent la variole (un huitième [8] de la moyenne entre le nombre de sensibles de l’année et le nombre de sensibles de l’année précédente), et, dans la colonne 6, le nombre de morts par variole (un huitième [9] de la colonne 5). Nous laissons à titre d’exercice pour le lecteur le soin d’expliciter les deux dernières colonnes.
On peut retenir une valeur d’époque —valeur calculée par Daniel Bernoulli— pour l’espérance de vie à la naissance : 26 ans et 7 mois.
A comparer avec les valeurs actuelles de l’espérance de vie à la naissance, par exemple en Suisse : 84,4 ans pour les femmes et 79,7 ans pour les hommes ! [10] (valeurs voisines à peine inférieures en Belgique et au Canada, à peine supérieure en France). A comparer aussi avec d’autres pays, où la valeur actuelle peut descendre en-dessous de 33 ans [11].
Outre la table de Halley, Bernoulli disposait de trois éléments numériques.
(1) Le nombre $n$, qui indique qu’un sensible a chaque année une chance sur $n$ d’attraper la variole. (Aujourd’hui on utiliserait plus volontiers le taux mesurant la « chance » d’un sensible d’attraper la variole en une année ; cette notion de taux est en particulier avantageuse si sa valeur n’est pas l’inverse d’un entier, par exemple si sa valeur est 0,4 ; mais Bernoulli utilise $n$). Après discussion de ses sources, Bernoulli adopte $n=8$.
(2) Le nombre $m$, qui indique qu’un contaminé a une chance sur $m$ de mourir de la variole. (Aujourd’hui, on utiliserait le taux de mortalité due à la variole). Les statistiques du temps indiquent également $m=8$ [12].
(3) Le nombre $N$, qui indique qu’un sensible a une chance sur $N$ de mourir de l’inoculation. Selon les données dont dispose Bernoulli, $N=200$.
Son modèle et ses calculs ont permis à Bernoulli d’estimer ce que serait le nombre de survivants après $x$ années pour une cohorte d’individus systématiquement inoculés en début de vie. Plus précisément, Bernoulli note $\xi(x)$ [13] le nombre de survivants après $x$ années ($x$ entre 0 et 24) dans la cohorte de Halley ; ce sont donc des nombres connus : par exemple $\xi(1)=1000$, $\xi(12)=646$ et $\xi(24)=572$. Il calcule ensuite, selon son modèle, trois nombres pour chaque année $x$ entre 0 et 24 :
(*) le nombre $s(x)$ de sensibles présents après $x$ années dans la cohorte de Halley (colonne 3 de la table ci-dessus),
(*) le nombre $z(x)$ qui apparaîtrait dans une « cohorte virtuelle » d’une population sans variole,
(*) et donc le nombre $((N−1)/N) z(x)$ de survivants après $x$ années dans une population systématiquement inoculée.
En trois formules (que certains lecteurs pourront allégrement sauter, et que d’autres voudront voir démontrées dans la seconde partie de notre texte) : $$ s(x) = \frac{m}{(m-1) e^{x/n} + 1} \xi(x) , $$ $$ z(x) = \frac{ m e^{x/n} }{ (m-1) e^{x/n} + 1 } \xi(x) , $$ $$ \frac{N-1}{N} z(x) = \frac{N-1}{N} \frac{ m e^{x/n} }{ (m-1) e^{x/n} + 1 } \xi(x) . $$ De la dernière formule, on déduit facilement une conséquence spectaculaire : dans une cohorte systématiquement inoculée, l’espérance de vie serait de
29 ans et 7 mois. En comparaison avec les chiffres de Halley, un gain moyen de 3 ans !
Notons que Bernoulli calcule d’abord l’espérance de vie d’une population inoculée sans aucun risque, 29 ans et 9 mois, avant d’arriver à 29 ans et 7 mois « tout tribu payé », ce qui est son expression pour signifier qu’il a tenu compte de ce que l’inoculation elle-même est mortelle une fois sur 200. Il a donc beau jeu d’insister : « l’intérêt public demandera toujours, non seulement que l’on emploie l’Inoculation, mais encore qu’on se hâte de l’employer » (paragraphe 14 de son article).
Relevons ici un des signes de la modernité de l’approche de Bernoulli : la notion même d’espérance de vie était toute récente à l’époque. Pour un éclairage actuel sur l’article de Bernoulli et des références à quelques publications de ces dix dernières années, voir la présentation de Sally Blower, suivie d’une traduction anglaise de très larges extraits de l’article de Bernoulli [14]. Voir aussi deux publications de Klaus Dietz et J.A.P. Heesterbeek : leur lettre à Nature, commémorant le 300e anniversaire de la naissance de Bernoulli et intitulée Daniel Bernoulli en avance sur l’épidémiologie moderne [15], ou leur article Le modèle épidémiologique de Daniel Bernoulli revisité [16].
Ces résultats furent donc présentés à l’Académie des Sciences de Paris le 16 avril 1760. Peut-être l’encyclopédiste d’Alembert était-il parmi les auditeurs, peut-être lui a-t-on rapporté la communication, toujours est-il que d’Alembert attaqua violemment le travail de Bernoulli dans une conférence donnée devant la même Académie le 12 novembre 1760 [17]. De fait, le modèle de Bernoulli n’eut pas de conséquence pratique à court terme ; ce n’est que bien plus tard qu’il servit d’inspiration pour l’épidémiologie mathématique, qui commença à se développer vers la fin du XIXe siècle. Ce sont par exemple les modèles élaborés par cette science qui ont contribué à la prise de décision des épidémiologistes états-uniens de stopper la vaccination antivariolique systématique en 1971 [18], plusieurs années avant l’annonce de la disparition de la maladie.
Les questions abordées par Bernoulli sont toujours d’actualité. Ainsi, l’OMS s’est fixé pour objectif d’éliminer la rougeole en 2010 et déclare qu’il est pour cela indispensable qu’au moins 95 % de la population soit vaccinée ; or, suite à de fortes résistances plus ou moins rationnelles, en Suisse par exemple, le taux actuel s’élève à peine à 87 % [19]. Le débat est loin d’être clos.
En préambule, répétons que cette seconde partie de notre article est très nettement plus technique, largement hors piste selon la terminologie de ce site. Nous suivons les calculs de Bernoulli, et nous adressons donc à des lecteurs mathématiciens.
Nous allons admettre l’existence de dérivées comme $\frac{d\xi}{dx}$, désignant la variation instantanée par rapport au temps du nombre de survivants d’une cohorte donnée (sous-entendu au temps $x$ ; on pourrait donc écrire $\frac{d\xi}{dx}(x)$). Nous n’aborderons pas le problème posé par un modèle faisant de $\xi = \xi(x)$ une fonction dérivable, alors que la définition de $\xi$ en fait a priori une fonction à valeurs entières (nombre d’individus), et donc une fonction discontinue.
Dans une première approche, pensons à $dx$ comme à un petit intervalle de temps. Le nombre des morts entre les temps $x$ et $x+dx$ est $$ -d\xi = \xi(x) - \xi(x + dx) $$ (noter que $d \xi$ est une quantité négative, puisque $\xi$ est une fonction décroissante de $x$, et que les deux membres de l’égalité précédente sont donc positifs). Pendant l’intervalle $dx$, le nombre de sensibles attrapant la variole est $sdx / n$ (ce serait $s/n$ si $dx$ valait un an, par définition de l’entier $n$), et le nombre de sensibles mourant de la variole est $sdx / mn$ (par définition de $m$). Par suite, le nombre total d’individus mourant pour d’autres causes que la variole est $$ -d\xi - \frac{sdx}{mn} . $$ La proportion de sensibles dans la population totale étant $s / \xi$, le nombre de sensibles mourant pour d’autres causes que la variole est donc $$ -s\frac{d\xi}{\xi} - \frac{ssdx}{mn\xi} . $$ Par ailleurs, la diminution $-ds = s(x) - s(x+dx)$ du nombre de sensibles entre $x$ et $x+dx$ est due à deux causes : les infections par variole (suivies de mort ou non), qui contribuent par $sdx / n$ comme déjà noté, et les morts par d’autres causes que la variole, résultat du calcul précédent. Nous pouvons donc égaler deux manières de compter la même quantité : $$ -ds = \frac{s dx}{n} -s \frac{d\xi}{\xi} - \frac{ss dx}{mn \xi} , $$ ce qui s’écrit aussi $\frac{s}{\xi} d\xi - ds = \frac{s dx}{n} - \frac{ss dx}{mn \xi}$, ou encore $$ \frac{ s \frac{d\xi}{dx} - \xi \frac{ds}{dx} }{ss} = \frac{\xi}{ns} - \frac{1}{mn} $$ (après multiplication par $\xi / ss$ et division par $dx$).
Pour la suite des calculs, on pense aux quotients de $d\xi$ et $ds$ par $dx$ comme à des dérivées. Si on pose $q = \xi / s$, on obtient donc $$ \frac{dq}{dx} = \frac{ s \frac{d\xi}{dx} - \xi \frac{ds}{dx} }{ss} = \frac{\xi}{ns} - \frac{1}{mn} = \frac{q}{n} - \frac{1}{mn} . $$ La solution d’une telle équation différentielle est « bien connue » [20], et s’écrit sous la forme $$ q(x) = \frac{1}{m} \left( e^{(x+C)/n} + 1 \right) $$ où $C$ est la « constante d’intégration ». Par définition de $\xi$ et $x$, nous avons $s(0) = \xi(0)$, d’où la valeur de $C$, qu’il convient d’écrire $e^{C/n} = m-1$. En fin de compte, nous avons d’abord $$ s(x) = \frac{ m }{ (m-1) e^{x/n} + 1} \xi (x) , $$ puis, avec les valeurs numériques $m = 8$ et $n = 8$, $$ s(x) = \frac{ 8 }{ 7 e^{x/8} + 1} \xi (x) . $$ Ainsi, si on accepte le modèle, une simple multiplication fournit la valeur $s(x)$ à partir de la valeur $\xi(x)$ de la table de Halley ; le modèle permet donc d’extraire de la table une information, $s(x)$, qui y est « cachée ».
Jusqu’ici dans ce chapitre, nous avons reproduit les calculs des paragraphes 5 et 6 de l’article de Bernoulli (21 paragraphes en tout). Lequel Bernoulli peut alors facilement dresser une table indiquant les valeurs de $s(x)$ pour $x$ entre 0 et 24. Voici l’un de ses commentaires : « [Cette] table, quoique parfaitement conforme à nos hypothèses, ne sera pas à la vérité exactement conforme à la Nature ; je suis cependant persuadé qu’elle ne s’en écarte pas beaucoup, tant à cause de la vraisemblance de nos hypothèses, que parce qu’aucun nombre ne me paroît choquer ces notions générales, que des observations infinies nous ont dictées sur la petite vérole. »
Sautons au paragraphe 13. L’expression $-d\xi - \frac{s dx}{mn}$ écrite plus haut indique que le taux de mortalité per capita pour toutes les causes autres que la variole est donné par $$ \mu(x) = - \frac{1}{\xi(x)} \left( \frac{d\xi}{dx} + \frac{s}{mn} \right) . $$ Il s’en suit que l’évolution $z(x)$ d’une population qui ne subit pas la variole est gouvernée par l’équation $$ \frac{dz}{dx} = - \mu(x) z(x) = \frac{ \frac{d\xi}{dx} + \frac{s}{mn} }{ \xi(x) } z(x) , $$ qu’on transforme facilement en $$ \frac{d}{dx} \left( \log \frac{z(x)}{\xi(x)} \right) = \frac{1}{z} \frac{dz}{dx} - \frac{1}{\xi} \frac{d\xi}{dx} = \frac{ s }{ mn \xi} = \frac{ \frac{1}{n} }{ m \frac{\xi }{s} } . $$ En insérant la valeur de $\xi /s$ établie plus haut, on obtient d’abord $$ \frac{d}{dx} \left( \log \frac{z(x)}{\xi(x)} \right) = \frac{ \frac{1}{n} }{ (m-1)e^{x/n} + 1 } = \frac{d}{dx} \left( \log \frac{ e^{x/n} }{ (m-1)e^{x/n} + 1 } \right) . $$ Puis, par une intégration facile tenant compte de ce que $z(0) = \xi(0)$, $$ z(x) = \frac{ m e^{x/n} }{ (m-1) e^{x/n} + 1 } \xi(x) $$ où il n’y a plus qu’à remplacer $n$ par 8 et $m-1$ par 7. Ainsi et une nouvelle fois, à partir de la connaissance de $\xi(x)$, on calcule facilement $z(x)$.
La rédaction de notre texte date essentiellement de septembre 2009. Peu après, nous avons réalisé que le travail de Daniel Bernoulli sur la variole faisait l’objet d’un chapitre dans le récent livre de Nicolas Bacaër, Histoires de mathématiques et de populations, paru chez Cassini en juillet 2009. Il y a également un chapitre sur la table de Halley, et un autre sur les critiques de d’Alembert. Chacun des 30 chapitres introduit simplement un thème de la dynamique des populations, science décrite dans la préface comme étant au carrefour des mathématiques, des sciences sociales (démographie), de la biologie (génétique des populations et écologie) et de la médecine (épidémiologie).
[2] Histoire et Mémoires de l’Académie Royale des Sciences de Paris, p. 1-45, 1760 (1766) ; édité dans Die Werke von Daniel Bernoulli, Band 2, Birkhäuser, 1982, p. 235-267.
[3] Certains lecteurs de ce texte sont vaccinés, mais la vaccination antivariolique n’est plus obligatoire en France depuis la loi du 30 mai 1984, voir ici.
[6] Edmund Halley, 1656-1742, scientifique pluridisciplinaire britannique, connu notamment pour ses observations et ses calculs concernant une comète qui porte aujourd’hui son nom.
[8] Pour cette valeur-ci de un huitième, voir plus bas à l’introduction de l’entier $n$.
[9] Pour cette valeur-là de un huitième, voir plus bas à l’introduction de l’entier $m$.
[12] Bernoulli insiste sur le fait que $8$ est une valeur moyenne, et qu’il existe des épidémies avec $m=3$, d’autres avec $m=40$, voire davantage. De plus, cette moyenne varie d’un pays à l’autre. Notons encore que le mot « statistique » n’est pas en usage à l’époque.
[13] Prononcer « ksi de x ».
[15] Klaus Dietz and J.A.P. Heesterbeek, Bernoulli was ahead of modern epidemiology, Nature, Vol. 408, 30 November 2000, p. 513-514, ici.
[16] Klaus Dietz and J.A.P. Heesterbeek, Daniel Bernoulli’s epidemiological model revisited, Mathematical biosciences 180 (2002), 1-21, ici.
[17] Parmi les critiques de d’Alembert, certaines ont gardé tout leur intérêt (voir l’article cité à la note précédente). Mais on ne peut s’empêcher de se demander si le célèbre d’Alembert n’était pas jaloux d’un Bernoulli ayant si bien traité un sujet qui aurait pu servir sa propre gloire. L’opinion de Bernoulli sur ce point éclate dans un extrait d’une lettre à Euler, datée d’avril 1768, que citent Dietz et Heesterbeek :
Que dites vous des énormes platitudes du grand Dalembert sur les probabilités ; comme je me trouve, trop souvent, injustement traité dans ses ouvrages, j’ai pris la resolution depuis assez longtemps de ne rien lire qui sorte de sa plume ; j’ai pris cette resolution à l’occasion d’un memoire sur l’inoculation, que j’ai envoyé à l’Académie de Paris il y a 8 ans et qui par la nouveauté de l’analyse avait été recu avec un grand accueil ; c’étoit, si j’ose le dire, comme une nouvelle province incorporée au corps des mathématiques ; il me semble que le succès de cette nouvelle analyse lui fit mal au coeur ; il la critique de mille façons, toutes egalement ridicules et aprez l’avoir bien critiquée il se donne pour premier auteur d’une théorie qu’il navoit pas seulement entendu nommer. Il savoit cependant que mon memoire ne pouvoit paroitre que dans sept ou huit ans et il ne pouvoit en avoir connaissance qu’en qualité d’academicien et à cet egard mon memoire devoit etre sacré jusqu’à ce qu’il fut rendu public. Dolus an virtus quis in hoste requirat !
[18] Voir N.T.J. Bailey, The mathematical theory of infectious diseases and its applications, Griffin, London, 1975.
[20] Les étudiants d’un cours traditionnel et technique reconnaîtront la somme de la solution générale de l’équation homogène et d’une solution particulière de l’équation inhomogène. Ceci dit, il existe des équations différentielles dites « de Bernoulli », en l’honneur de Jacques Bernoulli (1654-1705), oncle de Daniel ; mais l’équation qui nous intéresse ici n’est pas « de Bernoulli » en ce sens.