La probabilité d’extinction d’une espèce menacée
Piste noire Le 10 avril 2020 Voir les commentaires (11)Lire l'article en


Parmi les nombreuses espèces animales aujourd’hui en voie de disparition, certaines ne comptent plus que quelques dizaines d’individus. Comment estimer leur probabilité d’extinction ? Un modèle introduit à la fin du 19ème siècle par Galton et Watson permet de s’en faire une idée.
Rediffusion d’un article publié le 22 février 2013.
Les modèles d’évolution de populations ont une longue histoire [1]. La suite de Fibonacci fut introduite au XIII$^e$ siècle par Léonard de Pise pour décrire la croissance d’une population de lapins. Le modèle le plus connu d’évolution de populations est sans doute celui de Malthus, proposé au début du XIX$^e$ siècle. Supposons que chaque année, $15\%$ des individus de la population donnent naissance à un enfant, et que $5\%$ meurent. L’augmentation nette sera donc de $10\%$, ce qui conduit à une croissance exponentielle, comme pour les intérêts composés d’un compte d’épargne [2].
Le modèle de Malthus peut être affiné de diverses manières, par exemple en faisant dépendre le taux de croissance de l’effectif de la population pour tenir compte de la limitation des ressources, ce qui conduit au modèle logistique. Mais ceci est une autre histoire [3].
Ici, il sera question d’un modèle probabiliste, introduit en 1874 par Francis Galton et
Henry William Watson pour décrire l’extinction des noms de famille [GW]. Supposons, pour donner un exemple concret, que chaque individu a au cours de sa vie
- aucun enfant avec probabilité $1/8$,
- un enfant avec probabilité $3/8$,
- deux enfants avec probabilité $3/8$,
- trois enfants avec probabilité $1/8$.
Les nombres d’enfants d’individus différents sont de plus supposés indépendants les uns des autres [4].
Voici un exemple d’arbre généalogique obtenu par ce procédé :

L’ancêtre, en haut de l’arbre, a un enfant, qui en a lui-même deux, et ainsi de suite.
L’animation suivante montre la croissance d’un tel arbre :
Pour obtenir un arbre plus joli, les points représentant les individus se déplacent selon les règles suivantes : Les parents et leurs enfants s’attirent comme s’ils étaient reliés par un ressort, alors que les frères et sœurs et cousins se repoussent (c’est assez réaliste, non ?).
Le nombre d’individus peut croître exponentiellement, et il est alors préférable de représenter l’arbre en mettant l’ancêtre au milieu, et ses descendants sur des cercles de rayon croissant :

Voici ce que donne une animation de la croissance d’un tel arbre :
Dans d’autres cas, par contre, on observe l’extinction de la population. Quelle est la probabilité que cela arrive ? La réponse, pour l’exemple ci-dessus et en supposant qu’il y a un unique ancêtre est $\sqrt{5} - 2$, soit environ $23.6\%$.
Comment trouver la probabilité d’extinction
Voici comment on arrive à cette valeur. Il est facile de calculer la probabilité que la population se soit éteinte dès la première génération : cela arrive si et seulement si l’ancêtre n’a pas d’enfants, donc avec une probabilité $1/8$, soit $12.5\%$. Notons cette valeur $q_1$.
S’il y a initialement deux individus au lieu d’un, la population s’éteint si et seulement si chacun des deux ancêtres n’a pas d’enfants. L’indépendance implique que cela arrive avec probabilité $q_1^2 = 1/64$. De même, s’il y a initialement $N$ individus, la probabilité qu’aucun d’eux n’ait d’enfant est de $q_1^N = 1/(8^N)$.
Calculons maintenant, pour un ancêtre unique, la probabilité d’extinction au bout de deux générations. Cela arrive si
- soit l’ancêtre n’a pas d’enfants, c’est-à-dire avec probabilité $1/8$ ;
- soit l’ancêtre a un enfant qui lui-même n’a pas d’enfants ; la probabilité que cela arrive est de $(3/8) \cdot (1/8) = (3/8) \cdot q_1$ ;
- soit l’ancêtre a deux enfants qui n’en ont pas, ce qui arrive avec probabilité $(3/8) \cdot q_1^2$ ;
- soit enfin l’ancêtre a trois enfants, tous sans descendants, donc avec probabilité $(1/8) \cdot q_1^3$.
En ajoutant ces probabilités, nous arrivons à l’expression
\[ q_2 = \frac18 + \frac38 q_1 + \frac38 q_1^2 + \frac18 q_1^3 \]
Comme $q_1=1/8$, on obtient $q_2=729/4096$ qui est proche de $17.8\%$.
Quelle est la probabilité que la population se soit éteinte après trois générations ? Un raisonnement similaire montre qu’elle est donnée par
\[ q_3 = \frac18 + \frac38 q_2 + \frac38 q_2^2 + \frac18 q_2^3 \]
En fait, on obtient pour tout $n$ à partir de $1$ la relation de récurrence
\[ q_{n+1} = f(q_n) \]
où $f$ est le polynôme
\[ f(q) = \frac18 + \frac38 q + \frac38 q^2 + \frac18 q^3 \]
Autrement dit, on aura $q_3 = f(q_2) = f(f(q_1))$, $q_4 = f(f(f(q_1)))$, et ainsi de suite.
Comment se comporte cette suite de $q_n$ ? On ne peut pas obtenir d’expression simple de chaque $q_n$. Mais il existe un moyen géométrique simple d’étudier le comportement de la suite.

Dans la figure ci-dessus, on a tracé le graphe $y=f(q)$ du polynôme ainsi que la diagonale $y=q$. Pour connaître $q_2$, on trace une verticale au-dessus de $q_1 = 1/8$. Celle-ci coupe le graphe du polynôme au point d’ordonnée $q_2 = f(q_1)$. Pour calculer $q_3=f(q_2)$, il faut d’abord ramener $q_2$ sur l’axe des abscisses, ce qu’on fait en traçant une horizontale depuis le point $(q_1,q_2)$, qui coupe la diagonale en $(q_2,q_2)$. On regarde ensuite où une verticale issue de ce point coupe le graphe de $f$, et ainsi de suite. La figure montre que la suite des $q_n$ tend vers un point d’intersection du graphe de $f$ et de la diagonale, c’est-à-dire tel que $f(q)-q=0$.
La factorisation
\[ f(q) - q = \frac18 (q-1) (q^2+4q-1) \]
montre que les valeurs de $q$ telles que $f(q)-q=0$ sont $1$, $-2+\sqrt{5}$ et $-2-\sqrt{5}$ . La valeur $-2+\sqrt{5}$ est la seule comprise strictement entre $0$ et $1$, c’est donc elle qui fournit la réponse : la probabilité d’extinction tend vers $-2+\sqrt{5}$, soit $23.6\%$.
Distributions d’enfants plus générales
Le raisonnement ci-dessus n’est pas limité à la distribution particulière d’enfants de probabilités $1/8, 3/8, 3/8, 1/8$. Supposons que chaque individu n’a pas d’enfants avec une probabilité $p_0$, un enfant avec probabilité $p_1$, et ainsi de suite, jusqu’à un nombre maximal $k$ d’enfants avec probabilité $p_k$. Étant des probabilités, tous les $p_i$ sont compris entre $0$ et $1$, et ils satisfont
\[ p_0 + p_1 + \dots + p_k = 1 \]
Nous allons supposer que $0 < p_0 < 1$. En effet, si $p_0$ était nul, tous les individus ayant au moins un enfant, la population ne s’éteindrait jamais. Si $p_0$ était égal à $1$, la population s’éteindrait immédiatement.
Le même raisonnement que ci-dessus montre que la probabilité $q_n$ que la population soit éteinte après $n$ générations, pour un seul ancêtre, est déterminée récursivement par $q_1 = p_0$ et
\[ q_{n+1} = f(q_n) \]
pour tous les $n$ à partir de $1$, où $f$ est le polynôme
\[ f(q) = p_0 + p_1 q + p_2 q^2 + \dots + p_k q^k \]
Notons en particulier que
\[ f(1) = p_0 + p_1 + \dots + p_k = 1 \]
Par conséquent, le graphe de $f$ et la diagonale s’intersectent forcément au point $(1,1)$.
En général, une suite définie en itérant un polynôme peut se comporter de manière très compliquée, comme l’illustrent les ensembles de Julia et de Mandelbrot. Ici, toutefois, nous ne nous intéressons qu’aux $q$ compris entre $0$ et $1$. Comme le polynôme $f$ n’a pas de coefficients négatifs, on voit que $f(q)$ est croissante entre $0$ et $1$. Pour la même raison, c’est une fonction convexe [5]. Il suit de tout ceci qu’il n’y a que deux scénarios possibles :
- Soit l’équation $f(q)-q=0$ admet deux solutions positives, l’une étant $q=1$, et l’autre étant comprise entre $0$ et $1$. Comme dans l’exemple présenté au paragraphe précédent, c’est cette deuxième solution qui correspond à la probabilité d’extinction.
- Soit $q=1$ est la seule solution de $f(q)-q=0$ comprise entre $0$ et $1$ (il y a typiquement une seconde solution plus grande que $1$). Dans ce cas, la population s’éteindra avec probabilité $1$.
Comment savoir lequel de ces scénarios a lieu ? Comme le montre la figure, le premier cas arrive si et seulement si la tangente au graphe de $f$ en $q=1$ a une pente strictement supérieure à $1$. Cette pente peut être calculée de la manière suivante [6] :
On développe
\[ f(1+y) = p_0 + p_1 (1+y) + p_2 (1+y)^2 + \dots + p_k (1+y)^k = 1 + (p_1 + 2 p_2 + \dots + k p_k) y + \dots \]
La pente de la tangente est simplement le coefficient de $y$ dans ce développement, à savoir
\[ m = p_1 + 2 p_2 + \dots + k p_k \]
Ce nombre a une interprétation simple : Ce n’est autre que le nombre moyen d’enfants qu’a chaque individu. Ainsi nous avons démontré le résultat suivant :
Comme nous l’avons remarqué plus haut, s’il y a initialement un nombre $N$ d’individus, la probabilité d’extinction devient $q^N$. Si $m>1$, elle sera donc d’autant plus petite que $N$ est grand. Si par contre $m\le 1$, la population s’éteint avec probabilité $1$, quel que soit le nombre initial d’individus.
Pour résumer, nous avons obtenu les informations suivantes :
- pour que la population ait une chance de survie, il faut que le nombre moyen d’enfants par individu soit strictement supérieur à $1$ ;
- dans ce cas, plus il y a d’individus initialement, plus la probabilité de survie est grande.
On pourrait penser que la probabilité de survie augmente avec le nombre moyen d’enfants $m$. L’exemple suivant montre que ce n’est pas forcément le cas : Imaginons une espèce étrange, dont les individus n’ont pas de descendants dans $99\%$ des cas, mais $1000$ descendants dans $1\%$ des cas. Alors le nombre moyen d’enfants est $m=0.01\cdot 1000 = 10$, alors que la probabilité d’extinction est supérieure à $99\%$. Dans l’exemple discuté au début de l’article, on obtient $m=1.5$ pour une probabilité d’extinction de seulement $23.6\%$. La valeur de $m$ permet donc de savoir si la population a une chance de survivre, mais ne suffit pas à calculer la probabilité de survie.
Processus de branchement
Le calcul de la probabilité d’extinction présenté ci-dessus est un exercice relativement élémentaire, déjà contenu dans l’article original de Galton et Watson [GW]. A l’aide d’outils mathématiques plus sophistiqués [7], on peut montrer que dans le cas $m>1$, il n’y a que deux possibilités pour l’évolution à long terme de la population : Soit celle-ci finit par s’éteindre, soit elle croît sans limite. Le modèle de Galton-Watson ne permet donc pas de décrire une population qui se stabilise, ou oscille entre deux valeurs.
Pour décrire des dynamiques plus réalistes, il faut compliquer le modèle.
Une généralisation intéressante consiste à tenir compte de la position des individus dans leur habitat. Supposons que les individus se déplacent au hasard à la surface de la Terre, par exemple en migrant chaque jour d’un kilomètre vers le nord, le sud, l’est ou l’ouest, chaque direction étant choisie avec une probabilité d’un quart. De plus, à intervalles de temps réguliers, ils mettent au monde un nombre aléatoire d’enfants, comme dans le cas du processus de Galton-Watson. On parle alors de marche aléatoire branchante.
La figure ci-dessous montre une marche branchante, dans laquelle les individus ne se déplacent que vers l’est ou vers l’ouest, avec chaque fois une probabilité d’un demi. Tous les $50$ pas, ils se reproduisent en donnant naissance à un nombre aléatoire d’enfants compris entre $0$ et $3$. Pour aider à visualiser les générations, les enfants ont une couleur similaire à celle de leurs parents, avec une petite modification aléatoire.

Les marches aléatoires branchantes, dont le comportement est moins bien compris que celui du processus de Galton-Watson, sont actuellement l’objet de recherches actives. On peut par exemple se demander à quelle vitesse la population envahira son espace vital. La réponse à cette question permet de modéliser l’introduction d’une espèce étrangère dans un écosystème, qui est une cause importante de la disparition d’espèces indigènes [8], ou encore la propagation de maladies infectieuses [9].
On peut aussi considérer que la position des individus d’une marche aléatoire branchante ne décrit pas leur emplacement dans l’espace physique, mais plutôt un trait génétique qui détermine leur adéquation au milieu dans lequel ils vivent, comme la taille, la rapidité, la capacité à trouver une nourriture particulière. Le déplacement aléatoire dans cet espace modélise alors les mutations de la population.
Un moyen simple de décrire l’effet de la sélection naturelle dans ce modèle est de considérer que seul un nombre maximal d’individus, par exemple les mille individus les plus adaptés, survivent. On obtient alors une marche aléatoire branchante avec sélection. La simulation suivante montre une marche aléatoire branchante, dans laquelle on a sélectionné, avant chaque reproduction, les $5$ individus les mieux adaptés (donc les plus à droite). Observez la manière dont la population se déplace progressivement vers la droite.

On se pose alors la question de savoir avec quelle vitesse la population s’adapte au milieu, c’est-à-dire comment la position moyenne ou les positions extrêmes évoluent dans l’espace des traits. Une expression pour la vitesse d’adaptation lorsque le nombre d’individus est grand, conjecturée par Brunet et Derrida en 1997 [BD], a été démontrée récemment par Bérard et Gouéré [BG] pour une classe de marches aléatoires branchantes.
Ce genre de modèle ne s’applique pas uniquement à des problèmes de biologie et d’écologie. Les individus de la population peuvent tout aussi bien correspondre à des molécules participant à une réaction chimique (voir par exemple [DFM] pour une application à des réactions en présence d’un catalyseur). Pour cette raison, les processus de branchement peuvent faciliter l’étude de certaines équations aux dérivées partielles non linéaires [10] décrivant les mêmes réactions chimiques [Dy]. Il existe même des applications en informatique, par exemple à des algorithmes de recherche comme celui utilisé par votre moteur de recherche favori (voir par exemple [De]). Ces algorithmes explorent la toile en visitant un nombre de pages qui croît exponentiellement vite, en favorisant par exemple celles qui contiennent des mots clés recherchés. On peut alors considérablement accélérer l’algorithme en ne gardant qu’un nombre fixé de pages parmi les plus adéquates, ce qui revient essentiellement à effectuer une marche aléatoire branchante avec sélection.
Bibliographie
Sur les espèces en voie de disparition, je ne peux que vivement conseiller l’ouvrage [AC] du regretté Douglas Adams (auteur du Guide du Routard Galactique) avec Marc Carwardine (ce livre ne semble pas avoir été traduit en français, d’ailleurs je ne suis pas convaincu que l’humour british d’Adams survivrait à une telle traduction).
Les lecteurs mathématiquement chevronnés, qui désirent en savoir plus sur les généralisations du processus de Galton-Watson, peuvent consulter par exemple les notes de cours de Jean-François Le Gall [LG] et celles de Zhan Shi [S], ainsi que les monographies [E] et [DLG].
[AC]
Douglas Adams et Marc Carwardine, Last Chance to See, seconde édition, Arrow Books (London, 2009).
[BD]
Eric Brunet et Bernard Derrida, Shift in the velocity of a front due to a cutoff, Physical Review E, volume 56, pages 2597–2604 (1997).
[BG]
Jean Bérard et Jean-Baptiste Gouéré, Brunet-Derrida Behavior of Branching-Selection Particle Systems on the Line, Communications in Mathematical Physics, volume 298, pages 323–342 (2010).
[De]
L. Devroye, Branching Processes in the Analysis of the Heights of Trees, Acta Informatica, volume 24, pages 277–298 (1987).
[Dy]
Evgeniĭ Borisovich Dynkin, Superdiffusions And Positive Solutions Of Nonlinear Partial Differential Equations, American Mathematical Society (Providence, Rhode Island, 2004).
[DFM]
Donald A. Dawson, Klaus Fleischmann et Carl Mueller,
Finite time extinction of superprocesses with catalysts, Annals of Probability, volume 28, pages 603–642 (2000).
[DLG]
Thomas Duquesne et Jean-François Le Gall, Random Trees, Lévy Processes and Spatial Branching Processes, Astérisque (Marseille, 2002).
[E]
Alison Etheridge, An Introduction to Superprocesses, American Mathematical Society (Providence, Rhode Island, 2000).
[GW]
Henry William Watson et Francis Galton, On the Probability of the Extinction of Families, Journal of the Anthropological Institute of Great Britain, volume 4, pages 138–144, 1875.
[LG]
Jean-François Le Gall, Mouvement Brownien, processus de branchement et superprocessus, notes de cours, 1994.
[S]
Zhan Shi, Random Walks and Trees, notes de cours, 2010.
L’auteur remercie François Béguin et les relecteurs flandrin, Diego, julesdesp et Rémi Coulon pour leur nombreux conseils, qui ont substantiellement contribué à améliorer la lisibilité de l’article.
Notes
[1] Voir par exemple cet article sur Images des Mathématiques.
[2] Les $10\%$ de la population ne sont pas forcément un nombre entier, mais le fait d’arrondir ne se remarque pas trop pour les grandes populations.
[4] Galton et Watson considéraient uniquement les individus mâles, qui étaient seuls à transmettre les noms de famille à leur époque. Mais on peut tout aussi bien considérer la reproduction asexuée, ou ne tenir compte que des individus femelle.
[5] Sauf si $p_0$ et $p_1$ sont les seules probabilités non nulles. Dans ce cas, $f(q)$ est une fonction affine, qui coupe la diagonale uniquement au point $(1,1)$.
[6] Les lecteurs familiers avec la notion de dérivée reconnaîtront dans $m$ la dérivée de $f(q)$ en $q=1$, c’est-à-dire $m=f'(1)$ où $f'(q)=p_1 + 2p_2q + \dots + kp_kq^{k-1}$ est la dérivée de la fonction $f(q)$.
[7] La théorie des martingales et la loi zéro-un de Lévy.
[8] Un modèle voisin de colonisation d’un espace vital par une espèce introduite est discuté dans cet article sur Images des Mathématiques.
[9] Voir aussi cet article sur Images des Mathématiques
[10] Il s’agit d’équations de réaction-diffusion, dont il est question dans cet article sur Images des Mathématiques.
Partager cet article
Pour citer cet article :
Nils Berglund — «La probabilité d’extinction d’une espèce menacée» — Images des Mathématiques, CNRS, 2020
Laisser un commentaire
Actualités des maths
-
5 mars 2023Maths en scène : Printemps des mathématiques (3-31 mars)
-
6 février 2023Journées nationales de l’APMEP, appel à ateliers (9/4)
-
20 janvier 2023Le vote électronique - les défis du secret et de la transparence (Nancy, 26/1)
-
17 novembre 2022Du café aux mathématiques : conférence de Hugo Duminil-Copin (Nancy et streaming, 24/11)
-
16 septembre 2022Modélisation et simulation numérique d’instruments de musique (Nancy & streaming, 22/9)
-
11 mai 2022Printemps des cimetières
Commentaire sur l'article
La probabilité d’extinction d’une espèce menacée
le 24 février 2013 à 19:41, par projetmbc
La probabilité d’extinction d’une espèce menacée
le 25 février 2013 à 00:04, par Nils Berglund
La probabilité d’extinction d’une espèce menacée
le 25 février 2013 à 10:06, par projetmbc
La probabilité d’extinction d’une espèce menacée
le 10 mai 2021 à 18:56, par Georgia
La probabilité d’extinction d’une espèce menacée
le 25 février 2013 à 14:01, par Nils Berglund
La probabilité d’extinction d’une espèce menacée
le 10 mars 2013 à 11:37, par Jean-René Chazottes
La probabilité d’extinction d’une espèce menacée
le 10 mars 2013 à 18:54, par Nils Berglund
La probabilité d’extinction d’une espèce menacée
le 28 mars 2013 à 19:10, par courbis
La probabilité d’extinction d’une espèce menacée
le 26 octobre 2013 à 02:49, par zerp
La probabilité d’extinction d’une espèce menacée
le 27 octobre 2013 à 17:08, par Nils Berglund
La probabilité d’extinction d’une espèce menacée
le 12 décembre 2014 à 11:10, par Marc Monticelli