L’Argument de l’Apocalypse… selon la Répression des Fraudes
Bayes... not ?
Piste rouge Le 13 août 2011 Voir les commentaires
L’Argument [1] de l’Apocalypse ! Cette petite curiosité mathématique s’éloigne de tout domaine de recherche, mais a fortement impressionné les mathématiciens amateurs. Et les professionnels aussi ! En 1983, le physicien Brandon Carter, imagina cette curieuse énigme. D’après la légende, il fut si déconcerté par sa découverte que lors d’une conférence, il renonça au dernier moment à la présenter. Depuis 1989, John Leslie publia abondamment sur ce sujet [2]. A ses yeux aucune réfutation alors proposée (et il y en a eu des milliers [3]) n’était suffisamment solide. A juste titre semble-t-il ! Oublions ici notre rigueur de la Recherche scientifique et donnons la parole aux experts de la Répression des Fraudes qui vont sortir de leur cuisine et vous expliquer pourquoi.
La soif s’en va en buvant. Le permis aussi !
Avant d’écouter les arguments des fins limiers de la Répressions des Fraudes et d’attaquer cette célèbre et difficile énigme, traitons d’abord des exemples simples.
Imaginons Vincent arrêté par la police qui le suspecte d’avoir pris un petit verre de trop. Il est impossible de dire quelle est la probabilité qu’il soit positif à un test d’alcoolémie. Notons P(A) cette probabilité, dont on ne dispose d’aucune valeur [4].
Mais voici que Sandrine m’informe que notre ami Vincent a bu plus que de raison au mariage d’un ami : apéro, vin, champagne et digestif. J’ai toute confiance dans son témoignage. Cette « donnée supplémentaire E » me renseigne. Et j’estime que notre pauvre Vincent a environ 99% d’être verbalisé [5]. En un tel cas, on note :
\[ P(A\mid E) = 99\% \]
On lit « Probabilité que A soit vrai sachant E ». Le signe « | » (sachant) est important. Plus on aura d’informations pertinentes et plus notre résultat sera précis.
Les biscuits d’Alice et de Béatrice
Le « sachant E » (|E) peut aller jusqu’à contredire les premières observations. Pour illustrer cela, imaginons une charmante histoire qui illustre la formule de Bayes [6] :
- Alice pour son quatre-heures, dispose d’une boîte de dix biscuits : neuf au chocolat et un aux dattes.
- Béatrice dispose aussi d’une boîte de dix biscuits, mais cinq au chocolat et cinq aux dattes.
L’une d’entre elles donne un biscuit à Marguerite. Je ne sais pas qui, mais je suppose qu’Alice est la plus généreuse. Elle a 60% de chances d’être la donneuse et Béatrice 40%. Ces possibilités sont notées A et B. Leurs probabilités sont :
\[
P(A) = 60\%
\]
\[
P(B) = 40\%
\]
et bien sûr :
\[
P(A) + P(B) = 100\%
\]
Maintenant, Marguerite choisit un biscuit au hasard. Elle en obtient un aux dattes. Je peux continuer de dire qu’Alice est surement la gentille donneuse, avec une probabilité de 60%. Mais je me souviens qu’elle n’avait que très peu de biscuits aux dattes dans sa boîte : un seul ! Et c’est tout l’inverse chez Béatrice : cinq en tout. Je dispose d’une information (on dit parfois un événement) supplémentaire E qui me permet de voir Béatrice monter dans mon estime.
Je suppose que chaque biscuit au sein d’une boîte a autant de chance d’être choisi par Marguerite que les neuf autres. Sans faire de calculs, chacun peut dire :
- P(A) > P(A|E) : mon observation de E, c’est-à-dire le biscuit aux dattes dans la main de Marguerite, me donne quelques doutes sur la générosité supposée d’Alice.
- P(B) < P(B|E) : le quasi monopole de Béatrice sur les biscuits aux dattes m’incite à reconsidérer mon évaluation de départ.
Quel que soit le résultat, on aura :
\[
P(A|E) + P(B|E) = 1
\]
La formule de Bayes [7]
permet de chiffrer P(A|E) et P(B|E), et ainsi d’obtenir un résultat plus précis. La formule, même restreinte à deux hypothèses de départ, ici A et B, est plutôt ardue :
\[ P(A|E) = \frac{ P(A).P(E|A) } { P(A).P(E|A) + P(B).P(E|B)} \]
De façon similaire :
\[ P(B|E) =\frac{ P(B).P(E|B) } { P(A).P(E|A) + P(B).P(E|B)} \]
On vérifie :
\[ P(A|E) + P(B|E) = 1 \]
Ces calculs permettent d’obtenir un rapport $ P = \frac{ Nombre \; de \; cas \; favorables } { Nombre \; de \; cas \; possibles} $ plus précis par notre connaissance de l’événement E.
Il est souvent plus commode et plus sûr d’éviter de présenter la réponse sous sa forme littérale comme ci-dessus et de choisir une représentation plus claire [8] :
- sous forme de tableau, qui permet une vérification rapide ;
- ou sous forme de graphes, qui guidera votre raisonnement.
Personnellement je préfère la seconde, mais c’est une affaire de goût.
{} | Alice | Béatrice | Total |
Probabilité a priori d’être donneuse | \[P(A)=60\%\] | \[P(B)=40\%\] | \[100\%\] |
Probabilité d’avoir une datte par cette fille | \[P(E{{\mid A}})=1/10=10\% \] | \[P(E{{\mid B}})=5/10=50\%\] | Sans signification |
Bayes ; termes élémentaires | \[60\%.10\%=6/100\] | \[40\%.50\%=20/100\] | \[26/100\] |
Bayes ; probabilité que la fille soit la donneuse sachant E | \[6/26=3/13\] | \[20/26=10/13\] | \[1\] |
Les deux dernières lignes du tableau regroupent les termes nécessaires à l’application de la formule de Bayes.
Graphes

Biscuits (1/2)
Graphe des hypothèses
Le second graphe reprend les éléments du premier. Chacun peut le présenter à sa façon. Ici on calcule le nombre pondéré de biscuits aux dattes, soit 0,6 biscuit pour Alice et 2 pour Béatrice :

Biscuits (2/2)
Graphe des réponses
Mon observation de l’événement E me permet de considérer Béatrice comme la donneuse avec $10/13$ de chance, contre $3/13$ pour Alice. Le « sachant E » a fortement changé les premières hypothèses.
Le pâté d’alouette et la Répression des fraudes
Passons à une utilisation fallacieuse du théorème de Bayes en étudiant une plaisanterie classique chez nos grands-parents. Le pâté d’alouette n’est pas pur à 100%, mais seulement à 50% : un cheval pour une alouette… ! Dans la proportion d’un animal pour un animal (et non pas 1 gramme pour 1 gramme).
Imaginons un producteur de pâté qui utiliserait cette recette aux proportions originales et qu’il soit de mauvaise foi. Toute ressemblance avec un cas connu ne peut qu’être fortuite. Il affirme que son pâté est fait avec une jolie alouette, dont il reçoit 100 grammes de viande et qu’il ne traite que le meilleur, soit 20 grammes. Ajoutons un peu de cheval : sur 700 kilos livrés, il n’en utilise que 140 kilos. Mélangeons bien les 140,020 kg de cette délicieuse mixture. On obtient ce résumé pour les ingrédients :
{} | Alouette | Cheval |
Tirage au sort | 50% | 50% |
Poids livré (kg) | 0,100 | 700,000 |
Déchet (kg) | 0,080 | 560,000 |
Poids utile (kg) | 0,020 | 140,000 |
Que ce soit pour l’alouette et le cheval, on ne traite que 20% du meilleur :
{} | Alouette | Cheval |
Tirage au sort | 50% | 50% |
Poids utile | 20% | 20% |
Pour l’instant, rien n’est répréhensible.
Mais en malmenant la formule de Bayes, qui se retourne dans sa tombe, il déduit qu’une fibre de viande prise au hasard dans une conserve a autant de chance de venir de l’alouette que du cheval !
{} | Alouette | Cheval | Total |
Tirage au sort | 50% | 50% | 100% |
Poids utile | 20% | 20% | Sans signification |
Bayes, termes élémentaires ? | 50%.20%=10% | 50%.20%=10% | 20% |
Bayes, résultats ? | 50% | 50% | 100% |
La Répression des Fraudes veille et ne goûte pas à ce genre de calcul !
Pouvez-vous les aider à rectifier les comptes ? Si vous parvenez à trouver la réponse, faites un graphe ou un tableau, car cela sera ensuite utile pour maîtriser les problèmes qui suivent.
On peut se demander si impliquer la théorie des probabilités est le meilleur moyen de réfuter le raisonnement fallacieux notre producteur indélicat. Néanmoins, il serait bien de voir pourquoi la formule Bayes « indiquait » un résultat ahurissant : simplement en l’utilisant de façon erronée. Avec deux graphes on retrouve l’emploi normal de formule de Bayes :

Pâté d’alouette (1/2)
Graphe des hypothèses
Avec quelques transformations, on aboutit à :

Pâté d’alouette (2/2)
Graphe des réponses
On est bien sûr très loin des 50% de départ affirmé par notre producteur !
Il a calculé :
\[
P(Alouette\mid E) =\frac{ 0,50 } {0,50 + 0,50}... ???
\]
En réalité, la formule donne :
\[
P(Alouette\mid E) =\frac{ 0,50 .700 } {0,50 . 700 + 0,50 . 0,1} = 99,99\%
\]
Notre producteur voulait nous faire confondre moyenne et moyenne pondérée.
Ici, en manipulant une grandeur physique (un poids bien réel et non pas un pourcentage cuisiné à la va-vite), un consommateur ne peut pas tomber dans le panneau.
L’Argument de l’Apocalypse
Le paradoxe de Leslie (c’est l’un de ses autres noms [9]) repose lui aussi sur l’utilisation de la formule de Bayes. Imaginons (il n’y a rien de réel) que quelque part existent des mondes dont leurs issues seraient soumises à deux hypothèses que l’on met en concurrence :
- La théorie A : l’humanité du monde considéré disparaîtra en 2150 ;
- La théorie B : l’humanité du monde considéré disparaîtra plus tard.
Analysons leurs populations respectives et reprenons les chiffres du Monde « bien de chez nous ».
- Selon la théorie A, un humain sur 10 aura connu l’an 2000. On aura donc 5 milliards de personnes ayant vu l’an 2000 sur un total de 50 milliards à travers les âges.
- Dans le cas B, l’humanité considérée aura alors eu une population plus large. Pour fixer les calculs, disons qu’un humain sur 1000 aura connu l’an 2000. Là aussi 5 milliards de personnes auront vu l’an 2000, mais sur un total de 5 000 milliards de personnes.
Et pour terminer avec les hypothèses, disons que :
- la théorie A a une chance sur 100 d’exister (ou d’être en cours) ;
- quant à la théorie B, on lui donne 99% de chance d’exister.
Supposons que Carter m’envoie dans l’un de ces mondes (Dieu m’en garde !). Appelons E cet événement d’appartenir à l’un de ces mondes. Qu’est-ce qui me rend le plus probable d’avoir connu l’an 2000 ? Est-ce la théorie A ou la B ? Je devrais répondre en toute logique la théorie B à 99%. Mais considérons les probabilités conditionnelles, soit $P(A \mid E)$ et $P(B \mid E)$. Si j’applique la formule de Bayes, je devrais avoir confirmation de ces 99%.
Or, cette formule m’annonce la fin du monde proche avec un fort 50,25%.
Hypothèse | A | B | Total |
Probabilité (Hypothèse) | 1% | 99% | 100% |
Probabilité d’être présent en 2000 | 10% | 0,1% | Sans signification |
Bayes, termes élémentaires | 0,10% | 0,10% | 0,20% |
Bayes, résultats | 50,25% | 49,75% | 100,00% |
D’où vient ce changement ?
- D’un côté, je peux affirmer que le lien entre entre l’événement E et les hypothèses A (« je suis tombé dans un monde fou !) ») et B (« j’ai peu de raisons de m’en faire ») n’a ici aucune importance et je ne peux pas appliquer la formule de Bayes.
- D’un autre, je peux dire qu’il y a un événement E tout à fait digne d’intérêt et à prendre en compte (surtout pour la personne considérée, pour le restant du monde cela se discute !).
Le débat semble facile à conclure. Il n’en est rien :
- Ainsi, certains avancent que la formule Bayes ne serait pas applicable ici.
- D’autres ajoutent des considérations supplémentaires, mais cela revient à changer les hypothèses du problème.
- J’aurais mieux fait de ne connaître ni Carter ni l’An 2000, car le calcul serait exact !
Plus rationnel, le mathématicien français Jean-Paul Delahaye démontre que l’emploi de la formule de Bayes est source de pièges et a proposé une explication dans [10] et [11]. On peut aussi se rappeler le Pâté d’alouette (ou voir [12]) et rectifier le tableau vu plus haut.
Graphes

Apocalypse (1/2)
Graphe des hypothèses
Le second graphe est obtenu en pondérant les populations suivant les probabilités des deux théories. On obtient :

Apocalypse (2/2)
Graphes des réponses
Sous forme algébrique, on aurait écrit :
\[ P(B\mid E) = \frac{0,1\%. 5.10^{12} .99\%}{0,1\%. 5.10^{12} .99\% +10\%.50.10^{9} .1\%} = \frac{99\%}{99\% + 1\%} =99\%=P(B) \]
De façon similaire, on obtient aussi :
\[ P(A\mid E) = \frac{1\%}{99\% + 1\%} = 1\%=P(A) \]
Ceci diffère de la formule avancée par Brandon Carter qui ne prenait pas en compte les populations. Cela ressemble au problème du Pâté d’alouette où le producteur ne pondérait pas avec les poids des animaux. La formule fallacieuse sans pondération était :
\[ P(B\mid E) = \frac{0,1\%.99\%}{0,1\%.99\% +10\%.1\%}... ??? \]
L’exercice n’est pas trop différent de celui du pâté d’alouette, mais les chiffres mis en jeu sont notablement différents. Et une erreur de raisonnement est vite arrivée !
On peut se demander en termes plus simples où est le piège ? Maintenant que tout est au grand jour, chacun peut choisir sa méthode de raisonnement :
- Jean-Paul Delahaye parle d’anamorphoses (c’est-à-dire une forme de déformation), d’effet de loupe ou de filtre (on ne regarde que les 5 milliards d’individus présents en l’an 2000).
- La confusion entre moyenne et moyenne pondérée est la cause du raisonnement fallacieux.
- L’événement E n’apporte aucune information [13] et il n’y pas lieu de faire des calculs inutiles (si on l’on passe outre, c’est un droit, mais cela n’autorise pas à faire dire n’importe quoi à Bayes).
On peut aussi affirmer que ces explications sont toutes synonymes. Choisissez celle que vous voulez. C’est une affaire de goût.
Selon une formule célèbre, « Un topologue est une personne qui ne connaît pas la différence entre une tasse de café et un beignet ». Maintenant, on peut dire qu’ « un probabiliste est une personne qui connaît la ressemblance entre l’Apocalypse et un pâté d’alouette ».
Le Paradoxe de l’Apocalypse est résolu.
Annexes. Des exemples comme s’il en pleuvait !
Si les deux exemples vous ont troublés ou séduits, vous devez restez perplexes. Comment peut-on bâtir des problèmes avec de telles chausse-trapes et mieux encore les éviter ? C’est assez simple : toute situation où l’on confond moyenne et moyenne pondérée et où l’on considère un événement sans réelle portée (le temps qui passe) peut tendre un piège plus ou moins grossier. Voici un exemple inédit qui peut vous aider à en inventer d’autres.
Le camping des Flots Bleus
Dominique, le directeur du camping des Flots Bleus, a reçu un avis météo aussi défavorable qu’ambigu :
- Hypothèse A : soit à partir de 16h00, un orage violent frappera son camping pendant 1h00 et il sera tombé 20 mm,
- Hypothèse B : soit les vents fléchissent et tomberont 30 mm de précipitation pendant 1h30.
La première hypothèse est probable à 30%, et la seconde à 70%. En résumé :
Hypothèse | A | B |
Tirage (hypothèse) | 30% | 70% |
Durée (hh:mm) | 01:00 | 01:30 |
Précipitation (mm) | 20 | 30 |
A 16h30, il affirme à l’un de ses clients : « Dr. Duflot, il est tombé 10 mm d’eau en 30 minutes et si je fais mes calculs de statistiques, la première hypothèse est devenue probable à 39% et la seconde à 61%. Dominique assimile chaque quantité de pluie à des tirages au sort équiprobables [14]. On peut accepter cette simplification [15], même si la réalité est plus complexe.
Il a donc appliqué le calcul de Bayes, mais de façon erronée :
Hypothèse | A | B | Total |
Tirage | 30% | 70% | 100% |
Probabilité conditionnelle | 10mm/20mm = 50% | 10mm/30mm = 33% | Sans signification |
Bayes, termes élémentaires | 15% | 23% | 38% |
Bayes, résultats | 15/38 = 39% | 23/38 = 61% | 100% |
Le docteur Duflot comprend que dans les deux cas, il ne va pas pouvoir jouer aux boules. Mettant à profit le temps disponible, il cherche comment appliquer la formule de Bayes correctement.
Avant la fin de la pluie, il va donc voir Dominique et lui montre la bonne méthode pour aligner les chiffres et (ouf !) sortir le bon résultat. Comment a-t-il remis les chiffres de Dominique en ordre ?
Graphes

Le camping des flots bleus (1/2)
Graphes des hypothèses
Ceci permet d’obtenir le graphe final :

Le camping des flots bleus (2/2)
Graphes des réponses
Ce graphe montre des moyennes qui choquent au premier regard. Le calcul montre une pluie de 27 mm, ce qui semble contraire aux hypothèses. On a 6 mm de pluie venant de la première hypothèse et 21 mm de la seconde ! Pour Dominique, cela n’a pas de sens, en effet. Mais c’est correct pour un observateur qui cherche à faire une moyenne sur un grand nombre d’orages qui auraient les mêmes caractéristiques.
Vous pouvez écrire quantité de saynètes qui présentent ce genre de curiosités mathématiques.
La rédaction d’Images des maths, ainsi que l’auteur, remercient pour leur relecture attentive,
les relecteurs dont le pseudonyme est le suivant : François Brunault, EULENSPIEGEL, Magnani, Gérard Grancher, Francois D. et Michele Triestino.
Notes
[1] On peut affirmer que l’usage a validé un anglicisme. « Argument » se traduit ici par « débat ».
[2] John Leslie, The End of the World : The Sciences and Ethics in Science and Philosophy, Routledge, 1998.
[3] Par exemple, voir le site de Nick Bostrom, Anthropic Principle. An Annotated Preprint Archive, 2007.
[4] Certains diraient que cette valeur vaut 1/2. Comme on ne connaît ni Vincent ni rien d’autres dans ce problème, il serait hasardeux de dire que les deux cas envisagés, en infraction ou non, auraient la même probabilité. Aussi, mieux vaut affirmer que cette valeur est totalement indéterminée.
[5] J’ai obtenu ce chiffre en me rappelant que Sandrine ne s’est trompée qu’une seule fois en une centaine d’observations. J’ai donc une valeur que j’estime à tort ou à raison suffisamment précise. Une analyse mathématique plus poussée dirait que je considère des processus stationnaires : la probabilité que Sandrine se trompe n’a pas variée à chaque fois qu’elle m’a rapporté des faits. C’est une simplification, mais qui, croyez-moi, ne concerne que Sandrine. Vous connaissez surement des personnes qui après deux verres ont un taux d’erreur qui augmente !
[6] Cet exemple utilise les lois les plus simples de probabilités discrètes, équiprobabilité et autres.
[7] Thomas Bayes (1702, 1761), mathématicien britannique et pasteur de l’Église presbytérienne. Voir Wikipedia.
[8] Un tableau ou un graphe perd beaucoup en concision, mais on verra par la suite qu’appliquer directement la formule de Bayes est source de confusions entre les différents P(E|A), P(A|E) ou autres. Toute présentation qui réduit le risque d’erreur est donc la bienvenue.
[9] C’était un paradoxe, jusqu’à ce que l’on trouve l’explication. Il faudrait dire « raisonnement fallacieux », mais il est vrai que cela a moins de charme.
[10] Jean-Paul Delahaye, Au pays des paradoxes, Belin, Pour la science, 2008
[11] Jean-Paul Delahaye, La Belle au bois dormant, la fin du monde et les extraterrestres, Pour la science, 2003
[12] Philippe Gay, Édouard Thomas, Détournement de Bayes, Tangente n°136, Septembre-Octobre 2010
[13] Il existe sans doute plusieurs façons d’expliquer pourquoi E n’apporte aucune information. Si ceci est admis, il n’y a plus besoin de faire de longs calculs. Mais il resterait une énigme : pourquoi Bayes serait incohérent et nous mettrait sur une fausse piste ?
[14] Dominique a choisi un modèle de probabilité particulier, mais ce n’est pas le seul qui soit envisageable. Au moins il n’a pas pris le plus compliqué et c’est tant mieux. Voyez-vous d’autres modèles possibles ? Quel que soit le modèle, si on n’a pas plus d’informations pertinentes E, on restera avec P(A)=P(A|E).
[15] Bien que licite, le raisonnement de Dominique entraine quelques remarques. Par exemple, il analyse un tirage au sort dont on connaissait à l’avance le résultat, car dans les deux cas on a obligatoirement une averse. Il n’y a rien à redire, sauf que cet événement a une quantité d’information nulle.
Partager cet article
Pour citer cet article :
Philippe Gay — «L’Argument de l’Apocalypse… selon la Répression des Fraudes» — Images des Mathématiques, CNRS, 2011
Laisser un commentaire
Actualités des maths
-
5 mars 2023Maths en scène : Printemps des mathématiques (3-31 mars)
-
6 février 2023Journées nationales de l’APMEP, appel à ateliers (9/4)
-
20 janvier 2023Le vote électronique - les défis du secret et de la transparence (Nancy, 26/1)
-
17 novembre 2022Du café aux mathématiques : conférence de Hugo Duminil-Copin (Nancy et streaming, 24/11)
-
16 septembre 2022Modélisation et simulation numérique d’instruments de musique (Nancy & streaming, 22/9)
-
11 mai 2022Printemps des cimetières
Commentaire sur l'article