Les probabilités négligeables selon Émile Borel

Piste rouge Le 14 février 2018  - Ecrit par  Thierry Martin Voir les commentaires (1)

Cet article s’intéresse au point de vue d’Émile Borel sur le principe des probabilités négligeables et, en particulier, discute des conséquences pratiques de l’application de ce principe.

Lors du XVIIIe Congrès international de philosophie des sciences qui se tient à Paris en 1949, les mathématiciens probabilistes concentrent leurs discussions sur la question de la légitimité de l’usage d’un principe de probabilités négligeables (Cf par exemple (Fréchet, 1955)), thème qui est aussi au centre du débat qui, dans le numéro de la revue Dialectica consacrée la même année à « La connaissance probable », oppose subjectivistes et objectivistes autour des travaux d’Émile Borel.

L’usage d’un tel principe a profondément marqué l’histoire de la constitution du calcul des probabilités, jouant le rôle d’instrument de validation de la théorie : il sous-tend notamment l’analyse de l’espérance morale menée par Buffon dans son Essai d’arithmétique morale publié en 1777, et est au cœur de la réflexion de Cournot sur la valeur objective du calcul des probabilités, développée en 1843 dans l’Exposition de la théorie des chances et des probabilités. Mais on constate qu’en ce milieu du XXe siècle, il survit à la constitution du calcul des probabilités en théorie axiomatique, notamment dans l’œuvre d’Émile Borel où il est un thème récurrent.

Ainsi, dans les premières pages de son ouvrage, Valeur pratique et philosophie des probabilités, achevant le 4e et dernier volume de son monumental Traité du calcul des probabilités, Émile Borel rappelle que « par le calcul on ne peut transformer une grandeur quelconque qu’en grandeur de même nature » (Borel, 1939, p. 5). Appliqué à la théorie des probabilités, cela signifie qu’en calculant des probabilités, on ne peut obtenir que des probabilités. Par conséquent, il n’est pas possible de passer du probable au certain, et toute mesure de probabilité, aussi élevée soit-elle, demeure une probabilité et ne peut venir équivaloir la certitude. Pourtant, Borel lui-même affirmait que « les événements dont la probabilité est suffisamment faible ne se produisent jamais » (Borel, 1943, p. 8), formule constituant ce qu’il appelle la « loi unique du hasard », et dont il propose une illustration fictive avec l’hypothèse d’un groupe de singes qui, volant un lot de machines à écrire et frappant sans relâche leurs touches au hasard, composent sans erreur l’ensemble des volumes de la Bibliothèque Nationale ou ceux des plus riches bibliothèques du monde.

Malgré les apparences, il n’y a aucune incohérence de la part de Borel, dans cette position simultanée de deux thèses qui semblent se contredire ; mais cette compatibilité demande à être expliquée, car elle n’affirme pas que l’événement de très petite probabilité est très peu probable, mais bien qu’il ne se réalisera pas, passant ainsi d’une probabilité à une certitude. Une mesure de probabilité conduit ici à poser comme certaine une affirmation portant sur le réel. Et il ne s’agit pas d’une erreur : on sait que la probabilité très petite n’est pas rigoureusement nulle, donc qu’en toute rigueur l’événement de très petite probabilité n’est pas impossible, mais on procède à une sorte de passage à la limite permettant de tenir pour nulle, donc de négliger, la très petite probabilité. Cette opération suppose la mise en œuvre d’un « principe des probabilités négligeables » – qu’on abrégera ici en « PPN » –, dont il convient de remarquer qu’il n’appartient pas à la théorie mathématique elle-même ; il concerne son application, donc son interprétation, comme le rappellent aussi bien Émile Borel que Maurice Fréchet ou Paul Lévy qui écrit au début des Compléments à son Cours d’analyse donné à l’École Polytechnique en 1920-1921 : « Le calcul des probabilités, au point de vue mathématique, consiste en un petit nombre de théorèmes susceptibles d’un énoncé aussi précis et d’une démonstration aussi rigoureuse que ceux de toute autre partie des mathématiques. Mais les applications soulèvent des questions plus délicates. Elles reposent toutes sur l’assimilation d’un événement très peu probable à un événement impossible ; il s’agit de savoir ce que vaut cette assimilation ». Ce principe soulève au moins deux difficultés :

  • la première est d’ordre épistémologique, et interroge la légitimité de ce principe : est-on autorisé à assimiler ainsi la probabilité très petite à une probabilité nulle ?
  • la seconde est de nature technique, et porte sur la détermination de la valeur numérique qu’il convient d’attribuer à la probabilité négligeable. La question est ici celle du seuil à partir duquel une petite probabilité peut être posée comme négligeable, et la difficulté tient alors au risque d’arbitraire dont est susceptible cette détermination.

Le PPN a reçu au cours de son histoire deux formes distinctes, quoique souvent mêlées : 1° tout en sachant que l’événement de très petite probabilité n’est pas impossible, on décide de ne pas tenir compte, dans le choix d’une action, des conséquences qu’entraînerait sa réalisation, eu égard à la disproportion entre le coût élevé qu’entraînerait sa prise en compte et la petitesse de sa probabilité. On a ici affaire à ce qu’on pourrait appeler un principe décisionnel, définissant une probabilité subjectivement négligeable, principe dont la signification est relative à l’événement considéré et à l’action à accomplir. 2° On considère l’événement de très petite probabilité comme physiquement impossible parce que, bien qu’il soit logiquement possible, les conditions de son application au réel ajoutent des contraintes supplémentaires qui interdisent sa réalisation, si bien qu’il ne peut se produire dans les conditions qui sont celles de l’expérience. On a ici affaire à un principe physique définissant une probabilité objectivement négligeable, principe dont la signification n’est pas liée à telle ou telle condition particulière, mais s’applique aux conditions générales de notre expérience. Sous la première forme, le principe remplit une fonction pratique, dans la seconde il reçoit une fonction épistémique, celle de conférer à la théorie mathématique le statut de connaissance objective.

Le but de l’analyse qui suit n’est pas d’étudier l’ensemble des difficultés que soulève le recours à un PPN, mais de souligner cette dualité de significations dans l’œuvre d’Émile Borel.

JPEG - 807.6 ko

L’ouvrage Valeur pratique et philosophie des probabilités illustre parfaitement l’imbrication de perspectives mentionnée précédemment. La question posée par Borel au début du volume est d’abord épistémologique. Il part du constat selon lequel, tandis que les résultats auxquels conduisent les autres branches des mathématiques sont reçus sans contestation possible, ceux auxquels aboutit le calcul des probabilités sont fréquemment l’objet d’une suspicion quant à leur accord avec l’expérience, et ceci alors même que ces résultats sont issus de déductions tout aussi rigoureuses que dans les autres branches des mathématiques. Dans le champ des probabilités, les vérifications, écrit-il, y sont « toujours sujettes à caution ».

Cette situation résulte du principe formulé au départ : « par le calcul on ne peut transformer une grandeur quelconque qu’en grandeur de même nature » ; par conséquent en calculant des probabilités on ne peut obtenir que des probabilités, et les résultats étant des probabilités, leur validation demeure également seulement probable [1], si bien que l’applicabilité du calcul des probabilités au réel se trouve compromise. En d’autres termes, le fait que l’événement probabilisé ne se réalise pas, n’invalide pas le calcul de sa probabilité, puisque ce calcul ne porte, justement, que sur une probabilité, laquelle autorise la non-réalisation de l’événement, et inversement sa réalisation ne validera pas davantage le calcul puisqu’il ne mesure qu’une possibilité d’existence [2]. Et c’est pour surmonter cette difficulté épistémologique que Borel recourt au PPN, qui intervient donc ici à titre d’instrument de validation de la théorie.

La difficulté est alors de savoir comment déterminer une probabilité suffisamment petite pour être admise comme négligeable. Il est clair qu’il n’y a pas de probabilité absolument petite, mais c’est en fonction de l’échelle du phénomène considéré que pourra être estimée la petitesse de la probabilité, donc que pourra être assignée la valeur à partir de laquelle cette probabilité devient négligeable. Borel procède à une estimation numérique des probabilités négligeables en distinguant 3 échelles différentes : humaine, terrestre, cosmique. Bien entendu, son but n’est pas de fournir une mesure exacte de la limite à partir de laquelle une probabilité devient négligeable, mais seulement d’en indiquer l’ordre de grandeur.

À l’échelle humaine, c’est-à-dire au niveau individuel, une probabilité pourra être considérée comme négligeable si elle est inférieure à $10^{-6}$. À l’échelle terrestre, c’est-à-dire pour l’humanité entière, cette limite pourra être abaissée à $10^{-15}$ dans l’hypothèse où on estime cette population, comme le fait Borel, à environ 1 milliard d’individus soit $10^9$. Enfin, elle sera, dit-il, de $10^{-50}$ à l’échelle cosmique. À l’échelle humaine, il s’agit pour Borel, de raisonner en termes de négligeabilité pratique, c’est-à-dire de définir la probabilité à partir de laquelle un homme raisonnable agira comme si l’événement correspondant ne devait pas se produire. « Dans la conduite ordinaire de sa vie, écrit ainsi Borel, tout homme néglige habituellement les probabilités dont l’ordre de grandeur est inférieur à $10^{-6}$, c’est-à-dire à un millionième, et nous constaterons même, qu’un homme qui voudrait tenir constamment compte de possibilités aussi peu probables, deviendrait rapidement un maniaque ou même un fou » (Borel, 1939, p. 6). Si l’on reprend la distinction introduite précédemment entre une forme décisionnelle et une forme physique du principe des probabilités négligeables, il est clair que l’on a ici affaire à la première forme : c’est l’estimation du risque auquel m’expose telle ou telle décision qui à la fois autorise à et exige de considérer une petite probabilité comme négligeable, ceci alors même que l’événement correspondant peut fort bien se réaliser. Cependant, la question à laquelle vient répondre l’analyse de Borel n’est pas d’ordre pratique, mais comme on l’a vu de nature épistémologique, puisqu’il s’agit de la validation du calcul des probabilités. Il faut conclure de cette imbrication de perspectives que, pour Borel, les deux questions sont indissociables, et engagent toutes deux l’application de la théorie au réel.

JPEG - 75.8 ko

Mais à côté de cette négligeabilité décisionnelle, Borel considère une négligeabilité physique, celle qu’énonce la « loi unique du hasard ». L’événement que décrit la fiction des singes dactylographes n’est pas logiquement impossible, en ce que sa définition impliquerait contradiction, mais il l’est physiquement, ou de fait, à raison de la disproportion entre la probabilité mathématique de sa réalisation et les conditions physiques de sa production empirique. On se situe ici dans le cadre des probabilités universellement négligeables que peut illustrer l’hypothèse d’un événement dérogeant aux lois de la mécanique ou de la thermodynamique et dont Borel estime la valeur à $10^{-1000}$. On peut en donner une illustration en reprenant l’exemple construit par Borel dans l’article « Sur les probabilités universellement négligeables » (Borel, 1930). Imaginons que l’on dispose de 100 caractères d’imprimerie distincts et qu’une page de texte contient 2000 caractères, le nombre de pages possibles qu’un linotypiste [3] peut composer en frappant au hasard les touches de sa machine est égal à $100^{2000}$, soit $10^{4000}$. Par conséquent, la probabilité pour que l’une de ces pages possibles, prise au hasard, corresponde à une page réelle définie d’avance est égale à $10^{‑4000}$. Borel peut alors montrer que les conditions spatio-temporelles qui sont les nôtres, même en supposant des milliards de siècles, ne permettent pas, loin s’en faut, la réalisation d’un tel événement. Ici, ce n’est pas qu’il convient d’agir comme si cet événement ne pouvait se produire. Mais c’est que les conditions de réalisation empirique d’un tel événement interdisent d’envisager sa réalisation comme possible [4].

Les probabilités universellement négligeables appartiennent à cette catégorie de nombres que Borel appelle inaccessibles. Dans la préface du livre Les nombres inaccessibles, dont il précise qu’il est « l’aboutissement d’un demi-siècle de réflexions sur les principes de l’Analyse mathématique » (Borel, 1952, préface p. IX), Borel distingue à l’intérieur des mathématiques deux champs, selon que leurs objets peuvent ou non être effectivement construits et exhibés par le mathématicien, soit « une science de l’accessible et du réel, au-delà de laquelle il reste possible de développer une science de l’imaginaire et de l’imaginé » (Borel, 1952, préface p. IX-X). Sont des nombres accessibles, ceux que l’on peut identifier avec précision et énoncer effectivement par la mise en œuvre de règles déterminées dans un temps et un espace finis, autrement dit des nombres « calculables » ou « effectivement définis » en un nombre fini de mots. En revanche, les nombres qui, par leur immensité, excèdent les limites de nos conditions empiriques, de telle sorte qu’il n’est plus possible de les écrire effectivement, seront dits relativement inaccessibles. Tel est le cas, dit Borel, du nombre $n = 2^{2 000 000 000} + 3^{3 000 000 000} + 5^{5 000 000 000}$. « Nous savons, indique-t-il, que le nombre $n$, écrit dans le système décimal, exigerait plus d’un milliard de chiffres ; si l’on écrivait 1000 chiffres sur une page, il faudrait plus d’un million de pages pour l’écrire, à supposer que l’on ait eu le temps de calculer tous les chiffres. Un tel nombre pourra être dit relativement inaccessible, relativement signifiant ici par rapport au système décimal et à la durée de la vie humaine. Si, en effet, on écrivait 10 chiffres par seconde, il faudrait plus de 1000 jours pour écrire un milliard de chiffres et par suite des siècles pour effectuer le produit de deux nombres ayant chacun un milliard de chiffres » (Borel, 1952, préface p. 2). Enfin, sont définis comme absolument inaccessibles, non pas les nombres qui ne peuvent être effectivement construits dans un temps fini, mais ceux pour lesquels on ne dispose d’aucun moyen de calcul permettant de les engendrer. Il s’agit en particulier des nombres auxquels conduit l’adoption de l’axiome du choix de Zermelo, auquel fait référence Borel dans l’article sur les probabilités universellement négligeables en évoquant les « choix aventureux dans l’infini de Zermelo » (Borel, 1930, p. 1141).

Borel précise au chapitre IX, que l’axiome du choix de Zermelo a été introduit dans la théorie cantorienne des ensembles afin de résoudre le problème de savoir s’il est possible d’ordonner le continu, autrement dit de classer tous les points du continu de telle sorte que chacun d’eux possède un suivant immédiat et cela sans discontinuité. Dit autrement, sachant que l’ensemble infini dénombrable N satisfait la propriété de bon ordre [5], la question se pose de savoir si cette propriété peut être également affirmée d’ensembles de puissance supérieure, donc d’ensembles infinis non dénombrables. L’axiome du choix permet de répondre affirmativement à cette question, donc d’assurer une unité à la théorie cantorienne des ensembles, en posant qu’à tout point du continu on peut faire correspondre un autre point qui est son suivant immédiat, donc en dotant le théorème de bon ordre d’une validité universelle. Cependant, s’il permet d’affirmer que tout ensemble est bien ordonnable, il reste qu’on ne peut construire effectivement un bon ordre sur R. L’axiome du choix, tel que le formule Borel qui préfère l’appeler un postulatum, énonce que « étant donné un ensemble quelconque, il est possible de choisir dans chacun de ses sous-ensembles un élément distingué » (op. cit., p. 115). Mais, objecte-t-il, il n’est pas possible de construire effectivement ce nombre, même si on postule qu’il existe. En conséquence, « dire que l’on choisit un nombre déterminé parmi l’infinité des nombres inaccessibles revient à énoncer une opération vide de sens, puisque ce nombre n’est et ne sera jamais distingué des autres » (op. cit., p. 118), ce qui, précise Borel, n’empêche pas d’admettre par postulat « que ce nombre a été choisi et est vraiment distingué » (op. cit., p. 119). On aperçoit alors l’enjeu de la distinction entre une mathématique de l’accessible et une mathématique de l’imaginaire. Si l’on refuse l’axiome du choix, on définira ce que Borel propose d’appeler les mathématiques euclidiennes, mathématiques de l’accessible. Si, en revanche, on l’accepte, on crée une nouvelle mathématique, la mathématique de Zermelo, ou encore la « branche Z des mathématiques », jugée par Borel certes parfaitement légitime d’un strict point de vue mathématique, mais en même temps purement idéale. Ainsi, derrière l’analyse des nombres inaccessibles, c’est en fait une discussion sur les conséquences de l’axiome de Zermelo qui est en jeu, discussion menée d’un point de vue constructiviste, ou pour reprendre les expressions de Poincaré d’un point de vue pragmatiste (Poincaré, 1913, p. 84 et 96), par opposition au point de vue formaliste du cantorien.

On constate donc que la notion physique de négligeabilité reçoit chez Borel une double fonction épistémologique dans le cadre des probabilités universellement négligeables :

1° Lorsqu’elle s’exprime sous la forme de la « loi unique du hasard », c’est-à-dire dans le champ des nombres relativement inaccessibles, elle permet de définir une probabilité suffisamment faible pour poser l’événement considéré comme impossible, et par conséquent l’événement contraire comme jouissant d’une probabilité suffisamment élevée pour égaler la certitude. Elle assure ainsi une valeur objective au calcul des probabilités : « Ce n’est pas une différence de nature qui sépare la probabilité objective de la probabilité subjective, écrit Borel (Borel, 1914, p. 226-227), mais seulement une différence de degré. Un résultat du calcul des probabilités mérite d’être appelé objectif, lorsque sa probabilité devient assez grande pour se confondre pratiquement avec la certitude ».

2° Lorsqu’on considère des nombres absolument inaccessibles, la notion de négligeabilité physique permet de faire le partage entre une science de l’accessible et la « branche Z des mathématiques », certes légitime pour Borel, mais purement spéculative.

On comprend alors pourquoi il ne prend pas la peine de distinguer nettement les différentes significations que reçoit la notion de probabilité négligeable. C’est que, quel que soit l’objet qu’il considère, qu’il s’agisse de manifester la fécondité du calcul des probabilités dans le cadre des décisions humaines ou d’envisager les conditions physiques de son application à la pratique, ou encore de discuter la légitimité d’une mathématique purement formelle issue de l’adoption de l’axiome de Zermelo, c’est toujours dans une orientation pragmatiste ou constructiviste qu’il développe sa réflexion. Il s’agit toujours pour lui d’établir l’applicabilité de la théorie.

En conclusion, on peut avancer que le recours au PPN revêt dans l’œuvre d’Émile Borel, deux significations distinctes, l’une pragmatique, l’autre physique. Si Borel mêle ces deux significations, c’est qu’il poursuit dans les deux cas le même but : établir la « valeur pratique » du calcul des probabilités, c’est-à-dire son applicabilité au réel. Mais il s’agit bien de deux significations différentes. L’usage pragmatique et décisionnel du principe répond à une nécessité technique, celle de limiter le nombre de paramètres à prendre en compte dans le calcul. Son usage physique pose qu’un événement dont on peut calculer la probabilité mathématique et dont le concept n’est pas contradictoire, ne peut se produire dans les conditions empiriques qui sont les nôtres. Le principe installe alors une distance entre le logique et le réel, entre le mathématique et le physique, car l’application du calcul introduit des contraintes supplémentaires, si bien que tout ce qui est logiquement possible ne l’est pas pour autant physiquement. L’applicabilité du calcul des probabilités n’est pas pour autant mise en cause, mais elle n’est possible qu’à l’intérieur des limites que constituent les conditions empiriques de réalisation de l’événement probabilisé.

Bibliographie

É. Borel, Le hasard, Paris : Félix Alcan, 1914.

É. Borel, « Sur les probabilités universellement négligeables », Comptes rendus de l’Académie des Sciences, t. 190, 1930, p. 537-540 ; repris dans Œuvres d’Émile Borel, Paris : C.N.R.S., 1972, t. II, p. 1139-1142.

É. Borel, Valeur pratique et philosophie des probabilités (fascicule III du tome IV du Traité du calcul des probabilités), Paris : Gauthier-Villars, 1939.

É. Borel, Les probabilités et la vie, Paris : PUF, 1943.

É. Borel, Les nombres inaccessibles, Paris : Gauthier-Villars, 1952.

M. Fréchet, « Rapport général sur les travaux de la section de calcul des probabilités », dans Les mathématiques et le concret, Paris, P.U.F., 1955, p. 205-232.

H. Poincaré, « La logique de l’infini », Dernières pensées, Paris : Flammarion, 1913.

Post-scriptum :

L’auteur remercie Sabine Rommevaux-Tani, Sébastien Gauthier, Avner Bar-Hen, Jean-Pierre Delmas et Julien Chevallier pour leur relecture et leurs conseils.

Article édité par Sabine Rommevaux-Tani

Notes

[1« Même si le cas favorable est de beaucoup le plus probable, le cas défavorable peut cependant se produire, sans que pour cela la théorie et le calcul puissent être regardés comme étant en défaut », écrit Borel, (Borel, 1939, p. 5).

[2On peut ajouter que le recours à la statistique diminue certes cette difficulté, mais ne la supprime pas.

[3Le raisonnement de Borel reste inchangé, bien sûr, si on considère l’utilisation d’un clavier d’ordinateur.

[4Bien entendu, l’événement défini ici comme impossible n’est pas l’écriture de la page réelle, mais sa réécriture au hasard : l’événement ici probabilisé n’est pas l’arrivée de l’une quelconque des combinaisons possibles, mais l’arrivée de telle combinaison singulière distinguée parmi l’ensemble des combinaisons possibles.

[5Un ensemble E est dit bien ordonné si tout sous-ensemble non vide de E possède un minimum.

Partager cet article

Pour citer cet article :

Thierry Martin — «Les probabilités négligeables selon Émile Borel» — Images des Mathématiques, CNRS, 2018

Crédits image :

img_17795 - © S. Gauthier
img_17790 - © New York Zoological Society, 1907. Reproduit sur Wikipedia

Commentaire sur l'article

  • Les probabilités négligeables selon Émile Borel

    le 15 février à 11:34, par Aboubakar Maitournam

    Merci pour pour cet article hautement épistémologique. En parlant de « géométrie du hasard » pour désigner les probabilités des siècles avant l’avènement de la théorie de la mesure (qui est la justification mathématique avec l’axiomatique de Kolmogorov de la théorie des probabilités) ; Blaise Pascal a eu une intuition étonnante. Il avait ainsi eu la vision des probabilités formalisées, axiomatisées. En effet (merci à la théorie de la mesure de Borel, Lebesgue, Stieljes..), on calcule une probabilité comme on mesure une longueur, une surface, un volume. Mais dès qu’on devient un « artisan des mathématiques » (au sens de Kuhn, par exemple si on prend un modèle et on l’implémente, en clair si on est un ouvrier par rapport aux grands concepteurs des théories), les questions se posent. Ainsi en maths classiques bourbakiennes (les probabilités n’étaient pas incluses dans ces dernières), epsilon (du cours du lycée pour définir les limites puis de la topologie métrique ou du calcul infinitésimal) ne posait aucun problème formellement mais pratiquement epsilon est-il 0,1 ; 0,01 ; 0,001 ; 0,0000001 ? Donc oui Gaston Bachelard a raison, “l’application est complication”. En réalité appliquer, c’est (il me semble) se définir une échelle, des bornes, des seuils, des limites au propre comme au figuré. Ainsi en théorie, le prochain nombre réel après 0 est un inconnu, en pratique modulo une échelle il est soit 0,1, ou 0,01 ou 0,001 ou…. Donc que ce soit en probabilités ou en maths classiques, les ambiguïtés surgissent quand on descend du monde formel pur axiomatisé dans la réalité du moins en apparence. Mais on sait depuis Gödel (théorème d’incomplétude) que même formellement il y a des limites (limitations) en maths. De plus les probabilités soulèvent des questions et des doutes car elles ont endossé l’humilité (c’est leur péché original) ; Ainsi elles hésitent en disant c’est probable alors qu’ailleurs on assène (maths classiques) c’est sûr et certain malgré la « fin des certitudes » (Godel, hypothèse du continu, Cohen,..). La parabole pour résumer cela, c’est une personne qui marche sans hésiter sûre d’elle-même qui assène des vérités (maths classiques) et une autre qui par humilité dirait il est possible, c’est sûr mais…. De manière freudienne elle instille ainsi le doute sur ses propres affirmations.

    Répondre à ce message

Laisser un commentaire

Forum sur abonnement

Pour participer à ce forum, vous devez vous enregistrer au préalable. Merci d’indiquer ci-dessous l’identifiant personnel qui vous a été fourni. Si vous n’êtes pas enregistré, vous devez vous inscrire.

Connexions’inscriremot de passe oublié ?

Suivre IDM