Lagrange et le calcul des probabilités

Piste noire 22 avril 2015  - Ecrit par  Bernard Bru Voir les commentaires

A l’occasion de la commémoration du bicentenaire de Joseph-Louis Lagrange en 2013, l’Institut Henri Poincaré et Images des mathématiques ont noué un partenariat avec la Lettera Matematica Pristem, journal italien de diffusion des savoirs mathématiques. Le texte ci-dessous est la version française d’un article extrait du numéro spécial que la Lettera a consacré à Lagrange en 2014

On ne connaît que deux mémoires de Lagrange consacrés au calcul des probabilités, [1] [2] publiés en 1776 et 1777 [3].

Cela peut paraître peu, mais comme il s’agit de mémoires très exceptionnels, comme la plupart des mémoires de Lagrange, c’est déjà trop pour un exposé nécessairement court. En effet, l’œuvre de Lagrange forme un tout. Chacun de ses mémoires doit être replacé dans l’ensemble de l’œuvre pour être bien compris. C’est le cas notamment du second mémoire qui est en réalité le développement d’un projet conçu dès 1759 et qui touche aussi bien à l’histoire du calcul différentiel qu’à celle du calcul des probabilités.

JPEG - 280.3 ko
Joseph-Louis Lagrange
JPEG - 40.5 ko
Blaise Pascal sur un billet de 500 francs

On sait depuis Pascal que la plupart des problèmes de la théorie des hasards se ramènent à l’étude d’une équation aux différences qui décrit l’évolution de la fortune d’un joueur au cours d’une suite indéfinie de parties. L’idée du jeune Lagrange est de traiter ces équations par analogie avec la théorie des équations différentielles déjà bien développée par Euler et d’Alembert. Lagrange entend transposer les résultats de la théorie des équations aux différences infiniment petites, qu’il développe dans le même temps, à la théorie des équations aux différences finies, ou plutôt il entend développer les deux théories du même pas. Par exemple dans son premier article sur ce thème [4] Lagrange propose une méthode originale de variations des constantes dans le cas des équations différentielles linéaires avec second membre et la transpose au cas des différences finies. On sait que Lagrange reprendra cette idée vers 1775 [5] et l’appliquera de façon géniale dans ses mémoires mécaniques, notamment les derniers qui datent de 1808-1809, on verra à ce sujet la seconde édition de la Mécanique analytique. [6]

PNG - 1.2 Mo
Pierre Simon Laplace

Les applications probabilistes annoncées en 1759 ne seront publiées qu’en 1777. Lagrange propose alors une autre méthode tout aussi originale qu’il étend au cas des équations aux différences partielles, introduites par Laplace, [7] qui sont des analogues des équations aux dérivées partielles, l’un des thèmes analytiques dominants de ces années-là. La méthode de Lagrange est différente de la méthode des fonctions génératrices de Moivre et Laplace. Elle permet à Lagrange de donner la première solution analytique complète du problème de la durée du jeu, le problème le plus difficile de la théorie classique des chances, dont Moivre a donné l’expression générale sans qu’on sache vraiment comment il l’a obtenue.

Bref, pour exposer le second mémoire de Lagrange sur les probabilités, il faut le replacer non seulement dans l’histoire longue et riche du calcul des probabilités mais aussi dans celle aussi longue et plus riche encore du calcul différentiel et intégral. Il serait beaucoup trop long de le tenter ici, d’autant qu’il existe sur ce sujet des travaux importants, notamment l’article récent de Maria Teresa Borgato. [8]

Nous nous limiterons donc au premier mémoire de Lagrange sur le calcul des observations. On verra que ce mémoire est d’une richesse suffisante pour donner une idée de l’incomparable virtuosité de Lagrange dans les calculs analytiques et algébriques, mais aussi de son incontestable génie de l’invention et de ses hésitations dans ces questions si épineuses de statistique mathématique, à un moment de l’histoire où tout est encore à inventer, à bien peu près.

Ce mémoire a été lu à l’Académie de Berlin, les 2 et 16 novembre 1769 et le 21 août 1771. Le texte se ressent de cette présentation en deux fois à deux ans d’intervalle. D’autant que le texte définitif soumis aux Mélanges de Turin semble avoir été revu une dernière fois dans le courant de l’année 1773. Il est possible en effet que le mémoire soit l’un des deux qui ont été envoyés aux directeurs des Mélanges, le 27 janvier 1774.

Quoi qu’il en soit, l’existence du mémoire de Lagrange semble avoir été connue avant sa publication. Son sujet est d’actualité dans ces années-là. Comme l’écrit Jean III Bernoulli dans son Recueil pour les astronomes  : [9]

Le Problème de prendre entre un certain nombre d’observations le vrai milieu, qui est rarement le milieu arithmétique, intéresse beaucoup les Astronomes ; il est à souhaiter qu’on leur présente l’esprit rapproché des différentes méthodes données pour cet effet par le P. Boscovich, par M. Lambert dans l’ouvrage cité page 157 de mon premier volume, [10] par M. Daniel Bernoulli, dans un mémoire qui n’est pas encore imprimé, [11] enfin par M. de la Grange dans une belle Théorie qui a fait dernièrement le sujet de quelques lectures dans nos assemblées académiques.

JPEG - 1.3 Mo
Daniel Bernoulli

On verra également l’intéressant article « Milieu.. » du même Jean III Bernoulli, [12], qui expose la première version du mémoire de Daniel Bernoulli, dont il dit avoir reçu copie en 1769, et la partie « discrète » du premier mémoire de Lagrange ; ce qui démontre, en tout cas, l’intérêt des Académies européennes pour la recherche du milieu qu’il faut prendre entre plusieurs observations, un problème qui motive également les premières recherches de Laplace en calcul des probabilités. [13] [14]

Nous partageons notre article en deux parties, la première est probabiliste et la seconde statistique.

Calcul stochastique lagrangien

Comme son titre l’indique assez, le premier mémoire de Lagrange consiste à discuter à l’aide du calcul des probabilités de l’intérêt véritable qu’il y a à prendre la moyenne de plusieurs mesures soumises à des erreurs inévitables, qu’on espère ainsi « compenser ». Améliore-t-on ainsi la précision des mesures prises séparément et de quelle façon ?

PNG - 366.1 ko
Philosophical transactions

Ce problème a été posé de façon très nette par Thomas Simpson dans un mémoire publié en 1755 dans les Transactions de la Royal Society. [15] Lagrange ne cite nulle part Simpson, mais il est difficile de croire qu’il n’en a pas eu connaissance. Il connaît et apprécie les travaux mathématiques de Simpson qu’il discute parfois avec d’Alembert. [16] On ne voit pas pourquoi il n’aurait pas lu celui-là, d’autant qu’il a été publié de nouveau en 1757 dans des Mélanges, souvent cités par les savants du temps. Simpson est le premier, ou l’un des premiers, à proposer d’utiliser le calcul des chances en théorie des observations, notamment en Astronomie physique où chaque mesure est sujette à erreur et n’est que partiellement reproductible. Comme l’écrit Lagrange dans l’introduction de son premier mémoire, dans la théorie probabiliste des observations, on suppose que « les erreurs qui peuvent se glisser dans chaque observation sont données et qu’on connoisse aussi le nombre de cas qui peuvent donner ces erreurs, c’est-à-dire la facilité de chaque erreur ». Lagrange emploie le plus souvent le substantif facilité qui désigne généralement le nombre de cas ou la probabilité à une constante près dans le cas discret, ou ce qu’on appelle maintenant la densité, dans le cas continu.

On suppose donc connues « les limites entre lesquelles toutes les erreurs possibles doivent être renfermées avec la loi de leur facilité. » Et, annonce Lagrange, : « Je chercherai dans l’une et dans l’autre de ces hypothèses, quelle est la probabilité que l’erreur du résultat moyen soit nulle ou égale à une quantité donnée. »

Par exemple (Problème I, n° 1), on suppose que dans chaque observation, les erreurs ne puissent être que 0, +1 ou -1, et qu’il y a $a$ cas pour 0,$b$ cas pour 1 comme pour -1. On demande quelle est la probabilité d’avoir un résultat exact en prenant le milieu entre les résultats particuliers d’un nombre $n$ d’observations. » Ce problème, nous dit Lagrange, se ramène au suivant. On jette $n$ fois un dé à $a + 2b$ faces, dont $a$ sont marquées 0, $b$ marquées 1 et $b$ marquées -1. « Trouver la probabilité qu’il y a d’amener zéro », c’est à dire que la somme des faces soit nulle. Ce problème est classique depuis le début du XVIIIe siècle où il a été traité remarquablement par Montmort, Nicolas I Bernoulli et de Moivre. C’est précisément ce problème, qu’on appelle parfois le problème des points, généralisé à un dé à $f$ faces, marquées respectivement des nombres entiers $e_1, e_2, e_1, ..., e_f$ qu’on jette $n$ fois, que Moivre a mis au point la première partie de sa théorie des fonctions génératrices (la seconde partie est constituée de sa théorie des séries récurrentes que nous n’abordons pas ici). On associe à un tel dé le polynôme
[
x^e_1+x^e_2+...+x^e_f
]
Le nombre de façons d’obtenir une somme $s$ en $n$ jets est égal au coefficient de la puissance $x^s$ dans le développement du multinôme
[
(x^e_1+x^e_2+...+x^e_f)^n
]

JPEG - 39.9 ko
Abraham de Moivre

La méthode de Moivre [17], publiée plusieurs fois (1730, 1738, 1756), est devenue classique dans la seconde moitié du XVIIIe siècle, et naturellement Lagrange la connaît et l’utilise systématiquement dans son mémoire, en particulier dans ce problème I, où tout revient à calculer le terme constant de la puissance
[
(a+b(x+x^-1))^n
]
Ce qui n’est pas très difficile, par exemple, propose Lagrange, en écrivant $(a+b(x+x^{-1}))$ sous la forme :
[
(\alpha+\beta x)(\alpha + \beta x^-1)
]
avec $\alpha$, $\beta$ tels que $\alpha^2 +\beta^2=a$ et $\alpha \beta=b$. On élève ce produit à la puissance $n$. Le terme constant cherché est égal à la somme des carrés des coefficients du développement du binôme $(\alpha+\beta x)^n$.

Par exemple, si on suppose $a = 2b$, on a $\alpha=\beta=\sqrt{b}$, et le terme constant cherché vaut
[
b^n \Sigma_k=0^n (C_n^k)^2
]

Lagrange fait observer un peu plus loin, que la somme des carrés des coefficients du binôme $(1+1)^n$ a une forme simple, $\Sigma_{k=0}^n (C_n^k)^2 = C_{2n}^n$, une formule combinatoire qui résulte par exemple de ce que $\Sigma_{k=0}^n (C_n^k)^2 = \Sigma_{k=0}^n C_n^k C_n^{n-k}$ et que le second membre est une façon de compter les combinaisons de $n$ objets parmi $2n$. Laplace d’ailleurs redémontrera aussitôt cette formule dans une lettre à Lagrange du 11 août 1780. [18]

Lagrange a visiblement plaisir à faire des gammes sur ce thème, et au détour d’une formule à dégager une ou deux pépites algébriques ou combinatoires. Rappelons en une particulièrement élégante.

Au n° 5 remarque I, Lagrange se propose de chercher la loi que suivent les facilités ainsi calculées lorsque $n$ varie, dans le cas général où $a$ et $b$ sont quelconques.

JPEG - 324.8 ko
J.L. Lagrange / Zéphirin Belliard, lithographie de Delpech

Lagrange traite également le cas où les erreurs sont susceptibles de trois valeurs 0, -1 et $r$, où $r$ est un entier positif, mais pour ne pas être trop long nous omettons cette étude dont on imagine bien qu’elle est très ingénieuse. Il aborde ensuite le cas où les facilités des erreurs sont inconnues et qu’il faut les déterminer à partir des observations. Étant donnée son importance, nous effectuerons cette étude dans la partie suivante, et nous traitons sommairement la dernière partie du mémoire de Lagrange, celle qui concerne la facilité de la somme ou de la moyenne de n erreurs susceptibles de prendre des valeurs en nombre quelconque. Cette étude s’appuie visiblement sur les résultats de Simpson déjà évoqués, mais y ajoute des éléments tout à fait fondamentaux qui ont notamment fait impression sur le jeune Laplace, qui les reprendra à son tour dans un mémoire très important, une réponse laplacienne à Lagrange. [19]

Le premier problème traité par Lagrange est le problème classique des points. On dispose d’un dé à $f$ faces régulières, chaque face a la même chance d’arriver. On le jette n fois, déterminer la loi de la somme des points ainsi obtenus. Un problème qui remonte à Galilée au moins et dont tous les savants des XVIIe et XVIII siècles ont traité avec plus ou moins de réussite. Il s’agit en effet d’un des problèmes les plus sophistiqués du calcul classique des chances. C’est à l’occasion de ce problème que Nicolas Bernoulli et Montmort ont mis au point la formule du crible (ou principe d’inclusion-exclusion), une des formules fondatrices de la combinatoire.

JPEG - 351.2 ko

Le problème général des points, on l’a dit, a été complètement résolu par les géomètres du début du XVIIIe siècle. Il a été repris par Simpson qui l’a adapté à la première théorie probabiliste des observations. Dans la dernière partie de son premier mémoire, Lagrange commence par retrouver les résultats de Moivre et Simpson par la même méthode, celle des fonctions génératrices, mais avec sa puissance algébrique exceptionnelle qui lui permet d’aller plus loin, plus vite. Ce que Lagrange fait de façon particulièrement élégante grâce à un lemme algébrique (n° 23) dont nous ne dirons rien, sinon qu’il conduit à la formule alternée de Montmort-Nicolas Bernoulli-Moivre-Simpson-Lagrange-Laplace …

JPEG - 1.1 Mo
Leonhard Euler

On peut déjà remarquer que Lagrange introduit à cette occasion, en théorie des observations, c’est-à-dire en calcul stochastique, les « transformées de Laplace », une notion déjà utilisée, notamment par Euler, en théorie des équations différentielles, mais qui trouve là un champ d’application important et des propriétés nouvelles, comme on va le voir.

À l’aide de cette notion, Lagrange se propose de traiter le problème suivant :

 Problème X (n° 40).

On suppose que chaque observation soit sujette à toutes les erreurs possibles comprises entre ces deux limites $p$ et $–q$, et que la facilité de chaque erreur $x$, c’est-à-dire le nombre des cas où elle peut avoir lieu divisé par le nombre total des cas, soit représentée par une fonction quelconque de $x$ désignée par $y$ ; on demande la probabilité que l’erreur moyenne de $n$ observations soit comprise entre les limites $r$ et $–s$.

Soit donc $y$ la facilité de $x$, sa densité de probabilité. On lui associe la transformée $\int ya^x dx$, que Lagrange n’appelle pas, mais que Laplace nomme de façon générale sa « fonction génératrice ». [20]

Maintenant pour avoir la probabilité que l’erreur moyenne de $n$ observations soit $z$, il faudra considérer le polynôme qui est représenté par l’intégrale de $ya^x dx$, en supposant cette intégrale prise de manière qu’elle s’étende depuis $x = p$ jusqu’à $x = -q$, , l’on élèvera ce polynôme à la puissance $n$, et l’on cherchera le coefficient de puissance $z$ de $a$, par les règles données dans les corollaires du lemme précédent (n° 33) ; ce coefficient, qui sera une fonction de $z$ exprimera la probabilité que l’erreur moyenne soit $z$, comme il est facile de voir, d’après ce qui a été démontré plus haut.

Cette citation mot à mot du n° 40 énonce une propriété fondamentale des fonctions génératrices, les « transformées de Laplace » de Lagrange notamment. Elles transforment convolutions en produits. Aucune démonstration n’en est donnée, ni par Lagrange, ni par Laplace qui l’utilisera à son tour bientôt dans le cas des transformées dites « de Fourier ». Il est « facile » de la voir et cela suffit. Elle se rattache de toute évidence à la méthode de Moivre, dont elle donne la véritable dimension.

On écrit donc

[
(\int ya^x dx)^n = \int Ya^z dz
]
le coefficient $Y(z)$ de la puissance $a^z$ est la facilité en $z$ de la somme de $n$ observations de facilité $y$. Dans tous les cas, il s’agit donc d’écrire la fonction de $a$, $f(a)=(\int ya^x dx)^n$, sous forme d’une transformée de Laplace $ \int Ya^z dz$.

Ce calcul éblouissant de Lagrange réussit même à impressionner le jeune Laplace, qui tout en qualifiant de « belle » la méthode de Lagrange, s’employa aussitôt à la redémontrer par sa méthode de convolution. On verra la lettre de Laplace à Lagrange du 11 août 1780. [21].

JPEG - 6.7 ko
Portrait-charge de Adrien-Marie Legendre.

Lagrange traite d’autres cas. Il serait trop long d’y insister, d’autant que les formules alternées obtenues ont ceci qu’elles deviennent très vite inextricables lorsque $n$ dépasse 10 par exemple et que la recherche d’un équivalent pour n très grand est impossible sous cette forme. Ce problème laissé ouvert par Lagrange a occupé Laplace pendant près de 40 années. Sa solution publiée en 1810 et ses applications, notamment à la méthode des moindres carrés de Legendre et Gauss, constitue le point culminant de la Théorie analytique des probabilités (1812). L’idée de Laplace est pourtant fort simple, il suffit de poser , c’est-à-dire de remplacer la transformée de Lagrange (Laplace) de la facilité $y$.

[
\int ya^x dx
]
par sa transformée de Laplace (Fourier)

[
\int ye^itx dx
]

l’inversion se fait alors très simplement par analogie avec l’inversion des séries de Fourier. Ce faisant, Laplace réintroduit subrepticement le passage du fini à l’infiniment petit, banni par Lagrange, et sa méthode en souffrira longtemps, jusqu’à ce que la théorie des intégrales de Fourier deviennent un chapitre fondamental de la théorie moderne des fonctions (sans passage du fini à l’infiniment, mais avec l’introduction généralisée du presque partout, qui aurait sans doute déplu à Lagrange, mais aurait comblé Laplace). Ceci est une autre histoire.

Passons maintenant à la seconde partie du mémoire de Lagrange, la seule contribution de notre savant à la statistique mathématique, c’est-à-dire à la statistique contrôlée par le calcul des probabilités.

Statistique lagrangienne

Nous examinons rapidement maintenant la partie véritablement statistique du premier mémoire de Lagrange, la seule contribution connue de Lagrange à la statistique probabilisée. [22]

Lagrange commence par établir un résultat préliminaire, [23], que nous énonçons sans démonstration, avec des notations très légèrement modifiées.

Supposons qu’un instrument de mesure se trompe d’une quantité $e_i$ avec une facilité $a_i$ , pour $i$ compris entre $1$ et $m$. Pour simplifier, nous supposons que la somme des $m$ facilités est égale à 1. On fait $n$ mesures avec cet instrument. On sait que la facilité que la somme des erreurs commises au cours des mesures soit égale à $m$ est égale au coefficient de la puissance $m$ dans le développement du multinôme $(\Sigma_i a_i x^{e_i})^n$. Lagrange montre que la valeur maximale de cette facilité est obtenue lorsque le nombre de fois $\alpha_i$que la machine se trompe de $e_i$, au cours des $n$ mesures, est l’entier le plus proche de $na_i$, pour tout $i$ entre $1$ et $m$.

D’où il suit que le “l’erreur moyenne, pour laquelle la probabilité sera la plus grande, sera exprimée par $\frac{m}{n}=\Sigma_i a_i e_i$, qui est l’espérance mathématique de la loi d’erreur de l’instrument en question. « Ainsi, ajoute Lagrange, cette quantité représentera la correction qu’il faudra faire au résultat moyen de plusieurs observations. » L’erreur qui arrive, et qui doit être corrigée, est celle qui a, a priori, le plus de facilité à se produire. Nous discuterons plus loin ce principe de probabilité maximum qui est connu à Berlin depuis 1760 au moins.

Rappelons également que, si la probabilité d’obtenir l’erreur $e_i$ est égale à $a_i$, la facilité d’obtenir au cours de $n$ mesures $\alpha_i$ fois l’erreur $e_i$, pour $i$ compris entre $1$ et $m$, est donnée par la loi multinomiale

[
\fracn !\Pi_i a_i ! \Pi_i a_i^\alpha_i
]
Ceci étant dit, Lagrange se propose de résoudre le problème suivant (Problème VI, n° 19) :

Je suppose qu’on ait vérifié un instrument quelconque, et qu’ayant réitéré plusieurs fois la même vérification on ait trouvé différentes erreurs, dont chacune se trouve répétée un certain nombre de fois ; on demande quelle est l’erreur qu’il faudra prendre pour la correction de l’instrument.

Cette fois-ci les $a_i$ sont inconnues, et il faut les déterminer. C’est ce qu’on appelle maintenant le problème de l’estimation des paramètres d’une loi multinomiale, après avoir observé $n$ réalisations de cette loi. Une fois cette estimation faite, on en déduira la « correction » demandée, par la formule moyenne obtenue au problème V précédent.

GIF - 54.5 ko
Thomas Bayes

Inverser le théorème de Bernoulli, remonter des fréquences aux probabilités, voilà un problème qui est connu généralement des savants européens depuis très longtemps. Jacques Bernoulli déjà paraît se l’être posé, mais, en dépit des efforts de ce savant et de ses commentateurs, Moivre en particulier, il n’a pas trouvé de solution satisfaisante dans la première moitié du XVIIIe siècle. On sait que Bayes dans un mémoire posthume justement célèbre [24] en a donné une solution très remarquable, mais qui ne paraît pas avoir été remarqué des savants continentaux. Il ne semble pas en tout cas que Lagrange en ait eu connaissance, qui pourtant savait assez d’anglais pour lire les savants britanniques, Thomas Simpson par exemple, on l’a dit.

Vers 1770, simultanément, et partout en Europe où l’on s’occupe de science, on trouve différentes solutions très ingénieuses du même problème, le plus souvent non publiées, notamment chez Daniel Bernoulli en 1769, Condorcet en 1770, Lagrange entre 1769 et 1773, Laplace en 1773, …. Les premières solutions publiées paraîtront assez vite, Laplace, [25] Lagrange, [26], Daniel Bernoulli [27], Euler [28] ….

JPEG - 54.1 ko
Nicolas de Condorcet

Lagrange se doit donc d’intervenir sur ce terrain comme sur d’autres et de marquer sa différence. On le verra, il le fait sans excès d’enthousiasme, mais avec ce génie mathématique unique qui marque tous ses textes sur quelque sujet qu’il traite.

L’analyse de Lagrange est très elliptique. Ses hypothèses statistiques, sa méthodologie, ses principes, ne sont pas explicités et peuvent s’interpréter de diverses façons. Lagrange ne détaille que les calculs, toujours superbes. Toutefois ce résultat très élégant de Lagrange ne s’applique guère qu’à des instruments théoriques qui se laissent réduire par la loi multinomiale, quand on ne fait aucune hypothèse sur la facilité des erreurs. Un point de vue non paramétrique a priori. La loi d’erreur est inconnue et c’est elle-même qui est l’inconnue.

Il y a là un point délicat qui a été fort bien analysé par S. M. Stigler, notamment dans son article de synthèse. [29] Lagrange estime directement les inconnues $a_i$ en maximisant la probabilité des observations faites, exprimée par la loi multinomiale, sans faire aucune hypothèse sur la loi de facilité des erreurs, qui peut être connue par ailleurs ou postulée par hypothèse. Le résultat est alors toujours le même. L’estimation « la plus probable » de $a_i$ est la fréquence observée $A_i$, de sorte que la meilleure « correction » est toujours la moyenne observée $\Sigma A_i e_i$, dont Lagrange, on l’a vu, a calculé la facilité sous diverses hypothèses par la méthode de Moivre-Lagrange, hypothèses faites après coup, qui interviennent ainsi après la bataille.

JPEG - 28.2 ko
Jean Henri Lambert

En revanche, Lambert, [30] Daniel Bernoulli [31], et la statistique actuelle adoptent la démarche inverse, c’est-à-dire formulent les hypothèses sur la facilité des erreurs avant de déterminer les paramètres. La méthode d’estimation par maximum de vraisemblance conduit alors à des résultats très différents.

Lagrange s’est-il aperçu que son étude était un peu courte ? En a-t-il discuté avec Lambert ? En tout cas, il n’a pas poursuivi dans cette voie, d’autant qu’il estimait avoir mieux à faire ailleurs et que bientôt Laplace militerait contre l’usage systématique des moyennes en théorie des observations [32]. On ne connaît aucune réaction de Lagrange aux premiers grands mémoires statistiques de Laplace de 1774 et 1781, ni à ceux, tardifs, et très extraordinaires, des années 1810-1811. A l’inverse, on l’a dit, Laplace tiendra le plus grand compte du mémoire de Lagrange, qu’il s’emploiera à critiquer et à plier à son analyse propre, dans plusieurs mémoires importants [33], [34] et dans la Théorie analytique [35].

JPEG - 16.1 ko
Karl Pearson
PNG - 180.2 ko
Mélanges d’économie politique, 1847 Réunit : ... De la richesse territoriale du royaume de France, essai d’arithmétique politique par Lavoisier et Lagrange.

Quoi qu’il en soit, on peut remarquer que Lagrange donne ici la première démonstration connue de l’approximation normale d’une loi multinomiale, un résultat important retrouvé notamment par Karl Pearson, dans son grand mémoire sur le test du Chi2, [36].

On ne peut que déplorer l’abandon de la statistique mathématique par Lagrange, après son premier mémoire de probabilité. C’est un fait. Le premier géomètre de l’Europe ne paraît plus après cette date avoir publié quoi que ce soit sur ce sujet. Non pas qu’il se soit détourné tout à fait de l’étude des tableaux statistiques et de leurs applications à l’astronomie, à la théorie de la population ou aux assurances, [37], [38]. Mais ces travaux, mineurs sans doute dans son œuvre, sont non probabilistes. Pourtant, ces sujets sont à la mode en Europe, notamment en France, mais aussi en Italie, avec les beaux travaux des économistes et mathématiciens italiens, particulièrement Gaeta et Fontana qui ont entrepris de traduire le traité de Moivre, du moins la partie relative à l’actuariat, [24]. Steve Stigler nous a communiqué une lettre du père Gregorio Fontana à Lambert, datée du 20 août 1776, qui se trouve à l’Université de Bâle, dans laquelle le mathématicien de Pavie écrit :

À présent je traduis de différentes langues en Italien tous les Opuscules qu’on écrit sur la Question de la régularité avec laquelle les Garçons qui naissent chaque année dans les grandes Villes excèdent toujours les Filles. Ces opuscules sont les Mém. du dr Arbuthnot, les lettres de Nicolas Bernoulli, la Dissert. de ‘sGravesande, ce qu’en dit Moivre dans sa Theorie of Chances, les deux Mém. de Mr. Dan. Bernoulli, et le 20me chap. de l’ouvrage de Süssmilch. Si vous, Monsieur, en connaissez d’autres, faites-moi la grâce de me les indiquer.

JPEG - 192 ko
Antoine Lavoisier

J’attends même de Mr. De la Place un Mémoire manuscrit pour l’insérer dans mon Recueil, et j’écris maintenant à Mr. La Grange pour le même objet.

Fontana demande ensuite à Lambert un mémoire « qui sera fort goûté en Italie, où ce genre d’études est fort en vogue. »

Dans une autre lettre de Fontana à Lambert, datée du 5 mai 1775, que Stigler a eu la grande gentillesse de nous communiquer également, le savant italien écrit : « Mr. Jean Bernoulli m’a dit que le grand géomètre Mr. La Grange, à qui je vous prie de faire mes compliments, pense traduire le beau livre de Moivre intitulé The Doctrine of Chances avec des remarques de sa façon ». On sait que ce projet a été assez vite abandonné, [39] mais on peut penser que les notes et additions ont bien été rédigées et qu’elles forment le fond de la partie probabiliste du second mémoire de probabilités de Lagrange.

JPEG - 11.3 ko
Gregorio Fontana

Lagrange avait donc l’intention de poursuivre après 1775-1776. Il ne l’a pas fait, sans qu’on en connaisse vraiment les raisons. Est-ce à cause d’une opposition fondamentale aux méthodes probabilistes en théorie des observations, de son peu de goût et de temps disponible pour les applications, ou simplement du désir qu’il avait de préserver sa tranquillité face à Lambert, Daniel Bernoulli, et surtout Laplace qui multipliait les travaux de premier ordre sur ce thème et que Lagrange répugnait à affronter directement ? Déjà en compétition avec lui, par nécessité, en astronomie physique, la plus parfaite des sciences, Lagrange n’avait guère envie d’y ajouter la doctrine des chances, qui, somme toute, restait subalterne dans la science théorique européenne de la fin du XVIIIe siècle. Il était sans doute préférable d’aborder des terres neuves, où le directeur de la Classe de mathématiques de l’Académie de Berlin pouvait exprimer librement son génie mathématique et donner toute sa mesure, la théorie des nombres par exemple, sans crainte d’être contesté ou défié sur des sujets incertains qui se prêtent volontiers aux batailles académiques dont Lagrange avait horreur. Bref, on ne sait trop pourquoi, mais on ne peut que constater ce fait, le mémoire probabiliste de 1776, pour extraordinaire qu’il soit, reste isolé dans l’œuvre de Lagrange.

Ajoutons que la statistique italienne, loin de partager les réserves et le scepticisme lagrangiens, s’est remarquablement développée à la fin du XVIIIe siècle et au cours des deux siècles suivants, qu’on pense à Malfatti, Plana, Cesàro, Pareto, tant d’autres, et bien sûr aux écoles statistiques si brillantes de l’entre-deux-guerres et aux travaux actuels.

Post-scriptum :

L’auteur et la rédaction d’Images des Maths tiennent à remercier le relecteur Jean Aymes pour sa relecture attentive et ses remarques constructives.

Article édité par Frédéric Brechenmacher

Notes

[1J. L. Lagrange, « Mémoire sur l’utilité de la méthode de prendre le milieu entre les résultats de plusieurs observations, dans lequel on examine les avantages de cette méthode par le calcul des probabilités, et où l’on résout différents problèmes relatifs à cette matière », Misc. Taur. pour 1770-1773, 5 (1776), p. 167-232 ; Œuvres, t. 2, p. 173-234.

[2J. L. Lagrange, « Recherches sur les suites récurrentes dont les termes varient de plusieurs manières différentes, ou sur l’intégration des équations linéaires aux différences finies et partielles, et sur l’usage de ces équations dans la théorie des hasards », Nouv. Mém. Acad. Berlin, année 1775, 6 (1777), p. 183-272 ; Œuvres, t. 4, p. 151-251.

[3Par commodité, nous les appellerons respectivement premier et second mémoire dans la suite de l’article.

[4J. L. Lagrange, « Sur l’intégration d’une équation linéaire à différences finies, qui contient la théorie des suites récurrentes », Misc. Taur., 1 (1759), p. 33-42 ; Œuvres, t.1, p. 23-36.

[5’Voir notamment : Lagrange Oeuvres 14, p. 62-63, 74

[6J. L. Lagrange, Mécanique analytique, 2e édition, 2 vol. Paris, Courcier, 1811-1815 ; Œuvres, t. 11 et 12.

[7P. S. de Laplace, « Mémoire sur les suites récurro-récurrentes et sur leurs usages dans la théorie des hasards », Mém. Acad. R. Sci. Paris, Savants étrangers, 6 (1774), p. 353-371 ; Œuvres, t. 8, p. 5-24.

[8M. T. Borgato, « Lagrange e le equazioni alle differenze finite », in S. Féry (dir.), Aventures de l’analyse de Fermat à Borel. Mélanges en l’honneur de Christian Gilain, Nancy, Presses Universitaires, 2012, p. 301-335.

[9Jean III Bernoulli, Recueil pour les astronomes, volume 2, Berlin, chez l’Auteur, 1772, p.249.

[10J. H. Lambert, Beyträge zum Gebrauche der Mathematik und deren Anwendung I, II, III, Berlin, Verlage des Buchlagens der Realschule, 1765-1772.

[11Daniel Bernoulli, « Dijudicatio maxime probabilis plurium observationum discrepantium atque verisimillima inductio inde formanda », Acta Acad. Sci. Imp. Petrop., pour 1777 (1778), p. 3-23 ; Œuvres, t.2, p. 361-375.

[12Jean III Bernoulli, « Milieu à prendre entre les observations », Supplément à l’Encyclopédie, t. III, 1777, p. 935b-939a ; Réed in Encyclopédie méthodique. Mathématiques, tome 2, Paris, Panckoucke, 1785, p. 404-409.
« Milieu à ... »,

[13P. S. de Laplace, « Mémoire sur la probabilité des causes par les événements », Mém. Acad. R. Sci. Paris, Savants étrangers, 6 (1774), p. 621-656, Œuvres 8, p. 27-65.

[14P. S. de Laplace, « Recherches sur le milieu qu’il faut choisir entre les résultats de plusieurs observations », in C. C. Gillipsie « Mémoires inédits ou anonymes de Laplace sur la théorie des erreurs, les polynômes de Legendre, et la philosophie des probabilités », Rev. Hist. Sci., 32 (1979), p. 228-256.

[15T. Simpson, « A letter to the Right Honorable George Earl of Macclesfield, President of the Royal Society, on the Advantage of taking the Mean of a Number of Observations, in practical Astronomy », Philos. Trans. R. Soc. London, 49 (1755), p. 82-93.

[16Voir notamment, Lagrange Oeuvres 13, p. 154-156

[17A. de Moivre, The Doctrine of Chances : or, A Method of Calculating the Probability of Events in Play, The third edition, fuller, clearer, and more correct than the former, London, Lillar, 1756, reprinted New York, Chelsea, 1967.

[18Lagrange Œuvres 14, p. 95-96

[19P. S. de Laplace, « Recherches sur le milieu qu’il faut choisir entre les résultats de plusieurs observations », in C. C. Gillipsie « Mémoires inédits ou anonymes de Laplace sur la théorie des erreurs, les polynômes de Legendre, et la philosophie des probabilités », Rev. Hist. Sci., 32 (1979), p. 228-256.

[20P. S. de Laplace, Théorie analytique des probabilités, livre I, Paris, Vve Courcier, 1812, avec une introduction et des additions, 1814, avec trois suppléments ajoutés par l’auteur, 1820, avec un quatrième supplément ajouté par l’auteur, 1825 ; Œuvres, t.7.

[21Lagrange Œuvres 14, p. 95-96

[22Il s’agit des n° 16 à 22 du mémoire de Lagrange

[23problème V, n°16

[24T. Bayes, « An essay towards solving a problem in the doctrine of chances », Philos. Trans. R. Soc. London, 53 (1764), p. 370-418. Trad. fr. et postface de J.-P. Cléro, Cahiers d’histoire et de philosophie des sciences, N. S. 18 (1988).

[25] P. S. de Laplace, « Mémoire sur la probabilité des causes par les événements », Mém. Acad. R. Sci. Paris, Savants étrangers, 6 (1774), p. 621-656, Œuvres 8, p. 27-65.

[26J. L. Lagrange, « Mémoire sur l’utilité de la méthode de prendre le milieu entre les résultats de plusieurs observations, dans lequel on examine les avantages de cette méthode par le calcul des probabilités, et où l’on résout différents problèmes relatifs à cette matière », Misc. Taur. pour 1770-1773, 5 (1776), p. 167-232 ; Œuvres, t. 2, p. 173-234.

[27Daniel Bernoulli, « Dijudicatio maxime probabilis plurium observationum discrepantium atque verisimillima inductio inde formanda », Acta Acad. Sci. Imp. Petrop., pour 1777 (1778), p. 3-23 ; Œuvres, t.2, p. 361-375.

[28L. Euler, « Observationes in praecedentem dissertationem illustris Bernoulli », Acta Acad. Sci. Imp. Petrop., pour 1777 (1778), p. 24-33 ; Œuvres I, 7, p. 280-290.

[29S. Stigler, « The Epic Story of Maximum Likelihood », Statist. Sci., 22 (2007), p. 598-620.

[30J. H. Lambert, Beyträge zum Gebrauche der Mathematik und deren Anwendung I, II, III, Berlin, Verlage des Buchlagens der Realschule, 1765-1772.

[31Daniel Bernoulli, « Dijudicatio maxime probabilis plurium observationum discrepantium atque verisimillima inductio inde formanda », Acta Acad. Sci. Imp. Petrop., pour 1777 (1778), p. 3-23 ; Œuvres, t.2, p. 361-375.

[32. S. de Laplace, « Recherches sur le milieu qu’il faut choisir entre les résultats de plusieurs observations », in C. C. Gillipsie « Mémoires inédits ou anonymes de Laplace sur la théorie des erreurs, les polynômes de Legendre, et la philosophie des probabilités », Rev. Hist. Sci., 32 (1979), p. 228-256. 

[33P. S. de Laplace, « Mémoire sur les probabilités », Mém. Acad. R. Sci. Paris pour 1778, (1781), p. 227-332 ; Œuvres, t. 9, p. 383-485

[34P. S. de Laplace, « Mémoire sur les approximations des formules qui sont fonctions de très grands nombres », Mém. Acad. R. Sci. Paris pour 1782, (1785), p. 1-88 ; Œuvres, t. 10, p. 209-291.

[35P. S. de Laplace, Théorie analytique des probabilités, Paris, Vve Courcier, 1812, avec une introduction et des additions, 1814, avec trois suppléments ajoutés par l’auteur, 1820, avec un quatrième supplément ajouté par l’auteur, 1825 ; Œuvres, t.7.

[36K Pearson, « On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling », Phil. Mag., (5) 50 (1900), p. 157-175 ; Œuvres, p. 339-357

[37J. L. Lagrange, « Essai d’arithmétique politique sur les premiers besoins à l’intérieur de la République », in Collection de divers ouvrages d’Arithmétique politique, par Lavoisier, de Lagrange et autres, Roederer éd., Paris, Corancez et Roederer, an IV, p. 49-56 ; Œuvres, t. 7, p. 571-579.

[38J. L. Lagrange, « Mémoire sur une question concernant les annuités », Mém. Acad. R. Sci. Belles Lettres, Berlin, années 1792 et 1793, (1798), p. 235-146 ; Œuvres, t. 5, p. 613-624.

[39Lagrange Œuvres 14, p. 66

Partager cet article

Pour citer cet article :

Bernard Bru — «Lagrange et le calcul des probabilités» — Images des Mathématiques, CNRS, 2015

Crédits image :

Image à la une - (C) Collections École polytechnique
img_12901 - (C) Collections École polytechnique
img_12902 - Source : Banque de France, domaine public
img_12903 - (C) Collections École polytechnique
img_12904 - (C) Collections École polytechnique
img_12905 - (C) École polytechnique
img_12906 - University of York : Portraits of Statisticians ; domaine pubic
img_12907 - (C) Collections École polytechnique
img_12908 - (C) École polytechnique
img_12909 - (C) École polytechnique
img_12910 - (C) Académie des sciences
img_12911 - http://www.bioquest.org/products/auth_images/422_bayes.gif
img_12912 - (C) Collections École polytechnique
img_12913 - (C) Collections École polytechnique
img_12914 - Source : Pearson Portraits. Domaine public
img_12915 - (C) Collections École polytechnique
img_12916 - (C) Collections École polytechnique
img_12917 - http://www.comune.pomarolo.tn.it/sezioni/conoscere-pomarolo/personaggi

Commentaire sur l'article

Laisser un commentaire

Forum sur abonnement

Pour participer à ce forum, vous devez vous enregistrer au préalable. Merci d’indiquer ci-dessous l’identifiant personnel qui vous a été fourni. Si vous n’êtes pas enregistré, vous devez vous inscrire.

Connexions’inscriremot de passe oublié ?

Dossiers

Cet article fait partie du dossier «Joseph-Louis Lagrange» voir le dossier

Suivre IDM