[Rediffusion d’un billet publié en 2009]

Quel est le début de ce nombre ?

L’étrange loi de Benford

Piste bleue Le 5 novembre 2022  - Ecrit par  Élise Janvresse Voir les commentaires (5)

Saviez-vous que près de la moitié des nombres rencontrés dans la vie quotidienne commencent soit par un 1, soit par un 2, alors que moins d’un sur vingt commence par un 9 ?

Piste verte ou bleue : un domaine skiable pour lire ou relire cet été... Rediffusion d’un article publié le 26 décembre 2009.

Les nombres que l’on rencontre dans la vie quotidienne obéissent à une loi assez inattendue.
Amusons-nous en effet à les classer suivant leur premier chiffre significatif : celui-ci est compris entre 1 et 9, ce n’est jamais 0 et on ne tient compte ni du signe ni de la place de la virgule.
Ainsi, le premier chiffre significatif des nombres 0,025, 23,7 et -26 est 2 dans tous les cas.
Comparons alors les effectifs trouvés pour chaque premier chiffre possible.
Si on considère suffisamment de nombres, d’origines variées, une tendance surprenante se manifeste : on rencontre beaucoup plus de nombres commençant par 1, 2 ou 3, que par 7, 8 ou 9.

Le premier à mettre en évidence ce phénomène, qu’il décrit en 1881 [1], est l’astronome et mathématicien Simon Newcomb.
Ce dernier s’était étonné que les tables de logarithmes se déchiraient plus vite au niveau des premières pages que des dernières.
Le logarithme est une fonction mathématique grâce à laquelle on peut transformer les multiplications et les divisions (opérations très compliquées sans calculatrice !) en additions et soustractions. On imagine donc aisément l’usage intensif fait de ces tables par les scientifiques de l’époque.

Tables de Logarithmes Librairie Hachette 1957.

L’explication avancée par Newcomb est que les tables de logarithmes étaient plus abimées au début qu’à la fin parce que leurs utilisateurs rencontraient plus souvent des nombres commençant par 1 ou 2 que par 8 ou 9.
Il propose alors la formule suivante dans laquelle la fréquence [2]
d’apparition de chacun des premiers chiffres possibles est justement décrite
à l’aide de la fonction logarithme (en base 10) :
pour $i\in \{1, \dots , 9\}$, le premier chiffre significatif est $i$ avec probabilité
\[ P(i) = \log_{10} \left( \frac{i+1}{i} \right). \]
Voici les valeurs numériques approximatives données par la formule : les
chiffres 1 et 2 totalisent presque la moitié des effectifs !

PNG - 57.6 ko
Fréquence d’apparition de chacun des premiers chiffres significatifs possibles d’après la loi de Benford.

Le physicien Frank Benford fit la même découverte 57 ans plus tard et publia lui aussi un article [3] sur le sujet, dans lequel il propose la même formule, obtenue de manière empirique.
L’article de Benford ayant eu plus de retentissement, cette formule porte
désormais le nom de loi de Benford.

La loi de Benford est-elle vraiment vérifiée ?

Il est clair que de nombreuses données empiriques ne suivent pas du tout la loi de Benford :
si l’on s’intéresse par exemple à la taille d’une population adulte, mesurée en centimètres, la plupart des nombres auront un premier chiffre significatif égal à 1. Au contraire, si on mesure ces tailles en pieds, il y a peu de chance de trouver des nombres commençant par 1.

En son temps, Benford avait testé sa loi sur un nombre considérable d’observations - « aussi large que le temps et l’énergie humainement disponible le permettent » - d’origines diverses : il avait collecté plus de 20 000 nombres provenant aussi bien de résultats de Base-Ball que de relevés d’hydrologie.
Dans son article, la moitié des listes considérées s’écartent significativement de la loi prévue. Mais lorsqu’il cumule toutes les données relevées, la ressemblance devient frappante.

Aujourd’hui, l’informatique permet de tester très rapidement la loi de Benford sur des ensembles de données beaucoup plus gros. Comme le suggère l’économiste américain Mark Nigrini (voir aussi à la fin de l’article) sur son site internet, il est assez facile de lister et trier les tailles des fichiers présents sur le disque dur d’un ordinateur.

Distribution du premier chiffre significatif des tailles de 56 544 fichiers présents sur le disque dur d'un ordinateur.
Voici à gauche le résultat obtenu.
Les chiffres 1 et 4 apparaissent nettement plus souvent que ne
le prévoit la loi de Benford. Une observation plus précise des tailles des fichiers relevées montre que $16\,384$ et $4\,096$ (respectivement $2^{14}$ et $2^{12}$) sont obtenus plusieurs milliers de fois chacun. Il s’agit en fait des tailles que le système réserve automatiquement pour les répertoires.

Si on ne tient pas compte des répertoires, la distribution obtenue se rapproche étonnamment bien de la loi de Benford !

Est-ce étonnant ?

Il est clair que l’on peut écrire autant de nombres commençant par 1 que par 9 (ou par n’importe quel autre chiffre) : il suffit pour cela de prendre le nombre et de changer son premier chiffre !
On s’attend donc à ce que le hasard ne privilégie aucune des 9 situations possibles, et à ce que chaque chiffre entre 1 et 9 apparaisse en première place avec une fréquence 1/9...

L’attente d’une telle fréquence sur le premier chiffre d’un nombre est le résultat d’une illusion bien connue des psychologues, appelée biais d’équiprobabilité [4].
Il s’agit d’une tendance humaine à considérer que le « vrai » hasard implique nécessairement l’uniformité.
Mais nous avons souvent une mauvaise perception du hasard, et il semble ici que ce soit le cas.

Puisque l’on a des raisons de penser que la loi de Benford est bien vraie,
on peut se demander pourquoi c’est elle qui apparaît naturellement lorsqu’on regarde énormément de nombres d’origines diverses.

Pourquoi alors plus de 1 que de 9 ?

La loi de Benford a suscité depuis sa découverte un grand nombre de publications chez les scientifiques.
Le site Benford Online Bibliography en recense une quantité impressionnante.
Parmi ceux-ci, les articles de mathématiques cherchent essentiellement à répondre à deux questions :

  • Quelles conditions générales peuvent expliquer l’apparition de la loi de Benford ?
  • Pourquoi la plupart des données empiriques vérifient-elles approximativement cette loi ?

Le problème principal pour démontrer mathématiquement la loi de Benford est de définir rigoureusement ce que signifie « les nombres rencontrés dans la vie quotidienne ».
Une première idée qui vient à l’esprit est de ne regarder pour débuter que les nombres entiers. Est-il possible de définir la proportion de ceux commençant par 1 ?

PNG - 3.8 ko
Proportion des entiers pairs compris entre 1 et M.

Par exemple, tout le monde est d’accord pour dire que la moitié des entiers sont pairs.

Une façon de définir rigoureusement la proportion des nombres pairs parmi tous les entiers est la suivante :
on regarde la proportion des nombres pairs plus petits qu’une certaine valeur maximum, pour des valeurs maximums de plus en plus grandes.

  • Entre 1 et 10, il y a 5 nombres pairs, ce qui donne une proportion 5/10 = 1/2. En fait, la proportion des nombres pairs jusqu’à un maximum pair est toujours 1/2.
  • Entre 1 et 11, il y a aussi 5 nombres pairs, donc la proportion des nombres pairs jusqu’à 11 est 5/11 = 1/2 -1/22. De manière générale, si la valeur maximum $M$ est impaire, alors la proportion est égale à $1/2 - 1/2M$.

La proportion des entiers pairs compris entre 1 et $M$ ne change presque pas lorsque $M$ devient grand. On peut donc dire que la proportion cherchée est bien égale à 1/2, c’est-à-dire que la moitié des entiers sont pairs.

PNG - 20.3 ko
Proportion des entiers compris entre 1 et M commençant par 1.
Attention, sur l’axe horizontal, il s’agit d’une échelle logarithmique : on utilise la même distance pour représenter les entiers entre 1 et 10, entre 10 et 100, entre 100 et 1000.

Malheureusement, on ne peut pas définir de la même façon la proportion des nombres entiers commençant par 1.
En effet, regardons la proportion $R(M)$ des entiers, entre $1$ et $M$, commençant par 1 :

  • L’entier 1 commençant par 1, on obtient $R(1)=1$.
  • Puisqu’aucun nombre entre 2 et 9 ne débute par 1, la proportion va décroître jusqu’à atteindre $R(9)=1/9$ ;
  • Puis, les nombres de 10 à 19 commençant tous par 1, la proportion croît jusqu’à $M=19$ (on trouve alors $R(19)=11/19$).
  • Entre 20 et 99, aucun nombre ne commence par 1, donc le ratio décroît à nouveau jusqu’à $M=99$ (et $R(99)=11/99=1/9$).
  • Il croît à nouveau jusqu’à $M=199$ (et $R(199)=111/199$), etc.

Même lorsque le maximum $M$ devient très grand, la proportion ne cesse d’osciller entre $1/9$ et $5/9$.

La morale est la suivante : il y a autant de nombres débutant par 1 que par 9 entre 1 et 999 ou entre 1 et 9999 ; mais ce n’est pas vrai entre 1 et 19, entre 1 et 31. En fait, c’est faux dès que le maximum n’est pas de la forme $10^n-1$.

PNG - 40.5 ko
La courbe violette est la moyenne des valeurs $R$ données par la courbe rouge.
La bleue est obtenue de la même façon à partir de la violette, et la jaune à partir de la bleue.
À chaque fois que l’on fait la moyenne de la courbe précédente, on oscille un peu moins.

Puisqu’il est impossible de définir la proportion des entiers débutant par 1, la mathématicienne B.J. Flehinger [5] a proposé de définir une proportion généralisée obtenue en itérant le
procédé :
notons que $R(M)$ était la moyenne des nombres commençant par 1 entre 1 et $M$.
Flehinger s’intéresse alors la moyenne des $R(M)$
\[ \frac{R(1)+R(2)+\dots + R(M)}{M}, \]
puis à la moyenne des moyennes obtenues, etc.
Elle a alors prouvé que l’amplitude des oscillations diminuait à chaque étape et que si l’on fait suffisamment de « moyennes de moyennes », on retrouve bien la probabilité attendue d’avoir un nombre commençant par 1,
à savoir environ 30,1% (voir [6] pour une formulation précise).

Et si on s’intéresse à tous les nombres ?

Voici deux explications mathématiques - en fait, très liées - de la loi de Benford pour tous les nombres (pas forcément entiers) parmi les différentes imaginées par des mathématiciens.

Les lois mathématiques ne doivent pas avoir de frontière !

Supposons qu’il existe effectivement une loi mathématique qui régit les nombres rencontrés dans la vie quotidienne.
La moindre des choses est que cette loi soit la même partout dans le monde !
On s’attend donc à ce qu’elle soit identique dans les pays où les distances sont exprimées dans le système métrique et dans les pays se servant des mesures anglo-saxonnes. Ce doit être la même dans les pays de la zone euro et dans les pays utilisant le yen, le dollar ou la livre sterling.

Autrement dit, cette loi ne doit pas dépendre des unités dans lesquelles sont exprimées les grandeurs.
On peut montrer que cette propriété d’invariance par changement d’unité caractérise la loi de Benford [7].

Interprétation probabiliste

Comme le notait Benford lui-même, plus les nombres collectés sont d’origines variées, plus la fréquence du premier chiffre significatif est proche de la loi prédite.
Essayons alors de construire un modèle qui reflète cette idée.

Imaginons que chaque donnée collectée a été tirée au sort entre 0 et un certain maximum, mais que la valeur du maximum dépend de l’origine de la donnée.
Si on savait comment choisir la loi suivie par les maxima, on pourrait en déduire la loi suivie par le premier chiffre des données elles-mêmes.
Mais puisqu’on ne sait a priori pas comment choisir la loi des maxima, il semble qu’on ait seulement repoussé le problème !
D’un autre côté, les maxima sont eux aussi des nombres d’origines diverses rencontrés dans la vie quotidienne...
On s’attend donc à ce que leur premier chiffre significatif soit régi par la même loi que le premier chiffre significatif des données de départ.

On obtient ainsi une autre caractérisation : si le premier chiffre significatif des données et de leur maxima suivent la même loi, cette loi est nécessairement la loi de Benford ! [8]

En fait je triche un peu ici : il faut considérer pour les deux précédentes explications une formulation plus générale de la loi de Benford, qui ne décrit pas seulement la distribution du premier chiffre significatif, mais aussi celle du second, du troisième, et de tous les suivants.
Comme nous sortirions de la piste bleue, j’y reviendrai un peu plus tard

Loi de Benford pour tous les chiffres significatifs

Pour énoncer cette loi de Benford générale, il est commode de définir la mantisse d’un nombre, qui est toujours comprise entre 1 et 10 :
on peut voir la mantisse d’un nombre comme étant ce qui reste quand on a oublié la place de la virgule dans l’écriture de ce nombre.

Plus formellement, étant donné un nombre $x>0$, on définit sa mantisse comme l’unique nombre ${\mathcal{M}}(x)$ entre 1 et 10 tel qu’on puisse écrire
\[ x\ =\ {\mathcal{M}}(x) 10^k, \quad \text{où } k\text{ est un entier (positif ou négatif)}. \]

On a par exemple ${\mathcal{M}}(2009)={\mathcal{M}}(0,02009)=2,009$.
La mantisse de $x$ permet ainsi de connaître tous les chiffres significatifs
de l’écriture de $x$ en base 10, mais ne dit rien sur l’ordre de grandeur de
$x$.

La loi de Benford générale décrit précisément la distribution de la mantisse :
selon cette loi, la proportion des nombres $x$ dont la mantisse est entre $a$ et $b$ vaut, pour tous $ 1\le a \lt b \le 10$

\[ P\Bigl(a\le {\mathcal{M}}(x) < b\Bigr)\ =\ \log_{10}\left(\frac{b}{a}\right). \]
Dire que le premier chiffre significatif de $x$ est $i$ se traduit en terme de mantisse par $ i\le {\mathcal{M}} < i+1 $.
Ceci arrive avec la fréquence $\log_{10}\left(\frac{i+1}{i}\right)$, donc on retrouve bien la fréquence annoncée précédemment pour le premier chiffre significatif.

De manière assez surprenante, comme le remarque Ted Hill [9], la formulation générale de la loi de Benford implique que les distributions des chiffres significatifs successifs ne sont pas indépendantes !
Par exemple, parmi les nombres dont le premier chiffre est 1, la proportion de ceux dont le second chiffre est 0 (donc ayant une mantisse entre 1 et 1,1) vaut
\[ \frac{P(1\le {\mathcal{M}}(x) < 1,1)}{P(1\le {\mathcal{M}}(x) <2)} =\frac{\log_{10} 1,1}{\log_{10}2}\ \simeq\ 13,7\%, \]
alors que parmi ceux dont le premier chiffre est 9, le chiffre 0 apparaît en seconde position avec la fréquence
\[ \frac{P(9\le {\mathcal{M}}(x) < 9,1)}{P(9\le {\mathcal{M}}(x) <10)} = \frac{\log_{10} (9,1/9)}{\log_{10}10/9}\ \simeq\ 10,5\%. \]

Preuve de la caractérisation de la loi de Benford par l’invariance par changement d’unité (piste noire)

Changer l’unité dans laquelle est exprimée une grandeur revient à la multiplier par un certain facteur, qui est le rapport entre les deux unités (par exemple pour passer du franc à l’euro, on doit multiplier par $1/6,55957$).
La loi décrivant la distribution des mantisses doit donc être invariante par multiplication par un facteur $F$ quelconque, ce que l’on peut écrire ainsi : pour tout $F >0$, pour tous $1\leq a \[ P\Bigl({\mathcal{M}}(x)\in [a,b[\Bigr)\ =\ P\Bigl({\mathcal{M}}(F x)\in [a,b[\Bigr). \]
La clé pour mieux comprendre les conséquences de l’équation précédente consiste à passer au logarithme, afin de transformer la multiplication par $F$ en une addition.
Puisque l’on travaille sur l’écriture des nombres en base 10, l’utilisation du logarithme à base 10 s’impose !
On remarque alors que, par définition de la mantisse, $\log_{10}({\mathcal{M}}(x))\ =\ \{\log_{10}x\}$, où la notation $\{y\}$ désigne la partie fractionnaire du nombre $y$, c’est-à-dire l’unique nombre dans $[0,1[$ tel que $y-\{y\}$ soit un entier.
Le membre de gauche de l’équation d’invariance s’écrit donc
\[ P\Bigl({\mathcal{M}}(x)\in [a,b[\Bigr)\ =\ P\Bigl(\{\log_{10}x\}\in [\log_{10}a,\log_{10}b[\Bigr), \]
et celui de droite se transforme en
\[ P\Bigl({\mathcal{M}}(F x)\in [a,b[\Bigr)\ =\ P\Bigl(\{\log_{10}x +\log_{10}F \}\in [\log_{10}a,\log_{10}b[\Bigr).\]
Comme la partie fractionnaire d’une somme est égale modulo 1 à la somme des parties fractionnaires, on peut aussi écrire
\[ P\Bigl({\mathcal{M}}(F x)\in [a,b[\Bigr)\ = \ P\Bigl(\{\log_{10}x\}\in [\log_{10}a-\log_{10}F,\log_{10}b-\log_{10}F[\Bigr), \]
où $\log_{10}a-\log_{10}F$ et $\log_{10}b-\log_{10}F$ sont à comprendre
modulo 1.
Changeons de variables en posant $s=\log_{10}a$, $t=\log_{10}b$ et $u=-\log_{10}F$.
L’équation d’invariance devient : pour tous $0\leq s \[ P\Bigl(\{\log_{10}x\}\in [s,t[\Bigr)\ =\ P\Bigl(\{\log_{10}x\}\in [s+u,t+u[\Bigr), \]
où, comme précédemment, $s+u$ et $t+u$ sont définis modulo 1.

Ainsi, la proportion des $x$ tels que $\{\log_{10}x\}\in[s,t[$ donnée par notre loi ne doit dépendre que de la longueur de l’intervalle $[s,t[$.
En particulier, si $[s,t[$ est de la forme $[k/n,(k+1)/n[$ avec $k$ et $n$ entiers, cette proportion vaut forcément $1/n$ puisque $n$ tels intervalles disjoints recouvrent $[0,1[$.
On en déduit que pour $s$ et $t$ rationnels, puis par passage à la limite pour $s$ et $t$ réels quelconques, on a toujours
\[ P\Bigl(\{\log_{10}x\}\in [s,t[\Bigr)\ =\ t-s. \]
En revenant à la mantisse de $x$ et aux variables $a$ et $b$, cela donne
\[ P\Bigl({\mathcal{M}}(x)\in [a,b[\Bigr)\ =\ \log_{10}b-\log_{10}a. \]
La loi $P$ ne peut donc être que la loi de Benford !

Et tout ça, à quoi ça sert ?

Comme beaucoup de découvertes mathématiques, la loi de Benford est longtemps restée une curiosité sans application pratique, jusque dans les années 1990 où l’économiste américain Mark Nigrini suggéra l’utilisation de tests basés sur la loi de Benford pour la détection de données falsifiées.
Nigrini a montré qu’un examen attentif des nombres apparaissant dans la comptabilité d’une société peut permettre à un expert comptable de repérer d’éventuelles fraudes.
En effet, l’expérience montre que des données authentiques doivent suivre la
loi de Benford. En revanche, celui qui invente des nombres a tendance à
surestimer l’apparition de 5 et 6. En pratique, on utilise des tests plus fins faisant intervenir la distribution des deux premiers chiffres significatifs.
Ces tests ont permis de débusquer des falsifications dans les comptabilités
de sept sociétés basées à New-York et ont depuis été utilisés dans des domaines variés.

Moralité : que l’on se place du côté des gendarmes ou des voleurs, on gagne à enrichir ses connaissances en maths !

Article édité par Jacques Istas

Notes

[1S. Newcomb. Note on the frequency of use of the different digits in natural numbers. Amer. J. Math., 4:39—40, 1881.

[2Si on additionne les valeurs pour les chiffres de 1 à 9, on trouve bien grâce à la propriété magique de la fonction logarithme,
\[ \log_{10} \left( \frac{2}{1} \right) \ +\ \cdots \ +\ \log_{10} \left( \frac{10}{9} \right) \ =\ \log_{10} \left( \frac{2}{1}\times \frac{3}{2} \times\dots\times\frac{10}{9}\right) \ =\ \log_{10}10 \ =\ 1. \]

[3F. Benford The law of anomalous numbers. Proc. Amer. Phil. Soc., 78:551—572, 1938.

[4Lecoutre M.-P. (1992) Cognitive models and problem spaces in « purely » random situations. Educational Studies in Mathematics, 23, 557-568.

[5B.J. Flehinger. On the probability that a random integer has initial digit $a$. Amer. Math. Monthly, 73:1056—1061, 1966.

[6Dans son article, Flehinger définit une densité généralisée obtenue en itérant le processus de moyenne : $R_1(M)$ est la proportion des entiers pairs entre 1 et $M$
\[ R_1(M) := \frac{1}{M} \sum_{k=1}^M 1_{\{k\text{ commence par } 1\}}, \]
où $1_{\{k\text{ commence par } 1\}}$ est égal à 1 si l’entier $k$ commence par 1 et est égal à 0 sinon.
Pour $t>1$, on pose
\[ R_t(M) = \frac{1}{M} \sum_{k=1}^M R_{t-1}(k). \]
Flehinger montre alors que l’amplitude des oscillations des fonctions
$R_t(M)$ diminue et que le processus converge dans le sens suivant :
\[ \lim_t \liminf_M R_t(M) = \lim_t \limsup_M R_t(M) = \log_{10} 2. \]
Ce résultat reste vrai pour les autres premiers chiffres significatifs possibles.
Une démonstration du résultat de Flehinger se trouve dans un livre de Knuth (The Art of Computer Programming, Vol. 2. Addison-Wesley Publishing Company, 1981).

[7R.S. Pinkham. On the distribution of first significant digits. Ann. Math. Statist., 32:1223—1230, 1961.

[8É. Janvresse et T. de la Rue. From Uniform Distributions to Benford’s Law. Journal of Applied Probability 41 p.1203-1210, 2004.

[9T. Hill. The significant-digit phenomenon. Amer. Math. Monthly, 102:322—327, 1995.

Partager cet article

Pour citer cet article :

Élise Janvresse — «Quel est le début de ce nombre ?» — Images des Mathématiques, CNRS, 2022

Commentaire sur l'article

  • Quel est le début de ce nombre ?

    le 28 décembre 2009 à 05:54, par pi.erdeux

    Les « nombres que l’on utilise dans la vie quotidienne » comprennent

    les dates : le jour commence beaucoup plus souvent par un 1 ou par un 2 que la « moyenne » des nombres (à peu près les 2/3 des jours), l’année aussi (sans doute presque 100% des années dont on parle)

    les températures : dans les zones tempérées, il en est aussi de même des températures

    pour les élèves, les notes, qui commencent souvent par un 1 (en tout cas dans le système français)

    N’est-ce pas à considérer ?

    Répondre à ce message
  • Quel est le début de ce nombre ?

    le 29 décembre 2009 à 17:37, par heid

    C’est vrai que l’on utilise pas systématiquement la base 10 comme standard, et que l’échelle choisie (°C, année) utilise souvent premiers chiffres de début de valeur.

    Mais alors, si l’on utilise pas une répartition équitable du début des nombres, peut être avons nous mal « optimisé » notre usage de ceux-ci ?!?

    Plus sérieusement, j’aime bien l’utilisation dans le monde des expert comptable, je pensais pas que on générais plus de 5 et de 6 naturellement. (je ferais plus attention maintenant)

    Dans le même ordre d’idée j’ai un « truc » assez efficace pour détecter si une liste de nombre à été générée par un ordinateur ou à la main. En effet sur 10 jets aléatoires de 1 à 10 il est très probable d’avoir deux fois de suite le même nombre. Cela est beaucoup moins fréquent lorsque c’est généré par un humain (ça marche 8 fois sur 10). Effet de surprise garanti ...

    Répondre à ce message
  • Quel est le début de ce nombre ?

    le 24 janvier 2010 à 00:37, par Zenol

    Bonsoir,

    C’est un article très intéressant et plutôt surprenant.

    Je me pause alors quelques questions :

    *En base 10, comment varie la formule pour le nième chiffre significatif ? Qu’en est-il de la probabilité de trouver un 0 ?

    *En base 2, le premier chiffre significatif est toujours 1, mais quel est la probabilité pour les chiffres significatif suivants ?

    Répondre à ce message
    • Quel est le début de ce nombre ?

      le 25 janvier 2010 à 17:42, par Elise Janvresse

      Bonjour

      La formule pour tous les chiffres significatifs est donnée dans le paragraphe développable « Loi de Benford pour tous les chiffres significatifs » : dire que le 2nd chiffre significatif d’un nombre $x$ est 0 signifie que la mantisse de $x$ est entre 1 et 1,1 ou entre 2 et 2,1 ou entre 3 et 3,1 etc. On trouve donc un « 0 » en 2ème chiffre significatif avec probabilité
      \[ \log_{10}\frac{1,1}{1} +\log_{10}\frac{2,1}{2}+\dots +\log_{10}\frac{8,1}{8} +\log_{10}\frac{9,1}{9}, \]
      soit environ 11,97\%.

      La loi de Benford existe pour toutes les bases et la formule se généralise : on définit la mantisse de $x$ en base $B$ comme l’unique nombre $M_B(x)$ entre 1 et $B$ tel qu’on puisse écrire $x = M_B(x)B^k$ où $k$ est un entier (positif ou négatif).
      On a alors pour tous $1\le a< b < B$,
      \[P\left(a \log_B \frac{b}{a}.\]

      Répondre à ce message
      • Quel est le début de ce nombre ?

        le 7 novembre 2022 à 12:04, par Maï Huong Pham-Sauvageot

        Note du secrétariat de rédaction :

        La dernière ligne manquante du commentaire de l’autrice est :

        \[ P(a \lt M_B(x) \lt b) = \log_B \frac{b}{a}.\]

        Répondre à ce message

Laisser un commentaire

Forum sur abonnement

Pour participer à ce forum, vous devez vous enregistrer au préalable. Merci d’indiquer ci-dessous l’identifiant personnel qui vous a été fourni. Si vous n’êtes pas enregistré, vous devez vous inscrire.

Connexions’inscriremot de passe oublié ?

Dossiers

Cet article fait partie du dossier « À lire ou à relire cet été» voir le dossier