L’institut qui m’a accueilli en automne regroupe des gens d’horizonsvariés (biologistes, chimistes, physiciens, sociologues, etc.), et chacun, à tour de rôle, est censé présenter son domaine (en 20 minutes) au cours d’un repas hebdomadaire. J’y ai parlé du monde \(p\)-adique.
Le monde réel
Les nombres réels ont été utilisés pendant 2 millénaires, mais n’ont été formellement définis qu’en 1872: Cantor et Dedekind en ont donné chacun une construction en réponse à une demande un peu inquiète de Weierstrass (on ne sait jamais, le monde aurait fort bien pu s’écrouler tout d’un coup; la période était propice à la naissance de monstres défiant l’intuition, par exemple des fonctions continues dérivables nulle part). Les constructions de Cantor et Dedekind partent du corps \({\mathbf Q}=\{\frac{a}{b},\ a,b\ {\rm entiers},\ b\neq0\}\)des nombres rationnels. Les grecs avaient déjà réalisé, à leur grande horreur, qu’il existe des nombres irrationnels (du genre \(\sqrt 2\)). Une manière de s’en convaincre est de regarder le développement décimal (ou plus généralement le développement en base \(p\), si \(p\) est un entier quelconque) d’un nombre rationnel: il se répète au bout d’un certain temps, et donc tout nombre dont le développement décimal n’a pas cette propriété n’est pas rationnel. Ce que font Cantor et Dedekind revient à rajouter tous les développements décimaux possibles et donc à boucher les trous de \({\mathbf Q}\), et on obtient de cette manière un corps, le corps \({\mathbf R}\) des nombres réels 19La terminologie « rationnel, irrationnel, transcendant, réel, imaginaire, complexe » ferait la joie des psychologues., qui est complet (contrairement à \({\mathbf Q}\)), ce qui signifie que toute suite qui a l’air d’avoir une limite 20Une suite a l’air d’avoir une limite si on peut l’inclure dans un intervalle de longueur arbitrairement petite après en avoir enlevé un nombre fini (dépendant de l’intervalle) de termes; une telle suite est dite de Cauchy. Avec des quantificateurs, cela devient: la suite \((u_n)_{n\in{\bf N}}\) est de Cauchy si et seulement si \(\forall\epsilon>0, \exists N\in{\bf N}, \forall n\geq N, |u_n-n_N|\leq\epsilon\). On fera attention qu’il ne suffit pas que \(u_{n+1}-u_n\) tende vers \(0\) pour que \((u_n)_{n\in{\bf N}}\) soit de Cauchy. en a effectivement une 21La construction de Cantor revient à rajouter de force les limites de suites de Cauchy de nombres rationnels..
La valeur n’est pas absolue ; la norme n’est pas immuable
Implicite dans ce qui précède est le fait que l’on mesure la distance \(d(x,y)\) entre deux nombres rationnels \(x\) et \(y\) en utilisant la distance usuelle \(d(x,y)=|x-y|\), où \(|\ |\) désigne la valeur absolue. Cette valeur absolue vérifie les propriétés suivantes:
(i) \(|x|\geq 0\) et \(|x|=0\) si et seulement si \(x=0\),
(ii) \(|xy|=|x|\,|y|\) pour tous \(x,y\in{\mathbf Q}\),
(iii) \(|x+y|\leq |x|+|y|\) pour tous \(x,y\in{\mathbf Q}\) (Inégalité triangulaire).
Plus généralement, on appelle norme sur \({\bf Q}\) toute fonction \(\Vert\ \Vert:{\mathbf Q}\to{\mathbf R}_+\) vérifiant les mêmes propriétés (i), (ii) et (iii) ci-dessus que \(|\ |\). Une telle norme donne une manière de mesurer les distances, en posant \(d(x,y)=\Vert x-y\Vert\), et donc une manière de voir le monde.
On peut construire, en partant d’un nombre premier \(p\in\{2,3,5,7,11,\dots\}\), une norme \(|\ |_p\) sur \({\bf Q}\), dite \(p\)-adique, pour laquelle plus un nombre est divisible par \(p\) plus il est petit 22De manière précise, on procède comme suit. Si \(a\in{\bf Z}\) est un entier, on note \(v_p(a)\) le nombre de fois que l’on peut diviser \(a\) par \(p\) (avec \(v_p(0)=+\infty\) par convention), et on pose \(|a|_p=p^{-v_p(a)}\) (et donc \(|0|_p=0\)). Par exemple \(48=2^4\cdot 3\), et donc \(v_2(48)=4\) et \(|48|_2=2^{-4}\), \(v_3(48)=1\) et \(|48|_3=3^{-1}\),et \(v_p(48)=0\) et \(|48|_p=1\) pour tout \(p\neq 2,3\). On a \(v_p(ab)=v_p(a)+v_p(b)\) (c’est clair sur la définition) et \(v_p(a+b)\geq {\rm min}(v_p(a),v_p(b))\) (car la divisibilité de \(a\) et \(b\) par \(p^k\) entraîne celle de \(a+b\)); ce qui se traduit par \(|ab|_p=|a|_p|b|_p\) et \(|a+b|_p\leq\sup(|a|_p,|b|_p)\). On étend \(|\ |_p\) à \({\mathbf Q}\) en posant \(|x|_p=|a|_p/|b|_p\) si \(x=a/b\) avec \(a,b\in{\mathbf Z}\) (ce qui ne dépend pas
de l’écriture de \(x\) sous la forme \(a/b\)). et on obtient de la sorte une norme qui vérifie l‘inégalité ultramétrique \(|x+y|_p\leq\sup(|x|_p,|y|_p)\) plus forte que l’inégalité triangulaire.
Des mondes où l’ordre ne règne pas
On définit alors, suivant Hensel (1897), le corps \({\bf Q}_p\) des nombres \(p\)-adiques, en complétant \({\bf Q}\) pour la norme \(|\ |_p\), par exactement le même procédé que celui de Cantor 23 On rajoute de force les limites des suites de Cauchy de nombres rationnels pour la distance définie par \(|\ |_p\); le procédé de Dedekind utilise à plein l’ordre règnant dans le monde réel et est inutilisable dans le monde \(p\)-adique.qui nous a permis de construire \({\bf R}\) à partir de \({\bf Q}\) en complétant pour la valeur absolue. La norme \(|\ |_p\) s’étend, par continuité, à \({\bf Q}_p\), et \({\bf Q}_p\) est complet pour cette norme, par construction.
Un nombre \(p\)-adique a, comme un nombre réel, une écriture en base \(p\); la différence est qu’en \(p\)-adique il y a une infinité de chiffres avant la virgule et un nombre fini après, alors qu’en réel c’est l’inverse (c’est dû au fait que \(\frac{1}{p^n}\) est petit dans le monde réel si \(n\to +\infty\), alors qu’en \(p\)-adique c’est \(p^n\) qui l’est). Une autre différence (agréable) est que l’écriture en base \(p\) est unique en \(p\)-adique, alors que certains nombres réels ont deux écritures. Par contre, il reste vrai que les rationnels ont une écriture qui se répète au bout d’un moment et que ce sont les seuls nombres ayant cette propriété. Il est aussi vrai que la complétion consiste à rajouter tous les développement en base\(p\) possibles (avec un nombre fini de chiffres après la virgule).
L’ultramétricité de \(|\ |_p\) a des conséquences amusantes dont certaines sont assez déstabilisantes et d’autres très agréables:
— Tout point d’une boule 24La boule fermée de centre \(x_0\) et de rayon \(r\) est l’ensemble des \(x\) tels que \(|x-x_0|_p\leq r\); dans \({\bf R}\), cette boule est un segment. en est le centre.
— Une suite \((u_n)_{n\in{\bf N}}\) converge si et seulement si \(|u_{n+1}-u_n|_p\) tend vers \(0\) 25Que la vie de nos étudiants serait agréable s’il en était de même dans \({\bf R}\)…. Par exemple, \(1+2+4+8+\cdots+2^n+\cdots=-1\) dans 26 La série converge car \(|2^n|_2=\frac{1}{2^n}\to 0\), et on a \((1+2+4+8+\cdots+2^n)-(-1)=2^{n+1}\) qui tend vers~\(0\) dans \({\bf Q}_2\). \({\bf Q}_2\).
— L’ensemble \({\bf Z}_p\) des \(x\in{\bf Q}_p\) vérifiant \(|x|_p\leq 1\) est stable par addition, passage à l’opposé, et multiplication. C’est donc un sous-anneau de \({\bf Q}_p\). C’est aussi l’ensemble des \(x\in{\bf Q}_p\) n’ayant pas de chiffre après la virgule dans l’écriture en base \(p\); on peut donc le voir comme l’analogue \(p\)-adique du segment \([0,1]\).
— L’ensemble \({\bf Z}_p^*\) de ses éléments inversible est l’ensemble des \(x\in{\bf Q}_p\) vérifiant \(|x|_p=1\). Un élément de \({\bf Z}_p\) qui n’est pas inversible est divisible par \(p\), et \({\bf Z}_p\) est donc la réunion disjointe de \(p{\bf Z}_p=\{px,\ x\in{\bf Z}_p\}\).
Les mondes possibles
On peut se demander s’il existe d’autres mondes que le monde réel ou les mondes \(p\)-adiques, mais Ostrowski (1918) a montré que ce sont les seuls possibles:
À équivalence 27Deux normes sont dites équivalentes si les suites tendant vers\(0\) sont les mêmes pour les deux normes; deux normes équivalentes donnent naissance au même monde. près, les seules normes non triviales 28La norme triviale est la norme définie par \(\Vert 0\Vert=0\) et \(\Vert x\Vert=1\) pour tout \(x\neq 0\). sur \({\bf Q}\) sont la valeur absolue et les \(|\ |_p\), où \(p\) parcourt l’ensemble des nombres premiers.
Les mondes réel et \(p\)-adiques n’ont a priori rien à voir (par exemple car une somme d’entiers positifs peut être négative, voir ci-dessus, ou parce que l’on peut trouver une suite de nombres rationnels \((r_n)_{n\in{\bf N}}\) ayant pour limite \(\pi\) dans \({\bf R}\), \(1\) dans \({\bf Q}_2\), \(\sqrt 7\) dans \({\bf Q}_3\) et \(\sqrt{-1}\) dans \({\bf Q}_5\)), mais ils sont reliés entre eux de manière subtile et pas vraiment complètement comprise. Le premier indice de ce lien est la formule du produit 29Par exemple \(|48|=48=2^4\cdot 3\), \(|48|_2=2^{-4}\), \(|48|_3=3^{-1}\) et \(|48|_p=1\) si \(p\neq 2,3\); on a donc \(|48|\cdot\prod_p|48|_p=48\cdot 2^{-4}3^{-1}=1\). Plus généralement, si \(a\) est un entier non nul, on peut le factoriser sous la forme \(a=\pm\prod_pp^{v_p(a)}\) (avec \(v_p(a)=0\) sauf pour un nombre fini de \(p\)); alors \(|a|=\prod_pp^{v_p(a)}\) et \(|a|_p=p^{-v_p(a)}\) pour tout \(p\); il s’ensuit que quand on fait le produit de toutes les normes, la puissance de \(p\) dans \(|a|\) est annulée par celle dans \(|a|_p\), et le produit vaut~\(1\) comme annoncé (le résultat pour \(r\in{\bf Q}\) non nul s’en déduit en écrivant \(r\) sous la forme \(r=a/b\) avec \(a,b\) entiers).:
Si \(x\in{\bf Q}-\{0\}\), alors 30Le produit porte sur les nombres premiers; c’est en fait un produit fini car tous les termes sauf un nombre fini valent \(1\): si \(x=a/b\) et si \(p\) ne divise ni \(a\) ni \(b\), alors \(|x|_p=1\).
\(|x|\cdot\prod_{p}|x|_p=1\).
Des effets bénéfiques de la globalisation
Au vu du théorème d’Ostrowski, il est naturel d’essayer de considérer simultanément les mondes réel et \(p\)-adiques,
ce qui mène directement 31Il a quand même fallu 50 ans après la construction des nombres \(p\)-adiques pour que
les adèles soient introduits, et leur construction a été rien moins que directe (Chevalley (1940) a introduit le groupe des idèles qui est, a posteriori, le groupe des éléments inversibles de \({\bf A}\); les adèles sont nés \(5\) ans plus tard): ce sont toujours les idées simples qui viennent en dernier… à la construction des adèles. On définit un {adèle} comme une collection \((x_\infty,x_2,x_3,\dots,x_p,\dots)\), où \(x_\infty\in{\bf R}\) et \(x_p\in{\bf Q}_p\), avec \(x_p\in{\bf Z}_p\) sauf pour un nombre fini de \(p\). On note \({\bf A}\) l’ensemble des adèles; on en fait un anneau en définissant l’addition et la multiplication composante par composante 32 \((x_\infty,x_2,x_3,\dots,x_p,\dots)+(y_\infty,y_2,y_3,\dots,y_p,\dots)= (x_\infty+y_\infty,x_2+y_2,x_3+y_3,\dots,x_p+y_p,\dots)\) et \( (x_\infty,x_2,x_3,\dots,x_p,\dots)\cdot (y_\infty,y_2,y_3,\dots,y_p,\dots)= (x_\infty y_\infty,x_2 y_2,x_3 y_3,\dots,x_p y_p,\dots)\).. Cet anneau contient \({\bf Q}\) de manière naturelle 33Si \(r=a/b\in{\bf Q}\), alors \(|r|_p\leq 1\) si \(p\) ne divise pas \(b\), et donc \(r\in{\bf Z}_p\) sauf un nombre fini de \(p\). On peut donc associer à \(r\) l’adèle dont toutes les composantes sont égales à \(r\). Pour un théoricien des nombres, plonger \({\bf Q}\) dans \({\bf R}\) ou dans \({\bf Q}_p\) revient à regarder les phénomènes d’un point de vue local; le plonger dans \({\bf A}\) (qui contient tous les mondes possibles) offre un point de vue global sur ce qui se passe.
Tout nombre réel \(x\) peut s’écrire de manière unique \(x=n+r\), avec \(n\in{\bf Z}\) et \(r\in [0,1[\) (l’entier \(n\) est la partie entière de \(x\)). On peut écrire ceci de manière compacte, sous la forme \({\bf R}/{\bf Z}\sim [0,1[\). Comme le segment \([0,1[\) est de longueur~\(1\), cela conduit à considérer que le volume \({\rm Vol}({\bf R}/{\bf Z})\) de \({\bf R}/{\bf Z}\) est \(1\).
De même, on montre que tout adèle \(x\) peut s’écrire de manière unique sous la forme \(x=q+r\), avec \(q\in{\bf Q}\) et \(r\in[0,1[\times{\bf Z}_2\times{\bf Z}_3\times\cdots\times{\bf Z}_p\cdots\). Autrement dit, \({\bf A}/{\bf Q}\sim [0,1[\times{\bf Z}_2\times{\bf Z}_3\times\cdots\times{\bf Z}_p\cdots\). Comme \({\bf Z}_p\) est l’équivalent \(p\)-adique du segment \([0,1]\), il est naturel de lui attribuer un volume égal à \(1\), et on obtient donc \({\rm Vol}({\bf A}/{\bf Q})={\rm Vol}([0,1[)\times\prod_p{\rm Vol}({\bf Z}_p)=1\) car tous les termes du produit valent \(1\). Ce second indice de l’interconnexion des mondes réel et \(p\)-adiques n’est que moyennement convaincant car il semble reposer sur des conventions un peu arbitraires, mais le suivant l’est nettement plus.
Un petit miracle
Si \(\Lambda\) est un anneau, on note \({\bf SL}_2(\Lambda)\) l’ensemble des matrices \(2\times 2\)
à coefficients dans \(\Lambda\), de déterminant~\(1\) 34i.e. l’ensemble des \(\big(\begin{matrix}a&b\\c&d\end{matrix}\big)\), avec \(a,b,c,d\in\Lambda\) vérifiant \(ad-bc=1\).. Comme ci-dessus, on montre que \[{\bf SL}_2({\bf A})/{\bf SL}_2({\bf Q})\sim ({\bf SL}_2({\bf R})/{\bf SL}_2({\bf Z}))\times{\bf SL}_2({\bf Z}_2) \times{\bf SL}_2({\bf Z}_3)\times\cdots,\] et donc \[{\rm Vol}({\bf SL}_2({\bf A})/{\bf SL}_2({\bf Q}))= {\rm Vol}({\bf SL}_2({\bf R})/{\bf SL}_2({\bf Z}))\cdot\prod_p {\rm Vol}({\bf SL}_2({\bf Z}_p)).\] Le calcul du volume \({\rm Vol}({\bf SL}_2({\bf R})/{\bf SL}_2({\bf Z}))\) est assez délicat (c’est une intégrale triple sur un domaine pas si facile que \c ca à décrire); une méthode astucieuse de Siegel (1945), revisitée par Weil (1946), fournit la formule 35Le terme dans le membre de droite est égal à \(\frac{\pi^2}{6}\) (Euler, 1734) \[{\rm Vol}({\bf SL}_2({\bf R})/{\bf SL}_2({\bf Z}))=1+\frac{1}{2^2}+\frac{1}{3^2}+\frac{1}{4^2}+\cdots\]
Par ailleurs, si \(a,b\in{\bf Z}_p\), on peut trouver \(c,d\in{\bf Z}_p\) tels que \(ad-bc=1\) si et seulement si \(a\) et \(b\) ne sont pas simultanément divisible par \(p\). La proportion de tels couples est donc \(1-\frac{1}{p^2}\) et on a \({\rm Vol}({\bf SL}_2({\bf Z}_p))=1-\frac{1}{p^2}\). Un miracle apparaît alors: si on multiplie \(1+\frac{1}{2^2}+\frac{1}{3^2}+ \frac{1}{4^2}+\cdots\) par \(1-\frac{1}{2^2}\), on obtient \[1+\frac{1}{2^2}+\frac{1}{3^2}+\frac{1}{4^2}+\cdots-\frac{1}{2^2}-\frac{1}{4^2}-\frac{1}{6^2}-\cdots\,,\] et il ne reste plus que les termes impairs.
Si on multiplie le résultat par \(1-\frac{1}{3^2}\), on supprime de même tous les termes divisibles par \(3\), puis en multipliant par \(1-\frac{1}{5^2}\), on enlève tous les termes divisibles par \(5\)… A la limite il ne reste
plus que \(1\), et on obtient donc 36En passant, on a obtenu la formule \(1+\frac{1}{2^2}+\frac{1}{3^2}+
\frac{1}{4^2}+\cdots=\prod_p(1-\frac{1}{p^2})^{-1}\) due, elle aussi, à Euler (1737). \[{\rm Vol}({\bf SL}_2({\bf A})/{\bf SL}_2({\bf Q}))=(1+\frac{1}{2^2}+\frac{1}{3^2}+\frac{1}{4^2}+\cdots)(1-\frac{1}{2^2})(1-\frac{1}{3^2}) (1-\frac{1}{5^2})\cdots=1.\]
Plus généralement, on montre que \({\rm Vol}({\bf SL}_n({\bf A})/{\bf SL}_n({\bf Q}))=1\), ce qui est un cas particulier de formules très générales, dont beaucoup sont encore largement conjecturales(conjectures de Bloch et Kato et de Fontaine et Perrin-Riou). Celles-ci ont inspiré aux physiciens la théorie des cordes \(p\)-adiques qui ne semble pas avoir eu le succès espéré; peut-être faut-il attendre que les mathématiciens aient mieux compris ce qui se passe.