L’institut qui m’a accueilli en automne regroupe des gens d’horizons variés (biologistes, chimistes, physiciens, sociologues, etc.), et chacun, à tour de rôle, est censé présenter son domaine (en 20 minutes) au cours d’un repas hebdomadaire. J’y ai parlé du monde $p$-adique.
Les nombres réels ont été utilisés pendant 2 millénaires, mais n’ont été formellement définis qu’en 1872 : Cantor et Dedekind en ont donné chacun une construction en réponse à une demande un peu inquiète de Weierstrass (on ne sait jamais, le monde aurait fort bien pu s’écrouler tout d’un coup ; la période était propice à la naissance de monstres défiant l’intuition, par exemple des fonctions continues dérivables nulle part). Les constructions de Cantor et Dedekind partent du corps ${\mathbf Q}=\{\frac{a}{b},\ a,b\ {\rm entiers},\ b\neq0\}$ des nombres rationnels. Les grecs avaient déjà réalisé, à leur grande horreur, qu’il existe des nombres irrationnels (du genre $\sqrt 2$). Une manière de s’en convaincre est de regarder le développement décimal (ou plus généralement le développement en base $p$, si $p$ est un entier quelconque) d’un nombre rationnel : il se répète au bout d’un certain temps, et donc tout nombre dont le développement décimal n’a pas cette propriété n’est pas rationnel. Ce que font Cantor et Dedekind revient à rajouter tous les développements décimaux possibles et donc à boucher les trous de ${\mathbf Q}$, et on obtient de cette manière un corps, le corps ${\mathbf R}$ des nombres réels [1], qui est complet (contrairement à ${\mathbf Q}$), ce qui signifie que toute suite qui a l’air d’avoir une limite [2] en a effectivement une [3].
Implicite dans ce qui précède est le fait que l’on mesure la distance $d(x,y)$ entre deux nombres rationnels $x$ et $y$ en utilisant la distance usuelle $d(x,y)=|x-y|$, où $|\ |$ désigne la valeur absolue. Cette valeur absolue vérifie les propriétés suivantes :
(i) $|x|\geq 0$ et $|x|=0$ si et seulement si $x=0$,
(ii) $|xy|=|x|\,|y|$ pour tous $x,y\in{\mathbf Q}$,
(iii) $|x+y|\leq |x|+|y|$ pour tous $x,y\in{\mathbf Q}$ (inégalité triangulaire).
Plus généralement, on appelle norme sur ${\bf Q}$ toute fonction $\Vert\ \Vert:{\mathbf Q}\to{\mathbf R}_+$ vérifiant les mêmes propriétés (i), (ii) et (iii) ci-dessus que $|\ |$. Une telle norme donne une manière de mesurer les distances, en posant $d(x,y)=\Vert x-y\Vert$, et donc une manière de voir le monde.
On peut construire, en partant d’un nombre premier $p\in\{2,3,5,7,11,\dots\}$, une norme $|\ |_p$ sur ${\bf Q}$, dite $p$-adique, pour laquelle plus un nombre est divisible par $p$ plus il est petit [4] et on obtient de la sorte une norme qui vérifie l’inégalité ultramétrique $|x+y|_p\leq\sup(|x|_p,|y|_p)$ plus forte que l’inégalité triangulaire.
On définit alors, suivant Hensel (1897), le corps ${\bf Q}_p$ des nombres $p$-adiques, en complétant ${\bf Q}$ pour la norme $|\ |_p$, par exactement le même procédé que celui de Cantor [5] qui nous a permis de construire ${\bf R}$ à partir de ${\bf Q}$ en complétant pour la valeur absolue. La norme $|\ |_p$ s’étend, par continuité, à ${\bf Q}_p$, et ${\bf Q}_p$ est complet pour cette norme, par construction.
Un nombre $p$-adique a, comme un nombre réel, une écriture en base $p$ ; la différence est qu’en $p$-adique il y a une infinité de chiffres avant la virgule et un nombre fini après, alors qu’en réel c’est l’inverse (c’est dû au fait que $\frac{1}{p^n}$ est petit dans le monde réel si $n\to +\infty$, alors qu’en $p$-adique c’est $p^n$ qui l’est). Une autre différence (agréable) est que l’écriture en base $p$ est unique en $p$-adique, alors que certains nombres réels ont deux écritures. Par contre, il reste vrai que les rationnels ont une écriture qui se répète au bout d’un moment et que ce sont les seuls nombres ayant cette propriété. Il est aussi vrai que la complétion consiste à rajouter tous les développement en base $p$ possibles (avec un nombre fini de chiffres après la virgule).
L’ultramétricité de $|\ |_p$ a des conséquences amusantes dont certaines sont assez déstabilisantes et d’autres très agréables :
— Tout point d’une boule [6] en est le centre.
— Une suite $(u_n)_{n\in{\bf N}}$ converge si et seulement si $|u_{n+1}-u_n|_p$ tend vers $0$ [7]. Par exemple, $1+2+4+8+\cdots+2^n+\cdots=-1$ dans [8] ${\bf Q}_2$.
— L’ensemble ${\bf Z}_p$ des $x\in{\bf Q}_p$ vérifiant $|x|_p\leq 1$ est stable par addition, passage à l’opposé, et multiplication. C’est donc un sous-anneau de ${\bf Q}_p$. C’est aussi l’ensemble des $x\in{\bf Q}_p$ n’ayant pas de chiffre après la virgule dans l’écriture en base $p$ ; on peut donc le voir comme l’analogue $p$-adique du segment $[0,1]$.
— L’ensemble ${\bf Z}_p^*$ de ses éléments inversible est l’ensemble des $x\in{\bf Q}_p$ vérifiant $|x|_p=1$. Un élément de ${\bf Z}_p$ qui n’est pas inversible est divisible par $p$, et ${\bf Z}_p$ est donc la réunion disjointe de $p{\bf Z}_p=\{px,\ x\in{\bf Z}_p\}$.
On peut se demander s’il existe d’autres mondes que le monde réel ou les mondes $p$-adiques, mais Ostrowski (1918) a montré que ce sont les seuls possibles :
À équivalence [9] près, les seules normes non triviales [10] sur ${\bf Q}$ sont la valeur absolue et les $|\ |_p$, où $p$ parcourt l’ensemble des nombres premiers.
Les mondes réel et $p$-adiques n’ont a priori rien à voir (par exemple car une somme d’entiers positifs peut être négative, voir ci-dessus, ou parce que l’on peut trouver une suite de nombres rationnels $(r_n)_{n\in{\bf N}}$ ayant pour limite $\pi$ dans ${\bf R}$, $1$ dans ${\bf Q}_2$, $\sqrt 7$ dans ${\bf Q}_3$ et $\sqrt{-1}$ dans ${\bf Q}_5$), mais ils sont reliés entre eux de manière subtile et pas vraiment complètement comprise. Le premier indice de ce lien est la formule du produit [11] :
Si $x\in{\bf Q}-\{0\}$, alors [12] $|x|\cdot\prod_{p}|x|_p=1$.
Au vu du théorème d’Ostrowski, il est naturel d’essayer de considérer simultanément les mondes réel et $p$-adiques, ce qui mène directement [13] à la construction des adèles. On définit un adèle comme une collection $(x_\infty,x_2,x_3,\dots,x_p,\dots)$, où $x_\infty\in{\bf R}$ et $x_p\in{\bf Q}_p$, avec $x_p\in{\bf Z}_p$ sauf pour un nombre fini de $p$. On note ${\bf A}$ l’ensemble des adèles ; on en fait un anneau en définissant l’addition et la multiplication composante par composante [14]. Cet anneau contient ${\bf Q}$ de manière naturelle [15]
Tout nombre réel $x$ peut s’écrire de manière unique $x=n+r$, avec $n\in{\bf Z}$ et $r\in [0,1[$ (l’entier $n$ est la partie entière de $x$). On peut écrire ceci de manière compacte, sous la forme ${\bf R}/{\bf Z}\sim [0,1[$. Comme le segment $[0,1[$ est de longueur $1$, cela conduit à considérer que le volume ${\rm Vol}({\bf R}/{\bf Z})$ de ${\bf R}/{\bf Z}$ est $1$.
De même, on montre que tout adèle $x$ peut s’écrire de manière unique sous la forme $x=q+r$, avec $q\in{\bf Q}$ et $r\in[0,1[\times{\bf Z}_2\times{\bf Z}_3\times\cdots\times{\bf Z}_p\cdots$. Autrement dit, ${\bf A}/{\bf Q}\sim [0,1[\times{\bf Z}_2\times{\bf Z}_3\times\cdots\times{\bf Z}_p\cdots$. Comme ${\bf Z}_p$ est l’équivalent $p$-adique du segment $[0,1]$, il est naturel de lui attribuer un volume égal à $1$, et on obtient donc ${\rm Vol}({\bf A}/{\bf Q})={\rm Vol}([0,1[)\times\prod_p{\rm Vol}({\bf Z}_p)=1$ car tous les termes du produit valent $1$. Ce second indice de l’interconnexion des mondes réel et $p$-adiques n’est que moyennement convaincant car il semble reposer sur des conventions un peu arbitraires, mais le suivant l’est nettement plus.
Si $\Lambda$ est un anneau, on note ${\bf SL}_2(\Lambda)$ l’ensemble des matrices $2\times 2$ à coefficients dans $\Lambda$, de déterminant $1$ [16]. Comme ci-dessus, on montre que $${\bf SL}_2({\bf A})/{\bf SL}_2({\bf Q})\sim ({\bf SL}_2({\bf R})/{\bf SL}_2({\bf Z}))\times{\bf SL}_2({\bf Z}_2) \times{\bf SL}_2({\bf Z}_3)\times\cdots,$$ et donc $${\rm Vol}({\bf SL}_2({\bf A})/{\bf SL}_2({\bf Q}))= {\rm Vol}({\bf SL}_2({\bf R})/{\bf SL}_2({\bf Z}))\cdot\prod_p {\rm Vol}({\bf SL}_2({\bf Z}_p)).$$ Le calcul du volume ${\rm Vol}({\bf SL}_2({\bf R})/{\bf SL}_2({\bf Z}))$ est assez délicat (c’est une intégrale triple sur un domaine pas si facile que ça à décrire) ; une méthode astucieuse de Siegel (1945), revisitée par Weil (1946), fournit la formule [17] $${\rm Vol}({\bf SL}_2({\bf R})/{\bf SL}_2({\bf Z}))=1+\frac{1}{2^2}+\frac{1}{3^2}+ \frac{1}{4^2}+\cdots$$
Par ailleurs, si $a,b\in{\bf Z}_p$, on peut trouver $c,d\in{\bf Z}_p$ tels que $ad-bc=1$ si et seulement si $a$ et $b$ ne sont pas simultanément divisible par $p$. La proportion de tels couples est donc $1-\frac{1}{p^2}$ et on a ${\rm Vol}({\bf SL}_2({\bf Z}_p))=1-\frac{1}{p^2}$. Un miracle apparaît alors : si on multiplie $1+\frac{1}{2^2}+\frac{1}{3^2}+ \frac{1}{4^2}+\cdots$ par $1-\frac{1}{2^2}$, on obtient $$1+\frac{1}{2^2}+\frac{1}{3^2}+ \frac{1}{4^2}+\cdots-\frac{1}{2^2}-\frac{1}{4^2}-\frac{1}{6^2}-\cdots\,,$$ et il ne reste plus que les termes impairs. Si on multiplie le résultat par $1-\frac{1}{3^2}$, on supprime de même tous les termes divisibles par $3$, puis en multipliant par $1-\frac{1}{5^2}$, on enlève tous les termes divisibles par $5$... A la limite il ne reste plus que $1$, et on obtient donc [18] $${\rm Vol}({\bf SL}_2({\bf A})/{\bf SL}_2({\bf Q}))=(1+\frac{1}{2^2}+\frac{1}{3^2}+ \frac{1}{4^2}+\cdots)(1-\frac{1}{2^2})(1-\frac{1}{3^2}) (1-\frac{1}{5^2})\cdots=1.$$
Plus généralement, on montre que ${\rm Vol}({\bf SL}_n({\bf A})/{\bf SL}_n({\bf Q}))=1$, ce qui est un cas particulier de formules très générales, dont beaucoup sont encore largement conjecturales (conjectures de Bloch et Kato et de Fontaine et Perrin-Riou). Celles-ci ont inspiré aux physiciens la théorie des cordes $p$-adiques qui ne semble pas avoir eu le succès espéré ; peut-être faut-il attendre que les mathématiciens aient mieux compris ce qui se passe.
[1] La terminologie "rationnel, irrationnel, transcendant, réel, imaginaire, complexe" ferait la joie des psychologues.
[2] Une suite a l’air d’avoir une limite si on peut l’inclure dans un intervalle de longueur arbitrairement petite après en avoir enlevé un nombre fini (dépendant de l’intervalle) de termes ; une telle suite est dite de Cauchy. Avec des quantificateurs, cela devient : la suite $(u_n)_{n\in{\bf N}}$ est de Cauchy si et seulement si $\forall\epsilon>0, \exists N\in{\bf N}, \forall n\geq N, |u_n-n_N|\leq\epsilon$. On fera attention qu’il ne suffit pas que $u_{n+1}-u_n$ tende vers $0$ pour que $(u_n)_{n\in{\bf N}}$ soit de Cauchy.
[3] La construction de Cantor revient à rajouter de force les limites de suites de Cauchy de nombres rationnels.
[4] De manière précise, on procède comme suit. Si $a\in{\bf Z}$ est un entier, on note $v_p(a)$ le nombre de fois que l’on peut diviser $a$ par $p$ (avec $v_p(0)=+\infty$ par convention), et on pose $|a|_p=p^{-v_p(a)}$ (et donc $|0|_p=0$). Par exemple $48=2^4\cdot 3$, et donc $v_2(48)=4$ et $|48|_2=2^{-4}$, $v_3(48)=1$ et $|48|_3=3^{-1}$, et $v_p(48)=0$ et $|48|_p=1$ pour tout $p\neq 2,3$. On a $v_p(ab)=v_p(a)+v_p(b)$ (c’est clair sur la définition) et $v_p(a+b)\geq {\rm min}(v_p(a),v_p(b))$ (car la divisibilité de $a$ et $b$ par $p^k$ entraîne celle de $a+b$) ; ce qui se traduit par $|ab|_p=|a|_p|b|_p$ et $|a+b|_p\leq\sup(|a|_p,|b|_p)$. On étend $|\ |_p$ à ${\mathbf Q}$ en posant $|x|_p=|a|_p/|b|_p$ si $x=a/b$ avec $a,b\in{\mathbf Z}$ (ce qui ne dépend pas de l’écriture de $x$ sous la forme $a/b$).
[5] On rajoute de force les limites des suites de Cauchy de nombres rationnels pour la distance définie par $|\ |_p$ ; le procédé de Dedekind utilise à plein l’ordre règnant dans le monde réel et est inutilisable dans le monde $p$-adique.
[6] La boule fermée de centre $x_0$ et de rayon $r$ est l’ensemble des $x$ tels que $|x-x_0|_p\leq r$ ; dans ${\bf R}$, cette boule est un segment.
[7] Que la vie de nos étudiants serait agréable s’il en était de même dans ${\bf R}$...
[8] La série converge car $|2^n|_2=\frac{1}{2^n}\to 0$, et on a $(1+2+4+8+\cdots+2^n)-(-1)=2^{n+1}$ qui tend vers $0$ dans ${\bf Q}_2$.
[9] Deux normes sont dites équivalentes si les suites tendant vers $0$ sont les mêmes pour les deux normes ; deux normes équivalentes donnent naissance au même monde.
[10] La norme triviale est la norme définie par $\Vert 0\Vert=0$ et $\Vert x\Vert=1$ pour tout $x\neq 0$.
[11] Par exemple $|48|=48=2^4\cdot 3$, $|48|_2=2^{-4}$, $|48|_3=3^{-1}$ et $|48|_p=1$ si $p\neq 2,3$ ; on a donc $|48|\cdot\prod_p|48|_p=48\cdot 2^{-4}3^{-1}=1$. Plus généralement, si $a$ est un entier non nul, on peut le factoriser sous la forme $a=\pm\prod_pp^{v_p(a)}$ (avec $v_p(a)=0$ sauf pour un nombre fini de $p$) ; alors $|a|=\prod_pp^{v_p(a)}$ et $|a|_p=p^{-v_p(a)}$ pour tout $p$ ; il s’ensuit que quand on fait le produit de toutes les normes, la puissance de $p$ dans $|a|$ est annulée par celle dans $|a|_p$, et le produit vaut $1$ comme annoncé (le résultat pour $r\in{\bf Q}$ non nul s’en déduit en écrivant $r$ sous la forme $r=a/b$ avec $a,b$ entiers).
[12] Le produit porte sur les nombres premiers ; c’est en fait un produit fini car tous les termes sauf un nombre fini valent $1$ : si $x=a/b$ et si $p$ ne divise ni $a$ ni $b$, alors $|x|_p=1$.
[13] Il a quand même fallu 50 ans après la construction des nombres $p$-adiques pour que les adèles soient introduits, et leur construction a été rien moins que directe (Chevalley (1940) a introduit le groupe des idèles qui est, a posteriori, le groupe des éléments inversibles de ${\bf A}$ ; les adèles sont nés $5$ ans plus tard) : ce sont toujours les idées simples qui viennent en dernier...
[14] $(x_\infty,x_2,x_3,\dots,x_p,\dots)+(y_\infty,y_2,y_3,\dots,y_p,\dots)= (x_\infty+y_\infty,x_2+y_2,x_3+y_3,\dots,x_p+y_p,\dots)$ et $ (x_\infty,x_2,x_3,\dots,x_p,\dots)\cdot (y_\infty,y_2,y_3,\dots,y_p,\dots)= (x_\infty y_\infty,x_2 y_2,x_3 y_3,\dots,x_p y_p,\dots)$.
[15] Si $r=a/b\in{\bf Q}$, alors $|r|_p\leq 1$ si $p$ ne divise pas $b$, et donc $r\in{\bf Z}_p$ sauf un nombre fini de $p$. On peut donc associer à $r$ l’adèle dont toutes les composantes sont égales à $r$. Pour un théoricien des nombres, plonger ${\bf Q}$ dans ${\bf R}$ ou dans ${\bf Q}_p$ revient à regarder les phénomènes d’un point de vue local ; le plonger dans ${\bf A}$ (qui contient tous les mondes possibles) offre un point de vue global sur ce qui se passe.
[16] i.e. l’ensemble des $\big(\begin{smallmatrix}a&b\\c&d\end{smallmatrix}\big)$, avec $a,b,c,d\in\Lambda$ vérifiant $ad-bc=1$.
[17] Le terme dans le membre de droite est égal à $\frac{\pi^2}{6}$ (Euler, 1734)
[18] En passant, on a obtenu la formule $1+\frac{1}{2^2}+\frac{1}{3^2}+ \frac{1}{4^2}+\cdots=\prod_p(1-\frac{1}{p^2})^{-1}$ due, elle aussi, à Euler (1737).