Un joli problème d’Erdös

15 octobre 2006  - Ecrit par  Michel Benaïm Voir les commentaires

Soit 0 < a < 1 et Y^a = \sum_{k = 0}^{\infty} a^k \theta_k la série aléatoire obtenue en choisissant les \theta_k \in \{-1,1\} au hasard. L’étude de la fonction de répartition F^a(t) = \Pr(Y^a \leq t) révèle quelques connexions étonnantes entre la théorie des chaînes de Markov, l’analyse harmonique, la théorie des nombres algébriques, et la théorie géométrique de la mesure.

Introduction

Si la définition d’un problème de mathématiques est relativement consensuelle, celle d’un joli problème de mathématiques est nécessairement beaucoup plus subjective. Pourtant je ne doute pas que les lecteurs de cet article s’accorderont avec moi à trouver que le problème que les éditeurs des images 2005 m’ont demandé de présenter ici possède tous les ingrédients d’un joli problème de mathématiques :

  • Il est très facile à décrire ;
  • Il n’est toujours pas (complétement) résolu ;
  • Son analyse fait appel à des outils empruntés à des domaines particulièrement variés des mathématiques.

Soit $ \Omega = \{-1,1\}^{\mathbb{N}}$ et $a \in ]0,1[.$ Pour toute suite $\theta =(\theta_k)\in \Omega,$
nous notons
\[Y^a_n(\theta) = \sum_{k = 0}^n a^k{\theta_k} \mbox{ et } Y^a(\theta) = \sum_{k = 0}^{\infty} a^k \theta_k.\]
L’objet qui va nous intéresser ici est la fonction, ou comme disent les probabilistes, la variable aléatoire $Y^a : \Omega \mapsto \mathbb{R}$ lorsque les $\theta_n$ sont choisis au hasard en jouant à pile ou face.
Plus précisément, munissons $\Omega$ de la probabilité $\Pr$ du jeu de pile ou face :
\[\forall \omega \in \Omega, \forall n \in \mathbb{N}, \: \Pr(\{\theta \in \Omega \: : \theta_0 = \omega_0, ..., \theta_n = \omega_{n-1}\}) = \frac{1}{2^n}.\]
La loi de $Y^a$ est la probabilité $\nu^a,$ image de $\Pr$ par $Y^a :$
\[\nu^a(B) = \Pr(\{\theta \in \Omega \: : Y^a(\theta) \in B\}),\]
et sa fonction de répartition est l’application $F^a : \mathbb{R}\rightarrow[0,1]$ définie par
\[F^a(t) = \nu^a(]-\infty,t]) = \Pr(Y^a \leq t).\]
L’étude de la fonction $F^a$ (ou de la mesure $\nu^a$) a été initiée dans les années 30 par Wintner et ses collaborateurs et révèle des connexions remarquables entre l’analyse harmonique, la théorie des nombres algébriques, les systèmes dynamiques ou encore la théorie géométrique de la mesure.

Auto-similarité

Soit $(X_n)$
la suite récurrente aléatoire définie par

\[\begin{equation}X_{n+1} = a X_n + \theta_{n+1}, \: n \geq -1\label{equation_1}\end{equation}\]

où les $\theta_n$ sont tirés à pile ou face et $X_{-1}$ est une condition initiale arbitraire indépendante des $\theta_n.$
Pour tout $n \geq 0,$
\[X_{n}(\theta) = a^{n+1} X_{-1} + \sum_{k = 0}^n a^k \theta_{n-k},\]
de sorte que les variables $X_{n}$ et $a^{n+1} X_{-1} + Y_n^a$ ont la même loi car les vecteurs $(\theta_0, ... ,\theta_n)$ et $(\theta_n, ... , \theta_0)$ ont la même loi. Ainsi, si $\nu_n$ désigne la loi de $X_n$ et $\Phi$ une fonction « test » continue bornée,

\[\begin{equation}\int_{\mathbb{R}} \Phi~d\nu_n = \int_{\Omega} \Phi \circ X_n~d\Pr = \int_{\Omega} \Phi \circ (Y_n^a + a^{n+1} X_{-1})~d\Pr \rightarrow \int_{\Omega} \Phi \circ Y^a~d\Pr= \int_{\mathbb{R}}\Phi~d\nu^a\label{equation_2}\end{equation}\]

quand ${n \rightarrow \infty}.$
Par ailleurs, d’après $\ref{equation_1}$, la suite $(\nu_n)$ vérifie la relation de récurrence

\[\begin{equation}\nu_{n+1} = T^a (\nu_n)\label{equation_3}\end{equation}\]

où $T^a$ est l’opérateur qui transforme une mesure $\nu$ de fonction de répartion $F$ (i.e $F(t) = \nu (]-\infty, t])$ ) en une mesure $T^a(\nu)$ de fonction de répartition

\[\begin{equation}T_a(F)(t) = \frac{1}{2}\left [F\left (\frac{t-1}{a}\right ) + F\left (\frac{t+1}{a}\right )\right ]\label{equation_4}\end{equation}\]

De $\ref{equation_2}$ et $\ref{equation_3}$ on déduit la propriété d’autosimilarité suivante.

Proposition 1. $\nu^a$ est l’unique probabilité solution de $\nu = T^a(\nu).$ C’est la probabilité invariante de$\ref{equation_1}$.

Simulations

Figure 1. Graphe de $F_{4}$ pour $a = 0,25.$

La fonction de répartition $F_n$ de $\nu_n$ vérifie $F_n = T_a(F_{n-1}).$
Si, par ailleurs, $\nu_{-1}$ admet une densité, alors $\nu_{n}$ admet une densité $f_{n}$ et $f_{n} = \frac{1}{a}T_a(f_{n-1}).$
L’itération de ces formules est à la base des programmes informatiques réalisés par Michel Delasnerie pour représenter le graphe des fonctions $F_n$ et $f_n.$
Les figures données ici sont obtenues pour différentes valeurs de $a$ et différentes valeurs de $n$ lorsque $X_{-1}$ suit une loi uniforme sur $[0,1].$
Pour en comprendre la diversité il faut lire les sections suivantes.

Figure 2. Graphe de $f_{30}$ pour $a = 0,75.$
Figure 3. Graphe de $f_{22}$ pour $a = 0,6180340.$

Loi des types purs

Rappelons qu’une mesure $\nu$ sur $\mathbb{R}$ de fonction de répartition $F(t) = \nu(]-\infty,t])$ est dite absolument continue, si
$F(t) = \int_{-\infty}^t f(u)du$
où $f$ est une fonction positive intégrable
(appelée densité) ; et singulière si il existe un ensemble $N \subset \mathbb{R}$ de mesure de Lebesgue nulle et tel que $\nu(\mathbb{R}\setminus N) = 0.$
En général, une mesure $\nu$ sur $\mathbb{R}$ peut toujours s’écrire de manière unique sous la forme $\nu = \nu_{ac} + \nu_s$ où $\nu_{ac}$ est absolument continue et $\nu_s$ est singulière (éventuellement nulle).

Dans les années 30, le mathématicien Wintner et ses collaborateurs ont cherché à décrire le type de $\nu^a.$ Jessen et Wintner démontrent en 1935
le résultat suivant.

Proposition 2 [Jessen et Wintner, 1935]. La fonction $F_a$ est continue. De plus, la mesure $\nu^a$ est absolument continue ou bien continue singulière.

La seconde partie de cette proposition est une conséquence directe de la proposition 1. En effet, l’opérateur $T^a$ laissant invariant les mesures absolument continues et les mesures singulières, les parties $\nu^a_{ac}$ et $\nu^a_s$ sont des points fixes de $T^a,$ et par unicité, une de ces partie doit être nulle.

Les escaliers du diable : $a < \frac{1}{2}$

Pour $a < \frac{1}{2},$ $Y_n(\theta)$ prend au plus $2^{n+1}$ valeurs distinctes et le reste $r_n = Y^a(\theta) - Y_n^a(\theta)$ a un module
$ \leq \frac{a^{n+1}}{a-1}.$ La mesure $\nu^a$ est donc concentrée sur une réunion d’intervalles dont la longueur totale $l_n = 2^{n-1} a^{n-1}/ (1-a).$ tend vers zéro quand $n \rightarrow \infty.$ Ainsi,

Proposition 3 [Kershner et Wintner, 1935]. Pour $a < \frac{1}{2}$, $\nu^a$ est continue singulière. Plus précisément, le support de $\nu^a$ est un ensemble de Cantor de mesure de Lebesgue nulle.

La fonction $F^a$ est donc un escalier du diable (voir l’encadré 1 et la figure 1).

Encadré 1.

Escalier du diable

Un escalier du diable est une fonction continue croissante mais presque partout constante. Ce type de fonction a été découvert en 1885 par Ludwig Scheefer élève de Georg Cantor.

Les théorèmes d’Erdös et Solomyak : $a\geq\frac{1}{2}$

Pour $a = \frac{1}{2},$ il est facile de vérifier (en utilisant par exemple la proposition 1) que $\nu_{1/2}$ est la loi uniforme sur $I_{1/2}$.
Pour $a \geq \frac{1}{2}$ le support de $\nu^a$ coincïde avec l’intervalle $I_a = \left [ -\frac{1}{1-a}, \frac{1}{1-a} \right ]$ et $F^a$ est donc une fonction continue strictement croissante sur $I^a.$
Par ailleurs, Wintner en 1935 prouve que $F^a$ est dérivable de classe $C^{k-1}$ pour $a = 2^{-1/k}$ et $k \geq 2.$ Ces résultats pourraient laisser supposer que $F^a$ est absolument continue pour $a \geq \frac{1}{2},$ mais Erdös en 1939
prouve le surprenant résultat suivant.

Théorème 1 [Erdös, 1939]. Soit $1< g <2$ un nombre de Pisot (voir encadré 2) et $a = 1/g.$ Alors $\nu^a$ est singulière.

La figure 3 « illustre » ce théorème lorsque $a$ est l’inverse du nombre d’or.

Encadré 2.

Nombre de Pisot

Un nombre de Pisot $g$ est un entier algébrique, c’est-à-dire la racine d’un polynôme unitaire
à coefficients dans $\mathbb{Z}~,$ dont les conjugués (i.e les autres racines) $g_2, ..., g_m$ sont de module $< 1.$
Par exemple, le nombre d’or $g = (\sqrt{5} + 1)/2$ est un nombre de Pisot car c’est la racine du polynôme $X^2-X-1$ dont
le conjugué $(1-\sqrt{5})/2$ a un module $< 1.$
De même les racines positives $\theta_1 \sim 1.32471$ de $X^3 - X -1$ et $\theta_2 \sim 1.3802777$ de $X^4 -X ^3 -1$ sont des nombres de Pisot (ce sont d’ailleurs les seuls nombres de Pisot contenus dans $]1, \sqrt{2}[$).

Une propriété remarquable des nombres de Pisot est que leurs puissances s’approchent exponentiellement vite des entiers. En effet,
l’expression $g^n + g_2^n + ... + g_m^n$ est un polynôme symétrique des racines et peut donc s’écrire comme un polynôme à coefficients dans $\mathbb{Z}$ des fonctions symétriques élémentaires. Ainsi $g^n + g_2^n + ... + g_m^n \in \mathbb{Z}$ et

\[\begin{equation}dist(g^n, \mathbb{Z}) \leq \rho^n\label{equation_5}\end{equation}\]
pour un certain $0 < \rho < 1.$

Encadré 3.

La preuve du théorème d’Erdös

Soit
\[\Phi_t(Y^a) = {\mathcal{E}}(e^{itY^a}) = \int_{\mathbb{R}} e^{itx} \nu^a(dx) = \prod_{k = 0}^{\infty} \frac{1}{2}(e^{ita^k} + e^{-ita^k}) = \prod_{k = 0}^{\infty} \cos(ta^k) \]
la fonction caractéristique de $Y^a$ (i.e. la transformée de Fourier de $\nu^a$).
La preuve du théorème d’Erdös consiste à montrer que $\Phi_t(Y^a)$ ne converge pas vers $0$ quand $t\rightarrow \infty,$ car d’après le lemme de Riemann-Lebesgue, la transformée de Fourier d’une mesure absolument continue tend vers zéro en l’infini.
Pour $a = 1/g$ et $t(n) = \pi g^n,$
\[\Phi_{t(n)}(Y^{a}) = \prod_{k = 0}^{\infty} \cos(g^{n-k}\pi) = \prod_{k = 0}^{n} \cos(g^k \pi) C, \mbox{ où } C = \prod_{k = 1}^{\infty} \cos(a^{k}\pi).\]

D’après $\ref{equation_5}$ $||\cos(g^k \pi)| -1| \leq \pi \rho^k.$
D’où
\[\lim_{n \rightarrow\infty} |\Phi_{t(n)}(Y^{a})| = |C||\prod_{k = 0}^{\infty} |\cos(g^k \pi)| > 0.\]

Le problème d’Erdös et le théorème de Solomyak

Soit $\mathcal{S} \subset ]\frac{1}{2} , 1[$ l’ensemble des valeurs de $a$ pour lesquelles $\nu^a$ est singulière.
Le théorème d’Erdös pose le problème de la description de $\mathcal{S}.$
En 1940 Erdös prouve que $a \not \in \mathcal{S}$ pour presque tout $a \in ]a^*,1[$
pour un certain $a^*$ proche de $1.$ Kahane et Salem en 1958 obtiennent un critère assurant que $\nu^a$ possède une densité $L^2.$ En 1962 Garsia prouve que $a \not \in \mathcal{S}$ si $a$ est l’inverse d’un entier algébrique (voir encadré 2) dont les conjugués ont un module $> 1$ et tel que le terme constant du polynome unitaire soit $2$ ou $-2.$ Un tel polynome étant par exemple $x^{n+p} -x^n -2$ avec $p,n \geq 1$ et $\max{p,n} \geq 2.$ Dans le même travail, Garsia conjecture que $\mathcal{S}$ est de mesure nulle, mais il faudra attendre 1995 pour que cette conjecture soit prouvée par Solomyak.

Théorème 2 [Solomyak, 1995] $\mathcal{S}$ est de mesure de Lebesgue nulle.

A ce jour, on ne sait toujours pas si $\mathcal{S}$ contient des points qui ne sont pas des inverses de nombres de Pisot.

Encadré 4.

La preuve du théorème de Solomyak

En 1996, Y. Peres et B. Solomyak ont proposé une preuve remarquablement courte du théorème de Solomyak dont voici l’idée générale.
Soit \[D^a(x) = \liminf_{r \rightarrow 0} \frac{1}{2r} \nu^a(]x-r,x+r[).\]
Une application du théorème de recouvrement de Vitali montre que $a \not \in \mathcal{S}$ si et seulement si $D^a(x) < \infty$ pour $\nu^a$ presque tout $x.$
Il suffit donc de prouver que $s = \int_{\alpha}^{\beta} \int_{\mathbb{R}} D^a(x) \nu^a(dx) da < \infty$ pour en déduire que $\lambda( S \cap ]\alpha, \beta[ ) = 0$ où $\lambda$ désigne la mesure de Lebesgue.
Par le lemme de Fatou, le théorème de la mesure image et le théorème de Fubini,
\[s \leq \liminf_{r \rightarrow 0} \frac{1}{2r} \int_{\alpha}^{\beta} \int_{\mathbb{R}} \nu^a(]x-r,x+r[ \nu^a(dx) da\]
\[= \liminf_{r \rightarrow 0} \frac{1}{2r} \int_{\alpha}^{\beta} \Pr \otimes \Pr((\theta,\tilde{\theta}) \in \Omega^2 \: : |Y^a(\theta) - Y^a(\tilde{\theta})| < r) da\]
\[=\liminf_{r \rightarrow 0} \frac{1}{2r} \int_{ \Omega^2} \lambda(a \in ]\alpha, \beta[ \:: |Y^a(\theta) - Y^a(\tilde{\theta})|< r ) d\Pr(\theta) d \Pr(\tilde{\theta}).\]
Le terme $|Y^a(\theta) - Y^a(\tilde{\theta})|$ peut s’écrire sous la forme $2a^k|g(a)|$ où $k = |\theta \wedge \tilde{\theta}| = \min \{n : \theta_n \neq \tilde{\theta_n}\}$ et $g$ est de la forme

\[\begin{equation}g(a) = 1 + \sum_{ n\geq 1} b_n a^n\label{equation_6}\end{equation}\]
avec $b_n \in \{-1,0,1\}.$

Supposons que pour un certain $\delta >0,$ toute fonction de la forme
$\ref{equation_6}$ vérifie la propriété, dite de $\delta$ -transversalité, suivante :
$\forall a \in ]\alpha, \beta[ \: |g(a)| \leq \delta \Rightarrow g'(a) \leq -\delta.$ Alors $\lambda (a \in ]\alpha,\beta[ \, : |g(a)|\leq r) \leq 2 \delta^{-1} r$. Cette inégalité est tautologique pour $2r\geq\delta$ et une conséquence de la $\delta$-transversalité pour $2r$. Ainsi, $\lambda(a \in ]\alpha,\beta[ \, : |Y^a(\theta) - Y^a(\tilde{\theta})| < r) \leq r (\delta \alpha^{\theta \wedge \tilde{\theta}})^{-1}.$
D’où
\[s \leq (2 \delta)^{-1} \int_{\Omega^2} (\alpha^{\theta \wedge \tilde{\theta}})^{-1} d\Pr(\theta) d\Pr(\tilde{\theta})\]
\[= (2 \delta)^{-1} \sum_{k} \alpha^{-k} \Pr\otimes\Pr (\theta \wedge \tilde{\theta} = k)\]
\[= (2 \delta)^{-1} \sum_k (2 \alpha)^{-k} < \infty\] car $2\alpha < 1$ et, donc $\lambda(S \cap ]\alpha, \beta[) = 0.$

L’étape suivante de la preuve de Peres et Solomyak consiste à prouver la propriété de $\delta$-transversalité sur l’intervalle $[2^{-1}, 2^{-2/3}],$ puis, par un argument similaire, à couvrir l’intevalle $ [2^{-2/3}, 2^{-1/2}].$ Pour conclure, il suffit de remarquer que, $\nu_a$ étant la convolution de $\nu_{a^2}$ avec une autre mesure, l’absolue continuité de $\nu_{a^2}$ entraine celle de $\nu_a.$ Ce qui permet de couvrir tout l’intervalle $[2^{-1},1[$ à partir de $[2^{-1},2^{-1/2}].$

Références

Ce texte est inspiré du chapitre 1 du livre de M. Benaïm et N. El Karoui, Promenade Aléatoire, éditions de l’Ecole Polytechnique, 2004, ISBN 2-7302-1168-3.

Pour plus de détails, de nombreux développements et d’autres références le lecteur intéressé pourra consulter l’article de revue de
Y. Peres, W. Schlag et B. Solomyak "Sixty years of Bernoulli convolutions,’’ in fractal geometry and stochastics II, 46, 39-65, Prog. Prob. Birkhauser, Basel, 2000.

Post-scriptum :

Je remercie Michel Delasnerie qui a réalisé les programmes à l’origine des figures et François Ledrappier pour d’utiles commentaires.

Partager cet article

Pour citer cet article :

Michel Benaïm — «Un joli problème d’Erdös» — Images des Mathématiques, CNRS, 2006

Commentaire sur l'article

Laisser un commentaire

Forum sur abonnement

Pour participer à ce forum, vous devez vous enregistrer au préalable. Merci d’indiquer ci-dessous l’identifiant personnel qui vous a été fourni. Si vous n’êtes pas enregistré, vous devez vous inscrire.

Connexions’inscriremot de passe oublié ?

Suivre IDM