Sidereus Nuncius... aujourd’hui

Piste rouge Le 10 avril 2009  - Ecrit par  Étienne Ghys, Jos Leys Voir les commentaires (2)

Où l’on continue à parler de la Lune et du même génie toscan, mais aussi de courbes et de reliefs aléatoires, de dimension fractale, et même de percolation.

Ceci est la suite de cet article.

Un argument probabiliste ?

Les arguments que Galilée propose dans Sidereus Nuncius supposent en quelque sorte que le relief de la Lune se comporte aléatoirement, que les montagnes et les vallées y alternent un peu au hasard... Là aussi, cette idée est absolument révolutionnaire si on tient compte du fait que tous ses contemporains pensaient que la Lune est une sphère absolument parfaite. Mais qu’est-ce qu’un relief aléatoire ? A quoi ressemblerait le terminateur sur une Lune aléatoire ? L’argument « du bord lisse » est-il fondé pour un relief aléatoire ? Autant de questions complexes qui ne pourront être comprises que par un travail pluri-disciplinaire qui met en jeu des astronomes, des géologues, des physiciens et bien sûr... des mathématiciens. Ici, nous allons effleurer la question de manière très élémentaire, et même naïve...

Comment construire un relief « au hasard » ? Voici une méthode simple, critiquable par bien des aspects, mais qui nous donnera un peu d’intuition. Partons d’un carré, décomposé en petits carrés, disons en $5 \times 5$ petits carrés.

Cela fait $36= 6 \times 6$ sommets. Pour chacun d’entre eux, choisissons au hasard une « altitude » qui sera un nombre compris entre 0 et 1 (on peut penser en km par exemple). Quant au choix « au hasard », demandons qu’il soit « uniforme » comme disent les probabilistes. Si on utilise l’écriture décimale, cela signifie que les décimales sont choisies indépendamment les unes des autres en donnant la même probabilité 1/10 pour chacun des chiffres 0,1,.., 9 [1].

Nous avons donc choisi au hasard l’altitude des 36 points de notre réseau.

PNG
Il reste à trouver l’altitude des autres points. Il y a beaucoup de méthodes pour le faire, et à vrai dire ce n’est pas très important ici. Par exemple, on peut découper chaque petit carré en deux triangles, comme sur la figure. Pour obtenir notre relief aléatoire, on plante des bâtons en chacun de nos 36 points dont les longueurs sont les altitudes choisies et ensuite on connecte les sommets des bâtons par des triangles.

PNG

Voilà, nous avons un paysage « aléatoire »... On peut faire beaucoup de reproches à cette méthode et nous y reviendrons. La principale est peut-être qu’on n’a jamais vu de montagne formée en recollant des triangles... Mais disons qu’il s’agit d’une approximation.

Quelle est la hauteur « typique » d’une montagne ? Eh bien, il devrait être clair que si on tire bien au hasard, à peu près un quart des points culminent au dessus de 750 mètres et à peu près un quart des points sont au dessous de 250 mètres. De la « moyenne montagne » en quelque sorte d’altitude moyenne 500 m, avec quelques sommets qui culminent à près de 1000 m.

Observons notre paysage manière rasante, puisque c’est ce qui se passe sur le bord du disque quand on le regarde.

PNG

On constate le phénomène de Galilée : ce que nous voyons est beaucoup moins accidenté que le paysage. Nous voyons encore une ligne polygonale, mais chacun de ses morceaux provient en fait d’un sommet qui peut de situer au premier plan mais aussi au second, au troisième etc. jusqu’au dernier plan.

Observons la même figure lorsqu’il y a $50\times 50$ petits carrés au lieu de $5 \times 5$.

L’effet est encore plus visible : le relief est très escarpé mais l’horizon l’est beaucoup moins.

Introduisons des coordonnées. Nous noterons $x$ et $y$ l’abscisse et l’ordonnée, mais en fait nous ne nous intéressons ici qu’aux valeurs de $x$ et $y$ qui sont des entiers compris entre 0 et 5. Pour chaque $x$ et $y$, nous avons une altitude $z=h(x,y)$ (qui a été choisie aléatoirement, rappelons-le). Lorsque nous regardons le paysage comme précédemment, pour chaque valeur de $x$, ce que nous voyons a une altitude $f(x)$ qui n’est rien d’autre que la montagne la plus élevée qui est devant nous, autrement dit, $f(x)$ est le plus grand des nombres $h(x,0), h(x,1), ..., h(x,5)$.

Quelle est la probabilité pour que $f(x)$ soit plus petit qu’un certain nombre, disons $a \leq 1$ ?

C’est très facile : pour que $f(x)$ soit plus petit que $a$, il faut simplement que tous les nombres $h(x,0), h(x,1), ..., h(x,5)$ soient inférieurs à $a$. Puisque nous tirons au hasard de manière uniforme, la probabilité que nombre $h(x,y)$ est plus petit que $a$ est égale à $a$. Puisque nous tirons tous ces nombres au hasard de manière indépendante les uns des autres, nous avons la réponse notre question :

La probabilité pour que $f(x)$ soit plus petit qu’un certain nombre $a \leq 1$ est égale à $a^6$.

Déterminons par exemple $a$ de façon à ce que cette probabilité soit de 0,95. Il faut écrire $a^6 = 0, 95$, ce qui donne $a = \sqrt[6]{0,95} \simeq 0,99$.
Déterminons maintenant $a$ pour que cette probabilité soit 0,05. C’est $\sqrt[6]{0,05}\simeq 0,61$.

On voit donc que dans 90% des cas, $f(x)$ est compris entre 0,61 et 0,99. On le constate : la fonction $f$ oscille beaucoup moins que $h$, comme l’avait annoncé Galilée.

Supposons qu’au lieu de 5 rangées de montagnes on en mette 100. Alors, c’est dans l’intervalle $[0,971,0,9995]$ que seront concentrées 90% des valeurs de $f$ : bien plus resserré en effet.

Et puis si on considère maintenant $N$ rangées (un carré $N \times N$), alors l’intervalle est $[\sqrt[N+1]{0,05}, \sqrt[N+1]{0,95}]$. Ce qu’il faut retenir, c’est que lorsque $N$ grandit, et tend vers l’infini, cet intervalle se resserre et sa largeur tend vers 0 assez rapidement, comme l’inverse de $N$ [2]. Voilà une belle confirmation théorique de l’idée de Galilée.

On pourrait reprocher à notre petit calcul que nous avons placé notre paysage aléatoire sur un territoire plat alors qu’en réalité, il faudrait le placer sur une surface sphérique. Ce serait un reproche justifié. Nous y reviendrons un peu plus tard.

Examinons maintenant la forme du terminateur. Cette fois, essayons quelque chose de plus sérieux et plaçons notre paysage sur une sphère que nous allons observer à la verticale, en l’illuminant de manière rasante depuis la gauche, comme il se doit pour observer le terminateur.

Voici deux images de cette situation, pour illustrer le principe, mais les hauteurs au dessus de la sphère ont été exagérées.

PNG
PNG

Maintenant, plaçons un paysage de hauteur un peu plus « raisonnable » sous une lumière rasante. Pour que l’effet soit plus net, nous mettons en blanc les points « sous le Soleil » et en noir les « ténèbres », autrement dit nous n’utilisons pas les nuances de gris.

PNG

Et maintenant, augmentons le nombre de triangles, en le faisant passer de $5 \times 5$ à $100 \times 100$ et observons la même figure.

PNG

Que voyons-nous ? Comme Galilée nous voyons des taches blanches dans la zone noire et des taches noires dans la zone blanche...

Des modèles plus réalistes ?

Quels sont les reproches que l’on peut faire à nos modèles de surface aléatoire ?

Nous allons devoir commencer par « infliger » au lecteur un « mini-cours » de statistiques...

J’espère, tu moyennes, il varie, nous écartons, vous covariez, ils corrèlent.

Supposons qu’on dispose d’un nombre $X$ dont la valeur est aléatoire. On appelle moyenne de $X$ ou encore, de manière plus savante, espérance mathématique de $X$, la valeur que nous serions prêts à lui attribuer si nous n’avons aucune information complémentaire. Par exemple, si $X$ est la taille d’un homme âgé de 20 ans habitant en France, cette espérance est 175,1 cm (en 1990) [3]. On note souvent $E(X)$ l’espérance d’une variable aléatoire $X$.

Il est souvent utile de comprendre comment une variable aléatoire est dispersée autour de son espérance. Pour cela il est tout à fait naturel de considérer la différence $X-E(X)$ : l’écart à la moyenne. Ce nouveau nombre est bien sûr de moyenne nulle, puisque nous avons retiré la moyenne... On dit que la variable $X-E(X)$ est centrée. On pourrait considérer la moyenne de la valeur absolue de $X-E(X)$ mais les statisticiens préfèrent considérer la moyenne de son carré $E(X-E(X)))^2$ qu’ils appellent la variance de $X$. Comme son nom l’indique, plus elle est grande et plus $X$ varie autour de sa moyenne. Souvent, il est préférable de considérer la racine carré de cette variance, qu’on appelle l’écart type de $X$ et qu’on note $\sigma(X)$ (lettre grecque « sigma »). Si $X$ s’exprime en mètres par exemple, la variance s’exprime en mètres carrés et son écart type s’exprime à nouveau en mètres si bien qu’il porte bien son nom : il donne une indication de l’écart typique auquel il faut s’attendre entre $X$ et sa valeur moyenne. Pour l’exemple de la taille des hommes français en 1990, cet écart type vaut 6,8 cm.

Supposons maintenant qu’on considère deux nombres aléatoires $X$ et $Y$. On note $E(X)$ et $E(Y)$ leurs espérances mathématiques. Par exemple, on pourrait choisir un homme français âgé de 20 ans au hasard et considérer sa taille $X$ et la taille de son père $Y$. Il est clair que dans ce cas $E(Y)$ est un peu plus petit puisque la dernière génération est un peu grande que la précédente, si bien que $E(Y)$ est peut-être 170 cm. Formons alors le produit $(X-E(X))(Y-E(Y))$. Il s’agit du produit de deux variables centrées. Mais quelle est l’espérance de ce produit ? Le premier facteur et le second sont tantôt positifs, tantôt négatifs, et la moyenne de chacun est nulle. S’ils sont complètement indépendants, on peut penser que la moyenne du produit est nulle. Si par contre il y a une certaine dépendance entre $X$ et $Y$, la moyenne du produit peut ne pas être nulle. Un exemple caricatural est celui où $X=Y$ : les nombres sont tellement dépendants qu’ils sont égaux. Dans ce cas, le produit $(X-E(X))(Y-E(Y))$ devient le carré $(X-E(X))^2$ dont nous avons vu que la moyenne s’appelle la variance. Dans notre exemple de la taille d’un homme et de son père, il semble bien clair qu’il y a corrélation : on ne peut pas déduire la taille du père à partir de celle du fils mais cela donne une indication. Les probabilistes appellent covariance de $X$ et $Y$, et ils notent $Cov(X,Y)$, l’espérance du produit $(X-E(X))(Y-E(Y))$. Cette covariance est nulle lorsqu’il y a indépendance. Il n’est pas difficile de montrer que la valeur absolue de la covariance est inférieure ou égale au produit $\sigma(X) \sigma(Y)$ des écarts types si bien que finalement on est bien tenté de définir un nombre compris entre $-1$ et $1$ qu’on appelle la corrélation entre
$X$ et $Y$ et qui est défini par $corr(X,Y) = Cov(X,Y)/(\sigma(X)\sigma(Y))$. Si $X$ et $Y$ sont indépendants, la corrélation est nulle.

Voilà ! Notre mini-cours est terminé... Pour en savoir plus, le lecteur pourra commencer par lire cet article.

Premier problème :

Nous avons choisi l’altitude au dessus des 36 points du réseau carré avec une probabilité uniforme entre une valeur minimum, 0 dans notre cas, et une valeur maximum, 1. Est-ce bien raisonnable ? Beaucoup de distributions de probabilités sont possibles et en choisir une est souvent un point délicat de la modélisation. Mais une loi joue un rôle prépondérant dans la théorie des probabilités : la fameuse courbe en cloche de Gauss.

On dit qu’un nombre aléatoire suit une loi de Gauss si la probabilité pour qu’il soit dans un intervalle infiniment petit $[x,x+dx]$ est donnée par la formule $\frac{1}{\sigma\sqrt{2 \pi }} \exp ( -\frac{1}{2}({\frac{x-\mu}{\sigma}})^2) dx$. La formule est compliquée mais la figure qui suit est plus importante que la formule :

PNG

Ici, $\mu$ (lettre grecque « mu ») désigne l’espérance mathématique) et $\sigma$ son écart type. Plus $\sigma$ est grand et plus la distribution est dispersée autour de $m$. Avec une probabilité supérieure à 0,95, le nombre $x$ est dans l’intervalle [$\mu-2 \sigma, \mu+ 2 \sigma]$. Il nous faudrait justifier le fait que cette loi est plus importante que les autres, mais ceci nous entraînerait trop loin. Le lecteur pourra cependant lire avec profit cet article de B. Bru.

Une petite justification quand même...

Si on lance une pièce de monnaie un grand nombre $N$ de fois, on peut compter combien de fois elle tombe sur pile. Ce nombre $X$ est aléatoire et prend ses valeurs entre $0$ et $N$. En moyenne bien sûr, il vaut $N/2$ et on peut montrer que l’écart type est égal à $\sqrt{N}/2$. Il se trouve qu’on peut dire beaucoup plus et que plus $N$ est grand et plus la distribution de probabilité se rapproche d’une gaussienne.

Deuxième problème :

Nous avons choisi les altitudes au dessus des 36 points de manière indépendante. Cela n’est pas raisonnable. Supposons que ma maison soit à une altitude de 600 mètres par exemple et que je déclare que je vais rendre visite à un ami qui habite à 100 mètres de chez moi. Il est clair que vous ne pouvez pas deviner l’altitude de la maison de mon ami mais vous avez quand même une idée. Il est très peu probable que l’altitude de la maison de mon ami soit 1500 mètres par exemple : il faudrait qu’il y ait une falaise entre nos deux maisons. Les altitudes de nos deux maisons ne sont pas des variables indépendantes : la connaissance de l’une donne une certaine information sur l’autre.
Une chose est sûre : si vous deviez parier sur l’altitude de la maison de mon ami, sachant seulement que j’habite à 600 mètres, votre première idée serait probablement 600 mètres. J’imagine ensuite que votre pari serait que l’altitude en question est comprise entre 550 et 650 mètres par exemple. Clairement, la détermination d’un intervalle de confiance dans lequel on serait prêt à faire ce pari dépend de notre connaissance de la topographie : le mathématicien ne pourra le déterminer seul...
Si mon ami habite à 50 km de chez moi, on peut penser que les altitudes de nos maisons sont « moins dépendantes » que dans le cas précédent, et finalement si mon ami habite à 4 000 km de chez moi, je pense que le lecteur conviendra qu’il y a une indépendance entre les altitudes de nos maisons : l’information selon laquelle j’habite à 600 m d’altitude ne dit rien sur mon ami...

Ainsi, il nous faut estimer la corrélation des hauteurs de deux lieux en fonction de leur distance.

Alors, revenons à ce que pourrait être un bon modèle pour un relief ou une topographie aléatoire. Il s’agit de choisir des fonctions altitude $h(x,y)$ donnant l’altitude au dessus du point $(x,y)$ disons dans un carré. On impose plusieurs conditions :

1/ Si on fixe un point $(x,y)$, l’altitude $h(x,y)$ suit une loi de Gauss. En fait il faut imposer une condition technique supplémentaire, que le lecteur peut tout à fait ignorer s’il le souhaite [4]. On dit alors que le processus $h$ est gaussien.

2/ La moyenne et l’écart type de $h(x,y)$ ne dépendent pas du point $(x,y)$. On imagine que notre paysage est en quelque sorte uniforme.
Si on considère deux points dans le carré $(x,y)$ et $(x',y')$, les deux nombres $h(x,y)$ et $h(x',y')$ ne sont pas nécessairement indépendants. Leur corrélation ne dépend que de la distance dist qui sépare les deux points.

Lorsque cela se passe, on dit que $h$ est une variable gaussienne stationnaire. Cette condition n’est pas indispensable mais elle semble raisonnable. Plus les points sont éloignés et plus on peut penser que les altitudes en ces deux points sont indépendantes. Il reste à décider de la manière dont la corrélation décroît avec la distance. C’est le modélisateur qui devra faire son choix en se fondant sur les données topographiques dont il dispose.

Quelques exemples

L’analyse mathématique de ces processus gaussiens stationnaires n’est pas facile et ce n’est que récemment qu’il a été possible de l’attaquer de manière sérieuse. A vrai dire, avant de commencer par étudier les fonctions de deux variables aléatoires $h(x,y)$, il est peut-être sage de commencer plus modestement par des fonctions d’une variable $f(t)$. Pourquoi avons-nous choisi la lettre $t$ pour cette unique variable ? C’est pour indiquer que bien souvent on pense à cette variable comme le temps et on comprend alors l’importance de ce domaine de recherche. Par exemple, $h(t)$ pourrait être la température à Lyon au temps $t$. Est-ce un processus gaussien stationnaire ? Certainement pas... Il est clair que l’espérance de $h(t)$ quand $t=$ 1er août n’est pas la même que lorsque $t=$ 1er janvier. Mais on peut chercher à étudier ce type de processus, et sa covariance par exemple. Mais $h(t)$ pourrait aussi décrire des cours de la bourse ou tant d’autres choses.

Les articles mathématiques consacrés aux processus gaussiens de dimension 1 sont innombrables. Voir par exemple l’article dans Images des mathématiques sur le mouvement brownien.

Typiquement, on peut demander que la décroissance de la corrélation entre $h(t)$ et $h(t')$ soit comparable à $1- \vert t-t'\vert ^{2H}$, où $H$ est une constante qu’on appelle souvent la constante de Hurst, tout au moins si $t$ et $t'$ ne sont pas trop lointains. Il n’y a pas vraiment de raison très profonde de choisir ce genre de décroissance mais l’expérience semble indiquer que c’est un bon modèle. Regardez les graphes des fonctions $1-x^{2H}$ pour $x$ dans l’intervalle $[0,1/2]$ par exemple, pour diverses valeurs de $H$ [5].

JPEG

En rouge, $H=1$ ; en vert $H=0,5$ ; en jaune $H=0,25$ et en bleu $H=0,1$.

Remarquez que cette formule implique que la dépendance entre $h(t)$ et $h(t')$ devient de plus en plus totale lorsque $t$ et $t'$ se rapprochent et ceci d’autant plus rapidement que $H$ est grand. Pour $t-t'=0,1$ par exemple, la corrélation vaut respectivement
$0,37$ ;$0,68$ ;$0,9$ ;$0,99$ lorsque $H$ vaut $0,1$ ;$0,25$, $0,5$ ; $1$.
Plus $H$ est grand et plus la fonction $h$ est régulière. Si on connaît la fonction $h$ en un point, on a de bonnes chances de la deviner en un point proche (d’une manière d’autant plus précise que $H$ est grand).

Il n’est pas facile du tout de montrer, mais c’est possible, que pour chaque $H$, il existe un moyen de « tirer une fonction au hasard » de façon à ce que les fonctions qu’on obtient aient ce genre de décroissance des corrélations. Voici quelques exemples : nous prenons trois valeurs de $H$ et pour chacune de ces valeurs, nous choisissons une fonction aléatoire $h(t)$ pour ce type de processus. Voici les résultats (de gauche à droite : $H$ vaut $0,2$ ; $0,5$ et $H=1$).

JPEG - 21.8 ko

Comment dessiner ces courbes ?

Voici comment nous avons choisi leur équation !

\[h(t) = \sum_{1}^{100} f_k \sin(kt + \theta_k)\]

avec $\theta_k$ choisi au hasard uniformément dans l’intervalle $[0, 2 \pi]$,
et $f_k = r_k k ^{-(H+1/2)}$, avec $r_k$ au hasard dans $[0,1]$.

Le champ d’étude mathématique est immense et il est impossible d’en rendre compte ici. Voici cependant un exemple d’un problème concret. Nous avons discuté plus haut de l’irrégularité de l’horizon d’un paysage mais nous avions fait l’hypothèse que l’altitude en un point est répartie de manière uniforme dans un intervalle et surtout nous avions supposé une indépendance non raisonnable des altitudes. Supposons que l’on dispose d’un processus gaussien stationnaire $h(t)$ et que l’on connaisse bien sa covariance. Que peut-on dire du maximum de $h$ sur un certain intervalle de temps donné, par exemple $[0,T]$ ? C’est le problème des valeurs extrêmes, dont on imagine l’importance pratique : si par exemple $h(t)$ est la vitesse du vent chez moi au temps $t$ et si ma maison est construite pour résister à un vent maximum de 150 km/h, quelle est la probabilité pour que ma maison soit encore intacte dans 50 ans ? Voilà une question concrète... D’ailleurs l’article initial de Hurst en 1951 traitait aussi d’un problème concret relié au niveau du Nil [6].

Un travail pionnier sur cette question a été fait par Rice dans les années 1950, mais de nombreux travaux précisent et améliorent en permanence les résultats (voir par exemple la page de Jean-Marc Azaïs, probabiliste à l’Institut de Mathématiques de Toulouse).

L’étude des fonctions aléatoires de plusieurs variables est bien sûr plus compliquée et beaucoup moins précise. Là encore, on peut par exemple supposer que la corrélation décroît comme une puissance $1-a . dist^{2H}$ de la distance entre les points. Là encore, il n’est pas facile de montrer qu’on peut effectivement « tirer des fonctions de deux variables au hasard » de façon à avoir ce type de corrélation. Ce nombre $H$ est en quelque sorte une mesure de la régularité du relief, c’est-à-dire de la surface d’équation $z=h(x,y)$ prise au hasard avec ce type de modèle probabiliste. Voici quelques exemples
de surfaces aléatoires avec différents valeurs de $H$. D’abord $H=0,05$ :
PNG
Avec $H=0,5$ :
PNG
Avec $H=1$ :
PNG
Avec $H=2$ :
PNG

Comment dessiner ces surfaces ?

Voici leur équation !

\[ h(x,y) = \sum _{k=1}^{100} \sum_{l=1}^{100} f_{k;l} \sin(kx + ly + \theta_{k,l}) \]

avec $f_{k,l}= r_{k,l}.(k^2+l^2)^{-(H+1)/2}$ où
$r_{k,l} $ est choisi aléatoirement dans $[0,1]$, et $\theta_{k;l}$ dans $[0, 2 \pi]$.

C’est avec plaisir que nous pouvons citer ici Jacques Istas, membre du comité de rédaction de Images des mathématiques, et grand spécialiste de ces processus gaussiens multi-dimensionnels. On trouvera sur sa page une simulation numérique du mouvement brownien sphérique fractionnaire mais aussi des articles de recherche sur le sujet, comme par exemple un article discutant de ce qui se passe lorsqu’on lance aléatoirement des balles sur une surface (en créant des cratères lunaires peut-être ?). Mais on y verra aussi des photos prouvant que Jacques ne s’affronte pas seulement à des montagnes aléatoires !

Géométrie fractale ?

Est-ce que ce genre de modèle peut rendre compte de la topographie de la Terre (ou de la Lune) ? Cela a été suggéré par B. Mandelbrot [7]. On trouve même dans cet article une référence à un travail du mathématicien célèbre M. Fréchet datant de 1941 [8] sur l’usage des probabilités en géographie.

Mandelbrot a largement développé cette problématique en suggérant d’étudier la nature « fractale » du relief, tout particulièrement à travers la géométrie des courbes de niveau, comme le niveau 0 par exemple.

Regardez la succession de figures suivante. On peut penser à une suite d’images de plus en plus précises qui « convergent » à l’infini vers une forme limite (que nous n’avons pas dessinée mais que vous devez imaginer). Pensez à cette forme limite comme une île rouge dans un océan.

JPEG - 33.6 ko

Proposons-nous d’en mesurer la longueur de la côte, le périmètre de l’île.
Si on observe l’île sur une carte peu précise, on voit la première image, une étoile à six branches, constituée de 12 segments, disons de longeur 1km.
En première approximation, on peut donc approcher le périmètre par celui de l’étoile, c’est-à-dire 12 km. Mais si on y regarde de plus près, dans la seconde image, chaque côté de l’étoile se précise en quatre segments de longueur 1/3 km, ce qui donnerait un périmètre de $12\times 4/3 = 16$. Si on précise encore, chaque segment de précise en 4 segments dont chacun a une longueur 1/3 du précédent. A chaque étape, la longueur du polygone se multiplie par 4/3 si bien que les approximations successives ont des périmètres qui tendent vers l’infini. La longueur de la côte est donc ... infinie.

Pour quantifier cela, on définit la notion de dimension fractale, introduite au début du vingtième siècle par des mathématiciens ayant des motivations très éloignées des applications, et qui a pris un essor incroyable depuis une trentaine d’années dans le monde des applications [9].

Supposons donc qu’on dispose d’une courbe et d’un instrument de mesure de taille $x$, par exemple un compas dont les extrémités sont à une distance $x$. Pour mesurer la courbe, on compte combien de fois on peut reporter la longueur $x$ le long de la courbe. Concrètement, cela revient à approcher la courbe par un polygone dont les côtés sont de longueur $x$. Soit $N(x)$ ce nombre. On aurait envie de dire que la longueur de la courbe est de l’ordre de $L(x)=x.N(x)$ mais nous avons vu que $L(x)$ peut tendre vers l’infini quand $x$ tend vers 0. Il arrive assez souvent dans la pratique que $N(x)$ se comporte comme $x^{-d}$ lorsque $x$ tend vers 0 lorsque $x$ tend vers 0 pour un certain nombre $d$ [10]. On dit alors que $d$ est la dimension fractale de la courbe. Notons que $d$ n’est pas forcément un entier : pour une courbe tracée dans le plan, c’est un nombre compris entre 1 et 2. Plus la dimension fractale est proche de 1 et plus la courbe semble lisse et régulière.

Par exemple, pour notre île rouge, nous avons $N(3^{-n})= 12\times (4/3)^n$
c’est-à-dire $12 \times (3^{-n})^{- \frac{\ln(4)}{\ln(3)}}$ si bien que la dimension fractale est $d = \frac{\ln(4)}{\ln(3)}\simeq 1,26$.

Voici une autre courbe (dite « du dragon ») : pourrez-vous en deviner la dimension fractale ?

Des expériences numériques ont été faites sur un certain nombre de côtes sur Terre : une valeur typique de leur dimension fractale est 1,3 mais cela dépend bien sûr des côtes...

Supposons maintenant que l’altitude $h(x,y)$ soit un processus gaussien stationnaire dont la corrélation décroît comme $1-a . dist^{-2H}$. Que peut-on dire de la nature géométrique des lignes de niveau, c’est-à-dire les courbes sur lesquelles $h$ est une constante ? Eh bien, ce sont des courbes dont la dimension fractale est $2-H$ (si $H$ est compris entre 0 et 1).

Mais on peut aussi se poser d’autres questions sur les courbes de niveau. Considérons par exemple la loi expérimentale de Korcak (1938). Sur la Terre, comptons le nombre $I(x)$ d’îles dont la superficie est supérieure à un certain $x$. Comment se comporte cette fonction $I(x)$ quand $x$ tend vers 0 ? Le lecteur l’aura compris, $I(x)$ est de l’ordre de $x^{-k}$ pour une certaine constante $k$ dont on peut d’ailleurs montrer qu’elle est égale à $2(2-H)$.

Un théorème récent

Les applications de ce type sont nombreuses et vont bien sûr bien au delà de la topographie statistique : on rencontre ce genre de problèmes dans beaucoup de situations en physique, mais aussi en biologie. Voir par exemple cet article [11], à mi-chemin entre mathématique et physique.

A titre d’exemple, nous allons citer les résultats principaux d’un article [12] de P. Nolin téléchargeable ici et intitulé « Critical exponent of planar gradient percolation ».

Le problème étudié ne semble rien à voir avec la Lune ! mais le lecteur ne sera pas étonné, et saisira quand même une sorte d’analogie avec la discussion des reliefs aléatoires. C’est précisément ce genre d’analogies qui fait la force des mathématiques : une même méthode peut servir à beaucoup de problèmes, et la solution d’un problème rejaillit souvent sur d’autres problèmes apparemment bien éloignés.

Commençons par expliquer l’idée de la percolation. Partons par exemple d’un réseau hexagonal, comme en font les abeilles dans leurs ruches.

Choisissons une probabilité $p$ comprise entre 0 et 1. Pour chaque cellule, de manière indépendante, colorions-la en blanc ou en noir, avec une probabilité $p$ et $1-p$ respectivement. Un résultat fondamental de la théorie de la percolation affirme que si $p>1/2$, il y aura tant de cellules blanches qu’elles vont constituer une composante infinie, un continent blanc qui est parsemée d’îlots noirs. Voyons un exemple avec $p=0,7$.

Si $p<1/2$ c’est bien sûr le contraire qui se passe : on voit un continent noir contenant des îles blanches. Tout cela est bien connu des probabilistes.

Maintenant, considérons un grand « carré » formé de $N\times N$ hexagones : $N$ rangées horizontales de $N$ hexagones.
Nous allons remplir les cellules en noir ou en blanc, toujours de manière indépendante, mais avec une probabilité qui dépend de l’hexagone. Précisément, nous colorions en blanc avec une probabilité $k/N$ où $k$ est le numéro de la rangée où se trouve l’hexagone. Ainsi, les basses rangées auront tendance à être noires et les hautes rangées seront bien blanches. Que va-t-il se passer si $N$ est très grand ? On imagine une grande zone blanche (vers le haut), une grande zone noire (vers le bas), des îles blanches dans les ténèbres, et des îles noires dans la lumière.

La lumière et les ténèbres sont séparés par un terminateur, qui est dans ce cas une ligne polygonale, qu’on imagine située à peu près à mi-hauteur. Dans la figure qui suit, pour laquelle $N=50$, nous avons colorié en jaune la suite d’hexagones initialement blancs qui borde le continent blanc et en rouge le terminateur, qui sépare les deux continents.

JPEG

Ici, la même figure avec $N=300$.

JPEG

Voici le terminateur toujours pour $N=300$

JPEG

et un zoom :

JPEG

Nous pouvons énoncer maintenant le théorème principal de cet article :

Lorsque $N$ tend vers l’infini :

  • le terminateur s’écarte de la droite à mi-hauteur d’une distance de l’ordre de $N^{4/7}$. Notez que $N^{4/7}$ est petit par rapport à $N$ puisque
    $N^{4/7}/N= N^{-3/7}$ tend vers $0$ quand $N$ tend vers l’infini.
  • la longueur du terminateur est de l’ordre de $N^{10/7}$.

Il faudrait préciser ce qu’on entend par « de l’ordre de » mais le lecteur intéressé devra lire l’article ! Sur le site de V. Beffara on verra beaucoup d’images de simulations analogues.

Pas grand chose à voir avec la Lune ? Qui sait ? Mais la problématique générale est passionnante : comprendre l’interface entre deux milieux qui peuvent être le jour et la nuit, ou de l’eau de de l’huile, ou le yin et le yang !

La topographie de la Lune

Bien sûr, depuis Galilée notre compréhension du relief de la Lune s’est grandement améliorée. En 1994, la mission Clementine a permis de cartographier la surface lunaire, avec une précision de l’ordre de 100 m. Pour une description récente des connaissances actuelles, on pourra consulter cet article de M. Wieczorek de l’Institut de Physique du Globe de Paris. On pourra y trouver par exemple des graphiques décrivant la décroissance des covariances des altitudes en fonction de la distance entre les points d’observation. On pourra aussi y entrevoir toutes les difficultés numériques que ces calculs entraînent. Mais il ne faudrait pas restreindre ces difficultés à des « recettes de calculs numériques ». Voici un exemple de problème théorique engendré par ce type de mesure et discuté récemment : si on ne dispose que d’une carte d’un morceau de la Lune, est-il cependant possible d’avoir une « idée » de la décroissance des covariances sur toute la Lune [13] ? On comprendra que pour ce type de recherches, il faut être à la fois mathématicien, physicien et géologue...

Un défi pour le lecteur !

Reprenons une de nos surfaces aléatoires, éclairons-là par un Soleil rasant et observons le tout à la verticale pour voir le terminateur ou de manière rasante pour voir l’horizon.

Bien sûr, lorsqu’on observe le terminateur ou le bord du disque de la Lune, il faut tenir compte de la courbure de la Lune... Lorsque la courbure est grande par rapport à la distance typique entre deux montagnes, on peut penser que les montagnes voisines d’une montagne M donnée sont « en dessous » du plan tangent à la Lune au point M si bien qu’elles ne vont jouer aucun rôle dans le terminateur ou dans le bord du disque. Si la courbure est faible, tout se passe à peu près comme si on était dans un plan. Pour voir cet effet, on peut par exemple placer nos surfaces aléatoires sur un petit bout de sphère dont nous choisissons le rayon et nous pouvons observer.

Le rayon de la sphère pour l’image à gauche est le double du rayon pour l’image à droite.

Nous pouvons revenir à Galilée en lançant un défi mathématique à nos lecteurs. Partons d’une sphère, la Lune, et « habillons-la » avec un relief aléatoire dont nous supposons par exemple qu’il est gaussien et que nous en connaissons les caractéristiques, comme la covariance en fonction de la distance. Maintenant, observons le terminateur de cette Lune aléatoire ainsi que le bord de ce disque lunaire. Le lecteur pourra-t-il déterminer la dimension fractale de ces deux courbes ? Pourra-t-il confirmer l’observation géniale de Galilée que le terminateur est très irrégulier (grande dimension fractale) alors que le bord est très régulier (dimension proche de 1) ?

Voilà un joli problème de recherche mathématique pour les lecteurs de Images des Mathématiques, quatre siècles après Sidereus Nuncius ! Espérons qu’ils relèveront le défi !

Article édité par Étienne Ghys

Notes

[1Dans la pratique bien sûr, on n’utilise qu’un petit nombre de décimales, par exemple 12, si bien que tout cela revient à choisir un nombre entier compris entre 0 et $10^{12}-1$ (et à diviser ensuite par $10^{12}$ pour se ramener à l’intervalle $[0,1]$).

[2Le lecteur qui connaît un peu les logarithmes n’aura pas de mal à montrer que cet intervalle est très proche de l’intervalle
$[1-\ln(1/0,05)/N,1-\ln(1/0,95)/N]$, c’est-à-dire à peu près $[1-3/N,1-0,05/N]$.

[3Georges Olivierlien Bulletins et Mémoires de la Société d’Anthropologie de Paris lien Année 1991 lien Volume 3 lien Numéro 3-1-2 lien pp. 145-150, téléchargeable ici.

[4On demande également que toutes les « combinaisons linéaires » des $h(x_i,y_i)$ en un ensemble de points $(x_i,y_i)$ soient gaussiennes.

[5Notez que l’exposant $H$ n’est pas nécessairement un nombre entier. Il faut peut-être expliquer ici qu’il est possible de définir une puissance $x^y$ lorsque $x>0$ et $y$ est un nombre réel quelconque, pas forcément entier. En fait, on tient à préserver la relation $x^{y+z}=x^yx^z$ si bien que ceci implique que $x^{1/2}x^{1/2}=x^1= x$ et $x^{1/2}$ n’est donc rien d’autre que la racine carrée de $x$. Plus généralement, si $p,q$ sont deux entiers positifs, $x^{p/q}$ n’est autre que $\sqrt[q]{x^p}$ et il faut travailler (un peu) plus pour définir $x^y$ lorsque $y$ est irrationnel.

[6« Long Term Storage of Reservoirs », Transactions of the American Society of Civil Engineers 116 : 770-799. (1951) ; voir une description ici.

[7Benoît Mandelbrot, « Statistics Stochastic models for the Earth’s relief, the shape and the fractal », Proc. Nat. Acad. Sci. USA
Vol. 72, No. 10, pp. 3825-3828, October 1975, téléchargeable ici.

[8Maurice Fréchet, " Sur la loi de repartition de certaines grandeurs
geographiques
", J. Soc. Stat. Paris 82, (1941), 114-122.

[9Benoît Mandelbrot, « The Fractal Geometry of Nature », 1982, W. H. Freeman & Co. ISBN 0716711869.

[10Cela signifie que $N(x)x^d$ reste compris entre deux constantes positives quand $x$ tend vers 0.

[11M. B. Isichenko "Percolation, statistical topography, and transport
in random media
", Reviews of Modern Physics, 64:961–1043, October
1992.

[12Pierre Nolin, The Annals of Probability (vol. 36), 2008, N° 5, 1748-1776

[13M. A. Wieczorek et F. J. Simons, « Localized spectral analysis on the sphere », Geophys. J. Int., 162, 655-675, doi:10.1111/j.1365-246X.2005.02687.x, 2005. Téléchargeable sur le site de l’auteur.

Partager cet article

Pour citer cet article :

Étienne Ghys, Jos Leys — «Sidereus Nuncius... aujourd’hui» — Images des Mathématiques, CNRS, 2009

Commentaire sur l'article

Voir tous les messages - Retourner à l'article

  • Sidereus Nuncius... aujourd’hui

    le 21 septembre 2013 à 07:29, par Étienne Ghys

    Cher Damien,

    Merci pour ton commentaire et cette référence. Je vais regarder ça avec attention bien sûr.

    Cela dit, tu me parles de courbes de niveau d’un paysage (contour lines en anglais). C’est en effet dans le même esprit que la question que nous posons mais c’est assez différent quand même. Le terminateur est plutôt le contour apparent (je ne sais pas comment on dit ça en anglais), ce qui n’est pas tout à fait la même chose.

    Faut voir...

    Amitiés,

    Etienne

    Répondre à ce message

Laisser un commentaire

Forum sur abonnement

Pour participer à ce forum, vous devez vous enregistrer au préalable. Merci d’indiquer ci-dessous l’identifiant personnel qui vous a été fourni. Si vous n’êtes pas enregistré, vous devez vous inscrire.

Connexions’inscriremot de passe oublié ?

Dossiers

Cet article fait partie du dossier «Cartographie» voir le dossier
Cet article fait partie du dossier «Mathématiques de la planète Terre» voir le dossier