30 janvier 2009

0 commentaire — commenter cet article

Décrire l’évolution d’un nuage de points

Antonin Guilloux

Agrégé préparateur, École Normale Supérieure de Lyon. (page web)

L’objet de cet article est de décrire précisément (on pourrait dire mathématiquement) ce qu’on peut voir dans la série d’images ci-dessous (cliquer sur les onglets pour voir l’évolution) :

Commençons par décrire simplement ce qu’on voit. D’abord, on regarde une zone bien précise du plan : les points d’abscisse et d’ordonnée comprises entre -5 et 5. Dans cette zone, on voit de plus en plus de points à chaque nouvelle image, et on semble discerner une forme d’organisation de ces nuages de points.
Je dirais (mais je triche en connaissant le résultat) qu’on voit d’abord qu’il y a des zones dans lesquelles il n’y a aucun point. Ensuite, si on fait abstraction de ces zones, les points semblent s’accumuler près de l’origine, puis se répartir assez harmonieusement avec la règle que plus on s’éloigne de l’origine, moins il y a de points. Et cette répartition semble se confirmer quand le nombre de points augmentent.

Pour reprendre ces considérations avec un vocabulaire plus précis, nous avons un nuage de points qui évolue avec le temps et qui semble avoir une répartition asymptotique, c’est-à-dire que plus le temps passe, plus ce nuage semble s’organiser selon une loi précise.

Le but de cet article est d’abord d’expliquer quel est ce nuage de points, comment il évolue avec le temps. Ensuite de décrire cette loi selon laquelle il se répartit, et enfin de décrire ces zones interdites et leur évolution avec le temps.

Que voit-on ?

Le nuage de points est obtenu de la façon suivante : on choisit d’abord un point de départ (dans la série ci-dessus, le point de départ est le point de coordonnées $(1,\pi)$).

D’autre part on dispose d’un ensemble particulier de transformations du plan, affublées du nom barbare de transformations spéciales linéaires à coefficients entiers. Nous décrivons ces transformations ci-dessous. Les nuages sont alors constitués d’images du point de départ sous certaines de ces transformations, ce choix étant l’endroit où se cache le temps, donc l’évolution.

Mais commençons par décrire les transformations.


Les transformations linéaires du plan

Considérons quatre nombres entiers relatifs $a$, $b$, $c$ et $d$. Je définis une transformation du plan par la méthode suivante : à un point de départ de coordonnées $(x, y)$, j’associe le point de coordonnées $(ax+by, cx+dy)$. (Attention, ce n’est pas forcément inversible.)

Quelques exemples pour s’habituer aux formules :

  • si les nombres $(a,b,c,d)$ sont tous nuls, la transformation est très simple : on envoie tout point sur l’origine $(0,0)$ !
  • si ce sont les nombres $(1,0,0,1)$, alors l’image du point de coordonnées $(x,y)$ est le point de coordonnées... $(x,y)$. En bref, on ne fait rien. Cette transformation s’appelle donc l’identité.
  • pour les nombres $(-1,0,0,-1)$, le point de coordonnées $(x,y)$ est envoyé sur le point de coordonnées $(-x,-y)$. La transformation est là encore reconnaissable, c’est la symétrie centrale de centre l’origine :

La symétrie centrale

  • prenons-en une dernière : $(a,b,c,d)=(2,1,1,1)$. La transformation associée envoie le point de coordonnées $(x,y)$ sur le point de coordonnées $(2x + y, x+y)$ :

La transformation associée à $(2,1,1,1)$

Une question naturelle est de savoir si on peut inverser une telle transformation. C’est-à-dire s’il y a une autre de ces transformations qui fait l’inverse, qui ramène un point sur celui dont il venait. Un bon exemple vaut mieux qu’un long discours : considérons à nouveau la transformation associée aux entiers $(2,1,1,1)$ qui envoie le point de coordonnées $(x,y)$ sur le point de coordonnées $(X,Y)=(2x + y, x+y)$. Un rapide calcul permet de trouver son inverse : c’est la transformation associée à $(1,-1,-1,2)$. En effet, cette dernière transformation envoie le point de coordonnées $(X,Y)$ sur le point de coordonnées $(X-Y,2Y-X)=(x,y)$. On est bien revenu au point de départ !

La propriété cachée dans l’exemple ci-dessus est le fait que $ad-bc=1$. La quantité $ad-bc$ s’appelle le déterminant. Et vous pouvez vérifier le fait que si le déterminant $ad-bc$ vaut $1$, alors les transformations associées à $(d,-b,-c,a)$ et $(a,b,c,d)$ sont inverses l’une de l’autre [1].

Ca y est, nous avons nos transformations ! Les transformations spéciales linéaires à coefficients entiers sont les transformations associées à quatre entiers relatifs $(a,b,c,d)$ de déterminant 1. Cet ensemble de transformations est un objet bien connu en mathématiques ; on le note $\textrm{SL}(2,\mathbb Z)$.


Taille d’une transformation

Nous avons dit que le nuage de points à un instant donné est l’image du point de départ par certaines des transformations que nous venons de définir. Pour choisir quelles transformations on doit considérer, on va définir la taille de ces transformations. Et à l’instant $t$ (mesuré en secondes), le nuage de points sera l’image du point de départ sous toutes les transformations de taille plus petite que le nombre $t$.

Comment définir la taille d’une transformation, ou encore la taille d’un quadruplet $(a,b,c,d)$ d’entiers relatifs ? On utilise la norme euclidienne : la taille $T(a,b,c,d)$ du quadruplet $(a,b,c,d)$ est donnée par la formule $T(a,b,c,d)=\sqrt{a^2+b^2+c^2+d^2}$. Ce choix est un peu arbitraire, on pourrait choisir d’autres formules. Il est intéressant de noter que la valeur absolue de chacun des entiers $a$, $b$, $c$ ou $d$ est plus petite que la taille du quadruplet. Donc, il n’y a qu’un nombre fini de quadruplets de taille plus petite qu’un nombre $T$ fixé.

Cette dernière remarque indique que le nuage de points à l’instant $t$ est composé d’un nombre fini de points. C’est heureux, notamment c’est grâce à ça que nous avons pu en faire des dessins. On peut estimer le nombre de transformations spéciales linéaires à coefficients entiers de taille plus petite que $t$ : c’est de l’ordre de $t^2$, c’est à dire que la croissance est quadratique.


Choix d’un point de départ

Après avoir passé tant de temps à expliquer la procédure de construction du nuage, il est temps de se poser la question du point de départ. Dans ce paragraphe, on mentionnera deux notions un peu avancées : les couples d’entiers premiers entre eux et les nombres irrationnels. Mais on peut sans problème sauter ce paragraphe pour lire la suite en pensant au point de départ $(1,\pi)$.

Peut-on choisir le point de départ qu’on veut ? Essayons de regarder le nuage obtenu au temps 1000 avec comme point de départ $(1,0)$ :

JPEG - 10.7 ko
Ce nuage de points ne ressemble pas aux premiers.
Le point de départ est $(1,0)$ et le temps 1000

Manifestement, il ne se passe pas du tout les mêmes phénomènes. L’explication est très simple : les images possibles du point $(1,0)$ par une transformation spéciale linéaire à coefficients entiers sont des points à coordonnées entières. En effet, sous l’action de la transformation associée au quadruplet $(a,b,c,d)$, l’image du point $(1,0)$ est le point $(a,c)$. On peut même décrire toutes les images possibles : c’est exactement l’ensemble des points à coordonnées entières premières entre elles. Donc il est hors de question que le nuage de points construit à partir de $(1,0)$ se répartisse harmonieusement dans le plan. Il est contraint à rester dans les points à coordonnées entières.

Il se passera le même genre de phénomènes dès qu’on partira d’un point de coordonnées $(x,y)$ vérifiant soit que $x$ est nul soit que le nombre $\frac{y}{x}$ est un nombre rationnel. Pour le dire plus géométriquement, dès que la pente de la droite joignant ce point à l’origine est rationnelle (ou infinie). Prenons l’exemple du point $(\sqrt{\frac{1}{2}},\sqrt{\frac{1}{2}})$ : les coordonnées sont irrationnelles, mais la pente est $1$.

JPEG - 14 ko
Ce nuage non plus ne ressemble pas aux premiers.
Le point de départ est $(\sqrt{\frac{1}{2}},\sqrt{\frac{1}{2}})$ et le temps 1000

Mais concentrons-nous plutôt sur des points permettant de retrouver les propriétés de la première série. Ce sont les points de coordonnées $(x,y)$ telles que la pente $\frac{y}{x}$ est irrationnelle. C’est le cas du point $(1,\pi)$ que nous avions considéré. C’est aussi le cas du point $(1,\sqrt{2})$, qui donne la série :

Pourquoi un tel point est intéressant dans ce contexte ? Parce que si on regarde l’ensemble ses images par toutes les transformations spéciales linéaires à coefficents entiers, alors on peut en trouver aussi proches que l’on veut de n’importe quel point du plan. Cette propriété s’appelle la densité. Je vais essayer de l’énoncer autrement, en choisissant le point de départ $(1,\pi)$ pour fixer les idées. Disons que j’essaye, comme aux fléchettes, d’envoyer le point $(1,\pi)$ sur un point fixé $p$ du plan. Peut-être que je ne peux pas y arriver exactement. Par contre, si je me fixe une erreur admissible, aussi petite soit-elle, je vais arriver à une distance de $p$ plus petite que cette erreur :

Proposition : Pour tout point du plan $p$ et toute marge d’erreur $e$, il existe une transformation spéciale linéaire à coefficients entiers qui envoie le point $(1,\pi)$ presque sur le point $p$, avec une erreur au plus $e$.

Continuons à tourner autour de cette proposition. Elle dit que si je laisse évoluer mon nuage de points, je vais finir par remplir tout le plan, car je peux me rapprocher de n’importe quel point. Et ce qu’on essaye de décrire est de quelle manière a lieu ce remplissage. Par exemple, on constate sur les illustrations qu’on remplit plus vite près de l’origine que loin.

Répartition asymptotique des points

J’explique dans ce paragraphe comment décrire la répartition asymptotique des points. Le résultat est étonnamment récent pour un problème si concret : il date de 1999, et a été prouvé indépendamment par François Ledrappier et Arnaldo Nogueira. Ils font appel à des techniques différentes, mais profondes. C’est un bel exemple de théories mathématiques difficiles et abstraites qui ont des conséquences que l’on peut toucher du doigt sans être spécialiste.

On va maintenant regarder ce qui se passe dans un anneau limité par deux cercles de centre l’origine et de rayon $r_1$ et $r_2$. Sur l’illustration suivante, j’ai repris la dernière illustration de la première série, en ne dessinant que les points qui tombent dans l’anneau de rayons $0,3$ et $5$ :

PNG - 22.2 ko

Première information que nous donne le résultat de F. Ledrappier et A. Nogueira : la croissance du nombre de points dans l’anneau est linéaire au cours du temps. C’est-à-dire qu’à l’instant $t$, il y a de l’ordre de $t$ points dans l’anneau. Rappelons ici qu’il y a de l’ordre de $t^2$ transformations spéciales linéaires à coefficients entiers de taille inférieure à $t$, donc notre nuage de points complet contient de l’ordre de $t^2$ points. Mais comme on ne regarde que dans un domaine bien défini (l’anneau qu’on considère), on en rate beaucoup ; et même l’immense majorité.

Le théorème est beaucoup plus précis. Il dit que la densité du nuage près d’un point quelconque de l’anneau ne dépend que de la distance de ce point à l’origine : et même que la densité est directement proportionnelle à l’inverse de cette distance. Essayons d’expliciter cette phrase. Je choisis un point $p$ dans l’anneau, à distance $r$ de l’origine. Et à chaque instant $t$, je considère le rapport $r(t)$ entre le nombre de points du nuage qui sont à moins de, disons, 1 millimètre de $p$ et le nombre de points du nuage dans l’anneau. Ce rapport me donne la densité du nuage près du point $p$.
Et il existe une constante de proportionnalité $c$ positive telle que ce rapport $r(t)$ se rapproche de plus en plus de $c \times \frac{1}{r}$ quand le temps s’écoule : le rapport est proportionnel à l’inverse de la distance $r$.

Insistons sur le fait que cela ne dépend que de la distance du point à l’origine, et pas de la direction dans laquelle on regarde.

Diverticule dans la piste bleu : on peut prendre un mur rouge, si on connait un peu le changement de coordonnées polaires.

Nous venons de dire que, à une constante multiplicative près, la densité du nuage près d’un point à distance $r$ de l’origine est $\frac{1}{r}$. Le fait que ça ne dépende que de la distance à l’origine suggère de passer en coordonnées polaires. C’est-à-dire de repérer un point du plan non pas par ses deux coordonnées cartésiennes $(x,y)$, mais les deux paramètres suivants : la distance $r$ à l’origine et l’angle $\theta$ entre l’axe $(Ox)$ et la demi-droite $[O,p)$.

Les coordonnées polaires

Par cette opération, la représentation du nuage de points change. La série précédente des points à l’intérieur de l’anneau donne :

On constate que, mises à part les zones vides, les points semblent raisonnablement équirépartis, ou bien uniformément répartis : la densité du nuage est grosso modo partout identique. Et cette constation est (heureusement) justifiée par les mathématiques !

En effet, cela est dû au fait que le changement de coordonnées polaires ne conserve pas l’aire des ensembles du plan. L’aire d’un disque infinitésimal situé à distance $r$ de l’origine dans le plan est divisée par $r$ en coordonnées polaires. C’est la signification de la formule qu’on utilise régulièrement en classes préparatoires : \[dx.dy=r.dr.d\theta\]

Ainsi, fixons un instant $t$ et regardons ce qui se passe le long du cercle de rayon $r$. On peut le recouvrir par $(2000\pi)r$ petits disques de rayons $1$ millimètre comme au-dessus. Chacun de ces disques contient, à une constante multiplicative $C$ près, environ $\frac{1}{r}$ points du nuages. Donc au total, dans tous ces petits disques, on a \[(2000\pi)r\times \frac{C}{r} =2000\pi\times C \textrm{ points.}\]

Les chiffres exacts n’ont ici pas d’importance, seul compte le fait que le résultat ne dépend plus de la distance $r$ ! Ainsi, une fois passé en coordonnées polaires, le cercle de rayon $r$ devient le segment des points de coordonnées $(r,\theta)$, pour $\theta$ entre $-\pi$ et $\pi$ :

Image d’un cercle par le changement de coordonnées

Et les points du nuages proches de ce segment sont ceux qui étaient dans les petits disques : ils sont toujours $2000\pi\times C$, et ça ne dépend toujours pas de $r$ !
Ainsi, nous avons montré que la densité du nuage de points dans les bandes verticales ne dépend pas de la distance à l’origine. Comme la répartition asymptotique en coordonnées cartésiennes n’a pas de directions priviligiées, les lecteurs courageux montreront que la répartition asymptotique en coordonnées polaires ne dépend pas du paramètre $\theta$.

Et les trous ?

On vient de voir dans le paragraphe précédent que la répartition asymptotique ne dépend que de la distance à l’origine, pas de la direction dans laquelle on regarde. Bien, mais les zones sans points ? Expérimentalement, c’est-à-dire en regardant les illustrations, il semble par exemple clair que l’axe des abscisses est une direction particulière pour l’organisation du nuage de points. Comment réconcilier l’expérience et le théorème ?

Tout simplement en constatant qu’il ny a pas de contradictions entre les deux phénomènes. Tout réside dans les échelles de temps auxquelles on regarde. La répartition asymptotique décrit le comportement du nuage pour les temps qui deviennent infiniment grand. Sur les illustrations, on regarde l’évolution sur des temps forcément finis (ici jusqu’à 1000). En pratique, on commence à voir le nuage de points se conformer à la loi asymptotique, mais certaines zones sont plus difficiles à remplir, comme par exemple autour de l’axe des abscisses.

Pour comprendre cela, nous allons montrer qu’il y a à chaque instant une zone de sécurité autour du point $(1,0)$ dans laquelle le nuage ne peut pas rentrer et que cette zone s’amenuise au cours du temps.

D’abord nous avons besoin de comprendre comment les transformations spéciales linéaires à coefficients entiers transforment les longueurs. Le résultat suivant nous suffira :

Lemme : Soit $(a,b,c,d)$ un quadruplet d’entiers relatifs de déterminant $1$ - qui représente une trasformation du plan - et de taille $T=\sqrt{a^2+b^2+c^2+d^2}$. Considérons $(x,y)$ et $(s,t)$ deux points du plan à distance $l$ l’un de l’autre.

Alors la distance $l'$ entre leurs deux images $(ax+by, cx+dy)$ et $(as+bt, cs+dt)$ est comprise entre $\frac{l}{T}$ et $T\times l$ :
\[\frac{l}{T}\leq l'\leq T\times l\]

Autrement dit, ces transformations peuvent contracter ou dilater les distances, mais dans un rapport borné par la taille de la transformation. On peut voir ces possibilités de contraction ou dilatation sur les deux illustrations suivantes pour la transformation associée à $(2,1,1,1)$ qui est de taille $\sqrt{7}$ :

Une distance contractée

Le segment bleu est envoyé sur le segment rouge par la transformation associée à $(2,1,1,1)$.

Une distance dilatée

Le segment bleu est envoyé sur le segment rouge par la transformation associée à $(2,1,1,1)$.

Forts de cette information, nous allons trouver la zone de sécurité. On cherche à envoyer le point $(1,\pi)$ le plus près possible de $(1,0)$ avec une transformation $(a,b,c,d)$ de taille au plus $T$. Notons $l$ la distance entre l’image $(a+b\pi,c+d\pi)$ de $(1,\pi)$ et le point $(1,0)$. Rappelons nous que la transformation $(a,b,c,d)$ a un inverse et que c’est le quadruplet $(d,-b,-c,d)$. Par définition, cet inverse envoie le point $(a+b\pi,c+d\pi)$ sur le point $(1,\pi)$. De plus, elle envoie le point $(1,0)$ sur le point $(d,-c)$ :

Action de l’inverse

Le point rouge représente $(1,\pi)$ et le point bleu $(a+b\pi,c+d\pi)$.

Quelle est la taille de la transformation $(d,-b,-c,a)$ ? C’est le nombre $\sqrt{d^2+(-b)^2+(-c)^2+a^2}$ qui est égal à $\sqrt{a^2+b^2+c^2+d^2}$. C’est-à-dire qu’une transformation et son inverse ont la même taille ! On en déduit que la transformation $(d,-b,-c,a)$ est de taille au plus $T$, comme $(a,b,c,d)$. Donc on peut utiliser le lemme pour voir que la distance $l'$ entre le point $(1,\pi)$ et le point $(d,-c)$ est plus petite que $T\times l$ : \[l'\leq T\times l\]

D’autre part, $(d,-c)$ est un point à coordonnées entières. Or le point à coordonnées entières le plus près de $(1,\pi)$ est le point $(1,3)$. Donc la distance $l'$ entre $(1,\pi)$ et $(d,-c)$ est au moins $\pi -3$ : \[l'\geq \pi-3\]

Ainsi la distance entre $(1,\pi)$ et $(d,-c)$ est d’une part au plus $Tl $, et d’autre part au moins $\pi-3$. Cela mène à l’inégalité :

\[\pi-3\leq Tl\]

ou encore :

\[l\geq \frac{\pi-3}{T}\]

La voilà notre zone de sécurité : un point du nuage à l’instant $t$ est l’image du point $(1,\pi)$ par une transformation de taille inférieure à $t$. Sa distance au point $(1,0)$ est donc au moins $\frac{\pi-3}{t}$.

On peut faire ce raisonnement pour tout point de l’axe des abscisses , ce qui donne une zone de sécurité autour de cet axe. Dans l’illustration suivante, la zone de sécurité est au milieux des ceux courbes rouges. Ici on a zoomé dans le nuage de points de la première série à 100 secondes (attention aux échelles !) :

PNG - 2.8 ko
La zone de sécurité autour de l’axe des abscisses, au temps 100.

Notes

[1Les transformations de déterminant -1 sont aussi inversibles, d’inverse $(-d,b,c,-a)$. En revanche, si le déterminant n’est ni $-1$ ni $1$, il n’y a pas d’inverse dans les transformations considérées.

Affiliation de l'auteur

Soyez le premier à déposer un commentaire

Pour citer cet article : Antonin Guilloux, « Décrire l’évolution d’un nuage de points »Images des Mathématiques, CNRS, 2009.

En ligne, URL : http://images.math.cnrs.fr/Decrire-l-evolution-d-un-nuage-de.html

Si vous avez aimé cet article, voici quelques suggestions automatiques qui pourraient vous intéresser :