La géométrie derrière le théorème de Gauss-Lucas

Si nous faisions danser les racines ?

Un hommage à Bill Thurston

Piste noire Le 7 novembre 2012  - Ecrit par  Chéritat, Arnaud, Tan Lei Voir les commentaires (4)

Cet article tente de rendre un modeste hommage au géomètre légendaire Bill Thurston, disparu le 21 août 2012. Nous allons présenter quelques-unes de ses observations (visuelles bien entendu !) sur un théorème de Gauss (en 1836) et Lucas (en 1874).

L’article s’adresse aux lecteurs ayant déjà une certaine connaissance sur les notions de fonctions, dérivées, polynômes et nombres complexes.

Introduction

La dérivée d’un polynôme est encore un polynôme.
Par exemple pour P(x)=x4-7x2+3 on trouve P’(x)=4x3-14x.

Comment ça, mon polynôme a des racines ?
Les racines d’un polynôme P, ce sont les nombres complexes z solutions de l’équation P(z)=0. Voici quelques exemples : le polynôme z2-1 a deux racines : 1 et -1. Le polynôme z2+1 a deux racines : i et -i. Le polynôme z3 n’a qu’une racine : 0.

Factorisation totale. Il y a un théorème très utile, appelé LE théorème fondamental de l’algèbre (et parfois théorème de d’Alembert-Gauss), qui dit qu’un polynôme, qu’il soit à coefficients réels ou complexes, a toujours une racine complexe.
Une conséquence [1] est qu’un polynôme de degré m se factorise ainsi : P(z)=A(z-a1)…(z-am) où A et a1, … , am sont des nombres complexes. Il possède donc m racines, certaines pouvant se répéter comme dans P(z) = (z-1)(z-1)(z+2). Une racine qui se répète est appelée racine multiple.

Si P est de degré m, alors P’ est de degré m-1, donc il possède m-1 racines, qui peuvent très bien se répéter.

Y a-t-il une relation entre les racines complexes de P et celles de P’ ?
Si w est une racine multiple de P, alors c’est une racine de P’.
Si le degré de P est égal à deux, alors la racine de P’ est le milieu du segment reliant les deux racines de P (et si P a une racine double, c’est aussi la racine de P’).
Si P est de degré 3, il y a également une caractérisation géométrique des racines de P’, nettement plus élaborée.

Dans le cas général, il n’y a pas de réponse simple, mais on a le joli théorème suivant :

Théorème de Gauss-Lucas, version classique. Pour tout polynôme P (de degré un ou plus), l’enveloppe convexe des racines de P contient les racines de P’.

D’après Wikipedia, ce résultat est utilisé de façon implicite en 1836 par Carl Friedrich Gauss et prouvé en 1874 par Félix Lucas.

Un peu de géométrie sur le plan complexe (cliquez pour déplier).

Le plan complexe est une représentation géométrique de l’ensemble des nombres complexes [2], où un point de coordonnées (x,y) correspond au nombre complexe x+iy.
Un nombre complexe $a$ représente également le vecteur de 0 à $a$. Ce vecteur
peut être déplacé parallèlement partout dans le plan. Ainsi un nombre complexe
de la forme $a-z$ représente à la fois le vecteur de 0 à $a-z$ et le vecteur parallèle
de $z$ à $a$.

Qu’est-ce qu’une enveloppe convexe ? On peut imaginer un terrain avec un certain nombre d’arbres, qu’on veut entourer par un ruban le plus court possible. Le terrain entouré est l’enveloppe convexe de ces arbres. Certains arbres touchent le bord. D’autres (peut-être) sont à l’intérieur du terrain. Ce terrain est en particulier convexe, au sens où il contient le chemin droit reliant n’importe quel couple de ses points. L’enveloppe convexe est un polygone et inclut sa frontière et ses sommets.

Il existe au moins deux autres définitions équivalentes de l’enveloppe convexe d’une collection finie de points : d’une part c’est l’intersection de tous les demi-plans contenant tous les points ; d’autre part c’est l’ensemble des barycentres des points à coefficients positifs ou nuls.

Nous vous avons mijoté un exemple particulier : $P(z)=(z^2+2)(z-4)^2$. Il se factorise ainsi : $P(z) = (z+i\sqrt2)(z-i\sqrt2)(z-4)(z-4)$ et se développe ainsi : $P(z)=z^4-8z^3+18z^2-16z+32$. Sa dérivée $P'(z) = 4z^3-24z^2+36z-16$ se factorise ainsi : $P'(z)=4(z-1)(z-1)(z-4)$. L’enveloppe convexe des racines de $P$ est le triangle de sommets $i\sqrt2$, $-i\sqrt2$, $4$ et les racines de $P'$ sont $1$, $1$ et $4$, qui sont bien dans l’enveloppe convexe, la dernière étant pile sur un sommet.
Dans l’image ci-dessous, nous avons figuré les racines de $P$ comme des arbres et fait appel à des moutons pour celles de $P'$. Le bord de l’enveloppe convexe correspond à la clôture orange (l’épaisseur des arbres nous a obligés à la décaler légèrement).

Dans l’applet ci-dessous, vous pouvez vous amuser à déplacer les racines de P, voir varier leur enveloppe convexe et les racines de P’, et constater que ces dernières restent sagement dans leur enclos. Les racines de P sont les petits carrés rouges, celles de P’ sont les points noirs, et le bord de l’enveloppe convexe est constitué des segments orange.
Essayez également d’ajouter/retirer des racines avec le click droit ou ctrl-click.

Une preuve classique du théorème de Gauss-Lucas

Si on dérive $P(z)=A(z-a_1)\cdots(z-a_m)$, on trouve que
P’ est la somme pour j allant de 1 à m des produits $A(z-a_1)\cdots(z-a_m)$ dont on a retiré le facteur $(z-a_j)$ :
\[P'(z) = \sum_{j=1}^m \frac{P(z)}{z-a_j}\ .\]
Autrement dit
\[\frac{P'(z)}{P(z)}=\frac{1}{z-a_1}+\cdots + \frac{1}{z-a_m}\ .\]
À partir de là il y a plusieurs façons de procéder. Celle que nous présentons a une saveur géométrique et un rapport avec la suite.

Rappelons la méthode pour calculer l’inverse d’un nombre complexe $z$ : si $z=x+iy$, alors son module $|z|$ est $\sqrt{x^2+y^2}$ et son conjugué $\bar z$ est $x-iy$. On a la relation $z\bar z=|z|^2$, ou encore, $\frac1z=\frac{\bar z}{|z|^2}$ si $z$ est non nul.

L’équation citée plus haut se traduit alors ainsi :
\[\frac{P'(z)}{P(z)}= \frac{\overline{z-a_1}}{|z-a_1|^2}+\cdots+\frac{\overline{z-a_m}}{|z-a_m|^2} \ .\]

Pour des raisons pratiques, on passe au conjugué dans l’équation plus haut puis on multiplie par -1. On obtient :
\[-\overline{\, \frac{P'(z)}{P(z)}\,}= \frac{a_1-z}{|z-a_1|^2}+\cdots+\frac{a_m-z}{|z-a_m|^2} \ .\]
Si z est une racine de P’ et pas de P alors P’(z)/P(z) = 0 donc
\[ \frac{a_1-z}{|z-a_1|^2}+\cdots+\frac{a_m-z}{|z-a_m|^2} =0\ .\]

Comme les $ \frac{1}{|z-a_k|^2}$ sont des nombres réels positifs,
chaque terme de cette somme est un vecteur qui pointe dans la direction de z vers l’un des $a$j. Si z était en dehors de l’enveloppe convexe, tous ces vecteurs seraient non nuls et pointeraient dans un même cône, comme sur l’image ci-dessous. Leur somme ne pourrait pas être nulle, ce qui contredirait l’équation. C’est donc que la racine z de P’ est dans l’enveloppe convexe des racines $a$j de P.

Variante de la preuve

De l’équation précédente on déduit :
\[ \sum_{j=1}^m \frac{z}{|z-a_j|^2} = \sum_{j=1}^m \frac{a_j}{|z-a_j|^2}\ .\]
Donc
\[ z \sum_{j=1}^m \frac{1}{|z-a_j|^2} = \sum_{j=1}^m a_j \frac{1}{|z-a_j|^2}\ .\]
Si on note $b_j = \frac{1} {|z-a_j|^2}$, alors on reconnaît la formule du barycentre :
\[ z = \frac{\sum b_j a_j}{\sum b_j}\ .\]

Or un barycentre à coefficients positifs est toujours dans l’enveloppe convexe.

Au bord de l’enveloppe convexe, un petit exercice...

Si on regarde de près la preuve, elle indique également
si une racine de P’ peut être au bord de l’enveloppe
convexe des $a$j. Attention, il y a deux cas à considérer. Pouvez-vous trouver l’énoncé et le démontrer ?
Est-ce confirmé par l’applet ci-dessus ?

Astuce ou raison ?

L’astuce de calcul consistant à diviser par P pourra apparaître, selon la personne, comme une étrangeté ou une évidence. Certains, quand ils voient une preuve élémentaire mais basée sur une astuce la jugent insatisfaisante : à quoi bon démontrer sans expliquer ? Le problème c’est que la notion même d’expliquer est très subjective. Untel qui aime les manipulations algébriques la trouvera très ludique. Tel autre tentera d’en donner une version géométrique, éliminant les calculs au maximum. Nous présentons en fin d’article la preuve de Bill Thurston, maître en la matière.

Ci-dessous nous donnons une interprétation géométrique du nombre complexe $-\overline{\,\frac{P'(z)}{P(z)}\,}$ apparaissant dans la preuve précédente. Nous allons considérer notre polynôme P sous un angle différent, c’est-à-dire
comme une application ou une transformation du plan complexe [3].
Pour cela imaginons un premier plan complexe (le plan de départ) comme une feuille de papier calque élastique, puis un deuxième plan complexe (le plan d’arrivée) comme une feuille de papier habituelle. À chaque nombre complexe z dans le plan de départ, on associe le nombre complexe P(z) dans le plan d’arrivée. Le premier est appelé antécédent du second et ce dernier image du premier. On dit aussi que P ’envoie’ z sur P(z).

On peut donc imaginer que P prend le premier plan et tente de le transformer pour couvrir le deuxième plan, de sorte que chaque point z se trouve pile au-dessus du point P(z)
 [4].

Imaginons un motif dans le plan d’arrivée constitué de demi-droites issues de l’origine, que nous appelons des rayons droits. Imprimons ce motif sur le plan élastique de départ déformé par P. Puis décalquons. Cela donne une figure sur le plan de départ,
indiquant les antécédents des rayons droits. L’exemple
ci-dessous illustre le cas d’un certain polynôme de degré 4. Nous obtenons des courbes et quand elles sont parcourues par z alors P(z) se déplace le long d’un rayon droit. Nous les appelons courbes radiales. Notons qu’un nombre fini d’entre elles se brisent, précisément aux racines de P’. Elles sont figurées en bleu sur le dessin. Les autres plongent vers l’une des 4 racines.

Lemme de la courbe radiale. Le vecteur $ -\overline{\,\frac{P'(z)}{P(z)}\,}$ basé en z est tangent à la courbe radiale passant par z, et orienté dans le sens où P(z) se rapproche de 0.

(Un lemme est souvent un énoncé auxiliaire servant à préparer la démonstration d’un résultat plus important ; cela ne veut pas dire que le lemme est en soi sans intérêt).

Preuve abrégée du lemme

Un petit déplacement dz de z induit un déplacement de P(z) d’environ P’(z)×dz. Le vecteur -P(z) est tangent au rayon droit passant par P(z) et pointe vers 0. Si z se déplace sur une courbe radiale de façon à ce que P(z) se rapproche de 0, alors P’(z)×dz pointe dans la même direction que -P(z). Donc dz pointe dans la même direction que -P(z)/P’(z), donc dans la même direction que $ -\overline{\,\frac{P'(z)}{P(z)}\,}$ en se rappelant que pour tout nombre complexe $w$ non nul, les vecteurs $\overline{1/w}$ et $w$ pointent dans la même direction.

Variante

Si vous connaissez le logarithme complexe, vous aurez reconnu que P’/P est la dérivée de log(P). Les courbes radiales pour P correspondent aux horizontales pour log(P). Donc si z se déplace d’une petite quantité dz sur une courbe radiale de façon à ce que P(z) se rapproche de 0, la quantité
dz×P’(z)/P(z) devrait être un nombre réel négatif, sous la forme -r par exemple. Du coup
le déplacement dz est sous la forme -rP(z)/P’(z). Ce dernier pointe dans la même direction que -P(z)/P’(z), qui est la même que $ -\overline{\,\frac{P'(z)}{P(z)}\,}$.

Gauss-Lucas et les courbes radiales

On peut choisir un sens de parcours des demi-droites issues de 0 : celui se dirigeant vers 0. Cela induit un sens de parcours des courbes radiales : celui pour lequel P(z) se dirige vers 0. Considérons maintenant une courbe radiale, un point z dessus et la droite
tangente en z à la courbe. On appellera demi-tangente la moitié de cette droite, démarrant en z et dirigeant dans le sens de parcours de la courbe.

La preuve du théorème de Gauss-Lucas donne alors un résultat intéressant :

Théorème de Gauss-Lucas, version radiale. Soit P un polynôme complexe non-constant. Alors les demi-tangentes aux courbes radiales rencontrent toutes l’enveloppe convexe des racines de P.

Vous remarquerez dans cet énoncé une petite manie des mathématiciens. En effet si z est dans l’enveloppe convexe, il est évident que la tangente en z passe dans l’enveloppe, puisqu’elle passe par z ! L’énoncé est donc complètement inintéressant dans ce cas, et on aurait donc pu supposer dès le départ z en dehors... Mais on a trouvé plus élégant de faire l’économie de cette hypothèse.

Dans l’applet ci-dessous, qui reprend l’illustration précédente, vous pouvez déplacer la souris et voir se dessiner en rouge la demi-tangente aux courbes radiales, partant du point indiqué par le curseur (le reste de la droite tangente est dessiné en plus pâle). Nous avons également ajouté en orange le bord de l’enveloppe convexe des racines de P. Vous constaterez que les demi-droites rouges traversent toutes le triangle.

Un demi-plan suffit pour tout recouvrir

Nous avons jusqu’ici réussi à visualiser à la fois l’énoncé et la preuve
du théorème de Gauss-Lucas. Que peut-on dire de plus ?

En fait nous ne sommes qu’à la moitié de notre histoire, ce théorème
nous cache encore des facettes bien fascinantes. Par exemple il peut
s’énoncer sans même mentionner les racines du polynôme en question.
Est-ce que vous nous croyez ?

Notons encore P un polynôme complexe non-constant.
Le théorème fondamental de l’algèbre dit que P admet
au moins une racine, ou encore, de notre point de vue géométrique,
le point 0 admet au moins un antécédent par P.

Soit v un nombre complexe quelconque. Vous remarquerez qu’une solution
de l’équation P(z)=v est aussi une solution de l’équation P(z)-v=0, ou encore
une racine du nouveau polynôme P(z)-v. D’autre part P(z)=v s’interprète géométriquement comme z étant un antécédent de v par P.

En appliquant le théorème fondamental de l’algèbre à P(z)-v pour tout v parcourant le plan complexe, on peut conclure que tout point v admet au moins un antécédent par P. Autrement dit, P arrive à recouvre tout le plan d’arrivée avec la feuille calque du plan de départ.
On dit alors que P est surjectif sur le plan du départ.

L’air de rien, le théorème de Gauss-Lucas indique une économie sur la région suffisante à recouvrir le plan d’arrivée tout entier :

Théorème de Gauss-Lucas, version surjective. Un polynôme non-constant P est surjectif sur tout demi-plan (frontière comprise) qui rencontre des racines du polynôme dérivé P’.

Preuve.

On procède par absurde à l’aide de la version classique. Soit F un demi-plan rencontrant au moins une racine (disons c) de la dérivée P’ tel que son image par P ne couvre pas tout le plan d’arrivée. Il manque par exemple un point v. Les racines du polynôme Q(z)=P(z)-v sont donc toutes en dehors de F. Leur enveloppe convexe est donc disjointe de F. Or d’après la version classique du théorème de Gauss-Lucas (appliquée cette fois-ci au polynôme Q), le point c qui est aussi une racine de la dérivée Q’, se trouverait dans cette enveloppe, donc pas dans F. On obtient une contradiction.

On peut aussi redémontrer la version classique à partir de la version surjective (on dit alors que ces deux énoncés sont équivalents). Le détail est laissé au lecteur
comme un petit exercice...

Vous avez bien vu qu’il n’est plus question de parler des racines de P !

Et si on faisait danser les racines ?

Dans la preuve précédente, on a considéré les solutions de P(z)=v, ou encore les racines de P(z)-v. On peut se demander comment ces solutions bougent quand v change. C’est l’objet de l’applet ci-dessous. À gauche, l’ensemble de départ (le plan où vit le nombre complexe z). À droite, celui d’arrivée (le plan où vit le nombre complexe v). Le polynôme P envoie les points à gauche sur des points à droite. Déplacez le curseur dans le plan de droite et voyez valser les racines de P(z)-v.

Code :

  • la croix orange à droite est v, elle suit le curseur,
  • les croix orange à gauche sont les racines de P(z)-v,
  • les points noirs à gauche sont les racines de P’ (ils sont réglables),
  • les points noirs à droite sont les images par P des points noirs à gauche.

$\ $

Une région encore plus économique pour couvrir le plan ?

Ainsi, si l’on veut couvrir le plan d’arrivée tout entier avec un demi-plan contenant le moins de points possible, il faut prendre un demi-plan qui ’touche’ tout juste
l’enveloppe convexe des racines du polynôme dérivé P’.

Pour être encore plus économe, il serait intéressant de trouver une région D en un seul morceau (ou bien une région connexe comme disent les mathématiciens) sur laquelle l’image de P couvre chaque point du plan d’arrivée une et une seule fois. On dit alors que P est bijectif sur D. Pour être plus précis, on voudrait que D comprenne la région, appelée intérieur, délimitée par des morceaux de courbes qui forment ce qu’on appelle sa frontière, ainsi qu’une partie de ces courbes (mais pas tout !).

Le résultat suivant, qui est plus puissant que le théorème de Gauss-Lucas classique, nous a été communiqué par Bill Thurston en janvier 2011. Nous ne l’avions jamais vu ailleurs :

Théorème de Gauss-Lucas-Thurston, version bijective. Soit P un polynôme non-constant. Soit F un demi-plan posé sur l’enveloppe convexe des racines du polynôme dérivé P’ et extérieur à ces racines. Il y a sur la droite délimitant F une ou plusieurs racines de P’. Soit c l’une d’entre elles. Alors dans F on peut trouver une région connexe DF sur laquelle P est bijectif, et dont l’intérieur est envoyé par P sur un plan privé d’une demi-droite issue de P(c).

Il n’est pas si difficile de trouver des régions bijectives, et on a un large choix sur la forme de l’image par P de leur intérieur. L’intérêt du théorème est qu’il situe certaines de ces régions, d’image un plan moins une demi-droite, dans les demi-plans F appuyés sur l’enveloppe des racines de P’. Sa preuve est également intéressante, en ce qu’elle consiste à appliquer le théorème de Gauss-Lucas non pas à P, mais à P’, et la version radiale qui plus est.

L’image suivante essaye d’illustrer le théorème. Le polynôme a degré 4. Les trois racines de P’ sont les sommets du triangle orange. Nous ne savons pas où sont les racines de P et, pour une fois, on s’en moque ! Le demi-plan F est délimité par la droite noire et s’appuie sur un des sommets, sans toutefois contenir le triangle. La région D est la zone contenue dans F et peinte avec les damiers noirs et verts. Sa frontière est la courbe rouge. Le polynôme P envoie la région D sur l’image de droite, l’intérieur est envoyé sur le plan privé de la demi-droite rouge. On a pris soin, pour z dans D ou sa frontière, de peindre z avec la même couleur que P(z). On peut s’imaginer que P prend la région D, la déforme pour recoudre la courbe rouge sur elle-même à partir du point de contact avec le triangle, de façon à obtenir le plan d’arrivée.

Une idée de la preuve du théorème

Commençons par une autre illustration de la même situation. L’enveloppe convexe des racines du polynôme dérivé P’ est représentée par un triangle blanc. On considère le même demi-plan F en bas à droite de la droite noire.

Pour mettre en lumière la preuve, on a illustré cette fois-ci des courbes radiales de P(z)-v pour un certain choix de v. Ces courbes ne sont rien d’autre que les antécédents par P des rayons droits du plan d’arrivée et coulant vers v.
Dans F on peut remarquer la présence d’un puits de ces courbes,
c’est-à-dire un antécédent de v. Appelons-le p.

La valeur v a été choisie de sorte qu’une des courbes radiales de p
’bute’ sur le sommet blanc c perpendiculairement à la droite noire, puis bifurque sur deux courbes tangentes à cette droite. On trouve de tels v sur une certaine demi-droite issue de P(c).

On peut constater sur l’image, et c’est là qu’il faut travailler pour le montrer, que les deux courbes brisées restent dans F sans traverser la barrière noire. Une fois ce fait établi, toutes les autres courbes radiales de p seront bloquées par ces deux-là et resteront dans F. On pourra alors prendre D comme la région dans F délimitée par ces deux courbes (en ne considérant qu’une des deux courbes comme
faisant partie de notre région). Le fait que ces courbes radiales sont complètes, c’est-à-dire que P envoie bien chacune sur la demi-droite issue de v toute entière, vient essentiellement du fait qu’elles ne rencontrent aucune racine de P’ (pour les plus curieux, signalons qu’on applique le théorème d’inversion locale et le fait que P(z) est grand quand z est grand). Il apparaîtra alors dans D une copie déformée mais conforme du plan d’arrivée muni des rayons radiaux coulant vers v.

Pour le plaisir, voici une mise en relief de notre région D. Elle n’est pas nécessaire à la compréhension de la suite.
 [5].

Esquissons à présent une preuve que ces deux courbes brisées restent dans F, en les suivant à rebours (vers l’infini). On va étudier dans quelle direction peuvent s’incurver les courbes radiales. Cependant, et de façon surprenante, on va appliquer la version radiale du théorème de Gauss-Lucas non pas à P, mais à P’.

Lemme : Appelons n le vecteur normal en un point z à une courbe radiale, et pointant dans le sens vers où s’incurve la courbe. Alors n fait un angle d’au moins 90° avec $-\overline{\frac{P''(z)}{P'(z)}}$.

Avant de démontrer ce lemme, voyons sur la figure suivante comment on peut l’utiliser pour en déduire le théorème :

Le polygone jaune est l’enveloppe convexe des racines de P’. On a dessiné des bouts de courbes et les normales correspondantes. Certains sont compatibles avec le lemme, d’autres pas. On a coché les premiers et biffé les seconds. La règle est la suivante : le vecteur n doit faire plus de 90° avec le vecteur $-\overline{\frac{P''(z)}{P'(z)}}$, qui lui-même doit appartenir au cône issu de z et contenant les racines. Pour 5 points z différents, on a représenté en rose les directions des vecteurs n autorisés par le lemme.

Parcourons maintenant une courbe radiale. Si on est arrivé en un point z où la courbe s’éloigne de la droite noire, alors en continuant de la parcourir dans le même sens, elle ne pourra plus jamais s’en rapprocher : sinon, elle devrait être à un moment parallèle à la droite noire, mais s’incurver vers elle. Le vecteur n serait perpendiculaire à la droite noire et orienté dans sa direction. Il ferait alors moins de 90° avec tous les vecteurs du cône, car ces derniers pointent tous vers l’enveloppe : contradiction. La preuve que les deux courbes radiales issues de c commencent dès le début à s’incurver vers F est quasiment la même. Ainsi les deux courbes en lesquelles se brise le rayon issu de v sont intégralement incluses dans F. Nous avons vu plus haut que cela suffit à prouver le théorème.

Notez qu’on n’a pas démontré que D est convexe, d’ailleurs ce n’est pas toujours le cas.

Il nous reste à démontrer le lemme.

Il y a une version de la preuve utilisant le calcul différentiel (niveau L3/M1), mais nous préférons présenter la vision géométrique qu’en avait Thurston. Attention, celle-ci requiert des notions de géométrie Riemannienne (pas étudiées à l’université avant le M1 ou M2 dans les cursus de mathématiques fondamentales).

L’idée est de considérer le plan de départ avec une autre métrique, en l’occurrence celle ’calquée’ par P de la métrique usuelle du plan d’arrivée. Ainsi un vecteur de longueur unité habituelle issu d’un point z a pour longueur |P’(z)| à présent. Du coup les courbes radiales de P(z)-v deviennent des géodésiques pour cette métrique.
En général une géodésique d’un point A à un point B n’est pas une ligne droite quand la métrique est variable, même quand A et B sont proches : elle a tendance à faire un détour par les endroits où le coefficient de la métrique est petit, car c’est plus économique, c’est-à-dire dans notre cas vers la partie où le module de P’ devient plus petit. Thurston disait que c’est comme à la plage : pour aller plus vite d’un endroit à un autre, il vaut mieux faire un détour vers le bord de la mer et marcher le plus longtemps possible sur du sable mouillé et dur. Ce détour fait que notre parcours s’incurve
dans le sens opposé à la mer. Donc le vecteur normal n de notre lemme doit orienter dans une direction où le module de P’ devient plus grand.

Et la version radiale du théorème de Gauss-Lucas, appliquée cette fois-ci au polynôme dérivé P’, montre que le module de P’ diminue dans n’importe quelle direction faisant moins de 90° avec $-\overline{\frac{P''(z)}{P'(z)}}$. Ainsi notre vecteur n doit éviter toutes ces
directions. Fin de la démonstration.

Puisque la seule contrainte sur la droite noire est qu’elle doit être posée sur le triangle blanc, on pourrait sans doute la faire pivoter autour du triangle. Que va-t-il se passer ?
Observez l’animation ci-dessous.

b)

Observez que D est toujours inclus dans F, bien qu’il ne soit pas toujours convexe.

Une preuve sans calcul ?

Pour terminer notre tour de visite du théorème de Gauss-Lucas, nous vous indiquons une autre preuve de la version classique de ce théorème. Elle nous a été proposée par Bill Thurston. Par rapport à la preuve présentée en début d’article, elle élimine les deux lignes de calcul de $P'(z)/P(z)$. Elle est donc encore plus géométrique !
Par contre, elle n’offre pas le raffinement de bijectivité. Comme certaines notions nécessitent une connaissance du cours de Calcul Différentiel en L3,
nous la présenterons sous forme d’une série d’exercices sans fournir tous les détails. Nous ne présenterons pas les illustrations non plus. Comme disait souvent le maître, il faut entraîner le muscle cérébral de notre imagination !

Soit $z$ un point hors l’enveloppe convexe des racines d’un polynôme $P$.

— Pour chaque racine $a_j$ de $P$, traçons la droite passant par $z$ perpendiculaire au segment $[z,a_j]$. La fonction distance $z\mapsto |z-a_j|$ a une dérivée directionnelle strictement positive dans n’importe quelle direction pointant
vers le côté opposé à $a_j$ de cette droite.

— Comme $z$ admet un cône visuel vers les racines $a_j$,
il existe une direction dans laquelle la dérivée directionnelle de $z\mapsto |z-a_j|$ est strictement positive pour toutes les racines $a_j$.

— Ceci implique que dans cette direction, la dérivée directionnelle de $ z\mapsto |P(z)|$ est aussi strictement positive, car $|P(z)|$ est le produit des $|z-a_j|$.

— $P'(z)$ est donc non nul.

Ceci démontre le théorème de Gauss-Lucas.

Et après ?

Nous sommes enfin arrivés à la fin de notre histoire. Mais la fin d’une histoire est peut-être le début d’une autre, n’est-ce pas ?

Derrière ce théorème ultra classique et innocent, il y a encore de multiples questions
dont on ne connait pas de réponses. Par exemple, malgré beaucoup de résultats partiels, on ne sait toujours pas bien localiser les racines de P’ par rapport à celles de P. Après tout l’enveloppe convexe des racines pourrait être un trop grand terrain pour cacher nos trésors...

Un autre problème intéressant est d’étudier l’intersection K, sur tout v possible, de l’enveloppe convexe des racines de P(z)-v. Elle doit contenir toutes les racines de P’, et par conséquent leur enveloppe convexe C. On aurait pu s’attendre à ce que K se réduise à C.
Mais des expériences numériques suivies des arguments rigoureux montrent que ce n’est souvent pas le cas !
Pour plus de détail, le lecteur est invité à consulter une discussion sur Mathoverflow [6].

Ce théorème est aussi lié à une conjecture d’Eduardo Casas-Alvero, formulée en 2001. Soit P un polynôme ayant une racine commune avec chacune de ses dérivées successives. Cette conjecture prédit que toutes les racines de P se confondent en un seul point. Voir par exemple cet article.

Post-scriptum :

La rédaction d’Images des maths et les auteurs remercient pour leur relecture attentive,
les relecteurs dont le pseudonyme est le suivant : Ilies Zidane, Paul Laurain et
Thierry Barbot.

Article édité par Alvarez, Aurélien

Notes

[1Ce n’est pas une conséquence immédiate : il faut utiliser un autre théorème, qui dit que si a est une racine de P, alors P(z)=(z-a)Q(z) où Q est un polynôme.

[2Si ce n’est déjà fait, nous recommandons vivement de regarder le chapitre 5 du DVD Dimensions de Jos Leys, Étienne Ghys et Aurélien Alvarez.

[3Vous pouvez consulter ce très bel article de Christian Mercat, ainsi que
les chapitres 5 et 6 du DVD indiqué ci-dessus.

[4Il se trouve que pour recouvrir le plan d’arrivée comme ce que fait le polynôme P on doit aussi faire appel aux ciseaux et colles, comme pour recouvrir les coins d’un livre.

[5Les ’piques’ hors cette région sont artificiels. Pour les experts, signalons que hauteur des reliefs a été choisie suivant une « représentation conforme » de cette région vers le disque unité.

[6attention aux notations, le polynôme $P(z)$ la bas pourrait désigner notre $P'(z)$ ici.

Partager cet article

Pour citer cet article :

Chéritat, Arnaud, Tan Lei — «Si nous faisions danser les racines ?» — Images des Mathématiques, CNRS, 2012

Crédits image :

Image à la une - Les images en 2D et 3D dans la preuve de bijectivité ont été produites par Jos Leys. Les applets Javascript ainsi que les autres images et animations ont été produits par Arnaud Chéritat.
Le logo de l’article est l’image 3D de Jos Leys.

Commentaire sur l'article

Voir tous les messages - Retourner à l'article

  • Si nous faisions danser les racines ?

    le 9 novembre 2012 à 20:59, par flandrin

    Votre article m’a entousiasmé.
    En proposant différents éclairages du théoréme vous illustrez
    bien la démarche mathématique qui consiste à généraliser .
    Que du plaisir .
    Continuez ainsi.

    Répondre à ce message

Laisser un commentaire

Forum sur abonnement

Pour participer à ce forum, vous devez vous enregistrer au préalable. Merci d’indiquer ci-dessous l’identifiant personnel qui vous a été fourni. Si vous n’êtes pas enregistré, vous devez vous inscrire.

Connexions’inscriremot de passe oublié ?

Dossiers

Cet article fait partie du dossier «Puissances et racines» voir le dossier