Le phénomène de Gibbs

Piste bleue Le 5 janvier 2017  - Ecrit par  Pierre-Antoine Guihéneuf Voir les commentaires (1)

Il y a quelques mois, je suis allé voir l’exposition Le triomphe de la couleur à Rio de Janeiro [1]. Voici une partie de la description disponible sur le site internet du musée d’Orsay :

L’exposition Le triomphe de la couleur, De Van Gogh à Matisse, les collections du musée d’Orsay et de l’Orangerie montre comment la couleur, à la fin du XIXe siècle, se libère de la réalité sensible avec l’application des théories scientifiques sur les complémentaires et le mélange optique. Lié à Seurat et Signac, Van Gogh adopte pendant son séjour à Paris en 1886-1887 le chromatisme pur et la division de la touche des peintres néo-impressionnistes.

Les impressionnistes, et leurs héritiers, ont donc recours à des techniques picturales nouvelles, pas forcément fidèles à la réalité, mais rendant compte du mouvement ou du relief. Par exemple, pour rehausser des contrastes, certains peintres utilisent le cloisonnisme, qui consiste à séparer les zones de couleur par des traits foncés. Des artistes comme Émile Bernard, Louis Anquetin, Paul Gauguin, Paul Sérusier, Paul Cézanne, Vincent Van Gogh ou encore Fernand Léger ont largement utilisé cette technique.

Lors de cette exposition, j’ai été surpris par un détail d’une toile d’Hippolyte Petitjean, intitulée Jeune femme debout.

JPEG - 59.1 ko
Hippolyte Petitjean, Jeune femme debout

On y voit clairement le bord gauche de la robe de la femme faire « vibrer » la couleur du mur beige en arrière-plan. Cette vibration est typique d’un phénomène bien connu en traitement de l’image : le phénomène de Gibbs.

JPEG - 9.5 ko
Zoom sur la partie de la toile en question

Mettez-vous dans la peau du peintre : vous voulez mettre en valeur un changement de ton, par exemple avec du beige à gauche et du violet à droite, comme sur la toile de Petitjean. Une technique consiste à exagérer artificiellement le contraste près de ce changement de ton. Vous pouvez par exemple mettre des touches de beige plus clair juste à gauche de l’interface entre le beige et le violet. Mais ce beige est trop clair par rapport à la réalité, et pour compenser vous allez peindre, juste à gauche de ces touches de beige clair, des touches de beige un peu plus foncé. Et ainsi de suite, le parti pris de ne peindre que par traits de pinceau relativement grossiers fait que les contrastes nets se mettent à vibrer, par des vagues alternant clair et foncé. Et ce phénomène peut s’observer chez d’autres peintres, pas forcément pointillistes : deux exemples ici, avec Claude Monet et Paul Cézanne.

JPEG - 184.1 ko
Claude Monet, extrait des Nymphéas, les deux saules
Une astuce pour bien voir le phénomène de Gibbs ici : se mettre assez loin de l’image, ou bien la regarder en posant son regard loin, pour la rendre un peu floue.
JPEG - 1 Mo
Paul Cézanne, Les Joueurs de cartes

Il se passe exactement la même chose avec les images numériques trop compressées (par exemples en JPEG) : lorsqu’on compresse une image, on demande à l’ordinateur de travailler avec une résolution grossière. Dans ce cas, l’ordinateur fait ce qu’il peut pour recréer, avec cette mauvaise résolution qu’il a à sa disposition, les interfaces contrastées éventuellement présentes dans l’image initiale. Et en général, la solution qu’il trouve est similaire à celle des peintres : il va faire apparaître des halos vibrants autour de ces interfaces. En traitement de l’image, ce phénomène est appelé suroscillation (ringing en anglais) ou bien phénomène de Gibbs.

PNG - 286.5 ko
Le phénomène de Gibbs en traitement de l’image
À gauche : image initiale. À droite : image correspondante compressée (« sous-échantillonnée »), où on n’a gardé qu’un petit nombre de coefficients de Fourier.

Et on n’a pas le choix : il a même été démontré qu’il est impossible d’éviter ce type d’artefacts. C’est une propriété inhérente à la reconstruction des séries de Fourier (la théorie mathématique des signaux périodiques, voir le bloc dépliant ci-dessous) de fonctions discontinues. En termes savants, il n’y a pas convergence uniforme des séries de Fourier tronquées vers le signal initial lorsque celui-ci présente des discontinuités [2]. Et ce sont ces mêmes séries de Fourier tronquées qui sont utilisées lors de la compression d’images JPEG (voir le bloc dépliant ci-dessous) ; le même type d’idées sert à la compression de sons comme avec le format MP3, où ce phénomène est appelé pré-écho.

Principe des séries de Fourier

(Les blocs dépliants sont plutôt en piste rouge contrairement à l’article en piste bleue.)

Commençons par le cas des sons. Toute note de musique est une vibration périodique de l’air, et la fréquence de cette vibration correspond à la hauteur de la note (par exemple, le la de référence a une fréquence de 440Hz). Mais tous les signaux périodiques ne sont pas identiques, par exemple les deux courbes suivantes, qui représentent des variations de la pression de l’air au cours du temps, correspondent à deux sons différents.

Parmi ces signaux périodiques, il y en a un privilégié, c’est le signal sinusoïdal :

Dans ce cas, la théorie de Fourier dit que toute note s’obtient comme la somme d’une sinusoïde de même fréquence que le son — dite fondamentale —, avec une somme de sinusoïdales dont les fréquences sont des multiples de celle du son initial — et ces sinusoïdales sont appelées harmoniques.

Toute note est donc caractérisée par la suite des intensités de chacune de ses harmoniques. Plus généralement, toute fonction périodique peut être décomposée en série de Fourier : une telle fonction $f$ s’obtient comme la somme de sinusoïdes de fréquences qui sont des multiples de la fréquence de $f$ [3]. La suite des intensités de ces sinusoïdes est appelée série de Fourier de $f$ et est notée $\hat f$.

GIF - 398.9 ko
Une très belle animation créée par LucasVB

Il se passe la même chose pour les images numériques : on peut rendre une telle image périodique en la recopiant à l’infini :

On peut donc décomposer cette « image infinie » en série de Fourier (en deux dimensions, la théorie est similaire).

Lien entre le format JPEG et les séries de Fourier

(Les blocs dépliants sont plutôt en piste rouge contrairement à l’article en piste bleue.)

Le JPEG (acronyme de Joint Photographic Experts Group) est une norme qui décrit un algorithme de compression et de décompression d’images numériques. Une caractéristique importante de ce format de compression est qu’il engendre des pertes d’information : une fois compressée puis décompressée, l’image aura perdu en qualité. L’idée principale du JPEG est de commercer par calculer la transformée de Fourier de l’image [4] : on voit l’image comme une fonction de l’ensemble des pixels de l’image vers l’ensemble des entiers entre 0 et 255 (pour une image codée sur 256 niveaux), et on calcule la transformée de Fourier discrète de cette fonction [5]. On décide alors de ne garder en mémoire qu’un petit nombre de coefficients de Fourier (on parle de sous-échantillonnage) [6]. L’idée derrière cette opération est que d’une part pour beaucoup d’images, il y a de grosses régions à teinte uniforme, qui sont donc très bien représentées par une petite quantité de coefficients de Fourier, et que d’autre part l’œil humain perçoit principalement les basses fréquences. Pour retrouver l’image initiale, on calcule la transformée de Fourier discrète inverse de ces coefficients de Fourier gardés en mémoire, et on espère que le résultat sera assez fidèle à l’image initiale. Pour plus d’informations concernant le JPEG, voir la page Wikipédia qui y est consacrée.

PNG - 14.2 ko
Phénomène de Gibbs pour le signal en créneau
On a beau augmenter la précision de l’approximation par les séries de Fourier tronquées, on aura toujours des artefacts près des discontinuités de la fonction. Ici, reconstructions aux ordres 10, 50 et 250 du signal en créneau.

À l’époque de ces peintures (la toile de Petitjean date de 1894), le phénomène de Gibbs était encore largement méconnu (il a été découvert par Henry Wilbraham en 1848 — mais la publication est passée complètement inaperçue à l’époque — puis redécouvert indépendamment en 1898 par John Willard Gibbs et étudié rigoureusement en 1906 par Maxime Bôcher). Le lien entre ce phénomène de Gibbs et les vibrations visibles sur certaines de ces toiles est permis par l’analogie avec le comportement des images numériques de mauvaise qualité, qui n’ont commencé à circuler qu’environ un siècle plus tard. Les peintres de cette époque étaient bien en avance sur leur temps !

Post-scriptum :

Je tiens à remercier les relecteurs de cet article : Romain Dujardin, alchymic666, janpol3, Serma, Eric Heurtain et Michaël Bages.

Article édité par Romain Dujardin

Notes

[1J’admets que c’est un peu paradoxal, pour un français, d’aller voir de l’autre côté de l’atlantique des peintures habituellement exposées à Paris !

[2Plus précisément, si $f$ est une fonction périodique discontinue en $x$ (mais, disons, continue par morceaux), alors il existe une suite de points $x_n$ tendant vers $x$ tels que si on note $f_n$ la série de Fourier de $f$ tronquée au $n^{\text{ème}}$ coefficient, alors la distance entre $f_n(x_n)$ et $f(x_n)$ reste supérieure à une constante dépendant uniquement du saut de discontinuité de $f$ en $x$.

[3En fait, cela n’est vrai que sous certaines conditions sur la fonction $f$, par exemple qu’elle soit assez régulière. Il y a aussi plusieurs types de convergence, la plus naturelle (pour le mathématicien) étant celle de la convergence quadratique, la plus forte celle de la convergence uniforme. Pour plus de précisions, voir la page Wikipédia sur les séries de Fourier.

[4En fait, de blocs de taille $8\times 8$ dans l’image, mais peu importe.

[5En fait, on calcule la transformée en cosinus discrète, car celle-ci permet d’éviter l’apparition de phénomène de Gibbs au niveau des bords de l’image !

[6Plus précisément, si $c_n$ est le $n^{\text{ème}}$ coefficient de Fourier, alors on va garder en mémoire le nombre entier $\lfloor c_n q_n \rfloor$, où $\lfloor x \rfloor$ désigne la partie entière du nombre $x$, et $q_n$ est un nombre entier choisi une fois pour toutes et commun à toutes les images. Pour la décompression, il suffit de diviser l’entier obtenu par $q_n$. Le lecteur attentif aura remarqué que la transformée de Fourier discrète est 2-dimensionnelle : l’indice $n$ est en fait un multi-indice constitué de 2 entiers, et les coefficients $q_n$ sont en fait les coefficients d’une matrice, appelée matrice de quantification, choisie de manière empirique.

Partager cet article

Pour citer cet article :

Pierre-Antoine Guihéneuf — «Le phénomène de Gibbs» — Images des Mathématiques, CNRS, 2017

Crédits image :

Image à la une - Image obtenue en enregistrant avec une qualité 0 en jpg avec le logiciel GIMP.
Hippolyte Petitjean, Jeune femme debout - http://art.rmngp.fr/fr/library/artworks/hippolyte-petitjean_jeune-femme-debout-louise-claire-chardon-devenue-mme-hippolyte-petitjean-en-1904_huile-sur-toile_1894
Claude Monet, extrait des Nymphéas, les deux saules - https://fr.wikipedia.org/wiki/Les_Nymph%C3%A9as#/media/File:Claude_Monet_-_The_Water_Lilies_-_The_Two_Willows_-_Google_Art_Project.jpg
Paul Cézanne, Les Joueurs de cartes - https://fr.wikipedia.org/wiki/Les_Joueurs_de_cartes_(C%C3%A9zanne)#/media/File:Paul_C%C3%A9zanne_082.jpg
Phénomène de Gibbs pour le signal en créneau - https://fr.wikipedia.org/wiki/Ph%C3%A9nom%C3%A8ne_de_Gibbs
img_16442 - https://fr.wikipedia.org/wiki/Signal_carr%C3%A9#/media/File:Formes_d%27onde.png
img_16444 - https://en.wikipedia.org/wiki/File:Fourier_transform_time_and_frequency_domains.gif
img_16445 - https://en.wikipedia.org/wiki/Claude_Shannon#/media/File:Claude_Shannon_07.jpg

Commentaire sur l'article

Laisser un commentaire

Forum sur abonnement

Pour participer à ce forum, vous devez vous enregistrer au préalable. Merci d’indiquer ci-dessous l’identifiant personnel qui vous a été fourni. Si vous n’êtes pas enregistré, vous devez vous inscrire.

Connexions’inscriremot de passe oublié ?

Suivre IDM