Images des maths 2004 0 commentaire

L’analyse multifractale des signaux

Le 15 octobre 2004, par Alain Arneodo et Stéphane Jaffard

L’analyse multifractale, née dans les années 80 pour expliquer les observations effectuées sur des signaux de turbulence, a fourni de nouveaux outils pour l’analyse et la modélisation de signaux issus de multiples domaines scientifiques. En mathématiques, elle a servi de cadre unificateur pour reconsidérer de nombreuses fonctions introduites au cours des 19e et 20e siècles. De nouvelles synergies sont ainsi apparues entre mathématiciens, physiciens et analystes du signal.

Au milieux des années 80, les premiers enregistrements très précis de la vitesse d’un écoulement turbulent tels que ceux obtenus dans la soufflerie de Modane (travaux de Gagne, Hopfinger et leurs collaborateurs) ont confirmé la très grande complexité de ces données expérimentales. Les mathématiciens ont l’habitude de considérer des fonctions partout irrégulières ; c’est le cas des fonctions de Weierstrass $$ W_{a,b} (x) = \displaystyle\sum_{n=1}^\infty a^n \sin (b^n x) $$ qui sont continues, mais nulle part dérivables si $0 <a<1 <ab$. Il en est de même pour le mouvement brownien. De telles fonctions présentent cependant une certaine forme de régularité : leur irrégularité est en fait partout la même. La théorie de la turbulence homogène et isotrope développée par Kolmogorov en 1941 se situe dans un tel contexte. Toutefois, les expériences récentes révèlent des déviations systématiques par rapport aux prédictions de cette théorie. Les signaux de vitesse turbulente semblent très irrégulièrs dans certaines régions et beaucoup moins dans d’autres, sans que l’on puisse clairement assigner de frontières à ces régions : au sein d’une zone plutôt régulière on voit des zones d’irrégularité et réciproquement, ce mélange apparaissant à toutes les échelles. Cette complexité « multi-échelle » fait incontestablement penser aux fractals. L’analyse multifractale est apparue en physique pour comprendre et analyser des fonctions aussi complexes et pour introduire de nouveaux paramètres quantitatifs permettant leur classification. En fait, c’est dans les différents modèles de cascade d’énergie proposés par Mandelbrot en turbulence pleinement développée que l’on trouve les prémices de l’analyse multifractale, formalisée en 1985 par Parisi et Frisch dans leur étude des données expérimentales. Parallèlement, Kadanoff et ses collaborateurs à l’université de Chicago ont jeté les bases de cette approche dans le cadre des mesures invariantes de systèmes dynamiques. Une fois les outils conceptuels et numériques mis en place, cette analyse s’est révélée pertinente dans d’autres domaines des sciences fondamentales et appliquées ; c’est le cas pour les diverses manifestations de la turbulence en hydrodynamique, chimie, optique ; mais il existe bien d’autres domaines où l’on observe des structurations dynamiques spatiales, voir spatio-temporelles complexes, très irrégulières relevant des concepts de fractals, ou de multifractals, en physique, géophysique, astrophysique, météorologie, chimie, ou encore biologie, écologie, économie, analyse et synthèse d’image, télécommunications,... Parallèlement à l’énergie déployée pour mettre en application cette nouvelle approche, les mathématiciens, eux, construisaient et analysaient de nombreux modèles de fonctions multifractales et, surtout, étudiaient la validité des méthodes numériques mises en œuvre pour caractériser les paramètres qui leur sont associés. Nous exposerons ces méthodes, nommées « formalisme multifractal », et nous donnerons un aperçu des résultats mathématiques que l’on peut obtenir. Nous illustrons notre propos de quelques applications concernant l’analyse des séquences d’ADN, de signaux de vitesse turbulents, de séries financières et d’images satellite de la structure des nuages.

Qu’est-ce que l’analyse multifractale ?

L’analyse multifractale a pour but l’étude de fonctions dont la régularié ponctuelle peut varier d’un point à un autre. Les premiers outils pour mesurer la régularité sont familiers à tous : continuité, dérivabilité en un point. L’exposant de Hölder introduit un continuum entre ces notions et permet de repérer précisément la régularité grâce à un paramètre réel positif : une fonction $f$ est $C^\alpha (x_0)$ s’il existe un polynôme $P$ de degré au plus $ [ \alpha ]$ tel que $$ | f(x) - P(x-x_0)| \leq C | x-x_0|^\alpha .$$ L’exposant de Hölder de $f$ en $x_0$ est alors $$ H_f (x_0) = \sup \{ \alpha : \; f \; \mbox{ est} \; C^\alpha (x_0) \} . $$ On a vu que l’on s’attend à ce que les ensembles « isohölder » $$ A_h = \{ x: \; H_f (x) = h \} $$ soient des fractals. Si tel est le cas, le paramètre naturel à déterminer est leur dimension de Hausdorff (encadré 1). Finalement, on cherchera donc à calculer la fonction $$ D (h) = dim (A_h) $$ appelée spectre de singularités de $f$. Réaliser l’analyse multifractale d’une fonction $f$, c’est déterminer son spectre de singularités. Avant de décrire comment calculer numériquement le spectre de signaux expérimentaux, mentionnons quelques fonctions mathématiques multifractales.

La dimension de Hausdorff

La notion de dimension de Hausdorff étend à des ensembles fractals (dont la dimension pourra être non-entière), la notion naturelle de dimension pour les courbes et surfaces régulières. Soit $A$ un sous-ensemble borné de $\rm I\kern-2pt R^d$. Une famille $R = \{ B_i \}_{i\in \rm I\kern-2pt N}$ d’ensembles $B_i \subset \rm I\kern-2pt R^d$ est un $\varepsilon$-recou- vrement de $A$ si $A \subset \displaystyle\bigcup B_i $ et $\forall i$, $ diam (B_i) \leq \varepsilon$. On note alors $ M_\varepsilon^\delta = \displaystyle\inf_{ R = \{ B_i \}} \sum \left( diam (B_i )\right)^\delta $, où l’inf est pris sur tous les $\varepsilon$-recouvrements. La dimension de Hausdorff de $A$ est alors $ dim (A) = \sup \{ \delta : \; \displaystyle\lim_{ \varepsilon \rightarrow 0} M_\varepsilon^\delta = + \infty \}$ On vérifie aisément que, suivant cette définition, la dimension d’une courbe régulière est 1, d’une surface régulière est 2, mais on peut ainsi obtenir des dimensions non-entières. Ainsi l’ensemble triadique de Cantor composé des nombres réels s’écrivant $\displaystyle\sum_{n=1}^\infty \frac{\varepsilon_n}{3^n}$, avec $\varepsilon_n \in \{ 0, 2\}$, a pour dimension $\log 2 / \log 3$.

Quelques fonctions multifractales

Bien sûr, la notion de fonction multifractale, introduite en physique au milieu des années 80, n’avait pas pu être utilisée auparavant par les mathématiciens. Mais, comme par anticipation, de nombreuses fonctions, qui se sont ensuite avérées être multifractales, ont été considérées depuis le début du 19e siècle. En général, il s’agissait d’exemples (ou de contre-exemples) ayant des propriétés particulières.

Ainsi, dès que Bolzano et Cauchy eurent, indépendamment, donné la définition mathématique précise d’une fonction continue, la question de l’existence de fonctions continues nulle part dérivables s’est naturellement posée. Le premier exemple d’une telle fonction a été construit par Bolzano lui-même en 1830 ; c’était une fonction en dents de scie, auquelles on superpose des dents de scie de plus en plus petites... Il s’agit probablement de la première fonction mathématique multifractale. Malheureusement pour Bolzano (mais, nous allons le voir, heureusement pour nous !), cet exemple est resté longtemps ignoré et Riemann mentionnait encore ce problème en proposant comme candidat possible la série trigonométrique $$ \sum_{n=1}^\infty \frac{\sin (\pi n^2 x)}{n^2} .$$ On sait maintenant que cette fonction est dérivable en certains rationnels ; par contre c’est un très bel exemple de fonction multifractale ; son spectre est la réunion du segment $D(h) = 4h -2 $ (pour $h \in [\frac{1}{2}, \frac{3}{4}] $) et du point $(h,d)= (\frac{3}{2}, 0)$.

Riemann, de nouveau, publiait en 1854 son fameux mémoire d’habillitation dans lequel est définie « l’intégrale de Riemann. On savait depuis Cauchy définir l’intégrale de fonctions continues par morceaux ; aussi, pour montrer que cette nouvelle intégrale généralise effectivement l’intégrale de Cauchy, Riemann propose l’exemple de la fonction $$ \sum_{n=1}^\infty \frac{S (nx)}{n^2},$$ où $S(x)$ est $x$ auquel on soustrait l’entier le plus proche de $x$. On vérife immédiatement que cette fonction est Riemann-intégrable et a cependant un ensemble dense de discontinuités ; elle n’est donc pas « Cauchy-intégrable ». Il s’agit ici encore d’une fonction multifractale ; son spectre de singularités est le segment $D(h) =h$ pour $h \in [0,1]$.

Mesure binomiale aléatoire

Cette mesure est construite récursivement sur l’intervalle $[0, 1]$ de la façon suivante. Soient $a \in ]0,1[$, $b =1-a$, et $p \in ]0,1[$. On tire au hasard $\mu ([ 0, 1/2]) =a$ ou $b$, avec probabilité respectivement $p$ et $1-p$, et l’on prend $\mu ([1/2, 1]) = 1-\mu ([ 0, 1/2])$ ; une fois la mesure d’un intervalle dyadique $\lambda$ déterminée, celle de son fils de gauche $\lambda'$ est de même tirée au hasard et vaut $\mu (\lambda ') = a \mu (\lambda )$ ou $(1-a) \mu (\lambda )$ avec probabilité respectivement $p$ et $1-p$ et celle de son fils de droite sera alors $ \mu (\lambda ) -\mu (\lambda ')$. On construit ainsi par raffinements successifs une mesure de probabilité aléatoire sur $[0,1]$ dont on peut faire l’analyse multifractale au sens suivant : l’exposant de Hölder d’une mesure $\mu$ en un point $x_0$ est défini par $$ H_\mu (x_0) = \displaystyle\liminf_{\delta \rightarrow 0} \frac{\log \mu ([x_0-\delta , x_0 + \delta])}{\log \delta}.$$ Le spectre de singularités est alors défini comme pour les fonctions. Le lien entre mesures multifractales et fonctions multifractales apparait en dimension 1 et lorsque $h <1$ : l’exposant de Hölder d’une mesure positive $\mu$ portée par $[0,1]$ coïncide avec l’exposant de Hölder de la fonction $f(x) = \mu ([0,x])$.

Plusieurs autres exemples, qui s’avèreront ultérieurement être multifractals, balisent l’histoire de l’analyse au 20e siècle. Les plus importants pour nous seront les cascades multiplicatives. L’exemple le plus simple en est la mesure binomiale, (encadré 2). Des mesure aléatoires généralisant cette construction furent proposées par Mandelbrot en 1974 pour modéliser l’intermittence de la dissipation d’énergie d’un écoulement turbulent. L’étude mathématique de ces mesures fût réalisée par Kahane et Peyrière dès 1976. Ultérieurement, des modèles de cascade de plus en plus généraux et complexes furent proposés et étudiés. Il est vraiment remarquable que ces modèles, véritables cas d’école introduits en turbulence avant la notion de multifractal, se soient ensuite avérés être des exemples naturels d’une théorie dont les premiers succès ont effectivement été enregistrés dans le contexte de l’analyse de signaux en turbulence pleinement développée.

Décomposition en ondelettes

Une fonction $\psi$ (régulière et bien localisée) engendre une base orthonormée d’ondelettes si les fonctions $ 2^{j/2} \psi (2^jx-k ) $ $ (j\in \mathbb{Z}, \; k \in \mathbb{Z})$ forment une base orthonormée de $L^2 (\mathbb{R})$.

Les coefficients d’ondelettes d’une fonction $f$ sont alors les $ C_{j,k} = 2^j \int f(x) \psi (2^j x-k) dx$ (attention au fait qu’on n’utilise pas la normalisation $L^2$). Le coefficient $ C_{j,k}$ contient une information sur le comportement de $f$ au voisinage de l’intervalle dyadique $\lambda$ ($= \lambda (j,k)$) $=[ \frac{k}{2^j}, \frac{k+1}{2^j}[$ près duquel l’ondelette est localisée. On note alors $D_\lambda$ les suprema locaux $D_\lambda = \displaystyle\sup_{ \lambda ' (j',k') \subset \lambda } \left| C_{j',k'} \right| $. Si l’ondelette $\psi$ est $C^r$, alors elle a ses $r$ premiers moments nuls : $ \int \psi (x) dx = \int x \psi (x) dx = \dots = \int x^r\psi (x) dx =0 $. Si $f$ se compose d’un comportement polynomial sur lequel est ajouté une fluctuation, les coefficients d’ondelette font donc automatiquement abstraction de ce comportement polynomial (figure 1 sur l’ADN où cette propriété, spécifique aux ondelettes, est exploitée). La théorie des bases orthonormées d’ondelettes est essentiellement due aux travaux de Meyer, Mallat et Daubechies.

Qu’est-ce que le formalisme multifractal ?

Le calcul numérique du spectre de singularités d’un signal est clairement impossible à effectuer directement à partir de la définition (le calcul d’un exposant de Hölder qui peut être partout discontinu est déjà complètement instable numériquement). Les bases du formalisme multifractal ont été introduites en 1985 par Parisi et Frisch dans le célèbre article où ils introduisent la notion même de multifractalité. Leur but était de calculer le spectre de singularités non pas directement à partir de sa définition, mais plutôt à partir de quantités auxiliaires facilement estimables numériquement. Ils proposaient de le faire à partir des fonctions de structure de la vitesse (normes $L^p$ des accroissements de la vitesse) qui, depuis l’article fondateur de Kolmogorov sur la turbulence (1941), étaient des quantités couramment utilisées. La variante que nous allons exposer est basée sur une décomposition par ondelettes de la fonction. Elle constitue la caution mathématique des méthodes numériques (MMTO, ou Méthode des Maxima de la Transformée en Ondelettes) développées au début des années 90 par Arneodo et ses collaborateurs. L’intérêt d’utiliser les ondelettes est multiple, tant au niveau pratique (fiabilité et efficacité de la méthode MMTO) qu’au niveau théorique (nous verrons qu’elles permettent notamment de définir de nouveaux espaces fonctionnels sur lesquels sont basés les résultats mathématiques récents concernant le formalisme multifractal pour les fonctions). Pour simplifier la présentation, nous nous restreignons ici à des fonctions définies sur $\mathbb{R}$.

Le formalisme multifractal est basé sur la proposition suivante qui relie la régularité ponctuelle aux suprema locaux $D_\lambda$ (encadré 3). Ce résultat est valable si $f$ est uniformément hölderienne, c’est-à-dire s’il existe $\varepsilon>0$ et $C>0$ tels que $$ \forall x,y \;\;\;\; | f(x) -f(y) | \leq C | x-y|^\varepsilon $$ (nous faisons cette hypothèse pour tous les résultats mathématiques qui suivent).

L’exposant de Hölder de toute fonction $f$ uniformément hölderienne est donné par

$$ H_f (x_0) = \liminf_{ j \rightarrow +\infty, \; \lambda \in 3 \lambda_j (x_0)} \frac{\log (D_{\lambda})}{ \log (2^{-j})}\label{1}$$

(ici $ \lambda_j (x_0)$ désigne l’intervalle dyadique de côté $2^{-j}$ contenant $x_0$ et donc $3 \lambda_j (x_0)$ représente cet intervalle ainsi que les deux intervalles adjacents de même longueur).

Les quantités « globales », calculables sur un signal seront les valeurs de la fonction d’échelle définie, pour tout $p \neq 0$, par $$\tau_f (p) = \liminf_{j \rightarrow +\infty} \frac{\log \left( \displaystyle \sum_{| \lambda | = 2^{-j}} | D_{\lambda}|^p \right)}{\log (2^{-j})},\label{2}$$

où $| \lambda |$ désigne la longueur de l’intervalle $\lambda$ (on peut montrer que la fonction $\tau_f (p)$ ne dépend pas de l’ondelette, suffisament régulière, choisie). Le formalisme multifractal peut être établi de la façon suivante : on interprète $\ref{2}$ par le fait que $$ \sum | D_{\lambda}|^p \sim 2^{ -\tau_f(p)j} .$$ Calculons la contribution à $\sum | D_{\lambda} |^p$ des intervalles dyadiques de côté $2^{-j}$ contenant un point où l’exposant de Hölder vaut $h$ ; d’après $\ref{1}$, on a alors $| D_{\lambda}| \sim 2^{-hj}$ et, par définition de la dimension, l’ensemble $A_H$ est recouvert par $\sim 2^{D(h) j}$ tels intervalles dyadiques. Cette contribution vaut donc $$ 2^{ (D(h) -ph)j} \label{3}.$$ La contribution dominante sera celle correspondant à un $h$ tel que l’exposant dans $\ref{3}$ est le plus grand possible. On s’attend donc à ce que $$ - \tau_f (p) = \sup_h (D(h) -ph ).$$ Comme $-\tau_f (p)$ est toujours une fonction convexe, si $-D(h)$ est également convexe, alors $-\tau_f $ et $-D$ sont des fonctions convexes conjuguées qui se déduisent donc l’une de l’autre par transformation de Legendre-Fenchel, ce qui signifie que $$D(h) = \inf_{p\in \mathbb{R}} (hp-\tau_f (p) )\label{4}$$ qui est la formule recherchée. Empressons-nous de dire que le raisonnement heuristique ci-dessus est loin d’être une démonstration mathématique. Le seul résultat démontré en toute généralité est une majoration du spectre valable pour toute fonction : $$ D(h) \leq \inf_{p\in \mathbb{R}} (hp-\tau_f (p) ). $$ Il existe de nombreux contre-exemples à $\ref{4}$, mais, en même temps, il est remarquable que cette formule s’avère être vérifiée pour de nombreuses fonctions et processus aléatoires. Aujourd’hui, le but principal des recherches mathématiques en analyse multifractale est de comprendre son domaine de validité. A titre d’exemple, nous allons maintenant exposer un résultat de validité « générique » du formalisme multifractal.

Prévalence, un « presque partout »

Dans un espace vectoriel $E$ de dimension finie, la notion naturelle de « presque partout » invariante par translation signifie « hors d’un ensemble de mesure de Lebesgue nulle ». On vérifie facilement que, dans un espace de Banach de dimension infinie, il n’existe pas de mesure de Lebesgue (c’est-à-dire de mesure qui soit invariante par translation et qui prenne des valeurs finies non nulle sur les bornés d’intérieur non vide). On tourne cette difficulté en remarquant que, si $E$ est de dimension finie, un borélien $A \subset E$ est de mesure de Lebesgue nulle si et seulement s’il vérifie la propriété suivante :

il existe une mesure de probabilité $\mu$ à support compact telle que $$ \forall x \in E \;\; \mu (x+A) =0.$$

Cette caractérisation en dimension finie est prise comme définition si $E$ est un espace vectoriel métrique complet de dimension infinie. Les ensembles $A$ vérifiant cette propriété sont dits timides. Le complémentaire d’un ensemble timide est dit prévalent. Par abus de langage, on dira qu’une propriété qui est satisfaite (au moins) sur un ensemble prévalent a lieu presque partout. Les résultats suivants montrent que la notion de prévalence est une bonne généralisation de la notion de « presque partout » pour la mesure de Lebesgue :

  • $A$ prévalent $\Longrightarrow $ $ \forall x \in E$, $ x+A$ prévalent.
  • $A$ prévalent $\Longrightarrow $ $A$ dense.
  • Une intersection dénombrable d’ensembles prévalents est un ensemble prévalent.

Validité prévalente du formalisme multifractal

Remarquons tout d’abord que, si $p$ est positif, la détermination de la fonction $\tau_f (p)$ revient à savoir si $f$ appartient ou non à certains espaces fonctionnels ; si $s \in \mathbb{R}$ et $p >0$, l’espace d’oscillations ${\cal O}^s_p$ est défini par $$ {\cal O}^s_p= \{ f : \;\; \forall j \geq 0, \; \;\; 2^{-j} \sum_{| \lambda | = 2^{-j}} | D_{\lambda} |^p \leq C 2^{-spj}\} \label{5}$$ calculer $\tau_f $ revient à écrire que

$$ f \in \bigcap_{ \varepsilon >0, \; p >0} { \cal O}^{\frac{\tau (p)+1}{p} - \varepsilon}_p \label{6}$$ et $$ f \notin \bigcup_{ \varepsilon >0, \; p >0} { \cal O}^{\frac{\tau (p)+1}{p} + \varepsilon}_p . $$

Notons ${ \cal O}^\tau$ l’espace défini par $\ref{6}$ ; c’est un espace vectoriel métrique complet. L’énoncé qui suit affirme que, au sens de la prévalence (encadré 3), presque toute fonction de ${ \cal O}^\tau$ est multifractale.

Presque toute fonction $f$ de ${ \cal O}^\tau$ a pour fonction d’échelle $$ \left. \begin{array}{rll} \tau_f (p) & = \tau (p) & \mbox{si} \;\; p >0 \\& = p \tau' (0) -1 & \mbox{si} \;\; p <0 \end{array} \right\}\label{7}$$ et satisfait le formalisme multifractal, c’est-à-dire vérifie $\ref{4}$.

Sans démontrer ce résultat, mentionnons seulement le rôle clé joué par les ondelettes : le formalisme multifractal relie le spectre (défini à partir de quantités locales, les exposants de Hölder) à la fonction d’échelle (qui décrit des propriétés globales d’appartenance à des espaces fonctionnels) ; or, les ondelettes sont actuellement le seul système de représentation d’une fonction qui permette à la fois de caractériser ces propriétés locales, ( cf.$\ref{1}$), et les espaces fonctionnels correspondants, (cf. $\ref{5}$).

La formule $\ref{1}$ appliquée aux fonctions d’échelle $\ref{7}$ fournit des spectres génériques qui ont une partie croissante concave puis valent $-\infty$. Le lecteur sera sans doute déçu de ne retrouver que la moitié gauche des courbes en $\cap$ typiques dans les applications (figure 2 par exemple). En fait, l’utilisation d’espaces vectoriels, nécessaire dans le cadre de la prévalence, interdit de prendre en compte des $p <0$ dans la définition de l’espace ${ \cal O}^\tau$. Or la partie décroissante du spectre est obtenue dans $\ref{4}$ quand l’inf est atteint pour des $p <0$. Le point de vue de la prévalence, par sa nature même, ne peut donner mieux. On ne sait pas si des spectres de singularités comme celui de la figure 2 peuvent être obtenus comme « spectres génériques » en un sens à préciser.

L’analyse multifractale dans les applications

Lorsqu’on souhaite réaliser l’analyse multifractale d’un signal particulier, on est confronté au problème suivant : le spectre ne peut pas être calculé directement à partir de sa définition et d’autre part, les résultats mathématiques garantissant la validité « générique » du formalisme multifractal sont impuissants à fournir un résultat pour une fonction particulière. Il y a donc un acte de foi à appliquer le formalisme multifractal, même si les résultats mathématiques nous garantissent qu’il faudrait jouer de malchance pour qu’il ne soit pas vérifié, au moins pour la partie croissante du spectre (c’est-à-dire tant que l’inf est obtenu dans $\ref{4}$ pour des $p$ positifs). Les figures 1 à 4 montrent quelques applications typiques de l’analyse multifractale effectuées avec la méthode MMTO où la fonction d’échelle est désormais notée $\tau (q)$, en suivant la nomenclature utilisée dans les articles originaux de Arneodo et al..

Figure 1 : analyse par ondelettes des séquences d’ADN

Une séquence d’ADN est formée d’une chaine dont chaque maillon est l’un des quatre acides nucléiques Adénine (A), Cytosine (C), Guanine (G) et Thynine (T). On lui associe une `marche ADN’ (c’est-à-dire une fonction de $\mathbb{R}^+$ dans $\mathbb{Z}$ constante entre deux entiers consécutifs) en incrémentant de +1 chaque fois que l’on rencontre une purine (A ou G) et de -1 chaque fois qu’on rencontre une pyrimidine (C ou T). En (a) est représenté la marche ainsi obtenue pour la séquence du bactériophage $\lambda$. En (b) est ilustrée la représentation espace-échelle fournie par la transformation en ondelettes continue en utilisant une ondelette analysatrice ayant deux moments nuls. On analyse ce signal à des échelles $\geq 10 $ nucléotides pour que les effets dus au caractère discret de la marche disparaissent. A très grande échelle, le signal est clairement affine par morceaux à cause de la composition hétérogène des génomes ; l’utilisation d’ondelettes ayant au moins deux moments nuls est donc nécessaire pour s’affranchir de ces tendances ; comme l’illustre la coupe (c) effectuée à l’échelle $\sim 400$ nucléotides, l’analyse par ondelettes permet alors d’étudier les propriétés d’invariance d’échelle des génomes.

Figure 1 (suite)

La figure (a) représente (cercles) la fonction d’échelle du bactériophage $\lambda$, et (triangles)\\ la fonction d’échelle, moyennée sur 2184 séquences, d’introns (partie ne codant pas pour les protéines) humains ; la figure (b) représente les spectres de singularités $ D(h)$ correspondants calculé par transformée de Legendre. On voit que les signaux correspondants ne présentent qu’un seul exposant de Hölder $h \sim 0,6$ pour les introns, comme s’il s’agissait d’une fonction de Weierstrass, ou d’un mouvement brownien fractionnaire corrélé à longue portée. On a en fait pu mettre en évidence des corrélations de ce type dans toutes les séquences d’ADN d’organismes Eucaryotes (cellules possédant un noyau). Celles-ci permettent de comprendre la nature « multiéchelle » du mécanisme d’empaquetage de la double hélice dans le noyau. Dans le cas du bactériophage $\lambda$ (et plus généralement dans l’ADN des cellules d’organismes procaryotes, c’est-à-dire qui ne possèdent pas de noyau), on observe un seul exposant de Hölder, mais qui vaut $h= 0,5$ ; cela laisse supposer une absence de corrélations (par analogie avec la marche brownienne). L’analyse multifractale permet donc ici de différencier les séquences d’ADN de cellules possédant ou non un noyau.

Figure 2 : signal de vitesse de turbulence pleinement développée

Le signal représenté en (a) correspond à l’enregistrement ponctuel de la composante longitudinale du champ de vitesse par une sonde à fil chaud dans la soufflerie de l’ONERA à Modane. En (b), on voit que la fonction d’échelle $\tau (q)$ diffère d’une fonction affine $\tau (q) = qh-1$ telle que celle obtenue (droite hachurée) pour un brownien fractionnaire (monofractal) $B_{h=1/3}$ dont le spectre de puissance se comporte comme la fameuse loi en $k^{-5/3}$ prédite par Kolmogorov pour les signaux de vitesse turbulents. Le spectre de singularités $D(h)$ obtenu en (c) par transformation de Legendre s’étend entre les valeurs $h_{min} =0,12$ et $h_{max} =0,60$. Les singularités hölderiennes du champs de vitesse jouent un rôle central pour comprendre la nature de la turbulence dans la mesure où ces variations de régularité du signal sont la manifestation de ce qui est couramment appelé « phénomène d’intermittence » en turbulence eulérienne.

Figure 3 : analyse multifractale de signaux financiers

La méthode MMTO a été appliquée à différents signaux financiers (taux de change, commodités, indices boursiers). On montre ici l’indice standard américain $S\& P500$ (a) ainsi que le taux de change entre le Yen japonais et le Dollar américain (b). Le caractère non linéaire des fonction $\tau (q)$ correspondantes montre que ces signaux sont multifractals. Ces résultats expérimentaux infirment les modèles classiques en finance basés sur le mouvement brownien (et ses variantes). La similarité des fonctions d’échelle obtenues avec celle observée pour les fluctuations de vitesse d’une particule dans un flot turbulent permet d’établir une analogie entre les finances et la turbulence dite lagrangienne : les signaux respectifs sont modèlisables par une marche au hasard multifractale dont l’amplitudes des pas est corrélée à longue portée alors que les signes sont quasiment décorrélés, ce qui explique les difficultés de prédiction.

Figure 4 : analyse d’images satellite de nuages

Un nombre important de phénomènes naturels comme de laboratoire conduisent à la formation de surfaces rugueuses très irrégulières. La méthode MMTO a été généralisée en dimension 2 par A. Arneodo et ses collaborateurs. Nous présentons l’analyse d’une image prise à partir du satellite Landsat d’un stratocumulus marin (a). Les nuages ont une influence non négligeable sur la propagation du rayonnement solaire dans l’atmosphère ; ils jouent donc un rôle central dans la régulation du climat. De ce fait, la modélisation de leur structure est primordiale pour prédire l’évolution des conditions climatiques. L’extrème simplicité des modèles utilisés actuellement pour simuler la composante nuage dans le problème de l’interaction nuage-rayonnement est responsable pour une grande part de l’incertitude des modèles climatiques. La nature multifractale des images de nuages est clairement mise en évidence par les résultats du calcul de la fonction d’échelle (b) et du spectre de singularités (c) qui sont remarquablement reproduits par les prédictions d’un modèle de cascade log-normale (trait plein). La comparaison du spectre obtenu avec ceux calculés pour la vitesse (ligne pointillée) et la température (ligne hachurée) dans un champ turbulent suggère que la distribution spatiale des goutelettes d’eau dans un nuage est l’empreinte statistique de la nature intermittente de la turbulence atmosphérique. Enfin, on voit que des cascades multiplicatives simples pourraient fournir un outil de modélisation infiniment meilleur que les modèles très rudimentaires (constants par morceaux) utilisés actuellement dans l’étude de l’interaction entre les nuages et le rayonnement solaire.

Dans chaque cas, on peut se demander ce que la connaissance du spectre de singularités apporte. La réponse dépend bien sûr de l’application et n’est que partiellement donnée (pour des raisons évidentes de concision) dans les figures. Ainsi, dans le domaine de la turbulence pleinement développée, nous avons vu que des modèles mathématiques (cascades multiplicatives) avaient été proposés pour modéliser une hypothétique structure multiplicative sous-jacente à la nature intermittente des fluctuations de vitesse et de dissipation d’énergie. L’analyse multifractale (figure 2) permet de déterminer les valeurs des paramètres de ces cascades pour que le spectre de singularités du modèle coïncide avec le spectre expérimental ; il s’agit donc plus d’éliminer des modèles non satisfaisants que d’apporter la preuve expérimentale de la validité d’un modèle particulier certainement trop simpliste. Cette même analyse a permis également de détecter des évènements rares tels que les passage occasionnels, près de la sonde, de fins filaments de vorticité correspondant à un exposant de Hölder égal à $-1$. Ces filaments n’ont été mis en évidence expérimentalement que très récemment par le groupe de l’ENS dirigé par Yves Couder. Ils échappent aux modèles de cascade et démontrent donc qu’une description réaliste des flots turbulents ne peut se limiter à un simple mécanisme de cascade à travers les échelles, aussi sophistiqué soit-il, mais qu’elle doit prendre également en compte les mécanismes de formation, d’interaction et de destabilisation de ces filaments de vorticité.

Plus généralement, l’analyse multifractale est couramment utilisée comme aide à la modélisation (en calant les paramètres d’un modèle à l’aide du spectre de singularités numériquement calculé ou, éventuellement, en réfutant le modèle). Elle peut aussi être une étape indispensable à la synthèse. C’est également un outil de classification, en analyse de texture par exemple. Ainsi, récemment, les premières applications de la méthode MMTO à l’imagerie mammographique ont conduit à classifier les fluctuations de régularité de mammogrammes de seins normaux suivant la nature grasse ou glandulaire du tissus mammaire. L’étude de seins anormaux a permis de détecter et d’identifier les microcalcifications comme des singularités fortes (d’exposant de Hölder égal à $-1$) relativement aux singularités présentes dans les fluctuations de rugosité de la structure du sein ; de plus, la décomposition espace-échelle que fournit la décomposition en ondelettes 2D permet naturellement de regrouper les microcalcifications en amas dont les propriétés géométriques sont essentielles pour distinguer les microcalcifications de nature maligne de celles de nature bénigne. Ainsi cette méthode se révèle être une approche très prometteuse pour l’aide au diagnostic en imagerie médicale.

Les résultats mathématiques récents ont eu un profond impact dans les domaines appliqués. Ainsi, les physiciens pensaient encore récemment qu’un comportement multifractal était la signature d’une organisation interne extrèmement précise dans le signal (phénomènes de cascade, autosimilarité,...). Les résultats mathématiques de généricité ont renversé cette perspective, puisqu’ils montrent qu’un signal quelconque est, en général, multifractal.

Ces avancées mathématiques ne répondent pas à toutes les questions des utilisateurs : on a vu que la prévalence est, par nature, incapable de conforter l’expérimentateur par un résultat de validité « générique » portant sur tout le spectre calculé. De plus, l’exposant de Hölder donne une information très incomplète sur la nature de la singularité en un point. Les applications demandent aujourd’hui une classification beaucoup plus fine de ces singularités, prenant en compte les comportement oscillatoires et (en dimension 2 et plus) les comportements directionnels ; il faudra alors construire une nouvelle analyse multifractale adaptée à cette nouvelle classification.

Références

P. Abry, P. Gonçalves, J. Lévy-Véhel Eds., Lois d’Echelle, Fractales et Ondelettes Lavoisier (Coll. Hermes) (2002)

A. Arneodo, F. Argoul, E. Bacry, J. Elezgaray, J.-F. Muzy, Ondelettes, multifractales et turbulence : de l’ADN aux croissances cristallines, Diderot Editeur, Arts et Sciences, Paris, 1995.

A. Arneodo, B. Audit, N. Decoster, J.-F. Muzy, C. Vaillant, Wavelet-based multifractal formalism : applications to DNA sequences, satellite images of the cloud structure and stock market data, dans : « The Science of Disasters » ; A. Bunde, J. Kropp, H. J. Schellnhuber eds., Springer pp. 27-102 (2002).

A. Arneodo, E. Bacry, J.-F. Muzy, The thermodynamics of fractals revisited with wavelets, Physica A, Vol. 213, pp. 232-275 (1995).

B. Hunt, T. Sauer, J. Yorke, Prevalence : A translation invariant `almost every’ on infinite dimensional spaces. Bull. AMS, Vol. 27, pp. 217-238 (1992).

S. Jaffard, Wavelet techniques in multifractal analysis, Fractal Geometry and Applications : A Jubilee of Benoît Mandelbrot, M. Lapidus ed. Proceedings of Symposia in Pure Mathematics, (2003)

S. Jaffard, Y. Meyer and R. Ryan, Wavelets : Tools for Science and Technology, S.I.A.M., (2001)

J.-F. Muzy, E. Bacry, A. Arneodo, The multifractal formalism revisited with wavelets, Int. J. Bif. Chaos, Vol. 4, pp. 245-302 (1994).

Soyez le premier à déposer un commentaire

Pour citer cet article : Alain Arneodo et Stéphane Jaffard, « L’analyse multifractale des signaux »Images des Mathématiques, CNRS, 2004. En ligne, URL : http://images.math.cnrs.fr/L-analyse-multifractale-des.html