Les diagrammes de Feynman 2

Piste noire Le 29 octobre 2016  - Ecrit par  Nils Berglund Voir les commentaires (2)

Les diagrammes de Feynman, introduits à la fin des années 1940 par le physicien américain Richard Feynman, permettent de représenter des calculs algébriques compliqués sous forme graphique. C’est un parfait exemple de visualisation de formules par des dessins, permettant à la fois d’alléger les notations et d’éviter les erreurs de calcul.

Dans cette deuxième partie, nous allons introduire la notion de développement perturbatif dans le cadre du modèle $\Phi^4$. Nous découvrirons les équations de Schwinger—Dyson, qui servent à obtenir ce développement, et nous verrons comment les diagrammes de Feynman permettent de représenter graphiquement les calculs.

Dans la première partie de cet article, nous avons introduit le modèle $\Phi^4$ (lire « phi-quatre ») pour une chaîne de billes connectées par des ressorts :

Les ressorts entre particules sont supposés linéaires, de constante de raideur $k_2$, avec une longueur au repos négligeable par rapport à la distance $L_0$ entre les points d’ancrage. Par conséquent, si $X_i$ désigne le déplacement vertical de la $i$ème bille par rapport à sa position d’équilibre, l’énergie potentielle du ressort entre les particules $i$ et $i+1$ vaut
\[ \frac12 k_2 \left[ L_0^2 + (X_{i+1}-X_i)^2 \right] \]
Les ressorts entre billes et points d’ancrage peuvent être non linéaires : nous supposons que leur énergie s’écrit
\[ \frac12 k_1 X_i^2 + \frac 14 a X_i^4 \]
L’énergie de la chaîne s’obtient en ajoutant les énergies potentielles de tous les ressorts [1]. Si $a=0$, elle est donnée par un polynôme $E$ du second degré dans les variables $X_i$. Dans cette situation, le principe de Boltzmann—Gibbs affirme que si la chaîne est à l’équilibre thermodynamique à température $T$, les positions $X_i$ des billes suivent une loi normale multivariée [2], également appelée Gaussienne. Le théorème d’Isserlis—Wick nous a permis de calculer les valeurs moyennes de toute fonction polynomiale des $X_i$.

Lorsque la constante $a$ est non nulle, il faut ajouter à l’énergie $E$ un terme
\[ W = \frac a4 \left( X_1^4 + X_2^4 + \dots + X_N^4 \right) \]
La distribution de probabilité n’est alors plus Gaussienne, et le calcul des valeurs moyennes devient nettement plus difficile.

Le premier but des physiciens a été de montrer la non-trivialité de la théorie. Cela signifie qu’elle prédit des comportements qualitativement distinguables de la théorie Gaussienne du cas $a=0$. Si $a$ est non nul mais néanmoins petit, une approche possible à cette question est la théorie des perturbations.

Théorie des perturbations linéaire

Commençons par un exemple élémentaire de calcul perturbatif. Supposons que nous voulions résoudre l’équation
\[ 0,\!99 \, x = 1 \]
La solution est donnée, bien entendu, par l’inverse de $0,\!99$. Ma calculette me donne la solution approchée
\[ x = 1,\!010101\dots \]
Remarquons que les décimales semblent se répéter périodiquement. C’est normal, car en multipliant les deux côtés de l’équation par $100$, on obtient $99\,x = 100$, donc $x=100/99$, un nombre rationnel. Or le développement décimal de tout nombre rationnel est soit fini, soit périodique.

Généralisons un peu et considérons l’équation
\[ (1-a) x = 1 \]
dans laquelle $a$ est un paramètre proche de $0$. Dans l’exemple ci-dessus, $a$ était égal à $0,\!01$. La solution est bien sûr donnée par $x=1/(1-a)$. Observons toutefois ceci : l’équation peut également être écrite sous la forme
\[ x = 1 + a x \]
Si nous remplaçons le $x$ dans le membre de droite par $1+ax$, nous obtenons l’égalité
\[ x = 1 + a (1+a x) = 1 + a + a^2x \]
En répétant cette opération de substitution autant de fois qu’on le souhaite, on obtient à chaque fois une expression de la forme
\[ x = 1 + a + a^2 + a^3 + a^4 + \dots \]
Ceci suggère que $x$ est en fait égal à la somme infinie des puissances croissantes de $a$, que l’on appelle une série géométrique.
Remarquons que si $a=0,\!01$, on retombe bien sur le développement décimal périodique vu ci-dessus. Se pourrait-il qu’il y ait égalité entre $1/(1-a)$ et la série géométrique ? Le théorème suivant en donne la réponse.

Théorème : L’égalité \[ \frac{1}{1-a} = 1 + a + a^2 + a^3 + a^4 + \dots \] où la membre de droite est la somme infinie des puissances croissantes de $a$, est vraie si et seulement si $-1 < a < 1$.

Démonstration

Partons de l’égalité
\[ (1-a)(1+a+a^2+\dots+a^n) = 1-a^{n+1} \]
qui est valable pour tout entier positif $n$. Pour le voir, il suffit de développer le membre de gauche, et de réaliser que la plupart des termes se simplifient. On remarque alors que lorsque $n$ tend vers l’infini, le terme $a^{n+1}$ tend vers $0$ si et seulement si $-1 < a < 1$. On obtient alors le résultat en divisant des deux côtés par $1-a$.

Si $a$ n’est pas dans l’intervalle $]-1;1[$, on vérifie que la somme $ 1 + a + a^2 + a^3 + a^4 + \dots$ n’admet pas de limite.

Pour se convaincre de ce résultat, on peut considérer le cas $a=\frac12$. Voyez-vous pourquoi $1+\frac12+\frac14+\frac18+\dots = 2$ ?

Que se passe-t-il si $a$ vaut $1$ ? S’il vaut $-1$ ? Et si $a$ n’est pas compris entre $-1$ et $1$ ?

L’intérêt du théorème est qu’il évite d’effectuer une division : il suffit de savoir multiplier et additionner des nombres. De plus, les termes de la somme devenant de plus en plus petits, on obtient une bonne approximation du résultat en s’arrêtant après un nombre fini de termes. Par exemple, pour $a=0,\!01$, en s’arrêtant après le terme $a^3$ on obtient $1,\!010101$, réponse correcte à $6$ décimales près [3].

Théorie des perturbations non linéaire

Voici maintenant une équation plus difficile à résoudre :
\[ x - a x^5 = 1 \]
En général, on ne connaît pas la solution exacte. Toutefois, si $a=0$ la seule solution est évidemment $x=1$. Ceci suggère, pour $a$ non nul, de réarranger l’équation sous la forme $x = 1 + a x^5$. En procédant comme ci-dessus par substitutions successives, on trouve après quelques étapes
\[ x = 1 + a + 5 a^2 + 35 a^3 + 285 a^4 + 2530 a^5 + \dots \]
Ici nous n’avons écrit que les six premiers termes d’un polynôme qui en compte beaucoup plus. Pour $a=0,\!01$, on obtient $x=1,\!010538103\dots$ qui en effet satisfait l’équation avec une bonne précision. Remarquons toutefois trois choses :

  • Les coefficients ($1, 5, 35, 285, 2530, \dots$) ne semblent pas suivre de logique particulière, et on ne voit pas comment les déterminer sans faire explicitement les substitutions. Ce calcul devient vite fastidieux.
  • Il n’est pas évident, à priori, pour quelles valeurs de $a$ la somme infinie donne un résultat fini. En fait, il se pourrait tout à fait que la somme soit infinie pour tout $a$ non nul ! [4]
  • Même si le procédé donne une solution, rien ne nous dit que cette solution est unique. En fait, l’équation pour $x$ étant de degré $5$, nous savons qu’il peut y avoir jusqu’à cinq solutions (éventuellement complexes).

Les équations de Schwinger—Dyson

Revenons au modèle $\Phi^4$. Dans la première partie de cet article, nous avons introduit la notation

pour les covariances du modèle Gaussien obtenu pour $a=0$. Nous allons noter $\langle Y \rangle_a$ les valeurs moyennes par rapport à la distribution non Gaussienne du modèle $\Phi^4$ (donc si $a=0$ on a $\langle Y \rangle_0 = \langle Y \rangle$). Notre but sera de déterminer les valeurs moyennes de la forme

que les physiciens appellent « fonction à deux points habillée », par opposition à la « fonction à deux points nue » $\langle X_i X_j \rangle = C_{ij}$.

L’outil qui nous permettra d’étudier la question est ce qu’on appelle les équations de Schwinger—Dyson, qui sont dues à Julian Schwinger et Freeman Dyson. Par souci de simplicité, nous allons énoncer ces équations dans un cas particulier qui suffira à notre propos. Plus de détails sont donnés dans l’encadré ci-dessous, qu’il n’est toutefois pas nécessaire de lire pour comprendre la suite.

Théorème Pour des entiers $n, m\geq0$, on a \[ \begin{array}{rcl} \langle X_i^{n+1} X_j^m\rangle_a &=& n C_{ii} \langle X_i^{n-1} X_j^m\rangle_a + m C_{ij} \langle X_i^n X_j^{m-1}\rangle_a \\ &&- \displaystyle \frac{a}{k_{\rm B}T} \left[ C_{i1} \langle X_i^n X_j^m X_1^3 \rangle_a + \dots + C_{iN} \langle X_i^n X_j^m X_N^3 \rangle_a \right] \end{array} \] où les coefficients $C_{ij} = \langle X_i X_j\rangle$ sont les covariances du modèle Gaussien, c’est-à-dire pour $a=0$, $k_{\rm B}$ est la constante de Boltzmann, et $T$ est la température.

Remarquons que si $m=0$, le second terme du membre de droite vaut $0$. Autrement dit, l’équation doit se lire
\[ \langle X_i^{n+1} \rangle_a = n C_{ii} \langle X_i^{n-1} \rangle_a - \frac{a}{k_{\rm B}T} \left[ C_{i1} \langle X_i^n X_1^3 \rangle_a + \dots + C_{iN} \langle X_i^n X_N^3 \rangle_a \right] \]
Une remarque analogue s’applique au cas $n=0$ : dans ce cas c’est le premier terme du membre de droite qui vaut $0$.

Démonstration

L’idée est que, puisque on a ajouté un terme $W$ à l’énergie, les nouvelles valeurs moyennes peuvent être exprimées en fonction des valeurs moyennes par rapport à la loi normale en ajoutant un facteur $e^{-W(X)/k_{\rm B}T}$. Ainsi on a
\[ \langle X_i^{n+1} X_j^m\rangle_a = \frac{\displaystyle \int x_i^{n+1}x_j^m e^{-W(x)/k_{\rm B}T} e^{-E(x)/k_{\rm B}T} dx}{\displaystyle \int e^{-W(x)/k_{\rm B}T} e^{-E(x)/k_{\rm B}T} dx} =\frac{\langle X_i^{n+1} X_j^me^{-W(X)/k_{\rm B}T}\rangle}{\langle e^{-W(X)/k_{\rm B}T}\rangle} \]
Le numérateur de cette fraction se calcule comme dans la preuve du premier théorème de la partie 1 de l’article. On obtient une somme de termes de la forme
\[ C_{ik} \langle \partial_k(X_i^n X_j^me^{-W(X)/k_{\rm B}T})\rangle \]
où $\partial_k$ désigne la dérivée partielle par rapport à la variable $X_k$.
En appliquant la règle de Leibniz et en utilisant le fait que
\[ \partial_k(e^{-W(X)/k_{\rm B}T}) = -\frac{a}{k_{\rm B}T}X_k^3e^{-W(X)/k_{\rm B}T} \]
on obtient bien le résultat après avoir divisé par la constante de normalisation $\langle e^{-W(X)/k_{\rm B}T}\rangle$.

Plus généralement, si $G$ est un polynôme dans les variables $X_1,\dots,X_N$, alors on obtient
\[ \begin{array}{rcl} \langle X_i G(X)\rangle_a &=& C_{i1} \left[ \langle \partial_1 G(X)\rangle_a - \displaystyle \frac{a}{k_{\rm B}T} \langle G(X) X_1^3 \rangle_a \right] \\ &&+ \dots + C_{iN} \left[ \langle \partial_N G(X)\rangle_a - \displaystyle \frac{a}{k_{\rm B}T} \langle G(X) X_N^3 \rangle_a \right] \end{array} \]

Dans la suite, nous allons supposer que $k_{\rm B}T = 1$ afin d’alléger l’écriture. Toutefois, tous les résultats restent vrais dans le cas général, à condition de diviser $a$ par $k_{\rm B}T$.

Commençons par remarquer que si $m=a=0$, le théorème fournit la relation $\langle X_i^{n+1}\rangle = n C_{ii} \langle X_i^{n-1}\rangle$ que nous avons rencontrée dans la première partie de cet article. Les équations de Schwinger—Dyson sont donc une généralisation de ce résultat.

Appliquons maintenant le théorème au cas $n=0, m=1$, avec $i=1$ et $j=2$ pour alléger l’écriture (mais le résultat est analogue pour des $i$ et $j$ quelconques). Nous obtenons que la fonction à deux points $\langle X_1 X_2\rangle_a $ satisfait la relation
\[ \langle X_1 X_2\rangle_a = C_{12} - a \left[ C_{11} \langle X_2 X_1^3 \rangle_a + \dots + C_{1N} \langle X_2 X_N^3 \rangle_a\right] \]
On voit ici apparaître un problème typique de ce genre de situation : la fonction à deux points dépend de fonctions à quatre points de la forme $\langle X_2 X_i^3 \rangle_a$. Si nous écrivons les équations de Schwinger—Dyson pour ces fonctions à quatre points, nous verrons qu’elles dépendent de fonctions à six points, et ainsi de suite. La faute incombe aux termes $X_i^3$ qui proviennent du terme supplémentaire $W$ de l’énergie.

Cependant, si $a$ est petit, on peut espérer que l’influence des fonctions à quatre points est petite. On est donc exactement dans la logique d’un calcul perturbatif, comme nous l’avons vu au début de cet article. En appliquant le théorème avec $n=0, m=3$, nous obtenons
\[ \langle X_2 X_i^3 \rangle_a = 3 C_{2i} \langle X_i^2 \rangle_a + \mathcal{O}(a) \]
où $\mathcal{O}(a)$ désigne un « reste » d’ordre $a$, que nous espérons petit.
Comme par ailleurs $ \langle X_i^2 \rangle_a = C_{ii} + \mathcal{O}(a)$, nous obtenons après substitution dans l’équation précédente
\[ \langle X_1 X_2\rangle_a = C_{12} - 3a \left[ C_{11} C_{11} C_{12} + C_{12} C_{22} C_{22} + \dots + C_{1N} C_{NN} C_{N2} \right] + \mathcal{O}(a^2) \]

Représentation graphique

Comme les expressions ci-dessus sont longues à écrire, nous allons avoir recours à la représentation graphique introduite plus haut, que l’on peut considérer comme un cas particulier de diagramme de Feynman. La dernière équation devient alors

Ici, par convention, le sommet du milieu qui n’a pas d’étiquette signifie qu’on effectue la somme sur tous les indices de $1$ à $N$. Une traduction des graphes en expressions algébriques se trouve dans le bloc dépliant ci-dessous.

Dictionnaire

$ \langle X_1 X_2 \rangle_a$
$C_{12} = \langle X_1 X_2 \rangle$
$C_{11}C_{11}C_{12} + C_{12}C_{22}C_{22} + \dots + C_{1N}C_{NN}C_{N2}$

Si nous voulons calculer le coefficient de $a^2$, il nous faut déterminer le coefficient de $a$ dans la fonctions à $4$ points $\langle X_2 X_i^3 \rangle_a$. Un calcul détaillé dans le second bloc dépliant ci-dessous fournit le développement

Dictionnaire

$C_{2i} C_{ii}$
$C_{2i} C_{i1}^2 C_{11} + \dots + C_{2i} C_{iN}^2 C_{NN}$
$C_{21} C_{11} C_{1i} C_{ii} + \dots + C_{2N} C_{NN} C_{Ni} C_{ii}$
$C_{21} C_{1i}^3 + \dots + C_{2N} C_{Ni}^3$

Détails du calcul

En appliquant les équations de Schwinger—Dyson avec $n=0$ et $m=3$, nous obtenons
\[ \langle X_2 X_i^3 \rangle_a = 3 C_{2i} \langle X_i^2 \rangle_a - a \left[ C_{21} \langle X_i^3 X_1^3 \rangle_a + \dots + C_{2N} \langle X_i^3 X_N^3 \rangle_a \right] \]
Deux types de termes contribuent au coefficient d’ordre $a$. Le premier est le coefficient de $a$ dans l’expression

qui est juste une réécriture de l’expression obtenue ci-dessus pour $\langle X_i X_j\rangle_a$ avec $i=j$. La seconde contribution provient des termes constants dans $\langle X_i^3X_k^3\rangle_a$, c’est-à-dire (on applique le théorème avec $n=2$ et $m=3$)
\[ \langle X_i^3X_k^3\rangle_a = 2C_{ii}\langle X_iX_k^3\rangle_a + 3C_{ik}\langle X_i^2X_k^2\rangle_a + \mathcal{O}(a) \]
Pour le terme $\langle X_iX_k^3\rangle_a$, il suffit d’appliquer la relation obtenue pour $\langle X_2 X_i^3 \rangle_a$ en $a=0$, en remplaçant $2$ par $i$ et $i$ par $k$. Pour évaluer le terme $\langle X_i^2X_k^2\rangle_a$, nous utilisons les équations de Schwinger—Dyson avec $n=1, m=2$ pour obtenir

Remarquons que ce résultat est en fait équivalent au théorème d’Isserlis—Wick. En effet, il y a une façon de décomposer le quadruplet $(i,i,k,k)$ en $\{(i,i),(k,k)\}$, et deux façons de le décomposer en $\{(i,k),(i,k)\}$.
En regroupant les différents termes, nous obtenons

À nouveau, ce résultat peut aussi être déduit directement du théorème d’Isserlis—Wick, en appliquant le résultat de l’Exercice 1 de la première partie de l’article (les $6$ sommets des $15$ différents graphes sont alors numérotés $i, i, i, k, k, k$, puis tous les $i$ et tous les $k$ sont superposés). Le coefficient $9$ correspond au nombres de façons de décomposer $(i,i,i,k,k,k)$ en $\{(i,i),(i,k),(k,k)\}$, alors que $6$ est le nombre de façons de le décomposer en $\{(i,k),(i,k),(i,k)\}$. Il ne reste plus qu’à substituer cette expression dans le développement de $\langle X_2 X_i^3 \rangle_a$.

Voici le dictionnaire des graphes apparaissant ci-dessus :

$C_{ii}$
$C_{i1}^2 C_{11} + \dots + C_{iN}^2 C_{NN}$
$C_{ii} C_{kk}$
$C_{ik}^2$
$C_{ii} C_{ik} C_{kk}$
$C_{ik}^3$

En remplaçant le résultat dans l’expression de la fonction à deux points, nous obtenons son développement à l’ordre $2$, donné par

Cette représentation graphique a l’avantage de révéler une certaine structure dans le développement. Ainsi, le diagramme du terme d’ordre $1$ a $2$ sommets et $1$ arête, alors que celui du terme d’ordre $a$ a $3$ sommets et $3$ arêtes (chaque ligne ou boucle bleue entre deux sommets comptant pour une arête). Les diagrammes du terme d’ordre $a^2$ ont tous $4$ sommets et $5$ arêtes. De plus, de chaque sommet sans étiquette émergent exactement $4$ arêtes (on dit que ces sommets sont de degré $4$). Ce sont des conséquences du fait que le terme non-quadratique de l’énergie est de degré $4$.

En théorie quantique des champs, il est tentant d’interpréter chaque diagramme comme un processus faisant intervenir des particules. La ligne ondulée rouge correspondrait alors à une particule « habillée » allant du point $1$ au point $2$. Ce processus se décompose en une ligne bleue représentant une particule « nue » allant directement de $1$ à $2$, plus un terme d’ordre $a$, où la particule va d’abord en un autre point, où elle émet et absorbe une particule (la boucle) avant de rejoindre le point $2$, plus d’autres termes faisant intervenir plus de particules intermédiaires. Mais il s’agit seulement d’une interprétation d’un calcul perturbatif, qui décompose une probabilité en une somme de termes !

Une question reste cependant ouverte à ce stade. Comme nous l’avons observé plus haut dans le cadre de l’équation $x - a x^5 = 1$, nous ne savons pas si la somme infinie obtenue par ce développement donne un résultat fini si $a$ est non nul. En théorie quantique des champs, cette question reste en général largement ouverte. Il se trouve toutefois que dans le cas du modèle $\Phi^4$, on est parvenu à montrer que cette somme est effectivement finie. Dans la troisième et dernière partie de cet article, nous donnerons une idée d’une preuve particulièrement astucieuse de ce fait, dûe à David Brydges, Jürg Fröhlich et Alan Sokal.

Post-scriptum :

Merci aux relecteurs Himynameisarno et Claire Lacour, dont les remarques ont permis de rendre cet article plus lisible.

Article édité par Nils Berglund

Notes

[1Comme nous l’avons déjà mentionné dans la première partie de cet article, on pourrait également tenir compte de l’énergie cinétique des billes. Ici nous allons la négliger, pour simplifier les notations. Cette approximation est justifiée si les billes sont soumises à une force de frottement assez forte.

[2En formules, ceci signifie que la distribution jointe des positions admet la densité $\frac{1}{\mathcal{N}} e^{E/(k_{\rm B}T)}$, où $k_{\rm B}$ désigne la constante de Boltzmann, $T$ est la température, et $\mathcal{N}$ est une constante de normalisation, assurant que l’intégrale de la densité sur $\mathbb{R}^N$ vaut $1$.

[3Le même principe peut être utilisé pour calculer les covariances $C_{ij}$ de la chaîne dans le cas harmonique $a=0$ en termes des constantes $k_1, k_2$ des ressorts. En effet, les covariances forment une matrice $C$ qui est l’inverse de la matrice $K$ dont les éléments $K_{ij}$ sont les coefficients de $X_iX_j$ dans l’énergie.

[4Par exemple, la somme infinie $1 +1^1\cdot a + 2^2 \cdot a^2 + 3^3 \cdot a^3 + 4^4 \cdot a^4 + \dots$ donne un résultat infini dès que $a>0$. Il en va de même de la somme infinie $1 + 1\cdot a + 1\cdot 2 \cdot a^2 + 1\cdot 2\cdot 3 \cdot a^3 + 1\cdot 2\cdot 3\cdot 4\cdot a^4+ \dots$.

Partager cet article

Pour citer cet article :

Nils Berglund — «Les diagrammes de Feynman 2» — Images des Mathématiques, CNRS, 2016

Crédits image :

Image à la une - Créée par l’auteur en tikz.

Commentaire sur l'article

  • Les diagrammes de Feynman 2

    le 29 octobre 2016 à 13:17, par Christian

    « Les coefficients (1,5,35,285,2530,…) ne semblent pas suivre de logique particulière » Ces coefficients sont naturellement ceux de la fonction generatrice qui enumere les arbres planaires de degre 5. Ils s’expriment en forme close avec un coefficient binomial (a(n)=binomial(5n,n)/(4n+1)). Voir la serie http://oeis.org/A002294. Tres bonne serie d’articles.

    Répondre à ce message
    • Les diagrammes de Feynman 2

      le 29 octobre 2016 à 13:42, par Nils Berglund

      Merci pour cette excellente remarque !

      Elle montre que l’équation $x - a x^5 = 1$ peut être résolue de manière graphique, en comptant des arbres (même si une approche analytique, basée sur sa série génératrice, peut être plus puissante). Voici donc un exercice pour les lecteurs assidus : peut-on comprendre le lien entre arbres planaires de degré 5 et l’équation $x - a x^5 = 1$ ?

      Je ne cesse d’être émerveillé par ce que savent faire les spécialistes de combinatoire énumérative (dont je ne fais pas partie). Par exemple j’ai récemment découvert, en lien avec un travail de recherche, l’existence des nombres de Wedderburn–Etherington permettant de compter certains types d’arbres.

      Bien cordialement,
      Nils Berglund

      Répondre à ce message

Laisser un commentaire

Forum sur abonnement

Pour participer à ce forum, vous devez vous enregistrer au préalable. Merci d’indiquer ci-dessous l’identifiant personnel qui vous a été fourni. Si vous n’êtes pas enregistré, vous devez vous inscrire.

Connexions’inscriremot de passe oublié ?

Suivre IDM