PB BIBLIO 1951 : Le calcul d’Itō

Tribune libre
Écrit par Nils Berglund
Publié le 25 février 2020

Dans les deux articles Stochastic Integral, paru en 1944, et On a formula concerning stochastic differentials, paru en 1951, Kiyoshi Itō pose les bases de ce qu’on appelle aujourd’hui le calcul stochastique. Dans le premier article, il parvient à donner un sens mathématique précis à l’intégrale d’un processus stochastique contre un mouvement Brownien. Dans le second, il dérive une formule de changement de variables dans une équation différentielle stochastique, connue de nos jours sous le nom de formule d’Itō, qui fonde les interactions fructueuses entre équations différentielles stochastiques et équations aux dérivées partielles.

Le calcul stochastique concerne des processus aléatoires évoluant au cours du temps. L’objet fondamental permettant de construire ces processus est le mouvement Brownien, ou processus de Wiener. Il s’agit à l’origine d’un modèle mathématique du mouvement irrégulier d’une particule de faible masse plongée dans un fluide, sous l’effet des collisions avec ses molécules, mais il a des applications dans de nombreux domaines, qui vont de la physique aux mathématiques financières, en passant par la biologie.

Kiyoshi Itō en 1970

Une manière de définir le processus de Wiener est de considérer une marche aléatoire symétrique sur \(\mathbb{Z}\), c’est-à-dire une suite \(\{S_n : n\in\mathbb{N}\}\) de variables aléatoires satisfaisant les conditions suivantes :

  • Condition initiale : \(S_0 = 0\).
  • Incréments indépendants : pour tout entier \(n\), la différence \(S_{n+1}-S_n\) est indépendante de \(S_0, S_1, \dots, S_n\).
  • Loi des incréments : pour tout entier \(n\), la différence \(S_{n+1}-S_n\) vaut \(1\) avec probabilité \(\frac12\), et \(-1\) avec probabilité \(\frac12\).

Le processus de Wiener est alors obtenu en regardant une limite de cette marche aléatoire, vue de très loin et en très accéléré. Cela revient à considérer une marche avec des pas de plus en plus petits et de plus en plus fréquents, en posant
\[
W_t = \lim_{n\to\infty}\frac{1}{\sqrt{n}} S_{\lfloor nt \rfloor}
\]
L’animation suivante illustre la convergence d’une marche aléatoire vers le mouvement Brownien.

Voici une définition équivalente, mais plus simple à manipuler du processus de Wiener : c’est une collection \(\{W_t : t \ge 0\}\) de variables aléatoires, satisfaisant les conditions suivantes :

  • Condition initiale : \(W_0 = 0\).
  • Incréments indépendants : pour tout choix de \(t>s\ge 0\), \(W_t – W_s\) est indépendant de toutes les valeurs de \(W_u\) pour \(u\) dans l’intervalle \([0,s]\).
  • Incréments gaussiens : pour tout choix de \(t>s\ge 0\), \(W_t – W_s\) suit une loi normale centrée, de variance \(t-s\).

Ce processus est nommé ainsi en l’honneur de Norbert Wiener, qui avait montré son existence en 1923, et le fait que ses trajectoires sont continues. Toutefois, comme on le devine sur l’animation, ces trajectoires sont nulle part dérivables. Il s’agit donc d’un objet aléatoire assez singulier.

Équations différentielles stochastiques

La question qui se posait alors était de savoir si l’on pouvait donner un sens à des équations différentielles stochastiques (EDS) de la forme
\[
\text{d} X_t = b(X_t) \text{d} t + \sigma(X_t) \text{d}W_t
\]
Une telle équation peut par exemple représenter le mouvement suramorti 3Suramorti signifie que la particule est également soumise à une force de frottement assez forte. Dans ce cas, on peut montrer que le terme «masse fois accélération» de l’équation de Newton est négligeable, de sorte que le mouvement peut être décrit par une équation du premier ordre.  d’une particule Brownienne plongée dans un fluide de température variable, reliée au terme \(\sigma(X_t)\), ainsi qu’à une force \(b(X_t)\), telle que la gravité ou un champ électrique. Dans le cas où \(b\) est nul et \(\sigma\) est constant égal à \(1\), on devrait retrouver \(X_t = X_0 + W_t\).

Comme pour les équations différentielles ordinaires, une manière de construire des solutions est de passer par une équation intégrale. Si \(\sigma\) est constant égal à \(1\), cette équation a la forme
\[
X_t = X_0 + \int_0^t b(X_s) \text{d}s + W_t
\]
On peut alors montrer que cette équation intégrale admet un point fixe (dans un espace approprié), qui est par définition la solution de l’EDS \(\text{d} X_t = b(X_t) \text{d} t + \text{d}W_t\) partant du point \(X_0\).

Pour un coefficient \(\sigma\) général, l’équation intégrale devient
\[
X_t = X_0 + \int_0^t b(X_s) \text{d}s + \int_0^t \sigma(X_s) \text{d}W_s
\]
Or la définition de la seconde intégrale pose problème. En effet, le processus de Wiener n’est pas à variation bornée , ce qui empêche d’approcher l’intégrale par une somme d’aires de rectangles, comme pour l’intégrale de Riemann : si l’on essaie de la majorer et de la minorer par de telles sommes, on n’arrive pas à garantir que les deux bornes convergent vers une limite commune.

L'intégrale d'Itō

L’idée de Kiyoshi Itō  présentée dans l’article [I44], est de considérer d’abord l’intégrale de {{fonctions étagées}}. Supposons que \(\sigma\) est une fonction constante par morceaux sur \([0,t]\), discontinue en un nombre fini de points \(0 = t_0 < t_1 < t_2 < \dots < t_{N-1} < t_N = t\). Sa valeur \(\sigma_k\) sur l’intervalle \([t_k,t_{k+1}[\) peut être aléatoire, mais ne doit dépendre que des valeurs du processus de Wiener jusqu’au temps \(t_k\). Itō définit alors \[ \int_0^t \sigma(s) \text{d}W_s = \sum_{k=0}^{N-1} \sigma_k [W_{t_{k+1}} – W_{t_k}] \] L’intégrale stochastique d’une fonction \(\sigma\) quelconque est ensuite définie en l’approchant par une suite de fonctions étagées convergeant vers \(\sigma\), et en passant à la limite. Il faut bien sûr s’assurer que cette limite existe, et est indépendante de la suite d’approximations choisie. Pour cela, Itō démontre la relation \[ \mathbb{E} \biggl[ \biggl( \int_0^t \sigma(s) \text{d}W_s \biggr)^2 \biggr] = \int_0^t \mathbb{E} [\sigma(s)^2] \text{d}s \] appelée de nos jours {{isométrie d’Itō}}. C’est une isométrie entre deux espaces \(L^2\), dans lesquels vivent d’une part la fonction \(\sigma\), et d’autre part son intégrale stochastique. Approcher \(\sigma\) par des fonction étagées est donc équivalent à approcher son intégrale stochastique par des sommes. Avec cette définition de l’intégrale, on peut faire marcher l’argument de point fixe pour montrer l’existence de solutions de l’EDS générale (sous certaines hypothèses sur les fonctions \(b\) et \(\sigma\), cf.[I51a]).

La formule d'Itō

Dans l’article [I51b], Itō s’intéresse à la question suivante. Soit \(X_t\) la solution de l’EDS que nous venons d’étudier, et soit \(Y_t = u(X_t)\) pour une fonction \(u\) suffisamment régulière. Est-ce que \(Y_t\) est également solution d’une EDS, et si oui, laquelle ?

L’idée naïve, obtenue en appliquant la règle de dérivation de fonctions composées, est que
\[
\text{d} Y_t =
u'(X_t) \text{d}X_t
\]
Or Itō montre que cette formule n’est pas correcte, mais doit être complétée par un terme faisant intervenir la dérivée seconde de \(u\). Formellement, on a 4Si \(u\) dépend également du temps \(t\), il convient d’ajouter un terme donné par la dérivée de \(u\) par rapport au temps multiplié par \(\text{d}t\).
\[
\text{d} Y_t =
u'(X_t) \text{d}X_t
+ \frac12 u »(X_t) (\text{d}X_t)^2
\]
où le terme \((\text{d}X_t)^2\) doit être remplacé par
\[
(\text{d}X_t)^2 = \sigma(X_t)^2 \text{d}t
\]
Cette relation peut s’interpréter comme signifiant que «\((\text{d}W_t)^2 = \text{d}t\)». On aboutit alors à la formule d’Itō
\[
\text{d} Y_t =
\biggl[u'(X_t) b(X_t) + \frac12 u »(X_t) \sigma(X_t)^2\biggr] \text{d}t +
u'(X_t) \sigma(X_t) \text{d}W_t
\]
Cette formule est importante car elle permet d’effectuer des changements de variables dans une EDS. De plus, elle permet d’établir de nombreux liens entre le calcul stochastique et certaines équations aux dérivées partielles, faisant intervenir le terme entre crochets dans la formule d’Itō. En particulier, on retrouve l’équation de Kolmogorov ou de Fokker–Planck– gouvernant l’évolution de la loi de \(X_t\).

On trouvera dans l’article [JP] de plus amples informations sur l’histoire de l’intégrale stochastique et de ses applications. Certaines prémices du calcul stochastique avaient d’ailleurs été obtenues en 1940 par Wolfgang Döblin, mais gardées secrètes dans un pli cacheté qu’il envoya à l’Académie des sciences, avant de se donner la mort. Plus de détails sur cette histoire dramatique se trouvent dans cet article.

Bibliographie

[I44]

K. Itō, (1944), Stochastic Integral. Proceedings of the Imperial Academy. 20 (8) : 519-524.
retour article

[I51a]

K. Itō, (1951), On stochastic differential equations. Mem. Amer. Math. Soc. 4 : 51pp.
retour article

[I51b]

K. Itō, (1951), On a formula concerning stochastic differentials. Nagoya Mathematical Journal. 3 : 55-65.
retour article

[JP]

R. Jarrow, P. Protter, (2004), A short history of stochastic integration and mathematical finance : the early years, 1880–1970. A Festschrift for Herman Rubin, 75—91, Institute of Mathematical Statistics, Beachwood, Ohio, USA, 2004.
retour article

Post-scriptum

Retrouvez tous les billets publiés à l’occasion des 80 ans du CNRS.

ÉCRIT PAR

Nils Berglund

Professeur - Institut Denis Poisson - Université d'Orléans

Partager