Réseaux

Publié le 13 avril 2012

Faisons cette fois-ci une petite incursion dans la réalité, ou plutôt dans quelques idées – pas totalement établies – sur la réalité biologique et physique. L’étude actuelle des systèmes biologiques est caractérisée par l’analyse des relations entre différentes composantes biologiques au lieu de chaque composante en soi-même. On essaie de comprendre les fonctions biologiques à partir d’un réseau d’interactions entre molécules, qui est d’habitude modélisé par un graphe, orienté ou non ¹, muni d’une combinatoire et d’une topologie complexes. Les biologistes sont ainsi très intéressés à des réseaux complexes comme le réseau transcriptionnel, qui décrit la relation entre les gènes et les protéines, le réseau d’interaction protéine-protéine, qui tient compte des relations entre protéines, ou le réseau métabolique, qui cherche à modéliser les réactions métaboliques d’un organisme ². La figure montre le réseau d’interaction de la levure Saccharamyces cerevisiae où les 1870 noeuds représentent des protéines et les 2240 arcs des interactions physiques entre ces protéines ³.

Les réseaux de neurones et les réseaux alimentaires sont d’autres exemples d’origine biologique. Mais il y a des réseaux sociaux d’acteurs ou de mathématiciens, des réseaux d’information comme les réseaux des citations, l’Internet ou le World Wide Web et des réseaux technologiques comme les réseaux des centrales électriques d’un pays ou l’Internet2 dont l’origine n’est plus biologique. Tous ces réseaux ont quelques propriétés communes comme l’existence de « courts chemins » en moyenne ⁴ – l’effet « small world » ou « du monde petit » ⁵ –, un taux élevé d’agrégation ou « clustering » ⁶ – de manière que les voisins d’un noeud ont toujours d’autres voisins – ou une distribution du degré de noeuds selon une loi de puissance ⁷– avec beaucoup de noeuds faiblement connectés et peu de noeuds fortement connectés –.

En 2002, l’équipe du professeur Uri Alon du Weizmann Institut of Science observa que ces réseaux contiennent des petits sous-graphes surreprésentés, qu’ils appelèrent motifs ⁸. Ces sous-graphes apparaissent dans les réseaux avec des fréquences plus élevées que celles que l’on trouve dans des réseaux aléatoires ayant la même distribution de noeuds. Ils montrent des hauts taux de conservation entre des organismes différents. Voici les motifs surreprésentés trouvés dans le réseau de neurones du nématode Caenorhabditis elegans (252 neurones et 509 connexions) :

L’idée d’une fonction biologique attachée aux motifs du réseau de neurones de ce petit ver, qui deviennent ainsi des modules fonctionnels, est très intéressante. Mais comme il a été remarqué par d’autres auteurs, il faut faire attention aux faux positifs dérivés de l’algorithme de recâblage utilisé pour engendrer les réseaux aléatoires et au fait que certains réseaux – comme celui de neurones du ver Caenorhabditis elegans – ont une structure spatiale qui favorise l’agrégation de neurones de façon locale ⁹. Néanmoins l’idée d’une modularité propre de certains réseaux biologiques (où l’agrégation de modules fonctionnels simples – très conservés entre les différentes espèces – amène à des larges et complexes structures, chevauchées et inséparables, caractéristiques de chacune des espèces) reste très suggestive au moins pour un mathématicien ¹⁰.

Des différent types de modèles de réseaux cherchent à capturer les propriétés essentielles des réseaux du monde réel. Le modèle aléatoire de Erdös-Rényi qu’on obtient en reliant chaque paire de noeuds avec une probabilité fixe \(0 \leq p \leq 1\), possède la propriété de « courts chemins » propre des « mondes petits », mais pas les autres propriétés. Le modèle de Watts-Strogatz permet d’augmenter le taux d’agrégation, mais la distribution du degré de noeuds reste poissonnienne. Pour construire un modèle dont la distribution du degré des noeuds soit gouvernée par une loi de puissance, ont peut utiliser un algorithme, appelé modèle de Barabási-Albert, qui consiste à ajouter un noeud et à le relier aux noeuds existants (énumérés \(i=1,…n\)) avec une probabilité \(p_i = k_i / \sum_{i=1}^n k_i\), dite d’attachement préférentiel, proportionnelle au degré \(k_i\) de chaque noeud \(i\).Ce sont des modèles, dits sans échelle, très robustes ou insensibles aux erreurs aléatoires, mais très vulnérables aux attaques sur les noeuds de haut degré ou « hubs ». Mais dans ce modèle le taux d’agrégation tend vers 0 lorsque la taille du réseau augmente, ce qui ne se correspond pas avec l’observation. L’idée de réseau hiérarchique, introduite par E. Ravasz de l’équipe de A. L. Barabási, cherche à éliminer ce problème ¹¹. Il s’agit de combiner de manière itérative des petites agrégations de motifs. Voici un exemple réseau hiérarchique décrit dans l’article de Ravasz où le centre d’un « module clef » est connecté aux « noeuds périphériques » (appartenant aux sous-modules périphériques) de trois « modules périphériques » et les centres des ces modules sont interconnectés.

Remarquons que tout sous-graphe fini peut être retrouvé à distance bornée de n’importe quel noeud. Mais la nature répétitive de ce réseau est moins rigide que celle du pavage de Kepler-Penrose ou de l’arbre de Kenyon où tout sous-graphe est retrouvé de façon fidèle, c’est-à-dire en tenant compte des arêtes présentes et absentes. Dans les réseaux hiérarchiques, le taux d’agrégation s’approche d’une constante – qui vaut 0,606 pour l’exemple ci-dessus – indépendante du nombre des noeuds, mais la fonction c(k) qui mesure la taux d’agrégation des noeuds de degré k suit une loi de puissance – \(c(k) \sim k^{-1}\) pour l’exemple –. Le réseau métabolique du bacille Escherichia Coli est modelé par Ravasz et ses coauteurs en utilisant ce type de réseau. Grâce à un procédé de réduction – illustré dans la figure ci-dessous –, ils se ramènent à un réseau modulaire, puis ils se servent de l’invariance d’échelle pour affirmer leur nature hiérarchique

Il y a d’autres auteurs comme John Doyle qui critiquent cette approche et qui proposent d’autres modèles pour expliquer l’architecture de certains réseaux – souvent liés au génie informatique et industriel – n’ayant pas les propriétés des réseaux hiérarchiques. La loi d’échelle pour le taux d’agrégation est effectivement une condition nécessaire, mais pas suffisante pour l’existence d’une structure hiérarchique. Le modèle HOT (« Highly Optimized Tolerance » ou « Heuristic Optimized Tradeoff ») proposé par Doyle – qui cherche à expliquer la manière d’optimiser les performances sous contraintes technologiques ou economiques – se veut opposé à celui de Ravasz, auto-dissimilaire et à échelle riche.
Mais l’existence d’un « noyau » dans ce modèle est semblable à celle du noyau dans le pavage de Dürer : bien qu’on n’ait plus de structure répétitive ou auto-similaire (en un sens à préciser), cela ne signifie pas que le réseau ne garde pas une sorte de répétitivité ou d’auto-similarité consubstantielle à la notion de modularité.

Voici les différents type de réseaux représentés dans la figure : (a) Modèle de Barabási-Albert (b) Modèle sans échelle (c) Réseau mauvais (d) Réseau HOT

Comme j’ai déjà dit au début, il s’agit d’idées qui ne sont pas totalement établies. Mais, discutées ou non, elles dessinent à mon avis une belle esquisse du rôle de la biologie dans les maths à venir ¹². Le regard sur les mathématiques du début du XXe siècle, alors qu’on commémore le centenaire de la mort d’Henri Poincaré, peut nous donner une idée la taille du défi et ses dangers.

Commentaires

Écrire un commentaire

Il est possible d’utiliser des commandes LaTeX pour rédiger des commentaires — mais nous ne recommandons pas d’en abuser ! Les formules mathématiques doivent être composées avec les balises .
Par exemple, on pourra écrire que sont les deux solutions complexes de l’équation .

Si vous souhaitez ajouter une figure ou déposer un fichier ou pour toute autre question, merci de vous adresser au secrétariat.

Réseaux

ÉCRIT PAR

Fernando Alcalde Cuesta

Commentaires

Écrire un commentaire