Redes

Le 13 avril 2012  - Ecrit par  Fernando Alcalde
Le 5 octobre 2021  - Traduit par  Jimena Royo-Letelier, Julio E. De Villegas
Article original : Réseaux Voir les commentaires
Lire l'article en  

Hagamos esta vez una pequeña incursión en la realidad, o más bien en algunas ideas -no totalmente establecidas- acerca de la realidad biológica y física. El estudio actual de los sistemas biológicos está caracterizado por el análisis de las relaciones entre diferentes componentes biológicos, en lugar de cada componente en sí mismo. Se trata de comprender las funciones biológicas a partir de una red de interacciones entre moléculas, que por costumbre es modelizado por un grafo, orientado o no
 [1], provisto de una combinatoria y de una topología complejas. Los biólogos están muy interesados en redes complejas como la
red transcripcional,
que describe la relación entre los genes y las proteínas, la
red de interacción proteína-proteína, que considera relaciones entre proteínas, o la
red metabólica, que busca modelizar las reacciones metabólicas de un organismo. La figura muestra la red de interacción de la levadura Saccharomyces cerevisiae : los 1870 nudos representan proteínas y los 2240 arcos las interacciones físicas entre esas proteínas
 [2].

JPEG

Las redes de neuronas y las redes alimentarias son otros ejemplos de origen biológico. Pero hay redes sociales de actores o de matemáticos, redes de información como las redes de citas, Internet o la World Wide Web, y redes tecnológicas como las redes de centrales eléctricas de un país o la Internet 2 cuyo origen ya no es biológico. Todas esas redes tienen algunas propiedades comunes, como la existencia de ’’caminos cortos’’ en promedio [3] – el efecto ’’small world’’ o ’’del mundo pequeño’’
 [4] –, una tasa elevada de agregación o ’’clustering’’ [5] –de manera que los vecinos de un nudo siempre tienen otros vecinos– o una distribución de nudos según una ley de potencia [6]– con muchos nudos débilmente conectados y pocos nudos fuertemente conectados –.

En 2002, el equipo del profesor Uri Alon del Weizmann Institut of Science observó que esas redes contienen pequeños sub-grafos sobrerrepresentados, que llamaron motivos [7]. Esos sub-grafos aparecen en las redes con frecuencias más elevadas que las que uno encuentra en redes aleatorias con la misma distribución de nudos. Muestran altas tasas de conservación entre organismos diferentes. Aquí están los motivos sobrerrepresentados encontrados en la red de neuronas del nemátodo Caenorhabditis elegans (252 neuronas y 509 conexiones) :

La idea de una función biológica unida a los motivos de la red de neuronas de ese pequeño gusano, que se convierten así en módulos funcionales, es muy interesante. Pero como fue comentado por otros autores, hay que poner atención a los falsos positivos derivados del algoritmo de recableado utilizado para engendrar las redes aleatorias y al hecho de que ciertas redes –como ésta de neuronas del gusano Caenorhabditis elegans – tienen una estructura espacial que favorece la agregación de neuronas de manera local [8]. Sin embargo, la idea de una modularidad propia de ciertas redes biológicas (donde la agregación de módulos funcionales simples -muy conservados entre los diferentes espacios- lleva a amplias y complejas estructuras, montadas e inseparables, características de cada una de las especies) se mantiene muy sugerente para un matemático [9].

Diferentes tipos de modelos de redes buscan capturar las propiedades esenciales de las redes del mundo real. El modelo aleatorio de Erdös-Rényi que uno obtiene uniendo cada pareja de nudos con una probabilidad fija $0 \leq p \leq 1$, posee la propiedad de « caminos cortos » propia de los « mundos pequeños », pero no las otras propiedades. El modelo de Watts-Strogatz permite aumentar la tasa de agregación, pero la distribución del grado de nudos se mantiene poissonniana. Para construir un modelo cuya distribución del grado de los nudos sea gobernada por una ley de potencia se puede utilizar un algoritmo, llamado modelo de Barabási-Albert, que consiste en añadir un nudo y unirlo a los nudos existentes (enumerados $i=1,...n$) con una probabilidad $p_i = k_i / \sum_{i=1}^n k_i$, llamada de conexión preferencial, proporcional al grado $k_i$ de cada nudo $i$. Son los modelos llamados sin escala, muy robustos o insensibles a los errores aleatorios pero muy vulnerables a los ataques sobre los nudos de alto grado o « hubs ». Pero en este modelo, la tasa de agregación tiende a 0 cuando el tamaño de la red aumenta, lo que no concuerda con la observación. La idea de red jerárquica, introducida por E. Ravasz del equipo de A. L. Barabási, busca eliminar ese problema [10].
Se trata de combinar de manera iterativa pequeñas agregaciones de motivos. Aquí hay un ejemplo de red jerárquica descrita en el artículo de Ravasz, donde el centro de un « módulo clave » está conectado a los « nudos periféricos » (pertenecientes a los sub-módulos periféricos) de tres « módulos periféricos » y los centros de esos módulos están interconectados.

Subrayemos que todo sub-grafo finito puede ser encontrado a distancia límite de cualquier nudo. Pero la naturaleza repetitiva de esa red es menos rígida que la del teselado de Kepler-Penrose o del árbol de Kenyon, donde todo sub-grafo es encontrado de manera fiel, es decir, teniendo en cuenta las aristas presentes y ausentes. En las redes jerárquicas, la tasa de agregación se acerca a una constante – que vale 0,606 para el ejemplo de arriba – independiente del número de los nudos, pero la función c(k) que mide la tasa de agregación de los nudos de grado k sigue una ley de potencia – $c(k) \sim k^{-1}$ para el ejemplo –. La red metabólica del bacilo Escherichia Coli está modelado por Ravasz y sus coautores utilizando ese tipo de red. Gracias a un proceso de reducción -ilustrado en la figura de abajo- ellos se limitan a una red modular, y luego se sirven de la invarianza de escala para afirmar su naturaleza jerárquica [11].

Como ya lo dije en el principio, se trata de ideas que no están totalmente establecidas. Pero, discutibles o no, a mi parecer dibujan un lindo boceto del rol de la biología en las matemáticas por venir [12]. La mirada sobre las matemáticas de comienzos del siglo XX, ahora que se conmemora el centenario de la muerte de Henri Poincaré, puede darnos una idea del tamaño del desafío y de sus peligros.

Notes

[1Se dice que un grafo es orientado si cada arista se identifica con una pareja ordenada provista, por lo tanto, de una orientación natural. Si se olvida la orientación definida por el orden de los extremos, el grafo se vuelve no orientado.

[2Los términos vértice y arista, usuales en la teoría de grafos, son a menudo reemplazados por nudo y arco cuando se habla de redes. Se llama grado o valencia de un nudo al número de nudos conseguido por un arco o vecinos (que coincide con el número de arcos provistos de nudo, excepto por multiplicidad.

[3La distancia promedio entre dos nudos está dada por \[l = 2 \Sigma \frac{d_{ij}}{n (n+1)}\] donde $n$ es el número de nudos y $d_{ij}$ es la distancia mínima entre dos nudos. En la red de tipo ’’mundo pequeño’’ esta distancia es pequeña.

[4Pensemos en Hollywood, donde ’’casi todo el mundo’’ ha trabajado con Kevin Bacon

[5La tasa de agregación o ’’clustering’’ de una red es el promedio de las cantidades $2e_v/k_v(k_v-1)$ asociadas a los nudos $v$, donde $e_v$ representa el número de aristas entre vecinos de $v$, y $k_v$ el grado de $v$. Cuando se dice que una red real muestra un grado de agregación elevado, es en comparación con una red aleatoria.

[6Desde un punto de vista determinista, se puede decir que el grado de nudos de una red sigue una ley de potencia cuando $p(k) =$ número de nudos de grado $k = c k^{-\gamma}$ donde $c$ y $\gamma$ son constantes. Si se piensa en el número de nudos como una variable aleatoria, se dirá que la distribución del grado de nudos está gobernada por una ley de potencia si la fracción del número de nudos de grado $k$ se acerca a la cantidad $c k^{-\gamma}$ cuando $k$ se vuelve cada vez más grande. Se escribe entonces
$p(k) \sim c k^{-\gamma} $. Los grafos aleatorios siguen una distribución de Poisson $p(k) \sim e^{-\gamma}\frac{\gamma^k}{k!}$.

[7R. Milo, S. Shen-Orr, S. Itzkovitz, N. Kashtan, D. Chklovskii, U. Alon, Motifs : Simple Building Blocks of Complex Networks. Science 298 (2002), 824-827.

[8Y. Artzy-Randrup, S. J. Fleishman, N Ben-Tal, L. Stone, Comment on ’’Network Motifs : Simple Building Blocks of Complex Networks’’ and ’’Superfamilies of Evolved and Designed Networks’’. Science, 305 (2004), 1107. En ese trabajo los autores construyen una ’’red de juguete’’ a partir de los nudos de una grilla compuesta por $30 \times 30$ cuadrados, donde la probabilidad de juntar dos nudos mediante un arco decrece con la distancia siguiendo una distribución gaussiana. Los motivos presentes en la red de neuronas del gusano C. elegans también están sobrerrepresentados en esa red aleatoria.

[9De la misma manera como el árbol de Kenyon me evoca fragmentos de Kafka y de Bach, la lectura del epílogo del libro An introduction to systems biology de Uri Alon (publicado por Chapman & Hall en Boca Raton, EEUU, en 2007) acerca del rol de la modularidad y de la probabilidad en los sistemas biológicos, inevitablemente me hace pensar en sus compañeros -los árboles indistinguibles del árbol de Kenyon – y en los teselados de Penrose.

[10Ravasz, A. L. Somera, D. A. Mongru, Z. N. Oltvai, A. L. Barabási, Hierarchical organization of modularity in Metabolic networks. Science, 297 (2002), 1551-1555.

[11Hay otros autores, como John Doyle, que critican este enfoque y que proponen otros modelos para explicar la arquitectura de algunas redes -a menudo ligadas a la ingeniería informática e industrial- que no tienen las propiedades de redes jerárquicas. La ley de escala para la tasa de agregación efectivamente es una condición necesaria pero no suficiente para la existencia de una estructura jerárquica. El modelo HOT (’’Highly Optimized Tolerance’’ o ’’Heuristic Optimized Tradeoff’’) propuesto por Doyle – que busca explicar el modo de optimizar los desempeños bajo limitaciones tecnológicas o económicas- se ha mostrado opuesto al de Ravasz, auto-disimilar y a escala rica. Pero la existencia de un ’’núcleo’’ en ese modelo es parecida a la del núcleo en el teselado de Durero : pese a que ya no haya estructura repetitiva o auto-similar (en un sentido por precisar) esto no significa que la red no mantenga una especie de repetitividad o de auto-similaridad consustancial a la noción de modularidad.

Aquí están los diferentes tipos de redes representados en la figura : (a) Modelo de Barabási-Albert (b) Modelo sin escala (c) Red mala (d) Red HOT

[12No pienso solamente en las ’’mathematical sciences’’, sino en las ’’core mathematics’’ para repetir las fórmulas utilizadas recientemente por F. Quinn en las Notices of the American Mathematical Society.

Partager cet article

Pour citer cet article :

Julio E. De Villegas, Jimena Royo-Letelier — «Redes» — Images des Mathématiques, CNRS, 2021

Crédits image :

img_7517 - Image obtenue de l’article de H. Jeong, S. P. Mason, A.-L. Barabási et Z. N. Oltvai, Lethality and centrality in protein networks. Nature 411, 41-42 (3 May 2001) doi:10.1038/35075138
img_7522 - Image obtenue de l’article de E. Ravasz, A. L. Somera, D. A. Mongru, Z. N. Oltvai, A. L. Barabási, Hierarchical organization of modularity in Metabolic networks. Science, 297 (2002), 1551-1555.
img_7523 - Image obtenue de l’article de J. C. Doyle, D. L. Alderson, L. Li, S. Low, M. Roughan, S. Shalunov, R. Tanaka, W. Willinger, The ‘‘robust yet fragile’’ nature of the Internet. Proc. Natl. Acad. Sci. USA, 102 (41) (2005), 14497-14502.

Commentaire sur l'article

Laisser un commentaire

Forum sur abonnement

Pour participer à ce forum, vous devez vous enregistrer au préalable. Merci d’indiquer ci-dessous l’identifiant personnel qui vous a été fourni. Si vous n’êtes pas enregistré, vous devez vous inscrire.

Connexions’inscriremot de passe oublié ?