J’ai toujours été impressionné (et bien des fois dérangé) par la crédibilité a priori donnée aux mathématiciens 11 Malheuseurement, je pense que cette crédibilité n’est pas accordée de manière égale aux mathématiciennes… (et en général, à ceux qui développent une science exacte) face à la communauté. Bien que ceci soit souvent fort mérité, c’est parfois soit mal compris soit mal utilisé, notamment par certaines autorités qui utilisent des arguments de type technique afin de limiter/abréger artificiellement des discussions d’intérêt public. Dans les derniers mois, j’ai été assez surpris de constater que cette crédibilité un peu aveugle est souvent partagée par d’autres disciplines scientifiques (dites sciences molles), alors que certaines des idées qui en émanent sont d’une richesse conceptuelle enviées par d’autres sciences, y compris les mathématiques.
Enfin, je ne prétends pas (et me sens incapable de) résoudre cette question si difficile. La crédibilité donnée aux mathématiciens est un fait, et face à cette situation il est toujours important de rappeler la responsabilité que nous avons face à la société.
Un cas d’étude : la théorie du META-LEARNING
Durant des années, le psychologue M. Losada a travaillé aux États Unis et a réalisé une expérience assez originale. Il fit construire une salle de réunion spéciale (appelée son laboratoire) dans laquelle il fit venir les équipes de direction de nombreuses entreprises pour y tenir ses séances de travail. Depuis une salle à coté, il a observé la dynamique de ces réunions, en prenant note non seulement du nombre d’interactions mais aussi du type (positive ou négative, orientée vers les autres ou orientée vers soi-même, persuasive ou inquisitrice). Ces données en main, il est arrivé à des conclusions telles que : les équipes dont les membres sont trop déconnectés les uns des autres ne fonctionnent pas bien ; la même chose se produit pour celles dont le taux de positivité face à la négativité est bas ; si ce taux augmente et dépasse une certaine limite, alors la dynamique devient plus riche (équipe de haute performance) et le taux devient très haut (expansion de l’espace émotionnel), etc. Je pense qu’il n’est pas nécessaire d’être spécialiste d’une quelconque branche scientifique pour être d’accord du moins partiellement avec ces conclusions.
Encore insatisfait de son travail, Losada a essayé de modéliser mathématiquement ses expériences, afin de donner plus de poids à ses conclusions (survalorisation d’une science dure par rapport à une science molle ?). Ceci a donné lieu à Los, que je vous suggère de lire (en intégralité) avant de continuer. Pour le confort du lecteur, je traduis ci-dessous un paragraphe de la page 182 qui me semble très répresentatif du style d’approche au problème :
«Puisque le modèle devait engendrer des séries temporelles concordantes avec les caractéristiques générales des séries répertoriées dans le laboratoire, il était clair qu’il devait inclure des termes non linéaires qui
représentent l’interaction dynamique entre les comportements observés. L’une de ces interactions était entre attitude persuasive/inquisitrice et orientation vers soi-même/vers les autres. Si je note \(X\) le premier et \(Y\) le deuxième, leur interaction devrait être représentée par le produit \(XY\), qui est un terme non linéaire. À partir des données du laboratoire, je savais aussi que cette interaction devait être un facteur du taux de changement de l’espace émotionnel (que je note \(Z\)). De plus, j’avais aussi besoin d’un paramètre de normalisation d’échelle pour \(Z\). Par conséquent, le taux de changement de \(Z\) devrait s’écrire \[\frac{dZ}{dt} = XY – aZ,\]
où \(a\) est un paramètre de normalisation qui doit être constant.
À partir de mes observations dans le laboratoire, je savais aussi que la connectivité jouait un rôle très important sur le niveau de persuasion/inquisition. Donc, elle devait interagir avec \(X\), et le produit de cette interaction devait faire partie du taux de changement de \(Y\), avec une relation de type effet retard entre \(Y\) et \(X\). J’avais aussi besoin de soustraire l’interaction entre \(X\) et \(Z\) (qui peut-être représentée par le terme non linéaire \(XZ\)) et de \(Y\) avec elle-même. Comme conséquence, le taux de changement de \(Y\) devrait s’écrire \[\frac{dY}{dt} = cX – XZ – Y,\]
où \(c\) est un paramètre de contrôle qui représente la connectivité et qui doit varier d’une catégorie de performance à l’autre.
Finalement, d’après les séries temporelles enregistrées dans le laboratoire, le taux de changement de \(X\) devait être une fonction de la différence entre \(Y\) et le niveau de \(X\). Donc, avec l’inclusion d’un nouveau paramètre de normalisation, le taux de changement de \(X\) devrait s’écrire
\[\frac{dX}{dt} = b (Y – X),\]
où \(b\) est un paramètre (constant) de normalisation.
J’ai réalisé que, avec la seule exception du nom et de l’ordre des termes et des lettres choisies pour représenter les différents paramètres, ces équations étaient les mêmes
que celles trouvées par Lorenz pour son modèle et publiées dans l’un des articles scientifiques les plus cités [[Lor->#Lor]].»
On trouvera ici le texte original
«Thinking about the model that would generate time series that would match the general characteristics of the actual time series observed at the Capture Lab, it was clear that it had to include nonlinear terms representing the dynamical interaction among the observed behaviors. One such interaction is that between inquiry-advocacy and other-self. If I call the first \(X\) and the second \(Y\), their interaction should be represented by the product
\(XY\), which is a nonlinear term. I also knew from my observations at the lab, that this interaction should be a factor in the rate of change driving emotional space (which I will call \(Z\)). In addition, I would need a scaling parameter for \(Z\). Consequently, the rate of change of \(Z\) should be written as \[\frac{dZ}{dt} = XY – aZ,\]
where \(a\) is a scaling parameter that would be held constant.
From my observations at the lab, I also knew that connectivity had a critical incidence on the level of inquiry-advocacy and, consequently, it should interact with \(X\) and the product of this interaction should be part of the rate of change of \(Y\), according to the characteristics of the time series observed, where there was a lead-lag relationship between \(Y\) and \(X\). I also
needed to discount the interaction between \(X\) and \(Z\) (which would be represented by the nonlinear
term \(XZ\)) and \(Y\) with itself, so that the rate of change of \(Y\) should be written as
\[\frac{dY}{dt} = cX – XZ – Y,\]
where \(c\) is the control parameterrepresenting connectivity, as measured by the nexi index, and should be varied according to the nexi number for each team performance category.
Finally, and in accordance with the characteristics of the time series generated at the lab, the rate of change of \(X\) should be a function of \(Y\), discounting the level of \(X\); so that with the inclusion of a scaling parameter, the rate of change of X should be written as
\[\frac{dX}{dt} = b (Y – X),\]
where \(b\) is a scaling parameter to be held constant.
I realized that, except for some differences in the arrangement of the terms and the letters chosen to designate the parameters, these were the same set of coupled nonlinear differential equations that Lorenz had chosen for his model and published in one of the most often cited papers in science [[Lor->#Lor]]. »
Sans aucun doute, ce paragraphe (ainsi que la totalité de l’article) n’a pas la rigueur souhaitée. Outre le fait qu’il n’y a pas de justification théorique du modèle proposé, sa pertinence peut être mise en cause par le fait que les enregistrements auxquels on se réfère ne sont pas fournis dans l’article 12J’ai consulté directement l’auteur — qui est aujourd’hui un peu éloigné du milieu académique (notamment mathématique) —, et il m’a signalé qu’il n’a gardé aucune copie de ces enregistrements. Cependant, d’après lui, J.-C. Rota aurait eu accés à ces données, et il aurait recommandé la publication de Los.. Ceci serait largement suffisant pour discréditer du point de vue mathématique ce qui est proposé dans Los. Cependant, il suffit d’un petit effort de type épistémologique pour réaliser que les données extrapolées à partir du modèle final sont parfois concordantes avec celles acceptées plus haut, et en suggèrent d’autres encore plus risquées 13Ma préferée est celle qui stipule que les ailes du papillon de Lorenz auraient une interprétation de type mystique : l’aile gauche représente des moments d’interrogation, alors que l’aile droite correspond à des périodes de persuasion..
Il est important de souligner que le modèle proposé dans Los consiste en un système d’équations différentielles qui —un peu par miracle— coïncident avec celles proposées par Lorenz pour modéliser l’évolution des conditions atmosphériques et qui sont l’un des point de départ de la fameuse théorie du chaos (voir Lor). Ces équations ont été aussi retrouvées dans la description de la croissance/décroissance de populations en écologie, mais à ma connaissance, elles n’avaient pas encore été introduites en sciences humaines.
Afin de laisser ouverte la discussion, je ne m’exprimerais pas sur la qualité scientifique de Los. Néanmoins, quelques réflexions s’imposent. Tout d’abord, il me paraît évident que les procédures souvent très strictes pour une publication mathématique n’ont pas bien fonctionné dans ce cas 14Le lecteur notera que les dates de soumission et de publication de Los sembleraient être les mêmes. Cependant, j’ai consulté le directeur du journal, qui m’a signalé que cette situation est plutôt due à un problème de modus-operandi, et en aucun cas ne signifie que l’article ne fut soumis à un review. En fait, jusque récemment, un problème similaire se produisait au Comptes Rendus de l’Académie des Sciences, où l’on prenait comme date de présentation officielle d’un article celle à laquelle l’article avait été présenté par l’un des membres du comité éditorial aux autres membres…: on aurait dû demander à l’auteur d’apporter les données empiriques du laboratoire afin de les comparer avec celles du modèle. De plus, je trouve lamentable le fait que Los n’ait pas été indexé ni dans Math Reviews ni dans Zentralblatt, alors que tous les autres articles du même numéro du journal l’ont été 15Cela peut paraître un peu étrange, mais c’est une pratique habituelle de certains journaux, notamment ceux qui publient des articles où les mathématiques sont utilisées en tant qu’outil et ne sont pas le point d’étude central.. Comme conséquence, il est bien possible que, jusqu’à ce jour, très peu de mathématicien(ne)s ont lu Los 16Si l’on regarde google-scholar on notera que, si Los a bien déjà été cité dans 106 articles, aucun d’entre eux n’a été publié dans un journal de mathématiques..
Enfin, le monde a tendance à avancer un peu plus vite que les mathématiques, et tandis que de nombreuses questions à propos de Los me semblent tout-à-fait raisonnables, sa seule publication lui a donné une légitimité au point de fonder une nouvelle théorie (le Meta-Learning) dont elle constitue le plus important (peut être unique ?) soutien théorique. C’est ainsi qu’un certain paramètre de bifurcation bien connu 17Je remercie I. Guerra pour m’avoir montré la suite précise de calculs qui mène à la constante 2.9013 en question. est appelé dans certains milieux ligne de Losada 18Voir ici ; de plus, notre cher attracteur de Lorenz serait en train d’être renommé complexor, ou papillon de Losada 19Voir là . La situation est d’autant plus délicate que cette théorie est dejà enseignée comme quelque chose de définitif dans plusieurs universités, elle est appliquée dans l’organisation de certaines entreprises, et elle fait aussi partie des politiques publiques de certains pays20Notamment, des pays en voie de développement, car les équipes de haute performance devraient permettre réaliser la tâche difficile de faire beaucoup de choses avec très peu de moyens. . De plus, l’auteur jouit d’une grande réputation, et dans ses conférences il se permet des phrases assez risquées sur les politiques d’organisation et des salaires qui sont relevées comme des vérités intouchables par son public, car celui qui les émet a été validé par ce monde complexe et impitoyablement précis des mathématiques…
Notre communauté ne possède que très peu de moyens pour traiter ce type de cas. De ce point de vue, il me semble qu’Images des Mathématiques représente une opportunité pour une discussion mathématique au delà de la structure classique des publications. Je profite alors de cet espace pour resoumettre Los à un jugement massif : s’agit-il d’un cas de pseudo-science validé d’une manière un peu irresponsable, ou plutôt d’un petit coup de génie que la communauté mathématique n’a pas su valoriser ?
Je laisse ouverte la discussion. Je voudrais néanmoins prévenir mes collègues mathématicien(ne)s que, même si très probablement leur première impression de Los ne sera pas forcément positive, ceci est tout-à-fait concordant avec la théorie extra-mathématique développée : il s’agirait plutôt d’une réaction orientée vers soi même et chargée de négativité, facteurs qui tous deux empèchent un bon fonctionement collectif car ils entravent l’épanouissement personnel… Et si ce type d’argument ne parait pas très convaincant, il pourrait être utile de rappeler que, bien que l’article originel de Lorenz Lor contienne l’une des découvertes les plus importantes des mathématiques du vingtième siècle, il n’a pas été publié dans un journal mathématique, mais tout simplement dans un journal de météorologie…
Références
E. Lorenz. Deterministic nonperiodic flow. Journal of Atmospheric Sciences, Vol. 20 (1963), 130-141.
M. Losada. The complex dynamics of high performance teams. Math. and Computing Modelling, Vol. 30 (1999), 179-192 ; accés abonnés Elsevier
9h42
Voir les 13 commentaires