La bibliothèque de Babel

Tribune libre
Écrit par Stéphane Lamy
Publié le 9 mars 2010
« L’univers (que d’autres appellent la Bibliothèque) se compose d’un nombre indéfini, et peut-être infini, de galeries hexagonales, avec au centre de vastes puits d’aération bordés par des balustrades très basses. » 4En VO : « El universo (que otros llaman la Biblioteca) se compone de un número indefinido, y tal vez infinito, de galerías hexagonales, con vastos pozos de ventilación en el medio, cercados por barandas bajísimas.

Ainsi débute l’une des plus fameuses nouvelles de Jorge Luis Borges, où celui-ci joue avec l’idée d’une bibliothèque totale, qui contiendrait dans l’immensité inconcevable de ses innombrables salles TOUS les ouvrages possibles, dans toutes les langues, y compris celles encore à inventer… Un texte bref où le lecteur à la tournure d’esprit mathématique pourra trouver son content d’énigmes 5Le mathématicien Bill G. Bloch y consacre un ouvrage entier : « The unimaginable mathematics of Borges’ library of Babel », Oxford University Press.. On peut plus simplement y voir une allégorie de la perplexité du lecteur confronté à une masse d’information bien trop importante. Toute l’information est là, rangée quelque part, mais par son exhaustivité même elle en devient difficilement exploitable… Cette situation fait irrésistiblement penser à internet.

Sur internet, on peut trouver des masses d’information sur n’importe quelle sujet. Concernant le petit monde des mathématiques, évoquons quelques bases de données accessibles sur la toile :

ArXiv,  un serveur de preprints, ou prépublications en bon français, est librement accessible à tous, mais destinés à l’usage des chercheurs. Par exemple, si vous êtes intéressé par la géométrie algébrique, cliquez sur « Algebraic Geometry », et vous aurez accès à des textes de recherche mis en ligne ce jour même…

Mathematics Genealogy Project est un site de généalogie mathématique. Vous connaissez quelqu’un qui a soutenu sa thèse en mathématique ? Rentrez son nom, et vous trouverez le nom de son directeur de thèse (plus rarement de sa directrice), puis le nom du directeur de celui-ci… Voyez si vous pouvez remonter jusqu’à Hilbert, voire jusqu’à Gauss !

Math Sci Net et Zentralblatt sont les deux bases de données référençant les articles publiés couramment utilisées par les mathématiciens professionnels. J’ai l’impression que la première est la plus largement utilisée par la communauté des chercheurs, mais je vais pourtant choisir de parler de Zentralblatt. Trois raisons à cela :

  • 1 – Qui ne préfère pas Poulidor à Anquetil ?
  • 2 – Contrairement à Math Sci Net, le site Zentralblatt est (partiellement) ouvert à tous : la seule restriction est que seuls les trois premiers résultats de votre recherche vous sont accessibles si vous n’êtes pas abonnés (via votre université, dans le cas des chercheurs), mais cela n’empêchera de pouvoir reproduire la petite expérience qui va suivre ;
  • 3 – Il est possible sur Zentralblatt de faire une recherche suivant le critère de la langue.

Car enfin, avant de comparer la bibliothèque de Babel (où ne serait-ce que l’une de ses sous-sections) aux 2,9 millions (et des poussières) d’articles mathématiques recensés par Zentralblatt, il s’agit d’aller y voir de plus près. D’après la Genèse, chap. 11, verset 9 :

« Aussi la nomma-t-on Babel, car c’est là que Dieu confondit le langage de tous les habitants de la terre et c’est là qu’Il les dispersa sur toute la face de la terre. »

Curieux de savoir à quel point il y avait profusion de langues différentes dans le petit monde des publications mathématiques, j’ai donc cherché le nombre d’articles mathématiques publiés (depuis 1868 jusqu’à nos jours6 D’après la page d’accueil de Zentralblatt : « The ZMATH Database contains about 2.9 million entries drawn from about 3500 journals and 1100 serials from 1868 to present. » ) dans chacune des langues qui me passaient par la tête (et en m’aidant finalement de la page Wikipedia qui recense les langues les plus parlées au monde). J’ai obtenu le classement suivant :

  • 1- anglais (2 231 573) 76.7 %
  • 2- russe (188 215) 6.5%
  • 3- allemand (159 236) 5.5%
  • 4- français (150 579) 5.2 %
  • 5- chinois (68 615) 2.4 %
  • 6- italien (50 072) 1.7 %

Ces 6 premières langues représentent 98 % du total des publications (2 909 331, lors de ma recherche le 6 mars 2010)

Venaient ensuite dans l’ordre (avec certainement des oublis de ma part) : ukrainien (12093), espagnol (11787), roumain (8804), polonais (7115), hollandais (6500), japonais (5883), bulgare (3216), hongrois (2857), portugais (1737), suédois (1511), norvégien (980), grec (440), catalan (137), vietnamien (103), arabe (68), esperanto (53), hébreu (24), perse (17), hindi (7), bengali (2)…

Quelques brefs commentaires sur les places 2 à 6 : il y a en effet un nombre important de revues mathématiques russes, que je peux consulter couramment comme tout mathématicien lambda, non parce que je maîtrise le russe, mais parce qu’elles sont systématiquement traduites en anglais (voilà qui fait d’ailleurs encore gonfler un peu artificiellement le score du numéro 1…) Je suis assez partisan de cette démarche : écrire dans la langue où l’on est le plus à l’aise, puis traduire en anglais pour garantir un accès plus large. Comme il n’y a pas de traduction systématique des articles français (idée à saisir ?), je le fais moi-même de façon artisanale pour mes propres articles, sur ma page web… Pour ce qui est du chinois, je n’ai jamais été confronté à une référence vers un article dans cette langue, j’imagine donc que les 68615 publications ci-dessus doivent en grande majorité concerner des domaines mathématiques éloignés du mien. Quant à l’allemand et à l’italien, il m’est arrivé d’avoir à consulter un article dans ces langues, mais toujours pour des travaux anciens.

Cette dernière observation m’a conduit à opérer une recherche similaire, mais cette fois en me limitant aux articles parus au vingt et unième siècle (où se situe d’ailleurs essentiellement ma propre période d’activité).

Ma première surprise (car le classement ci-dessus n’en était pas vraiment une), est la proportion des articles de moins de dix ans par rapport à la masse des articles depuis 1868 : 30 pour cent !!! Soit un chiffre absolu de 869958 articles… Quant au classement par langue pour le 21ème siècle, le voici :

  • 1- anglais (798238) 91.7 %
  • 2- chinois (36899) 4.2 %
  • 3- russe (19302) 2.2 %
  • 4- français (7449) 0.9 %

Ces 4 premières langues représentent 99 % des publications totales (869958 au total)

Ce n’est bien sûr que par pur chauvinisme que je mentionne la 4ième place de la France, avec ce misérable 9 pour mille. Quant à l’Allemagne et l’Italie, je n’ose vous dire où elles ont sombré… Vous pourrez le constater par vous-même en vous amusant avec Zentralblatt.

Hmmm… 9 pour mille ? C’est justement pile mon poids sur Zentrallblatt : 9 entrées, toutes en français. J’ai pourtant écrit un dixième article dans une autre langue, mais semble-t-il dans une revue un peu trop obscure pour être référencée par Zentralblatt (pourtant Math Sci Net le mentionne ! N’est pas Anquetil qui veut !). Il s’agit de la « Revista del Seminario Iberoamericano de Matemáticas Singularidades en Tordesillas », qui a publié 3 glorieux volumes avant semble-t-il de s’éteindre en 2005. Mais bon, comme cet article était en espagnol, cela ne m’aide guère à rectifier ma statistique.

Comme j’imagine que mon facteur d’impact n’est pas bien fameux (je soupçonne qu’il y a comme une règle empirique que l’importance d’une revue est inversement proportionnelle à la longueur de son titre, en tous cas la « Revista » ne doit guère apporter d’eau à mon moulin), je ferais mieux de faire moins le malin est de travailler à rentrer dans le rang.

Bien. Je prends donc la solennelle résolution de m’efforcer de devenir un parfait mathématicien moyen du 21ème siècle, et de me conformer à la vérité incontournable des chiffres, que dis-je, à l’objectivité implacable des statistique. Résumons : 9 articles sur 1000 en français ? Au moins ça, c’est fait. Pour équilibrer mon score, me reste encore à écrire 917 articles en langue anglaise. C’est bien parti, mes deux derniers articles soumis sont en anglais, et un troisième est sur le feu… 917 papiers in english, cela n’a rien d’impossible. Prenez Paul Erdös (1355). Ou Edoardo Ballico (1037). Non, ce qui risque de s’avérer vraiment délicat, ce sont les 22 papiers en russe… Et je ne vous parle même pas des 42 en chinois…

ÉCRIT PAR

Stéphane Lamy

Professeur - Université Paul Sabatier, Toulouse 3

Partager