Bibliothèques numériques de mathématiques en France et dans le monde

Piste verte Le 24 octobre 2009  - Ecrit par  Thierry Bouche Voir les commentaires (1)

La bibliothèque est l’outil clé du mathématicien. L’avènement de la documentation électronique est a priori un atout considérable pour faciliter les recherches et accéder plus rapidement aux sources fiables dont se nourrit la recherche. De nombreux projets à travers le monde contribuent à réinventer la fonction bibliothèque dans ce nouveau monde numérique.

Les mathématiciens se contentent de mettre leur production à la disposition de tous, comme sur des étagères où l’on peut venir se servir.

(Jean-Pierre Serre [1]).

Spécificités de la documentation en mathématiques

Les mathématiques ne sont pas une science expérimentale [2]. L’intuition et l’analogie tiennent souvent lieu d’expérience, lesquelles se fondent sur la « culture » du chercheur, c’est-à-dire la collection d’énoncés et de méthodes qu’il a en tête lorsqu’il travaille. Cette culture est acquise en assistant à des exposés (séminaires, colloques, conférences...), par des échanges directs avec d’autres mathématiciens (de plus en plus souvent par voie électronique), et bien sûr en surveillant ce qui se (pré)publie [3].

Dans bien des cas, ces sources d’informations aboutissent à un seul objet : une liste de références à consulter pour y lire les énoncés précis des résultats, hypothèses et notations comprises, ainsi qu’un exposé des méthodes employées ou le détail des démonstrations, selon ce que l’on cherche à cette étape du travail. Parfois la valeur d’un article consulté réside entièrement dans sa bibliographie : s’il ne répond pas aux questions que l’on se pose, il arrive souvent qu’il cite l’oiseau rare.

On constate donc que la bibliothèque est l’outil critique du mathématicien : si une grande part de son activité consiste à identifier les ressources utiles pour ses recherches, il lui faut ensuite localiser un exemplaire disponible et en prendre physiquement possession.

Pour la première étape, la communauté mathématique ayant reconnu très vite la difficulté à trouver son chemin dans la masse toujours croissante des parutions, elle s’est dotée d’outils assez performants que sont les classifications par sujets, qui permettent notamment de surveiller ce qui paraît dans un domaine précis, et les journaux qui recensent la production mondiale, en leur adjoignant toute une collection de métadonnées (classification, analyse indépendante, adresse de l’auteur, etc.) dont la liste et la nature ont beaucoup varié au fil du temps [4].

L’avènement de la documentation électronique

Le « premier choc numérique » dans le domaine documentaire (la conversion des catalogues en bases de données) a atteint le secteur qui nous concerne vers 1990 : la possibilité de chercher un article à partir de quelques mots clés en quelques secondes a considérablement simplifié la vie des chercheurs, surtout à partir de 1995, lorsqu’il a été possible d’en bénéficier directement sur la Toile depuis n’importe quel ordinateur (les premières versions électroniques étaient des CD-ROM à prix d’or qui étaient en général consultables sur un ordinateur du laboratoire...). Le côté un peu décevant de ces outils était qu’à l’issue de recherches parfois pénibles [5] tout ce qu’on
obtenait, c’était une référence bibliographique précise, qu’il pouvait être fastidieux de localiser dans le monde réel.

C’est à ce stade qu’intervient le « second choc numérique » : la numérisation du corpus lui-même. Il devient alors possible de rajouter un simple lien au catalogue, et d’accéder au précieux article en un clic. Les bases de données [6]. MathSciNet (MSN) et Zentralblatt MATH (ZM) offrent à l’heure actuelle de l’ordre d’un million de tels liens (sur un total d’un peu moins de 3 millions de textes référencés), pointant pour la plupart vers des articles récents publiés directement au format électronique sur de très grandes plateformes depuis 1997 (Elsevier, Springer...) mais aussi vers de plus petites structures académiques (JSTOR, project Euclid, NUMDAM, CEDRAM...) Pour les autres types de sources documentaires comme les livres de référence ou les monographies de recherche, les liens sont beaucoup plus rares, même s’il existe parfois des versions électroniques (dont un assez grand nombre sont, il faut le reconnaître, pirates).

Une bibliothèque numérique mondiale et exhaustive ?

Spectateurs de toutes ces avancées qui ont un impact considérable sur leur environnement de travail quotidien, mais aussi acteurs (notamment à travers les sociétés savantes qui sont impliquées dans l’édition mais aussi dans la production des bases de données : MR est un service de l’AMS, ZM est supervisé par la société mathématique européenne (EMS)), les mathématiciens se sont mis à rêver d’une bibliothèque numérique mondiale et exhaustive aux alentours de l’an 2000. Cette bibliothèque numérique (dite DML : Digital mathematics library), conçue à l’origine, et de façon un peu naïve comme la transposition électronique de la bibliothèque que chaque mathématicien fréquente dans son laboratoire, comporterait dans ses rayonnages virtuels la totalité de ce qui s’est publié depuis les Éléments d’Euclide. Elle serait étroitement liée, peut-être intégrée, dans les bases de données, et surtout aussi navigable et gratuite que possible.

L’exhaustivité n’est pas un rêve : c’est seulement une question d’argent et de volonté. La totalité du corpus ne couvre pas plus de 100 millions de pages, selon des estimations crédibles : c’est moins que ce qui s’est publié dans le domaine biomédical depuis l’an 2000, cela représente une masse d’information modeste qui tiendrait sur un seul disque dur !

La « navigabilité » est, on l’a vu, une des motivations fortes pour la communauté. Quelle facilité si la machine fournit le lien ad hoc chaque fois que l’on souhaite suivre une référence [7] ! À comparer avec le nombre de sites qu’il faut connaître, de stratégies différentes qu’il faut y développer pour trouver quelque chose aujourd’hui...

Quant à la gratuité, elle intéresse bien peu les acteurs économiques. Elle aurait pourtant de grands bénéfices, notamment parce que les mathématiques étant assez largement la lingua franca de toute science, il serait bon que cette ressource basique soit disponible bien au-delà de l’environnemement professionnel du chercheur en mathématiques. Une autre raison, plus pragmatique, est que la navigation est assez frustrante et un tantinet stérile, si tous les liens pointent sur des portes closes.

En tant que projet global, la DML n’a pas avancé d’un pouce au cours des dix dernières années, malgré le soutien de l’Union mathématique internationale (IMU), de la Société mathématique européenne (EMS) et la tenue de nombreuses rencontres internationales sur le sujet. En revanche, la formalisation de ce projet a donné l’impulsion à des nombreuses initiatives locales qui ont vu le jour un peu partout dans le monde [8]. Les rencontres DML ont permis qu’une concertation minimale existe entre ces projets. Ceci nous incite aujourd’hui à imaginer la DML comme une mise en réseau horizontal de ces petites bibliothèques plutôt que comme un vaste chantier centralisé et pyramidal, au final irréalisable.

Un projet européen pourrait cependant être amené à développer au cours des trois prochaines années un accès intégré aux collections des principales bibliothèques numériques publiques européennes : ce serait le premier effort supranational dans ce domaine. Il est probable que cela donne une nouvelle impulsion au niveau mondial.

Un état des lieux

Aujourd’hui, si nous sommes toujours très loin d’avoir approché les ambitions du projet DML, le contenu mathématique disponible au format numérique est tout à fait considérable : il représente entre un sixième et un tiers de la totalité du corpus, le tiers des articles référencés dans les bases de données dispose d’un lien vers son texte intégral, bien que de très nombreuses ressources y échappent, en général parce qu’elles sont produites et gérées d’une façon un peu trop amateur. C’est sur le point des barrières d’accès que la situation est le plus décevante : conçue comme un service public dans un monde qui perd progressivement cette notion, la DML peine à trouver un modèle économique viable.

Des intérêts puissants se sont dressés contre la création d’une base de données indépendante et gratuite permettant de naviguer librement dans la littérature. Constatant l’intérêt des mathématiciens pour leur patrimoine scientifique, les éditeurs commerciaux ont entrepris de numériser leur propre fonds auquel ils vendent désormais un accès tarifé. Les projets américains comme JSTOR ou Euclid, ne pouvant compter sur des crédits récurrents, assurent leur pérennité en commercialisant l’accès à leurs services à un tarif qui peut nous paraître prohibitif [9]. L’IMU a recommandé depuis longtemps que les articles deviennent librement accessible à l’issue d’un certain délai pendant lequel l’éditeur récupère ses coûts de production (valeur généralement suggérée : 5 ans). Si cette recommandation a été entendue de nombreux acteurs académiques, elle n’a pas ébranlé les éditeurs commerciaux.

Le microcosme français

La France représente à peu près 1 % de la population mondiale mais, du fait de sa longue tradition de qualité en mathématiques, plutôt 2-3 % de la population du corpus qui nous occupe. Le virage numérique entrepris très tôt avec Gallica, et l’avancement du programme NUMDAM conduit au sein de la Cellule MathDoc par l’auteur de ces lignes en font néanmoins l’un des fers de lance des projets en cours, notamment au niveau européen où, si le modèle français n’est pas reproductible à l’identique, il est partiellement transposable. Avec ses 50 000 documents, la combinaison des bibliothèques publiques françaises (Gallica pour les livres, NUMDAM pour les articles de revues, TEL pour les thèses, en simplifiant un peu) est le quatrième réservoir mondial (après JSTOR : 260 000, projet Euclid : 100 000, et l’Allemagne : 85 000). Du point de vue de l’ergonomie, de la navigation, de la qualité des contenus et de la facilité d’accès aux documents, NUMDAM est souvent cité comme l’exemple à suivre. De fait, ce qui avait été lancé comme un projet pilote de numérisation des principales revues académiques françaises de mathématiques (pures) est désormais une véritable bibliothèque numérique couvrant tout le spectre mathématique publié en France depuis le XIXe siècle, avec les Annales de Gergonne, jusqu’à très récemment, en collaboration avec les éditeurs qui transfèrent pour archivage leur production numérique (plus de 10 % du contenu, soit environ 70 000 pages à ce jour), et dont environ 95 % est disponible en accès libre (les articles de moins de 5 ans sont en général disponibles auprès de leur éditeur uniquement sur abonnement).

Article édité par Jacques Istas

Notes

[1Selon Michel Broué : « Jean-Pierre Serre et le métier de mathématicien », Images des mathématiques. CNRS, 2006.
p. 28—29, et ce site.

[2L’expérience est parfois possible dans ce domaine, par exemple à l’aide de simulations numériques, ou d’illustrations de principes mathématiques dans la réalité, ce dont les articles de ce site ne se privent guère !

[3La publication dans les revues à comité de lecture d’articles sous leur forme définitive prend un temps assez long en mathématiques, car les « referees » doivent non seulement certifier l’originalité, la pertinence et la qualité des travaux, mais aussi comprendre le détail des démonstrations, demander des clarifications si nécessaire, et suggérer des améliorations de la présentation lorsque celle-ci nuit à la compréhension. Cette lenteur est très importante pour la fiabilité du corpus mathématique de référence, car le risque serait grand de voir des théories entières bâties sur des résultats faux publiés prématurément. Mais comme la recherche se fait dans l’urgence, la circulation des idées a pris d’autres chemins plus directs, notamment ce qu’on appelle les prépublications (texte d’article rédigé selon les standards de la profession, mais non encore validé par un comité de rédaction), qui ont aussi leur contrepartie électronique depuis 1992 : serveur américain arXiv, français HAL.

[4Un intéressant panorama de l’état de ces projets au début du XXe siècle est exposé par Laurent Rollet et Philippe Nabonnand, « Une bibliographie mathématique idéale ? le Répertoire bibliographique des sciences mathématiques », Gazette des mathématiciens 92 (2002), 11-26.

[5Mais certainement infiniment plus rapides qu’avec les outils antérieurs. Il faut voir que l’on peut se retrouver à chercher un papier à partir de quelques indications approximatives données oralement !

[6MathSciNet, Mathematical Reviews on the Web : http://www.ams.org/mathscinet/ ; ZMATH, the Zentralblatt MATH database : http://www.zentralblatt-math.org/zmath/.

[7De façon interne, comme cette note, une référence à un énoncé ou une équation numéroté... mais aussi et surtout de façon externe pour atteindre les articles cités, leur analyse MR ou ZM, d’autres articles similaires, etc.

[8Pour être tout à fait rigoureux, précisons que quelques projets de numérisation étaient déjà en cours à l’époque de la formalisation du projet DML, ils en furent les membres fondateurs : les projets allemand ERAM. américain Euclid, et français NUMDAM notamment. Un projet de « bibliothèque de journaux vivants » porté par l’EMS faisait déjà figure d’ancêtre : The Electronic Library of Mathematics sur le serveur EMIS. Des projets généralistes diffusant un important contenu mathématique servirent aussi d’inspiration, comme le vénérable Gallica de la Bibliothèque nationale de France, ou l’archive américaine de journaux savants JSTOR.

[9Une particularité assez diabolique de l’édition électronique est que le coût marginal de diffusion est nul, mais les frais d’investissement sont très élevés (chaîne de production plus stricte que pour l’édition papier, vastes plateformes de gestion et de diffusion). Si l’on peut couvrir les frais fixes en facturant un nombre restreint de clients riches au prix fort, il devient possible de négocier au cas par cas chaque nouvel abonnement. La gratuité est alors « inutile » puisque tout le monde peut être abonné à un prix qu’il peut se permettre, du moment qu’une certaine opacité du système est préservée... Le paradoxe est que des entreprises à but non lucratif comme celles que nous venons de citer affectent la moitié de leur personnel aux forces de vente !

Partager cet article

Pour citer cet article :

Thierry Bouche — «Bibliothèques numériques de mathématiques en France et dans le monde» — Images des Mathématiques, CNRS, 2009

Commentaire sur l'article

  • Bibliothèques numériques de mathématiques en France et dans le monde

    le 11 novembre 2009 à 07:37, par Rachid Matta MATTA

    Monsieur Thierry Bouche

    Les Bibliothèques numériques de mathématiques en France et dans le monde rendent un grand service aux chercheurs.

    Je vous serai reconnaissant si vous mettez sur cette page les deux articles suivants :
    1 - Le papier de la démonstration du cinquième postulat lu par Lagrange en 1806 devant l’Académie des Sciences.

    2 - La Preuve présentée par Carton en 1868 et soutenue par M. bertrand, Secrétaire perpétuel de l’Académie.

    Merci
    Amicalement

    Rachid Matta MATTA
    Le 11 novembre 2009

    Répondre à ce message

Laisser un commentaire

Forum sur abonnement

Pour participer à ce forum, vous devez vous enregistrer au préalable. Merci d’indiquer ci-dessous l’identifiant personnel qui vous a été fourni. Si vous n’êtes pas enregistré, vous devez vous inscrire.

Connexions’inscriremot de passe oublié ?

Dossiers

Cet article fait partie du dossier «Bibliothèques et périodiques mathématiques» voir le dossier

Suivre IDM