Mathématiques et langages : le feuilleton de la rentrée

Écriture automatique 2.0

El 11 septiembre 2017  - Escrito por  Jérôme Germoni, Pierre-Antoine Guihéneuf, Frédéric Le Roux Ver los comentarios (4)

Grâce à l’informatique, l’angoisse de la page blanche ne sera-t-elle bientôt qu’un lointain souvenir? Autrement dit, peut-on demander à un ordinateur d’écrire un texte original et cohérent par un procédé automatique?

Dans son article A Mathematical Theory of Communication publié en 1948, Claude Shannon, dont on célèbre le centenaire de la naissance cette année (voir aussi ici) a proposé une méthode simple pour produire un texte aléatoire. On commence par choisir un livre de référence, par exemple À la recherche du temps perdu de Marcel Proust. On ouvre une page au hasard et on pose son doigt au hasard sur la page; on écrit sur une feuille le premier mot de la phrase indiquée – par exemple: «Le». On ouvre ensuite une autre page du livre au hasard et on cherche la première apparition de ce mot à partir de cette page – par exemple «soutenaient légèrement le plafond s’écartaient». On écrit alors sur notre feuille le mot suivant du livre – ici, «plafond». On choisit à nouveau une page du livre au hasard et on cherche la première apparition de «plafond» à partir de cette page – par exemple: «suspendu au plafond par des» et on écrit le mot «par» sur notre feuille... Et ainsi de suite jusqu’à tomber sur un point. La suite donne, par exemple: «Le plafond par des yeux de clouer ses instruments interchangeables d’un coup qui n’eût paru quelque message d’elle [...]». L’ordinateur permet d’automatiser la procédure. Mais on aura du mal à faire passer la phrase obtenue pour du véritable Proust!

Depuis Shannon, d’autres méthodes plus élaborées ont été créées, dont certaines fondées sur le concept de «grammaire non contextuelle» introduit par le linguiste Noam Chomsky en 1956. Ces méthodes ont été récemment utilisées par le mathématicien Nate Eldredge pour créer le programme Mathgen, capable de produire automatiquement et en une fraction de seconde des articles formatés comme des articles de recherche en mathématiques, et qui ne contiennent que des phrases grammaticalement correctes, comme celle-ci: «la construction par Hito de domaines résolubles cocomplets d’Erdös a été une étape décisive dans le calcul elliptique.» Pour un profane, la différence avec un véritable article de recherche n’est sans doute pas flagrante, mais un mathématicien professionnel comprend très vite que le texte qu’il a sous les yeux n’a absolument aucun sens.

Ces galimatias ne devraient donc pas pouvoir aider à vaincre une crise d’inspiration. Pourtant, deux articles produits par Mathgen ont été acceptés pour publication dans des revues «scientifiques». La publication dans ces revues se faisant aux frais de l’auteur, on peut imaginer que les éditeurs acceptent d’y publier tout ce qui ressemble de près ou de loin à des mathématiques, peu importe le contenu, et que le rapport d’expert, qui note que «les résultats obtenus sont originaux, nouveaux et intéressants» a lui aussi été produit par un procédé automatique... On est bien loin du fonctionnement standard des journaux scientifiques, dont les éditeurs, qui sont eux-mêmes des chercheurs, demandent à plusieurs spécialistes du domaine un rapport détaillé sur l’article avant de prendre leur décision. Face à la page blanche, en mathématiques comme ailleurs, inspiration et transpiration restent d’actualité!

 

N.B. L’article de Shannon de 1948 est considéré comme la fondation de la théorie de l’information. Outre la façon de décrire les textes présentée ici, il contient un contexte général pour penser un système de communication et les notions d’entropie de l’information et de redondance qui sont intensivement utilisées jusqu’à aujourd’hui. On peut le lire en ligne et il est analysé (en anglais) sur Wikipedia.

Post-scriptum :

Ce texte appartient au dossier thématique «Mathématiques et langages».

Article édité par Jérôme Germoni

Comparte este artículo

Para citar este artículo:

Jérôme Germoni, Pierre-Antoine Guihéneuf, Frédéric Le Roux — «Écriture automatique 2.0» — Images des Mathématiques, CNRS, 2017

Créditos de las imágenes:

Imagen de portada - Domaine public. Source Wikimedia Commons, retravaillée en sépia par GIMP.

Comentario sobre el artículo

Voir tous les messages - Retourner à l'article

  • Quand aura-t-on des textes cohérents ?

    le 21 de septiembre de 2017 à 17:55, par Carlo

    Ma question ramène à ce que vous avez écrit dans le sous-titre : « Peut-on demander à un ordinateur d’écrire un texte original et cohérent par un procédé automatique ? »
    Mais le procédé proposé par Shannon et Mathgen ressemblent plus des jeux que de sérieux essais dans ce sens.
    Ma question est : les procédés d’écriture automatique les plus avancés combien sont-ils proches de nous permettre l’écriture d’un texte cohérent ?
    Par exemple ils pourraient aider les enseignants de latin dans les écoles, qui ne peuvent plus assigner des traductions de textes littéraires comme devoirs à la maison à ses élèves, car ils les répereront sur la toile déjà traduits.

    Répondre à ce message

Dejar un comentario

Foro sólo para inscritos

Para participar en este foro, debe registrarte previamente. Gracias por indicar a continuación el identificador personal que se le ha suministrado. Si no está inscrito/a, debe inscribirse.

Conexióninscribirse¿contraseña olvidada?

Registros

Este artículo es parte del registro «Mathématiques et langages» consulte el registro
La traducción del sitio del francés al castellano se realiza gracias al apoyo de diversas instituciones de matemáticas de América Latina.