Grâce à l’informatique, l’angoisse de la page blanche ne sera-t-elle bientôt qu’un lointain souvenir ? Autrement dit, peut-on demander à un ordinateur d’écrire un texte original et cohérent par un procédé automatique ?
Dans son article A Mathematical Theory of Communication publié en 1948, Claude Shannon, dont on célèbre le centenaire de la naissance cette année (voir aussi ici) a proposé une méthode simple pour produire un texte aléatoire. On commence par choisir un livre de référence, par exemple À la recherche du temps perdu de Marcel Proust. On ouvre une page au hasard et on pose son doigt au hasard sur la page ; on écrit sur une feuille le premier mot de la phrase indiquée – par exemple : « Le ». On ouvre ensuite une autre page du livre au hasard et on cherche la première apparition de ce mot à partir de cette page – par exemple « soutenaient légèrement le plafond s’écartaient ». On écrit alors sur notre feuille le mot suivant du livre – ici, « plafond ». On choisit à nouveau une page du livre au hasard et on cherche la première apparition de « plafond » à partir de cette page – par exemple : « suspendu au plafond par des » et on écrit le mot « par » sur notre feuille… Et ainsi de suite jusqu’à tomber sur un point. La suite donne, par exemple : « Le plafond par des yeux de clouer ses instruments interchangeables d’un coup qui n’eût paru quelque message d’elle […] ». L’ordinateur permet d’automatiser la procédure. Mais on aura du mal à faire passer la phrase obtenue pour du véritable Proust !
Depuis Shannon, d’autres méthodes plus élaborées ont été créées, dont certaines fondées sur le concept de « grammaire non contextuelle » introduit par le linguiste Noam Chomsky en 1956. Ces méthodes ont été récemment utilisées par le mathématicien Nate Eldredge pour créer le programme Mathgen, capable de produire automatiquement et en une fraction de seconde des articles formatés comme des articles de recherche en mathématiques, et qui ne contiennent que des phrases grammaticalement correctes, comme celle-ci : « la construction par Hito de domaines résolubles cocomplets d’Erdös a été une étape décisive dans le calcul elliptique. » Pour un profane, la différence avec un véritable article de recherche n’est sans doute pas flagrante, mais un mathématicien professionnel comprend très vite que le texte qu’il a sous les yeux n’a absolument aucun sens.
Ces galimatias ne devraient donc pas pouvoir aider à vaincre une crise d’inspiration. Pourtant, deux articles produits par Mathgen ont été acceptés pour publication dans des revues « scientifiques ». La publication dans ces revues se faisant aux frais de l’auteur, on peut imaginer que les éditeurs acceptent d’y publier tout ce qui ressemble de près ou de loin à des mathématiques, peu importe le contenu, et que le rapport d’expert, qui note que « les résultats obtenus sont originaux, nouveaux et intéressants » a lui aussi été produit par un procédé automatique… On est bien loin du fonctionnement standard des journaux scientifiques, dont les éditeurs, qui sont eux-mêmes des chercheurs, demandent à plusieurs spécialistes du domaine un rapport détaillé sur l’article avant de prendre leur décision. Face à la page blanche, en mathématiques comme ailleurs, inspiration et transpiration restent d’actualité !
N.B. L’article de Shannon de 1948 est considéré comme la fondation de la théorie de l’information. Outre la façon de décrire les textes présentée ici, il contient un contexte général pour penser un système de communication et les notions d’entropie de l’information et de redondance qui sont intensivement utilisées jusqu’à aujourd’hui. On peut le lire en ligne et il est analysé (en anglais) sur Wikipedia.
Post-scriptum
Le site de la conférence PopLang.
Ce texte appartient au dossier thématique « Maths et langage ».
17h55
Quand aura-t-on des textes cohérents ?
Ma question ramène à ce que vous avez écrit dans le sous-titre : « Peut-on demander à un ordinateur d’écrire un texte original et cohérent par un procédé automatique ? »
Mais le procédé proposé par Shannon et Mathgen ressemblent plus des jeux que de sérieux essais dans ce sens.
Ma question est : les procédés d’écriture automatique les plus avancés combien sont-ils proches de nous permettre l’écriture d’un texte cohérent ?
Par exemple ils pourraient aider les enseignants de latin dans les écoles, qui ne peuvent plus assigner des traductions de textes littéraires comme devoirs à la maison à ses élèves, car ils les répereront sur la toile déjà traduits.
19h21
Quand aura-t-on des textes cohérents ?
Oh oui ! Il y a des procédés beaucoup plus élaborés que celui que Shannon a inventé en 1948 et que Mathgen a en quelque sorte perfectionné. Évidemment ! Vous en entendez la preuve à travers les assistants vocaux des smartphones et, à l’écrit, Gmail peut vous proposer de rédiger les réponses à vos mails. Si cette technologie est à la portée de tous, c’est qu’elle est infiniment plus développée dans les laboratoires.
Autant dire que nous n’avons fait qu’effleurer le sujet et que l’écriture automatique en est bien au-delà du stade 2.0.
19h38
NB : Pendant son exposé au séminaire associé au cours de Yann LeCun au Collège de France, Yann Ollivier a écrit en direct un pastiche de L’Île mystérieuse de Jules Verne : on reconnaissait encore l’original face à l’imitation mais le procédé est déjà largement plus performant que ce que nous avons proposé ici.
Dans la catégorie « intelligence artificielle appliquée au langage écrit », on peut apprécier les progrès importants des moteurs de traduction automatique (même ceux qui sont disponibles en ligne) ou la reconnaissance de l’écriture (même sur des manuscrits médiévaux). Je suis sidéré que Tensorflow mette la reconnaissance des chiffres manuscrits à la portée d’un laptop quelconque programmé par un Béotien, ce qui était le point culminant des recherches il y a disons trente ans, et que les experts — par exemple cette collègue lyonnaise — soient sur le point de déchiffrer des manuscrits médiévaux.
18h32
Y-a-t-il des liens entre les procédés d’écriture automatique et la théorie logique des langages formels ?
Quels sont les progrès culturels et intellectuels faits par les études de ces procédés ?
Je pense à ce que les langages formels ont donné aux mathématiques, par exemple avec la théorie de la complexité par Chaitin, ou avec les travaux par Gödel, Turing, Church ; en particulier en permettant de comprendre mieux ce que nous pouvons nous attendre à une démonstration.
Et je remarque que les procédés automatiques de démonstration étaient bien avancés en 1979, quand Hofstadter écrivait, dans son livre « Gödel, Escher, Bach », qu’un de ces procédés, mis à l’épreuve de trouver la démonstration du théorème du triangle isocèle, l’un des plus simples de la géométrie euclidienne, avait trouvé la démonstration de Pappus, qui est si abstraite qu’on ne l’enseigne pas aux élèves d’école dans les cours élémentaires.
Donc j’aurai attendu que des procédés d’écriture automatique pussent donner bien plus qu’un pseudo-Proust sans aucun sens.