En cherchant un mot dans le dictionnaire, je note une fois de plus la façon ingénieuse dont ils sont rangés, qui permet de retrouver celui qu’on cherche si rapidement. L’idée est simple et merveilleuse : on commence par classer les mots d’après leur première lettre, suivant l’ordre alphabétique : tous les mots commençant par A viendront avant tous ceux commençant par B, eux-même précédant tous ceux commençant par C. Puis dans chacun de ces groupes ayant la même lettre initiale, on considère la seconde lettre : tous les mots ABxxx viendront avant tous les mots ACxxx. Et ainsi de suite, jusqu’à ce que toutes les lettres du mot aient été successivement comparées à celles des autres mots, l’absence de lettre étant prise comme « lettre 0 » de l’alphabet : « an » vient avant « ancien », « à » est définitivement le premier mot du dictionnaire et l’onomatopée zzz….zzz à toutes les chances de rester longtemps le dernier.
Le plus remarquable est que les potentialités de ce classement sont infinies : n’importe quel mot étranger, néologisme, terme inventé, nom propre ….. trouvera sa place, unique, au milieu des mots familiers déjà répertoriés. Cette infinité de mots potentiels, futurs, imaginaires, aléatoires, ayant leur place entre deux mots existants rappelle cette nouvelle de Jorge Luis Borges, Le Livre de Sable, décrivant un livre fabuleux recelant une infinité de pages entre deux quelconques d’entre elles. Une belle image de la droite réelle ! Et de fait, cet ordre du dictionnaire a un statut mathématique, sous le nom d’ordre lexicographique, relié à la notion de continu. Il est utilisé pour construire un ordre sur des suites finies partant d’un ordre sur l’ensemble où sont pris les éléments de ces suites, exactement comme l’ordre alphabétique nous permet de dire si un mot vient avant l’autre. Si on y inclut les mots de longueur infinie, nous obtenons un ensemble qui a la puissance du continu. En particulier, l’ordre naturel sur les nombres réels de l’intervalle [0,1[ correspond à l’ordre lexicographique pour les suites de leurs décimales : 0, 133 est inférieur à 0, 134 et le nombre 0, 1333333 …. (où le dernier chiffre est répété à l’infini) est compris entre les deux précédents.
Et le lien avec les structures fractales annoncé dans le titre ? Nous allons considérer l’ensemble de Cantor le plus simple, qu’on qualifie de « triadique ». Il est obtenu par la procédure suivante : on part de l’intervalle (au départ [0,1]), qu’on subdivise en trois parties égales, et on retire celle du milieu. Les deux parties conservées, [0,1/3] et [2/3, 1], sont à leur tour subdivisées en trois parties égales, où l’on retire celle du milieu, ce qui donne quatre intervalles de longueur 1/9. Et ainsi de suite, à l’infini. A la limite, le résultat de cette procédure récursive est un ensemble très lacunaire, de mesure (masse) nulle, d’intérieur vide (il ne contient pas d’intervalles), mais non dénombrable. L’ordre lexicographique est alors étroitement relié à la façon de donner l’adresse d’un point sur cet ensemble de Cantor : à chaque subdivision, on attribue le label 0 aux parties gauches et le label 1 aux parties droites (les parties que l’on garde). Par exemple, les points de la partie de l’ensemble de Cantor contenue dans [2/9, 1/3] auront tous une adresse commençant par « 01 ». Et c’est ainsi qu’on montre que l’ensemble de Cantor peut être mis en correspondance avec l’ensemble des réels de l’intervalle [0,1]. En effet, on peut représenter chaque nombre réel de l’intervalle par une suite de 0 et de 1, où les chiffres successifs viennent en facteur d’une puissance croissante de 1/2, exactement comme les décimales familières viennent en facteur d’une puissance croissante de 1/10. De même que ces puissances de 1/10 justifient le nom de « décimales », le développement d’un nombre réel de [0, 1[ en puissance de 1/2 s’appelle son « développement dyadique », empruntant cette fois au grec et non plus au latin. Et par l’intermédiaire de ce développement, chaque point de l’ensemble de Cantor, via son adresse, représente un nombre réel de l’intervalle [0,1].