Actualités

AlphaGo Zero : le meilleur joueur de go du monde qui a tout appris tout seul en 36 h

Le 20 octobre 2017

C’est une nouvelle étape fascinante qui vient d’être franchie par les experts de l’intelligence artificielle : un article publié dans Nature et relayé dans Le club de la tête au carré ce vendredi annonce qu’AlphaGo Zero peut apprendre à jouer au go et parvenir au plus haut niveau de jeu tout seul, sans aucune donnée d’apprentissage !

Depuis deux ans, le programme d’intelligence artificielle DeepMind de Google défraie la chronique. Le jeu de go est réputé très difficile pour l’intelligence artificielle parce que le nombre de combinaisons à explorer est gigantesque, beaucoup plus grand que les échecs : l’intuition humaine semblait indispensable quand les calculs exhaustifs sont inaccessibles. Mais le programme AlphaGo a battu sèchement des joueurs professionnels : 4-1 contre Lee Sedol en mars 2016, 3-0 contre Ke Jie. Autrement dit, la domination humaine sur le jeu de go a fait long feu. La puissance de calcul nécessaire pour explorer un très grand nombre de combinaisons était décuplée par une étape d’apprentissage préliminaire, pendant laquelle AlphaGo « apprenait à jouer » grâce à une bibliothèque gigantesque de parties humaines, puis se perfectionnait en jouant contre lui-même.

Le tour de force de la nouvelle version, AlphaGo Zero, consiste à faire cette phase d’apprentissage sans aucune base de données, sans savoir humain spécifique du domaine du go, sans aucune heuristique ! La machine commence par jouer complètement au hasard et explore l’univers gigantesque des parties possibles de façon circonspecte, sans aller au bout de chaque partie. Vu l’étendue des possibles, c’était un vrai défi de réussir à « décoller » du niveau débutant et de tirer parti d’essais au hasard pour en tirer des connaissances sur le jeu. AlphaGo Zero a ainsi découvert en 36 heures ce que les humains ont mis 3000 ans à apprendre... puis il est allé plus loin !

C’est une avancée considérable parce que les algorithmes mis en jeu ne sont pas du tout spécifiques du domaine et sont donc (probablement) faciles à transposer. Cela ouvre la porte à des algorithmes qui pourront devenir intelligents par eux-mêmes, même dans des domaines où il n’y a pas de connaissances humaines.

Les deux derniers paragraphes sont une paraphrase des propos de Tanguy Chouard dans La tête au carré.

En savoir plus : le site de Nature

Partager cette actualité

La tribune des mathématiciens

Suivre IDM