Le super-ordinateur AlphaGo, tombeur du champion du monde du jeu de go, à son tour terrassé

Le super-ordinateur AlphaGo, tombeur du champion du monde du jeu de go, à son tour terrassé

DirectLCI
IMPRESSIONNANT - AlphaGo avait surpassé le champion du monde du jeu de go l’an dernier. Il a été terrassé par son successeur AlphaGo Zero. Le super-ordinateur développé par DeepMind a appris en autodidacte à jouer en quelques jours avant de s’imposer 100 à 0. Une victoire pour l'intelligence artificielle de Google qui a réussi son exploit sans apprentissage humain.

En 2016, AlphaGo était parvenu à battre le champion du monde de go, le Sud-Coréen Lee Se-Dol, par quatre parties à une, créant une mini-tempête dans le milieu des grands maîtres du jeu qui avaient néanmoins salué la performance technologique. Pour réaliser son exploit, le super-ordinateur avait été nourri par des centaines de milliers de parties jouées par des professionnels et des amateurs. Ce qui lui avait permis "d'apprendre", pendant plusieurs mois, à copier le raisonnement humain par "deep learning" (l'apprentissage profond).


Le go est un jeu complexe avec un nombre de combinaisons possibles astronomique. Les programmes informatiques, bien que très forts en calcul, ne peuvent donc pas passer en revue toutes les possibilités pour choisir la bonne mais doivent imiter les concepts stratégiques de l'homme. Il fallait donc trouver un autre moyen de s'auto-former.

AphaGo a récemment "remis son titre en jeu", raconte une étude publiée par la revue Nature. Et il a subi une cuisante défaite 100 à 0. Son tombeur : son successeur, AlphaGo Zero. Ce dernier est la toute nouvelle version du programme développé par l’entreprise britannique DeepMind, filiale de Google spécialisée dans l’intelligence artificielle. A la différence du premier super-ordinateur, AlphaGo Zero peut désormais apprendre "en s’affranchissant de la connaissance humaine".

En vidéo

AlphaGo 1 - humain 0 : victoire de la machine face au meilleur joueur de go du monde

Parti de zéro pour apprendre par lui-même

"Il est sans doute le meilleur joueur de go de l’histoire", ont commenté Demis Hassabis et David Silver, deux de ses concepteurs. "Plus puissant", AlphaGo Zero fonctionne désormais avec une seule machine, là où son prédécesseur en avait besoin de plusieurs pour réaliser tous les calculs. Et il peut surtout "apprendre tout seul à jouer au go", souligne l’étude.


Pour s'entraîner, AlphaGo Zero a joué contre lui-même, "en partant de 0" sans autre connaissance sur le go que les règles du jeu. Au bout de trois jours, il avait déjà acquis les connaissance d'un joueur débutant. Il lui aura fallu 40 jours d’entraînement et quelque 30 millions de parties disputée pour battre son homologue 2016 à l'aide de stratégies inconnues des humains. "Ce n'est pas le premier logiciel qui apprend par lui-même. La nouveauté, c'est que AlphaGo Zero soit si bon", souligne le futurologue Anders Sandberg de l'Université d'Oxford. Mais aussi qu’il soit capable d’apprendre en n’étant "plus contraint par les limites de la connaissance humaine", ajoutent les concepteurs du projet.


L’auto-apprentissage des ordinateurs va permettre de faire des bonds dans certains domaines où les exemples ou connaissances étaient minces. "Nous sommes très excités parce que nous pensons que c'est maintenant assez bon pour faire de réels progrès sur de vrais problèmes", a expliqué Demis Hassabis en conférence de presse. Mais si elle peut se passer avec succès de l'expérience humaine pour se perfectionner, la machine dépend néanmoins toujours de l'intelligence des hommes: "Les brillantes idées qui ont permis d'améliorer le programme ont été générées par l'homme", précise Anders Sandberg. "AlphaGo ne se programme pas tout seul !"


Le jeu de go consiste à occuper la majeure partie d'un plateau de jeu à l'aide de pierres noires ou blanches en construisant des territoires et en encerclant les pierres de son adversaire pour en faire des prisonniers.

Plus d'articles

Sur le même sujet