"Il est sans doute le meilleur joueur de go de l’histoire", ont commenté Demis Hassabis et David Silver, deux de ses concepteurs. "Plus puissant", AlphaGo Zero fonctionne désormais avec une seule machine, là où son prédécesseur en avait besoin de plusieurs pour réaliser tous les calculs. Et il peut surtout "apprendre tout seul à jouer au go", souligne l’étude.





Pour s'entraîner, AlphaGo Zero a joué contre lui-même, "en partant de 0" sans autre connaissance sur le go que les règles du jeu. Au bout de trois jours, il avait déjà acquis les connaissance d'un joueur débutant. Il lui aura fallu 40 jours d’entraînement et quelque 30 millions de parties disputée pour battre son homologue 2016 à l'aide de stratégies inconnues des humains. "Ce n'est pas le premier logiciel qui apprend par lui-même. La nouveauté, c'est que AlphaGo Zero soit si bon", souligne le futurologue Anders Sandberg de l'Université d'Oxford. Mais aussi qu’il soit capable d’apprendre en n’étant "plus contraint par les limites de la connaissance humaine", ajoutent les concepteurs du projet.





L’auto-apprentissage des ordinateurs va permettre de faire des bonds dans certains domaines où les exemples ou connaissances étaient minces. "Nous sommes très excités parce que nous pensons que c'est maintenant assez bon pour faire de réels progrès sur de vrais problèmes", a expliqué Demis Hassabis en conférence de presse. Mais si elle peut se passer avec succès de l'expérience humaine pour se perfectionner, la machine dépend néanmoins toujours de l'intelligence des hommes: "Les brillantes idées qui ont permis d'améliorer le programme ont été générées par l'homme", précise Anders Sandberg. "AlphaGo ne se programme pas tout seul !"





Le jeu de go consiste à occuper la majeure partie d'un plateau de jeu à l'aide de pierres noires ou blanches en construisant des territoires et en encerclant les pierres de son adversaire pour en faire des prisonniers.