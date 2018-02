Pour créer une intelligence artificielle, les scientifiques utilisent différentes techniques regroupées sous une même discipline : l'apprentissage machine (ou machine learning, en anglais). Parmi ces techniques, figure l'apprentissage supervisé. "Actuellement, c'est la méthode la plus répandue. On l’utilise notamment pour tout ce qui est reconnaissance de plantes ou d’oiseaux", souligne Yann LeCun. Plus concrètement, les chercheurs collectent des millions d’images et indiquent à la machine à quelle espèce d'oiseau correspond chaque image. Ensuite, ils entraînent le système à produire une identification en fonction de l’image. "Cette technique d’apprentissage peut s’appliquer à tout un tas de scénarii, mais elle nécessite des quantités importantes de données", poursuit Yann LeCun.





Autre technique : l’apprentissage par renforcement ou apprentissage profond (deep learning). "Cela consiste à ne pas dire à la machine quelle est la réponse correcte, elle doit la trouver d’elle-même, grâce à un système de récompenses et de punitions", explique Jean-Gabriel Ganascia, professeur d’information à Sorbonne-Université et président du comité d’éthique du CNRS. Le scénario est similaire à l’entraînement d’un animal de cirque à qui l’on donne une friandise lorsqu’il exécute l’action désirée. "La limite de cette technique, en tout cas dans sa forme actuelle, c’est qu’elle nécessite de très nombreux essais, reprend Yann LeCun. Ça ne marche pas très bien pour le monde réel. Mais c’est très efficace, en revanche, pour tout ce qui est de l’ordre du jeu."





Ces deux types d'apprentissage peuvent se combiner. Ce fut le cas avec le célèbre AlphaGo, l’intelligence artificielle développée par Deep Mind (une entreprise rachetée en 2014 par Google). Avant de battre les champions du monde (humains) du jeu de go, le super-ordinateur a d’abord commencé par apprendre les techniques des meilleurs joueurs (apprentissage supervisé). Puis, il a joué des millions et des millions de parties contre une copie de lui-même. A force de remporter des victoires contre son double, il a fini par renforcer progressivement sa stratégie (apprentissage par renforcement). "De fil en aiguille, en analysant non pas toutes les parties possibles, mais une grande partie, la machine a fini par devenir quasiment imbattable", souligne Yann LeCun.