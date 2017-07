Le visage est bien celui de l'ancien président américain, la voix aussi, pourtant il n'a jamais tenu les propos que cette vidéo lui prête. Ces images publiées par des informaticiens de l'université de Washington ne sont pas tirées de discours de Barack Obama. Il s'agit d'un pure montage et le résultat est bluffant. Jusqu'à aujourd'hui, personne n'avait réussi à synchroniser avec autant de réussite le son avec les mouvement des lèvres et du visage. Alors comment ces chercheurs ont-ils fait ?





L'équipe d'informaticiens, financée en partie par Samsung, Google et Facebook Intel, a fabriqué un réseau de neurones artificiels qui permet de convertir des sons en mouvements faciaux. Ce réseau s'est alimenté de 14 heures de discours de Barak Obama, principalement ses allocutions hebdomadaires. Grâce à ces nombreuses sources, "il apprend à convertir ces éléments audio bruts en formes de la bouche", détaille Supasorn Suwajanakorn, le responsable principal de cette recherche. "Nous synthétisons une texture de (lèvres) de grande qualité (...) pour modifier (dans la vidéo finale) ce qu’il semble dire en concordance avec la piste audio d’origine."





Cette bouche de synthèse est donc apposée sur une autre vidéo du président, dont le contexte n'a rien à voir et ça fonctionne. Quelques améliorations devraient être apportées pour que les émotions faciales soient encore plus en concordance avec le ton employé car "les gens sont très sensibles à la moindre zone de la bouche qui ne semble pas réaliste", poursuit le responsable. "Dès que vous ne reproduisez pas au mieux les dents ou que le menton bouge au mauvais moment, on le voit tout de suite et ça paraît faux."