VIDÉO - Un faux Obama (plus vrai que vrai) mis au point par des scientifiques

DirectLCI
INTELLIGENCE ARTIFICIELLE - Des chercheurs de l'université de Washington ont réussi à créer des vidéos de faux discours d'Obama plus vrai que nature, à partir de pistes audio. Une petite révolution dans le domaine du numérique mais qui soulève de nombreuses questions sur les utilisations possibles de cette nouvelle technologie.

Le visage est bien celui de l'ancien président américain, la voix aussi, pourtant il n'a jamais tenu les propos que cette vidéo lui prête. Ces images publiées par des informaticiens de  l'université de Washington ne sont pas tirées de discours de Barack Obama. Il s'agit d'un pure montage et le résultat est bluffant. Jusqu'à aujourd'hui, personne n'avait réussi à synchroniser avec autant de réussite le son avec les mouvement des lèvres et du visage. Alors comment ces chercheurs ont-ils fait ?


L'équipe d'informaticiens, financée en partie par Samsung, Google et Facebook Intel, a fabriqué un réseau de neurones artificiels qui permet de convertir des sons en mouvements faciaux. Ce réseau s'est alimenté de 14 heures de discours de Barak Obama, principalement ses allocutions hebdomadaires. Grâce à ces nombreuses sources, "il apprend à convertir ces éléments audio bruts en formes de la bouche", détaille Supasorn Suwajanakorn, le responsable principal de cette recherche. "Nous synthétisons une texture de (lèvres) de grande qualité (...) pour modifier (dans la vidéo finale) ce qu’il semble dire en concordance avec la piste audio d’origine."


Cette bouche de synthèse est donc apposée sur une autre vidéo du président, dont le contexte n'a rien à voir et ça fonctionne. Quelques améliorations devraient être apportées pour que les émotions faciales soient encore plus en concordance avec le ton employé car "les gens sont très sensibles à la moindre zone de la bouche qui ne semble pas réaliste", poursuit le responsable. "Dès que vous ne reproduisez pas au mieux les dents ou que le menton bouge au mauvais moment, on le voit tout de suite et ça paraît faux."

Conversations vidéo, reproductions historiques : de multiples applications

A quoi peut donc servir cette innovation, vous direz-nous ? "Une conversion réaliste de l’audio à la vidéo présente des usages pratiques, comme l’amélioration des visio-conférences pendant les réunions, ou encore la possibilité future de discuter avec une figure historique en réalité virtuelle grâce à la création d’images depuis l’audio", explique Ira Kemelmacher-Shlizerman, du département d’informatique et d’ingénierie de l’université. "C’est le genre d’avancée qui permettra d’aboutir à ces prochaines étapes."


Les logiciels de conversation en ligne comme Messenger et Skype pourraient également en bénéficier pour améliorer le rendu lorsque les résolutions sont mauvaises mais que le son est bon. 

De possibles dérives ?

Cette petite révolution dans le domaine de l'intelligence artificelle soulève tout de même quelques interrogations. Et si les utilisateurs de cette technologie l'utilisaient pour délivrer de fake news ? Comment à l'avenir discerner la réalité, des montages ? Steve Seitz, co-auteur de la recherche tente de rassurer : "nous prenons simplement de véritables mots prononcés par quelqu’un pour les transformer en vidéo de cette personne." Mais la prolifération de fausses informations sur les réseaux sociaux et la multiplication de faux sites d'informations nécessitent de ne pas prendre cette donnée à la légère.

Dans un autre registre, l'université de Washington avait déjà fait le buzz en créant des doubles digitaux de personnalités, des doppelgänger en 3D, déjà un premier pas vers la manipulation numérique.

Plus d'articles

Sur le même sujet

Lire et commenter