Le data-mining, l'intelligence artificielle au service du fisc

par Cédric INGRAND
Publié le 2 juillet 2020 à 8h37

Source : JT 20h Semaine

BOÎTE NOIRE - Quelques mois après les annonces de Bercy, les nouveaux dispositifs de détection de fraude fiscale portent leurs premiers fruits. Mais que détectent-ils au juste et comment ? Et s'agit-il d'ailleurs vraiment d'intelligence artificielle ? Explications.

Mettre "fisc", "réseaux sociaux", et "intelligence artificielle" dans la même phrase, c'est forcément créer un mélange détonnant. En ajoutant votre vie en ligne à la somme d'informations qu'elle détient déjà sur vous, l'administration fiscale possède désormais une vue très précise de vos activités, professionnelles ou privées. Et cela porte ses fruits, comme l'a confirmé Bercy le 1er juillet, lors de la présentation des chiffres des recettes des derniers contrôles  fiscaux.

L'exemple le plus couramment mis en avant avant le vote de la loi, c'est l'observation du train de vie - ce que l'on appelait les "signes extérieurs de richesse" quand le fisc compulsait attentivement les pages des magazines people pour détecter voitures de luxe et villégiatures qui auraient pu échapper à l'impôt. Pourtant, et en tout cas pour le moment, ce n'est pas de ce genre de détection qu'il s'agit. Comme l'expliquait en novembre 2019 Gérald Darmanin, pendant la période d'expérimentation de trois ans que délimite la loi, les boîtes noires de Bercy sont parties à la chasse de trois infractions précises : le commerce de marchandises prohibées, l'activité professionnelle non déclarée et la domiciliation fiscale frauduleuse.

Réseaux sociaux, commerce entre particuliers, des terrains de chasse passés à la loupe

Si la loi de finances ne dressait pas la liste précise des sites et des plateformes que les serveurs du fisc on commencé à exploiter, ce sont en fait tous ceux où un contribuable est susceptible d'être identifié et de publier des informations publiques. Dans le lot, forcément, les réseaux sociaux, Twitter/Facebook/Instagram en tête. Autre grand terrain de chasse, tous les grands services de mise en relation, LeBonCoin ou eBay pour les petites annonces, et AirBnB pour l'hébergement entre particuliers. Bref, tous ces sites qui peuvent vous servir occasionnellement ou devenir les supports d'une véritable activité régulière. Voici quelques cas pratiques :

1 - Le commerce de marchandises prohibées

Ce délit-là concerne surtout les services des Douanes, qui ont désormais accès aux mêmes outils de détection que leurs camarades du fisc. Si les agents surveillent déjà les plateformes de vente en ligne, l'automatisation de la détection leur permet de faire remonter beaucoup plus d'affaires. Ici, on recherche les particuliers ou les professionnels qui vendraient en ligne des articles interdits en France ou dont la détention et/ou le commerce sont réglementés. La liste est longue : on y trouve les drogues bien sûr, mais aussi les contrefaçons, les armes, les médicaments - vrais ou faux - ou encore certains cosmétiques autorisés ailleurs mais illicites chez nous. 

2 - L'activité professionnelle non déclarée

S'il est une infraction où le traitement automatisé fait merveille, c'est bien le travail non déclaré. Vous vendez une armoire ancienne sur LeBonCoin ? Rien de répréhensible à cela. Si en revanche le logiciel comprend que vous vendez des meubles anciens à longueur d'années et sur plusieurs plateformes, alors ce n'est plus du vide-grenier de particuliers, c'est bien une activité de brocanteur. Idem pour les adeptes du dropshipping, qui créent publicités et sites de commerce en ligne où ils revendent les articles de grandes plateformes, souvent étrangères - on pense par exemple à AliExpress - en laissant le vendeur original gérer la logistique. Cette activité économique 100% en ligne laisse peu de traces dans le monde réel mais beaucoup d'indices sur Internet. 

L'exemple vaut aussi pour AirBnB et ses concurrents, où la location occasionnelle de votre chambre d'amis et la location quasi-permanente de cinq studios dans votre immeuble n'ont pas du tout les mêmes conséquences fiscales. Là encore, c'est la triangulation du volume de transactions et de vos déclarations d'impôt qui font remonter les petites et grandes fraudes à la surface. 

3 - La domiciliation fiscale frauduleuse

Cette fraude-là ne concerne a priori que certains hauts revenus. C'est aussi celle qui demande le plus de finesse aux algorithmes du fisc. Le procédé est connu : déclarer votre résidence fiscale à Londres ou Bruxelles, où la fiscalité sur les capitaux ou les plus-values est moindre, alors que vous passez dans les faits l'essentiel de votre temps en France. Jusque-là, en cas de contrôle, l'administration pouvait demander au fraudeur soupçonné la preuve de ses déplacements et de sa présence hors de France plus de six mois par an. Avec les données glanées en ligne, comme la localisation des publications sur les réseaux sociaux par exemple, le logiciel peut commencer à retracer les déplacements et comprendre où sa cible passe le plus clair de son temps.

Pas de résultats sans vérification humaine

Quelle que soit l'infraction, le système n'est générateur que d'alertes ou d'indices. Aux agents du fisc de corroborer les intuitions du logiciel ou de les infirmer en comprenant mieux le contexte des informations glanées par la machine. Ce n'est pas parce que vous vous prenez en photo devant une voiture de sport sur la Place du Casino à Monaco que vous êtes forcément un exilé fiscal en puissance, que vous blanchissez vos revenus mal acquis en les faisant passer pour des gains aux jeux ou que vous êtes forcément le propriétaire du bolide... ou les trois en même temps. Dans tous les cas, ce sont les vérificateurs du fisc qui reprennent chaque dossier à la main.

Fraude fiscale : les contrôles de plus en plus efficacesSource : JT 20h Semaine

Un danger pour la vie privée ?

Si la CNIL avait exprimé ses réticences face aux premières annonces du dispositif, tant Bercy que la loi de finances avaient posé des gardes-fous assez clairs. D'abord, sur internet, les robots du fisc n'ont pas plus de pouvoir qu'un internaute lambda : ils accèdent uniquement aux informations et aux photos que vous publiez en mode public. Pour avoir accès à vos publications ou messages privés, il faudrait en passer par une procédure judiciaire qui, elle, ne s'automatise pas. La loi précise également que le système s'interdit d'utiliser la reconnaissance faciale pour retrouver toutes vos photos en ligne, même celles publiées par des tiers ou sur des pages qui ne vous identifient pas. En outre, toutes les données collectées doivent être effacées sous trente jours si elles ne donnent pas lieu à enquête plus poussée. 

Mais les données en ligne ne sont que la partie émergée de l'iceberg de big data auquel les agents de Bercy ont déjà accès : vos documents fiscaux bien entendu, mais aussi les déclarations sociales de vos employeurs, de la Caf, de l'Urssaf ou de Pôle Emploi, tout comme la liste de vos comptes bancaires. En fait, parler d'intelligence artificielle tient, comme souvent, de l'abus de langage : dans l'IA, le logiciel apprend et s'améliore constamment, ce qui ne semble pas être le cas ici. Cette corrélation entre des données disparates tient plutôt du big data, ou du datamining,  c'est-à-dire quand le logiciel plonge dans les profondeurs des fichiers pour y trouver les meilleurs pépites. Avant même l'ajout des plateformes en ligne au périmètre de ses analyses, l'utilisation du datamining sur les seules données administratives aurait permis au fisc de récupérer près de 700 millions d'euros en impôts et pénalités depuis le début de cette année.


Cédric INGRAND

Tout
TF1 Info