Environnement : l'intelligence artificielle laisse-t-elle une empreinte carbone bien réelle ?

par Cédric INGRAND
Publié le 11 juin 2019 à 17h49

Source : JT 20h Semaine

CO2 - Une étude l’affirme: en inventant des algorithmes d’une puissance sans précédent, leurs développeurs ont aussi créé des monstres en terme d’empreinte carbone. Et donc de danger pour l'environnement ?

Une intelligence artificielle qui émettrait autant de CO2 que cinq voitures à moteur thermique sur toute leur durée de vie ? La comparaison peut frapper. Et c’est d’ailleurs probablement le but des chercheurs de l’université d’Amherst, aux États-Unis. Ils sont partis d’un constat : si l’intelligence artificielle, un peu comme l’industrie minière, consiste à raffiner des données pour en extraire la richesse, elle a aussi un impact environnemental mesurable.

Pour comprendre pourquoi, il faut comprendre les principes du "machine learning" : plutôt que de créer un logiciel en lui donnant des règles, comme une recette à suivre,  il donne à la machine les moyens d’apprendre d’elle-même. C’est ainsi que fonctionnent par exemple aujourd’hui l’essentiel des algorithmes de reconnaissance d’image. Plutôt que de mettre en équation ce à quoi ressemble la photo d’un chien, le "machine learning" permet à l’algorithme de l’apprendre de lui-même en étudiant des millions de photos existantes.

Des algos costauds, mais gourmands

Ici, la qualité d’un logiciel tient souvent à la quantité de données qu’il peut utiliser pour s’entraîner, pour s’améliorer constamment. Des données qu’il faut stocker, traiter, disséquer -un processus qui s’est largement simplifié et dont le coût a baissé ces dernières années. Avec l’arrivée de processeurs dédiés et l’explosion de l’informatique dans le Cloud, la puissance disponible pour les développeurs a également décuplé. Plus besoin d’avoir à sa disposition de gros serveurs dédiés ou même des supercalculateurs, puisque il est possible désormais d'avoir accès en quelques clics à la puissance du Cloud de Google ou d’Amazon. De quoi expliquer que les développeurs n’aient souvent aucune idée du coût en CO2 de leurs créations.

Comme sujets d’étude, les chercheurs ont pris certains algorithmes connus, en l'occurrence quatre modèles mathématiques qui ont fait avancer le traitement du langage naturel, c'est-à-dire tout ce qui permet aux machines de comprendre les langues et d’écrire des textes automatiquement, des algorithmes utilisés tant par les assistants vocaux que pour la traduction automatique. Résultat : le raffinement des modèles employés va de pair avec une augmentation en flèche du coût environnemental, mais pas seulement. Un algorithme entraîné sur 65 millions d’échantillons coûtera ainsi quelques dizaines de dollars. Le même poussé à un paroxysme de précision peut coûter des millions de dollars, avec une empreinte CO2 qui grimpe en conséquence.

Une équation à plusieurs inconnues

Si les chiffres impressionnent, ils ne peuvent être que théoriques. Difficile en effet de mesurer, à la tonne de CO2 près, l’empreinte carbone des machines utilisées par les développeurs. Dans leurs calculs, les chercheurs d’Amherst ont utilisé comme postulat une consommation énergétique et une empreinte carbone qui seraient une valeur moyenne aux États-Unis. Les mêmes calculs n’auraient pas donné les mêmes résultats en France  étant donné l’importance du nucléaire dans notre mix énergétique. 

Mais ces résultats peuvent aussi changer selon les infrastructures informatiques utilisées, par exemple quand elles tirent profit de datacentres alimentés par des énergies vertes, comme ceux de Google au nord des États-Unis ou dans les pays nordiques. Le pire n’est donc jamais sûr. Le travail des chercheurs d’Amherst aura au moins le mérite de pousser les développeurs à s’inquiéter à cette variable supplémentaire.


Cédric INGRAND

Tout
TF1 Info