Ici, la qualité d’un logiciel tient souvent à la quantité de données qu’il peut utiliser pour s’entraîner, pour s’améliorer constamment. Des données qu’il faut stocker, traiter, disséquer -un processus qui s’est largement simplifié et dont le coût a baissé ces dernières années. Avec l’arrivée de processeurs dédiés et l’explosion de l’informatique dans le Cloud, la puissance disponible pour les développeurs a également décuplé. Plus besoin d’avoir à sa disposition de gros serveurs dédiés ou même des supercalculateurs, puisque il est possible désormais d'avoir accès en quelques clics à la puissance du Cloud de Google ou d’Amazon. De quoi expliquer que les développeurs n’aient souvent aucune idée du coût en CO2 de leurs créations.





Comme sujets d’étude, les chercheurs ont pris certains algorithmes connus, en l'occurrence quatre modèles mathématiques qui ont fait avancer le traitement du langage naturel, c'est-à-dire tout ce qui permet aux machines de comprendre les langues et d’écrire des textes automatiquement, des algorithmes utilisés tant par les assistants vocaux que pour la traduction automatique. Résultat : le raffinement des modèles employés va de pair avec une augmentation en flèche du coût environnemental, mais pas seulement. Un algorithme entraîné sur 65 millions d’échantillons coûtera ainsi quelques dizaines de dollars. Le même poussé à un paroxysme de précision peut coûter des millions de dollars, avec une empreinte CO2 qui grimpe en conséquence.