L’IA locale est-elle une solution (un peu) plus sobre ?

Face à l’explosion de l’empreinte carbone et hydrique des centres de données cloud, l’alternative d’une intelligence artificielle exécutée directement sur nos ordinateurs personnels ou sur de petits serveurs d’entreprise gagne en crédibilité. Mais ce passage à l’échelle locale constitue-t-il une véritable révolution écologique ou seulement un transfert de pollution ?

Chaque jour, des millions d’utilisateurs sollicitent des IA génératives pour rédiger un courriel, traduire un texte ou coder une application. Derrière l’apparente immatérialité de ces requêtes se cache pourtant une réalité physique bien concrète : une consommation d’énergie considérable et une utilisation massive d’eau potable difficilement compatibles avec les contraintes de la transition écologique. Une question s’impose alors : et si une partie de la solution résidait dans l’IA « locale », exécutée directement sur nos ordinateurs ou au sein de petits clouds privés d’entreprise ?

L’illusion dématérialisée et le choc de la réalité

La généralisation de l’IA générative au sein des organisations crée une situation paradoxale. Un récent article paru dans Le Monde mettait en évidence la problématique des départements de responsabilité sociétale des entreprises et des associations de protection de l’environnement, pourtant en première ligne sur les questions de transition écologique, devenus de gros utilisateurs de ces outils pour rédiger des rapports de durabilité ou optimiser leur communication, au prix d’une forte dissonance cognitive (1). Ce déploiement massif s’effectue dans un angle mort écologique quasi complet, d’autant que beaucoup d’organisations n’ont pas défini de cadre interne pour ces usages.

Ce phénomène s’inscrit dans un contexte numérique français déjà préoccupant. Avant même l’essor grand public de l’IA générative, le numérique représentait 4,4 % des émissions nationales de gaz à effet de serre en 2022 et pourrait voir son empreinte tripler d’ici 2050 en l’absence de mesures de sobriété fortes (2). Les centres de données français, infrastructures indispensables à ces services, ont vu leur consommation électrique augmenter de 38 % en trois ans (3).

À l’échelle internationale, l’emballement est encore plus spectaculaire. L’Agence internationale de l’énergie anticipe un doublement de la consommation d’électricité des centres de données d’ici 2026, pour atteindre près de 1 000 TWh par an, soit l’équivalent de la consommation électrique annuelle du Japon (4). Dans le même temps, les émissions de Google ont augmenté de 48 % en cinq ans, principalement sous l’effet des besoins en calcul liés à l’IA (5). La montée en charge des usages est vertigineuse : OpenAI indiquait en 2025 traiter plusieurs milliards de prompts quotidiens sur ChatGPT, transformant chaque micro-usage en contribution à un phénomène industriel mondial (6).

Les fleuves évaporés de l’intelligence artificielle

Si l’impact carbone des centres de données est désormais mieux documenté, la consommation d’eau de l’IA reste encore largement sous-estimée, alors qu’il s’agit d’un enjeu écologique majeur. Pour maintenir les processeurs à des températures acceptables et éviter une dégradation irréversible des performances, la plupart des infrastructures recourent à des systèmes de refroidissement par évaporation en circuit ouvert, où l’eau est vaporisée dans l’atmosphère pour dissiper la chaleur, disparaissant ainsi des ressources locales (7).

L’entraînement initial d’un modèle de langage de taille intermédiaire comme GPT-3 aurait ainsi nécessité environ 700 000 litres d’eau douce pour l’électricité et le refroidissement (8). Un centre de données de 100 mégawatts peut utiliser près de 2 millions de litres d’eau par jour, soit la consommation d’environ 6 500 foyers, tandis que les plus grands complexes peuvent évaporer plusieurs millions de litres quotidiens lors des pics de chaleur (7)(9).

L’empreinte hydrique varie fortement selon l’efficacité des infrastructures. Une requête complexe adressée à un modèle de raisonnement avancé peut consommer plusieurs dizaines, voire centaines de millilitres d’eau sur certains serveurs, alors que des centres de données optimisés réduisent fortement cette consommation grâce à des technologies de refroidissement plus efficaces (9). Paradoxalement, pour optimiser l’évaporation et limiter la corrosion, ces centres sont souvent construits dans des régions à l’air sec, déjà soumises à un stress hydrique sévère, accentuant les tensions avec l’agriculture et les usages domestiques (7). L’empreinte en eau démarre bien avant l’exploitation : une seule usine de semi-conducteurs peut consommer plusieurs dizaines de millions de litres d’eau ultrapure par jour (9).

Le grand écart énergétique d’un prompt

Sur le cycle de vie d’un modèle d’IA, la majorité de la consommation électrique totale provient de l’usage quotidien, l’inférence, bien davantage que de la phase d’entraînement initiale (9). En revanche, la consommation d’une requête individuelle varie énormément selon le modèle, le type de tâche demandé et l’optimisation de l’infrastructure.

Une enquête de Reporterre, s’appuyant sur les travaux de chercheurs des universités de Rhode Island et de Tunis, montre qu’une simple question adressée à un modèle avancé, générant une réponse courte d’environ 300 mots, consomme environ 40 % d’électricité de plus qu’une recherche sur un moteur classique (7). Cet écart, inférieur à certaines estimations anciennes qui évoquaient un facteur dix à quinze, illustre les progrès récents en matière de mise en cache et d’optimisation des architectures cloud.

Mais cette efficacité apparente ne vaut que pour certains usages limités. Dès que la réponse s’allonge, que la mise en cache ne fonctionne plus ou que l’on passe à des modèles de raisonnement approfondi, la consommation augmente fortement. Certaines estimations académiques évoquent des écarts de consommation d’un facteur dix à cinquante entre des modèles compacts optimisés et des modèles de raisonnement avancés (9).

Le mix électrique reste déterminant : à service équivalent, une requête exécutée sur un centre de données alimenté par un mix faiblement carboné, comme en France ou en Scandinavie, émet plusieurs fois moins de CO₂ qu’aux États-Unis ou dans des régions dépendantes du charbon (3)(4).

Le réflexe local : quand nos ordinateurs reprennent le contrôle

Face au coût environnemental des architectures centralisées, l’exécution locale de modèles d’IA suscite un intérêt croissant. L’hypothèse est simple : dans l’immense majorité des usages du quotidien, rédaction, reformulation ou synthèse, il n’est pas nécessaire d’interroger des modèles géants de plusieurs centaines de milliards de paramètres. Des modèles ouverts, plus compacts et spécifiquement optimisés suffisent à traiter efficacement une grande partie des usages (9).

Les ordinateurs personnels récents et les petits serveurs d’entreprise bénéficient désormais de puces sobres intégrant mémoire unifiée, large bande passante et unités de traitement neuronal dédiées à l’IA. Ces architectures permettent de faire tourner des modèles locaux de taille intermédiaire à des vitesses satisfaisantes, avec une consommation relativement limitée. Contrairement au cloud, où les serveurs et systèmes de refroidissement fonctionnent en continu, la charge locale est généralement ponctuelle : la machine s’active quelques secondes pour générer une réponse puis retombe en veille à faible consommation. Pour l’utilisateur ou la petite structure, l’impact sur la facture d’électricité reste relativement faible et l’empreinte hydrique directe est quasi inexistante, les ordinateurs étant refroidis par air.

Cette sobriété locale doit toutefois être nuancée à l’échelle macro. Pour des volumes massifs de requêtes traités en continu, les grands centres de données demeurent nettement plus efficaces par watt consommé que des terminaux dispersés (9). L’intérêt écologique de l’IA locale ne repose donc pas sur une supériorité énergétique absolue, mais sur la réduction du trafic réseau, la diminution des appels API récurrents et surtout la mobilisation de modèles plus petits, mieux ajustés aux besoins réels.

Matériel : cycle de vie et effet rebond

Considérer l’IA locale comme une solution écologique évidente reviendrait à ignorer les fondamentaux de l’analyse de cycle de vie. En France, les travaux de l’ADEME montrent que la phase de fabrication concentre une large part de l’empreinte carbone totale d’un terminal numérique (2)(3). L’extraction et le raffinage des métaux critiques et terres rares nécessaires aux puces de pointe génèrent pollutions, consommation d’eau industrielle et impacts sociaux majeurs. Cette pression matérielle s’illustre de manière dramatique dans les mines de cobalt de la République démocratique du Congo, où des enfants continuent de travailler dans des conditions extrêmement dangereuses, comme le documente régulièrement Amnesty International (10).

Dans ce contexte, l’achat de nouveaux ordinateurs ou de serveurs locaux dédiés uniquement à l’IA peut rapidement devenir une aberration écologique et humaine. Un renouvellement anticipé du parc annule souvent les gains d’usage par rapport au cloud (9). Une adoption non maîtrisée de l’IA locale fait également peser un risque d’effet rebond matériel : la multiplication de millions de petits processeurs dédiés, souvent sous-utilisés et rapidement obsolètes, pourrait entraîner une consommation globale de ressources minérales et un volume de déchets électroniques supérieur à celui d’infrastructures centralisées correctement optimisées.

La première règle de sobriété reste donc l’allongement de la durée de vie des équipements existants. Prolonger de plusieurs années l’usage d’un parc informatique professionnel permet de réduire fortement son empreinte carbone (2)(3). L’IA locale ne devient écologiquement pertinente que si elle est exécutée sur des terminaux déjà en place, amortis et idéalement mutualisés.

Coffre-fort numérique : sécurité et souveraineté en bonus

Si les bénéfices écologiques de l’IA locale exigent une gestion rigoureuse, les arguments liés à la sécurité des données et à la souveraineté numérique s’avèrent immédiatement tangibles pour les organisations. Dans les architectures cloud traditionnelles, le transfert systématique de données confidentielles, médicales ou financières vers des serveurs distants gérés par des entreprises tierces présente des risques structurels d’interception, d’exploitation commerciale ou de violation de la confidentialité. Selon IBM Security, le coût moyen mondial d’une violation de données atteignait près de 4,4 millions de dollars en 2025 (11).

Par ailleurs, les lois américaines comme le Cloud Act permettent, dans certains cas, l’accès des autorités américaines à des données hébergées par des entreprises soumises au droit américain, ce qui soulève des tensions récurrentes avec les exigences européennes du RGPD. L’IA locale apporte une réponse partielle à ces problématiques en garantissant que le traitement des données s’effectue au sein même de l’infrastructure de l’organisation, sans transfert systématique vers des serveurs externes. Cette architecture facilite une approche de conformité par conception, où sécurité et protection des données sont intégrées dès l’origine dans le système technique.

Les entreprises peuvent également instaurer des contrôles d’accès précis, anonymiser certaines données sensibles ou exécuter les modèles dans des environnements totalement isolés d’internet. Pour les secteurs hautement régulés comme la santé, la finance, le juridique ou la défense, cette maîtrise représente un avantage stratégique majeur.

L’horizon hybride : bâtir la sobriété de demain

Opposer frontalement un modèle tout-cloud énergivore à une IA locale supposée vertueuse ne correspond pas à la réalité des flux numériques. Pour rester dans les limites planétaires tout en bénéficiant des apports de l’IA, les organisations devront probablement concevoir des architectures hybrides, hiérarchisées et éco-optimisées (9).

La première condition consiste à router intelligemment les tâches. Pour la majorité des usages quotidiens, secrétariat, tri ou reformulation, les requêtes peuvent être orientées vers des modèles locaux compacts, éventuellement quantifiés pour réduire fortement les besoins matériels sans perte majeure de qualité. Les modèles cloud lourds doivent rester réservés aux usages réellement complexes. Il faut également éviter de faire tourner une IA sur chaque poste de travail, ce qui accélère l’obsolescence matérielle et complique la maintenance. Le plus rationnel consiste souvent à déployer un petit serveur privé mutualisé à l’échelle de l’organisation. Ce mini-cloud local améliore le taux d’utilisation des machines, mutualise l’énergie et renforce la sécurité.

Lorsque le recours au cloud reste nécessaire, les organisations ont intérêt à privilégier des fournisseurs implantés dans des régions à électricité décarbonée et utilisant des systèmes de refroidissement moins gourmands en eau (3)(5). La sobriété repose enfin sur la mesure systématique. Des outils comme CodeCarbon ou EcoLogits permettent désormais d’estimer l’empreinte énergétique, carbone ou hydrique de certaines requêtes et fournissent des indicateurs utiles aux directions informatiques et aux départements RSE (9).

Au fond, la vraie question n’est peut-être pas de savoir si l’IA doit être locale ou hébergée dans le cloud, mais de déterminer quels usages méritent réellement d’exister. Car le meilleur prompt reste souvent celui que l’on ne formule pas. Une part importante des requêtes adressées chaque jour à ces outils pourrait être évitée par un simple travail de discernement, de préparation ou de reformulation humaine. La sobriété ne consiste donc pas seulement à déplacer les calculs vers des machines plus proches ou plus efficaces : elle suppose aussi de réduire le volume même des sollicitations.

(Photos DR – CC)

Notes
(1) Le Monde – « On est au cœur d’une dissonance cognitive » : les organisations engagées pour l’environnement face à l’embarrassant calcul de l’empreinte carbone de l’IA
(2) ADEME – « Quel est l’impact du numérique ? »
(3) ADEME / Arcep – « L’empreinte environnementale du numérique »
(4) Agence internationale de l’énergie / Data Center Dynamics – « Global data center electricity use to double by 2026 »
(5) Bloomberg – « Google’s Emissions Shot Up 48% Over Five Years Due to AI »
(6) – The Verge, « OpenAI says ChatGPT users send over 2.5 billion prompts every day »
(7) Reporterre – « ChatGPT, DeepSeek, Gemini : combien d’énergie coûte vraiment une requête ? »
(8) Shaolei Ren et al., « Making AI Less “Thirsty”: Uncovering and Addressing the Secret Water Footprint of AI Models »
(9) Nidhal Jegham et al. – « How Hungry is AI? Benchmarking Energy, Water, and Carbon Footprint of LLM Inference » / « Edge-AI Rebound »
(10) Amnesty International, Rapport sur l’impact humain et social de l’extraction du cobalt en RDC.
(11) IBM Security – « Cost of a Data Breach Report » / Amnesty International – rapports sur l’impact humain et social de l’extraction des métaux critiques en RDC

Notre site est accessible, sans abonnement, sans mur payant, sans publicité, parce que nous voulons que tous ceux qui le souhaitent puissent lire et partager nos articles.

Mais ce choix a une contrepartie : sans vos dons, déductibles des impôts, Le Nouveau Paradigme ne peut pas exister.

Nous dépendons donc exclusivement du soutien de nos lectrices et lecteurs.

Je fais un don pour LNP

Environnement

Laisser un commentaire Annuler la réponse

À savoir

Violences sexuelles sur les enfants : le piège de la surenchère pénale

Canicules, polluants éternels, pouvoir des plateformes et offensive municipale de l’extrême droite… au menu de cette semaine

Quand la République présume que sa police a raison de tirer

Climat : pourquoi l’État affaiblit-il les outils qu’il a lui-même créés ?

Comment l’abandon de la prévention condamne notre Sécurité sociale